2026-05-22
Codex 0.133.0 今天上线,Goals 默认开启并引入 Appshots(macOS,可让 Codex 操控桌面任意 App);Claude Code 2.1.147 把 /simplify 改为有 effort level 的 /code-review,7 小时后 2.1.148 紧急修复 Bash exit code 127 regression。同时有报道称微软正强制内部工程师在 6 月底前从 Claude Code 切换到 Copilot CLI,这是迄今最大规模的企业 AI coding tool 逆向迁移案例,揭示了产品力与采购决策权的分离。Claude Code 用户今天应立即升级到 2.1.148 修复 Bash regression;Codex 用户值得试用 /goal 持久任务追踪。
A · 深度观察
- Cursor:一年 cloud agent 经验总结 — 环境质量(environment quality)、durable execution 和 harness 边界设计是自主执行效果的核心决定因素,比模型选型影响更大,值得逐条对照自己的 agent 架构取向。 · 来源
- Viv (LangChain):bossman supervisor > external judge > self-reflection — 用一个专职监督角色的主 agent 批判式地驱动多个工作 Claude,比同一 agent 自我反思或独立评判者更有效;关键洞察是主 agent 应认为自己在「评判工作」而非「做工作」,适合需要长链路纠错的任务。 · 来源
- Simon Willison:Datasette Agent 发布 — LLM 库 + Datasette 插件系统结合实现可扩展 SQL agent;对想用 Python 构建可插拔 data agent 的人是一个从 LLM library 到 extensible agent 的完整参考架构。 · 来源
B · GitHub Trending
- ChromeDevTools/chrome-devtools-mcp — Chrome DevTools 官方 MCP server,让 coding agent 直接操控浏览器;⭐40k,今日 +151。
- multica-ai/multica — 开源 managed agents 平台,把 coding agent 变成可分配任务、追踪进度的团队成员;⭐31k,今日 +534。
- Lum1104/Understand-Anything — 把任意代码库转成可交互知识图谱,支持 Claude Code / Codex / Cursor / Copilot;⭐17k,今日 +666。
- teng-lin/notebooklm-py — NotebookLM 非官方 Python API + Claude Code / Codex agent skill,暴露 web UI 没有的能力;⭐14k,今日 +186。
- antoinezambelli/forge — 自托管 LLM tool-calling + 多步 agentic workflow Python 框架;⭐1.6k,今日 +398。
- dotnet/skills — .NET 官方 AI coding agent skills 仓库,专为 C# 项目提供 agent 辅助能力;⭐2.3k,今日 +129。
C · 产品动态
1. Claude Code 2.1.147 + 2.1.148
📌 发生了什么 — 2.1.147 核心变更:① pinned background sessions(Ctrl+T)空闲保活、原地更新、内存压力下最后释放;② /simplify 改名 /code-review,新增 effort level(如 /code-review high)和 --comment 参数(直接在 GitHub PR 发 inline 评论),旧 cleanup 行为移除;③ 修复企业 forceLoginOrgUUID / forceLoginMethod 对第三方和 API key session 不生效的问题;④ 修复 ! 命令输出中 & 转义为 & 导致 URL 无法复制(影响 headless 场景如 gcloud auth login)。2.1.148 于 7 小时后紧急修复 2.1.147 引入的 Bash exit code 127 regression。另,CC 工程师 Boris Cherny 预告下一版将加入 /usage 命令,按 Skills / Agents / MCPs / Plugins 细分 token 消耗。
💬 讨论 — 非官方 changelog bot 记录 prompt token 总量 +7.9%,tools 占比从 69.4% 升至 71.7%;工具文档新增明确指引「始终使用 grep 执行搜索任务」。
🔗 来源 — GitHub Release 2.1.147 · Boris Cherny(CC 工程师)
💡 Insight — /code-review 取代 /simplify 是明确的产品定位转变:从「帮你整理代码」变成「帮你找 bug + 发 PR inline 评论」,适合在 review 流程中作为自动化第一关。更值得关注的是 /usage 预告——多 agent 场景下 token 来源不透明是当前最大的 debug 痛点,细粒度归因将直接影响 context 管理策略。
2. Codex rust-v0.133.0:Goals 默认开启 + Appshots
📌 发生了什么 — Goals 正式默认启用,跨 turn 追踪任务进度,有独立持久化存储;旧版本需运行 codex features enable goals 或手动修改 ~/.codex/config.toml。codex remote-control 改为前台命令,等待就绪后报告机器状态,保留显式 start/stop 子命令。Appshots(目前仅 macOS)允许 Codex 操控电脑上的任意 App。Extensions 新增 subagent start/stop、tool execution、turn metadata 等生命周期事件,支持 async approval。
💬 讨论 — Sam Altman 宣布「new codex ships today」;Codex PM Derrick Choi 称 Appshots UX “addicting”;宝玉整理了中文版 /goal 启用指南;Greg Brockman:“trying to remember what it was like to code before codex”。
🔗 来源 — GitHub Release rust-v0.133.0 · Sam Altman
💡 Insight — Goals 默认化把跨 turn 任务记忆从实验功能升为基础设施;Appshots 把边界从「写代码」延伸到「用电脑」。如果你用 Codex 做长链路任务,/goal 值得今天就接入;如果你在开发 extension,新的生命周期事件让 subagent 监控和 approval 流程终于有了完整钩子。
3. 微软内部强制从 Claude Code 迁移到 Copilot CLI
📌 发生了什么 — 据 The Verge 报道(宝玉整理),微软 Experiences & Devices 部门(负责 Windows / M365 / Outlook / Teams / Surface)要求工程师在 6 月底前从 Claude Code 全面切换到 GitHub Copilot CLI。微软去年 12 月内部推广 CC,受欢迎程度反而让自家 Copilot CLI 显得尴尬。内部措辞是「统一工具链」,但知情人士透露成本(license 费用流入竞争对手 Anthropic)也是原因之一。被要求迁移的工程师据称并不情愿。
💬 讨论 — 目前信号来自宝玉对 The Verge 报道的二手整理,尚未有英文一手确认。
🔗 来源 — 宝玉(The Verge 报道整理)
💡 Insight — 工程师不情愿迁移说明 CC 的产品力护城河是真实的,但大企业采购决策权在管理层而非开发者。对 Anthropic 而言,这指出了 CC 需要更强的企业采购故事(SSO、集中账单、合规)来和 Copilot 正面竞争;对个人开发者无直接影响。
4. Zara Zhang 开源 Claude Code Lark/飞书 Bridge
📌 发生了什么 — 投资人 Zara Zhang 开源了 Claude Code 的 Lark/飞书集成桥接工具。核心功能:用手机通过 Lark chat 使用 CC;每个群聊对应一个 CC session;CC 可通过 CLI 读取 Lark 文档、聊天记录、会议纪要;CC 可直接写 Lark Doc;在评论里 @ Claude 它会回复;支持发送带按钮的 interactive card。
🔗 来源 — Zara Zhang
💡 Insight — 把 CC 嵌入通讯层的核心价值不是「手机也能用」,而是 CC 能直接读取工作上下文(群聊、文档、会议纪要)——省掉手动粘贴背景信息这一步,让 agent 基于真实工作流做决策。对重度使用飞书的中国 / 东南亚技术团队可直接接入。