LumenNews 2026-05-22

Codex 0.133.0 今天上线，Goals 默认开启并引入 Appshots（macOS，可让 Codex 操控桌面任意 App）；Claude Code 2.1.147 把 /simplify 改为有 effort level 的 /code-review，7 小时后 2.1.148 紧急修复 Bash exit code 127 regression。同时有报道称微软正强制内部工程师在 6 月底前从 Claude Code 切换到 Copilot CLI，这是迄今最大规模的企业 AI coding tool 逆向迁移案例，揭示了产品力与采购决策权的分离。Claude Code 用户今天应立即升级到 2.1.148 修复 Bash regression；Codex 用户值得试用 /goal 持久任务追踪。

A · 深度观察

Cursor：一年 cloud agent 经验总结 — 环境质量（environment quality）、durable execution 和 harness 边界设计是自主执行效果的核心决定因素，比模型选型影响更大，值得逐条对照自己的 agent 架构取向。 · 来源
Viv (LangChain)：bossman supervisor > external judge > self-reflection — 用一个专职监督角色的主 agent 批判式地驱动多个工作 Claude，比同一 agent 自我反思或独立评判者更有效；关键洞察是主 agent 应认为自己在「评判工作」而非「做工作」，适合需要长链路纠错的任务。 · 来源
Simon Willison：Datasette Agent 发布 — LLM 库 + Datasette 插件系统结合实现可扩展 SQL agent；对想用 Python 构建可插拔 data agent 的人是一个从 LLM library 到 extensible agent 的完整参考架构。 · 来源

ChromeDevTools/chrome-devtools-mcp — Chrome DevTools 官方 MCP server，让 coding agent 直接操控浏览器；⭐40k，今日 +151。
multica-ai/multica — 开源 managed agents 平台，把 coding agent 变成可分配任务、追踪进度的团队成员；⭐31k，今日 +534。
Lum1104/Understand-Anything — 把任意代码库转成可交互知识图谱，支持 Claude Code / Codex / Cursor / Copilot；⭐17k，今日 +666。
teng-lin/notebooklm-py — NotebookLM 非官方 Python API + Claude Code / Codex agent skill，暴露 web UI 没有的能力；⭐14k，今日 +186。
antoinezambelli/forge — 自托管 LLM tool-calling + 多步 agentic workflow Python 框架；⭐1.6k，今日 +398。
dotnet/skills — .NET 官方 AI coding agent skills 仓库，专为 C# 项目提供 agent 辅助能力；⭐2.3k，今日 +129。

C · 产品动态

1. Claude Code 2.1.147 + 2.1.148

📌 发生了什么 — 2.1.147 核心变更：① pinned background sessions（Ctrl+T）空闲保活、原地更新、内存压力下最后释放；② /simplify 改名 /code-review，新增 effort level（如 /code-review high）和 --comment 参数（直接在 GitHub PR 发 inline 评论），旧 cleanup 行为移除；③ 修复企业 forceLoginOrgUUID / forceLoginMethod 对第三方和 API key session 不生效的问题；④ 修复 ! 命令输出中 & 转义为 & 导致 URL 无法复制（影响 headless 场景如 gcloud auth login）。2.1.148 于 7 小时后紧急修复 2.1.147 引入的 Bash exit code 127 regression。另，CC 工程师 Boris Cherny 预告下一版将加入 /usage 命令，按 Skills / Agents / MCPs / Plugins 细分 token 消耗。

💬 讨论 — 非官方 changelog bot 记录 prompt token 总量 +7.9%，tools 占比从 69.4% 升至 71.7%；工具文档新增明确指引「始终使用 grep 执行搜索任务」。

🔗 来源 — GitHub Release 2.1.147 · Boris Cherny（CC 工程师）

💡 Insight — /code-review 取代 /simplify 是明确的产品定位转变：从「帮你整理代码」变成「帮你找 bug + 发 PR inline 评论」，适合在 review 流程中作为自动化第一关。更值得关注的是 /usage 预告——多 agent 场景下 token 来源不透明是当前最大的 debug 痛点，细粒度归因将直接影响 context 管理策略。

2. Codex rust-v0.133.0：Goals 默认开启 + Appshots

📌 发生了什么 — Goals 正式默认启用，跨 turn 追踪任务进度，有独立持久化存储；旧版本需运行 codex features enable goals 或手动修改 ~/.codex/config.toml。codex remote-control 改为前台命令，等待就绪后报告机器状态，保留显式 start/stop 子命令。Appshots（目前仅 macOS）允许 Codex 操控电脑上的任意 App。Extensions 新增 subagent start/stop、tool execution、turn metadata 等生命周期事件，支持 async approval。

💬 讨论 — Sam Altman 宣布「new codex ships today」；Codex PM Derrick Choi 称 Appshots UX “addicting”；宝玉整理了中文版 /goal 启用指南；Greg Brockman：“trying to remember what it was like to code before codex”。

🔗 来源 — GitHub Release rust-v0.133.0 · Sam Altman

💡 Insight — Goals 默认化把跨 turn 任务记忆从实验功能升为基础设施；Appshots 把边界从「写代码」延伸到「用电脑」。如果你用 Codex 做长链路任务，/goal 值得今天就接入；如果你在开发 extension，新的生命周期事件让 subagent 监控和 approval 流程终于有了完整钩子。

3. 微软内部强制从 Claude Code 迁移到 Copilot CLI

📌 发生了什么 — 据 The Verge 报道（宝玉整理），微软 Experiences & Devices 部门（负责 Windows / M365 / Outlook / Teams / Surface）要求工程师在 6 月底前从 Claude Code 全面切换到 GitHub Copilot CLI。微软去年 12 月内部推广 CC，受欢迎程度反而让自家 Copilot CLI 显得尴尬。内部措辞是「统一工具链」，但知情人士透露成本（license 费用流入竞争对手 Anthropic）也是原因之一。被要求迁移的工程师据称并不情愿。

💬 讨论 — 目前信号来自宝玉对 The Verge 报道的二手整理，尚未有英文一手确认。

🔗 来源 — 宝玉（The Verge 报道整理）

💡 Insight — 工程师不情愿迁移说明 CC 的产品力护城河是真实的，但大企业采购决策权在管理层而非开发者。对 Anthropic 而言，这指出了 CC 需要更强的企业采购故事（SSO、集中账单、合规）来和 Copilot 正面竞争；对个人开发者无直接影响。

4. Zara Zhang 开源 Claude Code Lark/飞书 Bridge

📌 发生了什么 — 投资人 Zara Zhang 开源了 Claude Code 的 Lark/飞书集成桥接工具。核心功能：用手机通过 Lark chat 使用 CC；每个群聊对应一个 CC session；CC 可通过 CLI 读取 Lark 文档、聊天记录、会议纪要；CC 可直接写 Lark Doc；在评论里 @ Claude 它会回复；支持发送带按钮的 interactive card。

🔗 来源 — Zara Zhang

💡 Insight — 把 CC 嵌入通讯层的核心价值不是「手机也能用」，而是 CC 能直接读取工作上下文（群聊、文档、会议纪要）——省掉手动粘贴背景信息这一步，让 agent 基于真实工作流做决策。对重度使用飞书的中国 / 东南亚技术团队可直接接入。