2026-05-30
Claude Code 放出了数月来最密集的一批功能:dynamic workflows(大规模 multi-agent orchestration)、从 .claude/skills/ 自动发现的 plugin auto-discovery,以及在 Bedrock/Vertex/Foundry 上落地的 Auto mode——与此同时 Opus 4.8 已成为默认模型,漏放代码缺陷的概率降低约 4 倍,外加一个能在对话中途注入 system prompt 又不会冲掉 cache 的全新 API。Cursor 上线了基于 classifier 的 Auto-review 运行模式;Codex 升到 v0.135.0,并确认整合 GPT-5.5。只要你每天在用这些工具,今天就更新。
A · 深度观察
- Salesforce:231 天的迁移用 Claude Code 13 天就交付了 — Boris Cherny(Anthropic CC 工程师)翻出了一篇带硬数据的 Salesforce 复盘——事故率下降 5% 的同时产出还在加速——他的观点是:真正胜出的团队是在删减步骤、把整块所有权交给 agent,而不是给现有 workflow 提速。 · 来源
- Matt Pocock:对 agent 代码库而言,ADR 是杠杆率最高的上下文层 — 为那些不言自明的决策写下 Architecture Decision Records,能让你技术栈里的每个 agent 都更聪明——20 条 ADR 就把代码本身无法表达的那些棘手约束全部记下来了;文中还有一个来自 Sandcastle 的实例。 · 来源
- Dax(OpenCode 作者):用好 coding agent 是一项深功夫,而非随手可得的能力 — 一个反共识的重新定义:重度 AI 工具用户却做出糟糕结果,恰恰说明是技能差距、而非 agent 失灵——上限很高且可以学,这也重新解释了为什么大多数能看到的 AI coding 产出都不咋样。 · 来源
B · GitHub Trending
- EveryInc/compound-engineering-plugin — 面向 Claude Code、Codex、Cursor 的官方 Compound Engineering 插件——18K stars,今日新增 353;如果你跨多个 coding agent 工作,这层跨工具互操作层值得评估。
- anthropics/claude-code — 128K stars,今日新增 395——受 v2.1.154-158 发布和 Opus 4.8 上线带动而飙升。
- cursor/plugins — Cursor 官方插件规范及一方插件——如果你在为 Cursor 生态做开发,可作参考。
C · 产品动态
1. Claude Code v2.1.154–158: Dynamic Workflows + Plugin Auto-load + Enterprise Auto Mode
📌 发生了什么 — 四个版本连发。v2.1.154:dynamic workflows 以研究预览形式上线——在任意 prompt 里提到 “workflow”,Claude 就会生成一份确定性的 orchestration 方案,然后跨数十到数百个并行后台 agent 执行;Opus 4.8 现已成为默认(high effort,最高用 /effort xhigh);Opus 4.8 的 Fast mode 现为标准速率的 2 倍(较此前下调)以换取 2.5 倍速度;精简版 system prompt 现已是 Opus 4.8+ 的默认;/simplify 现在只跑清理(reuse、simplification、efficiency、altitude),不再执行完整的 /code-review —fix 找 bug 流程。v2.1.157:放在 .claude/skills/ 里的 plugin 无需 marketplace 即可自动加载;‘claude plugin init
💬 讨论 — Anthropic Claude Code PM Cat Wu 用 dynamic workflows 在 10 分钟内把上百个 A/B 测试 flag 全部并行跑了一遍,从而完成编目并找出陈旧的那些。Alex Albert(Anthropic DevRel)建议交互式来回用 Fast mode,异步长跑任务用普通模式。
🔗 来源 — Claude Code v2.1.157 release · Cat Wu (Anthropic Claude Code PM)
💡 Insight — 从 .claude/skills/ 自动加载 plugin,把团队内的工具共享变成一次 git push——没有 marketplace 的摩擦。Dynamic workflows 让 Claude Code 从单 agent 转向 harness 构建者:描述任务,Claude 自己写出并执行 orchestration 方案。Bedrock/Vertex 上的企业用户终于用上了不被打断的 Auto mode。
2. Claude Opus 4.8 + mid-conversation system prompt injection without cache bust
📌 发生了什么 — Anthropic 把 Opus 4.8 作为 Claude Code 的新默认推出。针对编码的改进:漏放代码缺陷而不加标记的概率降低约 4 倍(system card 基准);在 agentic 任务上更倾向于标出不确定性,而不是谎报进度。Anthropic 明确把这描述为”一次不大但实在的改进”——没有夸大其词。新的 API 能力:在 Opus 4.8 上,你现在可以在对话中途传入一条 system 角色的消息;Claude 会从那一刻起将其视为权威,并且它与自动 cache 配合——更新会命中 cache 而非冲掉它。此前唯一对 cache 安全的做法只能是把更新塞进一个 user turn 里。
💬 讨论 — Swyx 指出对话中途的 system prompt 这个特性出人意料。Box CEO Aaron Levie 报告了相对 Opus 4.7 的可量化企业收益:报告起草上 87% 对 77%,财务数据抽取约提升 8 个百分点。Simon Willison 认为这种坦诚的”不大改进”措辞让人耳目一新。
🔗 来源 — Anthropic official · ClaudeDevs (Anthropic official dev channel)
💡 Insight — 对话中途注入 system prompt 而不让 cache 失效,改变了你设计长跑 agent 会话的方式——现在你可以在任意 tool result 之后廉价地追加更新过的指令。把你的 system prompt 设计成可分阶段追加的模块化层,而不是每次整体重写的单体块。
3. Cursor Auto-review Run Mode
📌 发生了什么 — Cursor 把 “Auto-review” 作为一种新的运行模式推出(Settings > Cursor Settings > Agents > Run Mode)。三档闸门作用于 Shell、MCP 和 Fetch 工具调用:在白名单内的调用立即执行;可沙箱化的调用在 sandbox 里跑;其余一切则路由到一个 classifier subagent,由它决定 allow / try-different-approach / ask-for-approval。你可以写自定义指令,按项目去引导 classifier 的判断。
🔗 来源 — Cursor changelog
💡 Insight — 这是介于”总是询问”和”从不询问”之间、可用于生产的中间地带——灰色地带交给 classifier 处理。自定义指令这个钩子让你能用自然语言编码项目专属的 allow/deny 逻辑,对于不断演进的 agent workflow 来说,比静态白名单更易维护。
4. Codex v0.135.0 + GPT-5.5 integration confirmed
📌 发生了什么 — Codex CLI 发布 rust-v0.135.0:vim mode 新增 text-object 编辑和可配置的打断当前轮次的快捷键;‘codex doctor’ 现在能报告更丰富的环境、git、终端及 thread 清单诊断信息;/permissions 能识别命名的 permission profile;Python SDK 为 thread/turn API 暴露了 Sandbox 预设;可通过 CODEX_NON_INTERACTIVE=1 进行非交互式安装。另外,Codex PM Derrick Choi 确认整合了 GPT-5.5,OpenAI 公布的 Braintrust 案例研究也佐证了这一点——其中明确把 “Codex with GPT-5.5” 描述为当前在用的技术栈。
🔗 来源 — openai/codex rust-v0.135.0 · Derrick Choi (Codex PM)
💡 Insight — 以 GPT-5.5 作为 Codex 的主干是一次实打实的能力跃升——如果你上一次拿 Codex 对标 Claude Code 还是在 Opus 4.7 上做的基准测试,下结论前请用两边当前的技术栈重新跑一遍。