2026-05-08
Claude Code 2.1.133 上线,最值得注意的一点:系统提示中「执行前确认高风险操作」的 guardrail 被整体移除,自动化工作流的行为将有实质变化。Codex 同日推出 Chrome 扩展,可在后台并发驱动多个浏览器标签页。如果你在 CI 或 agent harness 里依赖 CC 的内置确认提示做最后一道防线,今天要重新评估你的安全策略。
A · 产品动向
1. Claude Code 2.1.133:risky-action guardrail 从系统提示层移除
📌 发生了什么 — CC 2.1.133 有两类变动。功能侧:新增 worktree.baseRef(fresh | head),控制 —worktree / agent-isolation worktree 的 base 分支——默认值从 2.1.128 起的 head 改回 fresh(origin/worktree.baseRef: "head";hooks 和 Bash tool 现通过 effort.level / $CLAUDE_EFFORT 获知当前努力等级;修复了多 session 并发时 token refresh race 导致的 401 死循环。行为侧(来自 ClaudeCodeLog 系统提示分析):原有「破坏性操作前确认」规则从提示中删除——删文件、强制推送、发消息、修改基础设施不再有内置询问;「一次批准不等于后续场景也批准」的规则同样移除;此外提示中混入 Bun HMR disconnect log 噪音,污染了 tone/style 指令。Bundle 体积缩减 35.9%,prompt token 减少 47.5%。
💬 讨论 — ClaudeCodeLog 将 guardrail 移除定性为「speeds automation, drops per-action checks」——对 CI 友好,但原本依赖 CC 内置确认作最后防线的用户,需要自己在 hooks 或 harness 层补足审批逻辑。
🔗 来源 — GitHub Release v2.1.133 · ClaudeCodeLog 系统提示变更分析
💡 Insight — guardrail 从系统提示层移除,是一个架构信号:Anthropic 在把「风险决策边界」的责任从模型层下推给 operator/harness 层。对在跑 CI 自动化的用户,今天要做一件事:在 PreToolUse hooks 里自己实现破坏性操作的白名单或审批逻辑,不能再依赖模型内置提示兜底。
2. Codex v0.129.0 正式版 + Chrome 扩展:可后台并发驱动浏览器标签页
📌 发生了什么 — Codex 稳定版 v0.129.0 是一个大版本:TUI 新增 modal Vim 编辑模式(/vim、default-mode 配置、Vim keymap context);resume/fork picker 重新设计,加入 /ide context 注入和 workspace-aware /diff;plugin 管理新增 workspace sharing、remote bundle sync、admin-disabled 状态处理;hooks 新增 /hooks 浏览入口、可在 compaction 前后运行、向 PreToolUse 注入 context。同日,OpenAI 推出 Codex Chrome 扩展(Mac/Windows 可用,欧盟/英国暂不开放):Codex 在后台并发控制多个 Chrome 标签页,支持任意 Chromium 浏览器,不占用用户当前操作界面,适用于需要登录态的内部系统操作(dashboard 查询、CRM 更新、多步骤表单流程)。
💬 讨论 — Greg Brockman 直接演示后台驱动 Chrome tabs;歸藏 测试发现扩展可控制任意 Chromium 浏览器(包括 Dia),并发多个 SubAgent 各自操作不同页面。与 Claude Code 需借助外部 browser-use / Playwright MCP 相比,Codex 把浏览器控制做成了 first-party plugin,是 capability 层面的实质区别。
🔗 来源 — GitHub Release rust-v0.129.0 · Greg Brockman — Codex 驱动 Chrome tabs 演示
💡 Insight — Codex 把浏览器控制内置为 plugin 而非依赖外部 MCP,降低了 agent 处理「需要登录态的 web 操作」的配置门槛。对 Claude Code 用户这是一个明确的 capability gap——如果你的 workflow 大量涉及浏览器自动化,今天值得认真评估 Codex 的实际可用性。
3. Claude Mythos Preview + harness 工程:Mozilla Firefox 4月修复 423 个安全 bug
📌 发生了什么 — Mozilla 发布了详细的技术博客,记录他们如何用 Claude Mythos Preview 构建安全漏洞挖掘 harness,使 2026 年 4 月的修复量跳升至 423 个(此前每月 20-30 个),超过过去 15 个月总和。关键细节:① 模型能力 + harness 工程缺一不可——他们大幅改进了「如何驾驭模型、水平扩展、叠加多模型来放大信号并过滤噪音」;② 早期 AI 生成的安全报告以 false positive 为主,对开源维护者造成不对称成本(生成 cheap,验证 expensive);③ 大量 exploit 尝试被 Firefox 现有 defense-in-depth 拦截,反向验证了已有防护层的价值;④ 发现了一个 20 年前的 XSLT bug 和一个 15 年前的 <legend> 元素 bug。
💬 讨论 — Simon Willison 标注为 fascinating in-depth details;Anthropic DevRel Alex Albert 重点推了「一个月修复量超过过去 15 个月」的数据。这是目前有实质工程细节的、最具说服力的 AI-assisted security research 案例之一。
🔗 来源 — Simon Willison — Firefox + Claude Mythos 博客摘要 · Alex Albert — Anthropic DevRel
💡 Insight — 这个案例最值得复盘的不是「AI 找到了 bug」,而是 harness 工程的三层设计:大量候选生成 → 噪音过滤 → 与现有 defense-in-depth 协同。对在做 code review / security scanning agent 的工程师,Mozilla 的博客是目前最有参考价值的 production harness 架构文档之一,原文值得完整读一遍。
4. openai-cli 官方 CLI 发布:终端直调 Responses API,支持 agent 风格 cloud tools
📌 发生了什么 — OpenAI 开源了 openai-cli(Apache 2.0,Go 实现,Homebrew 可安装)。核心能力:① 调用 Responses API,支持所有 cloud tools(web 搜索、code interpreter、文件检索、图像生成),agent 工作流可直接从 shell 跑通;② 输出走 Unix 结构化格式(JSON/YAML/JSONL/pretty),支持管道串联和内建 GJSON 字段抽取(类 jq 但内建);③ 图像生成、TTS、语音转录一行命令完成;④ project 管理和 API key 分配也集成进来;⑤ 文件用 @file.ext 语法传参,与 curl 习惯一致。由 OpenAI 研究员 jxnlco(Jason Liu)主导,定性为「small ship / passion project」。
💬 讨论 — 宝玉 分析指出,此前 OpenAI 官方只有 Python/Node SDK,命令行用户要么裸写 curl,这次把 SDK 能力搬进 shell,可以直接接进现有 CI/CD 和自动化流程,「很适合 Agent 使用」。
🔗 来源 — 宝玉 — openai-cli 详细拆解
💡 Insight — cloud tools 支持(含 web search + code interpreter)意味着你可以把 OpenAI agent 调用直接嵌进 shell 脚本或 Makefile,不需要写 Python 包装。对于有大量 CLI 自动化工作流的开发者,今天值得装上试一试,尤其是 openai responses create + 管道组合的场景。
B · 深度观察
- Boris Cherny:夜间并发数千个 agent,几乎只用手机跑 Claude Code — Anthropic Claude Code 工程师 Boris Cherny 透露他夜间并发运行 thousands 级别的 agent,几乎完全通过手机使用 Claude Code;预言「coding 将成为新的读写能力」。 · 来源
- Codex PM:auto-review 的 permission model 设计——规则快速路径 + boundary crossing 时引入独立 reviewer — Codex PM Derrick Choi 解释 auto-review 如何平衡 agent 的权限粒度:常规操作走规则驱动的快速路径,跨边界操作引入独立 reviewer,减少 approval fatigue 的同时保留关键 guardrail。 · 来源
- LangChain Viv:sandbox 是 production agent 和 eval 规模化的核心基础设施 — LangChain agents/evals 工程师 Viv 梳理 sandbox 的三个核心用途:安全代码执行、大规模并行 eval 运行、tracer 数据挖掘 + 自我改进实验,强调 sandbox 不只是「隔离」,是 agent self-improvement 可 scale 的基础。 · 来源
- GStack v1.28:Claude Code harness 新增浏览器文件下载、反 bot 检测和 llms.txt — YC 总裁 Garry Tan 的 Claude Code 个人 harness GStack 更新至 v1.28,Browser 支持文件下载和 Xvfb headed 模式反 bot 检测;新增 llms.txt 让各类 agent 自动发现可用 skill,减少 prompt 猜测成本。 · 来源
- Dan Shipper:Anthropic 正把 API 层建成开发者云基础设施 — Every CEO Dan Shipper 做了 podcast dispatch 分析 Code with Claude 事件,认为 xAI 算力交易 + Managed Agents 表明 Anthropic 的战略方向是把 API 从模型接口升级为 full cloud infrastructure for developers,类比 AWS 对开发者的定位。 · 来源