LumenNews 2026-05-08

Claude Code 2.1.133 上线，最值得注意的一点：系统提示中「执行前确认高风险操作」的 guardrail 被整体移除，自动化工作流的行为将有实质变化。Codex 同日推出 Chrome 扩展，可在后台并发驱动多个浏览器标签页。如果你在 CI 或 agent harness 里依赖 CC 的内置确认提示做最后一道防线，今天要重新评估你的安全策略。

A · 产品动向

1. Claude Code 2.1.133：risky-action guardrail 从系统提示层移除

📌 发生了什么 — CC 2.1.133 有两类变动。功能侧：新增 worktree.baseRef（fresh | head），控制 —worktree / agent-isolation worktree 的 base 分支——默认值从 2.1.128 起的 head 改回 fresh（origin/），有未推送 commit 的用户需显式设 worktree.baseRef: "head"；hooks 和 Bash tool 现通过 effort.level / $CLAUDE_EFFORT 获知当前努力等级；修复了多 session 并发时 token refresh race 导致的 401 死循环。行为侧（来自 ClaudeCodeLog 系统提示分析）：原有「破坏性操作前确认」规则从提示中删除——删文件、强制推送、发消息、修改基础设施不再有内置询问；「一次批准不等于后续场景也批准」的规则同样移除；此外提示中混入 Bun HMR disconnect log 噪音，污染了 tone/style 指令。Bundle 体积缩减 35.9%，prompt token 减少 47.5%。

💬 讨论 — ClaudeCodeLog 将 guardrail 移除定性为「speeds automation, drops per-action checks」——对 CI 友好，但原本依赖 CC 内置确认作最后防线的用户，需要自己在 hooks 或 harness 层补足审批逻辑。

🔗 来源 — GitHub Release v2.1.133 · ClaudeCodeLog 系统提示变更分析

💡 Insight — guardrail 从系统提示层移除，是一个架构信号：Anthropic 在把「风险决策边界」的责任从模型层下推给 operator/harness 层。对在跑 CI 自动化的用户，今天要做一件事：在 PreToolUse hooks 里自己实现破坏性操作的白名单或审批逻辑，不能再依赖模型内置提示兜底。

2. Codex v0.129.0 正式版 + Chrome 扩展：可后台并发驱动浏览器标签页

📌 发生了什么 — Codex 稳定版 v0.129.0 是一个大版本：TUI 新增 modal Vim 编辑模式（/vim、default-mode 配置、Vim keymap context）；resume/fork picker 重新设计，加入 /ide context 注入和 workspace-aware /diff；plugin 管理新增 workspace sharing、remote bundle sync、admin-disabled 状态处理；hooks 新增 /hooks 浏览入口、可在 compaction 前后运行、向 PreToolUse 注入 context。同日，OpenAI 推出 Codex Chrome 扩展（Mac/Windows 可用，欧盟/英国暂不开放）：Codex 在后台并发控制多个 Chrome 标签页，支持任意 Chromium 浏览器，不占用用户当前操作界面，适用于需要登录态的内部系统操作（dashboard 查询、CRM 更新、多步骤表单流程）。

💬 讨论 — Greg Brockman 直接演示后台驱动 Chrome tabs；歸藏测试发现扩展可控制任意 Chromium 浏览器（包括 Dia），并发多个 SubAgent 各自操作不同页面。与 Claude Code 需借助外部 browser-use / Playwright MCP 相比，Codex 把浏览器控制做成了 first-party plugin，是 capability 层面的实质区别。

🔗 来源 — GitHub Release rust-v0.129.0 · Greg Brockman — Codex 驱动 Chrome tabs 演示

💡 Insight — Codex 把浏览器控制内置为 plugin 而非依赖外部 MCP，降低了 agent 处理「需要登录态的 web 操作」的配置门槛。对 Claude Code 用户这是一个明确的 capability gap——如果你的 workflow 大量涉及浏览器自动化，今天值得认真评估 Codex 的实际可用性。

3. Claude Mythos Preview + harness 工程：Mozilla Firefox 4月修复 423 个安全 bug

📌 发生了什么 — Mozilla 发布了详细的技术博客，记录他们如何用 Claude Mythos Preview 构建安全漏洞挖掘 harness，使 2026 年 4 月的修复量跳升至 423 个（此前每月 20-30 个），超过过去 15 个月总和。关键细节：① 模型能力 + harness 工程缺一不可——他们大幅改进了「如何驾驭模型、水平扩展、叠加多模型来放大信号并过滤噪音」；② 早期 AI 生成的安全报告以 false positive 为主，对开源维护者造成不对称成本（生成 cheap，验证 expensive）；③ 大量 exploit 尝试被 Firefox 现有 defense-in-depth 拦截，反向验证了已有防护层的价值；④ 发现了一个 20 年前的 XSLT bug 和一个 15 年前的 <legend> 元素 bug。

💬 讨论 — Simon Willison 标注为 fascinating in-depth details；Anthropic DevRel Alex Albert 重点推了「一个月修复量超过过去 15 个月」的数据。这是目前有实质工程细节的、最具说服力的 AI-assisted security research 案例之一。

🔗 来源 — Simon Willison — Firefox + Claude Mythos 博客摘要 · Alex Albert — Anthropic DevRel

💡 Insight — 这个案例最值得复盘的不是「AI 找到了 bug」，而是 harness 工程的三层设计：大量候选生成 → 噪音过滤 → 与现有 defense-in-depth 协同。对在做 code review / security scanning agent 的工程师，Mozilla 的博客是目前最有参考价值的 production harness 架构文档之一，原文值得完整读一遍。

4. openai-cli 官方 CLI 发布：终端直调 Responses API，支持 agent 风格 cloud tools

📌 发生了什么 — OpenAI 开源了 openai-cli（Apache 2.0，Go 实现，Homebrew 可安装）。核心能力：① 调用 Responses API，支持所有 cloud tools（web 搜索、code interpreter、文件检索、图像生成），agent 工作流可直接从 shell 跑通；② 输出走 Unix 结构化格式（JSON/YAML/JSONL/pretty），支持管道串联和内建 GJSON 字段抽取（类 jq 但内建）；③ 图像生成、TTS、语音转录一行命令完成；④ project 管理和 API key 分配也集成进来；⑤ 文件用 @file.ext 语法传参，与 curl 习惯一致。由 OpenAI 研究员 jxnlco（Jason Liu）主导，定性为「small ship / passion project」。

💬 讨论 — 宝玉分析指出，此前 OpenAI 官方只有 Python/Node SDK，命令行用户要么裸写 curl，这次把 SDK 能力搬进 shell，可以直接接进现有 CI/CD 和自动化流程，「很适合 Agent 使用」。

🔗 来源 — 宝玉 — openai-cli 详细拆解

💡 Insight — cloud tools 支持（含 web search + code interpreter）意味着你可以把 OpenAI agent 调用直接嵌进 shell 脚本或 Makefile，不需要写 Python 包装。对于有大量 CLI 自动化工作流的开发者，今天值得装上试一试，尤其是 openai responses create + 管道组合的场景。

B · 深度观察

Boris Cherny：夜间并发数千个 agent，几乎只用手机跑 Claude Code — Anthropic Claude Code 工程师 Boris Cherny 透露他夜间并发运行 thousands 级别的 agent，几乎完全通过手机使用 Claude Code；预言「coding 将成为新的读写能力」。 · 来源
Codex PM：auto-review 的 permission model 设计——规则快速路径 + boundary crossing 时引入独立 reviewer — Codex PM Derrick Choi 解释 auto-review 如何平衡 agent 的权限粒度：常规操作走规则驱动的快速路径，跨边界操作引入独立 reviewer，减少 approval fatigue 的同时保留关键 guardrail。 · 来源
LangChain Viv：sandbox 是 production agent 和 eval 规模化的核心基础设施 — LangChain agents/evals 工程师 Viv 梳理 sandbox 的三个核心用途：安全代码执行、大规模并行 eval 运行、tracer 数据挖掘 + 自我改进实验，强调 sandbox 不只是「隔离」，是 agent self-improvement 可 scale 的基础。 · 来源
GStack v1.28：Claude Code harness 新增浏览器文件下载、反 bot 检测和 llms.txt — YC 总裁 Garry Tan 的 Claude Code 个人 harness GStack 更新至 v1.28，Browser 支持文件下载和 Xvfb headed 模式反 bot 检测；新增 llms.txt 让各类 agent 自动发现可用 skill，减少 prompt 猜测成本。 · 来源
Dan Shipper：Anthropic 正把 API 层建成开发者云基础设施 — Every CEO Dan Shipper 做了 podcast dispatch 分析 Code with Claude 事件，认为 xAI 算力交易 + Managed Agents 表明 Anthropic 的战略方向是把 API 从模型接口升级为 full cloud infrastructure for developers，类比 AWS 对开发者的定位。 · 来源