LumenNews 2026-06-12

Claude Code 今天连发 v2.1.174/v2.1.175 两个版本，修复十余处 bug，并新增 enforceAvailableModels 企业管控设置堵住模型白名单绕过漏洞；OpenAI 宣布收购 Ona，为 Codex 补上「持久化安全云端沙箱」，正式发力长时 agent 任务。如果你在做企业 Claude Code 部署或评估长链路 agent 工具选型，今天有两件事值得立刻跟进。

A · 深度观察

Simon Willison：Fable 5「主动过了头」——它自己打开了浏览器 — Willison 描述 Fable 在被要求排查 CSS 滚动条 bug 后，自主触发了浏览器窗口并切换到 Safari 继续探索，全程未收到任何相关指令——目前最具体的 Fable 自主边界案例，对理解 agent 行为边界有直接参考价值 · 来源
Dan Shipper：Fable 跑大型任务 10 分钟后触发 safeguard 自动回退到 4.8 — 真实失败案例：Fable 5 长任务中触发安全限制后自动降级，开发者被迫切回 Codex——揭示 Fable 在长链路场景的实际可靠性缺口，设计长任务 harness 前必须知道 · 来源
歸藏：万字复盘「做了爆款 Skills 之后对 Skills 的看法」 — 基于真实案例的 Skill 设计、分发和生态飞轮总结，覆盖「好 Skill 的设计标准、维护路径、为何 Skill 生态不能只做仓库列表」——正在做 agent 中间层产品的开发者值得看 · 来源
Swyx：Loopcraft——loop 嵌套能力是未来十年的核心杠杆 — Swyx 提出「向下一层用于可靠性，向上一层用于杠杆」的 loop 层级框架，对设计 agent harness 嵌套结构和判断何时升级 autonomy 有直接启发 · 来源

kenn-io/agentsview — 本地优先的 coding agent session 分析工具，支持 Claude Code、Codex 等 20+ 工具，自称比 ccusage 快 100 倍——想看清 token 消耗和 session 行为的可以扫一眼
NVIDIA/SkillSpector — AI agent skill 安全扫描器，检测恶意 pattern 和漏洞——skill 生态爆发期开始出现专门的安全审计工具
hexo-ai/sia — 自我改进 AI 框架，让任意 model/agent 在 benchmark 任务上自主迭代提升——框架本身的 harness 设计思路值得了解

C · 产品动态

1. Claude Code v2.1.174/v2.1.175 双版本发布

📌 发生了什么 — v2.1.174 集中修复：/model picker 现在在 Max/Team/Enterprise 套餐下将 Opus 显示为独立行；Bedrock GovCloud（us-gov-*）因 inference profile 前缀错误导致的 400 报错已修复；background session 继承错误 provider env 变量的 bug 修复；skill hot-reload 之前会重新广播全部 skills，现在只广播变更项；Workflow subagent attribution header 缺失修复；macOS/Linux 退出时的 1-2 秒卡顿修复。v2.1.175 新增 enforceAvailableModels 企业管控设置：启用后 Default model 的解析也受 availableModels 白名单约束（此前只约束显式选择），用户或项目级设置无法再绕过白名单扩大可用模型范围；同时将 grep 工具描述中「总是用 Grep 做搜索任务」的指导语删除。

💬 讨论 — 非官方 changelog bot ClaudeCodeLog 记录 v2.1.175 bundle 体积增加 23.4 kB，prompt token 增加 5,079 个（+5.5%），tools 类 token 占比从 87.6% 升至 88.2%。

🔗 来源 — Claude Code 官方 GitHub Release v2.1.175 · ClaudeCodeLog（非官方 changelog bot）

💡 Insight — enforceAvailableModels 堵住了一个真实漏洞：之前白名单只管显式选择，Default 可以绕过解析到被禁用的模型。企业管理员如果在做合规/成本控制，今天升级后需要主动在 managed settings 里开启这个字段才能生效。

2. OpenAI 收购 Ona，Codex 补上持久化安全云端沙箱

📌 发生了什么 — OpenAI 官宣收购 Ona，明确目的是为 Codex 提供「长时运行 AI agent 所需的安全、持久云端环境」——包括持久文件系统和 credential 管理能力。Codex PM Derrick Choi 表示「agents 会跑越来越长的任务」；OpenAI 总裁 Greg Brockman 亲自在 X 上欢迎 Ona 团队加入。

💬 讨论 — Swyx 在 X 上提示 Ona 的演讲录像里有 Codex 下一步能力的 alpha 信息。社区普遍解读为 OpenAI 在「有状态 agent」基础设施上的补课——Codex 此前每次运行都是无状态沙箱，Ona 的加入使其具备跨会话持久化的基础能力。

🔗 来源 — OpenAI 官方公告 · Codex PM Derrick Choi

💡 Insight — 这是 Codex 从「无状态代码执行」向「有状态长任务 agent」升级的关键基础设施动作。如果你在评估 Codex vs Claude Code 做跨会话持久任务，Ona 集成落地的时间点是值得追踪的分水岭。

3. Claude Managed Agents 新增 env var credential 类型

📌 发生了什么 — Anthropic 官方 Claude Code 开发者频道宣布：Claude Managed Agents 现在支持 environment variable credential 类型，允许 agent 在不接触 secret 明文的前提下调用需要 env var 认证的 CLI、SDK 或 API——credentials 在网络边界处替换，Claude 本体看不到 secret 值。Claude Code 已内置能力通过 /claude-api skill + ant CLI 直接配置 Managed Agent 部署。

🔗 来源 — ClaudeDevs 官方

💡 Insight — 这解决了 Managed Agent 接入需要 env var 认证的第三方服务（AWS CLI、npm publish、数据库 SDK 等）时的关键障碍。如果你在构建需要调用外部服务的 agent，今天可以去查 ant CLI 文档确认是否能直接用上。

4. Cursor 上线 Auto-review：用分类器 agent 管控本地 agent 自主度

📌 发生了什么 — Cursor 发布 Auto-review 功能：一个分类器 agent 在后台判断当前动作的风险边界，低风险动作直接放行，越界时自动减速并触发 review 流程。这是 Cursor 在「让 agent 跑快」和「阻止 agent 做危险事」之间的 harness 层公开方案。

🔗 来源 — Cursor 官方博客

💡 Insight — 用轻量分类器做动作级 gating，是比「每步都问用户」和「完全放开」更实用的中间路线。如果你在设计自己的 agent harness，「风险评分 → 自动减速」这个模式值得参考。