2026-05-13
Claude Code v2.1.140 修了 /goal 静默挂起、symlinked settings 触发误报、--bg 断连等一批影响日常使用的 bug;Anthropic 同步开源 Claude for Legal,12 个垂直 plugin + 20+ MCP connector,是迄今最完整的 plugin/skill/scheduled-agent/MCP 架构参考实现。今天值得立即做两件事:更新 Claude Code,克隆 Claude for Legal 仓库看目录结构来参考 plugin 架构。
A · 产品动向
1. Claude Code v2.1.140
📌 发生了什么 — 修了 10+ 个 bug,最影响工作流的有:/goal 在 disableAllHooks / allowManagedHooksOnly 下静默挂起(现在显示明确提示而非永久 spinner);symlinked settings 文件触发错误 ConfigChange hook;claude —bg 在 background service 即将 idle-exit 时报 connection dropped;/loop 为已能自动通知完成的 background task 重复调度 wakeup。功能改进:Agent tool 的 subagent_type 现接受大小写和分隔符不敏感的匹配(“Code Reviewer” 自动解析为 code-reviewer)。内部 prompt 大幅精简:文件数 -38%,tokens -31%,tools 类型占比从 36% 升至 44%。新增 CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE 和 CLAUDE_CODE_RESUME_PROMPT 两个环境变量,移除了 CLAUDE_CODE_AGENT_COST_STEER。
💬 讨论 — ClaudeCodeLog bot 还记录到 prompt 层变更:Grep tool 说明更新为「ripgrep-based,search 任务必须用它」;Write tool 说明强调写入 local filesystem。
🔗 来源 — Claude Code GitHub Release v2.1.140 · ClaudeCodeLog bot changelog thread
💡 Insight — symlinked settings bug 和 /loop 重复 wakeup 是在 dotfile 管理 + loop agent 场景下很容易踩到的陷阱,现已修复。subagent_type 模糊匹配意味着 agent harness 里的 type 字符串格式可以更宽松——如果你有 tool-match failure 的历史记录,这次更新直接消除了根因。
2. Claude for Legal:plugin / skill / MCP 架构首个垂直全家桶
📌 发生了什么 — Anthropic 开源 Claude for Legal 仓库,包含 12 个针对不同法律岗位的 plugin(corporate-legal、litigation、privacy-governance 等)。每个 plugin 的内部结构是:skill(SKILL.md 工作手册,描述判断逻辑和输出格式)+ scheduled agent(renewal-watcher、docket-watcher 等定时后台任务)+ .mcp.json(声明连接哪些外部系统)+ CLAUDE.md 模板(冷启动访谈后注入团队 playbook)。官方 MCP connector 覆盖 Ironclad、DocuSign、iManage、Everlaw、Relativity、Thomson Reuters CoCounsel、Harvey、Box、Datasite 等 20+ 系统,以及 Word、Excel、Outlook。输出格式直接是 Word 修订模式(redline),律师逐条 accept/reject。
💬 讨论 — Box CEO Aaron Levie 点名这批 legal plugins 是「headless 软件交互未来」的典型案例。宝玉做了完整架构拆解:skill(说明书)→ subagent(隔离 context 的并行执行单元)→ scheduled agent(定时后台任务)→ MCP connector(外部数据接入)→ plugin(四者打包容器)。
🔗 来源 — 宝玉 plugin 架构拆解 · 宝玉 Claude for Legal 全景概述
💡 Insight — 这个仓库的价值不只是法律工具——它是 Anthropic 迄今发布的最完整的 plugin/skill/scheduled-agent/MCP 架构参考实现。如果你在设计 agent harness 或 MCP 集成方案,直接 clone 看目录结构,比读文档更快建立 mental model。scheduled agent 的模式(定时扫描 + 推送到 Slack)尤其值得借鉴,直接对应 coding agent 里的「定时跑 CI 巡检 / 依赖升级扫描」场景。
3. Codex + Computer Use:自主完成 Telegram bot token 续期
📌 发生了什么 — PSPDFKit 创始人 Peter Steinberger 演示:Codex 调试 Telegram 问题时需要新 token,自主调用 Peekaboo(macOS 截图 / 视觉 MCP tool)打开 Telegram Mac 客户端,与 BotFather 对话,完成 token 申请——整个流程无人工介入。同日,OpenAI Codex PM Derrick Choi 展示另一个日常用例:Codex 每天早上自动扫描多份科技 newsletter 邮件并汇总要点,作为个人信息过滤层。
💬 讨论 — 两个 demo 指向同一个方向:Codex 正从「写代码」扩展到「处理工作流中需要 GUI 操作或多步信息处理的任务」,且是 agent 自主决定调用工具,不需要人工触发。
🔗 来源 — Peter Steinberger (@steipete) · Derrick Choi, OpenAI Codex PM (@derrickcchoi)
💡 Insight — Codex 通过 vision MCP tool(Peekaboo)的 Computer Use 已在生产环境可用,且是 agent 在遇到障碍时自主 fallback 到 GUI 操作的——不是预设 workflow,是即兴决策。如果你的 workflow 里有「需要操作 GUI 但懒得写自动化脚本」的环节,这个组合现在是可行的而不只是 demo。
4. Claude Code 自主性三层:stop hook + auto mode + /goal
📌 发生了什么 — Anthropic @ClaudeDevs 发了一组官方教程推文,重点介绍两个机制:(1)stop hook:在 Claude 打算停止时拦截,可跑测试套件、请求 CI 端点、做任意门控检查,决定是否允许结束;(2)auto mode(CLI 里 shift+tab 切换,或 desktop 模式选择器):长任务时 Claude 不需等待人工确认直接执行。配套是已上线的 /goal(提供 AI 自评的终止条件描述)。Swyx 将三层总结为:/skill(preset prompts,最低自主性)→ /plan(human-refined inputs)→ /goal(AI-evaluated outputs,最高自主性)。
🔗 来源 — ClaudeDevs stop hook thread · Swyx (@swyx) 自主性层级
💡 Insight — stop hook 是目前 Claude Code 里最被低估的 autonomy primitive:它把「Claude 什么时候可以停」这个决策权交给程序化逻辑,而非模型自我评估。结合 /goal(AI 提议完成)+ stop hook(外部验证门控),可以构建出「AI 提议 + 测试通过才真正停止」的双重保险 harness,适合不允许漏测的 CI 场景。
B · 深度观察
- llm 0.32a2:推理模型切换到 /v1/responses endpoint — Simon Willison 的 llm CLI,reasoning 模型现在走 /v1/responses 而非 /v1/chat/completions,支持跨 tool call 的 interleaved reasoning token 显示,-R 可隐藏 · 来源
- Opus 4.7 近期感知质量提升 — Every CEO Dan Shipper 和团队多名成员独立注意到 Opus 4.7 最近在 coding 和 writing/strategy 任务上明显变好,如果上次评测是几周前,值得重新跑一次对比 · 来源
- Aaron Levie:agent 部署比软件部署更像专业服务 — Box CEO 指出 forward deployed engineer 将成 AI 时代最稀缺岗位——agent 部署要求深度理解业务流程、搭 evals、做变更管理,复杂度远超传统软件部署,对做 agent infra 产品的人有定价和范围参考价值 · 来源
- Zara Zhang:AI 产品定位全面模糊化 — 投资人 Zara Zhang 列举了一批新 AI 产品 pitch,指出定位高度同质化到「还不如直接用 Claude」——对做 AI coding 工具差异化的创业者是一个反面教材清单 · 来源