2026-06-06
今天最值得立即关注的是 Claude Code 2.1.166:跨会话消息权限收紧(其他 session 发来的 relayed 消息不再携带 user authority),如果你有 multi-session agent pipeline,今天就该检查是否受影响。Cursor SDK 同步上线 custom tools 和 auto-review,让 headless agent 添加自定义工具从「搭 MCP server」降到「传函数」。Claude Cowork 限额翻倍至 7 月 5 日,适合今天把一直想交给 agent 的复杂任务真正试一次。
A · 深度观察
- Simon Willison:MicroPython+WASM 打造低摩擦 agent 代码执行沙箱 — 完整记录了为何 Pluggy 插件机制不够安全、WASM 隔离的具体实现路径,以及「vibe-coded 沙箱能不能信任」的工程诚实——在 agent 里嵌代码执行节点的人值得仔细读 · 来源
- Viv (LangChain):agent self-verification 是 long-horizon 任务最大瓶颈 — 结合 Terminal Bench 实验数据说明中间步骤验证如何做 credit assignment,提出 verification 是 agent 递归自改进的根本门槛——设计 agent harness 的人有直接参考价值 · 来源
- Box CEO Aaron Levie:AI coding 已有最优条件,工程师仍不可缺,其他知识工作 agent 化更难 — 从可验证性、context 数字化、质量容错率推导:coding 是 agent 最有利的赛道而这条赛道仍高度依赖人——反向说明其他知识工作的 agent 替代风险被高估了 · 来源
B · GitHub Trending
- CopilotKit/CopilotKit — AG-UI Protocol 官方实现,React/Angular 前端 agent + GenUI 框架,32k stars,今日 +366
- Panniantong/Agent-Reach — 一条 CLI 让 agent 零 API 费用读写 Twitter/Reddit/YouTube/GitHub/Bilibili/小红书,适合需要多平台 context 的 agent
- MemPalace/mempalace — 自称 benchmark 最优的开源 AI memory 系统,54k stars,今日 +227,适合关注 agent 长期记忆方案的人扫一眼
- withastro/flue — Astro 团队出品的 sandbox agent framework,4.6k stars,今日 +126,值得看看其隔离设计思路
C · 产品动态
1. Claude Code v2.1.166:跨会话安全加固 + fallbackModel 配置
📌 发生了什么 — ① 跨会话消息权限收紧:来自其他 Claude session 通过 SendMessage 中继的消息不再携带 user authority,receivers 拒绝 relayed 权限请求,auto mode 直接拦截——影响所有依赖 session 间委托权限的 agent pipeline。② fallbackModel 配置:最多配 3 个备用模型,主模型过载/不可用时按序切换,--fallback-model 同时适用于 interactive session。③ thinking 可彻底关闭:MAX_THINKING_TOKENS=0、--thinking disabled 现在对默认开启 thinking 的 Claude API 模型生效。④ deny 规则支持 glob:工具名位置填 "*" 可一键拒绝所有工具。⑤ 修复 JetBrains terminal 闪烁。v2.1.167 为 bug 修复。
💬 讨论 — 非官方 changelog bot @ClaudeCodeLog 记录到本次 prompt token 增加 +1,774(+2.5%),新增 1 个 prompt file。
🔗 来源 — GitHub Release v2.1.166 · ClaudeCodeLog bot
💡 Insight — 跨会话安全变更是潜在的 breaking change:relayed 消息失去 user authority 意味着「A session 发命令给 B session」的授权链路被切断。如果你的 multi-agent harness 依赖 session 间权限传递,需要重新设计信任模型——比如改为 operator-level 配置而非 runtime relay。
2. Cursor SDK:custom tools、auto-review、任意深度嵌套 subagent
📌 发生了什么 — TypeScript/Python SDK 同步更新:① local.customTools 直接传函数定义,内部注册为 MCP tool(custom-user-tools),subagent 全程可继承;② local.autoReview 开启后,headless agent 的 tool call 经 classifier 分级放行而非全放行,可用自然语言指令引导 classifier;③ 支持自定义存储层(agent/run metadata 持久化方式);④ 支持任意深度嵌套 subagent,父 agent 定义的 tool 对整个 subagent 树可见。
🔗 来源 — Cursor SDK changelog
💡 Insight — 之前在 Cursor SDK headless agent 里加自定义能力要跑一个独立 MCP server,现在传一个函数就够——CI 脚本或生产服务里嵌 agent 的接入成本大幅下降。auto-review 的 classifier 路径意味着可以给无人值守 agent 加精细度更高的安全门,而不是在「全放行」和「全人审」之间二选一。
3. Cursor Design Mode:多选元素 + 语音并发输入
📌 发生了什么 — 浏览器内 Design Mode 更新:① shift 多选 DOM 元素,agent 同时拿到元素代码、布局关系和视觉上下文,可一次指令做跨元素一致性调整;② 语音输入支持 agent 运行中并发排队,不用等上一轮结束就能说下一条指令。Cursor 设计 lead Ryo Lu 确认与 Composer 2.5 配合最佳,配套发布 Design Mode 详细博客。
💬 讨论 — Ryo Lu 演示了「click + chat + shift 多选」的连续工作流
🔗 来源 — Cursor changelog · Ryo Lu (@ryolu_)
💡 Insight — 语音排队(agent 跑着就能说下一条)把 design-in-code 节奏从「等待—描述—等待」变成近似口述设计稿的连续流,这比 multi-select 本身对 UI agent 工作流的影响更大。
4. Claude Cowork 5 小时限额翻倍,至 7 月 5 日
📌 发生了什么 — Anthropic 将 Claude 桌面 app 中 Cowork 功能的 5 小时 rate limit 翻倍,面向所有付费计划(Pro/Team 等),有效期至 2026 年 7 月 5 日。Cowork 定位是处理超出单次 chat 范围的长任务——跨账户研究、收件箱分拣、定期报告生成等。需下载 Claude 桌面 app 使用。
💬 讨论 — Anthropic Claude Code 工程师 Boris Cherny 称「如果你一直攒着一个大型复杂项目想试,现在是时机」
🔗 来源 — @claudeai 官方 · Boris Cherny (@bcherny)
💡 Insight — Cowork 本质是 Claude 在桌面 app 里跑 long-running agent 任务的入口;限额翻倍短期降低了探索成本,对于一直因限额犹豫是否迁移工作流的用户是低风险的试用窗口。