LumenNews 2026-06-06

今天最值得立即关注的是 Claude Code 2.1.166：跨会话消息权限收紧（其他 session 发来的 relayed 消息不再携带 user authority），如果你有 multi-session agent pipeline，今天就该检查是否受影响。Cursor SDK 同步上线 custom tools 和 auto-review，让 headless agent 添加自定义工具从「搭 MCP server」降到「传函数」。Claude Cowork 限额翻倍至 7 月 5 日，适合今天把一直想交给 agent 的复杂任务真正试一次。

A · 深度观察

Simon Willison：MicroPython+WASM 打造低摩擦 agent 代码执行沙箱 — 完整记录了为何 Pluggy 插件机制不够安全、WASM 隔离的具体实现路径，以及「vibe-coded 沙箱能不能信任」的工程诚实——在 agent 里嵌代码执行节点的人值得仔细读 · 来源
Viv (LangChain)：agent self-verification 是 long-horizon 任务最大瓶颈 — 结合 Terminal Bench 实验数据说明中间步骤验证如何做 credit assignment，提出 verification 是 agent 递归自改进的根本门槛——设计 agent harness 的人有直接参考价值 · 来源
Box CEO Aaron Levie：AI coding 已有最优条件，工程师仍不可缺，其他知识工作 agent 化更难 — 从可验证性、context 数字化、质量容错率推导：coding 是 agent 最有利的赛道而这条赛道仍高度依赖人——反向说明其他知识工作的 agent 替代风险被高估了 · 来源

CopilotKit/CopilotKit — AG-UI Protocol 官方实现，React/Angular 前端 agent + GenUI 框架，32k stars，今日 +366
Panniantong/Agent-Reach — 一条 CLI 让 agent 零 API 费用读写 Twitter/Reddit/YouTube/GitHub/Bilibili/小红书，适合需要多平台 context 的 agent
MemPalace/mempalace — 自称 benchmark 最优的开源 AI memory 系统，54k stars，今日 +227，适合关注 agent 长期记忆方案的人扫一眼
withastro/flue — Astro 团队出品的 sandbox agent framework，4.6k stars，今日 +126，值得看看其隔离设计思路

C · 产品动态

1. Claude Code v2.1.166：跨会话安全加固 + fallbackModel 配置

📌 发生了什么 — ① 跨会话消息权限收紧：来自其他 Claude session 通过 SendMessage 中继的消息不再携带 user authority，receivers 拒绝 relayed 权限请求，auto mode 直接拦截——影响所有依赖 session 间委托权限的 agent pipeline。② fallbackModel 配置：最多配 3 个备用模型，主模型过载/不可用时按序切换，--fallback-model 同时适用于 interactive session。③ thinking 可彻底关闭：MAX_THINKING_TOKENS=0、--thinking disabled 现在对默认开启 thinking 的 Claude API 模型生效。④ deny 规则支持 glob：工具名位置填 "*" 可一键拒绝所有工具。⑤ 修复 JetBrains terminal 闪烁。v2.1.167 为 bug 修复。

💬 讨论 — 非官方 changelog bot @ClaudeCodeLog 记录到本次 prompt token 增加 +1,774（+2.5%），新增 1 个 prompt file。

🔗 来源 — GitHub Release v2.1.166 · ClaudeCodeLog bot

💡 Insight — 跨会话安全变更是潜在的 breaking change：relayed 消息失去 user authority 意味着「A session 发命令给 B session」的授权链路被切断。如果你的 multi-agent harness 依赖 session 间权限传递，需要重新设计信任模型——比如改为 operator-level 配置而非 runtime relay。

2. Cursor SDK：custom tools、auto-review、任意深度嵌套 subagent

📌 发生了什么 — TypeScript/Python SDK 同步更新：① local.customTools 直接传函数定义，内部注册为 MCP tool（custom-user-tools），subagent 全程可继承；② local.autoReview 开启后，headless agent 的 tool call 经 classifier 分级放行而非全放行，可用自然语言指令引导 classifier；③ 支持自定义存储层（agent/run metadata 持久化方式）；④ 支持任意深度嵌套 subagent，父 agent 定义的 tool 对整个 subagent 树可见。

🔗 来源 — Cursor SDK changelog

💡 Insight — 之前在 Cursor SDK headless agent 里加自定义能力要跑一个独立 MCP server，现在传一个函数就够——CI 脚本或生产服务里嵌 agent 的接入成本大幅下降。auto-review 的 classifier 路径意味着可以给无人值守 agent 加精细度更高的安全门，而不是在「全放行」和「全人审」之间二选一。

3. Cursor Design Mode：多选元素 + 语音并发输入

📌 发生了什么 — 浏览器内 Design Mode 更新：① shift 多选 DOM 元素，agent 同时拿到元素代码、布局关系和视觉上下文，可一次指令做跨元素一致性调整；② 语音输入支持 agent 运行中并发排队，不用等上一轮结束就能说下一条指令。Cursor 设计 lead Ryo Lu 确认与 Composer 2.5 配合最佳，配套发布 Design Mode 详细博客。

💬 讨论 — Ryo Lu 演示了「click + chat + shift 多选」的连续工作流

🔗 来源 — Cursor changelog · Ryo Lu (@ryolu_)

💡 Insight — 语音排队（agent 跑着就能说下一条）把 design-in-code 节奏从「等待—描述—等待」变成近似口述设计稿的连续流，这比 multi-select 本身对 UI agent 工作流的影响更大。

4. Claude Cowork 5 小时限额翻倍，至 7 月 5 日

📌 发生了什么 — Anthropic 将 Claude 桌面 app 中 Cowork 功能的 5 小时 rate limit 翻倍，面向所有付费计划（Pro/Team 等），有效期至 2026 年 7 月 5 日。Cowork 定位是处理超出单次 chat 范围的长任务——跨账户研究、收件箱分拣、定期报告生成等。需下载 Claude 桌面 app 使用。

💬 讨论 — Anthropic Claude Code 工程师 Boris Cherny 称「如果你一直攒着一个大型复杂项目想试，现在是时机」

🔗 来源 — @claudeai 官方 · Boris Cherny (@bcherny)

💡 Insight — Cowork 本质是 Claude 在桌面 app 里跑 long-running agent 任务的入口；限额翻倍短期降低了探索成本，对于一直因限额犹豫是否迁移工作流的用户是低风险的试用窗口。