LumenNews 2026-05-07

今天 Anthropic 在 Code w/ Claude 活动上打出两张牌：与 SpaceX 签署算力合同（300+ MW、22 万张 NVIDIA GPU 本月上线），Claude Pro/Max 5 小时限额即日起翻倍；Claude Managed Agents 同步开放 multiagent orchestration、outcomes loop、webhooks 进入公测，dreaming（跨会话记忆整理）进入 research preview。Claude Code 重度用户今天有两件事可以立刻跟进：确认限额已更新，以及翻看 Managed Agents 文档看有没有你正在手搓的 agent 记忆 / 编排能力。

A · 产品动向

1. Anthropic × SpaceX 算力扩容，Claude Pro/Max 5 小时限额翻倍

📌 发生了什么 — Anthropic 宣布与 SpaceX 达成算力合作：获取 300+ MW 新容量和 22 万块 NVIDIA GPU，预计本月内上线，全部用于 Claude Pro 和 Max 用户。同步生效：Pro MAX 和 Team 的 5 小时速率限额翻倍，峰值时段的额外降级限制被撤销（但峰值限制未完全取消）。这是对过去几周用量爆表、用户频繁撞限额的直接回应。

💬 讨论 — Boris Cherny（Claude Code 工程师）公开承认「需求已超过供给，感谢坚持」——这是 Anthropic 首次正式确认容量压力。中文社区观察到峰值限制尚未完全取消，认为算力仍是短板。

🔗 来源 — Anthropic 官方公告 · Boris Cherny（Anthropic Claude Code engineer）

💡 Insight — 限额翻倍对跑长任务、多并发 subagent 的 Claude Code 用户是实质改善。SpaceX 合作是租用 Colossus 超算闲置容量的短期填坑，Anthropic 自建算力路线未变——但这个窗口期值得重新跑之前被截断的大任务。

2. Claude Managed Agents 公测：multiagent orchestration + dreaming 上线

📌 发生了什么 — Code w/ Claude 活动现场，Anthropic 发布 Claude Managed Agents 四项新能力：① multiagent orchestration 进入 public beta（lead agent 委派 specialist agent 并行处理复杂任务）；② outcomes loop 进入 public beta（rubric 驱动的自我改进循环）；③ webhooks 进入 public beta；④ dreaming 进入 research preview——后台跨多个会话反思记忆，可自动编辑记忆、新增 skill、移除过时条目。所有功能今日在 Claude Platform 可用，入口在 /claude-api skill 或对应 OSS repo。

💬 讨论 — ClaudeDevs 官方账号区分了 session 内实时记忆写入与 dreaming 离线 batch 反思的架构区别，Simon Willison 在现场直播博客中有同步记录。

🔗 来源 — @claudeai（Anthropic 官方） · @ClaudeDevs（Anthropic 官方开发者频道）

💡 Insight — dreaming 是目前 coding agent 里最接近「agent 自我进化」的官方实现——不是人工写 memory，是 agent 自己跨会话整理经验、沉淀 skill。research preview 阶段 API 可能不稳定，但现在就读文档、规划 harness 如何对接是对的时机。

3. Cursor 3.3：上线 Context Usage Breakdown 面板

📌 发生了什么 — Cursor 3.3 changelog 新增 context usage 可视化：agent 运行时可实时看到 rules、skills、MCP、subagent 各自占用的 token 数。宝玉（AI 工程写作者）实测发现自己的 Skills 占了 6.8K tokens，远超预期。

💬 讨论 — Cursor 设计主管 Ryo Lu 的配套推文定性这是「legibility 优先」设计——平时折叠看清晰视图，需要时展开看 token 深度数据。

🔗 来源 — Cursor changelog 05-06-26 · 宝玉（@dotey）实测

💡 Insight — Context budget 是 coding agent 性能的隐性瓶颈，很多人的 Rules 和 Skills 在无意识间已经堆满。这个面板让你第一次能直接看到各模块的 token 开销——拿到数据后，优先裁剪高 token / 低频使用的 skill，而不是靠直觉猜。

4. Codex 完成「知识工作 OS」转型，Every 团队 80% 工作时间在里面跑

📌 发生了什么 — Every CEO Dan Shipper 和增长负责人 Austin Tedesco 在 AI & I 播客复盘：三个月前 Codex 对知识工作者还是玩具，GPT-5.5 上线后翻转——Austin 现在用 Codex 写 GTM 计划（从 Slack/Notion/会议记录提取素材）、重建 KPI 看板、做候选人识别。核心差异化：Codex Desktop app 比 Claude Desktop/Cowork 更快更稳定；folder 结构 + reviewer agent 是工作流核心。

💬 讨论 — Peter Yang 同日横评印证了这一趋势：Codex 被评为「最好的 desktop app，GPT-5.5 很强，但没有移动端是硬伤」。Claude Code 被点名 98% uptime 不够理想。

🔗 来源 — Dan Shipper（Every CEO）+ AI & I 播客 · AI & I 播客 episode

💡 Insight — Codex 的竞争力目前更多在 desktop app 体验和可靠性而不仅是模型质量——这对 Claude Code 的 CLI-first 路线是一个信号。如果你在评估工具切换，Peter Yang 的横评是目前最完整的对比入口。

B · 深度观察

Simon Willison：vibe coding 与 agentic engineering 的边界在消融 — Simon 发现自己高度熟练的 agentic engineering 开始有了 vibe coding 的味道——不再逐行审查、信任程度在提升，他认为这令人不安，值得每个「负责任使用 AI 写代码」的工程师对照自省 · 来源
Simon Willison 的 Code w/ Claude 2026 现场直播博客 — Anthropic 活动全天文字直播，含 Managed Agents 发布和 keynote 其他内容的一手记录 · 来源
Cursor 工程博客：持续改进 agent harness — 介绍如何通过迭代 context 策略、评估体系和模型特定调优让 harness 持续进步，与 Anthropic 的 harness 设计文章形成互读 · 来源 📖 中文版
Anthropic Engineering：长期运行应用开发的 harness 设计 — Prithvi Rajasekaran 详述三智能体架构（planner + generator + evaluator），GAN 启发的 evaluator 是关键，跑多小时自主 coding session 的完整方案 · 来源 📖 中文版
Peter Yang：五款 AI 个人 agent 横评（OpenClaw/Hermes/Claude Code/Codex/Gemini） — 结论是「没有人赢得这场竞赛」，各有明显短板，是目前最完整的跨工具对比 · 来源
Matt Pocock：/handoff 是 Claude Code 新 skill 且很好用 — /grill-with-docs → /handoff 切到 /prototype → 返回 grilling session → /to-prd → /to-issues 的链式 skill 工作流展示 · 来源
Codex PM Derrick Choi：用 imagegen 可视化 PR 变更 — 让 Codex 生成 PR 变更的可视化图像替代阅读大段 diff，是非官方功能组合但实用 · 来源