2026-05-07
今天 Anthropic 在 Code w/ Claude 活动上打出两张牌:与 SpaceX 签署算力合同(300+ MW、22 万张 NVIDIA GPU 本月上线),Claude Pro/Max 5 小时限额即日起翻倍;Claude Managed Agents 同步开放 multiagent orchestration、outcomes loop、webhooks 进入公测,dreaming(跨会话记忆整理)进入 research preview。Claude Code 重度用户今天有两件事可以立刻跟进:确认限额已更新,以及翻看 Managed Agents 文档看有没有你正在手搓的 agent 记忆 / 编排能力。
A · 产品动向
1. Anthropic × SpaceX 算力扩容,Claude Pro/Max 5 小时限额翻倍
📌 发生了什么 — Anthropic 宣布与 SpaceX 达成算力合作:获取 300+ MW 新容量和 22 万块 NVIDIA GPU,预计本月内上线,全部用于 Claude Pro 和 Max 用户。同步生效:Pro MAX 和 Team 的 5 小时速率限额翻倍,峰值时段的额外降级限制被撤销(但峰值限制未完全取消)。这是对过去几周用量爆表、用户频繁撞限额的直接回应。
💬 讨论 — Boris Cherny(Claude Code 工程师)公开承认「需求已超过供给,感谢坚持」——这是 Anthropic 首次正式确认容量压力。中文社区观察到峰值限制尚未完全取消,认为算力仍是短板。
🔗 来源 — Anthropic 官方公告 · Boris Cherny(Anthropic Claude Code engineer)
💡 Insight — 限额翻倍对跑长任务、多并发 subagent 的 Claude Code 用户是实质改善。SpaceX 合作是租用 Colossus 超算闲置容量的短期填坑,Anthropic 自建算力路线未变——但这个窗口期值得重新跑之前被截断的大任务。
2. Claude Managed Agents 公测:multiagent orchestration + dreaming 上线
📌 发生了什么 — Code w/ Claude 活动现场,Anthropic 发布 Claude Managed Agents 四项新能力:① multiagent orchestration 进入 public beta(lead agent 委派 specialist agent 并行处理复杂任务);② outcomes loop 进入 public beta(rubric 驱动的自我改进循环);③ webhooks 进入 public beta;④ dreaming 进入 research preview——后台跨多个会话反思记忆,可自动编辑记忆、新增 skill、移除过时条目。所有功能今日在 Claude Platform 可用,入口在 /claude-api skill 或对应 OSS repo。
💬 讨论 — ClaudeDevs 官方账号区分了 session 内实时记忆写入与 dreaming 离线 batch 反思的架构区别,Simon Willison 在现场直播博客中有同步记录。
🔗 来源 — @claudeai(Anthropic 官方) · @ClaudeDevs(Anthropic 官方开发者频道)
💡 Insight — dreaming 是目前 coding agent 里最接近「agent 自我进化」的官方实现——不是人工写 memory,是 agent 自己跨会话整理经验、沉淀 skill。research preview 阶段 API 可能不稳定,但现在就读文档、规划 harness 如何对接是对的时机。
3. Cursor 3.3:上线 Context Usage Breakdown 面板
📌 发生了什么 — Cursor 3.3 changelog 新增 context usage 可视化:agent 运行时可实时看到 rules、skills、MCP、subagent 各自占用的 token 数。宝玉(AI 工程写作者)实测发现自己的 Skills 占了 6.8K tokens,远超预期。
💬 讨论 — Cursor 设计主管 Ryo Lu 的配套推文定性这是「legibility 优先」设计——平时折叠看清晰视图,需要时展开看 token 深度数据。
🔗 来源 — Cursor changelog 05-06-26 · 宝玉(@dotey)实测
💡 Insight — Context budget 是 coding agent 性能的隐性瓶颈,很多人的 Rules 和 Skills 在无意识间已经堆满。这个面板让你第一次能直接看到各模块的 token 开销——拿到数据后,优先裁剪高 token / 低频使用的 skill,而不是靠直觉猜。
4. Codex 完成「知识工作 OS」转型,Every 团队 80% 工作时间在里面跑
📌 发生了什么 — Every CEO Dan Shipper 和增长负责人 Austin Tedesco 在 AI & I 播客复盘:三个月前 Codex 对知识工作者还是玩具,GPT-5.5 上线后翻转——Austin 现在用 Codex 写 GTM 计划(从 Slack/Notion/会议记录提取素材)、重建 KPI 看板、做候选人识别。核心差异化:Codex Desktop app 比 Claude Desktop/Cowork 更快更稳定;folder 结构 + reviewer agent 是工作流核心。
💬 讨论 — Peter Yang 同日横评印证了这一趋势:Codex 被评为「最好的 desktop app,GPT-5.5 很强,但没有移动端是硬伤」。Claude Code 被点名 98% uptime 不够理想。
🔗 来源 — Dan Shipper(Every CEO)+ AI & I 播客 · AI & I 播客 episode
💡 Insight — Codex 的竞争力目前更多在 desktop app 体验和可靠性而不仅是模型质量——这对 Claude Code 的 CLI-first 路线是一个信号。如果你在评估工具切换,Peter Yang 的横评是目前最完整的对比入口。
B · 深度观察
- Simon Willison:vibe coding 与 agentic engineering 的边界在消融 — Simon 发现自己高度熟练的 agentic engineering 开始有了 vibe coding 的味道——不再逐行审查、信任程度在提升,他认为这令人不安,值得每个「负责任使用 AI 写代码」的工程师对照自省 · 来源
- Simon Willison 的 Code w/ Claude 2026 现场直播博客 — Anthropic 活动全天文字直播,含 Managed Agents 发布和 keynote 其他内容的一手记录 · 来源
- Cursor 工程博客:持续改进 agent harness — 介绍如何通过迭代 context 策略、评估体系和模型特定调优让 harness 持续进步,与 Anthropic 的 harness 设计文章形成互读 · 来源 📖 中文版
- Anthropic Engineering:长期运行应用开发的 harness 设计 — Prithvi Rajasekaran 详述三智能体架构(planner + generator + evaluator),GAN 启发的 evaluator 是关键,跑多小时自主 coding session 的完整方案 · 来源 📖 中文版
- Peter Yang:五款 AI 个人 agent 横评(OpenClaw/Hermes/Claude Code/Codex/Gemini) — 结论是「没有人赢得这场竞赛」,各有明显短板,是目前最完整的跨工具对比 · 来源
- Matt Pocock:/handoff 是 Claude Code 新 skill 且很好用 — /grill-with-docs → /handoff 切到 /prototype → 返回 grilling session → /to-prd → /to-issues 的链式 skill 工作流展示 · 来源
- Codex PM Derrick Choi:用 imagegen 可视化 PR 变更 — 让 Codex 生成 PR 变更的可视化图像替代阅读大段 diff,是非官方功能组合但实用 · 来源