LumenNews / 早报 / 2026-05-25 Sources & Pipeline →
早报 · 2026-05-25 · 深度观察 4 · Trending 3 · 产品动态 1 · 47 sources

2026-05-25

OpenAI 研究员 Yann Dubois 提出:把当前模型冻结、专注 harness 工程,每个领域都能感受到 AGI——这是今天最值得细想的命题,直接指向开发者该在哪里投入。今天没有紧急产品更新需要立即行动,但 Boris Cherny(Claude Code 工程师)的 auto mode 多开建议值得今天就开一个新 session 验证。

A · 深度观察

  • Yann Dubois:harness 是 AGI 性能的关键变量,不是模型 — OpenAI 研究员声称「冻结模型 + 专注 harness 工程/训练,每个领域都能感受到 AGI」;Viv(LangChain agents & evals)从反面印证:模型在不熟悉的 harness 下性能大幅下滑,对 tool shape 极度敏感——两者合起来意味着 harness 设计是当前最高杠杆的工程工作,而非等待下一代模型。 · 来源
  • Armin Ronacher:AI 代填的 issue 是开源维护的系统性噪音 — Pi 项目收到大量 LLM 代写 issue:错误根因猜测、假 minimal repro、无关类比,全部充满自信——Ronacher 明确要求回归「命令→期望→实际→精确报错」四要素;对让 coding agent 自动提 issue 的工作流,这是直接的约束条件。 · 来源
  • Boris Cherny(Claude Code 工程师):auto mode 是 multi-clauding 的核心前提 — 关掉权限提示 = 启动 session 后立刻开第二个并行 session 成为可能——Cherny 本人的 #1 使用建议,意味着提升 Claude Code 产出的瓶颈是交互设计(权限打断)而非模型能力。 · 来源
  • Nikunj Kothari:Claude Code + browser_use 反向工程私有 API — 手法:让 Claude Code 启动 browser_use / vanilla playwright 录制网络请求,边手动点击边让模型分析 API 结构、auth 方式和 rate limit,比 DOM 抓取稳定得多——并提出「tools.txt」概念(类比 llms.txt),供 agent 发现可用工具接口。 · 来源
  • anthropics/knowledge-work-plugins — Anthropic 官方开源的 Claude 知识工作者插件集,14K 总星、今日 550 新增——看 Anthropic 自己认为哪些 plugin 模式值得标准化推广。
  • manaflow-ai/cmux — 基于 Ghostty 的 macOS 终端,为 AI coding agent 专门设计垂直标签和通知,今日 696 新星——多开 Claude Code session 时可能比普通终端更顺手。
  • earendil-works/pi — 完整 AI agent toolkit:coding CLI + 统一 LLM API + TUI/Web UI + Slack bot + vLLM pods,54K 总星、456 今日新增——看 agent 工具栈的另一种整合思路。

C · 产品动态

1. kimi-code 推出 TypeScript 版本

📌 发生了什么 — Moonshot AI(Kimi)发布 kimi-code 的 TypeScript 重写版,继 Python 版之后进入 TS 实现——中国头部 AI 厂商的 coding CLI 赛道布局在提速。

💬 讨论 — 宝玉指出社区此前有梗「kimicli 用 Python 是彻底失败、应重构为 TS」,没想到真的出了 TS 版。

🔗 来源宝玉 (@dotey)

💡 Insight — Claude Code / Codex / OpenCode 之外,中文 coding CLI 生态在快速补齐;短期对已有工具链无影响,但多竞品入场会加快 MCP / tool interop 标准化的外部压力。