Sources & Pipeline
AI coding 早报背后的消息源与加工链路。Live snapshot from config/sources.yaml at build
time — updates as the source list evolves.
加工流程 Pipeline
抓取 Fetch
RSS 拉新条目;X 用本地 cookie-based CLI 拉每个 handle 最近发文;GitHub 拿仓库 release;工程博客(Anthropic / Cursor)直接抓 HTML。每个 source 失败独立处理,不连坐。
去重 Dedupe
每个新 URL 算 sha1 写入 state/seen.json,跨日生效。
老条目不会再被推送。
时间窗 24h
首次启动只放过最近 24 小时内容,避免历史灌水。日常运行不再裁剪——
seen.json 已经隔了一切旧内容。
Claude 评议
喂入完整 taste.md(读者画像 + PASS/FILTER 规则
+ 事件聚合 + A 桶 / B 桶 schema),让 Claude Sonnet 做语义筛选与编排。
过滤掉 vibe 推文、转发链接、营销稿;剩下的合并相同事件,分发到 A · 产品动向 / B · 深度观察。
分发 Deliver
写入 content/digests/<date>.md(即你正在浏览的本站);
推送 Lark interactive card;可选触发 translate.py 把英文长文翻成中文落到 /articles/。
RSS 订阅 Blogs & Changelogs
工程博客 Scraped — no public RSS
播客 Podcasts (show notes)
GitHub Releases Watched repositories
X 关注 Followed handles
每位每次抓取最近 10 条原创推文,去掉 RT/reply 后取前 3 条进入 Claude 评议。