Angehefteter Tweet
Hao Sun
1.6K posts

Hao Sun
@hao_sun_
专注美股价值投资。不杠杆/不合约/不期权。不碰币圈。欢迎美股投资者私聊互fo。
Hong Kong Beigetreten Ekim 2013
406 Folgt95 Follower
Hao Sun retweetet
Hao Sun retweetet
Hao Sun retweetet
Hao Sun retweetet
Hao Sun retweetet

终于有人把枯燥的监控面板,做成了一张实时服务地图。
Maple 是一个开源项目,可以把后端系统里的 telemetry 数据,变成可交互、会动的服务依赖图。
对做微服务和分布式系统的人来说,这个痛点太熟了:
日志一堆
指标一堆
trace 一堆
出问题时还是不知道到底卡在哪个服务、哪条查询、哪个队列
Maple 的思路是直接把数据流画出来:
实时服务依赖
API / 数据库 / Kafka 交互关系
节点级 p99 延迟、错误率、性能指标
重查询定位
OpenTelemetry 接入
还带 MCP code server,方便 AI Agent 帮你审查系统
重点不是“图好看”。
而是排查线上问题时,你不用再在一堆冷冰冰的面板里猜。
你能直接看到数据怎么流,瓶颈在哪里,哪个服务正在拖垮系统。
对后端团队来说,这类可视化 observability 工具会越来越重要。
中文
Hao Sun retweetet

119k星!前 Vercel 工程师把他压箱底的 Claude 工作流全公开了。
Matt Pocock,就是那个把 TypeScript 讲得最通透的人,把他每天实际在用的 AI 编程方法整套扔了出来,一共 18 个技能,专门治 AI 写代码各种翻车。
核心干这几件事:
1️⃣ /grill-me:像审犯人一样把你的需求问透,再也不会你说东它改西
2️⃣ /tdd:强制先写一个会挂的测试再写代码,不靠谱的实现根本过不了关
3️⃣ /caveman:token 消耗直接砍掉 75%,废话一句不留
4️⃣ /improve-codebase-architecture:定期给代码库做体检,越写越清爽
一行装完:npx skills@latest add mattpocock/skills
先试试 /grill-with-docs,你会第一次感觉 AI 真的听懂了你在说什么。
github.com/mattpocock/ski…

中文

#大冲塔运动
网易有道词典“it's my duty”的全球发音,使用了BBC采访 #duty哥 的原声,底下也有其他人重复duty哥的台词,向他致敬🫡🫡
墙国蛙哈哈🐸@GFWfrog
“不正确记忆”网站现已上线,首发八九六四填空,回顾20个关键词,让我们一起对抗遗忘! 64.buzhengquejiyi.com
中文
Hao Sun retweetet

Anthropic 发了一篇文章,讲他们内部怎么用 Claude 接管 95% 的数据分析请求,整体准确率稳定在 95% 左右。
他们一开始直接把 Claude 接到数据仓库上让它自己跑,准确率不超过 21%。
一、为什么数据分析比代码生成难
写代码有文档、有测试,模型出错会被发现。
数据分析不一样:往往只有一个正确答案,来自一个正确的数据源,而且没有任何确定性的方式验证答案是对的。
他们总结出三类主要失败:
一是映射模糊。数据仓库里可能有几百万个字段,Agent 不知道"活跃用户"到底对应哪个字段,什么行为算活跃,要不要排除欺诈用户,时间窗口用多长。
二是数据过期。数据源和业务定义一直在变,Agent 掌握的知识随之过期,开始给出表面合理、实际有偏差的答案。
三是检索失败。正确的信息就在仓库里,也有完整的注释,但搜索空间太大,Agent 就是找不到它。
二、他们的解法:三层结构
数据基础层解决映射模糊。
核心原则是:每个概念只有一个权威答案。维护少量受强治理的逻辑模型,坚决废弃那些近似的重复数据集。当 Agent 搜索某个概念时,只找到一个结果。
但是光有原则不够,还得用工具强制执行,绕过权威模型的改动无法通过 CI,下游团队必须基于权威层构建。没有执行机制的治理,会很快退化。
可信数据源层解决检索失败。
按可信程度从高到低分四类:
1. 语义层(编译好的指标定义,Agent 被强制要求优先用这个)
2. 数据血缘图(语义层覆盖不到时,推断应该从哪个上游模型聚合)
3. 查询语料库(历史 SQL,但直接给 Agent 访问数千条历史查询,准确率变化不到一个百分点,要先提炼成结构化参考文档才有用)
4. 业务上下文(路线图、决策记录、组织架构,Agent 不知道这些就只会回答你问的问题,而不是你想要的答案)。
Skill 层解决三类失败的最后一公里。Skill 是 Agent 按需读取的 Markdown 文件,告诉它按什么顺序查哪些数据源、如何处理模糊的数据。
加了 Skill 之后,准确率从 21% 涨到 95%。某些领域能到 99%。
这里有几个关键做法:成对创建 Skill,一个做轻量路由器缩小搜索范围,一个编码资深分析师的分析流程。参考文档要面向模型检索来写,描述粒度、范围、排除条件和注意事项,不要写容易过期的操作步骤。
最容易被忽视的一点是:Skill 文档和数据模型放在同一个代码库,改模型的 PR 就是更新 Skill 文档的 PR,用 CI 钩子强制执行。他们曾经亲眼看到上线时准确率 95%,一个月后跌到 65%,才意识到 Skill 维护是工程问题,不是文档问题。
三、一个有意思的负面结论
他们给 Agent 开放了对整个数仓所有 SQL 的 grep 访问,数千个文件。
验证了 Agent 每次回答前确实读了这些文件,但准确率变化不到一个百分点。
进一步检查:答错的问题,正确答案在语料库里有吗?约 80% 的情况下有。Agent 看了,但就是用不上。
结论:瓶颈不是能不能访问信息,而是能不能把问题映射到正确的结构。
这个发现重新调整了好几个月的工作优先级。
四、还没解决的问题
静默失败:答案是错的,但看起来合理,没人提出异议就被直接用了。
他们现在用来源标注页脚、对高层汇报内容要求人工确认来缓解,但也承认还没有完善的解决方案。
claude.com/blog/how-anthr…
中文
Hao Sun retweetet

说个极其得罪人,但绝对能保住你心智空间的真相:一定要在“路上”找朋友,千万不要“带着”朋友上路。
这也是我最近这半年来,最痛的领悟。
当你发现了一个新杠杆,或者认知突然升级时(比如看懂了 AI 时代的趋势,明白了复利的威力),你的第一反应往往是极其兴奋的:我要拉着我最好的朋友/室友一起学,大家一起逆袭。
然后你会发现,你迎来了地狱级的能量消耗。
1/ 解释成本,是你最大的沉没成本你想拉着身边人一起成长,结果 90% 的时间都花在了“劝说”和“对抗惰性”上。 你要苦口婆心地向他们证明:英语很重要、下班后不要只打游戏、学会调 API 能极大提升效率。最后他们敷衍地点点头,第二天照旧。 而你,却被榨干了原本可以用来调试几行 FastAPI 代码、或者刷几组 Anki 牌组的宝贵精力。不要用自己的时间,去为别人的认知滞后买单。
2/ 同频不是“劝”出来的,是“筛”出来的试图改变身边的人,是一种极度自大的妄念。真正的同路人,根本不需要你去做思想工作。 与其在原来的圈子里苦劝别人一起进步,不如闭上嘴,直接打开电脑,把你的报错日志、踩坑记录、或者是 PPL 训练后的力竭感直接发出来。 放弃拯救,开始展示。
3/ 在“路上”相遇,才是最高效的社交当你开始向着目标全速狂奔时,你会自动摆脱原有的重力圈。 这时候,你在 X 上、在开源社区里遇到的那些人,大家根本不需要寒暄,也不需要互相解释什么是“长期主义”。你们不需要互相打鸡血,只需要一句“这个 Bug 你是怎么跑通的”,就能直接产生价值交换。
总结:不要去拖拽那些不想走的人,你的电量很贵,只留给跑在同一条赛道上的人。 当你把手头的事情做到极致,属于你的同路人,自然会在下一个路口等你。
永远在路上,永远不下牌桌。 寻找还在暗处死磕的 1% 同路人,评论区冒个泡,顶峰相见 👇
中文



















