Lucas Wu

816 posts

Lucas Wu

Lucas Wu

@haihsu93

AI Builder

北京 Katılım Ocak 2018
418 Takip Edilen60 Takipçiler
Lucas Wu
Lucas Wu@haihsu93·
复议
Lucas Wu tweet media
yibie@yibie

多 Agent 系统炒了一年,生产环境里真正活下来的只有三种模式。剩下的都在坟墓里。 这个结论不是我的。它来自三份今天同时浮出水面的证据——一份是 Cognition(Devin 背后的公司)工程负责人的内部复盘,一份是 Manning 作者 Micheal Lanham 的行业全景报告,还有一份,是 GitHub 上一个叫 metaswarm 的项目。 我把它们放在一起看,发现一件很有意思的事:它们说的竟然是同一句话。 --- ## 三个信号,同一个判断 **信号一:metaswarm——18 个 Agent,127 个 PR,一个周末** 今天 HN 上最火的项目。一个人 + 18 个 AI agent + 一个周末 = 127 个 PR 推到生产。MIT 开源。看起来是多 Agent 协作的终极案例。 但如果你仔细看它的架构,你会发现一个被刻意隐藏的细节:**它的 18 个 Agent 不是在对等协作。它是 map-reduce-and-manage。** 一个管理者拆任务,17 个子 Agent 各干各的,管理者收结果、合并、push。Agent 之间不互相聊天、不互相审查、不互相投票。每一个子 Agent 面对的是自己那一小块独立的上下文。 它看起来像 swarm,但其实是流水线。 **信号二:Walden Yan 的内部复盘——「写入保持单线程」** Walden Yan 是 Cognition 的工程负责人。他 10 个月前写了一篇《不要构建多 Agent 系统》,今天又写了一篇《多 Agent:什么真的有效》。 核心结论原话:「多 Agent 系统在今天最有效时,写入保持单线程,额外的 Agent 贡献智能而不是行动。」 他们试了三种模式: 1. **代码审查循环**——编码 Agent 写,审查 Agent 读。审查 Agent 拥有**完全干净的上下文**,不看编码过程,只看 diff。平均每个 PR 能发现 2 个 bug,58% 是严重的。关键发现:两个 Agent **不共享上下文**效果反而更好。因为上下文衰减——编码 Agent 工作几小时后积累了巨大的上下文窗口,注意力已经稀释了。干净的审查 Agent 反而更聪明。 2. **智能朋友**——主模型遇到棘手问题,调用一个更强(也更贵)的模型作为「朋友」。关键难点不是推理能力,是**沟通**:弱模型怎么知道自己到极限了?该传给强模型什么上下文?强模型怎么回话才能让弱模型真正理解? 3. **管理者-子 Agent**——一个管理 Devin 拆任务,子 Devin 各干各的,管理者综合。遇到的问题全是**沟通问题**:管理者默认过度规定(因为它缺乏代码库上下文)、子 Agent 不主动报告该让兄弟姐妹知道的信息、Agent 之间默认不传消息。 三种模式,同一条规则:**写操作的 Agent 只有一个。** **信号三:Micheal Lanham 的行业全景——「多 Agent 失败是结构性的,不是提示词问题」** Lanham 是 Manning《AI Agents in Action》的作者。他今天的文章标题就说明了一切:《Multi-Agent in Production in 2026: What Actually Survived》。 他把多 Agent 系统分成三种拓扑: - **Agent-flow(流水线)**:顺序传递。A 做完交给 B,B 做完交给 C。这是生产环境里**存活率最高**的形态。 - **Agent-orchestration(编排)**:一个管理者调度多个执行者。map-reduce-and-manage。最实用的复杂任务形态。 - **Agent-collaboration(对等协作)**:Agent 之间互相通信、协商、投票。**几乎全死了。** 他的原话:「大多数看起来像『更多 Agent = 更聪明』的东西,其实只是相同信息的冗余重排列。」 三份报告,三个作者,没有互相引用。但结论完全一致。 --- ## 为什么「对等协作」全死了? 答案藏在两个技术细节里。 **第一个,Walden 说的「操作携带隐式决策」。** 当一个 Agent 写代码时,它在做选择——用什么设计模式、怎么处理边界情况、变量命名风格、错误处理策略。这些选择不是显式的,是「隐式」的。 两个 Agent 同时写,就会对同一个问题做出互相冲突的隐式决策。最后合并的时候不是 merge conflict,是**设计哲学冲突**。这种冲突没有 diff 工具能自动解决。 **第二个,Lanham 说的「级联表面」。** 对等协作的失败不是线性的,是指数级的。Agent A 的误差传给 Agent B,B 放大后传给 C,C 再放大传给 A。三个循环下来,输出和输入的语义距离已经大到不可恢复。 这解释了为什么 2024 年所有那些「Agent 团队自动开发 App」的演示都停在了 demo 阶段。 --- ## 那活下来的三种模式长什么样? **模式一:流水线(Agent-flow)** 最简单的形态。A → B → C,一个接一个。像工厂流水线。 适用场景:需求明确、步骤可分、输出可验证。比如:需求分析 Agent → 代码生成 Agent → 测试生成 Agent → 代码审查 Agent。 活下来的原因:每一步的输入和输出是明确的、可检查的。出问题能定位到具体环节。 **模式二:编排(Orchestration = map-reduce-and-manage)** 一个强 Agent 做规划 + 拆解 + 综合,多个弱 Agent 并行执行子任务。 适用场景:复杂任务需要并行加速,但决策权必须集中。比如 metaswarm 的 18 个 Agent,比如 Devin 的 manager-worker。 活下来的原因:写入操作只有管理者一个。子 Agent 贡献的是「智能」(分析、生成、搜索),不是「决策」。 **模式三:生成-验证(Generator-Validator)** 一个 Agent 写,另一个 Agent 读 + 挑刺。写的不看读的过程,读的不看写的过程。干净的上下文。 适用场景:代码审查、安全检查、内容审核。Walden 说他们在生产环境已经跑了很久。 活下来的原因:验证 Agent 的上下文是干净的。没有历史包袱,不会被编码 Agent 的错误假设带偏。 --- ## 一个反直觉的结论 看了这三份报告,我最大的感受不是「多 Agent 不行」,而是一个更微妙的东西—— **多 Agent 系统真正解决的问题不是「更聪明」,是「更便宜 + 更可靠」。** 用同样的钱,跑 5 个便宜模型的并行流水线,比跑 1 个贵模型做全流程,出活质量更稳定、容错率更高、速度更快。 这不是 AGI 的突破。这是系统设计的胜利。 Walden 在文章最后说的:「我们正在构建一个世界,智能被注入软件开发生命周期的每一个阶段——不是作为一群自主行动者,而是作为一个协调的系统,扩展人类的品味。」 注意这个词:「协调的系统」,不是「自主的行动者」。 --- ## 所以,别再造 Agent Swarm 了 如果你现在准备做一个多 Agent 项目,问自己三个问题: 1. **写入操作能不能只有一个人?** 如果能,继续。如果不能,单 Agent 可能更好。 2. **Agent 之间传什么上下文?传多少?** 这不是提示词问题,这是架构问题。传多了淹没接收者,传少了接收者无法做正确决策。 3. **失败会怎么级联?** 如果 Agent A 错了,Agent B、C、D 会跟着错到什么程度?有没有断路器? 如果你对这三个问题没有清晰的答案,你就还没有准备好上生产。 多 Agent 的未来是真实的。但不是你想的那种未来。 不是一群 Agent 在聊天室里讨论怎么做。是一个指挥,多个执行者。是一种结构设计,不是魔法。 --- **参考来源:** - Walden Yan (Cognition): [Multi-Agents: What's Actually Working](x.com/walden_yan/sta…) - Micheal Lanham: [Multi-Agent in Production in 2026: What Actually Survived](@Micheal-Lanham/multi-agent-in-production-in-2026-what-actually-survived-f86de8bb1cd1" target="_blank" rel="nofollow noopener">medium.com/@Micheal-Lanha…) - metaswarm: [18 AI agents, 127 PRs to prod in a weekend](news.ycombinator.com/item?id=468649…) - Anthropic: [anthropics/skills](github.com/anthropics/ski…) ⭐

中文
0
0
0
6
Lucas Wu
Lucas Wu@haihsu93·
Hyperliquid 最强的不是“预测市场”这个品类,而是它有可能把预测市场、永续合约、现货、传统资产、pre-IPO、事件合约都统一到一个高性能链上交易系统里。 这条消息真正 bullish 的地方,不是 AI 自动抓新闻,而是 Hyperliquid 正在把“市场创建”本身协议化。如果它成功,未来交易的不是币,而是任何有价格、有结果、有争议空间的东西。
Quant Chad@Autonomous_Chad

Hyperliquid could be the next $1 trillion opportunity in crypto. This new announcement is the reason why Two days ago i was fudding them for only having two (2) markets active, today they announced unlimited markets. They just automated market creation. here is how it works : - AI scrapes news headline to propose new markets - @HyperliquidX validator set vote on their inclusion - Then the same validator set votes on resolution This is a very elegant way of automating the labor intensive process of market creation while delegating the human verification element to the protocol. Their platform currently generates $5B daily volume on perps alone ($1.8T annually). If they can become a top player in the Prediction Market space too with these changes and their current userbase they could easily reach $5-10T range in a few years. Amazing to see such innovation in the PM space

中文
1
0
4
89
Lucas Wu
Lucas Wu@haihsu93·
为什么体验好会带来价值复利? 交易平台有一个很强的飞轮: 好体验 → 更多交易者 → 更大交易量 → 更深流动性 → 更小滑点 → 吸引更多大户/做市商 → 更多手续费 → 更强生态 → 进一步吸引用户。 这就是所谓“流动性网络效应”。 对交易所来说,流动性不是普通功能,而是护城河。因为用户最在乎的是:我能不能快速成交?价格好不好?大单会不会滑点?资金安全吗? Hyperliquid 采用类似中心化交易所的订单簿模式,订单按价格-时间优先撮合,这和传统交易所/CEX 的交易体验更接近。 所以作者的判断是: 一旦 Hyperliquid 成为链上交易流量的主要入口,$HYPE 就会被市场重新估值。
🧸@lonelybearrr

Why I stacked up $1M in $HYPE. Most people still think Hyperliquid is “just another perp DEX.” That’s the mistake. What people are underestimating is that $HYPE is positioned at the intersection of where liquidity, attention, and crypto market structure are heading over the next decade. The market always rewards infrastructure that captures volume. Binance captured volume. Ethereum captured settlement. Solana captured speed. Hyperliquid is trying to capture onchain trading itself. And if they win even a fraction of that market, $61 will eventually look ridiculously cheap. Here’s the thesis: Crypto is moving toward an onchain financial system where users no longer want fragmented experiences. They want speed, deep liquidity, transparency, and self-custody all at once. Hyperliquid is one of the very few protocols that actually solved the user experience problem. Fast execution. Deep liquidity. Native order books. No horrible UI. No laggy experience that feels “onchain.” For the first time, trading onchain actually feels better than trading on a CEX. That changes everything. Because once product experience becomes superior, liquidity naturally follows. And where liquidity flows, value compounds aggressively. People focus too much on narratives and ignore where the money is actually moving. Hyperliquid is already processing absurd trading volume. The fees are real. The retention is real. The community is cult-like. And the product is still early. Now think bigger. If Hyperliquid evolves into the dominant onchain trading layer for perp markets, spot markets, and broader financial primitives, then $HYPE becomes more than just a token. It becomes an asset tied directly to one of the strongest cash-flow engines in crypto. That’s where the asymmetric bet exists. The reason I believe $HYPE can 10x from here isn’t because “number go up.” It’s because the market historically reprices platforms that dominate user behavior far beyond what seems rational in early stages. People laughed at: ETH below $100. SOL below $20. BNB before exchange dominance. BTC below $1k. The common pattern? The market underestimated infrastructure during accumulation phases. At $61, people think they’re late. I think the market is still massively underpricing what Hyperliquid could become if it captures global crypto trading flow over the next cycle. And the reality is: crypto trading volume will continue growing exponentially over time. More users. More leverage. More speculation. More capital. More financialization. Hyperliquid benefits directly from all of it. Could there be volatility? Of course. Could it nuke 50% short term? Easily. But I’m not positioning for noise. I’m positioning for where I believe market structure is heading over the next 5-10 years. The biggest money is rarely made chasing trends late. It’s made by identifying infrastructure before the market fully understands its importance. That’s why I stacked $1M into $HYPE.

中文
0
0
2
84
Lucas Wu
Lucas Wu@haihsu93·
@superexvip 好像看到一个英文版的,不知道谁抄谁的
中文
1
0
0
799
北方
北方@superexvip·
$HYPE 短期超越 $BNB 的900亿美元确实很难,毕竟币安是加密行业有垄断性地位、有3亿用户、年盈利80亿+,而Hyperliquid只有100万用户、年盈利8亿左右,目前的体量相差太大。横向对比美股,纳斯达克,纽交所,CME这三大交易市场市值也是500亿到1000亿美元这个区间。 且Hyperliquid还存在两个疑点: 1. 还有几亿代币未解锁,未来会如何解锁和处置; 2. 链上交易所的合规化前景,hyperliquid前两年确实吃了很多监管空白的福利 所以Hype目前的价格并没有低估,市场只是在存在情绪化溢价。我前面几条推并不是鼓动在加密熊市时间去短期fomo,而是阐述目前Hype为何逆势上涨,市场在炒一个什么样的叙事。
中文
16
3
50
33.8K
Evan
Evan@RanRan113080440·
@i5ting 这些大厂里面的就算裁员了,去别的大厂不是随便进,替他们担心什么?
中文
17
0
26
67.7K
i5ting
i5ting@i5ting·
某团,某博,某讯文档都爆出大量裁员。比例惊人,我不敢说数据,可以评论区聊聊
中文
428
30
792
688.8K
Lucas Wu
Lucas Wu@haihsu93·
Keep your eyes on the road, your hands upon the wheel.
English
0
0
1
10
Lucas Wu
Lucas Wu@haihsu93·
代码只是结果
中文
0
0
1
9
Lucas Wu
Lucas Wu@haihsu93·
越发觉得,在虚拟世界,我已经无所不能了。
中文
0
0
1
11
Lucas Wu
Lucas Wu@haihsu93·
Replacing Markdown with HTML is ridiculous, because Markdown is structurally far more elegant than HTML.
English
0
0
0
10
Holegots
Holegots@holegots·
我悟了 所有的 AI startup 本质都是中转站 Cursor 是中转站 Manus 也是中转站 自己的产品不过是帮助中转站卖出更多 Token 的小巧思罢了
中文
44
14
204
30.6K
(Oma)devuae
(Oma)devuae@delveroin·
Drop URL link! Let’s send some traffic there!!
English
225
3
77
6.2K
Dr. DIG
Dr. DIG@CiprianiRanieri·
time to promote your product. share it below, see it as a marketing opportunity. I'll start !
English
228
7
109
8.8K
Kaito
Kaito@KaiXCreator·
Time to promote your startup Drop your project URL Let’s drive some traffic
English
286
3
122
10K
Priyanka Saini
Priyanka Saini@PriyankaSaini28·
Hey Builders, Drop what you’re building Just the link No Pitch I’ll go through everything ↓
English
325
6
137
8.8K
John
John@ionleu·
drop ur startup link
English
341
4
145
14.3K
Csaba Kissi
Csaba Kissi@csaba_kissi·
Share your project/website, guys
English
527
6
247
26.8K
🃏
🃏@anupamrjp·
Hey founders 👋 what are you building right now? SaaS • AI tools • side projects • MVPs Drop your product 👇 🚀
English
54
2
27
1.4K
Tobby_scraper
Tobby_scraper@Tobby_scraper·
GM Guys. Share your app! 💡
English
156
1
70
5.9K