Yifeng "Evan" Wang

1.6K posts

Yifeng "Evan" Wang banner
Yifeng "Evan" Wang

Yifeng "Evan" Wang

@ewind_dev

MTS @paperboy_ai / ex @lovart_ai / cofounded @AffineOfficial / aka 雪碧 / building @spoollabs

Singapore Katılım Mayıs 2020
1.4K Takip Edilen12.1K Takipçiler
Sabitlenmiş Tweet
Yifeng "Evan" Wang
Yifeng "Evan" Wang@ewind_dev·
借此分享一个重要的决定:出道创业两个月,Spool 被 Paperboy 光速收购啦! Spool 的所有全职成员(aka 我一个人)也就此加入 PB 开启下一段旅程 🙈 如果你好奇这个决定背后的动机,推荐听看看这期节目,或者直接关注 @paperboy_ai 吧哈哈 整活预警,我们即将 launch 很好玩的东西!
koji@Yuancheng

本周播客:人类和 AI Agent 的最佳配合方式,还没被发明|对谈 @paperboy_ai y 【视频播客】 youtu.be/Kmpj5KUfIew?si… 🚥 本周,十字路口的嘉宾是 Paperboy(paperboy.com)团队。John Yang 21 岁,CEO。Jett Chen 19 岁,CMU 大一在读,同时是 founding engineer。Paperboy 团队 12 人,10 位工程师,融资 470 万美金。 John 认为:人类和 AI Agent 配合工作的最佳方式,很可能还没被发明出来。虽然已经有了 Claude Code、Codex、Manus、OpenClaw,但它们本质上都是 session-based + prompt-based。用户需要打开一个窗口,输入 prompt,等完成,关掉。下次从零开始。 Paperboy 正在尝试找到一种更自然、更连续、更可协作的 Agent 界面与记忆结构——Agent 应该通过观察你用电脑来自己学习,用 IM 而不是 session 来组织对话,主动找你,而不是等你 prompt。

中文
49
9
225
73.3K
Yifeng "Evan" Wang retweetledi
StarKnight
StarKnight@StarKnight·
中肯🤔
StarKnight tweet media
日本語
284
404
3.8K
185.4K
Yifeng "Evan" Wang retweetledi
Claude
Claude@claudeai·
New in Claude Code: Artifacts. Interactive pages built from your session, like a PR walkthrough or a living project dashboard, shared with your team at a private link. Available in beta on Team and Enterprise plans.
English
663
1.3K
17.7K
3.7M
Yifeng "Evan" Wang
Yifeng "Evan" Wang@ewind_dev·
@hylarucoder k8s node 有几千个的数量上限,新 pod 冷启动时长也很长,更重要的是它的设计是为了跑大量 stateless 负载,和现在给 agent 开 stateful computer 的场景是有设计哲学上的冲突的。我是比较看好基于 firecracker + JuiceFS 的方案,还不成熟但日新月异
中文
0
0
8
598
海拉鲁编程客
海拉鲁编程客@hylarucoder·
草, 自己想了两天, 不如看你逗哥的文章.....
idoubi@idoubicc

聊一聊 Agent 的存算分离架构设计👇 一个有灵魂,有记忆的 Agent,一次任务的生命周期包括以下步骤 1. 用户输入 query(text + files) 2. Agent 读取提示词文件(soul.md,identify.md,user.md 等) 3. Agent 读取可用的工具和技能(tools,skills 等) 4. Agent 读取记忆(memory.md,memory_search 查询) 5. Agent 构建上下文(prompt + tools + memory + query) 6. Agent 进入 Loop(LLM 调用 → 工具调用 → 观测 → 再推理) 7. Agent 交付结果(Artifacts) 什么需要存:提示词文件,工具和技能,对话记录,交付产物 什么需要算:上下文拼接,LLM 调用,工具调用 简单表示这个过程 fn(query, agent runtime) = artifacts 我们可以把 agent 运行方式简单分为三类 1. 本地裸机运行 2. 本地带沙盒(sandbox)运行 3. 云端多副本运行 --- 1. 本地裸机运行,是 OpenClaw 之类 Agent 的常见模式。Agent 提示词文件、skills,对话记录(sessions)全部存在本地磁盘,Agent 执行任务时,会在固定 workspace 目录下运行,用户上传的文件、Agent 产出的文件全部落在同一个 workspace,Agent Loop 完全依赖本地文件构建上下文和执行工具调用,存跟算是一体的。 这种模式好处是足够简单,避免了额外的文件挂载开销,弊端在于安全性,比如 Agent Loop 执行了一个 exec(rm -rf /) 工具调用,很容易对宿主机产生破坏 2. 本地带沙盒运行,是 Codex 之类的 Agent 的常见模式。主要解决两个问题。一是防止 Agent 越权操作,提高安全性;二是解决宿主机的依赖缺失导致工具调用异常的问题。 Agent Loop 执行工具调用时,涉及到敏感操作或者有外部依赖时,把宿主机的 workspace 目录挂载到 sandbox,在 sandbox 执行工具调用,输出产物自动同步到宿主机的 workspace 目录 这种模式下的存算分离,只在工具调用环节引入 sandbox 来动态计算,存储主要靠宿主机的文件系统 3. 云端多副本运行,是 Manus 之类的工具型 Agent 的常见模式。主要特点是多租户,多任务,长时间运行 像 genspark claw,kimi claw,max claw 之类的托管版小龙虾,本质上是在云端多副本运行的助理型 Agent,每个用户有独立的提示词文件,动态安装的 skills,需要长期记忆 这类 claw 托管服务,最简单的实现方式是搭建一套 k8s 集群,在每个 pod 部署一套 Agent 框架(OpenClaw,harmes 等),通过 pvc 挂载云硬盘,实现对用户资料的持久化存储。通过负载均衡策略把每个用户的请求路由到固定的 pod,在同一个 pod 做 Agent Loop,存算是一体的,每个 Agent 有独立的运行空间。这种方案隔离性很好,不好的地方在于 pod 需要常驻,运行成本很高,难以规模化 --- 云端 Agent 需要规模化(scalable),必然要结合 serverless 架构做存算分离。计算层依赖 k8s 集群的调度机制动态扩缩容,水平扩展 Agent 网关的并发处理能力 存储层结合 Agent 的运行生命周期,不同阶段的产物用不同的存储方案,主要分为四种 1. 热状态。Agent Loop 的 step,plan,游标等状态,用 kv(redis)来存,高性能,低延迟,用于异常重启后的断点恢复 2. 对话和任务记录。在任务完成后用关系型数据库(postgres)来存 3. 长期记忆。基于对话/任务记录做摘要,提取成记忆,用向量数据库(pgvector,milvus)来存 4. 工作产物。包括用户上传的文件,Agent 输出的文件,系统内置的 tools,动态创建的 skills 等,用对象存储(s3,oss)来存 --- 以 FastClaw 为例,演示基于存算分离架构的云端 Agent 的运行过程👇 1. 一套 k8s 集群,日常 2 个 pod,部署 fastclaw gateway,接收用户请求 2. 负载均衡把用户请求路由到其中一个 pod,Agent 开始计算逻辑: 2.1 从 db 读取提示词文件(soul,identity,user) 2.2 初始化 pod 内一个临时目录作为 workspace 2.3 初始化 sandbox,挂载 workspace 2.4 从对象存储下载用户资料和系统 skills 到 workspace 2.5 调用 memory_search 工具,从向量数据库查询记忆 2.6 拼接上下文,调用 llm,解析工具 2.7 在 sandbox 执行工具调用,读写 workspace 内的文件 2.8 把 Agent Loop 过程中的状态设置为 checkpoint,保存到 kv 2.9 Agent 输出结果给用户 3. 通过惰性检查,把不活跃的 sandbox 关闭,关闭前把 sandbox 内 workspace 的文件上传到对象存储 以上的存算分离架构,计算层依赖 pod + sandbox,pod 水平扩容支持并发调用,sandbox 承接少量的工具调用,使用 e2b 作为 sandbox 可以做到秒级启动,构建 sandbox 池可以提高并发容错;存储层依赖 kv + db + vector db + oss 的组合使用,瓶颈在于 io 延迟 这套架构最大的挑战在于分布式多副本场景下的数据一致性,需要合理使用锁机制和负载均衡策略。 理解了这套架构,再去看 Manus,Claude managed agents 的实现,就很好理解了。 篇幅有限,不能详述细节,欢迎留言讨论。🤗

中文
28
7
57
43.9K
Yifeng "Evan" Wang
Yifeng "Evan" Wang@ewind_dev·
现在怎么都有 Anthropic 听床师了?
雨哥向前冲@xiangxiang103

我挺认同Kun Chen的看法的,他这次的判断抓住了核心,而且说得挺准。 事情是这样的:Anthropic本来打算从今天开始,把用Claude Pro或Max订阅去跑Agent SDK、claude -p这种程序化调用、GitHub Actions,还有第三方agent工具的额度单独拆出来,改成独立的计费,用完就得按API价格另外付钱。这对很多开发者来说简直是晴天霹雳,尤其是那些把Claude当主力跑自动化工作流的人。 结果就在今天,他们突然发邮件说这个改动先暂停了,什么都不变,订阅额度依然能继续被这些工具正常消耗。Kun Chen自己做的那个“/no-mistakes”工具,也就能继续顺畅地用下去。他兴奋地说这是个好信号,我觉得没错。 为什么说这是积极变化呢?因为这说明Anthropic在认真听开发者的反馈,没有一意孤行地只保护自己家的交互式产品。他们原本可能想把Claude打造成一个“超级应用”,不愿意让重度用户和第三方工具把服务器资源薅得太狠。但现在暂停这个计划,其实等于默认让订阅继续补贴更广阔的生态,让大家能更自由地基于Claude做创新。这对整个开发者社区是实打实的利好,也显示他们正在从“封闭应用”往“开放基础设施”的方向调整。 当然,他最后也说“still have more to do to gain back my trust”,这点我也很赞同。 Anthropic这次快速掉头是好事,但之前政策反复确实伤过不少人的信任。以后能不能说到做到、给开发者稳定的预期,才是最关键的。 总之,这件事对正在用Claude做agent开发的同学来说,是个可以松口气的好消息。短期内继续放心投入是相对安全的,值得继续观察他们下一步怎么平衡容量和生态。

中文
23
1
27
10.7K
Yifeng "Evan" Wang
Yifeng "Evan" Wang@ewind_dev·
@realchendahuang 团队应用鉴权走 zero trust、部署个人服务有 tunnel,还有 durable object 可以用作 serveless 存储、figma-like 协作应用和 agent 串流 relay
中文
1
0
13
869
陈大黄
陈大黄@realchendahuang·
我感觉大家对 Cloudflare 的开发程度依然不足 1%。 它现在出了太多的功能。 对象存储用 R2。 后端 API 用 worker。 AI 网关用 AI Gateway。 重计算的,用 Container。 缓存用 KV。 数据库用 D1。 如果用 PostgreSQL,可以用 HyperDrive 连一下。 等等,还有很多很多,只有你想不到。没有他做不到。 关键是真他妈便宜。免费额度就能用很久。什么叫免费额度?就是一分钱不掏啊,赛博菩萨。
中文
44
32
375
80.2K
Yifeng "Evan" Wang
Yifeng "Evan" Wang@ewind_dev·
遇到了一模一样的 bug!半小时烧掉 $200 Max 一周用量 15%,只因 opus 毛手毛脚 + harness bug 导致蹦出一千个 subagent 😫 谁家传参错误的 fallback 是给人往死里烧的……太初生了,老美也急需 1818 黄金眼啊
Yifeng "Evan" Wang tweet mediaYifeng "Evan" Wang tweet media
Max For AI@MaxForAI

突发,美国用户正式起诉Anthropic欺诈!! 根据WSJ @WSJ 报道,来自华盛顿特区客户卡尔·卡恩本周一(今天)提起了针对Anthropic @AnthropicAI 的联邦诉讼。 他认为Anthropic在“Max 5x”和“Max 20x”订阅计划的使用限制方面误导了消费者。 目前该诉讼正寻求成为自去年四月以来购买这些计划的用户的集体诉讼。 这起诉讼是针对人工智能订阅费用及其所谓不透明性的消费者反弹的早期典型案例。 目前AI 订阅正迅速成为与流媒体服务和其他娱乐形式并列的消费者消费常态。 这起在加州北区提交的诉讼称,Anthropic 宣传 Max 5x 和 20x 方案的使用上限分别为其 Pro 方案的五倍和二十倍。 但一些用户投诉称:实际的上限难以确定,且似乎比宣传的额度更低。 该诉讼主要基于其所称 Anthropic 于 2025 年 7 月向不同等级的订阅者发送的电子邮件。 这份邮件里Anthropic详细解释了当时每个等级对具体 Claude 模型每周可预期的使用量。 “Max 5x 和 Max 20x 方案实际提供的使用量远低于当时邮件里宣传的使用量,”诉讼称。 起诉者卡恩最初出于个人原因开始使用 Claude,后来开始大量用它编写代码,今年四月升级到 Max 20x 订阅。 诉讼称,几周内,他发现自己触及了公司施加的每周使用限制,在一次五小时的冲刺中就耗尽了他每周配额的 15%。 诉讼指控称,他“发现自己要么不得不停止工作、节省使用量,要么购买额外用量以确保能完成工作”,诉讼还寻求认定 Anthropic 对这些套餐的营销具有欺诈性。 目前 Anthropic 拒绝置评。 今年早些时候 Anthropic 的模型走红后导致使用量激增,导致该公司推理系统承压(人话:用的人太多了),引发一些用户关于服务中断和服务限制的投诉。 大快人心啊! 看看后面谁还敢偷偷砍额度😠

中文
42
2
42
16.6K
Yifeng "Evan" Wang retweetledi
React Native
React Native@reactnative·
React Native 0.86 is now available! This release includes comprehensive edge-to-edge support on Android 15+. And, following 0.83, it's the second React Native release with no user-facing breaking changes. reactnative.dev/blog/2026/06/1…
English
8
66
479
48.6K
Yifeng "Evan" Wang retweetledi
Cat Chen, @catchen@mastodon.world
最近才在知乎上看到,有些人明明自己没有 life,却说 work/life balance 没有意义。从小被培养成没有 life 的人,你给他 life 他反而不知道怎么办了。 zhihu.com/question/20350…
caoz@caozlog

我觉得国人很大的一个问题是,缺乏生活追求,当然也许他们的生活追求在我理解之外。我身边有些朋友,明明财务自由,还在追寻一份工作,我说的不是那种有自己的事业不放手,或者和朋友们一起搞点理想的事业,这种我能理解。我说的是,继续去找份职场工作,哪怕只是一种生活惯性。有一个朋友连续创业成功企业卖出套现n个亿,然后找了一份国企工作上班去了,护照上缴的那种,我就一直理解不了他图什么,我说你是看中人家前台了还是秘书了,总要有个目标吧,人家说真没有,就是没有工作不踏实。 还有一个大学宿舍同学,之前在不同互联网巨头做技术中层,资历老,年头久,虽然管理级别不高,但股票套现身价比我高不少,孩子也上大学了,没啥可操心的了吧。然后跟我吐槽说最近下课了,50岁不好找工作,我说你跟我一起出去浪不好么,为啥还要找工作,就觉得在家不踏实。 身边好像不少这种,资产相当不错,人特别宅,没啥爱好,赚了钱就是养家,有精力就鸡娃,孩子也都上大学了(有的都毕业有工作了),不知道干嘛,不上班就难受,上班也不知道图啥。 然后有这种人没事还说羡慕我的生活,我说你羡慕个球啊,你要是真喜欢到处浪不就是一念之间的事情。

中文
55
12
142
30.4K
Yifeng "Evan" Wang
Yifeng "Evan" Wang@ewind_dev·
我家唯一 Google 地球长期用户是我爸……这就跟他报喜去
Google Earth@googleearth

Prepare for takeoff. ✈️ Flight simulator is now available globally on web to all users. goo.gle/4fBYnWO We've recently added many our most powerful professional desktop features to web. Elevation profiles, new import types, but there's always been one other feature you've been asking us to add to the web version of Google Earth, just for fun... Where will you fly? Share your best maneuvers, views, and flyovers with us!

中文
28
2
33
12K
Yifeng "Evan" Wang
Yifeng "Evan" Wang@ewind_dev·
我:兴奋地跟老婆说 fable 多强多强,模型参数多大多大,什么 deepseek 600B 啊 opus 10000B 啊 fable 50000B 啊 blabla 她:听起来很像毒品的纯度
中文
63
19
572
63.8K
Yifeng "Evan" Wang
Yifeng "Evan" Wang@ewind_dev·
《那一夜》 猛蹬 fable 通宵一晚上,八点多还带娃去医院,现在我人快没了……💀💀💀 顺便推荐图中的 Superset 是我最爱的 vibe IDE,傻瓜式多 worktree 摇老虎机大杀器
Yifeng "Evan" Wang tweet media
Labrin@quant_sheep

史称 419 day

中文
15
1
23
10.1K
Yifeng "Evan" Wang
Yifeng "Evan" Wang@ewind_dev·
笑死,跟着 @waylybaye 上电视了! 现在找 1818 黄金眼投诉类人社还来得及吗
Yifeng "Evan" Wang tweet media
中文
2
0
29
7.1K
Yifeng "Evan" Wang
Yifeng "Evan" Wang@ewind_dev·
新的软件公司护城河:我们的底层架构是那一夜 fable one shot 的
中文
30
5
238
41.2K
Bojie Li
Bojie Li@bojie_li·
@ewind_dev 试过了,我们那个语音架构 Fable 优化不了,给我搞得一团糟,还得我帮它收拾烂摊子 😂
中文
1
0
7
2.5K
Yifeng "Evan" Wang
Yifeng "Evan" Wang@ewind_dev·
@turingou 对我来说娃是个支线副本吧,无非是在有机会的时候选择去体验更丰富的人生,这和 all in 创业是不矛盾的
中文
0
0
1
861
郭宇 guoyu.eth
郭宇 guoyu.eth@turingou·
人生的三大乐趣,如果你没有工作和生存压力,你会怎么选? 1.享乐。 2.挑战。 3.创造。 许多人觉得有钱就能解决一切问题,因为他们觉得所有问题的解决办法都是「享乐」,享乐其实只能解决几个月到几年的问题,对一般人来说,一两年不工作,心理就会开始失去锚点,出现心理疾病,严重的甚至需要干预。旅游也好,吃好吃的也好,到处游玩也会很累,大部分人也不会喜欢天天飞来飞去的旅游,很快会腻。 挑战是更少数人的游戏,但是人这种东西,一旦失去职场的压力,很难再从内心无端给自己生出什么挑战来,大部分人很懒,懒得思考,懒的锻炼自己的身体和大脑,更别提去做百里挑一的人类做不到的事情。 创造是极少数人的乐趣,虽然现在有 AI 和 vibe coding,只要想做什么东西,能用以前 1/100 的成本来说,能沉浸在不断创造的乐趣中的人,也是极少的。 说个题外话,在传统价值观里许多人觉得结婚或者生小孩可以绕开这些思考,我很好奇处于婚姻中或者已经有小孩的人们是怎么看待这个问题?人生的终极问题能够绕开吗?还是无论怎么做,总会在某个时刻又涌上心头?
中文
216
69
653
74.4K