Lichas

514 posts

Lichas

Lichas

@Syulichas

Full-stack dev obsessed with building AI agents that actually do things. Turning ideas into autonomous systems. Currently shipping: maxclaw

Beigetreten Ekim 2023
59 Folgt87 Follower
Lichas
Lichas@Syulichas·
@twikejin 而且大概率是个中国人
中文
0
0
0
226
老法师(laofs.cn)
老法师(laofs.cn)@twikejin·
这白毛天天这么吹票,没收钱我都不信...
中文
113
0
121
80.3K
Lichas
Lichas@Syulichas·
@46ge5 不要影响人家IPO 小心别人👮‍♂️抓你
中文
0
0
4
3.1K
枫原万葉
枫原万葉@46ge5·
告诉大家一个小秘密,某家骗子机器人公司之所以不再投入大量科研经费,是因为机器人算法想要 scale 需要的数采和训练非常昂贵,他们已经很清楚自己没有希望做出机器人届的GPT(他们已经把各种 VLA 、world model 加 RL试遍了,没有用) 于是他们选择造大号变形金刚玩具来骗骗傻子
中文
297
62
1.4K
479.9K
川沐|Trumoo🐮
川沐|Trumoo🐮@xiaomustock·
今天还得装死了,我的持仓全跌, 全方位亏钱。
中文
89
5
400
326.5K
realzbc
realzbc@realzbc·
@real_kai42 花了几千刀的 token, 用的哪一家😅?
中文
5
1
25
11.1K
Kai
Kai@real_kai42·
过去一个月是疯狂的一个月 大概一个月前,我下定决心重构 kimi-code,开始设计新的架构。 我大概抱着电脑和便携屏在汤泉卷了两整天,花了几千刀的 token 去做架构分析、设计和验证,最终得到了一份我认为最优的架构方案。 我觉得在 vibe 时代,架构变得更加重要了,一份好的架构能够在可控的范围内,让 Agent 肆意 coding,而不会打破东西 - 架构确定后,就开始冲刺实现。(过程中吵和推翻了无数次) - 迅速组建了一个强大的 team,感恩兄弟们无条件的信任🙇‍♂️ - 迅速 onboarding 整个 team,🙇‍♂️ 再次感恩兄弟们 - 封闭开发了一段时间(🤣年轻的时候,觉得是糟粕,真到时候,发现是人类工程效率奇迹。你无法想象随时可以拉着全部人在白板前吵架的架构迭代速度) - 虽然代码都是 vibe 的,但依旧逃不过 “代码质量正比于人类的注意力密度”。所以 agent 并不会替代所有程序员,只会让顶级的程序员生产力翻 20 倍,并淘汰其他程序员,且,集体主义 >>> 个人英雄主义。 - 一步一个坑的解决过程中遇到的问题。每一天都是最绝望的一天😭 - 开源后就病倒了,皮质醇分泌过度,影响免疫力 - 这一个月学的东西够我消化半年的 - 一周干了一整箱红牛,还得是生物燃料 - 🫥 也在 x 上消失了一个月 本来想写一些文章去总结过程中一些 insights 和 idea,但我本来就不擅长写长文,外加人脑自我保护让我迅速忘记了整个过程中的痛苦,并模糊了时间观念(冷知识,kimi-code 重构版开源其实才过了一周多,但在我的感性认知中,像是已经过了一个月) 等 kimi-code 陆续迭代到稳定,再去总结过程中的 lessons learned
Kai tweet media
中文
274
96
1.7K
526.8K
纳米AI
纳米AI@antiAIvo·
腾讯的AI agent WorkBuddy、CodeBuddy 是我以前所在的团队做出来的 跟我天天玩的小伙伴 现在也成了负责人,晋升总监了 以前他经常说: 你看xxx清华毕业的 同年龄当时光芒耀眼 自己却黯淡无光 如今都在腾讯 但是职级确没有自己高 这叫殊路同归 而今天AI的红利 他已经是 大鹏一日同风起,扶摇直上九万里
中文
20
3
144
50.9K
Lichas
Lichas@Syulichas·
@dexteryy 太强了… 这自由了吧
中文
0
0
0
201
Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋
昨天是neocloud快乐日,今天是scale-up快乐日,今年「追高」的新资产(主要是硅光和NAND)都在英伟达的托举下贡献了超额收益。三年半12倍,七年半28倍,感谢詹森
Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋 tweet mediaDexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋 tweet mediaDexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋 tweet mediaDexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋 tweet media
中文
6
0
21
2.5K
Lichas
Lichas@Syulichas·
@idoubicc 看起来是实战经验丰富的
中文
0
0
0
309
idoubi
idoubi@idoubicc·
聊一聊 Agent 的存算分离架构设计👇 一个有灵魂,有记忆的 Agent,一次任务的生命周期包括以下步骤 1. 用户输入 query(text + files) 2. Agent 读取提示词文件(soul.md,identify.md,user.md 等) 3. Agent 读取可用的工具和技能(tools,skills 等) 4. Agent 读取记忆(memory.md,memory_search 查询) 5. Agent 构建上下文(prompt + tools + memory + query) 6. Agent 进入 Loop(LLM 调用 → 工具调用 → 观测 → 再推理) 7. Agent 交付结果(Artifacts) 什么需要存:提示词文件,工具和技能,对话记录,交付产物 什么需要算:上下文拼接,LLM 调用,工具调用 简单表示这个过程 fn(query, agent runtime) = artifacts 我们可以把 agent 运行方式简单分为三类 1. 本地裸机运行 2. 本地带沙盒(sandbox)运行 3. 云端多副本运行 --- 1. 本地裸机运行,是 OpenClaw 之类 Agent 的常见模式。Agent 提示词文件、skills,对话记录(sessions)全部存在本地磁盘,Agent 执行任务时,会在固定 workspace 目录下运行,用户上传的文件、Agent 产出的文件全部落在同一个 workspace,Agent Loop 完全依赖本地文件构建上下文和执行工具调用,存跟算是一体的。 这种模式好处是足够简单,避免了额外的文件挂载开销,弊端在于安全性,比如 Agent Loop 执行了一个 exec(rm -rf /) 工具调用,很容易对宿主机产生破坏 2. 本地带沙盒运行,是 Codex 之类的 Agent 的常见模式。主要解决两个问题。一是防止 Agent 越权操作,提高安全性;二是解决宿主机的依赖缺失导致工具调用异常的问题。 Agent Loop 执行工具调用时,涉及到敏感操作或者有外部依赖时,把宿主机的 workspace 目录挂载到 sandbox,在 sandbox 执行工具调用,输出产物自动同步到宿主机的 workspace 目录 这种模式下的存算分离,只在工具调用环节引入 sandbox 来动态计算,存储主要靠宿主机的文件系统 3. 云端多副本运行,是 Manus 之类的工具型 Agent 的常见模式。主要特点是多租户,多任务,长时间运行 像 genspark claw,kimi claw,max claw 之类的托管版小龙虾,本质上是在云端多副本运行的助理型 Agent,每个用户有独立的提示词文件,动态安装的 skills,需要长期记忆 这类 claw 托管服务,最简单的实现方式是搭建一套 k8s 集群,在每个 pod 部署一套 Agent 框架(OpenClaw,harmes 等),通过 pvc 挂载云硬盘,实现对用户资料的持久化存储。通过负载均衡策略把每个用户的请求路由到固定的 pod,在同一个 pod 做 Agent Loop,存算是一体的,每个 Agent 有独立的运行空间。这种方案隔离性很好,不好的地方在于 pod 需要常驻,运行成本很高,难以规模化 --- 云端 Agent 需要规模化(scalable),必然要结合 serverless 架构做存算分离。计算层依赖 k8s 集群的调度机制动态扩缩容,水平扩展 Agent 网关的并发处理能力 存储层结合 Agent 的运行生命周期,不同阶段的产物用不同的存储方案,主要分为四种 1. 热状态。Agent Loop 的 step,plan,游标等状态,用 kv(redis)来存,高性能,低延迟,用于异常重启后的断点恢复 2. 对话和任务记录。在任务完成后用关系型数据库(postgres)来存 3. 长期记忆。基于对话/任务记录做摘要,提取成记忆,用向量数据库(pgvector,milvus)来存 4. 工作产物。包括用户上传的文件,Agent 输出的文件,系统内置的 tools,动态创建的 skills 等,用对象存储(s3,oss)来存 --- 以 FastClaw 为例,演示基于存算分离架构的云端 Agent 的运行过程👇 1. 一套 k8s 集群,日常 2 个 pod,部署 fastclaw gateway,接收用户请求 2. 负载均衡把用户请求路由到其中一个 pod,Agent 开始计算逻辑: 2.1 从 db 读取提示词文件(soul,identity,user) 2.2 初始化 pod 内一个临时目录作为 workspace 2.3 初始化 sandbox,挂载 workspace 2.4 从对象存储下载用户资料和系统 skills 到 workspace 2.5 调用 memory_search 工具,从向量数据库查询记忆 2.6 拼接上下文,调用 llm,解析工具 2.7 在 sandbox 执行工具调用,读写 workspace 内的文件 2.8 把 Agent Loop 过程中的状态设置为 checkpoint,保存到 kv 2.9 Agent 输出结果给用户 3. 通过惰性检查,把不活跃的 sandbox 关闭,关闭前把 sandbox 内 workspace 的文件上传到对象存储 以上的存算分离架构,计算层依赖 pod + sandbox,pod 水平扩容支持并发调用,sandbox 承接少量的工具调用,使用 e2b 作为 sandbox 可以做到秒级启动,构建 sandbox 池可以提高并发容错;存储层依赖 kv + db + vector db + oss 的组合使用,瓶颈在于 io 延迟 这套架构最大的挑战在于分布式多副本场景下的数据一致性,需要合理使用锁机制和负载均衡策略。 理解了这套架构,再去看 Manus,Claude managed agents 的实现,就很好理解了。 篇幅有限,不能详述细节,欢迎留言讨论。🤗
idoubi@idoubicc

我年初开始做 OpenClaw 托管服务,在一套 k8s 集群部署了 500 个 Pod,每个 Pod 限制 4g 的运行内存。日常开着 18 台 4c16g 的服务器作为节点池,一个月成本将近 5k 刀。 几个月下来,托管服务的 MRR 突破了 8k 刀,除去运营成本,利润非常低。 今天终于把服务迁移到了 FastClaw,通过存算分离的架构,让 Agent 无需常驻,而是在收到请求时动态挂载 sandbox 来提供服务。服务器从 18 台降到了 3 台,运营成本降到了 1/6,下个月有机会赚到钱了。😄 跟 OpenClaw 比,FastClaw 真的是太轻量了。 1. 代码体积约为 OpenClaw 的 1/40 2. 运行资源占用约为 OpenClaw 的 1/7 3. 单二进制分发,无环境依赖 4. OpenClaw 的 gateway 启动大概需要 15s,FastClaw 秒级启动 FastClaw 本身是为云原生多租户场景而设计的 Agent 运行框架,同样也适用本地运行场景。 继续完善,欢迎体验。✌️ github.com/fastclaw-ai/fa…

中文
47
80
500
72.8K
Lichas
Lichas@Syulichas·
@lb377204209 这个是公开的秘密。阿里系高管进驻两年了吧快
中文
1
0
54
11.4K
房策
房策@lb377204209·
立个flag:山姆超市中国业务2030年之前会被阿里(概率65)或则京东(概率35%)收购,这几年山姆井喷一样的到处开花,应该就是为全面退出中国做准备,把规模做大,把现金流做大,到时候卖个好价钱。
中文
386
39
925
300.2K
Lichas
Lichas@Syulichas·
@ruanyf 这是什么工具可以看token量
中文
0
0
0
98
ruanyf
ruanyf@ruanyf·
上周,OpenClaw 创始人贴出了自己的 Token 使用量。(下图) 他一个月消耗的 Token 数量为6030亿。根据预设的费率,这些 Token 价值130万美元! 这并不是真实支出,只是一个估计值。因为他是 OpenAI 员工,可以无限量免费使用公司的 Token。 但是,可以用这个金额衡量,如果放开使用顶级模型,公司要支付的费用。一个人一个月130万美元,相当于近900万人民币,一年下来超过1亿人民币! 就算改用便宜的模型,国内的开源模型,价格大约是国外旗舰模型的1/30到1/50,那么一年也要200万~300万人民币。 我写了一点自己的想法。公司会发现,如果无限量使用,AI 编程比真人程序员昂贵多了。ruanyifeng.com/blog/2026/05/w…
ruanyf tweet media
中文
101
26
289
114.7K
西格玛交易员
西格玛交易员@jassion767·
磷化铟近期消息汇总: 1、2英寸衬底突破3000美元 2、6英寸破6500美元 3、英伟达被曝溢价300%锁单 4、AXT积压订单突破1.5亿美元 5、华w旗下的哈勃科技入股磷化铟基高速光芯片自主研发,产品可应用于最高至3.2T高速光模块 6、3.2T方案在800G基础上需求再翻5.6倍。 总结:供需缺口看不到天花板
中文
39
14
158
49.7K
Lichas
Lichas@Syulichas·
国产 AI GPU 的真正瓶颈,可能不是“算力”,而是 HBM。 很多人讨论华为昇腾,只盯着制程、架构、CUDA 生态,但大模型训练真正吃的是: 参数读写、激活值读写、KV Cache、并行通信、吞吐稳定性。 这些东西最后都会打到一个核心问题上:内存带宽。 所以昇腾 910 / 910B / 910C 高度依赖 HBM,并不是简单“堆料”,而是高性能 AI 加速器的生死线。 没有 HBM,高算力芯片很容易变成: 算得快,喂不饱; 峰值高,利用率低; 芯片强,训练慢。 AI 时代的芯片竞争,表面看是 GPU,底层其实是: 先进封装 + HBM 供应链 + 软件生态 + 集群互联。 谁能持续拿到更强 HBM,谁才有机会撑起真正的大模型训练。 #华为 #昇腾 #Ascend #国产GPU #AI芯片 #HBM #大模型 #人工智能 #半导体 #先进封装 #GPU #NVIDIA #算力
Lichas tweet media
中文
0
0
0
179
Lichas
Lichas@Syulichas·
@luoling8192 @MaxForAI 有。我的项目。以及腾讯、字节都是用go做agent,尤其是云agent
中文
1
0
2
380
Max For AI
Max For AI@MaxForAI·
昨天见了一个非常牛逼的Agent团队,我敢说在国内绝对是T0的级别(之前DPSK还找他们搞了点Agent数据) 刚好聊到了这两天推上吵得非常热闹的AI产品(Agent)要不要用Python的话题 他们Founder说的很直接:SB才在Agent项目里用Python🤣 TS适合100%Agent项目,主要有几个原因: 第一,Agent最终大多时候会在产品里。 不管你做的是Chat界面、工作流面板、浏览器插件、Copilot,还是IDE扩展、Slack/Discord/网页工具,TS天然离这些更近。 前端是TS,后端也是TS,中间的tool schema、事件流、UI状态都能共用一套类型。 如果你用Python那就会变成: 模型服务在Py、后端在Node、前端在TS 一份schema要复制三份 如果某个字段名大小写错了,你的Agent马上就给死给你看。 第二,Agent很依赖异步和事件流。 Agent不是一次请求一次回答这么简单。 它要边想边输出,边调用工具,边等用户确认,边更新UI,边处理取消、重试、超时、恢复。 TS/Node在事件驱动、stream、WebSocket、server-sent events这些场景里很顺。 Python当然也能做,但你会更容易感受到「这东西本来不是为这类Web产品链路长出来的」。 第三,类型系统对Agent很重要。 Agent真正容易炸的地方不是「模型不会说话」,而是工具参数错、返回结构错、状态字段错、上下文对象变形。 TS可以把很多东西提前卡住: tool input/output、agent state、message format、UI事件、workflow node、permission object、external API response 这对Agent很关键,因为Agent系统里有大量JSON对象在飞来飞去。 第四,TS更适合做「Agent runtime」。 如果你做的是一个Agent框架、SDK、运行时、插件系统,TS优势更明显。 因为使用者往往要把它接进: 网页、后台服务、Electron、浏览器插件、VS Code插件、API route、serverless、edge runtime 这些地方TS生态更统一。 所以很多Agent infra选TS,不是因为Python不行,是因为它们要服务的使用场景更接近Web开发者和产品团队。 第五,AI应用现在其实是拼系统。 早期大家用Python,是因为AI=模型。 现在很多AI产品已经演化到包含LLM API、tool calling、database、vector store、browser automation、workflow、UI、billing、auth、analytics 这已经不是研究工程了,是产品工程。 互联网产品工程的主语长期就是JS/TS。 很无聊,但世界就是这么没品😮‍💨 但他也表示Python不会消失。 更合理的分工其实是: Python做模型层、数据层、eval、embedding pipeline、离线任务、实验脚本。 TS做产品层、Agent编排层、前端交互层、插件层、用户可见的runtime。 所以你如果做一个Agent产品,你最好: MVP前端+Agent orchestrator用TS。 涉及模型训练、数据处理、复杂检索、评测系统,再上Python。 聊了一下午,真的学了太多了 才知道自己之前对于Agent的认知到底有多浅薄🧎
中文
156
155
1K
291.7K
Lichas
Lichas@Syulichas·
如果存储巨头也有二次元代言人—— SK hynix 是橙色热情,Micron 是蓝色理性,SanDisk 是红黑速度感。 感觉半导体战争突然变成了夏日番外篇,美光,海力士,闪迪你最喜欢谁?
Lichas tweet mediaLichas tweet mediaLichas tweet media
中文
0
0
1
192
Lichas
Lichas@Syulichas·
@hanking66 可惜里面藏了个腾讯和中海油什么玩意😲
中文
0
0
3
2.4K
美股仙人
美股仙人@hanking66·
买不了美股怎么?那就曲线救国,就看你有没有发现美的眼睛了,😂😂😂 比如港美互联网lof,我感觉应该改名美台半导体😂😂真他妈什么神仙组合 Buy the dip,长期持有,Discord在个人资料。
美股仙人 tweet media
中文
28
8
137
51.2K
Lichas
Lichas@Syulichas·
@berryxia 已下载。BYOK可以支持xiaomi mimo吗
中文
0
0
0
818
Berryxia.AI
Berryxia.AI@berryxia·
卧槽… 兄弟们 我真的是后知后觉~ 今天还屁颠屁颠跑到Bloome 去问什么时候可以支持iOS端啊? 结果告诉我说美区已经可以使用了… 因为我一直以为没有在iOS 添加到主屏幕在用,忍受着… 结果下载完使用起来太丝滑了…… 真特么好用…
Berryxia.AI tweet media
Berryxia.AI@berryxia

这个状态有点舒服了,三个Agent 协作审核干活。 2个负责执行任务,1个进行复核和查漏补缺。 而你只需要动动嘴皮子和不断的PUA他们就行了。

中文
39
2
46
23.6K
RollingTokens
RollingTokens@rollingtokens·
@yusan1776 鹅厂也是,部分BG新项目以Go为主,少数BG因为历史原因坚守C++
中文
2
2
5
3.8K
吴思齐 Leo
吴思齐 Leo@siqileo·
字节至今为止做出的最好技术决策就是用 Go 作为主力语言,第二好的技术决策就是把 Infra 和技术中台的建设提升到战略级别。
中文
83
10
402
129.8K
Kg
Kg@dannykkg·
@shao__meng 所以有啥实际用处吗?除了这个动画😅,我给朋友推荐 QClaw,正用在呢,停更了,甚至他们自己停更的当天还在拉人开会推广。
中文
4
0
2
1.5K
meng shao
meng shao@shao__meng·
腾讯的 Marvis 今天手痒我真的去试了试 怎么说呢?确实是我手痒了,这手得剁 😂 整个软件,就这个 Agent 模拟办公室的 dashboard 小动画也有些意思,Marvis 这个项目经理,收到任务后,会小跑到需要调用的 Agent 面前窃窃私语一番,这个 Agent 开始干活后,Marvis 继续回到工位假装很忙的盯着进度;更有意思的是,没活儿干的 Agent 会摸鱼玩游戏 😄 腾讯的产研部门,这是按照自己部门的工作状态做的吗?永远只有几个人真的在忙、项目经理永远假装在忙和在各种催进度、大家摸鱼的功夫百花齐放,公司眼中,最关注的永远是 Token(人力)成本。。 最后说回 Agent 执行结果,算了不说了,一言难尽
meng shao tweet media
中文
26
3
53
40.5K
Lichas
Lichas@Syulichas·
富途要清退了。投资美股,现在中国大陆能直接开户的港券商 新加坡盈立 Join me and experience the uSMART APP now! m.usmartsg66.com/promo/overseas…
Lichas tweet media
中文
2
0
2
1.8K
Simon
Simon@simonliu707·
@btclaochen 证券公司转户不需要费用
中文
2
0
0
2.3K
Simon
Simon@simonliu707·
如果你是在被封杀的证券开户,又你不想卖掉股票,现在有一个比较好的解决方法。 赶紧开个诸如第一证券的户,将股票全部转过去即可(账户里面的股票和现金皆可一起转户)。至于有什么政策风险,这个我就不清楚。
Simon tweet mediaSimon tweet media
Simon@simonliu707

最新消息:证券会正式封杀Tiger Brokers、富途证券(香港)和长桥证券了(香港)。 我很早就说过,要炒美股,一定不能在带中资背景的证券公司开户。 举一反三的还有:你如果都炒美股了,就不要买中概股了。同样还有,你如果要开美卡,就不要开带中资背景的美国银行账户了。 为什么?你慢慢想!

中文
12
4
54
64.4K
Lichas
Lichas@Syulichas·
想投资美股,却被开户门槛卡住? 现在大陆用户用身份证就能直接开户美国券商了! 推荐 BBAE 必贝证券(Redbridge): • ✅ 纯大陆身份证开户,无需护照、无需海外地址、无需港澳台证明 • ✅ 0佣金交易美股 + ETF(含零碎股) • ✅ 支持IPO打新、期权、盘前盘后交易 • ✅ 开户快,3分钟在线完成 • ✅ 新用户入金还有现金奖励(限时活动) 想稳稳配置苹果、英伟达、特斯拉等美股,现在最方便的渠道之一就是 BBAE。landing.bbae.com/m/h5/new-user-… 邀请码 stj2hhrh3
中文
1
0
1
1.2K