李牧Lab

347 posts

李牧Lab banner
李牧Lab

李牧Lab

@Limuchn

AI 产品经理 / Agent 架构师/ 独立开发者 不聊虚的概念,只做能用的 Agent,讲能听懂的 AI

杭州 Katılım Ekim 2023
132 Takip Edilen13 Takipçiler
李牧Lab retweetledi
Geek Lite
Geek Lite@QingQ77·
让 Claude Desktop 桌面端接入任意第三方 API 模型的本地代理工具 Kimi · MiniMax · 百炼 · 智谱 GLM · DeepSeek · mimo — 一键切换,无缝使用 github.com/Win-Hao/ModelL…
Geek Lite tweet media
中文
7
13
59
7.7K
李牧Lab
李牧Lab@Limuchn·
Apple-esque 与 -esque 后缀 -esque 是一个非常常用的英语后缀。 含义: “……风格的”、“……范儿的”、“有……特征的”。 Apple-esque: 翻译成“果味十足”或“苹果范儿”。指那种极简、精致、注重动画细节和软硬件一体感的设计风格。 #新词
中文
0
0
0
25
李牧Lab
李牧Lab@Limuchn·
24年开始开放出来,以前登录网页版要:掏手机 -> 扫码 -> 确认。 现在只要你的 Mac 微信是在线状态,打开网页时,浏览器会自动和电脑里的微信 App“对暗号”。 暗号匹配:网页发现你电脑里已经登录了微信,直接发起本地握手。 信任继承:既然你已经在 Mac 客户端登录过,系统就默认你身份合法,不再折腾手机。 一键确认:把原本跨越两个设备的“体力活”,变成了电脑内部的“确认函”。 这种 Web 与客户端的本地联动,才是真正的“零摩擦”体验。
中文
0
0
0
75
李牧Lab
李牧Lab@Limuchn·
最近一些时间,发现微信的一些微小的惊喜,每次想拿出手机微信扫码登录,手机刚拿来起发现微信主动登录好了,我只要点击确认,方便不少,具体怎么实现的?
李牧Lab tweet media
中文
1
0
0
26
李牧Lab
李牧Lab@Limuchn·
@lxfater 验证下,最近被排版困扰,感谢分享
中文
0
0
0
54
李牧Lab
李牧Lab@Limuchn·
@iamtonyzhu @indigox 普通人的机会,还是抓紧机会搞应用层,三五年机会也是机会,五层蛋糕理论下,下面4层都输普通人无法触及的。
中文
1
0
2
1.2K
Tony出海
Tony出海@iamtonyzhu·
隐形大佬 @indigox,原微博的联合创始人, AI投资者,曾投资支持空中云汇、美ONE(李佳琦直播间),Anthropic、Cohere、xAI、TogetherAI、Lambda和 SpaceX等。 几乎不投 AI 应用层。 “未来三到五年,绝大多数 AI 应用都会被基础模型直接吃掉;要么投得更深(Infra、Robotic、Defense、Science),要么投得更"端到端"(全栈 AI 公司),中间的纯应用层是死亡谷。” “一切都是媒体,这是最重要的。你必须吸引注意力,否则真的很难生存。无论你是打造品牌、运营基金,还是制作产品,这一切都一样。”
Wickey@Wenzi_WW

In today's podcast, we sit down with indigox, the co-founder of Weibo, a social media platform (Like X in US). AI investor who has backed Anthropic, Cohere, #xAI, TogetherAI, Lambda, and #SpaceX. @BillSun_AI "I think everything is media, and that's the most important thing. You have to get attention, otherwise it's really hard to survive. Whether you're building a brand, running a fund, or making a product, it's all the same." Welcome to the Innovator Coffee, a podcast that bridges the gap between people and the world of AI and innovation. Follow us on Sportify, YouTube and Apple to like, share and comment. See full session below: youtube.com/watch?v=KWlFmD…

中文
28
87
501
143.5K
李牧Lab
李牧Lab@Limuchn·
@dotey 我第一次听到世界模型,还以为是跟联合国一样,各国投入成立的跨国别的平权模型。 维特根斯坦所言,定义清楚语言是最核心的事情。
中文
0
0
0
53
宝玉
宝玉@dotey·
港科大、新加坡国立、牛津等十余所高校联合发了一篇 88 页的综述,试图解决一个越来越尴尬的问题:“世界模型”这四个字在不同圈子里意思完全不同。 做强化学习的说的是 Dreamer 那种在脑子里想象未来再决策的系统,做视频生成的说的是 Sora 那种画面生成器,做 Web Agent 的说的是 LLM 对网页状态的预测能力。大家各说各的,论文之间根本没法比。这篇论文提出了一个“能力等级 x 领域法则”的二维框架,想把这些散落的社区拉到同一张地图上。 能力分三层: L1 预测器只管预测下一步, L2 模拟器能做多步推演且推演结果要遵守所在领域的基本规则(物理世界不能让杯子穿桌子,软件世界不能调不存在的 API), L3 进化器能在预测出错时主动诊断原因、设计实验获取新数据、修正自身模型。 领域分四类: 物理世界(机器人、自动驾驶)、 数字世界(网页浏览器、代码、GUI)、 社会世界(多智能体交互、社会模拟)、 科学世界(天气预报、材料发现、药物设计)。 每个领域对“什么算合法的状态转换”有完全不同的约束,失败模式也不同。 综述 400 多篇工作后有几个跨领域的共性发现: 视频生成模型视觉逼真度远超物理忠实度,最好的模型在物理一致性测试上通过率只有 26.2%; LLM 驱动的社会模拟能复现舆论极化等涌现现象,但智能体有系统性的趋同偏差,跟真实人类行为分布偏离大; 目前 L3 做得最成熟的是自动化科学实验,比如 A-Lab 用机械臂在 17 天内完成 353 次闭环实验合成了 36 种化合物,失败实验被提炼为持久知识而非丢弃。 论文末尾有个观察: 从牛顿定律到麦克斯韦方程,人类历史上最成功的世界模型全是符号化的、可直接修改和组合的。 现在的神经网络把所有规则藏在权重里,L1 和 L2 阶段够用,但到了需要修改模型结构本身的 L3,这种隐式表示就成了障碍。 世界模型的终局,是越来越大的神经网络,还是终究要回到可编辑的符号规则?
宝玉 tweet media宝玉 tweet media宝玉 tweet media宝玉 tweet media
Trueman (CHU Meng)@truemanv5666

🚀 Our new preprint is out: Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond It also reached #1 on Hugging Face Daily Papers 🎉 @huggingface @HuggingPapers @_akhaliq Joint work from @HKUST, @NUSingapore, @UniofOxford, @NTUsg, @CUHKofficial, @HKUniversity, @UW and more. arXiv: arxiv.org/abs/2604.22748 HF: huggingface.co/papers/2604.22…

中文
7
78
303
48.5K
李牧Lab
李牧Lab@Limuchn·
虽然是黑中国,但是这一幕塑造中国的企业家很酷。
李牧Lab tweet media李牧Lab tweet media李牧Lab tweet media李牧Lab tweet media
中文
0
0
0
13
李牧Lab retweetledi
郭宇 guoyu.eth
郭宇 guoyu.eth@turingou·
今天非常高兴和大家正式介绍并开源我的第 14 款 vibe 产品 wanman.ai 它的理念很简单,让世界上所有人,都能在 AI agents 团队的帮助下,从零创办或接管任何组织,围绕用户的核心意图,持续自动化地运营一人公司。 为了实践这种理念,wanman 必须设计的尽可能简单,不需部署,不用买 mac mini,不用操作复杂的权限,只要打开网站,输入想法,即可运行。 wanman 有两种工作模式,第一种是从故事目标自治运行,它会分析目标,规划任务并邀请 AI 员工,自动开会并对齐目标,每个虚拟工作日结束后,wanman 会主动进行创意发散,从而保持任务持续运行。 第二种是 wanman 接管(takeover)目前支持任何 GitHub 仓库,它会分析代码仓库,围绕目标进行自动优化和测试,在持续运行的基础上,不断提交代码到远端仓库。 无论哪种工作模式,wanman 都会运行到目标达成。它和许多流行的 harness 产品相似,均支持:agents 消息通信、自进化 skill、沙箱隔离环境运行、多模型架构等功能,和其他产品不同的是,wanman 的设计哲学是,让人类用户退居二线,仅作 AI 团队的观察者。它的核心架构和组件已在 GitHub 开源:github.com/chekusu/wanman 从现在开始,任何用户都可以登录 wanman.ai 免费体验,目前支持授权 codex 使用,未来会逐步支持多模型授权与自动调度。 这是我今年以来开发最久,也是最重要的产品之一,为了开发 wanman,我做了 sandbank cloud,chatben,tuwa 等基础设施,这些产品的 vibe 经验,最后都成了 wanman 的一部分代码。 wanman 的命名来自于日语的 one man(ワンマン)的罗马音,在日本的乡间,经常能看到ワンマン電車在田野中悠然自得地穿行,我相信在不久的将来,也会有许多人使用 wanman 创建自己的ワンマン会社。 祝大家都能借助 wanman.ai 告别创业的烦恼,享受创造的乐趣!
郭宇 guoyu.eth tweet media郭宇 guoyu.eth tweet media郭宇 guoyu.eth tweet media郭宇 guoyu.eth tweet media
中文
150
193
1.5K
171.8K
李牧Lab retweetledi
歸藏(guizang.ai)
歸藏(guizang.ai)@op7418·
Claude Code 新增了一个自动模式 终于不需要你对每个文件处理和命令执行进行审批了! 安全防护会在每个操作运行前进行检查,比以前的全部跳过权限审批更加安全 使用 claude --enable-auto-mode 启用,然后按 Shift+Tab 切换到这个模式
中文
11
14
126
38K
李牧Lab retweetledi
宝玉
宝玉@dotey·
今天试了下,很好很强大👍
yan5xu@yan5xu

😅嗯,bb-browser,badboy browser,坏孩子浏览器来了,真的很丧良心,但真的很好用。 现在你可以用 bb-browser site 的方式直接拉到任何网站的信息,目前支持 Reddit、Twitter、GitHub、Hacker News、小红书、知乎、B站、微博、豆瓣、YouTube,50+ 个命令,我会持续更新。 当然能做到信息获取这件事不稀奇,我也是看到 @jakevin7 的 twitter-cli 的启发,才做的。但 bb-browser 的实现方式非常丧良心 — 我是通过 Chrome 插件 + CDP 直接操控你真实的浏览器。不是无头浏览器,不是偷 Cookie,不是模拟请求。你已登录了,它就直接用你的登录态。它直接在浏览器 console 里面跑 eval,以前爬虫最麻烦的登录态、还有各种鉴权都没有了😂。(这种方式真的。。。太作弊了,我都能想到哪些大厂前端发现我在这么搞,会怎么骂我,因为真的很难防) 另外我还在命令行里面埋了 guide 命令,也就是说你只要装了 bb-browser CLI 或 MCP,跟你的 Agent 说"我需要把 XX 网站 CLI 化",它就能帮你做了!!

中文
20
182
816
187.3K
李牧Lab retweetledi
Macro_Lin | 市场观察员
OpenAI工程师翁家翌在下边的访谈里讲了两句非常有意思的话: 1. 每个人的命运是可以被预测的; 2. 上帝在宏观不掷骰子,而微观上掷骰子。 某种程度上,个人是很认同的。 "宿命论/命运可预测": 翁家翌认为每个人的命运是可以被预测的,这个世界是一个确定的世界,人类在宏观上是没有自由意志的,世界在宇宙大爆炸的时候就已经确定了。 这个立场本质上是物理学中的经典决定论,也就是拉普拉斯妖的思路:如果你知道宇宙某一时刻所有粒子的状态和运动信息,就能推演出整个过去和未来。从这个角度看,人的命运只是初始条件在时间维度上的展开,不可预测只是因为我们信息不够,而不是因为它不确定。 翁家翌作为做强化学习的人,会有这种直觉其实不奇怪。RL 本质上就是在一个由规则确定的环境里,通过行动和反馈的闭环来逼近最优策略。如果你把整个宇宙看成一个极其复杂的环境,而人只是其中的 agent,那“命运可预测”就变成了一个工程问题,而非哲学问题,只是算力和信息量的限制。 “上帝在宏观不掷骰子,而微观上掷骰子”: 这个观点上,他把爱因斯坦和哥本哈根学派的争论做了一个调和,而不是简单地站某一边。 微观掷骰子,这基本上是承认量子力学的实验事实。单个粒子的行为确实是概率性的,你没法预测一个电子具体会出现在哪,只能给出概率分布。这一点在实验上已经反复验证过,没什么好争的。 宏观不掷骰子,这才是他真正想表达的核心。意思是:当微观的随机性被大量粒子叠加、平均之后,在宏观层面上涌现出来的规律是确定的。 映射到人的命运上,他的意思大概是:你人生中每一个微小的决策瞬间,每一次神经元的放电,可能确实带有量子层面的随机性。但当这些微小的随机性汇聚成一个人几十年的生命轨迹时,大数定律把噪声给消除了,剩下的是一条由初始条件(你的基因、家庭、时代、性格结构)基本锁定的路径。 这个观点还有一层更深的含义:它解释了为什么“算命”这件事在统计意义上可能有效,但在具体事件上经常失败。 宏观层面的命运轨迹(大致会从事什么类型的工作、大致的人生节奏)或许是可预测的,因为它是由足够多的微观变量平均出来的。但某一天你会遇到谁、某一次会议会说什么话,这些微观事件里骰子还在转。 这不是那种粗糙的"一切命中注定"式宿命论,而是一个更接近统计物理的框架:自由意志存在于微观的每一步,但命运浮现于宏观的整条路径。 你可以选择今天吃什么,但你这辈子大概会成为什么样的人,可能在出生的时候就差不多定了。
中文
202
564
2.7K
364.3K
李牧Lab retweetledi
黄赟
黄赟@huangyun_122·
AI 佬们,你们是怎么做到,同时用 Codex,Claude Code,Openclaw,还让他们互相都知道前天,昨天,今天你做了点啥的?
中文
76
30
236
139K
李牧Lab
李牧Lab@Limuchn·
闭眼claude,工具上不要纠结!
李牧Lab tweet media
中文
0
0
0
16
Ryo
Ryo@siantgirl·
看完王自如的 Vibe Coding 的描述,我觉得他比我强。就是我觉得他比大多数百分之八九十的那种程序员都要强。我写的 Web Coding 从来都不管那个 TDD 的,他还知道 TDD,而且他还会设计后边那个数据怎么流转,就是很愿意往层次挖掘,还有各种模型优化,我都不知道。他有一套获取知识的体系,逻辑思维特别缜密。
中文
69
47
587
196.3K
Chang Wei 昌维
Chang Wei 昌维@changwei1006·
@dotey 我只是很好奇composer 1的基座模型是哪个?
中文
2
0
0
1.8K
宝玉
宝玉@dotey·
Cursor 上线 Composer 2 不到 24 小时,就被开发者扒出了底裤。 (以下内容 Claude 辅助生成) 一个叫 Fynn 的开发者在调试 Cursor 的 API 时,发现返回的模型 ID 赫然写着:kimi-k2p5-rl-0317-s515-fast。翻译成人话:这就是月之暗面(Moonshot AI)的 Kimi K2.5,加了一层强化学习(RL)微调。 Moonshot AI 预训练负责人 Yulun Du 随即在 X 上发帖确认,经测试 Composer 2 的 tokenizer 和 Kimi 的完全一致,并直接 @ 了 Cursor 联合创始人 Michael Truell,质问为什么不遵守许可证、也没有支付任何费用。另外两名 Moonshot 员工也发帖证实,不过三条帖子后来都被删除了。 而 Cursor 在 3 月 19 日发布 Composer 2 时,只提到性能提升来自"对基座模型的持续预训练加强化学习",全程没有提到 Kimi K2.5。这两件事并不矛盾,持续预训练和 RL 本来就是在某个基座模型上做的,Cursor 只是没说基座是谁的。 这不是第一次了 去年 10 月 Cursor 发布 Composer 1 时,多国开发者发现生成的代码中频繁出现中文。Alley Corp 合伙人 Kenneth Auchenberg 当时贴出截图,直言这是"铁证",认为 Composer 1 就是基于中国开源模型微调的。KR-Asia 和 36Kr 后来证实,Cursor 和 Windsurf 都在使用中国开源模型,其中 Windsurf 承认用的是智谱的 GLM。Cursor 从来没有公开披露 Composer 1 的底层模型,后来悄悄发了 Composer 1.5 就翻篇了。 许可证才是核心问题 Kimi K2.5 使用的是修改版 MIT 许可证,里面有一条专门为这种场景设计的条款:如果使用该模型(包括衍生作品)的商业产品月活超过 1 亿或月收入超过 2000 万美元,必须在产品界面上醒目展示"Kimi K2.5"字样。 Cursor 今年 2 月的年化收入已经突破 20 亿美元,换算成月收入大约 1.67 亿美元,是许可证门槛的 8 倍多。但 Cursor 的界面上只写着"Composer 2",没有任何 Kimi 的标识。 与此同时,Cursor 正在跟投资人谈一轮新融资,估值目标约 500 亿美元,相比去年 11 月的 293 亿美元估值几乎翻倍。而 Moonshot AI 上一轮估值据报道约 43 亿美元。一个估值是对方 12 倍的公司,拿了对方的模型包装成自研技术,用来支撑"前沿实验室"的叙事去融资。 截至目前,Cursor 没有做出任何公开回应。 这件事的后续走向,对整个开源 AI 生态有标杆意义。如果 Moonshot 不对一家年收入 20 亿美元的公司执行许可证,那以后所有开源模型的署名条款就成了摆设。每家 AI 实验室都会算同一笔账:为什么要开源自己的模型,让分发能力更强的公司去掉署名、包装成自研、然后以 12 倍于你的估值去融资?
宝玉 tweet media
Aakash Gupta@aakashgupta

Cursor is raising at a $50 billion valuation on the claim that its “in-house models generate more code than almost any other LLMs in the world.” Less than 24 hours after launching Composer 2, a developer found the model ID in the API response: kimi-k2p5-rl-0317-s515-fast. That’s Moonshot AI’s Kimi K2.5 with reinforcement learning appended. A developer named Fynn was testing Cursor’s OpenAI-compatible base URL when the identifier leaked through the response headers. Moonshot’s head of pretraining, Yulun Du, confirmed on X that the tokenizer is identical to Kimi’s and questioned Cursor’s license compliance. Two other Moonshot employees posted confirmations. All three posts have since been deleted. This is the second time. When Cursor launched Composer 1 in October 2025, users across multiple countries reported the model spontaneously switching its inner monologue to Chinese mid-session. Kenneth Auchenberg, a partner at Alley Corp, posted a screenshot calling it a smoking gun. KR-Asia and 36Kr confirmed both Cursor and Windsurf were running fine-tuned Chinese open-weight models underneath. Cursor never disclosed what Composer 1 was built on. They shipped Composer 1.5 in February and moved on. The pattern: take a Chinese open-weight model, run RL on coding tasks, ship it as a proprietary breakthrough, publish a cost-performance chart comparing yourself against Opus 4.6 and GPT-5.4 without disclosing that your base model was free, then raise another round. That chart from the Composer 2 announcement deserves its own paragraph. Cursor plotted Composer 2 against frontier models on a price-vs-quality axis to argue they’d hit a superior tradeoff. What the chart doesn’t show is that Anthropic and OpenAI trained their models from scratch. Cursor took an open-weight model that Moonshot spent hundreds of millions developing, ran RL on top, and presented the output as evidence of in-house research. That’s margin arbitrage on someone else’s R&D dressed up as a benchmark slide. The license makes this more than an attribution oversight. Kimi K2.5 ships under a Modified MIT License with one clause designed for exactly this scenario: if your product exceeds $20 million in monthly revenue, you must prominently display “Kimi K2.5” on the user interface. Cursor’s ARR crossed $2 billion in February. That’s roughly $167 million per month, 8x the threshold. The clause covers derivative works explicitly. Cursor is valued at $29.3 billion and raising at $50 billion. Moonshot’s last reported valuation was $4.3 billion. The company worth 12x more took the smaller company’s model and shipped it as proprietary technology to justify a valuation built on the frontier lab narrative. Three Composer releases in five months. Composer 1 caught speaking Chinese. Composer 2 caught with a Kimi model ID in the API. A P0 incident this year. And a benchmark chart that compares an RL fine-tune against models requiring billions in training compute without disclosing the base was free. The question for investors in the $50 billion round: what exactly are you buying? A VS Code fork with strong distribution, or a frontier research lab? The model ID in the API answers that. If Moonshot doesn’t enforce this license against a company generating $2 billion annually from a derivative of their model, the attribution clause becomes decoration for every future open-weight release. Every AI lab watching this is running the same math: why open-source your model if companies with better distribution can strip attribution, call it proprietary, and raise at 12x your valuation? kimi-k2p5-rl-0317-s515-fast is the most expensive model ID leak in the history of AI licensing.

中文
48
48
338
198.2K
李牧Lab retweetledi
Garry Tan
Garry Tan@garrytan·
I just launched /office-hours skill with gstack. Working on a new idea? GStack will help you think about it the way we do at YC. (It's only a 10% strength version of what a real YC partner can do for you, but I assure you that is quite powerful as it is.)
Garry Tan tweet media
English
191
437
3.7K
942.7K
李牧Lab retweetledi
小互
小互@xiaohu·
349 篇文章 + 289 集播客,全部转成 AI 友好的 Markdown 格式,附带 MCP 服务器和 GitHub 仓库,直接喂给 Claude Code、Cursor 这类 AI 工具就能用。 详细介绍及数据下载:xiaohu.ai/c/a066c4/lenny… GitHub及MCP:github.com/LennysNewslett…
小互 tweet media
中文
1
13
28
5.3K