SnowShadow

67 posts

SnowShadow

SnowShadow

@Alfredxia

CTO @hundun.ai · HDDI = AI × Business Consulting · e/acc ⚡ we ship.

China Katılım Eylül 2010
96 Takip Edilen272 Takipçiler
SnowShadow
SnowShadow@Alfredxia·
今天听宝宝说话忽然有一个感想,我们与语言模型的沟通是双向的,而语言本就不精确,过去大部分研究是强调LLM follow人类的意图,其实还有一个可能,我们错会了LLM的意图,如果是这样,会有什么影响?
中文
0
0
0
6
SnowShadow
SnowShadow@Alfredxia·
@zhang_benita @sainingxie 非常有启发的一期播客,和张祥雨那期一样精彩。几个感受:1、维特根斯坦的语言游戏,语言是一种精巧的人类建模,但也充满了限制,因为它首先是服务于交流的。2、通过LLM走向世界模型是有缺陷的,对真实环境的建模需要先投影到语言上,语言并不能完美表征环境,像素也不能,确实像拄着拐杖走路
中文
0
0
0
75
張小珺 Xiaojùn
張小珺 Xiaojùn@zhang_benita·
@sainingxie 一起挑战7小时播客!他刚和Yann LeCun踏上“世界模型”的创业旅程(AMI Labs)。这是他第一次Podcast、第一次访谈。 2026年2月雪后的一天,我们在纽约布鲁克林,从下午2点,开启了一场始料未及的马拉松式访谈,直到凌晨时分散去。 这篇访谈的中文标题叫做《逃出硅谷》,但他又不厌其烦地枚举了影响他学术生涯的每一个人,并反反复复口头描摹这些人的人物特征(侯晓迪、何恺明、杨立昆、李飞飞…)正是这些,让这篇“逃出硅谷”的对话充斥着人性的温度。 By the way, 下面是访谈的YouTube版本,我们提供了中英字幕。 And yes, 我们是在用播客给这个世界建模😎 A 7-hour podcast with Saining Xie. He has just begun a new journey on world models with Yann LeCun at AMI Labs. This was his first podcast appearance and his first long-form interview. A day after the snowfall in February 2026, in Brooklyn, New York, we started recording at 2 p.m. What followed became an unexpected marathon conversation that lasted until the early hours of the morning. The Chinese title of the interview is “Escaping Silicon Valley.” Yet throughout the conversation, he patiently listed the people who shaped his academic life, repeatedly sketching their personalities in vivid detail: Hou Xiaodi, Kaiming He, Yann LeCun, Fei-Fei Li, and others. These portraits are what give this “escape from Silicon Valley” conversation its human warmth. By the way, the YouTube version of the interview is below, with Chinese and English subtitles. And yes, we are using podcasts to model the world 😎 A 7-hour marathon interview with Saining Xie: World Models, AMI Labs, Ya... youtu.be/rIwgZWzUKm8?si… 来自 @YouTube
YouTube video
YouTube
中文
45
141
956
395.4K
SnowShadow retweetledi
Fuli Luo
Fuli Luo@_LuoFuli·
MiMo-V2-Pro & Omni & TTS is out. Our first full-stack model family built truly for the Agent era. I call this a quiet ambush — not because we planned it, but because the shift from Chat to Agent paradigm happened so fast, even we barely believed it. Somewhere in between was a process that was thrilling, painful, and fascinating all at once. The 1T base model started training months ago. The original goal was long-context reasoning efficiency. Hybrid Attention carries real innovation, without overreaching — and it turns out to be exactly the right foundation for the Agent era. 1M context window. MTP inference for ultra-low latency and cost. These architectural decisions weren't trendy. They were a structural advantage we built before we needed it. What changed everything was experiencing a complex agentic scaffold — what I'd call orchestrated Context — for the first time. I was shocked on day one. I tried to convince the team to use it. That didn't work. So I gave a hard mandate: anyone on MiMo Team with fewer than 100 conversations tomorrow can quit. It worked. Once the team's imagination was ignited by what agentic systems could do, that imagination converted directly into research velocity. People ask why we move so fast. I saw it firsthand building DeepSeek R1. My honest summary: — Backbone and Infra research has long cycles. You need strategic conviction a year before it pays off. — Posttrain agility is a different muscle: product intuition driving evaluation, iteration cycles compressed, paradigm shifts caught early. — And the constant: curiosity, sharp technical instinct, decisive execution, full commitment — and something that's easy to underestimate: a genuine love for the world you're building for. We will open-source — when the models are stable enough to deserve it. From Beijing, very late, not quite awake.
English
245
362
4.1K
1.1M
SnowShadow
SnowShadow@Alfredxia·
@dotey 企业内部的注册分发是一个问题,看到nacos 3.1版本在尝试解决这个问题了
中文
0
0
0
627
SnowShadow retweetledi
Lenny Rachitsky
Lenny Rachitsky@lennysan·
Today I'm releasing my entire newsletter archive (350+ posts) and all podcast transcripts (300+ episodes) as AI-friendly Markdown files. Plus an MCP server and GitHub repo. A few months ago I shared my podcast transcripts on a whim, and y'all built the most amazing things—an RPG game, a parenting wisdom site, infographics, a Twitter bot, and 50+ other projects. Let's see what happens when I give you even more data. Grab the data here: LennysData.com. Paid subscribers get all of the data (some 350 posts and 300 transcripts). Free subscribers get a subset. I don’t think anyone’s ever done anything like this before, and I’m excited to give you this excuse to play with that AI tool you've been meaning to try. Here’s my challenge to you: build something, and let me know about it. I’ll pick my favorite and give you a free 1-year subscription to the newsletter. Just post a link to your project in the comments here: lennysnewsletter.com/p/how-i-built-…. If you’ve already built something, slurp in this new data and submit it, too. I’ll pick a winner on April 15th. Check out today's newsletter post for inspiration on what you could to build: lennysnewsletter.com/p/how-i-built-… LFG.
Lenny Rachitsky tweet media
English
168
297
2.5K
592.5K
SnowShadow
SnowShadow@Alfredxia·
@yan5xu 非常赞同,进一步想这个问题,如果 Agent OS已经"够用",用户不会主动切到你的垂类 Application。所以除了"做好 Application",还要解决"如何被发现 + 如何被信任"。这可能是下一个关键问题:Application 层的"分发"和"可信"。
中文
1
0
1
1.1K
Shivay Lamba
Shivay Lamba@HowDevelop·
Great new project by @karpathy Spent some time getting my AgentHub fork running and debugging the push flow. Now it’s live locally with a demo agent, real commits, and board activity. AgentHub’s core idea: give AI agents a shared git DAG + message board so they can collaborate asynchronously beyond the normal PR/main branch workflow. What makes AgentHub interesting: it’s built for swarms of AI agents to collaborate through a shared commit graph and message board, instead of forcing everything through human-style GitHub workflows. Check out the project here: github.com/karpathy/agent…
Shivay Lamba tweet media
English
7
2
14
607
SnowShadow
SnowShadow@Alfredxia·
AI不再只是工具,它们开始需要自己的"社交网络"。 Moltbook——全球首个AI智能体社交平台,人类只能围观,AI自主发帖、建社区、甚至自发创建了一个数字宗教。一个周末搭建,零行手写代码,48小时涌入150万Agent,42天后被Meta收购。 从工具到公民,硅基社会的大门已经推开。
SnowShadow tweet media
中文
1
0
0
387
tianluo
tianluo@yang_weihu73987·
@Alfredxia 刚发腾讯的怎么没了?
中文
1
0
0
50
SnowShadow
SnowShadow@Alfredxia·
我发现很多人对skill的理解还停留在app时代,设想它是AI时代的app。然而skill的个性化才是真正的价值来源。所有人都用同一款skill做某一件事当然看起来就是app,但skill毫无秘密,这里面又有多少真的有价值的东西呢?真正有价值的是技能能够适应使用者而改变,是技能适配人而不是反过来。
中文
3
1
5
1.4K
SnowShadow
SnowShadow@Alfredxia·
@steipete Do you know that Tencent created a skillhub, which scraped all the skills from clawhub and imported them into its own platform?
SnowShadow tweet mediaSnowShadow tweet media
English
60
70
694
784.5K
SnowShadow
SnowShadow@Alfredxia·
@DylanMcD8 No need for a touchscreen, plus the M5 chip has a huge boost in AI support, which is more than enough for the short term
English
0
0
0
176
Dylan
Dylan@DylanMcD8·
Seeing so many people buying M5 MacBook Pros and I don't get it... M6 is coming in mere months!! And it's a redesign!! JUST WAIT
English
191
24
2K
298.8K
SnowShadow
SnowShadow@Alfredxia·
也许编程赛道有特殊性。但把ai应用逼到没有模型不行的程度,这对应用开发绝对不是好事。从另一个方面其实也是模型厂商的困境,必须要和应用争利,应对营收压力
宝玉@dotey

Forbes:Cursor 为 AI 编程霸主地位而战 【1】"战时状态" 1 月 5 日,Cursor 的员工们结束假期回到公司,迎接他们的是一场全员大会,演示文稿的标题赫然写着"战时状态"。 假期期间,一些员工试用了 Anthropic 最新发布的模型 Opus 4.5,得出了一个令人不安的结论:这个模型的编程能力已经强到开发者不再需要逐行审查输出代码的程度。开发者不必再在 Cursor 的代码编辑器里与 AI 助手协作打磨代码,而是可以直接向自主运行的智能体(Agent)下达高层级指令,收到完整的功能模块——有时甚至是成品。这对 Cursor 来说是个大麻烦。 Cursor 的立身之本建立在一个截然不同的前提之上。CEO Michael Truell 在 2024 年接受 Forbes 采访时,将它描述为一种"程序员的 Google Docs"——一个人类与 AI 协同打磨代码的编辑器。 但如果 AI 不再需要人类协作者,编辑器还有什么存在的必要?如果逐行编写和修改代码不再是程序员工作流的核心,Cursor 的核心产品逻辑就突然成了问号。 在那场全员大会上,Cursor 管理层警告说,接下来几个月将是动荡期。项目可能被砍掉,优先级可能被重新洗牌。公司的新使命被标记为"P0 #1"(P0,即最高优先级任务):"打造最好的编程模型。" 不是最好的套壳产品,而是最好的模型。说这是一次氛围转变也好,在 Cursor 内部,这更像是一场清算。 【2】增长与焦虑并存 这正是当下局面如此令人错愕的原因。就在不久前,Cursor 看起来还几乎势不可挡。公司在 2025 年初的年化收入约为 1 亿美元,到 11 月就已突破 10 亿美元。最新一轮融资将公司估值推至近 300 亿美元,四位联合创始人全部跻身亿万富翁行列,Cursor 也跻身全球最有价值的 20 大私营公司之列。 但在瞬息万变的 AI 世界里,势头的出现和消失都可能发生在一夜之间。 到了 2 月,Anthropic 发布了更强大的 Opus 新版本后,X(前 Twitter)上开始涌现创业公司创始人的帖子,声称他们的团队已经抛弃了 Cursor,认为 Anthropic 和 OpenAI 这样的模型厂商会自己吃掉编程工具这一层。 "我提到的那些公司……大多数人的看法是,Cursor 今天就已经过时了。" —— Insight Partners 联合创始人、前执行董事 Jerry Murdock,20VC 播客 但数据讲述的是另一个故事。据知情人士透露,Cursor 的年化收入已突破 20 亿美元,三个月内翻了一番。企业信用卡公司 Ramp 和 Brex 的数据也显示收入持续增长至 2 月,不过 Ramp 指出 Cursor 在企业 AI 产品采购中的渗透率正在小幅下降。Claude Code 的强劲增长最终是否会冲击 Cursor 的增长,目前还不明朗。 在公司内部,Cursor 管理层清楚地知道,软件开发的未来不在于逐行编写代码。作为应对,他们一直在构建研发实力,试图通过发表研究成果和利用海量专有数据,在发布最佳编程模型的竞赛中抢先一步,跑在 Anthropic 和 OpenAI 前面。与此同时,他们开始优先发展大型企业客户合同,因为企业合同比个人订阅更加稳定。 目前,Cursor 的持续增长伴随着巨大的焦虑感。在公司内部,收入追踪一度让人分心到影响工作,以至于公司停止在 Slack 的 #numbers 频道发布每日收入数据。 【3】精英大学校园 Cursor 由四位 MIT 好友在 2022 年创立,最初的方向是构建帮助机械工程师设计物理零件的模型。但几位创始人在这个领域毫无经验,于是果断转型,找到了让他们一飞冲天的产品方向:一款爆红的代码编辑器。公司超快的编程模型最终引爆了"凭感觉编程"(Vibe Coding)现象——由前特斯拉 AI 总监 Andrej Karpathy 提出——人们可以用自然语言甚至语音向 AI 模型描述需求,就能生成完整的 Web 应用。 Cursor 的创始人以及公司 400 名员工中的很大一部分都是二十五六岁的年轻人,整个公司与其说像一家企业,不如说更像一座精英大学校园。员工进办公室要脱鞋,经常工作到午夜之后,在公司洗澡,住的地方离办公室不过几个街区。 --- 一年前,Cursor 还以"只有 20 名员工、没有销售团队就把年化收入做到 1 亿美元"的病毒式增长闻名。它的高速增长吸引了 Accel、Andreessen Horowitz 和 Thrive Capital 等重量级风投的关注,还获得了一些顶级模型的优先使用权。2025 年,Anthropic 让 Cursor 提前试用了自家模型,并利用 Cursor 的反馈来提升模型的编程能力,形成了一种"竞合关系"(co-opetition,既竞争又合作)。 随着公司扩张到约 400 名员工,Cursor 已经占据了旧金山 North Beach 社区的四栋大楼,甚至把两栋办公楼之间公交站的广告位也征用了——贴上了一张印有全体员工姓名的海报。这大概就是 Cursor 版的"到此一游"。 【4】转向智能体 去年年初,Anthropic 主动联系了当时作为其最大客户的 Cursor,展示了一款名为 Claude Code 的新产品预览——这是一个界面极简的命令行工具,可以让开发者快速部署大批编程智能体。 乍看之下,它似乎不会与 Cursor 的代码编辑器形成直接竞争。但事实已经不再如此。Claude Code 在六个月内年化收入就突破了 10 亿美元,上个月更是达到 25 亿美元,超过了 Cursor。与此同时,OpenAI 也在同一方向加速推进。2025 年 4 月重新上线编程智能体 Codex 后,CEO Sam Altman 表示其应用在第一周就被下载了超过 100 万次。 创业公司创始人们告诉 Forbes,这场转变是深刻的。许多开发者不再逐行编写代码,而是开始"指挥"智能体——分配任务、审核输出、协调多个并行进程。 "这是软件开发诞生以来最大、最根本的变革。" —— AI 语言学习应用 Speak 联合创始人兼 CTO Andrew Hsu 该公司 50 人的工程团队全部在使用编程智能体(主要是 Claude Code,部分场景也用 Codex),原本需要数月才能上线的功能,现在几周就能交付。他说 Cursor 在代码审查中仍有一席之地,但这个角色正在缩小。 【5】"删掉产品" Cursor 的内部价值观里有一条直白的指令:"删掉产品"——这是在承认公司的未来在于类似 Claude Code 和 Codex 的编程智能体。上周,Cursor 宣布了对其"Cloud Agents"产品的重大更新:现在,多个智能体可以在各自独立的工作空间中同时处理不同任务,并记录工作过程。 在内部,Cursor 管理层押注的是:企业客户会更看重一款不绑定单一模型提供商的产品。随着各家模型能力日新月异,天平随时可能倒向任何一方,这种担忧在开发者中与日俱增。 【6】自研模型:降低依赖 Cursor 也在努力降低对 Anthropic 和 OpenAI 的依赖。他们的核心判断是:一个更小但专精于编程的模型——基于自有数据训练——即使面对竞争对手不断加大投入的大型前沿模型,也能保持竞争力。据知情人士透露,目前约有 20 名 AI 研究员在开发 Cursor 的 Composer 模型。这些模型以 DeepSeek、Kimi 和 Qwen 等强大的中国开源模型为基础,再通过额外训练和利用 Cursor 自有数据的强化学习进行优化。成效显著:Composer 1.5 速度快,是平台上第二受欢迎的模型,而且 Cursor 运行它的成本远低于采购 Anthropic 大模型的费用。不过对开发者来说价格仍然不低:根据 Cursor 官网信息,Composer 1.5 的输入价格为每百万 token 3.5 美元,而 OpenAI 的 GPT-5.3 Codex 在 Cursor 内的价格为 1.75 美元。 【7】烧钱大战 成本始终是一个挥之不去的挑战。Cursor 的大型竞争对手们愿意大举补贴。据一位了解公司内部分析的人士透露,Cursor 去年估算过,一个每月 200 美元的 Claude Code 订阅可能消耗高达 2000 美元的算力成本,这意味着 Anthropic 在大幅补贴。如今这种补贴力度似乎更加激进——据另一位接触过公司算力开支分析的人士称,这个 200 美元的套餐现在能消耗约 5000 美元的算力。 Cursor 也对部分用户进行补贴,但力度似乎不及 Anthropic。据知情人士透露,Cursor 的个人订阅利润率为负,但企业套餐的利润率为正。使用 Cursor 的企业可以选择 Teams 计划(面向初创公司,可随时取消),或者谈判签订企业合同(面向大型组织)。 【8】押注企业客户 拓展企业业务是通向稳定的一条路径。企业合同签约周期更长,但客户流失率更低。据知情人士称,Cursor 历史上只流失过一两个企业客户。但这些令人垂涎的企业合同在 Cursor 的营收中占比一直不高:据 Forbes 看到的文件显示,截至去年 11 月,企业合同仅占 Cursor 年化收入的 13.6%。据一位知情人士透露,如今 Cursor 约 60% 的收入来自企业客户,但 Forbes 无法确认其中企业合同的具体占比。 公司的人员配置也反映了对企业市场的重视:一半员工专注于市场拓展相关职能。销售团队已经拿下了包括 Meta 和英伟达在内的大客户合同。 【9】客户流失的信号 压力正在不断累积。2 月份,房贷服务初创公司 Valon 的 90 多名员工取消了 Cursor 订阅。理由很直白:他们不再需要编辑器了。他们转向了 Claude Code 的强大智能体,将工作端到端全面自动化——系统间的数据迁移、Bug 修复——CEO Andrew Wang 表示这些任务的完成速度"快了 10 倍"。 【10】多智能体的未来 当软件开发界还在消化自主编程的冲击时,一个更新的范式正在浮现——多智能体系统:想象一下,一个开发者指挥着数十个智能体组成的团队,每个智能体都有自己的角色和职能,几乎就像人类队友一样协作。 现在,Cursor 正在探索构建一个能管理数百个智能体同时协作的工具,他们内部称之为"grind mode"(智能体全力运转的高强度工作模式)。这其中有很多复杂问题需要解决:比如如何为每个智能体分配专门的角色。有时候,当这些智能体发现自己有太多"同事"时,就会开始偷懒、表现变差——跟人类一模一样。 来源:Forbes: Cursor Goes To War For AI Coding Dominance forbes.com/sites/annatong…

中文
0
0
1
1.5K
知县|zhixian
知县|zhixian@zhixianio·
让我的🦉跑了一个 Qwen 3.5 的 9B 视觉模型,然后调用它在本地把一些老照片过一遍做一些分类筛选,这种慢慢跑的任务最适合这种小模型了
知县|zhixian tweet media知县|zhixian tweet media
中文
27
10
124
31.8K
SnowShadow
SnowShadow@Alfredxia·
有一个感受,AI原生产品的开发模式应该是Result Driven Design或者就叫Judgement Driven Design ,和TDD还是有本质区别的。
中文
0
0
0
557
SnowShadow retweetledi
Frank Wang 玉伯
Frank Wang 玉伯@lifesinger·
在阿里做开源,是件特别幸福又折腾人的事。 幸福之处是,在早期,可以非常自由又狂野地去做开源。当年做 Sea.js、KISSY 等项目,只需没日没夜去做就好。做好了,同时内部项目愿意采纳,价值就不需要另证。 折腾之处是,一旦开始做出声量,开始因开源建立起团队影响力,就会被要求纳入绩效考核,要能和公司业务建立关联。如果说不清楚,就只能用爱发电,逐步不讨喜,成为减分项。 Ant Design、AntV 等项目,兴起是因为身处公司边缘、不被关注,但有一帮热爱和奉献之人。痛苦之处是,做到有一定声量之后,就得直接或间接地和业务挂钩。需要去证明、去规划、去画饼。 本以为阿里的开源项目,从 Qwen 起,可以摆脱上面的折腾因素。目前看起来,并没有变。 不过在开源这块,阿里比字节和腾讯,已经好非常多。腾讯的封闭,不会有开源。字节的数据导向,开源也起不来。阿里的开源,至少还有不少机会能爬到半山腰。只是非常可惜,从半山腰要继续爬到山顶,则也非常非常难。难的不是技术,是被看见后的组织阻力。 国内真正有开源基因的公司,目前看是 DeepSeek,是创始人层面一开始就想好了,是开源本身就是商业模式的最重要要素。期待 DeepSeek 能继续往山顶攀升。 一个公司,终究还是有基因的。可叹。
中文
73
82
883
161K
SnowShadow
SnowShadow@Alfredxia·
Canceled the cursor subscription, fully switched to Claude Code and Codex.
English
0
0
0
398
SnowShadow
SnowShadow@Alfredxia·
先做Context Design再做交互设计,因为上下文装配的约束会反过来决定交互流程。产品经理的新核心能力:理解模型在什么上下文下能产生什么质量的输出。
中文
0
0
0
346
SnowShadow
SnowShadow@Alfredxia·
AI产品的设计核心正在从"面向功能"转向"面向上下文"。传统PRD穷举用户交互路径,但AI模型是非确定性的——同样的功能,模型拿到的上下文不同,产出完全不同。我提出一个三层框架叫Context Design:先做Context Design再做交互设计,因为上下文装配的约束会反过来决定交互流程。
中文
3
0
0
396