ocde

49.7K posts

ocde banner
ocde

ocde

@ocde

设计人机融合演化的AIZEN

🌎 Katılım Şubat 2007
2.9K Takip Edilen1.4K Takipçiler
Sabitlenmiş Tweet
ocde
ocde@ocde·
x.com/i/grok/share/4… Harness Engineering
宝玉@dotey

传说中的DeepSeek天才少女、雷军千万年薪挖角的罗福莉也开始发推了。 帖子里最生动的段落是关于她第一次使用复杂 Agent 脚手架的经历。她用的词是:orchestrated Context,编排过的上下文,我理解就是现在比较火的 Harness Engineering。 她说第一天就被震惊了,然后试图说服团队去用,没成功,于是下了一个硬性命令: > MiMo 团队里,明天对话数不到 100 条的人,可以辞职了。 这个管理风格相当激进,但有效。一旦团队的想象力被 Agent 系统的能力点燃,这种想象力就直接转化成了研发速度。 一方面确实霸气,一方面也让我有点意外,原以为大模型团队应该是更积极拥抱这种从传统 Chat 模型到 Agent 模型范式变化的。 其他都是“干货” 1. 提前押注的架构优势 1T 底座模型几个月前就开始训练了,当时的目标是长上下文推理效率。采用了 Hybrid Attention 机制(混合注意力,简单说就是不让所有 token 都互相关注,而是让一部分用全局注意力、一部分用局部注意力,大幅降低计算成本),支持百万 token 上下文窗口,加上 MTP 推理层(Multi-Token Prediction,一次预测多个 token 而不是一个一个蹦,推理延迟和成本都大幅下降)。 这些架构决策在当时并不时髦,但它们恰好成了 Agent 时代的结构性优势。 2. 为什么 MiMo 团队能这么快 罗福莉在做 DeepSeek R1 的时候亲眼见证过的真实总结: — 基座与基础设施研究周期很长。你需要在它产出回报的一年前就有战略定力。 — 后训练的敏捷性是另一种能力:靠产品直觉驱动评估,压缩迭代周期,及早捕捉范式转换。 — 还有那些不变的东西:好奇心、敏锐的技术直觉、果断的执行力、全力以赴。 以及一样很容易被低估的东西:对你正在为之构建的世界,发自内心的热爱。 3. 模型会开源的,等模型稳定到值得开源的时候。

English
0
0
0
40
ocde
ocde@ocde·
当每个人都在创造价值那么整个社会就可以创造更大的价值
java@huang_java

@iPaulCanada 假设所有公司都是ai,不需要雇佣任何人,那么所有人都没工作,除了老板有钱,那些公司的产品卖给谁?

中文
1
0
0
31
ocde
ocde@ocde·
竞争结构从规模到模型优势,人数只是个模型参数不是重要的战略变量
rocklee8505@rocklee8505

@iPaulCanada 有点像是大萧条前兆了,他们不明白,成本低不是万能药,没有人能够消费才是根本。

中文
1
0
0
39
ocde
ocde@ocde·
Janet @genie0309

最近刷Twitter有一个特别强烈的反差感: 硅谷大佬们开始重新写代码了。 Shopify CEO @tobi 亲自跑 AI 实验,一夜 37 轮迭代优化自家生产代码。YC CEO @garrytan 每天 16K 行,开了 12 个 Agent 并行干活,github star数蹭蹭涨。@Chamath 带2.5个初级开发,几周从零给自己搭了个 Jira 替代品.... 这些人不缺工程师,但他们选择自己动手。 反观国内,太多公司老板一边喊着 AI 转型,一边自己却只停留在豆包的Q&A水平上,寄希望于找几个懂AI的人就能解决转型问题。 然而,残酷的现实是,这次不同于以往任何一次技术革命,AI 时代的组织逻辑一定会被彻底改写,且已经在快速发生。 你没法领导一场你自己都不参与的变革!!!

QHT
1
0
0
53
ocde retweetledi
KK.aWSB
KK.aWSB@KKaWSB·
今天科技圈最热门的话题之一: Yann LeCun的AMI Labs融资$10.3亿,欧洲史上最大种子轮,专门挑战GPT/Claude/Gemini的自回归架构 图灵奖得主LeCun离开Meta,用4个月创立了AMI Labs。 他要做的事只有一件:证明整个LLM路线走错了。 LeCun的核心判断:GPT、Claude、Gemini这类模型只是在预测下一个token,本质上是统计相关性,无法真正理解世界。 AMI的架构叫JEPA——不预测文字,而是建立物理世界的内部模型,能理解3D现实、连续信号和因果关系。 同期,李飞飞的World Labs也刚融了$10亿——三周内两位顶级AI科学家合计筹了$20亿,全部押注LLM是死路。 投资方包括NVIDIA、贝索斯、丰田、三星、淡马锡。 他们在等的不是产品,是一个可能颠覆整个行业的架构。
中文
63
50
367
73.1K
ocde
ocde@ocde·
ai是认知系统,程序是执行系统。
数字生命卡兹克@Khazix0918

能用脚本就别用Agent。 今天早上发了那篇文章以后,有很多朋友跟我讨论。 发现大家问得最多的一个问题是,你天天说Agent和Skills是未来,那你自己平时干活是不是什么都丢给Agent? 我说实话,还真不是。 正好借这个机会我再补充一下,因为我发现这是一个很普遍的误解。 很多人一听Agent厉害,就想把所有事情都交给它干,但说实话,在我自己的实际工作里,Agent反而是我最后才会动用的手段。 我自己处理事情的优先级是这样的。 1. 能用Agent写个脚本解决的,一律都用脚本自动化解决。 2. 脚本搞不定的,或者需要一些泛化能力的,做成Skill。 3. 只有那些真正需要创造性判断、复杂推理的任务,才会真正交给Agent。 这其实是个循环。 先说脚本。这东西就是逻辑是固定的,输入是什么,输出是什么,中间怎么处理,全都是确定的,不存在需要判断的地方,不存在可能出现意外情况的地方,比如我飞书上各种各样现在跑着的自动化。 这种事情你让Agent来干,纯属浪费。 你不会用大炮打蚊子,同样的道理,你也不该用Agent去干脚本能干的活。 再说Skill。有些事情,纯脚本搞不定。比如我做的那个AI热点监控站,里面有一个资讯打分的功能,每条资讯进来,要判断它的重要性、相关性、时效性,给一个综合评分。 这个事情你没法写死逻辑,因为资讯的内容是千变万化的,你不可能为每种内容预设一套评分规则。 这时候就需要大模型的泛化能力了,但它又不需要Agent那种自主决策和多步骤规划的能力,它就是一个单一的、封装好的能力单元。 这就是Skill的价值。 最后才是Agent,我用Agent的很多时候,就是那种你没法提前规划好所有步骤的任务。你知道你想要什么结果,但你不知道中间要经过哪些步骤,因为这取决于过程中遇到的具体情况。 就比如,开发一个脚本,比如,做一个究极详细的竞品体验报告。 这种需要动态规划、需要根据中间结果调整策略的任务,才是Agent真正的用武之地。 所以,这三层,其实有点像一个金字塔,而且是上下循环的金字塔。 最好的Agent使用方式,就是不断往下沉淀能力,自己永远只处理那些还没法被固化的部分。 很多人犯的错误是,一上来就把所有事情都往Agent上堆。 结果就是慢、贵,还不稳定。 真不是Agent不行,是很多场景根本用不到它,强行上Agent只会引入不必要的不确定性。 这才是这个金字塔真正的运转方式。 让Agent去创造工具,让工具去执行任务。 这个循环一旦跑起来,才是AI在公司里真正落地的样子。

中文
1
0
0
38
ocde
ocde@ocde·
这就是为什么人类大脑仅需要20瓦的原因,要分布式微服务化。 #aizen #2026
中文
0
0
0
33
ocde
ocde@ocde·
#哈哈
QHT
0
0
0
56
ocde
ocde@ocde·
敲打的是每个私有制
龙城思码客 (Loading...)@izodic

@Rumoreconomy 历史的韵脚总是在重演。从 40 亿利润分配到 315 的‘鸡蛋挑骨头’,逻辑线其实很清晰。当一个民企的声望和组织力超过了某些边界,且不愿被收编时,‘合规性检查’就成了最顺手的工具。老于的麻烦,本质上是‘怀璧其罪’。

中文
0
0
0
35