枫原万葉

177 posts

枫原万葉

枫原万葉

@46ge5

这是一个新账号,老帐号被 ban 了 本职是做 LLM pre-train & post-train 的,目前已对 LLM 丧失兴趣,但偶尔也分享一些 AI 知识

Katılım Nisan 2026
177 Takip Edilen44 Takipçiler
陈一发儿
陈一发儿@yifaer_chen·
老马,X啥时候能支持live图🤔🤔
陈一发儿 tweet media陈一发儿 tweet media陈一发儿 tweet media陈一发儿 tweet media
中文
209
3
339
52.4K
枫原万葉
枫原万葉@46ge5·
心细我觉得是针对 engineer 来说的,有很强的 debug 和工程能力,这是基本素质。 聪明要看怎么定义了。但至少团队里要有足够多的人,能冒出足够多的 idea(因为 idea 往往不集中在某个聪明人身上,事实上很多好的训练技巧和数据构造方法都来自于实习生)。三个月能提供1个 idea,我都认为是“聪明”。 最后,也要有人能拍板决定把某个技巧怼到训练里去,不过这种判断力我认为更多是出于经验。大模型几乎就是实验科学。
MikaStars★@MikaStars39

所以是不是印证了shunyu的说法,只要有一些比较聪明而且心细的人就可以做成大模型🤔

中文
0
0
1
32
枫原万葉
枫原万葉@46ge5·
@torontobigface 中方收获可以直接去掉,美国对于台湾长期是战略模糊,川普的发言很好地印证了这一点; 美方收获里的放弃支持伊朗也可以去掉,因为中国在伊朗问题上多次食言。
中文
0
0
43
5.2K
多伦多方脸
多伦多方脸@torontobigface·
习川会这次虽然排面拉的很高 但是谈判的收益很低 目前公布的就是这么多 如果后续没有新的进展,就等于200架波音换川普表个态 双方很难说谁占便宜了,因为基本就没啥成果
多伦多方脸 tweet media
中文
146
19
776
263.8K
枫原万葉
枫原万葉@46ge5·
银翼杀手告诉我们 如果你能复制一个自己,那你可能也是个复制体 如果人能创造类人智慧,那很有可能人就是被某种智慧体创造的
中文
0
0
2
25
枫原万葉
枫原万葉@46ge5·
The reason the world felt like a better place during your childhood is because you were a child.
English
0
0
1
24
枫原万葉
枫原万葉@46ge5·
@predict_addict @pmddomingos To be fair, AlphaGo was DeepMind-led — but Ilya was actually a co-author on the Nature paper, so he definitely had something to do with it 😅
English
2
0
4
425
Pedro Domingos
Pedro Domingos@pmddomingos·
Ilya was there when Alex did AlexNet and when Dario's team did ChatGPT. Will he get lucky again at Safe Superintelligence?
English
46
18
339
58.3K
枫原万葉
枫原万葉@46ge5·
@quarktalksss 你可能有个认知需要更正一下:生活在完善的科学教育下的人口只占一小部分,而不是你说的“大多数”。现代科学教育体系真正大规模全球化只是最近几十年,很多社区、家庭才刚刚有第一代“接受现代科教者”。而宗教教育已经持续几千年,长期是绝大多数文明唯一的系统教育形式。
中文
0
0
1
135
夸克说
夸克说@quarktalksss·
晚上突然在想一个问题,人类都发展到今天这个阶段了,为什么科学还是竞争不过宗教?也就是,为什么大多数国家都已经在用科学和逻辑教育下一代了,但等这些人成年了,进入社会了,很多依然还是会拥抱宗教?当然,也有人拥抱的不是宗教,而是一些类宗教的思想体系。 原因很大程度上在于,科学解决的、或者试图解决的是真假的问题,但宗教不是,宗教要解决的是冷暖的问题。前者无论如何逻辑清晰、论证严密,也解决不了后面的问题。因为人在脆弱的时候,冷暖比真假重要。 这也是为什么,很多时候你知道什么是对的,什么是更好的,但另一些人却并不在意的原因,因为他们要的,只是眼下的一根火柴,哪怕之后火柴会消失,又或者会点燃屋子,但他们太冷,已经没有兴趣再想那么多。
中文
90
10
167
16.4K
枫原万葉
枫原万葉@46ge5·
每次等待十几个 agent 执行任务我就在想,为什么 CPU 和 GPU 不能再快10000倍,原本1小时的任务在1秒钟完成 在输入完任务的那一刻,执行结果其实就已经确定了 但除了 CPU 频率瓶颈,GPU 的并行扩展也解决不了串行推理问题。。。
中文
0
0
1
47
枫原万葉
枫原万葉@46ge5·
今天和一个做脑科学的朋友聊天,我才知道 我们的大脑其实一直在“主动预测世界”,而不是“眼睛看到 → 大脑接收 → 产生视觉”,外部的输入其实只是修正预测 这也就是我们可以在没有外部输入的情况下“凭空想像”的原因:大脑本来就能内部生成感知体验 梦、幻觉、想象、“真实感受”,都只是同一系统的不同状态,区别只是“外部输入”和“主动控制”的强弱而已
中文
0
0
1
72
枫原万葉 retweetledi
枫原万葉
枫原万葉@46ge5·
People keep calling Ilya “lucky.” Yeah, and he just happened to be there for AlexNet, Word2Vec, Seq2Seq, AlphaGo, GPT, CLIP, and half the modern deep learning canon. If one person is present at every major breakthrough for 15 years, maybe they’re not just watching history happen.
English
3
1
56
4.3K
枫原万葉
枫原万葉@46ge5·
@0ujXByOpKClR3ZM 中国的图书馆早就变成了“自习馆”,公共阅读区也被自习的人摆上作业和 iPad 鸠占鹊巢。在图书馆里看图书馆的书都已经成为一种“异类”。
中文
0
0
9
306
方的言
方的言@0ujXByOpKClR3ZM·
我从小就有一个困惑:为什么上自习要去图书馆的自习室? 那个所谓的“学习氛围”真的有那么重要么? 我这辈子只有当年追姑娘的时候陪着一起去过图书馆自习室,还是人家姑娘想去我跟着,表面上学习,其实心思根本没在书本上。我今天所掌握的所有知识,除了课本之外,都是在家自己感兴趣看书学到的,到图书馆反而学不进去。 不知道有没有人跟我有同感?
Kai@Kai866

今天除了习特会以外,这张北京图书馆的照片,震惊了外网,我估计他们并没有预料到在高强度的竞争下,中国人对改变命运有多么强的愿望。

中文
26
0
56
12.1K
枫原万葉
枫原万葉@46ge5·
@baoshu88 算不上历史最少,有一堆峰会都只是恢复沟通、建个热线。 对于今天的中美来说,不升级贸易战、不进一步脱钩就已经是阶段性成果了。逆水行舟也是一种努力。 这次峰会本来就没什么预期。真正能签大东西的时代,全球化高峰期、中美利益高度重叠期,早就已经过去了。
中文
0
1
3
497
包叔
包叔@baoshu88·
这是史上成果最少的中美峰会,没有联合声明,没有联合记者会,没有签署任何合作协议。中国巧妙地迎合了特朗普的需求,盛大场面、高规格的接待,但除了买了点飞机和农产品,几乎没有任何实质性举措,拖延、等待、维持现状,不再恶化对中国来说就是胜利。
中文
284
71
1.3K
365.8K