Sam Chen

15 posts

Sam Chen

@HzXun

医桥科技创始人，医疗AI实践者

Katılım Aralık 2014

67 Takip Edilen7 Takipçiler

Sam Chen@HzXun·5h

@zhao_dashuai 😅😅😅在亚洲大陆上，甚至全球南方国家里，中国是唯一一个没有在过去300年内沦为白人殖民地的文明（日本在二战后事实成为了美国的殖民地）。中国人眼中没有任何一个高人一等的外族。

中文

Sam Chen@HzXun·11h

@zhao_dashuai 商朝用来做活人祭祀的俘虏大都是雅利安人，说起来这些雅利安人的后代后来入侵印度成为了婆罗门和刹帝利。不知道印度人知道他们的高种姓在shang这个他们认为的'中国最低等人眼里和猪头一个用途是啥想法……

中文

611

Zhao DaShuai 东北进修🇨🇳 Commentary@zhao_dashuai·11h

Hey indians, meet your masters; The Shang. The Shang people were China's chariot-riding, genocide enjoyer from the 1500 BC, just like the Aryans who conquered your emaciated race during the same era.

Zhao DaShuai 东北进修🇨🇳 Commentary tweet media

English

465

18.7K

Sam Chen@HzXun·12h

@wsl8297 八级钳工

中文

Joruno@wsl8297·1d

普通人的天花板是什么？

中文

129

196

181.7K

Sam Chen@HzXun·17h

@TruthBridgeV 所以攻击中国人臭会让中国人无感。因为中国人普遍体味就轻。马来人在热带，汗腺发达有利于体温调节，是优势基因。虽然体味会重。

中文

147

Sam Chen@HzXun·17h

@TruthBridgeV 汉人的祖先翻越帕米尔高原，进入到黄河上游。在翻越高原的过程中对应雪原气候发生了基因筛选，包括大汗腺（出汗失温）的退化和内眼睑（自带雪镜）的增生。有意思的是汗腺和女性的乳腺公用一个基因开关，所以汉族女性普遍偏小。也有沿着海岸线北上的一支，在几千年中混入汉族，两广一带普遍。

中文

Truth Bridge@TruthBridgeV·1d

这群丑陋又没素质的马来西亚穆斯林女游客，来中国旅游竟然公开捂鼻狂喊“中国人好臭”“都不洗澡”，还偷拍网约车司机在背后嘲讽！真当我们听不懂马来语啊？你们头上那块三月不换的裹尸布才叫臭到窒息吧？热带国家自己汗臭+香料味熏天，还有脸指责别人？出门不照镜子吗？丑陋无知还敢秀优越，简直给马来西亚丢尽脸！中国人忍耐是有限度的，这种垃圾游客建议拉黑名单，永远别来了！

中文

527

248

1.6K

238.5K

Sam Chen@HzXun·21h

我查过写下 Attention is all you need 论文的谷歌八子后来创业的经历，除了一个创立了Cohere 外，其他人似乎都没有成为LLM发展的主流。有意思的是马斯克有一次访谈说到买了一批黄仁勋的显卡给OpenAI的时间是2015年，那就是在Transformer架构发布之前。也许上帝就需要现在出现大模型，不管最后是谁

Sam Chen@HzXun

@Compute_King 2016 年谷歌才发布： Attention is all you need 论文，成为所有当今大语言模型的理论基础。2022年 facebook 在chatgpt的压力下开源 llama 3.0，qwen早期的文档几乎一比一复刻 llama 3。排除掉语音，视频监控，中国早期的ai研究都沉没了，就像人类进化过程中哪些昙花一现的类人物种

中文

Sam Chen@HzXun·1d

@realchendahuang 确实如此。后发公司的优势之一就是可以绕过MySQL。甲骨文收购MySQL的目的就是为了让它不再升级进化以免威胁到自己产品。

中文

陈大黄@realchendahuang·2d

我宣布我是PostgreSQL的忠实拥趸。 PostgreSQL 太他妈强了，可以一个打十个。而MySQL 就是个垃圾。 PostgreSQL 最牛逼的地方，就是它的插件系统。普通数据库只能存数据，PostgreSQL 可以不断长出新能力。你要任务队列，PGMQ 可以直接在数据库里做队列。你要向量检索，pgvector 可以直接存 embedding，做相似度搜索。你要图数据库，AGE 可以直接在 PostgreSQL 里跑图查询。你要半结构化数据，JSONB 可以直接存、直接查、直接建索引。你要全文检索，FTS 原生就能做，很多项目根本不用一上来就搞 Elasticsearch。这就是 PostgreSQL 离谱的地方。它不是一个单纯的数据库，它更像一个数据基础设施平台。以前你做一个项目，可能要数据库、Redis、消息队列、向量数据库、图数据库、搜索引擎堆一堆东西。现在很多中小项目，先上 PostgreSQL 就够了。一个数据库，先把半个后端基础设施顶住。 MySQL 呢？很多技术团队因为历史的惯性，还在用MySQL5.7 ，那也没办法的事。新项目就千万别用MySQL5.7，不要揣着粪坑里的石头当着宝。新项目直接上PostgreSQL。这是2026年AI时代的最佳实践。

中文

168

Sam Chen@HzXun·1d

@KELMAND1 我把llm分成研发用和生产用。研发下，越强越好，越快越好，因为再贵的大模型也比人便宜，更快的交付更好和更强的产品远比token价值高。交付用，是指生产环境下产品中用到的llm，稳定，快速，便宜更加重要，也许还需要私有部署。

中文

Eason Mao☢@KELMAND1·2d

讲个暴论：大模型早晚和发烧音响一样，有“木耳困境” - 音响贵到一定程度后大部分人根本听不出好坏。就拿编程说，普通人顶多写个小脚本、改改报错，免费模型就能搞定，顶级模型再“聪明”，写出来的代码在他眼里也看不出差别。至于那些架构设计、底层优化，普通人连这活儿能干嘛都不知道，更别说用上了。最后顶级模型只能卖给发烧玩家，或者 ToB，大众市场就图个“能用、顺手”，谁在乎那点所谓的“智商”差距。

中文

144

26.1K

Sam Chen@HzXun·1d

@xRoAvFFhMM37706 @teacher_cao 这种深仇大恨，那可以理解他今天那种得了狂犬病似的状态

中文

金坷垃@xRoAvFFhMM37706·1d

@teacher_cao 据说他当年在百度搜索割包皮手术结果百度给推荐了一家莆田医院，给他阉割了。

中文

490

Cao草@teacher_cao·2d

Claude为啥这么讨厌中国人创始人在百度经历了什么我真的好好奇有知道的给我讲讲吗

中文

184

208

188.3K

Sam Chen@HzXun·1d

中文

1.2K

Compute King@Compute_King·2d

大家现在能叫出一串名字：DeepSeek，千问，Kimi，混元，星火，文心一言…… 感觉好像就是ChatGPT一出来，中国本土公司一夜之间全冒出来了。但其实根本不是那么回事。如果画一张中国大模型的技术族谱，你会发现几条主线：第一条主线和智源研究院有关。北京智源人工智能研究院（BAAI）成立于2018年11月。它不是一家普通的公司，而是在科技部和北京市政府的支持下，由清华、北大、中科院这些顶尖高校和科技企业共同发起的非营利研究机构。它不为赚钱，专为死磕AI领域最硬核、最原始的创新，目标直指大模型、世界模型和通用人工智能这些星辰大海。智源研究院2021年牵头搞出了“悟道”系列大模型，成了后来中国大模型江湖的技术土壤。现在，它又开始折腾“悟界”系列，想让AI不仅懂文字图片，还能看懂物理世界，更进一步帮科学家研究生命科学。智源手里还有两张王牌： 🔹 智源大会：这是它每年组局的全球AI顶级聚会，大牛学者和行业大佬都会来，现场发布一堆前沿成果和年度趋势预测，基本是国内AI圈的风向标。 🔹 人才生态：它最厉害的一招，是把清华、北大、中科院这些顶级学术力量揉在一起，打破体制的围墙，搞出一个自由开放的交流平台。在笔者看来，现在的智源更多扮演的角色像是一个播火者，不造产品，只管把火种点燃，然后递到整个产业手里。如果把智源研究院看作是一棵树的根，顺着根往上看，会分出三条枝干：一条是CPM（清华大学牵头的超大规模预训练模型）。2020年11月14日，智源研究院和清华大学研究团队联合发布了以中文为核心的大规模预训练语言模型CPM-LM，参数规模达26 亿，预训练中文数据规模100 GB。CPM这条线往下长出了OpenBMB开源社区，再后来就有了现在大家在端侧玩得比较多的MiniCPM模型。另一条是“悟道”系列，它直接孕育了GLM这个技术路线，然后孵化出了现在商业化最成功的智谱AI，就是那个ChatGLM背后的大佬。还有一条叫M6，是阿里达摩院跟智源一起捣鼓的多模态大模型，这条线一路往下，就演化成了今天的通义千问Qwen。现在市面上竞争得你死我活的大模型产品，追根溯源，技术底气有一大半都能对上这个谱系。为什么智源研究院这么牛？因为它当时把国内最核心的大模型人才和最前沿的技术路线全给聚到一块儿了。智源，清华，北大这三家，基本上构成了一个铁三角，就像美国那边的OpenAI，DeepMind配上斯坦福，伯克利一样，人才和想法在这个生态里来回流动，碰撞出来的火花，就把早期的底座给搭好了。第二条主线是百度，属于典型的“起了个大早，赶了个完集”。早在AI这个词还没流行的2013年，李彦宏就亲自挂帅，成立了百度深度学习研究院，这是全球第一个把“深度学习”直接挂在企业研究院招牌上的。紧接着2014年，百度在硅谷设立人工智能实验室，请来了吴恩达当首席科学家，全力推动“百度大脑”。更有意思的是，现在AI圈如日中天的Anthropic创始人Dario Amodei，当时就在那个组里研究语音识别和模型扩展。他还把Jim Fan招了进来做实习生。 2017年底，百度硅谷团队干了一件大事，发了一篇论文叫《Deep Learning Scaling Is Predictable, Empirically》，第一次系统性地证明了Scaling Law在机器翻译、语言建模、图像和语音上都管用。可惜当时没引起太大轰动，但金子总会发光，它后来成了大模型研究的基石。2019年OpenAI那篇著名的Scaling Law论文，参考文献里就明明白白引用了这篇百度论文的作者Joel Hestness的后续研究。时间来到2019年，百度正式发布了开创性的知识增强语义模型ERNIE 1.0。这个模型厉害在于，它不只看无结构的原始数据，还把百度多年积累的大规模知识图谱给融合进去了，一出来就刷新了多种中文NLP任务，直接对标BERT。年底更是迅速迭代到了ERNIE 2.0，搞了持续学习语义理解框架，中英文任务上全面超越了业界主流模型。第三条主线是科大讯飞。源头可以一直追到1999年，当时还在中科大读博的刘庆峰，和导师王仁华教授一起，依托中科大创立了科大讯飞的前身。讯飞从中文语音起家，但它在AI大模型上的布局，可以追溯到2014年。那年，讯飞首次提出“讯飞超脑计划”。这个计划是个战略转弯信号，标志着讯飞不再只盯着智能语音，而是要向更难的认知智能和机器学习全面进军。到了2019年10月份，讯飞被美国商务部加入了禁运名单，决定启动“国产化AI算力底座”建设。这为后来大模型的自主训练，提前备好了算力粮草。说到这儿，笔者插一段亲身见闻。这其中的很长一段时间笔者还在某大厂工作，业务跟英伟达是直接竞争关系，所以能亲眼看到百度和讯飞在英伟达生态圈里有多重。重到什么程度呢？当时CUDA软件栈里好多奇怪的Bug，都是百度和讯飞的工程师先踩到，然后和英伟达一起联手修掉的。从这点就能看出来，这两家当时在AI工程化上走得还是比较前沿的。如果说ChatGPT像一把火，那么他一下子把整个中国大模型产业给点爆了，商业化了，出圈了，但烧起来的那些柴，是在2020年前就一批批已经被产业的大拿们码好了的。因为，在那之前，这些人已经闷头干了不少事： 🔹 完整的大规模预训练体系搭起来了，知道大模型该怎么训了； 🔹 积累了部分中文高质量语料，不再是拿英文随便翻译翻译就完事； 🔹 千亿，万亿参数的超大模型真刀真枪跑通了，验证了工程上走得通； 🔹 部分搭建了国产化AI算力底座，踩了很多坑； 🔹 多模态路线也摸着石头探索了； 🔹 各种开源社区，像OpenBMB，也建起来了。这些工作，在那些个安静的前夜，的确没有马上变成赚大钱的产品，但它们实实在在化作了土壤。后来智谱AI的崛起，通义千问的迭代，百度的文心，DeepSeek的惊艳，讯飞的星火，到字节的豆包，腾讯的混元，小而强的面壁MiniCPM，全都是从这片土壤里长出来的庄稼。中国大模型产业的爆发，扳机是ChatGPT扣动的；但中国大模型技术的种子，是早在2020年前，由智源研究院，百度，科大讯飞，以及清华，北大，中科大和一批有远见的科技企业，一起亲手种下去的。

刘江/LIU Jiang@turingbook

还是亲历者来说说历史吧。中国最早的大模型研究基本上与智源研究院有关。第一个正式发布的大模型是智源研究院支持清华刘知远团队的清源CPM（2020年11月，26亿参数） zhuanlan.zhihu.com/p/298138008 ，后来演变为OpenBMB，现在还是最好的端侧模型之一。然后就是智源研究院牵头，唐杰老师挂帅的悟道1.0模型系列（2021年3月），其中就包括GLM的最早期版本（GLM论文通信作者是唐杰和杨植麟）。其他比较早期的工作，百度是Ernie 3.0（2021年7月）；阿里M6（2021年3月）是与唐杰团队合作的（林俊旸是第一作者，唐和当时在阿里的杨红霞是通信作者），后来演变为Qwen。华为盘古有两个版本，一个是华为云田奇与杨植麟团队合作，一个出自诺亚方舟实验室，但都没有持续。可能有遗漏的，大家可以补充。

中文

104

152

751

205.9K

Sam Chen@HzXun·3d

不要挡在大模型进化的道路上。如果你对llm下一次能力的升级感到恐惧，那么你的业务模式就是错的。但是不要担心 claude code 或是 codex 配上专门的skill 可以干掉你的智能体。因为3年以后，绝大部分人都还是不会在自己用来工作的电脑上安装claude code，因为安全性，私有，和安装壁垒。

中文

Sam Chen@HzXun·4d

@elcriticopol 事实是，特斯拉上海工厂挽救了 Elon Mask。而这是上海市政府和Tesla的对赌投资，否则这位万亿富翁很有可能在2016年前后破产。

中文

El crítico crítico ☭@elcriticopol·5d

Logros del capitalismo: crear un trillonario. Logros del socialismo chino: sacar a 850 millones de personas de la pobreza. No tengo nada más que decir.

Español

2.8K

23.7K

650.2K

Sam Chen@HzXun·5d

本月腾讯开发者邮件提示对微信AI开放接口，我司将会MedB智能体免费部分的开放。我一直认为微信的强大之一是微信小程序的生态圈的优势。微信下一代会占据一个AI智能体入口并在小程序生态内建立服务。这也许会早于嵌入Gemini的安卓操作系统问世。

中文

Sam Chen@HzXun·14 Tem

@ZeusCSGO 毕竟这个杂种是在欧洲子宫-乌克兰里拉出来的，对于女性的认知来自于他那个被欧洲人当成妓院的祖国。

中文

273

30.5K

Zeus ✌️@ZeusCSGO·13 Tem

About six months ago, I posted a few videos on Telegram with a girl I met in Shanghai. Our faces were visible, but there was no explicit content or anything disrespectful in those videos. At the time, it felt like just a normal moment from life. I didn’t realize it could affect someone’s personal situation. Later, I found out the girl was in a relationship and that she faced a lot of hate because of it. I truly regret that things turned out this way. As soon as I understood the seriousness of the situation, I deleted the videos. I never meant to hurt anyone — it wasn’t intentional. I’m not hiding or making excuses — I’m just being honest. Also, for the record: I was not married, not in a relationship — rumors about a “wife” or “family” are simply false. Please, stop the hate. We all make mistakes, and I’ve learned from mine. I want to move forward — with respect toward everyone involved. Let’s put an end to this topic. And if there’s any way I can help the girl who was affected, I’d be glad to do so.

English

3.4K

101

1.9K

1.5M

Sam Chen@HzXun·30 Oca

炉火

日本語

Keşfet

@zhao_dashuai @wsl8297 @TruthBridgeV @realchendahuang @KELMAND1 @xRoAvFFhMM37706 @teacher_cao @Compute_King