
@zhao_dashuai 😅😅😅在亚洲大陆上,甚至全球南方国家里,中国是唯一一个没有在过去300年内沦为白人殖民地的文明(日本在二战后事实成为了美国的殖民地)。中国人眼中没有任何一个高人一等的外族。
中文
Sam Chen
15 posts





@Compute_King 2016 年谷歌才发布: Attention is all you need 论文,成为所有当今大语言模型的理论基础。2022年 facebook 在chatgpt的压力下开源 llama 3.0,qwen早期的文档几乎一比一复刻 llama 3。 排除掉语音,视频监控,中国早期的ai研究都沉没了,就像人类进化过程中哪些昙花一现的类人物种







还是亲历者来说说历史吧。中国最早的大模型研究基本上与智源研究院有关。第一个正式发布的大模型是智源研究院支持清华刘知远团队的清源CPM(2020年11月,26亿参数) zhuanlan.zhihu.com/p/298138008 ,后来演变为OpenBMB,现在还是最好的端侧模型之一。然后就是智源研究院牵头,唐杰老师挂帅的悟道1.0模型系列(2021年3月),其中就包括GLM的最早期版本(GLM论文通信作者是唐杰和杨植麟)。 其他比较早期的工作,百度是Ernie 3.0(2021年7月);阿里M6(2021年3月)是与唐杰团队合作的(林俊旸是第一作者,唐和当时在阿里的杨红霞是通信作者),后来演变为Qwen。华为盘古有两个版本,一个是华为云田奇与杨植麟团队合作,一个出自诺亚方舟实验室,但都没有持续。 可能有遗漏的,大家可以补充。

