
@elmercurioAON 中国古代的朝贡体系是皇家海外贸易体系,而不是税收。
中国的皇帝对外国的朝贡都会支付比一般贸易更高的对等价格。
在中国历史上多次出现海外政权要求增加朝贡频率被中国拒绝的例子。还有分裂外国政权争相要求获得朝贡资格的。
几千年中,中国人一直认为自己地大物博,根本不屑于去抢掠外国。
中文
Sam Chen
16 posts








@Compute_King 2016 年谷歌才发布: Attention is all you need 论文,成为所有当今大语言模型的理论基础。2022年 facebook 在chatgpt的压力下开源 llama 3.0,qwen早期的文档几乎一比一复刻 llama 3。 排除掉语音,视频监控,中国早期的ai研究都沉没了,就像人类进化过程中哪些昙花一现的类人物种







还是亲历者来说说历史吧。中国最早的大模型研究基本上与智源研究院有关。第一个正式发布的大模型是智源研究院支持清华刘知远团队的清源CPM(2020年11月,26亿参数) zhuanlan.zhihu.com/p/298138008 ,后来演变为OpenBMB,现在还是最好的端侧模型之一。然后就是智源研究院牵头,唐杰老师挂帅的悟道1.0模型系列(2021年3月),其中就包括GLM的最早期版本(GLM论文通信作者是唐杰和杨植麟)。 其他比较早期的工作,百度是Ernie 3.0(2021年7月);阿里M6(2021年3月)是与唐杰团队合作的(林俊旸是第一作者,唐和当时在阿里的杨红霞是通信作者),后来演变为Qwen。华为盘古有两个版本,一个是华为云田奇与杨植麟团队合作,一个出自诺亚方舟实验室,但都没有持续。 可能有遗漏的,大家可以补充。

