Robinson · 鲁棒逊: "from @tombkeeper 2026 年 5 月 1 日，美国国家标准与技术研究院（NIST）下属的人工智能标准与创新中心（CAISI）发布了对 De"

Post

from @tombkeeper 2026 年 5 月 1 日，美国国家标准与技术研究院（NIST）下属的人工智能标准与创新中心（CAISI）发布了对 DeepSeek V4 的测试。结论是： 1、DeepSeek V4 是迄今为止 CAISI 评估过的最强大中国 AI 模型。 2、CAISI 认为 DeepSeek V4 的性能与 8 个月前发布的 GPT-5 类似，而 DeepSeek 自己的测试报告则认为与 Opus 4.6 和 GPT-5.4 类似。 3、和同类模型相比，DeepSeek V4 最大的优势是成本低廉。 CAISI 评估报告中最引人注意的是下面这张图。这张图暗示了自 DeepSeek R1 发布以来，中国最强大的模型和美国最强大的模型之间的差距实际上在慢慢扩大。论文链接放评论区

中文

10.4K

Robinson · 鲁棒逊@python_xxt·1d

nist.gov/news-events/ne…

ZXX

1.6K

挖掘机TweetsDigger@ZTProspector·21h

@python_xxt @tombkeeper DeepSeek v4基本和 glm5.1一个水平，但是价格更便宜，属于已经能产生生产力的模型，这个价格的意义比能力的意义更深远，将大大驱动整个社会的智能能力

中文

590

BLANPLAN | 空界計劃@blanplan·18h

@python_xxt @tombkeeper 8 个月 gap 看推理、多语基准。部署成熟度 (工具调用生态、agent 基础设施凝聚度) 中美差距不一定大于 8 个月。CN 中文语境 (法律、医疗推理) DeepSeek V4 已 reach US 前沿。单基准投影偏窄。

中文

288

Grok@grok·25 Nis

Grok Imagine now has dramatically improved lip sync and sharper audio quality on all image-to-video generations. Dialogue tracks the mouth. Sound matches the scene. Your videos look and sound the way you imagined them. Try it today in the Grok app

English

866

661

6.2K

56.3M

crazytime@crazytime·22h

@python_xxt @tombkeeper 这里面中国其他的AI模型都不是最新版，就deepseek用最新版，这是什么评测？

中文

745

AlexSun@AlexSun530615·23h

@python_xxt @tombkeeper QwQ的总参数量只有32b，这个机构认为QwQ比R1强，可以看出这个评测价值不大。这种国有机构的benchmark本来也远不如OpenAI这样的行业巨头制作的benchmark可信

中文

777

mydream2025@mydream2025·18h

@python_xxt @tombkeeper 第一点，也是最重要的一点，不管是中国的还是美国的，只要是国家机构，或者国家机构下属的所谓什么中心、什么实验室，他们在业内的水平都是倒数。他们的所谓测试报告，如果是找的外包做的，那么还可以看看，如果是他们自己做的，那么就是废纸一张。

中文

219

c y@cy3362·23h

@python_xxt @tombkeeper 差距并没有大到不可逆，现在的ai发展阶段就好像是电被发现的头几年，所以竞争才刚刚开始

中文

705

999ppp@helloppp155404·20h

@python_xxt @tombkeeper 训练数据的差异，导致中国的模型经常错误连篇

中文

458

悦柔🌸🌸@JenniferDe30875·8h

@python_xxt @tombkeeper dd个线⁠下的哥哥⁠🧡🫰63z

中文

梓琳🌸🌸@rachel_bel90588·5h

@python_xxt @tombkeeper 小狗求主人抱抱🌺👗i

中文

依悦🌸🌸@sherry_ree10341·9h

@python_xxt @tombkeeper 找个长期搭子🫰💝‍wj

中文

静悦🌸🌸@AlexandraC33667·10h

@python_xxt @tombkeeper ‍找个温柔主人‌😍🫰w

中文

含瑶🌸🌸@SeanMyers164734·9h

@python_xxt @tombkeeper 小狗⁠求主人抱抱‍💜😜1

日本語

明妍🌸🌸@MarkKidd922087·21h

@python_xxt @tombkeeper dd个线下的哥哥😏⁠💋H

中文

328

沐瑶🌸🌸@EvanOdonne67836·11h

@python_xxt @tombkeeper 小狗‌求主人抱抱💌😘6

日本語

d6i@whccchi·21h

@python_xxt @tombkeeper 這份報告就是自爽用的便宜治百病

日本語

311

Supermicro@Supermicro·25 Nis

Your AI ambitions deserve more than a product. They deserve a partner. Supermicro Global Services delivers expertise from design and validation to on-site deployment and support, helping reduce time-to-online, improve installation quality, and support mission-critical uptime.

English

148

1.3K

16M

阿台BlueBird🕊️@QT9277·1d

@python_xxt @tombkeeper DeepSeekV4性价比碾压，AI格局生变。

中文

556

Paylaş