Flower Zhang

2 posts

Flower Zhang

Flower Zhang

@FlowerZhang7

Katılım Kasım 2022
15 Takip Edilen0 Takipçiler
KK.aWSB
KK.aWSB@KKaWSB·
千亿大模型集体翻车,整个AI圈傻了。 3月25日,谷歌悄悄发布了ARC-AGI-3基准测试。 GPT-5:0.26% Claude:0.25% Grok:0%,直接交白卷 人类呢?旧金山街头随便找的测试者,100%满分。 这测试没规则、没目标、没说明。 扔进一个陌生环境,自己摸索,自己推理。 人类天生会的事,AI完全不会。
中文
85
28
411
386.8K