Sabitlenmiş Tweet

2026年初多模态模型目前大概就这样排(纯看Vision Arena盲测数据,2月最新):
1. Gemini 3 Pro – 1289
2. Gemini 3 Flash – 1277
3. GPT-5.2 High – 1257
4. Gemini 3 Flash (thinking-minimal) – 1256
5. GPT-5.1 High – 1252
6. Kimi-K2.5 Thinking – 1251
7. Gemini 2.5 Pro – 1246左右(老将还在前十晃)
8. ChatGPT-4o最新版 – 1235
9. GPT-5.1 – 1235
10. Kimi-K2.5 Instant – 1231
视觉理解和多模态推理目前还是Gemini 3系列最稳,Pro拔尖,Flash性价比和速度无敌。国产里Kimi-K2.5系列已经杀进前十很猛了。
想按场景选的话大概是:
- 纯视觉/OCR/图表/文档:Gemini 3 Pro/Flash
- 硬核推理:GPT-5.2 High
- 预算有限但要强:Gemini 3 Flash 或 Kimi-K2.5
- 国产天花板:Kimi-K2.5 Thinking
- 追求最快响应:Gemini 3 Flash (thinking-minimal)
数据来自arena.ai Vision榜,欢迎自己去盲测验证,谁上谁下天天变~
中文


























