Francis Zhang
527 posts




大模型厂商交替领先,真是各领风骚三五月:去年四季度是gemini、今年一季度是cluade、现在感觉轮到GPT5.5了。核心还是大家都在积极进取迭代,只很多时候领先源于对手的松懈。去年在算力投入上非常节制的Authropic最近应该是感受到了算力短缺的痛。 梳理下时间线 1、去年四季度: Google Gemini 3 系列(尤其是25年11月左右的Gemini 3 Pro/Deep Think)强势登顶,很多基准(如Humanity’s Last Exam、推理、多模态)领先,引发OpenAI“Code Red”。它在多模态、长上下文和搜索集成上特别亮眼,一度被视为转折点。 2、今年一季度: 最耀眼的自然是Anthropic Claude 4.6(Opus/Sonnet,2月发布)强势反超,尤其在编码(SWE-Bench)、长上下文推理、agentic任务和实际生产力上领先。 3、当下2026年4月: OpenAI GPT-5.5正处于发布窗口,刚 在ChatGPT和Codex上即将全面上线。它强调更好的上下文理解、编码、computer use和agent能力,试图追赶和超越。 大模型领域现在并没有绝对的“唯一王者”,而是各有专长: 1)Claude:主攻编码、长任务、可靠推理往往领先,Agent上迭代非常多。 2)Gemini:多模态、速度、性价比、超长上下文强(3.1 Pro Preview仍很能打)。 3)GPT:通用agent、工具调用、实时应用和生态集成突出,新版在上下文和特定专业任务上提升明显。算力囤积最积极 4)grok:有X这个实时内容平台提供源源不断的训练数据,但近期受制于团队动荡。看跟cursor的合作、以及囤积的大量算力,后面会不会进一步跟上。 当然还有meta最新的Muse Spark,AI团队的最新之作。 更不用说国内豆包、千问、混元、kimi也是各有特色,杀疯了。 这就是当下大模型领域的现状:快速迭代、轮流坐庄。暂时还没有一家能长期领先甚至垄断。当然竞争对用户是好事——模型越来越强、价格/速度也优化。 2月中在《资本开支的战争》推文里有聊过:”往下游看,越往用户端竞争越激烈,当然也是未来AI决胜的关键所在。 可以说大模型、在面向B端或者C端的Agent或者应用才是AI的王冠,但这一层面短期其实很难看出谁会成为最后真正的赢家,再很多时候都是交替领先”。现在看确实如此 GPT-5.5出来后估计又要新一轮刷榜了,下一个出来交替领先的会是谁?




























