2025年3月25日,谷歌推出新一代多模态大模型 Gemini 2.5 Pro,以100万token上下文窗口和深度推理架构刷新多项基准测试纪录。核心亮点包括:
- 超强推理能力:在GPQA科学测试(84.0%)和AIME数学竞赛(86.7%)中碾压竞品,无需工具即通过人类知识极限测试(18.8%准确率)。
- 代码与多模态:SWE-Bench编码得分63.8%,可生成可执行游戏代码;原生支持图文/音视频输入,未来扩展至200万token上下文。
- 思维链架构:通过多步骤逻辑推演实现“思考式应答”,在LMArena排行榜以1443分登顶,响应速度保持毫秒级。
该模型已在Google AI Studio和Vertex AI开放接入,其发布直接激化与OpenAI的多模态竞争——双方同日亮出“推理+生成”组合拳,全球AI竞赛正式进入技术深水区。