一、调价策略:高低分档与动态博弈
- 基础定价结构
输入费用分两档:
• ≤20万tokens:1.24美元/百万tokens(约9元人民币)
• >20万tokens:2.50美元/百万tokens(约18元人民币)
输出费用同步调整:短文本场景10美元/百万tokens,长文本场景15美元/百万tokens。 - 与竞品对比定位
虽降价但仍高于多数对手:
• 对比OpenAI o3-mini(输入1.10美元)、DeepSeek R1(输入0.55美元),溢价率分别达12.7%和125%
• 但显著低于OpenAI旗舰产品o1-pro(输入150美元,输出600美元),形成“次旗舰”市场卡位。 - 免费试用策略
在严格速率限制下开放免费使用,支持开发者测试复杂推理任务(如医学影像分析、长代码生成),企业用户需付费解锁更高调用限额。
二、调价动因:技术与商业双重驱动
- 技术成本压力
Gemini 2.5 Pro的多模态架构(支持文本、图像、视频)需消耗超4000块TPU v5芯片训练,研发成本较前代增加43%,迫使通过价格分摊算力投入。 - 市场竞争倒逼
• 防御性降价:应对DeepSeek等开源模型在中小企业市场的渗透(R1成本仅为Gemini的1/4)
• 差异化保价:强调数学推理(MATH基准提升19%)、代码生成(HumanEval得分89.2%)等性能优势,维持高端定价权。 - 需求端变化
企业客户对长文本处理需求激增(如法律合同解析、财报分析),促使谷歌对超20万tokens场景加收66%溢价。
谷歌此次调价既是对市场的一次压力测试,也为AI模型从“通用能力竞争”转向“垂直场景价值量化”提供了商业样本。正如CEO皮查伊所言:“当AI开始直接参与利润创造时,它的定价应该反映这种生产力溢价。”