
2月18日,月之暗面推出最新模型Kimi Latest,开放平台同步上线,以下是具体介绍:
技术特点
- 动态上下文窗口技术:Kimi Latest 采用动态上下文窗口技术,可根据实际需求智能匹配 8k/32k/128k 计费方案,最高支持 128k 的上下文长度,能够处理更复杂的对话和信息,为用户提供了灵活的使用选择和费用透明度;
- 自动上下文缓存功能:该模型支持自动上下文缓存,缓存命中时 Token 成本仅为常规费用的千分之一,还可减少 15%-30% 的重复计算开销,在多轮对话场景中响应延迟有望降低 40% 以上;
- 新增图片理解能力:相较于 moonshot – v1 系列,Kimi Latest 新增了图片理解能力,支持图像输入,进一步拓宽了其应用领域;
- 延续核心功能:核心功能仍延续 ToolCalls、JSON Mode 等专业工具链支持,还具备联网搜索功能,为用户创造更加丰富的互动场景。
适用场景及建议
- 聊天应用开发:聊天应用开发者首选 Kimi Latest,可复现与 Kimi 智能助手高度一致的交互体验,在情感响应方面表现出色,使人机交互变得更加自然流畅;
- 结构化数据处理:针对结构化数据处理场景,月之暗面仍建议使用 moonshot – v1 系列。
平台与使用限制
- 开放平台情况:Kimi 开放平台公测 20 天已吸引超 3 万开发者注册,本次 Kimi Latest 模型推出后,平台形成 “快速迭代” 与 “稳定输出” 双轨并行的产品矩阵;
- 调用限制:目前 Kimi Latest 仅支持调用 Kimi 普通版模型,Kimi k1.5 长思考模型暂不支持 API 调用,企业级用户若有需求需提交详细测试方案,经技术团队评估后定向发放访问权限。
市场影响
- 开发者生态:Kimi Latest 优先开放普通版 API 有利于快速构建开发者生态,但暂缓 k1.5 开放可能影响需要深度推理场景的 B 端客户采用,需警惕竞争对手在长思考模型领域的抢先布局;
- 行业变革:动态上下文处理方案可能引发行业技术路径变革,倒逼竞争对手加速长文本处理优化。其动态计费模型使单次调用成本降低约 37%-93%,对需要处理长文本但预算有限的中小企业利好。