🧠 模型即 Agent 的背景
- 在当前 AI 发展中,Agent(智能体)常被定义为「LLM + 规划 + 记忆 + 工具使用」的组合,承载着完成复杂任务的能力。
- OpenAI、Anthropic、Google Gemini 等持续布局此类 Agent 型产品,目标是让 AI 更像真正的助手,能自主规划、执行、反馈。
🚀 Kimi 家族进阶:From 大上下文 到 Agent
- 早在 2023 年,Moonshot AI 将旗下 Kimi 智能助手的上下文窗口从 20 万字提升至 200 万字,具备读取超长文本并深入分析的能力。
- 随后推出的 Kimi+(探索版),进一步支持自主检索与链式思考(CoT),可在深度推理中一次性浏览 500 个页面,远胜普通搜索。
✨ Kimi‑Researcher 深度研究 Agent 内测开启
- 发布日期:2025 年 6 月 20 日晚上,月之暗面正式启动 Kimi‑Researcher(深度研究) 的小范围灰度测试。
- 核心技术:端到端自主强化学习(agentic RL)训练,模型具备计划执行、自主检索、筛选与自我优化等能力。
- 性能指标:•在 HLE 测试中超越 Claude 4 Opus、Gemini 2.5 Pro 和 OpenAI Deep Research,与 Gemini‑Pro 的 Agent 方案并驾齐驱。•在一次研究任务中,平均执行 23 步推理,规划 74 个关键词,检索 206 个网页,最终保留质量排名前 3.2% 的内容,生成可追溯、万字级的深度报告。
- 未来计划:后续将逐步开源预训练模型与强化学习模型,助力科研社区推进 Agent 强化学习发展。
✅ 总结对比
特性 | Kimi-Researcher |
---|---|
上下文窗口 | 支持超长阅读(200 万字) |
推理能力 | 23 步链式推理 |
自主决策 | 规划检索策略、过滤网页 |
成果 | 生成带引用的深度研究报告 |
性能对标 | 超越多家顶尖 Agent 型模型 |
总的来看,Kimi‑Researcher 是 从“工具增强型 AI”向“自主研究型 Agent”迈出的关键一步,借助端到端强化学习和自我规划能力,它在多步检索与深度分析方面展现出强竞争力,目标直指专业领域的深度研判能力。
内测申请地址
https://moonshot.feishu.cn/share/base/form/shrcnun1ElaoXzEZgcJCKppSNse
发表回复