2026 年 1 月 27 日,国内人工智能初创公司月之暗面 Kimi 正式发布了新一代开源模型——Kimi K2.5。作为 Kimi 系列的最新版本,K2.5 在多个方面实现了重要突破,特别是在视觉与文本融合、Agent 集群能力以及办公场景表现上。
核心特性
1. 原生多模态架构
Kimi K2.5 基于原生多模态架构设计,这意味着:
- 视觉和文本能力在架构层面就是统一的
- 支持视觉与文本的联合训练
- 能够处理图像、视频等多种输入形式
- 在视觉理解和文本推理之间实现了更好的协同
2. 强大的编程能力
Kimi K2.5 在编程方面展现出了强大的能力:
- 能够根据网页草图或涂鸦生成可运行的代码
- 支持包含 HTML、CSS 和 JavaScript 的完整前端开发
- 可以从视频解析网站的交互效果
- 具备将视觉内容转换为代码的能力
这些能力让开发者能够通过自然语言和视觉输入来快速生成应用界面,大幅提高了开发效率。
3. Agent 集群功能
Kimi K2.5 首次引入了"智能体集群"(Agent Swarm)功能:
- 能够调度多达 100 个子智能体并行工作
- 处理步骤可达 1500 个
- 通过并行化显著减少执行时间
与单一智能体设置相比,Agent Swarm 可以将执行时间减少最多 4.5 倍。这是智能体技术的一个重大突破,让复杂任务的执行效率得到了显著提升。
4. Office 办公能力
Kimi K2.5 在办公场景中表现出色:
- 支持处理 Word、Excel、PPT、PDF 等办公文档
- 能够执行复杂的文档操作,如添加注释、创建数据透视表
- 支持生成公式和图表
- 可以处理长文档,生成万字论文或百页报告
这些能力使其非常适合学术研究、文档分析、报告生成等需要处理大量文本和数据的场景。
技术创新
1. 视觉与文本的联合训练
Kimi K2.5 在大规模视觉和文本混合数据上进行了约 15T tokens 的持续预训练。在大规模数据下,视觉与文本能力在统一的架构中协同提升,相互促进。这种训练方式让模型在理解图像和生成文本时更加准确和自然。
2. Parallel-Agent Reinforcement Learning (PARL)
Agent Swarm 的实现基于 Parallel-Agent Reinforcement Learning(PARL):
- 使用可训练的编排器智能体来分解任务
- 每个子任务由动态实例化的冻结子智能体执行
- 并行运行这些子任务可以显著减少端到端延迟
训练可靠的并行编排器是挑战性的,因为独立运行的子智能体提供延迟、稀疏且非平稳的反馈。为解决这个问题,PARL 采用了分阶段奖励塑造技术,在训练早期鼓励并行化,随着训练进行逐渐转向任务成功。
3. Critical Steps 指标
为了评估并行策略,团队引入了"Critical Steps"指标——一个受并行计算中关键路径启发的延迟导向指标。该指标不计算总步骤数,而是评估关键路径开销,同时反映每个阶段最慢的子智能体。只有当子任务缩短关键路径时,才能提高性能。
性能表现
1. 编程基准
在 Kimi Code Bench 内部评估中,Kimi K2.5 在不同任务类型上都表现出一致的改进:
- 构建任务:提升明显
- 调试任务:改进显著
- 重构任务:表现稳定
- 测试任务:改进明显
- 脚本任务:提升显著
2. 文本与推理
- HLE(人类最后考试):在文本和图像任务上表现优秀
- AIME 2025(数学):表现强劲
- GPQA-Diamond 和 IMO-AnswerBench:在无工具和有工具情况下都表现出色
K2.5 在 HLE 和 AIME 上的成绩表明其在逻辑推理和数学计算方面具有强大的能力。
3. 办公生产力
Kimi 团队设计了两个内部专家生产力基准:
- AI Office Bench:评估端到端 Office 输出质量
- General Agent Bench:测量复杂多步骤工作流程
在这两个基准上,Kimi K2.5 相比 K2 Thinking 分别表现出 59.3% 和 24.3% 的改进,反映了其在真实任务上的端到端性能增强。
4. Agent Swarm 性能
Agent Swarm 在复杂任务上表现出色:
- 在内部评估中,将端到端运行时间减少 80%
- 最小化实现目标性能所需的关键步骤,相比单一智能体执行减少 3×–4.5×
- 随着性能目标提高,时间缩减可扩展到 4.5×
应用场景
1. 编程辅助
- 前端开发:从对话生成完整的用户界面
- 视觉调试:通过图像和视频输入进行代码生成和调试
- 自动化重构:自动优化现有代码结构
- 多语言支持:支持多种编程语言和框架
2. 网页生成
- 视频转网站:从视频解析网站并重建
- 截图转代码:从网站截图还原前端代码
- 交互效果重现:自动识别和实现动画效果
- 响应式设计:生成适应不同设备的代码
3. 智能办公
- 文档处理:Word 文档编辑和格式化
- 数据分析:Excel 数据透视表和分析
- 演示文稿:PPT 自动生成和美化
- 公式生成:PDF 中 LaTeX 公式自动编写
4. Agent 应用
- 市场调研:多步骤信息收集和分析
- 文档翻译:大文档翻译和本地化
- 论文综述:文献调研和综述生成
- 报告生成:自动生成各类分析报告
与其他模型对比
vs 前代 Kimi 模型
- 多模态能力:原生多模态架构,视觉和文本能力更强
- 编程能力:显著提升,支持视觉输入编程
- Agent 能力:首次引入 Agent Swarm,执行效率大幅提升
- 办公能力:支持更多办公应用和复杂操作
vs 其他国产大模型
- 编程能力:在编程基准上表现出色,特别是在前端开发方面
- Agent 能力:Agent Swarm 技术领先,并行化执行效率高
- 视觉能力:在大规模视觉-文本联合训练下表现突出
- 多模态:原生多模态架构,支持多种输入形式
vs 国际顶尖模型
虽然在某些基准测试上可能仍与 GPT-4、Claude 等存在一定差距,但在:
- 中文优化:对中文有更好的支持和优化
- 视觉编程:在视觉转代码方面有独特优势
- Agent Swarm:智能体集群技术领先,并行化效率高
- 成本效益:提供更具性价比的解决方案
- 数据安全:数据存储和处理在国内,符合合规要求
使用方式
1. 在线访问
- 直接访问 Kimi 官网使用
- 通过 Kimi App 使用四种模式
- 通过 Kimi Code 在终端中编程
2. API 调用
- 注册 Moonshot AI 平台账号
- 获取 API 密钥
- 按照官方文档进行集成
- 调用模型进行内容生成和分析
3. 本地部署
- 从 Hugging Face 下载模型权重
- 使用支持 Kimi K2.5 的推理框架
- 在本地服务器或工作站上部署
- 根据需求进行微调和定制
月之暗面的发展战略
1. 技术迭代
月之暗面在 2025 年进行了密集的技术迭代:
- 2025 年 7 月:开源中国首个万亿参数基座模型 Kimi K2
- 2025 年 11 月:发布专注于复杂逻辑推理的 Kimi K2 Thinking 模型
- 2026 年 1 月:发布集视觉、代码、多模态输入于一体的 Kimi K2.5
2. 产品生态
围绕 Kimi K2.5,公司构建了完整的产品生态:
- Kimi:通用大模型平台
- Kimi App:移动端应用
- Kimi Code:编程辅助工具
- Kimi Agent:智能体服务
3. 商业模式转变
- 从 C 端消费转向海外开发者生态
- 聚焦于学术、办公等垂直场景
- 提供多样化的 API 服务和产品
- 注重产品"造血"能力和商业可持续性
月之暗面的发展历程
融资历程
- 2025 年 12 月 31 日:完成 5 亿美元 C 轮融资,估值 43 亿美元
- 至 2026 年 1 月:估值被推至 48 亿美元
- 公司自成立以来累计融资金额已超过 20 亿美元
- 公司明确表示"不急于上市",计划将资金用于"更加激进地扩增显卡",以加速下一代 K3 模型的训练和研发
用户增长
- 2025 年:Kimi App 的月活跃用户数从第一季度的 2165.3 万回落至年末的 902.7 万
- 2025 年 9 月至 11 月:海内外付费用户数平均月环比增长超过 170%,同期海外 API 收入增长达 4 倍
- 2025 年 12 月:Kimi 的 Web 端用户平均访问时长将近 9 分钟,在国内 AI 大模型产品中排名第一
战略转型
- 2025 年:面对 DeepSeek 冲击,月之暗面停止了高消耗的"烧钱买量"营销策略
- 转而进行底层技术"造血",聚焦于基座模型与 Agent 产品的研发
- 公司将产品重心从通用的 C 端聊天助手转向海外开发者生态以及学术、办公等垂直场景
总结
Kimi K2.5 作为月之暗面 2025 年密集技术迭代的最新成果,体现了公司在视觉-文本联合训练、智能体集群、编程辅助和办公生产力等多个维度的技术突破。
特别是在 Agent Swarm 技术上的创新,让智能体从顺序执行转向并行协同,大幅提高了复杂任务的执行效率。这种技术不仅对当前的 AI 应用有重要意义,也为未来大规模智能体系统的构建提供了新的思路。
虽然在与国际顶尖模型的绝对性能上可能仍有差距,但在中文支持、本地化服务、数据安全和成本效益等方面,Kimi K2.5 为国内开发者和企业用户提供了一个强有力的选择。
未来,随着大模型技术的持续发展和竞争加剧,我们可以期待月之暗面在智能体、多模态、Agent Swarm 等方向上有更多突破,为用户提供更强大、更便捷、更经济的 AI 服务。