今日凌晨,月之暗面正式发布了备受期待的Kimi K2.6。
这款新模型主打Agent能力,在多项测评中对标GPT-5.4、Claude Opus 4.6等顶 级模型。
市场期待很高,全村希望的叙事再次升温。
但把目光转向更能反映开发者真实调用偏好的OpenRouter榜单时,一个尴尬的现实浮现出来:
Kimi,根本不在Top10。
过去一个月,OpenRouter上调用量最高的模型是小米MiMo-V2-Pro。
而Kimi K2.5,月之暗面的前代旗舰模型,调用量与小米完全不在一个量级,彻底缺席。
更具戏剧性的是,小米这款模型并非靠“便宜大碗”取胜。
它在中国上榜模型中定价并不低,OpenRouter标价为:输入$1/百万Token、输出$3/百万Token。
而刚刚发布的Kimi K2.6,OpenRouter定价只略低一点:输入$0.6/百万Token、输出$2.8/百万Token,几乎是贴着小米的价格肉搏。
一家中国最受期待的明星创业公司,新模型发布后最 先要面对的竞争对手,不是OpenAI,不是Anthropic,而是小米?
01
小米凭什么贵却霸榜?
打开中文开发者社区,关于小米MiMo-V2-Pro的吐槽随处可见。
"这价格是中国模型里最贵的吧?”"小米是不是飘了?”“性价比不如预期”,类似的质疑从未停止。
但数据不会说谎。开发者嘴上说贵,身体却很诚实。
在OpenRouter榜单上,MiMo-V2-Pro的月度调用量达9.43万亿Tokens,稳居全球第 一。
为什么明明不算便宜的MiMo-V2-Pro,却在调用量上碾压一众低价中国模型?
答案在于实用。
OpenRouter对MiMo-V2-Pro的官方描述是:
这是小米的旗舰基础模型,为agentic场景深度优化,特别适配OpenClaw等主流Agent框架。
这意味着,它在开发者真正关心的Agent工作流里,更容易交付完整结果。
如果单看模型价格,在中国模型里,小米的确是贵的。
但在当前Agent时代,模型的胜负早已不只是单点能力和价格,而是端到端任务的成功率和总拥有成本。
开发者口中的贵,往往是和DeepSeek、MiniMax这类便宜大碗的中国模型比。
但开发者钱包里的值,却是和Claude这样的顶 级模型比。
如果把参照系换成海外顶 级模型,MiMo-V2-Pro的价格估算下来,只有Claude Sonnet的1/3,Claude Opus的1/5。
所以,在真正需要强Agent能力的场景里,开发者投出了最真实的一票:
只要任务成功率更高、整体成本更低,开发者就会继续把钱投向MiMo-V2-Pro。
当然,也有人提出另一种解释:
MiMo-V2-Pro可能在最近的龙虾热潮中,做了深度适配和优化。
这让它在当前OpenClaw等主流Agent框架下表现突出,而Kimi 2.5等前代模型则暂时没有那么好的适配性。
但无论原因如何,结果已经摆在眼前。
开发者用实际调用量证明,在Agent这个新战场上,够用、好用、性价比合适,比任何品牌光环都更重要。
02
Kimi的高光与隐身
Kimi从来不是一个默默无闻的选手。
作为月之暗面这家中国顶 级创业系大模型公司的旗舰产品,Kimi自诞生以来就承载着极高的市场期待。
Kimi理应是那个最有希望与国际顶 级模型正面硬刚的本土力量之一。
它也确实赢过。
公开报道显示,2026年2月,Kimi K2.5曾在OpenRouter榜单上强势爆发,一度冲进全球前列,甚至登上过全球第二的位置。
那一刻,开发者用真金白银的调用量,把Kimi推到了聚光灯最亮的地方。
然而,高光之后是更刺眼的隐身。
Kimi K2.5的峰值并没有转化成长期统治力。进入3月后,它迅速从榜单头部滑落。
在过去一个月的榜单里,Kimi K2.5已彻底缺席头部位置,调用量与小米MiMo-V2-Pro完全不在一个量级。
曾经的全球第二,如今连模型前排都难以看见。
这意味着,月之暗面前一个阶段的产品形态,虽然能在短期内靠单点能力冲高,但没有在开发者最关心的Agent工作流里,形成真正的黏性和统治力。
回看K2.5,发布于2026年初,当时的核心卖点是长上下文、推理能力、通用性能。
但2026年3月后,开发者市场的核心需求已经从通用大模型转向Agent原生能力。
OpenClaw框架的爆发、多Agent协作工作流的普及,让能跑Agent成为大模型的硬门槛。
而K2.5更像一个通用能力的优等生,在Agent这个特定考场里,卷面分数高,但实战扣分多。
同时,在OpenClaw等框架适配、工具链集成、社区模板丰富度上,K2.5显然也慢了一步。
开发者市场是残酷的。
他们不会因为曾经好用继续选择K2.5,他们只关心这个模型现在好不好用。
高光与隐身的落差,把月之暗面推到了一个必须背水一战的十字路口。
03
Kimi K2.6的反击
如今Kimi K2.6带着更强的Agent能力入场,这场开发者的投票游戏,才刚刚进入最激烈的阶段。
据官方信息,Kimi K2.6不是一次常规迭代,它的定位集中在long-horizon coding、Agent集群、多Agent编排,三个关键词全部指向Agent能力。
技术细节同样激进:
300个子Agent并行协同,4000个协作步骤的长程任务,5天持续自主运行的稳定性,代码能力号称行业领 先。
这不是在K2.5基础上做加法,而是Agent化重写。
月之暗面显然意识到了K2.5的问题,通用能力再强,在Agent时代也打不赢专用选手。
但比技术参数更耐人寻味的,是定价策略。
K2.6没有走其他中国大模型价格“打骨折”的路线,而是选择了一个极其微妙的定价:
比小米便宜一点,但不多。
这不是降维打击,而是一场贴身肉搏。
对一家明星创业公司来说,这既是务实的选择,也是某种程度的讽刺。
K2.6发布前,市场期待的对手是GPT-5.4、Claude Opus 4.6这样的顶 级模型。
但发布后,它最 先要争夺的,却是开发者当前已经在用、而且用得很顺手的小米MiMo-V2-Pro。
K2.6的真正目标,不是赢一场技术测评,不是刷一个SOTA分数,而是把月之暗面从高期待重新拉回高调用公司。
04
市场不相信"应该"
在中国AI的舆论场上,"应该"是一种强大的叙事力量。
Kimi"应该"是中国最牛的模型之一,因为月之暗面拥有亮眼的品牌光环、超高的市场期待、吸睛的技术叙事。
而小米"不应该"是AI领域的赢家,因为它过去从未被视为中国最前沿的大模型玩家,公众观感并不占优。
但OpenRouter的榜单是一个"应该"的粉碎机。
它只记录开发者实际发起了多少次API请求、消耗了多少Token。
在这个指标面前,所有的品牌光环、所有的期待诅咒,都被还原为一个简单的问题:谁现在最 好用?
Kimi K2.6当然可以讲开源、更强、更像顶 级模型的故事。
但真正决定它命运的,不是这些词,而是开发者愿不愿意把下一次Agent任务交给它。
真正的较量才刚开始。
【本文由投资界合作伙伴微信公众号:世界模型工场授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。




