上周,OpenRouter平台突然出现两个匿名模型——Hunter Alpha与Healer Alpha。
没有标识、没有团队介绍、也没有官方声明,却一举冲上API调用日榜首位,引发全球开发者热议。就连OpenClaw的创始人也在社交平台X上公开询问:“这到底是谁家的产品?”
所有猜测都指向同一个名字:DeepSeek V4。
然而今天凌晨,小米突然官方发声认领:
这两个匿名模型的真实身份,是小米 MiMo-V2 系列的早期测试版本。
一时间全网哗然,集体被打脸。
为什么一家手机厂商的模型,会被全球开发者一致误认为是DeepSeek的下一代重磅产品?
01 DeepSeek V4的“替身”小米此次推出的模型,确实带有浓郁的DeepSeek风格。
参数配置高度相似
小米匿名模型披露的参数规格:万亿级参数量、百万token上下文长度、专为Agent任务优化,与市场上流传的DeepSeek V4传闻几乎完全吻合。
能力表现如出一辙
Hunter Alpha在代码生成、超长文本理解、多步骤Agent任务中的表现,令人立刻联想到DeepSeek从V2到V3一脉相承的“效率优先”基因。
核心人才深度联动
小米MiMo大模型的负责人罗福莉,正是DeepSeek的前核心成员。
罗福莉被业界誉为“AI天才少女”,拥有北京大学计算语言学硕士学位,曾在阿里达摩院主导多语言模型研发,随后加入DeepSeek并成为DeepSeek-V2关键架构的核心设计者。2025年底,她被雷军以千万年薪招至麾下,并于同年11月正式官宣加入小米。
如今,市场辨识一家模型公司的依据已不再是品牌标识,而是参数结构、能力特点、训练路径以及核心人才的流动轨迹。
罗福莉的加盟,使DeepSeek的技术基因被小米直接移植;而匿名测试的策略,也被小米运用得游刃有余。
中国AI实验室的技术路线,已经趋同到难以分辨彼此。

随着小米正式官宣认领,市场关注点迅速聚焦于“模型的实际应用场景”。
答案非常明确:MiMo-V2系列并非通用聊天机器人,而是专门为智能体(Agent)应用场景构建的基础平台。
丨MiMo-V2-Pro(对应Hunter Alpha)是旗舰级基础模型。
总参数量超过1万亿,激活参数量为420亿,支持100万token的上下文长度。其优化重点在于长程规划与多步骤推理能力。在OpenClaw框架下,该模型能够自主完成复杂的多步任务。
社区实际测试表明,其在编程辅助和工具调用方面的表现已接近Claude Opus 4.6的水平。
丨MiMo-V2-Omni(对应Healer Alpha)是全模态版本。
支持262K上下文长度,原生兼容文本、图像、语音、视频的输入与输出。该模型具备看图理解、听录音、解析视频内容并直接执行操作的能力。
例如:截取一张商品图片,它可以自动打开电商平台进行比价并完成下单;输入一段会议录音及白板照片,它能自动生成结构化笔记并在协作文档工具中填充相应表格。
丨MiMo-V2-TTS 是配套的高质量语音合成模型。
基于超过1亿小时语音数据训练而成,支持多种方言、多角色音色及多情感语气的灵活切换。
三款模型相互配合,构建了从用户意图理解到任务执行的端到端闭环。
MiMo-V2系列发布后,雷军迅速在社交媒体上为其背书:
MiMo-V2-Pro在全球大模型综合能力排行榜Artificial Analysis中位列全球第八。若按品牌排名,则位居全球第五,超越了xAI的Grok模型。

每当新模型发布,行业总会陷入思考:这究竟是基准测试的胜利,还是真实场景能力的体现?
当前,权威基准测试一致表明,MiMo-V2系列在逻辑推理与代码能力方面已跻身全球顶尖阵营。
在AIME 2025数学基准测试中,MiMo-V2 Flash取得94.1%的高分,展现出接近人类顶尖竞赛选手的解题水平。
SWE-Bench测试结果进一步显示,MiMo-V2-Pro在编程任务上不仅显著领先国内同类产品,多项指标更与国际顶级模型旗鼓相当。

然而质疑声随之而来:传统静态测试能否真实反映智能水平?MiMo-V2在人类实际任务中的表现究竟如何?
在强调实战能力的PinchBench与Claw-Eval榜单上,小米这一系列模型展现了卓越的执行力。
PinchBench榜单中,MiMo-V2-Pro任务完成率高达85%,稳居全球前三,仅次于当前顶尖阵营(Claude 4.6系列与GPT-5.4)。
Claw-Eval评估中,MiMo-V2指令服从度达到97%,彰显出对复杂工具链的深度理解能力。
更值得注意的是,MiMo-V2正获得开发者群体的实际认可,调用量表现惊人。
OpenRouter平台数据显示,MiMo-V2-Pro(Hunter)上线后连续多日蝉联日榜榜首,大量调用源自开发者真实的智能体工作流。

来源:OpenRouter LLM Leaderboard(2026.3.10-2026.3.16)
社区实测反馈普遍积极,许多开发者认为该模型组合将实际可用性提升至新高度。
但亦有开发者提出质疑,认为MiMo-V2存在“针对特定框架/评测目标进行强优化”的嫌疑。
小米官方与OpenClaw生态多次强调对OpenClaw工具调用与多步任务的优化,然而训练细节(如数据配方、算力投入、强化学习过程)未完全公开,难以从根本上排除“对OpenClaw等少数智能体基准存在过拟合”的可能性。
此外,部分开发者测试后发现,MiMo-V2-Pro与MiMo-V2-Omni在安全对齐策略上差异显著:前者审查严格,后者更为开放。这种差异对企业合规、跨境产品一致性及安全体验提出了新的挑战。
04 小米的AI雄心无论外界对这组模型的表现存在多少争议,小米的此次出击,已足以让整个大模型领域重新审视它的实力。
2026年,中国大模型市场已步入落地攻坚期,真正的竞争在于谁能将模型深度融入用户的日常场景。
正是在这一关键节点,小米将MiMo-V2系列直接推向舞台中央。
过去三年,小米AI给外界的印象始终停留在应用层面:超级小爱语音助手、澎湃OS的智能插件、手机终端的局部优化。它更像是一家终端厂商的辅助功能提供者,而非独立的基础模型参与者。
然而,随着MiMo-V2-Flash开源后跃居全球智能体榜单第二,再到此次两款模型的匿名评测,小米已不再是追随者,而是开始构建自身的技术体系。
这也表明,小米的目标不仅是证明自身具备研发大模型的能力,更要进一步验证这套能力能够成为整个生态的新基石。
因此,小米真正的AI战略,是打造“人-车-家”生态中的统一智能层。
通过将MiMo系列深度整合进小米自有的垂直链条——芯片(澎湃芯片)、操作系统(澎湃OS)、大模型、终端设备(手机、汽车、智能家居),使AI不再只是应用内的对话窗口,而是系统级的原生能力。
例如,用户在手机上说出“帮我把今天会议纪要整理好”,MiMo-V2能直接理解意图,自动调用WPS生成文档,同时将关键事项推送至车机导航和家居日程。
当汽车检测到驾驶员疲劳时,MiMo-V2结合手机传感器与车内摄像头,自动调节空调、播放指定音乐,甚至提前通知智能家居开始煮咖啡。
这种闭环执行能力,依托的是小米独有的生态优势:超过7亿月活跃用户、超过10亿台物联网设备,以及澎湃OS对硬件的全面权限控制。
其他纯模型厂商往往只能提供云端API调用服务,而小米却能直接将用户意图转化为物理世界的实际行动。
罗福莉曾在内部多次强调:小米不追求孤立的超级模型,而是要让AI“走出对话框,接管真实生活”。
这正是小米与DeepSeek、智谱、月之暗面等纯模型厂商的根本差异。前者依赖生态落地,后者依赖参数规模与API定价。
换言之,小米正在经历一场根本性转型:从一家销售硬件的科技公司,转变为以AI重新定义用户生活方式的生态服务商。
MiMo-V2系列,仅仅是这一战略的第一张牌。
05 竞争格局将如何重塑?小米此次发力,直接将国内大模型竞争推向全新阶段。
首当其冲受到冲击的是价格体系。
MiMo-V2系列API定价仅为Claude Opus 4.6的五分之一:在256K上下文长度内,输入每百万token收费1美元,输出每百万token收费3美元;即便扩展至1M上下文,费用也仅翻倍。
这一价格策略,将此前动辄数十美元的智能体调用门槛大幅拉低。
有开发者反馈,许多团队在体验MiMo Claw免费版本后,已开始将部分生产任务迁移至该平台,“成本骤降”成为最普遍的评价。
在国内市场,小米的突然入局使竞争格局出现显著分化。
此前凭借参数规模或应用场景占据优势的阿里通义、字节豆包等大模型,如今必须直面一个同时具备顶尖智能体能力与10亿物联网设备生态的竞争对手。
小米补足了中国大模型最缺乏的落地闭环能力,将竞争焦点从“参数规模比拼”彻底转向“真实场景验证”。
对DeepSeek而言,压力同样直接:其技术路线被延续继承,而智能体执行场景又被小米凭借硬件生态提前占据。
从全球视野看,小米正成为能与Apple Intelligence形成对标态势的硬件级人工智能生态。
苹果目前仍以封闭的端侧小模型为主,强调隐私保护与本地计算;
小米则通过开放的低价API与全链路权限控制,实现从云端意图理解到物理设备执行的无缝衔接。凭借7亿月活跃用户和澎湃OS的系统级控制权,小米有望在人工智能普惠化进程中获得先发优势。
06 结语匿名模型的发布并非一次简单测试,而是小米技术自信的集中展现。
这意味着小米已不满足于仅作为人工智能能力的承接方,而是试图深入模型、系统与生态协同的更深层次。
这套体系最终能否成功确立,仍需时间检验。
但可以确定的是,小米已不再仅是这场竞赛的旁观者,而是正式步入牌局中心。
随时随地看视频