智元机器人想当「具身智能的安卓」

中国现在有两类机器人公司。

一类在拼硬件参数，谁的关节更多、谁的身高更高；另一类在拼「谁能先让机器人进厂干活」。

智元显然是第二种。

4月17日的APC 2026大会上，创始人邓泰华说了一句关键的话：「2026年是部署态元年。」

翻译一下：行业到了从「能跳舞」到「能干活」的转折点。

六个模型，三种智能

智元这次发布了六大AI模型，覆盖运动、交互、作业三个方向：

运动智能是基础。BFM行为基座模型用超1亿帧人类动作数据训练，学的不是某一个具体动作，而是动作的分布。给它一个没见过的动作指令，可以Zero-shot直接执行。

GCFM生成式运控模型更进一步，连输入动作这一步都省了。给机器人一句话描述意图，它自己决定该做什么动作。

有意思的是GO-2模型引入了「动作思维链」——类似大模型的Chain-of-Thought，但发生在动作空间里。机器人执行任务前，会先在脑子里预演一遍。

这让机器人从「执行预设动作」变成了「会思考的动作」。

交互智能解决的是「能不能对话」的问题。传统机器人的交互是割裂的，语音先转文字，文字推理完再转语音，每一步都在丢信息。WITA Omni 1.0把这个链路打通了，实现端到端的多模态交互。

作业智能是「部署态」最硬的一块骨头。机器人在真实场景里完成任务，不是表演。

彭志辉提过一个数据：「今天，全世界的高质量具身数据可能只有50万小时。」

这个数字比大语言模型的数据饥渴更严重——因为机器人要在真实物理世界里摸爬滚打才能采集数据。

智元的解法是SOP在线强化学习系统。部署在现场的机器人持续回传经验，云端集群并行训练，策略实时下发。3小时在线训练就能将任务成功率提升33%。

机器人越用越聪明，这才是飞轮真正转起来的样子。

真正的重头戏：AIMA生态平台

如果说模型是技术秀，那AIMA平台才是商业逻辑的核心。

AIMA的架构是「1+3+X」：

灵渠OS：开源操作系统，被称为「具身智能的安卓」
灵创平台：零门槛做机器人动作，用户上传一段视频，平台自动完成关键点检测、训练和部署
灵心平台：定制机器人性格
Genie Studio：一站式开发

邓泰华宣布了「元苼」生态计划：五年投入20亿，目标助力数千家合作伙伴。

这套路眼熟吗？

像不像Google推Android——做平台，让别人来建生态。

智元的定位说得很清楚：「因为AI需要有身体，所以我们做了配套的本体，以AI来定义本体。」

换句话说，智元不想只卖机器人。它想成为具身智能的基础设施。

数据之外的两个细节

大会公布了一些数字：2023年营收30万，2025年破10亿；2026年3月28日，第10000台机器人下线；Omdia报告说2025年出货量全球份额39%，双料第一。

从30万到10亿，三年完成。这个增速确实惊人。

但我更关注两个细节。

第一个是关节系列化。

智元把五大系列、近10款产品全部规整到8款系列化关节设计上。「这8款关节用在我们所有产品上，能够满足所有部位的关节需求。」

这是制造业的逻辑，不是科研的逻辑。标准化才能规模化，规模化才能降成本。

第二个是「沿途下蛋」的策略。

彭志辉将任务维度划分为「场景复杂度」和「任务复杂度」，认为当前的最佳切入点是「在简单场景做复杂任务」。

比如在结构化的工厂环境里，执行高自由度、高维感知的复杂操作。

这个判断很务实。机器人不需要一上来就进你家帮你叠衣服，先把工厂里的活干好。

我的判断

具身智能现在有两个路线之争。

路线一：特斯拉路线——垂直整合，软硬件一起做。Optimus Gen 3在美国量产遇阻，现在把希望押在上海。4月17日，首批50台机器人正式交付进特斯拉上海工厂总装产线，单台售价4.9万美元。

路线二：智元路线——做平台，让别人来集成。开源操作系统，开放数据集，拉合作伙伴一起建生态。

两条路线的本质分歧是：机器人行业最终会走向标准化，还是每家都有一套自己的封闭系统？

智元选择了「开源生态」这张牌。

这把牌能不能赢，现在还不好说。但至少在中国市场，智元已经把自己摆到了「具身智能基础设施」的位置。

彭志辉说：「整个具身智能行业目前还在共同探索，没有任何一家企业能独自给出正确答案。」

我认同这句话。但探索也需要方向。智元的方向是：硬件是身体，模型是灵魂，生态是壁垒。

最后，数据才是核心。

谁先规模化部署，谁就占据数据优势；谁占据数据优势，谁就训练出更好的模型；谁训练出更好的模型，谁就能继续规模化部署。

飞轮一旦转起来，就停不下来。

问题是，谁能先把飞轮转起来？

智元发布的七大生产力解决方案覆盖工业制造、商业服务、特种作业三大方向。这个布局说明它不想只做一个机器人公司，而是想成为机器人时代的「卖水人」。

能不能成，看2026年的部署规模。