智元机器人想当「具身智能的安卓」
中国现在有两类机器人公司。
一类在拼硬件参数,谁的关节更多、谁的身高更高;另一类在拼「谁能先让机器人进厂干活」。
智元显然是第二种。
4月17日的APC 2026大会上,创始人邓泰华说了一句关键的话:「2026年是部署态元年。」
翻译一下:行业到了从「能跳舞」到「能干活」的转折点。
六个模型,三种智能
智元这次发布了六大AI模型,覆盖运动、交互、作业三个方向:
运动智能是基础。BFM行为基座模型用超1亿帧人类动作数据训练,学的不是某一个具体动作,而是动作的分布。给它一个没见过的动作指令,可以Zero-shot直接执行。
GCFM生成式运控模型更进一步,连输入动作这一步都省了。给机器人一句话描述意图,它自己决定该做什么动作。
有意思的是GO-2模型引入了「动作思维链」——类似大模型的Chain-of-Thought,但发生在动作空间里。机器人执行任务前,会先在脑子里预演一遍。
这让机器人从「执行预设动作」变成了「会思考的动作」。
交互智能解决的是「能不能对话」的问题。传统机器人的交互是割裂的,语音先转文字,文字推理完再转语音,每一步都在丢信息。WITA Omni 1.0把这个链路打通了,实现端到端的多模态交互。
作业智能是「部署态」最硬的一块骨头。机器人在真实场景里完成任务,不是表演。
彭志辉提过一个数据:「今天,全世界的高质量具身数据可能只有50万小时。」
这个数字比大语言模型的数据饥渴更严重——因为机器人要在真实物理世界里摸爬滚打才能采集数据。
智元的解法是SOP在线强化学习系统。部署在现场的机器人持续回传经验,云端集群并行训练,策略实时下发。3小时在线训练就能将任务成功率提升33%。
机器人越用越聪明,这才是飞轮真正转起来的样子。
真正的重头戏:AIMA生态平台
如果说模型是技术秀,那AIMA平台才是商业逻辑的核心。
AIMA的架构是「1+3+X」:
- 灵渠OS:开源操作系统,被称为「具身智能的安卓」
- 灵创平台:零门槛做机器人动作,用户上传一段视频,平台自动完成关键点检测、训练和部署
- 灵心平台:定制机器人性格
- Genie Studio:一站式开发
邓泰华宣布了「元苼」生态计划:五年投入20亿,目标助力数千家合作伙伴。
这套路眼熟吗?
像不像Google推Android——做平台,让别人来建生态。
智元的定位说得很清楚:「因为AI需要有身体,所以我们做了配套的本体,以AI来定义本体。」
换句话说,智元不想只卖机器人。它想成为具身智能的基础设施。
数据之外的两个细节
大会公布了一些数字:2023年营收30万,2025年破10亿;2026年3月28日,第10000台机器人下线;Omdia报告说2025年出货量全球份额39%,双料第一。
从30万到10亿,三年完成。这个增速确实惊人。
但我更关注两个细节。
第一个是关节系列化。
智元把五大系列、近10款产品全部规整到8款系列化关节设计上。「这8款关节用在我们所有产品上,能够满足所有部位的关节需求。」
这是制造业的逻辑,不是科研的逻辑。标准化才能规模化,规模化才能降成本。
第二个是「沿途下蛋」的策略。
彭志辉将任务维度划分为「场景复杂度」和「任务复杂度」,认为当前的最佳切入点是「在简单场景做复杂任务」。
比如在结构化的工厂环境里,执行高自由度、高维感知的复杂操作。
这个判断很务实。机器人不需要一上来就进你家帮你叠衣服,先把工厂里的活干好。
我的判断
具身智能现在有两个路线之争。
路线一:特斯拉路线——垂直整合,软硬件一起做。Optimus Gen 3在美国量产遇阻,现在把希望押在上海。4月17日,首批50台机器人正式交付进特斯拉上海工厂总装产线,单台售价4.9万美元。
路线二:智元路线——做平台,让别人来集成。开源操作系统,开放数据集,拉合作伙伴一起建生态。
两条路线的本质分歧是:机器人行业最终会走向标准化,还是每家都有一套自己的封闭系统?
智元选择了「开源生态」这张牌。
这把牌能不能赢,现在还不好说。但至少在中国市场,智元已经把自己摆到了「具身智能基础设施」的位置。
彭志辉说:「整个具身智能行业目前还在共同探索,没有任何一家企业能独自给出正确答案。」
我认同这句话。但探索也需要方向。智元的方向是:硬件是身体,模型是灵魂,生态是壁垒。
最后,数据才是核心。
谁先规模化部署,谁就占据数据优势;谁占据数据优势,谁就训练出更好的模型;谁训练出更好的模型,谁就能继续规模化部署。
飞轮一旦转起来,就停不下来。
问题是,谁能先把飞轮转起来?
智元发布的七大生产力解决方案覆盖工业制造、商业服务、特种作业三大方向。这个布局说明它不想只做一个机器人公司,而是想成为机器人时代的「卖水人」。
能不能成,看2026年的部署规模。
