邱恒:智元机器人CMO
观点摘录:
介绍了智元机器人的发展历程,产品系列和布局。
智元机器人的三大智能模块:运动智能,是机器人的基础能力;交互智能,实现自然语言交互和情感识别;作业智能,最关键的一个能力,直接决定了生产力能否有效落地。
智元机器人已经有八个商用场景落地,当前机器人已不再局限于实验室研发阶段,虽然还不完美,但是已经有人愿意为此买单。
任何一个完整的产业体系,都难以仅凭一家公司独立实现。智元机器人正积极构建生态体系,携手各使能伙伴共同推进产业发展。
发言内容:
各位老师,接下来我将结合智元的实际情况,就当前具身智能产业的进展向大家做一个汇报。
首先先简单介绍一下智元机器人的发展历程:
智元机器人成立于2023年2月,仅仅过了半年,就发布了首款机器人系列产品,之后在上海建立了制造工厂。2024年8月,发布“远征A2”。同年9月,大模型训练数据采集场地建设完成。2025年1月,实现一千台机器人下线。3月,基于我们的数据和代码,发布了首个通用具身基座大模型GO-1,“远征A2”获得了中美欧三方认证,是全球唯一获得全部认证的机器人,并进一步实现全球首个工业常态化落地,A2-W机器人进入富临精工工厂。7月,于世界人工智能大会发布了具身智能操作系统灵渠OS。8月,实现了首个世界模型开源平台。
智元有以下几个机器人家族。“远征”是全尺寸的人形机器人,“灵犀”是半尺寸,大概一米三像小孩身高的一个机器人,“精灵”是轮式机器人,擅长在各种场地里面干活,还有就是机器狗,全系列涵盖了家用、行业用等各种场景,和大中小各种尺寸。同时,也运用降维技术打造了扫地机器人产品,相较于市面上的常规产品,在性能和体验上更具优势,为初创阶段的公司获取了稳定营收,保障核心业务的持续推进。在此基础上,我们也推出了相关的机器人零部件产品。
智元整体采用“1+3”的布局,“1”是机器人,“3”代表三个智能。第一个是交互智能,实现自然语言交互和情感识别。第二个是作业智能,实实在在地干活,能够赚钱养家。第三个是运动智能,是机器人的基础能力。交互智能主要跟大脑相关用于思考,运动智能主要是跟小脑相关,而作业智能跟大小脑都有关系,因为要完成作业,首先需要大脑进行决策,进而小脑负责具体的执行。
在全栈技术布局方面,有智元自研产品,有共同定义、共同研发的合作产品,也有属于在市场上能够直接买到标准品。其中自研和合作占比很高,因为整个产业只有例如gps、雷达等少部分产品是成熟的,可以直接采购,还有很多不成熟的产品,如果依赖市面上的,做出来的产品很难商用化,可能会在某个点掉链子。所以,智元主要通过自研与合作相结合的方式,确保技术的完整性,从而在商用化过程中稳定地创造价值、提升生产力。包括与大脑相关的仿真平台,ViLLA架构具身模型,世界模型强化学习,和小脑相关的感知算法、SLAM算法、规控算法等技术。
2025年1月,智元实现了一千台机器人的量产化,客观讲在整个业界能做到这一规模的公司非常少,智元是全球第一家实现一千台人形机器人量产的公司。这个里面大家可以看到有很多机器人排列在一起的,有点像科幻电影里面的场景,实际上是在做测试,发布一条群控命令,然后看机器人能不能一起完美的做出一个动作。
接下来简单介绍一下三个智能。
首先是交互智能,如果把交互智能分成类似于自动驾驶的五个阶段,智元现在处于G3和G4之间,G3类似于智能座舱,G4类似于硅基家人,比汽车领域的智能座舱水平要高,但还没有完全达到硅基家人的场景。在这里面涉及到多模态的技术,不仅是语言能力,还包括表情和动作,如果跟一个机器人聊天时,像对着音箱一样,那是很无聊的,要能像家人一样,表情和肢体动作就很重要。交互智能方面已经有了不少落地场景,比如在展厅里做讲解,在银行营业厅、汽车4s店里做一些咨询服务。
其次是运动智能,是机器人的基础能力,分为三个阶段。第一个阶段“拟人”,模仿人的一些动作,比如现在大家经常说的拟人步态;第二个阶段“类人”,能力跟人差不多;第三个阶段“超人”。按照现在的发展速度,要达到“超人”这个阶段其实并不是一个非常难的事情,因为机器人在某些能力上已经跟人接近,甚至可能会快速超越。当前阶段在拟人和类人之间,已经能完成一些基本动作,比如在楼梯、路面上行走,还能跳跃、跨越,接下来要攻克攀爬,再拓展到各种球类运动,能力会越来越强。机器人的进化其实非常快,它一旦学会一个动作,就永远都会,训练的速度非常快,以季度为单位在进步。
最后是作业智能,也是最关键的一个能力,直接决定了生产力能否有效落地。当前,处于具备端到端的操作技能,未来要迈向操作大模型的阶段,现在是一个一个的能力在跑通,未来把这些能力汇聚到一起时将成为操作大模型。
下面介绍的是机器人的学习过程,首先看视频,照样本学习,然后再到仿真,训练完之后进一步要做机器人的泛化,这种形态,精灵学会了,那远征和灵犀也就会了。
接下来介绍的是数据飞轮。我们现在训练机器人,先选场景采数据,再训练模型,接着将训练完成的模型导入机器人本体,再结合本体进行泛化。就这么一个场景一个场景地攻,从1个、2个到越来越多,等大量场景都跑通了,就能逐步构建起大模型。当前已经有八个商用场景,第一个讲解接待,第二个文娱商演,第三个工业智造,第四个数采训练,第五个物流分拣,第六个科研教育,第七个安防巡检,第八个商用清洁。这八类场景现在都已经有了客户,所以当前机器人已不再局限于实验室研发阶段,虽然它还不完美,但是已经有人愿意为此买单。
任何一个完整的产业体系,都难以仅凭一家公司独立实现。因此,我们正积极构建生态体系,携手各使能伙伴共同推进产业发展,这既包含技术生态,也涵盖商业生态。在技术生态层面,尽管智元自身仍处于初创阶段,但是有一些更初创的企业,他们创意不错,技术也不错,我们会进行投资,导入到我们的平台。同时,我们也正与部分科研院校开展联合研发。在商业生态层面,我们已汇聚了不少机构伙伴,还有各个行业的合作伙伴。众多伙伴选择与智元合作,核心原因在于我们的使能平台具备较高的易用性。机器人跟人类相同一定是千人千面,但是智元作为一家科技公司,没有精力去做千人千面的工作,包括皮肤、肌肉的定制,所以需要和伙伴一起合作去实现机器人的千人千面。
目前我们公司的人员规模增长较快,预计到2025年底将达到 1300余人。从人员结构来看,研发人员占比75%,而这部分研发人员中,又有三分之二聚焦于智能相关领域的研发工作。机器人难的不是“机器”的部分,而是“人”的部分。在地域布局上,公司总部设立于上海,同时在北京、深圳也部署了研发团队。我们也在做全球化布局,在海外已经开始设点。
红包分享
钱包管理

