能干活才是未来!五大先锋公司激辩从实验室到产业化的跨越式突破
发布日期:2025-06-11 

在人工智能技术浪潮奔涌的当下,具身智能(Embodied AI)正以破竹之势成为全球科技竞技的核心赛道。2025年6月6日,2025北京智源大会期间,“智源具身智能会客厅”汇聚了宇树科技、北京人形机器人创新中心、银河通用、穹彻智能、Physical Intelligence等全球顶尖企业,通过技术展示、实机演示与圆桌对话,勾勒出这一领域的最新图谱。

这场科技盛宴不仅揭示了具身智能在运动控制、环境交互、数据驱动等关键技术的突破,更展现了从实验室原型到产业落地的清晰路径。


从格斗到叠衣服:机器人开始“干真活”

宇树科技CEO王兴兴带来的G1机器人,以“全球最能打的机器人”标签引发关注。在《CMG世界机器人大赛》机甲格斗中,G1凭借自主决策算法与高动态运动控制,击败多国劲旅夺冠。王兴兴强调:“格斗不是表演,而是验证全身协调性、实时决策能力的‘炼金石’。”其背后是深度强化学习与动力学模型的融合,使机器人在高速对抗中实现毫秒级反应。

宇树机器人上台表演(gif进行了加速处理)

北京人形机器人创新中心的天工2.0则以“马拉松冠军”身份亮相。总经理熊友军展示的数据令人惊叹:天工 1.02小时40分钟内完成半程马拉松,且具备草地、沙地、丘陵等多地形适应能力。升级后的天工2.0强化了上肢灵巧手系统,配备了灵巧手,具备更高的自由度和更强的负重能力,从而拓展了它在实际任务中的应用范围。

天工2.0 现场展示准备茶点gif进行了加速处理)

银河通用创始人王鹤展示的Galbot轮式机器人,在商超复杂环境中实现了“所见即所得”的抓取能力。其自研VLA(视觉-语言-动作)模型突破传统轨迹规划局限,通过合成数据训练,在货架密集场景中完成超高的品识别与抓取成功率。更关键的是,系统具备抗干扰能力——即使人为触碰,仍能动态调整动作完成订单。

银河通用机器人展示商超货架场景应用(gif进行了加速处理)

穹彻智能联合创始人卢策吾的演示更具颠覆性:机器人通过力觉-位置双重反馈,完成刮胡子、挖冰淇淋等精细操作。其系统在食品加工行业已实现规模化落地,卢策吾指出:“力反馈是机器人理解物理世界的‘第六感’,就像人类闭眼也能感知力度,这种本能化交互是通用性的关键。”

穹彻机器人挖冰淇淋演示(gif进行了加速处理)

Physical Intelligence联合创始人Karol Hausman提出的“100个家庭训练法则”引发热议。通过在100个不同家庭场景中训练,其π-0.5模型实现了对第101个陌生家庭任务的高效泛化。Karol坦言:“这打破了‘数据量决定论’,证明算法架构的优化比单纯堆砌数据更重要。”

Physical Intelligence 联合创始人兼 CEO Karol Hausman


产业落地:从“炫技”到“干活”的范式转变

  • 为什么是“比赛”推动了产业前进

“机器人赛事不是作秀,而是产业化的催化剂。”王兴兴的论断在圆桌讨论中引发共鸣。熊友军表示认同:举办机器人竞技赛事意义重大不仅是一场全民科普盛会也是技术的实战“训练场”,更是连接产业界与潜在客户的重要平台

卢策吾认为,机器人赛事本身非常有价值,能很好地展示技术能力,但它更应该是一个起点。接下来我们更希望看到机器人能“干活”的比赛,即真正体现生产力和实际应用价值的比赛。如果未来能有更多“技能型”的比赛,就能更好地锤炼和检验这些实用能力。我们也希望通过这样的路径,让大家真正看到:机器人不是只会表演,而是能劳动、能创造价值——劳动最光荣。 

王鹤的银河通用则通过“无人药店”项目实现商业闭环:在北京部署的7家24小时药店中,由人形机器人承担夜间接单和配送任务,既便利了用户,也缓解了人力紧张。他计划年底前将网点扩展至北上广深,并进军工厂料库管理。“当机器人能稳定运行2000小时无故障,就是产业爆发的临界点。”

  • 形态之争:人形是否是终极答案?

针对清华大学张銹院士“人形非最优解”的质疑,熊友军以“场景适配论”回应:“家庭环境天然适配人形,门把手高度、操作界面设计都以人体工学为基准。”目前在人形机器人的成本和技术成熟度上还存在挑战。但从长远看,它依然是推动具身智能真正落地的最理想选择之一。

王兴兴则提出“形态解耦”理念:“机器人形态越接近人类,数据采集越方便,训练效果也越好。下肢可以是轮式或四足,但上半身保留类人结构以利用现有动作数据。同样王兴兴认为,未来进入 AGI 或通用智能阶段后,机器人的外形将极大多样化,会根据不同任务出现各种更高效的设计,结构、尺寸、材料可能比现在丰富百倍。

  • 模型瓶颈:从“能动”到“可靠”的最后一公里

尽管VLA模型在简单任务中表现优异,但嘉宾们一致指出其局限性。卢策吾表示VLA 模型很受关注,我认为它火得有道理。V 代表对世界的理解,L 是与人的沟通,A 则是行动和改变世界,这几乎涵盖了机器人所需的核心能力。而语言作为“粘合剂”,能将高层知识更好地串联起来。但我也认同王鹤的观点:VLA 虽有潜力,但在机器人这一更复杂、更高不确定性的任务空间中,仍有明显局限。

Karol Hausman坦言:“当前模型在长序列任务中的成功率还达不到实际应用所需的水平。这不仅仅是数据量的问题。即便我们有无限的数据,用现有的算法也很难在复杂、长时序、精细操作的任务上达到接近100% 的成功率 


劳动创造价值,智能重塑世界

在这场科技与产业的深度对话中,“能干活,才是未来”的共识贯穿始终。从春晚舞台到工厂车间,从格斗擂台到家庭客厅,具身智能正以惊人的速度跨越“死亡之谷”。当机器人开始理解力度、适应变化、创造价值,一个由实体智能重构的产业革命已然开启。正如Karol Hausman所言:“这仅仅是开始,但已足够振奋人心。”未来,具身智能将如何改写人机协作的叙事?答案或许就藏在下一场机器人马拉松的赛道上。

封面图源|豆包AI文生图