李竹X王田苗对谈｜硅谷双雄千亿豪赌下，人形机器人「底层逻辑」再思考

发布日期：2025-02-24

最近，马斯克又双叒语出惊人，号称今年将量产数千台“擎天柱”机器人，三年内实现百倍跃升。同在硅谷的小扎也不甘示弱，宣布Meta将投入650亿美元，加速人形机器人布局。

由“硅谷双雄千亿豪赌”的话题展开，北航机器人研究所名誉所长、中关村智友研究院院长王田苗与英诺天使基金创始合伙人李竹，进行了一场理性对谈，为“具身智能”这个狂飙突进的产业注入思考。

精彩观点：

◎无论具身智能以人形，还是其他载体呈现，到目前为止还未达到所谓的“iPhone时刻”，我们依然走在通往大哥大、通往BB机、通往小灵通的产品探索与演进阶段。

◎ 人形机器人是具身智能的新物种，而且是相当重要的一个新物种。从供应链维度分析，人形机器人将会是一个“类似汽车供应链”的统一市场，它不仅足够大，而且有望推动供应链玩家的重新洗牌。

◎人形机器人在10年内，以1000万至5000万台套的出货量，或以80%的占比进入家庭应用，还过于乐观。如果最近2-3年，人形机器人在工业、商业、消费等场景，无法实质性落地，其背后的估值泡沫问题，就需要更加理性看待了。

◎ 在中国要相信市场的力量，只要有内核实力和坚持长期主义，所有企业都会反复去迭代、去创新。当中国企业先沿着自己的优势赛道存活下来后，一定会去做0-1的基础性创新。

以下为对话实录：

李竹：马斯克特别看好人形机器人，提出了三年百倍的目标，扎克伯格也提出要投资650亿美元，研发家用人形机器人。为什么人形机器人成为大家普遍看好的具身智能方向？进入家庭离我们还有多远？

王田苗：我觉得主要有两个原因。第一，这个世界的物理环境大多是以人为中心设计的，无论是台阶、把手、椅子，还是冰箱、电梯都是充分适配人的。因此，打造一款形似人类的人形机器人，或许最有利于其融入、适应既有环境。有句话叫“语言改变认知，工具改变世界”，人们期待未来的人形机器人能像人类那般自如地运用各类工具，从而改变世界，这无疑是人们心中长久的梦想。

从商业行为的视角来看，人形机器人是一个相对理想的通用平台，能够完成多项任务，具有泛化与迁移的能力，市场潜力巨大。进一步而言，从供应链维度分析，人形机器人将会是一个“类似汽车供应链”的统一市场，它不仅足够大，而且有望推动供应链玩家的重新洗牌。我相信，人形机器人是具身智能的新物种，而且是相当重要的一个新物种。

但未来，人形机器人机器人的应用占比，究竟是多少？增速如何？何时能真正进入家庭？这些问题都还在探讨中。

考虑到成本维护、复杂环境、充电、安全、伦理等方面的问题，我认为人形机器人在10年内，以1000万至5000万台套的出货量，或以80%的占比进入家庭应用，还过于乐观。如果最近2-3年，人形机器人在工业、商业、消费等场景，无法实质性落地，其背后的估值泡沫问题，就需要更加理性看待了。

然而，时至今日，人们已经找到了新思路——即推出类人形机器人的“折中方案”。它不一定严格遵循人类的外形，而是在诸如劳动作业、儿童陪伴与互动等多种场景中，搭载具身智能相关技术，率先落地应用。

未来，关于不同机器人在全场景中的总应用占比，我认为“人形&类人形机器人”有望占据总应用量的20%-30%，其它形态的通用机器人占50%左右，特种机器人占20%左右。

李竹：具身智能发展很快，目前我们处于什么阶段，还有创业机会吗？

王田苗：是有机会的，只是现阶段给创业者增加了门槛。

回顾历史，1900年代福特T型车问世前，欧洲曾涌现了大量的汽车作坊，但当量产革命到来时，98%的企业被淘汰；1970年代工业机器人浪潮中，日本200余家厂商经历了20余年的大浪淘沙，最终仅存发那科、安川两家巨头，以及少数从事抛光、打磨、焊接等垂类应用的机器人公司，存活率仅为10%左右；如今的大模型市场亦是如此，尽管出现了百模大战的壮观景象，但DeepSeek、Grok3等新突破仍不断涌现，我们什么时候能见证某一大模型能把其他所有创新项目全部碾压，且性能远远超过呢？

所以，我想说无论具身智能以人形，还是其他载体呈现，到目前为止还未达到所谓的“iPhone时刻”，我们依然走在通往大哥大、通往BB机、通往小灵通的产品探索与演进阶段。

在这一进程中，我看到具身智能的两个机会：第一，是具身智能硬件，与大模型或操作系统逐渐走向集中化不太同，硬件本质上会展现出多元化的发展特征，就像冰箱、汽车各具风格，在具身智能硬件创业领域，也许还有更多机会；第二，是以客户需求为导向的产品创新，目前具身智能的创新基本是以技术为导向发生的，未来企业发展壮大一定是得客户者得天下，而这个分水岭还没有到来，就像在新能源汽车的早期阶段，几乎没有人能想到极氪、小鹏、理想等新兴品牌的崛起，具身智能在这个层面还很有机会。

此外，还有许多具身智能前沿技术有待创新攻克，特别是结合具体客户场景需求的整机、核心部件、应用模式等。比如具身智能任务交互与认知AI大模型，视觉空间智能环境识别与语义推理路径链模型，专用操作工艺技能小模型，具身载体实时灵巧稳定安全动作链模型， AI模型训练与推理编译优化的开发工具平台；再比如相关数据制造工厂，包括仿真、生成、训练、蒸馏、校准、分享等，包括领域、企业、专用、隐私、保密等，比如芯片（控制、识别、推理、类脑）、微纳传感器、运动一体化关节、微纳执行器、灵巧手、核心部件等等。

挑战性的难点也是存在的。第一个难点是，企业如何在底层创新或应用方面具备差异化思路？第二个难点是，企业需要具备很强的融资、找商业合伙人、找落地场景能力。如果能解决这两个难点，还有机会，甚至可能跻身领先位置。

李竹：在具身智能方向，中美之间在技术上是否有差距？未来谁会更胜一筹？

王田苗：未来10年，一定是中国更胜一筹。

一方面，中国在软硬件结合方面，极具优势。庞大的中国市场，每天都会产生海量应用数据，特别是消费者行为数据及工业装备广泛应用数据。相对而言，国内的部分任务数据能够实现共享，这促进了技术的快速迭代，使得国内的学习速度可以远超西方国家。

另一方面，在“限制条件”下，中国也比较适合做1-10的科技创新。0-1的科技创新，往往需要在基础供应链全部打通的环境下，更有利于发展。基于此，我认为未来10年，我国的工业机器人、服务机器人、医疗器械等领域，有望领先世界。

但目前差距还是有的。比如目前中国与日本、德国在材料、激光、视觉以及核心部件上，仍存在差距。比如在人形机器人方面，我们的人才缺失、关键部件性能提升也存在短板。

但是，在中国要相信市场的力量，只要有内核实力和坚持长期主义，所有企业都会反复去迭代、去创新。当中国企业先沿着自己的优势赛道存活下来后，一定会去做0-1的基础性创新。

文章来源：中关村智友研究院