李竹X王田苗对谈|硅谷双雄千亿豪赌下,人形机器人「底层逻辑」再思考
发布日期:2025-02-24 
图片

最近,马斯克又双叒语出惊人,号称今年将量产数千台“擎天柱”机器人,三年内实现百倍跃升。同在硅谷的小扎也不甘示弱,宣布Meta将投入650亿美元,加速人形机器人布局。
由“硅谷双雄千亿豪赌”的话题展开,北航机器人研究所名誉所长、中关村智友研究院院长王田苗与英诺天使基金创始合伙人李竹,进行了一场理性对谈,为“具身智能”这个狂飙突进的产业注入思考。
精彩观点:
◎无论具身智能以人形,还是其他载体呈现,到目前为止还未达到所谓的“iPhone时刻”,我们依然走在通往大哥大、通往BB机、通往小灵通的产品探索与演进阶段。
◎ 人形机器人是具身智能的新物种,而且是相当重要的一个新物种。从供应链维度分析,人形机器人将会是一个“类似汽车供应链”的统一市场,它不仅足够大,而且有望推动供应链玩家的重新洗牌。
◎人形机器人在10年内,以1000万至5000万台套的出货量,或以80%的占比进入家庭应用,还过于乐观。如果最近2-3年,人形机器人在工业、商业、消费等场景,无法实质性落地,其背后的估值泡沫问题,就需要更加理性看待了。
◎ 在中国要相信市场的力量,只要有内核实力和坚持长期主义,所有企业都会反复去迭代、去创新。当中国企业先沿着自己的优势赛道存活下来后,一定会去做0-1的基础性创新。
以下为对话实录:

李竹:马斯克特别看好人形机器人,提出了三年百倍的目标,扎克伯格也提出要投资650亿美元,研发家用人形机器人。为什么人形机器人成为大家普遍看好的具身智能方向?进入家庭离我们还有多远?

王田苗:我觉得主要有两个原因。第一,这个世界的物理环境大多是以人为中心设计的,无论是台阶、把手、椅子,还是冰箱、电梯都是充分适配人的。因此,打造一款形似人类的人形机器人,或许最有利于其融入、适应既有环境。有句话叫“语言改变认知,工具改变世界”,人们期待未来的人形机器人能像人类那般自如地运用各类工具,从而改变世界,这无疑是人们心中长久的梦想。
从商业行为的视角来看,人形机器人是一个相对理想的通用平台,能够完成多项任务,具有泛化与迁移的能力,市场潜力巨大。进一步而言,从供应链维度分析,人形机器人将会是一个“类似汽车供应链”的统一市场,它不仅足够大,而且有望推动供应链玩家的重新洗牌。我相信,人形机器人是具身智能的新物种,而且是相当重要的一个新物种。
但未来,人形机器人机器人的应用占比,究竟是多少?增速如何?何时能真正进入家庭?这些问题都还在探讨中。
考虑到成本维护、复杂环境、充电、安全、伦理等方面的问题,我认为人形机器人在10年内,以1000万至5000万台套的出货量,或以80%的占比进入家庭应用,还过于乐观。如果最近2-3年,人形机器人在工业、商业、消费等场景,无法实质性落地,其背后的估值泡沫问题,就需要更加理性看待了。
然而,时至今日,人们已经找到了新思路——即推出类人形机器人的“折中方案”。它不一定严格遵循人类的外形,而是在诸如劳动作业、儿童陪伴与互动等多种场景中,搭载具身智能相关技术,率先落地应用。
未来,关于不同机器人在全场景中的总应用占比,我认为“人形&类人形机器人”有望占据总应用量的20%-30%,其它形态的通用机器人占50%左右,特种机器人占20%左右。

李竹:具身智能发展很快,目前我们处于什么阶段,还有创业机会吗?

王田苗:是有机会的,只是现阶段给创业者增加了门槛。
回顾历史,1900年代福特T型车问世前,欧洲曾涌现了大量的汽车作坊,但当量产革命到来时,98%的企业被淘汰;1970年代工业机器人浪潮中,日本200余家厂商经历了20余年的大浪淘沙,最终仅存发那科、安川两家巨头,以及少数从事抛光、打磨、焊接等垂类应用的机器人公司,存活率仅为10%左右;如今的大模型市场亦是如此,尽管出现了百模大战的壮观景象,但DeepSeek、Grok3等新突破仍不断涌现,我们什么时候能见证某一大模型能把其他所有创新项目全部碾压,且性能远远超过呢?
所以,我想说无论具身智能以人形,还是其他载体呈现,到目前为止还未达到所谓的“iPhone时刻”,我们依然走在通往大哥大、通往BB机、通往小灵通的产品探索与演进阶段
在这一进程中,我看到具身智能的两个机会:第一,是具身智能硬件,与大模型或操作系统逐渐走向集中化不太同,硬件本质上会展现出多元化的发展特征,就像冰箱、汽车各具风格,在具身智能硬件创业领域,也许还有更多机会;第二,是以客户需求为导向的产品创新,目前具身智能的创新基本是以技术为导向发生的,未来企业发展壮大一定是得客户者得天下,而这个分水岭还没有到来,就像在新能源汽车的早期阶段,几乎没有人能想到极氪、小鹏、理想等新兴品牌的崛起,具身智能在这个层面还很有机会。
此外,还有许多具身智能前沿技术有待创新攻克,特别是结合具体客户场景需求的整机、核心部件、应用模式等。比如具身智能任务交互与认知AI大模型,视觉空间智能环境识别与语义推理路径链模型,专用操作工艺技能小模型,具身载体实时灵巧稳定安全动作链模型, AI模型训练与推理编译优化的开发工具平台;再比如相关数据制造工厂,包括仿真、生成、训练、蒸馏、校准、分享等,包括领域、企业、专用、隐私、保密等,比如芯片(控制、识别、推理、类脑)、微纳传感器、运动一体化关节、微纳执行器、灵巧手、核心部件等等。
挑战性的难点也是存在的。第一个难点是,企业如何在底层创新或应用方面具备差异化思路?第二个难点是,企业需要具备很强的融资、找商业合伙人、找落地场景能力。如果能解决这两个难点,还有机会,甚至可能跻身领先位置。

李竹:在具身智能方向,中美之间在技术上是否有差距?未来谁会更胜一筹?

王田苗:未来10年,一定是中国更胜一筹。
一方面,中国在软硬件结合方面,极具优势。庞大的中国市场,每天都会产生海量应用数据,特别是消费者行为数据及工业装备广泛应用数据。相对而言,国内的部分任务数据能够实现共享,这促进了技术的快速迭代,使得国内的学习速度可以远超西方国家。
另一方面,在“限制条件”下,中国也比较适合做1-10的科技创新。0-1的科技创新,往往需要在基础供应链全部打通的环境下,更有利于发展。基于此,我认为未来10年,我国的工业机器人、服务机器人、医疗器械等领域,有望领先世界。
但目前差距还是有的。比如目前中国与日本、德国在材料、激光、视觉以及核心部件上,仍存在差距。比如在人形机器人方面,我们的人才缺失、关键部件性能提升也存在短板。
但是,在中国要相信市场的力量,只要有内核实力和坚持长期主义,所有企业都会反复去迭代、去创新。当中国企业先沿着自己的优势赛道存活下来后,一定会去做0-1的基础性创新
文章来源:中关村智友研究院