- FAIR plus机器人全产业链接会
- 2025智能机器人关键技术大会
- 第六届中国机器人学术年会
- 中国机器人峰会暨智能经济人才峰会
- 全国人工智能与机器人关键技术大会
- 世界机器人大会
- 2023中国(太原)人工智能大会主题展览
- 2025科技创变者大会
9月5日,由智友·雅瑞 科创平台主办的“2025科技创变者大会”在北京成功举办。在圆桌对话环节,主持人智友·雅瑞 科创平台投资合伙人王晶与星源智创始人兼CEO刘东、INDEMIND联合创始人兼CTO闫东坤、知行机器人创始人兼CEO白国超、悟通感控创始人兼CEO陈立洋共同探讨具身智能临界点的算力、数据与商业化的三重博弈。
图注:智友·雅瑞 科创平台投资合伙人 王晶
王晶:数据是具身智能发展离不开的一个重要议题,因为它是具身智能从实验室走向规模化落地的重要引擎,它决定的泛化和稳健性的上限,算力又决定训练的效率和端侧的实时性,但是当前具身智能海量数据场景中,现实中有很多“脏数据”“小数据”,各位嘉宾是如何看待具身智能发展中的数据问题?
图注:星源智创始人兼CEO 刘东
刘东分享了星源智收集数据的做法和经验。他介绍说,公司孵化于北京智源人工智能研究院,研究院承接具身数据训练场的一些项目,因此公司投入了大量的资源去采集一些真机数据,这些数据在完成AI自动化标注后,质检人员和人工也会将数据中的小数据、脏数据、不合格数据剔除。在这些高质量人工采集的数据基础上,团队将数据扩增——将这些高质量真机数据放到仿真环境去调节变量,以生成和扩增用来训练具身大脑模型的数据。真机采集的数据若有1,扩增数据可以达到10,帮助团队迅速完成数据增量工作。在此基础上,团队也会采用纯仿真和互联网数据去训练抓取等操作任务;他认为,在真机数据、扩增数据以及纯仿真和互联网数据这三种数据融合之下,训练出泛化性比较强的跨本体的具身大脑。
图注:INDEMIND联合创始人兼CTO 闫东坤
闫东坤介绍了所在的INEDMIND公司数据积累进展情况:自公司2021年商用机器人落地以来,产品已在全球几十个国家运行超300万小时,依托量产机器人获取海量数据(可复用至家用场景),目前已脱离 “依赖仿真数据+外采数据” 的阶段,进入 “量产数据为主、仿真数据为辅” 的新阶段,这些海量数据未来也可以在家庭场景中复用。不过,他也提出公司产品所采集的数据都来自家庭、商业、超市等非标场景,具有“非标化、动态化”特征,例如数据经常会受不同光线、空间布局影响,易产生脏数据、小数据问题。为解决上述问题,目前公司正在联合合作客户在保障信息安全的前提下,基于量产机器采集真实场景数据,以此为基础训练AI模型;同时,也在基于真实数据搭建仿真平台,通过平台自动化生成极端场景数据,解决(Carol Case)相关的数据缺口问题。
图注:知行机器人创始人兼CEO 白国超
白国超围绕机器人灵巧手及末端执行器相关的数据问题进行了观点阐述。他认为,机器人灵巧手和末端执行器是与环境、物品直接接触的关键部件,在抓取过程中会产生大量数据,主动采集这些数据对企业非常重要。当前,不同场景下的数据特点与处理是不同的。在工业场景中,数据确定性强,抓取物品的品类、数量等相对固定,公司会提前采集数据并预训练,以提升执行成功率与可靠性;目前,航空领域及其他制造业愈发重视数据,公司已经积累大量航空零部件相关数据——一部分由企业自行采集,一部分来自客户的脱敏数据;公司与客户共同开发数据,形成共享资源的同时,会保障客户工厂的数据安全与隐私。他认为,数据问题已经航空工业场景中的技术壁垒,它包含核心的工业现场工艺流程数据、工艺操作数据。
图注:悟通感控创始人兼CEO 陈立洋
陈立洋认为,传感器是具身智能重要的数据源,承担着采集数据的重要任务,因此产品稳定性与一致性对数据采集工作十分重要。在时间一致性方面,传感器需长期稳定工作,避免因使用时长导致数据偏差,例如血压计需每1~2年校准以保证基线准确,进而确保数据可靠。在批次一致性方面,受材料学、物理量产特性影响(如芯片分I3/I5/I7),传感器易存在批次差异,需通过工艺优化控制,确保不同批次产品数据来源一致,提升下游产业应用稳定性,同时行业内会传递自动或非自动标定方法辅助解决该问题。
他也指出了当前触觉传感行业的核心痛点,即触觉传感行业成熟度较低,存在材料性能短板——金属疲劳、材料蠕变问题未妥善解决,导致传感器在过载、长时间高压加载下易出现数据漂移;同时,传感器还须具备抗干扰的鲁棒性,例如在受到意外冲击后仍能恢复基线、正常工作。这些问题使得看似科研简单的电子皮肤、足底压力传感等产品难以实现量产落地。他认为,提供更稳定的传感器产品是保证具身智能的高质量数据采集的重点。当前触觉传感的量产落地还有一些问题亟须解决,例如工业基础能力需要进一步提升,工艺层面的基本功需攻克,传感器稳定性、一致性、抗漂移、抗蠕变及鲁棒性问题也需要重点解决。