7月27日,腾讯 Robotics X 实验室与福田实验室联合发布具身智能开放平台 Tairos “钛螺丝” ,腾讯首席科学家、Robotics X 实验室主任、福田实验室主任张正友在会上作了《未来已来,从神话巨人到具身智能》的主题演讲,阐述了为何推出具身智能平台、新平台“钛螺丝”的目标和使命以及具身智能行业发展的现状和未来发展趋势。
Tairos平台可在官网申请试用:https://tairos.tencent.com/
以下是演讲全文。
各位嘉宾,上午好!今天我想和大家分享《未来已来,从神话巨人到具身智能》。
正如大家最近感受到的,“具身智能”正成为全球科技竞争的高地。我研究人工智能和机器人技术已四十年,见证了人工智能和机器人这些年的不断进化。
然而当我们回溯历史,这项技术的梦想,远比我们想象的更古老。早在2700年前的古希腊,人类已经有了具身智能构想的萌芽Talos 。Talos是由工匠之神打造的青铜巨人,他不是一个简单的机械工具,而是已经拥有了自主意识。Talos被送给了克里特用来巡视、守卫领土,是最早的安保机器人。Talos虽然存在在神话中,却体现了人类对拥有机械智能体的渴望。这种渴望,从青铜锻造炉延续到今天的实验室。
2018年初,腾讯创始人马化腾做出了一个重要决定——成立腾讯Robotics X实验室。这张图的时间轴浓缩了我们实验室七年来的前沿探索足迹。
从2018年平衡自行车的动态控制,到2021年Max实现腿轮一体化的四足机器狗,再到2023年灵巧手操作和栩栩如生的运动步态,再到去年下半年的养老机器人原型小五——我们覆盖了操作、运动、感知、智能、硬件设计等机器人核心技术栈。通过这一系列的探索,让我们成为国内少有的具备全栈机器人技术能力的团队。
我们深刻理解机器人硬件与具身智能的共生关系。 软硬一体不是简单拼装,而是从传感器到大小脑再到执行器的系统级融合创新。
这种系统级融合创新的理念,就体现在上图左边的 SLAP 框架里。这是我早在2018年,也是在世界人工智能大会提出的,希望为“具身智能”描绘一个清晰的技术蓝图。
经过了这些年的持续探索和实践,腾讯Robotics X实验室的同事们不断打磨这个框架,现在已经进化形成了一个更完整、也更强大的核心技术体系,我们称之为 “SLAP³”体系。这里面核心是三个紧密结合的大模型 :
首先是规划大模型,相当于人的左脑。让机器人能理解复杂目标是什么,然后拆解成一个个可执行的策略步骤。比如陪行动不便的老人散步,需要先去拿轮椅,把老人抱到轮椅上,然后推轮椅。
接着是感知大模型,相当于人的右脑。它的作用就是让机器人真正了解自己所处的环境。比如说轮椅在什么地方。
还有就是感知行动联合大模型,相当于人的小脑。这个模型打通了从“看见”到“做到”的关键环节。比如在一个狭窄的过道里,推轮椅要安全避开其他行人和障碍物。
这种架构的优势在于它层次化、模块化,同时又能联合优化。不同功能的大模型可以相对独立地发展和更新,同时又能高效地协同工作、互相增强。
这是逐步将具身智能推向现实世界通用应用的关键路径——因为真正的智能机器人,不仅要理解我们的世界,更要能在这个世界里安全、稳定且高效地完成任务。
具身智能技术在不断迭代,国内外的新成果、新突破不断涌现,我判断未来还将在五个方向上持续发展,我们根据首字母总结为IDEAS:
I 是 IPhD, 虚实集成世界。数字世界和真实世界正在深度融合,真实世界的信息被反映在虚拟世界中,经过运算,又返回到真实世界中,并对真实世界产生影响,这种结合越来越紧密。
D 是 Democratization,技术门槛降低。人和机器的交互从过去的机器语言,到高级编程语言,再到现在用我们人类自己的自然语言。这使得与机器打交道的门槛大大降低,男女老少都能轻松参与。
E 是 Evolving intelligence,智能演进。AI迎来爆发,未来智能、本体、环境三者之间的一体化互动将更加紧密,并不断演进提升,使AI更加通用和可靠,加速推动产业创新和个人效率。
A 是Agentization,智能体化。AI系统从被动演进到主动交互智能体,具备感知、规划、行动和学习能力。而且智能体将不再孤独,多智能体的交互协作将涌现出集体智能。
S 是Sensing multimodalization,感知多模态化。感知技术从单一视觉,变成视觉、触觉、力觉多模态融合,甚至加上嗅觉和味觉,为机器人提供更多信息。
相信技术会在不远的将来给我们带来惊喜,腾讯Robotics X实验室也会在这些方向上继续探索和落地,为具身智能融入社会做出贡献。
我们刚才提到了具身智能技术的飞速演进。国内的具身智能机器人产业,已经进入了一个快速的发展通道。
这背后的推动力是很扎实的:首先, 政策支持力度很大,方向很明确;其次,机器人的产业链相当完整非常高效;再者, 应用场景无论从数量还是质量上都呈现出巨大的潜力。这使得一批优秀的机器人企业迅速涌现出来。
社会各界迫切期待机器人在真实环境中能落地应用。例如,工厂车间对柔性生产、精准抓取与重复作业的需求;酒店、商场对于接待导览服务的需求;家庭场景下对智能陪伴、安全监护、家居操控乃至适老化日常起居辅助的需求。
然而,要真正满足这些多元场景的高标准、严要求,使具身智能走进千家万户与生产服务第一线,无论是核心技术的攻关,还是工程化落地的精进,我们仍需付出巨大努力。
大多数企业,在这个落地过程中都会面临诸多的障碍。这远不仅仅是一个算法问题、或者一个模型能力的问题,而是一个极其复杂、环环相扣的系统工程挑战, 需要打通基础模型、数据采集、训练仿真、真机调试、真机部署的全链条。每一个环节,都藏着不少"坑" 。
腾讯Robotics X实验室在深入产业实践的过程中,在每个环节都深有体会。正是基于这些亲身经历和积累的经验教训,我们为每个环节都开发了相应的实用工具,致力于解决这些共性的落地难题。
为此,腾讯Robotics X和福田实验室正式推出Tairos 具身智能开放平台。
这个平台核心功能非常明确: 为机器人本体开发商与应用开发商补齐关键的软件能力。大家可以看到,我们一方面联合宇树、越疆、帕西尼、众擎、擎朗等优秀的本体硬件伙伴,另一方面服务机器人应用生态伙伴,通过标准化平台,让软件能力不再成为机器人走向场景落地的瓶颈。
平台能力有两大支柱:——模型和云服务,提供三大核心能力:规划大模型支持复杂任务规划,多模态感知大模型融合视觉、位置、触觉等环境信息,而感知-行动联合大模型实现操作和运动能力。云服务则覆盖完整研发链条,开发者可通过云平台完成仿真、训练、数据管理等关键环节,并通过SDK/API灵活对接硬件。
这些能力最终体现为四大产品特点:
第一, 跨本体适配,同一套算法可低成本迁移到不同机器人硬件本体。
第二, 模块化支持 ,我们希望灵活适应不同伙伴对于具身软件和工具的需求,到位但不越位。
第三, 标准化产品 ,降低伙伴的适配成本,始终带来SOTA的技术。
第四, 追求成功率与稳定性,以真实场景落地为唯一目标,给伙伴带来可持续的商业价值。
我们和合作伙伴一起,已经将Tairos平台搭载在不同形态的机器人本体上。这里,我们展示在工业生产、商业服务、家居生活和基本运动控制等场景中的一些落地。
我们希望成为机器人厂商的合作伙伴,让机器人企业专注自身优势、聚焦创新,让Tairos助力行业发展。
● Tairos是开放的。我们对所有机器人本体开放合作,也对各领域模型开放算法接入能力,让开发者自由组合创新。
● Tairos是伙伴的助力。Tairos不追求自身的商业化,但是希望为行业伙伴带来商业机会,取得商业成功。
● Tairos以落地为目标。在真实场景中产生实际价值,让机器人服务于人。
● Tairos的核心追求在于连接。实现人与机器的自然交互,实现机器与机器的协同工作。
● Tairos肩负责任,在产业和技术上,为机器人的发展和融入社会做出贡献。
这五个定位驱动Tairos成为伙伴的“技术杠杆”。我们期待与所有探索者携手,让具身智能机器人走出神话,走进每个需要智慧的角落,做机器人行业的“钛螺丝”。
唐代的智通大师留给我们四句偈语:“三身元我体,四智本心明。身智融无碍,应物任随形。” 这描绘的,恰恰是我们对理想具身智能的追求。在过去,机器人和AI常常是割裂的:我们强行把缺乏世界认知的AI塞进机器躯壳。结果往往是笨拙和不自然。
但未来,技术与认知的进步正推动我们从“割裂的拼接”走向“有机的融合”——智能不再是塞进去的,而是在与环境的持续、闭环交互中真实涌现出来的。它意味着具身智能需具备强大的泛化能力 —— 这个“身”与“智”要能动态、协同地进化, 无缝地适应多变的环境,实现身、智、环境的圆融统一。它不再被束缚于单一功能或固定环境,而是能在工业、家庭、医疗等多种场景中理解开放任务,成为真正意义上的通才。
非常幸运,我们正亲眼见证着这个 “身智融无碍”的未来在展开,融合演进,未来已来!
大会现场,腾讯Robotics X实验室也邀请到了我们的合作伙伴之一宇树公司的机器人G1,利用Tairos平台的多模态感知规划能力,完成做一个互动。
文章来源:腾讯Robotics X实验室