北大教授黄铁军:AGI的脑、眼、身
发布日期:2025-09-25 

在科技飞速发展的当下,通用人工智能(AGI)已成为众多领域瞩目的焦点。2025科技创变者大会上,北京智源人工智能研究院理事长、北京大学计算机学院教授黄铁军在《AGI之路:脑、眼、身》主旨报告中,从研究视角深入探讨了通向AGI的关键要素,提出关于AGI本质的思考及对技术路径的判断,为行业提供了重要参考。

图注:北京智源人工智能研究院理事长、北京大学计算机学院教授 黄铁军

01 

AGI的本质:超越而非通用

当谈及AGI时,业界的理解存在显著差异。多数人将 “能在多领域应用” 视为AGI的标志,但黄铁军指出,AGI的原始定义是 “全面超越人类的智能”。这也是发展人工智能的初心,从对人类智能的模仿到最终实现超越。

事实上,关于AGI的讨论已经持续20多年。2015年1月,在波多黎各的一场会议上曾统计众多专家对AGI出现时间的预测,包括马斯克、哈萨比斯在内,预测的时间中点是2045年,也就是一半人认为30年内可实现超越人类的智能。

黄铁军在同一时间点发表的文章中也提出了类似判断,并至今仍坚持这一观点。“我现在的看法差不多还是这样,差不多还有20年的时间可以完成这样一个历史性的使命。”

02 

生存还是毁灭?有关AGI的价值辩论

随着AGI可能成为现实,关于其风险的讨论也日益激烈。2019年1月的相关会议上,AGI的讨论进一步聚焦于“如何让AGI有利于人类,而不是消灭人类”。

在西方文化背景下,AI超越人类常被描绘为人类的“灭顶之灾”。会议上甚至设置了辩论环节,讨论“是否应该开发超越人类的人工智能”。黄铁军站从支持一方提出了一个关键观点:人类智能存在上限,在应对未来未知的宇宙级风险时,可能不足。 

“恐龙智能没达到能应对小行星撞地球,所以灭亡了。人类现在大概有这个能力。”黄铁军举例说明,“未来20年左右的时间之内小行星有可能撞地球,真要发生近距离接触,我们可以用核技术将其轨道推开,避免恐龙式的命运。”

同样,面对外星文明等未知风险,人类需要更强大的智能系统。“2019年的时候我们还没有办法理解复杂的外星语言体系,但今天的大模型预示这是可能的。”黄铁军指出,只要有一定数据和结构,大模型就能对外星语言进行建模。正因如此,我们才必须推进更强大智能系统的研发,以应对人脑能力范围之外的未知挑战。

03 

AGI的实现路径:脑、眼、身的协同发展

通向AGI的道路需要解决三个核心问题:脑(认知能力)、眼(感知能力)和身(行动能力)。黄铁军强调,这三个方面都需要全面发展,仅靠任何单一领域的突破都难以实现真正的通用智能。

脑:认知能力的突破

“脑”的方面,近年来取得了巨大进步。自2018年GPT-1发布以来,生成式大模型快速发展,神经网络规模持续扩大,在认知领域实现关键突破。如今,大模型不仅能够“理解任意语言”,甚至为“破解未知语言(如外星语言)”提供技术基础。更重要的是,这些模型展现出对物理世界的初步认知能力,无论是语言理解中的上下文衔接,还是图像场景中的动态推演,本质上都是“基于历史信息推测后续可能性”。以“静态照片预测动态场景”为例:给定“人用手挤柠檬”的静止图像,大模型能准确预判“柠檬形态变扁、柠檬汁流出”的后续过程。这种能力类似于人类无需理解复杂物理定律,就能知道“杯子掉地上会碎”的常识判断,让智能系统的行动更具意图性与目的性,为融入物理世界奠定了基础。

眼:感知系统的演进

在感知层面,当前的研究重点正在从传统的图像识别转向仿生视觉系统开发。我们研发的脉冲视觉芯片和相机的时间分辨率比人眼快千倍,能够捕捉高超音速运动,为机器人提供毫秒级延迟的实时环境信息。这种超高速感知能力是实现“眼疾手快”的关键突破,达到这样的感知精度与速度,智能系统就能在动态环境中做出更敏捷的响应。

身:行动能力的挑战

与此同时,身体本体成为AGI之路上面临的最长远挑战。从进化尺度看,身体演化历时数十亿年,远比语言和视觉更古老、更复杂。当前行业普遍采用的本体在能效、柔性和灵巧性方面与生物系统仍有巨大差距。一些机构通过仿生身体的研究路线,智源研究院的线虫模型是第一个完整的数字生命体,利用大模型方法训练其神经系统和肌肉控制系统,使其在虚拟环境中涌现出觅食、避障等生命行为。这类研究不仅推动了对智能本质的理解,也为开发高性能柔性机体提供了理论基础。

结语

要实现“脑、眼、身”的协同,开源开放被黄铁军视为关键的推进路径。他明确提出:“开源、开放的具身大模型才是未来生态的基座”。

具身智能的核心价值,在于打破AI对“图片、视频等数字内容”的依赖,使其能走进物理世界,通过深度建模与实时交互解决真实问题。只有通过开放代码、模型与数据,才能吸引更多参与者共建生态,极大降低不同场景下机器人的开发门槛,进而加速物理世界建模技术的落地与迭代。

然而,技术的融合并非易事预计这一进程仍需要较长时间,但路径已经清晰。未来的智能系统不仅需要拥有强大的认知能力,还要具备超高速的感知系统和高度灵活的行动能力,才能在真实物理环境中发挥真正价值。

文章来源:智友雅瑞科创平台