AI教父勒昆告别Meta,深耕“世界模型”重塑通用智能前景
AI教父杨·勒昆(Yann LeCun)最近做出了一个惊人的决定:离开了工作十多年的Meta。他认为现有大模型陷入语言桎梏,转而投身于通过视觉数据建立“世界模型”的新范式,旨在于深度感知物理世界,实现真正“高级机器智能”。
人工智能领域正经历着前所未有的热潮,大模型的崛起似乎预示着一个智能新时代的到来。但如果有人告诉你,我们现在对人工智能的狂热追捧可能走错了方向,你是否会感到惊讶?这并非危言耸听,而是出自人工智能“教父”之一的杨·勒昆(Yann LeCun)之口。他近期做出了一个令人瞩目的决定:离开了深耕十多年的Meta,转而投身于他所坚信的通用智能新范式研究。
AI领域的顶尖人物,为何在人工智能如日中天之际,选择离开科技巨头,去探索一条看似“反潮流”的道路?这背后的逻辑,远比我们想象的更为深邃,也更接近人工智能的未来。
语言模型的“死胡同”?LeCun的批判性视角
在人工智能领域,LeCun与杰弗里·辛顿(Geoffrey Hinton)、约书亚·本吉奥(Yoshua Bengio)并称为“深度学习三巨头”,并于2018年荣获计算机界的诺贝尔奖——图灵奖。然而,正是这位开创性的科学巨匠,对当前炙手可热的大语言模型(LLM),却一直持有一种近乎批评的态度。

他认为,当前像ChatGPT这样的大模型,尽管在诗歌创作、编程甚至日常对话方面展现出惊人的能力,但它们的本质却被**“语言”所局限。这些模型通过在海量文本数据中学习统计规律和词语关联来生成看似流畅的文本,然而它们对文本背后所代表的物理世界和常识**却一无所知。
LeCun将这种现象比喻为一个盲人,即便他能将一本关于色彩的百科全书倒背如流,甚至能滔滔不绝地谈论梵高的《星空》或莫奈的《睡莲》,但他本人却从未真正“看见”过一丝色彩。他所理解的,只是“语言”对色彩的描述,而非色彩本身。
基于此,LeCun坚定地认为,我们现在追逐的,是通往超人智能的**“死胡同”。他坚信,真正的人类智能必须超越语言的范畴,它需要对物理世界有深刻的感知和理解,并能够构建一套内在的“世界模型”**。

超越语言:V-JEPA架构与“世界模型”蓝图
正是这种信念,促使LeCun一直致力于推动V-JEPA架构,一个他称之为“世界模型”的理论构想。与现有大模型依赖文本学习不同,V-JEPA模型的核心是通过观察大量的视频数据,感知空间信息来理解世界。

设想一个婴儿,他无需语言就能通过观察、触摸和感受来学习基础的物理常识,比如杯子掉落会碎、球会滚动、火是烫的。这正是LeCun眼中人工智能应当具备的能力。他设想的“世界模型”将能够进行规划、推理,甚至拥有持久的记忆。LeCun将这种能力定义为**“高级机器智能”(AMI)**。
在当前大模型占据主流的背景下,LeCun的观点显得有些特立独行。要理解他这一“高明”的棋步,我们需要回顾他的人工智能探索之路。
AI情结的起源:从HAL 9000到深度学习的冰河期
LeCun对人工智能的热情可以追溯到上世纪80年代。电影《2001太空漫游》中的人工智能HAL 9000给他留下了深刻印象,引发了他对人类智能起源的深思。彼时,AI研究界对智能的“先天”与“后天”之争异常激烈,而LeCun坚定地站在了“一切皆可学习”这一边。

那是一个神经网络研究的“冰河时期”,普遍不被看好。然而,正是LeCun与辛顿、本吉奥这“三巨头”,在不被关注的角落里,为深度学习奠定了坚实的基础。
在贝尔实验室,LeCun开发出了**卷积神经网络(CNN)**这一革命性技术。这项技术最初应用于识别银行支票上的手写数字,在当时无疑是一个“神迹”,首次在大规模实际应用中展现了AI的巨大潜力。贝尔实验室的时代,资金充裕、技术前沿,是科学家们理想的研究乐园。

FA的诞生与ChatGPT的冲击
2013年,深度学习在图像识别领域取得突破性进展。Facebook的创始人扎克伯格亲自“三顾茅庐”,邀请LeCun加入,并创立了Facebook人工智能研究院(FAIR)。LeCun提出的三个条件,扎克伯格也悉数答应:
- 保留纽约大学的教职
- 无需搬到加州
- 研究成果必须公开
这意味着FAIR从一开始就是一个开放的、纯粹的基础研究机构,用LeCun的话说,他们拥有**“无限授权的白板”**,能够自由探索任何感兴趣的方向。在LeCun的领导下,FAIR确实取得了许多颠覆性成就,推动了整个AI行业的发展。
然而,ChatGPT的横空出世,打破了这份宁静。
当ChatGPT像病毒般席卷全球,整个AI行业都为之疯狂,所有巨头都开始**“all in”大语言模型**。Meta也不例外,他们迅速调整方向,集中资源全力开发Llama系列大模型。Llama 2的发布,通过其开放权重的策略,确实改变了行业格局。然而,在这巨大的成功背后,Meta内部的路线分歧也逐渐显现。

LeCun直言不讳地指出,ChatGPT的成功可能导致Meta过度关注已验证的技术,进而忽视了那些更前沿、更具颠覆性,但可能尚未成熟的创新方向。更令人担忧的是,Llama 4被爆出**“操纵测试数据”**以刷分,这不仅让扎克伯格十分不悦,还导致Meta生成式AI部门面临信任危机和大量人才流失。
权力冲突与孤独的预言家
这些还只是表象。更深层次的矛盾在于权力结构的调整。Meta重金挖来了年仅28岁的Scale AI首席执行官亚历山大·王(Alexandr Wang),让他负责公司新的AI研发方向。更让LeCun难以接受的是,这位年轻人竟然成为了他的新上司。
LeCun并非隐忍之人,他直接指出亚历山大·王**“太年轻”、“缺乏经验”**,根本不理解研究机构的运作方式,也不了解研究人员的真正需求。一位AI界的老前辈、深度学习三巨头之一,其研究方向却要由一位二十出头的年轻人来指挥,这种冲突可想而知。

加之LeCun本人对于大语言模型“通往超人智能是死胡同”的坚定立场,与公司内部“被LLM洗脑”的主流观点格格不入。在如此复杂的环境下,LeCun在Meta内部从事基础研究的难度可想而知。他俨然成为了一位孤独的预言家,呐喊着眼前的繁荣可能只是海市蜃楼。
因此,他的离开,也就成为了必然。
告别Meta,深耕通用智能新范式
离开Meta之后,LeCun将把他毕生的心血,全部倾注到他所提出的**“世界模型”和高级机器智能的实现上。他看到了一个广阔的蓝海市场**:当所有人都涌向大模型赛道时,许多传统行业,例如喷气发动机、重工业等领域对AI的需求,却被大公司所忽视。LeCun认为,这些正是Meta不感兴趣,但却蕴藏巨大潜力的方向。
LeCun坚信,未来AI的突破将不再由Meta这样的大公司主导,而是会诞生于**“新生实验室”**形式的基础研究型创业公司。他提到了OpenAI前首席技术官米拉·穆拉蒂(Mira Murati)创立的Thinking Machines,以及OpenAI联合创始人兼首席科学家伊利亚·苏茨凯弗(Ilya Sutskever)创立的Safe Superintelligence,这些在他看来都是能带来颠覆性创新的地方。

LeCun表示,他的新架构将通过分析大量的视频数据,让AI模型理解物理世界最基本的规律。它能够预判接下来会发生什么,例如,当你扔出一个球,AI能够预测其运动轨迹。不仅如此,他还计划将**“情绪”这一概念融入其中。这并非让AI拥有喜怒哀乐,而是通过经验和评估,使AI的决策和预测更具“人性化”**,更贴近真实世界的复杂性。
他乐观地预计,在未来十二个月内,我们就能看到这种技术的**“婴儿版”。更大规模的应用可能还需要几年时间。他强调,这还不是他最终极的“超级智能”**,但这却是通向我们梦想中超级智能的必经之路。

增加世界的智能总量:LeCun的宏大愿景
也许你会觉得LeCun有些固执,有些理想主义。但他的AI追求,远不止于技术本身。他穷尽一生都在追逐一个宏大的目标:增加世界上的智能总量。
他坚信,当世界的智能总量不断提升,人类的痛苦就会随之减少,我们的决策将更加理性,对世界乃至宇宙的理解也会更加深刻。他曾言,人类所犯的错误,许多时候都源于“蠢”。

试想,如果未来真的出现了LeCun所预言的**“世界模型”**,一个真正理解物理世界、能够进行复杂推理的AI,它所能做的事情将远远超越现在大模型的范畴。它可能会设计出更高效的能源系统,发明出更强大的新材料,甚至帮助我们更好地理解生命和宇宙的奥秘。
这就像达尔文思考生命起源,爱因斯坦构思相对论一样,他们都曾行走在一条孤独的道路上,与当时的主流思想格格不入。然而,正是这些少数派的坚持,最终引领了人类文明的巨大飞跃。
当所有人都将目光聚焦于语言层面,惊叹于大模型的各种神奇之时,LeCun这位真正的AI教父,却选择了一条更为艰险、更为深远的道路。他试图让AI从**“读万卷书”进化到“行万里路”**,从理解语言的表象,到理解世界的本质。
他的离开,不仅仅是Meta的一次人事变动,更是AI领域一次思想上的大碰撞,一次路线选择上的大讨论。它提醒我们,切勿被眼前的繁荣所迷惑,真正的进步,往往诞生于反思和质疑。
或许,当我们跳出语言的束缚,让机器真正“看懂”这个世界的时候,人类距离真正的通用人工智能,才会迈出更坚实的一步。