在人工智能竞争持续升温的当下,围绕 DeepMind、OpenAI 与 Anthropic 的讨论,已经不再只是“谁的模型更强”的问题,而是逐渐演变为一个更深层的命题:顶级 AI 实验室究竟如何组织研究、选择技术路线,并在算力、资本与安全之间做出长期取舍。
在近日 InfoQ 对《哈萨比斯:谷歌 AI 之脑》(TheInfinityMachine)作者、知名科技史学家、金融史学家塞巴斯蒂安·马拉比(Sebastian Mallaby)的采访中,我们尝试从一个更接近“内部观察者”的视角,重新理解 DeepMind 的成长逻辑,以及它与 OpenAI、Anthropic 之间真正的结构性差异。
作为长期跟踪哈萨比斯及其团队的观察者,马拉比认为,DeepMind 的优势并不仅仅来自谷歌提供的算力和资金,更来自一种独特的组织方式:既允许科学家长期自由探索,又能在关键时刻迅速形成突击小组推动突破。这种机制,使它能够持续攻克 AlphaGo、AlphaFold 这样需要十年以上投入的问题。
与此同时,不同实验室在“安全与速度”之间的取舍差异,也正在成为影响 AGI 竞争格局的重要变量。而随着 AI 规模化(scaling) 从训练阶段扩展到推理阶段乃至未来智能体层面,AI 进步的动力结构本身也正在发生变化。
从这个意义上说,今天的 AI 竞争,已经不再只是模型能力的竞赛,而是一场围绕组织模式、研究方法与系统资源配置展开的长期博弈。
InfoQ:您在书中提到,哈萨比斯在 MIT 的导师托马索·波吉奥(Tomaso Poggio)曾表示,他遇到的很多诺奖得主,既才华横溢又运气极佳。有少数诺奖得主天赋异禀,无论研究什么注定会获奖。2009 年辛顿遇到哈萨比斯,认为他是比自己更争强好胜的人。如果让您用几个词形容哈萨比斯,会是什么?为什么这么说?
马拉比:让我用三个词来形容他的话,我会说天造之才、争强好胜、友善谦逊。
天才这个自然不必多说了。争强好胜是他发自内心地渴望胜利,渴望做出一番了不起的成就。我觉得这和他从小参加国际象棋比赛有关。他才六岁的时候,就早早地置身于激烈的竞争之中,也因此变得极具好胜心。这份好胜心,成了他前进的动力。
但反过来想,如果一个人只是争强好胜、天赋异禀,为人却不友善,那别人就不会愿意为他效力,也不会喜欢他,甚至会想方设法给他使绊子、阻碍他。而他的优势就在于,大家都很喜欢他。人们和他接触后,都会觉得他为人正派,价值观很好,希望人工智能能为人类带来福祉。正因如此,大家才愿意支持他的事业。我很难想象,如果没有这份善良,他还能否取得今天这般成就。
InfoQ:所以你认为 DeepMind 如今的成功与哈萨比斯这个创始人谦逊、善良的个性有关吗?与其他 AI 实验室相比,DeepMind 又有哪些独特之处?
马拉比:是的,我认为这些都与哈萨比斯的个性密切相关。
DeepMind 的独特之处首先在于,它成立于 2010 年,那时候人工智能甚至连一张猫咪的照片都识别不出来。当时相关技术还完全不成熟,可还是有人愿意加入这家公司,投身于一项尚未成功的事业。正是这份超前的投入与远见,让 DeepMind 在最初大约十年里一直处于行业领先地位,直到 ChatGPT 问世,赛道才迎来了激烈角逐。而在那之前的十年,他们始终遥遥领先,这一切都源于起步之早,而这无疑直接归功于哈萨比斯。他从 18 岁、进入剑桥大学之前,就坚信人工智能的可能性,早早地就对这份愿景矢志不渝。这或许也是造就他的另一项特质:他不仅好胜、是天才、为人善良,更是一位具有远见卓识的先行者。
InfoQ:您书中提到,哈萨比斯其实并不喜欢商业管理。他的理想组织形态是“贝尔实验室 + 学术研究所”。DeepMind 团队一直在英国独立办公,团队早期很多制度是允许科学家长期研究、不要求短期产品以及他们的论文可以公开发表,这和硅谷很多公司完全不同。这些看起来“过于自由”的条件,会不会给哈萨比斯的管理带来困难?通常习惯了自由的人,尤其是天才们,是不愿意受到约束的。
马拉比:我认为 DeepMind 最关键的一点,是他们给了这些顶尖人才极大的自由。研究员们可以自主决定研究方向,发表学术论文,拥有类似在大学里的研究自由。
但如果 DeepMind 只有自由,那只会变成一群人各做各的研究,最终拿不出任何成型的产品。而哈萨比斯把自由探索和集中攻坚结合了起来——当他判断某个研究方向已经具备取得重大突破的条件时,就会下令:“好了,这条路线可以落地了,我们要组建专门团队,全速推进,实行自上而下的集中管理。”
他把这类团队称作“突击小组(strike team)”。从最早开发雅达利游戏智能体,到后来的 AlphaGo,再到 AlphaZero 直至 AlphaFold 在内的一系列模型,背后都有这样的突击小组。在突击小组里,会有负责人统一指挥,所有人朝着同一个目标冲刺,有时间压力和截止日期,工作强度极高。
所以哈萨比斯的天才之处,就在于把自由探索和成果转化结合在了一起——利用理论科学上的突破,落地打造出 AlphaGo 这样的产品。
他之所以懂学术自由,是因为自己读过博士,了解大学的研究模式;而组建突击小组的思路,则来自他的游戏行业经历——他曾在游戏公司任职,还自己创办过一家,很清楚游戏公司如何赶工期、按时交付产品。他正是把这两种模式完美融合在了一起。
InfoQ:像 DeepMind 这样的顶级 AI 实验室是如何组织和管理人才的?例如如何招聘科学家?如何管理顶级研究人员?是否会给他们很高的薪酬或者更多的资源?
马拉比:在最初阶段,公司给的薪资其实并不高,因为当时他们的资金非常有限。虽然会提供公司期权,但大多数加入的人并不认为这些期权未来会有价值——因为当时的 AI 既没有成熟的产品,也没有清晰的盈利模式。
因此,在创业早期,要吸引优秀人才其实是很困难的。我认为,德米斯能做到这一点,很大程度上是因为他和他的联合创始人沙恩·莱格(Shane Legg) 本身都是非常受尊敬的科学家,这使得其他研究人员愿意加入他们的团队。
另外,还有一些人加入的原因是,他们并不想处理创业公司中的那些“非科研”事务,比如和律师打交道、对接投资人、考虑办公场所等。这些事情在他们看来既烦琐又无聊。如果德米斯愿意负责这些组织和管理工作,他们就可以专注于自己擅长的科学研究。因此,一些人(比如参与雅达利项目的研究者姆尼赫)就提到,这正是他加入的原因。
不过到 2014 年之后,情况发生了明显变化。被谷歌收购后,DeepMind 获得了充足的资金支持,不仅能够提供更具竞争力的薪酬,也建立了更加稳定、完善的工作环境,包括更优质的办公条件和高质量的免费餐食。整体而言,收购之后,这里的工作体验显著提升。
此外,随着 AI 技术不断发展,科研对算力的依赖也越来越强。要让模型真正取得突破性效果,需要大量先进的半导体和计算资源。因此,对于科学家来说,能否获得充足的算力成为一个关键因素。而在 DeepMind 工作,可以直接使用谷歌的算力和芯片资源,这也成为吸引顶尖人才加入的重要原因之一。
InfoQ:DeepMind 在被谷歌收购时并非完全处于“被动求生”状态,您在上次分享中也提到过,当时 Meta CEO 扎克伯格曾邀请哈萨比斯共进晚餐商议收购之事,马斯克也曾向他们抛出橄榄枝,也就是说,DeepMind 在进入谷歌体系之前就已自带光环了。那是不是可以解读成 DeepMind 进入 Alphabet 体系中享有很高的话语权?这是 DeepMind 成功的因素之一吗?
马拉比:是的,我认为,当时有其他公司也有意收购他们,这一点在他们最终卖给 Alphabet 时,实际上增强了他们的谈判筹码。
不过,我也认为更关键的一点在于 Alphabet 的领导层——尤其是拉里·佩奇(Larry Page),以及后来接任的桑达尔·皮查伊(Sundar Pichai)——在与德米斯接触之后,很快意识到他是一个非常特别的人。他们非常希望能够留住他,并且愿意按照他的想法去推进事情,因为他们认为他极具价值。
在收购 DeepMind 时,来自加拿大的深度学习先驱杰弗里·辛顿(Geoffrey Hinton)曾开玩笑地说:“就算只买德米斯一个人,也值 1 亿到 1.5 亿英镑。”这其实反映了他们对德米斯的高度评价——他不仅是一个创业者,更是一个具有天才级洞察力的人。
正因为如此,谷歌在收购之后给予了 DeepMind 极高的重视和充分的资源支持,包括大量的研究资金。这也是 DeepMind 后来能够持续取得成功的重要原因之一——本质上,是因为谷歌对德米斯的认可与信任,并愿意长期支持他的研究方向。
InfoQ:即使有很高的话语权,但谷歌毕竟是一家商业公司,DeepMind 是如何在长期科研和短期成果之间取得平衡的?
马拉比:在相当长一段时间里,DeepMind 的重心一直是长期科研,而不是产品化。它基本没有推出真正意义上的商业产品,虽然也曾尝试过一些医疗应用,但那更多是因为德米斯的联合创始人穆斯塔法·苏莱曼( Mustafa Suleyman)的推动,而不是谷歌的核心诉求。
谷歌当时是允许,甚至支持 DeepMind 专注于基础研究的。它每年投入近 10 亿美元来支持这些研究项目——这是一个非常大的投入,但对于现金充裕的谷歌来说,是可以承担的。
这种局面在 2022 年发生了根本性变化。随着 ChatGPT 的推出,谷歌突然意识到,传统搜索引擎可能会被基于大语言模型的新型搜索方式所颠覆。这种威胁让谷歌感到紧张,因此他们迅速转向,希望与 OpenAI 竞争,并开始要求 DeepMind 从以科学研究为主,转向更偏产品化的方向,尤其是开发大语言模型。
一开始我也在想,德米斯是否会对此感到不适应,毕竟他本质上是一位科学家。
但后来我和他交流时,他的看法很有意思。他说:“你要记住,在创立 DeepMind 之前,我运营的是自己的创业公司万灵药工作室(Elixir Studios),那是一家游戏公司,我们是做产品的。我并不排斥做产品,而且我本身也是一个很有竞争心的人,我也希望在这场竞争中获胜。”
他还提到,到了这个阶段,AI 的发展已经进入一个新的状态:构建大语言模型,一方面是在打造产品,另一方面本身也是在推进科学前沿。
事实上,自从 ChatGPT 出现之后,我们已经看到大量新的技术进展不断涌现,比如:
这些前沿探索本身就发生在“产品形态”之中。因此,在当前阶段,科学研究与产品开发并不是二选一的关系,而是可以同时推进的两条路径。
InfoQ:在收购后的最初几年里,DeepMind 与谷歌之间最大的文化冲突是什么?谷歌在多大程度上允许 DeepMind 保持科研独立?
马拉比:这些文化上的分歧,主要集中在“安全性”问题上。DeepMind 希望建立一套更独立、更特殊的治理机制,以确保 AI 不会仅仅被用于服务某一家公司的商业利益。他们设想成立一个类似“伦理和安全审查委员会”的机构,成员可能包括像美国前总统奥这样的人物,由这个机构来决定 AI 应该如何被使用。
对于这个想法,谷歌在表面上有时似乎表示支持,但实际上并没有真正打算落实。因此,双方围绕这一问题,与律师、投行顾问等一起,进行了长达三年的反复博弈。
在这段时间里,德米斯甚至曾尝试寻找其他出路,比如去接触阿里巴巴创始人马云,希望获得资金支持,让 DeepMind 重新独立运作。这可以说是双方最核心的一次“文化冲突”。
不过,在科研层面上,双方的分歧其实并不明显。谷歌一直非常支持 DeepMind 开展前沿研究,比如 AlphaGo 项目。
事实上,在 AlphaGo 于韩国比赛期间,谷歌的联合创始人谢尔盖·布林(Sergey Brin),以及当时的 CEO 埃里克·施密特(Eric Schmidt)等高层都亲自前往现场观赛,他们对这一项目非常投入,也非常享受这一历史性时刻。
InfoQ:您提到谷歌和 DeepMind 之间曾爆发了激烈的文化冲突,您在书中也提到德米斯差点就带着团队离开了谷歌。但最后为什么又决定留下来了,谷歌做了一些什么样的妥协吗?
马拉比:其实归根结底,德米斯在那段时间最想做的还是科研。因为如果真要为了自立门户再去创办一家新公司,他不仅得四处奔波拉投资,还得雇一堆律师去跟谷歌法务部“撕破脸”,这肯定会让谷歌那边大动肝火。对他来说,与其深陷这种无休止的商业纠葛,他显然更愿意把全部精力都放在攻克 AI 科学难题上。
所以我觉得,这才是他最终选择留下的原因。
还有一个很有趣的点:德米斯的大本营在伦敦,而不是硅谷。在硅谷,那种“你必须得拥有自己公司”的创业狂热几乎是一种信仰;但在伦敦,这种氛围没那么激进。德米斯 显然更愿意坚守最初把公司卖给谷歌时的那份初心。
在他面前,其实摆着两条截然不同的路:一条是靠独立打拼建立一个庞大的商业帝国,成为身家百亿的超级富豪;另一条则是深耕科学领域,发明真正的 AI,最终问鼎诺贝尔奖。
显然,比起那几十亿美金,他更渴望那一枚诺贝尔奖章。
InfoQ:我们能否讨论一个假设,如果 DeepMind 没有被谷歌收购,它今天会是什么样?
马拉比:在我生活的英国,常能听到一种声音:“唉,要是当初 DeepMind 没卖给谷歌该多好,那样我们现在就有一家独立的英国 AI 巨头了。”
但我完全不这么看。
我认为当时的 DeepMind 真的太缺钱了。你完全可以换个角度来看待这桩收购:这根本不是什么“英国 AI 产业的损失”,正相反,这是英国的一大胜利。像德米斯这样天才的英国创业者,凭本事说服了一家美国巨头,心甘情愿地每年往伦敦的 AI 实验室里砸近10 亿美元。
想一想,美国人拿着大把钞票来投资英国,这难道不是天大的好事吗?
如果德米斯当时没把公司卖给谷歌,凭他的天赋和那股子不服输的劲头,他肯定也能成功。他大概率会保持独立,或者转头去拿埃隆·马斯克之类大佬的投资。但那条路肯定要难走得多,因为手里的钱会缩水,而且还得整天面对各种“内耗”——毕竟马斯克可是个极度好斗的人。
如果没有谷歌的财力支持,像 AlphaGo 这样的奇迹可能要推迟很久才会出现。但无论如何,德米斯最终还是会成为 AI 领域的领军人物。那是他的使命,也是他的天赋所在——只要是他想做成的事,这世界上恐怕没什么能拦得住他。
InfoQ:AlphaGo 可以说让 DeepMind 一战成名。在谷歌内部,伴随着 AlphaGo 的成功,谷歌高层有没有重新评估 AGI 价值?您认为这场胜利是否改变了 DeepMind 在集团内部的话语权?具体体现在哪些方面?
马拉比:对于谷歌的每一个人来说,DeepMind 在 AlphaGo 上的胜利无异于一记具有震撼性的警钟。
通过那场比赛,所有人真切地看到了 AI 蕴含的恐怖力量。早些时候,谢尔盖·布林还曾断言:“要做出一个能下围棋的系统肯定难如登天。”结果,德米斯用事实狠狠地打了他的脸。谷歌高层不得不承认,AI 的进化速度早已远超他们的预期。
从那时起,研发预算开始疯狂飙升。原本 DeepMind 的经费就已经很高了,AlphaGo 之后更是又翻了一番。
可以说,这场胜利成了德米斯手里最有力的筹码,让他能说服谷歌源源不断地砸钱。而一年后(2017 年)横空出世的AlphaZero,则进一步巩固了他的地位,证明了这种投入是完全值得的。
InfoQ:无论是 AlphaGo,还是 AlphaFold,都在业内备受关注。在您看来,AlphaGo 与 AlphaFold 在方法论上有什么共通之处?
马拉比:它们其实都是“无限机器”的例子。
以围棋为例,先手一开始可以在 361 个交叉点中选择任意一个落子,然后轮到后手有 360 种选择。接下来依次是 359、358……如果把这些可能性相乘,很快就会得到一个极其庞大的数字——每一步棋、每一个应对,以及对应对的再应对,都会形成爆炸式增长的可能性空间。
所以,这是一个巨大的搜索空间,一个几乎无限的可能性集合。我把它称为“无限机器”。也就是说,像 AlphaGo 这样的系统,本质上是一台能够从几乎无限的可能走法中提取出“意义”的机器。
如果你再看蛋白质结构——一张蛋白质的图像,你会看到它是如何折叠的。里面有无数细小的弯曲,而每一个弯曲都可能朝不同方向变化。因此,蛋白质可能形成的结构组合,比围棋还要大得多,某种意义上说,已经非常接近“无限”。
但 DeepMind 仍然发明了一种机器,能够在所有这些可能的组合中预测出正确的蛋白质结构——这些组合所涉及的原子数量甚至超过宇宙中的原子数。所以,从这个角度看,它同样是一台“无限机器”。我认为这就是两者之间最核心的联系:如何从如此庞大的数据和可能性中提取出有意义的结果。
AlphaFold 的确是一个非常重要、具有里程碑意义的成就,在全球范围内都是如此。那么,为什么 DeepMind 选择把它开源?
一方面,是出于帮助全世界、推动科学进步的考虑;另一方面,也是因为 DeepMind 认为,他们之所以能够做出 AlphaFold,很大程度上得益于一个长期积累的科学共同体。
比如 CASP 这个竞赛——它是由学术界发起的,每两年举行一次,让不同科研团队竞赛蛋白质结构预测。在 DeepMind 于 2020 年获胜之前,这个竞赛已经持续了大约 18 年。
也就是说,在 DeepMind 解决这个问题之前,整个领域已经有了大量的基础研究工作。因此,DeepMind 也希望通过回馈学术界的方式,来表达感谢——他们把 AlphaFold 系统开放出来,让整个领域都能使用这些预测结果。
如果他们只是利用了所有人的开放研究成果,却不公开自己的研究,那在道义上会显得不太合适。所以,这也是他们选择开源的重要原因之一。
当然,还有一个现实层面的因素:在商业应用,比如药物研发中,仅仅是 AlphaFold 2(也就是后来获得诺贝尔奖的版本)其实还不够。
你不仅需要知道蛋白质的结构,还需要理解蛋白质之间、蛋白质与其他分子之间是如何相互作用的。这正是 AlphaFold 3 和 4 要解决的问题。
而 AlphaFold 4 并没有开源,它是专有的系统。这也意味着它正在逐渐走向产品化阶段,因此 DeepMind 和谷歌选择将其保留在内部。
InfoQ:无论 AlphaGo,还是 AlphaFold 都是非常伟大的成就,那 DeepMind 是如何选择“值得投入十年的课题”的?有哪些判断依据是可复制的?
马拉比:德米斯经常提到一个概念,叫作“科学品味”(Scientific Taste)。
他有一种敏锐的直觉:能“嗅”出 AI 领域中哪些悬而未决的问题虽然极具挑战,但只要拼命攻关两年就一定能捅破那层窗户纸。他极其擅长进行这种战略豪赌。这种能力不仅源于他对科学前沿的深刻理解,更源于他看透了科学家这个群体的运作逻辑。
他曾跟我讲过一个关于 AlphaFold 的精彩故事。
2018 年时,团队已经研发了两年,做出的系统虽然贵为全球最强,但还远没有达到能预测“所有蛋白质形状”的终极目标。它只是比其他 AI 强,但离解决问题还差得远。当时,团队负责人安德鲁·西尼尔(Andrew Senior)甚至有些灰心地对德米斯说:“这题我们解不出来,实在太难了。我们已经尽力了,2018 版系统表现不错,已经领先全人类了,但求你别逼我们去预测自然界所有的蛋白质,那根本不可能。”
但德米斯直觉认为,预测所有蛋白质是有可能的。为了验证自己的判断,他亲自参加了 AlphaFold 团队的每一次技术研讨会。
他在会上并不多说话,而是在冷静地观察团队的讨论是否“流畅”(fluent)。
所谓的“流畅”,是指大家是否在源源不断、快速地蹦出新的研究灵感。德米斯认为,只要灵感还在流淌——哪怕有些想法现在看起来不一定对——只要大家还有“产生新点子的能力”,就说明科学进步的空间远未枯竭。
基于这种观察,德米斯决定顶住压力,拒绝关闭项目。他不仅没有听从老负责人的撤退建议,反而换了主帅,提拔了年轻的约翰·江珀(John Jumper)。
江珀坚信成功就在前方,德米斯则给了他毫无保留的支持。两年后,他们交出了足以问鼎诺贝尔奖的科研成果。
这个故事告诉我们:作为领导者,你不仅需要那种判断“什么能成”的科学品味,更要学会坐在会议室里,去捕捉那些思维碰撞的火花,去倾听灵感流动的声音。
InfoQ:AlphaGo、AlphaFold 都只是 AGI 路线上的阶段实验。您赞同这个说法吗?
马拉比:嗯,可以这么说。我认为它们确实都推动了人工智能科学的发展。而在这条漫长路径的尽头,将会是通用人工智能(AGI)。
不过从另一个角度来看,你也可以认为,大语言模型的成功源自人工智能研究中的另一条技术路线,这条路线并不包括强化学习,因此它和 AlphaGo 的路径并不相同。
而且,它与 AlphaFold 也有一定程度的分离。AlphaFold 的确使用了 Transformer 模型,但那是一种特殊形式的 Transformer。关于 AlphaFold 和 Transformer 的相关研究,大致集中在 2018 到 2020 年之间,更准确地说是在 2019 到 2020 年。
与此同时,OpenAI 已经在基于 Transformer 架构构建大语言模型了。因此,我更倾向于把这看作是人工智能进展中的另一条独立技术路线。
所以,从宏观上看,任何在 AI 领域的重要突破,都会推动未来的发展;但从更具体的技术起源来看,大语言模型的诞生路径,其实是相对独立的。
InfoQ:根据您对 AI 行业的了解,您认为 DeepMind、OpenAI、Anthropic 的核心差异是什么?
马拉比:首先,一个很大的差异在于它与谷歌的关系。就像我之前说的,DeepMind 有来自谷歌的大量资金支持,这是一个非常大的优势。因为即便在今天,训练这些模型的成本依然极其高昂,而它们带来的收入其实并不多。
所以现阶段,你必须有充足的资金支撑,而德米斯很幸运,有谷歌在背后支持。相比之下,Anthropic 和 OpenAI 需要不断去找投资人融资,这本身就很困难——这是一个很关键的差别。
不过在其他方面,它们其实又很相似。比如说,它们都有自己的大语言模型,而且这些模型整体水平都很高。不同时间点上,可能某一家会领先另外两家,但这种领先是动态变化的。
如果换一个角度来看它们的差异,可以从“安全性”入手。Anthropic 对安全问题非常重视,甚至不久前还因为 AI 在军事系统中的应用问题,与五角大楼发生过争议。
而 DeepMind 在这方面的表现则不太一样。我认为德米斯本人也是重视安全的,包括在军事应用方面,但他并没有和政府发生正面冲突。所以你可以说,Anthropic 是最愿意为推动安全议题而承担风险的公司;DeepMind(以及谷歌)排在中间。
至于 OpenAI,就很有意思了。从外部表现来看,它似乎没有那么强调安全——比如在 Anthropic 和五角大楼发生争议时,OpenAI 的态度更像是:“没问题,我们可以提供 AI。”
这在某种程度上也类似他们发布 ChatGPT 时的策略:他们并不介意推出一个可能存在风险的产品,而是选择先发布再迭代。相比之下,Anthropic 和 DeepMind 都曾因为更谨慎,而没有发布一些模型。
所以如果做一个粗略排序:
你提到 OpenAI 最近招募了 OpenClaw 的开源项目创始人彼得·斯坦伯格(Peter Steinberger),也在问这会不会对谷歌或 DeepMind 构成威胁,尤其是在 OpenClaw 现在很火的情况下。
我认为,在谷歌 DeepMind 内部,本身就有大量在做智能体的优秀研究人员。即使招募了一个做出 OpenClaw 的人,也不太可能从根本上改变整个竞争格局。
另外一点很关键:OpenClaw 确实令人印象深刻,但它同样也具有一定的风险性。真正的挑战在于,如何做出既强大又安全的系统——只有这样,它才真正具备大规模应用价值。而至于彼得是否能够做到这一点,目前其实还无法确定。
InfoQ:谷歌、OpenAI、xAI、Anthropic 以及中国的 DeepSeek、阿里巴巴、腾讯等公司,您认为谁最接近 AGI?
马拉比:AGI(通用人工智能)的定义一直都是不精确的,人们其实并没有一个统一、清晰的标准。
从某种角度来说,你完全可以这样理解:现在这些优秀的大语言模型,本身就具备“通用性”(general)、“人工性”(artificial)以及一定程度的“智能”(intelligent)。因此,也有人会认为——某种意义上的 AGI 其实已经出现了。
但这本质上取决于你如何定义 AGI。
一种更务实的理解方式是:AGI 应该是一种在现实世界中极其有用的机器,尤其是在商业环境里,能够执行原本由人类完成的工作。换句话说,它不只是“聪明”,而是“能干活”。
在这个维度上,你可以看到一些非常具体的进展。例如,Claude Code 这样的系统,已经能够非常高效地编写代码,以至于企业对程序员的需求结构可能发生变化——过去可能需要 20 个工程师,未来也许只需要 10 个,因为有一半的代码是由模型完成的。
当然,这并不是某一家独有的能力。其他公司也在做类似的事情:比如 OpenAI Codex,以及谷歌 DeepMind 自己的代码生成模型,中国的一些模型在代码生成方面也表现不俗。
所以问题就变成了:谁现在最好?也许此刻可以说是 Claude,但六个月之后,很可能格局就会变化。
换句话说,在“是否接近 AGI”这个问题上,我们已经进入了一个新的阶段:关键不再只是“有没有”,而是“谁在什么任务上更实用、替代性更强”,以及这种能力能否持续、稳定地提升。
InfoQ:那您认为,AGI 突破更可能来自模型规模,还是新的算法?
马拉比:到目前为止我们取得的进展,其实是多方面共同作用的结果。
很重要的一点是要理解:无论是来自谷歌、OpenAI,还是 Anthropic 的进展,虽然它们确实在不断扩大算力规模(scaling compute),但这并不是全部。与此同时,它们也在持续改进算法、优化工程实现,并进行各种技术创新,这些共同推动了整个 AI 科学的发展。
所以,本质上这是一个“规模 + 技术”的组合驱动过程。而我也认为,未来大概率仍然会延续这种组合路径。
当然,现在很多人在讨论一个问题:算力扩展是否会遇到瓶颈?我的看法是,每当人们认为“扩展快到极限了”的时候,总会出现新的扩展方式。
比如说,早期的基础模型通过扩大训练规模获得了巨大提升,但后来这种边际收益可能开始下降。于是,又出现了新的扩展路径——比如在推理阶段对“推理模型”进行扩展,这又带来了新的性能提升空间。
再往未来看,也许还会出现新的规模化维度,比如智能体或者具身智能的扩展。
因此,我的判断是:规模化本身不会消失,它只是在不断换一种形式出现,并且仍然会是一个长期存在的核心竞争优势。
本文来自微信公众号“AI前线”(ID:ai-front),作者:冬梅,编辑:蔡芳芳,36氪经授权发布。
发布时间:2026-04-07 13:20