哈萨比斯如何带领DeepMind实现技术反超:愿景、战略调整与谷歌资源的合力
在经历早期对大语言模型的战略误判及内部整合阵痛后,谷歌CEO德米斯·哈萨比斯(Demis Hassabis)通过统一领导DeepMind与谷歌大脑,利用TPU算力优势及公司资源支持,于2025年底发布Gemini 3并在部分指标上实现对OpenAI的技术反超。哈萨比斯凭借超越时代的AGI愿景、科学家的执着以及强大的资源整合能力,将DeepMind从落后状态拉回竞争前沿,确立了其在谷歌AI生态中的核心地位。此次逆袭的关键在于软硬件协同优化、专注研发模式以及对强化学习与多模态技术的持续投入。
事件概述
谷歌DeepMind在掌门人德米斯·哈萨比斯(Demis Hassabis)的领导下,经历了从战略滞后到技术反超的过程。尽管早期因低估大语言模型潜力而落后于OpenAI,但通过内部重组、资源集中及硬件架构优化,DeepMind于2025年底发布的Gemini 3模型在部分关键指标上实现了对OpenAI最新模型的追赶甚至反超。
核心背景与战略转折
1. 早期战略偏差与落后
- 愿景超前但路线分歧:哈萨比斯早在剑桥大学时期便构想出通用人工智能(AGI),其愿景领先时代数十年。然而,他早期过度推崇强化学习,将其置于首位,而将大语言模型视为次要分支。
- 错失时间窗口:当DeepMind开始关注并试图追赶OpenAI的GPT-3时,OpenAI内部已完成参数量近2万亿的GPT-4预训练。这导致DeepMind在技术节奏上落后了一到两代。
- “盖亚”项目的局限:为模拟真实世界以训练AGI,DeepMind启动了耗资巨大的“盖亚”(Gaia)项目,旨在构建自然环境的强化学习试验场。该项目虽具学术价值,但因过于超前且难以产出实际成果,未能及时应对大模型浪潮。
2. 谷歌内部的整合与全力支持
- 组织合并:在经历Bard发布失利及内部模型混乱后,谷歌决定将DeepMind与谷歌大脑(Google Brain)合并,由哈萨比斯统一领导,集全公司之力打造Gemini系列模型。
- 资源保障:谷歌提供了稳定的资金、顶尖人才储备以及自研的TPU(张量处理单元)算力基础设施。这种软硬件协同的优势,使得DeepMind能够专注于模型研发而无后顾之忧。
- 战略定位清晰化:谷歌明确DeepMind的角色是进行“从零到一”的突破,特别是在AGI追求和算法架构科研方面,而非直接负责商业化应用落地。
逆袭的关键因素
1. 领导力与执行力
- 哈萨比斯展现出强大的资源整合能力。一旦决心竞争,他便善于调动全公司资源达成目标。作为诺贝尔化学奖得主,他的科学家身份增强了公众对谷歌AI方向的信任,同时其创新者本色推动了科研范式的变革。
2. 硬件与软件的深度协同
- TPU架构优势:不同于依赖GPU的竞争对手,DeepMind依托谷歌自研的TPU架构,实现了模型训练与推理的高效协同。新的TPU架构针对特定模型进行了适配,最大化了算力利用率,最终训练出了性能领先的Gemini大模型。
3. 专注研发模式
- 相比OpenAI面临的频繁融资压力及商业模式探索,DeepMind在谷歌体系内保持了相对稳定的研发环境。这使得团队能够专注于原生多模态、长上下文、持续学习及世界模型等DeepMind擅长的前沿方向。
未来展望与挑战
- AGI实现路径:哈萨比斯认为实现AGI仍需五到十年,并期待出现一两个Transformer级别的创新。目前,谷歌DeepMind仍是他实现这一终极目标的最佳平台。
- 潜在挑战:哈萨比斯对量子计算持保留态度,认为经典计算足以解决AGI问题,这与谷歌近期对量子计算的重视形成一定张力,可能影响未来的技术布局。
- 竞争格局:尽管Gemini 3在部分指标上实现反超,但OpenAI凭借ChatGPT占据的用户心智优势依然显著。此外,Anthropic及中国开源模型的崛起也构成了新的竞争压力。
