从游乐园模拟游戏里长出来的DeepMind
本文揭示了DeepMind创始人哈萨比斯的AI发展理念源于其早年开发模拟游戏《主题公园》的经历,即通过简单局部规则在受控环境中“涌现”出复杂秩序。哈萨比斯将这一思想延伸至认知神经科学,提出大脑本质是模拟引擎,并以此指导DeepMind构建从AlphaGo到Gemini的通用人工智能系统。如今,DeepMind正致力于建立虚拟细胞模型,试图通过模拟解开生命起源的终极奥秘。
1996年,我拥有了第一台电脑。当然在学生眼中,它更像是一台游戏机。那台奔腾100电脑的硬盘只有540M,但那时候我感觉它能装下整个世界。我用它玩过上百个游戏,其中最早的几个就包括《主题公园》。 30年后我才明白,我每天使用的Gemini及其背后的DeepMind,其精神内核竟直接源自这款古老的游戏。 这段故事记载于DeepMind创始人哈萨比斯(Demis Hassabis)的个人传记中。昨天拿到这本书后,我一口气读完了。内容非常丰富,从他的童年一直写到2025年与OpenAI的竞争,而最让我感兴趣的还是关于“模拟”的部分。 “模拟”一直是我在AI领域最感兴趣的方向,此前我也曾断断续续地谈论过。在这本书中,这部分内容并非重点,只是匆匆几页带过。我又花了一些时间搜索了大量资料。读完这些资料我才意识到:模拟根本就是DeepMind的起源和核心。 主题公园 1994年,17岁的哈萨比斯在牛蛙工作室(Bullfrog Productions)担任《主题公园》的首席程序员和共同设计者。不同于打怪通关的游戏,《主题公园》让玩家在一个被压缩的微型世界中设计、建造并运营一个游乐园。 在这个游戏中,他没有用死板的脚本规定游客该怎么走,而是奢侈地为每个像素小人分配了约200字节的内存。内存里保存了它们独立的饥饿感、渴感、快乐度和预算。每个像素小人并不具备真正的智能,但它们开始有了自己的局部条件驱动力。(1994年的主流PC是486,大都是4M-8M内存。) 神奇的事情发生了。如果玩家为了赚钱把薯条的含盐量调得很高,吃完薯条的游客就会普遍更渴,他们就会改变路线,朝饮料店移动。 如果饮料店太少,队伍就会拉长;如果队伍太长,一部分游客会烦躁、愤怒、降低满意度,甚至提前离园。局部的小小参数改变,最终会演化成整个乐园的人流波动、情绪变化、收益变化,乃至秩序混乱。 哈萨比斯没有写过任何一行让游客“排队暴动”的代码。他在这款公园模拟器里第一次亲眼见证了“涌现行为”:只要设定极简的局部规则,把它们放进一个模拟环境里,复杂的群体智能就会自然而然地“长”出来。 《主题公园》最终卖了一千五百万份,是历史上最畅销的模拟游戏之一。 对于一个普通玩家来说,《主题公园》是有趣的。但对于哈萨比斯来说,它意味着一种世界观的开端。一旦你在少年时期亲眼看过“简单规则如何长出复杂秩序”,你看世界的方式就很难不发生变化。 交通是不是某种涌现?市场是不是某种涌现?社会是不是某种涌现?智能本身,会不会也是某种涌现? 读完他的整条人生路径会发现:游戏,更具体说是模拟游戏,对他来说就是AGI(通用人工智能)思想最纯粹的雏形——在一个受控的宇宙中,设立规则,秩序自现。 模拟国家 到了1998年,哈萨比斯的野心膨胀了。他创办了Elixir Studios,试图打造一款叫《共和国:革命》(Republic: The Revolution)的游戏。他不再满足于一个商业化游乐园的局部秩序,而是试图去模拟更宏大的系统:政治、派系、权力、财富、影响力、动员、忠诚、腐败、社会情绪、资源流动。 《主题公园》里的游客,已经有了口渴、饥饿、快乐、预算这些状态,但他们终究不是“谁”。而在《共和国》里,哈萨比斯最初想要的,是另一种更难的东西:这些虚拟公民不只是参数的组合,不只是响应刺激的棋子,而是各自有日常、有信念、有动机的人。某种意义上,每个人都是自己。当年的宣传材料上是这么说的:一百万市民,人人都有自己的希望、梦想与住所。 这意味着他试图模拟的已经不只是“国家机器如何运转”,还包括“社会中的人如何作为自己而存在”。 这次他失败了,从项目管理、技术规模、玩法平衡、开发周期、商业结果来看,都出了各种各样的幺蛾子。 但如果只把它理解成“野心太大所以翻车”,还是低估了它的意义。他遇到的是更深的问题:一个‘每个人都是自己’的世界,是不太可能靠编写规则去实现的,哪怕这个规则可能复杂到数千条。 模拟即智能 哈萨比斯意识到,要真正做出那种能自我演化、具备通用处理能力的模拟系统,他必须先搞清楚:生物大脑到底是怎么产生智能的。于是他果断离开了游戏行业,进入伦敦大学攻读认知神经科学博士学位。 2009年,他在博士论文里抛出了一个划时代的理论:人类大脑的海马体不仅仅是用来存储记忆的硬盘,它更是一个模拟引擎。通过fMRI实验,他证明了:无论人们回忆过去、想象未来,甚至做白日梦时,大脑其实在调用同一套神经回路。这套回路的核心功能,就是构建并运行一个“内部模拟模型”。我们的大脑产生智能的本质,就是能在内部构建并运行关于现实世界的模拟模型。 DeepMind时代 2010年,带着“大脑本质上是一个模拟引擎”的顿悟,DeepMind正式成立。从第一天起,这个“基因”就深深烙印在公司的DNA里:AI不再依赖人类预设的繁琐代码规则。无论是扔进受控的物理沙盒,还是投入浩瀚的数据海洋,智能都必须通过算法的自我摸索,自下而上地“涌现”出来。于是我们看到了在雅达利游戏里,AI摸索出了完美的通关策略并击败了人类选手。看到了AlphaGo在围棋的数字世界中与自己对弈千万局,击溃全人类棋手。 在一次与Lex Fridman的对谈中,哈萨比斯将“模拟”的思想推向了宇宙和物理学的极限。他提出了一个观点:大自然中生成的任何模式,都可以被算法发现和模拟。 因为大自然不是随机的。物理世界和生物系统的结构,是经历了数十亿年进化和自然选择后留下的产物。所以,这些现象背后藏着一张“隐形的地图”。 所以我们看到了AlphaFold的成功。它在蛋白质的物理世界中构建了一个极其精确的内部模拟模型,从浩瀚如繁星的氨基酸组合空间中找出了折叠生命的密码,一举斩获诺贝尔奖。 现在它的沙盒不再局限于单一的棋盘或蛋白质图谱,它正在将人类的文字、图像、声音和代码全部纳入其庞大的原生多模态世界模型中,试图理解并推演人类社会这个最复杂、最宏大的现实沙盒。这就是我们每天都在用的Gemini。 我曾写过几篇关于DeepMind论文的随笔,探讨过他们一个很特别的理念:AGI可能并非单一的模型,而是由千万个智能体的互动所催生出的一种宏观市场状态。 曾经我觉得这是纯粹的学术推演。但现在我才明白,这分明是哈萨比斯个人世界观的完美投射。 虚拟细胞与生命 如今哈萨比斯正在追逐一个酝酿了25年的梦想:建立一个完整的“虚拟细胞”模型。 他计划从酵母菌开始,模拟细胞内部所有的动态交互和通路。如果在硅基环境中能实现如此高精度的生命模拟,那么未来的科学实验将在计算机里以百倍的速度推进。他认为AI有朝一日能通过在“原始化学汤”中进行组合搜索的模拟,来解开生命究竟是如何起源的终极奥秘。 一切都是最初的游乐园 从给虚拟小人调薯条的含盐量,到让AI像生命演化一样自主‘繁衍’出全新的代码;从电子游戏里简陋的像素沙盒,到试图折叠宇宙规律的物理沙盒。哈萨比斯坚信信息是宇宙中最基本的单位,而AI就是用来模拟这些信息结构的终极工具。 30年前,我在那台奔腾100前拨弄着鼠标,看着小人排起长龙,乐此不疲。 那时我绝不会想到,装在几兆内存里的像素沙盒,竟然是人类通向AGI的一次微缩彩排。DeepMind的灵魂早在那时就已经在这个简陋的游乐园里悄悄发芽了。
