AI 小镇之后,智能体开始模拟人类逃命
2023年斯坦福AI小镇证明了生成式智能体(Agent)能模拟人类日常行为,如今研究转向更严肃的方向:用大语言模型驱动的虚拟人模拟火灾、飓风等灾难中的逃生决策。卡内基梅隆、清华、天津大学等机构已发表研究,从场馆疏散推演到城市级社会模拟,补齐了“物理—认知分离”的仿真框架。该技术有望应用于应急预案SaaS、城市数字孪生和保险风险定价,但面临模型过度平均、验证成本高、安全对齐导致失真等风险,需警惕用模拟人替代真实人的诱惑。
事件概述
2023年斯坦福大学与Google联合发布的“AI小镇”项目,让25个大模型驱动的虚拟居民在像素小镇中自主生活、社交甚至策划派对,展示了生成式智能体(Agent)模拟人类行为的能力。然而,此后该领域的前沿研究并未停留在游戏与社交层面,而是转向了一个更严肃的应用方向——模拟人类在灾难中的逃生决策。卡内基梅隆大学、清华大学、天津大学等机构在过去一年中发表了多项研究,用智能体模拟地铁火灾、飓风疏散、大型活动人群管理等场景,试图将大模型的决策能力嵌入传统人群仿真,实现“物理—认知分离”的新范式。
核心信息
1. 从“粒子”到“有脑子的人”
传统人群仿真将人抽象为受“社会力”驱动的粒子,只能模拟密度和碰撞,无法模拟恐慌中的决策(如是否立即撤离、选择哪个出口、是否折返寻找家人)。大语言模型驱动的智能体能模拟“不确定性下的恐慌与决策”,使虚拟人具备情绪、误判和牵挂,从而实现更逼真的逃生行为。
2. 四块拼图正在补全
- 卡内基梅隆大学:与校方应急管理部门合作16个月,为毕业典礼等万人级活动推演疏散预案。从500个智能体迭代至13000个,最终成为培训协调员的日常工具。研究经验表明,模拟器需先在小事(如普通散场)上获得专家信任,再用于灾难推演。
- 天津大学联合清华、卡迪夫大学发布的RESCUE系统:首个实时大规模虚拟人逃生模拟,在ICCV 2025上发表。虚拟人基于“看—想—跑”循环决策,可逐帧分析碰撞力,区分年轻、老年、残障人群的不同步态,相比传统“粒子”模型,RESCUE虚拟人逃生更多、摔倒更少。
- 清华大学AgentSociety社会模拟器:将尺度拉升至城市级,上万个智能体生成500万次社会互动,研究议题包括飓风灾害下的人口流动与应急响应。同时引入验证方法:用真实飓风疏散记录评估智能体行为是否符合实际。
- 分层生成式智能体:将“慌乱”拆解为三层决策——顶层(撤离还是找家人)、中间层(走熟悉路还是绕开烟雾)、底层(具体步态),使灾难中的高压决策可计算。
3. 应用方向
- 应急预案SaaS化:传统疏散评估为一次性PDF,模拟器可迭代测试不同警报、出口配置的效果,成为“活”的预案工具。
- 城市数字孪生“补脑”:现有数字孪生缺乏动态人群,智能体可模拟市民在台风、地震中的行为,提升政府治理预算的吸引力。
- 保险风险定价:巨灾保险的核心是风险建模,而人是最大不确定变量。斯坦福2024年研究显示,通过深度访谈构建的“数字分身”在问卷调查中复现本人回答的准确率约85%,接近真人复测水平。
4. 潜在风险
- 模型过于平均:大模型捏出的智能体趋同于“理性的平均人”,但灾难真正致命的是非典型行为(如不愿撤离的老人、逆行救人的路人等)。
- 微观可信不等于宏观真实:每个智能体决策看似合理,但群体加总可能产生现实中不存在的集体幻觉。大模型模拟成本高昂,大规模验证目前难以实现。
- 安全对齐导致失真:商用大模型被训练得乐于助人、拒绝伤害,但灾难现场存在自私、推搡等人性暗面,过度对齐的模型可能给出过于乐观的预案。
- 替代真实人的诱惑:当模拟人足够便宜且好用,机构可能用AI替代真实调研、演练和公共决策。卡内基梅隆研究者强调:推演可交智能体,最终签字必须是人。
值得关注
生成式智能体正从虚拟小镇的派对场景转向灾难逃生模拟,标志着该技术从玩具阶段进入真实世界的生死问题检验。应急管理、城市治理、保险精算等领域的付费意愿远高于游戏和社交,但技术成熟度、验证成本、伦理风险仍需警惕。真正的挑战不在于AI是否更像人,而在于人类是否开始相信AI已经足够像人,从而替代真实人群的处境与权利。
