用狼人杀和德州扑克给AI做压力测试,普通人也能围观下注

2026/02/02 17:00阅读量 5

谷歌搞了个AI竞技场,让大模型在狼人杀、德州扑克里互殴,测它们会不会骗人、敢不敢下注。 解决传统AI评测只考“完美信息”(如下棋)的局限,真实世界充满谎言和风险,得测AI能不能应付。 用游戏当沙盒,安全地逼AI暴露弱点——比如撒谎成瘾或怂到不敢决策,提前排雷比上线后翻车强。

暂无可展示正文

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。