美国研究员36小时中国AI行:所有实验室怕字节,人人夸DeepSeek
2026/05/08 12:15阅读量 49
艾伦研究所研究员Nathan Lambert在36小时中国行后发文,称中国AI实验室文化独特:学生深度参与核心研发、注重团队协作而非个人英雄主义、更愿做“不性感”的工作。所有实验室都对字节跳动保持警惕,对DeepSeek一致敬佩。中国AI生态更偏向合作共赢,研究员普遍对商业化和社会风险问题不太关心。
核心观察:中国AI实验室的文化差异
美国艾伦研究所(Ai2)研究员Nathan Lambert在36小时的中国之行中,走访了智谱、月之暗面、清华、美团、小米、零一万物以及阿里巴巴北京园区等地。他总结出中国AI实验室的几个关键文化特征:
- 学生深度参与核心研发:中国实验室的许多核心贡献者是在读学生,他们被当作同事直接参与核心工作,愿意做“不性感”但能提升模型效果的细活。相比之下,美国顶级AI公司(如OpenAI、Anthropic、Cursor)基本不招实习生,Google的Gemini相关实习也常被隔离在边缘。
- 更少的自我意识和内部斗争:在美国,Llama团队曾因内部政治斗争而崩盘;而中国实验室内部更强调团队协作,较少有人因个人ego影响整体项目。
- 快速适应新范式:学生群体善于快速学习,不受上一轮AI炒作周期路径依赖的束缚,能高效吸收从Scaling MoE到Scaling RL再到Agent等新范式。
- 对AI风险问题不敏感:当Nathan问及中国研究员对AI经济影响或长远社会风险的看法时,多数人的反应是“愣了一下”,似乎觉得这不是他们该操心的事——他们的任务就是做出最好的模型。
产业生态:竞争与协作并存
- 所有实验室怕字节,所有人敬DeepSeek:字节跳动被视作中国少数走闭源路线的大模型玩家,所有实验室都对其保持高度关注。而DeepSeek被公认为研究品味最好的实验室,获得了普遍敬佩。
- 北京如同硅谷:36小时内Nathan跑了6家AI公司,竞争对手的办公室近在咫尺。人才流动情况与美国类似,主要看团队氛围。但私下交流中,中国实验室之间更尊重彼此,更像一个生态而非互相厮杀的部落。
- 商业化非研究员职责:中国研究员谈及商业化时常耸耸肩说“那不是我的事”,与美国人热衷于讨论融资、算力、产业趋势形成对比。
中国AI产业的真实样貌
- AI需求信号:中国公司对软件付费意愿不高(SaaS生态小),但存在庞大的云计算市场。Nathan认为AI花费更接近云模式,市场并未对新工具能否生长出市场感到担忧。
- 技术自研执念:美团、蚂蚁集团等公司自研大模型,逻辑是LLM将成为未来科技产品的核心,必须自己掌握。但自研同时也会开源:先训通用底座开源以获取社区反馈,再微调内部版本用于产品。开源是实用主义,而非信仰。
- 算力不足:英伟达仍是训练黄金标准,每个实验室都因芯片不够而受限。
- 数据产业不成熟:中国有数据产业但质量参差不齐,研究员更倾向自己花时间搭建RL训练环境,大公司则拥有内部数据标注团队。
尾声:开源与合作的中国逻辑
Nathan承认自己始终不理解为什么中国实验室愿意开源好不容易训练出的模型。最终他感受到,背后是一种强烈的深层愿望:把技术栈掌控在自己手中。开源不是为了追逐热点,而是支持开发者、回馈生态、并进一步理解自身模型的方式。
“当我从笔记本电脑上抬起头,总能看到地平线上的一簇簇起重机。这跟中国的开源精神,显然是一脉相承的。”
