Transformer核心作者Noam Shazeer加入OpenAI,AI人才争夺再升级
2026/06/18 10:51阅读量 6
Transformer论文核心作者之一Noam Shazeer宣布加入OpenAI,此前他曾因Google未发布其主导开发的对话模型Meena而离职创业,创办Character.AI,后于2024年8月以约27亿美元被Google“请回”并担任Gemini联合技术负责人。此次他离开Gemini加入OpenAI,标志着AI顶级研究者的稀缺性持续上升,其深厚的技术背景(参与Transformer架构、Mixture of Experts等)将对大模型竞争格局产生重要影响。
事件概述
Noam Shazeer,2017年Transformer经典论文《Attention Is All You Need》的八位作者之一,已在社交媒体宣布正式加入OpenAI。Shazeer是AI领域的顶级研究者,深度参与了注意力机制、多头注意力等关键设计,其职业生涯经历了Google早期工程师、Transformer共建者、创业者、再到Gemini联合技术负责人等多个阶段。
核心信息
- 职业脉络:Shazeer 2000年加入Google,早期从事搜索、广告系统等核心工程。2012年转入Google Brain,转向深度学习基础研究。除Transformer外,他还提出了Mixture of Experts、Multi Query Attention、Adafactor等技术,直接影响了大模型训练和推理效率。当代主流大模型(GPT、BERT、Claude、Gemini)均基于Transformer路线。
- 创业与回归:2020年,Shazeer参与开发的对话模型Meena性能领先,但因Google顾虑风险未发布。2021年他联合创立Character.AI,2023年完成1.5亿美元A轮融资(a16z领投),估值达10亿美元,移动应用首周下载超170万次。但由于推理成本高、内容安全压力等问题,2024年8月Google以约27亿美元促成合作,Shazeer回到Google出任Gemini联合技术负责人。
- 最新动向:不到两年后,Shazeer从Gemini离职加入OpenAI。这反映出当前AI产业对顶级研究者的争夺愈发激烈,尤其在推理优化、长上下文、模型可靠性等方向,少数真正理解模型底层规律的人才变得极为稀缺。
值得关注
Shazeer的履历覆盖了大模型从基础研究到大公司工程、创业产品的全路径。OpenAI得到他,相当于获得一位从大模型史前时代一路走到今天的工程型研究者。这一变动可能进一步改变AI公司之间的竞争格局,尤其是在OpenAI与Google DeepMind的模型对战趋于白热化的背景下。
