千问模型负责人林俊旸提出离职,阿里高管紧急答疑 | 智能涌现独家
阿里千问大模型技术负责人林俊旸突然宣布离职,引发团队动荡及行业关注,阿里集团CEO吴泳铭等高管紧急召开全员会议进行回应。阿里高层强调此次调整是团队扩张而非收缩,旨在整合资源以应对激烈的AI竞争,但内部沟通不足导致矛盾爆发。林俊旸作为开源战略的核心推手,其离开引发了社区对Qwen未来发展的担忧,而接替者周浩的动向及团队重组细节仍在讨论中。
北京时间3月4日下午约13:00,通义实验室紧急召开了All Hands(全员)会议,阿里集团CEO吴泳铭向千问员工坦诚表示:"我应该要更早知道这些。" 12个小时前(北京时间3月4日凌晨0点11分),阿里千问大模型技术负责人林俊旸在X上突然宣布离职——林俊旸是阿里AI开源模型的核心推手,也是阿里最年轻的P10之一——行业一片哗然之时,Qwen的很多成员也无法接受团队灵魂人物的突然出走。 “在资源远少于竞对的前提下,能取得今天的成绩,俊旸的领导力是核心因素之一。”不止一位千问成员对36氪评价。 在会上,以刘大一恒(Qwen RL leader)为代表,Qwen成员们围绕包括团队拆分、新成员周浩、对模型路线选择、资源投入等等维度,对阿里高层提出了多项疑问。 这场会议与会者包括阿里数位高管、Qwen团队以及通义实验室其他团队成员。围绕团队调整、战略方向等关键议题,包括阿里巴巴集团CEO吴泳铭,阿里巴巴首席人才官蒋芳、阿里云CTO周靖人做出多个回应。 对于此次调整,阿里高层给出的核心定性是:Qwen没有收缩,这是一次团队扩张,无关任何政治斗争,反而需要投入更多资源。 “我们在快速发展,这波调整是为了扩充更多人才、提供更多资源。”阿里巴巴首席人才官蒋芳也承认沟通存在不足,“这次组织形式没沟通好,新人引入肯定会带来阵型变化,扩大过程中必然涉及到这些,我们可能没处理好。” 有传言称周浩将直接领导林俊旸及其相关团队,但据智能涌现获悉,包括周浩的接任职位,汇报线,尚在讨论中。 会上,阿里高层强调多次,千问基础模型是集团当前最重要的事情,大模型的竞争不仅仅是Qwen团队的事,而是整个阿里集团的事——无论是基础模型研发,还是底层 infra 建设,都将在集团层面统筹推进,“一定要超越”。 阿里云 CTO 周靖人则回应了包括招聘名额、算力短缺等尖锐问题:为何外部客户(如大模型创业公司)购买阿里云算力用得顺畅,内部团队反而在算力、招聘名额上捉襟见肘? 周靖人表示,团队处于“一直资源紧张”,内外差异有很多历史原因,未来正在做整体规划,但没有进一步展开说明。 关于林俊旸的动向,会上也没有更新的结论。但下午2点左右,林俊旸再度发布朋友圈,表示"qwen的兄弟们,按照原来安排继续干,没问题的",并未明确是否回归。 数日前,阿里刚刚完成一轮AI战略更新,内部将AI的总称和核心品牌统一为千问,组织层面也迎来了新一轮调整。 《智能涌现》了解到,此前Qwen拥有自己的预训练、后训练、Infra团队;从模型模态上看,也有语言模型、多模态、代码等多个方向。 过往,训单模态模型曾是业界主流。然而,随着对视觉理解需求的日益增长,视觉语言模型(Vision Language Model)应运而生,这也使得各个模态的深度融合成为一大发展趋势。 一位知情人士曾对《智能涌现》表示,从2025年开始,林俊旸就在寻求让语言、图像、视频、代码等方向的员工一起工作,以寻求提升模型训练效率。Qwen团队曾提出与万相团队合并,但没有完成,才开始做了自己的qwen-image模型。 但在这轮调整中,通义实验室希望将Qwen团队按预训练、后训练、视觉理解、图像等维度拆分,和通义实验室中的团队合并(如通义万相、通义百聆等团队),一起工作。但在没有充分信息沟通的情况下,矛盾就此爆发。 “林俊旸,他一个人就值一亿美金” 就在3月2日晚间,千问还在X上宣布开源四款Qwen 3.5小尺寸模型,马斯克点赞了这条推文,并表示“令人惊叹的智能密度。” 千问模型灵魂人物林俊旸毫无征兆地突然提出离职,让阿里AI团队陷入一片迷茫。 在前任阿里千问技术负责人周畅离职后,生于1993年的林俊旸从2022年起开始接手阿里Qwen团队,负责整体技术工作。 这几年间,阿里Qwen模型家族也在快速发展,从最开始的通义模型家族到Qwen 2.5、Qwen 3.5 Max等模型,一路成长为世界一流模型团队。在多个维度上,Qwen都是毫无疑问的开源模型第一家族。 多位前阿里模型团队的人士对《智能涌现》都曾表示,2023年国内大模型刚起步时,国内大厂对是否开源、开源力度多少也有分歧。但阿里的开源战略做得足够早,足够有战略定力,很大程度上得益于周畅、林俊旸等人的积极推动和执行。 而随着林俊旸离开,一同宣布离职的,还有多位Qwen成员,其中有负责Qwen各个模型细分方向的核心负责人,如: * 惠彬原(Binyuan Hui):Qwen代码方向负责人,Qwen-Coder系列模型主理人,负责从预训练到后训练的全流程Agent训练,近期也有参与具身智能(Robotics)相关研究。 * 郁博文(Bowen Yu):Qwen后训练研究负责人,毕业于中国科学院大学,主导 Qwen-Instruct 系列模型的开发。 * Kaixin Li:Qwen 3.5/VL/Coder的核心贡献者,博士毕业于新加坡国立大学。 除了上述几位人员,还有不少年轻研究员,也在同一天提出了离职。 不止一位Qwen研究员在推特、小红书发布情绪低落的贴文。“Qwen is nothing without its people.”这番发言套用了2024年OpenAI陷入CEO更换风波时,OpenAI员工在推特上的刷屏发言。 林俊旸官宣离职在AI社区引起了巨大轰动,很多反馈来自海外开发者,均在表达对林俊旸推动Qwen开源工作的感谢。“一个时代的结束。”Hyperbolic Labs创始人兼CTO Yuchen Jin表示。 “如果这一批人真要是离开了,Qwen模型至少得耽误半年到1年,重组团队重新训。”一位投资人对《智能涌现》表示。另一位字节AI人士则称“林俊旸至少是1亿美金以上级别的人才。” 不少传言称,林俊旸离开是“非自愿”,但经《智能涌现》确认,林俊旸在3月3日提出离职,并且还没有和阿里谈好相关的细节,Qwen团队成员在3月4日下午得到的消息。 《智能涌现》最新得到的消息是,阿里巴巴高层还和林俊旸密切沟通中,林俊旸是否确认离开阿里巴巴还未可知。 林俊旸离开后,即将接手阿里Qwen后训练工作的新成员,是来自Google DeepMind的周浩。一位Qwen团队人士对《智能涌现》称,周浩于2026年1月短暂入职夸克,而后调至通义实验室。从汇报线上看,周浩直接汇报给周靖人,不少声音称,他将接手Qwen的后训练工作。 周浩(Hao Zhou)本科毕业于中科大,博士毕业于威斯康星大学麦迪逊分校 (UW-Madison)。据他的领英主页,他曾于Meta工作3年,在Google DeepMind工作约4年,是Gemini 3.0模型的核心贡献者,亲自带队落地了带工具与思考链的多步 RL方向,并深度参与了Gemini 1.0、AI Mode及Deep Research 等项目。 阿里在开源上赢了口碑,但它还想要更多 就在3月3日,林俊旸刚刚在X(推特)上发布数款小尺寸的开源模型,这些模型适用于手机等,也贯彻了Qwen一直以来的开源路线。 很多人认为将做开源模型粗暴理解为“做慈善”,但这并不公允。 开源做得好,首先服务了整个阿里云的开发者生态。因为更早做开源,Qwen模型家族在模型发展早期能够快速得到社区反馈,成长迅速,反哺了模型训练。 Qwen全尺寸、全模态的模型路线,让很多企业、学校的技术从业者能够很快选用到合适自己的模型,建立了一波好口碑。在这些模型落到生产环境后,很多企业主也会倾向于购买Qwen的模型服务,间接转化成了阿里云的商业收入。 但这其中的商业逻辑很难论证,这也是开源长期以来面临的问题,国内外都如此——Meta花了数十亿美元训练Llama却免费开放,外界至今争论这笔账究竟怎么算,也从来无法体现在Meta财报当中。 而尽管在开源依旧维持着优秀口碑,但在闭源旗舰模型一侧,阿里在2025年发布的Qwen 3、Qwen-3.5系列,尽管维持在第一梯队,但已有吃力之势。 林俊旸等核心成员离开,很大程度是源于阿里巴巴当前AI战略的快速变化,和基础模型团队的目标产生了差距。 追赶旗舰模型、维持开源领先地位都很重要,但阿里巴巴的基础模型团队训练资源相对有限。 自2023年以来,Qwen家族累计开源了超过400个模型,模型家族涵盖了从0.5B到235B的多个参数规模。很难想象,支撑这些模型更新主力的Qwen团队,仅有100多人。算上通义实验室其他团队,整体为数百人规模。 作为对比,字节负责基模训练的Seed团队就已经近2000人。在各个方向上,阿里投入的绝对人数,都是友商的几分之一。不少Qwen人士都曾对36氪表示,Qwen的算力、Infra建设都长期缺乏资源和支持,这部分阻碍了模型的迭代速度。 这是如今阿里AI战略急行军的一个激烈切面。2025年11月,千问App上线,大打春节大战,只是刚刚拉开AI To C战争的序幕——字节旗下的豆包已然接近2亿日活大关,还有尚未完全发力的腾讯;同时,阿里在旗舰模型也不能掉队——这关系着阿里云的商业化闭环,以及整个阿里集团的未来。 (36氪作者周鑫雨对本文已有贡献)
