通义巨震:周靖人收权,林俊旸放手?

阿里通义实验室核心高管林俊旸与郁博文突然离职,引发外界对Qwen模型研发稳定性的担忧。文章分析认为,此次变动并非单纯因开源战略分歧,而是源于通义实验室内部组织结构调整及资源分配矛盾。随着集团将重心转向B/C端兼顾并加强千问APP产品闭环,原有垂直整合的Qwen团队被拆分,导致林俊旸等原负责人权力缩减并最终选择离开。

林俊旸为何离开? > 文 | 象先志 林俊旸宣布离开千问,这件事非常突然,原本还在看几位长老陪马老师溜园的新闻。 目前确定的信息是,林俊旸是昨天下午提的离职,阿里那边刚开始走流程。同一天,Qwen的后训练负责人郁博文也正式离职,他的工作由年初从谷歌挖过来的zhou姓高管接任。 林俊旸去年刚晋升,是阿里最年轻的P10,外界担心他突然离开给Qwen后续模型研发和更新带来不确定性。 这种担心不太必要。 林俊旸和郁博文等固然是Qwen系列模型的核心功臣,大模型领域单兵能力的重要性也确实相比过去大幅提升,但阿里整个AI研发体系不可能只依赖于两三个重要的技术骨干。 我不相信Qwen因为林俊旸离开就会彻底陨落,就像我不太相信鹅厂招来姚顺雨就能扭转局面一样。 1 - 先梳理下林俊旸和郁博文等人离开的原因。 有传言是说,阿里内部对现有的开源模式有分歧,觉得开源的成本投入不划算,或者认为开源影响了阿里云卖自己的API。 这个说法不合理。我倒不是说阿里内部没有这种讨论,而是因为林俊旸是做模型基础研发,模型开源还是闭源,都不影响他工作结果的价值。就算阿里突然全面转向闭源,模型研发照样得有人带,后训练这些照样得继续做。 按照这个逻辑,唯一能把这两件事统一起来的,就是林俊旸确实有不可妥协的开源理想。给个P10又怎样,只要Qwen转向闭源,劳资立马撂挑子不干。 这种可能性有,但确实很小。不只是林俊旸走了,郁博文这些也走了,不可能说这些人都要当Richard Stallman吧。 而且综合各方面的消息,林俊旸的离开比较突然。 说是昨天下午通义开了场内部会议,会上产生分歧,林俊旸当场离开,几小时后就在X平台上宣布了离职的消息。林俊旸级别高,阿里如果真的想调整开源战略,这种业务负责人多少有点提前的吹风和讨论。 所以林俊旸突然离开,最大可能还是跟通义最近的组织调整有关。 而这个组织调整的原因,应该不是直接出于开源和闭源的战略有重大变化。今天阿里算是全球模型开源的扛把子,HF上下载量一直保持领先。但阿里开源的整体状态是三角形:中腰部模型能力很强,但参数量最大的最强模型表现是有差距的。 阿里如果只是想做B端,通过云服务卖API,这个问题还没有那么关键,因为开源跟闭源是两个赛道。然而阿里从去年11月开始,已经明牌要参与这轮AI入口争夺。 因为千问APP起步晚了对手一年多,需要投入更多资源追上对手,整个春节档阿里为千问投入的预算也是最多的。这些措施取得了明显效果,千问APP用户快速增长,目前已经甩开元宝,但仍然低于豆包。 从纯B端向B/C两端兼顾的转向,对Qwen的模型能力提出了更高的要求。集团层面,Qwen也得更多配合千问APP的产品团队,因为后者当下是集团最大的优先级。 林俊旸直接负责的Qwen团队隶属于通义实验室,后者由阿里云CTO周靖人负责。 通义正计划将Qwen团队分拆,从涵盖不同训练流程和模态的“垂直整合”体系,转变成预训练、后训练、文本、多模态等一个个分开的水平分工团队,这些团队仍隶属通义实验室。 晚点报道提到,林俊旸并不认可这种分开拆散团队的做法,他认为预训练、后训练,乃至Infra和训练团队应该更紧密地结合和沟通。 这个描述其实非常有意思,值得推敲一番。预训练、后训练这些团队本身就是各自存在的,为什么在Qwen下面就是垂直整合,分拆过后就是水平分工呢?整个通义实验室依旧在周靖人博士的领导之下,各团队之间的拉通对齐怎么就不能做继续做呢? 按照互联网公司喜欢讲的管理学模型,甚至可以说这让组织结构进一步扁平化,有利于提高信息传递的效率。 当然这只是理论上,而理论跟实际往往有相当的距离。林俊旸和Qwen团队已经经过了长时期磨合,保持着高强度产出,做这种分拆一定意味着大量的组织摩擦和不确定性。 2 - 这些动作无法避免的后果是,林俊旸的“势力范围”在缩减。 他领导的Qwen团队从去年中开始组建自己的Infra团队,代替原来阿里云的人工智能平台PAI。也就是说,Qwen团队在逐步补齐所有LLM训练需要的基础设施。 OpenAI infra负责人翁家翌前段时间提到,真正拉开openai和meta差距的就在于infra上。他认为这其中的关键在于谁的RL infa BUG相对更少,训练迭代更快。 所以可以推测,林俊旸对于由阿里云PAI来负责通义各业务的infra不满意,因此要单独组建infra团队。 但阿里内部对Qwen团队的投入产生评价本身就是有分歧的,这种团队扩充或许进一步加剧了这种分歧,拉大了集团高管跟林俊旸团队的张力。据说甚至有高管对除夕夜亮相发布的 Qwen-3.5 并不完全满意,称其是一个“半成品”。 最终的局面就变成,一边是林俊旸和Qwen团队感觉受到了集团的资源掣肘,另一边则是集团对Qwen表现也不满意,要大调组织架构,提升产出并且加强跟C端产品的闭环。 今天还流出一份吴妈给通义团队开会的摘要,信息量很多但不保真。 看起来从谷歌挖过来的zhou姓高管,是林俊旸离职的导火索。zhou担心自己融不进Qwen团队,所以要求挂到周靖人下面。晚点报道也提到,zhou确实是直接向周靖人汇报。 这个细节如果属实,那基本意味着zhou跟林早就是要二选一。 因为zhou是搞后训练的,搞后训练的跟统筹模型研发的不对付,还向顶头上司“告御状”,暗示对方要排挤我,这后面抬头不见低头见的,哪里还有合作的可能。 既然最后zhou的诉求得到了满足,成功入职了,就说明周靖人和集团当时已经在两个人之间做出了选择。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。