腾讯混元Hy3 Preview发布:推倒重来,聚焦“实用”与加速迭代
2026/04/25 09:31阅读量 4
2026年4月23日,腾讯发布并开源大模型Hy3 Preview,标志着其大模型战略从“修补迭代”转向“底层重构”。该模型采用MoE架构,总参数295B、激活参数21B,重点强化复杂推理、长上下文指令遵循及代码智能体能力。腾讯通过取消管理层级头衔、实施并行生产模式,将模型研发周期压缩至三个月,并首次将Hy3作为十余款核心产品的首选底座,试图以“场景驱动”和“高实用性”重塑竞争力。
事件概述
2026年4月23日,腾讯正式发布并开源大语言模型 Hy3 Preview。此次发布被视为腾讯大模型战略的重大转折点,标志着其从过去的缓慢追赶转向彻底的底层重构。在Meta推出Muse Spark、Google持续迭代Gemini系列以及DeepSeek V4上线的全球AI竞争背景下,腾讯选择以“推倒重来”的方式,试图证明其已走上正确的技术路线。
核心信息与技术细节
-
架构与性能:
- 架构:采用混合专家(MoE)架构,结合强化学习(RL)驱动的后训练策略。
- 参数量:总参数295B,激活参数21B。
- 上下文:最大支持256K上下文长度。
- 能力突破:在复杂推理、指令遵循、上下文学习、代码生成及智能体(Agent)协作等关键领域实现大幅提升。
- 效率优化:通过全栈优化,同等成本下推理效率提升约40%。
-
研发模式变革:
- 从零重建:Hy3并非基于旧版本迭代,而是于2026年1月底启动,重新搭建了组织架构、基础设施及训练框架。原有的训练框架未沿用,Agent系统几乎从零搭建。
- 并行生产:打破传统串行流程,预训练、后训练验证、RL基础设施建设及业务链路适配同步进行,将原本需6个月以上的周期压缩至3个月。
- 组织扁平化:正式取消总经理、总监等传统头衔,试行“方向负责人制”,减少汇报层级,提升跨部门协作效率。
-
战略导向:“实用主义”:
- 联合设计(Co-design):改变过去“基模团队训完再交付”的模式,在数据策略、评估指标设计早期即引入业务方(如元宝团队),共同定义“实用性”。
- 强化学习(RL)优先:大幅降低对监督微调(SFT)的依赖,转而重点攻坚RL,利用真实复杂任务反馈提升模型上限,使其具备处理未知问题的能力。
- 场景闭环:依托腾讯在社交、游戏、广告等领域的丰富场景,构建“场景-反馈-训练-更强模型”的循环体系。
行业对比与影响
-
对标巨头纠偏路径:
- Google:曾经历Bard表现不佳的危机,通过合并Brain与DeepMind团队、统一底座,最终实现Gemini市场份额回升至20%以上。
- Meta:在LLaMA 4翻车后,重组成立超级智能实验室(MSL),放弃盲目追求SOTA榜单,转而聚焦图表理解、医疗推理等具体场景,成功挽回声誉。
- 腾讯:此次Hy3的发布被视为腾讯自我纠偏的延续,通过延揽前OpenAI研究员姚顺雨出任首席AI科学家、撤销原AI Lab收拢力量,完成了类似巨头的“痛苦聚焦”。
-
商业化落地信号:
- Hy3 Preview上线即成为腾讯十余款核心产品(包括元宝、WorkBuddy、QClaw等)的首选模型,这在混元历史上是首次。
- 测评显示,Hy3已进入国产模型第一梯队,用户反馈中多次出现“活人感”、“逻辑清晰”等评价。
-
未来挑战:
- 虽然基础架构已打通,但如何将海量业务场景产生的真实反馈高效转化为RL训练燃料,仍需解决数据合规、标注工程及链路稳定性等难题。
- 行业竞争已从单一模型参数比拼转向“模型+场景+工程”的系统性竞争,腾讯能否维持当前的加速度并持续兑现场景价值,将是长期考验。
