腾讯混元Hy3 Preview发布：推倒重来，聚焦“实用”与加速迭代

2026/04/25 09:31阅读量 4

2026年4月23日，腾讯发布并开源大模型Hy3 Preview，标志着其大模型战略从“修补迭代”转向“底层重构”。该模型采用MoE架构，总参数295B、激活参数21B，重点强化复杂推理、长上下文指令遵循及代码智能体能力。腾讯通过取消管理层级头衔、实施并行生产模式，将模型研发周期压缩至三个月，并首次将Hy3作为十余款核心产品的首选底座，试图以“场景驱动”和“高实用性”重塑竞争力。

事件概述

2026年4月23日，腾讯正式发布并开源大语言模型 Hy3 Preview。此次发布被视为腾讯大模型战略的重大转折点，标志着其从过去的缓慢追赶转向彻底的底层重构。在Meta推出Muse Spark、Google持续迭代Gemini系列以及DeepSeek V4上线的全球AI竞争背景下，腾讯选择以“推倒重来”的方式，试图证明其已走上正确的技术路线。

核心信息与技术细节

架构与性能：
- 架构：采用混合专家（MoE）架构，结合强化学习（RL）驱动的后训练策略。
- 参数量：总参数295B，激活参数21B。
- 上下文：最大支持256K上下文长度。
- 能力突破：在复杂推理、指令遵循、上下文学习、代码生成及智能体（Agent）协作等关键领域实现大幅提升。
- 效率优化：通过全栈优化，同等成本下推理效率提升约40%。
研发模式变革：
- 从零重建：Hy3并非基于旧版本迭代，而是于2026年1月底启动，重新搭建了组织架构、基础设施及训练框架。原有的训练框架未沿用，Agent系统几乎从零搭建。
- 并行生产：打破传统串行流程，预训练、后训练验证、RL基础设施建设及业务链路适配同步进行，将原本需6个月以上的周期压缩至3个月。
- 组织扁平化：正式取消总经理、总监等传统头衔，试行“方向负责人制”，减少汇报层级，提升跨部门协作效率。
战略导向：“实用主义”：
- 联合设计（Co-design）：改变过去“基模团队训完再交付”的模式，在数据策略、评估指标设计早期即引入业务方（如元宝团队），共同定义“实用性”。
- 强化学习（RL）优先：大幅降低对监督微调（SFT）的依赖，转而重点攻坚RL，利用真实复杂任务反馈提升模型上限，使其具备处理未知问题的能力。
- 场景闭环：依托腾讯在社交、游戏、广告等领域的丰富场景，构建“场景-反馈-训练-更强模型”的循环体系。

行业对比与影响

对标巨头纠偏路径：
- Google：曾经历Bard表现不佳的危机，通过合并Brain与DeepMind团队、统一底座，最终实现Gemini市场份额回升至20%以上。
- Meta：在LLaMA 4翻车后，重组成立超级智能实验室（MSL），放弃盲目追求SOTA榜单，转而聚焦图表理解、医疗推理等具体场景，成功挽回声誉。
- 腾讯：此次Hy3的发布被视为腾讯自我纠偏的延续，通过延揽前OpenAI研究员姚顺雨出任首席AI科学家、撤销原AI Lab收拢力量，完成了类似巨头的“痛苦聚焦”。
商业化落地信号：
- Hy3 Preview上线即成为腾讯十余款核心产品（包括元宝、WorkBuddy、QClaw等）的首选模型，这在混元历史上是首次。
- 测评显示，Hy3已进入国产模型第一梯队，用户反馈中多次出现“活人感”、“逻辑清晰”等评价。
未来挑战：
- 虽然基础架构已打通，但如何将海量业务场景产生的真实反馈高效转化为RL训练燃料，仍需解决数据合规、标注工程及链路稳定性等难题。
- 行业竞争已从单一模型参数比拼转向“模型+场景+工程”的系统性竞争，腾讯能否维持当前的加速度并持续兑现场景价值，将是长期考验。

阅读原文详情

事件概述

核心信息与技术细节

行业对比与影响

准备好启动您的定制项目了吗？