腾讯混元 Hy3 Preview 首秀：三个月重建模型，放弃榜单内卷转向场景落地

2026/04/23 17:08阅读量 7

腾讯首席 AI 科学家姚顺雨主导的混元大模型 Hy3 Preview 正式发布，该模型在三个月内完成了从底层基础设施到训练框架的系统性重建。Hy3 Preview 采用 295B 总参数、21B 激活参数的 MoE 架构，主打快慢思考融合，重点优化编程、智能体（Agent）及长上下文处理能力。与以往追逐通用榜单不同，该版本明确转向“场景优先”策略，旨在解决社交、游戏及企业服务等真实业务中的复杂工程问题。

事件概述

腾讯首席 AI 科学家姚顺雨主导的混元大模型 Hy3 Preview 正式亮相。这是混元大模型重建后的首个版本，标志着腾讯在大模型战略上从“追逐榜单”转向“深耕场景”。

核心信息

研发周期：自去年年底姚顺雨入职负责 AI Infra 及大语言模型起，于 1 月底启动训练，仅用三个月完成从底层重构到上线。
架构参数：
- 类型：快慢思考融合的 MoE（混合专家）语言模型。
- 规模：总参数 295B，激活参数 21B。
- 上下文：最大支持 256K 长度。
- 设计逻辑：在性能与成本间寻求平衡，避免盲目堆砌万亿参数带来的通信延迟和推理成本激增问题。
能力表现：
- 编程与 Agent：在 WorkBuddy 等应用中展现出处理复杂代码生成、本地文件读取分析、数据可视化及深度调研的能力。实测显示其能流畅生成交互式 3D 场景、经营类小游戏，并能准确解析非标准排版 PDF 内容。
- 闲聊与创作：在日常对话中表现出更强的“活人感”，能提供客观与主观并行的建议；在创意写作上风格更稳定，减少了套话，具备独特性和情绪张力。
- 基准测试：在多个真实生产场景 benchmark 及腾讯混元 CL-bench 上，相比前代提升明显。

战略转向：从打榜到 Co-design

摒弃榜单焦虑：姚顺雨指出，过度追求 MMLU 等榜单成绩会导致语料污染，且榜单高分不代表真实场景体验好。用户感知的是能力下限（如指令遵循、幻觉率），而非上限。
Co-design 模式：腾讯利用其在社交（微信）、游戏、广告及企业服务（企业微信、腾讯会议）等领域的独特场景优势，推行“模型在业务中跑，业务数据反哺模型”的闭环模式。
差异化竞争：不再盲目对标通用智能榜单，而是针对碎片化对话流、实时游戏局势反应、私有文档精准分析等特定需求进行优化。

后续计划

部署范围：Hy3 Preview 已首发上线腾讯云、元宝 App、ima、CodeBuddy、WorkBuddy、QQ、QQ 浏览器、腾讯文档等产品，微信公众号、和平精英、腾讯新闻等主线产品也在陆续接入。
迭代方向：正式版将根据用户反馈持续打磨，同时团队将继续扩大预训练和强化学习规模，以提升模型的智能上限。

阅读原文详情

事件概述

核心信息

战略转向：从打榜到 Co-design

后续计划

准备好启动您的定制项目了吗？