腾讯混元 Hy3 Preview 首秀:三个月重建模型,放弃榜单内卷转向场景落地
2026/04/23 17:08阅读量 7
腾讯首席 AI 科学家姚顺雨主导的混元大模型 Hy3 Preview 正式发布,该模型在三个月内完成了从底层基础设施到训练框架的系统性重建。Hy3 Preview 采用 295B 总参数、21B 激活参数的 MoE 架构,主打快慢思考融合,重点优化编程、智能体(Agent)及长上下文处理能力。与以往追逐通用榜单不同,该版本明确转向“场景优先”策略,旨在解决社交、游戏及企业服务等真实业务中的复杂工程问题。
事件概述
腾讯首席 AI 科学家姚顺雨主导的混元大模型 Hy3 Preview 正式亮相。这是混元大模型重建后的首个版本,标志着腾讯在大模型战略上从“追逐榜单”转向“深耕场景”。
核心信息
- 研发周期:自去年年底姚顺雨入职负责 AI Infra 及大语言模型起,于 1 月底启动训练,仅用三个月完成从底层重构到上线。
- 架构参数:
- 类型:快慢思考融合的 MoE(混合专家)语言模型。
- 规模:总参数 295B,激活参数 21B。
- 上下文:最大支持 256K 长度。
- 设计逻辑:在性能与成本间寻求平衡,避免盲目堆砌万亿参数带来的通信延迟和推理成本激增问题。
- 能力表现:
- 编程与 Agent:在 WorkBuddy 等应用中展现出处理复杂代码生成、本地文件读取分析、数据可视化及深度调研的能力。实测显示其能流畅生成交互式 3D 场景、经营类小游戏,并能准确解析非标准排版 PDF 内容。
- 闲聊与创作:在日常对话中表现出更强的“活人感”,能提供客观与主观并行的建议;在创意写作上风格更稳定,减少了套话,具备独特性和情绪张力。
- 基准测试:在多个真实生产场景 benchmark 及腾讯混元 CL-bench 上,相比前代提升明显。
战略转向:从打榜到 Co-design
- 摒弃榜单焦虑:姚顺雨指出,过度追求 MMLU 等榜单成绩会导致语料污染,且榜单高分不代表真实场景体验好。用户感知的是能力下限(如指令遵循、幻觉率),而非上限。
- Co-design 模式:腾讯利用其在社交(微信)、游戏、广告及企业服务(企业微信、腾讯会议)等领域的独特场景优势,推行“模型在业务中跑,业务数据反哺模型”的闭环模式。
- 差异化竞争:不再盲目对标通用智能榜单,而是针对碎片化对话流、实时游戏局势反应、私有文档精准分析等特定需求进行优化。
后续计划
- 部署范围:Hy3 Preview 已首发上线腾讯云、元宝 App、ima、CodeBuddy、WorkBuddy、QQ、QQ 浏览器、腾讯文档等产品,微信公众号、和平精英、腾讯新闻等主线产品也在陆续接入。
- 迭代方向:正式版将根据用户反馈持续打磨,同时团队将继续扩大预训练和强化学习规模,以提升模型的智能上限。
