腾讯混元Hy3 Preview:全链路重构后的基模能力回归
2026/04/27 19:34阅读量 6
腾讯发布开源的混元Hy3 Preview模型,标志着其大模型经历三个月的全链路推倒重来后重回竞争赛道。实测显示该模型在复杂推理、代码开发及智能体执行等核心场景表现稳健,具备从SFT转向RL强化学习的实战进化能力。作为预览版,它已接入微信、元宝、腾讯云等十余款核心产品,依托腾讯庞大的生态数据闭环,为后续更大参数版本的正式发布奠定基础。
事件概述
上周,腾讯正式开源并发布混元(Hunyuan)Hy3 Preview版本。尽管在GPT-5.5和DeepSeek V4等竞品密集发布的背景下,这款参数量不到300B的预览版初期未引发预期中的热烈讨论,但深度实测表明,这实际上是腾讯大模型彻底重构后的关键拐点。
核心信息与技术重构
1. 极速迭代与组织变革
- 研发周期:Hy3 Preview从预训练启动到发布仅耗时3个月,远快于行业常规的6-12个月重构周期。
- 组织架构:前OpenAI研究员姚顺雨出任首席AI科学家,撤销原有AI Lab,将AI Infra部与大语言模型部合并,打破算法与基建壁垒;推行扁平化管理,取消总经理、总监层级,实行方向负责人制。
- 技术底座:未沿用旧有框架,Agent系统从零搭建。采用MoE混合专家架构,总参数295B,激活参数仅21B。全栈优化后,推理效率较上一代提升40%。
- 范式转移:训练体系从依赖SFT(监督微调)全面转向以**RL(强化学习)**为核心,旨在赋予模型独立判断和解决未知问题的能力,摆脱“刷榜强、实战弱”的困境。
2. 实测表现亮点
在复杂推理、代码开发与智能体落地三大场景中,Hy3 Preview展现出显著的稳定性与逻辑自洽性:
- 复杂推理:面对多条件、多轮推翻的任务(如项目排期冲突),模型能主动拆解约束条件,并在发现冲突时回溯校准,而非强行编造答案。
- 代码开发:不仅能生成数据分析脚本,还能理解任务结构,根据报错信息精准定位并修复依赖缺失、字段错误等问题,可用性显著提升。
- 智能体(Agent):在长链路办公场景(如整理竞品动态)中,具备明确的执行感,能区分信息优先级,拆分任务阶段,并在中间结果不完整时提示补充,避免幻觉。
生态落地与未来展望
1. 全场景快速接入
Hy3 Preview已成为腾讯十余款核心产品的首选模型,覆盖C端、B端及垂类场景:
- C端应用:元宝对话交互更具“人感”,多轮对话情商在线;腾讯文档AI PPT生成成功率提升20%,耗时缩短20%。
- 游戏场景:和平精英AI NPC能精准扮演人设并适配复杂对战节奏。
- 企业办公:CodeBuddy与WorkBuddy首Token延迟降低54%,端到端时长降低47%,可稳定驱动数百步复杂工作流。
2. 长期竞争力
腾讯拥有微信、QQ等国民级入口,覆盖社交、游戏、金融等全互联网场景,日活用户达十亿级。随着“真实场景 - 用户反馈 - 模型训练 - 能力升级”的正向飞轮加速运转,结合正在补齐的算力短板与领先的人才队伍,腾讯大模型正通过实用主义路线重塑竞争格局。Hy3 Preview仅是开胃菜,后续更大参数、更强综合能力的正式版即将推出。
