腾讯混元 Hy3 Preview 发布:295B 参数模型重塑 AI 底座,聚焦 Agent 与办公场景
腾讯正式发布混元 3.0 预览版(Hy3 Preview),这是一款总参数 295B、激活参数 21B 的混合专家模型,支持 256K 上下文长度。该模型在复杂推理、代码生成及智能体(Agent)任务中表现突出,旨在为元宝、微信 Agent 及企业工具提供统一底层能力。测试显示其在信息整合、上下文纠偏及多任务规划等实际办公场景中具备显著优势,标志着腾讯 AI 战略从单纯比拼参数转向深耕生产力落地。
事件概述
2026 年 4 月,腾讯正式开源并发布了新一代大语言模型混元 Hy3 Preview。作为混元 3.0 的预览版本,这是腾讯首席 AI 科学家姚顺雨接手团队后的首份核心答卷。该模型被定位为腾讯 AI 生态的新底座,旨在支撑元宝(C 端产品)、微信 Agent、WorkBuddy及QClaw等企业级应用。
核心参数与技术架构
- 模型类型:快慢思考融合的混合专家模型(MoE)。
- 参数量:总参数 295B,激活参数 21B。
- 上下文窗口:最大支持 256K tokens。
- 性能定位:腾讯官方宣称其为迄今最智能的混元模型,在复杂推理、指令遵循、上下文学习、代码能力及智能体执行上实现大幅提升。
- 基准测试:在 SWE-Bench Verified、Terminal-Bench 2.0(代码智能体)及 BrowseComp、WideSearch(搜索智能体)等主流基准中,成绩已追近行业主流模型。
实测表现:聚焦生产力与 Agent 场景
针对日常办公及 Agent 协作场景的测试显示,Hy3 Preview 展现出以下关键能力:
1. 复杂任务拆解与执行
在模拟“客户会前包”制作任务中,模型不仅能整理合同、投诉、回款等多方数据,还能自动拆解角色分工、细化目录结构(如客户概览、风险预警等),并生成包含具体截止时间的协调通知话术,表现出极强的结构化输出能力。
2. 上下文校正与事实核查
面对背景材料中存在矛盾(如项目重点方向描述错误)的情况,模型能够识别并否定错误总结,重新梳理时间线,并基于记忆偏差、确认偏误等逻辑解释原因,展现了优秀的上下文纠错能力。
3. 拒绝幻觉与检索规划
在缺乏财报数据的查询任务中,模型未进行编造,而是主动列出优先查询路径(财报、电话会纪要、投资者关系页面等),并给出标准回复模板。这种对信息缺口的诚实处理及检索流程规划,更符合企业级应用对准确性的要求。
4. 多任务调度与代码执行
- 日程管理:能根据时间刚性和补救难度,自动排序会议、汇报及团建通知等任务,并补充设备调试等潜在风险提醒。
- 代码能力:在处理销售数据统计时,代码结构扎实,能有效处理缺失字段和非法值,覆盖正常与异常数据场景。
战略意义与行业影响
- 补齐 C 端短板:此前腾讯在 C 端产品“元宝”中曾接入外部模型(如 DeepSeek),导致自研模型存在感不足。Hy3 Preview 的发布意味着腾讯将把自研基模全面回归至核心 C 端产品,以支撑流量竞争。
- 构建 Agent 生态:随着字节、小米等厂商加速布局系统级手机助手和自主智能体,腾讯正通过混元 3.0 强化其微信 Agent、企业微信及腾讯会议等高频场景的底层能力,试图将庞大的入口优势转化为数据和商业闭环优势。
- 战略转型:此次更新标志着腾讯 AI 战略重心从单纯的 Benchmark 指标比拼,转向解决复杂场景下的实际问题,强调模型在真实工作流中的稳定性与实用性。
注:本次发布的 Hy3 Preview 仅为预览版,腾讯方面表示将通过开源社区反馈进一步优化,以推动正式版落地。
