腾讯混元 Hy3 Preview 发布：295B 参数模型重塑 AI 底座，聚焦 Agent 与办公场景

2026/04/24 08:58阅读量 2

腾讯正式发布混元 3.0 预览版（Hy3 Preview），这是一款总参数 295B、激活参数 21B 的混合专家模型，支持 256K 上下文长度。该模型在复杂推理、代码生成及智能体（Agent）任务中表现突出，旨在为元宝、微信 Agent 及企业工具提供统一底层能力。测试显示其在信息整合、上下文纠偏及多任务规划等实际办公场景中具备显著优势，标志着腾讯 AI 战略从单纯比拼参数转向深耕生产力落地。

事件概述

2026 年 4 月，腾讯正式开源并发布了新一代大语言模型混元 Hy3 Preview。作为混元 3.0 的预览版本，这是腾讯首席 AI 科学家姚顺雨接手团队后的首份核心答卷。该模型被定位为腾讯 AI 生态的新底座，旨在支撑元宝（C 端产品）、微信 Agent、WorkBuddy及QClaw等企业级应用。

核心参数与技术架构

模型类型：快慢思考融合的混合专家模型（MoE）。
参数量：总参数 295B，激活参数 21B。
上下文窗口：最大支持 256K tokens。
性能定位：腾讯官方宣称其为迄今最智能的混元模型，在复杂推理、指令遵循、上下文学习、代码能力及智能体执行上实现大幅提升。
基准测试：在 SWE-Bench Verified、Terminal-Bench 2.0（代码智能体）及 BrowseComp、WideSearch（搜索智能体）等主流基准中，成绩已追近行业主流模型。

实测表现：聚焦生产力与 Agent 场景

针对日常办公及 Agent 协作场景的测试显示，Hy3 Preview 展现出以下关键能力：

1. 复杂任务拆解与执行

在模拟“客户会前包”制作任务中，模型不仅能整理合同、投诉、回款等多方数据，还能自动拆解角色分工、细化目录结构（如客户概览、风险预警等），并生成包含具体截止时间的协调通知话术，表现出极强的结构化输出能力。

2. 上下文校正与事实核查

面对背景材料中存在矛盾（如项目重点方向描述错误）的情况，模型能够识别并否定错误总结，重新梳理时间线，并基于记忆偏差、确认偏误等逻辑解释原因，展现了优秀的上下文纠错能力。

3. 拒绝幻觉与检索规划

在缺乏财报数据的查询任务中，模型未进行编造，而是主动列出优先查询路径（财报、电话会纪要、投资者关系页面等），并给出标准回复模板。这种对信息缺口的诚实处理及检索流程规划，更符合企业级应用对准确性的要求。

4. 多任务调度与代码执行

日程管理：能根据时间刚性和补救难度，自动排序会议、汇报及团建通知等任务，并补充设备调试等潜在风险提醒。
代码能力：在处理销售数据统计时，代码结构扎实，能有效处理缺失字段和非法值，覆盖正常与异常数据场景。

战略意义与行业影响

补齐 C 端短板：此前腾讯在 C 端产品“元宝”中曾接入外部模型（如 DeepSeek），导致自研模型存在感不足。Hy3 Preview 的发布意味着腾讯将把自研基模全面回归至核心 C 端产品，以支撑流量竞争。
构建 Agent 生态：随着字节、小米等厂商加速布局系统级手机助手和自主智能体，腾讯正通过混元 3.0 强化其微信 Agent、企业微信及腾讯会议等高频场景的底层能力，试图将庞大的入口优势转化为数据和商业闭环优势。
战略转型：此次更新标志着腾讯 AI 战略重心从单纯的 Benchmark 指标比拼，转向解决复杂场景下的实际问题，强调模型在真实工作流中的稳定性与实用性。

注：本次发布的 Hy3 Preview 仅为预览版，腾讯方面表示将通过开源社区反馈进一步优化，以推动正式版落地。

阅读原文详情