国产通用大模型新玩家云知声发布U2:不卷参数,卷“智能密度×Token价值”
2026/06/09 10:55阅读量 2
云知声推出新一代基座模型U2,以“智能密度×Token价值”为核心设计理念,采用稀疏MoE架构和高知识密度数据筛选,在多项评测中以更低激活参数比肩甚至超越更大规模模型,可将思考Token消耗减少约25%,显著降低推理成本。U2已上线云知声Token Hub,支持主流Agent脚手架。云知声2025年大模型相关收入超6.1亿元,同比增长超10倍,其Token调用收入ARR环比增长600%。
事件概述
云知声发布新一代基座模型U2,定位为原生智能体基座大模型,核心设计理念是“智能密度×Token价值”,旨在用更少的Token和更低的成本实现更强的智能。U2已正式上线云知声Token Hub,支持OpenClaw/Hermes等主流Agent脚手架,可直接用于开发。
核心技术手段
- 高知识密度精筛:过滤重复、低质、易引发幻觉的数据,提升单位参数有效知识密度。
- 语义Token压缩优化:优化分词与表征,让每个Token承载更多有效信息,减少表达所需的Token数。
- 知识点级校验与自反馈机制:持续纠偏、主动抑制幻觉。
- 稀疏MoE架构:叠加稀疏知识编码和知识蒸馏,使专家模块更精干。U2总参数量2660亿,性能可媲美1.2万亿参数模型,参数效率约为后者的5倍。
- 隐式思考机制:在隐藏层先理清解题方向,减少显式推理链的输出,可将思考Token消耗减少约25%。
- 原生Agent能力:通过Harness Engineering与模型训练闭环,使模型原生具备多步规划、工具调用和过程纠错能力,完成复杂任务所需交互轮次更少。
性能表现
- 指令遵循:IFBench评测表现突出。
- Agent任务:Claw系列Agent评测、GDPval办公能力评测均处于前列。
- 推理与长文本:GPQA硬核推理和长文本理解上,以极低激活参数实现接近或超越部分超大模型的效果。
- 实测案例:生成交互式粒子宇宙前端demo(近1000行代码,无外部库)、12星座心理分析应用、OPC赛道深度研究报告(自动引用公开数据),均展现较强的Coding、Agent和推理能力。
商业模式与业绩
云知声定位为“港股AGI第一股”,坚持“强基模+深应用”路线,围绕智慧医疗、智慧生活等场景落地。其业务体系包括底层U2基座模型、中间兽牙智能体平台、上层产业场景及MaaS/生态平台。
- 公司团队不足500人,年营收超10亿元。
- 2025年大模型相关收入突破6.1亿元,同比增长超10倍。
- 2026年5月Token调用收入ARR环比增长600%,预计6月仍将高速增长。
