国产通用大模型新玩家云知声发布U2:不卷参数,卷“智能密度×Token价值”

2026/06/09 10:55阅读量 2

云知声推出新一代基座模型U2,以“智能密度×Token价值”为核心设计理念,采用稀疏MoE架构和高知识密度数据筛选,在多项评测中以更低激活参数比肩甚至超越更大规模模型,可将思考Token消耗减少约25%,显著降低推理成本。U2已上线云知声Token Hub,支持主流Agent脚手架。云知声2025年大模型相关收入超6.1亿元,同比增长超10倍,其Token调用收入ARR环比增长600%。

事件概述

云知声发布新一代基座模型U2,定位为原生智能体基座大模型,核心设计理念是“智能密度×Token价值”,旨在用更少的Token和更低的成本实现更强的智能。U2已正式上线云知声Token Hub,支持OpenClaw/Hermes等主流Agent脚手架,可直接用于开发。

核心技术手段

  • 高知识密度精筛:过滤重复、低质、易引发幻觉的数据,提升单位参数有效知识密度。
  • 语义Token压缩优化:优化分词与表征,让每个Token承载更多有效信息,减少表达所需的Token数。
  • 知识点级校验与自反馈机制:持续纠偏、主动抑制幻觉。
  • 稀疏MoE架构:叠加稀疏知识编码和知识蒸馏,使专家模块更精干。U2总参数量2660亿,性能可媲美1.2万亿参数模型,参数效率约为后者的5倍。
  • 隐式思考机制:在隐藏层先理清解题方向,减少显式推理链的输出,可将思考Token消耗减少约25%。
  • 原生Agent能力:通过Harness Engineering与模型训练闭环,使模型原生具备多步规划、工具调用和过程纠错能力,完成复杂任务所需交互轮次更少。

性能表现

  • 指令遵循:IFBench评测表现突出。
  • Agent任务:Claw系列Agent评测、GDPval办公能力评测均处于前列。
  • 推理与长文本:GPQA硬核推理和长文本理解上,以极低激活参数实现接近或超越部分超大模型的效果。
  • 实测案例:生成交互式粒子宇宙前端demo(近1000行代码,无外部库)、12星座心理分析应用、OPC赛道深度研究报告(自动引用公开数据),均展现较强的Coding、Agent和推理能力。

商业模式与业绩

云知声定位为“港股AGI第一股”,坚持“强基模+深应用”路线,围绕智慧医疗、智慧生活等场景落地。其业务体系包括底层U2基座模型、中间兽牙智能体平台、上层产业场景及MaaS/生态平台。

  • 公司团队不足500人,年营收超10亿元。
  • 2025年大模型相关收入突破6.1亿元,同比增长超10倍。
  • 2026年5月Token调用收入ARR环比增长600%,预计6月仍将高速增长。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。