商汤免费1500次调用背后的三层护城河:从架构创新到生态锁定

2026/05/13 14:24阅读量 3

商汤推出SenseNova 6.7 Flash-Lite、SenseNova U1模型及Skills工具集,并赠送首月每5小时1500次免费调用额度。核心策略是通过NEO-Unify统一架构实现图文交错生成与信息图能力,降低Token消耗60%,再以开源、工具链和低成本构建生态锁定的三层护城河。

事件概述

商汤近期发布三款新产品:SenseNova 6.7 Flash-Lite(多模态智能体模型)、SenseNova U1(基于NEO-Unify架构的图文统一模型)和SenseNova-Skills(办公技能工具集),同时推出SenseNova Token Plan,首月每5小时赠送1500次免费调用额度。此举在大模型公司普遍收费的背景下形成反差,其目标是通过模型差异化、低成本输出和工具链完整性构建三层护城河。

核心信息

  1. 第一层护城河:模型差异化

    • SenseNova U1基于自研NEO-Unify架构,将视觉理解与图像生成统一在同一表示空间,摒弃传统视觉编码器+VAE的分离模式。采用Mixture-of-Transformers(MoT)解耦参数但共享注意力上下文,实现近无损视觉接口与分辨率自适应生成。
    • 在基准测试中,U1系列(含8B和A3B版本)在MMMU、OCRBench等理解任务上表现均衡,GenEval生成得分约0.91-0.92,长文本渲染(LongText-Bench)中英文均超0.96。
    • 统一架构带来跨能力协同:理解与生成同步提升,而非折中。实测可一句指令生成完整图文教程(如炒菜步骤)、信息图(如碳循环图),避免传统多环节拼接导致的“人肉胶水”问题。
  2. 第二层护城河:低成本留住用户

    • SenseNova 6.7 Flash-Lite专为长链路办公场景设计,原生支持OpenClaw、Hermes Agent等智能体框架,可直接看懂网页布局、文档结构、财务图表。
    • 相比纯文本智能体,6.7 Flash-Lite的Token消耗直降60%。在36个月、近90万行销售数据案例中,模型自动进行数据审计、异常值判断,并给出定价与品类调整建议,还能全自动生成PPT。
  3. 第三层护城河:工具链与生态锁定

    • Token Plan提供首月大额免费额度,U1模型基于Apache 2.0协议开源(支持商业使用和本地部署),降低开发者进入门槛。
    • 配套SenseNova-Skills覆盖信息图生成、PPT创作、数据分析、深度调研等高频场景;Agent Pack集成Hermes Agent和OpenClaw框架,可一键部署。
    • 推理系统采用LightLLM调度+LightX2V生成,FlashAttention3后端在统一多模态prefill中相比Triton加速2.3-3.2倍,支撑低成本大规模服务。
    • 通过“免费/低价模型吸引试用→工具链产生粘性→团队规模扩散形成网络效应”的飞轮,商汤试图在模型能力差距缩小的竞争中建立生态优势。

值得关注

  • U1系列模型权重已在GitHub开源,Hugging Face Trending榜获得关注,与Qwen、InternVL等开源模型形成直接竞争。
  • 商汤强调“多模态智能的未来突破在于内核架构创新而非简单规模扩大”,NEO-Unify的统一架构是否能长期保持技术壁垒,取决于后续迭代速度和开发者生态建设。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。