商汤免费1500次调用背后的三层护城河：从架构创新到生态锁定

2026/05/13 14:24阅读量 3

商汤推出SenseNova 6.7 Flash-Lite、SenseNova U1模型及Skills工具集，并赠送首月每5小时1500次免费调用额度。核心策略是通过NEO-Unify统一架构实现图文交错生成与信息图能力，降低Token消耗60%，再以开源、工具链和低成本构建生态锁定的三层护城河。

事件概述

商汤近期发布三款新产品：SenseNova 6.7 Flash-Lite（多模态智能体模型）、SenseNova U1（基于NEO-Unify架构的图文统一模型）和SenseNova-Skills（办公技能工具集），同时推出SenseNova Token Plan，首月每5小时赠送1500次免费调用额度。此举在大模型公司普遍收费的背景下形成反差，其目标是通过模型差异化、低成本输出和工具链完整性构建三层护城河。

核心信息

第一层护城河：模型差异化
- SenseNova U1基于自研NEO-Unify架构，将视觉理解与图像生成统一在同一表示空间，摒弃传统视觉编码器+VAE的分离模式。采用Mixture-of-Transformers（MoT）解耦参数但共享注意力上下文，实现近无损视觉接口与分辨率自适应生成。
- 在基准测试中，U1系列（含8B和A3B版本）在MMMU、OCRBench等理解任务上表现均衡，GenEval生成得分约0.91-0.92，长文本渲染（LongText-Bench）中英文均超0.96。
- 统一架构带来跨能力协同：理解与生成同步提升，而非折中。实测可一句指令生成完整图文教程（如炒菜步骤）、信息图（如碳循环图），避免传统多环节拼接导致的“人肉胶水”问题。
第二层护城河：低成本留住用户
- SenseNova 6.7 Flash-Lite专为长链路办公场景设计，原生支持OpenClaw、Hermes Agent等智能体框架，可直接看懂网页布局、文档结构、财务图表。
- 相比纯文本智能体，6.7 Flash-Lite的Token消耗直降60%。在36个月、近90万行销售数据案例中，模型自动进行数据审计、异常值判断，并给出定价与品类调整建议，还能全自动生成PPT。
第三层护城河：工具链与生态锁定
- Token Plan提供首月大额免费额度，U1模型基于Apache 2.0协议开源（支持商业使用和本地部署），降低开发者进入门槛。
- 配套SenseNova-Skills覆盖信息图生成、PPT创作、数据分析、深度调研等高频场景；Agent Pack集成Hermes Agent和OpenClaw框架，可一键部署。
- 推理系统采用LightLLM调度+LightX2V生成，FlashAttention3后端在统一多模态prefill中相比Triton加速2.3-3.2倍，支撑低成本大规模服务。
- 通过“免费/低价模型吸引试用→工具链产生粘性→团队规模扩散形成网络效应”的飞轮，商汤试图在模型能力差距缩小的竞争中建立生态优势。

值得关注

U1系列模型权重已在GitHub开源，Hugging Face Trending榜获得关注，与Qwen、InternVL等开源模型形成直接竞争。
商汤强调“多模态智能的未来突破在于内核架构创新而非简单规模扩大”，NEO-Unify的统一架构是否能长期保持技术壁垒，取决于后续迭代速度和开发者生态建设。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？