半年20余倍增长:无问芯穹Token工厂的生意飞轮
无问芯穹作为中立第三方Token工厂,2025年12月至2026年4月其Agentic MaaS平台Token调用量增速超20倍,95%以上需求来自智能体场景。公司通过软硬协同优化实现万亿参数模型5-10倍性价比提升,形成“需求越多-优化越强-成本越低”的商业飞轮。推理需求爆发带动国产芯片在Prefill等场景落地,Token成本仍有1-2个数量级下降空间,可能催生大量小型AI原生组织。
事件概述
AI产业叙事已从训练转向推理,2026年全球企业推理基础设施资本支出预计达680亿美元,超过训练基建的450亿美元。无问芯穹定位为中立第三方Token生产中枢,不做芯片、不做通用大模型、不做C端应用,专注于将算力高效转化为Token。2025年12月至2026年4月,其Agentic MaaS平台Token调用量增长超20倍,其中95%以上需求来自智能体场景。
商业飞轮
无问芯穹提出AI生产力公式:智能规模 × Token生产效率 × Token价值转化。当前在万亿参数大模型场景已实现5-10倍的性价比提升。其飞轮逻辑为:需求越多越多元,适配芯片与模型的组合优化空间越大,优化能力越强,产出更稳定高性价比的Token,进而吸引更多需求。目前采用按Token计费模式(类似广告CPM),技术优化节省的成本直接转化为毛利,再投入研发形成正向循环。
推理精细化与国产芯片机会
大模型推理分为计算密集型的Prefill阶段和访存密集型的Decode阶段,两类任务对芯片要求不同。国产芯片已越过“能不能用”阶段,在Prefill场景已实现落地,找到了真实的产业着力点。即使抛开国产化叙事,全球AI算力仍处于供不应求状态,无问芯穹的核心业务逻辑不受影响。
未来展望
Token成本目前还有1-2个数量级的下降空间,成本降低后,将催生大量十人、二十人以内的小型AI原生组织。这类组织人和AI深度协作,生产效率远超传统同规模团队,已完成数字化转型的赛道会更早出现这类组织。当前AI仍处于需求大于供给的阶段,远未到零和博弈,产业链各主体创造价值即可获得收益,范式突破只会带来新的增长空间。
