美团LongCat-2.0:国产算力“期房”还是真突破?
美团发布LongCat-2.0大模型,参数1.6万亿,基于五万卡国产ASIC集群训练,SWE-bench Pro评分59.5略超GPT-5.5。但权重“即将推出”、训练数据不公开、芯片厂商和成本保密,被质疑为“伪开源”。API依赖低价和免费额度冲高调用量,实质为垂直模型,难以复制。
事件概述
美团在Hugging Face上发布LongCat-2.0大模型,宣称采用五万卡国产专用AI加速芯片集群,从头训练1.6万亿参数MoE模型(平均激活约480亿),原生支持百万token上下文。在SWE-bench Pro上取得59.5分,略高于GPT-5.5的58.6分。但官方未公开芯片厂商、训练总成本和实际耗时(wall-clock)三个关键数据,且模型权重状态为“coming soon”,仅开放了推理框架和Infra代码,训练数据(35T以上tokens)未公布。
核心信息
-
“伪开源”争议:LongCat标注MIT许可证,但权重待上线、数据不公开,行业无法复现训练或微调。对比DeepSeek V4的全开源策略,美团更接近免费商用的闭源模型。数据不公开可能因为混入内部业务数据(外卖、商家信息等),但导致测试集泄露风险无法验证。
-
调用量全球前三的真相:LongCat以匿名身份“Owl Alpha”在OpenRouter平台运行,月调用量进入前三。但API定价仅0.30美元/百万token(GPT-5.5为2.50美元),且大量免费额度,属于新模型冲榜常规手段。收费后排名持续性存疑。
-
垂直定位与通用叙事错位:LongCat本质为美团本地生活业务(商家智能助手、外卖调度等)优化,通用对话和多模态能力弱于同期竞品。但宣传中常被包装成通用大模型突破。同期国产模型(Kimi K3 2.5T参数、百度文心5.0 2.4T参数、DeepSeek V4)均走不同路线。
-
经济性与可复制性:五万卡集群三年折旧加运维成本接近百亿,美团可依靠自身业务现金流支撑,但纯AI创业公司无法复制。阿里、京东采用微调加业务落地的轻量路线,与美团“全栈自研+从零训练”的重路线形成对比。
值得关注
- LongCat证明国产算力可完成端到端训练验证,但缺乏透明性(芯片供应商、训练成本、实际耗时)使行业无法对标或复制。
- 真正的开源交付应包含:芯片与集群配置可核验、权重可下载、训练数据构成与清洗规则可追溯。在满足这些条件前,LongCat更像工程演示而非公共基础设施。
- 国产AI大模型当前面临路线分化:资本市场催高参数竞赛,但企业真实需求是轻量化降本方案。万亿参数模型对奶茶店老板解决差评问题可能并无必要。
