美团LongCat-2.0：国产算力“期房”还是真突破？

2026/07/03 18:49阅读量 2

美团发布LongCat-2.0大模型，参数1.6万亿，基于五万卡国产ASIC集群训练，SWE-bench Pro评分59.5略超GPT-5.5。但权重“即将推出”、训练数据不公开、芯片厂商和成本保密，被质疑为“伪开源”。API依赖低价和免费额度冲高调用量，实质为垂直模型，难以复制。

事件概述

美团在Hugging Face上发布LongCat-2.0大模型，宣称采用五万卡国产专用AI加速芯片集群，从头训练1.6万亿参数MoE模型（平均激活约480亿），原生支持百万token上下文。在SWE-bench Pro上取得59.5分，略高于GPT-5.5的58.6分。但官方未公开芯片厂商、训练总成本和实际耗时（wall-clock）三个关键数据，且模型权重状态为“coming soon”，仅开放了推理框架和Infra代码，训练数据（35T以上tokens）未公布。

核心信息

“伪开源”争议：LongCat标注MIT许可证，但权重待上线、数据不公开，行业无法复现训练或微调。对比DeepSeek V4的全开源策略，美团更接近免费商用的闭源模型。数据不公开可能因为混入内部业务数据（外卖、商家信息等），但导致测试集泄露风险无法验证。
调用量全球前三的真相：LongCat以匿名身份“Owl Alpha”在OpenRouter平台运行，月调用量进入前三。但API定价仅0.30美元/百万token（GPT-5.5为2.50美元），且大量免费额度，属于新模型冲榜常规手段。收费后排名持续性存疑。
垂直定位与通用叙事错位：LongCat本质为美团本地生活业务（商家智能助手、外卖调度等）优化，通用对话和多模态能力弱于同期竞品。但宣传中常被包装成通用大模型突破。同期国产模型（Kimi K3 2.5T参数、百度文心5.0 2.4T参数、DeepSeek V4）均走不同路线。
经济性与可复制性：五万卡集群三年折旧加运维成本接近百亿，美团可依靠自身业务现金流支撑，但纯AI创业公司无法复制。阿里、京东采用微调加业务落地的轻量路线，与美团“全栈自研+从零训练”的重路线形成对比。

值得关注

LongCat证明国产算力可完成端到端训练验证，但缺乏透明性（芯片供应商、训练成本、实际耗时）使行业无法对标或复制。
真正的开源交付应包含：芯片与集群配置可核验、权重可下载、训练数据构成与清洗规则可追溯。在满足这些条件前，LongCat更像工程演示而非公共基础设施。
国产AI大模型当前面临路线分化：资本市场催高参数竞赛，但企业真实需求是轻量化降本方案。万亿参数模型对奶茶店老板解决差评问题可能并无必要。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？