火猫 AI

核心服务定制优势系统升级 AI 智能体 Skills 定制开发

AI 工具扣子智能体

精选案例资讯中心

安全保障关于我们联系我们

每日 AI 资讯

国产算力全链路突破：DeepSeek-V4与美团LongCat重塑万亿参数模型格局

2026/04/28 17:18阅读量 2

中国大模型在国产芯片集群上实现全链路训练，DeepSeek-V4与美团LongCat-2.0-Preview的发布标志着国产万亿参数模型数量首次超越美国。美国AI“御三家”对此反应各异，GPT-5.5承认压力，Gemini 3.1视其为“掀桌子”级威胁，而Claude Opus 4.7则保持从容。这一突破迫使行业重新审视英伟达生态垄断，并推动软硬件协同重构与容错体系建设。

事件概述

随着 DeepSeek-V4 和美团 LongCat-2.0-Preview 的发布，中国在大模型领域取得关键性突破。两大模型均基于国产芯片集群完成训练，标志着国产算力已具备支撑万亿参数模型全链路替代的能力，不再局限于小范围测试或仅关注推理环节。

核心事实与数据

竞争格局逆转：全球范围内，中国发布的万亿级参数模型数量首次超过美国，打破了该级别模型长期由海外大厂垄断的局面。
供应链变化：新加坡曾占据英伟达 GPU 出口量的近 30%，现转口贸易比重显著下降，反映出高端算力获取渠道的多元化趋势。
技术适配难度：DeepSeek-V4 多次跳票的主要原因在于需花费大量时间适配国产芯片集群，包括重写核心算子、构建确定性算子以及建立完整的容错体系。
产业投资布局：美团通过投资半导体领域十余家公司（涵盖新材料、晶圆制造、芯片设计及 TPU），为国产算力提供了持续的资金与技术弹药。

国际巨头反应

针对 DeepSeek-V4 的发布，美国主流闭源大模型表现出不同态度：

GPT-5.5：态度相对“傲娇”，虽不认为这是终结比赛的事件，但承认百万级上下文带来的低成本优势将对整个行业造成巨大压力，并表示将“盯紧”该对手。
Gemini 3.1：定性更为严厉，将其视为“掀桌子”级别的危险竞品，直言当开源模型在舒适区展现统治力时，压迫感极其真实。
Claude Opus 4.7：表现最为从容，表示若 DeepSeek-V4 在特定任务场景更优则愿意切换使用，强调无需在所有任务上追求最优解。

技术挑战与未来路径

脱离英伟达 CUDA 生态并非易事，国产模型面临以下核心挑战：

软硬件协同重构：万亿参数对显存容量和带宽要求极高，需重构整个软硬件工程体系。
算子重写与优化：必须针对国产芯片特性重写核心算子，甚至自研全确定性的算子以确保训练精确可复现。
容错机制建设：在万卡集群长期训练中，硬件故障不可避免，需同步构建检测与恢复体系。
成本与效率平衡：需针对国产环境特点优化训练框架和模型结构，确保性能满足需求。

未来竞争将从上半场的“拼算力资源”转向下半场的“比物理底座”。中国凭借无人机、无人车、机器人及工业规模等独特场景，拥有全球独一档的稀缺数据优势，这将为芯片厂商提供长期连续的真实负载验证，助力国产模型结合产业结构实现弯道超车。

阅读原文详情

准备好启动您的定制项目了吗？

现在咨询，即可获得免费的业务梳理与技术架构建议方案。

联系我们查看案例