拆掉Token暴利墙,云厂商下场造芯

2026/05/20 11:29阅读量 3

全球头部云厂商加速自研AI芯片,AWS、谷歌云、微软云路径分化,分别覆盖训推一体、训推解耦、推理优化。通过自研芯片降低推理成本、减少对英伟达依赖,亚马逊、谷歌、微软2026年资本开支指引均接近2000亿美元。国内云厂商以阿里真武、华为昇腾950、腾讯792亿元投入跟进,构建超万卡集群算力底座。

事件概述

Agent爆发驱动大模型训练与推理需求增长,云厂商自研芯片进入商业化阶段。AWS、谷歌云、微软云路径分化:AWS采用Trainium/Graviton训推一体,安迪·贾西披露Trainium3效能提升4倍、能耗降低40%,AI训练与推理成本最多减少50%;谷歌云将第八代TPU拆分为TPU 8t(训练)和TPU 8i(推理),训练性价比提升约2.7倍,推理性价比提升80%;微软发布Maia 200,仅支持低精度计算,定位于Azure AI和Copilot推理业务。

核心信息

  • 市场反应:AWS Trainium2全面售罄,Trainium3接近满订,Trainium4提前一年半被预订大半;Anthropic承诺向AWS定制芯片投入高达1000亿美元;Meta与AWS在Graviton采购上达成合作。
  • 成本竞争:SemiAnalysis报告显示谷歌第七代TPU在TCO上对英伟达构成优势,OpenAI已从英伟达获得约30%算力报价折扣;黑石与谷歌成立合资公司,提供TPU compute-as-a-service。
  • 资本开支:亚马逊2026年一季度资本开支432亿美元,全年指引约2000亿美元;Alphabet提高至1800-1900亿美元;微软约1900亿美元。
  • 国内进展:阿里在万卡集群中使用自研芯片“真武”;华为昇腾950计划2026年生产约75颗;腾讯计划投入792亿元用于AI基础设施。

值得关注

云厂商角色从算力出租方转变为重资产基础设施方,自研芯片虽短期内未必直接改善利润,但能降低单位推理成本、增强客户黏性,进而决定云服务利润上限。英伟达短期主导地位难以撼动,但云厂商通过多样化芯片供给争夺AI定价权,Token成本下降将成为AI商业化关键变量。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。