OpenAI与博通联手发布自研推理芯片,英伟达面临多方围堵

2026/06/25 14:31阅读量 4

OpenAI与博通合作推出首颗自研推理芯片Jalapeño,从设计到流片仅九个月,目标部署10GW,已能运行GPT-5.3。博通凭借ASIC定制和高速网络优势,成为AI公司“去英伟达”的关键伙伴。与此同时,亚马逊、谷歌、Cerebras等也在加速自研芯片部署,英伟达虽财报亮眼(单季营收816亿美元),但推理市场正被竞争对手蚕食。

事件概述

OpenAI与博通合作发布了首颗自研推理芯片Jalapeño,该芯片从架构设计到流片仅用九个月,被博通称为“先进半导体历史上最快的ASIC开发周期”。Jalapeño完全围绕ChatGPT的推理需求设计,目标部署规模为10GW(约10座大型核电站的功率),目前已经在实验室中运行GPT-5.3的工程样片,OpenAI称其每瓦性能“远超当前最先进水平”。

核心信息

  • 博通的地位:博通是做定制AI芯片(ASIC)和高速以太网交换芯片的通信公司,其最新Tomahawk 6交换芯片单颗交换能力达102.4Tbps。由于博通不涉足大模型或云服务业务,保持“中立”身份,因此OpenAI和Anthropic都选择与其合作。博通2026财年AI半导体业务收入预计约560亿美元(2025财年约200亿美元),最新季度收入108亿美元,同比增长143%。
  • 英伟达的处境:英伟达2026年5月最新季度营收816亿美元,数据中心收入752亿美元,同比增长92%;毛利率74.9%。但竞争对手正在多个方向逼近:亚马逊Trainium芯片年化收入已突破200亿美元,若按市场价计算可达500亿美元;谷歌云单季收入首破200亿美元,AI Agent收入同比增长800%,并与Anthropic锁定约3.5GW的下一代TPU算力;Cerebras凭借OpenAI的200亿美元合同完成64亿美元IPO。
  • OpenAI与Anthropic的差异化策略:OpenAI将算力分为两条路线——英伟达GPU负责训练,Cerebras和博通负责推理(Cerebras提供晶圆级芯片,低延迟;博通提供定制芯片和网络)。Anthropic则全部押注亚马逊Trainium,承诺未来十年在AWS上花费超1000亿美元,锁定5GW算力。二者都在脱离英伟达的单一依赖。
  • “芯片自主权外包”模式:博通为客户提供从设计、代工管理、供应链到网络系统的全套服务。AI公司只负责定义芯片架构,博通提供工程化和量产能力。这种模式让客户拥有芯片“定义权”而无需从零开始。英伟达由于销售成品GPU且与客户存在竞争关系,无法复制该模式。

值得关注

  1. 推理专用化趋势:大模型推理是稳定、海量、可预测的工作负载,适合专用芯片(砍掉GPU中不必要的电路)。Jalapeño以及Cerebras、Trainium的崛起标志着推理芯片正在从通用GPU向定制化方向转变,这对英伟达的长期收入结构构成潜在威胁。
  2. 芯片竞争格局变化:英伟达不仅在面对博通、亚马逊、谷歌的ASIC竞争,还面临HBM(高带宽内存)供应瓶颈——GPU中很大一部分成本用于SK海力士和三星的HBM,这部分利润并不归属英伟达。
  3. 电力消耗规模:若OpenAI和Anthropic两个超大规模算力园区(合计约14.7GW)全天运行,年耗电量相当于15座大型核电站,反映出AI基础设施对能源的巨大需求。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。