OpenAI与Broadcom推出首款专为LLM推理优化芯片“Jalapeño”

2026/06/24 14:00阅读量 8

OpenAI与Broadcom联合发布名为Jalapeño的专用推理芯片,这是OpenAI首款自研AI加速器。芯片从底层针对大语言模型推理设计,9个月内完成从设计到流片,早期测试显示能耗比显著优于现有产品。该芯片将作为多代计算平台首步,计划2026年底前部署,旨在降低推理成本、提升AI可及性。

事件概述

OpenAI与Broadcom(纳斯达克:AVGO)正式推出代号“Jalapeño”的首款智能处理器(Intelligence Processor)。该芯片专为大语言模型(LLM)推理场景从头设计,是双方共建多代计算平台的第一款AI加速器,目标让高级AI更快、更可靠、更易获取。

核心信息

  • 芯片定位:Jalapeño并非从过往AI负载改造而来的通用加速器,而是基于OpenAI对LLM推理的深入理解(涉及ChatGPT、Codex、API及未来智能体产品运行的系统)实现“白板设计”,兼顾当前与未来的主流LLM。
  • 开发周期:从初始设计到流片仅用9个月,OpenAI称这是高性能先进半导体领域最快的ASIC开发周期。速度得益于OpenAI自身模型参与设计与优化,实现软硬件深度协同。
  • 性能表现:工程样品已在实验室中运行机器学习负载(含GPT‑5.3‑Codex‑Spark),达到生产目标频率与功耗。早期测试表明,Jalapeño的每瓦性能将大幅优于当前业界最优水平,详细技术报告将在未来数月发布。
  • 架构特点:通过减少数据移动、均衡计算与存储及网络资源,使实际利用率接近理论峰值。Broadcom提供硅实现与Tomahawk网络芯片,支撑大规模量产部署。
  • 部署计划:Jalapeño是第一代产品,2026年底前开始部署,后续有多代路线图。OpenAI与Broadcom、Celestica合作,结合微软等伙伴实现千兆瓦级数据中心部署。

战略意义

OpenAI总裁Greg Brockman表示,世界正走向计算驱动的经济,Jalapeño是OpenAI全栈基础设施长期战略的一部分,旨在让算力更充裕,使AI更快、更可靠、更廉价。OpenAI硬件负责人Richard Ho指出,芯片架构围绕前沿AI模型最关键的算子、内存移动、网络和服务模式优化,早期测试表明可接近硬件理论极限高效执行大部分重要工作负载。

Broadcom CEO Hock Tan强调,此次合作是对未来十年AI物理基础设施的根本投入,多代路线图刚刚开始,通过与OpenAI直接协同开发业界领先硅片,能在2026年起依托微软等伙伴部署千兆瓦级数据中心。

影响与总结

Jalapeño的出现意味着OpenAI不再只做模型和产品,而是自研底层硬件,形成“芯片架构—内核—内存—网络—调度—部署—产品体验”全栈闭环。每一层都能围绕“让模型更快、更可靠、更便宜”这一目标优化,从而加速飞轮:更优基础设施→更高算力效率→更强的训练与服务→更强大的模型→更好的产品→更多用户与收入→再投资下一代基础设施,最终让高级智能更普及、更可靠、更便宜。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。