OpenAI与Broadcom推出首款专为LLM推理优化芯片“Jalapeño”

2026/06/24 14:00阅读量 8

OpenAI与Broadcom联合发布名为Jalapeño的专用推理芯片，这是OpenAI首款自研AI加速器。芯片从底层针对大语言模型推理设计，9个月内完成从设计到流片，早期测试显示能耗比显著优于现有产品。该芯片将作为多代计算平台首步，计划2026年底前部署，旨在降低推理成本、提升AI可及性。

事件概述

OpenAI与Broadcom（纳斯达克：AVGO）正式推出代号“Jalapeño”的首款智能处理器（Intelligence Processor）。该芯片专为大语言模型（LLM）推理场景从头设计，是双方共建多代计算平台的第一款AI加速器，目标让高级AI更快、更可靠、更易获取。

核心信息

芯片定位：Jalapeño并非从过往AI负载改造而来的通用加速器，而是基于OpenAI对LLM推理的深入理解（涉及ChatGPT、Codex、API及未来智能体产品运行的系统）实现“白板设计”，兼顾当前与未来的主流LLM。
开发周期：从初始设计到流片仅用9个月，OpenAI称这是高性能先进半导体领域最快的ASIC开发周期。速度得益于OpenAI自身模型参与设计与优化，实现软硬件深度协同。
性能表现：工程样品已在实验室中运行机器学习负载（含GPT‑5.3‑Codex‑Spark），达到生产目标频率与功耗。早期测试表明，Jalapeño的每瓦性能将大幅优于当前业界最优水平，详细技术报告将在未来数月发布。
架构特点：通过减少数据移动、均衡计算与存储及网络资源，使实际利用率接近理论峰值。Broadcom提供硅实现与Tomahawk网络芯片，支撑大规模量产部署。
部署计划：Jalapeño是第一代产品，2026年底前开始部署，后续有多代路线图。OpenAI与Broadcom、Celestica合作，结合微软等伙伴实现千兆瓦级数据中心部署。

战略意义

OpenAI总裁Greg Brockman表示，世界正走向计算驱动的经济，Jalapeño是OpenAI全栈基础设施长期战略的一部分，旨在让算力更充裕，使AI更快、更可靠、更廉价。OpenAI硬件负责人Richard Ho指出，芯片架构围绕前沿AI模型最关键的算子、内存移动、网络和服务模式优化，早期测试表明可接近硬件理论极限高效执行大部分重要工作负载。

Broadcom CEO Hock Tan强调，此次合作是对未来十年AI物理基础设施的根本投入，多代路线图刚刚开始，通过与OpenAI直接协同开发业界领先硅片，能在2026年起依托微软等伙伴部署千兆瓦级数据中心。

影响与总结

Jalapeño的出现意味着OpenAI不再只做模型和产品，而是自研底层硬件，形成“芯片架构—内核—内存—网络—调度—部署—产品体验”全栈闭环。每一层都能围绕“让模型更快、更可靠、更便宜”这一目标优化，从而加速飞轮：更优基础设施→更高算力效率→更强的训练与服务→更强大的模型→更好的产品→更多用户与收入→再投资下一代基础设施，最终让高级智能更普及、更可靠、更便宜。

阅读原文详情

事件概述

核心信息

战略意义

影响与总结

准备好启动您的定制项目了吗？