OpenAI首款自研AI芯片Jalapeño流片,全栈战略迈出关键一步
2026/06/25 23:00阅读量 3
OpenAI与博通合作开发的首款定制AI芯片Jalapeño已成功流片,这是一款面向推理场景的ASIC,标志着OpenAI正式向AI基础设施层扩张。芯片采用台积电3nm工艺,已在GPT-5.3-Codex-Spark上运行,计划2026年底投入使用,2028年实现GW级算力集群。此举旨在降低对英伟达的依赖,通过软硬件协同优化降低推理成本,巩固token经济优势。
事件概述
OpenAI宣布其与博通合作开发的首款定制AI芯片Jalapeño已完成流片(tape-out)。该芯片是一款面向推理场景设计的专用集成电路(ASIC),是OpenAI全栈战略中从模型向下延伸至基础设施的关键一环。
核心信息
- 开发周期:OpenAI声称从架构设计到流片仅用9个月,为“史上最快”纪录。但实际研发可能早于2025年10月官宣合作的时间点。
- 供应链:芯片由OpenAI设计加速器,博通提供芯片制造、网络连接技术,天弘科技(Celestica)负责系统搭建。
- 工艺与架构:预计采用台积电3nm工艺,引入systolic array(脉动阵列)架构,搭配HBM与ARM架构CPU。
- 测试验证:已在OpenAI的轻量版模型GPT-5.3-Codex-Spark上跑通,频率和功耗符合设计目标,资源利用率接近理论峰值,能效表现较高。
- 部署节奏:2026年底首次投入使用,2027年显著加速,2028年上半年全面发力,最终实现GW级算力集群。
值得关注
- 战略意义:Jalapeño使OpenAI首次具备从模型到底层基础设施协同优化的能力,不再完全依赖微软、亚马逊或谷歌等外部硬件体系。这是其全栈控制权的第一步,后续还将自研芯片架构、内核软件、内存系统、网络架构等。
- 降低依赖:OpenAI希望未来至少10%的算力来自英伟达生态之外。此前已测试亚马逊Trainium芯片、与Cerebras合作,并推出MRC网络协议以提升集群稳定性。
- 与竞品对比:Anthropic直至2026年4月才传出探索自研芯片的消息,尚未确定设计方案或组建团队。OpenAI在基础设施自主权上领先。
- 商业闭环:通过软硬件协同降低推理成本,提升资源利用率,加速token经济正向循环:基础设施效率→算力→模型能力→产品体验→收入→再投入。
- 后续发展:OpenAI正与高通、联发科共同开发智能手机芯片,进一步拓展芯片布局。
