2026年OpenAI首秀自研推理芯片Jalapeño，每瓦性能优或改善Codex经济效益

📅 2026/6/25 21:37:15

Jalapeño芯片问世全流程跑通2026年6月24日OpenAI首次向外界展示了其自研的首款定制AI推理芯片代号Jalapeño。这颗芯片由OpenAI与Broadcom联合设计与制造专为OpenAI推理系统的工作负载而优化。OpenAI表示公司自家的AI模型也参与了芯片设计过程。虽然芯片仍在测试阶段但早期结果显示其每瓦性能显著优于当前市场上最先进的替代方案。对于密切关注AI基础设施竞争的人来说Jalapeño的问世并不意外但它落地的速度仍然值得关注。OpenAI与Broadcom的合作在2025年10月正式宣布而在此之前OpenAI自研芯片的传闻已经在业内流传了至少一年。早在2025年初路透社就报道了OpenAI计划在当年完成首款定制芯片设计的消息。如今这颗芯片以实物形态而非PPT的形式出现意味着OpenAI从芯片设计到流片、再到测试验证的全流程已经跑通。打破GPU垄断OpenAI加入定制芯片行列理解Jalapeño的战略意义需要先厘清AI芯片市场当前的格局。过去五年Nvidia的GPU几乎垄断了AI训练和推理的计算市场----从GPT - 4到Claude到Gemini几乎所有前沿模型的训练和部署都依赖Nvidia的H100/B200系列芯片。这种依赖带来的问题是双重性的一方面是成本Nvidia的高端GPU售价长期维持在高位且供不应求另一方面是架构通用性的代价----GPU是为通用并行计算设计的而非专门为Transformer架构或特定推理场景优化。这为定制芯片留下了明确的优化空间如果能针对自家模型的特定计算模式定制硅片理论上可以实现数倍的能效比提升。Google是最早验证这条路线的公司。它的TPU张量处理单元从2016年起就为内部推理和训练工作负载提供支持目前已经迭代到第六代。Amazon紧随其后先后推出推理芯片Inferentia和训练芯片Trainium为AWS上的AI客户提供Nvidia之外的选择。Jalapeño的亮相标志着OpenAI也正式加入了这场用定制硅片打破GPU垄断的行列----而且它不是从零开始的。Broadcom在定制ASIC领域拥有数十年的经验曾为Google、Meta等公司定制过数据中心芯片这次合作本质上是OpenAI的算法知识加上Broadcom的工程能力的结合。Broadcom角色关键产业链权力结构转移Broadcom在这场合作中的角色同样值得玩味。作为全球最大的定制ASIC设计公司之一Broadcom的业务模式与Intel或AMD等通用芯片厂商有本质区别----它不制造可以在市场上公开销售的标准化芯片而是为特定客户设计特定用途的定制硅片。在此之前Broadcom已经为Google的TPU系列、Meta的推荐系统加速器等多个大型数据中心项目提供过定制芯片设计服务。与OpenAI的合作之所以引人注目是因为它意味着Broadcom正在巩固自己在AI定制芯片设计领域的核心供应商地位----而当一家年营收超百亿美元的芯片巨头把AI模型公司视为最重要的长期客户群时整个产业链的权力结构正在发生深刻的转移。芯片策略明确或改善Codex经济效益OpenAI总裁Greg Brockman在合作宣布后的内部播客中解释了公司的芯片策略。他说OpenAI对自家工作负载有深入的理解一直在寻找那些被通用硬件服务不充分的特定场景----那些用GPU跑成本太高、但用定制芯片却可以大幅优化的计算模式。Jalapeño正是为推理场景定制的----即当用户向已训练好的AI模型发送请求时模型生成响应的计算过程。在官方公告中OpenAI特别强调了这颗芯片在运行实时编程模型时的低运营成本。这意味着对于Codex这类需要低延迟、高并发的代理式AI产品来说Jalapeño可能带来直接的单位经济效益改善。AI参与设计展现自举效应一个容易被忽略但同样重要的细节是OpenAI的AI模型参与了Jalapeño的设计过程。这并非营销噱头。芯片设计中的布局布线、电源网络优化、时序收敛等环节存在大量的排列组合搜索空间正是AI擅长的领域。Google DeepMind在2020年就展示了用强化学习优化芯片布局的能力并在其TPU设计中实际部署了这一技术。OpenAI使用自家模型辅助芯片设计意味着AI不仅在向上游产品、应用渗透也在向下游硬件、基础设施延伸----用AI来设计运行AI的芯片这种自举效应在工程意义上耐人寻味。成本关注贯穿垂直整合策略凸显对成本的关注贯穿了Jalapeño的整个叙事。OpenAI在声明中特意指出OpenAI不仅开发前沿模型或在其上构建产品它还在设计其底层的基础设施芯片架构、内核、内存系统、网络、调度、部署系统和产品体验。因为OpenAI横跨整个技术栈每一层都可以围绕同一个目标进行优化让模型对用户来说更快、更可靠、更经济。这段表述清晰地勾勒出了一种垂直整合策略类似于苹果对iPhone的做法----控制从芯片到操作系统到应用的全链路以换取性能和体验的最优解。经济账可观量产仍需时日从商业角度审视Jalapeño的经济账不难算。推理成本是目前AI商业化的核心瓶颈之一----当OpenAI以每月20美元或200美元的订阅价格向用户提供ChatGPT和ChatGPT Pro时每一次对话、每一次代码生成都在消耗GPU的计算资源。如果定制芯片能将单次推理的能耗和时延降低30%到50%----考虑到Google TPU在类似场景中已经证明了这一量级的改进是可行的 ----那么无论是在保持价格不变的前提下提高毛利率还是在降低价格的同时扩大用户基数都给OpenAI提供了更多战略选择。尤其值得关注的是OpenAI特别提到实时编程模型的运行成本这暗示了Codex及其衍生产品如GitHub Copilot背后的模型服务可能是Jalapeño首批承载的商业化负载之一。当然Jalapeño目前还远未到量产阶段。OpenAI坦承芯片仍在测试中更重型的任务如预训练可能仍将依赖Nvidia硬件。考虑到芯片从测试到大规模部署通常需要一到两年时间以及良率、散热、软件生态兼容性等一系列工程挑战Jalapeño真正成为OpenAI推理基础设施的主力可能要到2027年至2028年。但即便如此它的出现已经向市场传递了一个清晰的信号AI模型公司正在向上游扩张芯片将不再是只能向Nvidia购买的商品而可以成为差异化的护城河。

新闻详情

相关阅读

企业展厅不一定贵，但要看这几点

编写prompt的原则

记一次C++调用Java下载接口偶发失败的排查与优化：从时间戳冲突到UUID

嵌入式开发实战：从DEMOJM评估板到BDM调试工具选型指南

前端 - React - - useEffect和useLayoutEffect的区别

数据库设计实战：高并发订单系统的分库分表与数据一致性架构

RAG原理与工程实践：从知识检索到可信生成的完整链路

PowerBuilder程序的数据窗口PDF导出办法

B站视频收藏者的救星：三步解锁m4s缓存文件

过度设计的代价：从 Maven 版本幻觉到工程上的简单原则

Claude Code 提示词设计：从塑造“人格”到建立“状态机”

MC-037 | 自定义 Skill 开发：创建你的AI能力模块

3个步骤让小爱音箱变身AI语音助手：MiGPT深度体验指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用