博通CEO亲自递过来一颗辣椒奥特曼接住了2026年6月24日晚上9点10分北京时间。我刷着手机看到一张照片博通CEO陈福阳那个在半导体行业里以并购狂人闻名的马来西亚华裔老头正笑眯眯地把什么东西递到山姆·奥特曼手上。不是合同不是支票。是一颗芯片。名字叫Jalapeño——哈拉贝诺辣椒。对就是墨西哥菜里那种能辣到你怀疑人生的辣椒。OpenAI给自家第一款自研AI推理芯片起了这么个名字我第一反应是这帮人是真不怕烫手。但仔细想想还真是贴切。又辣又快又热又猛——这颗辣椒可能真的要烧到英伟达的锅了。9个月从零到流片先说一个数字9个月。这是什么概念在半导体行业一颗芯片从设计到流片tape-out就是送去工厂生产第一版实物芯片通常需要2到3年。英伟达的H100从设计到量产花了将近两年半。谷歌的TPU迭代一代也是按年算的。OpenAI用了9个月。陈福阳的原话是“这是高性能先进半导体领域有史以来最快的ASIC开发周期。”注意不是之一是最快。那问题来了凭什么答案说出来你可能不信——因为ChatGPT自己参与了芯片设计。你没看错。OpenAI在研发Jalapeño的过程中用自己的AI模型来加速工程迭代和验证。芯片设计里那些最耗时的环节——架构模拟、参数调优、布线验证——大量交给了AI来完成。这就有意思了。AI帮人类设计芯片芯片造出来又用来跑AIAI变得更强又帮人类设计更好的芯片。一个闭环转起来了。而且转得飞快。OpenAI总裁格雷格·布罗克曼说了一句话我觉得是这个故事里最被低估的一句“我们的AI模型大幅压缩了芯片研发周期这样的效率提升超出了所有人的预期。”翻译成人话就是连我们自己都没想到能这么快。这也解释了为什么OpenAI要自己造芯片——不是为了跟英伟达抢生意而是因为当你比任何人都了解自己的工作负载时通用芯片永远不是最优解。训练是一次性投入推理是每天的天文数字接下来要说一个很多人没意识到的商业逻辑。AI芯片分两种用途训练和推理。训练就是模型学习的过程——消化海量数据形成能力。这是一次性的。GPT-5训练完了就完了不会再回头重新学一遍至少短期内不会。推理是模型用的过程——每一次你打开ChatGPT问个问题模型都要实时计算生成回答。训练是建工厂推理是每天开工生产。训练是一次性的资本投入推理是每天数亿用户持续产生的运营成本。对于OpenAI来说ChatGPT的月活用户已经是个天文数字。每一次对话、每一次代码生成、每一次图片理解背后都是算力在烧钱。而这些算力绝大部分跑在英伟达的GPU上。英伟达的GPU是通用芯片什么都能干训练能干推理也能干图形渲染也能干。但什么都能干的代价是它在任何一件事上都不是最优的。Jalapeño不一样。它是ASIC——专用集成电路。从出生就被设计成只干一件事跑大模型推理。打个比方英伟达的GPU像是一把瑞士军刀功能多但你拿它切菜肯定不如专用菜刀快。Jalapeño就是那把菜刀。OpenAI的判断很简单推理成本占我们日常支出的绝对大头。如果能用专用芯片把推理成本砍掉一半那就是省下了一个天文数字。没错根据早期测试数据Jalapeño的推理成本预计比英伟达GPU低50%。三到五成。你想想OpenAI一年在算力上花多少钱如果砍掉一半省下来的都是利润。这就是为什么OpenAI要造芯片。不是为了酷是为了省钱——省着省着就变成了赚钱。Jalapeño芯片核心数据信息图——展示9个月流片周期、50%成本降幅、ASIC推理定位、每瓦能效超越等关键数据性能到底行不行博通CEO敢说媲美英伟达说到这里你肯定有一个问题快是快便宜是便宜但性能到底行不行毕竟芯片这东西不是PPT上画个数字就能跑的。目前公开的信息是博通CEO陈福阳直接表示Jalapeño的性能可与英伟达Blackwell系列及谷歌TPU相媲美。这句话的分量很重。陈福阳不是OpenAI的人他是博通的CEO是合作伙伴里最懂芯片的人之一。他敢公开说媲美说明实验室数据确实拿得出手。而且早期测试还显示了一个关键指标每瓦能效大幅超越当前市面顶尖算力产品。每瓦能效是什么意思就是每消耗一度电能产出多少算力。这个指标比单纯的峰值算力重要得多——因为AI推理最大的瓶颈不是算力不够而是电费太贵、散热跟不上。Jalapeño围绕大模型的算力、内存、网络调度做了架构级的优化大幅减少了数据搬运过程中的损耗硬件利用率贴近理论峰值。简单说就是同样的电干更多的活。目前实验室的工程样片已经稳定运行GPT-5.3-Codex-Spark等前沿模型。这不是跑个benchmark刷分是真的在跑自家的生产级模型。当然我也得说一句公道话实验室数据和大规模量产数据之间还有很长的路。很多芯片倒在了从实验室到数据中心的路上。Jalapeño计划2026年底完成首批小规模部署2027年产能爬坡2028年上半年全面规模化量产。也就是说真正的大考还没开始。全栈掌控奥特曼的棋盘比你想象的大如果你觉得OpenAI造芯片只是为了省钱那你低估奥特曼了。让我把时间线拉长一点。OpenAI和博通的合作早在18个月前就启动了。2025年10月对外官宣。在那之前OpenAI还跟AI芯片公司Cerebras有过接触积累定制芯片的认知。这不是一时兴起是蓄谋已久。布罗克曼的原话透露了更多“我们不仅在开发前沿模型也在构建其上的产品更重要的是我们正在设计它们之下的基础设施——包括芯片架构、内核、内存系统、网络、调度、部署系统乃至产品体验。”你把这句话拆开看模型——OpenAI在做GPT系列。产品——OpenAI在做ChatGPT、Sora、API。芯片架构——OpenAI在做Jalapeño。内核——OpenAI在做。内存系统——OpenAI在做。网络——OpenAI在做。调度系统——OpenAI在做。部署系统——OpenAI在做。产品体验——OpenAI在做。从最底层的硅片到最顶层的用户体验OpenAI要把每一层都攥在自己手里。这不是一家AI公司的做法这是一家全栈计算公司的做法。而且别忘了搭载Jalapeño芯片的计算机系统大部分硬件架构也是OpenAI自主设计的。他们不光造芯片连服务器整机都自己搞。布罗克曼还有一句话说得很透彻“通过自主研发更多底层技术环节我们可以用更高效率提供智能服务。”翻译一下我们的模型我们自己最懂我们的负载我们自己最清楚那为什么不连跑模型的硬件也自己做这是一个正向循环模型越强对推理负载的理解越深芯片设计越精准推理成本越低能服务更多用户积累更多数据模型更强。转起来了而且是加速转。OpenAI全栈技术栈示意图——从芯片架构、内核、内存系统到模型、产品、用户体验的垂直整合图谱“去英伟达化”所有人都想自己造芯片OpenAI不是第一个造自研AI芯片的但可能是最受关注的一个。我们来盘点一下。谷歌——TPU系列从2016年就开始搞了现在是第六代还是第七代我都有点数不清了。TPU支撑了谷歌从搜索到Gemini的全部AI推理。亚马逊——Trainium系列2023年开始推去年底已经大规模部署在AWS上。亚马逊的逻辑跟OpenAI一样我自己的云上跑着无数AI推理请求凭什么给英伟达交税微软——去年发布了自己的AI加速芯片Maia专门给Azure上的AI服务用。Meta——也有自己的AI芯片MTIA系列主打推荐系统的推理。现在OpenAI也加入了。你看明白了吗所有AI巨头都在做同一件事去英伟达化。不是因为他们讨厌黄仁勋而是因为英伟达的GPU太贵了而且供不应求——你想买还不一定买得到。陈福阳说了一句话我觉得是整个行业现状最好的注脚“现有产能完全无法满足市场需求算力紧缺不止会持续2026、2027年预计2028年行业算力需求还会继续攀升。”2028年还在涨。这意味着谁手里有自研芯片谁就掌握了算力自主权。英伟达的饭碗还稳吗短期看当然稳。英伟达的CUDA生态、通用GPU的灵活性、以及训练市场的统治力不是一朝一夕能撼动的。博通股价从2022年末至今涨了近7倍2026年以来累计上涨10%但英伟达同期涨得更多。但长期看趋势很明确推理市场正在被各家自研芯片蚕食。而推理恰恰是AI计算市场中增长最快、体量最大的那块蛋糕。有意思的是OpenAI也不是把鸡蛋全放在一个篮子里。他们跟亚马逊云达成了合作可以用Trainium芯片也跟AMD、思博睿签了算力合作协议。自研加外采双保险。毕竟谁也不想被一家供应商卡脖子。全球巨头去英伟达化芯片自研版图——谷歌TPU、亚马逊Trainium、微软Maia、Meta MTIA、OpenAI Jalapeño的布局对比对普通人来说这意味着什么说了这么多行业格局回到最开始的问题这跟你我有什么关系关系大了。还记得那个50%的推理成本降幅吗推理成本降低意味着AI服务可以更便宜。更便宜意味着更多人用得起AI。用OpenAI自己的话说“如果AI能帮工程师更快设计出更好的芯片就可以降低整个行业的计算成本帮助普及先进AI的使用权限。”这句话不是场面话。它指向一个真实的趋势AI算力的成本曲线正在往下走。你想想今天ChatGPT Plus一个月20美元如果推理成本砍一半是不是可以降到10美元或者保持20美元但给两倍的用量或者免费用户也能享受到更多功能再往远想当AI推理便宜到几乎不花钱的时候会发生什么每一个App都可以内置AI每一个网站都可以有智能助手每一个中小企业都能用上大模型。AI不再是巨头的特权而是像水电一样的基础设施。而这一切的起点可能就是那颗叫Jalapeño的辣椒。还有一层更深远的影响AI造芯片这个闭环。如果ChatGPT能帮OpenAI在9个月内造出芯片那同样的方法论能不能复制到其他领域AI帮设计新药、AI帮设计新材料、AI帮优化城市规划。当AI开始加速AI自身的迭代我们可能正在进入一个加速循环的时代。这个时代会多快我不知道。但Jalapeño给出的信号是比我们以为的要快。又辣又快文章写到最后我刷了一下评论区。有人调侃“又辣又快犹如我的焦虑。”有人说“Chip so hot it ghosts users。”——芯片太烫了都开始已读不回了。还有人已经给OpenAI设计了芯片周边T恤上印着一颗辣椒下面写着Silicon Verde。你看每次科技圈搞出大动静网友们的反应永远是最真实的温度计。他们用幽默消化焦虑用段子表达期待。但笑归笑焦虑是真的。9个月造芯片。AI自己参与芯片设计。推理成本砍半。全栈掌控。去英伟达化大潮。每一条单拎出来都是大新闻加在一起就是一场正在加速的变革。Jalapeño哈拉贝诺辣椒。又辣又快。而我们所有人都在这口锅里。