为什么 AI 公司都在疯狂“造芯片“?—— 一篇给你讲明白

📅 2026/7/5 2:37:38
为什么 AI 公司都在疯狂“造芯片“?—— 一篇给你讲明白
为什么 AI 公司都在疯狂造芯片—— 一篇给你讲明白2026 年 6 月OpenAI 发布了第一款自研芯片 Jalapeño。一周后Anthropic 被曝正在接触三星也要造自己的芯片。为什么写软件的公司突然都跑去搞硬件了这篇文章用最通俗的语言一次给你讲清楚。1. 先搞懂AI 芯片到底在算什么你可能听说过GPU、AI 芯片这些词。但在聊为什么大厂要自己造之前我们需要先搞懂一个问题AI 芯片到底在算什么答案是矩阵乘法。一个大语言模型比如 ChatGPT、Claude的本质是什么是一层一层的矩阵你可以理解成一张巨大的 Excel 表格里面填满了数字参数。GPT-4 有 1.8 万亿个参数你可以想象一张 1.8 万亿个格子的表格。当 AI 思考时它做的核心运算就是把输入矩阵 × 参数矩阵一层一层乘下去。输入你的问题 ↓ 矩阵乘法 × 第1层参数 ↓ 矩阵乘法 × 第2层参数 ↓ ...重复几十到几百层 ↓ 输出AI 的回答每秒要做几万亿次这样的乘法。这就是为什么 AI 需要专门的芯片——普通的 CPU你电脑里的处理器虽然什么都能算但算矩阵太慢了。一句话理解AI 芯片 为疯狂做矩阵乘法而优化的计算器。2. 以前大家都是买显卡为什么现在要自己造2.1 训练 vs 推理这是两件完全不同的事要理解这波造芯片潮你必须分清楚两个概念训练Training推理Inference做什么用海量数据教模型用训练好的模型回答问题算多久几个月几万台机器一起跑每次几毫秒到几秒用什么芯片英伟达 H100/B200 GPU可以用 GPU也可以用专用芯片花多少钱训练一次几亿美元每次回答几分钱但累积起来更多类比建工厂工厂每天生产产品关键洞察推理成本才是 AI 公司最大的长期开销。ChatGPT 每天有上亿次对话每次对话都要做矩阵乘法。训练模型是一次性投入推理是持续烧钱。OpenAI 2025 年营收 130 亿美元但支出高达 340 亿美元——大部分烧在了推理算力上。2.2 英伟达的 GPU 很好但有两个问题英伟达的 GPU比如 H100是目前 AI 计算的绝对王者训练模型离不开它。但对于推理来说它有两个问题问题一太贵了。一块 H100 售价约 3-4 万美元一个集群要上万块。而且英伟达的毛利率超过 70%——这意味着你花的钱大头是英伟达的利润。问题二它是通用的不是专用的。GPU 最初是为游戏图形设计的后来发现很适合 AI。它很灵活什么都能算。但灵活是有代价的——芯片上有很多电路你根本用不到但它们也在耗电。一句话理解用 GPU 做推理就像开卡车去超市买菜——当然能装但太费油了。3. OpenAI 的 Jalapeño 到底是什么为什么 9 个月就能造出来3.1 什么是 ASICOpenAI 的 Jalapeño 是一种ASICApplication-Specific Integrated Circuit专用集成电路。GPUASIC什么都能算只会算一种东西灵活通用死板专用贵功耗高便宜功耗低约省 50%买来就能用需要专门设计和制造ASIC 的思路是既然我知道我的芯片只需要做大模型推理那我就把所有电路都优化成只做这一件事——砍掉所有不需要的部分把省下来的面积和功耗全部堆到矩阵乘法上。结果就是性能不输 GPU但成本只有一半。3.2 为什么 9 个月就能造出来以前造芯片动辄要 2-3 年。Jalapeño 只用了 9 个月原因有三只用做推理不用做训练训练芯片涉及复杂的数据调度和互联推理芯片只需要喂数据→出结果设计简单得多博通兜底博通提供了成熟的 IP 核和设计工具OpenAI 不用从零画电路AI 辅助设计OpenAI 用自己的模型来优化芯片布局和验证——用 AI 来设计 AI 芯片一句话理解Jalapeño 不是从沙子开始造芯片而是在博通提供的地基上针对自己的模型定制了一套最优方案。3.3 Anthropic 为什么也要跟进Anthropic 找三星的逻辑和 OpenAI 几乎一样Claude 每天要处理海量推理请求 → 推理成本是生命线英伟达 GPU 供不应求且太贵 → 需要第二供应源自研芯片可以根据 Claude 模型的特点深度定制 → 比通用 GPU 更高效这正在变成一个行业规律做大模型的公司到了一定规模就必须自己造芯片。就像连锁餐厅到了一定规模就会自建中央厨房。4. 这对我们普通人意味着什么你可能觉得芯片离你很远。但其实它正在影响你每天使用的 AI 产品4.1 AI 会越来越便宜推理成本降 50%最终会反映在 API 价格和订阅费用上。现在调用一次 GPT-5 可能要几分钱未来可能会降到几厘甚至更低。更便宜的推理 更多 AI 应用场景 更多创业机会。4.2 AI 会越来越快专用芯片的延迟更低。未来的 AI 回复可能从等几秒变成几乎瞬时——这对语音助手、实时翻译、自动驾驶等场景至关重要。4.3 竞争格局在变当 OpenAI 和 Anthropic 都用自己的芯片时他们不再受制于英伟达的供货周期和定价。这意味着✅ 模型迭代更快不再等显卡到货✅ 价格竞争更激烈成本结构改善⚠️ 小公司更难追赶自研芯片门槛极高4.4 但对开发者来说核心能力不变无论底层跑的是英伟达 GPU 还是自研 ASIC你调用的 API 接口HTTP 请求 → 返回 JSON不会变。理解 Prompt Engineering、系统设计、业务逻辑的能力永远比跑在什么芯片上更重要。 一张图总结AI 芯片进化路线 过去买英伟达 GPU通用、贵、受制于人 ↓ 现在自研推理 ASIC专用、便宜、自主可控 ↓ 未来训练芯片也可能自研 → 彻底摆脱外部依赖 OpenAI 的第一步是推理Jalapeño Anthropic 正在跟进接触三星 Google 已经走完这条路TPU 系列 Meta 也在路上MTIA 系列 一个值得思考的问题如果你今天开始学习 AI 全栈开发五年后这些芯片知识对你有用吗答案是不需要会设计芯片但需要理解这个趋势。就像做 Web 开发不需要会造服务器但需要知道 AWS 和 Vercel 的区别做 AI 开发不需要会画电路但需要知道推理成本为什么在下降 → 判断什么时候可以给产品加更多 AI 功能各家模型的能力边界 → 做技术选型时不被营销话术忽悠行业格局怎么变 → 投资自己的学习方向时更有判断力底层在变但应用层的机会只会越来越多。 2026 年 7 月 4 日 参考资料OpenAI 官方公告、CNBC、36氪 等