模型降价潮之后，AI开销账单出现了新的矛盾

📅 2026/7/1 6:34:36

模型降价潮之后AI开销账单出现了新的矛盾5月下旬到6月初国内几家大模型厂商集中调了价。5月22日DeepSeek把V4-Pro的每百万token价格压到原来的四分之一左右。隔了五天小米MiMo-V2.5系列跟上输入缓存命中降了99%输出降了86%。进入6月腾讯云跟进DeepSeek-V4-Pro推理输入输出各降75%缓存命中价格从0.001元/千tokens砍到了0.000025元。三家出手的幅度和节奏都很快。单看这些数字AI推理似乎已经逼近水电定价了。但翻一下这几个月的实际AI支出记录事情没那么简单。降价新闻刷屏的时候月费账单并没有成比例地缩水。用量增速盖过了单价降速降价只是等式的一边。另一边是用量。证券时报6月24日报道某互联网龙头的大模型日均Token调用量已突破180万亿较发布时增长超1500倍过去一年增长超10倍。证券时报的原文用了跨越质变点——AI调用从试用阶段进入了生产级大规模调用。单价降了75%到99%用量涨了10倍以上。两条线交叉之后总花费的变化方向和降价数字暗示的方向并不重合。这种矛盾在不同使用强度下表现不一样。轻度使用场景中月均50万token级别订阅费是大头API降价几乎没有影响——订阅费没动月账单纹丝不动。中度使用场景月均500万token级别API支出确实在降半年前约50元/月现在约12.5元/月但同期用量翻了不止一倍省下来的被用量增量吃掉了一大半。重度使用场景Agent开发、自动化工作流、月均3000万token以上的问题更突出调用量翻了5倍API单价降了75%总API支出跟半年前差不多而新增的工具订阅还在往上堆。问题不是单价有没有降——单价确实降了。问题是每月实际付出去的钱跟降价99%这个数字制造的心理预期之间有一道不小的落差。订阅费在这道落差里占了很大比重不降价但你也不太会退订。容易被忽略的几笔成本除了单价×用量这个基础算式还有几个少有人算的支出项。工具切换的摩擦。模型降价之后一部分工作可能从原来的工具搬到了其他平台又为了特定任务开了新的API。每多一个工具就多一套计费规则要搞明白、多一个后台要管。省下来的API费用有一部分被管理成本吞回去了。Agent的调用乘法。搜狐科技6月26日的一篇分析提到一个容易被忽略的逻辑模型降价某种程度上是在给Agent生态铺路。Agent做一次多步任务背后是几十上百次模型调用。Agent能力越强用得越猛调用次数就指数级上升——降价省的那部分被更多次的调用消化掉了。芯片制造成本的上升压力。华泰证券6月17日研报指出AI芯片综合成本可能上涨30-50%。HBM存储占据芯片成本约45%预计价格还要涨。世界经济论坛达沃斯2026年年报的数据显示推理成本3年跌了97%剩下的降价空间越来越窄。而芯片制造成本中枢在上移两股力量在对冲API继续大幅降价的窗口在收窄。如果芯片成本持续上移而API降价止步用量还在涨——月费账单的走向就不好说了。定价表上的箭头一路向下用量曲线一路向上。两条线交叉出来的结论不是AI越来越便宜了那么简单——单价在降但每月实际开销未必降对重度使用场景来说甚至还在涨。180万亿Token、增长1500倍这个数字摆在面前的时候AI在按单价变便宜是事实但打开账单看总金额是另一回事。

新闻详情

相关阅读

ShaderGlass：为数字世界注入复古灵魂的实时视觉魔法

2026 年中小企业布局 GEO 现状，梳理行业现存痛点与发展机遇

DARTS 在靶标鉴定中的优势分析

Fiddler HTTP/HTTPS 抓包工具完整实操技术教程

从零搭建个人AI工作台：我用玄鉴AI把日常效率翻了3倍

微前端架构落地实战：用qiankun轻松拆分巨石应用

Rust 宏展开的可视化调试

Postman便携版：打破Windows系统限制的API开发自由方案

别再死记硬背了！用一张图搞懂Xilinx 7系列FPGA的CLB与Slice结构（附资源速查表）

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！