AI 开发经济学改写:从行政驱动到技术质变,Token 消耗策略大转变 📅 2026/6/30 21:01:02 【导语去年 Meta 将员工 Token 消耗量纳入绩效考核引发无意义消耗现象。如今Tokenmaxxing 迎来第二阶段由技术质变驱动改写了 AI 开发的经济学同时也带来了安全攻防和权力分配的新变化。】Tokenmaxxing 第一阶段行政驱动的无意义消耗去年 Meta 把员工的 Token 消耗量写进绩效考核导致员工让两个 Agent 互相对话一整天来刷量这种现象被称为 tokenmaxxing。这是因为大量资历老的员工抗拒 AI 工具公司只能用行政手段推动团队使用 AI。Tokenmaxxing 第二阶段技术质变带来新逻辑如今Tokenmaxxing 的第一阶段已经结束第二阶段开始逻辑恰恰相反。这次是技术本身出现了质变模型质量越过临界点token 烧得越多输出质量越好。以前让 Agent 长时间跑会出现 compounding error现在“loops”模式基本是每多跑一轮就更好一点。这个变化直接改写了 AI 开发的经济学成本效率的计算不再是哪个模型单次调用最便宜而是哪个模型能在等预算下跑更多轮。不同模型成本效率对比以 Claude Opus 和 GLM 5.2 为例Claude Opus 每轮迭代带来 1.1× 的提升GLM 5.2 带来 1.05×但 GLM 的价格只有 Claude 的 1/5。多跑几轮之后便宜模型反而在前头。GLM 5.2 约 $1.40/M 输入、$4/M 输出Opus 4.X 是 $5/M 输入、$25/M 输出。GLM 5.2 在部分 benchmark 上已经超过 GPT 5.5Haiku 4.5 更是被碾压。安全攻防与权力分配新变化Anthropic 的 Mythos 模型在 AISI 的网络安全测试里100M token 预算下没有出现任何边际收益递减的迹象这意味着安全攻防正在变成经济战谁能比对手多烧 token 谁就赢。OpenAI 发布了首款自研推理芯片 Jalapeño和 Broadcom 合作专门针对自有推理负载优化模型参与了芯片设计。GPT 5.6 系列通过了美国政府协调的预览这表明 AI 能力的分配权力正在从行业转移到政府。编辑观点Tokenmaxxing 的转变反映了 AI 技术的快速发展从行政驱动到技术驱动将对 AI 开发和应用产生深远影响。开发者需重新考虑成本效率行业竞争也将更加激烈。