Agent工具结果缓存，缓存键到底该拿啥拼

📅 2026/6/30 5:16:15

很多人给 Agent 加缓存第一反应是缓存用户问题→最终回答但工具调用这一层的缓存更值钱也更容易踩坑。我这篇只聊一件事工具结果要不要缓存、缓存键该用什么拼——这玩意儿设错了要么命中率低得没意义要么直接给用户返回了别人的数据。先分清哪些工具结果能缓存不是所有工具都该缓存。我按两个维度过一遍工具类型例子能缓存吗纯查询、结果稳定查城市天气编码、查商品规格能TTL 长查询但会变查实时库存、查物流状态能TTL 短带副作用下单、发券、改数据绝对不能跟用户身份强相关查我的订单能但键必须带用户带副作用的工具缓存了就是事故——我见过有人把创建工单也缓存了同一句话进来两次直接命中第二次没真建单用户以为提交了其实没有。核心缓存键拼什么键的本质是什么相同才算同一次调用。我的拼法是import hashlib, json def cache_key(tool_name, args, user_scopeNone): # 1. 参数要规范化排序键、去掉无关字段、统一大小写/空格 norm {k: v for k, v in sorted(args.items()) if k not in IGNORE_KEYS} # 2. 涉及用户私有数据的工具键里必须掺 user_scope否则串户 parts [tool_name, json.dumps(norm, ensure_asciiFalse, sort_keysTrue)] if user_scope: parts.append(user_scope) # 比如 user_id 或租户 id raw |.join(parts) return tool: hashlib.md5(raw.encode()).hexdigest()几条踩过血的规矩参数必须规范化再拼。模型生成的参数顺序、空格、大小写不固定{city:合肥}和{ city: 合肥 }不归一化就是两个键命中率直接砍半。私有数据的键一定要掺 user_scope。这是红线。我早期查我的订单只拿tool_name args当键结果 A 用户的订单缓存被 B 用户命中——args 都是空的订单从 token 里取键就撞了。那次差点出大事。把不影响结果的参数踢出键。比如request_id、timestamp这种每次都变的留着等于永远不命中。TTL 别一刀切我按工具配不同 TTL放配置里天气编码这种缓一天实时库存缓 30 秒物流状态缓 2 分钟。配置化之后调起来不用改代码。TTL {query_weather_code: 86400, query_stock: 30, query_express: 120}说点不好的工具缓存最大的暗坑是数据新鲜度。库存缓了 30 秒这 30 秒里卖空了用户拿到的就是脏数据。该不该缓、缓多久本质是拿一点点过时换省调用、提速度得业务方一起拍。还有就是带 user_scope 的键会让缓存条目暴涨每个用户一份内存得盯着我加了 LRU 上限别让它无限长。模型这边我用讯飞星辰 MaaS 现成 API工具结果缓存这层完全在我自己业务侧做跟模型解耦换模型也不影响这套缓存逻辑。你们工具结果缓存的键是怎么拼的有没有踩过串户的坑评论区说说。

新闻详情

相关阅读

P.2简易计算器

社区公益服务平台 Java+SpringBoot+Vue 前后分离

【数据仓库】如何评估数仓的健康度

4路24位高精度应变片专用采集卡 力学应变测试闭环解决方案。4路24位4.8Ksps ADC，支持全桥、半桥、1/4桥，4路16位DA，4路DO。

嵌入式安全：安全启动与硬件信任根的实现

科研制图告别熬夜调试！Okbiye 双赛道 AI 绘图工作台一站式搞定全学科期刊图表

AI Agent开发中外部工具连接的工程化解决方案：Agent-Reach框架解析

符文世界:龙之荒野服务器开服联机教程

获千万级Pre-A轮融资，光速一构要把汽车流水线搬进弹性体3D打印工厂

AScript异步执行与await关键字

如何在1分钟内为Windows安装苹果USB网络共享驱动：完整解决方案

NoFences：你的Windows桌面需要一场空间革命吗？

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

4路24位高精度应变片专用采集卡力学应变测试闭环解决方案。4路24位4.8Ksps ADC，支持全桥、半桥、1/4桥，4路16位DA，4路DO。