Agent Memory系统架构

📅 2026/6/18 20:42:30
Agent Memory系统架构
1、向量数据库的致命缺陷为什么OpenAI放着万能的向量数据库不用???工程的本质是选对工具,而不是证明你会用多复杂的工具。致命缺陷1:模糊匹配 vs 精确调用(效率问题)买车的时候和销售讨论很多,包括金额方面、车型对比方面,大模型会根据讨论的这些进行各种检索进行模糊匹配;但是不应该这样呀,应该直接查询预算这个字段,一击命中就能毫无歧义。致命缺陷2:处理“时间问题冲突”的系统性困境(逻辑问题)时间盲区:买车的时候预算问题,昨天我的预算5万 发工资了 今天我的预算涨了到了8万 两个预算丢进大模型 大模型会懵逼的。状态覆写:新值直接覆盖旧值,系统内永远只有一个唯一的真值。2、ChatGPT的四层分层设计会话元数据:天气、时区、设备类型。用完即弃,不进长期记忆;用户结构化档案卡:建一个结构化表格,JSON格式。随时更新、随时覆盖、精确读取(职业、饮食偏好)。绝不模棱两可;近期对话摘要:轻量级话题清单。静态注入当前对话,不存原文,提炼主题存入;滑动窗口:当前上下文。超过token上限,最老消息直接丢弃。3、Agentic Memory的三大命题1、认知:memory绝不是存储区,而是影响决策的外部状态。如果Agent是一个人,存一堆记录不叫能力。真正的能力是把历史记录提取成当前有用的证据。memory的核心价值不在于存了多少G的数据,而在于“历史转化成决策”的这条道路到底通不通;2、memory的最小可用闭包--系统三件套原始账本:类似于银行流水,只追加不修改,记录所有读写动作,用于溯源排错的“黑匣子”;派生视图:将死数据转化成大模型能看得懂的格式(向量索