别死背定义了!13个AI Agent核心概念这么记才对

📅 2026/6/16 6:41:55
别死背定义了!13个AI Agent核心概念这么记才对
面试前五分钟手机里翻笔记翻到怀疑人生——Agent是啥ReAct和反思有啥区别MCP到底怎么解释概念一个比一个绕背了忘忘了背。别慌。这篇我把大厂常问的 13 个 AI Agent 核心概念按怎么理解最快的方式重新捋了一遍。不是给你堆定义是帮你把整条线串起来下次面试官问到任何一个点你都能顺着上下游讲出体系感。面试前五分钟你慌了吗说实话AI Agent 这个领域的概念密度太高了。像没整理过的工具箱扳手螺丝刀锤子堆一起用的时候摸半天。光是一个让 AI 自己干活的命题就牵扯出规划、记忆、工具、协议、工程方法一大串。很多人的问题不是不知道这些词是不知道它们之间的关系。打个比方这些概念就像一栋楼的各个楼层。地基是大模型本身预训练、微调一楼是让模型能动手Agent、ReAct、工具调用二楼是让它更聪明RAG、记忆、防幻觉三楼是标准化能力MCP、Skill顶楼是工程保障Harness、SDD、反思机制。搞清楚楼层关系单个概念自然就记住了。接下来我们一层层拆。先从地基开始——大模型本身是怎么炼出来的。底座先搞懂预训练和微调到底干了啥很多人面试被问预训练和微调的区别张嘴就是预训练用大数据微调用小数据。没错但太干了面试官想听的是你理解这两步的目的差异。预训练的本质是教语言。想象一个小孩从零开始学说话——没人教语法纯靠听。预训练干的就是这事把海量文本喂给模型让它学会下一个字大概率是什么。训练方式是自监督学习具体来说就是不断预测下一个 token。没有人工标注不需要标准答案纯靠统计规律。训练出来的东西叫基座模型什么都会一点但什么都不精。跟小孩学完说话差不多。微调的本质是教干活。基座模型会说话了但你让它帮你写代码、做客服、改文案它可能东一句西一句。微调就是拿具体任务的数据继续训练这个模型让它学会在这种场景下应该怎么回答。这步用的数据量小得多——几千到几万条标注数据就够。训练方式通常是监督学习也就是有输入有标准输出模型学着模仿。一句话总结预训练给能力微调给方向。一个管会不会说话一个管说话办不办事。面试时候把这个对比讲清楚比背两段定义管用十倍。让 AI 能动手的那套东西学完说话、学完干活下一步是什么让它自己干活。这就是 Agent 的核心命题。Agent 不是一个工具是一种工作方式。它的特点是能自己拆任务、自己决定下一步做什么、自己调用工具获取信息、自己判断结果对不对。传统大模型像一个坐在那等你提问的答题机器。Agent 更像一个实习生——你说帮我查一下上周的销售数据然后做个报表它自己规划步骤自己去查数据库自己写 Excel最后把结果交给你。关键能力三件套规划、记忆、工具调用。但光有能力不够还得有一套做事的方法论。这就是 ReAct。ReAct 的全称是 Reason Act推理加行动。听起来很学术翻译成人话就是先想后做做完再想。具体流程是这样的模型接到任务先推理我现在知道什么、还缺什么如果信息不够就调工具去拿拿到结果后再推理拿到的东西够不够解决问题不够就继续调。周而复始直到任务完成。跟人干活一模一样——想清楚了再动手动完手看看结果不行再调整。不过 ReAct 只管做的循环。做完以后怎么知道自己做得对不对这就需要自我反思机制。反思本质上是先出答案再检查然后修改。两种路径第一种是自我反馈——模型自己审查自己的输出。适合检查文案一致性、有没有违反约束、格式对不对这类能靠逻辑判断的事。第二种是外部反馈——把结果放进真实环境验证。代码跑一下看报不报错JSON 过一下 schema 验证SQL 查询看返回结果对不对。反思不是锦上添花是质量兜底。省了这步输出质量全靠运气。补知识、存记忆、防胡说Agent 能干活了但有三个实际问题得解决第一它知识有限——模型训练时没见过你公司的内部文档。 第二它记性差——聊着聊着就忘了前面说了啥。 第三它爱编——模型会把自己没见过的东西编出一个看起来对的答案。分别对应三个解法RAG、记忆系统、Token 理解。RAG 就是让模型开卷考试。全称 Retrieval-Augmented Generation检索增强生成。跟你查字典一个道理——不确定的词先翻一下再答题。模型回答问题之前先去知识库里搜一轮相关资料把搜到的内容塞进上下文然后基于这些参考答案来回复。就像你考试可以带小抄——模型本身可能不知道公司上个月的运营数据但只要把相关文档检索出来给它它就能基于真实信息回答而不是瞎编。关于幻觉这件事要多说两句。幻觉就是模型一本正经地胡说八道。它不是不会回答是会给你一个格式完美、逻辑通顺、但内容是编的答案。所以永远不要把大模型的输出当成事实来用特别是涉及数字、日期、人名这些具体信息的时候。RAG 能缓解幻觉但不能完全消除。这是模型的底层特性面试时要诚实讲。再说记忆系统。Agent 的记忆分两层跟人的记忆是一回事短期记忆管当前对话——你跟它聊的这一轮。但上下文窗口有限聊多了前面的内容会被挤掉。处理方式通常是截断旧消息或者做摘要压缩保持 prompt 长度不爆。长期记忆管跨会话——上次聊过什么、用户偏好是啥、历史决策记录。做法是把关键信息存成向量下次需要的时候用语义检索召回再塞回上下文里。最后补一个底层概念Token。模型不认字只认数字。Token 就是模型处理文本的最小单位。分词器把你输入的文字切成一个个小块token每块对应一个数字 ID模型全程用这些 ID 来计算。为什么面试要问这个因为它直接影响成本和性能——输入越长 token 越多价格越贵速度越慢。理解 token 机制才能理解为什么 prompt 要精简、为什么上下文窗口有上限。接口标准和能力封装到这里模型能力有了、做事方法有了、知识补充和记忆也有了。下一个问题是怎么让这些能力跟外部世界对接两个关键概念MCP 和 Skill。MCP 是 AI 世界的 TypeC 接口。一根线通吃所有设备。全称 Model Context Protocol模型上下文协议。它定义了一套标准化的对接方式让 AI 应用能连接各种外部数据源和工具——本地文件、数据库、搜索引擎、工作流系统全走统一协议。没有 MCP 之前每接一个新工具就要写一套对接代码跟手机充电线一样混乱——安卓一根、苹果一根、老诺基亚又一根。有了 MCP所有工具方按同一个协议提供服务AI 应用方按同一个协议去调用。一个协议搞定所有连接。面试时讲 MCP关键词是标准化和解耦。Skill 是给模型装的技能包。本质上是结构化的本地文件夹里面打包了某个领域需要的一切流程文档、知识材料、模板示例、脚本工具。模型遇到相关场景时自动或按需加载相当于临时给它装上一个领域的专业知识和操作手册。跟游戏里装备技能一回事——基础属性不变但装备不同技能包就能应对不同副本。工程化怎么落地概念都懂了最后一个问题在真实项目里Agent 怎么才能可靠地跑起来这是面试中区分背概念和真做过的分水岭。三个工程方法得知道。Harness 工程——给 AI 搭工作台。直译是驾驭工程。核心思路是不能把 Agent 像野马一样放出去得给它围好栅栏。具体包括上下文怎么管理、工具怎么调用、执行环境怎么隔离、权限怎么控制、输出怎么验证、日志怎么记录、代码谁来 review、反馈怎么形成回路。八个维度缺一个都可能在生产环境翻车。跟连锁餐厅开店一样——菜单、食材、后厨、卫生、培训、巡检、客诉、复盘漏一环就砸招牌。面试里能把这八点列出来并且每个举一两个实践细节基本就过了这道题。SDD——先写规格再写代码。全称 Spec-Driven Development规格驱动开发。思路很直接让 AI 写代码之前先把需求、范围、行为约束、设计决策、任务拆分全写成文档。AI 按文档来开发不自己猜。不给规格让 AI 写代码跟不给需求文档让实习生干活一样——他倒是能写出东西来但大概率不是你想要的。这步省了后面返工时间翻三倍。真要选工程方法优先级我会把 SDD 排第一。因为它从源头减少歧义后面所有环节的质量上限都被它决定。最后是反思机制在工程中的落地——就是前面讲的自我反思但在工程层面要设计成流程的一部分而不是有时候模型自己会检查。好的 Agent 系统每次输出后都会走一轮校验代码跑测试、文案查约束、数据核对来源。这不是可选步骤是流水线里的必经质检站。串一遍面试怎么讲出体系感回到开头那个场景——面试官问你某个概念你不只是回答它是什么还能说“它在整个 Agent 体系里处于什么位置、解决什么问题、跟上下游什么关系。”这就像读地图。知道自己在哪条路上就算被问路也不怕。底层是大模型能力预训练 微调中间是 Agent 执行机制ReAct 反思 工具调用辅助层是知识和记忆RAG 短期/长期记忆 Token 理解标准层是对接协议和能力封装MCP Skill顶层是工程方法Harness SDD。这 13 个概念不是散装知识点是一条完整的技术栈。搞明白每层干什么面试时候随便从哪个点切入都能讲出深度。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】