从“问对问题”到“建对系统”:Prompt、Context、Loop、Harness 工程的演变与理解

📅 2026/6/25 17:19:39
从“问对问题”到“建对系统”:Prompt、Context、Loop、Harness 工程的演变与理解
从“问对问题”到“建对系统”Prompt、Context、Loop、Harness 工程的演变与理解引言AI 工程化的四次跃迁2023 年我们学会了一件事写一个好的提示词。2025 年我们发现提示词只是冰山一角上下文才是关键。2026 年行业共识是真正的竞争力不在模型不在提示词而在那个包裹模型运行的“机械外壳”——Harness。而贯穿这一切的是让 AI 真正“动起来”的核心引擎——Agent Loop。这四者并非彼此取代而是一个层层递进、不断深化的工程演进路径Prompt说什么→ Context看什么→ Loop怎么动→ Harness在什么系统里动本文将带你完整走一遍这四次进化的逻辑它们分别解决了什么问题、如何定义、以及如何理解它们在 AI 工程中的位置。一、Prompt Engineering2022-2024学会“问对问题”定义Prompt Engineering提示词工程是研究如何通过精心设计的输入文本最大限度地激发大语言模型正确能力的工程实践。它本质上处理的是人类意图到模型输入之间的接口。Prompt Engineering 关注的核心问题是“怎么表达任务”。核心手段在 GPT 刚刚走入大众视野的那段时间Prompt Engineering 是最炙手可热的技能涌现了大量经典技术零样本提示Zero-shot直接告诉模型做什么不给例子少样本提示Few-shot给几个输入-输出例子让模型“意会”规律思维链Chain-of-Thought引导模型一步步推理而非直接跳结论角色扮演Role Prompting给模型设定身份如“你是一位资深架构师”提示链Prompt Chaining把复杂任务拆成多个小提示串联执行理解Prompt Engineering 的核心价值在于**“表达”**——如何用措辞激活正确的模型行为。它按请求生效无状态优化的是单次输入-输出对。它的局限性也很明显Prompt 无法注入私有知识库无法告知模型上周代码库里发生了什么无法处理跨会话的记忆也无法取代权限系统或错误恢复逻辑。一旦任务要求模型调用工具、追踪状态或跨步骤协作单靠 Prompt 撑不住整个系统。一句话理解Prompt Engineering 是“问对问题”的艺术——但只会问问题还远不够。二、Context Engineering2024-2025治理“信息环境”定义Context Engineering上下文工程关注的是模型在执行任务时看到什么——即模型在做出每个决策时能够注意到的全部信息。Anthropic 给出了直接的定义当 Agent 朝向更长的时间跨度和多轮推理演进时核心挑战变成了**“管理整个上下文状态系统指令、工具、MCP 服务器、外部数据、消息历史”**。Prompt Engineering 问的是“怎么表达任务”Context Engineering 问的是**“模型工作时应该处于什么信息环境里”**。核心洞察模型每次推理时看到的内容远不止你写的那段话你看到的 prompt: 帮我审查这段代码 模型实际看到的 context: ├── 系统提示词System Prompt ├── 对话历史多轮消息 ├── 检索到的文档RAG 注入 ├── 工具调用的返回结果 ├── 项目文件内容 └── 你的 prompt: 帮我审查这段代码核心手段Context Engineering 的核心技术包括RAG检索增强生成从知识库中动态注入相关文档System Prompt 设计全局约束和角色定义上下文压缩超长对话中保留关键信息、丢弃噪音多 Agent 上下文共享多个 Agent 之间传递结构化信息理解Context Engineering 的兴起有一个根本原因模型的上下文窗口在急速扩展。从 2018-2019 年 512-1024 个 token到如今百万甚至千万级别。窗口越长模型越能处理论文、代码库甚至完整项目文档。但更大的窗口也带来了新的挑战信息环境污染——上下文越长模型越容易被无关内容干扰。好的 Agent 输出和差的 Agent 输出之间的区别往往与原始请求的措辞无关而取决于关键信号是否在正确的时刻出现在窗口内。一句话理解Context Engineering 是“给 AI 配眼镜”——确保它在做决定时能看到所有该看的信息。三、Agent Loop2022 至今让 AI“动起来”的引擎定义Agent Loop智能体循环是每一个运行中的 AI Agent 背后都在执行的核心循环。这个循环决定了 Agent 能否正确理解任务、调用工具、处理结果并在多轮迭代中自主完成任务。如果说 Prompt 和 Context 解决的是“输入什么”的问题那么Agent Loop 解决的是“怎么运转”的问题——它是让 AI 从“回答问题”变成“执行任务”的核心引擎。起源ReAct 范式2022 年 10 月Google Research 和普林斯顿大学发表了论文“ReAct: Synergizing Reasoning and Acting in Language Models”提出了一个影响深远的核心循环Thought思考→ Action行动→ Observation观察→ Thought → …具体来说ThoughtLLM 生成推理文本分析当前状态决定下一步做什么ActionLLM 输出结构化的动作指令如搜索、调用 APIObservation外部环境执行动作并返回结果LLM 将其作为下一轮输入ReAct 的价值在于它解决了纯推理逻辑清晰但无法与外部交互和纯行动能获取信息但缺乏规划各自的缺陷。从论文到工程五阶段架构从 ReAct 的“Thought-Action-Observation”三元组到生产级实现本质上是将论文概念映射到了工程实践中。一个生产级 Agent Loop 的通用架构包含五个阶段接收输入获取用户提示、System Prompt、工具定义和历史对话状态评估LLM 分析当前状态决定下一步行动工具调用执行 LLM 请求的一个或多个工具结果收集将工具执行结果反馈给 LLM循环或终止重复步骤 2-4直到任务完成理解Agent Loop 的演进代表了 AI 从“被动响应”到“主动执行”的根本转变。2025 年被普遍认为是Agent 的元年。标志性事件包括Anthropic 在 2025 年底将“Claude Code SDK”更名为“Claude Agent SDK”标志着从“代码辅助工具”到“通用 Agent 框架”的定位转变OpenAI 推出了 Agents SDK。ReAct 不是终点而是起点。2025 年出现了 LLMCompiler 等新兴方案将 ReAct Loop 编译为并行任务图以减少等待时间。一句话理解Agent Loop 是 AI 的“心脏”——让它不再只是回答问题而是能主动完成任务。四、Harness Engineering2026 至今构建“可信执行系统”定义Harness Engineering驾驭工程是 AI 工程化的第三代范式。Harness 的原意是“马具”——套在马身上的缰绳、嚼子和鞍具。马提供动力但马具控制方向、速度和安全。在 AI 语境中模型是马Harness 是缰绳。模型提供智能Harness 提供控制。研究团队对 Harness 工程作了更明确的范围界定它并非泛指与大语言模型相关的所有外围系统而是指模型外层的工程化运行框架。它通过执行环境、工具接口、上下文控制、任务编排、可观测性、评估反馈和治理机制将模型调用组织成可执行、可控制、可追踪的任务流程。为什么需要 Harness多数 AI 编码的失败并非模型的失败。模型会写代码。问题几乎总出在起点进入了错误的状态又缺乏自我纠正的机制。HumanLayer 的工程团队观察编码 Agent 以各种方式失败——忽略指令、不经确认就执行危险命令、在简单任务上陷入死循环——得出了一个结论“这不是模型问题是配置问题。”当 AI 开始尝试直接修改生产环境的代码库、调用真实的金融 API 或操作工业设备时单纯的信息管理已不足以保证安全。Harness 正是为此而生。Harness 的七个构件ETCLOVG卡内基梅隆大学、耶鲁大学等研究团队提出了ETCLOVG 七层分类体系层级功能执行环境Execution Environment决定 Agent 代码在哪里运行、受到什么约束工具接口Tool Interface定义外部能力如何被描述、发现和调用上下文管理Context Management决定模型在短期、会话级和持久化层面能看到什么生命周期与编排Lifecycle Orchestration组织状态读写控制流覆盖单 Agent 到多 Agent 协作可观测性Observability捕获轨迹、成本、失败和可靠性信号验证Verification将任务转化为评估、失败归因和回归反馈治理Governance权限、身份、策略、安全加固、审计和人工监督理解Harness Engineering 的崛起有一个清晰的演进时间线2022-2024Prompt Engineering— 关注如何表达需求2025Context Engineering— 关注每一步该向模型提供什么上下文2026Harness Engineering— 关注模型运行其中的整个系统Harness 的核心价值在于在不改模型权重的情况下仅调整 harness 层本身就可能显著改变 Agent 在 coding 和 terminal benchmark 上的表现。一句话理解Harness Engineering 是“给 AI 套上缰绳”——确保强大的模型力量沿着正确的轨道释放。总结四层架构的关系层次时间核心问题一句话理解Prompt2022-2024怎么表达任务问对问题Context2024-2025模型看到什么信息配好眼镜Loop2022 至今模型怎么自主运转装好心脏Harness2026 至今模型在什么系统里运行套好缰绳这四者不是竞争关系而是分层协同的关系Prompt 优化表达Context 管理信息环境Loop 驱动自主执行Harness 构建可信系统。模型的智能是引擎而这四层工程实践是让引擎真正驱动车轮的传动系统、导航系统和安全系统。理解这四者的演变逻辑是理解 AI 工程化未来方向的关键。