Prompt 工程的 3 个核心技巧(讲透版)

📅 2026/7/5 4:49:52
Prompt 工程的 3 个核心技巧(讲透版)
Day02Prompt 工程的 3 个核心技巧讲透版前言同一个模型凭什么有人用得好凌晨两点你盯着屏幕。隔壁老王用着同一个 ChatGPT三分钟搞定周报。你问了半小时它还答非所问——要么写得太虚要么格式乱七八糟。你心里那个鼓点开始敲是模型偏心是我智商不够都不是。差距不在模型在 Prompt。同一颗大脑你给它清晰指令还是含糊问题出来的东西天差地别。我踩过太多坑把市面上的 Prompt 技巧翻了一遍发现真正高频管用的就 3 个。今天我不光给你这 3 个名字还讲透每一个为什么有效、怎么写、容易踩什么坑。读完你今晚就能用而且知道为什么这么用。PART 01角色设定——先告诉模型它是谁为什么有效大模型训练时读过海量「某个角色说的话」。你给它一个身份等于让它把注意力聚焦到那部分知识上用那个角色的口吻和深度来回答。往底层说一句这是条件激活——身份词会激活模型里和该角色相关的参数通路抑制无关的「发散」。所以加了角色输出会更收敛、更专业、更少废话。怎么写一句话——「你是一个……」。# 不加角色泛泛 prompt 帮我写个产品周报 # 加角色聚焦 prompt 你是一个有 8 年经验的 ToB 产品经理。帮我写本周周报。加了角色模型写出来的周报术语、关注点、颗粒度全都不一样——它开始像一个产品经理那样思考。角色选得对不对效果差很多。常见角色和它们各自聚焦的方向角色聚焦点适合的活ToB 产品经理客户场景、指标、优先级周报、需求文档资深文案钩子、节奏、情绪标题、广告语数据分析师SQL、指标拆解、归因数据解读、报表代码审查员边界条件、安全、性能代码 review面试官追问逻辑、深度、反例模拟面试、自检进阶一招主角色 审核角色。先让模型扮演执行者产出再让它切换成审核者挑刺效果比一次生成好得多。# 第一轮执行者 draft chat(你是有 8 年经验的 ToB PM。帮我写本周周报。) # 第二轮审核者 final chat(f你是挑剔的技术总监。审这段周报指出 3 个不够具体的地方并改写\n{draft})常见坑角色太泛等于没加。你是一个专家——啥专家模型还是不知道聚焦哪。你是一个资深数据分析师擅长 SQL 和指标拆解——这才叫角色。一句话角色越具体模型越知道调用哪块脑容量。PART 02任务拆解 CoT 思维链——模型最怕含糊为什么有效模型不是一个字一个字往后蒙最准而是一步步想更准。你把大任务拆成小步骤等于强迫它一步步推理而不是一口气猜一个答案。底层原理就一句拆解让模型把更多 token「花在推理」上而不是直接跳到结论。每多一步中间过程它就有更多机会修正方向错误就更难累积到最终答案。怎么拆把做一件事拆成按顺序做 3~5 件小事。# 含糊模型瞎猜结构 prompt 帮我分析这个产品为啥留存低 # 拆解 思维链模型按步推理 prompt 你是一个产品增长专家。请按以下步骤分析留存低的原因 1. 先列出 3 个最可能的假设 2. 对每个假设给出验证它需要的核心数据 3. 最后按「影响面 × 置信度」排序给出优先验证哪个 看出差别没含糊版模型给你一段泛泛的可能用户体验不好。拆解版它被迫先列假设、再给数据、最后排序——每一步都比蒙一段靠谱。拆解版模型实际会这么答每步都落到实处假设① 新用户引导太长没等到 aha 时刻就走② 核心功能入口太深注册后找不到③ push 太频繁被关通知。验证数据① 看新用户「注册→首次成功」漏斗卡在哪一步② 看注册后 24h 内是否点过核心功能③ 看 push 关闭率和关通知用户的留存对比。排序按「影响面 × 置信度」优先验证①——影响面最大覆盖所有新用户且数据现成。看见没同样的模型换个问法输出从「一段正确的废话」变成「一份能直接开干的行动清单」。这招有个学名叫CoTChain of Thought思维链。本质就一句话别让模型跳着答让它把推理过程写出来。复杂问题推理、计算、多步规划尤其管用。CoT 有两种用法按需选类型怎么触发适合Zero-shot CoT在 prompt 末尾加一句「请一步步思考」通用、省事Few-shot CoT给 1~2 个带推理过程的样例任务复杂、要求高⚠️但 CoT 不是万能的。简单任务翻译一句话、改个错别字用 CoT 反而变慢、变啰嗦甚至引入错误——模型为了「凑步骤」会过度发挥。判断标准任务需要推理/计算/规划才上 CoT直觉型任务别画蛇添足。拆解的粒度也有讲究不是越细越好拆解粒度步数效果太粗1 步退化成含糊提问模型瞎蒙舒适区3~5 步推理充分又不啰嗦太碎7 步模型啰嗦、容易跑偏该合并常见坑拆得太碎模型反而啰嗦。3~5 步最舒服超过 7 步考虑合并。PART 03Few-shot 输出格式——给例子定格式为什么有效你在 Prompt 里解释 100 句我要那种……的感觉不如塞给它一个真实样例。模型是模仿大师照着例子来准确率立涨。怎么给放 1~2 个「输入→输出」的样例然后再给真实任务。prompt 把用户的吐槽分类成bug / 需求 / 吐槽。 例子1 输入点了三次才下单成功 输出bug 例子2 输入希望加个夜间模式 输出需求 现在分类 输入 user_inputFew-shot 例子不是随便挑的有四条挑选原则数量1~2 个就够别堆。多了反而过拟合模型变死板。顺序把和当前任务最接近的例子放最后近因效应最强。反例加一个「容易混淆但类别不同」的例子模型分得更清。风格一致所有例子的输入长度、输出格式要统一不然模型学混。输出格式控制除了给例子还要明说格式——「用 JSON 输出」「用 Markdown 表格」「不超过 50 字」。模型默认爱写长文你不说格式它就给你一大段散文。三种常见格式的 before/after你想要的别这么说这么说JSON「结构化一点」「只输出 JSON字段category, confidence」表格「整理一下」「用 Markdown 表格列功能、优先级、理由」短文「简洁点」「不超过 50 字不要开头客套」给你一个完整可跑的分类例子带 JSON 解析import json from openai import OpenAI client OpenAI() resp client.chat.completions.create( modelgpt-4o-mini, messages[{ role: user, content: f把用户反馈分类为 bug / 需求 / 吐槽只输出 JSON。 {{category: ..., reason: ...一句话理由...}} 输入{user_input}, }], ) result json.loads(resp.choices[0].message.content) # 直接解析成 dict print(result[category], result[reason])Few-shot vs Fine-tune 的边界当你发现 prompt 里要塞的例子越来越多5 个以上还压不住或者任务风格极度固定、调用又高频——那就是从 Few-shot 该升级到 Fine-tune 的信号了。例子能解决 80% 的问题剩下 20% 重复到一定程度就该烙进权重。常见坑例子给太多5 个以上反而过拟合模型变得死板例子之间风格要一致不然模型学混。结尾3 招合一回头看Prompt 工程就 3 招角色设定让它知道用哪部分脑→ 任务拆解 CoT让它一步步想→ Few-shot 格式让它照着做、按格式交。每招都不是玄学是对着大模型的脾气来的。Prompt 不是咒语是写给模型的沟通说明书。你写得多清楚它就答得多准。下一篇我想拆更具体的——你最想让我讲Few-shot 例子怎么挑、CoT 在什么场景反而会搞砸还是Prompt 注入怎么防这 3 招别光看今晚就找一个真实任务练手——写周报、改文案、做分类都行练一次比看十篇技巧帖管用。评论区告诉我。下一篇预告Day03 可能讲「Few-shot 例子到底怎么挑——数量、顺序、反例都有讲究」我是小刘檀木一个从二本摸爬滚打到上市公司 AI 负责人的普通人。关注我把 AI 学进简历。— END —小刘檀木 · 帮普通人把 AI 学进简历