程序员职业规划:实践笔记 84

📅 2026/6/30 4:58:02
程序员职业规划:实践笔记 84
如果你正准备往大模型方向转《程序员职业规划实践笔记 03》这类问题别只看热度。更重要的是判断自己该补哪块能力以及怎么证明你真的会。摘要本文概述文章目标、核心观点和实践价值。摘要大模型不是简单的工具升级而是软件工程范式的重构。本文不讲虚的概念直接从求职作品集的角度出发拆解如何在简历中证明你不仅会调 API更能解决工程化痛点。通过对比传统开发与 AI 原生开发的差异给出具体的能力分层、短期学习路径及长期竞争力构建建议。很多同行现在最大的焦虑不是“学不会”而是“学会了怎么证明”。面试时HR 问你会不会 LangChain你点头再问你怎么处理幻觉、怎么优化 Token 成本、怎么保证 RAG 的检索准确率你就沉默了。在大模型时代传统的“CRUD 熟练工”身份正在迅速贬值。企业需要的不再是能调用接口的脚本小子而是能设计智能体工作流、能评估模型效果、能把不确定性转化为确定性的工程师。今天这篇笔记我就复盘一下我是如何调整自己的学习路线并把这种调整转化为可展示的求职证据的。目录岗位趋势从“功能实现”到“效果调优”能力分层你处于哪一层短期学习计划从 Demo 到可演示的工程中期项目沉淀做一个“有瑕疵但真实”的项目长期竞争力不可替代的是什么总结岗位趋势从“功能实现”到“效果调优”以前我们写后端关注的是 QPS、并发量、数据库事务一致性。这些指标是二进制的要么对要么错。但现在引入了 LLM 后很多指标变成了概率性的。比如一个客服机器人的回答是否“有用”很难用简单的单元测试覆盖。这导致岗位需求发生了微妙变化1.纯应用层开发缩减简单的 Wrapping 工作如把 API 包一层 RESTful门槛极低甚至会被 AI 自动生成。2.AI 工程化AI Engineering崛起懂得如何搭建向量数据库、优化 Prompt 模板、监控模型输出质量、进行微调Fine-tuning的人才变得紧缺。3.领域知识AI 复合型人才懂金融风控逻辑又能用大模型做风险识别比单纯懂大模型的人更有壁垒。我的建议是不要试图去和 AI 比拼写代码的速度你要比拼的是对业务逻辑的抽象能力和对模型行为的控制能力。能力分层你处于哪一层为了清晰规划我把当前所需的大模型相关能力分为三层。你可以对照自查避免无效努力。L1 使用者Consumer会用 ChatGPT/Claude 辅助写代码会调 OpenAI API 做简单问答。这是入门级简历上只能体现“熟悉基本调用”。L2 构建者Builder能使用 LangChain/LlamaIndex 等框架搭建 RAG 应用懂 Embedding 原理能处理基本的 Prompt 工程。这是目前中级岗位的基准线简历需要展示具体的 Demo 链接。L3 优化者与架构师Optimizer Architect能解决长上下文丢失、检索噪声、幻觉等问题懂模型微调LoRA/SFT能设计多 Agent 协作流程具备完整的评估体系Eval。这是高薪岗位的核心竞争力。大多数人的误区是停留在 L1-L2 之间打转以为学会几个框架就能跳槽。实际上L2 到 L3 的跨越才是区分“玩具开发者”和“工业级工程师”的分水岭。短期学习计划从 Demo 到可演示的工程如果你决定开始转型前两周不要急着啃论文。我建议按照以下顺序执行目的是快速产出可展示的成果。1. 掌握 RAG 的核心链路RAG检索增强生成是目前最落地的场景。不要只写一个chain要深入理解每一步的数据流转。代码示例一个简单的 RAG 查询构建from langchain.text_splitter import RecursiveCharacterTextSplitter from langchain_community.vectorstores import FAISS from langchain_community.embeddings import HuggingFaceEmbeddings from langchain_openai import ChatOpenAI # 1. 加载文档并切片 (注意chunk size 和 overlap 对检索效果影响巨大) text_splitter RecursiveCharacterTextSplitter(chunk_size500, chunk_overlap50) docs text_splitter.split_documents(raw_documents) # 2. 向量化存储 embeddings HuggingFaceEmbeddings(model_namebge-m3) # 选用支持中文且高效的模型 vectorstore FAISS.from_documents(docs, embeddings) # 3. 构建检索链 llm ChatOpenAI(temperature0.1, modelgpt-4o-mini) retriever vectorstore.as_retriever(search_kwargs{k: 3}) # 这里不仅仅是拼接更要考虑检索结果的排序和重排(Rerank) # 简单的 Prompt 工程示例 prompt_template 基于以下已知信息简洁而准确地回答用户的问题。 如果无法从已知信息中找到答案请回答“我不知道”。 已知信息: {context} 用户问题: {question} 在这个阶段你的重点不是代码多复杂而是你能否解释清楚为什么选这个 Chunk Size为什么选这个 Embedding 模型。2. 建立评估意识面试官一定会问“你怎么知道你的 RAG 系统好不好”你必须准备一套评估指标。不仅是准确率还要包括检索召回率 (RecallK)相关文档是否被找到忠实度 (Faithfulness)生成的答案是否完全基于检索到的文档上下文相关性 (Context Relevance)提供的上下文是否真的有助于回答问题可以用Ragas或DeepEval这样的开源库来自动化评估。把这些评估报告截图放在你的 GitHub 仓库 README 里这就是强有力的证据。中期项目沉淀做一个“有瑕疵但真实”的项目不要去做那种“全知全能”的智能助手。那种项目太泛显得空洞。建议做一个垂直领域的、有具体痛点的小项目。推荐选题方向企业内部知识库助手难点在于权限控制和多源数据清洗。代码审计 Agent输入 PR Diff输出潜在 Bug 和建议。难点在于如何限制 Token 用量并聚焦关键代码片段。个性化研报生成器输入多份 PDF输出一份结构化摘要。难点在于如何处理不同格式的文档。关键动作1.公开代码GitHub 必须有清晰的README.md包含架构图、部署方式和技术栈选型理由。2.记录踩坑过程在博客或文章中写下你遇到的具体困难。例如“初期检索噪声太大导致幻觉严重后来引入 Cross-Encoder 重排模块准确率提升了 15%”。这种细节比罗列功能列表值钱得多。3.提供在线 Demo哪怕是用 Streamlit 搭的一个简陋界面也要让面试官能直接体验。长期竞争力不可替代的是什么技术栈迭代很快今天流行 LangChain明天可能就有更好的框架。但有些东西是长期的1.系统工程思维大模型只是组件之一。如何让这个组件在高并发下稳定运行如何设计降级策略如何做缓存这些传统后端能力依然重要。2.数据敏感度AI 的本质是数据驱动。你能否清洗脏数据能否构造高质量的指令微调数据集这决定了模型的天花板。3.业务抽象能力能否将模糊的业务需求转化为明确的 Prompt 约束或 Agent 流程这需要深刻的业务理解和逻辑思维能力。总结职业规划不是画饼而是步步为营的证据积累。在大模型时代“会写代码”是底线“会用模型解决问题”是进阶“能优化模型表现并保障工程稳定性”才是护城河。建议你立刻行动起来1. 盘点现有技能找出 L2 到 L3 的缺口。2. 选择一个垂直场景动手做一个包含完整评估流程的小型项目。3. 将过程中的思考、踩坑记录、评估数据整理成公开的作品集。不要等准备好了再出发。在做的过程中你才能发现真正的瓶颈在哪里。那个瓶颈就是你下一阶段的学习重点也是你简历上最有说服力的亮点。共勉。资料展示下面是我整理的AI大模型学习资料和工具包预览适合收藏后按主题逐步学习。如果你想看完整资料目录可以在评论区留言「资料」也欢迎告诉我你更关注AI大模型里的哪类内容。