15天学会AI应用开发（八）使用向量数据库实现RAG功能

📅 2026/6/29 20:10:24

文本嵌入Embedding模型向量化一段文本的时候经常用到all-MiniLM-L6-v2它是一个轻量级的文本嵌入Embedding模型专门把文字转成数字向量给RAG做语义检索用。命令行通过cd命令进入Python工程的所在目录再执行下面的模型下载命令可将all-MiniLM-L6-v2保存到本地目录modelscope download --model sentence-transformers/all-MiniLM-L6-v2 --local_dir all-MiniLM-L6-v2接着编写下面的Python代码就表示把指定文本转成数字向量也就是对文本做向量化处理from sentence_transformers import SentenceTransformer model SentenceTransformer(./all-MiniLM-L6-v2) vectors model.encode(什么是RAG)二、向量检索库FAISS把文本向量化之后还要找个地方保存向量数据以便后续从数据集中检索知识。FAISS就是一个本地、超快、免费的语义检索工具专门用来在RAG里找“最相似的知识”。Python代码里的FAISS主要完成三件事建立索引、放入知识向量、在用户提问时检索知识如下代码所示import faiss # 建立索引相当于建了个检索表 index faiss.IndexFlatL2(vectors.shape[1]) # 把知识向量放进去 index.add(np.array(vectors).astype(float32)) # 用户提问 → 检索最相似的1条 D, I index.search(...)三、结合all-MiniLM-L6-v2与FAISS实现RAG接下来演示如何使用all-MiniLM-L6-v2与FAISS实现RAG检索功能。在编写Python代码前要先在命令行执行下面的pip安装命令pip install faiss-cpu sentence-transformers然后编写下面的Python检索测试代码from sentence_transformers import SentenceTransformer import faiss import numpy as np # 你的知识库完全不变 knowledge [ 什么是AI人工智能AI是一门使机器模拟人类智能的技术。, 什么是RAGRAG代表检索增强生成通过检索外部知识提升大模型回答准确性。, 本地RAG消耗Token吗本地RAG不调用云端API不消耗Token完全免费。, FAISS是什么FAISS是Facebook开源的向量检索库用于本地高效检索。, RAG的作用RAG让大模型能引用外部知识避免胡说八道。 ] # 加载你本地已有的模型不变 embed_model SentenceTransformer(./all-MiniLM-L6-v2, devicecpu) # 生成向量把知识库向量化 vectors embed_model.encode(knowledge) # 构建 FAISS 索引 index faiss.IndexFlatL2(vectors.shape[1]) index.add(np.array(vectors).astype(float32)) # RAG 检索逻辑不变 def rag(question): print(\n 问题 question) # 把问题向量化 q_vec embed_model.encode([question]) # 从 FAISS 检索对应的知识 D, I index.search(np.array(q_vec).astype(float32), 1) best knowledge[I[0][0]] answer best.split()[-1] print( 答案 answer) print(- * 50) # 运行 if __name__ __main__: print( 本地智能 RAG 系统问什么答什么 ) while True: q input(\n请输入问题q退出) if q.lower() q: break rag(q)运行上面的Python代码根据提示输入问题“什么是FAISS”输出日志结果如下本地智能 RAG 系统问什么答什么请输入问题q退出什么是FAISS 问题什么是FAISS 答案FAISS是Facebook开源的向量检索库用于本地高效检索。 --------------------------------------------------

新闻详情

相关阅读

如何快速掌握时间序列预测：iTransformer终极解决方案指南

重要的桥接Python库

【配电网规划】SOCPR和基于线性离散最优潮流（OPF）模型的配电网规划( DNP )（Matlab代码实现）

MOSFET 场效应管笔记总结

零壹教育：列表推导式到底好在哪？从新手循环到Pythonic的必经之路

从满额到冻结：ChatGPT Plus额度耗尽后的72小时连锁反应（含API错误码对照表+应急回滚方案）

如何在macOS上快速掌握OBS虚拟摄像头：5个终极技巧指南

终极免费IDM激活教程：3分钟搞定Internet Download Manager永久使用指南

List、Set、Map

Java开发者转型安全开发：从代码审计到自动化工具实践

HyperFrames 设计、品味与借鉴

【TEE从入门到精通及实战】75 TEE内Wasm沙箱的内存安全：从“段错误”到“编译时保证”

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！