15天学会AI应用开发（十）把文本嵌入模型换成国产模型

📅 2026/7/5 5:08:51

一、all-MiniLM-L6-v2的缺点虽然all-MiniLM-L6-v2的优点很多比如下列几点1、体积极小几十 MB随便本地离线下载2、速度超快CPU 就能跑不用显卡3、通用好用英文很强中文也能用日常 RAG 足够4、适配所有向量库FAISS、Chroma、Milvus 全都兼容但是all-MiniLM-L6-v2的缺点也很明显就是它对中文的理解能力一般有时会出现一些似是而非的错误。比如之前的文章《15天学会AI应用开发八使用向量数据库实现RAG功能》运行Python测试代码时如果输入的问题是“RAG是什么”输出日志结果如下本地智能 RAG 系统问什么答什么请输入问题q退出RAG是什么问题RAG是什么答案RAG让大模型能引用外部知识避免胡说八道。 --------------------------------------------------然而原始的知识库是这样的什么是AI人工智能AI是一门使机器模拟人类智能的技术。, 什么是RAGRAG代表检索增强生成通过检索外部知识提升大模型回答准确性。, 本地RAG消耗Token吗本地RAG不调用云端API不消耗Token完全免费。, FAISS是什么FAISS是Facebook开源的向量检索库用于本地高效检索。, RAG的作用RAG让大模型能引用外部知识避免胡说八道。可见问题“RAG是什么”的正确答案是第二条知识“RAG代表检索增强生成通过检索外部知识提升大模型回答准确性。”但all-MiniLM-L6-v2返回的答案却是最后一条知识“RAG让大模型能引用外部知识避免胡说八道。”说明all-MiniLM-L6-v2对中文的支持不够精准。对于专业中文的RAG来说更好的办法是换成国产的文本嵌入模型比如BGE-small、BGE-base、Qwen-Embedding等等。二、下载中文嵌入模型BGE-smallBGE-small的模型页面为 https://modelscope.cn/models/BAAI/bge-small-zh-v1.5 模型文件大小为192.25MB。在下载离线大模型前要先在命令行执行下面的pip安装命令pip install modelscope接着命令行通过cd命令进入Python工程的所在目录再执行下面的模型下载命令modelscope download --model BAAI/bge-small-zh-v1.5 --local_dir bge-small-zh-v1.5上面下载命令的“--model”参数表示离线大模型为“BAAI/bge-small-zh-v1.5”而“--local_dir”参数表示离线大模型的本地保存目录。下载完毕即可在Python工程的目录下方找到bge-small-zh-v1.5文件夹里面保存的便是BGE-small的具体模型文件。三、结合BGE-small与FAISS实现RAG接下来演示如何使用BGE-small与FAISS实现RAG检索功能。在编写Python代码前要先在命令行执行下面的pip安装命令pip install faiss-cpu sentence-transformers然后编写下面的Python检索测试代码与之前教程的代码相比仅仅把all-MiniLM-L6-v2改成了bge-small-zh-v1.5from sentence_transformers import SentenceTransformer import faiss import numpy as np # 你的知识库完全不变 knowledge [ 什么是AI人工智能AI是一门使机器模拟人类智能的技术。, 什么是RAGRAG代表检索增强生成通过检索外部知识提升大模型回答准确性。, 本地RAG消耗Token吗本地RAG不调用云端API不消耗Token完全免费。, FAISS是什么FAISS是Facebook开源的向量检索库用于本地高效检索。, RAG的作用RAG让大模型能引用外部知识避免胡说八道。 ] # 加载你本地已有的模型不变 embed_model SentenceTransformer(./bge-small-zh-v1.5, devicecpu) # 生成向量把知识库向量化 vectors embed_model.encode(knowledge) # 构建 FAISS 索引 index faiss.IndexFlatL2(vectors.shape[1]) index.add(np.array(vectors).astype(float32)) # RAG 检索逻辑不变 def rag(question): print(\n 问题 question) # 把问题向量化 q_vec embed_model.encode([question]) # 从 FAISS 检索对应的知识 D, I index.search(np.array(q_vec).astype(float32), 1) best knowledge[I[0][0]] answer best.split()[-1] print( 答案 answer) print(- * 50) # 运行 if __name__ __main__: print( 本地智能 RAG 系统问什么答什么 ) while True: q input(\n请输入问题q退出) if q.lower() q: break rag(q)运行上面的Python代码根据提示先输入问题“RAG是什么”再输入问题“RAG有哪些作用”输出日志结果如下本地智能 RAG 系统问什么答什么请输入问题q退出RAG是什么问题RAG是什么答案RAG代表检索增强生成通过检索外部知识提升大模型回答准确性。 -------------------------------------------------- 请输入问题q退出RAG有哪些作用问题RAG有哪些作用答案RAG让大模型能引用外部知识避免胡说八道。 --------------------------------------------------

新闻详情

相关阅读

ComfyUI-WanVideoWrapper性能突破：5090显卡10分钟生成41秒高清视频的技术奥秘

从零构建AI自动追踪摄像机：YOLO目标检测与伺服电机控制实战

Kibana：Elasticsearch 数据的可视化面板

2026年最新盘点8个AI写作辅助软件，半天搞定万字论文！

新手快速上手 OpenClaw2.7.9，全套配置操作步骤详解

抖音内容采集系统：如何设计高并发、抗风控的现代化架构

Thorium浏览器深度解析：性能优化、隐私保护与跨平台构建的完整指南

ToolJet：拖拽搭内部工具，不用从零写代码

马鞍山可靠的撕碎机工厂推荐

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！