当前位置: 首页> 房产> 家装 > 微信小程序开发管理_网站制作多少钱啊_广告主平台_百度一下就知道了官网榡

微信小程序开发管理_网站制作多少钱啊_广告主平台_百度一下就知道了官网榡

时间:2025/7/11 2:38:18来源:https://blog.csdn.net/zishuijing_dd/article/details/146980732 浏览次数:2次
微信小程序开发管理_网站制作多少钱啊_广告主平台_百度一下就知道了官网榡

RAG的流程

RAG Retrieval-augmented Generation,大模型增强技术,现在热门的大模型技术之一。搭建企业私有知识库的必备,既可以在使用AI智能的时候,及时的加入本地业务知识,又不会暴露企业的内部信息。
RAG的流程一般分为四步:

  1. 知识提取
    从给定文档、图片、网页中提取数据。
  2. 知识索引
    给数据做合理的切割,使用embedding 技术将文本变成向量数据,存入到向量数据库。非结构化文件所附带的元数据(时间、文件名、作者、标题等)也会保存,作为索引的一部分。
  3. 知识检索
    RAG接收用户的提问,将提问内容也通过embedding技术转为向量数据。然后与向量数据库中数据进行匹配(相似度、相关性等方面的匹配)。通常会使用一些粗略的提取K个块(这时候可以比较多,比如100个),然后rerank进行精准排序,最后提取前K(这时候比较小,比如3 、4)个结果。
  4. 生成
    将最终的k个结果,还有提示词,发送给大模型,大模型进行语言组装、生成。

优缺点

优点

  • 保护私有数据。不需要上传到在线模型,且在不训练模型的情况下,还能保证模型数据及时性。
  • 减少幻觉。不会让模型随意生成,通过提示词可以强制只根据查询结果回复
  • 可解释性提高。可以随时反馈引用的文档,可视化输出结果的原因

缺点

  • 性能问题。私有的数据量可能很大,检索会很慢
  • 低命中率问题。无无论用户意图是否明确,由于检索算法限制,可能无法高效召回相关信息。
  • 冗余。搜索的信息包含重复的信息,会生成重复内容
  • 用户的语义难以明确。单纯的向量相似也未必是相似的语义。
关键字:微信小程序开发管理_网站制作多少钱啊_广告主平台_百度一下就知道了官网榡

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

责任编辑: