当前位置: 首页> 科技> 数码 > 泉州网官网_镇江丹阳怎么样_qq推广官网_抖音权重查询

泉州网官网_镇江丹阳怎么样_qq推广官网_抖音权重查询

时间:2025/9/2 7:25:10来源:https://blog.csdn.net/2401_85379281/article/details/143177186 浏览次数:0次
泉州网官网_镇江丹阳怎么样_qq推广官网_抖音权重查询

本文来看两个工作:

一个RAG中的引文生成的工作,目前这个技术点广泛应用于AI搜索以及RAG系统当中。其中提到的三种引用方法的优缺点,可以做个笔记用。

一个是关于RAG中决定何时检索,Probing-RAG,可以再回顾下自适应RAG的思路,里面提到的几种代表性决策方法,也可以再温习下。

供大家一起参考并思考。

一、RAG自适应新思路-Probing-RAG

何时检索这个工作一直都是RAG的中高腰方向,例如,类似的工作Adaptive-RAG通过分类器根据查询复杂性决定检索次数;FLARE在生成句子中任何标记的概率低于阈值时触发检索;DRAGIN结合标记不确定性和注意力权重决定检索时机。

如下图1所示:

不反映LLM内部知识的外部查询复杂性分类器引导的多余检索步骤,可能会导致错误的答案。相比之下,右侧的例子显示了模型使用探针来识别不需要进一步检索的情况,从而能够生成正确的答案。这其实就是我们一直所说的自适应检索方案,允许语言模型根据任务类型或查询中包含的特定信息主动决定何时以及检索哪些外部信息。

这些方法可以大致分为三种主要方法:基于外部分类器的、基于LLM反馈的和基于置信度的技术。

其中:

基于外部分类器的方法专注于训练外部模型,以优化基于查询特征的检索决策。例如,Adaptive-RAG结合了一个额外的分类器,将查询分为三种类型:无需检索、单步检索或多步检索。这个分类器根据每个查询的复杂性选择最优的检索次数。

**基于LLM反馈的方法依赖于对响应一致性的评估来指导检索决策。**这些方法使用提示或多语言表述来评估模型响应的质量。如果LLM在其输出中检测到低一致性,它将触发检索以获取相关文档。

**基于置信度的方法依赖于模型的token不确定性来指导检索决策。**例如,FLARE在生成的句子中遇到概率低于某个阈值的任何token时启动检索,而DRAGIN同时考虑token不确定性和连续token之间的注意力权重来决定何时检索额外信息。

因此,也可以通过内部状态估计置信度:当仅依赖于最终层的词汇分布输出时,估计LLM的事实置信度面临挑战,最近的工作已经从置信度估计扩展到使用中间表示来减轻幻觉。Dola对比了较后层和较早层的logits,以获得更可靠的下一个token分布。Lookback Lens使用基于分类器引导的解码策略来减轻上下文幻觉。

例如,图2所示的各种自适应RAG方法的概念比较。

(A) 根据外部分类器测量的查询复杂性来决定是否执行检索;(B) 基于LLM的响应来决定检索; © 使用最终令牌选择的置信度来决定检索; (D) Probing-RAG使用探针模型来决定检索,该模型利用LLM的内部隐藏状态来,也就是最近的工作 《Probing-RAG: Self-Probing to Guide Language Models in Selective Document Retrieval》,https://arxiv.org/abs/2410.13339,

一句话说下具体实现思路,Probing-RAG通过使用预训练的探针(prober)来有效捕捉模型的内部认知,从而可靠地决定是否检索外部文档。

其中,Prober是一个前馈网络,具有单个隐藏层和输出层,用于二分类。它利用LLM中间层的隐藏状态来评估是否需要额外的检索步骤。

在位置上,为啥是中层,是因为语言模型的较低层捕获低级信息,而较高层捕获更抽象的高级信息。因此,探针被放置在模型的三分之一位置之后,以最大化这些表示的效用。

伪代码如下:

在处理流程上,在输入上,探针使用模型生成的理由(r)和预测答案(ˆa)对应的隐藏状态作为输入。最后,通过计算隐藏状态的平均值来降低维度,并对其进行归一化处理,以保持数值稳定性和一致性。

此外,在训练数据上, 使用Chain-of-Thought(CoT)提示让LLM生成理由和预测答案,并记录生成过程中的隐藏状态。根据预测答案的准确性分配标签,生成正负样本对。

在训练过程方面,使用交叉熵损失函数训练探针模型。通过比较隐藏状态表示,探针学习区分何时检索能提高性能,何时不能。

二、RAG中的引文生成的再回顾

关于RAG中的引文生成,这块之前有说过longcite这些,核心就是微调,大模型具备这样的能力,例如,WebGLM,采用基于规则的方法匹配回应和参考,以过滤包含引用的高质量训练数据,并对LLMs进行微调,以学习将引用融入答案。

最近也有工作,《On the Capacity of Citation Generation by Large Language Models》,https://arxiv.org/abs/2410.11217,这篇论文提出了Generate-then-Refine方法,目的是解决生成一些错误引用的问题。

借此可以看看里面提到几种方案:

1、预引用方法

将引用视为常规标记,在LLMs推理过程中直接生成引用。这种方法对LLMs的能力要求较高,但生成的引用与参考文献之间的一致性较好。

2、后引用方法

首先生成没有引用的回复,然后匹配回复内容与参考文献,确定是否需要添加引用。这种方法生成的引用质量较差。

3、Generate-then-Refine方法

这种方法是结合预引用和后引用方法,生成初始回复后,添加相关引用并删除无关引用,从而提高引用质量而不改变回复文本,但核心还是需要通过微调LLMs来成为一个细化器,能够准确判断引用是否支持回复。

首先,使用LLM生成一个回答。这个回答可能包含了一些引用,但这些引用的质量可能不高,可能包含不相关的引用或者缺少必要的引用。

接着,使用一个微调过的模型(称为优化器)来评估和修改生成的回答中的引用。 优化器需要具备三种能力:保留相关引用:识别并保留回答中已经正确包含的相关引用;添加缺失的引用:识别回答中缺少的引用,并将其添加到回答中;移除不相关的引用:识别并移除回答中不相关或错误的引用。

而为了训练这个优化器,训练数据也有讲究,需要构建一个包含问题、参考材料、陈述和目标引用的训练数据集。

再数据的构建上,通过枚举所有可能的引用组合,并使用自然语言推理(NLI)模型来确定哪些组合真正支持陈述,从而构建高质量的目标回答。

总结

本文来看两个工作,一个RAG中的引文生成的工作,一个是关于RAG中的文档选择Probing-RAG,可以再回顾下自适应RAG的思路。

参考文献

1、https://arxiv.org/abs/2410.13339

2、https://arxiv.org/abs/2410.11217

如何学习AI大模型?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高

那么针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉[CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)]()👈

学习路线

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

关键字:泉州网官网_镇江丹阳怎么样_qq推广官网_抖音权重查询

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

责任编辑: