熵与分布（更懂「犹豫」）：整个候选分布有多分散； P(True) 自评估：追加一个问题「上述答案是否正确？(A) True (B) False」，再看 logprob；

📅 2026/6/26 5:37:00

基于logprob，幻觉抑制创新方案。目录基于 `logprob`，幻觉抑制创新方案。一、基础层：单值置信度（简单但有效）1. 平均对数概率 / 困惑度（Perplexity）2. 最小 token 概率（Min-Prob，强烈推荐）二、熵与分布（更懂「犹豫」）：整个候选分布有多分散3. 预测熵（Predictive Entropy）4. 语义熵（Semantic Entropy）—— ⭐ 创新、登上 Nature 2024三、采样层：用「多次调用 + logprob」交叉验证5. SelfCheckGPT —— ⭐ 经典创新6. P(True) 自评估四、生成层：让 logprob 实时干预生成（最前沿、最有效）7. FLARE：主动检索增强 —— ⭐ 创新且非常实用8. 对比解码（Contrastive Decoding）9. 约束解码 + logprob 重排五、校准层：让概率「数值上可信」10. 温度缩放 / Conformal Prediction（保形预测）—— ⭐ 创新方向总结一、基础层：单值置信度（简单但有效）这一层只用 logprob 算一个标量分数，做阈值过滤。工程上最快落地。1. 平均对数概率 / 困惑度（Perplexity）做法：整句 token 的 logprob 求平均，或算perplexity = exp(-平均logprob)。困惑度越高 = 模型越「懵」。有效性：⭐⭐⭐ 简单粗暴，能抓住「整体在胡说」的回答，但会被长句稀释（一句话里只有一个数字错，平均下来看不出来）。2. 最小 token 概率（Min-Prob，强烈推荐）做法：不看平均，而是看整句里概率最低的那个 token。因为幻觉常常只是「一个关键实体错了」，平均值会掩盖它，但最小值能精准暴露。有效性：⭐⭐⭐⭐ 比平均值实战效果好很多，尤其适合抽取/事实类任务。这是个被验证过的「便宜又好用」的技巧。二、熵与分布（更懂「犹豫」）：整个候选分布有多分散光看选中词的概率不够，还要看整个候选分布有多分散——这才是「不确定性」的本质。

新闻详情

相关阅读

2026年除醛效果好的除甲醛公司综合测评参考

前端组件开发

别再人工盯盘了！用简单代码带你跑通【私域群运营机器人】的自动化监控

小程序毕业设计-基于 SpringBoot 与微信小程序的中草药智能识图平台设计与实现 前后端分离架构下中草药识别小程序系统设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)

我的汽车进步之路——电控 、X-by-wire, ADAS, ASIL部分内容

计算机小程序毕设实战-基于 SpringBoot 的移动端中草药识图查询平台设计与实现 面向大众科普的中草药智能识别微信小程序设计与实现【完整源码+LW+部署说明+演示视频，全bao一条龙等】

四维流形连通和操作中的Weyl能量极小化问题探究

动量守恒在临界非线性色散方程中的关键作用：从Lions密度斑块问题谈起

小程序毕设选题推荐：基于 SpringBoot 的中草药图像识别与资源展示平台设计与实现 移动端智能中草药辨识科普小程序设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】

计算机毕业设计之基于Java的流浪动物收养系统设计与开发

技术线上面试代码写完就以为通关？留学生利用黑盒测试自证风控「蒸汽教育分享」

暗黑2存档编辑器终极指南：5分钟快速掌握d2s-editor完整使用教程

3个步骤让小爱音箱变身AI语音助手：MiGPT深度体验指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

小程序毕业设计-基于 SpringBoot 与微信小程序的中草药智能识图平台设计与实现前后端分离架构下中草药识别小程序系统设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)

我的汽车进步之路——电控、X-by-wire, ADAS, ASIL部分内容

计算机小程序毕设实战-基于 SpringBoot 的移动端中草药识图查询平台设计与实现面向大众科普的中草药智能识别微信小程序设计与实现【完整源码+LW+部署说明+演示视频，全bao一条龙等】

小程序毕设选题推荐：基于 SpringBoot 的中草药图像识别与资源展示平台设计与实现移动端智能中草药辨识科普小程序设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】