LLM 幻觉的形式化数学定义

📅 2026/6/22 21:13:48

LLM 幻觉的形式化数学定义目录LLM 幻觉的形式化数学定义1. 前置定义：LLM 的生成本质2. 基础算子定义3. 幻觉的严格数学定义4. 幻觉的两种表现形式5. 幻觉严重程度的量化二、详细举例与对应验证例1：忠实性幻觉（矛盾型）例2：忠实性幻觉（捏造型）例3：事实性幻觉（矛盾型）例4：事实性幻觉（捏造型，最典型）例5：推理型幻觉（特殊子类）三、关键补充与误区澄清一、LLM 幻觉的主流分类体系维度1：按参考基准划分（学术界最核心分类）1. 忠实性幻觉（内在幻觉/上下文幻觉）2. 事实性幻觉（外在幻觉/世界知识幻觉）维度2：按表现形式与错误类型划分1. 矛盾型幻觉2. 捏造型幻觉（无依据幻觉）3. 误导型幻觉（偏倚幻觉）维度3：按幻觉发生的语义层级划分1. 实体级幻觉2. 关系级幻觉3. 篇章级/逻辑级幻觉维度4：按可察觉难度划分1. 显式幻觉2. 隐式幻觉维度5：按产生根源划分（技术治理视角）1. 训练源幻觉2. 上下文诱导幻觉3. 解码生成幻觉二、幻觉的标准化基准与评测体系（一）基准的核心判定范式1. 文本蕴含范式2. 事实三元组范式（二）主流公开基准数据集1. TruthfulQA —— 开放域事实性幻觉标杆基准2. FEVER (Fact Extraction and Verification) —— 事实核验通用基准3. XSumHall / FactCC —— 摘要场景忠实性幻觉基准4. RGB (RAG Groundedness Benchmark) —— RAG场景忠实性基准5. HALUE —— 多任务综合幻觉基准（三）基准的局限性LLM 幻觉（Hallucination）的核心本质是：模型生成的文本在语义上通顺、看似合理，但内容与参考事实基准不符或无依据。以下用严格的符号与公式对其进行定义，该框架也是当前学术界幻觉检测与抑制研究的通用形式化基础。1. 前置定义：LLM 的生成本质大语言模型是一个自回归条件概率模型：给定输入提示序列x = [ x 1 , x 2 , … , x m ] \boldsymbol{x} = [x_1, x_2, \dots, x_m]x=

新闻详情

相关阅读

LS2088A SEC模块AIOP接口寄存器详解与故障诊断实战

新手如何选购尤克里里？从材质到尺寸！2026零基础尤克里里选购指南

终极指南：5分钟快速上手B站直播弹幕获取神器blivedm

2026国内AI生成商用歌曲平台 授权与效果实测对比

紫光档案管理系统SQL注入漏洞复现：从原理到实战的完整指南

3分钟掌握yuzu：终极Switch模拟器完全指南

面向可重构原子阵列的超高速率量子纠错码设计与实现

IDM激活脚本终极指南：三步永久解锁Internet Download Manager完整功能

基于ColdFire MCF5307的嵌入式MP3音乐服务器设计与实现

Linux家目录配置Git化管理：从stow部署到原子化运维

MPC56x Nexus调试接口硬件设计全解析：连接器选型、引脚配置与信号完整性

第11章：Embedding入门——把文档变成可检索知识

3个步骤让小爱音箱变身AI语音助手：MiGPT深度体验指南

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

2026国内AI生成商用歌曲平台授权与效果实测对比