LLM 幻觉的形式化数学定义 📅 2026/6/22 21:13:48 LLM 幻觉的形式化数学定义目录LLM 幻觉的形式化数学定义1. 前置定义:LLM 的生成本质2. 基础算子定义3. 幻觉的严格数学定义4. 幻觉的两种表现形式5. 幻觉严重程度的量化二、详细举例与对应验证例1:忠实性幻觉(矛盾型)例2:忠实性幻觉(捏造型)例3:事实性幻觉(矛盾型)例4:事实性幻觉(捏造型,最典型)例5:推理型幻觉(特殊子类)三、关键补充与误区澄清一、LLM 幻觉的主流分类体系维度1:按参考基准划分(学术界最核心分类)1. 忠实性幻觉(内在幻觉/上下文幻觉)2. 事实性幻觉(外在幻觉/世界知识幻觉)维度2:按表现形式与错误类型划分1. 矛盾型幻觉2. 捏造型幻觉(无依据幻觉)3. 误导型幻觉(偏倚幻觉)维度3:按幻觉发生的语义层级划分1. 实体级幻觉2. 关系级幻觉3. 篇章级/逻辑级幻觉维度4:按可察觉难度划分1. 显式幻觉2. 隐式幻觉维度5:按产生根源划分(技术治理视角)1. 训练源幻觉2. 上下文诱导幻觉3. 解码生成幻觉二、幻觉的标准化基准与评测体系(一)基准的核心判定范式1. 文本蕴含范式2. 事实三元组范式(二)主流公开基准数据集1. TruthfulQA —— 开放域事实性幻觉标杆基准2. FEVER (Fact Extraction and Verification) —— 事实核验通用基准3. XSumHall / FactCC —— 摘要场景忠实性幻觉基准4. RGB (RAG Groundedness Benchmark) —— RAG场景忠实性基准5. HALUE —— 多任务综合幻觉基准(三)基准的局限性LLM 幻觉(Hallucination)的核心本质是:模型生成的文本在语义上通顺、看似合理,但内容与参考事实基准不符或无依据。以下用严格的符号与公式对其进行定义,该框架也是当前学术界幻觉检测与抑制研究的通用形式化基础。1. 前置定义:LLM 的生成本质大语言模型是一个自回归条件概率模型:给定输入提示序列x = [ x 1 , x 2 , … , x m ] \boldsymbol{x} = [x_1, x_2, \dots, x_m]x=