知识图谱推理综述

📅 2026/6/27 2:50:35
知识图谱推理综述
论文基本信息项目内容标题A Comprehensive Survey of Knowledge Graph Reasoning: Approaches and Applications作者Guanglin Niu, Bo Li, Yangguang Lin发表期刊IEEE Transactions on Big Data, Vol. 12, No. 3, May/June 2026机构北京航空航天大学人工智能学院、北京邮电大学人工智能学院代码https://github.com/ngl567/KGR-Survey一、核心研究背景1.1 什么是知识图谱推理知识图谱KG以有向图结构组织知识包含实体Entities和关系Relations。但现实中的KG普遍存在不完备性Freebase中75%的人缺少国籍信息DBpedia中60%的人缺少出生地信息知识图谱推理KGR的目标是从已有事实中推断未知知识填补这些缺失。1.2 三种核心推理范式见图1范式特点示例传统KGR单步三元组补全给定(David, Nationality, ?) → 预测USA多跳KGR基于路径的多步推理David→BornIn→San Francisco→LocatedIn→California→LocatedIn→USA时序KGR带时间戳的事件推理(David, Recruit, ?, 2024)二、传统KGR方法详解第III节2.1 知识图谱嵌入KGE模型论文将KGE模型分为五大类别a) 平移/翻译类模型Translation-basedTransE开山之作hr≈t\mathbf{h} \mathbf{r} \approx \mathbf{t}hr≈t将关系视为向量空间中的平移操作TransH为每个关系引入超平面投影解决一对多/多对多问题TransR/TransD为每个关系建立独立的关系空间RotatE将关系建模为复数空间中的旋转天然处理对称关系HAKE/H2E利用极坐标编码层次结构b) 张量分解类Tensor Decomposition-basedRESCAL将KG视为三阶张量关系用完整矩阵表示DistMult限制关系为对角矩阵提升效率ComplEx使用复值向量和Hermitian积同时建模对称和反对称关系TuckER利用Tucker分解显式建模关系交互c) 神经网络类NN-basedNTN关系特定的双线性/张量变换ConvE/ConvKB使用2D卷积建模嵌入交互d) 图神经网络类GNN-basedR-GCN关系特定的消息传递KBGAT多头注意力机制强调重要邻居NoGE融入共现模式e) Transformer类KG-BERT将三元组作为文本序列用BERT编码KoPA用知识前缀适配器桥接KGE和LLM2.2 本体感知KGEOntology-Aware利用层次概念和概念间关系JOIE联合嵌入本体层和实例层CAKE构建常识图统一本体和实例Concept2Box用盒嵌入捕获概念重叠和层次2.3 路径增强KGEPath-Enhanced类型代表模型特点关系路径PTransE, HARPA只编码关系序列完整路径PARL, RPE同时编码实体和关系多路径CPConvKE, PathCon识别并整合多条信息路径2.4 多模态增强KGEMultimodal文本型DKRL, KG-BERT, SimKGC融合型IKRL, RSME, Hybrid Transformer联合编码多模态集成型MoSE, IMF独立训练后融合输出2.5 负采样策略六大类见图4策略代表方法核心思想随机均匀采样TransE原始版简单但易产生假负例概率型Bernoulli采样根据关系元数调整概率对抗生成型KBGAN, IGANGAN生成困难负例自监督型Self-Adv (RotatE)利用模型自身分数加权语义相似型AN, DNS用语义相似实体替换高效型NSCaching, CCS缓存高质量负例提升效率2.6 逻辑推理模型归纳逻辑编程ILPAMIE优化查询执行和规则评估ScaLeKB自动数据清洗和分区Evoda遗传逻辑编程扩展Horn规则神经网络规则学习NeuralLP, DRUM端到端学习规则模式RNNLogicRNN规则生成器 推理预测器Ruleformer将规则挖掘视为序列到序列任务联合规则-KGE模型开环增强KALE, RUGE, RulE将规则融入嵌入学习闭环迭代IterE, UniKER, EngineKG规则推理与嵌入学习相互增强三、多跳与时序KGR第IV节3.1 多跳KGR方法代表模型特点强化学习型DeepPath, MINERVA, MultiHopKG将推理视为MDP显式路径探索任务特定奖励大语言模型型StructGPT, ToG, KG-Agent隐式知识融合通用性强但存在幻觉问题关键对比见图5RL模型显式路径、可解释、需训练LLM模型隐式推理、泛化好、可能有幻觉3.2 时序KGRTKGR方法代表模型特点TKGE型TATransE, TTransE, HyTE, TERO学习时间嵌入擅长有效性评分演化学习型RE-NET, EvolveRGCN, CyGNet建模KG快照序列捕获动态演化LLM型PPT, ECOLA, SToKE文本化事件处理隐式时间表达关键对比见图6TKGE插值已知时间戳✓外推未来✗演化学习擅长外推但难以利用查询后事件LLM插值外推皆可但图结构保真度差四、应用领域分类第V节首次系统分类4.1 横向领域通用应用领域核心任务代表工作问答系统简单查询/复杂多跳查询/时序问答KEQA, EmbedKGQA, TwiRGCN, CRONKGQA推荐系统用户偏好挖掘/可解释推荐KGCN, KPRN, CogER, RippleNet, KGAT视觉推理VQA/跨模态检索/场景图生成FVQA, Graphhopper, KCR, GB-Net4.2 垂直领域行业特定领域典型应用关键挑战医疗健康药物发现、DDI预测、安全用药推荐高错误成本、需可追溯性、隐私保护商业电商产品分类、供应链风险管理、企业风险预测低延迟、数据新鲜度、多模态异构网络安全漏洞关联、攻击模式识别、智能合约缺陷检测实时性、对抗性、可操作的解释教育学习资源推荐多路径可解释推理社会科学社会经济指标预测层次KG嵌入交通地铁客流预测语义类型GNN环境科学海洋溢油检测规则GNN混合五、挑战与未来方向第VI节5.1 可信推理Trustworthy Reasoning神经符号推理结合符号可解释性与神经可扩展性溯因推理从观察生成假设RLF-KG统一评估指标忠实度人在回路验证5.2 多模态推理跨模态对齐与融合编码扩散模型合成缺失模态5.3 持续学习Continual Learning避免灾难性遗忘LKGE使用掩码自编码器平衡新旧知识TIE将删除的三元组视为负例5.4 不确定性推理高斯分布嵌入KG2E概率盒嵌入BEUrRE置信度感知训练SUKE5.5 LLM增强KGR任务机会局限传统KGR实体描述丰富、关系释义、子图摘要幻觉、结构忠实度不足多跳KGRCoT式路径推理生成链与真实KG路径不匹配时序KGR时间抽象、事件链补全时间粒度不一致关键要求约束感知生成、逻辑规则验证器、来源感知检索六、论文核心贡献总结全面性首次从基础方法应用双视角系统综述KGR新颖性涵盖负采样策略、开源库、规则引导范式等较少关注的主题应用分类首次提出横向垂直领域的应用分类体系前沿性深入探讨LLM与KGR的融合及挑战实用性强调从基准测试到实际部署的差距延迟、新鲜度、噪声、可审计性七、关键图表索引图号内容页码Fig. 1三种KGR范式概览p.722Fig. 2五种代表性KGE模型p.723Fig. 3TransE及其变体分类p.723Fig. 4六种负采样策略对比p.725Fig. 5RL vs LLM多跳推理对比p.729Fig. 6三种时序KGR方法对比p.730Fig. 7KGR在QA中的应用示例p.730Table I主流KGE开源库p.726Table II传统KGR代表模型总结p.727