×

一篇综述:知识图谱的3种类型,6大推理任务

hqy hqy 发表于2025-07-11 19:51:51 浏览20 评论0百度已收录

抢沙发发表评论

一、引言与背景

知识图谱(KGs)作为结构化和利用现实世界知识的强大范式,在认知智能系统中发挥着基础性作用,能够使系统具备先进的理解和推理能力。知识图谱推理(KGR) 的目标是基于 KGs 中现有的事实推断新知识,在诸如公共安全情报分析、智能医疗和金融风险评估等众多实际应用场景中扮演着关键角色。

可以将 KGR 任务分为六类:

静态单步 KGR静态多步 KGR动态 KGR多模态 KGR少样本 KGR归纳 KGR

二、知识图谱类型与 KGR 任务分类

2.1 知识图谱类型

三种典型的知识图谱类型:静态知识图谱、动态知识图谱和多模态知识图谱。

静态知识图谱:由事实三元组组成,以有向图的形式表示,其中节点代表实体,边代表关系。大多数公开可用的 KGs 属于静态类别,因此大部分 KGR 研究集中在静态 KGs 上。动态知识图谱:适用于现实世界中具有动态特性的领域,如金融、新闻和学术等。动态 KGs 的“动态”特性体现在知识的演变和时间属性上,包括:事实三元组的增删改以及新实体和关系的出现,同时还涉及时间维度的嵌入,形成事件四元组(s, p, o, t)。多模态知识图谱(MMKGs):利用多模态数据源(如文本、图像、音频等)来丰富实体和关系的表示,增强嵌入特征。MMKGs 通过将多模态数据与符号实体和关系相结合,克服了从这些数据源中提取的符号实体和关系缺乏丰富特征的问题。

2.2 KGR 任务分类

文章将 KGR 任务分为以下六类:

静态单步 KGR基于静态 KG 中已知的三元组挖掘实体之间的语义关联,并将其转移到未知三元组中以预测缺失元素。主要方法包括:知识图谱嵌入(KGE)模型和基于逻辑规则的模型。静态多步 KGR与单步 KGR 不同,静态多步 KGR 需要捕捉实体沿多步路径的中间语义关联。例如,通过分析图中的多步关系路径来预测尾实体。动态 KGR需要同时捕捉知识的变化语义信息和事件演变的时间信息,以全面理解 KG 的动态特性并提高推理过程的准确性。多模态 KGR利用多模态数据(文本、图像、视频等)来丰富实体和关系的表示,增强 KG 中实体和关系的嵌入。少样本 KGR关注长尾实体/关系分布和稀疏关联问题,例如动态 KG 中新添加的实体。在少样本情况下,目标是开发能够基于有限知识泛化关联的方法。归纳 KGR与依赖已知实体/关系的推理任务不同,归纳 KGR 需要在推理过程中处理未见过的实体(例如,图中的 A、B、C 和 D)。归纳 KGR 的目标是通过从观察到的三元组中泛化语义模式来推断新事实。

三、KGR 方法与技术细节

3.1 静态单步 KGR

静态单步 KGR 方法主要分为:基于 KGE 的模型和基于逻辑规则的模型。

基于 KGE 的模型KGE 模型通过将 KG 中的实体和关系嵌入到向量空间中,学习实体和关系的拓扑特征,从而识别实体对之间的直接语义关联。例如,TransE 模型将关系表示为嵌入空间中的平移操作,优化目标是 h + r ≈ t,其中 h、r 和 t 分别表示头实体、关系和尾实体的嵌入。此外,还有张量分解模型、基于神经网络的模型、基于图神经网络的模型和基于 Transformer 的模型等多种 KGE 方法。基于逻辑规则的模型基于逻辑规则的 KGR 利用 KG 中三元组的频繁模式自动挖掘符号规则,并通过查询和与规则匹配的三元组实例化规则。例如,从 KG 中挖掘出逻辑规则 Nationality(x, y) ⇐ BornIn(x, z) ∧ LocatedIn(z, y),然后利用与规则匹配的观察到的三元组来推断新的三元组。

3.2 静态多步 KGR

静态多步 KGR 方法主要包括:基于随机游走的模型、基于强化学习的模型和基于 LLM 的模型。

基于随机游走的模型通过从起始节点随机采样后续节点来构建路径,如路径排名算法(PRA)利用随机游走发现实体之间的路径,并将路径中的关系序列作为特征输入分类器以预测实体之间的关系。后续方法主要集中在优化路径生成和特征提取。基于强化学习的模型将 KG 推理任务建模为马尔可夫决策过程,训练智能体在图中导航。例如,DeepPath 定义关系作为动作空间,并基于成功识别正确尾实体来制定奖励函数。基于 LLM 的模型利用 LLMs 的能力来导航 KG,以增强推理性能并解决冷启动和缺失答案等问题。例如,StructGPT 引入迭代调用-线性化-生成框架,利用 LLM 接口从 KG 中提取推理任务的相关路径作为证据。

3.3 动态 KGR

动态 KGR 包括:增量 KGE 模型和时序 KGR 模型。

增量 KGE 模型如 PuTransE 扩展传统 TransE 方法,为 KG 的不同部分创建多个嵌入空间,当 KG 更新时学习新的嵌入空间并与现有空间聚合。时序 KGR 模型基于时间嵌入的模型和基于演变学习的模型。例如,TA-TransE 将时间视为数值属性,结合时间、谓词序列进行编码,通过类似于 TransE 的评分函数评估四元组。

3.4 多模态 KGR

多模态 KGR 方法可分为:基于多模态嵌入的模型和基于预训练语言模型(PLM)的模型。

基于多模态嵌入的模型设计 KGE 模型直接将多模态信息整合到实体嵌入中。例如,文本基础的 MMKGR 模型利用实体和关系的文本描述来增强实体表示。基于 PLM 的模型利用预训练语言模型(PLMs)的微调能力,将三元组转换为 PLMs 的输入序列,并微调模型以适应特定任务。

3.5 少样本 KGR

少样本 KGR 方法主要包括:度量学习模型、元学习模型和辅助信息增强模型。

度量学习模型如 GMatching 利用实体的邻居子图编码实体对,并训练度量学习模型以匹配支持集和查询集中的实体对表示。元学习模型如 MetaR 编码支持集中的实体对以获得关系元表示,然后使用标准 KGE 模型和梯度下降策略进行快速优化。辅助信息增强模型通过结合文本描述、本体信息和路径信息等辅助信息来丰富长尾关系的表示。

3.6 归纳 KGR

归纳 KGR 方法可分为:基于规则的模型、基于 GNN 的模型和多模态增强模型。

基于规则的模型由于规则封装了高层次的语义知识,通常只涉及变量,因此可以独立于特定实体直接应用于未见过的实体推理。基于 GNN 的模型使用 GNN 编码实体的邻居信息以推断未见过实体的嵌入。例如,MEAN 使用 GNN 编码实体的邻居,并使用 TransE 模型解码表示以产生推理结果。多模态增强模型通过充分利用实体和关系相关的文本、图像等多模态信息,直接学习未见过实体的嵌入。

四、KGR 应用

4.1 水平领域应用

问答系统:KG 基于问答系统(KGQA)已集成到许多实际应用中,如智能客服机器人。KGR 技术用于从 KG 中生成精确答案,处理简单查询、未知答案查询和复杂查询。推荐系统:KGR 技术用于挖掘用户偏好和增强推荐结果的可解释性。例如,KGCN 使用 GCN 聚合邻居信息以编码实体,通过计算项目特征和用户特征之间的相似性来生成个性化推荐。视觉推理:KGR 技术用于增强视觉推理任务,包括视觉问答、跨模态检索和场景理解。例如,FVQA 将每个实例表示为包含图像、问题、答案和支持事实子图的元组,要求整合背景知识。

4.2 垂直领域应用

医疗保健领域:利用 KGR 进行疾病特定 KG 构建、药物-疾病相互作用预测等。例如,SDKG-11 构建疾病特定 KG,并应用多模态 KGR 来发现特定疾病的见解。商业领域:开发大规模多模态商业 KG,如 OpenBG,应用于产品分类和预测等下游任务。网络安全领域:构建领域特定的 KG,并应用基于规则学习的推理模型来自动推断漏洞、弱点、平台和攻击模式之间的关系。

五、KGR的的挑战和机遇

现实世界 KG 是稀疏性的,传统 KGE 模型难以捕获有效的拓扑特征,利用逻辑规则捕获关系间相关性、引入外部知识源并使用 GNN 技术进行融合、结合对比损失与交叉熵损失等方法可以解决稀疏性问题。现实世界知识通常具有内在不确定的,当表示不确定性时,很难准确推断正确的结果使用自动化提取技术构建的大型 KG 中存在噪声和错误,需要利用自动错误检测技术,来减少噪音和错误,防止基于此类 KG 的推理结果不可靠KGR 的可解释性主要依赖于基于规则学习的模型和多跳推理技术,这些技术通过符号规则和明确的路径信息提供可解释性,但与 KGE 模型相比,其泛化能力有限。将符号逻辑与 KGE 通过神经典义推理框架相结合,平衡可解释性与泛化能力,是一个有前景的研究方向。

https://arxiv.org/pdf/2506.11012

https://github.com/ngl567/KGR-Survey