本文已参与「新人创作礼」活动，一起开启掘金创作之路。

本文首发于CSDN。

诸神缄默不语-个人CSDN博文目录 cs224w（图机器学习）2021冬季课程学习笔记集合

@[toc]

YouTube 视频观看地址1 视频观看地址2 视频观看地址3

本章主要内容：本章将介绍知识图谱上的推理任务。

目标是回答多跳查询multi-hop queries，包括path queries和conjunctive queries。 conjunctive合取的，交集的；与；连接的；联合的，连接（着）的; 契合的；逻辑乘法的

介绍query2box方法以解决predictive queries问题。

1. Reasoning over Knowledge Graphs

回忆：知识图谱补全任务[^1]
本章主旨：介绍如何实现知识图谱上的多跳推理任务。
1. 回答多跳查询问题，包括path queries和conjunctive queries。在某种程度上也可以说是在做知识图谱预测问题，在对任意predictive queries做预测。
2. 介绍query2box方法。
知识图谱示例：Biomedicine（以下课程内容都会使用这个知识图谱来作为示例）
KG上的predictive queries 任务目标：在一个incomplete的大型KG上做多跳推理（如回答复杂查询问题）。
对于某一类查询，我们可以自然语言的形式（绿色字）、formula/logical structure（棕色字）的形式或者graph structure（蓝色节点是查询中出现的实体，绿色节点是查询结果）的形式来表示它。本节课仅讨论有formula/logical structure或graph structure后如何进行工作，从自然语言转换到对应形式的工作不在本课程讲解。
查询类型及示例：
1. one-hop queries What adverse event is caused by Fulvestrant? (e:Fulvestrant, (r:Causes))
2. path queries What protein is associated with the adverse event caused by Fulvestrant? (e:Fulvestrant, (r:Causes, r:Assoc))
3. conjunctive queries What is the drug that treats breast cancer and caused headache? ((e:BreastCancer, (r:TreatedBy)), (e:Migraine, (r:CausedBy))
predictive one-hop queries 知识图谱补全任务可以formulate成回答one-hop queries问题： KG补全任务：链接 $(h,r,t)$ 在KG中是否存在？ one-hop query： $t$ 是否是查询 $(h,(r))$ 的答案？举例：What side effects are caused by drug Fulvestrant?图中那个查询应该是少写了一个右括号
path queries one-hop queries可以视作path queries的特殊情况，one-hop queries在路径上增加更多关系就成了path queries。
一个n-hop query $q$ 可表示为： $q=(v_a,(r_1,\dots,r_n))$ $v_a$ 是 anchor entity 查询结果可表示为 $\llbracket q\rrbracket_G$
$q$ 的query plan（一个链）：
path queries示例：What proteins are associated with adverse events caused by Fulvestrant? $v_a$ 是 e:Fulvestrant $(r_1,r_2)$ 是 (r:Causes, r:Assoc) query：(e:Fulvestrant, (r:Causes, r:Assoc)) query plan：
那么我们应该如何回答KG上的path query问题呢？如果图是complete的话，那么我们只需要沿query plan直接traverse（遍历）KG就可以。
1. 从anchor node（Fulverstrant）开始：
2. 从anchor node（Fulverstrant）开始，遍历关系“Causes”，到达实体{“Brain Bleeding”, “Short of Breath”, “Kidney Infection”, “Headache”}
3. 从实体{“Brain Bleeding”, “Short of Breath”, “Kidney Infection”, “Headache”}开始，遍历关系“Assoc”，到达实体{“CASP8”, “BIRC2”, “PIM1”}，即所求答案
但由于KG是incomplete的，所以如果仅traverse KG，可能会缺失一些关系，从而无法找到全部作为答案的实体。
我们可能很直觉地会想，那能不能直接先用KG补全技术，将KG补全为completed (probabilistic) KG，然后再traverse KG？但这样不行，KG被补全后就会是一个稠密图，因为KG补全后很多关系存在的概率都非0，所以KG上会有很多关系，在traverse时要过的边太多，其复杂度与路径长度 $L$ 呈指数增长： $O(d^L_{max})$ ，复杂度过高，无法实现。
因此我们就需要进行预测任务：predictive queries 目标：在incomplete KG上回答path-based queries 我们希望这一方法能够回答任意查询问题，同时隐式地impute或补全KG，实现对KG中缺失信息和噪音的鲁棒性。对链接预测任务的泛化：从one-step link prediction task（就以前讲过的那种）到multi-step link prediction task（path queries）

2. Answering Predictive Queries on Knowledge Graphs

idea: traversing KG in vector space[^2] 核心思想：嵌入query 相当于把TransE[^1] 泛化到multi-hop reasoning任务上：使query embedding $\mathbf{q}$ （相当于一个实体加关系的嵌入： $\mathbf{q}=\mathbf{h}+\mathbf{r}$ ）与answer embedding $\mathbf{t}$ （一个实体）靠近， $f_q(t)=-||\mathbf{q}-\mathbf{t}||$
对path query $q=(v_a,(r_1,\dots,r_n))$ ，其嵌入就是 $\mathbf{q}=\mathbf{v}_a+\mathbf{r}_1+\cdots+\mathbf{r}_n$ 嵌入过程仅包含向量相加，与KG中总实体数无关。
path query示例：
可以训练TransE来优化KG补全目标函数。因为TransE天然可以处理composition relations，所以也能处理path queries，在隐空间通过叠加relation嵌入来表示多跳。 TransR / DistMult / ComplEx无法处理composition relations，因此很难像TransE这样轻易扩展到path queries上。
conjunctive queries 示例： What are drugs that cause Short of Breath and treat diseases associated with protein ESR2? ((e:ESR2, (r:Assoc, r:TreatedBy)), (e:Short of Breath, (r:CausedBy)) query plan：
同样，如果KG是complete的话，直接traverse KG就行：
同样，如果KG有关系缺失了，有些答案就会找不到：
我们希望通过嵌入方法来隐式impute KG中缺失的关系 (ESR2, Assoc, Breast Cancer)。如图所示，ESR2与BRCA1和ESR1都有interact关系，这两个实体都与breast cancer有assoc关系：
再回顾一遍query plan，注意图中的中间节点都代表实体，我们也需要学习这些实体的表示方法。此外我们还需要定义在隐空间的intersection操作。

3. Query2box: Reasoning over KGs Using Box Embeddings

box embeddings[^3] 用 hyper-rectangles (boxes) 来建模query： $\mathbf{q}=(Center(q),Offset(q))$ offset（在计算机里应该是偏移量的意思）一个多维长方形，用中心和corner（偏移）来定义。如图所示：在理想状态下，一个box里包含了所有query（Fulverstrant副作用）的回答的实体。
key insight: intersection box就是组合之后还是box，就很好定义节点集的intersection。
embed with box embedding
1. 实体嵌入：zero-volume boxes 参数量： $d|V|$
2. 关系嵌入：从盒子投影到盒子（实体→实体）参数量： $2d|R|$ [^4]
3. intersection operator $f$ ：从盒子投影到盒子，建模box的intersection操作
projection operator $\mathcal{P}$ 用当前box作为输入，用关系嵌入来投影和扩展box，得到一个新的box。

cs224w（图机器学习）2021冬季课程学习笔记14 Reasoning over Knowledge Graphs

1. Reasoning over Knowledge Graphs

2. Answering Predictive Queries on Knowledge Graphs

3. Query2box: Reasoning over KGs Using Box Embeddings