2.5.2 图卷积神经网络
图卷积神经网络(Graph Convolutional Network,GCN),将卷积运算从传统数据(例如,图像)推广到图数据。其核心思想是学习一个映射函数,通过该映射函数,图中的节点可以聚合它自己的特征与它邻居节点的特征,来生成该节点的新表示。图卷积神经网络是许多复杂图神经网络模型的基础,包括基于自动编码器的模型、生成模型和时空网络等。
图卷积层通过聚集来自其邻居的特征信息来封装每个节点的隐藏表示。特征汇总后,将非线性变换应用于结果输出。通过堆叠多层,每个节点的最终隐藏表示形式将接收来自其他邻居的消息。
图卷积神经网络(GCN)与递归图神经网络密切相关。GCN不是使用收缩约束来迭代节点状态的,而是在结构上使用固定数量的层(在每一层中具有不同的权重)来解决循环的相互依存关系。由于图卷积更有效,更方便与其他神经网络进行合成,因此,近年来,GCN迅速得到普及。GCN分为两类,即基于谱的和基于空间的。基于谱的方法通过从图信号处理的角度引入滤波器来定义图卷积,其中图卷积运算被解释为从图信号中去除噪声。基于空间的方法继承了GCN的思想,以通过信息传播来定义图卷积。自从GCN弥合了基于谱的方法与基于空间的方法之间的鸿沟以来,基于空间的方法由于其引人注目的效率、灵活性和通用性而迅速发展。
1. 基于谱的图卷积神经网络
基于谱的图卷积神经网络(Spectral-based Graph Convolutional Network)基于图信号处理问题,将图神经网络的卷积层定义为一个滤波器,即通过滤波器去除噪声信号从而得到输入信号的分类结果。实际问题中只能用于处理无向且边上无信息的图结构,将输入信号的图定义为可特征分解的拉普拉斯矩阵,归一化后的特征分解可以表示为通用结构,其对角矩阵A就是特征值的λi按序排列组成的特征矩阵。基于谱的图卷积神经网络方法的一个常见缺点是,它们需要将整个图加载到内存中以执行图卷积,这在处理大型图时是不高效的。
2. 基于空间的图卷积神经网络
基于空间的图卷积神经网络(Spatial-based Graph Convolutional Network)的思想,主要源自传统卷积神经网络对图像的卷积运算,但是与之不同的是,基于空间的图卷积神经网络是基于节点的空间关系来定义图卷积的。
为了将图像卷积与图卷积联系起来,可以把图像视为图的特殊形式,如图2.14(a)所示,每个像素代表一个节点,每个像素直接连接其附近的像素。通过一个3×3的窗口,每个节点的邻域是其周围的8个像素。这8个像素的位置表示一个节点的邻居的顺序。然后,通过对每个通道上的中心节点及其相邻节点的像素值进行加权平均,对该3×3窗口应用一个滤波器。由于相邻节点的特定顺序,可以在不同的位置共享可训练权重。同样,对于一般的图,如图2.14(b)所示,与卷积神经网络对图像的像素点进行卷积运算类似,基于空间的卷积图神经网络通过计算中心单一节点与邻节点之间的卷积,来表示邻节点间信息的传递和聚合,作为特征域的新节点表示。
图2.14 卷积对比示意图
基于谱的图卷积神经网络模型在图形信号处理中具有理论基础,通过设计新的图形信号滤波器,人们可以构建新的ConvGNN。但是,由于效率、通用性和灵活性问题,与基于谱的卷积图神经网络模型相比,基于空间的图卷积神经网络模型更为可取。首先,基于谱的图卷积神经网络模型效率不如基于空间的图卷积神经网络模型。基于谱的图卷积神经网络模型要么需要执行特征向量计算,要么需要同时处理整个图形。基于空间的图卷积神经网络模型更可扩展到大型图,因为它们通过信息传播直接在图域中执行卷积,可以在一批节点而不是整个图中执行计算。其次,依赖于图傅里叶基础的基于谱的图卷积神经网络模型不能很好地推广到新图。它们假设一个固定的图,对图的任何扰动都会导致本征基的变化。另一方面,基于空间的图卷积神经网络模型在每个节点上本地执行图卷积,可以轻松地在不同位置和结构之间共享权重。此外,基于谱的图卷积神经网络模型仅限于在无向图上运行,基于空间的图卷积神经网络模型则更灵活,可以处理多源图输入,如边缘输入、有向图、有符号图和异构图,这些图输入可以轻松地合并到聚合函数中。