对于论文Semi-Supervised Classification with Graph Convolutional Networks，小白的学习理解

参考笔记：论文笔记：Semi-Supervised Classification with Graph Convolutional Networks_hongbin_xu的博客-CSDN博客

论文笔记：SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS_semi supervised classification_饮冰l的博客-CSDN博客

拉普拉斯矩阵与正则化_拉普拉斯正则化_solicucu的博客-CSDN博客

图卷积网络 GCN Graph Convolutional Network（谱域GCN）的理解和详细推导_详细给出图卷积网络推导过程_不务正业的土豆的博客-CSDN博客

如果看了这篇文章你还不懂傅里叶变换，那就过来掐死我吧 - 知乎

前言

卷积神经网络：灵感来源于人类的大脑，在识别一个物体时，首先识别边缘，再识别形状，最后确定物体的类型。卷积神经网络利用大脑识别的特点，建立多层神经网络，较低层识别物体的特征，若干底层特征组成更高一层特征，最终通过多层特征组合来进行分类。

典型的卷积神经网络CNN由卷积层、池化层和全连接层组成。卷积层用来提取特征，池化层用来降维和降低过拟合，全连接层用来输出最后的结果。研究的对象通常是有规则的空间结构，比如有序的语句，对于猫狗的分类。这些特征都可以用矩阵来表示。对于具有平移不变性的图片，一个小窗口移动到任意位置都不影响内部结构，可以使用CNN来提取特征。而RNN通常用于NLP这种序列信息。但是生活中还具备很多没有规则的空间结构数据，比如分子结构等，可以认为是无限维的数据，不具有平移不变性，这些不规则的空间结构难以用固定的卷积核来表示特征。每一个节点都是独一无二的，会让CNN,RNN失效.而GCN设计了一套从图数据中提取特征的办法，本质是个特征提取器。论文（Semi-Supervised Classification with Graph Convolutional Networks）使用谱图理论，利用拉普拉斯矩阵的特征值和特征向量来研究图的性质。

半监督学习是指样本集只有部分数据含有标签，通过已有标签的数据推断出没有标签数据的分类。给定一个数据集，可以映射成一个图，数据集中每个数据对应一个结点，由于一个图可以对应一个矩阵，这使得我们可以基于矩阵来进行半监督学习算法的分析。但是这有两个问题，一是假设有n个样本，复杂度就是n^2，这使得如此大规模的数据很难处理。二是构图过程只能使用样本集，再加入新的样本需要对原图进行重构并重新标记。

该论文的目标是解决半监督学习的问题。本文使用神经网络f(X,A)对图结构进行编码，对带有标签的节点在监督目标上进行训练。

1 介绍

我们考虑在图中对节点进行分类的问题，其中标签只适用于一小部分节点。这个问题被定为半监督学习，其中标签信息通过某种形式基于图的显示正则化在图上平滑。例如公式（1），在损失函数中使用拉普拉斯正则化项：

$L_{0}$ 表示图中有标签的监督损失
f（.）表示类似神经网络的可微函数
λ 是个权重因子
X是节点特征向量 $X_{i}$ 的矩阵
A表示图的邻接矩阵
$D_{ii}=\sum_{j}^{}A_{ij}$ 表示A的度矩阵，是个对角矩阵
∆=D-A表示无向图的非归一化图拉普拉斯算子

这有两个好处，我们为图神经网络引入了一个简单且行为良好的前向传播公式，并展示了它是如何从谱图卷积的一阶近似中被激发。其次，我们演示了这种形式的基于图的神经网络模型如何用于图中节点的半监督分类。缺点是依赖于假设：相连接的节点可能共享相同的标签。这个假设可能会限制建模的能力，因为图边不一定需要编码节点相似性，而是可能包含附加信息。