【intro】图卷积神经网络(GCN)

本文为Graph Neural Networks(GNN)学习笔记-CSDN博客后续,内容为GCN论文阅读,相关博客阅读,kaggle上相关的数据集/文章/代码的阅读三部分,考虑到本人是GNN新手,会先从相关博客开始,进一步看kaggle,最后阅读论文。

引入

GNN缘起

1. CNN的缺陷

CNN的核心特点在于局部连接(local connection),权重共享(shared weights)和多层叠加(multi-layer)。(之前在李沐老师的课上也提到过,之所以可以权重共享,是因为用的卷积核是一样的,虽然听起来有点抽象,但是换个角度直接想边缘检测的canny算子,按x y方向分别的检测,每个方向上都使用同一个,局部连接我猜作者在这里的意思是没办法连接整张图?多层叠加的话,这个很正常吧,哪怕只是普通的DNN也是多层的呀

传统的方法被应用在提取欧氏空间数据特征,但是很多实际用用场景中的数据是从非欧式空间中获得的,此时传统的深度学习方法就有点不够用了。

在前面关于GNN的介绍中,提到图片可以被表示在图中,每个像素作为顶点,邻接的像素就连一条边,但是CNN对于更为一般性的图结构可能就不那么好用了。(我贫瘠的想想出现了比如两张图片,虽然拍的是同样的东西,而且也都是平面图,但是怎么表示其中相对应点点关系呢?之前的诸如关键点检测的方法超神奇,那么图是否会给出新的答案捏?期待看完之后我能得到一个答案

2. 图嵌入的缺陷

图嵌入大致可以分为三类:矩阵分解、随机游走、深度学习

作者在这里提到的图嵌入的常见模型(DeepWalk、Node2Vec)我都没听过,所以看过再更新这里。

3. GNN的优点

1)节点

对于图结构,没有天然的顺序(CNN和RNN都需要一定的顺序,图片肯定是按照一定顺序排列的像素,自然语言也肯定是有顺序的),因此GNN采用再每个节点上分别传播的方式进行学习,忽略节点的顺序,正因如此输出会随着输入的不同而不同。

2)边

可以通过图结构进行传播,而不是仅仅将其作为节点特征的一部分。

4. GNN的局限性

1)对不动点使用迭代方法来更新节点的隐藏状态,效率不高

2)原始的GNN在迭代中使用相同的参数,其他比较著名的模型在不同的网络层采用不同的参数进行分层特征提取,使得模型能够学到更加深的特征表达。

3)一些边上保存的某些信息可能不能被有效的考虑进去(如知识图中的边具有关系类型,并且通过不同边的消息传播应根据其类型而不同)。且如何学习边的隐藏状态也是一个重要问题。

4)如果我们需要学习节点的向量表示而不是图的表示,则不适合使用固定点,因为固定点中的表示分布将在值上非常平滑并且用于区分每个节点的信息量较少。

大部分都没看懂,期待后期看完后补充

5. framework

在一个图结构中,每个节点由自身的特征以及与其相连的节点特征来定义该节点。

不确定这样理解对不对,比如我们现在想推送广告给A,已知A关注了B、C、D,其中C、D和A互关,C点开了广告a,D点开了广告b,是否可以合理猜测A大概率也会想看广告ab呢?

GNN的目的就是为每一个节点学习到一个状态嵌入向量h_v \in R^s,这个向量包含每个节点的邻居节点的信息,h_v表示该节点的状态向量,这个向量可以用于产生输出o_v

按照这篇文章前面的定义,h_v表示顶点v的隐藏状态,o_v表示的是顶点v的输出。R^s指的应该是s-欧几里得空间(但是这里有个疑问,之前说图可以解决非欧式空间的问题,这里属于欧式空间不就没啥特殊了吗?所以这个定义存疑)

h_v = f\left ( x_v, x_{co[v]} , h_{ne[v]},x_{ne[v]}\right )

o_v = g\left ( h_v,x_v \right )

这里f是局部转移函数(local transition function),在所有节点中共享,根据邻居节点的输入来更新节点状态。

g为局部输出函数(local output function),用于描述输出的产生方式。

x_v表示节点v 的特征向量,x_{co[v]}表示与节点v关联的边的特征向量(不清楚是否按照图论中incident的定义),h_{ne[v]}表示节点v的邻居节点的状态向量,x_{ne[v]}表示节点v的邻居节点的特征向量。(浅总结一下,一共有两种向量:特征向量和状态向量。其中特征向量主要有三个来源:节点v自己,与节点v相连的边,节点v的邻居,状态向量仅仅来源于邻居节点。这里有个小问题,为什么只有邻居节点需要提供状态向量?

现在,离开局部模式,进入all叠加模式:

H^{t+1} = F(H^t,X)

O=G(H,X_N)

小结:和前面关于GNN的intro感觉差不太多捏。需要关注的点是两种向量分别储存的是什么信息,是同等重要吗?是类似图片不同的通道可以独立考虑,还是类似NLP里面对于同一段文字的不同的embedding,某一个embedding可能决定其他embedding的重要程度,这都是希望后面可以回答的问题。

GCN是做什么的

GCN是一种能够直接作用于图并利用其结构信息的卷积神经网络,这一思想是又图像领域迁移到图领域的。

GCN设计了一种从图数据中提取特征的方法,让我们可以使用这些特征对图数据进行节点分类(node classification)、图分类(graph classification)、边预测(link prediction),还可以顺便得到图的嵌入表示(graph embedding)。

对于图数据,一般常见的任务类型:

节点分类(node classification):给定一个节点,预测其类型(比如之前那个教练分开,判断学员会跟哪个的

边预测(link prediction):预测两个节点之间是否存在连接(可能类似于猜你喜欢?

网络相似度(network similarity):衡量两个网络或者子网络之间的相似性。

一个拥有C个input channel的graph作为输入,经过中间的hidden layers,得到F个output channel的输出。

->输入一个图,通过若干层GCN每个node特征都从X变成了Z,这里无论中间的hidden layers有多少层,node之间的连接关系都是共享的(但是不一定层数越多越好)。

应用举例:

graph convolutional network有什么比较好的应用task? - 知乎

1. 空手道俱乐部网络(社交网络)
2. 蛋白质交互网络(生物学)
3. 论文引用网络(用户画像)

⬆️本身就是图结构

⬇️本身不是图结构,但是可以构建图结构

比如图片

有一个举例是说可以做人脸聚类,正巧在论文中也提到了,即使不训练、完全使用随机初始化的参数w,GCN提取出来的特征就已经很棒了。这一点与CNN就完全不一样了(相比之下CNN如果完全只使用初始化的参数,那么出来的就很emmm随机)。论文中举例的是俱乐部会员关系聚类,在原数据中同类别的node,经过GCN提取出来的embedding,就已经在空间上自动聚类了,相比之前的DeepWalk、node2vec这种需要复杂训练才能得到的node embedding也没差到哪去。

为什么要用GCN

文章在这里指出CNN的核心在于kernel,通过在图片上滑动一个小窗口计算卷积的方式来提取特征,关键在于图片结构上的平移不变性(小窗口移动到图片的任何位置,其内部结构都是不变的)->参数共享

RNN的对象是自然语言,属于序列信息(一维),通过各种门的操作,使得序列前后的信息互相影响,今儿捕捉序列特征。

以上都属于欧式空间数据。欧式空间的数据结构很规则,但是在现实生活中,还存在很多不规则的数据结构,比如图结构(亦称拓扑结构),比如社交网络、活血分子结构、知识图谱。图结构一般来说十分不规则,可以认为是无限维的一种数据->没有平移不变性。每个节点中为的结构都可能是独一无二的,因此传统的CNN、RNN方法就派不上什么用场了。

为了解决这一问题就提出了很多方法,如DeepWalk,node2vec等(按照上面的文章的介绍,这两个都并非GNN方法),GCN是解决的方案之一。

GCN,图卷积神经网络,与CNN类似,也相当于是一个特征提取器,只不过对象是图。

GCN数学基础

卷积

如何通俗易懂地解释卷积? - 知乎

一般定义函数fg的卷积f*g(n)如下:

连续形式:(f*g)(n) = \int_{-\infty }^{\infty}f(\tau )g(n-\tau)d\tau

离散形式:(f*g)(n)=\sum_{\tau=-\infty}^{\infty}f(\tau)g(n-\tau)

先对g函数进行翻转,在把g函数平移到n,在这个位置对两个函数的对应点相乘,然后相加(注意这里的卷积与CNN的卷积其实是不相同的,CNN中的卷积可以理解为加权求和)

​​​​​​​​​​​​​​

在CNN中。首先随机出实话卷积核的系数,根据误差函数反向传播梯度下降迭代优化->实现特征提取->引入GCN中,可优化的卷积参数

Laplacian矩阵

对于图G=(V,E),其laplacian矩阵的定义为L=D-A,L是laplacian矩阵,D是顶点的度矩阵(对角矩阵),矩阵对角线上的元素依次为各个顶点的度,A是图的邻接矩阵。

这种laplacian矩阵称为combinatorial laplacian。很多GCN论文中应用更多的是symmetric normalized laplacian,定义为

L^{sys} = D^{-\frac{1}{2}}LD^{-\frac{1}{2}}

为什么要使用拉普拉斯矩阵呢?

1. 拉普拉斯矩阵是对称矩阵,可以进行特征分解(谱分解),这与GCN的spectral domain对应。
2. 拉普拉斯矩阵只在中心顶点和一阶相连的顶点上(1-hop neighbor)有非0元素,其余之处均为0
3. 通过拉普拉斯算子与拉普拉斯矩阵进行类比

laplacian矩阵的谱分解(特征分解)

首先是概念:矩阵的谱分解、特征分解、对角化都是同一个概念。

- 线性代数相关知识回顾

特征值&特征向量

A是一个n阶矩阵,如果存在一个数\lambda及非零的n维列向量\alpha,使得

A\alpha = \lambda \alpha

成立,则称\lambda是矩阵A的一个特征值,称非零向量\alpha是矩阵A属于特征值\lambda的一个特征向量。

- 正定矩阵&半正定矩阵

A是n阶方阵,如果对任何非零向量x,都有x^TAx>0,其中x^T表示x的专职,就称A正定矩阵

A是实对称阵,如果对任意的实非零列向量x有x^TAx\geq 0,称A半正定矩阵

- 特征分解

并非所有矩阵都可以特征分解<=n阶方阵+存在n个线性无关的特征向量

A的所有特征值的全体叫做A的谱,记作\lambda (A)

注意:特征向量不能由特征值唯一确定,反之,不同特征值对应的特征向量不会相等,即一个特征向量只能属于一个特征值。

假设矩阵A有n个线性无关的特征向量\{X_1,X_2,\cdot \cdot \cdot ,X_n\},对应着的特征值\{\lambda _1, \lambda _2,\cdot \cdot \cdot ,\lambda _n \},我们将特征向量组成一个矩阵(矩阵中的每一列是一个特征向量:

V=[X_1,X_2,\cdot \cdot \cdot ,X_n]

类似的,我们也可以将特征值组成一个对角阵:

\Lambda = diag([\lambda _1, \lambda _2,\cdot \cdot \cdot ,\lambda _n])

因此A的特征分解(eigen decomposition)可以记作:

A=V\Lambda V^{-1}

实对称阵一定可以形似对角化

        相似对角化:一个矩阵与一个对角阵相似,一个n阶矩阵可相似对角化的充要条件是:有n个线性无关的特征向量

实对称阵的不同特征值的特征向量正交

实对称阵一定有n个线性无关的特征向量
半正定矩阵的特征值一定非负
实对称矩阵的特征向量总是可以化成两辆相互正交的正交矩阵

->拉普拉斯矩阵一定可以谱分解,且分解胡有特殊的形式

L = U\begin{pmatrix} \lambda _1 & & \\ & \cdot \cdot \cdot & \\ & & \lambda _n \end{pmatrix}U^{-1}

其中,U = (\vec{u_1}, \vec{u_2}, \cdot \cdot \cdot , \vec{u_n}),是列向量为单位特征向量的矩阵。

\begin{pmatrix} \lambda _1 & & \\ & \cdot \cdot \cdot & \\ & & \lambda _n \end{pmatrix}是n个特征值构成的对角阵。由于U是正交矩阵,UU^T=E,E是单位阵。因此还可以写作:

L = U\begin{pmatrix} \lambda _1 & & \\ & \cdot \cdot \cdot & \\ & & \lambda _n \end{pmatrix}U^{T}

傅立叶变换

傅立叶变换/卷积

傅里叶变换概念及公式推导-CSDN博客

傅里叶变换(Fourier Transform)——附详细推导傅里叶变换和傅里叶级数关系和区别 - 知乎

对于任意时域的信号f(t),其傅立叶变换(Fourier transform)到频域为:

F(\omega )=\int_{-\infty}^{\infty}f(t)e^{-i\omega t}dt

同样,对于已知频域信号F(\omega),其对应的傅立叶逆变换(inverse Fourier transform)到时域为:

f(t) = \frac{1}{2\pi }F(\omega)e^{i\omega t}d\omega

深入理解傅里叶变换

推广傅立叶变换

把传统的傅立叶变换以及卷积迁移到graph上的核心工作是把拉普拉斯算子的特征函数-e^{i\omega t}变为graph对应的拉普拉斯矩阵的特征向量。

在前面的补充内容中,对于特征方程的定义为:AV=\lambda V,其中A是一种变换,V是特征向量/特征函数,\lambda是特征值。那么相应的,对于特征函数e^{-i\omega t},有:

\Delta e^{-i\omega t}=\frac{\partial^2 }{\partial t^2}e^{-i\omega t}=-\omega ^2e^{-i\omega t}

e^{-i\omega t}代表的就是V,\Delta是变换A,-\omega ^2就是\lambda

离散拉普拉斯算子与LOG推导_离散的拉普拉斯算子-CSDN博客

相对应的:LV=\lambda V

这里L表示的局势拉普拉斯矩阵(其实就相当于一种变换)

为什么拉普拉斯矩阵的特征向量可以作为傅里叶变换的基 

GCN

图中的每个结点无时无刻不因为邻居和更远的点的影响而在改变着自己的状态直到最终的平衡,关系越亲近的邻居影响越大。

在图中,我们不仅有节点的特征(节点的数据),还有图的结构(节点之间是如何进行连接的)。将节点的特征与图的结构信息同事作为输入,让机器自己去决定到底使用哪些信息。GCN是一种能够直接作用于图,并且利用其结构信息的卷积神经网络。

假设我们现在有一批图数据,其中与N个节点(node),每个节点都有自己的特征,let这些节点的特征组成一个NxD维的矩阵X,各个节点之间的关系形成一个NxN的矩阵A(邻接矩阵),X和A是我们模型的输入。

GCN层与层之间的传播方式是:

H^{(l+1)}=\alpha (\tilde{D}^{-\frac{1}{2}} \tilde{A} \tilde{D}^{-\frac{1}{2}} H^{(l)} W^{(l)} )

其中\tilde{A} = A+II是单位矩阵

\tilde{D}\tilde{A}的度矩阵(degree matrix),\tilde{D}_{ii}=\sum j \tilde{A}_{ij}

H是每一层的特征,对于输入层,H就是X(节点特征,NxD维矩阵)

\sigma是非线性激活函数

回顾:

- 邻接矩阵

表示顶点之间相邻关系的矩阵(是n阶方阵)。

它是利用矩阵的二维结构,使其中的一维代表其中一个端点,另一维代表另一个端点。

(在有向图中,是一维表示起点,一维表示终点)

- 度矩阵:度矩阵是对角阵,对角上的元素为各个顶点的度。顶点vi的度表示和该顶点相关联的边的数量。无向图中顶点vi的度d(vi)=N(i)。

度矩阵&邻接矩阵:

​​​​​​​

- 拉普拉斯矩阵

标准拉普拉斯矩阵(是对称阵)的形式为:

L_{ij}=\begin{cases} D_{ij} & \text{ if } i=j \\ -1 & \text{ if } i,j \ in \ edge set \\ 0 & \text{ otherwise} \end{cases}

->对角线上的取值为节点的度,若节点i和节点j相邻,取值为-1

归一化拉普拉斯矩阵L_{sum}

L_{ij}=\begin{cases} 1 & \text{ if } i=j \\ \frac{-1}{\sqrt{D_{ii}} \sqrt{D_{j/j}} } & \text{ if } i,j \ in \ edge set \\ 0 & \text{ otherwise} \end{cases}

常见的形式:L_{sym} = D^{-\frac{1}{2}} L D^{-\frac{1}{2}} = I - D^{-\frac{1}{2}} A D^{-\frac{1}{2}}

这里A表示邻接矩阵,若在邻接矩阵中加入环,即a_{ii} = 1,矩阵形式可以表示为\hat{A} = A+I

->怎么通过邻接矩阵&度矩阵得到拉普拉斯矩阵

图的一些基本知识:图,邻居,度矩阵,邻接矩阵-CSDN博客

数据结构图的邻接矩阵、关联矩阵、度矩阵还有权重矩阵的区别和联系是什么呀? - 知乎

https://www.cnblogs.com/BlairGrowing/p/15658878.html

GNN入门之路: 01.图拉普拉斯矩阵的定义、推导、性质、应用 - 知乎

GCN层与层之间的传播方式是:

H^{(l+1)}=\alpha (\tilde{D}^{-\frac{1}{2}} \tilde{A} \tilde{D}^{-\frac{1}{2}} H^{(l)} W^{(l)} )​​​​​​​

\tilde{D}^{-\frac{1}{2}} \tilde{A} \tilde{D}^{-\frac{1}{2}}这一部分当然就可以提前算出来了

假设我们构造一个两层的GCN,激活函数分别采用ReLU和Softmax,那么整体的正向传播公式为:

Z = f(X,A)=softmax(\hat{A} ReLU( \hat{A} X W^{(0)} ) W^{(1)})

这里\hat{A}表示邻接矩阵(size= NxN,有N个节点),X是特征向量矩阵(size=NxC),W^{(0)}, W^{(1)}分别代表可以训练的参数(size=CxH, HxF)->NxF

针对所有带标签的节点计算cross entropy损失函数:

L = \sum_{l\in y _{_L}}^{}\sum_{f=1}^{F} Y_{lf} ln Z_{lf}

这样就可以训练一个node classification 模型了由于即使只有很少的标签也可以训练,作者称该方法为半监督分类。

Graph Convolutional Networks | Thomas Kipf | Google DeepMind

看起来像每个节点的向量的长度为3,对于向量中的每个值都分别看其连接情况。但是如果仅仅这样的话,理论上我们A节点的值应该也挂在A节点的信息里,但是显然,这里由于没有自环,所以A节点反而只有E节点的信息(哦~所以才要加上单位阵构造一个自环出来) 

注意:

网络的层数代表着结点特征所能到达的最远距离。比如一层的GCN,每个结点只能得到其一阶邻居身上的信息。对于所有结点来说,信息获取的过程是独立同时开展的。当我们在一层GCN上再堆一层时,就可以重复收集邻居信息的过程,并且收集到的邻居信息中已经包含了这些邻居结点在上一个阶段所收集的他们的邻居结点的信息。这就使得GCN的网络层数也就是每个结点的信息所能达到的maximum number of hops。因此,我们所设定的层的数目取决于我们想要使得结点的信息在网络中传递多远的距离。需要注意的是,通常我们不会需要结点的信息传播太远。经过6~7个hops,基本上就可以使结点的信息传播到整个网络,这也使得聚合不那么有意义。

Reference

何时能懂你的心——图卷积神经网络(GCN) - 知乎

如何理解 Graph Convolutional Network(GCN)? - 知乎

图神经网络(GNN)模型原理及应用综述-CSDN博客

图卷积网络(GCN)入门详解 - 知乎

图卷积网络(Graph Convolutional Networks, GCN)详细介绍-CSDN博客

Graph Convolutional Networks (GCN)

【Graph Neural Network】GCN: 算法原理,实现和应用 - 知乎

OpenVaccine: COVID-19 mRNA Vaccine Degradation Prediction

描述

研究人员观察到RNA分子有自发降解的倾向。这是一个严重的限制——一次切割就可以使mRNA疫苗失效。目前,对于特定RNA的主干中最容易受到影响的位置的细节知之甚少。如果不了解这一点,目前针对COVID-19的mRNA疫苗必须在高度冷藏的条件下制备和运输,除非能够稳定,否则不太可能到达地球上一小部分人的手中。

传统疫苗(比如季节性流感疫苗)包装在一次性注射器中,冷藏后运往世界各地,但mRNA疫苗目前还不可能做到这一点。->如何设计超级稳定的信使RNA分子(mRNA)。

利用Kaggle社区的数据科学专业知识来开发RNA降解的模型和设计规则。设计模型预测RNA分子每个碱基的可能降解率,在Eterna数据集的子集上进行训练,该数据集包含3000多个RNA分子(跨越一系列序列和结构)以及它们在每个位置的降解率。

评估

采用MCRMSE

MCRMSE=\frac{1}{N_t} \sum_{j=1}^{N_t} \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_{ij} - \hat{y_{ij}})^2 }

其中N_t表示评分的ground truth的数量,y\hat{y}分别为真实值和预测值

数据集介绍

数据集:

  • train.json - the training data
  • test.json - the test set, without any columns associated with the ground truth.

数据介绍:

  • id - 每个sample对应的随机标识符
  • seq_scored - (68 in Train and Public Test, 91 in Private Test)int,表示使用预测值进行评分时所使用的位置数。这应该与reactivity、deg_*和*_error_*列的长度相匹配。用于Private Test的分子将比Train和Public Test数据中的分子长,因此此向量的大小将不同。 
  • seq_length - (107 in Train and Public Test, 130 in Private Test) int,表示序列的长度。用于Private Test的分子将比Train和Public Test数据中的分子长,因此此向量的大小将不同。
  • sequence - (1x107 string in Train and Public Test, 130 in Private Test)描述RNA序列,每个样品的a、G、U和C的组合。应该有107个字符长,前68个碱基应该对应于seq_score中指定的68个位置(注意:从0开始索引)。
  • structure - (1x107 string in Train and Public Test, 130 in Private Test) 由“(”,“)”和“.”组成的数组,描述估计碱基是成对还是未成对的字符。成对的碱基由左括号和右括号表示,例如(....)表示碱基0与碱基5配对,而碱基1-4未配对。(从索引0开始)
  • reactivity - (1x68 vector in Train and Public Test, 1x91 in Private Test) 浮点数数组的长度应该与seq_scores相同。这些数字是按顺序表示的前68个碱基的反应性值,用于确定RNA样品的可能二级结构。
  • deg_pH10 - (1x68 vector in Train and Public Test, 1x91 in Private Test) 浮点数数组,数组的长度应该与seq_scores相同。这些数字是按顺序表示的前68个碱基的反应性值,用于确定在高pH (pH 10)下无镁孵育后碱基/键降解的可能性。
  • deg_Mg_pH10 - (1x68 vector in Train and Public Test, 1x91 in Private Test)浮点数数组,数组的长度应该与seq_scores相同。这些数字是按顺序表示的前68个碱基的反应性值,用于确定碱基/键在高pH (pH 10)下与镁孵育后降解的可能性。
  • deg_50C - (1x68 vector in Train and Public Test, 1x91 in Private Test) 浮点数数组,数组的长度应该与seq_scores相同。这些数字是按顺序表示的前68个碱基的反应性值,用于确定在高温(50摄氏度)下无镁孵育后碱基/键降解的可能性。
  • deg_Mg_50C - (1x68 vector in Train and Public Test, 1x91 in Private Test) 浮点数数组,数组的长度应该与seq_scores相同。这些数字是按顺序表示的前68个碱基的反应性值,用于确定在高温(50摄氏度)下与镁孵育后碱基/键降解的可能性。
  • *_error_* - 浮点数数组,数组应具有与相应的reactivity或deg_*列相同的长度,在reactivity列和deg_*列中得到的实验值的计算误差。
  • predicted_loop_type - (1x107 string) 描述序列中每个字符的结构上下文(也称为“循环类型”)。由Vienna RNAfold 2 structure的bpRNA分配的环路类型。由bpRNA_documentation: S: paired "Stem" M: Multiloop I: Internal loop B: Bulge H: Hairpin loop E: dangling End X: eXternal loop
    • S/N filter Indicates if the sample passed filters described below in Additional Notes.

数据展示

[COVID-19 mRNA] 4th place solution | Kaggle

train = pd.read_json("../input/stanford-covid-vaccine/train.json",lines=True)
test  = pd.read_json("../input/stanford-covid-vaccine/test.json",lines=True)
sub = pd.read_csv("../input/stanford-covid-vaccine/sample_submission.csv")

test_pub = test[test["seq_length"] == 107]
test_pri = test[test["seq_length"] == 130]

train.head(5)
indexidsequencestructurepredicted_loop_typesignal_to_noiseSN_filterseq_lengthseq_scoredreactivity_errordeg_error_Mg_pH10deg_error_pH10deg_error_Mg_50Cdeg_error_50Creactivitydeg_Mg_pH10deg_pH10deg_Mg_50Cdeg_50C
0id_001f94081GGAAAAGCUCUAAUAACAGGAGACUAGGACUACGUAUUUCUAGGUA........((((((.......)))).)).((.....((..((((((......EEEEESSSSSSHHHHHHHSSSSBSSXSSIIIIISSIISSSSSSHHH...6.894110768[0.1359, 0.20700000000000002, 0.1633, 0.1452, ...[0.26130000000000003, 0.38420000000000004, 0.1...[0.2631, 0.28600000000000003, 0.0964, 0.1574, ...[0.1501, 0.275, 0.0947, 0.18660000000000002, 0...[0.2167, 0.34750000000000003, 0.188, 0.2124, 0...[0.3297, 1.5693000000000001, 1.1227, 0.8686, 0...[0.7556, 2.983, 0.2526, 1.3789, 0.637600000000...[2.3375, 3.5060000000000002, 0.3008, 1.0108, 0...[0.35810000000000003, 2.9683, 0.2589, 1.4552, ...[0.6382, 3.4773, 0.9988, 1.3228, 0.78770000000...
1id_0049f53baGGAAAAAGCGCGCGCGGUUAGCGCGCGCUUUUGCGCGCGCUGUACC........(((((((((((((((((((((((....)))))))))).)))...EEEEESSSSSSSSSSSSSSSSSSSSSSSHHHHSSSSSSSSSSBSSS...0.193010768[2.8272, 2.8272, 2.8272, 4.7343, 2.5676, 2.567...[73705.3985, 73705.3985, 73705.3985, 73705.398...[10.1986, 9.2418, 5.0933, 5.0933, 5.0933, 5.09...[16.6174, 13.868, 8.1968, 8.1968, 8.1968, 8.19...[15.4857, 7.9596, 13.3957, 5.8777, 5.8777, 5.8...[0.0, 0.0, 0.0, 2.2965, 0.0, 0.0, 0.0, 0.0, 0....[0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, ...[4.947, 4.4523, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, ...[4.8511, 4.0426, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0,...[7.6692, 0.0, 10.9561, 0.0, 0.0, 0.0, 0.0, 0.0...
2id_006f36f57GGAAAGUGCUCAGAUAAGCUAAGCUCGAAUAGCAAUCGAAUAGAAU........((((.((.....((((.(((.....)))..((((......)...EEEEESSSSISSIIIIISSSSMSSSHHHHHSSSMMSSSSHHHHHHS...8.800110768[0.0931, 0.13290000000000002, 0.11280000000000...[0.1365, 0.2237, 0.1812, 0.1333, 0.1148, 0.160...[0.17020000000000002, 0.178, 0.111, 0.091, 0.0...[0.1033, 0.1464, 0.1126, 0.09620000000000001, ...[0.14980000000000002, 0.1761, 0.1517, 0.116700...[0.44820000000000004, 1.4822, 1.1819, 0.743400...[0.2504, 1.4021, 0.9804, 0.49670000000000003, ...[2.243, 2.9361, 1.0553, 0.721, 0.6396000000000...[0.5163, 1.6823000000000001, 1.0426, 0.7902, 0...[0.9501000000000001, 1.7974999999999999, 1.499...
3id_0082d463bGGAAAAGCGCGCGCGCGCGCGCGAAAAAGCGCGCGCGCGCGCGCGC.........((((((((((((((((......))))))))))))))))((...EEEEEESSSSSSSSSSSSSSSSHHHHHHSSSSSSSSSSSSSSSSSS...0.104010768[3.5229, 6.0748, 3.0374, 3.0374, 3.0374, 3.037...[73705.3985, 73705.3985, 73705.3985, 73705.398...[11.8007, 12.7566, 5.7733, 5.7733, 5.7733, 5.7...[121286.7181, 121286.7182, 121286.7181, 121286...[15.3995, 8.1124, 7.7824, 7.7824, 7.7824, 7.78...[0.0, 2.2399, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0....[0.0, -0.5083, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0...[3.4248, 6.8128, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0,...[0.0, -0.8365, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0...[7.6692, -1.3223, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0...
4id_0087940f4GGAAAAUAUAUAAUAUAUUAUAUAAAUAUAUUAUAGAAGUAUAAUA........(((((((.((((((((((((.(((((((((....)))))))...EEEEESSSSSSSBSSSSSSSSSSSSBSSSSSSSSSHHHHSSSSSSS...0.423010768[1.665, 2.1728, 2.0041, 1.2405, 0.620200000000...[4.2139, 3.9637000000000002, 3.2467, 2.4716, 1...[3.0942, 3.015, 2.1212, 2.0552, 0.881500000000...[2.6717, 2.4818, 1.9919, 2.5484999999999998, 1...[1.3285, 3.6173, 1.3057, 1.3021, 1.1507, 1.150...[0.8267, 2.6577, 2.8481, 0.40090000000000003, ...[2.1058, 3.138, 2.5437000000000003, 1.0932, 0....[4.7366, 4.6243, 1.2068, 1.1538, 0.0, 0.0, 0.7...[2.2052, 1.7947000000000002, 0.7457, 3.1233, 0...[0.0, 5.1198, -0.3551, -0.3518, 0.0, 0.0, 0.0,...

OpenVaccine - GCN | Kaggle

!conda install -y -c bioconda forgi
!conda install -y -c bioconda viennarna

import forgi.graph.bulge_graph as fgb
import forgi.visual.mplotlib as fvm
import forgi.threedee.utilities.vector as ftuv
import forgi

import RNA

import matplotlib.pyplot as plt

idx = 0
id_= train.iloc[idx].id
sequence = train.iloc[idx].sequence
structure = train.iloc[idx].structure
loops= train.iloc[idx].predicted_loop_type
reactivity = train.iloc[idx].reactivity
bg = fgb.BulgeGraph.from_fasta_text(f'>rna1\n{structure}\n{sequence}')[0]
fig = plt.figure(figsize=(6, 6))

fvm.plot_rna(bg, lighten=0.5, text_kwargs={"fontweight":None})
plt.show()

怎么构建邻接矩阵

参考​​​​​​​OpenVaccine: GCN (GraphSAGE)+GRU+KFold | Kaggle

这个notebook中是从数据中抽取5列

pred_cols = ['reactivity', 'deg_Mg_pH10', 'deg_pH10', 'deg_Mg_50C', 'deg_50C']
# 字符用数字替代
# 字典,字符:对应的位置
token2int = {x:i for i, x in enumerate('().ACGUBEHIMSX')}

def get_couples(structure):
    """
    For each closing parenthesis, I find the matching opening one and store their index in the couples list.
    The assigned list is used to keep track of the assigned opening parenthesis
    """
    # 记录括号的位置,检查是否匹配上
    opened = [idx for idx, i in enumerate(structure) if i == '(']
    closed = [idx for idx, i in enumerate(structure) if i == ')']

    assert len(opened) == len(closed)
    assigned = []
    couples = []
    
    # 对于每个右括号,匹配其对应的左括号(左括号的位置在右括号前面?)
    for close_idx in closed:
        for open_idx in opened:
            # 如果左括号出现在右括号前面
            if open_idx < close_idx:
                # 如果左括号没有出现过(没有完成匹配),那么这个左括号就是待匹配的
                if open_idx not in assigned:
                    candidate = open_idx
            # 如果右括号提前出线(那就不对了)
            else:
                break
        # 安排匹配
        assigned.append(candidate)
        # 匹配上了,按照左右括号的index存储
        couples.append([candidate, close_idx])
        
    assert len(couples) == len(opened)
    
    # 返回左右括号的位置(匹配上的)
    return couples

def build_matrix(couples, size):
    # 构建矩阵,按照制定size,构建size x size方阵
    mat = np.zeros((size, size))
    
    # 连接相邻节点
    for i in range(size):  # neigbouring bases are linked as well
        if i < size - 1:
            mat[i, i + 1] = 1
        if i > 0:
            mat[i, i - 1] = 1
    # 如果匹配上了(左右括号),置1(是无向图呢)
    for i, j in couples:
        mat[i, j] = 1
        mat[j, i] = 1
        
    return mat

def convert_to_adj(structure):
    # 首先得到匹配的序号(方便后面把边连上)
    couples = get_couples(structure)
    # 得到邻接矩阵
    mat = build_matrix(couples, len(structure))
    return mat

def preprocess_inputs(df, cols=['sequence', 'structure', 'predicted_loop_type']):
    # 根据选择的列构建输入,将对应字符embedding
    # 对于一个正常的三维数据,正常的索引值为(0,1,2),相当于(x,y,z)
    # 这里(0,2,1)就是交换了索引y和z的位置
    # 比如现在有一个数字,本来索引所在的位置是[1,2,3],那么调整后就变成了[1,3,2]
    # 不过这里实际上应该是反常识的,对应的第一个位置是z,一个数的下标是[z,y,x]
    inputs = np.transpose(
        np.array(
            df[cols]
            .applymap(lambda seq: [token2int[x] for x in seq])
            .values
            .tolist()
        ),
        (0, 2, 1)
    )
    
    # 根据structure列信息构建邻接矩阵
    adj_matrix = np.array(df['structure'].apply(convert_to_adj).values.tolist())
    
    return inputs, adj_matrix

解释一下这里的inputs,首先进行一个简化,现在我们只有三条数据:

将token换成index(int):

变成list:

[[[5, 5, 3, 3, 3, 3, 5, 4, 6, 4], [2, 2, 2, 2, 2, 0, 0, 1, 1, 2], [8, 8, 8, 8, 7, 7, 7, 7, 8, 8]], [[5, 5, 3, 3, 3, 3, 3, 5, 4, 5], [0, 0, 0, 0, 1, 1, 1, 1, 2, 2], [8, 8, 8, 9, 9, 9, 7, 9, 8, 8]], [[5, 5, 3, 3, 3, 5, 6, 5, 4, 6], [2, 2, 2, 2, 0, 1, 2, 2, 2, 2], [7, 7, 7, 7, 9, 9, 9, 9, 12, 12]]]

交换xy维度

可以看到,最开始每条数据都是dataframe的一行,将对应的token embedding,这时候字符串变成了由数字构成的list,将同一条记录的数据放在一起,转置,此时三个column对应位置token embedding一一对应,此时一整列的数据实际上也是一条数据中一列的数据。

构建网络

class GCN(nn.Module):
    '''
    Implementation of one layer of GraphSAGE
    '''
    def __init__(self, input_dim, output_dim, aggregator='mean'):
        super(GCN, self).__init__()
        self.aggregator = aggregator
        
        if aggregator == 'mean':
            linear_input_dim = input_dim * 2
        elif aggregator == 'conv':
            linear_input_dim = input_dim
        elif aggregator == 'pooling':
            linear_input_dim = input_dim * 2
            self.linear_pooling = nn.Linear(input_dim, input_dim)
        elif aggregator == 'lstm':
            self.lstm_hidden = 128
            linear_input_dim = input_dim + self.lstm_hidden
            # torch.nn.LSTM(input_size, hidden_size, num_layers=1)
            # input_size表示输入维度
            # hidden_size表示隐层状态 h 的维度,也是LSTM的输出维度
            # num_layers表示LSTM的堆叠层数。如果有多层LSTM堆叠,前一层最后一个时间步的隐层状态作为后一层的输入。
            self.lstm_agg = nn.LSTM(input_dim, self.lstm_hidden, num_layers=1, batch_first=True)
        
        self.linear_gcn = nn.Linear(in_features=linear_input_dim, out_features=output_dim)
        
    def forward(self, input_, adj_matrix):
        # 如果采用conv
        if self.aggregator == 'conv':
            # set elements in diagonal of adj matrix to 1 with conv aggregator
            # idx: 索引,起始值0,结束值adj_matrix最后一个维度的长度,out指定输出张量
            idx = torch.arange(0, adj_matrix.shape[-1], out=torch.LongTensor())
            # 在前面的代码中,我们知道idx,idx这个位置是xy
            # 这里就是给对角线赋值为1,相当于加上一个自环(一个节点肯定与自己相连)
            adj_matrix[:, idx, idx] = 1
            
        # pytorch中默认float32,numpy默认float6
        adj_matrix = adj_matrix.type(torch.float32)
        # 在第三个维度上求和,可以参考下面的例子,看一下怎么求和
        # 因此得到的结果代表对应的某张图中的某个节点与其他节点连接的个数
        sum_adj = torch.sum(adj_matrix, axis=2)
        # 如果没有与别的节点相连->赋值为1
        sum_adj[sum_adj==0] = 1
        
        # 如果是mean或者conv
        if self.aggregator == 'mean' or self.aggregator == 'conv':
            # 计算两个tensor的矩阵乘法,torch.bmm(a,b),tensor a 的size为(b,h,w),
            # tensor b的size为(b,w,m) 也就是说两个tensor的第一维是相等的,
            # 然后第一个数组的第三维和第二个数组的第二维度要求一样,
            # 对于剩下的则不做要求,输出维度 (b,h,m)
            # https://blog.csdn.net/qq_40178291/article/details/100302375
            # b,h,w,m,这里的b就是sample的个数,h&w是节点的个数,m是feature的长度
            feature_agg = torch.bmm(adj_matrix, input_)
            # 作用:扩展维度,参数表示在哪个地方加一个维度
            feature_agg = feature_agg / sum_adj.unsqueeze(dim=2)
            
        # 如果pooling
        elif self.aggregator == 'pooling':
            # 起始就是一个linear层,且输入神经元个数=输出神经元个数
            feature_pooling = self.linear_pooling(input_)
            # + sigmoid
            feature_agg = torch.sigmoid(feature_pooling)
            feature_agg = torch.bmm(adj_matrix, feature_agg)
            feature_agg = feature_agg / sum_adj.unsqueeze(dim=2)
        
        # 如果lstm
        elif self.aggregator == 'lstm':
            feature_agg = torch.zeros(input_.shape[0], input_.shape[1], self.lstm_hidden).cuda()
            for i in range(adj_matrix.shape[1]):
                neighbors = adj_matrix[:, i, :].unsqueeze(2) * input_
                _, hn = self.lstm_agg(neighbors)
                feature_agg[:, i, :] = torch.squeeze(hn[0], 0)
                
        if self.aggregator != 'conv':
            # 一般torch.cat()是为了把多个tensor进行拼接而存在的
            # torch.cat(tensors, dim=0, *, out=None) 
            feature_cat = torch.cat((input_, feature_agg), axis=2)
        else:
            feature_cat = feature_agg
                
        feature = torch.sigmoid(self.linear_gcn(feature_cat))
        feature = feature / torch.norm(feature, p=2, dim=2).unsqueeze(dim=2)
        
        return feature
        
    
class Net(nn.Module):
    # 开始搭积木
    # 这里的部分值是根据数据决定的
    def __init__(self, num_embedding=14, seq_len=107, pred_len=68, dropout=0.5, 
                 embed_dim=100, hidden_dim=128, K=1, aggregator='mean'):
        '''
        K: number of GCN layers
        aggregator: type of aggregator function
        '''
        super(Net, self).__init__()
        
        self.pred_len = pred_len
        self.embedding_layer = nn.Embedding(num_embeddings=num_embedding, 
                                      embedding_dim=embed_dim)
        
        self.gcn = nn.ModuleList([GCN(3 * embed_dim, 3 * embed_dim, aggregator=aggregator) for i in range(K)])
        
        # https://blog.csdn.net/zdx1996/article/details/123532554
        # 门控循环单元
        # bidirectional – If True, becomes a bidirectional GRU. Default: False
        # num_layers -循环层数。
        # batch_first -如果为True,则输入和输出张量提供为(batch, seq, feature)而不是(seq, batch, feature)。
        # GRU相对RNN多了许多权重矩阵,因此需要修改初始化模型参数的函数
        # https://zhuanlan.zhihu.com/p/473208127
        self.gru_layer = nn.GRU(input_size=3 * embed_dim, 
                          hidden_size=hidden_dim, 
                          num_layers=3, 
                          batch_first=True, 
                          dropout=dropout, 
                          bidirectional=True)
        
        self.linear_layer = nn.Linear(in_features=2 * hidden_dim, 
                                out_features=5)
        
    def forward(self, input_, adj_matrix):
        #embedding
        embedding = self.embedding_layer(input_)
        embedding = torch.reshape(embedding, (-1, embedding.shape[1], embedding.shape[2] * embedding.shape[3]))
        
        #gcn
        gcn_feature = embedding
        for gcn_layer in self.gcn:
            gcn_feature = gcn_layer(gcn_feature, adj_matrix)
        
        #gru
        gru_output, gru_hidden = self.gru_layer(gcn_feature)
        truncated = gru_output[:, :self.pred_len]
        
        output = self.linear_layer(truncated)
        
        return output
y = torch.tensor([
     [
       [1, 2, 3],
       [4, 5, 6]
     ],
     [
       [1, 2, 3],
       [4, 5, 6]
     ],
     [
       [1, 2, 3],
       [4, 5, 6]
     ]
   ])

>> torch.sum(y, dim=0)
tensor([[ 3,  6,  9],
        [12, 15, 18]])

>> torch.sum(y, dim=1)
tensor([[5, 7, 9],
        [5, 7, 9],
        [5, 7, 9]])
横向拍瘪

>> torch.sum(y, dim=2)
tensor([[ 6, 15],
        [ 6, 15],
        [ 6, 15]])
纵向拍瘪

稍微解释一下,这里之所以用GRU是因为这个notebook的方法就是:

GCN (GraphSAGE)+GRU+KFold

这里,输出是一个(L, D*H_{out}),这里L表示序列长度, D(双向?如果bidirectional=true,值为2,否则为1,在这里为2),H_{out}是hidden size

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/595059.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

考虑极端天气线路脆弱性的配电网分布式电源和储能优化配置模型

1 主要内容 程序主要参考《考虑极端天气线路脆弱性的配电网分布式电源配置优化模型-马宇帆》&#xff0c;针对极端天气严重威胁配电网安全稳定运行的问题。基于微气象、微地形对配电网的线路脆弱性进行分析&#xff0c;然后进行分布式电源接入位置与极端天气的关联性分析&…

优优嗨聚集团:法律明灯,个债处理中的法律咨询力量

在现代社会&#xff0c;个人债务问题日益突出&#xff0c;无论是因生活消费、投资失利还是其他原因&#xff0c;债务问题都可能成为个人财务的一大负担。面对复杂的债务困境&#xff0c;许多人感到迷茫和无助。此时&#xff0c;法律咨询如同一盏明灯&#xff0c;能够为个人债务…

Docker 安装部署 postgres

Docker 安装部署 postgres 1、拉取 postgres 镜像文件 [rootiZbp19a67kznq0h0rgosuxZ ~]# docker pull postgres:latest latest: Pulling from library/postgres b0a0cf830b12: Pull complete dda3d8fbd5ed: Pull complete 283a477db7bb: Pull complete 91d2729fa4d5: Pul…

自动化测试 selenium基础

前言 我们都知道测试开发工程师的任务是根据用户需求测试用例的同时,害的开发自动化工具来减轻测试压力且提高测试的效率以及质量,这一节我们就来简单谈谈开发简单的自动化工具基础 什么是自动化测试呢?就是将我们需要做的测试交给机器去做,也就是使用代码来模拟人对于机器的行…

openKylin 2.0 Alpha2 X86 安装教程

原文链接&#xff1a;openKylin 2.0 Alpha2 X86 安装教程 Hello&#xff0c;大家好啊&#xff01;今天我们将讨论如何在VMware Workstation上安装openKylin 2.0 Alpha2 X86版。openKylin是一个基于Linux的操作系统&#xff0c;旨在提供高性能、可靠性强的系统体验。在虚拟化软件…

docker Harbor私有仓库部署管理

搭建本地私有仓库&#xff0c;但是本地私有仓库的管理和使用比较麻烦&#xff0c;这个原生的私有仓库并不好用&#xff0c;所以我们采用harbor私有仓库&#xff0c;也叫私服&#xff0c;更加人性化。 一、什么是Harbor Harbor是VWware 公司开源的企业级Docker Registry项…

【前端热门框架【vue框架】】——事件处理与表单输入绑定以及学习技巧,让学习如此简单

&#x1f468;‍&#x1f4bb;个人主页&#xff1a;程序员-曼亿点 &#x1f468;‍&#x1f4bb; hallo 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍&#x1f4bb; 本文由 曼亿点 原创 &#x1f468;‍&#x1f4bb; 收录于专栏&#xff1a…

Linux IP Forwarding路由转发实验

linux 路由转发功能 Linux 操作系统具备路由转发功能&#xff0c;路由功能是指 Linux 操作系统提供的路由管理和转发功能&#xff0c;它允许 Linux 主机在网络中正确地转发数据包&#xff0c;并确保数据包能够达到其目的地。 出于安全考虑&#xff0c;Linux系统默认是禁止数据…

主生产计划有多重要,看完这篇就懂了

导 读 我们是否也经常遇到&#xff1a; 有时工厂加班加点也不能完成任务&#xff0c; 有时设备闲置&#xff0c;很多工人没有活干&#xff0c; 我们是不是还没运行主生产计划管理&#xff1f; 什么是主生产计划 在制造业中&#xff0c;主生产计划(MPS&#xff09;是根据销售…

泛型通配符

泛型&通配符 文章目录 泛型&通配符一、泛型介绍&理解1.1 泛型概述&使用(集合/比较器)1.2 自定义范型结构(类/接口/方法) 二、通配符&读写特点三、企业真题 一、泛型介绍&理解 1.1 泛型概述&使用(集合/比较器) 泛型&#xff1a;类似于场景中的标签…

Android getevent命令详细分析

在调试Android 的输入事件时&#xff0c;经常使用 “getevent -lrt” 命令&#xff0c;来确认驱动上报数据是否正常。从源码的角度来详细的分析一下getevent 这个程序。 首先用ls命令来看一下getevent lrwxr-xr-x 1 root shell 7 2023-11-20 10:08 system/bin/getevent -> …

学习java中的interface接口

1.了解接口 java提供了一个关键字interface&#xff0c;用这个关键字我们可以定义出一个特殊的结构&#xff1a;接口 格式&#xff1a; public interface 接口名{ //成员变量&#xff08;常量&#xff09; //成员方法&#xff08;抽象方法&#xff09; } 注意&#xff1a;接…

cmake进阶:宏定义

一. 简介 前面学习了 CMakeLists.txt语法中是如何定义函数&#xff0c;本文继续学习 cmake中的宏定义。 二. cmake进阶&#xff1a;宏定义 cmake 提供了定义宏的方法&#xff0c;cmake 中函数 function 和宏定义 macro 在某种程度上来说是一样的&#xff0c;都是创建一段有…

Linux 内核简介

操作系统简介 操作系统概念&#xff1a;操作系统处于硬件和应用程序的中间层&#xff0c;控制和管理整个计算机系统的硬件和软件资源&#xff0c;提供给用户和其他软件方便的接口和环境&#xff0c;它是计算机系统的最基本的系统软件。 操作系统功能: 处理机管理存储器管理设…

硬件四舍五入模式

文章目录 舍入模式1. 就近舍入2.向0舍入3.远离0舍入4. 向正无穷舍入5. 向负无穷舍入6.向负无穷舍入7. ROUND TO MATH参考资料 舍入模式 为了减小舍入操作对推理结果的精度影响&#xff0c;AI芯片有时会支持多种舍入模型(round mode)供编程人员选择&#xff0c;常见模式如下表&…

websevere服务器从零搭建到上线(二)|Linux上的五种IO模型

文章目录 阻塞 blocking非阻塞 non-blockingIO复用 IO multiplexing信号驱动 signal-driven异步 asynchronous拓展知识 看过上篇文章英国基本能理解本文五张图的内容websevere服务器从零搭建到上线&#xff08;一&#xff09;&#xff5c;阻塞、非阻塞、同步、异步 本文要能够在…

IP地址类型

这些IP地址中有IPv4和IPv6地址,以及一些是链路本地地址(通常用于本地网络中的通信),而另一些则是可以被路由的公共或私有IP地址。 这里是您提供的IP地址的一些简要说明: IPv6 链路本地地址:以fe80:开头的地址是IPv6链路本地地址。这些地址仅用于同一链路(如以太网段或无…

Verilog中求两个数的差值

根据输入信号a,b的大小关系&#xff0c;求解两个数的差值&#xff1a;输入信号a,b为8bit位宽的无符号数。如果a>b&#xff0c;则输出a-b&#xff0c;如果a≤b&#xff0c;则输出b-a。 接口信号图如下&#xff1a; 代码如下&#xff1a; &#xff08;CSDN代码块不支持Veril…

SpringBoot 使用 @RequiredArgsConstructor(onConstructor_ = @Autowired) 报错解决

若使用 RequiredArgsConstructor(onConstructor_ Autowired) 启动报错&#xff0c;或者爆红可以使用以下方法解决 1. 安装或启用 Lombok插件 2. 检查 Lombok 版本 3. 若 onConstructor_ 爆红&#xff0c; 可能是IDEA中文软件包冲突 4. 若以上还是不行&#xff0c;可以添加…

数据结构-二叉树-二叉搜索树

一、概念 二叉搜索树又称二叉排序树&#xff0c;它或者是一棵空树&#xff0c;或者具有以下性质的二叉树&#xff1a; 若它的左子树不为空&#xff0c;则左树上所有节点的值都小于根节点的值。 若它的右子树不为空&#xff0c;则右子树上所有节点的值都大于根节点的值。 它…
最新文章