范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

GNN入门必看!GoogleResearch教你从毛坯开始搭建sota图神经网络

  来源:distill
  编辑:LRS  【新智元导读】图神经网络近几年的发展十分火热,主要原因还是图能够表示连通关系,例如知识图谱等更贴切现实应用!Google Research最近发了一篇博客,从零开始教学GNN的发展路程,不熟悉的同学可以查缺补漏啦!
  近几年,神经网络在自然语言、图像、语音等数据上都取得了显著的突破,将模型性能带到了一个前所未有的高度,但如何在图数据上训练仍然是一个可研究的点。
  传统神经网络输入的数据通常每个sample之间都不存在关系,而图数据更加复杂,每个节点之间存在联系,也更符合真实世界中的数据存储方式。真实世界的物体通常根据它们与其他事物的联系来定义的,一组对象以及它们之间的联系可以很自然地表示为一个图(graph),基于图数据的神经网络也称为Graph Neural Network(GNN)。
  图神经网络的发展逐渐受到更多关注,在推理、常识等方面也取得很多成就,来自Google的研究员们最近发表了一篇博客,介绍了图神经网络的发展历程,还对现代图神经网络进行了探讨和解释。
  一个图由顶点和边组成,在人的脑海中,可以很自然地把社交网络等数据表示为图,那如何把图像和文本表示为图你想过吗?
  通常认为图像是带有通道(channels)的矩形网格,将它们表示为例如244x244x3的三维矩阵。
  另一种看待图像的方式是有规则结构的图像,其中每个像素代表一个节点,并通过边缘连接到相邻的像素。每个非边界像素恰好有8个相邻节点,并且存储在每个节点上的信息是表示像素 RGB 值的三维向量。
  可视化图的连通性的一种方法是邻接矩阵。对这些节点进行排序,在一个5x5的图像中有25个像素,构造一个矩阵,如果两个节点之间存在一条边那么在邻接矩阵中就存在一个入口。
  对于文本来说,可以将索引与每个字符、单词或标记相关联,并将文表示为一个有向图,其中每个字符或索引都是一个节点,并通过一条边连接到后面的节点。
  但文本和图像在实际使用上通常不采用这种编码方式,用图来表示是比较多余的一步操作,因为所有图像和文本都具有非常规则的结构。例如,图像的邻接矩阵中通常有一条带状结构,因为所有的节点或像素都连接包含在在一个网格结构中。文本的邻接矩阵只包括一条对角线,因为每个单词只连接到前一个单词和下一个单词。
  在使用神经网络表示图任务时,一个最重要的表示就是它的连通性,一个比较好的选择就是邻接矩阵,但如前文所说,邻接矩阵过于稀疏,空间利用率不高;另一个问题就是同一个图的邻接矩阵有多种表示方法,神经网络无法保证这些邻接矩阵的输出结果都相同,也就是说不存在置换不变性(permutation invariant)。
  并且不同形状的图可能也包含相同的邻接矩阵。
  一种优雅且高效来表示稀疏矩阵的方法是邻接列表。它们将节点之间的边的连通性描述为邻接列表第k个条目中的元组(i,j)。由于边的数量远低于邻接矩阵的条目数量,因此可以避免了在图的断开部分(不含边)进行计算和存储。
  既然图的描述是以排列不变的矩阵格式,那图神经网络(GNNs)就可以用来解决图预测任务。GNN是对图的所有属性(节点、边、全局上下文)的可优化变换,它可以保持图的对称性(置换不变性)。GNN采用"图形输入,图形输出"架构,这意味着这些模型类型接受图作为输入,将信息加载到其节点、边和全局上下文,并逐步转换这些embedding,而不更改输入图形的连通性。
  最简单的GNN模型架构还没有使用图形的连通性,在图的每个组件上使用一个单独的多层感知器(MLP)(其他可微模型都可以)就可以称之为GNN层。
  对于每个节点向量,使用MLP并返回一个可学习的节点向量。对每一条边也做同样的事情,学习每一条边的embedding,也对全局上下文向量做同样的事情,学习整个图的单个embedding。
  与神经网络模块或层一样,我们可以将这些GNN层堆叠在一起。
  由于GNN不会更新输入图的连通性,因此可以使用与输入图相同的邻接列表和相同数量的特征向量来描述GNN的输出图。
  构建了一个简单的GNN后,下一步就是考虑如何在上面描述的任务中进行预测。
  首先考虑二分类的情况,这个框架也可以很容易地扩展到多分类或回归情况。如果任务是在图节点上进行二分类预测,并且图已经包含节点信息,那么对于每个节点embedding应用线性分类器即可。
  实际情况可能更复杂,例如图形中的信息可能存储在边中,而且节点中没有信息,但仍然需要对节点进行预测。所以就需要一种从边收集信息并将其提供给节点进行预测的方法。
  可以通过Pooling来实现这一点。Pooling分两步进行:对于要池化的每个item,收集它们的每个embedding并将它们连接到一个矩阵中,通常通过求和操作聚合收集的embedding。
  更复杂地,可以通过在 GNN 层内使用池化来进行更复杂的预测,以使学习到的embedding更了解图的连通性。可以使用消息传递(Message Passing)来做到这一点,其中相邻节点或边缘交换信息并影响彼此更新的embedding。
  消息传递包含三个步骤:
  1、对于图中的每个节点,收集所有相邻节点embedding(或消息)。
  2、通过聚合函数(如sum)聚合所有消息。
  3、所有汇集的消息都通过一个更新函数传递,通常是一个学习的神经网络。
  这些步骤是利用图的连接性的关键,还可以在GNN层中构建更复杂的消息传递变体,以产生更高表达能力的GNN模型。
  本质上,消息传递和卷积是聚合和处理元素的邻居信息以更新元素值的操作。在图中,元素是节点,在图像中,元素是像素。然而,图中相邻节点的数量可以是可变的,这与图像中每个像素都有一定数量的相邻元素不同。通过将传递给GNN层的消息堆叠在一起,节点最终可以合并整个图形中的信息。
  节点学习完embedding后的下一步就是边。在真实场景中,数据集并不总是包含所有类型的信息(节点、边缘和全局上下文),当用户想要对节点进行预测,但提供的数据集只有边信息时,在上面展示了如何使用池将信息从边路由到节点,但也仅局限在模型的最后一步预测中。除此之外,还可以使用消息传递在GNN层内的节点和边之间共享信息。
  可以采用与之前使用相邻节点信息相同的方式合并来自相邻边缘的信息,首先合并边缘信息,使用更新函数对其进行转换并存储。
  但存储在图中的节点和边信息不一定具有相同的大小或形状,因此目前还没有一种明确有效的方法来组合他们,一种比较好的方法是学习从边空间到节点空间的线性映射,反之亦然。或者,可以在update函数之前将它们concatenate在一起。
  最后一步就是获取全局的节点、边表示。
  之前所描述的网络存在一个缺陷:即使多次应用消息传递,在图中彼此不直接连接的节点可能永远无法有效地将信息传递给彼此。对于一个节点,如果有k层网络,那么信息最多传播k步。
  对于预测任务依赖于相距很远的节点或节点组的情况,这可能是一个问题。一种解决方案是让所有节点都能够相互传递信息。但不幸的是,对于大型的图来说,所需要的计算成本相当高,但在小图形中已经可以有所应用。
  这个问题的一个解决方案是使用图(U)的全局表示,它有时被称为主节点或上下文向量。该全局上下文向量连接到网络中的所有其他节点和边,并可以作为它们之间传递信息的桥梁,为整个图形建立表示。这可以创建一个比其他方法更丰富、更复杂的图形表示。
  从这方面来看,所有的图形的属性都已经学习到了对应的表示,因此可以通过调整感兴趣的属性相对于其余属性的信息在池中利用它们。例如对于一个节点,可以考虑来自相邻节点、连接边和全局信息的信息。为了将新节点嵌入到所有这些可能的信息源上,还可以简单地将它们连接起来。此外,还可以通过线性映射将它们映射到同一空间,并应用特征调节层(feature-wise modulation layer)。
  通过上述流程,相信大家已经对简单的GNN如何发展为sota模型有了了解。在获取图的节点、边表示后,就可以为之后的任务再单独设计网络,GNN为神经网络提供了一种处理图数据的方式。
  在原文博客中,还包括一些GNN的真实案例和数据集,并了解GNN在其中的具体作用,想了解更多内容可以访问参考链接进行阅读。
  参考资料:
  https://distill.pub/2021/gnn-intro/

为什么我们要为自己树立所谓的标准?华为为世界树立了5G的标准,然后华为成了美国的敌人,但是华为也成为了全世界的朋友!图片来源于网络标准是什么?如果你要问这个问题,做建筑行业的人最有发言权,标准就是劳动人民在日常生活为什么写过辞职报告的员工不能再续用?辞职,不管是什么原因,总之是因为干的不爽了,所以才想辞职。如果刻意挽留想要辞职的员工,那是一种错误,更是历史的倒退。图片来源于网络自古有人的地方就有矛盾,有矛盾的地方就有利益之争。人生的选择比努力更重要年轻的时候许多人自负自己是条龙,然后嚷嚷着上山下海。想着要努力奋斗出一个不一样的世界,后来渐渐的发现这个社会到处都有规矩,当你试图违背规矩时,就会触犯法律,或者说得罪某些利益集团,为什么那么多人选择了修禅我们活在这个世间,有时候许多人是不想见的,但又必须见有些事是不想做的,但又必须做。有时候委屈了自己想成全别人,但是没有人会领你的情,因为人性不在善良。图片来源于网络总有那么一段时间为什么你的工资会那么低?当你抱怨自己工资低的时候,不妨看看这篇文章。图片来源网络工作的目的是为了养家糊口,当工作所获得的回报不足以养家糊口时,说明你的工资低。那么为什么你的工资会低呢?当今社会除了机关单位人心中的成见,如同一座大山我们一生都在想办法让别人认可,而这种认可,不止是对长相和能力的认可,更多的是对自己人品的认可!魔童哪吒里面有一句台词人心中的成见,如同一座大山,任你怎么努力也休想搬动。这句台词深深如果结婚是为爱情找个坟墓?那么相亲,是不是在为坟墓看风水?图片来源于网络常听有人说去相亲,然后说完哈哈一笑,尴尬的又接着说没相中。后面好奇害死猫,追着问为什么没相中?这中间插曲就多了,对方觉得我太矮,配不上他。我还是想找个有钱的,而不是长活着,是一种艺术前些年说活着是一种修行,那是因为德才不够多年后回过头来说活着是一种艺术,是因为经历太多,风起云涌后还能够淡定如初。图片来源于网络人一生,当你觉得活着是在修行的时候,是因为你欠缺的东企业英才与庸才论当一个企业开始海选人才的时候,说明这个企业人才转换机制出现了重大管理问题。世间从不缺人才,但是人才的存在往往对领导者起着威胁作用,人才一旦威胁到领导者的安全,人才就会被灭掉。当人才三十岁后,请打理好你凌乱的人生社会真的很残酷,如果不拼爹30岁前能买房娶妻生子的人很少,也正因为如此许多人到了三十岁因为没有解决人生中的二大问题娶妻生子,开始陷入焦虑。这种焦虑不是来源于外界环境,而是自我认识和越努力,越幸运我们当中许多人奋斗一生,无非不就是官位权力收入还有社会地位和关系。而真正能站在金字塔尖的人其实少之又少,更多的人在这个俗世中往往不是被主动选择,就是被被动选择。图片来源于网络先说找
现场报道全套ATC产品会来什么样的惊奇?ATC音箱的介绍经常看到,这篇文章我们主要讨论三个问题,第一是越大的落地箱表现越全面吗?第二是全套的ATC产品听起来效果如何?第三是2。1声道的玩法。ATC的经典系列产品型号众多,韩国奥立AllnicH5500黑胶唱头放大器疫情期间,国外媒体评论2021年夏天最值得购买的唱头放大器,从价格最低的SoundsmithMMP3MkII(800美元),到价格不菲的DanDAgostinoMomentumPh意大利MastersoundCompact300B电子管合并功放说起意大利这个国家,你第一时间会联想到什么?对于艺术家来说会是色彩浓厚的文艺复兴,对于体育迷来说会想到意大利足球甲级联赛,对于美食家来说可联想的就更多了,如酱料丰富的意大利面,汇聚声雅30周年纪念唱片有感2021年是声雅音响成立三十周年,三十年,对国内的音响企业来说都是老牌企业了,三十年的执着三十年的努力,三十年的口碑,造就了声雅品牌在中国音响业的地位和影响力!三十周年,不光是声雅ELECTROCOMPANIETEMC1MKVSE(第五代)限量签名版挪威ELECTROCOMPANIET(音乐之旅)成立于1973年,以制造晶体管功率放大器闻名,音乐之旅的晶体管放大器很有自己的特色,数十年来一直坚持自己的声音理念,以稳重扎实的声底挑战音响的爆棚威力,海汀克指挥布鲁克纳交响乐全集废话不多说,请直接拿出这套唱片中布鲁克纳的第四交响曲(第三乐章)第五交响曲(终乐章)第七交响曲(第二乐章)第八交响曲(终乐章)第九交响曲(第二乐章)。泡一杯好茶,将门窗关紧,音量扭不附赠充电器和耳机的iphone12你会选择吗?相信很多小伙伴都在等待iphone12的到来,期待这么久iphone12它已经来了,此次iphone12发布与之前不一样,iphone12将不再赠送充电器与耳机,不知道听到这里小伙初中数学尺规作图专项初中数学尺规作图专题讲解尺规作图是起源于古希腊的数学课题,是指用没有刻度的直尺和圆规作图。其中直尺必须没有刻度,只能用来作直线线段射线或延长线段圆规可以开至无限宽,但上面也不能有刻中考压轴题解题套路剖析中考数学常考压轴题类型1线段角的计算与证明中考的解答题一般是分两到三部分的。第一部分基本上都是一些简单题或者中档题,目的在于考察基础。第二部分往往就是开始拉分的中难题了。对这些题轻初中数学证明题该如何思考?证明题的思路很多几何证明题的思路往往是填加辅助线,分析已知求证与图形,探索证明。对于证明题,有三种思考方式(1)正向思维。对于一般简单的题目,我们正向思考,轻而易举可以做出,这里就费马点问题费马,法国业余数学家,拥有业余数学之王的称号,他是解析几何的发明者之一。费马点就是到三角形的三个顶点的距离之和最小的点。费马点结论对于一个各角不超过的三角形,费马点是对各边的张角都