用限制图机器学习无处不在 Transformer 可缓解 GNN (限制性作图的基本原理和方法)

在我们今天的生活中，图的示例包括社交网络、例如Twitter、Mastodon、以及任何链接论文和作者的引文网络，分子，知识图、例如 UML 图、百科全书以及有超链接的网站，表示为句法树的句子以及任何的 3D 网格等，可以说图已经无处不在。

近日，Hugging Face 研究科学家 Clémentine Fourrier 在文章《Introduction to Graph Machine Learning》就介绍了今天这种无处不在的图机器学习。什么是图形？为什么要使用图？如何最好地表示图？人们如何在图上学习？Clémentine Fourrier 指出，图是对由关系链接项目的描述，其中，从前神经方法到图神经网络仍然是目前人们常用的图上学习方法。

此外，有研究人员近期也开始考虑将 Transformers 应用于图中，Transformer 具有良好的可扩展性，可缓解 GNN 存在的部分限制，前景十分可观。

图是对关系链接项目的描述

从本质上来看，图是对由关系链接项目的描述。图（或网络）的项目称为节点（或顶点），由边（或链接）来进行连接。例如在社交网络中，节点是用户，边是用户彼此间的连接；在分子中，节点是原子，边缘是它们的分子键。

可以看到，使用数据必须首先考虑其最佳表示，包括同质/异质、有向/无向等。

在图层面，主要任务包括以下：

节点层通常是对节点属性的预测，例如 Alphafold 使用节点属性预测来预测给定分子整体图的原子 3D 坐标，从而预测分子如何在 3D 空间中折叠，这是一个困难的生物化学问题。

边缘的预测包括边缘属性预测和缺失边缘预测。边缘属性预测有助于对药物副作用的预测，给定一对药物的不良副作用；缺失边预测在推荐系统中则是用于预测图中的两个节点是否相关。

在子图级别中，可进行社区检测或子图属性预测。社交网络可通过社区检测来确定人们的联系方式。子图属性预测多应用在行程系统中，例如谷歌地图，可用于预测预计到达时间。

当要进行预测特定图的演变时，转换设置工作中的所有内容，包括训练、验证和测试等，都可在同一个图上完成。但从单个图创建训练、评估或是测试的数据集并非易事，很多工作会使用不同的图（单独的训练/评估/测试拆分）完成，这被称为归纳设置。

表示图处理和操作的常见方法有两种，一种是作为其所有边的集合（可能由其所有节点的集合补充），或是作为其所有节点之间的邻接矩阵。其中，邻接矩阵是一个方阵（节点大小×节点大小），指示哪些节点直接连接到其他节点。要注意的是，由于大多数图并不是密集连接的，因此具有稀疏的邻接矩阵会使计算更加困难。

图与 ML 中使用的典型对象非常不同，由于其拓扑结构比“序列”（如文本和音频）或“有序网格”（如图像和视频）更复杂：即便可以将其表示为列表或矩阵，但这种表示不可以被视为是有序对象。也即是说，如果打乱一个句子中的单词，就可以创造一个新句子，如果将一个图像打乱并重新排列它的列，就能创建了一个新图像。

图注：Hugging Face 标志和被打乱的 Hugging Face 标志，是完全不同的新形象

但图的情况并非如此：如果我们洗掉图的边缘列表或邻接矩阵的列，它仍然是同一个图。

图注：左边是一个小图，黄色表示节点，橙色表示边；中心图片上的邻接矩阵，列和行按节点字母顺序排列：节点 A 的行（第一行）可以看到其连接到 E 和 C；右边图片打乱邻接矩阵（列不再按字母顺序排序），其仍为图形的有效表示，即 A 仍连接到 E 和 C

通过 ML 的图形表示

使用机器学习处理图的常规过程，是首先为项目生成有意义的表示，其中，节点、边或完整图取决于具体任务需求，为目标任务训练预测器。与其他模式一样，可以通过限制对象的数学表示，以便在数学上与相似对象接近。但在此之中，相似性在图 ML 中很难严格定义：例如，当两个节点具有相同的标签或相同的邻居时，它们是否更相似？

如下面所示，本篇文章重点关注的是生成节点表示，一旦有了节点级的表示，就有可能获得边或图级的信息。对边级信息，可以将节点对的连接起来，或者做点乘；在图级信息中，可以对所有节点级表示的串联张量进行全局池化，包括平均、求和等。但是，它仍然会使整个图的信息变得平滑和丢失——递归的分层集合可能更有意义，或者增加一个虚拟节点，与图中的所有其他节点相连，并将其表示作为整个图的表示。

简单地使用工程特性

在神经网络之前，图形及其感兴趣的项目可以通过特定任务的方式表示为特征的组合。在今天，这些特征仍用于数据增强和半监督学习，尽管存在更复杂的特征生成方法，但根据任务找到如何最好地将这些特征提供给到网络至关重要。

节点级特征可以提供关于重要性的信息以及基于结构的信息，并对其进行组合。

节点中心性可用于衡量图中节点的重要性，通过对每个节点邻居中心性求和直到收敛来递归计算，或是通过节点间的最短距离度量来递归计算，节点度是其拥有的直接邻居的数量；聚类系数衡量节点邻居的连接程度；Graphlets 度向量计算则可计算有多少不同的 graphlets 以给定节点为根，其中，graphlets 可使用给定数量的连接节点来创建的所有迷你图。

边级特征用关于节点连通性的更详细信息补充表示，其中就包括了两个节点之间的最短距离、它们的共同相邻点以及 Katz 指数（指两个节点之间可能走过的一定长度的路径的数量——其可以直接从邻接矩阵中计算出来）。

图级特征包含关于图相似性和特殊性的高级信息，其中，小图计数，尽管计算成本很高，但提供了关于子图形状的信息。核心方法通过不同的 "节点袋 "方法（类似于词袋）来衡量图之间的相似性。

基于行走的方法使用随机行走中从节点 i 访问节点 j 的概率来定义相似性度量，这些方法结合了局部和全局信息。例如，此前 Node2Vec 模拟图形节点之间的随机游走，使用 skip-gram 处理这些游走，就像我们处理句子中的单词一样，以计算嵌入。

这些方法还可用于加速 PageRank 方法的计算，该方法给每个节点分配一个重要性分数，基于它与其他节点的连接，例如通过随机行走来评估其访问频率。但上述方法也存在一定的局限性，它们不能获得新节点的嵌入，不能很好地捕捉节点之间的结构相似性，不能使用添加的特征。

图神经网络如何处理图？

神经网络可以泛化到看不见的数据。考虑到此前提到的表示约束，一个好的神经网络应该如何处理图？

典型的神经网络不是排列不变的，例如 RNN 或 CNN，因此一种新的架构——图神经网络被引入（最初是作为一种基于状态的机器）。

一个 GNN 是由连续的层组成的。GNN 层将节点表示为其邻居的表示和来自上一层（消息传递）的自身组合，通常还会加上激活以添加一些非线性。而与其他模型相比，CNN 可看作是具有固定邻居大小（通过滑动窗口）和排序（非排列等变）的 GNN；而没有位置嵌入的 Transformer 可以看作是全连接输入图上的 GNN。

聚合来自节点邻居的信息有很多方法，例如求和、平均，此前已有的类似聚类方法包括：

选择一个聚合：一些聚合技术（特别是平均/最大集合）在创建精细表示以区分类似节点的不同节点邻居表示时，会遇到失败的情况；例如，通过均值集合，一个有4个节点邻居表示为1、1、-1、-1，平均为0，与一个只有3个节点表示为-1、0、1的邻居是没有区别的。

在每个新层，节点表示包括越来越多的节点。一个节点通过第一层，是其直接邻居的聚合。通过第二层，它仍然是其直接邻居的聚合，但此刻其表示还包括了它们自己的邻居（来自第一层）。在 n 层之后，所有节点的表示成为其距离为 n 的所有邻居的集合，因此，如果其直径小于n，则为全图的聚合。

如果网络层数太多，则存在每个节点成为完整图的聚合的风险（并且节点表示对所有节点收敛到相同的表示），这被称为过度平滑问题，可通过以下方式来解决：

过度平滑问题是图 ML 中的一个重要研究领域，由于它会阻止 GNN 扩大规模，就像 Transformers 在其他模型中被证明的那样。

没有位置编码层的 Transformer 是置换不变的，并且 Transformer 还具有良好的可扩展性，因此研究人员在近期开始考虑将 Transformers 应用于图中。大多数方法的重点是通过寻找最佳特征和最佳方式来表示图形，并改变注意力以适应这种新数据。

下面展示了一些方法，这些方法在斯坦福大学的 Open Graph Benchmark 上取得最先进或接近的结果：

近期有研究“Pure Transformers are Powerful Graph Learners”在方法中引入了 TokenGT，将输入图表示为一系列节点和边嵌入，也即是使用正交节点标识符和可训练类型标识符进行增强，没有位置嵌入，并将此序列作为输入提供给 Transformers，此方法非常简单，同时也非常有效。

此外，在研究“Recipe for a General, Powerful, Scalable Graph Transformer”中，跟其他方法不同的是，它引入的不是模型而是框架，称为 GraphGPS，可允许将消息传递网络与线性（远程）Transformer 结合起来，轻松创建混合网络。该框架还包含几个用于计算位置和结构编码（节点、图形、边缘级别）、特征增强、随机游走等的工具。

将 Transformer 用于图在很大程度上仍处于起步阶段，但就目前来看，其前景也十分可观，它可以缓解 GNN 的一些限制，例如缩放到更大或更密集的图，或是在不过度平滑的情况下增加模型大小。

图无处不在，用 Transformer 可缓解 GNN 限制

未经「AI科技评论」授权，严禁以任何方式在网页、论坛、社区进行转载！

版权文章，未经授权禁止转载。详情见转载须知。

图无处不在，用 Transformer 可缓解 GNN 限制

谷普下载提醒您

本文链接：http://www.gpxz.com/article/a69f1949b2059970567e.html

上一篇：ChatGPTAPI中国厂商往何处去正式发布chatgp

下一篇：李航ACM名单公布恭喜梅宏Fellow俞栋2022邢

豆果美食

豆果美食是最优质的美食菜谱社区,提供各种菜谱大全,食谱大全,家常菜做法大全,丰富的菜谱大全可以让您轻松地学会怎么做美食,展现自己的高超厨艺,开启美好生活！

生活常识 2024-01-14 18:45:30

蝴蝶教程

蝴蝶教程(www.jc2182.com)提供了的编程基础技术教程，向网友分享了PHP，Python，Java，Ruby，C，HTML，CSS，Javascript，MySQL，等Web编程和软件运维的基础知识，望对有兴趣于IT行业发展的小伙伴给予抛砖引玉的作用。

手机软件 2024-08-17 00:56:45

祝你云记

承德志合电子商务有限公司

特产礼品 2024-07-13 23:09:59

终信信安信息系统集成服务中心

终信信安信息系统集成服务中心致力于信息技术集成服务，包括软件开发、网站建设、微信商家二位码申请办理、微信支付技术支持等多项业务，为各中小企业提供优质的信息技术服务。

手机软件 2024-08-17 19:41:22

貂皮衣服染色改色

貂皮大衣重新染色,貂皮衣服染色,貂皮大衣改色尤巧九五年开始研发貂皮成品衣服染色改色的相关技术和试剂，到而今已经有近三十个年头。让成千上万的客户花比较少的钱得到效果很好非常满意的衣服，既环保又省钱而且还让更多的生命回归自然

电影视频 2024-08-17 20:30:32

除铁器

昌盛磁电主要经营除铁器、电磁除铁器、永磁除铁器、磁选机、悬挂式永磁除铁器、自卸式电磁除铁器、管道式除铁器、永磁滚筒、管道式除铁器等设备的专业厂家,欢迎来电选购,电话:0316-2229110

电影视频 2024-08-17 23:32:26

公司注册

中誉财税专业从事公司注册,代办营业执照,代理记账,公司注销等业务,已有多年行业经验,服务超500家公司,免费提供咨询,助力企业成长。

商业服务 2024-07-10 04:42:15

政府门户导航

政府门户导航（zfmh.cn）是站长在线打造的各类型的政府机构、事业单位、企业单位门户导航。

站长资源 2024-07-16 14:02:41

传奇手游发布网

传奇手游发布站(www.sdlmdx.com)为您提供高品质传奇类手游下载中心,为玩家推荐新款：176精品传奇、180合击版手游、变态单职业传奇、冰雪传奇手游,以及最新热门传奇手游排行榜,找新开各种传奇手游尽在传奇手游发布网!

下载资源 2024-11-18 00:02:36

悠久资源(xu9.cn)

悠久资源（xu9.cn），为各位网络管理员网站建设者提供企业网站程序源码及模板下载,PbootCMS,帝国CMS及Wordpress源码模板，并提供网站使用教程，网站SEO优化教程，服务器安全教程，数据库安全教程等，程序使用过程中遇到的问题解决方案。

新闻资讯 2024-12-21 15:42:06

极客晨星AI自习室首页

极客晨星作为国内知名AI教育高新技术企业，深耕行业近10年，用深厚的科技实力和优质的教育内容为孩子提供全学科和编程科技教育资源，目前全国已落地300多家校区，帮助孩子和家长实现成长进步，收获媒体和社会的良好口碑！欢迎来电咨询：010-64708343。

下载资源 2025-01-28 21:02:40

北京树葬公墓

北京树葬网是为数不多的介绍北京树葬公墓和北京生态葬陵园价格、位置和具体家数的专业平台，同时也提供树葬百科等相关知识。

商业服务 2025-02-06 14:36:33

百度这APP干嘛的亿级APP中增速第一手机百度改名 (百度这两天有故障吗)

在今日的百家号盛典活动中，百度高级副总裁兼搜索公司总裁向海龙宣布，，手机百度，将全面升级，并改名为，百度，在盛典中，百家号推出了集成百度AI技术的，创作大脑，工具，帮助作者提升创作效率和创作质量，主要功能有，百家号还在会议上发布了，百万年薪计划，等一系列内容创作者扶持计划，帮助优秀创作者在百家号平台上一年获得100万元及以上的收益，...。

2025-01-31 01:34:34

2019 看点最全汇总 5G 商用来了！MWC (电影看点)

从移动通信行业发展的角度，2019年毫无疑问将会是5G元年，在经历了2018年的众多铺垫之后，即将到来的MWC2019，世界移动大会，举办时间为2019年2月25日至2月28日，地点为位于西班牙巴塞罗那的FiraDebarcelonaGranVia展馆，毫无疑问将成为众多通信设备厂商、芯片商和运营商展现其5G实力和进展的舞台，同时也是...。

2024-12-10 00:47:52

AI 生态大网服务器市占率超看浪潮如何编织中国 2017 57% AI (aiot生态发展大会)

浪潮集团AI影响因子活动浪潮集团专访专访随着深度学习带来AI的第三次浪潮，对AI的相关讨论层出不穷，算法是大家关注的重点，算法固然重要，但想做好AI，还需要强大的底层支撑，谷歌在训练AlphaGoZero时，用到2000块TPU，仅仅花费三天就完成训练，目前，企业AI化的需求不断加深，需要有非常强大的计算平台来有力支撑线上推理和线下训...。

2024-12-09 21:05:40

烩面加盟店 (烩面加盟店排行榜前十名)

烩面原本是陕北那边的土特产，但是因为它的风味非常的独特，再加上非常的有营养，所以很快她就成了全国的加盟的品牌了，现在火的烩面是羊肉烩面，羊肉烩面比传统的烩面多了一份肉香，但是它油而不腻，非常的好吃，再加上，他里面可以放各种各样的佐料，所以人们可以根据自己的口味做各种各样的调整，现在加盟烩面还是非常好的时候，因为烩面可以暖胃，在这个寒冷...。

2024-12-04 23:16:00

热烈祝贺上海市静安区天目中路爱君家政分店隆重开业 (热烈祝贺上海大学刘剑)

热烈祝贺上海市静安区天目中路爱君家政分店隆重开业，本店是一家集家政服务与专业培训为一体的连锁品牌化家政服务公司，采用管理制的经营方式，打破中政传统的中介模式，并且家政O2O平台及手机APP的运用，形成家庭服务，互联网模式，爱君服务之魂，在于细微之处的精雕细琢，更在于倾尽心血的匠人之心，我们的口号就是打破传统、追求很好，随着上海市静安区...。

2024-12-02 23:20:08

涨价预警小米15系列早期爆料出炉 (小米涨价引关注)

5月14日，AndroidHeadline挖出了小米15和小米15Pro的机型信息，同日，闲聊站也开始给大家打涨价预防针，小米15有24129PN74G，国际版，、24129PN74I，印度版，和24129PN74C，中国版，小米15Pro暂时只有24101PNB7C，中国版，、2410DPN6CC，独占钛金属，卫星通信版，两个型号，...。

2024-12-02 17:57:59

精彩赛事好搭档 (精彩赛事不容错过)

发表在极米投影仪2018，12，3119，562018年的夏天，全世界喜欢运动，热爱足球的人们的目光都聚焦在了俄罗斯，世界杯的魅力是感动与狂欢的交融，国足的常规缺席并没有给广大中国球迷带来什么影响，啤酒加小龙虾开启世界杯的畅快看球之旅，不过仅有这两样可还不够，看球赛当然需要超大屏幕才够爽，不过在家置办台超大屏幕的电视不仅价格不菲，而且...。

2024-11-28 20:41:29

欧乐思MP120投影仪质量怎么样参数分析是否值得入手 (欧乐思mp120)

发表在其它家用投影仪品牌2022，11，215，07欧乐思MP120投影仪，是一款新上市的外形小巧的家用投影仪，对于一些考虑购买千元以内投影仪的用户，这款投影仪到底值不值得入手呢，今天就来为大家介绍一下欧乐思MP120的详细参数，看看它的各方面质量性能是否值得用户去选择，欧乐思MP120详细参数介绍1.光学参数欧乐思MP120投影仪使...。

2024-11-28 16:54:19

别让太多人看到揭秘闲鱼精准引流 (别让太多人看的英文)

这篇文章给大家分享一下，闲鱼精准引流的一个好方法，这个方法一天引流200，精准粉丝不是问题，分享之前，先提一提一些引流的思路，一般我选择引流之前会先从一个维度来思考，首先当然是平台，就像抖音这种日活破6亿的平台，当然多么细分的流量都有，抖音这块蛋糕虽然大，但吃的人也多呀，所以想用最主流的打法从抖音搞流量，这里最主流打法指老老实实发视频...。

2024-11-26 17:52:12

二中分北校区好还是171好 (二中分北校区属于什么档次)

二中分北校区在教学管理上更为严谨，1、北校区注重对教师的选拔与培训，师资队伍整体年轻化且有活力，教师素质普遍较高，此外，该校区的课程安排紧凑，学习效率较高，2、相比之下，171学校的管理较为宽松，师资力量存在较大差异，部分教师可能缺乏教学经验或者年岁较大，3、因此，综合各项因素，二中分北校区在教学质量和师资配备上更胜一筹，北京2中、1...。

2024-11-24 17:20:13

王毅说明中方在南海疑问上的严正立场 (王毅在中美高层对话)

外地时期2024年7月27日，中共中央政治局委员、外交部长王毅在万象缺席东亚协作系列外长会时期，就南海疑问说明中方立场，王毅示意，中国在南海的领土主权和陆地权力领有充沛的历史和法理依据，中方从保养周边友好和地域协作大局登程，同东盟国度签订了，南海各方行为宣言，，一以贯之片面有效落实，宣言，，同时保持同间接当事国经过对话协商妥善管控统一...。

2024-11-13 10:11:28

CLS 63 2008款飞驰CLS级 AMG 1万公里爱护名目多少钱 (cls632023款)

2008款飞驰CLS级CLS63AMG1万公里爱护费用详解关于2008款飞驰CLS级CLS63AMG车型，行驶1万公里后，基础爱护名目重要为A爱护，包含改换AMG公用机油等，估量费用为2060元，请留意，此费用仅为预估多少钱，详细费用或者会因地域、服务商等起因有所差异，最终费用以商家结算实践金额为准，为确保您的爱车继续以最佳形态行驶，...。

2024-07-07 22:10:03

文章推荐

清华大学张钹实现下一代人工智能的两个范式 (清华大学张钹教授)

8月3日，首届全球数字经济大会在京召开，在人工智能产业治理论坛上，来自我国人工智能领域的顶尖科学家，围绕主题，探索创新、共举担当，展开前沿对话，其中，中科院院士、清华大学人工智能研究院名誉院长张钹做了，人工智能的治理与创新发展，的演讲，在演讲中，张钹介绍了实现下一代人工智能的两个范式，其中，所有的处理都在连续空间里进行，的范式一，优点...。

2024-12-03 21:49:59

资讯动态

首批获奖名单公布蚂蚁集团设立蚂蚁InTech科技奖 (首批获奖名单公布时间)

9月5日，2024Inclusion·外滩大会上，首届蚂蚁InTech科技奖公布获奖名单，10位青年学者获奖，并获得由蚂蚁集团提供的公益奖金，蚂蚁InTech科技奖设立于2024年7月，意在奖励在计算机科学及相关学科科研工作中取得创新突破的中国杰出青年学者，鼓励他们持续探索和解决计算机科学发展的真问题，中国工程院院士、清华大学教授郑纬...。

2024-12-03 20:09:06

资讯动态

2021腾讯财报腾讯终成IT自研疯狂的企鹅这一年 (2021腾讯视频星光大赏)

2021年对所有行业来说都是不平凡的一年，经济、卫生、政策环境的调整对各行业的发展影响深刻，特别是对超速发展的TMT行业，是优化之年，也是再出发之年，在数字化转型升级的重要一年，国家对于数字基建、数字经济的重视超乎想象，一大批头部互联网企业在响应数字经济改革需求的同时也感受到了更多的监管，在愈发规范化的政策、管理制度下，腾讯作为国内典...。

2024-12-03 17:35:52

资讯动态

呼吁所有互联网平台一起行动二选一将认真落实；字节跳动回应屏蔽外部网址链接等问题否认破产！恒大出台理财产品兑付方案；美团饿了么互相起诉对方 (呼吁所有互联网的句子)

恒大集团回应，有关恒大破产重组的言论完全失实，并出台理财产品兑付方案，分期支付或以当地恒大房产抵偿恒大财富的兑付方案分为三种，包括现金分期兑付、实物资产兑付和冲抵购房尾款兑付，现金分期兑付安排为，投资产品到期后，在到期当月的最后一个工作日支付，现金分期兑付金额，的10%，此后每满三个月支付10%，直至全部支付完毕，用实物资产兑付方面，...。

2024-11-30 15:41:37

资讯动态

九牛手机广告平台站内互动数据分析 (九牛手机广告怎么关)

文字链接认证代码普通联盟标志认证代码企业广告联盟标志认证代码广告联盟评测代码说明，本页面的认证代码为九牛手机广告平台专用评测代码，站长需懂简单html知识，直接复制代码粘贴到联盟网站相应页面即可使用，本代码不适用于其他广告联盟网站请勿获取！文字认证，文字链接代码认证适用所有类型的广告联盟，复制代码后放在九牛手机广告平台网站首页底部或友...。

2024-11-19 17:06:13

网络百科

用 限制 图机器学习无处不在 Transformer 可缓解 GNN (限制性作图的基本原理和方法)

未经「AI科技评论」授权，严禁以任何方式在网页、论坛、社区进行转载！

相关文章

文章推荐

用限制图机器学习无处不在 Transformer 可缓解 GNN (限制性作图的基本原理和方法)