范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

KDDCUP2021首届图神经网络大赛放榜,百度飞桨PGL获得2金1银

  机器之心发布
  机器之心编辑部
  百度飞桨凭借什么在「大数据领域世界杯」 KDD CUP三大赛道里豪取两金一银?
  近日,由 KDD CUP 与 OGB(Open Graph Benchmark)联合举办的首届图神经网络大赛正式放榜,在 DeepMind、微软、蚂蚁金服、UCLA 等全球 500 多个顶尖企业、高校和实验室的激烈竞争中,百度凭借飞桨图学习框架 PGL 一路过关斩将,最终在全部三个赛道包揽了两冠一亚。
  本次大赛承办方斯坦福大学 Jure Leskovec 教授宣布冠军队伍
  据了解,KDD CUP 是 ACM SIGKDD 组织的年度赛事,素有 「大数据领域世界杯」 之誉,是目前数据挖掘领域最高水平、最具影响力、规模最大的国际顶级赛事。而今年,KDD CUP 与 OGB 联合举办了第一届 OGB-LSC(OGB Large-Scale Challenge)比赛,提供来自真实世界的超大规模图数据,来完成图学习领域的节点分类、边预测和图回归三大任务。
  本次比赛采取「闭卷考试」,整个比赛周期只有 2 次提交模型结果机会,极其考验参赛队伍模型泛化能力,竞赛难度极大。得益于百度在图神经网络的持续深耕,在本次大赛的三大赛道之中,百度飞桨图学习框架 PGL,合计夺得大规模节点分类赛道冠军、大规模图关系预测赛道冠军、化学分子图性质预测赛道亚军。
  飞桨 PGL 夺冠页面:https://ogb.stanford.edu/kddcup2021/results/
  飞桨 PGL 代码完全开放,欢迎大家使用、反馈和贡献。 PGL 链接: https://github.com/PaddlePaddle/PGL B 站 图神经网络 7 日教程: https://www.bilibili.com/video/BV1rf4y1v7cU PGL 图学习入门教程: https://aistudio.baidu.com/aistudio/projectdetail/413386 飞桨 PGL 参赛报告 & 代码: https://github.com/PaddlePaddle/PGL/tree/main/examples/kddcup2021
  大规模节点分类赛道冠军:引入基于异构关系的统一消息传递模型
  OGB-LSC 节点分类数据集,来源于真实世界的超大规模学术引用网络 MAG(Microsoft Academic Graph)。OGB 官方提取了超 2.4 亿的实体(包括论文、作者等),构建出包含 16 亿边关系的大规模异构图。参赛选手需从异构图中挖掘有效信息,预测出指定的 arXiv 论文的主题(总共包含 153 个主题,例如 cs.LG 机器学习、q-bio.BM 生物分子等)。
  目前,解决节点分类的图学习方法主要包含两类:一类是标签传递算法,而另一类则是通过模型对多阶邻居特征进行聚合,并预测中心节点标签的图神经网络。然而目前这两种方法均有其局限性,无法最大限度的利用图节点中的标签信息。
  为解决上述问题,飞桨 PGL 提出了统一消息传递模型 UniMP,巧妙地利用了『标签』掩盖预测策略,使得模型可以在训练和预测中,同时进行标签传递和特征聚合,成功地将上述两种图学习方法统一到消息传递模型中,并在半监督节点分类任务上取得明显提升。目前,相关论文已被 IJCAI2021 收录,并成为目前节点分类任务中的主流的强基准。
  R-UniMP:标签与特征(图中蓝色能量)在统一的消息传递机制下进行传播
  针对本次的大规模异构图,飞桨 PGL 进一步引入了基于异构关系的采样方法与注意力融合机制,将 UniMP 升级成为 R-UniMP,并且在飞桨并行计算框架基础上实现了分布式大规模图神经网络模型的训练和预测。实验结果相对官方基线的验证集准确率提升将近 10 个百分点!并最终在与 DeepMind、微软、蚂蚁金服、清华等一众国内外科技公司与学术机构的较量中摘得桂冠。
  大规模图关系预测赛道冠军:提出 20 层的 NOTE-RPS 知识图谱嵌入模型
  本次边预测任务为大规模知识图谱中的关系预测。在知识图谱中,通过连接不同实体的三元组(例如姚明-出生于 ->上海)来表示关于世界的事实知识。然而,这些大型知识图谱并不完善,缺少实体之间的许多关系信息。
  使用机器学习方法自动估算缺失的三元组可以显著减少人工修补成本,从而提供了更全面的知识图谱。本次比赛使用 Wikidata 知识图谱,包含近 9 千万的实体和 5 亿的三元组,为至今数据规模最大的知识图谱任务。
  目前业界知识表示模型层出不穷,例如 TransE、RotatE 等。飞桨 PGL 基于大规模知识表示库 PGL-KE,对已有算法升级提出了 Normalized Orthogonal Transforms Embedding(NOTE)模型,能够对关系进行多维度建模,同时能在大规模场景下仍保持数值稳定性。
  NOTE:归一化正交转换知识图谱嵌入模型
  其次,飞桨 PGL 提出的 Relation-based Post Smoothing (RPS)图神经网络算法,对训练完的 NOTE 模型进行后处理,并使用了 20 层的 RPS 模型,堪称知识图谱领域最深的图神经网络模型。基于 NOTE+RPS 大规模知识表示方案的实验结果相对于官方提供的基准提升了 12 个百分点,并最终在与阿里巴巴、哈工大、中科大等团队的较量中一举夺魁,助力知识图谱向实践应用迈出了巨大一步。
  化学分子图性质预测赛道:利用分子 3D 构象构造自监督预训练辅助任务
  分子特性预测已被广泛认为是计算药物和材料发现中最关键的任务之一。基于 DFT 量子物理计算的方法需要耗费大量时间才能有效预测多重分子性质。为了利用图神经网络强大的表达能力来预测分子性质,飞桨 PGL 与螺旋桨 PaddleHelix 生物计算框架联合提出了 LiteGEM 模型,利用分子的 3D 构象构造自监督预训练辅助任务,提升分子性质预测效果,并最终获得亚军。
  应用落地:可支持更大规模产业应用,飞桨图学习框架 PGL 迎来重大升级
  除了在 KDD CUP 上全面开花,飞桨 PGL 也一直持续地致力于图神经网络算法创新以及更大规模的工业应用落地。
  近日,飞桨 PGL 迎来重大升级,推出了万亿超大规模分布式图引擎,本次 KDD CUP 夺冠技术方案即是均基于该分布式图引擎。分布式图引擎研发的初衷也是希望图学习算法可以在业界实现更大规模的产业应用,目前,百度已借助飞桨 PGL 在搜索、信息流推荐、金融风控、智能地图、知识图谱等多个场景实现数十项应用落地。
  深度学习开发者峰会 WaveSummit 2021 万亿图引擎发布现场
  此外,飞桨 PGL 还与多个外部机构合作:网易云音乐在调研了大量开源方案后,也选择了对大规模图训练更加友好的飞桨 PGL 作为云音乐推荐的图神经网络基础框架。同时,飞桨 PGL 也助力科技创新 2030「新一代人工智能」重大项目 OpenKS 知识计算引擎。
  源于图神经网络对于复杂数据建模的便利以及其强大的表达能力,飞桨 PGL 也探究图神经网络与多个交叉学科的结合,包括构建大数据疫情预测系统,与飞桨螺旋桨 PaddleHelix 合作致力于化合物属性预测,并在多个化合物预测榜单上取得 SOTA。
  飞桨图学习框架 PGL
  图学习作为通用的人工智能算法之一,势必成为智能时代新的基础能力,赋能各行各业,助力智能经济腾飞。现阶段仅仅是图学习热潮的开始,未来还将有更加深度的技术产出,和更大规模的产业机会出现,扎根图学习领域,持续为产业智慧化升级赋能,需要从现在就开始。

美将启动火星栖息地模拟计划研究人员计划在美国亚利桑那州生物圈2号的加压密封温室里开展新实验。图片来源TRENTTRESCH据说,20世纪七八十年代,一位俄罗斯宇航员在俄罗斯轨道飞行器上进行了一次植物生长实验NuSTAR数据表明观测到一些宇宙超光X射线源可能是一个视角问题据外媒报道,超光X射线源(ULX)在直接正面观测时很容易被发现,但是如果它们的方向稍微远离地球,它们就可能被隐藏起来。你很难错过直指你的手电筒光束。但是从侧面看,这束光显得明显更暗存在即作用粒子古希腊人认为最小的粒子是原子,而如今科学界已经发现原子下面还有质子中子电子夸克中微子等等,人们普遍认为物质就是由一个一个点状粒子组成的。这套用粒子来描述各种事物的模型,也就是我日本天文学的雄心壮志!2029年,将带回火卫一岩石样本最近,美国宇航局毅力号火星车在探测火星过程中翻火星车的新闻,相信很多人都还记忆犹新。(图片说明毅力号火星车)所谓的翻火星车,只是我们用翻车这个流行词来形容毅力号遭遇的麻烦,那就是执天上的月亮,竟有这么多起源月球,是地球的卫星,并且也是太阳系中第五大的卫星。自古以来,关于月亮的传说,一直都源源不断。据科学家研究,从地球形成开始,月球就一直绕着地球做公转,并且永远只有一面向着地球。进入现火星上的春夏时节是什么样的?专家介绍火星上的温度和风速情况火星的春夏时节到底是什么样的?中国首次火星探测任务地面应用系统总设计师刘建军我们现在在火星上测了大概是在800帕左右,800帕是一个什么概念?我们通常以前都认为火星上的气压大概是我太阳射电斑马纹条纹之美与耦合之谜自从上个世纪四十年代美国科学家GroteReber利用自制的9。45米口径抛物面射电望远镜首次观测到很强的太阳射电信号并开启了太阳射电天文学以来,以时间为x轴频率为y轴并以太阳射电海到底有多深了?超出你的想像地球的表面的70都被海洋所包围,地球上水的90都是海水。所以地球其实就是一个海洋的星球。但是人类对海洋的了解非常的少。据说不超过5,这个比例和人对宇宙的了解差不多。那么海洋的平均的对无中生有的新思考如果我们将无中生有的无看做是无限,无中生有的有看做是有限。并比对我们现在的世界。就会有新的发现和见解。例如我们的地球,从空间上来讲它是无限的,谁都不可能从地球的一个方向一直走下去,你看了吗?木星四大卫星的捉迷藏大戏正在上演现代快报讯(记者阿里亚)8月22日木卫三全食木卫二8月23日木卫三偏食木卫二8月31日木卫三半影食木卫二8月的夜晚,木星的四大卫星玩得不亦乐乎,接连上演互掩互食天象。借助望远镜,公狩猎太阳系寂静的太空中,一艘巨大的飞船缓缓驶过,看它前进的方向,目标正是太阳系。月球人类基地,塔林科将军正在观看前方的大屏幕,屏幕中有一个小红点正在向着代表太阳系的圆环缓慢移动。距离我们还有
37岁南非妇女生下十胞胎一名南非妇女原本以为自己怀了8胞胎,但在剖腹产生下10个婴儿后,她创造了新的世界纪录。Ekurhuleni市Tembisa镇的TebohoTsotetsi说,他的妻子,37岁的Go互联网时代的德国新一代青少年阅读能力逐年下降PISA的一项特别评估测试显示中小学生们只有在必须要阅读的情况下才会去读书。调查显示中小学生们的阅读兴趣呈明显的下降趋势。在德国,几乎一半的15周岁少年在阅读文章时无法区文中的事实多管齐下这种哺乳动物有两条阴茎,每个阴茎上有两个头针鼹鼠看起来就像是刺猬,雌性还会长出育儿袋所以大家猜猜它们是哪个大洲上的哺乳动物?2012年,科学家发现澳洲的针鼹鼠原来长了个四头阴茎研究表明,雄针鼹鼠每次交配中交替使用它们,这对马克龙计划阻止欧盟使用英语,拼命推广法语法国计划利用担任欧盟理事会主席的机会阻止欧盟会议上使用英语,提高法语的重要性。马克龙政府寻求在英国脱欧后提高法语在欧盟文化的重要性。法国将于2022年担任欧盟理事会轮值主席国。法国SpaceX把水熊虫和鱿鱼幼苗带上了太空SpaceX上周四完成国际空间站第22次补给任务时,它携带了两类非常特殊的物种水熊和短尾鱿鱼(?bobtailsquid)。因为美国宇航局的研究人员试图了解太空飞行的条件会如何影响激光脉冲的速度超越了真空光速在完美真空中,光子的移动速度约为每秒30万公里。这是信息传播速度的严格极限。虽然这一定律不可能被打破,但光本身的一些特性并不遵循这一规则。操纵它们无法使我们提前达到外星,但可以为激科学家复苏了西伯利亚永久冻土下数万年前的轮虫数万年来,微小的生物被封在西伯利亚永久冻土下。科学家把它解冻后,多细胞动物不仅恢复了活力,而且还进行了繁殖表明存在一种机制,多细胞动物可在冷冻过程中避免细胞损伤。俄罗斯土壤科学物理天体物理学家首次模拟整片气态物质形成恒星的过程恒星的诞生是狂野又辉煌的历程。在密集的寒冷的气体和尘埃云中,历时数百万年。这不是一个我们能够从头到尾旁观的过程,但是一次壮观的模拟使我们比以往任何时候都更接近它们。利用被称为STA中国外卖员带女儿一起上班在中国东部的江苏省,有一名快递员被拍摄到带着两岁的女儿送食物。当这位父亲骑车穿过城市时,女婴被放在一个送货箱里。他在网上分享了自己的日常生活视频,在中国社交媒体上引起轰动。她是如此酒店有哪些事情是管理层不愿意让大众知道的?那些在五星级酒店工作的人们,酒店有哪些事情是管理层不愿意让大众知道的?我有个朋友在伦敦的一个小的奢侈酒店工作。他跟我说那里的前台系统根本就是胡闹。钱能买来任何东西。只要是客户想要的非常罕见潜水员被座头鲸误吞,又被吐了出来上周五上午8点前,资深龙虾潜水员迈克尔帕卡德(MichaelPackard)开始他当天的第二次潜水。他的船JanJ号停泊在鲱鱼湾海滩附近,周围有捕捞带鱼的船只。水温是适宜的60度,