范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

几何构象增强AI算法,百度生物计算研究成果登Nature子刊

  机器之心发布
  机器之心编辑部
  近日,百度在国际顶级期刊《Nature》旗下子刊 《Nature Machine Intelligence》(Impact score 16.65)上发表了 AI + 生物计算的最新研究成果《Geometry Enhanced Molecular Representation Learning for Property Prediction》,提出 "基于空间结构的化合物表征学习方法",即 "几何构象增强 AI 算法"(Geometry Enhanced Molecular Representation Learning,GEM 模型),揭示了一种基于三维空间结构信息的化合物建模方法,以及在药物研发中的应用。
  论文链接:https://www.nature.com/articles/s42256-021-00438-4
  公开资料显示,《Machine Intelligence》是《Nature》旗下专注于机器学习领域的顶级期刊,过去两年该期刊的影响因子已超过 16。在该项研究中,百度螺旋桨 PaddleHelix 团队首次将化合物的几何结构信息引入自监督学习和分子表示模型,并在下游十多项的属性预测任务中取得 SOTA,成为百度在 AI 赋能药物研发领域对外公开的又一项重磅成果。
  药研领域求变,AI + 生物计算成最佳选择
  众所周知,药物研发的成本高、周期长、风险高。据美国塔夫茨大学 2014 年的研究,新药进入市场的平均成本约为 26 亿美元,从首次合成到进入临床试验的平均耗时为 31.2 个月,从一期临床到上市长达 96.8 个月。另一方面,随着全球迈入老龄化社会,对新药的需求也在逐年增加,到 2024 年全球医药市场总规模将超过 11 万亿。与之相反,制药公司每 10 亿美元投资所获得的上市新药数量却在逐年下降。如何通过新的技术手段,快速找到有潜力的候选药物,降低进入临床试验失败的风险,就成为药物研发领域最亟需解决的问题。
  在计算方法出现之前,药物研发基本通过生物实验的方法来寻找药物,成本高昂且耗时长,随着计算化学和计算生物学的发展,也有通过传统机器学习方法辅助进行药物设计的,但这些方法或多或少在效果和效率层面有不足,以小分子为例,要找到一个候选药物,筛选(搜索)的数量级达到 10 的 60 次方,传统计算方法很难高效完成。另一方面,随着 AI 技术的发展和普及,药物研发也逐渐进入到 AI 时代,天生擅长处理大数据的 AI 深度学习技术,就成为近年来大家关注的焦点,希望通过 AI 新技术提升药物研发效率,减少后期失败概率,降低药物研发成本。
  化合物的性质预测的主要目的在于及时发现理化性质不达标的化合物,以降低候选化合物进入临床实验失败的风险,提升药物研发的成功率。传统的化合物性质预测分析一般采取实验方式,成本高昂且耗时长。业内也有一些基于 AI 算法的工作,但大多是使用化合物的二维信息,没有纳入化合物的三维空间结构信息。而百度首次提出,将化合物的空间结构信息引入到化合物预训练中,通过几何增强的自监督学习,对化合物分子进行表征,通过化合物的表征自主推断出空间结构信息,进而预测化合物分子的性质属性,以辅助进行药物研发,提升效率,降低成本。
  值得一提的是,该研究由百度螺旋桨 PaddleHelix 生物计算团队独立完成,并已经在药物研发领域,携手合作伙伴在早期药物研发管线中落地。
  百度 GEM 模型加速药物研发进程
  很多的研究工作都证明了机器学习技术,特别是深度学习在化合物性质预测方面的巨大潜力,这些工作使用序列(SMILES 表达式)或是图(原子为节点,化学键为边)来表示化合物,用序列建模或者图神经网络(GNN)去预测化合物的属性。有些研究直接把每个化合物看作一个图,利用基于图拓扑结构的自监督学习方法进行分子表征,比如,遮盖并还原化合物图中的原子,化学键或子结构。但是,这些方法都只把化合物视为拓扑图,没有充分利用化合物的几何结构信息。而化合物的几何结构,即三维空间结构,对化合物的物理,化学,生物等性质都起着关键性的作用,具有相同拓扑结构的两个化合物的空间结构可能完全不同。另一方面,由于生物实验复杂的操作和高昂的成本,化合物的标注数据十分稀少且珍贵。稀疏的数据让深度神经网络极易过拟合,难以发挥强大的建模能力,如何从海量的无标注化合物中学习高质量的化合物表征成为化合物建模和属性预测的关键。
  鉴于此,百度提出一种全新的基于空间结构的化合物建模方法——几何构象增强 AI 算法 GEM,并设计了多个几何级别的自我监督学习策略,用于学习化合物的空间结构知识,使得化合物的表征能自主推断出空间结构信息。这项技术在十多个基准的化合物属性预测数据集上均取得出色成绩,并成功应用到候选化合物的 ADMET 成药性预测任务上,取得良好收益。
  解读几何构象增强 AI 算法 GEM 模型
  几何构象增强 AI 算法 GEM 模型包含两个主要部分:基于空间结构的图神经网络(a)和多个几何级别的自监督学习任务(b)。
  图 1: GEM 的整体框架 基于空间结构的图神经网络
  由于化合物的集合结构可以完全被原子-化学键键长-键角确定。GEM 提出了一种基于空间结构的图网络,同时对原子-化学键-键角的关系建模空间结构信息。每个化合物由两个图组成:原子-化学键的图 G 和化学键-键角的图 H。类似于过往的工作,原子-化学键的图 G 以原子作为图的节点,化学键作为连接原子的边。而化学键-键角的图 H 则为首次引入,以化学键作为图的节点,两个化学键所形成的键角为图的边。图神经网络包含多轮迭代,而化学键作为每一轮迭代中图 G 和图 H 的桥梁进行信息互通。最后一轮迭代的表征被用于化合物属性预测。 基于空间结构的自监督学习
  为了使模型更好学习到化学空间知识,GEM 不单单只是将几何信息作为输入,更进一步地设计了基于几何信息的学习任务(目标):预测化学键的长度;预测化学键组成的键角;预测两两原子之间的距离。其中,键长和键角描述化合物的局部结构,而两两原子之间的距离更关注化合物的全局结构。描述局部结构的自监督学习任务随机挑选化合物中以某个原子为中心的子图并进行遮盖,预测被遮盖的子图中的化学键的键长和化学键间形成的键角。描述全局结构的自监督学习任务则预估原子距离矩阵中的元素。通过这些基于空间结构的自监督学习任务,图神经网络能够有效推断出化合物的空间信息,从而对化合物的表征带来正向影响。 实验结果
  GEM 在 14 个化合物属性的基准数据集中取得了最佳表现,这些数据集都是目前学术界公认的化合物属性预测数据集。例如,在毒性相关的数据集(tox21、toxcast)和 HIV(艾滋病)病毒数据集上,GEM 预测结果远优于其他 baseline 模型。总体而言,百度的 GEM 模型,在 ESOL、FreeSolv 等回归任务上相对现在方法提升 8.8%,在 BACE、BBBP、SIDER 等分类任务上相对提升 4.7%。此外,在自监督学习方法上的消融实验也证明了基于空间结构的自监督学习方法的有效性。
  落地 ADMET 成药性预测和药物筛选等场景
  几何构象增强 AI 算法 GEM,能很好的学习化合物的空间结构知识,自主推断出空间结构信息,从而准确地预测候选化合物的 ADMET 性质——吸收(Absorption)、分布(Distribution)、代谢(Metabolism)、排泄(Excretion)和毒性(Toxicity),帮助在药物研发早期快速筛选潜在成功率更高的化合物。据了解,百度的该项研究已经应用于药物研发领域,在合作伙伴的早期药物筛选管线中实现了商业化落地。
  此外,几何构象增强 AI 算法 GEM 还在药物虚拟筛选和药物联用方面,也起到关键作用。药物虚拟筛选是药物研发的重要一环,旨在通过从大规模的虚拟化合物库中找到与目标靶点有强亲和力的候选化合物。药物联用是通过预测两个药物在不同细胞系中的协同效用,以帮助找出给定药物在某一细胞系内中具有最佳协同作用。使得两种有协同效用的药物能够在保证治疗效果的同时,减少抗药性的产生。并通过降低使用剂量提升药物的安全性。
  关于百度螺旋桨 PaddleHelix
  螺旋桨 PaddleHelix 是基于百度飞桨深度学习框架打造,面向新药研发、疫苗设计、精准医疗等场景的生物计算平台,为生物医药领域的研究者提供全面的 AI + 生物计算的模型工具和技术方案。目前,螺旋桨 PaddleHelix 平台已开放多个模型,涵盖分子生成、虚拟筛选、ADMET 预测、蛋白 / RNA 结构预测、mRNA 序列设计、双药联用等方面。
  除此之外,在 PPI 蛋白-蛋白相互作用,组学的表征和精准用药等方面,螺旋桨 PaddleHelix 团队也开展了相关的工作,并在多个国际竞赛中取得佳绩,相关研究成果也将陆续开放给大家体验试用。未来,螺旋桨 PaddleHelix 生物计算平台,还将继续秉持开源开放的态度,继续携手合作伙伴赋能生物计算行业,共建 AI + 生物计算的生态和服务。
  基于空间结构的化合物表征学习方法 GEM 已通过螺旋桨 PaddleHelix 平台对外开放,欢迎大家使用。 GitHub 地址:https://github.com/PaddlePaddle/PaddleHelix 平台地址:https://paddlehelix.baidu.com/ 合作洽谈:baidubio_cooperate@baidu.com

你带的机械手表一天有多大误差?怎么样?天文台,一天快不到1秒!注意机械表本身就存在走时误差,如果机械表的走时误差在正常范围内则不需要担心。根据机械表所采用的机芯精准度不同,每个品牌或系列的误差范围都不同,需要根据购表时图片中是什么花,谢谢?感谢邀请专门卖花的老王说过这花的名叫腰缠万贯。当然这是商品名,为了销售,起个寓意美好的名称。谢邀!中文学名珊瑚树拼音shnhsh拉丁学名ViburnumodoratissimumK如果王某文控告周某涉嫌强制猥亵罪成立的话,华联男会无罪吗?阿里周女才是此案件的祸首元凶!强烈支持受害者上诉状告谎渣周女!狠毒莫过妇人心啊!可以想象今后职场拒绝女性,将是大势所趋,势在必行,成为全社会普遍共识!行业新规!否则男性将人人自危!是商流带动物流发展,还是物流支撑商流变革?这个问题问的不对,提问点把一句完整的不具备对立性的问题粗暴的割裂了。商流带动了物流的发展,物流支撑着商流的变革。物流本身属于辅助性的配套行业,随着商流的发展和商业模式的变幻,符合商第四次工业革命已经到来,无论9080后还是6070后,大家是否都处在同一起跑线上?第四次工业革命及对人才的要求第四次工业革命将会重新架构人类的生活工作学习和思维方式,并会改变人与世界的关系,特别是物联网还会改变万物之间的联系。大部分简单问题逐步被人工智能解决,大任正非和马云谁格局更大,为什么很多人说任正非的贡献大?任正非是优秀的战略家,这么说吧,在中国近现代史上,如果任正非说自己是排位第三的战略家,那一定没人敢说自己是排位第二的战略家。马云在企业经营发展的战术运用上,也是非常厉害的,但在战略穷人为什么穷?因为穷,才叫穷人。穷人翻身了,就不穷了。1因为穷人生下来就穷,原生家庭街坊四邻亲戚朋友,都穷。2因为穷人的父母,很多价值观和选择都是错的,导致儿女大概率也是穷人。3穷人,生活所迫,优爱腾芒与其抢救超前点播,不如重新定义会员模式本文来自微信公众号壹娱观察(IDyiyuguancha),文大娱乐家。果不其然,超前点播又一次引成为了众矢之的,而这一次是因为腾讯视频热播剧扫黑风暴采用的超前点播更新方式,又要求用强制安装软件谷歌被韩国罚款约1。77亿美元据美联社报道,韩国公平贸易委员会9月14日表示,由于美国谷歌公司将安卓操作系统强加给智能手机制造商,韩国已要求谷歌初步支付2074亿韩元(约合1。77亿美元)的罚款。报道称,这将是外卖平台的局,把千万骑手的责任拖累甩了出去当前一篇文章说中国互联网巨头只知道捞钱的时候,有粉丝反对,说了下面的话我觉得说的挺有道理,但是转念一想,当有人为你送外卖的时候,有人给你开车的时候,可曾想过这些人连基本的权益都没有无代码开发平台好用的,一定是要功能很强大,而且不需要写代码有什么推荐?OutSystems在功能广度上一骑绝尘OutSystems是快速应用开发的头号低代码平台,并且是2018年Gartner高生产力平台即服务魔力象限的领导者。OutSystems是
motorolaedgespro由内而外更进一步很少有人注意到,摩托罗拉换了一个新的口号POWERTOEMPOWER。这个口号,像极了多年前摩托罗拉全盛时期的口号LIFEMPOWERED。尽管在手机市场里可以算得上是最有资历的老半年前入手苹果11,现在才发现是翻新机,网友不怪你,太难辨认这届粉丝不好带,老是买到翻新机。是粉丝辨别能力太差吗?不是!是现在iPhone翻新技术太牛了,一般人根本就发现不了问题。如果你拿到iPhone是先看关于本机,再看验机报告。确认验机新冠源头查明?原来大家都被耍了,美国13年前就已合成冠状病毒正当全世界媒体都将目光聚焦到了美国德堡实验室时,一份来自于13年前的美国科学院研究院刊的期刊出现在人们的视线。在这份期刊中,刊登一篇有关于合成了SARS样冠状病毒的文章。这篇文章的华为能否彻底离开美国技术?注意是美国技术?除非说你准备回到原始社会,要不然的话,谁都不能彻底离开美国技术。别的不说了,就说咱们日常中需要用到的电吧!咱们用的电,不是交流电就是直流电,但无论是交流电还是直流电,其技术发明者都北京地铁可用数字人民币买票充值,已与重庆轨道交通乘车码互联互通昨起,北京轨道交通新增支持数字人民币线下购买票卡补票和充值,以及亿通行APP线上购票等场景的应用。这是继6月30日亿通行APP支持数字人民币刷闸支付后的一次升级,实现了数字人民币在想去海口旅游,有哪些景点推荐?海口游玩不一定非要去景点,我觉得随便选个地方就够老人转上半天,白沙门公园,可看南洋各树种,名花,可看海听鸟鸣。去金牛岭公园,可观三角梅展,细细品味几十种梅花,别有一番风味。晚上还可黄山上哪些景点不能错过?古人说五岳归来不看山,黄山归来不看岳,由此可见,黄山天下第一奇山的美称,并非浪得虚名了!如果,你准备去黄山旅游!如果,你正在为规划黄山行程而发愁!那么,下面这篇详细的黄山旅游攻略,广州老人必去景点有哪些?16年11月我和老伴到过广州旅游。在北京路七天住宿。坐地铁到过长隆动物园,黄埔军校旧址,莲花寺,广州塔,越秀公园,白云山,三元里,陈家祠,华南植物园,三六九步行街,中山纪念堂,荔枝去重庆旅游,有哪些旅游攻略值得推荐?网上重庆攻略很多,行程规划都很详细,我就不多说啦。今天就和大家分享重庆旅游心得,一些注意事项,避免踩雷。第一,喜闻乐见的景点注意项1。重点说在前面!!!!!!美心洋人街不存在了!!iPhone13到底香不香?发布前夕曝光汇总距离苹果iPhone13机型发布时间越来越近,随之而来的参数曝光也越来越多,那么传说中的iPhone13到底香不香?下面小编整合了最近关于iPhone13比较靠谱的消息,来看看它是iOS15Beta5来了,新变化都在这今天凌晨苹果向开发者推出了iOS15。0Beta5版本号为19A5318f距离上一次版本更新时隔14天本次版本更新主要对系统功能进行调整和部分已知问题进行修复。关机后仍可查找关机界