范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

一天之内两大AI预测蛋白结构算法开源,分别登上NatureScience

  机器之心报道
  机器之心编辑部
  这是科学激动人心的新一步。
  使用 DNA 序列预测蛋白质形状的 AphaFold2,终于开源了。
  众所周知,蛋白质是生命活动的基本组件,它们可以单独存在,也会协同工作。为了发挥作用,这些长链氨基酸扭曲、折叠并交织成复杂的形状,这些形状可能很难,甚至根本不可能破译。
  科学家们一直在梦想通过基因序列简单地预测蛋白质形状——如果能够成功,这将开启一个洞察生命运作机理的新世界。然而近五十年来,人们的进展缓慢。
  7 月 15 日,《自然》杂志一篇论文被接收的消息引发了人们的关注,谷歌旗下人工智能公司 DeepMind 在研究《Highly accurate protein structure prediction with AlphaFold》中宣布,人们首次发现了一种通过计算来预测蛋白质结构的方法。即使在不知道相似结构的情况下,AI 也可以在原子层面上精确预测蛋白质结构。也就是说,之前备受关注的 AlphaFold2 终于开源了。
  无独有偶,作为相当热门的研究领域,Science 同样在今天发表了一篇论文,介绍并开源了一个可媲美 AlphaFold2 的新工具 RoseTTAFold。
  所以说,赛马了,感兴趣的同学可以自由选择。
  AlphaFold2 开源,原子精度预测蛋白质结构
  2020 年 12 月的国际蛋白质结构预测竞赛 CASP ,一项重磅成果引发了科技界所有人的关注:由 DeepMind 开发的 AlphaFold 2 击败一众选手,在准确性方面达到比肩人类实验结果,被认为是蛋白质折叠问题的解决方案。
  在两年一次的 CASP 竞赛中,各组争先预测蛋白质的 3D 结构。2020,AlphaFold 击败了所有其他小组,并在准确性方面与实验结果相匹配。它能以就计算机方法而言前所未有的准确度根据蛋白质的氨基酸序列预测其三维结构。
  这破解了出现五十年之久的蛋白质分子折叠问题,同时证明了 AI 对于科学发现,尤其是基础科学研究的影响。
  科学家们纷纷表示,这项突破极具意义。Alphafold 的突破性研究成果将帮助科研人员弄清引发某些疾病的机制,并为设计药物、农作物增产,以及可降解塑料的「超级酶」研发铺平道路。
  因此,这段时间以来,科研圈也在等待 AlphaFold 2 的技术细节。
  不久之前,Demis Hassabis 就曾在 Twitter 上表示 DeepMind 将开源 AlphaFold2,如今终于兑现承诺。
  7 月 15 日,Demis Hassabis、John Jumper 等人在 Nature 杂志上发表了文章《Highly accurate protein structure prediction with AlphaFold》,描述并开源了 AlphaFold2,它预测的蛋白质结构能达到原子水平的准确度。
  链接:https://www.nature.com/articles/s41586-021-03819-2开源地址:https://github.com/deepmind/alphafold
  在文章中,DeepMind 表示 AlphaFold 可以周期性的以原子精度预测蛋白质结构。在技术上,AlphaFold 利用多序列对齐,进行深度学习算法的设计,还结合了关于蛋白质结构的物理和生物学知识提升效果。
  作为通讯作者之一,Demis Hassabis 在一段声明中写到,「去年在 CASP14 大会上我们揭晓了一个可以将蛋白质 3D 结构预测精确到原子水平的全新 AlphaFold 系统,此后我们承诺会分享我们的方法,并为科学共同体提供广泛、免费的获取途径。今天我们迈出了承诺的第一步,在《自然》期刊上分享 AlphaFold 的开源代码,并发表了系统的完整方法论,详尽细致说明 AlphaFold 是如何做到精确预测蛋白质 3D 结构的。作为一家致力于推动科学进步的公司,我们期待看到我们的方法将为科学界启发出什么其他新的研究方法,也期待很快能和大家分享更多我们的新进展。」
  AlphaFlod 首次参加 CASP 就在 98 名参赛者中名列榜首,准确地从 43 种蛋白质中预测出了 25 种蛋白质的结构。而同组比赛中获得第二名的参赛者仅准确预测出了 3 种。AlphaFold 专注于从头开始建模目标形状,且并不使用先前已经解析的蛋白质作为模板。在大多数情况下,AlphaFold 的准确性与实验相媲美,大大优于其他方法。
  图 1:AlphaFold 产出高准确度的架构。
  AlphaFold 网络直接预测给定蛋白质的所有重原子的三维坐标,使用基本氨基酸序列和同源序列的对齐序列作为输入 (如图 1e)。
  AlphaFold 网络由两个主要部分组成。首先,网络的主干通过一个称为 Evoformer 的新神经网络块的重复层来处理输入,产生一个 Nseq × Nres 阵列 (Nseq: 序列数,Nres: 残差数) ,它表示一个处理过的 MSA 和一个表示剩余对的 Nres × Nres 阵列。Evoformer 块包含许多新颖的基于注意力和非基于注意力的成分,它的关键创新是与 MSA 交换信息的新机制,并能直接推理空间和进化关系的配对表征。
  网络的主干之后是结构模块(Structure Module),该模块以蛋白质的每个残基的旋转和平移的形式引入了显式的 3-D 结构。这些表征在微不足道的状态下初始化,所有旋转设置为同一性(identity),所有位置设置为原点,但能够快速开发和完善具有精确原子细节的高度准确的蛋白质结构。这部分网络的关键创新包括打破链原子结构,允许同时局部细化结构的所有部分,一个新的「equivariant transformer」允许网络隐式地推理未表示的侧链原子,以及损失项可对残基方向的正确性赋予重要权重。
  图 3:架构细节
  图 4:解释神经网络
  更多细节大家可以查看 Nature 原文与 DeepMind 提供的补充材料。
  最后提一句,也不知是何原因,该论文未经编辑就出版了(5 月接收、7 月发表),难道是知道今天 Science 也将发表论文介绍一个可与 AlphaFold2 相匹配的研究?也就是下面这一篇。
  华盛顿大学等开发媲美 AlphaFold2 的新工具 RoseTTAFold
  DeepMind 在 2020 年的 CASP14 会议上展示了其在该领域的显著成果 AlphaFold2,当时该技术在预测蛋白质方面取得了排名第一的准确率。
  华盛顿大学医学院蛋白质设计研究所(Institute for Protein Design)的研究者们很大程度上重现了 DeepMind 在蛋白质预测任务上的表现,他们联合哈佛大学、德克萨斯大学西南医学中心、剑桥大学、劳伦斯伯克利国家实验室等机构研发出了一款基于深度学习的蛋白质预测新工具 RoseTTAFold,在预测蛋白质结构上取得了媲美 AlphaFold2 的超高准确率,而且速度更快、所需要的计算机处理能力也较低。
  这项研究已经在 Science 上发表。
  论文链接:https://science.sciencemag.org/content/early/2021/07/14/science.abj8754
  华盛顿大学医学院团队也向社区开源了该工具,来自世界各地的科学家都可以使用它来构建蛋白质模型,加速自己的研究。在上传至 GitHub 后不久,该工具就已被 140 多个独立研究团队下载。
  项目地址 https://github.com/RosettaCommons/RoseTTAFold
  具体地,在这项研究中,华盛顿大学医学院生物化学系教授、蛋白质设计研究所所长 David Baker 领导的计算生物学家团队开发了一款叫做「RoseTTAFold」的软件工具,该工具利用深度学习技术,根据有限信息准确、快速地预测蛋白质结构,原本这一工作需要数年的实验室研究。
  从结构上来看,RoseTTAFold 是一个三轨(three-track)神经网络,意味着它可以兼顾蛋白质序列的模式、氨基酸如何相互作用以及蛋白质可能的三维结构。在这种结构中,一维、二维、三维信息来回流动,使得网络能够集中推理蛋白质的化学部分与它的折叠结构。
  下图 A 为具有 1D、2D 和 3D 注意力轨迹(attention track)的 RoseTTAFold 架构;B 为 CASP14 目标上蛋白质预测方法的平均 TM-score;C 为 CAMEO 中介(medium)和硬(hard)目标的盲基准测试结果。
  RoseTTAFold 方法的准确率比目前可用的方法高得多,因而研究者想要测试是否可以利用它解决以前未解决且具有挑战性的 MR 问题,并改进临界个案的解决方案。四个最近的晶体数据集,包括牛属甘氨酸 N - 酰基转移酶(GLYAT)、细菌氧化还原酶以及细菌表面层蛋白(SLP)(下图 A)和来自真菌平革菌属金孢子菌属的分泌蛋白(下图 B),基于 PDB 蛋白质数据库中可用的模型无法利用 MR 解决,因此研究者使用 RoseTTAFold 模型进行了重新分析:
  另一方面,RoseTTAFold 能够利用一台游戏计算机在短短 10 分钟内计算出蛋白质结构。研究者使用 RoseTTAFold 计算出了数百种新的蛋白质结构,其中包括许多人类基因组中认知甚少的蛋白质。此外,他们还生成了与人类健康直接相关的一些蛋白质结构,包括与有问题的脂质代谢、炎症和癌细胞生长相关的蛋白质。他们还表明,RoseTTAFold 可以用于建立复杂生物的模型,所需时间只是以前所需时间的一小部分。
  下图为使用 RoseTTAFold 的蛋白质预测流程。其中,A 和 B 是从序列信息中预测大肠杆菌蛋白复合物的结构;C 表示由 RoseTTAFold 生成的 IL-12R/IL-12 复合结构符合以前发表的低温电子显微镜(cryo-EM)密度(EMD-21645)。
  论文一作、华盛顿大学博士后研究员 Minkyung Baek 表示:「我们希望这个新工具将造福整个研究领域。」
  参考链接:
  https://newsroom.uw.edu/news/accurate-protein-structure-prediction-now-accessible-all
  https://www.nature.com/articles/s41586-021-03819-2

宇宙大爆炸与空时代在宇宙大爆炸之初,无数的量子涨落产生了无数正负电子对,它们中的大多数都很快地又湮灭了,仅有极少数得以分开从而存在更长的时间,或许到宇宙的终结,或许到某个粒子加速器,或许到宇宙深处,高中地理试题解析第84题(地球公转小行星带太阳活动)知识点八大行星太阳系共有八大行星,距离太阳从近到远分别为水星金星地球火星木星土星天王星海王星。在火星和木星之间,存在着小行星带。八大行星的自转公转特点如下自转金星自东向西,天王星躺为什么要用概率描述微观粒子的状态?难道上帝真的掷骰子吗?量子力学到底有多诡异?已经诞生一百多年的量子力学,至今也没有被完全搞明白。难怪有物理学大佬这样描述量子力学的诡异性如果你首次接触量子力学,没有感到困惑的话,那你一定没有搞懂量子力学科学家在仙女座大星系中探测到可能的中等质量黑洞宇宙中有许多恒星质量黑洞,质量达数十倍的太阳质量,是由大质量恒星坍缩而成。还有更容易被观察到的超大质量黑洞,质量为数百万至数十亿倍于太阳,座落于星系的中心,形成的原因尚未厘清。由于重力信号可以光速探测地震来源科学网世界上最大的构造板块在日本海岸附近震动两分钟后,日本气象厅向大约5000万居民发出了最后警告8。1级地震引发的海啸正向海岸逼近。但直到海浪到达数小时后,专家们才估算出20人类为什么不愿深入研究金星?越了解金星,便越觉得绝望科学家曾经对金星寄予厚望,认为这会是人类的第二个家园!探测的结果却让科学家无比失望,金星的自然条件比想象中还要恶劣。太阳系八大行星里面,金星是距离地球最近的行星。金星在夜空中的亮度美国为外星人开会,其实是为了转移视线5月17日,美国国会将举行不明飞行物(UFO)相关的公开听证会。你没看错,美国国会为了外星人专门开会讨论。这是福克斯新闻网发布的新闻,真实性肯定没疑问。外星人一直是个充满神秘感的话河南多地市民寻找陨石陨石中含有什么神奇的物质难道含有黄金据了解,11月29日凌晨206分,河南的漯河驻马店南阳等地,夜空被不明物照亮,也有说有民众拍到了流星坠落的画面,后经有关航天局证实,有一颗小星星在河南上空发生分裂爆炸,直径约在0。俄联盟MS20号载人飞船乘员进入国际空间站中新社莫斯科12月8日电(记者田冰)俄罗斯国家航天集团公司8日消息称,俄罗斯联盟MS20号载人飞船与国际空间站成功对接,三名乘员进入空间站。莫斯科时间8日16时40分许,俄罗斯联盟这些上亿年前的宝贝,有的已被烧成了砖头这里,到处都是宝贝路边其貌不扬的小山坡随手一挖便是上亿年前的古生物化石红砖厂旁边裸露的石层里三叶虫角石等几亿年前的化石随处可见这里是贵阳市青岩古生物化石群也是贵州省重点古生物化石产量子计算简史最近几年,量子理论与技术蓬勃发展,藉由量子的神秘力量人们将有机会在不同领域当中实现许多以往无法想象的应用,也因此建构完善量子产业链已成为国家与企业之间争相发展的重点项目之一,甚至成
凤凰端子真的好用吗?接线端子被广泛的应用在各个领域,下面我来说说凤凰端子的优缺点都有哪些。接线端子是属于电器上的一个接口类零件,主要可以划分为信号端子,电力端子,以及连接端子。凤凰端子的优点1。凤凰端鹅厂机器狗来了!会武功能走梅花桩说到机器狗,相信很多人都会第一时间想起这只Spot机器狗。哦,不对,放错图了应该是这只!售价为7。45万美刀,折合人民币53万软妹币。确实很贵,但是别忘了它能开门跳舞旋转跳跃和太空新突破!英国电子皮肤可附于机械手臂人造皮肤领域材料大师化学家斯坦福大学化学工程系系主任鲍哲南曾这样描述她在电子人造皮肤领域的研究初衷。在鲍哲南等科学家的设想中,这种黑科技能够协助假肢理解触摸弯曲或按压等动作,因此配德国逆天的仿生机械,这才是真正的黑科技FESTO是一家在自动化技术和仿生技术上造诣很高的德国企业,特别是在仿生领域,火遍大江南北。它是由AlbertFezer和GottliebStoll创建于1925年,公司名字由两位编程与数学可以用编程来验算概率作业(Scratch版)大学有概率与统计课,当然会有作业。做概率作业与做其它作业不一样,常常会吃不准,自己做对了还是做错了?其实,编程可以用来验算你的概率题。这里先举一个很简单的例子。两个骰子一起抛,求点RISCV基础指令集将扩展,类似DSP来源内容由半导体行业观察(IDicbank)编译自theregister,谢谢。RISCV看起来将被扩展,旨在为更小的设备上的应用程序带来更多的计算能力。这个被称为的Zve软件指令祖传驱蚊秘笈,教你轻松制服深夜在耳边低语的仙女这里是小怪兽的不正经科普第二期,第一期的内容过于刺激,怕大家接受不了,所以这次我们学点温和而有用的知识。好像从5月20号开始,无数的商家就开始为了618购物节造势,什么情侣打折,第6意外的事情表明婚姻不会长久每个人都想要一生挚爱,但实践表明,这种场景是严酷现实中罕见的例外。在欧洲,过去50年里,人们离婚的频率增加了2。5倍儿,结婚的次数减少了2倍。好消息是预测离婚是可能的,并得到科学研埃及女祭司再现人间?生前专业成就非凡,就因相信自己的前世你相信这个世界存在转世轮回这样的事情吗?网络上流传了很多的号称真实的转世案例,但是大部分是不好考证的,就算有一些证据,也是科学界不能承认的,可是却有这么一个人,凭借自己前世的记忆,美国面面观没有残疾的孩子,只有残疾的教育美式大学教育(上)(思进注最近,各类美国衰败了的文章很多,有些分析是事实的陈述逻辑自洽,不过,有些判断可能失之偏颇。恰好我和庞忠甲先生在10年前合著的美国凭什么(2012年出版)介绍了美国的方方面面强势美国面面观没有残疾孩子,只有残疾的教育教育是强大之源(思进注最近,各类美国衰败了的文章很多,有些分析是事实的陈述逻辑自洽,不过,有些判断可能失之偏颇。恰好我和庞忠甲先生在10年前合著的美国凭什么(2012年出版)介绍了美国的方方面面