专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

蛋白质结构预测速度提升60倍!Meta做出生物界的ChatG

  智东西
  编译周炎
  编辑云鹏
  智东西3月24日消息,近日,《华尔街日报》在一则报道中,对Meta的ESMFold与DeepMind的AlphaFold两个蛋白质结构预测大模型进行了梳理,详细地介绍了二者的原理以及开发过程。
  报道称,此前,DeepMind解决了一个困扰科学家50年的难题,它使用AI代替此前速度较慢、成本较高的实验室技术,来确定蛋白质的三维结构。这些结构对药物和疫苗开发、气候变化研究等都至关重要。
  据悉,DeepMind的AlphaFold2首发于2021年7月,已被用于预测几乎所有已知的蛋白质结构。就在AlphaFold2推出的3个月后,Meta研究人员在Nature上发表论文。文章显示,Meta研究人开发了一种蛋白质结构预测模型ESMFold,预测了来自细菌、病毒和其他尚未表征的微生物的约6亿种蛋白质的结构。同时,在较短的氨基酸序列中,相较于AlphaFold2,其预测蛋白质结构的速度快了将近60倍。
  一、ESMFold加入战局,14天内预测超6亿种蛋白质结构
  从氨基酸序列中预测蛋白质结构是自然科学的重大挑战,从蛋白质的分子结构结构来看,蛋白质的分子结构可划分为四级,所谓的蛋白质的结构预测就是从蛋白质的一级结构预测其折叠和二级、三级、四级结构。根据不同的氨基酸和序列,蛋白质能折叠的构型数量是一个天文数字,使用AI的方法可以加速对蛋白质的解析。
  目前在基于进化的算法中,AlphaFold2通过在多序列输入、进化同源物对齐序列和可选结构模板上训练端到端神经网络,在预测蛋白质结构方面取得了一定成果。与AlphaFold2工作原理不同,ESMFold使用ESM2学习的信息和表示来执行端到端的3D结构预测。
  简单来讲,作为大型语言模型,ESMFold的原理与ChatGPT基本相似,只不过,训练它的内容不是自然语言,而是生物基因语言。它基于语言学习模型内部表征,而不是像AlphaFold2一样基于结构和序列匹配算法,这样就消除对显式同源序列作为输入的要求,即ESMFold蛋白质模型只需一个序列作为输入。同时ESMFold是一个完全端到端的序列结构预测器,可以完全在GPU上运行,无需访问任何数据库。
  研究人员曾经做过试验,在单个NVDIAV100GPU上,使用较少参数的ESMFold在14。2秒被对具有384个残基进行预测,可比单个AlphaFold模型能够实现的预测速度快6倍,而在较短的序列上,研究人员甚至看到约60倍的提速。
  据悉,ESMFold蛋白质模型背后的团队由MetaAI资深研究科学家AlexanderRives主导,该团队专注于大规模蛋白质序列和结构数据的无监督表示学习模型研究。
  2017年,欧洲生物信息研究所发布的显示了AlphaFold模拟人类的蛋白质结构,来源:法国新闻社
  MetaAI研究科学家AlexanderRives说:这些蛋白质极其多样,人类对它们知之甚少,为了数量规模庞大的蛋白质,研究人员需要在预测速度上取得突破。他还称,使用大型语言模型,ESMFold能够在两周内预测超过6亿种蛋白质。
  作为测试案例,MetaAI将ESMFold用于来自环境来源(包括土壤、海水、人类肠道、皮肤和其他微生物栖息地)的批量测序宏基因组DNA数据库。绝大多数编码潜在蛋白质的DNA条目来自从未培养过且科学未知的生物体。
  自从DeepMind取得突破以来,人们对AI在生物学中的应用产生了巨大的兴趣。AlphaFold是蛋白质结构预测方面取得的一大进步,这也进一步激发了深度学习的浪潮。
  二、曾取得CASP最好成绩,AlphaFold将被用于治疗疾病
  目前,DeepMind开源了AlphaFold2的代码,让社区可以免费使用,目前约2。4亿的几乎所有已知的蛋白质都可以查到。此前,研究人员花费几个月或几年时间才能预测蛋白质的结构。投资生命科学技术的成长型股票公司BiospringPartners联合创始人詹妮弗卢姆(JenniferLum)称,AlphaFold缩短了这个过程,使这些团队能够将他们的时间转移到下游的研究和产品开发上,进入其他增值领域。
  2018年,AlphaFold1在两年一度的CASP实验中取得了最好的成绩。团队又花了大量时间跟踪CASP,尝试不同的方法来改进AlphaFold,测试它们是否可以匹配实验蛋白质结构的准确性。
  Jumper称,这个团队一直工作到2019年,他才真正相信这个团队能够完成它的使命。传统而言,生物学家使用基于X射线和其他技术的实验室技术来理解单一蛋白质结构,但据Jumper称,这一过程不仅要花费数年时间,还活花费10万美元。
  JohnJumper领导了机器学习应用蛋白质生物学的新方法开发,来源:DeepMind官网
  虽然计算方法在理解蛋白质结构方面取得进展,但是目前这项技术还不够完善。无法取代实验室方法。最初的AlphaFold模型试验AI预测氨基酸对之间的距离,第二步利用这些距离分布来得到蛋白质的预测结构。其中第二步涉及到AlphaFold,它利用这些信息,提出了一个关注蛋白质是什么样子的共识模型,而无需AI。
  Jumper称,研究小组正在把注意力转向蛋白质创新的新挑战。研究小组正在寻求了解突变与蛋白质功能变化之间的联系,这可以帮助治疗疾病。
  结语:AI赋能药物研发具有巨大潜力
  作为蛋白质结构预测大模型,ESMFold在速度上快于AlphaFold2约60倍。如果在实际计算中,这一速度优势表现得更加明显。同时推断速度优势使得基于计算有效映射大型宏基因组序列数据库的结构空间成为可能。
  ESMFold还可以被用于进行快速准确的结构预测,进一步帮助发现新的蛋白质结构和功能。未来,ESMFold或将超越预测蛋白质的静态结构,进一步研究蛋白质的动态结构。当这两个领域的研究都完成后,通过AI赋能新药设计就具备了基础,而从长远看,这具有巨大的潜力。

三亚海滩上,挤满了阳康们!当全国文旅人翘首以盼,等待解封后的春天时,三亚率先尝到了旅游复苏的甜头。近日,阳康们涌向海南三亚话题冲上了社交平台热搜,据媒体报道,近几天,三亚多家酒店出现了满房的情况,有当地民宿茶卡盐湖景区入选2022年度携程口碑榜日前,携程全球合作伙伴峰会公布2022年度携程口碑榜榜单,茶卡盐湖景区入选携程口碑榜2022年度山水景点。茶卡盐湖小火车。图片由茶卡盐湖景区提供携程口碑榜单是对过去一年内旅行者综合出境游春天即将到来全面复苏仍有深远挑战看到国家卫健委公告深夜刷屏,杭州的上班族李丹(化名)的第一反应是通关了,三年了,不敢相信。卫健委12月26日公告显示,自2023年1月8日起,取消来华人员入境后全员核酸检测和集中隔爬虫的异步实现aiohttp库学习在协程基础学习(python协程基础学习)中,我们学习到requests。get()也会使程序处入阻塞状态,从而无法实现异步。因此需要引入提供异步Web服务的aiohttp库。由此RedmiK60Pro值不值得购买?真实体验一周之后,答案出炉昨晚的RedmiK60系列发布会大家都看过了吧?卢总打扮得非常帅气,但哪怕他穿得这么帅,在使用了一周RedmiK60Pro之后,我还是该说什么说什么,不会偏袒他的。对于Redmi这Python面向对象详解下面从这几个方面来详细详解Python面向对象初识对象成员方法类和对象构造方法其它内置方法封装继承类型注解多态综合案例一初识对象生活中数据的组织学校开学,要求学生填写自己的基础信息这些人小心重阳!张伯礼最新提醒不少人担心,如果新冠病毒的毒株不同,是否会再次被新冠病毒感染?据科技日报报道,近日,中国工程院院士张伯礼就二次感染的相关问题进行了解答再次感染新冠病毒的概率主要与人体免疫水平病毒株总榜额2200万元!邵东发布4个揭榜挂帅科技项目红网时刻新闻12月28日讯(通讯员刘旭东姚知知赵宇峰)你有难题发榜,我凭本事揭榜。12月28日上午,邵东市首批揭榜挂帅科技项目新闻发布会召开,会上,邵东市发榜了今年4个揭榜挂帅项目混合动力汽车的未来最近大家都在关注今后的新能源混动车型的上牌问题,可能以后不在有绿牌的出现,需要跟普通燃油车一同拍牌了。如实如此的话可能对销售厂商来说会带来一定的影响,但我认为仅仅是短期的和微弱的影规范互联网宗教行为,网络不是法外之地2021年12月3日,国家宗教事务局令第17号公布了互联网宗教信息服务管理办法,该办法自2022年3月1日起施行。该办法由国家宗教事务局国家互联网信息办公室工业和信息化部公安部和国红星美凯龙拉响债务警报作者连禾编辑贾乐乐一纸公告,让家居龙头美凯龙一天跌了近5个点。12月26日,家居龙头美凯龙股价跳空低开,早盘震荡,跌幅一度下探至5。87最终收于4。71元,跌幅4。66。股价波动的
科莫多巨蜥的毒液到底有多可怕?2009年,一名31岁的渔民安瓦尔,在印尼科莫多岛上采摘水果,结果不小心从水果树上掉了下来,刚好踩到了一只巨型蜥蜴,蜥蜴瞬间就朝他扑了过去,咬住了他的腿,之后又咬住了他的手臂,身体武汉未来的房价会涨到100000元平米吗?这个问题的答案是肯定的!以目前的趋势,未来武汉房价必然达到10万的水平,只是时间长短的问题。2010年至2017年,短短七年间,武汉的房价已经翻了3番,目前,武汉部分高端楼盘如洞庭兰州青白石片区,中央公园怎么样?兰州北拓的黄金区域,目前基础交通还跟不上建设需要,交通滞后可能会成为十四五期间兰州青白石片区发展的的最大障碍!不过就兰州地理位置和城区格局而言,青白石片区是离主城区最近的待开发区域农民为什么不在国家统计失业范围之内?中国有四个儿子,大儿子叫工人,二儿子叫子弟兵,三儿子叫公务员,四儿子叫农民,所以四儿子就没有纳入统计失业包括养老金范围,因为四儿子有金山银山还有三分地。农民有土地,这是农民可以赖以农村成立社区是什么意思?很多农村驻有村委会办公室,同时也驻有社区管理委员会办公室,特别是在城市郊区的农村和街道的农村都同时设立了村委会和社区管理委员会,很多人弄不明白是怎么回事。那农村成立社区是什么意思呢农村里的剩男,为何一剩再剩呢?到底是什么原因?男女比例失调。计划生育只要一个孩子时,受封建思想影响,都拚命要男孩,等他们长大了,很难找到媳妇。一,农村姑娘远嫁,二,女孩见少,三,彩礼高,四,剩男挣钱少。我就一大龄剩男!个人亲身抖音付费直播试水,看直播要给钱了?我们应该如何思考?使劲收,最好是家人们看的话,一分钟100块钱。毕竟粉丝听话的很。毕竟人设都设计好了打PK,卖货摆错价格,怒亏2个亿回馈粉丝。没事就怼工厂,怼员工反正就是赔钱回馈粉丝。赔完还得补交税马上就要退休了,退休工资才3650元太少了,怎么办?3600不少了。我企业工龄32年,退休时退休金只有2200,涨了这么多年还不到3000。知足常乐吧!如果身体不好,这些钱也够生活了,如果身体还可以,就找一些力所能及的工作,打打工补南宁五象新区未来的发展潜力很大吗?五象新区无法成为国家级新区!!!目前看来,五象新区的潜力也就这样了。我们对比一下贵阳的贵安新区,贵安新区的面积是1700平方公里,由贵阳市的郊区和安顺市合并得来。是全国第8个国家级如果把三峡大坝加高10米,截留更多的洪水,可行吗?我国的三峡大坝,作为当今世界上最大的水利枢纽工程,位于湖北省宜昌市上游,距下游葛洲坝水电站38公里,三峡大坝全长2309米高185米,呈梯形形状,集发电旅游航运调控洪水于一身。三峡大家有经历过亲人去世吗?是怎样走出痛苦和想念的?2018年9月1日下午3点8分,我的妻子在医院里停止了呼吸。她的眼睛没有闭上,我流着泪,帮她合上了双眼。我永远失去了我最亲近的爱人,孩子永远的失去了妈妈。一位好妻子,好女儿,好姑妈
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网