GAN生成蛋白质?活性与天然蛋白相似
作者/文龙
从头设计用于催化所需化学反应的蛋白质一直是蛋白质工程领域的长期目标。尽管科学家们已经研究数十年之久,但迄今为止,在计算和实验上均未实现蛋白质序列与蛋白质功能之间的映射。
最近,立陶宛维尔纽斯大学和瑞典查尔默斯理工大学的研究人员联合开发了一种生成神经网络,该网络可以处理和「学习」不同的天然蛋白质序列,证明了人工智能快速生成高度多样化的功能蛋白的潜力。
相关研究成果于3月4日以「使用生成对抗网络扩展蛋白质序列空间」(Expanding functional protein sequence spaces using generative adversarial networks)为题发表在《自然·机器智能》(Nature Machine Intelligence)杂志上。
蛋白质属于大分子,结构高度复杂,并且可以在所有活的生物体体内发现。蛋白质由氨基酸通过肽键连接而成,具有多种功能和特性。不同氨基酸排列的特定顺序最终决定了蛋白质的3D结构、理化性质和分子功能。
另一方面,机器学习已经证明了在天然蛋白质序列中捕获其结构和进化信息的巨大潜力,但这些方法仅能预测给定蛋白质序列的特性。相比之下,生成性对抗网络(GAN)能够绕开巨大的蛋白质序列空间的实验筛选,直接从氨基酸序列推断蛋白质性质和功能,生成新型功能序列变体。
因此,该团队基于自注意生成性对抗网络(self-attention GAN)开发了 ProteinGAN。ProteinGAN 能够直接从复杂的多维氨基酸序列空间中学习蛋白质序列的进化关系,并创建具有天然蛋白质类似物理特性的具有特定功能的新的序列变体。
研究人员对用 ProteinGAN 生成的酶蛋白进行了实验,结果显示,ProteinGAN 产生的序列比训练数据中存在的序列多了高达四倍,具有新颖的结构。经质谱验证,所产生的酶具有特异性,显示出的反应产量和活性水平与对应的天然酶相似。
图示:生成的和自然序列的氨基酸对的相关性。(来源:论文) 对抗学习
负责这项研究的查尔默斯理工大学副教授 Aleksej Zelezniak 表示:「受AI最新发展的启发,特别是 GAN 可以生成逼真的照片,我们很想知道当前的AI技术是否准备好生产人类已知的最复杂的分子——蛋白质。」
ProteinGAN 使用的生成性神经网络基于对抗学习,保证了新产生的高度多样化的蛋白质序列具有与天然蛋白质序列类似的物理性质。
对抗学习可以看作是由两个人工神经网络「玩耍」的游戏。第一个网络被称为「生成器」,它生成特定类型的数据(例如,图像、文本),ProteinGAN 中的生成数据为蛋白质序列。第二个网络称为「判别器」,它试图区分由生成器创建的人工数据是否为真实数据。随后,生成器使用判别器提供的反馈生成新的数据,直到判别器无法识别生成的数据是人工生成的数据。
图示:ProteinGAN架构。(来源:论文)
Zelezniak 说:「通过反复地重复这一过程,两个网络都变得更好,直到无法将生成的序列与真实的序列区分开。使用我们开发的AI工具,我们能够生成活跃但不存在或尚未发现的功能蛋白。」 人工智能解决生物问题
Zelezniak 指出:「从洗衣粉到抗癌以及冠状病毒的治疗方法,蛋白质是我们日常生活中常用到的。」但是,创建功能性蛋白质序列是一项非常具有挑战性的任务,因为即使是给定序列的轻微改变也会使蛋白质失去功能。
ProteinGAN 证明了人工智能在序列空间允许的生物学限制内快速生成高度多样化的功能蛋白的潜力。将来,ProteinGAN 可以用于发现具有不同特性的新蛋白质序列,这可能对于满足生物医学和生物技术等领域的应用具有重要的价值。
Zelezniak 还表示:「我们实验室的研究专注于基于 AI 技术的人工合成生物应用。我们目前正在努力解决诸如塑料污染等新出现的问题,我相信人工智能将有助于建立更好的有机体,以适应这一特殊问题。」
论文链接:http://dx.doi.org/10.1038/s42256-021-00310-5
参考内容:https://phys.org/news/2021-04-proteingan-adversarial-network-functional-protein.html
汽车史上第一次真正的自驾游,两人一狗横穿美国一百多年前,汽车在美国也还是稀罕物件时,31岁的并不会开车的霍医生,因为一场赌约,驾驶着一辆温顿汽车开始了一场横跨美国的冒险之旅1hr1903年5月18日,在旧金山大学俱乐部里,大
路虎卫士90110插电混动版上市,捷豹路虎推出多款新车型2021成都车展,路虎推出多款重要新车2022年款全新路虎卫士90正式上市,售价69。8万至84。8万元中国市场首款卫士插电式混合动力车型2022款卫士110P400e登场,售价7
奥迪开启2021新生代车型家族粉丝盛典8月3日,一汽大众奥迪通过线上互动形式举行未来引力场暨2021奥迪新生代车型家族粉丝盛典,正式开启奥迪A3家族RS套件燃速型奥迪Q3家族RS套件燃速型预售,售价24。00万元31。
一汽丰田首款旗舰SUV车型正式下线8月16日,一汽丰田皇冠品牌在线上举行主题为至臻传奇一陆绽放的下线启航活动,宣布一汽丰田皇冠品牌旗下首款旗舰SUV车型皇冠陆放在天津市一汽丰田TNGA新一工厂正式下线。一汽丰田忠实
福特与SKInnovation合作投资114亿美元建立全新电芯生产基地2021年9月29日,福特汽车与SKInnovation宣布合作投资114亿美元,在美国田纳西州和肯塔基州建立整合电芯及整车生产链路的巨型园区(BlueOvalCity)和全新电芯
下半年手机市场大战打响!小米打出神仙秒充王牌,商标已申请iPhone13正式开售,手机市场下半年的大战就要打响了。现在的手机用户都比较在意电池和快充速度,现在大电池超级快充的组合也就成为了当下的主流。目前,排在第一梯队的都是各厂商百瓦级
减速机市场为何被日本占据工业机器人广泛应用于汽车制造电器设备生产食品机械加工等产业制造上,随着我国人工费用的增长,机器人替代人工的趋势越来越明显,而机器人生产出来的产品一致性好装配精度高等优点也越来越受到
美国科技禁令伤害了谁,促进了谁?ASML给出了答案美国科技禁令伤害了谁,促进了谁?ASML总裁温宁克给出了答案。他表示美国限制高端技术对华出口,将会加速中国实现科技自主,15年之内,中国将有能力制造所有产品。短期内看似伤害了中国,
中国有修建现代化万里长城的必要中国有修建现代化万里长城的必要刘大锦听说最近,西南边陲修建隔离墙。其实,我在5年前就设计了现代化长城图纸。中国从林则徐戒烟至今100多年了,我们把毒品戒掉了吗?今天,我提议修建长城
开普勒三定律的升华刘大锦开普勒定律,也叫行星运动定律。是行星绕太阳运动的三定律具体内容为1。行星沿椭圆轨道运动,而太阳则位于椭圆轨道的二个焦点之一。假如恒星静止没有运动,那么行星绕恒星的运动轨迹就是
一大波新大学正在筹建中,谁最有潜力?近年来,除了办学历史悠久实力雄厚的前浪高校在发力,各地许多后浪新大学也准备在各大城市纷纷问世。在刚刚过去的8月,就有云南体育大学西浦光线电影学院敦煌艺术大学等多所高校传出筹建动态。