范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

谷歌AI加入蛋白质解析大军ProtENN模型助增680万个蛋白质注释词条,登顶Nature子刊

  要说"AI for Science"的扛大旗者,大家也许都会首先想到 DeepMind:
  2018 年,DeepMind 推出蛋白质折叠结构预测模型 AlphaFold,从氨基酸序列计算预测蛋白质结构,不仅为 Alpha 系列锦上添花,奠定了其在 AI 创新上的领头羊地位,还彰显了深度学习攻破其他领域难题的潜力。
  AlphaFold 出世后,"AI for biology"(将人工智能用于生物学研究)成为人工智能领域的研究潮流,吸引了世界各地的优秀研究者投身其中。
  谷歌 AI 也是其中之一。
  这不,最近谷歌便发布了用于蛋白质解析的机器学习模型 ——ProtENN ,登顶 Nature 子刊《Nature Biotechnology》。
  地址:点此查看
  值得注意的是,早在 2019 年,谷歌 AI 就在bioRXiv发过 ProtENN 的预印本,不知是不是最近才被 Nature 接收?
  蛋白质结构对生命有着至关重要的作用,了解蛋白质的氨基酸序列(如其结构域)与功能之间的关系是一项具有重大科学意义的长期挑战。
  自计算机兴起,科学家们就开始尝试用计算工具助攻该课题。例如,被广泛使用的蛋白质家族数据库 Pfam 便囊括了大量详细描述蛋白质结构功能的计算注释,例如珠蛋白与胰蛋白酶家族。但发展至今,目前至少仍有三分之一的微生物蛋白质的注释有待完善。
  而据谷歌 AI 的官博介绍,ProtENN 的出现,能够为完善蛋白质结构的计算注释 起到重要作用。蛋白质注释
  根据谷歌 AI 介绍,他们所提出的 ProtENN 方法可以帮助在 Pfam 的蛋白质功能注释集中添加大约 680 万个条目 ,大约相当于过去十年的新增条目总和,将 Pfam 的覆盖范围扩大了 9.5% 以上。
  他们将其命名为:Pfam-N。
  在计算机视觉中,模型通常首先用于图像分类任务的训练,如 CIFAR-100,然后将其扩展到更专业的任务,如物体检测和定位。
  受此启发,谷歌团队也决定开发一个蛋白质域分类模型,在给定蛋白质结构域的氨基酸序列的情况下,从 17,929 个类别(所有类别都包含在 Pfam 数据库中)中预测单个标签。
  目前有许多模型可以用于蛋白质结构域分类,但当前最前沿的方法也存在许多缺陷。
  首先,它们基于线性序列的比对,并且不考虑蛋白质序列不同部分的氨基酸之间的相互作用。然而,蛋白质不仅仅停留在一行氨基酸中,还会折叠起来,这样不相邻的氨基酸也会相互影响。
  此外,当前最前沿的方法是将新的查询序列与一个或多个具有已知功能的序列进行比对。如果新序列与任何具有已知功能的序列高度不同,这种对具有已知功能的序列的依赖就会加大预测新序列功能的难度。
  另外,基于比对的方法需要密集的计算量,将它们应用于大型数据集(例如包含超过 10 亿个蛋白质序列的宏基因组数据库 MGnify)时,成本会非常高昂。谷歌 AI 怎么做?
  为了解决这些问题,谷歌团队想到了使用扩张卷积神经网络 (CNN),因为"它非常适合模拟非局部成对氨基酸的相互作用,并且可以在 GPU 等现代 ML 硬件上运行"。
  他们训练了一维 CNN (称之为"ProtCNN ")来预测蛋白质序列的分类,以及一组独立训练的 ProtCNN 模型(称之为"ProtENN"),目的是通过开发一种可靠的机器学习方法来补充传统的基于对齐的方法的缺陷。
  与其他领域的分类问题相似,蛋白质功能预测的挑战不在于为任务开发全新的模型,而更多在于创建公平的训练和测试集,以确保模型能够对看不见的数据进行准确的预测。
  由于蛋白质是从共同的祖先那进化而来的,因此不同的蛋白质通常共享一大部分氨基酸序列。如果不加以注意,测试集可能会被与训练数据高度相似的样本所控制,从而使模型可能仅通过简单地"记忆"训练数据而不是学习来泛化模型的优异性能。
  为了防止这种情况,研究者必须使用多个单独的设置来评估模型性能。在每次评估中,他们都将模型精度分层为每个保留测试序列与训练集中最近序列之间的相似性函数。
  第一个评估包括一个聚类分裂训练和测试集 ,与先前研究者提出的方法一致。其中,蛋白质序列样本按序列相似性进行聚类,并将整个聚类放入训练集或测试集中。由此,每个测试示例与每个训练示例之间至少有 75% 的差异。在此任务上的出色表现表明,他们所提出的模型可以泛化、以对分布外的数据做出准确的预测。
  ▲谷歌团队创建了一个测试集,使 ProtENN 能够很好地泛化远离训练集的数据
  在第二次评估中,他们使用随机拆分的训练和测试集 ,根据对样本分类难度的评估来对样本进行分层。难点主要有两点:1)测试示例与最近的训练示例之间的相似性;2)真实分类的训练示例数量(这比在仅有少量训练示例的情况下准确预测函数要困难得多)。
  他们还评估了最广泛使用的基线模型和评估设置的性能,特别是以下基线模型:(1) BLAST,一种使用序列比对来测量距离和推断函数的最近邻方法;(2) TPHMM 和 pmmer。每一个模型都包括基于上述序列比对相似性的模型性能分层。
  他们将这些基线与 ProtCNN 和 CNN 的集合 ProtENN 进行了比较。实验表明,ProtENN 的泛化能力高于 ProtCNN 与两类基线模型。
  ▲谷歌团队衡量了每个模型的泛化能力,从最难的例子(左)到最简单的例子(右)
  他们与 Pfam 团队合作,测试 ProtENN 是否适用于标记真实世界的序列。
  实验证明,ProtENN 学习到基于比对的方法的互补信息,并创建了两种方法的集合,标记比任何一种方法都多的序列。他们公开发布了这项工作的结果 ——Pfam-N,其包括 680 万个新的蛋白质序列注释。
  目前,ProtENN 模型的架构已在 github 上开放。此外,他们还设计了一个交互工具 ProteInfer,用户可以在浏览器中输入蛋白质序列,并实时获得蛋白质功能预测的结果:
  项目地址:点此查看
  AI 解析蛋白质还能更卷吗?大家怎么看?

石头扫地机器人T6S5年货节特惠到手价2399元1999元IT之家1月1日消息备受欢迎的石头扫地机器人T6S5迎来年货节特惠,只需要2399元1999元就能到手,感兴趣的小伙伴可以关注一下。石头科技扫地机器人T6系列拥有严选知名元器件,整科(广)普(告)如何选购扫地机器人?看准这三点就不会差如今的扫地机器人早已经走进千家万户,不再是笔者小时候只有在电视剧里才能看到的新鲜玩意,扫地机器人在提高人们生活质量的同时,无形中也提高了人们的幸福感,90后的年轻小夫妻下班之后不再石头扫地机器人T6选区划区清扫体验想扫哪里扫哪里在科技解放人双手的实用领域,扫地机器人算是走入寻常百姓家的最好范例。越来越多的家庭选择扫地机器人来代替人工清扫,当然也不乏各种对于人工智障型扫地机器人的吐槽。其实人工智能和人工智障智障扫地机器人和智能扫地机器人的差距在哪里?作为智能家居产品之一的扫地机机器人,从诞生之日起便承担起了解放人类双手的工作。如今的扫地机器人早已经走进千家万户,不再是21世纪初的新鲜玩意,不过,现实情况并非很多人想象中的那么乐华为新款WatchGT上架京东1488元,4月11日开卖感谢IT之家网友腾讯滨海大厦的线索投递!IT之家3月26日消息今天的华为P30系列手机发布会上,华为除了推出全新的P30系列手机,与之一起发布的还有HUAWEIWATCHGT系列新雷军介绍用小米设备改造的智能房车60余种设备,还有投影仪IT之家7月10日消息今日小米集团董事长兼CEO雷军发布了一段视频,亲自介绍了由小米设备改造的智能房车。在进入房车时,刷一下手机即可开启回家模式,小爱音箱同时做出响应。在这种模式下小米台式净饮机开启预售自来水直接喝,3秒出热水,到手价1399元IT之家12月7日消息上个月小米发布了一款台式净饮机并开启众筹,现在这个产品已在小米商城开启订金预售,100元订金抵200元,到手价1399元。据官方介绍,小米台式净饮机是一台带有人工智能平台小冰公司完成A轮融资估值超10亿美元IT之家7月12日消息据36氪消息,人工智能平台公司小冰公司已完成A轮融资,目前估值已超过10亿美元。IT之家了解到,微软(亚洲)工程院在2013年组建人工智能小冰团队,这是小冰公外媒苹果自动驾驶团队去年大调整,员工5000减至200人2月28日消息,据国外媒体报道,在近几年大热的自动驾驶汽车方面,苹果也有涉足,CEO蒂姆库克在2017年的6月,首次公开承认他们在研发自动驾驶系统。但从外媒的报道来看,他们的自动驾马斯克政府应加强对人工智能监管,特斯拉也不例外北京时间2月19日早间消息,特斯拉首席执行官埃隆马斯克(ElonMusk)周一发文称,应该对所有人工智能都进行更好的监管,即便是对他的公司也不例外。他此举是是对麻省理工科技评论的一小米全面屏电视体验高屏占比设计,低廉的售价经过了手机厂商过去几年铺天盖地的宣传,相信大家对全面屏这个词早就已经熟得不能再熟了,不过在电视机产品里,全面屏倒还是个新鲜的概念。今年4月份的时候,小米发布了两款电视机新品,分别是
华为开启智慧语音新一期众测支持识别山东话感谢IT之家网友乄弈枫灬的线索投递!IT之家12月18日消息,昨日,华为智慧语音应用市场版本开启了新一期众测活动,活动时间为12月17日至12月20日。IT之家了解到,升级后的华为米家免洗扫拖机器人Pro今晚开售2499起,LDS激光导航IT之家10月31日消息,小米于10月15日发布了米家免洗扫拖一体机器人以及Pro版本。这两款产品集成了拖地吸尘功能,自动识别地毯,能够自动洗拖布。机器人零售价2999元起,将于今小米智能门锁系列双11限时优惠E型号799元,1S999元IT之家10月31日消息,小米智能门锁系列将在双11期间开启大促活动,限时开抢。小米此前表示,将在2021年提供20亿补贴,为500款产品提供降价优惠。具体来看,小米智能门锁E型号华为WATCHGT211。0。14。75版固件更新新增日出日落显示,运动时屏幕常亮感谢IT之家网友乄弈枫灬的线索投递!IT之家10月24日消息,根据IT之家网友木易丩巾投稿,华为WATCHGT2智能手表目前已经推送了11。0。14。75版固件更新,大小为219M中英文最大AI模型世界纪录先后产生,大模型竞赛新阶段来了10月15日消息,超大AI模型训练成本太高hold不住?连市值万亿的公司都开始寻求合作了。本周,英伟达与微软联合发布了5300亿参数的威震天图灵(MegatronTuring),成李开复未来15年AI将接管人类一半工作IT之家10月13日消息,李开复近日在樊登读书节目中表示,未来15年,人工智能会接管我们现在一半的工作和工作里的任务。李开复称,至少一半人的工作,其实是单一领域重复性的工作。人工智华米Amazfit中文名定为跃我寓意向上而生,超越自我IT之家10月12日消息今天下午1430华米科技正式召开Amazfit2021全球年度新品发布会,会上华米公布了Amazfit的新品牌Logo,还公布了Amazfit的全新中文名称爆改100多元卡西欧,可测速测温测海拔,不输智能运动表卡西欧F91W手表,可谓经典中的经典。但全球那么多人都佩戴同款,是有点不那么时尚了。怎么破?改它!这不,最近国外一位硬核玩家JoeyCastillo,直接把卡西欧F91W改造成了一749元,华为WatchFITnew智能手表正式开售10天续航,支持血氧心率监测IT之家9月29日消息今日,华为WatchFITnew智能手表正式开售,采用1。64英寸全彩大屏,搭配2。5D镜片,售价799元,首发到手价749元。华为WatchFITnew拥有IT之家开箱OPPOWatchFree图赏轻巧大屏,全场景睡眠监测IT之家9月26日消息今日OPPO正式发布了OPPOWatchFree智能手表,提供标准版以及NFC版可选,零售价549元起。这款手表采用了轻量化设计,整机仅重33g,其特点是提供小米小爱同学官方将逐步适配协同唤醒家庭传声等功能,提高唤醒准确率IT之家9月24日消息小米社区于9月22日举办了负责人在线专场活动,本期由小米小爱同学的负责人与米粉互动,回答了80问题。官方表示,针对小爱同学出现莫名被唤醒的问题,团队已经将这一