范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

科学家开发标记和检索DNA数据文件新技术,DNA数据存储有望成真

  北京时间 6 月 15 日消息,据国外媒体报道,在近期的一项新研究中,美国麻省理工学院的科学家开发了一种标记和检索 DNA 数据文件的技术,这或许能让 DNA 数据存储成为可能。
  此时此刻,地球上大约有 10 万亿吉字节(GB)的数据量,而每一天,人类制造出来的电子邮件、照片、社交媒体动态和其他数字文件加起来,又有 250 万吉字节的数据。这些数据中的大部分都存储在名为"艾字节(exabyte,简称 EB)数据中心"的巨大设施中(1EB 相当于 10 亿 GB),其规模可能有几个足球场那么大,建造和维护成本约为 10 亿美元 。
  许多科学家认为,解决天量数据存储问题的另一种办法在于包含我们遗传信息的生物大分子:脱氧核糖核酸(DNA)。从地球生命诞生至今,DNA 已经进化到可以以极高的密度存储大量信息,理论上一个装满 DNA 的咖啡杯就可以存储世界上所有的数据。
  我们需要新的解决方案,来存储世界正不断积累的大量数据,尤其是档案数据,DNA 的密度甚至是闪存的 1000 倍。另一个有趣的特性是,DNA 聚合物一旦制造出来,它就不会再消耗任何能量。你可以把数据写入 DNA,然后永久存储起来。
  科学家已经证明,图像和文本可以编码为 DNA,但我们还需要一种从许多 DNA 片段混合物中挑选出所需文件的简单方法。在新研究中,科学家展示了一种方法,能将每个数据文件封装到一个 6 微米的二氧化硅球形"胶囊"中,并使用 DNA 短序列作为标签,以显示其文件内容。
  利用这种方法,研究人员从包含 20 张图像的 DNA 文件中准确提取出了以 DNA 序列形式存储的单个图像。考虑到可以用到的标签数量,这种方法最多能扩展到 10^20 个文件。稳定的存储介质
  这些由二氧化硅制成的球体便是 DNA"文件",每个球体中都包含编码特定图像的 DNA 序列,其外部覆盖有描述图像内容的核苷酸条形码
  数字存储系统将文本、照片和其他类型的信息都编码为一系列的 0 和 1,同样的信息也可以用构成遗传密码的 4 种核苷酸(A、T、G 和 C,即腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶)编码在 DNA 中。例如,G 和 C 可以代表 0,而 A 和 T 代表 1。
  作为存储介质,DNA 还具有其他几个特点。首先,它非常稳定,而且合成和测序都相当容易(但目前还十分昂贵)。其次,它具有非常高的存储密度 ——1 个核苷酸相当于 2 个比特,大约为 1 立方纳米。因此,以 DNA 形式存储的数据完全可以放在我们的手掌中。
  这种存储数据的新方法面临着诸多障碍,首先就是合成如此大量 DNA 需要耗费的成本。目前,写入 1 拍字节(100 万 GB)的数据需要花费 1 万亿美元。为了与磁带(通常用于存储档案数据)竞争,估计 DNA 合成的成本需要降低约 6 个数量级,这一目标可能会在 10 年或 20 年内实现,就像过去几十年来闪存存储信息的成本大幅下降一样。
  除了成本之外,使用 DNA 存储数据的另一个主要瓶颈是,我们很难从所有文件中挑选出想要的文件。
  假设写入 DNA 的技术已经很先进,可以实现在 DNA 中写入 1 艾字节或 1 泽字节(zettabyte,简称 ZB,1ZB=1000EB)数据的成本效益,会发生什么?你会有一大堆的 DNA,也就是无数的文件、图像或电影和其他东西,但你需要在其中找到想要的某一张图片或某一部电影,这就像大海捞针。
  目前,DNA 文件通常使用 PCR(聚合酶链式反应)方法来检索。每个 DNA 数据文件都包含一个与特定 PCR 引物结合的序列。为了读取某个特定的文件,需要将该引物添加到样品中,找到并放大所想要的序列。然而,这种方法的一个缺点是,引物与目标序列以外的 DNA 序列之间可能存在串扰,导致不必要的文件输出。此外,PCR 的检索过程需要用到酶,最终会消耗库中的大部分 DNA,这有点像在干草堆里找一根针,因为其他所有 DNA 都没有被放大,因此基本上它们都被扔掉了。解决 DNA 文件检索难题
  研究人员将这样的图像储存在 DNA 中
  麻省理工学院的研究小组开发了一种新的检索技术,希望取代 PCR 方法。他们将每个 DNA 文件封装到一个微小的二氧化硅胶囊中,每个胶囊都贴上了由单链 DNA 组成的"条形码",与文件内容相对应。为了证明这种方法的成本效益,研究人员将 20 个不同的图像编码到大约长度为 3000 个核苷酸的 DNA 片段中,这大致相当于 100 个字节(他们的研究还显示,这些胶囊可以容纳高达 1GB 的 DNA 文件)。
  研究中的每个文件都有相应的条形码标签,如"猫"或"飞机"等。当研究人员想要提取一个特定的图像时,他们会取出一个 DNA 样本,加入与目标标签相对应的引物。例如,老虎的图像对应的标签是"猫""橘色"和"野生",而家猫的图像对应"猫""橘色"和"家养"。
  这些引物用荧光或磁性颗粒标记,便于从样本中提取并识别匹配片段。通过这种方法,研究人员可以将需要的文件移出来,剩下的 DNA 则完整地放回去,继续存储数据。他们的检索过程允许布尔逻辑语句,如"总统和 18 世纪"会生成"乔治・华盛顿"的结果,这很类似谷歌的图像检索。
  在目前的概念验证阶段,搜索速度是每秒 1000 字节(1KB)。文件系统的搜索速度是由每个胶囊的数据量大小决定的,而目前限制数据量大小的因素就是在 DNA 上写入 100 兆字节(MB)数据所需的高昂成本,以及可以并行使用的分类器的数量。如果 DNA 合成变得足够便宜,就能够用这种方法将每个文件存储的数据量最大化。
  研究人员所使用的条形码 —— 单链 DNA 序列 —— 取自哈佛医学院遗传学和医学教授史蒂芬・埃利奇开发的序列库,其中包含了 10 万个序列。如果给每个文件贴上两个这样的标签,就可以唯一地标记 100 亿(10^10)个不同的文件;如果每个文件上有 4 个标签,就可以唯一地标记 10^20 个文件。
  在 DNA 中写入、复制、读取,以及用 DNA 进行低能耗的档案数据存储方面,我们取得了快速进步,但这也使得从巨大的数据库(10^21 字节,泽字节规模)中精确检索数据文件变得极为困难,这项新研究引人注目的地方在于,它使用一个完全独立的 DNA 外层解决了这个问题,扩展了 DNA 的不同属性(杂交而非测序),而且使用的是现有的仪器和化学试剂。
  科学家设想这种 DNA 封装技术可以用于存储"冷"数据,即保存在档案中但不经常访问的数据。目前,研究实验室已经成立了一家名为 Cache DNA 的初创公司,正在开发 DNA 的长期存储技术,既可以用于长期的 DNA 数据存储,也能用于短期的临床和其他现有的 DNA 样品存储。
  虽然我们可能还需要一段时间才能将 DNA 作为数据存储介质,但目前在 Covid-19 检测、人类基因组测序和其他基因组学领域中,对于 DNA 和 RNA 样品的低成本和大规模存储的解决方案都有很紧迫的需求。

冰层之下的土卫二海洋似乎具有类似地球的洋流活动据外媒报道,埋藏在20公里冰层之下的土星卫星之一土卫二的地下海洋,似乎具有类似于地球的洋流活动。这一理论是从土卫二冰壳的形状得出的,它挑战了目前认为土卫二全球海洋是同质的想法。土卫科学家首次测量到木星大气中900多英里小时的强风西南研究院的科学家与法国天文学家领导的团队合作,首次帮助确定了木星中间大气层中令人难以置信的强大风力。该团队测量了1994年肖梅克middot莱维9号彗星撞击所挖掘出的分子,以追踪科学家发现许多系外行星可能拥有富含水的大气层大气层使地球表面的生命成为可能,调节我们的气候,并保护我们免受破坏性宇宙射线的伤害。虽然望远镜已经统计出越来越多的岩石行星,但科学家们曾认为它们的大部分大气层早已消失。然而,芝加哥实验失败的教训被消灭的物种报复性反弹加利福尼亚大学戴维斯分校领导的一项研究发现,一些被列为彻底根除目标的入侵物种会报复性地反弹,特别是在水生系统中。这项发表在PNAS杂志上的研究记录了从加利福尼亚河口消灭入侵的欧洲绿研究发现被认为是好胆固醇的HDL同样有健康风险工作表明,高密度脂蛋白颗粒大的人发生心肌梗死的风险增加,而实际上只有高密度脂蛋白颗粒小的人与风险降低有关。HDL胆固醇(高密度脂蛋白胆固醇)通常被称为ldquo好胆固醇rdquo与新型纳米晶体管可在高电压下保持低温高效电源转换电源转换器是鲜为人知的系统,它让电力变得如此神奇。它们让我们能够插入电脑电灯和电视机,并在瞬间将它们打开。转换器将墙上插座中的交流电(AC)转化为我们电子产品所需的直流电(DC)。科学家研发手持式伽马射线相机可帮助加快癌症诊断英国的科学家开发了一种先进的手持式成像设备,在应对癌症时,它可能被证明是一个强大的工具,其能提供皮肤下癌性肿瘤的3D图像。该技术使用伽马射线和光学成像的混合来测量放射性物质的深度,研究显示人死后一些细胞基因表达在大脑重新活过来人体死后的器官变化可能对重要的大脑研究有所启发。在人死后的几个小时内,其大脑中的某些细胞仍然活跃。根据伊利诺伊大学芝加哥分校的新研究,一些细胞甚至增加了它们的活性,并增长到巨大的比Artemis计划中的猎户座飞船落水试验顺利进行美国航天局目前正在努力完成对猎户座航天器进行飞行认证所需的所有测试。猎户座航天器将作为空间飞行器,将宇航员和货物运送到月球和更远的地方,作为今后Artemis飞行任务的一部分。航天马斯克星舰准备在7月进行首次轨道级飞行,以后月月飞北京时间6月15日消息,美国太空探索技术公司(SpaceX)正接近其星际飞船开发的下一个重要里程碑。目前,SpaceX正努力完成美国联邦航空管理局(FAA)本周提出的环境影响整改要专家未来50年虚拟孩子将司空见惯,长得与用户都很像,只存在于元宇宙中凤凰网科技讯北京时间6月1日消息,英国人工智能专家卡特里奥娜坎贝尔(CatrionaCampbell)表示,未来50年,能与用户玩耍拥抱用户,甚至与用户长得很像的虚拟孩子将司空见惯
补给到货,国际空间站重启俄舱段漏气检查和封堵工作IT之家2月22日消息据俄罗斯卫星通讯社报道,美国国家航空航天局(NASA)转播的宇航员通话内容显示,国际空间站ISS的宇航员将重启俄罗斯星辰(Zvezda)舱段的气密性检查工作。国际空间站20年不断老化要修修补补,美国还没接替者自2000年开始,尽管太空中存在各种各样的固有危险,人类还是在国际空间站生活了20年的时间,完成了各种各样的科学实验。图示2017年,远征5455号任务的宇航员准备从哈萨克斯坦的拜至今已耗资约1500亿美元,国际空间站应该被放弃吗北京时间11月3日消息,今年11月2日,我们迎来了人类连续进驻国际空间站20周年的纪念日。但是,现在有人提出了一个问题宇航员是否应该挂起宇航服,将太空探索交给机器人去完成?在格林尼回望国际空间站二十年耗费如此巨资是否值得北京时间10月27日消息,国际空间站(InternationalSpaceStation,ISS)是否造福了人类社会?对这一问题,科学家们分成了两派一些人认为,国际空间站是一座团结登月50年后,人类为何突然重拾登月梦想?北京时间7月16日消息,据英国卫报报道,随着阿波罗号宇航员首次登月50周年纪念日逐渐临近,许多国家都开始执行月球勘测任务,新的太空竞赛背后隐藏着什么呢?突然之间,好像每个人都想前往阿波罗11号登月50周年,回顾阿波罗号探月计划北京时间7月15日消息,据美国宇航局网站报道,阿波罗11号飞船登月50周年纪念日临近,让我们再次回顾一下阿波罗号计划的探月历史。阿波罗1号首批3名宇航员模拟操作中丧生1967年1月印度将发射月船2号探测器,欲成登月第四国IT之家7月14日消息据中新网报道,印度计划15日发射无人探测器月船2号,若任务成功,印度便会成为全球第4个实现登月的国家。据悉,月船2号将是印度的第二台月球探测器。印度在2008宇宙究竟有多大?它的边界在哪里?北京时间9月6日消息,如果你有想过时空旅行,很简单,你只要抬头仰望天空就可以了。你所看到的每一缕星光,都是遥远过去的每一个瞬间。这是因为宇宙中的恒星,星系都距离我们太过遥远,即便其宇宙大爆炸之前是什么?新浪科技讯北京时间9月3日消息,据国外媒体报道,宇宙大爆炸是解释宇宙形成过程的最主流理论之一,根据该理论,大约137亿年前,整个宇宙都是以一个奇点的形式存在,但随之而来的还有另一个创造虫洞需要什么条件?物理学家给出了详细名单北京时间8月30日消息,据国外媒体报道,近日发表在预印网站arXiv上的一篇论文指出,我们也许有办法打造一个近乎稳定的虫洞。虫洞听上去就很吸引人,毕竟按正常方法我们要耗时数万年才能首个高度模拟人类乙肝病毒感染的肝硬化小鼠模型诞生1月31消息,厦门大学夏宁邵教授团队和浙江大学附属第一医院李君教授团队历经5年的协同攻关,建立了国际上第一个高度模拟人类乙肝病毒(HBV)自然感染诱发的慢乙肝肝硬化小鼠模型。疾病动