范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

科学家开发标记和检索DNA数据文件新技术,DNA数据存储有望成真

  北京时间 6 月 15 日消息,据国外媒体报道,在近期的一项新研究中,美国麻省理工学院的科学家开发了一种标记和检索 DNA 数据文件的技术,这或许能让 DNA 数据存储成为可能。
  此时此刻,地球上大约有 10 万亿吉字节(GB)的数据量,而每一天,人类制造出来的电子邮件、照片、社交媒体动态和其他数字文件加起来,又有 250 万吉字节的数据。这些数据中的大部分都存储在名为"艾字节(exabyte,简称 EB)数据中心"的巨大设施中(1EB 相当于 10 亿 GB),其规模可能有几个足球场那么大,建造和维护成本约为 10 亿美元 。
  许多科学家认为,解决天量数据存储问题的另一种办法在于包含我们遗传信息的生物大分子:脱氧核糖核酸(DNA)。从地球生命诞生至今,DNA 已经进化到可以以极高的密度存储大量信息,理论上一个装满 DNA 的咖啡杯就可以存储世界上所有的数据。
  我们需要新的解决方案,来存储世界正不断积累的大量数据,尤其是档案数据,DNA 的密度甚至是闪存的 1000 倍。另一个有趣的特性是,DNA 聚合物一旦制造出来,它就不会再消耗任何能量。你可以把数据写入 DNA,然后永久存储起来。
  科学家已经证明,图像和文本可以编码为 DNA,但我们还需要一种从许多 DNA 片段混合物中挑选出所需文件的简单方法。在新研究中,科学家展示了一种方法,能将每个数据文件封装到一个 6 微米的二氧化硅球形"胶囊"中,并使用 DNA 短序列作为标签,以显示其文件内容。
  利用这种方法,研究人员从包含 20 张图像的 DNA 文件中准确提取出了以 DNA 序列形式存储的单个图像。考虑到可以用到的标签数量,这种方法最多能扩展到 10^20 个文件。稳定的存储介质
  这些由二氧化硅制成的球体便是 DNA"文件",每个球体中都包含编码特定图像的 DNA 序列,其外部覆盖有描述图像内容的核苷酸条形码
  数字存储系统将文本、照片和其他类型的信息都编码为一系列的 0 和 1,同样的信息也可以用构成遗传密码的 4 种核苷酸(A、T、G 和 C,即腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶)编码在 DNA 中。例如,G 和 C 可以代表 0,而 A 和 T 代表 1。
  作为存储介质,DNA 还具有其他几个特点。首先,它非常稳定,而且合成和测序都相当容易(但目前还十分昂贵)。其次,它具有非常高的存储密度 ——1 个核苷酸相当于 2 个比特,大约为 1 立方纳米。因此,以 DNA 形式存储的数据完全可以放在我们的手掌中。
  这种存储数据的新方法面临着诸多障碍,首先就是合成如此大量 DNA 需要耗费的成本。目前,写入 1 拍字节(100 万 GB)的数据需要花费 1 万亿美元。为了与磁带(通常用于存储档案数据)竞争,估计 DNA 合成的成本需要降低约 6 个数量级,这一目标可能会在 10 年或 20 年内实现,就像过去几十年来闪存存储信息的成本大幅下降一样。
  除了成本之外,使用 DNA 存储数据的另一个主要瓶颈是,我们很难从所有文件中挑选出想要的文件。
  假设写入 DNA 的技术已经很先进,可以实现在 DNA 中写入 1 艾字节或 1 泽字节(zettabyte,简称 ZB,1ZB=1000EB)数据的成本效益,会发生什么?你会有一大堆的 DNA,也就是无数的文件、图像或电影和其他东西,但你需要在其中找到想要的某一张图片或某一部电影,这就像大海捞针。
  目前,DNA 文件通常使用 PCR(聚合酶链式反应)方法来检索。每个 DNA 数据文件都包含一个与特定 PCR 引物结合的序列。为了读取某个特定的文件,需要将该引物添加到样品中,找到并放大所想要的序列。然而,这种方法的一个缺点是,引物与目标序列以外的 DNA 序列之间可能存在串扰,导致不必要的文件输出。此外,PCR 的检索过程需要用到酶,最终会消耗库中的大部分 DNA,这有点像在干草堆里找一根针,因为其他所有 DNA 都没有被放大,因此基本上它们都被扔掉了。解决 DNA 文件检索难题
  研究人员将这样的图像储存在 DNA 中
  麻省理工学院的研究小组开发了一种新的检索技术,希望取代 PCR 方法。他们将每个 DNA 文件封装到一个微小的二氧化硅胶囊中,每个胶囊都贴上了由单链 DNA 组成的"条形码",与文件内容相对应。为了证明这种方法的成本效益,研究人员将 20 个不同的图像编码到大约长度为 3000 个核苷酸的 DNA 片段中,这大致相当于 100 个字节(他们的研究还显示,这些胶囊可以容纳高达 1GB 的 DNA 文件)。
  研究中的每个文件都有相应的条形码标签,如"猫"或"飞机"等。当研究人员想要提取一个特定的图像时,他们会取出一个 DNA 样本,加入与目标标签相对应的引物。例如,老虎的图像对应的标签是"猫""橘色"和"野生",而家猫的图像对应"猫""橘色"和"家养"。
  这些引物用荧光或磁性颗粒标记,便于从样本中提取并识别匹配片段。通过这种方法,研究人员可以将需要的文件移出来,剩下的 DNA 则完整地放回去,继续存储数据。他们的检索过程允许布尔逻辑语句,如"总统和 18 世纪"会生成"乔治・华盛顿"的结果,这很类似谷歌的图像检索。
  在目前的概念验证阶段,搜索速度是每秒 1000 字节(1KB)。文件系统的搜索速度是由每个胶囊的数据量大小决定的,而目前限制数据量大小的因素就是在 DNA 上写入 100 兆字节(MB)数据所需的高昂成本,以及可以并行使用的分类器的数量。如果 DNA 合成变得足够便宜,就能够用这种方法将每个文件存储的数据量最大化。
  研究人员所使用的条形码 —— 单链 DNA 序列 —— 取自哈佛医学院遗传学和医学教授史蒂芬・埃利奇开发的序列库,其中包含了 10 万个序列。如果给每个文件贴上两个这样的标签,就可以唯一地标记 100 亿(10^10)个不同的文件;如果每个文件上有 4 个标签,就可以唯一地标记 10^20 个文件。
  在 DNA 中写入、复制、读取,以及用 DNA 进行低能耗的档案数据存储方面,我们取得了快速进步,但这也使得从巨大的数据库(10^21 字节,泽字节规模)中精确检索数据文件变得极为困难,这项新研究引人注目的地方在于,它使用一个完全独立的 DNA 外层解决了这个问题,扩展了 DNA 的不同属性(杂交而非测序),而且使用的是现有的仪器和化学试剂。
  科学家设想这种 DNA 封装技术可以用于存储"冷"数据,即保存在档案中但不经常访问的数据。目前,研究实验室已经成立了一家名为 Cache DNA 的初创公司,正在开发 DNA 的长期存储技术,既可以用于长期的 DNA 数据存储,也能用于短期的临床和其他现有的 DNA 样品存储。
  虽然我们可能还需要一段时间才能将 DNA 作为数据存储介质,但目前在 Covid-19 检测、人类基因组测序和其他基因组学领域中,对于 DNA 和 RNA 样品的低成本和大规模存储的解决方案都有很紧迫的需求。

NASA批准波音Starliner第二次试飞,7月30日前往国际空间站IT之家7月24日消息在首次尝试对接国际空间站失败18个月后,波音公司的Starliner已准备好进行第二次尝试。在飞行准备审查之后,NASA已批准该飞行器于7月30日进行第二次无俄罗斯成功发射科学号重型实验舱,将于29日与国际空间站对接IT之家7月22日消息据俄罗斯卫星通讯社消息,7月21日晚,俄罗斯质子M火箭携带俄科学号实验舱,从哈萨克斯坦拜科努尔航天发射场点火升空,前往国际空间站。目前该实验舱已经由火箭成功送NASA国际空间站俄舱段内又确定几处可能的漏气点IT之家7月18日消息据俄罗斯卫星通讯社消息,美国国家航空航天局NASA安全咨询委员会代表大卫韦斯特表示,国际空间站俄罗斯星辰舱中又发现了几个可能的漏气点,乘组人员用板子或密封胶对神舟十二号出征太空满月,3名航天员在空间站看新闻联播IT之家7月17日消息据央视军事报道,今天,神舟十二号出征太空满1个月(已经过去13,还需要待2个月),3名航天员在空间站每天咋安排?看7月16日在轨工作第30天日程早8点开工,巡俄罗斯质子M火箭已经竖起,将于7月21日发射科学号实验舱IT之家7月17日消息根据俄罗斯国家航天集团Roscosmos消息,今日质子M火箭已经水平转运至发射台并竖起,将于北京时间7月21日2258发射科学号实验舱。本次发射任务原定于7月天问一号首次火星探测任务五大科学目标正在一步步实现IT之家8月7日消息目前我国天问一号祝融火星车行驶里程已经突破800米,工作了82个火星日,各系统工况正常。根据央视新闻频道消息,我国首次火星探测任务共携带了13台科学探测设备,并我国祝融号火星车行驶里程突破800米,正穿越复杂地形地带IT之家8月6日消息据中国探月工程消息,截至2021年8月6日,祝融号火星车在火星表面工作82个火星日,累计行驶里程突破800米(808米)。目前,祝融号火星车正在穿越石块撞击坑沙NASA机智号直升机将进行第11次火星飞行升空12米飞行130秒8月5日消息,美国国家航空航天局(NASA)旗下的机智号火星直升机(又译为灵巧号),计划最早于美国东部时间周四凌晨在火星进行第11次飞行任务。届时直升机将升至距离火星表面12米的高祝融号火星车开始穿越复杂地形地带石块撞击坑沙丘分布密集IT之家7月30日消息据中国探月工程公众号消息,祝融号火星车完成对第二处沙丘地貌科学探测后,继续向南移动,本周到达一片石块撞击坑沙丘分布密集的复杂地形地带。后续,地面飞控人员将依据法国科学家成功摧毁感染HIV病毒细胞近日,法国科学家宣称在抗击艾滋病方面取得重大成果,有望为艾滋病治愈带来突破。来自巴黎巴斯德研究院的研究人员表示,他们在体外实验中成功摧毁了感染艾滋病病毒的细胞。科学家通常使用抗逆转英国成功测试太空鱼叉,清理太空垃圾有办法了北京时间2月17日报道,一艘名为RemoveDEBRIS的太空飞行器本周向预定目标一块人造卫星的嵌板发射鱼叉工具并且准确击中目标。科学家们以每秒20米的速度向目标发射鱼叉工具并最终
我国翼龙10无人机搭载气象探测载荷,完成应急探测试验任务IT之家11月27日消息,据航空工业官方消息,11月27日9时,航空工业自主研制的翼龙10无人机腾空而起,搭载毫米波测云雷达掩星海反探测系统等。到达任务空域后,与天基海基岸基气象观熊猫涂装国产最大土压平衡盾构机开工,始发成自高铁锦绣隧道IT之家11月1日消息,据中国铁建,基建狂魔现在又一次开动起来,这一次是中铁十四局承建的成自高铁锦绣隧道,为此还动用了国产最大土压平衡盾构机。值得一提的是,这款盾构机上有涂装熊猫的中国首座上跨运营高铁钢桁梁桥成功转体IT之家10月28日消息,10月27日3时30分许,廊坊市交通中心工程光明道上跨铁路立交桥成功转体,这在国内上跨运营高铁钢桁梁桥工程建设中尚属首次,这同时也标志着廊坊市区光明道东西中国自主研发高速铁路ATO系统顺利通过技术评审时速350公里自动驾驶IT之家3月29日消息据铁科院发布,近日,国铁集团科信部在北京组织召开了铁科院高速铁路ATO系统技术评审会,中国自主研发的高速铁路ATO系统顺利通过评审。京张智能动车组IT之家获悉中国天眼FAST新发现201颗脉冲星,含银河系之外的遥远星体IT之家5月20日消息根据央视新闻消息,今日国家天文台研究团队正式发布了FAST望远镜在观测中取得的重要进展。截至今年3月,该巡天项目共计观测了约126平方度的银道面区域,新发现了NASA确认Kes75是银河系已知最年轻的脉冲星IT之家10月22日消息还记得之前出故障的钱德拉X射线空间望远镜吗?NASA近日利用其观测的数据确认Kes75是银河系迄今为止最年轻的脉冲星,这将为天文学家提供有关某些恒星如何走向如果第九行星真实存在,其具体位置仍是个谜北京时间4月27日消息,如果太阳系存在神秘的第九行星,它潜伏在太阳系黑暗的边缘,但很可能不在我们想象的位置。依据天文学家对这一假设天体的搜索,最新信息可能表明它的轨道离心率比之前2科学家发现迄今为止最古老的行星系统之一IT之家1月18日消息据scinews报道,科学家们发现了银河系中迄今为止的最古老的行星系统之一。该行星系统有一颗被称为TOI561b的岩石行星,围绕一颗100亿年的恒星运行。这颗我国成功发射遥感三十号10组卫星将开展电磁环境探测及相关技术验证IT之家7月19日消息据央视新闻报道,北京时间2021年7月19日8时19分,我国在西昌卫星发射中心用长征二号丙运载火箭,成功将遥感三十号10组卫星发射升空,卫星顺利进入预定轨道,我国成功发射钟子号卫星星座02组卫星IT之家7月9日消息根据央视新闻消息,今晚19时59分,我国成功发射钟子号卫星星座02组。本次发射任务在太原卫星发射中心进行,由长征六号遥六火箭发射,将卫星成功送入预定轨道。这是7中国首颗空间引力波探测技术实验卫星太极一号完成在轨交付IT之家1月9日消息中科院官网消息显示,1月8日,我国首颗空间引力波探测技术实验卫星太极一号(微重力技术实验卫星)在轨交付仪式在京举行。会议听取了太极一号卫星工程首席科学家中科院院