随着人类文明的发展,存储技术也在不断发展进步,结绳、简竹、纸张、磁带、软盘、硬盘等都是发展过程中的产物,尤其是现代化的电子存储,其最小单位我们称之为比特,即采用0与1两种状态来实现信息的存储;而DNA作为生物活性物质,是所有生命体中遗传信息之重要载体,内含CGTA四个碱基对,一直用于生命信息的存储复制(繁衍),来实现生命的延续与发展。正是DNA的这种特性,它可不可以被人类利用,实现现代信息的存储啦?答案令人惊讶, 是肯定的! 据新华社天津9月17日报道:中国科学院院士、天津大学元英进教授带领的合成生物学团队采用创新DNA存储算法,已经将十幅精选敦煌壁画存入DNA中,够科幻吧,接下来对保存信息的DNA片段,进行进支持老化破坏实验,依旧实现信息恢复;实验结果表明:敦煌壁画信息既可以在DNA可以保存,同时在实验室 常温下可保存千年 ,在 9.4℃下可保存两万年 ! 该成果近日已经发表于《自然·通讯》上,大家可以直接查阅。 DNA存储的敦煌壁画 惊艳亮点 据国际数据公司(IDC)估计,按照目前全球快速增长的数据总量,到 2025年全球数据总量将达到惊人的175ZB(1ZB≈10的21次方字节)。 作为重要信息载体,全球数据中心,正在大量扩建,与此同时其能耗非常惊人,据估计, 到2025年,全球数据中心的耗电量将高达 全球能耗的33% 。 DNA存储一旦实现应用,其具备的高存储密度与低能耗处理等优势,被视为一种极具潜力的存储技术,完全可以应对数据存储增长挑战的新机遇。 探索之路 2021年8月元英进教授团队,从头编码设计合成了一条长度为254886碱基对、专用于数据存储的酵母人工染色体,该染色体中包含有两张经典图片和一段视频的存储信息,利用酵母的自然繁殖,实现数据的稳定复制,并用纳米孔测序器件实现了数据快速读出与无错恢复。这里有几点关键信息,信息利用碱基对进行编码,信息复制采用酵母的繁殖,解码采用的是读取碱基对的排序信息。如下图: DNA存储技术概念图 如何确保信息丢失? DNA作为一种链式生物大分子,具有生物活性,容易出现在体外常温保存时, DNA断裂降解等风险,可能带来信息长期存储的可靠性风险。为此,团队采用了德布莱英图理论的序列重建算法来解决DNA断裂问题,同时结合贪婪路径搜索和循环冗余校验码。哪怕已经出现断裂的DNA片段,依旧可以实现高效重组,以确保存储信息的不丢失,实现DNA存储的长期可靠性。 DNA存储 完美实验,一气呵成 双码设计: 团队首先采用序列重建算法(内码)与喷泉码算法(外码),设计了6.8MB的敦煌壁画编码信息,利用编码信息合成出已经承载图片信息的DNA片段,合计21万条。(可见其辛苦) DNA存储信息片段示意图 非保护性破坏实验: 团队制备了一份没有任何特殊保护的DNA水溶液样本,并在70℃温度下加速样本断裂、降解(这种环境对生物活性物质DNA极为不利)。经过十周的"破坏"性实验, 结果是DNA信息片段,80%以上都发生了断裂或错误,即严重破坏。 修复性重组: 破坏后的DNA片段,依照序列重建算法进行解码组装,实现96.4%以上的片段修复,进而通过喷泉码解决少量片段丢失的问题,最终实现原始的敦煌壁画图片完美恢复。 根据理论推算,这种程度的高温破坏,完全相当于实验室常温25℃条件下的一千年或者9.4℃条件下的长达两万年的自然保存。 可喜可贺,这是天津大学合成生物学团队,继人工合成染色体的酵母体内信息存储模式取得突破后,在DNA信息体外存储模式上取得的又一重要突破。 伙伴们,看到这个激动的小实验,大成就,有什么新看法?欢迎一起讨论! NDA信息存储未来示意图 天津大学DNA存储取得重大突破 可让信息保存千年万年_新闻频道_央视网(cctv.com)