干细胞之家 - 中国干细胞行业门户第一站

 

 

搜索
朗日生物

免疫细胞治疗专区

欢迎关注干细胞微信公众号

  
查看: 27914|回复: 0
go

Science:比硬盘还靠谱?最大限度提高 DNA 存储 [复制链接]

Rank: 7Rank: 7Rank: 7

积分
24651 
威望
24651  
包包
140579  

优秀版主 博览群书 美女研究员 优秀会员

楼主
发表于 2017-3-3 21:48 |只看该作者 |倒序浏览 |打印
Science:比硬盘还靠谱?最大限度提高 DNA 存储
$ u& E- _% R" z5 |( N来源:生物 360 / 作者:MEI / 2017-03-03- {+ b- O! }- S0 P; \, S: \; g9 {1 s, v
DNA 具有提供大容量信息存储的潜力。 然而,目前的方法仅能够使用理论最大值的一小部分。纽约基因组中心和哥伦比亚大学的 Erlich 和 Zielinski 提出了一种策略:DNA 喷泉,它接近每个核苷酸存储的信息的理论最大值。 他们将信息的高效编码存储进 DNA ,并在多轮聚合酶链反应后仍可以完全恢复文件。相关论文发表在 3 月 3 日的《Science》上。
+ w! h! A. c) L5 J3 r5 E! g
5 \0 S& F: y& u5 \DNA 是一种有吸引力的存储数字信息的媒介,因为它是紧凑的,并且如果保存在阴凉,干燥的地方可以持续几十万年,这从 2016 年的一篇《自然》论文就可以体现出来:西班牙学者成功测序了距今 43 万年的 DNA 部分序列。( 最古老人类 DNA 测序揭示尼安德特人的秘密 )
9 `2 k4 m  p, j4 u* M/ I3 p哥伦比亚大学的计算机科学教授 Yaniv Erlich 说,“DNA 不会像磁带和 CD 那样随时间而降解,并且不会过时。”
5 G. j$ T3 [, U5 w- j# NErlich 和他的同事 Nina Zielinski,选择了六个文件编码写入 DNA:一个完整的计算机操作系统,一部 1895 的法国电影,一个 50 美元的亚马逊礼物卡,计算机病毒,具有图画信息的先锋板和一个 1948 年由信息理论家 Claude Shannon 领导的老研究。这些文件总共 2.14×10 6 字节。! ~$ |: q0 f  U
他们将这些文件压缩成一个主文件,然后将数据拆分为由 1 和 0 组成的二进制代码的短字符串。使用称为喷泉码的容错算法,它们将符串随机地封装成液滴,并将每个液滴中的 1 和 0 映射到 DNA 中的四个核苷酸碱基:A,G,C 和 T。算法删除已知错误的字母组合,并添加一个条形码到每个液滴,以帮助以后重新组装文件。/ a& l$ k& ^; y, E
总而言之,他们生成了 72,000 条 DNA 链的数字列表,每条链长 200 个碱基,并将其文本文件发送到旧金山的 DNA 合成公司,Twist Bioscience,其专门将数字数据转换为生物数据。 两个星期后,他们得到一个含有一串 DNA 分子的小瓶。
/ [/ j* Q# c8 t6 f; P7 |+ J为了检索他们的文件,他们使用现代测序技术来读取 DNA 链,然后用软件将遗传代码翻译成二进制。 他们恢复了他们的文件,而且没有错误。 在这个简短的演示中,Erlich 在虚拟机上打开他的归档操作系统,并玩起 Minesweeper 的游戏来庆祝。( ^% e( R% i3 N7 s% _
他们还证明,通过 PCR 技术扩增存储 DNA 样本后,,可以产生几乎无限数量的文件拷贝,并且经过多次拷贝后,该技术仍然可以恢复这些文件数据。
* o. ^, d) L+ N( r6 q5 I! B研究人员表明,他们的编码策略在一克 DNA 上包装了 215 帕比特数据,是哈佛大学的开创性研究人员乔治·教会和欧洲生物信息学研究所的 Nick Goldman 和 Ewan Birney 在《自然》发表的方法的 100 倍。
  {9 F6 _* r7 A* s- N) N“我们相信这是迄今为止最高密度的数据存储设备,”Erlich 说。
* V" p; x( {2 x+ V# IDNA 数据存储的容量理论上限于每个核苷酸的两个二进制数字,但是 DNA 本身的生物学约束和包括冗余信息以重新装配和读取片段的需要将其容量降低到每个核苷酸碱基 1.8 个二进制数。
6 z: r9 j, c5 E8 s2 C研究的亮点是使用喷泉码。在编码理论中,喷泉码是一类抹除码,其有能力从一组给定的源符号中产生一串无限的编码符号序列,而在理想情况下,只需获得大小和源符号相同或稍大的任意编码符号子集,便可恢复源符号。使用他们的 DNA 喷泉技术,Erlich 和 Zielinski 平均每个碱基核苷酸包装 1.6 位。 这至少比以前发布的方法多 60% 的数据,并且接近 1.8 位的限制。
6 X! H( H  g+ ?1 x( a$ C8 w该技术是一项着眼于未来的具有划时代意义存储技术,它具有高效、存储量大、存储时间长、易获取且免维护的优点。不过,鉴于合成 DNA 分子和读取 DNA 数据的成本,现阶段用它来存储信息仍然太过昂贵。9 U& F0 D3 |' i+ x- v
但是,如果生产低质量的分子,DNA 合成的价格可以大大降低,而使用 DNA 喷泉等编码策略可以修复分子错误。随着技术发展,DNA 存储技术有望进入寻常百姓家。
" i- z+ W# u1 k# ~5 D# v- v/ ~参考资料:/ |1 x+ _( c# _5 {
1.DNA Fountain enables a robust and efficient storage architecture+ Y1 Z$ J) \, a/ l3 s1 K1 W# u
2.As reliable as your hard drive? Maximizing DNA storage
# M$ p9 y7 S9 u' k0 o3.Towards practical, high-capacity, low-maintenance information storage in synthesized DNA
& v; E! J6 ]; y9 h" U) e' n& y& @4.Nuclear DNA sequences from the Middle Pleistocene Sima de los Huesos hominins( r2 H$ G8 A6 C; `9 o$ f& A& n- o+ v; Z
已有 1 人评分威望 包包 收起 理由
细胞海洋 + 2 + 10 极好资料

总评分: 威望 + 2  包包 + 10   查看全部评分

‹ 上一主题|下一主题
你需要登录后才可以回帖 登录 | 注册
验证问答 换一个

Archiver|干细胞之家 ( 吉ICP备2021004615号-3 )

GMT+8, 2024-5-19 06:52

Powered by Discuz! X1.5

© 2001-2010 Comsenz Inc.