  
- 积分
- 24651
- 威望
- 24651
- 包包
- 144052
|
安诺基因Hi-C再获进展,联合研究成果登《Genome Biology》
& n1 J! |2 l+ s来源:安诺基因 / 作者: / 2015-12-11; Z2 G7 U0 n& A3 |- ?2 `0 \
近日,安诺优达和法国居里研究所等机构的共同研究成果发表于Genome Biology(影响因子10.8)上。该研究成果为全球学术界提供了一项灵活高效的标准化Hi-C数据分析流程。 t: p+ m0 ]4 u4 a
+ x) I0 j* a8 ^; L
高通量染色体捕获技术(High-throughput chromosome conformation capture,Hi-C),以整个细胞核为研究对象,利用高通量测序技术,结合生物信息学方法,研究全基因组范围内整个染色质DNA在空间位置上的关系。通过对染色质内全部DNA相互作用模式进行捕获,获得高分辨率的染色质三维结构信息。随着Hi-C技术逐渐成熟,开发一种可以用于任何项目的生物信息分析流程十分必要,然而全基因组的Hi-C测序数据常常包括多达上百G的原始序列产量,处理这些大量数据需要优化的生物信息分析流程,长期以来缺乏一种稳定、灵活、高效的流程。目前能处理Hi-C数据的软件HOMER、HICUP、HiC-inspector 、HiCdat、HiCbox及hiclib要么不能以并行模式同时处理大量数据,要么需要非常强的Python库编程技巧。
/ {3 Z$ g+ s' U5 n i. X# }本研究中,安诺优达总裁陈重建博士携手科学顾问Edith Heard(法国居里研究所资深研究员)及Hi-C技术发明人Job Dekker,研发出一种Hi-C数据处理及分析的新流程HiC-Pro。
* x5 Z. e5 P& T- N' [ j+ jHiC-Pro能够避免以上缺陷,它是一种经过优化的可操作性极强的信息分析流程,采用基于酶切位点的分析策略,可以将原始的Hi-C测序数据转化成标准化的相互作用图,运行时间大大缩短。同时,HiC-Pro应用非常强大,可以比对测序reads、检测有效连接产物、执行质量控制以及制作染色体内部和染色体之间的相互作用热图,此外,HiC-Pro还可以利用阶段性基因型数据来构建等位基因特异性相互作用图。
6 b C: H: r X3 Y% x# A: N研究中分别采用来自两个公共数据库的IMR90和IMR90_CCL186数据进行分析对比,对于每个数据库,运行HiC-Pro流程,获得分辨率为20 kb、40 kb、150 kb、500 kb 和1 Mb 分辨率的标准相互作用图,IMR90_CCL186 数据库还能获得5 kb分辨率的相互作用图。结果表明,和hiclib运行相同的数据,HiC-Pro完成分析少于15小时,而hiclib需要用28小时。此外,HiC-Pro运行IMR90_CCL186数据得到5kb分辨率相互作用图的用时仅12小时,表明HiC-Pro能在合理的时间分析大量数据。
% {3 s: t4 }" p A* s5 c/ Y+ a3 { ) C. n( k# }7 ]6 u
图1 HiC-Pro运行结果以及与hiclib的对比
: Q0 J ?3 a" g3 {7 t1 aHiC-Pro和hiclib分析结果有很好的相关性,在不同分辨率下,二者获得的相互作用热图很相似,再次说明HiC-Pro能在较短时间内完成效果很好的Hi-C大量数据分析。0 E6 @5 u. R# T
6 i/ {6 J5 y, K8 f5 J/ [2 p; |, r0 ^图2 HiC-Pro和hiclib相关性分析
% O1 f8 i4 j# _5 `/ {0 THiC-Pro采取迭代矫正算法,增强了可操作性。在不同Hi-C分辨率下,比较HiC-Pro和之前的流程HiCorrector,发现在进行下游分析之前,HiC-Pro中的算法可以充分加速Hi-C数据的标准化。' f% u+ F: R6 z( g! `9 ? _* h) B
将HiC-Pro用于构建人GM12878细胞系等位基因特异性相互作用图,用已发布的GM12878细胞系Hi-C数据进行分析。研究发现,在826M双端reads中,61%被HiC-Pro划分为有效相互作用,6%的有效相互作用比对到父亲或者母亲的基因组上,用于构建单倍体图谱。和预测一致,失活的X染色体图谱分为两个大的区域。
t( M+ o9 w; {+ ~/ \ D, G % P* b) a) G. G! H# ~
图3 HiC-Pro构建等位基因特异相互作用图
: G2 G; Y5 ]( f- P3 @综上所述,HiC-Pro是一种灵活高效的Hi-C数据处理流程,经优化HiC-Pro可以解决运行高分辨率数据的困难,同时提供了一种高效获取相互作用图的方式,并可广泛应用于质量控制、数据标准化、等位基因特异性图谱构建等,其源代码及文档可以免费在Github获取。HiC-Pro的出现,使信息分析手段变得高效简洁,将极大的推动三维基因组学领域的研究进展。( F2 Z+ N1 P% o) ?4 v) v: C
参考文献:Nicolas Servant, NelleVaroquaux, Bryan R. Lajoie, et al. HiC-Pro: an optimized and flexible pipeline for Hi
. k# Y3 `% I: h5 t-C data processing [J]. Genome Biology, 2015, 16.8 e: ^: E- X t1 ^
|
附件: 你需要登录才可以下载或查看附件。没有帐号?注册
-
总评分: 威望 + 2
包包 + 10
查看全部评分
|