  
- 积分
- 24651
- 威望
- 24651
- 包包
- 144021
|
安诺基因Hi-C再获进展,联合研究成果登《Genome Biology》
2 g& i p2 |9 p- ]来源:安诺基因 / 作者: / 2015-12-118 _# L7 u% ~# W8 {
近日,安诺优达和法国居里研究所等机构的共同研究成果发表于Genome Biology(影响因子10.8)上。该研究成果为全球学术界提供了一项灵活高效的标准化Hi-C数据分析流程。
) ], Q e F8 v. B 1 }' v( L9 m g/ Y8 d
高通量染色体捕获技术(High-throughput chromosome conformation capture,Hi-C),以整个细胞核为研究对象,利用高通量测序技术,结合生物信息学方法,研究全基因组范围内整个染色质DNA在空间位置上的关系。通过对染色质内全部DNA相互作用模式进行捕获,获得高分辨率的染色质三维结构信息。随着Hi-C技术逐渐成熟,开发一种可以用于任何项目的生物信息分析流程十分必要,然而全基因组的Hi-C测序数据常常包括多达上百G的原始序列产量,处理这些大量数据需要优化的生物信息分析流程,长期以来缺乏一种稳定、灵活、高效的流程。目前能处理Hi-C数据的软件HOMER、HICUP、HiC-inspector 、HiCdat、HiCbox及hiclib要么不能以并行模式同时处理大量数据,要么需要非常强的Python库编程技巧。3 l$ d9 u& l6 S. p5 t1 C/ s3 R
本研究中,安诺优达总裁陈重建博士携手科学顾问Edith Heard(法国居里研究所资深研究员)及Hi-C技术发明人Job Dekker,研发出一种Hi-C数据处理及分析的新流程HiC-Pro。
6 T8 o" K/ z' f2 \' w$ I1 Z+ z2 EHiC-Pro能够避免以上缺陷,它是一种经过优化的可操作性极强的信息分析流程,采用基于酶切位点的分析策略,可以将原始的Hi-C测序数据转化成标准化的相互作用图,运行时间大大缩短。同时,HiC-Pro应用非常强大,可以比对测序reads、检测有效连接产物、执行质量控制以及制作染色体内部和染色体之间的相互作用热图,此外,HiC-Pro还可以利用阶段性基因型数据来构建等位基因特异性相互作用图。" Z; O6 v5 x; l% y- Z. O
研究中分别采用来自两个公共数据库的IMR90和IMR90_CCL186数据进行分析对比,对于每个数据库,运行HiC-Pro流程,获得分辨率为20 kb、40 kb、150 kb、500 kb 和1 Mb 分辨率的标准相互作用图,IMR90_CCL186 数据库还能获得5 kb分辨率的相互作用图。结果表明,和hiclib运行相同的数据,HiC-Pro完成分析少于15小时,而hiclib需要用28小时。此外,HiC-Pro运行IMR90_CCL186数据得到5kb分辨率相互作用图的用时仅12小时,表明HiC-Pro能在合理的时间分析大量数据。
" f+ Z: }* P" C& W2 n2 E9 q' A9 J$ F
! o# r7 c2 q& }% ]- ^图1 HiC-Pro运行结果以及与hiclib的对比
1 {9 t/ p! e4 B7 r9 v5 W) T: c4 | EHiC-Pro和hiclib分析结果有很好的相关性,在不同分辨率下,二者获得的相互作用热图很相似,再次说明HiC-Pro能在较短时间内完成效果很好的Hi-C大量数据分析。( h& `5 F% ^ t5 s( c0 D" }( _# |% G
$ D1 y& s8 {- n2 _) \: p
图2 HiC-Pro和hiclib相关性分析
7 u1 U5 ]. ]+ R& u" vHiC-Pro采取迭代矫正算法,增强了可操作性。在不同Hi-C分辨率下,比较HiC-Pro和之前的流程HiCorrector,发现在进行下游分析之前,HiC-Pro中的算法可以充分加速Hi-C数据的标准化。, t1 ?3 P4 J9 M$ m. y+ v; F: E. Q
将HiC-Pro用于构建人GM12878细胞系等位基因特异性相互作用图,用已发布的GM12878细胞系Hi-C数据进行分析。研究发现,在826M双端reads中,61%被HiC-Pro划分为有效相互作用,6%的有效相互作用比对到父亲或者母亲的基因组上,用于构建单倍体图谱。和预测一致,失活的X染色体图谱分为两个大的区域。
& K( l$ K* [" {$ s6 x! U 4 ?: K' R- |& t d4 \; c# M
图3 HiC-Pro构建等位基因特异相互作用图3 ]& k! f9 ]1 `& Z2 ^# l8 t
综上所述,HiC-Pro是一种灵活高效的Hi-C数据处理流程,经优化HiC-Pro可以解决运行高分辨率数据的困难,同时提供了一种高效获取相互作用图的方式,并可广泛应用于质量控制、数据标准化、等位基因特异性图谱构建等,其源代码及文档可以免费在Github获取。HiC-Pro的出现,使信息分析手段变得高效简洁,将极大的推动三维基因组学领域的研究进展。
9 x" T9 h" |- A, |+ T$ ~& t; ~/ F1 T参考文献:Nicolas Servant, NelleVaroquaux, Bryan R. Lajoie, et al. HiC-Pro: an optimized and flexible pipeline for Hi! U0 F% u) a* g$ ^0 j
-C data processing [J]. Genome Biology, 2015, 16.5 t. w1 y9 f d- o+ E: T0 l# d
|
附件: 你需要登录才可以下载或查看附件。没有帐号?注册
-
总评分: 威望 + 2
包包 + 10
查看全部评分
|