干细胞之家 - 中国干细胞行业门户第一站

 

 

搜索
干细胞之家 - 中国干细胞行业门户第一站 干细胞之家论坛 干细胞行业新闻 绘制基因组导航图 新工具帮助科学家绘制染色体复杂构象
佰通生物
朗日生物

欢迎关注干细胞之家微信公众平台

免疫细胞治疗交流区

查看: 1264|回复: 0
go

绘制基因组导航图 新工具帮助科学家绘制染色体复杂构象

Rank: 7Rank: 7Rank: 7

积分
21347 
威望
21347  
包包
105060  

优秀版主 博览群书 美女研究员 优秀会员

发表于 2017-9-13 21:55 |显示全部帖子
绘制基因组导航图 新工具帮助科学家绘制染色体复杂构象- }. |5 ~) B' Z0 H) }5 w/ v  I
来源:科学网 / 作者:张章 / 2017-09-13
& t; o$ L9 N" ^) e; c" B$ N7 t8 e2 |/ I  n
图片来源:Illustration by the Project Twins1 C1 ~# A9 O, W+ U' e5 l( E- x/ C  [
染色体的功能远不止保持 DNA 整齐有序。这种基因组 DNA 和蛋白质组成的复合物有许多不同的结构和构象。这些结构和构象可能会影响周围基因的表达。在某些构象中,线性 DNA 中相距较远的两个序列可能实际上非常靠近,并影响彼此的活性;而在其他形式中,这两个序列又可能相距甚远。& K3 C' d( e' B& w9 v9 \) [* D
美国麻省理工学院研究生 Erez Aiden 与同事共同开发了一种能在基因组水平上揭示染色体折叠方式的新工具。这种名为 Hi- C 的技术不仅能详细描述影响基因表达的 DNA 环和结构域,甚至还能将复杂的基因组拼接在一起。
7 B$ L' g2 X2 D) ]: B灵感激发! \+ l6 l8 |4 E8 g* W# q' l$ H2 L
虽然,它只是以 2D 矩阵呈现的数据记录了染色质的交互信息,但在 2009 年,Aiden 还没能找到一种简单方法探索这些空间构象。所以,他自己开发了一种技术。& a  x2 L* j; w7 |0 \) G0 |
Aiden 回忆道:“当时我只能打印出多个分辨率的 Hi- C 矩阵,而且需要用上百张纸。我还要找来最大的会议桌,把打印的所有矩阵都摆放上去,以查看大规模的空间构象。”
+ ?, G3 Q/ W: K4 I即便如此,Aiden 也认为 Hi- C 是一个很好的界面。不过,他也承认需要一种更环保、可持续和共享的方法观察染色体构象。
) s! h! N! D: A# y" l/ A最后,Aiden 开发了 Juicebox—— 一个基于 Java 的桌面应用程序。它可以提供 Google Maps 样式的染色质交互数据集,允许研究人员从基因组水平放大或缩小观察其结构特征。/ @5 z* _1 N0 j3 B) H
2014 年发布的 Juicebox 大约被下载了 1.4 万次,今年研究人员又推出了一个基于浏览器的版本。Juicebox 只是一系列探索 2D 基因组交互数据的免费程序中的一个:一些程序专注于相对狭窄的染色体位点,而另一些则可以探索基因组。但这些程序的出现反映了染色质相互作用数据集的日益增长。事实上,4D 核组项目等大项目更是大规模地促进了染色体交互数据集的爆炸式增长。1 `3 ]# W! J8 B
马萨诸塞州波士顿哈佛医学院生物信息学家 Peter Park 指出,“因为数据变得如此复杂,所以可视化尤为重要。”' x/ u; w  B" Y1 b) L
目前,加州大学圣克鲁兹分校开发的 Genome Browsers 是最受欢迎的探索基因组数据的门户之一。像大多数基因组浏览器一样,它将序列数据呈现为一维“轨迹”,显示为表观遗传特征(如组蛋白修饰和甲基化位点)的线性字符阵列。
: ~: A4 ^! k/ P( h: k" W1 yAiden 等人,都从 Google 地图中获得了灵感。加州大学圣迭戈分校的 James Robinso 表示,有了 Google 地图,用户就可以从全球视图无缝切换到街道级视图。这样一来,整个数据集非常巨大,但 Google 并没有一次性提供所有数据。相反,软件“将世界划分成不同分辨率的瓦片”。在任何时间内,用户只能查看少量的瓦片。而这些瓦片被组织起来,使相邻的瓦片更易被获取。
; F4 e: x! N4 C; A; T" r' U! x类似地,Juicebox 的 hic 文件能以多种分辨率存储每个可能的染色体对的图块集。软件的查询表可以直接检索数据,从而加快访问速度。因此,Juicebox 用户可以无缝探索整个基因组的交互作用,然后放大以查看精细的功能。
6 D8 x: g8 T- b, S2 V基因组同步4 k: ~% |& d$ L# [" D; ~7 v9 V
今年 3 月,哈佛医学院生物医学信息学家 Nils Gehlenborg 开发了基于网络的 2D 基因组交互可视化工具——HiGlass,它也提供了类似 Google 地图的体验。8 J& ?5 _! S: A
与 Juicebox 一样,在 HiGlass 中,研究人员可以导入基因组轨迹以便了解所看到的内容。此外,HiGlass 还允许用户在一个浏览器窗口中打开多个 HiGlass 视图,并将它们同步起来,使其始终显示相同的区域。
3 U% Z- H3 `1 Z" |Gehlenborg 表示,这样研究人员就可以比较不同条件或实验中的染色体构象了。“我们在为研究者和分析师提供新猜想的灵感。”他说。5 P2 U( @# q) A( k
该团队已经建立了一个 HiGlass 服务器,以挖掘公开的数据。由于需要分析自定义数据集的研究人员必须在本地安装该软件,Gehlenborg 团队为此提供了一个 Docker 容器。& Q' Q+ K3 j5 ]1 J* p1 Z( ~
实际上,Juicebox 的 Web 版本和 HiGlass 都允许用户创建可分享的 URL——指向数据的特定视图。Aiden 把这个功能称为软件的“杀手级应用”。他认为,如果用户注意到基因组结构与特定的 1D 轨道完全重叠,“那么点击那个 URL,复制它,就可以推送它了,而所有接收到该分享的人都可以点击它,随后便会得到相同的参数设置”。
% F; j1 o* V% |另外两个可视化软件——3D 基因组浏览器和 WashU EpiGenome 浏览器均能提供更多的本地化视图。用户可以选择感兴趣的区域,浏览器会显示该区域的基因组交互信息。
$ T+ D7 P9 h' F: j' A- C此外,Juicebox 和 HiGlass 将热图映射成矩形的镜像,而这些浏览器则将热图显示为三角形。加州大学圣迭戈分校基因组生物学家 Bing Ren 说:“我们去掉了一半的冗余信息。”6 `) s$ P; e. c" M/ |! U
也许,这种变化可能听起来不大,但宾夕法尼亚州立大学的 Feng Yue 的研究,这种变化能让研究人员更容易识别功能区域。例如,3D 基因组浏览器允许用户将来自两个物种的热图相叠,以评估折叠体系结构的进化保守。 “虚拟 4C”模式允许用户查询与特定基因组位点相互作用的序列的 Hi- C 数据集,从而方便研究者观察基因调控区域之间的相互作用。+ U5 p! Q% v5 d/ F8 D
另一个流行的基因组交互可视化软件是由加州大学圣迭戈分校的 Sheng Zhong 等人开发的 GIVE。GIVE 允许研究人员使用几行 HTML 代码,将完整功能的基因组浏览器(包括 2D 交互数据查看器)纳入其个人或实验室网页。Zhong 指出,研究人员可以与同事分享数据,发表文章时也可以附上链接,整个操作时间大约为 20 分钟。
& P% H1 A; F2 ^$ }# c* c+ s意大利米兰 FIRC 分子肿瘤学研究所计算生物学家 Francesco Ferrari 则使用 R 编程语言和 Bioconductor 软件库显示其 Hi- C 数据。虽然这难与缺乏其他软件交互,但是由于该团队一直使用 R 和 Bioconductor 进行数据分析,“所以这样更方便”。" c* k: g1 l2 [! N
实现 3D
: C( @! W5 `4 w3 G  ~最终,2D 互动矩阵可以提示 3D 结构。毕竟,如果两个区域相互作用,它们可能距离非常接近。越来越多的研究人员正在使用他们的 2D 数据直接计算和可视化 3D 结构。) L+ s! A& G; ^, X. y
英国剑桥巴布拉汉研究所博士后 Csilla Várnai,参与了今年早些时候单细胞 Hi- C 研究的 3D 模型构建工作。她使用一个名为 Gromacs 的通用分子建模包来将染色体模拟成一条串珠——每个珠代表约 10 万个碱基——然后将串珠进行折叠,而 Hi- C 的交互数据则是折叠时的“约束条件”。0 D  D7 i- x. h) g
某些软件则专门被设计用于染色体结构的建模。挪威奥斯陆大学生物信息学家 Jonas Paulsen 开发的 Chrom3D 软件将 Hi- C 数据与核包膜距离的信息相结合,以模拟染色体在细胞核中的位置。Paulsen 提到,“这对基因调控非常重要”。核外围附近的基因倾向于被抑制,而位于中心的基因通常是有活性的。
9 x4 T, L) h* p) q* O西班牙巴塞罗那基因组调控中心基因组分析中心的 MarcMartí-Renom 和 Mike Goodstadt 开发了另一个 3D 工具——TADkit。TADkit 允许用户在相应的 2D 热图和 1D 轨迹旁边查看 3D 染色体模型。只要选中一个视图中的一个特征,那么软件就会自动高亮其他试图中的同一特征。
: q+ V- K( o7 M5 h! d+ H不过,由于大多数 Hi- C 数据集包含数百万个细胞,到底 3D 视图比 2D 视图能多提供哪些信息还有待观察。
" g5 T: H) k7 t7 z) k. ]对此,麻省理工学院生物信息学家 Leonid Mirny 打了个比方,你拍了一堆人的照片,然后将它们平均化,最后得到的照片会跟谁都不像。3D 视图可能也会存在这种问题。Zhong 指出,目前还不清楚哪个工具(如果有的话)将成为基因组可视化的黄金标准,现在这方面的争论已经很激烈了。
6 C6 [1 u1 Y# p- GRen 则表示,对于基因组生物学而言,可视化是关键因素。他解释称,分析工具是在统计数据的基础上设计而成的。有时候它们会错过一些东西,有时它们会推断出一些压根不存在的功能。“因此,科学家还是要谨慎,自己检查分析数据非常重要。”
1 R8 ~; a8 X, q2 q2 I" {
附件: 你需要登录才可以下载或查看附件。没有帐号?注册
你需要登录后才可以回帖 登录 | 注册
验证问答 换一个

Archiver|干细胞之家 ( 吉ICP备13001605号 )

GMT+8, 2017-11-20 08:12

Powered by Discuz! X1.5

© 2001-2010 Comsenz Inc.