  
- 积分
- 1133
- 威望
- 1133
- 包包
- 4372
|
本帖最后由 细胞海洋 于 2010-5-16 11:49 编辑 ) l, U- h: U2 I. [
3 K8 w& V4 d4 |' p
RNA 靶基因预测
1 L2 v3 d) O' B与小RNA 基因预测相比,靶基因的预测具有更大的难度. 因为目前已知的小RNA 靶基因数量非常有限,不能为预测提供充足的依据,而且对预测的候选基因的鉴定步骤相对繁琐,很难实现高通量和规模化. 从已知的小RNA 与靶基因的相互作用中,人们得出小RNA5′端的2~8 个核苷酸几乎无一例外地与靶mRNA 3′端UTR 区完全互补. 因此,这一特点被各种靶基因预测方法广泛采用. 同时,结合小RNA 与靶基因形成二聚体的热力学稳定性和二级结构分析软件,如MFold、RNAFold 和RNAhybrid ,以及小RNA 的3′端与靶基因的互补情况等,作为其它限制条件来进行小RNA 靶基因预测[53 ] . 目前,不同研究小组已开发多个小RNA 靶基因预测软件,主要
3 F, _6 c( j' e% \8 I% Q有以下几种:/ Z! p9 {6 H" L9 c4 G0 j r
TargetScan, c- ^/ K4 p7 @2 D1 z' `" v% A) a7 ?
TargetScan 是Lewis 等[54 ] 开发的用来预测哺乳动物小RNA 靶基因的软件,是最早出现的靶基因预测软件之一. 它提供网络实时服务,至今仍是使用频率最高的小RNA 靶基因预测软件. 它基于在mRNA的3′非编码区搜索与小RNA 的5′端第2~8 个核苷酸( 被称为“种子”序列) 完全互补的序列, 并以RNAFold 软件计算结合位点的热力学稳定性,最后得到评分最高的mRNA 序列. 其最新的版本TargetScanS 采用了改进的算法:以腺苷酸之后的长度为6 个核苷酸的序列作为“种子”进行扫描,并且要求这段序列定位于保守区内,而其旁侧序列的保守性相对较低[13 ] . 此外,TargetScanS 不需要计算配对区的自由能,使靶基因的搜索范围进一步缩小.1 _9 H& ]) `$ L9 X) \0 g" V
miRanda
- e5 z' s8 r& h/ q" v$ A5 F# `miRanda 为Enright 和John 等编写,可用于线虫和人小RNA 靶基因的预测. miRanda 主要强调小RNA 与靶基因连接位点的进化保守性,亦偏重于以小RNA 的5′端序列搜索靶基因, 并仍然采用RNAFold 计算热力学稳定性. 该算法的预测结果覆盖了10 个已验证小RNA 靶基因中的9 个,其假阳性率估计为24 %~39 %.
- R9 G( T e: Y2 X' ADIANA2MicroT
' L' B- T9 g3 fDIANA2MicroT 是Kiriakidou 等[55 ] 编写的一种特殊的小RNA 靶基因预测软件. 它主要针对含单一小RNA 结合位点的靶基因,除了要与小RNA5′端“种子”序列配对外,还要与小RNA 的3′端配对,并要求配对序列中央最好有“囊泡”存在,即靶基因上小RNA 结合位点中央未与小RNA 互补序列所形成的泡状结构. 该软件在线虫中的预测结果,成功对应了多个已验证的小RNA 靶基因.8 ^0 @& v5 u3 R5 S+ S# W! f/ W( ?! @
PicTar0 A) k# `9 u; d$ W8 n. a. W9 D
PicTar 是Krek 和Grum 编写的一种更为高级的小RNA 靶基因预测方法,可以在脊椎动物、线虫和果蝇中预测小RNA 的靶基因. 它不但预测了含单个小RNA 结合位点的靶基因,而且预测了多个小RNA协同作用的靶基因,即靶基因含有多个不同小RNA结合位点[56 ,57 ] . PicTar 使用复杂的智能配对算法,以精确筛选物种间高度保守的小RNA 结合位点,并充分考虑了小RNA 的协同表达性. 作者通过PicTar 预测的13 个靶基因,经生物学实验验证了7 个,该算法总的预测结果覆盖了9 个已通过体内实验验证小RNA 靶基因中的8 个. 估计其假阳性率为30 % ,具有不错的前景. |
|