|
  
- 积分
- 1432
- 威望
- 1432
- 包包
- 13671
|
基因芯片数据分析与处理
本帖最后由 hualin840518 于 2009-7-5 19:17 编辑
4 `, N- x' M( u" N: ?) s" l" H b8 W( x1 Q8 y1 Z9 ?! p
超星数子图书馆 这个数据库有电子版的,不过我现在下不了!
2 x5 K. F- F3 \' r8 Q9 R不过后面讲的贝叶斯网络模型我以前上传过一本书你可以参考一下!
0 @6 L8 C: x) b4 H1 k9 @) m下面是这本书的简介和目录!; o5 {! i+ y# f. D
h% L, s7 U- @
基因芯片技术是交叉性很强的学科,尤其需要生物学家和计算科学家通过“双边对话”来完成实验设计、实验方法到数据分析和阐明。不同学科研究人员之间的沟通需要跨专业的复合型人才,而目前复合型人才非常缺乏。有鉴于此,我们编写本书,目的在于通过基因芯片技术及数据分析基本原理的深层描述,培养有多种技能的复合型人才,从提出生物学命题开始,经过合理的实验设计、实验流程以及数据挖掘,以期更好地解决生物学命题。
8 Y5 N, y8 q' M+ O6 C6 f本书共分为十六章,分属于三大部分。第一部分主要为基础知识部分,包括概述、微阵列基因芯片制备和检测技术、统计学基础3章;第二部分内容是数据处理方法,包括实验设计、图像的获得和数据的前处理、数据的预处理和归一化、差异表达基因分析、芯片数据的可靠性分析、聚类分析和可视化微阵列实验中的分类方法7章;第三部分主要为数据挖掘和应用—相关内容,包括微阵列技术的标准化、基因芯片数据的基因注释和功能分析、系统生物学及基因调控网络、基因芯片技术的应用——从基因筛选到临床诊断、主要数据分析软件的介绍和展望6章。
& L3 b- U6 n6 z. l. ?+ ^通过阅读本书,生物学者和计算科学工作者都能从中获得他们各自所需的信息。从事统计学研究的人能对生物学和芯片技术有清楚的了解,生物学或医学领域的研究者能初步掌握基因芯片中所涉及的统计学知识。同时,本书也可作为各大专院校生物芯片技术和生物信息科学的学科建设的教学参考书。
) y7 B) d5 L2 r; C+ B8 \" `
5 k; R$ P$ u+ ]+ r! E; u# B( ?+ I 目录
* y7 t' A1 T& S& O3 z2 R
% f. l& ~% R- b, _, X 第一章概述1
: a! {8 J# v2 ]4 S' j& V3 f+ c7 U8 | t& R7 D
( Q: F0 C- [* K" E3 }) Y9 d第一节分子生物学技术及基因、基因组
- t, ~* k# H; K2 N1 C1 m+ B6 h) h9 i4 v7 v/ w
) b$ J- ~8 K$ H3 D h科学发展历史简介1 3 L8 w2 w$ {1 Q4 j! G- c
2 A9 O0 p0 W( H) F0 k
7 \" i2 r! W3 ^, {
第二节基因芯片技术简介3 & U. g4 o0 ` y
! M, ~3 k" p9 Q( g
1 J& ?# O+ J4 l" c- w/ L7 s
一、基因芯片的基本概念4
5 t$ D/ I* l% B: Y& K5 B$ w, R7 ?$ u- C" O7 L6 F% F* ]8 b7 ?- a
6 l9 u1 U) n3 \. O b
二、基因芯片技术的产生和发展4 6 o' ]: m% ]3 U( U% n
/ ~! k8 M. w5 k+ g' @* P, {
% L9 \, r& w& z% u
三、基因芯片的应用领域6 5 A3 T( r) \/ V( O
& }, u$ @0 o2 h. i" j! ]
& z# i2 q; x' j第三节生物信息学与基因芯片的数据 ) `6 Y) x+ B3 o" J5 z5 c e
$ e: |, r) C) D
! m. {) O7 E+ O, s8 L# }. f
挖掘7
! u2 t4 F; Z& ~& L9 ^0 z: ~" }9 N1 n' O0 y/ E
/ g$ u0 ~" h6 O: G' G j2 [- p
一、生物信息学的兴起7
2 m, r! h. U& X# y: n: d! q$ ?, c# l3 L( C( p5 _4 h- ?; M
: ^3 l( l) L0 E" w8 O
二、基因芯片的数据挖掘8
( x( h) ?9 c9 ^2 ?
* j. u8 X. I5 L
( k D2 j# D. ?* B参考文献9 ! l1 t3 x5 [) _* o. \# D0 L5 |: b
# ?7 V% _& F# Y2 c
1 [0 G9 ^3 O6 N4 o) k, e) L# f( s第二章微阵列基因芯片实验技术11
$ v5 c: ]% w! Q6 w1 t8 @/ t( q1 p
8 N% ^9 V/ y9 c8 X6 n4 l7 j- _4 p- |, h3 T
第一节基因芯片的价值和分类11
: K6 M& {3 |) L- \( i. v! F" S$ O; J- Q
- V- ]: M! J0 j: _: |
' c: V- x4 i" _9 T6 {一、基因芯片的价值11 : {3 b$ K" [; |* n5 [
+ j) j, g5 `6 S' ]5 K( S1 ]/ |% r. c1 a& V0 S5 C! c( d
二、基因芯片的分类12
. k- P$ n+ b! ^/ f: z' ]6 b+ z+ m3 q# c/ b( h& {
1 S" j7 X- K' z) ^( G$ p
第二节基片的制备15 . W6 T7 u, \8 Q0 j
4 }* Y. O% `3 O; d3 }# L5 Q, y
+ [; `, G$ t2 @9 W8 j' M# r
一、基片的类型和性质15
2 E1 ^0 h5 I) K1 }& g
* O. D2 [( l% w2 h
" U! D1 x" P% b: d& L二、玻璃基片表面的修饰方法17
1 {3 h; P% p7 _, g# ]1 M
5 l7 l7 H' ?3 ~) V9 {; T
m% R! E- m, q1 _9 n9 r5 i2 u) V第三节点样探针的制备18 4 h" B! }0 m' B( F
/ K$ e0 k D2 O$ p( ?; u% Q3 D0 u2 D
9 ?4 w9 m( p6 b
一、cDNA探针的制备19 2 Q; W. G( ]) N, c9 n- z
: s7 Z/ w2 S" Q. a% [! `4 k* K" O4 o5 h2 z8 Q& W) O) X
二、基因组DNA探针19
; U8 x" h) q2 W" l k, e: I1 @6 Q4 ?
! O+ a2 R- Q- f9 F三、寡核苷酸探针19 + m( @, a! d0 B( \8 f4 ~9 P
0 O7 ^% ^3 y/ R1 x8 w
' D1 Q# A0 [) Q! g四、独特的PMMM探针设计20 . u7 Y' r: c( F4 [
9 A& K& k4 {' k9 ?7 ]4 ~' K
+ n9 S; W$ p# |* P) U3 W4 D
第四节基因芯片点样22 ( [ f; q# S m* s' y
! u' {3 V) j1 w
" D* B$ Y' A3 ^4 @+ l( C+ M9 p一、芯片点样仪和点样方式22 ' |* Q7 R# t- c, u( w: B& j
3 e+ r# @0 D- b. I5 o- @/ b
2 B9 b7 C2 K2 U8 @' j二、点样后处理27 5 S6 B" N b9 }6 D
) R4 N; u$ d6 K. f3 N, d% X! d
8 ^$ ]! F+ v5 Y. V1 \
三、基因芯片的质量标准28
5 e/ V* Y2 G a% u+ e% P* w9 _1 ]) h3 a; }5 |; D
$ o1 f5 D$ F6 V第五节原位合成及纳米结构的基因芯片
4 O [( l- w0 Y @8 k) Z2 W, e6 f9 J; i$ w* p8 u) ]
' V" n) `4 z& A9 ?! [; I$ ^制备28
2 S, K. ?) h& o& n+ c0 d( `: V `! l K+ `& V) Z
% j/ P! T, E0 i( {7 O0 P/ g( `
一、原位合成法制作基因芯片28 # m. R+ w) a$ F/ ?: B, f+ H- r
' M4 z+ R S% M: ]7 {1 D2 G# ?9 Q
二、纳米结构的基因芯片制备31 % D3 t# n1 N. b% u z
M+ h9 |! c0 |. }1 y! z" D! j$ o: a/ z! m
第六节表达谱基因芯片的检测方法34 . f" _2 J, {8 `) o
0 w$ e# y ^+ |5 ?" d- V o' M' l3 i1 z$ |& C
; z$ E9 w( t/ ~: y& Q3 r
一、样本选择、处理和RNA的分离35
! l* M7 _3 Z' `! a& D8 a& e3 X1 T e
5 @& q0 B" D8 |- Z, D; @1 N! D" E
二、mRNA样本标记35
# l& O+ T8 Z3 [4 q& s4 ^6 Q6 }! B+ e, q6 S
- D+ b2 m. o e9 _8 s
三、芯片杂交38 " M& J3 [0 [ _5 T$ |2 ~) Q
3 ~7 ^+ j& |8 ?* Q* N
. @. F* P5 S8 W+ |
参考文献39 + u; J* y! G! N( u- j; b' {# E6 U
) J0 z1 t8 O. W" ~' l0 e
& k' g% X6 G% F; B% k7 }5 U第三章统计学基础41
F/ X6 E6 I6 P% I5 v5 Y' ]( ^; S+ L. i+ n' W9 i
, o# z1 J0 K8 w6 h; _* \第一节统计学的基本概念41
. E4 }, Y; r* S# y. A" `4 m M* k
9 D8 n; }, N! `6 d一、总体与样本41 1 K1 W7 Q+ F6 l/ }7 j/ W2 p. R
5 k- V# x! q+ j# T4 B; u: u' D0 G4 k: h- A
二、资料的统计描述42 2 y8 K1 Y* V8 x z3 t# k
6 P' h: t3 D j2 l& d& j3 p
4 U2 |, G% \2 v1 K9 s
三、随机变量、概率与分布43
3 Y0 R( W8 N5 h) B" E) M3 f; Z! r$ g2 [* Z8 M+ n: ` f0 \
" M u$ Q/ n# a4 u+ H7 e) r9 F2 Q四、统计量45
5 a6 x) u2 u; K
. |1 g5 |. f0 a1 r
4 u- [0 k t' u4 i8 X第二节假设检验46
( H: r6 J/ Q i w4 [
8 \- Y! y* y% M: J
/ _. X: k. x% C, T/ Z) z2 x一、假设检验的基本原理46
% h8 j8 F2 K5 u7 n1 L9 t- T- X) [% e, `9 g: ]; }% h- Y
! a0 s& T( p% f% C! B; q( b5 t* {
二、假设检验的步骤47
9 t7 C0 C4 `& v, d, a5 z( m. D* J& V5 K* o2 T& H+ N
, E% c0 h% P2 r$ x6 L5 ^
三、假设检验的基本方法47 8 g/ S; u& R: U- y
% X) M( [' [: v" @
( h: |1 V; ^" I/ \) l# e& |
第三节方差分析54
& q8 ?$ l$ S( l; Z
: F2 k4 S h8 c
& P9 H. `5 y8 r+ K8 k- a一、完全随机设计资料的方差分析54 3 P! Y8 Q; f! n* G" c1 ?6 ^
, J% o; p. t- z+ L W
$ k* b2 x+ A1 B$ R6 |, U- h: p" O二、随机区组设计资料的方差分析55 * J+ F& ?1 R! F2 x% V6 t C
# [# ?! p3 j! P0 K4 L' U r P7 L) s+ A3 G2 @; G( Z
三、多个样本均数间的多重比较57
6 s3 z5 e& @3 y5 ]' T4 B2 a
- I R1 g0 R; T" U9 B/ U# C5 s( c
0 @: T0 l% I0 J第四节聚类分析与判别分析简介57 9 X6 [( {6 v& r! C% m
8 x' I) H4 F# h' ?( ?- Z2 l
: e5 L3 F8 U. l+ R7 r/ i一、聚类分析58 $ {2 P' R4 K8 T- e8 V2 V! p
2 B6 S! X0 `& L' n) C/ d5 w& C) W% N: h% ]
二、判别分析59 - K- f/ E. \4 _: v& l
3 V/ U) `! f( r% B3 _2 H- B) l6 Q( c5 T; v
参考文献61
2 u3 I E1 v9 Q# y* v
8 ~/ R2 E3 E- m5 V
3 D. X; J1 u) v4 T4 `5 b第四章实验设计62 " [4 a ^6 Z& d
4 i) a! s% g9 \- d
' y7 b9 P3 o. u- B第一节样品配对模式62 2 O2 X( U6 C* G
$ M$ W7 E# [! r% F, v6 v3 ]( N: S& e+ B* v3 ^$ l( t
一、基因芯片实验的分类62
s1 b5 |) S7 x$ l
& A4 e Z+ l) W" P: Y- ^; ]! j- }: {" f, |$ M0 W
二、样品配对方案概述64
2 ~( {+ |1 I# u- d
& p7 J. K) R: e& V& p4 Q0 }
: b7 W, X: Z: w$ f三、样品配对模式的选择66 5 O3 ^, G6 Z. y j& F
9 B% t: }7 C* Q, z! `! M% Q. z# E9 D
) S9 m4 s" i/ L! i( Y4 p! p1 v第二节样品的重复及合并69 ; p9 [! J7 x! o# n& D t" W2 m& i
6 Q0 I: H z( T, ~9 K- a
1 W& [0 u- D; l+ K W% C. h一、实验误差的来源及重复样品的使用69 * s& y$ [- K; S* g" ^1 t$ U6 N
" j6 B) E1 f" U& e' l* J
& \) k% n3 w1 R2 w# M1 T3 \二、样品重复数量的确定70
# J5 g- B: S4 L0 f% L1 a# F% V4 o+ O8 v4 k$ @' F
* t% N8 {) {3 M6 Q1 {
三、样品合并70
/ g# D5 S- J% l7 @0 Y7 M0 ^/ R* @( O
1 J6 U; T5 u- U# L- d6 D第三节总结72 8 q$ o$ ?& j% B
+ s( k+ B$ E( v! Z% \- g
+ m& c3 u( R+ k2 O参考文献72 # H8 z( f2 ~! B, p: X7 o. S/ I
# `) w2 R' `6 e: m( t0 a
* P! [, y5 ~; t% e4 H第五章基因芯片图像的采集和处理74
* I4 y$ A6 M* E+ A
0 A; d. V0 N7 @9 L
1 Y" B' [! A% h6 d( W6 j第一节基因芯片图像的采集74
+ ]0 e" X2 q4 U- U9 u
, s8 ^" `8 N6 Z- _/ D/ [2 f( C: W6 ~& N$ I, ?# V# v
一、激光共聚焦扫描仪74
7 _% o$ }! L% R( a) r5 ]* P a$ e c' ?/ L' `* r
/ R2 x/ ] u9 g# q9 o4 {8 }二、CCD扫描仪78
; F+ t- G% f0 l8 M4 j
. b1 |9 a# N: o1 N- T* k1 @" j. y" \' q; ?
三、扫描仪的技术指标79 ; m/ b( `1 a+ D& U3 [9 y! ?. t
! \5 O _. P X- E1 p1 d" T2 \
- p& [% ]" v1 ^第二节基因芯片图像的处理81 & I% y* s; T: ~9 B5 |
$ s0 T5 |+ T7 ]2 ]; Z
" `8 a1 s7 m- K1 {* p+ L一、划格83 5 o, j* b3 c& r
3 i- \' d$ l" w& v# t7 o) _7 [- A6 Z
( t) x* U5 _& s$ E# K" F二、分割84 * `& H& w% U: j2 z- z- J" v* q5 F
7 G/ N5 L% T9 y) h
4 [0 u5 ] b+ i# J9 ]* t# i三、信息提取87 * r6 G. J# x9 }% _; ^
7 B5 P" k2 T1 V6 [. J! R( g9 {, o
8 d6 E1 j; S" i1 R+ v$ P
四、质量评估88
, k9 Y+ w, h9 d, @ \4 Q- c* x$ X# w2 W
$ J9 ~, K& n0 T4 {- E$ ?2 }第三节一些芯片扫描仪和芯片图像处理 ( X* ~, O! l3 i! r& q+ @: r
2 O$ i$ p$ M9 h; w2 \" W; t; W5 i
3 C0 c& k( R! T) a软件的介绍88 2 S% o( A( q- Z5 t! z; {
% O, N! |) T+ a# N' t" x" R- F
- a& v7 s$ i# @! k; M Z4 B一、激光共聚焦扫描仪90 , I$ N, j' y% W8 u% W P
/ y/ x. k3 [% i8 k9 G) z9 N
. \* U( G# q9 r- O- N4 j' ^二、 激光非共聚焦扫描仪91
5 R* }( h, ~5 H0 I- T9 ]+ ^
7 _6 n3 a$ c$ p# }$ X$ I% c9 J: K! C; a! C+ a4 G
三、CCD基因芯片检测仪92 & [' T; Q* \ E, G5 U
, n: S$ H# `$ S( z7 P
/ ?0 s/ r2 Z$ c; p% `9 R参考文献96 5 N8 X8 Q. U& M' c
; a$ x' G+ y( w4 A* F# ?! y2 R9 o1 w0 `1 |' s
第六章数据的预处理和归一化98 6 x F( Z1 @+ y5 h& f
% y' u0 a! k$ Y$ U( F" N' _/ g! h" _* i1 c! ~8 X# o F! Q- V
第一节数据的预处理98 0 ^+ Z2 M1 ^& r1 p
0 w# T9 v, i9 M6 A6 Q6 m8 X- Z! c3 g K, C4 f2 ^3 ^
一、背景的校正98
2 j$ F8 Y8 |, i$ `2 P) A* f6 Q2 M5 b- a. G
6 ^3 o+ ~ n/ k/ A" }. b4 W二、弱信号的处理99 7 n: o! w' Q, T" h6 ^* A
' T2 M1 }6 A E
$ @8 Q! n$ N: u$ `
三、数据的对数转换101
) h2 L' \9 Q$ q7 Y& p/ m; y. f1 o0 {+ I/ g q
6 n1 C( {$ |# ` v
四、重复数据的合并102 - q9 g6 W: @; l
& f @3 N6 E% g6 l! a& P/ i' g
5 p' y& @3 ^1 C" q: d1 Z4 X% D五、缺失数据的处理103 . i0 u/ v; W- {: f2 Q0 e$ `
9 B7 d6 o4 ~# t* o# }& |, t2 X1 y: T9 l {
第二节数据的归一化104 # n7 R- X8 U$ ]- I) ?# \
0 m8 w! [* B6 I( h( v- h2 `5 f8 D. v2 ]2 Z5 L0 e8 l0 L) J7 y
一、cDNA芯片数据的归一化105 |' d- {& @8 r5 Y" N, w# h2 p
& u% |* T1 `/ \: I7 d1 Z
' |) u# `% x' T. O0 Q二、Affymix芯片数据的归一化115 ; w' ^2 _5 R# o, D7 |/ _( E
) b) I a: K5 M
! D4 E& M2 Z+ q. b: Q5 ]8 U参考文献118 7 H) E8 H2 K( s/ a' H! E% u
8 ?; h% `9 f3 D4 ^8 d/ }
% v% d z$ G& j) `* D8 [* G; ^第七章差异表达基因分析120 5 K4 @: ?6 ?) Z% {0 o' C
9 A+ c6 y W- _5 l8 i3 z9 ?1 G7 n8 O% w1 b7 A9 G
第一节差异表达基因的挑选120
5 f; B: b4 j- ^- ~- z. g2 w- Z. P# Q2 k1 @6 ]5 e) D$ z
2 q! D! z( m( ]+ _* ^& t2 L
一、倍数法120 + t3 t9 N4 V* o1 B2 h$ z" M
* D6 H$ G1 s, u: y
# j' H! E/ [6 ]) H2 w7 N$ D二、Z值法121
' b- O# m7 l( W& p6 E* O6 z5 ~+ u
4 y& y+ \4 M% g" I7 T2 N* ]( @+ K
7 I" U$ J1 y6 ?4 e三、重复实验的判别方法121
/ p7 j" N: a! c. D( w
! P" R; q; \) T& E( P, U- U0 M% ^. P# K" k2 q" X: c$ ^1 P
四、其他方法124 1 F( R1 ^- Z0 c6 s" Y
! c* D, c; r o; U+ n; c* c+ }
/ j- ]( Z* e- q2 U3 N
五、总结125
/ W" ^) n4 R ~
* K2 e) U" p; I# {; `" q5 ?& w
: M7 w( p9 g8 C第二节研究差异表达基因的意义126 + N1 A8 {1 L# X( M V
- V) O. H1 w# u' U. S1 N; k( f( U3 y, c8 J+ O0 U; C N2 V
一、在基因组研究中的作用126
^/ u' k) q4 S" I1 C0 K0 k
! ~, M0 @2 E5 ?2 |( ~" G/ }4 e
二、在药物研究中的作用127
N I+ n" y* Q5 P6 B# u: U" z; i: @0 S
2 D9 X' W: m( T2 Z2 E; s" d& {) j, X/ y+ `
三、在医学基础研究中的作用129
5 q( X$ O6 Y* p$ E
8 g# e/ }5 S7 K1 \# c, J3 ^# h0 X+ W2 B4 m# e4 v
参考文献131 : H" J( @- _- W/ [8 o6 g3 G e+ O
! I3 b- v( t: q, [ u. B
- S, a: a/ L$ I9 J N% ^
第八章芯片数据的可靠性分析133
& J! t# J! W0 p9 j1 l2 z% v; l) o
/ ]! v) [: a R( l8 m$ s* g7 v6 L! [9 j
第一节数据的评价133
P6 M5 F5 q* ^( j C$ }0 F/ w- ^. D" L( E% n0 j1 i8 N0 W
# d3 C- t- }% p一、差异表达基因的可靠性133
+ u+ y' W! ~6 ?8 I
. s: D+ M- j1 M* w
Y, }; D' x- S9 C) i7 R二、芯片数据重复性评价139
2 N4 B3 m* r- J% k# J! r8 _/ F3 ~0 b* D* G4 n
9 C0 w& N. k4 ?3 L1 X第二节误差来源分析142 . \" B% T0 t( j* [1 B& j# A
5 D2 Z" O( C- ^3 D5 |: P
: ^1 u7 Z; Q6 Z! a/ S) c* X一、生物学差异来源142
: F& B- D2 z D/ I5 q! D+ U
! `% E/ T7 A: i; ^. Z& U9 V7 g4 B! _% C+ o# E0 L) {
二、实验系统误差144
7 U: F& u3 Y1 Z/ B4 V8 X: b/ S0 _9 T) f" [/ V
7 g$ V2 |7 C, ~5 V6 l: h0 U" |第三节基因芯片的质控体系149 ! T* v- Y }9 r
1 {0 M; v7 [4 H" T
2 D$ ?" ^& h+ M; k3 C! p3 L9 \' N一、直接点样的基因芯片的质控体系149
0 E6 A* D8 [/ a8 B- v4 E2 z5 n0 |5 M. p6 _! d! z+ C! D
% l, D; I1 `' _二、Affymetrix的寡核苷酸芯片质控
6 l' Z& ?/ Q( o, r' u/ x. T! r/ Z% A3 h. d6 q
% z/ D N) ]6 [$ D9 v8 {4 z体系及其产品质量评估151
" S+ w" `& U7 l2 ^% r2 H
m% l/ k1 g. u3 h% ?6 a# U8 p0 q5 ^3 ?
第四节信号线性扩增技术及其评估154
/ w9 @% ~- M" Y+ L& ^1 C! }1 \9 O. q4 j, {, h
3 M" |4 i/ g) r5 d一、信号线性扩增技术154 ! l6 u$ L5 G6 K& g! ~: U9 v# S( w
4 T9 _. S+ e& L! s2 a* G& J [4 |7 L k
* M' E. D0 u6 {二、信号扩增方法的可靠性评价154
5 I5 ?. h8 c0 Q+ ?1 x4 p" k
j9 M, K1 ]) n9 v- Y" B8 j+ m9 |8 h1 @
参考文献161
$ p, K# T: T+ X( }7 x2 A: O# z. b, e9 [+ @
C" s+ D/ ^* |" [0 B% C
第九章聚类分析和可视化162 6 \6 {9 v _9 |& A; [0 K
: F3 ]' U9 @ n& x: P% V
& v. d% x4 ?( D- q
第一节相似性(或距离)的度量162 * X4 p! W2 E- [% x% _5 o' p* W
9 w, ?7 n1 C7 h* E
) r1 X" [+ r- {' p, i$ I0 T5 f2 t8 P一、欧氏距离162
( }& f7 s0 v, h! l3 s
, g8 i+ J3 Q' w0 \- S& f) F3 ?4 ?
1 a6 h1 v2 ^, x- n4 n$ v二、马氏距离163
& j/ _* T) w/ j' p# b( j) h
2 ^; n" [, y; W3 p2 t2 _ L+ ^% Q- Y g) `
三、Chebychev距离164 5 j+ \! O$ V3 G! l! Y
: o- n1 O2 @* R2 N* `, R+ Y
! E1 t) a. ]7 a" K% Q- E( _% F四、Mahalanobis距离164 5 Z& j8 r9 G3 a" U) p! Y
# ]& n3 R, P' H. K
& X3 {9 C9 t# z) j五、Minkowski距离164
4 |' P) j6 H) ^. z L9 ?
; @1 H( t- k: w6 S2 Q
/ p) d* p5 b1 D8 V! W六、平均点积164
* w0 m E& y" X- g6 ?! h1 u' a6 d
) h' j( O( I x9 i/ _: r+ e' T1 s6 F7 F0 V
七、向量间的角度165 3 b- e4 p% Q- v5 z
9 g v( b' N+ D+ H- N( n, R" ^
- Q5 Q; o! V7 W八、协方差165 $ N: m: I3 j, n6 B; l1 I* ] m/ L
7 s6 e8 E8 r% T+ K z
0 l$ Q2 m! [; I) ^9 Q九、Pearson相关距离165
1 w3 y! o7 ]: H6 }# Z. T& g; |) C! n0 M+ C
( ^- k; m8 V2 \! x. Q4 `! u
十、Spearman秩相关166 ! l) S1 _# l! P2 V
* [" w9 b4 i7 q( g- }& o. w
n! o. a& }& ~4 P1 u- j# x
十一、互信息166
$ R9 [8 b$ S1 k" y5 P: h+ K7 Z$ y
6 L1 t I3 i; K3 W% x2 @2 ^4 l
( s; l% ]8 K# `+ b十二、Kendalls Tau167 : b& q8 ~. ]: w8 s" q
" y2 n& Z1 { h: y( `
4 A" I, O- g: Q! ^- A1 F9 H0 h第二节聚类算法167 ( R, D5 y. H' \* ]
) z- f7 D1 J! C1 _# H) O4 M
( P" p" ~ i4 _7 |4 k# k
一、系统聚类168 1 n; R5 t, H u4 n4 \8 e L
Z9 f9 }9 D3 x4 y% _
5 ]; |5 @- B; s) L/ F; I2 u1 t
二、分割聚类172
8 V% I3 V8 m4 Y! [" S! s; ~4 E* R6 H9 D( O/ N- D6 ^( V) J
, d/ {; _3 q" I! A第三节二维聚类177
, I- m1 X4 g8 F+ f6 C+ U$ {5 r1 a
* U8 h# f+ o9 d% [" o7 m3 R E+ B9 e2 O1 \$ W
一、耦联二维聚类177 3 w' A, k) D8 h
! @" d& T) Z6 j/ s7 q/ v- W
( L" j! L' m5 \0 b' b5 }1 a二、区组聚类177 U% ?7 K8 {' e4 l* v
' u" w$ a5 h) P+ Z) L9 ^6 S
m$ m' U6 a% E# u( @1 ]! [第四节主成分、SVD和基因修剪178
8 g$ P/ a/ B ^
]: D/ ^" S+ R G- |# N
! L+ A3 w& X2 B一、主成分178 7 n( J6 {/ x& z
4 I2 E9 k* B" ]8 O. u/ v B1 H
' t) h6 B; ?4 f4 |二、奇异值分解178 & N' Y% Q7 K4 w2 u/ Z& @ L
& ^, Z5 S) B$ a& u+ E+ e0 K0 p) _7 B8 r' o$ A H- S
三、基因修剪179 B' N7 F/ V& G, f
* Q+ T3 r. T, K4 Y5 m8 b: n8 ^, D4 Z
参考文献179 8 h3 v1 Y# ?: u; l: G: {; [6 g+ Y3 L9 a; B
0 l5 @: t6 j& @/ @2 k2 P U: s" O. B3 m, k2 q) e" q; X
第十章微阵列实验中的分类方法181
# {0 c+ ^# X& z$ x, m# v% k6 z$ n- Y" T
3 w3 m' E3 }2 Z# ~1 e! Q第一节概述182 # z+ c! }; {0 n: s" G& S
( \: X! k8 _6 }7 b" D! ?1 t+ m
7 t( b* _ [" h, T& F0 \一、利用基因表达谱数据进行生物样本 . Q7 `- z$ x! A
' W+ y2 k3 E! [# ^. {! m% K |
- L6 R( ^: T! s$ x分类183 4 U; n/ n4 N( T1 A/ @1 f, J
+ |% N* w; m, Y! f# {. h. h: g6 s x s
二、分类的背景183
7 z" i5 O- u! I* }& L7 _, V7 Q8 {2 g5 X+ c1 Z6 `% c1 c4 n5 k! j
# I; i" }0 L! r ^
三、基因表达谱数据184
5 T# k* ~: k7 W& m( h
: K+ f' t" ]2 n& ]2 ]
8 f/ Z( R/ }2 |* t( ~第二节不同分类方法的概述184
0 N$ O' _1 z* t( Y M! [7 a* E5 ~' F/ j3 V
+ N, a" o$ @& w$ y) b
一、分类及统计决策论184 + c/ J f; N9 G! y
( o$ k- ^$ P* v N+ f/ M+ M$ C8 X4 P* x! {, l5 C8 P4 g1 ], l
二、费歇线性判别分析186 5 u" m- x& e* R. F) h/ m6 Z
: w) K0 i/ O6 G. d* v r: d* N9 ]& T. s6 F9 ^
三、线性判别和二次判别分析186 " T# O$ n) n, j9 i! r% P
; J7 r; Q' p7 x+ n: U0 x" I# | |3 r7 T G9 [6 C) l* ?
四、线性判别分析的扩展188 ! p* {$ V( t2 t$ i2 T1 F3 B
3 W& `! ~- n# h, \
2 T* D" o6 P/ \( M9 `五、最近邻分类器188
2 \/ ]1 P. `1 u! x- Y+ b; A; @1 V6 w1 R7 [2 `- T
# y- W q5 v1 s$ M( A6 N% A# O7 A六、决策树190
- ]! {$ F/ L5 j9 G* Y9 @6 k
4 m3 K2 t6 u, z& R t: X9 n
, b, e- L" f9 {7 C& d+ a' `/ t6 R七、BP神经网络分类法194
1 ]" C3 Y6 R+ C. W! M( W
9 Y: j# H, q% m# @
' u6 J, h- X6 Y5 A% Q八、支持向量机197 ' D1 ]! p8 _8 \3 @
# |2 C$ _/ y3 D) U% X1 q c- L0 ^ s/ e1 i3 T- n
九、Parzen窗204 . T1 ]- _$ E9 b+ G
9 V0 k: a( w# h* t8 G1 N
1 e; `, q) ?6 f9 q& `第三节分类中的一般问题205 $ G) ^4 ?) y# f% f
; W* n) x' s! A) ~* A
" }; K: s' _5 y7 Q$ d一、特征选取205 + `) F& A `. l& x. m
: {8 y9 G" N9 z9 A/ m
+ Y+ B0 q- P- s8 w2 y2 n
二、标准化和距离函数206 - u" y& h1 h4 y
, K/ T( K7 N' {+ Z g4 M8 J
! L& Z l- L9 N三、缺失值填充207 % w* j4 M/ U" V2 w
2 K8 e; l2 M4 n# D
! b9 X. O; {+ u* a- I$ p四、多分类问题208 n! P. B3 ^7 @
6 [, N, |4 O: m% {# c! S X
4 q+ |5 v9 }4 v: L6 @ [! T第四节性能评价209
0 y# j, b7 Z1 H5 S0 s2 }) j0 R- @
5 K; l! e; P& V
: N5 p3 U2 h& d% H5 D一、偏差、方差和误差率209 3 ^7 m1 X# {7 F* A- u! Q: ^
- U6 W( @# r% Y! S) D9 J( e7 V) e9 _# ~$ H5 Z( j
二、再置换估计210 & D, z$ ]! e a8 j* x
3 ?/ t3 L9 @4 a- D5 C/ }0 \
* d; |5 Q+ @" C; @三、倍数交叉验证法210 * C/ @2 C5 `3 d/ c& V
. ]5 }. L- k3 Y# m/ s" ~
5 Z1 r$ g1 \+ `2 e6 H
四、解靴带估计210
9 o$ t+ a" Z/ k! G
5 G# T5 _5 c p' [/ [4 A! H+ m9 ?' }0 [2 T
第五节实例分析211
$ N+ j! I' a n% A/ b8 a) w( e' w$ x @; j: A& {5 C
! u7 a$ J; ~; }! S, A' T) y一、基因表达谱数据211 5 F, N3 D) m& V' ~& _% S1 v
) ?7 J) j7 J; q9 R! r5 T
: F& G2 g- ~2 X b
二、数据预处理212
" M" S7 m- |. C# f0 s6 }0 Z9 u
5 ^/ @. I+ U+ k9 L- ^. Z! Y9 D! q" }5 B7 [) E8 j
三、支持向量机软件应用213
; o! [: p D. H7 `: t. o1 @$ ^0 m- ], [+ R' f6 h8 F
4 P" B; ^ \& B' v参考文献216 # r$ Q2 b& ]' M# t: _
: } p' u/ D5 A: y$ j" w. g2 N+ m" ~8 t% X: ^" a% N
第十一章微阵列技术的标准化218 7 M* a' [" ?0 K* ?$ a" X
/ C, ~0 [" z% q+ m& W0 B
8 o2 b. f0 @) W1 h: i, T
第一节MIAME规则218 2 y# v' M9 z P$ W/ r! u. n% M
+ }5 g$ A5 r5 l: V
. z$ w! b- {' e4 V! W& Y; j- A一、MIAME规则的具体内容219 4 c5 R* w# v3 S* L6 S: U" I
% S( I. E4 |% i: I" z0 m$ c0 Z; Z7 S
+ V; x$ @$ |- P
二、MIAME表单221 * R- o% Y) `: h1 t) B/ ?8 _- W: ^
: \, q" D; ~3 {4 B1 n9 d8 |1 S
9 \) g. B/ x& S6 E$ f三、MIAME的目前与将来222 9 Z/ P0 r; `/ P" f5 o% R) @) D
* r0 ^: |: \* ~+ f
( o, p# e- |, t. B) R
第二节Affimetrix芯片系统与MIAME - a; O4 ~( _. D
( p+ Z' A' S* L* M6 ^: S
* i/ `' c% ~) s: I7 V规则223
9 P/ @0 }. m: C) Z* R; v$ e
, i4 ~/ o5 r" a) I# e: f, [% y4 r
( v/ j. {% F& u9 T4 A# n) I9 c* g一、遵循MIAME规则224 8 w" X8 s3 b" D
0 g% t: s0 a7 `
L9 V, a) K& _! ^, D二、Affimetrix实验的MIAME表单225 2 s9 W3 u& y8 J( n! z6 A: y
3 G" C Q/ q# K1 n u7 p
4 Q7 q9 q G9 m$ Q- h- ?( B( K# ^
三、Affimetrix的RNA抽提、清洗、
9 w6 w- R0 O/ O9 _ `/ u8 D" k; e+ B
5 ?( z' O8 U/ j6 d0 |7 w% ^标记和杂交规范225
, u9 l: M2 g# _8 W* W8 ^
. E; S6 I/ s0 ]4 B/ X; Z; P- h% v- Y" U7 a4 P
参考文献227 , R8 h/ F: F: u% R" {) Q/ q; Q0 J
0 U' a& m2 D2 U/ Z/ P" K9 l5 ^
1 |0 S( `, g. D) \4 V% G第十二章基因芯片数据的基因注释和
: t- f: `4 p- I' T4 h L1 _! e0 V* J2 c, a; t
/ |! U3 i% j: }1 K# P
功能分析228
6 ^) N. i$ K& S! u% Y
' l8 P& q/ w0 Q h& G0 J) K) _
4 @ C/ ^0 C1 }' e第一节单一基因的注释228 ( d) r) J" k7 p, V' n4 s C2 a
7 l$ n& k+ }4 {! w$ y& H
9 m \$ Q9 B3 H6 M* ~一、一般的注释228
9 l& k& e5 k' u( P- Z1 S: D0 ~: E: J j5 Y; ?
$ b: s! `7 X; ~! \/ C g
二、关于疾病的信息233 4 c) Z3 o7 j) s( R
8 c' S0 |0 t: _! c- t% P/ J; e
" H1 t* c- D: E) m* V$ k S. |三、蛋白质家族的信息234 5 L1 Z! Z& |4 Y9 h, p
' r) {% P! w \0 s) v2 Q. h
% b* D" q& s$ L' b$ N. B
第二节转录因子调节的分析235
8 X5 S! s8 Y5 D( ?0 [
D! C% g6 t% ?8 O+ o2 U2 t/ D5 Q! `5 Q5 \2 ~- n, p2 f( h& {
一、Transfac数据库236 ) ~$ K6 a+ ~% {
, l1 r0 E! ~8 g- E3 ?
, C+ N2 W9 B3 x二、转录因子研究中的统计学检验238
% C/ m% K d# y6 H) r1 o. V1 P& x; [7 g
% t( G6 D: x0 O0 }9 S% R
, }( G' q, ^% ^% b7 U3 M第三节Gene Ontology数据库中基因
- e: ]- R' V7 b" I- n5 c
* Q* v m3 [/ D( X8 I: j# M5 h2 q3 G( j2 T5 i r* P
功能分类的分析240
+ ^1 n9 h( R7 @4 J6 X; \7 f5 j5 e; i& s* w/ R2 ]
7 r+ W9 ]# ^* ], [$ x一、Gene Ontology数据库240
0 a/ Z# e m; {" i/ r$ U, h7 |
8 H3 H( j3 T5 Q& Y9 u) @/ _5 o% V7 x2 K4 k z9 f& C9 Q
二、GO数据库相关分析的工具241
! H- q# }9 _5 V2 W: D* }5 G( O
* p1 q0 R9 O9 z% [
# O! V/ X1 }0 _( ]8 w第四节生物学通路和生物学相互作用的
. z/ \4 q# a, a, @- A* A% f) g+ a% q: s
- L' N: M. f8 \8 |# D. F, ?8 u* f分析243 / F7 k* T' m* w. |4 R
& X7 y* I5 k5 ~1 M! u
- H' }; Y! w2 t0 h3 q) ~一、生物学通路中的基因分析244 / b9 ~. L3 T( Y6 A; B; G' e
5 \6 b! L% K, y/ ?9 Z+ B3 J! F( C. o
+ v5 k) Y$ Y- a) ^4 g二、生物学网络中的基因分析249 9 Z$ W9 D9 |# U! ~
9 h0 H# ?1 ]# P) m6 D
$ C% H5 ^3 l( z+ `) P三、基因芯片数据中使用者自己定义的
; m5 w8 O) X3 e: R4 |: K) K5 d
: {3 w; ]6 v0 ]) Y& ]) u
基因集的分析250
& k% S& s! J; q
( T6 E4 v/ p! _, B6 ]
( Y8 x: W4 u4 Y3 W; z参考文献251 ) s$ c6 S# G1 P! P, B% I
( X$ [" j" G v8 z5 v
! A; \5 }4 ]0 u3 u3 m) d
第十三章系统生物学及基因调控 2 R# s( N. a1 K: K
+ y; \- H0 G. c) x, x" G) n
/ z7 A0 M% A# H, U t4 J0 z4 k$ S网络252
% y) t7 [0 _3 X( v2 g4 L$ Q( k/ {
! b4 H, o# Z6 F# D! L# k7 o( A& e7 H+ H. g
第一节系统生物学简介252 ! W- R# |( k) \% U) p ^
6 e0 O8 k+ R- \3 A5 n9 o- o2 v8 [
9 ~3 U$ E5 _- P8 s( R1 X3 x第二节基因转录调控网络的构成253 6 V; @ y: q i- n8 z
4 K8 Q, V5 D9 ~
; F8 h9 o% g7 q8 ]* O" q
一、基因转录过程简介253 5 s& P$ B. B6 i1 ]; K9 R
* ]+ { e) U5 s1 X4 L* F! y
5 x. l, _" b* ]& {! T
二、研究转录因子及其调控基因的实验 . T, D6 y) m2 }
& U. ]7 s& s2 d G+ F0 j! S
8 |% I7 c2 E z方法254
- h! q, o) q. b$ S# G7 ]9 t$ \- l* a. q# k. [$ A# v
$ \* {7 J7 n" @6 D* d% ?3 M
三、基因调控网络与图形254
# b/ O8 C* i6 o/ C$ G; Y. n8 W' h$ e, P" q$ ^, C" _0 O" z
& V' {" m" A- P5 m5 d2 n1 j
第三节用高斯图形模型推导基因调控
0 M$ M! g" A; }; x2 }1 Q- I1 b1 A4 d8 x9 D& H$ g
/ ?/ I+ O( q8 p* E5 x; J
网络257
, F( i8 P6 G4 \0 W1 C! _/ ~4 A1 L, G: p k. N( ~0 A
# e. E5 D4 W" H Z2 X# n
第四节贝叶斯网络模型在基因芯片 8 _6 }3 R2 A! M" K/ n R7 ]
: u) Z) o- t; s* n$ G9 T# _# ~
% E: Y/ C0 e i, P9 i" M
数据中的应用259
# C, a( L* q3 c7 ]0 w3 |0 ^1 S! E+ U3 {" L$ B- \
4 Y, q$ ^3 Q7 S1 Y+ H w0 U( x
一、贝叶斯网络简介259 1 Z/ j8 j A4 c; E& j& o
! y1 r: I6 ^7 J
; g, X6 g- V: _# v2 ^" I( w
二、学习贝叶斯网络261 |
|