自分の大学院時代の自主勉強会での発表スライドです。
ファイルの整理をしていて偶然見つけたので懐かしくなってアップしました。
生物学専攻だった自分が他専攻の学生へ向けた内容です。
細胞の分子生物学(Molecular Biology of the Cell)という有名な本の13章を担当しました。
※細胞の分子生物学についてはこちらへ
http://www.amazon.co.jp/gp/product/4315518670?ie=UTF8&camp=1207&creative=8411&creativeASIN=4315518670&linkCode=shr&tag=teapipin-22
自分の大学院時代の自主勉強会での発表スライドです。
ファイルの整理をしていて偶然見つけたので懐かしくなってアップしました。
生物学専攻だった自分が他専攻の学生へ向けた内容です。
細胞の分子生物学(Molecular Biology of the Cell)という有名な本の13章を担当しました。
※細胞の分子生物学についてはこちらへ
http://www.amazon.co.jp/gp/product/4315518670?ie=UTF8&camp=1207&creative=8411&creativeASIN=4315518670&linkCode=shr&tag=teapipin-22
21. なった。
一方、従来の定義である分断配列を考慮しないリピートでは、ヒトでトリプ
レットリピートは 1,090 遺伝子に 1,312 存在し、アミノ酸リピートは 3,747 遺
伝子に 5,397 存在した。チンパンジーではトリプレットリピートは 781 遺伝子
に 911 存在し、アミノ酸リピートは 2,950 遺伝子に 3,944 存在した。マウスで
はトリプレットリピートは 985 遺伝子に 1,178 存在し、アミノ酸リピートは
3,674 遺伝子に 5,074 存在した。アミノ酸リピートの上位 3 位の個数は、ヒトで
は順に E、P、アラニン(A)リピートであり、チンパンジーでは E、S、A リ
ピート、マウスでは E、P、L リピートの順になった。
3.2.2 リピートの割合や長さの比較
ヒトで分断配列を考慮したアミノ酸リピートと分断配列を考慮しないアミノ酸
リピートの長さの平均値を比較した(図 3-2)。グルタミンリピートを除いてす
べてのリピートで分断配列を考慮した場合の方が標準偏差は大きかった。また、
KS 検定の結果、 分断配列を考慮したリピートと考慮しないリピートで全体的な
分布に大きな差は見られなかった。
次に、ヒトとチンパンジー、マウスでの各アミノ酸リピートの組成の割合や
長さの平均値を比較した(図 3-3)。リピートの組成比に対してヒトとチンパン
ジー、ならびにヒトとマウスそれぞれでの相関係数はそれぞれ 0.993、0.996 と
なり、高い相関が見られた。相関係数の同等性の検定を行うと p-value が 0.174
となり、2 つの相関係数に差は見られなかった。よって、ヒト、チンパンジー、
マウスの各アミノ酸リピートの組成に有意差はないことが分かった。
16
14
12
10
長さ
8
分断配列ありリピート
分断配列なしリピート
6
4
2
0
A C D E F G H I K L M N P Q R S T V W Y
リピート
図 3-2 ヒトにおけるアミノ酸リピートの長さの平均値
横軸が各アミノ酸リピート、縦軸が長さである。
20
22. 18 18
ヒト
16 16
チンパンジー
ヒト マウス
14 チンパンジー 14
マウス
12 12
10 10
%
長
さ
8 8
6 6
4 4
2 2
0 0
S P L E A G K R Q D T V H F I C N Y M W A C D E F G H I K L M N P Q R S T V W Y
リピート
リピート
図 3-3 分断配列を考慮したアミノ酸リピートの割合と長さの平均値
右:アミノ酸リピートの割合。横軸が各アミノ酸リピート、縦軸が長さ。ヒトでリピ
ートの個数の多いものから順に並べた
左:ヒト、チンパンジー、マウスにおけるアミノ酸リピートの長さの平均値。横軸が
各アミノ酸リピート、縦軸が長さである。
3.2.3 分断配列の種類や分布
トリプレットリピート病の原因となる遺伝子のリピート領域には分断配列が
確認されており、種類や位置が報告されている。しかし、今までリピートに含
まれている分断配列自体を網羅的に解析した例は報告されていなかった。そこ
で分断配列のどのような組成であるかを知るために、まずリピートに含まれて
いる分断配列を抽出し分類した。その結果、ヒトにおける全リピート内におけ
る分断配列の組成は、GAA、GAG、GCG、CTG、CAA という順に存在するこ
とが分かった(図 3-4)。GAA は特に多く、全体の 8.09 %を占めていた。
次に、翻訳領域における全トリプレットの数とすべての各トリプレットリピ
ートの長さとの相関係数は 0.719 であり相関が見られた(図 3-5 左)。また、す
べての全トリプレットの数と分断配列の数との間でも相関(相関係数 0.634)
が見られた(図 3-5 右)。つまり、トリプレットリピートや分断配列の組成は翻
訳領域で用いられているトリプレットの組成とほぼ一致していることが分かる。
21
26. 3.3.2 オーソログ遺伝子とオーソログでない遺伝子の比較
オーソログ遺伝子とオーソログでない遺伝子を比較することで、ヒトとマウ
スでリピートの違いがあるかを検証した。各リピートの割合や長さの平均値を
求めると(図 3-7)、オーソログでない遺伝子でのプロリン(P)とグリシン(G)
リピートの割合の高さが顕著であった。リピートの長さの平均値には大きな差
は見られなかった。
20 16
オーソログ遺伝子
18 オーソログ遺伝子 オーソログでない遺伝子
14
オーソログでない遺伝子
16
12
14
12 10
長
% 10
さ 8
8
6
6
4
4
2 2
0 0
S P L E A G K R Q D T V H F I C N Y M W A C D E F G H I K L M N P Q R S T V W Y
リピート リピート
図 3-7 ヒトでマウスとオーソログ遺伝子と
オーソログでない遺伝子でのリピート比較
左:各リピートの割合(%)。横軸が各アミノ酸リピート、縦軸が長さ。ヒ
トでリピートの個数が多いものから順に並べた。
右:長さの平均値。横軸が各アミノ酸リピート、縦軸が長さである。
3.3.3 ヒトのみ、マウスのみでリピートを持つ遺伝子の割合や長さ
オーソログ遺伝子のうちヒトのみで存在する各リピートの割合とマウスのみ
で存在する各リピートの割合を比較した(図 3-8 左)。図に示したように全体的
な分布に差は見られなかった。次に、それぞれのリピートの長さの平均値を比
較した(図 3-8 右)。標準偏差はヒトのみに存在するリピートにおいてはグルタ
ミンリピートが最も大きく、マウスのみに存在するリピートの場合はグリシン
リピートが最も大きかった。ヒトのみとマウスのみの場合を比較すると全体の
傾向に大きな差は見られなかった。
25
27. 20 16
18 ヒトのみ ヒトのみ
14
マウスのみ マウスのみ
16
12
14
10
12
長
% 10 さ 8
8
6
6
4
4
2 2
0 0
A S P L G E R K Q D T V F I H N C Y M W A C D E F G H I K L M N P Q R S T V W Y
リピート リピート
図 3-8 オーソログ遺伝子のうち、ヒトのみのリピートとマウ
スのみのリピートの比較
左:リピートの割合。横軸が各アミノ酸リピート、横軸が長さ。ヒトのみ
の場合でリピートの個数が多いものから順に並べた。
右:リピートの長さの平均値。横軸がアミノ酸リピート、縦軸が長さであ
る。
3.3.4 ヒトとマウスの両方でリピートを持つオーソログ遺伝子での長さの差の
分布
ヒトとマウスの両方でリピートを持つ遺伝子の、グルタミンリピートとアラニ
ンリピート領域の差を算出した(図 3-9) 。例えばヒトで長さ 10、マウスで長さ
7 のリピート部位では 7-10 = -3 となる。区間を 2 としたヒストグラムに表した。
この結果、ヒトとマウスではほぼ対称的な分布をしていることが確認できた。
したがって、リピートの形成速度には差は見られないことが示唆された。
26
29. 表 3-4 割り振られた GO Slim 単語の内訳
ヒトの遺伝子で割り振られた Go slim 単語の内訳。機能は、B: Biological
process, C: Cellular component, M: Molecular function である。
機能 GO slim term 遺伝子の数
B biological_process unknown 705
B cell communication 3,640
B cell growth and/or maintenance 3,763
B cell cycle 785
B cell motility 341
B metabolism 7,428
B response to stress 932
B transport 2,071
B death 490
B development 1,882
B physiological processes 10,925
C cell 10,768
C cellular_component unknown 768
C external encapsulating structure 4
C extracellular 1,175
C unlocalized 75
M chaperone activity 1
M catalytic activity 4,959
M enzyme regulator activity 612
M binding 9,258
M nucleic acid binding 3,073
M molecular_function unknown 779
M motor activity 167
M signal transducer activity 2,704
M structural molecule activity 816
M transcription regulator activity 1,251
M transporter activity 1,475
遺伝子の合計 15,521
次にリピート数が上位 10 位までのリピートを持つ各遺伝子について同様の方
法で有意性を検討した。偶然性の排除のためにボンフェローニによる補正を行
い、有意水準を p < (0.01 / 250)として有意性を検討した(表 3-5 下) その結果、
。
多くのリピートで転写に関わる遺伝子に有意性が見られた。次に各リピート間
でどのくらい機能に相違があるかを検討するために、各リピートの機能に対す
る偏りの強さ(p-value として算出されている)に対して全体を分母として割合
を算出し、その値に対してクラスター解析を行い、機能の偏りによって各リピ
ートをグループ分けした(図 3-10) 。この結果、特にロイシン(L)リピートを
持つタンパク質は他のリピートを持つタンパク質と比較して機能の分布が異な
っていることが分かった。
28