バイオインフォ講義41. 今日の講義内容と課題
• 復習問題と出席:
– 復習問題1〜3を解いて、今日の講義の終わりに提出して下さい。学
籍番号と氏名を明記のこと。
• 課題(締切1月19日):h%p://reac-onontology.org/BioInfoLecture/
にある配列を用いて、以下の問いに答えなさい。
– 課題1:sequence-Q1〜Q4をそれぞれBLAST検索し、どのようなドメイ
ンを持つか、どのようなタンパク質をコードするのか調べて説明しなさ
い。
– 課題2:Augustusを用い、con-g-Q1, con-g-Q2からそれぞれいくつの
遺伝子が予測されるか調べなさい。また、予測された遺伝子のうちそ
れぞれ1つずつBLAST検索し、どのようなドメインを持つか、どのような
タンパク質をコードするのか調べて説明しなさい。
– maskot@bio.-tech.ac.jp にメールで提出してください。学籍番号と氏
名を明記すること。講義の感想も書いてくれると嬉しいです。
2. 復習問題1
A. 文献検索
B. 実験生物材料データベース
C. 塩基配列・アミノ酸配列類似検索
D. マルチプルアラインメント
E. ドメイン検索、モチーフ検索
F. タンパク質局在予測
G. 膜タンパク質予測
H. タンパク質立体構造データベース
I. 遺伝子機能の用語辞典
J. 遺伝子発現データベース
K. 遺伝子予測
L. ゲノム構造の閲覧
M. パスウェイデータベース
N. 化合物データベース
1. Augustus / GeneMark / Glimmer
2. BLAST / PSI-BLAST/ PHI-BLAST
3. ChemIDplus / PubChem
4. GEO
5. GO
6. InterProScan / CD-search / MOTIF
7. KEGG
8. MAFFT / CLUSTALW / PRRN
9. NBRP
10. PDBj / SCOP
11. PSORT
12. PubMed
13. TMHMM
14. UCSC Genome Browser
左の 1 – 14 それぞれについて、A-Nの中からそれぞれ
適切な用途を選びなさい。
3. 復習問題2
データベースが
塩基配列
データベースが
アミノ酸配列
クエリーが塩基配列 (1) (2)
クエリーがアミノ酸配列 (3) (4)
• (5)
• BLASTPで得られた類似配列を多重アラインメントし、部位毎にアミノ酸の出現頻
度を統計的に計算した PSSM (Posi-on-Specific Scoring Matrix) を作成し、その
PSSMに基づいて2回目の検索を行なう。3回目以降、それを繰り返す。類似性
が低い場合でも配列の検出を可能にする。
• (6)
• ローカルアラインメントと単純な正規表現モチーフを組み合わせた方法。問い
合わせ配列が持つ重要なアミノ酸パターンを指定することで、選択したパター
ンを持ちかつ周辺が類似した配列を検索できる。つまり、指定したパターンを持
たない擬陽性配列を取り除くことが出来る。
(1) – (6) に、それぞれ BLASTX, BLASTP, BLASTN, TBLASTN, PHI-BLAST,
PSI-BLAST のいずれかの語を当てはめて下さい。
6. 主な遺伝子予測ツール
• 原核生物用
– ORF Finder h%p://www.ncbi.nlm.nih.gov/projects/gorf/
– Glimmer h%p://www.ncbi.nlm.nih.gov/genomes/MICROBES/glimmer_3.cgi
– GeneMark.hmm
h%p://www.ncbi.nlm.nih.gov/genomes/MICROBES/genemark.cgi
– NCBI Prokaryo-c Genome Annota-on Pipeline
h%p://www.ncbi.nlm.nih.gov/genome/annota-on_prok/
• 真核生物用
– GENSCAN h%p://genes.mit.edu/GENSCAN.html
– FGENESH
h%p://linux1.soiberry.com/berry.phtml?
topic=fgenesh&group=programs&subgroup=gfind
– GENEID h%p://genome.crg.es/geneid.html
– Augustus h%p://bioinf.uni-greifswald.de/augustus/
14. 今日の講義内容と課題
• 復習問題と出席:
– 復習問題1〜3を解いて、今日の講義の終わりに提出して下さい。学
籍番号と氏名を明記のこと。
• 課題(締切1月19日):h%p://reac-onontology.org/BioInfoLecture/
にある配列を用いて、以下の問いに答えなさい。
– 課題1:sequence-Q1〜Q4をそれぞれBLAST検索し、どのようなドメイ
ンを持つか、どのようなタンパク質をコードするのか調べて説明しなさ
い。
– 課題2:Augustusを用い、con-g-Q1, con-g-Q2からそれぞれいくつの
遺伝子が予測されるか調べなさい。また、予測された遺伝子のうちそ
れぞれ1つずつBLAST検索し、どのようなドメインを持つか、どのような
タンパク質をコードするのか調べて説明しなさい。
– maskot@bio.-tech.ac.jp にメールで提出してください。学籍番号と氏
名を明記すること。講義の感想も書いてくれると嬉しいです。