SlideShare a Scribd company logo
今日の講義内容と課題	
•  復習問題と出席:	
–  復習問題1〜3を解いて、今日の講義の終わりに提出して下さい。学
籍番号と氏名を明記のこと。	
•  課題(締切1月19日):h%p://reac-onontology.org/BioInfoLecture/ 
にある配列を用いて、以下の問いに答えなさい。	
–  課題1:sequence-Q1〜Q4をそれぞれBLAST検索し、どのようなドメイ
ンを持つか、どのようなタンパク質をコードするのか調べて説明しなさ
い。	
–  課題2:Augustusを用い、con-g-Q1,	con-g-Q2からそれぞれいくつの
遺伝子が予測されるか調べなさい。また、予測された遺伝子のうちそ
れぞれ1つずつBLAST検索し、どのようなドメインを持つか、どのような
タンパク質をコードするのか調べて説明しなさい。	
–  maskot@bio.-tech.ac.jp	にメールで提出してください。学籍番号と氏
名を明記すること。講義の感想も書いてくれると嬉しいです。
復習問題1	
A.  文献検索	
B.  実験生物材料データベース	
C.  塩基配列・アミノ酸配列類似検索 	
D.  マルチプルアラインメント	
E.  ドメイン検索、モチーフ検索	
F.  タンパク質局在予測	
G.  膜タンパク質予測	
H.  タンパク質立体構造データベース	
I.  遺伝子機能の用語辞典		
J.  遺伝子発現データベース	
K.  遺伝子予測	
L.  ゲノム構造の閲覧	
M.  パスウェイデータベース	
N.  化合物データベース	
1.  Augustus	/	GeneMark	/	Glimmer	
2.  BLAST	/	PSI-BLAST/	PHI-BLAST	
3.  ChemIDplus	/	PubChem	
4.  GEO	
5.  GO	
6.  InterProScan	/	CD-search	/	MOTIF	
7.  KEGG	
8.  MAFFT	/	CLUSTALW	/	PRRN	
9.  NBRP	
10.  PDBj	/	SCOP	
11.  PSORT		
12.  PubMed	
13.  TMHMM	
14.  UCSC	Genome	Browser	
左の	1	–	14	それぞれについて、A-Nの中からそれぞれ
適切な用途を選びなさい。
復習問題2	
データベースが	
塩基配列	
データベースが	
アミノ酸配列	
クエリーが塩基配列	 (1)	 (2)	
クエリーがアミノ酸配列	 (3)	 (4)	
•  (5)	
•  BLASTPで得られた類似配列を多重アラインメントし、部位毎にアミノ酸の出現頻
度を統計的に計算した	PSSM	(Posi-on-Specific	Scoring	Matrix)	を作成し、その
PSSMに基づいて2回目の検索を行なう。3回目以降、それを繰り返す。類似性
が低い場合でも配列の検出を可能にする。	
•  (6)	
•  ローカルアラインメントと単純な正規表現モチーフを組み合わせた方法。問い
合わせ配列が持つ重要なアミノ酸パターンを指定することで、選択したパター
ンを持ちかつ周辺が類似した配列を検索できる。つまり、指定したパターンを持
たない擬陽性配列を取り除くことが出来る。	
(1)	–	(6)	に、それぞれ	BLASTX,	BLASTP,	BLASTN,	TBLASTN,	PHI-BLAST,	
PSI-BLAST	のいずれかの語を当てはめて下さい。
復習問題3	
•  生物学分野での代表的なオントロジーデータベースである Gene	
Ontology	データベースでは、遺伝子産物を 3	つの意味概念によっ
て階層的に分類している。その3つとは何か。次の中から選べ。	
A.  biological	process	
B.  cellular	component	
C.  cellular	phenotype	
D.  metabolic	pathway	
E.  molecular	func-on	
F.  molecular	structure	
G.  sequence	homology	
H.  structural	feature
遺伝子予測、再び
主な遺伝子予測ツール	
•  原核生物用	
–  ORF	Finder	h%p://www.ncbi.nlm.nih.gov/projects/gorf/	
–  Glimmer	h%p://www.ncbi.nlm.nih.gov/genomes/MICROBES/glimmer_3.cgi	
–  GeneMark.hmm	
h%p://www.ncbi.nlm.nih.gov/genomes/MICROBES/genemark.cgi	
–  NCBI	Prokaryo-c	Genome	Annota-on	Pipeline	
h%p://www.ncbi.nlm.nih.gov/genome/annota-on_prok/	
•  真核生物用	
–  GENSCAN	h%p://genes.mit.edu/GENSCAN.html	
–  FGENESH	
h%p://linux1.soiberry.com/berry.phtml?
topic=fgenesh&group=programs&subgroup=gfind	
–  GENEID	h%p://genome.crg.es/geneid.html	
–  Augustus	h%p://bioinf.uni-greifswald.de/augustus/
スプライシング、イントロン、エキソン	
h%p://www.drgelo.club/?tag=%E3%82%B9%E3%83%97%E3%83%A9%E3%82%A4%E3%82%B7%E3%83%B3%E3%82%B0	
	
5’スプライス部位、3’スプライス部位およびブランチ部位の塩基配
列には、イントロン間でよく保存されたコンセンサス配列が存在
h%p://bioinf.uni-greifswald.de/augustus/
塩基配列を入力、目的の生物種に最も近い生物を選
択、選択的スプライシングの程度も選択して「Run」
結果画面の1例。
スクロールダウン。入力配列から2つの遺伝子が予測されたこ
とが分かる。画面上に戻って	
「The	graphical	and	text	results	are	here」をクリック。
予測された遺伝子のアミノ酸配列などが得られる。
予測されたアミノ酸配列のマルチfasta
今日の講義内容と課題	
•  復習問題と出席:	
–  復習問題1〜3を解いて、今日の講義の終わりに提出して下さい。学
籍番号と氏名を明記のこと。	
•  課題(締切1月19日):h%p://reac-onontology.org/BioInfoLecture/ 
にある配列を用いて、以下の問いに答えなさい。	
–  課題1:sequence-Q1〜Q4をそれぞれBLAST検索し、どのようなドメイ
ンを持つか、どのようなタンパク質をコードするのか調べて説明しなさ
い。	
–  課題2:Augustusを用い、con-g-Q1,	con-g-Q2からそれぞれいくつの
遺伝子が予測されるか調べなさい。また、予測された遺伝子のうちそ
れぞれ1つずつBLAST検索し、どのようなドメインを持つか、どのような
タンパク質をコードするのか調べて説明しなさい。	
–  maskot@bio.-tech.ac.jp	にメールで提出してください。学籍番号と氏
名を明記すること。講義の感想も書いてくれると嬉しいです。

More Related Content

More from Mas Kot

生命化学情報学1
生命化学情報学1生命化学情報学1
生命化学情報学1
Mas Kot
 
天然物生合成と環境物質代謝のケモインフォマティクス
天然物生合成と環境物質代謝のケモインフォマティクス天然物生合成と環境物質代謝のケモインフォマティクス
天然物生合成と環境物質代謝のケモインフォマティクス
Mas Kot
 
文献データベース Literature Databases
文献データベース Literature Databases文献データベース Literature Databases
文献データベース Literature Databases
Mas Kot
 
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
Mas Kot
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクス
Mas Kot
 
Metabolic network and cheminformatics
Metabolic network and cheminformaticsMetabolic network and cheminformatics
Metabolic network and cheminformatics
Mas Kot
 
Metabolic Network Analysis
Metabolic Network AnalysisMetabolic Network Analysis
Metabolic Network Analysis
Mas Kot
 
代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析
Mas Kot
 

More from Mas Kot (8)

生命化学情報学1
生命化学情報学1生命化学情報学1
生命化学情報学1
 
天然物生合成と環境物質代謝のケモインフォマティクス
天然物生合成と環境物質代謝のケモインフォマティクス天然物生合成と環境物質代謝のケモインフォマティクス
天然物生合成と環境物質代謝のケモインフォマティクス
 
文献データベース Literature Databases
文献データベース Literature Databases文献データベース Literature Databases
文献データベース Literature Databases
 
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクス
 
Metabolic network and cheminformatics
Metabolic network and cheminformaticsMetabolic network and cheminformatics
Metabolic network and cheminformatics
 
Metabolic Network Analysis
Metabolic Network AnalysisMetabolic Network Analysis
Metabolic Network Analysis
 
代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析
 

バイオインフォ講義4