SlideShare a Scribd company logo
今日の講義内容と課題(締切1月5日)	
1.  タンパク質類似検索		
BLAST	/	PSI-BLAST/	PHI-BLAST	
2.  ドメイン検索、モチーフ検索	
CD-search	/	InterProScan	/	MOTIF	
3.  マルチプルアラインメント	
CLUSTALW	/	MAFFT	/	PRRN	
4.  タンパク質の性質の予測	
PSORT	/	TMHMM	
5.  タンパク質構造DB	
PDBj	/	SCOP	
6.  タンパク質オーソログ検索	
OC	Viewer	/	COG	
7.  タンパク質配列アノテーション	
KAAS	
•  左記の1〜7の中から4つ選び、そ
れぞれ使ってみてください。その
後、選んだ4つそれぞれについて、
以下の説明をして下さい。	
–  どのデータベース(またはツール)
を使ったか	
–  どんな問い合わせを行なったか	
–  どんな結果が得られたか	
•  maskot@bio.Ptech.ac.jp	にメール
で提出してください。学籍番号と
氏名を明記すること。	
•  講義の感想も書いてくれると嬉し
いです。
まずは前回の復習も兼ねて
hRp://www.ncbi.nlm.nih.gov/
NCBIのトップにある検索フィールドで「Protein」を選択
タンパク質IDで検索。タンパク質IDが思いつか
ない場合は、タンパク質名等で検索。
検索結果が出てくるので
そのうちのひとつを選択して詳細を見てみる
前回は塩基配列のFASTAフォーマットでしたが、今回はアミノ酸
配列(タンパク質配列)のFASTAフォーマットを扱います。
右上のほうにある「Send	to」をクリック
「File」をクリックして保存方法を選びます。
アミノ酸配列のFASTAフォーマットがダウンロードできました。
まとめ	
•  NCBIのウェブページで塩基配列やアミノ酸配
列を検索して、結果をFASTAフォーマットとして
ダウンロードできる。	
•  複数の配列をひとつのファイルとして保存す
る(マルチFASTAと呼ぶ)こともできるので、
やってみてください。
NCBI	Protein	BLAST	
タンパク質類似検索
hRp://blast.ncbi.nlm.nih.gov/Blast.cgi
どんなときに使う?	
•  未知のアミノ酸配列に対し、類似配列を見つ
けたり、どのようなドメインを持っているか見
つけることにより機能の推定をしたいとき。	
•  類似配列が機能未知の場合などでは、PSI-
BLASTを用いて、通常のBLASTでは検出できな
かった類似性の低い配列を検出できることも
ある。
いろんなBLAST	
データベースが	
塩基配列	
データベースが	
アミノ酸配列	
クエリーが塩基配列	 BLASTN	 BLASTX	
クエリーがアミノ酸配列	 TBLASTN	 BLASTP	
•  PSI-BLAST	(PosiPon-Specific	Iterated	BLAST)	
•  BLASTPで得られた類似配列を多重アラインメントし、部位毎にアミノ酸の出現頻
度を統計的に計算した	PSSM	(PosiPon-Specific	Scoring	Matrix)	を作成し、その
PSSMに基づいて2回目の検索を行なう。3回目以降、それを繰り返す。類似性
が低い場合でも配列の検出を可能にする。	
•  PHI-BLAST	(PaRern-Hit	IniPated	BLAST)	
•  ローカルアラインメントと単純な正規表現モチーフを組み合わせた方法。問い
合わせ配列が持つ重要なアミノ酸パターンを指定することで、選択したパター
ンを持ちかつ周辺が類似した配列を検索できる。つまり、指定したパターンを持
たない擬陽性配列を取り除くことが出来る。
まず、普通のBLASTP
NCBI	BLASTのページから「protein	blast」をクリックする
と、このページ。
今回は塩基配列ではなくアミノ酸配列を入力。データ
ベースはNRの他にswissprotやpdbを選択できる。
他にもいろいろオプションがあるので、確認してから画面下の「BLAST」をク
リック。さらに下の「Algorithm	parameters」をクリックすると、さらに細かいパ
ラメーター設定が出来るので試してみましょう。
ドメイン検索結果および待ち受け画面。検
索が終了すると自動的に画面が遷移する。
検索結果の例
少しスクロールダウンしたところ。ヒットした配列との
マッチ領域がスコアによって色付けされている。
さらにスクロールダウンすると、与えた閾値より
小さい期待値の配列のリストが見られる。
次に、PSI-BLAST	
再ブラスト
次に、オプションを変えてみて「PSI-BLAST」を
使ってみましょう。
ドメイン検索結果および待ち受け画面。検
索が終了すると自動的に画面が遷移する。
画面がほとんど同じに見えるが、上方中央に
「PSI	Blast	IteraPon	1」と書かれてある。
PSI-BLASTとはいえ1回目なので通常のBLASTと同じ。
さらにスクロールダウンすると、与えた閾値より小さい期待値の
配列のリストが見られる。リストの右に「Select	for	PSI	blast」の
チェックがあることに注意。2回目のPSI-BLASTのためのPSSM作
成に用いるかどうか決める。
さらにスクロールダウンすると、与えた閾値より大きい期待値の
配列のリストが見える。「Run	PSI-Blast	IteraPon	2」の「Go」をク
リックすると、2回目の計算がスタート。
2回目の計算結果。1回目とマッチ領
域の絵が変わっていることに注意。
1回目のイテレーションでは検出できなかった配列が検出でき
ていることを確認。必要なら何度でも繰り返す。
GenomeNet	BLAST	
BLASTは他のデータベースでも提供
している
hRp://www.genome.jp/tools/blast/
GenomeNet	BLAST	では、ゲノム配列が完了した生物種(KEGG	GENES)限定の
BLAST、細胞小器官(KEGG	MGENES)限定のBLAST、ウイルス(KEGG	VGENES)
限定のBLASTなどを行なうことが出来る。
検索結果の例。
画面中程のプルダウンメニューをクリックすると、検索結果からのマルチプ
ルアラインメント(CLUSTALW等)や系統樹作成等、他の解析へそのまま進む
ことが出来る。
まとめ	
•  アミノ酸配列の類似検索	
– 普通はBLASTPを使う	
– 検出感度を上げたければPSI-BLAST	
– 擬陽性を除きたければPHI-BLAST	
•  色んなサイトがBLASTを提供している
CD-Search	
ドメイン検索
CD-Searchとは?	
•  PSI-BLASTであらかじめ得たPSSMデータベース
CCD	(Conserved	Domain	Database)に対して検索
をかける	
•  外部データベースであるPfam,	SMART,	COGから
も、ドメイン、タンパク質のアラインメントが取られ、
全12,000以上のPSSMが作成されている。	
•  検索で使われているプログラムはRPS-BLAST	
(reverse	PSI-BLAST)。PSSMを問い合わせに使う
のではなくデータベースとして使う。
NCBI	BLASTのページの下のほうにある「Find	
conserved	domains」をクリック
CD-searchの画面のテキストエリアに
アミノ酸配列を入力
入力したら「Submit」
検索結果の例。ヒットしたドメインが下にリストアップさ
れる。リストの左にある[+]をクリックするとアラインメン
トが表示される。
アラインメントが表示された状態。
ドメイン名をクリックするとこの画面に。AAAドメインの記述から、問い合わせ
配列はATP結合能を持つかもしれない(しかし実験してみないと分からない)。
下にあるのは問い合わせ配列を含んだマルチプルアラインメント。
左中程の「StaPsPcs」の[+]をクリックするとPSSM情報等
の詳細が表示される。そこからさらにPSSM名をクリック
選択したPSSMの詳細。ポジションごとにアミノ酸出現
頻度、コンセンサス配列、エントリーに含まれる主要な
配列などが示されている。
InterProScan	
多様な配列特徴データベースの一
括検索
hRp://www.ebi.ac.uk/interpro/
他のツールと同じく、テキストフィール
ドにアミノ酸配列を入れて検索
検索結果の例
ドメインの情報や、遺伝子の機能分類
(GO;	Gene	Ontology)等が見れる。
GenomeNet	MOTIF	
モチーフ検索
hRp://www.genome.jp/tools/moPf/
アミノ酸配列をテキストエリアに入れるだけだが、下の
方のオプションでデータベースを選択できたりパラメー
タを変更できたりするので確認してみましょう。
検索結果の例
[Detail]をクリックすると、問い合わせ配列中の
モチーフの位置情報が示される。
モチーフ名をクリックすると、モチーフの定義や、その
モチーフを持つ他のタンパク質等の情報が見られる。
まとめ	
•  ドメイン検索、モチーフ検索	
– 両者の区別は曖昧	
•  これも色んなサイトがツールを提供している	
– NCBI	CD-search,	InterProScan,	GenomeNet	MOTIF
など
CLASTALW	
マルチプルアラインメント
hRp://clustalw.ddbj.nig.ac.jp/
どんなときに使う?	
•  相同なアミノ酸配列(塩基配列)が多数得ら
れて、保存されている重要なアミノ酸残基(塩
基)などの情報を得たいとき	
•  また、そこから系統樹を作成したいとき
使い方は簡単。テキストフィールドにマルチ
FASTA形式のファイルをコピペして実行。
スクロールダウンすると、マルチプルアラインメントのオプション
が選択できるので、いろいろ変えて試してみましょう。
実行。しばらく待ちます。
間違えて普通のFASTA形式(配列が1つしか書
いていない)を使った場合のエラーメッセージ。
きちんとマルチFASTA形式(複数の配列が書いてある)
を使った場合。まずそれぞれの配列のタイトルが表示
され、次にペアワイズ(1対1)アラインメントのスコア。
そしてマルチプルアラインメント。ブラウザの設定にもよるが、
フォントの関係で上下の文字がずれていたりするので、結果
ファイルをダウンロードしてみたほうがいいかも。
ダウンロードして見た場合
結果画面からスクロールダウンすると
系統樹のデータが示されている
系統樹ファイルをダウンロードしたもの。パソコン側に系統樹表示ソフ
トをインストールしておくことで、系統樹を画像表示できる。TreeView
やDendroMakerなど。
MAFFT	
日本の産総研が開発した	
新型マルチプルアラインメント
hRp://mag.cbrc.jp/alignment/server/
GenomeNet	CLUSTALW	/	
MAFFT	/	PRRN	
色んなマルチプルアラインメント
hRp://www.genome.jp/tools/clustalw/
hRp://www.genome.jp/tools/mag/
hRp://www.genome.jp/tools/prrn/
まとめ	
•  マルチプルアラインメントといえばCLUSTALW
がスタンダード	
– だが、最近は他のツールもよく使われている。特
に	MAFFT	は評判がいい
タンパク質の性質を予測する
ツール	
PSORT,	TMHMM
どんなときに使うか?	
•  得られたアミノ酸配列に対して、細胞質ゾル
に局在するか、膜タンパク質であるか、等の
性質を予測することで機能に関する手がかり
を得たいとき	
•  特定の小器官に局在しそうなタンパク質の候
補を集めたいとき	
•  特定生物の全タンパク質に対して局在化予
測を行ないたいとき
PSORT	
タンパク質の細胞内局在予測
hRp://www.genscript.com/psort/
wolf_psort.html
使い方は簡単で、動物・植物・菌類を選び、アミ
ノ酸配列を入力して「Submit」
アミノ酸配列をひとつだけ問い合わせた予測結果例。マルチ
FASTAを用いれば複数の配列を一度に予測できる。「details」を
クリックして詳細結果表示。
細胞質ゾル、核内などの詳細な局在予測結果
TMHMM	
膜タンパク質予測
hRp://www.cbs.dtu.dk/services/
TMHMM/
これも使い方は簡単でアミノ酸配列をテキストフィール
ドに入力してSubmitするだけ
アミノ酸配列のどこからどこまで膜貫
通領域らしいか判定
スクロールダウンすると疎水性の高い
領域が図示される
まとめ	
•  タンパク質の細胞内局在予測ならPSORT	
•  膜タンパク質の膜貫通部位予測ならTMHMM
タンパク質立体構造DB	
PDB	と	SCOP
PDBj	
タンパク質三次元構造データベース
の日本版
PDB	(Protein	Data	Bank)	
•  X線結晶構造解析、核磁気共鳴法(NMR)、高分解能
電子顕微鏡などによって決定された、タンパク質、
DNA、RNA、糖鎖など生体高分子を構成する原子の三
次元座標のデータ	
•  日本では2001年から大阪大学タンパク質研究所を作
り、米国のRCSB-PDB	(Research	CollaboraPon	for	
Structureal	BioinformaPcs)と共同、2003年からは欧州
のMSD	(Macromolecular	Structure	Database)も参画し
た wwPDB	(World-wide	PDB)	として活動	
•  生体高分子の立体構造に関する論文を発表する際、
登録が義務づけられている。
hRp://pdbj.org/
どんなときに使うか?	
•  研究対象とするタンパク質などの生体高分子
の立体構造を知り、その機能がどのような三
次元的配置のうえで発現されているかを合理
的に理解したいとき	
•  医薬品候補の化合物を検索する際に、対象
タンパク質の機能部位の立体構造を元に、コ
ンピュータ上で候補化合物のドッキング計算
を実施してあらかじめ候補を減らしたいとき
画面上部にある検索フィールドに検索文字を入力すると、データベース中の
エントリ名やキーワードを補完してくれるので使いやすい。
入力文字を増やすとどんどん絞られてくる
PDBのエントリIDは、このような4文字から構成される
立体構造毎に与えられたIDと、その構造をまとめたページ
ダウンロード例。タイトルや化合物としての分子の記述、由来する生物種、
構造決定を行なった研究者、原著論文の情報等が記されている。
結晶の情報や、各原子の座標など。PDBフォーマットを使って、
パソコン上で立体構造を閲覧できるソフトは色々あるので調べ
て使ってみましょう。
hRp://ef-site.hgc.jp/eF-site/index.jsp
PDBのエントリIDやキーワードを入力することで、PDBデータベース中のタン
パク質の分子表面形状と、その上での静電位と疎水性が、機能部位情報と
ともに表示される。
hRp://ef-site.hgc.jp/eF-seek/top.do	
手元にある立体構造ファイル(PDB形式)をアップロードすることで、PDB中にある類似
の部分分子表面が検索できる。計算負荷が重いため、リアルタイムでは計算されず、
メールで結果が返答される。
SCOP	
タンパク質立体構造分類の世界標準
hRp://scop.mrc-lmb.cam.ac.uk/scop/
SCOP	(Structural	ClassificaPon	Of	Proteins)	
•  正確にはタンパク質ではなく「ドメイン」の分類	
–  専門家の判断基準による手作業の分類	
•  階層構造	
1.  クラス	
二次構造(αヘリックス、βストランド)含量による大雑把な分類	
2.  フォールド	
二次構造の構成や配置が同じで、見た目が似ているドメインのグルー
プ。相同性は考慮していない。	
3.  スーパーファミリー	
配列類似性は低いが、構造や機能から相同であると推定されるドメイン
のグループ	
4.  ファミリー	
アミノ酸配列が30%以上の一致度を示すか、一致度は30%以下だが機
能もしくは構造に明瞭な類似が認められる相同なドメインのグループ
どんなときに使うか?	
•  対象とするタンパク質の立体構造が決まって
いる場合で、どういうドメイン構成なのか、同
じファミリーやスーパーファミリーにどのような
ドメインやタンパク質があるのか知りたいとき	
•  同じファミリーに分類されたタンパク質から、
目的のタンパク質の機能に関するヒントが得
られる可能性が高い。
新版が作られたようだが、見てみた限り、まだ機能のいくつかに不足が見ら
れるので、従来版のほうを使ってみる。「top	of	the	hierarchy」で階層の上か
らたどっていくこともできるし、「Keyword	search」で検索も出来る。
キーワード検索の画面
“Pm”	で検索した結果。たとえば有名な	TIM	
barrel	を見てみましょう
TIM	barrel	の詳細ページ
いくつかあるスーパーファミリーのうち
のひとつ、PLP-binding	barrel
いくつかあるファミリーのうち、
alkanine	racemase-like	ファミリー
それに属するタンパク質の例
対応するPDBのエントリが記されている。同じタンパク質でも
実験条件によって構造は少し異なるが、リストの上位には
SCOPが薦める典型的な構造が配置されている。
まとめ	
•  タンパク質立体構造データベースPDB	
– 立体構造に関する論文を発表する時には登録が
必須	
– 全ての立体構造解析の基礎	
•  タンパク質立体構造分類SCOP	
– 専門家による手作業の分類	
– 関連タンパク質を立体構造から探せる
OC	Viewer	
ゲノム解読の完了した生物の	
全オーソログ遺伝子の分類を閲覧
オーソログとは?	
•  ホモログ	homolog	
–  相同性のある遺伝子またはタンパク質のこと	
•  オーソログ ortholog	
–  ホモログのうち、異なる生物種に存在するが機能は同一で、同
じ祖先配列に由来し、種分岐にともなって分化したと推定され
るもの	
•  パラログ paralog	
–  ホモログのうち、同じ生物種に存在するが機能は異なる場合が
あり、同じ祖先配列に由来し、遺伝子重複により生じたと推定
されるもの	
•  ゼノログ xenolog	
–  ホモログのうち、水平伝播によりその生物に取り込まれたと推
定されるもの
hRp://www.genome.jp/tools/oc/
どんなときに使うか?	
•  対象のタンパク質のオーソログが、ゲノム解
読のされた種の中でどのように分布している
か、またどのように機能しているか調べたい
とき
テキストフィールドにアミノ酸配列を入力して検索
検索結果例。真核生物で3つのオーソロググループ	
(ortholog	cluster)に分類されていることが分かる。
その中のひとつをクリック。オーソログの存在する生物種とそ
の階層分類、具体的な配列の名前などが見れる。
配列名をクリックするとその遺伝子またはタンパク質
の詳細ページ
スクロールダウンすると、そのオーソログがどの生物グループで見つかった
か、また関連のオーソログは何かなどの情報が得られる。
hRp://www.ncbi.nlm.nih.gov/COG/	
同じようなコンセプトのデータベースとしてCOGが有名だが、更新頻度が低く、
またカバーしているゲノムの数も少ない。
まとめ	
•  オーロソグとは、ホモログのうち、異なる生物種に存
在するが機能は同一で、同じ祖先配列に由来し、種
分岐にともなって分化したと推定されるもの	
•  ゲノム解読された生物種からオーソログを検索でき
るデータベース	
•  OC	Viewer	
•  COG
KAAS	
タンパク質配列自動アノテーション
サーバー
アノテーションとは?	
•  訳すと「注釈付け」(annotaPon)	
•  分子生物学やバイオインフォマティクスの分野で
は、得られたアミノ酸配列や塩基配列に対し、ど
のような機能を持っているか推定または実験的
に検証し、得られた機能情報を配列に付加する
こと。	
•  最も一般的なのがBLASTを用いた簡易アノテー
ションで、さらにキュレーション(ひとつひとつ手
作業で確認してデータをきれいにすること)する
こともある。
hRp://www.genome.jp/tools/kaas/
どんなときに使うか?	
•  多数のアミノ酸配列または塩基配列が得られ
て、その機能をまとめて推定したいとき
いろんな機能が選べますが、ゲノム配列を読んだというような大規模なもの
でなければ「SBH	method」を使うのがいいでしょう。
配列のマルチFASTAファイルを入力します。解析には時間がかかるので、
メールアドレスを入力して「Compute」。結果はメールで帰って来ます。
リクエストが受け付けられましたのページ。しばらく待てばメールが届き、そ
こに記述してあるページにアクセスすれば結果が見れる。
たとえば6つの配列の解析をリクエストした結果。もっとたくさんの配列もリク
エスト可能(だが、その分時間がかかる。)左のカラムは問い合わせ配列の
ID、右のカラムはアノテーションされたオーソログのID
アノテーション結果を代謝パスウェイ上にマッピングして機能を
閲覧することができます。
どのパスウェイにいくつの配列がアノテーションされたか
代謝パスウェイ中のどの位置にアノテーションされた
か、色付きのマップで示される。
色付きの四角をクリックするとオーソログの情報が見れる。
まとめ	
•  KAASによる自動アノテーションは簡便なので、
多くのゲノム解読に利用されている。	
•  ゲノム配列である必要は無く、マルチFASTA
形式の多数の配列をアノテーションするのに
便利
今日の講義内容と課題(締切1月5日)	
1.  タンパク質類似検索		
BLAST	/	PSI-BLAST/	PHI-BLAST	
2.  ドメイン検索、モチーフ検索	
CD-search	/	InterProScan	/	MOTIF	
3.  マルチプルアラインメント	
CLUSTALW	/	MAFFT	/	PRRN	
4.  タンパク質の性質の予測	
PSORT	/	TMHMM	
5.  タンパク質構造DB	
PDBj	/	SCOP	
6.  タンパク質オーソログ検索	
OC	Viewer	/	COG	
7.  タンパク質配列アノテーション	
KAAS	
•  左記の1〜7の中から4つ選び、そ
れぞれ使ってみてください。その
後、選んだ4つそれぞれについて、
以下の説明をして下さい。	
–  どのデータベース(またはツール)
を使ったか	
–  どんな問い合わせを行なったか	
–  どんな結果が得られたか	
•  maskot@bio.Ptech.ac.jp	にメール
で提出してください。学籍番号と
氏名を明記すること。	
•  講義の感想も書いてくれると嬉し
いです。

More Related Content

What's hot

データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度
Seiichi Uchida
 
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Takashi J OZAKI
 
JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点
JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点
JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点
Yasuyuki Okumura
 
バイオインフォ講義3
バイオインフォ講義3バイオインフォ講義3
バイオインフォ講義3
Mas Kot
 
診断研究におけるGRADEアプローチ
診断研究におけるGRADEアプローチ診断研究におけるGRADEアプローチ
診断研究におけるGRADEアプローチ
Takashi Fujiwara
 
テンソル分解を用いた教師なし学習による変数選択
テンソル分解を用いた教師なし学習による変数選択テンソル分解を用いた教師なし学習による変数選択
テンソル分解を用いた教師なし学習による変数選択
Y-h Taguchi
 
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)ryotat
 
R seminar on igraph
R seminar on igraphR seminar on igraph
R seminar on igraph
Kazuhiro Takemoto
 
マルチレベルモデル講習会 理論編
マルチレベルモデル講習会 理論編マルチレベルモデル講習会 理論編
マルチレベルモデル講習会 理論編
Hiroshi Shimizu
 
木と電話と選挙(causalTree)
木と電話と選挙(causalTree)木と電話と選挙(causalTree)
木と電話と選挙(causalTree)
Shota Yasui
 
機械学習と主成分分析
機械学習と主成分分析機械学習と主成分分析
機械学習と主成分分析
Katsuhiro Morishita
 
Rayyan補足資料 検索結果をrayyanへ
Rayyan補足資料 検索結果をrayyanへRayyan補足資料 検索結果をrayyanへ
Rayyan補足資料 検索結果をrayyanへ
SR WS
 
Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門
Okamoto Laboratory, The University of Electro-Communications
 
統計的検定と例数設計の基礎
統計的検定と例数設計の基礎統計的検定と例数設計の基礎
統計的検定と例数設計の基礎
Senshu University
 
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
Preferred Networks
 
ネットワークメタ分析入門
ネットワークメタ分析入門ネットワークメタ分析入門
ネットワークメタ分析入門
Senshu University
 
逐次モンテカルロ法の基礎
逐次モンテカルロ法の基礎逐次モンテカルロ法の基礎
逐次モンテカルロ法の基礎
ShoutoYonekura
 
ベイズ統計によるデータ解析
ベイズ統計によるデータ解析ベイズ統計によるデータ解析
ベイズ統計によるデータ解析
Kunihiro Hisatsune
 
機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)
Kota Matsui
 
Cuda fortranの利便性を高めるfortran言語の機能
Cuda fortranの利便性を高めるfortran言語の機能Cuda fortranの利便性を高めるfortran言語の機能
Cuda fortranの利便性を高めるfortran言語の機能
智啓 出川
 

What's hot (20)

データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度
 
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
 
JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点
JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点
JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点
 
バイオインフォ講義3
バイオインフォ講義3バイオインフォ講義3
バイオインフォ講義3
 
診断研究におけるGRADEアプローチ
診断研究におけるGRADEアプローチ診断研究におけるGRADEアプローチ
診断研究におけるGRADEアプローチ
 
テンソル分解を用いた教師なし学習による変数選択
テンソル分解を用いた教師なし学習による変数選択テンソル分解を用いた教師なし学習による変数選択
テンソル分解を用いた教師なし学習による変数選択
 
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
 
R seminar on igraph
R seminar on igraphR seminar on igraph
R seminar on igraph
 
マルチレベルモデル講習会 理論編
マルチレベルモデル講習会 理論編マルチレベルモデル講習会 理論編
マルチレベルモデル講習会 理論編
 
木と電話と選挙(causalTree)
木と電話と選挙(causalTree)木と電話と選挙(causalTree)
木と電話と選挙(causalTree)
 
機械学習と主成分分析
機械学習と主成分分析機械学習と主成分分析
機械学習と主成分分析
 
Rayyan補足資料 検索結果をrayyanへ
Rayyan補足資料 検索結果をrayyanへRayyan補足資料 検索結果をrayyanへ
Rayyan補足資料 検索結果をrayyanへ
 
Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門
 
統計的検定と例数設計の基礎
統計的検定と例数設計の基礎統計的検定と例数設計の基礎
統計的検定と例数設計の基礎
 
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
 
ネットワークメタ分析入門
ネットワークメタ分析入門ネットワークメタ分析入門
ネットワークメタ分析入門
 
逐次モンテカルロ法の基礎
逐次モンテカルロ法の基礎逐次モンテカルロ法の基礎
逐次モンテカルロ法の基礎
 
ベイズ統計によるデータ解析
ベイズ統計によるデータ解析ベイズ統計によるデータ解析
ベイズ統計によるデータ解析
 
機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)
 
Cuda fortranの利便性を高めるfortran言語の機能
Cuda fortranの利便性を高めるfortran言語の機能Cuda fortranの利便性を高めるfortran言語の機能
Cuda fortranの利便性を高めるfortran言語の機能
 

Similar to バイオインフォ講義2

バイオインフォ講義1
バイオインフォ講義1バイオインフォ講義1
バイオインフォ講義1
Mas Kot
 
Metabolic network and cheminformatics
Metabolic network and cheminformaticsMetabolic network and cheminformatics
Metabolic network and cheminformatics
Mas Kot
 
Qaシステム解説
Qaシステム解説Qaシステム解説
Qaシステム解説
yayamamo @ DBCLS Kashiwanoha
 
バイオインフォ講義4
バイオインフォ講義4バイオインフォ講義4
バイオインフォ講義4
Mas Kot
 
20160824srws第八回GRADE、PROSPERO、PRISMA
20160824srws第八回GRADE、PROSPERO、PRISMA20160824srws第八回GRADE、PROSPERO、PRISMA
20160824srws第八回GRADE、PROSPERO、PRISMA
SR WS
 
【DL輪読会】GPT-4Technical Report
【DL輪読会】GPT-4Technical Report【DL輪読会】GPT-4Technical Report
【DL輪読会】GPT-4Technical Report
Deep Learning JP
 

Similar to バイオインフォ講義2 (6)

バイオインフォ講義1
バイオインフォ講義1バイオインフォ講義1
バイオインフォ講義1
 
Metabolic network and cheminformatics
Metabolic network and cheminformaticsMetabolic network and cheminformatics
Metabolic network and cheminformatics
 
Qaシステム解説
Qaシステム解説Qaシステム解説
Qaシステム解説
 
バイオインフォ講義4
バイオインフォ講義4バイオインフォ講義4
バイオインフォ講義4
 
20160824srws第八回GRADE、PROSPERO、PRISMA
20160824srws第八回GRADE、PROSPERO、PRISMA20160824srws第八回GRADE、PROSPERO、PRISMA
20160824srws第八回GRADE、PROSPERO、PRISMA
 
【DL輪読会】GPT-4Technical Report
【DL輪読会】GPT-4Technical Report【DL輪読会】GPT-4Technical Report
【DL輪読会】GPT-4Technical Report
 

More from Mas Kot

階層的クラスタリング入門の入門
階層的クラスタリング入門の入門階層的クラスタリング入門の入門
階層的クラスタリング入門の入門
Mas Kot
 
機械学習入門の入門
機械学習入門の入門機械学習入門の入門
機械学習入門の入門
Mas Kot
 
生命化学情報学4
生命化学情報学4生命化学情報学4
生命化学情報学4
Mas Kot
 
生命化学情報学3
生命化学情報学3生命化学情報学3
生命化学情報学3
Mas Kot
 
生命化学情報学2
生命化学情報学2生命化学情報学2
生命化学情報学2
Mas Kot
 
生命化学情報学1
生命化学情報学1生命化学情報学1
生命化学情報学1
Mas Kot
 
天然物生合成と環境物質代謝のケモインフォマティクス
天然物生合成と環境物質代謝のケモインフォマティクス天然物生合成と環境物質代謝のケモインフォマティクス
天然物生合成と環境物質代謝のケモインフォマティクス
Mas Kot
 
文献データベース Literature Databases
文献データベース Literature Databases文献データベース Literature Databases
文献データベース Literature Databases
Mas Kot
 
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
Mas Kot
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクス
Mas Kot
 
Metabolic Network Analysis
Metabolic Network AnalysisMetabolic Network Analysis
Metabolic Network Analysis
Mas Kot
 
代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析
Mas Kot
 

More from Mas Kot (12)

階層的クラスタリング入門の入門
階層的クラスタリング入門の入門階層的クラスタリング入門の入門
階層的クラスタリング入門の入門
 
機械学習入門の入門
機械学習入門の入門機械学習入門の入門
機械学習入門の入門
 
生命化学情報学4
生命化学情報学4生命化学情報学4
生命化学情報学4
 
生命化学情報学3
生命化学情報学3生命化学情報学3
生命化学情報学3
 
生命化学情報学2
生命化学情報学2生命化学情報学2
生命化学情報学2
 
生命化学情報学1
生命化学情報学1生命化学情報学1
生命化学情報学1
 
天然物生合成と環境物質代謝のケモインフォマティクス
天然物生合成と環境物質代謝のケモインフォマティクス天然物生合成と環境物質代謝のケモインフォマティクス
天然物生合成と環境物質代謝のケモインフォマティクス
 
文献データベース Literature Databases
文献データベース Literature Databases文献データベース Literature Databases
文献データベース Literature Databases
 
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクス
 
Metabolic Network Analysis
Metabolic Network AnalysisMetabolic Network Analysis
Metabolic Network Analysis
 
代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析
 

バイオインフォ講義2