SlideShare a Scribd company logo
今日の講義内容と課題(締切1月12日)	
1.  遺伝子機能の用語辞典		
GO	(Gene	Ontology)	
2.  遺伝子発現データベース	
GEO	(Gene	Expression	Omnibus)	
3.  パスウェイデータベース他	
KEGG	PATHWAY	
KEGG	LIGAND		
KEGG	DRUG	
4.  化合物データベース	
ChemIDplus	/	PubChem	
5.  実験生物材料データベース	
NBRP	(NaNonal	BioResource	Project)	
•  左記の1〜5の中から3つ選び、そ
れぞれ使ってみてください。その
後、選んだ4つそれぞれについて、
以下の説明をして下さい。	
–  どのデータベース(またはツール)
を使ったか	
–  どんな問い合わせを行なったか	
–  どんな結果が得られたか	
•  maskot@bio.Ntech.ac.jp	にメール
で提出してください。学籍番号と
氏名を明記すること。	
•  講義の感想も書いてくれると嬉し
いです。
GO	(Gene	Ontology)	
hSp://geneontology.org/	
遺伝子機能の用語辞典
GO	(Gene	Ontology)	とは何か?	
•  遺伝子の機能の記述に関して、生物学分野
における共通語彙の作成を目指した用語・用
例辞書	
– それまで遺伝子や機能のネーミングにはルール
が存在しなかった。ポストゲノム時代を迎え数万
もの遺伝子候補の推定機能を系統的に記載した
り比較したりする方法が必要不可欠になってきた。	
– 他の生物学分野でも様々なオントロジーが作成さ
れ、その適用範囲を広げ続けている。
どんなときに使うか?	
•  解析対象の遺伝子(群)について、これまで報告
されている機能をまとめて知りたいとき	
•  特にゲノム等の大規模解析で標準的な解析法	
–  解析ソフトがGOを結果として出力する場合がある	
•  エビデンスコードによる信頼度判断	
–  生物学実験結果によるもの(IDA,	IGI,	IMP,	IPI,	IEP)	
–  文献中の意見によるもの(TAS,	NAS)	
–  自動アノテーションによるもの(IEA)	
–  計算機実験結果によるもの(IGC,	ISS,	RCA)
GO	term	(GO用語)	
•  生物学的プロセス	biological	process	
– 細胞内の生理機能に関する用語	
•  細胞の構成要素	cellular	component	
– 細胞内小器官やタンパク質複合体など細胞内局
在に関する用語	
•  分子機能	molecular	funcNon	
– 生化学的・分子生物学的な機能に関する用語
hSp://geneontology.org/ にアクセスし、左上の「Search	GO	
data」に調べたい言葉を入れる。たとえば「methyl」とか。
「methyl」を含む用語は1495個、遺伝子は22408個、アノテー
ションは62671個らしい。上から順に見てみましょう。
胚発生時のDNAメチル化とか。左のメニューから、さら
に絞り込みが行なえます。
たとえばmolecular_funcNon、biolobical_process、cellular	component
のいずれかに関する語だけを知りたい場合、「Ontology	source」を選
択して絞り込んでみましょう。
「methyl」を含む「molecular_funcNon」関連語を検索した結果。
Methyltransferaseを中心に858件
「methyl」を含む「biolobical_process」関連語を検索した結果。	
胚発生時のメチル化など557件
「methyl」を含む「cellular_component」関連語を検索した結果。	
タンパク質複合体を中心に53件
画面の右には関連文献へのリンク。	
その他にも色んな絞り込みができるので試してみて下さい。
遺伝子名「MECP2」で検索した場合。「MECP2」という単語を含
むオントロジー語彙はゼロ、「MECP2」という名の遺伝子が15
個、「MECP2」遺伝子に付与されているアノテーションが543個。
「MECP2」遺伝子に付与されているアノテーションが543個。DNA結合能を持ち、核に
局在し、(細胞内の分子の)移動に関わる機能を持つらしい。また、エビデンスコード
にも注意。IEAは自動アノテーションによるもの。IMPは生物学実験結果によるもの。
「DNA	binding」をクリックして詳細を見る。いくらかの説明と、具
体的な遺伝子へのリンクがついている。
スクロールダウンすると、DNA	binding	という機能がど
のような階層中に位置しているかが分かる。
たとえばその上位階層「heterocyclic	
compound	binding」のページ
「heterocyclic	compound	binding」とい
うアノテーションを持つ遺伝子のリスト
適当な遺伝子を選択してダウンロードしてみましょう。	
上の中程にある「↓」ボタンをクリック。
色んなフィールドがあるので、欲しい情報を左から右へ、	
要らない情報を実日から左へマウスでドラッグする。
欲しい情報を右へ、要らない情報を左へ、整理できたら
「Download」をクリック
エクセル等で使える表形式のデータがダウンロードできます。
GEO	(Gene	Expression	Omnibus)	
hSp://www.ncbi.nlm.nih.gov/geo/	
遺伝子発現データベース
GEO	(Gene	Expression	Omnibus)	とは?	
•  大規模遺伝子発現データの公共レポジトリとして
NCBIが提供	
–  マイクロアレイ、SAGE法(Serial	Analysis	of	Gene	
Expression)、ChIP-chips、抗体アレイ、プロテインアレ
イ等	
–  ユーザは興味あるデータを自由に検索してオンライ
ンで解析したり、ダウンロードして使うことが出来る。	
–  データは全て無償。世界最大の登録データ数。	
•  同じコンセプトの別データベースとしてヨーロッパ
EBIの ArrayExpress	がある。	
–  hSp://www.ebi.ac.uk/arrayexpress/
どんなときに使う?	
•  データ検索・解析	
– 興味ある遺伝子の発現変動を調べたいとき	
– 興味ある実験の発現データセットを調べたいとき	
•  データ登録	
– 多くの学術誌で、アレイ実験の論文に対し、デー
タ登録を義務づけている。
hSp://www.ncbi.nlm.nih.gov/geo/	にアクセスし、右上
の入力フィールドに適当な語を入れて「Search」
たとえばcolorectal	cancer(大腸癌)を入れて「Search」をクリックすると、
6217件のデータセット、1167633件の遺伝子発現プロファイルが登録
されているらしいということが分かる。この6217や1167633などの数字
をクリックすると次へ進む。
colorectal	cancer(大腸癌)でデータセットを選択した場合の結果。
様々なセットの実験結果がリストアップされている。
多数の実験結果のひとつ「SW480	KRAS-mutant	colorectal	cancer	cell	line	
response	to	dual	inhibiNon	of	tankyrase	and	MEK:	Nme	course」を選択した結
果。	画面右側の「download」で結果をダウンロードできる。
ダウンロード結果の例。
どの条件でどの遺伝子がどのような発現を示したかが
分かる。手元のパソコンで解析したい場合に使う。
簡単な解析ならダウンロードせずにオンラインで出来る。たとえば画面下の
「Compare	2	sets	of	samples」でデータを2群に分けて比較解析できる。
グループAとしていくつかの実験を選択
グループAとしていくつかの実験を選択
グループAとしていくつかの実験を選択、終了
グループBとしていくつかの実験を選択
グループBとしていくつかの実験を選択、終了。
「Step	3」をクリック。
有意な発現差のある遺伝子がリストアップされる。そのうちのひとつはヒート
ショックタンパク質らしい。色んな場所をクリックして詳細情報を確認してみま
しょう。
「Cluster	heatmaps」で類似した発現をクラスタリングす
ることができます。
(Hierarchical:	階層的クラスタリングをする場合)「Distance」で距離の定義を
選択、「Linkage」でクラスタリング法の選択、「Display」で計算開始
クラスタリング結果。よく似た発現パターンの遺伝子(行)が近傍に配置され、
よく似た発現パターンの実験(列)が近傍に配置される。好きな位置を拡大し
て詳細を確認できる。
クラスタリング結果。よく似た発現パターンの遺伝子(行)が近傍に配置され、
よく似た発現パターンの実験(列)が近傍に配置される。好きな位置を拡大し
て詳細を確認できる。
拡大例
興味のある遺伝子の配列が手元にある場合は、
GEO	BLASTで検索
問い合わせ配列そのもの、あるいはその類似配列を検索。右にある
「Accesssion」のリンクから、それぞれの配列の発現データが見られます。
ある遺伝子を検索した結果、3つの実験が見つかりました。
KEGG	PATHWAY	/	LIGAND	/	DRUG	
hSp://www.kegg.jp/	
パスウェイデータベース他
KEGG	(Kyoto	Encyclopedia	of	Genes	and	
Genomes)	とは?	
•  京都大学化学研究所が運営、パスウェイの
ゲノムレベル比較を中核としたデータベース	
– 最近は病気パスウェイや医薬品データも充実し
つつある	
•  KEGG	PATHWAY,	KEGG	LIGAND,	KEGG	DRUG	
等
どんなときに使う?	
•  遺伝子や化合物が代謝パスェイや病気のパ
スウェイのどこに位置するか調べたいとき	
•  興味のある生物種がどのパスウェイを持って
いるか調べたいとき	
•  複数の生物種の持つパスウェイを比較したい
とき	
•  その他色々
最も簡単な使い方は hSp://www.kegg.jp/	にアクセスし、	
一番上にあるテキストボックスに検索したい語を入れる
たとえば「bax」を検索した場合。その後を含む様々なものが検索され
る。この場合、アポトーシス制御因子のbaxが欲しかったので
「K02159」というID番号をクリックする。
Bax	という遺伝子はKEGGではK02159というオーソログID番号を
与えられ、アポトーシスの他にp53シグナル伝達やERによるタン
パク質分解、そして大腸がん等に関与していることが分かる。
たとえばアポトーシスのパスウェイをクリックすると、パスウェイ中で
Baxだけ赤字で表現された図が得られる。図の他の場所をクリックす
ると、それぞれに対応する遺伝子の情報に飛べる。
hSp://www.kegg.jp/ に戻ってスクロールダウンすると、様々
なKEGGコンテンツにアクセスできる。その中で次は「KEGG	
Organisms」で、KEGGで取り扱っている生物種を確認しよう。
ゲノム配列が完全に読まれている生物として真核生物299種、原核生物
3021種、古細菌175種。その他にもドラフトゲノムやメタゲノムなどを取り扱っ
ている。ヒトに限定し検索したい場合、「Homo	sapiens	(human)」をクリック。ヒ
トに限定したパスウェイを閲覧したい場合、そのすぐ左にある「hsa」をクリック。
KEGG	Organisms	から「Homo	sapiens	(human)」をクリッ
クして、ヒトに限定したキーワード検索
ヒトに限定したキーワード検索結果
ヒトのBax遺伝子と、そのパスウェイ
スクロールダウンすると、立体構造やアミノ酸配列、塩
基配列が得られる。
KEGG	Organisms	から「hsa」をクリックして、代謝パスウェイ等の情報を
得るページ。上部の「Pathway	map」をクリックすると、ヒトが持つとさ
れるパスウェイとその遺伝子を見ることが出来る。
「Pathway	map」をクリックした結果。ヒトは解糖系やTCA回路等
を持っている。たとえば解糖系をクリック。
解糖系/糖新生のパスウェイのうち、ヒトが持つとされる酵素遺伝子が緑色、
持っていないとされる酵素遺伝子が白色のボックスで示される。緑色のボッ
クスをクリックするとその遺伝子に飛べる。
例えばアスコルビン酸代謝のページに飛ぶと、ヒトの持つ遺伝子は少
ない。ページ上部の「Homo	sapiens	(human)」をクリックすると、他の
生物種の同じパスウェイに飛ぶことができる。
たとえば同じパスウェイの大腸菌のページ。ヒトとの遺伝子セットの違
いに注意。遺伝子を一通り持っていれば、その代謝パスウェイがその
生物種で存在している可能性がある。
hSp://www.kegg.jp/ に戻って、「KEGG	PATHWAY」のリンクをクリック
するとこのページ。生物種を限定せずに様々なパスウェイを閲覧でき
る。代謝パスウェイだけではなく、情報伝達パスウェイ、細胞プロセス、
病気など、さまざまなパスウェイがある。一個一個眺めてみましょう。
興味のある遺伝子や化合物がたくさんある場合、Pathway	Mapping	
(別名	KEGG	Mapper)の	Search	Pathway	が便利なことがあります。
KEGG	Mapper	のページ。少々使い方にクセがあるの
で、「Examples」を参考に使ってみるのが良いかも。
たとえばヒトの遺伝子に興味ある場合、「Search	against」に「hsa」を入
れて、「Enter	objects」に遺伝子名を「hsa:」付きでリストアップして
「Exec」をクリック。
パスウェイマッピングの結果。問い合わせ遺伝子の多くがアポトーシスに
マッピングされたことが分かる。例えばそのアポトーシスをクリック。
アポトーシスのパスウェイのうち、問い合わせ遺伝子が赤字で表示さ
れる。好きな場所をクリックすればそれに対応する遺伝子の情報が
得られる。
hSp://www.kegg.jp/ に戻って、「KEGG	PATHWAY」のリンクをクリック、
スクロールダウンすると「Drug	development」というパスウェイもある。
このパスウェイに限り、生体内のパスウェイではなく、製薬会社がど
のように医薬品開発を進めて来たかの歴史がたどれる。
その中のひとつ。おそらく皆さんもお世話になる(なった?)かも
知れない抗生物質テトラサイクリンの医薬品開発の歴史
化学構造の絵をクリックすると詳細情報のページへ。
たとえばこの化合物が抗菌活性を持つことが分かる。
スクロールダウンして、様々な情報を確認してみましょう。そして、
「DDI	search」をクリックすると薬物間相互作用(drug-drug	interacNon)
の情報が得られます。
薬物間相互作用のページ。テトラサイクリンを問い合わせとしたとき、飲み合
わせると副作用が報告されている他の薬がリストアップされている。それぞ
れのID番号をクリックするとその薬の詳細情報が見られる。
テトラサイクリンと飲み合わせの悪い薬の例。スクロールダウンして、何の薬
か確認してみましょう。ちなみにページの末尾にある「Japanese	version」をク
リックすると日本語ページを見ることが出来ます。
hSp://www.kegg.jp/ に戻って、「KEGG	BRITE」のリンクをクリックするとこの
ページ。様々な分子学的実体の階層分類を取り扱っています。
スクロールダウンして、どのようなものが階層分類されているか確認してみ
ましょう。今回はこの中でたとえば「EnzymaNc	reacNons」(酵素反応)をクリッ
クしてみます。
酵素反応分類の最上位は6つのクラスに分けられています。
たとえば「1.	Oxidoreductase	reacNons」(酸化還元反応)の三角印をクリック
すると、その下の階層が見られます。
さらに下の階層へ
さらに下の階層へ
EC番号	1.1.1.1	に該当する酵素反応の一般的記述と具体的な反応がリスト
アップ。その中でたとえばR02124をクリック
レチノール酸化反応とその詳細。反応にはR番号というID、化合物にはC番号
というIDが与えられている。たとえば	C00473をクリック。
レチノールという物質の英語ページ。最下部にある
「Japanese	version」をクリックして日本語ページへ。
せっかくの日本語ページですので何が書かれているか各自で詳しく見てみ
ましょう。ページ中程にある「同一コード:	D06543」をクリックすると、同一化合
物の「医薬品」としてのページへ飛べます。
同一化合物の医薬品ページ。どのような情報が記載されているか各自で確
認してみましょう。「DB	search」をクリックすると、類似化合物を検索できます。
類似化合物検索のページ。データベースを選んで「compute」をクリック
類似化合物検索結果の例。化合物構造を自前で準備すればどんな化合物
でも検索できます。
ChemIDplus	
hSp://chem.sis.nlm.nih.gov/chemidplus/	
	
PubChem	
hSp://pubchem.ncbi.nlm.nih.gov/	
		
化合物データベース
化合物データベース	
•  生物学データベースは当初から無償のもの
が多いが、化学系・薬学系のデータベースは
有償のものが多い。	
•  しかし、ケミカルバイオロジーなどの研究領域
において、化合物に主眼を置いた生理活性
の評価やタンパク質の機能制御が注目され
るようになり、最近は無償のデータベースが
増えてきた。
どんなとき使うか?	
•  (ChemIDplus)生物試験、たとえばマウスに静
脈注射してLD50(半数致死量)が10〜50mg/
kgなど、の結果から化合物を検索したいとき	
•  (PubChem)世界最大級の化合物データベー
スで、より広い範囲から目的の生物活性を持
つ化合物を検索したいとき
化合物名、化学構造、分子量、生物試験の内容、物
理的性質などから化合物を検索できる。	
hSp://chem.sis.nlm.nih.gov/chemidplus/
たとえば「Molecular	Weight」に「between」「201.2	201.7」(二つの数字の間に
スペースが必要)を入力して、分子量201.2〜201.7の分子を検索してみよう
分子量201.2〜201.7の分子の検索結果。左や右のボタンで再度絞り込み検
索や類似構造検索が出来る。化合物名をクリックして詳細情報へ。
化合物の詳細。PubMed文献ページへのリンクや、毒性、物理的性質
等、どのような情報が記述してあるか各自チェックしてみよう
化合物、生物活性などをシンプルな	
ユーザインタフェースで検索できる。	
hSp://pubchem.ncbi.nlm.nih.gov/
たとえばペニシリンを検索した結果。スペルを微妙に間違えても
しっかり検索できる。化合物名をクリックして詳細ページへ。
化合物の詳細ページ。二次元構造、三次元構造、結合するタン
パク質、薬理活性、毒性等、どのような情報が記述されている
か各自でチェックしてみましょう。
毒性情報の例
生物試験(バイオアッセイ)の例。AIDというのがアッセイのIDで、
クリックするとそれぞれのアッセイの詳細が見られる。
アッセイの例。様々な化合物で抗菌活性を測定している。
NBRP	(NaNonal	BioResource	Project)	
hSp://www.nbrp.jp/	
実験生物材料データベース
NBRP	(NaNonal	BioResource	Project)とは?	
•  ライフサイエンスの実験研究に利用される生
物材料のうち、国が特に重要と定めた生物種
についてリソースの収集・保存・提供体制を
整えることを目的としたプロジェクト。	
•  独立した複数のデータベースの集合体であり、
デザインも利用法も統一されていない。	
•  唯一の共通点は、バイオリソースの情報とそ
の入手方法が必ず提供されていること。
どんなとき使うか?	
•  実験研究を開始するにあたって生物材料を
入手したいとき、あるいはその情報を知りた
いとき	
– よく使われている標準的な実験材料は何か?	
– ある特定の遺伝子の変異体はあるか?	
– 特徴的な形質を持つ生物材料はあるか?	
– 論文発表された研究の追試や再現性検証したい
ときなど
hSp://www.nbrp.jp/ にアクセスし、目的の生物種があればそのリンクから
飛んでも良いし、ページ上部の「Resource	search」の「合計:	6,372,945」などを
クリックして hSp://resourcedb.nbrp.jp/	に飛んでも良い。
hSp://resourcedb.nbrp.jp/ に飛んだらこのページ。下にあるリストか
ら選んでも良いが、たとえば「alcohol	dehydrogenase」の変異体を探し
てみる。キーワードに入力して「検索」をクリック。
「alcohol	dehydrogenase」関連の生物株の検索結果。枯草菌に
遺伝子破壊株があるらしい。
目的の生物株をどの機関で取り扱っているか、どう入手すれ
ば良いかが分かる。他にも、手元に目的の遺伝子配列があ
ればBLASTで検索も出来る。
その他の主なデータベースや
ツール	
とても説明しきれないので
核酸配列情報データベース、	
タンパク質配列情報データベース	
•  DDBJ	国立遺伝学研究所内の日本DNAデータバンクによる運営	
– hSp://www.ddbj.nig.ac.jp/	
•  GenBank	米国立NCBIによる運営	
– hSp://www.ncbi.nlm.nih.gov/genbank/	
•  EMBL	EBI	ENA	欧州分子生物学研究所による運営	
– hSp://www.ebi.ac.uk/ena/	
•  UniProt	複数のタンパク質データベースが統合されたもの	
– hSp://www.uniprot.org/
統合データベース	
•  統合データベースプロジェクト	
– hSp://lifesciencedb.jp/	
•  ゲノムネット統合データベース	
– hSp://www.genome.jp/ja/	
•  ExPASy	
– hSp://www.expasy.org/	
•  NCBI	
– hSp://www.ncbi.nlm.nih.gov/
その他	
•  REBASE	制限酵素データベース	
– hSp://rebase.neb.com/rebase/rebase.html	
•  REBsites	制限酵素処理後の電気泳動パターンシミュレーション	
– hSp://tools.neb.com/REBsites/index.php	
•  Primer3Web	プライマー設計支援ツール	
– hSp://bioinfo.ut.ee/primer3/
今日の講義内容と課題(締切1月12日)	
1.  遺伝子機能の用語辞典		
GO	(Gene	Ontology)	
2.  遺伝子発現データベース	
GEO	(Gene	Expression	Omnibus)	
3.  パスウェイデータベース他	
KEGG	PATHWAY	
KEGG	LIGAND		
KEGG	DRUG	
4.  化合物データベース	
ChemIDplus	/	PubChem	
5.  実験生物材料データベース	
NBRP	(NaNonal	BioResource	Project)	
•  左記の1〜5の中から3つ選び、そ
れぞれ使ってみてください。その
後、選んだ4つそれぞれについて、
以下の説明をして下さい。	
–  どのデータベース(またはツール)
を使ったか	
–  どんな問い合わせを行なったか	
–  どんな結果が得られたか	
•  maskot@bio.Ntech.ac.jp	にメール
で提出してください。学籍番号と
氏名を明記すること。	
•  講義の感想も書いてくれると嬉し
いです。

More Related Content

What's hot

機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門
hoxo_m
 
論文に関する基礎知識2016
 論文に関する基礎知識2016 論文に関する基礎知識2016
論文に関する基礎知識2016
Mai Otsuki
 
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
Yoshitake Takebayashi
 
研究分野をサーベイする
研究分野をサーベイする研究分野をサーベイする
研究分野をサーベイする
Takayuki Itoh
 
形態素解析の過去・現在・未来
形態素解析の過去・現在・未来形態素解析の過去・現在・未来
形態素解析の過去・現在・未来Preferred Networks
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
RyuichiKanoh
 
学振特別研究員になるために~2023年度申請版
学振特別研究員になるために~2023年度申請版学振特別研究員になるために~2023年度申請版
学振特別研究員になるために~2023年度申請版
Masahito Ohue
 
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
Rで因子分析 商用ソフトで実行できない因子分析のあれこれRで因子分析 商用ソフトで実行できない因子分析のあれこれ
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
Hiroshi Shimizu
 
ナレッジグラフ入門
ナレッジグラフ入門ナレッジグラフ入門
ナレッジグラフ入門
KnowledgeGraph
 
マインドフルネスと人工知能
マインドフルネスと人工知能マインドフルネスと人工知能
マインドフルネスと人工知能
Youichiro Miyake
 
博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-
博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-
博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-
Yoshiharu Ikutani
 
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
(shibao)芝尾 (kouichiro)幸一郎
 
遺伝的アルゴリズム (Genetic Algorithm)を始めよう!
遺伝的アルゴリズム(Genetic Algorithm)を始めよう!遺伝的アルゴリズム(Genetic Algorithm)を始めよう!
遺伝的アルゴリズム (Genetic Algorithm)を始めよう!
Kazuhide Okamura
 
トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?
hoxo_m
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
Shiga University, RIKEN
 
15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学
Ken'ichi Matsui
 
関数データ解析の概要とその方法
関数データ解析の概要とその方法関数データ解析の概要とその方法
関数データ解析の概要とその方法
Hidetoshi Matsui
 
2014 3 13(テンソル分解の基礎)
2014 3 13(テンソル分解の基礎)2014 3 13(テンソル分解の基礎)
2014 3 13(テンソル分解の基礎)
Tatsuya Yokota
 
データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散
Seiichi Uchida
 

What's hot (20)

機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門
 
論文に関する基礎知識2016
 論文に関する基礎知識2016 論文に関する基礎知識2016
論文に関する基礎知識2016
 
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
 
研究分野をサーベイする
研究分野をサーベイする研究分野をサーベイする
研究分野をサーベイする
 
形態素解析の過去・現在・未来
形態素解析の過去・現在・未来形態素解析の過去・現在・未来
形態素解析の過去・現在・未来
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
 
学振特別研究員になるために~2023年度申請版
学振特別研究員になるために~2023年度申請版学振特別研究員になるために~2023年度申請版
学振特別研究員になるために~2023年度申請版
 
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
Rで因子分析 商用ソフトで実行できない因子分析のあれこれRで因子分析 商用ソフトで実行できない因子分析のあれこれ
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
 
ナレッジグラフ入門
ナレッジグラフ入門ナレッジグラフ入門
ナレッジグラフ入門
 
マインドフルネスと人工知能
マインドフルネスと人工知能マインドフルネスと人工知能
マインドフルネスと人工知能
 
博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-
博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-
博士課程進学というキャリアについて -博士課程への進学を検討している方へ向けて-
 
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成BigQueryで集計するシステムを作って分かったKPI集計ツール作成
BigQueryで集計するシステムを作って分かったKPI集計ツール作成
 
遺伝的アルゴリズム (Genetic Algorithm)を始めよう!
遺伝的アルゴリズム(Genetic Algorithm)を始めよう!遺伝的アルゴリズム(Genetic Algorithm)を始めよう!
遺伝的アルゴリズム (Genetic Algorithm)を始めよう!
 
トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?
 
Rの高速化
Rの高速化Rの高速化
Rの高速化
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
 
15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学15分でわかる(範囲の)ベイズ統計学
15分でわかる(範囲の)ベイズ統計学
 
関数データ解析の概要とその方法
関数データ解析の概要とその方法関数データ解析の概要とその方法
関数データ解析の概要とその方法
 
2014 3 13(テンソル分解の基礎)
2014 3 13(テンソル分解の基礎)2014 3 13(テンソル分解の基礎)
2014 3 13(テンソル分解の基礎)
 
データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散
 

Similar to バイオインフォ講義3

バイオインフォ講義2
バイオインフォ講義2バイオインフォ講義2
バイオインフォ講義2
Mas Kot
 
バイオインフォ講義1
バイオインフォ講義1バイオインフォ講義1
バイオインフォ講義1
Mas Kot
 
IIBMP 2014 JSBi講習会 パーソナルゲノム時代のリテラシー教育 - 慶應SFCでの事例 -
IIBMP 2014 JSBi講習会 パーソナルゲノム時代のリテラシー教育 - 慶應SFCでの事例 -IIBMP 2014 JSBi講習会 パーソナルゲノム時代のリテラシー教育 - 慶應SFCでの事例 -
IIBMP 2014 JSBi講習会 パーソナルゲノム時代のリテラシー教育 - 慶應SFCでの事例 -
Kazuharu Arakawa
 
[18-01-26]DSTEP ディープラーニングによる出芽酵母蛍光画像の細胞内タンパク質局在の分類
[18-01-26]DSTEP  ディープラーニングによる出芽酵母蛍光画像の細胞内タンパク質局在の分類 [18-01-26]DSTEP  ディープラーニングによる出芽酵母蛍光画像の細胞内タンパク質局在の分類
[18-01-26]DSTEP ディープラーニングによる出芽酵母蛍光画像の細胞内タンパク質局在の分類
Eli Kaminuma
 
Metabolic network and cheminformatics
Metabolic network and cheminformaticsMetabolic network and cheminformatics
Metabolic network and cheminformatics
Mas Kot
 
Active Learning from Imperfect Labelers @ NIPS読み会・関西
Active Learning from Imperfect Labelers @ NIPS読み会・関西Active Learning from Imperfect Labelers @ NIPS読み会・関西
Active Learning from Imperfect Labelers @ NIPS読み会・関西
Taku Tsuzuki
 
StatGenSummerSchool2023_GenomeDataAnalysis1.pdf
StatGenSummerSchool2023_GenomeDataAnalysis1.pdfStatGenSummerSchool2023_GenomeDataAnalysis1.pdf
StatGenSummerSchool2023_GenomeDataAnalysis1.pdf
The University of Tokyo, Osaka University, RIKEN IMS
 
ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状
Takeru Nakazato
 
Diet networks thin parameters for fat genomic
Diet networks thin parameters for fat genomicDiet networks thin parameters for fat genomic
Diet networks thin parameters for fat genomic
Hakky St
 
PubMedBERT: 生物医学NLPのための事前学習
PubMedBERT: 生物医学NLPのための事前学習PubMedBERT: 生物医学NLPのための事前学習
PubMedBERT: 生物医学NLPのための事前学習
Naoto Usuyama
 
バイオインフォ講義4
バイオインフォ講義4バイオインフォ講義4
バイオインフォ講義4
Mas Kot
 
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Eric Sartre
 
【メタサーベイ】Vision and Language のトップ研究室/研究者
【メタサーベイ】Vision and Language のトップ研究室/研究者【メタサーベイ】Vision and Language のトップ研究室/研究者
【メタサーベイ】Vision and Language のトップ研究室/研究者
cvpaper. challenge
 

Similar to バイオインフォ講義3 (13)

バイオインフォ講義2
バイオインフォ講義2バイオインフォ講義2
バイオインフォ講義2
 
バイオインフォ講義1
バイオインフォ講義1バイオインフォ講義1
バイオインフォ講義1
 
IIBMP 2014 JSBi講習会 パーソナルゲノム時代のリテラシー教育 - 慶應SFCでの事例 -
IIBMP 2014 JSBi講習会 パーソナルゲノム時代のリテラシー教育 - 慶應SFCでの事例 -IIBMP 2014 JSBi講習会 パーソナルゲノム時代のリテラシー教育 - 慶應SFCでの事例 -
IIBMP 2014 JSBi講習会 パーソナルゲノム時代のリテラシー教育 - 慶應SFCでの事例 -
 
[18-01-26]DSTEP ディープラーニングによる出芽酵母蛍光画像の細胞内タンパク質局在の分類
[18-01-26]DSTEP  ディープラーニングによる出芽酵母蛍光画像の細胞内タンパク質局在の分類 [18-01-26]DSTEP  ディープラーニングによる出芽酵母蛍光画像の細胞内タンパク質局在の分類
[18-01-26]DSTEP ディープラーニングによる出芽酵母蛍光画像の細胞内タンパク質局在の分類
 
Metabolic network and cheminformatics
Metabolic network and cheminformaticsMetabolic network and cheminformatics
Metabolic network and cheminformatics
 
Active Learning from Imperfect Labelers @ NIPS読み会・関西
Active Learning from Imperfect Labelers @ NIPS読み会・関西Active Learning from Imperfect Labelers @ NIPS読み会・関西
Active Learning from Imperfect Labelers @ NIPS読み会・関西
 
StatGenSummerSchool2023_GenomeDataAnalysis1.pdf
StatGenSummerSchool2023_GenomeDataAnalysis1.pdfStatGenSummerSchool2023_GenomeDataAnalysis1.pdf
StatGenSummerSchool2023_GenomeDataAnalysis1.pdf
 
ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状
 
Diet networks thin parameters for fat genomic
Diet networks thin parameters for fat genomicDiet networks thin parameters for fat genomic
Diet networks thin parameters for fat genomic
 
PubMedBERT: 生物医学NLPのための事前学習
PubMedBERT: 生物医学NLPのための事前学習PubMedBERT: 生物医学NLPのための事前学習
PubMedBERT: 生物医学NLPのための事前学習
 
バイオインフォ講義4
バイオインフォ講義4バイオインフォ講義4
バイオインフォ講義4
 
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
 
【メタサーベイ】Vision and Language のトップ研究室/研究者
【メタサーベイ】Vision and Language のトップ研究室/研究者【メタサーベイ】Vision and Language のトップ研究室/研究者
【メタサーベイ】Vision and Language のトップ研究室/研究者
 

More from Mas Kot

階層的クラスタリング入門の入門
階層的クラスタリング入門の入門階層的クラスタリング入門の入門
階層的クラスタリング入門の入門
Mas Kot
 
機械学習入門の入門
機械学習入門の入門機械学習入門の入門
機械学習入門の入門
Mas Kot
 
生命化学情報学4
生命化学情報学4生命化学情報学4
生命化学情報学4
Mas Kot
 
生命化学情報学3
生命化学情報学3生命化学情報学3
生命化学情報学3
Mas Kot
 
生命化学情報学2
生命化学情報学2生命化学情報学2
生命化学情報学2
Mas Kot
 
生命化学情報学1
生命化学情報学1生命化学情報学1
生命化学情報学1
Mas Kot
 
天然物生合成と環境物質代謝のケモインフォマティクス
天然物生合成と環境物質代謝のケモインフォマティクス天然物生合成と環境物質代謝のケモインフォマティクス
天然物生合成と環境物質代謝のケモインフォマティクス
Mas Kot
 
文献データベース Literature Databases
文献データベース Literature Databases文献データベース Literature Databases
文献データベース Literature Databases
Mas Kot
 
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
Mas Kot
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクス
Mas Kot
 
Metabolic Network Analysis
Metabolic Network AnalysisMetabolic Network Analysis
Metabolic Network Analysis
Mas Kot
 
代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析
Mas Kot
 

More from Mas Kot (12)

階層的クラスタリング入門の入門
階層的クラスタリング入門の入門階層的クラスタリング入門の入門
階層的クラスタリング入門の入門
 
機械学習入門の入門
機械学習入門の入門機械学習入門の入門
機械学習入門の入門
 
生命化学情報学4
生命化学情報学4生命化学情報学4
生命化学情報学4
 
生命化学情報学3
生命化学情報学3生命化学情報学3
生命化学情報学3
 
生命化学情報学2
生命化学情報学2生命化学情報学2
生命化学情報学2
 
生命化学情報学1
生命化学情報学1生命化学情報学1
生命化学情報学1
 
天然物生合成と環境物質代謝のケモインフォマティクス
天然物生合成と環境物質代謝のケモインフォマティクス天然物生合成と環境物質代謝のケモインフォマティクス
天然物生合成と環境物質代謝のケモインフォマティクス
 
文献データベース Literature Databases
文献データベース Literature Databases文献データベース Literature Databases
文献データベース Literature Databases
 
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
KNApSAcKデータベースを用いた昆虫・植物間化学的相互作用解析
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクス
 
Metabolic Network Analysis
Metabolic Network AnalysisMetabolic Network Analysis
Metabolic Network Analysis
 
代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析代謝(メタボリック)ネットワーク解析
代謝(メタボリック)ネットワーク解析
 

バイオインフォ講義3