SlideShare a Scribd company logo
Metascapeを用いた
Gene Ontology Enrichment Analysis(GO解析) 入門
2019.10.04
生体防御医学研究所
情報生物学分野
金 賢正
第3回KyushuBioinformaticsCommunity勉強会
目次
1. GO enrichment analysis
1. Gene ontology
2. GO enrichment analysis
3. GO enrichment analysis Tools
2. Metascape
1. Express analysis
2. Custum analysis
目次
1. GO enrichment analysis
1. Gene ontology
2. GO enrichment analysis
3. GO enrichment analysis Tools
2. Metascape
1. Express analysis
2. Custum analysis
1.1 Gene ontology
Gene ontologyとは?
膨大な数の遺伝子を効率的に説明するため、
各特徴により遺伝子を区別して定義をするプロ
ジェクトであるGOコンソーシアムによる遺伝子
のアノテーション情報 Cellular component
(細胞の構成要素)
Molecular function
(分子機能)
Biological process
(生物学的プロセス)
例.”ヘモグロビン”等
例.”ミトコンドリア”等
例.”糖代謝”等
• 大きく3つに分類されて、それらは各々階層構造
を持つ
• GO Termは定義されたアノテーション情報で、
通し番号がふられる
(例. GO: 0006783 = heme biosynthetic process)
GO enrichment analysisとは?
遺伝子リスト(発現変動遺伝子等)に対して、
密に含まれているGO Termを統計的に検出す
る解析
• マイクロアレイ実験や次世代シーケンシング
(NGS)などで得られたデータは大量な遺伝子含
むため、機能ごとにグループ化して解析する必
要がある
• 英語ではGO analysis(GO解析) 又は GO
enrichment analysisと表記される場合が多い Aho, Tommi; Almusa, Henrikki; Matilainen, Jukka;
Larjo, Antti; Ruusuvuori, Pekka; Aho, Kaisa-Leena; et
al. (2015): Gene Ontology enrichment analysis for the
unconditionally essential genes.. PLOS ONE. Figure.
1.2 GO enrichment analysis
例)
R パッケージ ウェブサイト
例
• GOFunction
• goProfiles
• Goseq
• Gostats
• clusterProfiler
• topGO など
• DAVID
• GENEONOLOGY
• Gorilla
• gProfiler
• Metascape など
長所
Rユーザーは使いやすい
(Bioconductor)
遺伝子の数に制限がない
誰でも使いやすい
(アクセスが良い)
短所 Rが初めての人は使いづらい
インプットできる遺伝子の数が限ら
れている場合が多い (主に3,000個)
1.3 GO enrichment analysis tools
• 現在は主にRやウェブ上で解析が行われている
1.3 GO enrichment analysis tools
R パッケージ ウェブサイト
例
• GOFunction
• goProfiles
• Goseq
• Gostats
• clusterProfiler
• topGO など
• DAVID
• GENEONOLOGY
• Gorilla
• gProfiler
• Metascape など
長所
Rユーザーは使いやすい
(Bioconductor)
遺伝子の数に制限がない
誰でも使いやすい
(アクセスが良い)
短所 Rが初めての人は使いづらい
インプットできる遺伝子の数が限ら
れている場合が多い (主に3,000個)
• 現在は主にRやウェブ上で解析が行われている
目次
1. GO enrichment analysis
1. Gene ontology
2. GO enrichment analysis
3. GO enrichment analysis Tools
2. Metascape
1. Express analysis
2. Custum analysis
特徴
• どのような機能を持つ遺伝子が多いかを早く直感的に確認できる
• 遺伝子リストは複数のリストデータも使用可能
• 遺伝子名のフォーマットはEntrez Gene ID、Gene Symbol、RefSeq、
Ensemblなど多数対応
• 2015年に開発され、現在もこまめに更新されている
• 遺伝子3000個まで解析可能
とにかく使いやすい!
ウェブ上で簡単にヒト・マウス・ラット
などのGO解析ができるツール
2. Metascape
検索エンジンにて
簡単にアクセス可能
Metascapeへアクセス
トップページ
解析を行うセッション
トップページ
基本的な解析用の
チュートリアル
トップページ
Excelでも実行できる
(Add-inで、windowsのみ)
トップページ
インプットファイルには色んな
フォーマットが使える
2.1 Express analysis
テストデータ
(Gene Symbol)で実行
12
データをインプット
Input as speciesと
Analysis as speciesを
H.sapiensに設定
1
2
データをインプット
処理中
• Bar Graph Summary (Figure 1.)
• Gene Lists(Table 1.)
• Gene Annotation(Table 2.)
• Pathway and Process Enrichment
Analysis(Table 3., Figure 2.)
• Protein-protein Interaction Enrichment
Analysis(Figure 3.)
解析結果のリスト
解析結果のページ
• Gene List Report Excel
Sheets
• Gene List Report PPT file
• All in One Zip File
解析結果をエクセルやパワーポ
イント(遺伝子リスト)、zipファ
イル(すべての結果)でダウン
ロードできる
解析結果のページ
コンマ区切りの.csvファイル
(テストデータ)をダウンロード
2.2 Custom analysis
実験目的に応じてより細かくオプションの設定が出来る
インプット用データをダウンロード
インプットファイルにより、
自動に項目が選択される
Input as speciesとAnalysis as
speciesをH.sapiensに設定
データをインプット
1
2
3
Custom analysisのページ
Custom analysisのページ
インプットファイルにより、
自動的に選択される
Custom analysisのページ
詳細なアノテーションソースを
選択できる
Annotationの設定
Annotationの設定
Annotationの設定
設定した項目に変更される
フィルタリング
必要な場合、各項目について
フィルタリングできる
フィルタリング
Membershipの設定
1
2
Annotationより詳細にカテゴリー
が設定できる
例えば、”polymerase”と入力
したらpolymeraseに関連する
termが表示される
Membershipの設定
Membershipの設定
Enrichmentの設定
解析に使用するP-valueなどを
変更出来る
Enrichmentの設定
解析結果のページ
解析結果をダウンロード
解析結果の図やテーブル
をzipファイルでダウン
ロード可能
AnalysisReport
AnalysisReport
Metascapeを引用した論文リスト(ホームページ>About>Citations)

More Related Content

What's hot

アンサンブル学習
アンサンブル学習アンサンブル学習
アンサンブル学習
Hidekazu Tanaka
 
PythonとQGISで簡単処理
PythonとQGISで簡単処理PythonとQGISで簡単処理
PythonとQGISで簡単処理
Kazutaka ishizaki
 
GeoPackageを使ってみた(おざき様)
GeoPackageを使ってみた(おざき様)GeoPackageを使ってみた(おざき様)
GeoPackageを使ってみた(おざき様)
OSgeo Japan
 
クラシックな機械学習の入門 3. 線形回帰および識別
クラシックな機械学習の入門 3. 線形回帰および識別クラシックな機械学習の入門 3. 線形回帰および識別
クラシックな機械学習の入門 3. 線形回帰および識別
Hiroshi Nakagawa
 
広告配信のための高速疎ベクトル検索エンジンの開発@WebDBフォーラム2015 #webdbf2015
広告配信のための高速疎ベクトル検索エンジンの開発@WebDBフォーラム2015 #webdbf2015広告配信のための高速疎ベクトル検索エンジンの開発@WebDBフォーラム2015 #webdbf2015
広告配信のための高速疎ベクトル検索エンジンの開発@WebDBフォーラム2015 #webdbf2015
Yahoo!デベロッパーネットワーク
 
金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル
Kei Nakagawa
 
Projek akhir
Projek akhirProjek akhir
クラスタリング
クラスタリングクラスタリング
クラスタリング
Wakamatz
 
AIを取り巻く基準について
AIを取り巻く基準についてAIを取り巻く基準について
AIを取り巻く基準について
Noriyasu Higashino
 
決定木・回帰木に基づくアンサンブル学習の最近
決定木・回帰木に基づくアンサンブル学習の最近決定木・回帰木に基づくアンサンブル学習の最近
決定木・回帰木に基づくアンサンブル学習の最近
Ichigaku Takigawa
 
モナドをつくろう
モナドをつくろうモナドをつくろう
モナドをつくろう
dico_leque
 
Pythonではじめるロケーションデータ解析
Pythonではじめるロケーションデータ解析Pythonではじめるロケーションデータ解析
Pythonではじめるロケーションデータ解析
Hiroaki Sengoku
 
Masterplan centrum Wrocławia część 1
Masterplan centrum Wrocławia część 1Masterplan centrum Wrocławia część 1
Masterplan centrum Wrocławia część 1
Wroclaw
 
ナレッジグラフ/LOD利用技術の入門(前編)
ナレッジグラフ/LOD利用技術の入門(前編)ナレッジグラフ/LOD利用技術の入門(前編)
ナレッジグラフ/LOD利用技術の入門(前編)
KnowledgeGraph
 
第22回オープンデータトーク 地理データ形式のこれから
第22回オープンデータトーク 地理データ形式のこれから第22回オープンデータトーク 地理データ形式のこれから
第22回オープンデータトーク 地理データ形式のこれから
IWASAKI NOBUSUKE
 
固有表現抽出について
固有表現抽出について固有表現抽出について
固有表現抽出について
Syo Kyojin
 
第2回ナレッジグラフ推論チャレンジ2019の紹介(11/22, SWO研究会)
第2回ナレッジグラフ推論チャレンジ2019の紹介(11/22, SWO研究会)第2回ナレッジグラフ推論チャレンジ2019の紹介(11/22, SWO研究会)
第2回ナレッジグラフ推論チャレンジ2019の紹介(11/22, SWO研究会)
KnowledgeGraph
 
自然言語処理 BERTに関する論文紹介とまとめ
自然言語処理 BERTに関する論文紹介とまとめ自然言語処理 BERTに関する論文紹介とまとめ
自然言語処理 BERTに関する論文紹介とまとめ
KeisukeNakazono
 
09遺跡分布を分析する〜カーネル密度推定〜
09遺跡分布を分析する〜カーネル密度推定〜09遺跡分布を分析する〜カーネル密度推定〜
09遺跡分布を分析する〜カーネル密度推定〜
Junpei Ishii
 
[DSO]勉強会_データサイエンス講義_Chapter8
[DSO]勉強会_データサイエンス講義_Chapter8[DSO]勉強会_データサイエンス講義_Chapter8
[DSO]勉強会_データサイエンス講義_Chapter8
tatsuyasakaeeda
 

What's hot (20)

アンサンブル学習
アンサンブル学習アンサンブル学習
アンサンブル学習
 
PythonとQGISで簡単処理
PythonとQGISで簡単処理PythonとQGISで簡単処理
PythonとQGISで簡単処理
 
GeoPackageを使ってみた(おざき様)
GeoPackageを使ってみた(おざき様)GeoPackageを使ってみた(おざき様)
GeoPackageを使ってみた(おざき様)
 
クラシックな機械学習の入門 3. 線形回帰および識別
クラシックな機械学習の入門 3. 線形回帰および識別クラシックな機械学習の入門 3. 線形回帰および識別
クラシックな機械学習の入門 3. 線形回帰および識別
 
広告配信のための高速疎ベクトル検索エンジンの開発@WebDBフォーラム2015 #webdbf2015
広告配信のための高速疎ベクトル検索エンジンの開発@WebDBフォーラム2015 #webdbf2015広告配信のための高速疎ベクトル検索エンジンの開発@WebDBフォーラム2015 #webdbf2015
広告配信のための高速疎ベクトル検索エンジンの開発@WebDBフォーラム2015 #webdbf2015
 
金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル金融時系列のための深層t過程回帰モデル
金融時系列のための深層t過程回帰モデル
 
Projek akhir
Projek akhirProjek akhir
Projek akhir
 
クラスタリング
クラスタリングクラスタリング
クラスタリング
 
AIを取り巻く基準について
AIを取り巻く基準についてAIを取り巻く基準について
AIを取り巻く基準について
 
決定木・回帰木に基づくアンサンブル学習の最近
決定木・回帰木に基づくアンサンブル学習の最近決定木・回帰木に基づくアンサンブル学習の最近
決定木・回帰木に基づくアンサンブル学習の最近
 
モナドをつくろう
モナドをつくろうモナドをつくろう
モナドをつくろう
 
Pythonではじめるロケーションデータ解析
Pythonではじめるロケーションデータ解析Pythonではじめるロケーションデータ解析
Pythonではじめるロケーションデータ解析
 
Masterplan centrum Wrocławia część 1
Masterplan centrum Wrocławia część 1Masterplan centrum Wrocławia część 1
Masterplan centrum Wrocławia część 1
 
ナレッジグラフ/LOD利用技術の入門(前編)
ナレッジグラフ/LOD利用技術の入門(前編)ナレッジグラフ/LOD利用技術の入門(前編)
ナレッジグラフ/LOD利用技術の入門(前編)
 
第22回オープンデータトーク 地理データ形式のこれから
第22回オープンデータトーク 地理データ形式のこれから第22回オープンデータトーク 地理データ形式のこれから
第22回オープンデータトーク 地理データ形式のこれから
 
固有表現抽出について
固有表現抽出について固有表現抽出について
固有表現抽出について
 
第2回ナレッジグラフ推論チャレンジ2019の紹介(11/22, SWO研究会)
第2回ナレッジグラフ推論チャレンジ2019の紹介(11/22, SWO研究会)第2回ナレッジグラフ推論チャレンジ2019の紹介(11/22, SWO研究会)
第2回ナレッジグラフ推論チャレンジ2019の紹介(11/22, SWO研究会)
 
自然言語処理 BERTに関する論文紹介とまとめ
自然言語処理 BERTに関する論文紹介とまとめ自然言語処理 BERTに関する論文紹介とまとめ
自然言語処理 BERTに関する論文紹介とまとめ
 
09遺跡分布を分析する〜カーネル密度推定〜
09遺跡分布を分析する〜カーネル密度推定〜09遺跡分布を分析する〜カーネル密度推定〜
09遺跡分布を分析する〜カーネル密度推定〜
 
[DSO]勉強会_データサイエンス講義_Chapter8
[DSO]勉強会_データサイエンス講義_Chapter8[DSO]勉強会_データサイエンス講義_Chapter8
[DSO]勉強会_データサイエンス講義_Chapter8
 

More from KyushuBioinformaticsCommunity

20200219 Shinya Oki
20200219 Shinya Oki20200219 Shinya Oki
20200219 Shinya Oki
KyushuBioinformaticsCommunity
 
20191004 Kenichi Horisawa
20191004 Kenichi Horisawa20191004 Kenichi Horisawa
20191004 Kenichi Horisawa
KyushuBioinformaticsCommunity
 
20191004 Naoto Kubota
20191004 Naoto Kubota20191004 Naoto Kubota
20191004 Naoto Kubota
KyushuBioinformaticsCommunity
 
20190621 Narumi Sakaguchi
20190621 Narumi Sakaguchi20190621 Narumi Sakaguchi
20190621 Narumi Sakaguchi
KyushuBioinformaticsCommunity
 
20190621 Tomoya Ichihara
20190621 Tomoya Ichihara20190621 Tomoya Ichihara
20190621 Tomoya Ichihara
KyushuBioinformaticsCommunity
 
20190621 Syougo Nakayama
20190621 Syougo Nakayama20190621 Syougo Nakayama
20190621 Syougo Nakayama
KyushuBioinformaticsCommunity
 
20190412 Shotaro Kawano
20190412 Shotaro Kawano20190412 Shotaro Kawano
20190412 Shotaro Kawano
KyushuBioinformaticsCommunity
 
20190412 Yuhei Yamauchi
20190412 Yuhei Yamauchi20190412 Yuhei Yamauchi
20190412 Yuhei Yamauchi
KyushuBioinformaticsCommunity
 
20190412 Chie Kikutake
20190412 Chie Kikutake20190412 Chie Kikutake
20190412 Chie Kikutake
KyushuBioinformaticsCommunity
 
20190412 Naoto Kubota
20190412 Naoto Kubota20190412 Naoto Kubota
20190412 Naoto Kubota
KyushuBioinformaticsCommunity
 

More from KyushuBioinformaticsCommunity (10)

20200219 Shinya Oki
20200219 Shinya Oki20200219 Shinya Oki
20200219 Shinya Oki
 
20191004 Kenichi Horisawa
20191004 Kenichi Horisawa20191004 Kenichi Horisawa
20191004 Kenichi Horisawa
 
20191004 Naoto Kubota
20191004 Naoto Kubota20191004 Naoto Kubota
20191004 Naoto Kubota
 
20190621 Narumi Sakaguchi
20190621 Narumi Sakaguchi20190621 Narumi Sakaguchi
20190621 Narumi Sakaguchi
 
20190621 Tomoya Ichihara
20190621 Tomoya Ichihara20190621 Tomoya Ichihara
20190621 Tomoya Ichihara
 
20190621 Syougo Nakayama
20190621 Syougo Nakayama20190621 Syougo Nakayama
20190621 Syougo Nakayama
 
20190412 Shotaro Kawano
20190412 Shotaro Kawano20190412 Shotaro Kawano
20190412 Shotaro Kawano
 
20190412 Yuhei Yamauchi
20190412 Yuhei Yamauchi20190412 Yuhei Yamauchi
20190412 Yuhei Yamauchi
 
20190412 Chie Kikutake
20190412 Chie Kikutake20190412 Chie Kikutake
20190412 Chie Kikutake
 
20190412 Naoto Kubota
20190412 Naoto Kubota20190412 Naoto Kubota
20190412 Naoto Kubota
 

20191007 hyeonjeong kim

Editor's Notes

  1. Molecular function(分子機能):生化学水準で生産物により分類 Biological process(生物学的プロセス):生物学的な代謝過程での役割により分類 Cellular component(細胞の構成要素): 細胞内に存在する位置により分類 ある。GOで定義された用語であるGO termは GO定義されたアノテーション情報であるGO Termは、通し番号がふられる。    例.GO: 0006 783  =  heme biosynthetic process 生物学的概念を記述するための、共通の語彙を策定しようとするプロジェクトにより定義された遺伝子のアノテーション情報
  2. mRNA expression data같은건 특히 몇만 정도의 유전자를 포함 GOは簡単に似たような機能の遺伝子を持つグループ. ある遺伝子リスト(発現変動遺伝子等)に対して、密に含まれているGO Termを(超幾何分布のp値等で、)統計的に検出
  3. Bioconductorで解析可能 약간씩 다르기때문에 연구목적과 환경에 맞춰서 골라서 쓰면됨
  4. Bioconductorで解析可能 약간씩 다르기때문에 연구목적과 환경에 맞춰서 골라서 쓰면됨
  5. Metascape 에관한 간단한 설명 결과를 레포트로 내주니까 좋다!! インプットのリストにどのような機能を持つ遺伝子が多いかなどを直感的に速く確認できる 遺伝子IDリストの他に複数のリストデータも使用可能で、複数リスト間のアノテーションについて差分することが出来る とにかく使いやすい!
  6. 검색엔진에서 검색하면 쉽게들어갈수있다
  7. 홈페이지는 이런느낌 삼천밖에 못씀
  8. 홈페이지는 이런느낌 삼천밖에 못씀
  9. 오른쪽위에 도큐멘츠가 잇다 혼자서도 이거보고 충분히 따라할수있을만큼 간단하다
  10. 여기에있는 샘플데이터로 한번해보자
  11. 여기에있는 샘플데이터로 한번해보자
  12. 여기에있는 샘플데이터로 한번해보자
  13. 잠시기다리면 이래됨
  14. 유전자의 갯수가아니고 GO의 카테고리의 개수로 보는거임 테이블
  15. 유전자의 갯수가아니고 GO의 카테고리의 개수로 보는거임 테이블
  16. 밑에 진심볼누르는거랑 같은 파일임 오른쪽의 옵셔널 데이터 칼럼은 여기서 쓰이지는 않음
  17. 밑에 진심볼누르는거랑 같은 파일임 오른쪽의 옵셔널 데이터 칼럼은 여기서 쓰이지는 않음