Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Brief introduction of aLeaves (mainly in Japanese)

1,042 views

Published on

Slides from an oral presentation by Shigehiro Kuraku given in Septermber 2013 at the annual meeting of Zoological Society of Japan in Okayama, Japan.

Published in: Education
  • Be the first to comment

  • Be the first to like this

Brief introduction of aLeaves (mainly in Japanese)

  1. 1. aLeaves(エイリーヴズ)を用いて 分子系統樹推定におけるデータセット生成の ストレスを減らす ~ tackling a bottleneck of modern molecular phylogenetics ~ 工樂 樹洋(理研CDB・ゲノム資源解析ユニット) Shigehiro Kuraku (Genome Resource & Analysis Unit, RIKEN CDB)
  2. 2. Informatics Modern sequencing Molecular Developmental Biology ゲノム資源解析ユニット Genome Resource & Analysis Unit Center for Developmental Biology RIKEN, Kobe, Japan Who am I ?
  3. 3. コンセプト 系統樹推定法が成熟し、多数のゲノムプロジェクトにより配列情報が非常に 豊かになったにもかかわらず、実験生物学者にとって分子系統樹推定の 作業は身近になるどころか、より手の届きにくいものになったのではないか? 情報過多になりがちな昨今の配列リソースを網羅しつつも、 生物学者が頼りにしやすい手掛かりを用いて配列数を絞り込む ことができるオンラインツールをつくる
  4. 4. Hidden paralogy とは?: 例、zebrafish Emx3 Derobert et al., 2002 etc. Morita et al., 1995 Reviewed in Kuraku, 2010. Integ. Comp. Biol.
  5. 5. Heuristic collection B) A) Exhaustive search of homologs ホモログ配列セット、どうやって用意していますか?
  6. 6. 配列情報が散在していることがネック EnsemblNCBI Protein (annotated) Individual web sites of genome projects Your sequences NCBI Refseq (annotated) Ensembl Metazoa データセット
  7. 7. コンセプト 系統樹推定法が成熟し、多数のゲノムプロジェクトにより配列情報が非常に 豊かになったにもかかわらず、実験生物学者にとって分子系統樹推定の 作業は身近になるどころか、より手の届きにくいものになったのではないか? 情報過多になりがちな昨今の配列リソースを網羅しつつも、 生物学者が頼りにしやすい手掛かりを用いて配列数を絞り込む ことができるオンラインツールをつくる
  8. 8. Collaborators GRAS, RIKEN CDB CBRC, AIST & iFReC, Osaka Univ. Christian M. Zmasek Sanford-Burnham Medical Research Institute USA Kazutaka Katoh 加藤 和貴Osamu Nishimura 西村 理
  9. 9. For citation
  10. 10. aLeaves – http://aleaves.cdb.riken.jp 5分以内に対象データベース から配列を収集しmultifasta 形式で出力 EnsemblやNCBIに加え、 ゾウギンザメ、ナメクジウオ、 アコヤガイなどの配列も含め ワンサーチで アミノ酸配列クエリー1本 から検索スタート
  11. 11. Taxonomic coverage (1)
  12. 12. Taxonomic coverage (2)
  13. 13. Downstream analysis on MAFFT server 様々な基準に従い、配列の体系的な取捨選択が可能 ・配列長 ・酷似する配列を削除 (CD-HIT) ・Gap-freeな座位数を制限している配列を削除(Max-Align) ・特定の生物種に絞る ・Guide-tree(案内木)上の位置 Managed by K. Katoh
  14. 14. Heuristic identification of homologs (in publications, etc.) Exhaustive collection of homologs Careful refinement of dataset by deleting unnecessary sequences Phylogenetic tree inference Retrieval of limited number of sequences (on MAFFT server at CBRC, AIST) (on aLeaves server at CDB, RIKEN) Workflow using aLeaves-MAFFT
  15. 15. 注意点 ・aLeaves は他所ですでに公開されているリソースだけ に基づいたツールです(オリジナルサイトへリンク) ・aLeavesプロジェクトとしては、独自にタンパクコード遺伝子 の推定およびその吟味を行わず、オリジナルリソースの情報を そのまま踏襲しています ・aLeaves-MAFFTサーバを利用し予備的な分子系統解析が 可能だが、本格的な解析は、作成した配列セットをダウン ロードし、やはりローカルで行ってください
  16. 16. Perspectives ・塩基配列への対応 ・遺伝子配列だけでなくゲノムアセンブリに対応 ・動物以外の生物群に対応 ・特定の生物種の追加などのリクエストにも可能な限り対応 機能拡張の可能性 サポート ・質問等は shigehiro-kuraku@cdb.riken.jp へ ・分子系統解析についての一般的なご相談もぜひどうぞ

×