Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

データベース活用による 知のめぐりのよい細胞生物学

1,049 views

Published on

講演「データベース活用による知のめぐりのよい細胞生物学」90分のスライド。こののち、以下の講習会90分 http://motdb.dbcls.jp/?AJACS39

Published in: Education
  • Be the first to comment

  • Be the first to like this

データベース活用による 知のめぐりのよい細胞生物学

  1. 1. © ライフサイエンス統合データベースセンター/大学共同利用機関法人 情報・システム研究機構データベース活用による知のめぐりのよい細胞生物学大学共同利用機関法人 情報・システム研究機構(ROIS)ライフサイエンス統合データベースセンター(DBCLS)坊農 秀雅Online supplemental material: http://bit.ly/dbcls130515
  2. 2. こんな本にも関わってきました2
  3. 3. 低酸素(hypoxia)3
  4. 4. 代謝経路を制御するシグナル伝達経路4From Nat. Med. 11, 1047-1048 (2005)mammalC.elegansorthologs homologs比較ゲノム
  5. 5. 5Nature 464, 670-671 (2010)より
  6. 6. kongetu今月だと6http://genome.cshlp.org/
  7. 7. 7http://genome.cshlp.org/content/23/5/749
  8. 8. 8Nature 464, 670-671 (2010)より
  9. 9. DBCLS: Database Center for Life Science• ライフサイエンス統合データベースセンター‒ ライフサイエンス分野のデータベース統合化の拠点‒ Since 2007‒ @東京大学本郷キャンパス内•が、東大の機関ではありません9
  10. 10. バイオサイエンスデータベースセンター(NBDC)•National Bioscience Database Center‒Since 2011•独立行政法人 科学技術振興機構(JST)の傘下10http://biosciencedbc.jp/nbdc.cgi?lng=ja&gg=org_membersより引用
  11. 11. NBDC web site11
  12. 12. 統合DBとは?•安心してすぐに利用できるデータを提供‒ 「ぐるなび」、「食べログ」、「クックパッド」•公共DBとして外に出す際にデータを綺麗に‒「分別回収→リサイクル」•NBDC/DBCLS/DDBJ を中心に日本中のさまざまな大学・研究機関が協力ライフサイエンスデータのロジスティクス(流通業)DBを試薬に例える。昔はほぼ一択だったのがたくさん出てきてどれがいいのか全くわからない状態どころか、何が出回っているのかさえ実態がつかめないという
  13. 13. 今日紹介する内容•統合TV•カタログ&コンテンツ‒IntegbioDBカタログ‒新着論文レビュー‒領域融合レビュー•検索‒生命科学DB横断検索‒Allie:略語検索エンジン‒inMeXes -> LSD‒DNA DB overview•GGRNA (RefSeq search)‒GEO overview•RefEx‒DBCLS SRA•アーカイブ‒DDBJ, DOR, DRA‒生命科学DBアーカイブhttp://bit.ly/dbcls130515
  14. 14. free! 14就職しても登録なしでsound from http://famicom-music.net/famicompiano/f-contents/l&e-1.html
  15. 15. 統合TV (togoTV)•動画によるDBやツールのチュートリアル‒ 各DBやツール名、•統合データベース講演会AJACSの動画も•YouTubeでも•約680の動画             (アップデート込)15で検索クリエイティブ・コモンズ 表示 2.1 日本
  16. 16. 16
  17. 17. 統合TV(togoTV)17
  18. 18. 今日紹介する内容•統合TV•カタログ&コンテンツ‒IntegbioDBカタログ‒新着論文レビュー‒領域融合レビュー•検索‒生命科学DB横断検索‒Allie:略語検索エンジン‒inMeXes -> LSD‒DNA DB overview•GGRNA (RefSeq search)‒GEO overview•RefEx‒DBCLS SRA•アーカイブ‒DDBJ, DOR, DRA‒生命科学DBアーカイブhttp://bit.ly/dbcls130515
  19. 19. 19
  20. 20. 20
  21. 21. 今日紹介する内容•統合TV•カタログ&コンテンツ‒IntegbioDBカタログ‒新着論文レビュー‒領域融合レビュー•検索‒生命科学DB横断検索‒Allie:略語検索エンジン‒inMeXes -> LSD‒DNA DB overview•GGRNA (RefSeq search)‒GEO overview•RefEx‒DBCLS SRA•アーカイブ‒DDBJ, DOR, DRA‒生命科学DBアーカイブhttp://bit.ly/dbcls130515
  22. 22. First author’sとは?Nature, Science, Cell などに代表されるトップジャーナルに掲載された日本人を著者とする生命科学分野の論文について論文の著者自身の執筆による専門分野の異なる生命科学研究者にむけた日本語によるレビューを、誰でも自由に閲覧・利用できるようウェブ上にていち早く無料で公開するサイト。DBCLS謹製。22
  23. 23. クリエイティブ・コモンズ 表示 2.1 日本 23
  24. 24. 24
  25. 25. ライフサイエンス領域融合レビュー生命科学において注目される分野・学問領域における最新の研究成果について、第一線の研究者の執筆による日本語のレビューを、だれでも自由に閲覧・利用できるよう、無料で公開します。25New!
  26. 26. 今日紹介する内容•統合TV•カタログ&コンテンツ‒IntegbioDBカタログ‒新着論文レビュー‒領域融合レビュー•検索‒生命科学DB横断検索‒Allie:略語検索エンジン‒inMeXes -> LSD‒DNA DB overview•GGRNA (RefSeq search)‒GEO overview•RefEx‒DBCLS SRA•アーカイブ‒DDBJ, DOR, DRA‒生命科学DBアーカイブhttp://bit.ly/dbcls130515
  27. 27. 27高血圧
  28. 28. 28
  29. 29. 29
  30. 30. 今日紹介する内容•統合TV•カタログ&コンテンツ‒IntegbioDBカタログ‒新着論文レビュー‒領域融合レビュー•検索‒生命科学DB横断検索‒Allie:略語検索エンジン‒inMeXes -> LSD‒DNA DB overview•GGRNA (RefSeq search)‒GEO overview•RefEx‒DBCLS SRA•アーカイブ‒DDBJ, DOR, DRA‒生命科学DBアーカイブhttp://bit.ly/dbcls130515
  31. 31. 31
  32. 32. 32
  33. 33. 33LifeScienceDictionaryのサイトにリンク
  34. 34. 今日紹介する内容•統合TV•カタログ&コンテンツ‒IntegbioDBカタログ‒新着論文レビュー‒領域融合レビュー•検索‒生命科学DB横断検索‒Allie:略語検索エンジン‒inMeXes -> LSD‒DNA DB overview•GGRNA (RefSeq search)‒GEO overview•RefEx‒DBCLS SRA•アーカイブ‒DDBJ, DOR, DRA‒生命科学DBアーカイブhttp://bit.ly/dbcls130515
  35. 35. DNA DB overview35
  36. 36. GGRNA36
  37. 37. GGRNA検索例37
  38. 38. 今日紹介する内容•統合TV•カタログ&コンテンツ‒IntegbioDBカタログ‒新着論文レビュー‒領域融合レビュー•検索‒生命科学DB横断検索‒Allie:略語検索エンジン‒inMeXes -> LSD‒DNA DB overview•GGRNA (RefSeq search)‒GEO overview•RefEx‒DBCLS SRA•アーカイブ‒DDBJ, DOR, DRA‒生命科学DBアーカイブhttp://bit.ly/dbcls130515
  39. 39. GEO overview(目次)• http://lifesciencedb.jp/geo/39
  40. 40. RefEx40
  41. 41. RefExliver specific genes41
  42. 42. RefEx:Specific gene(HIF1A)42
  43. 43. 43
  44. 44. © 2013 坊農秀雅 Licensed under CC 表示 2.1 日本RNAseq vs マイクロアレイ44
  45. 45. © 2013 坊農秀雅 Licensed under CC 表示 2.1 日本RNAseqとは?• 「次世代シーケンサを利用して、サンプル中の RNA の中身に関する情報を得るために cDNA をシーケンシングする方法」–http://en.wikipedia.org/wiki/RNA-Seqより勝手に翻訳• Whole transcriptome shutgunsequencing(WTSS) や• Transcriptome sequencingとも45
  46. 46. © 2013 坊農秀雅 Licensed under CC 表示 2.1 日本RNAseq データ解析の流れ1ゲノムに対する多重配列アラインメント.bamゲノムアノテーション.gtf予測転写単位ごとの(推定)発現量情報SRR001356.1 2023DAAXX:5:1:123:563 length=33TGTCGGTCCAGCTCGGCCTTGGGCTCCGTTTTC+SRR001356.1 2023DAAXX:5:1:123:563 length=33-IIIIIIII8IIIIIIIIIII6IIIIIIIII9I@SRR001356.2 2023DAAXX:5:1:123:476 length=33TCTGAACCCGACTCCCTTTCGATCGGCCGCGGG+SRR001356.2 2023DAAXX:5:1:123:476 length=33IIIIIIIIIIIIIIIIIIIIIGIIIIIII-III@SRR001356.3 2023DAAXX:5:1:121:746 length=33GTGGCAGCGTTTTTGGGCCCGCCGCTTGCCGTT+SRR001356.3 2023DAAXX:5:1:121:746 length=33IIIII&IIIIIIIIIIIIIIIIHI1IIIIIIIIFASTQゲノム .fa1.tophat(bowtie)2.cufflinks3.cummeRbund46遺伝子アノテーション
  47. 47. © 2013 坊農秀雅 Licensed under CC 表示 2.1 日本データ形式の実際(RNAseq)• FASTQ形式–4行/readが基本単位–3000万read ->1億行超/file• ファイルサイズも2Gbyte/file超–FAT32フォーマットでは…• いわゆる「開く」ことが不可能→コマンドライン操作SRR001356.1 2023DAAXX:5:1:123:563 length=33TGTCGGTCCAGCTCGGCCTTGGGCTCCGTTTTC+SRR001356.1 2023DAAXX:5:1:123:563 length=33-IIIIIIII8IIIIIIIIIII6IIIIIIIII9I@SRR001356.2 2023DAAXX:5:1:123:476 length=33TCTGAACCCGACTCCCTTTCGATCGGCCGCGGG+SRR001356.2 2023DAAXX:5:1:123:476 length=33IIIIIIIIIIIIIIIIIIIIIGIIIIIII-III@SRR001356.3 2023DAAXX:5:1:121:746 length=33GTGGCAGCGTTTTTGGGCCCGCCGCTTGCCGTT+SRR001356.3 2023DAAXX:5:1:121:746 length=33IIIII&IIIIIIIIIIIIIIIIHI1IIIIIIII47% less SRR001356.fastq% tophat -p8 -o tophat_out bowtie2/cel215 SRR001356.fastq
  48. 48. © 2013 坊農秀雅 Licensed under CC 表示 2.1 日本RNAseq データ解析の流れ2• 最近はgenomeがなくてもする方法も–transcriptome の de novoassembly• 「UniGeneを自分で作る」–現状、より膨大な計算時間が• immature• state-of-the-art 48
  49. 49. © 2013 坊農秀雅 Licensed under CC 表示 2.1 日本マイクロアレイ解析遺伝子アノテーションGenespringoligoprobeに対応する遺伝子ごとの発現量 49
  50. 50. © 2013 坊農秀雅 Licensed under CC 表示 2.1 日本データ形式の実際(マイクロアレイ)• タブ区切りテキスト–数万(=スポットの数)行• (古い)Excelでも「開ける」–Excel2003の行数制限内• コマンドライン操作なしで中身が直接見れる50
  51. 51. © 2013 坊農秀雅 Licensed under CC 表示 2.1 日本マイクロアレイ• mature• ある程度(技術として)枯れてきた• 本もそれなりに出ている51
  52. 52. © 2013 坊農秀雅 Licensed under CC 表示 2.1 日本データ解析に必要なものマイクロアレイ RNAseq解析ソフト遺伝子アノテーションゲノムアノテーションゲノム配列コマンドライン操作計算機パワー+++ ++++++ +++- ++- +++ ++++ +++52
  53. 53. © 2013 坊農秀雅 Licensed under CC 表示 2.1 日本結論• 手堅く出したいのならマイクロアレイ• 出すのを試したいのならRNAseq53
  54. 54. © 2013 坊農秀雅 Licensed under CC 表示 2.1 日本公共データベースのデータでまずは練習を…SRA(DRA) GEOArrayExpressGenomeMetagenomeRNAseqChIPseqmicroarray(GeneChip,Oligoarray)• SRAxxxxx, SRPxxxxx,SRXxxxxx• ERAxxxxx, ERPxxxxx,ERXxxxxx• DRAxxxxx, DRPxxxxx,DRXxxxxx• GSExxxxx• E-xxxcommand(control)+ F で検索 54
  55. 55. © 2013 坊農秀雅 Licensed under CC 表示 2.1 日本探し方例:論文から55
  56. 56. 今日紹介する内容•統合TV•カタログ&コンテンツ‒IntegbioDBカタログ‒新着論文レビュー‒領域融合レビュー•検索‒生命科学DB横断検索‒Allie:略語検索エンジン‒inMeXes -> LSD‒DNA DB overview•GGRNA (RefSeq search)‒GEO overview•RefEx‒DBCLS SRA•アーカイブ‒DDBJ, DOR, DRA‒生命科学DBアーカイブhttp://bit.ly/dbcls130515
  57. 57. 57http://sra.dbcls.jp/http://g86.dbcls.jp/togopic© 2011 DBCLS Licensed under CC 表示 2.1 日本SRAs(Survey of Read Archives)DBCLS SRA
  58. 58. SRAの統計値58© 2011 DBCLS Licensed under CC 表示 2.1 日本
  59. 59. SRAの統計値259© 2011 DBCLS Licensed under CC 表示 2.1 日本
  60. 60. Search NGS data by disease60
  61. 61. Search NGS data by publication61
  62. 62. PUBLISHED OR NOT公開されたデータを元にした論文はあるのか6219%paper publishednot publishedNUMBER OF SUBMITTED STUDY「論文を公開してからデータを公開する」とは限らない
  63. 63. 今日紹介する内容•統合TV•カタログ&コンテンツ‒IntegbioDBカタログ‒新着論文レビュー‒領域融合レビュー•検索‒生命科学DB横断検索‒Allie:略語検索エンジン‒inMeXes -> LSD‒DNA DB overview•GGRNA (RefSeq search)‒GEO overview•RefEx‒DBCLS SRA•アーカイブ‒DDBJ, DOR, DRA‒生命科学DBアーカイブhttp://bit.ly/dbcls130515
  64. 64. DDBJ64
  65. 65. DOR65
  66. 66. 66
  67. 67. 今日紹介する内容•統合TV•カタログ&コンテンツ‒IntegbioDBカタログ‒新着論文レビュー‒領域融合レビュー•検索‒生命科学DB横断検索‒Allie:略語検索エンジン‒inMeXes -> LSD‒DNA DB overview•GGRNA (RefSeq search)‒GEO overview•RefEx‒DBCLS SRA•アーカイブ‒DDBJ, DOR, DRA‒生命科学DBアーカイブhttp://bit.ly/dbcls130515
  68. 68. 68
  69. 69. 69
  70. 70. 70
  71. 71. 統合DB=ライフサイエンスデータの「上水処理場」+「下水処理場」•安心してすぐに利用できるデータを提供‒ 「ミネラルウォーターを買わなくても飲用できるように」•公共DBとして外に出す際にデータを綺麗に‒「油を流しに捨てないで!」ライフサイエンスの「ライフライン」http://rise-eco.jp/recycle.html•NBDC/DBCLS/DDBJ を中心に日本中のさまざまな大学・研究機関が協力
  72. 72. 72LSQA http://qa.lifesciencedb.jp/
  73. 73. 73★http://bit.ly/dbcls130515bono@dbcls.jp / bonohuからスカイツリー方向を臨む

×