Social genome annotation

1,487
-1

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,487
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
18
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Social genome annotation

  1. 1. ソーシャル・ゲノム・ アノテーション 中尾光輝 mn@kazusa.or.jp かずさディー・エヌ・エー研究所 1
  2. 2. 中尾光輝 • かず さの特別研究員 • 植物ゲノム情報研究室 • CBRC の協力研究員 • ホートンチーム 2
  3. 3. • BioRubyプロジェクト開発者 • オープンバイオ研究会(open-bio.jp) • Ruby会議実行委員 • 「RとBioconductorを用いたバイオイ ンフォマティクス」の翻訳 3
  4. 4. 内容 • アノテーションとは • アノテーションのライフサイクル • 課題の整理 • ソーシャル・ゲノム・アノテーション • かずさの取り組み 4
  5. 5. アノテーション 5
  6. 6. アノテーション • ゲノムアノテーション • 遺伝子アノテーション 6
  7. 7. ゲノムアノテーション • 遺伝子構造アノテーション • 遺伝子機能アノテーション 7
  8. 8. GenBank レコード • Features table に遺伝子構造アノ テーションが書かれている 8
  9. 9. 9
  10. 10. 10
  11. 11. 5 4 3 2 1 11
  12. 12. 遺伝子構造 • 遺伝子予測 • エキソン-イントロン構造 • 機能性RNA、SNP、cis-エレメント • ゲノム配列(一次元)における座 標のセット 12
  13. 13. Sequence Onotolgy 13
  14. 14. UniProtKB/Swiss-Prot • タンパク質知識ベース • UniProt.org • beta.uniprot.org がオススメ 14
  15. 15. 15
  16. 16. 16
  17. 17. 17
  18. 18. 18
  19. 19. 19
  20. 20. 20
  21. 21. 21
  22. 22. 遺伝子機能 • 対象 • 遺伝子シンボル、アミノ酸配列 • 機能についてのアノテーション • その他の記載 22
  23. 23. 遺伝子機能 • 分子機能(EC番号のつくもの) • 機能? • 局在化部位(Component) • 系統関係など 23
  24. 24. GOアノテーション • GeneOntology.org • 遺伝子産物への注釈をサポート するツール 24
  25. 25. 3つのオントロジー • Molecular Function • Biological Process • Cellular Component 25
  26. 26. 26
  27. 27. gene_product association term evidence 根拠 遺伝子産物 用語 27
  28. 28. evidence 根拠 28
  29. 29. アノテーションの例 29
  30. 30. GOの開いた世界 • タームの標準化 • 機能分類 • 集約(GOslim) • 種間比較 30
  31. 31. ゲノムアノテーション • 遺伝子構造アノテーション • 遺伝子機能アノテーション • その他のアノテーション • コンテクストを与える 31
  32. 32. 質的な範囲 • 論文の結果 • 実験結果 • 大規模実験結果 • 自動 32
  33. 33. 質のコントロール • UniProtKB • 用語のカテゴリ • 論文の有無 • GO • evidence code evidence 根拠 33
  34. 34. gene_product association evidence term 根拠 遺伝子産物 用語 34
  35. 35. アノテーションの ライフサイクル • 生成 • 成長 • 無効化/消失 35
  36. 36. 生成場所 • 遺伝子DNA配列決定 • ゲノムプロジェクト • ゲノムデータベース • アノテーション大会 • サードパーティーアノテーション 36
  37. 37. スケール • ゲノムスケール    網羅性 • 一遺伝子       正確性 37
  38. 38. 伝言ゲーム • コピー&ペーストで typo が伝播 する • imilar to X protein • Putative hypothetical protein 38
  39. 39. Excel の悲劇 • アクセッションに E123456 • 読み込み時に数値に変換された 39
  40. 40. 成長 • 改善/更新のプロセス • Hypothetical protein • Similar to X protein • 新しい論文 • 新しいデータベース、方法 40
  41. 41. 成長場所 • 遺伝子DNA配列決定 • ゲノムプロジェクト • ゲノムデータベース • アノテーション大会 • サードパーティーアノテーション 41
  42. 42. ゲノムデータベース • MGI, SGD, FlyBase,TAIR, ... • 持続的な更新 • GO アノテーションを利用 42
  43. 43. サードパーティ • KEGG • GO Annotation @ EBI • NCBI RefSeq, Gene • UniProtKB 43
  44. 44. 無効化/消失 • 遺伝子構造の更新 • アミノ酸配列の更新 • 根拠にした論文のとりさげ • 元にしたデータの更新 44
  45. 45. アノテーション利用 • GenBankエントリの作成 • 遺伝子データベースの遺伝子単位 のページのコンテンツのソース • カテゴリカルデータ 45
  46. 46. アノテーション • IDをもったもの(遺伝子など) • 用語体系(コンテクスト) • 根拠と参照元 • つけた人 • 作成日 46
  47. 47. gene_product association evidence term 根拠 ID 用語 47
  48. 48. 根拠と参照元 • 論文 • 教科書 • ほかのアノテーション • 学会発表 • 心の眼 48
  49. 49. 自動アノテーション • 充実している • InterProScan • 各種予測ツール • Evideice code: IEA • ホモロジーサーチ 49
  50. 50. 手動アノテーション • 論文を読む速度に依存 • 検索、取得、理解 • 整理法に依存 50
  51. 51. 課題 • アノテーション高度化 • 参照元を増やす • 質を高める 51
  52. 52. 対策 • 作業効率を上げる • 人を数を増やす 52
  53. 53. 作業効率を上げる • 論文の取得は加速された • インターネット 、電子出版 • 検索 • Medline, PubMed • オープンアクセス 53
  54. 54. 作業効率を上げる • 論文から転記するところは? • UI、ツールでサポート 54
  55. 55. 人の数を増やす • お金でかいけつ • 参入障壁をさげる • UI、ツールでサポート • コミュニティーでやる 55
  56. 56. ソーシャルアノテーション • ソーシャルブックマーク • CiteULike • はてなブックマーク • ソーシャルアノテーション • diigo.com 56
  57. 57. CiteULike.org • 論文情報の共有・保存・管理 • PDF保存 • メモ、タグ付け • 共有 • ブックマークレット 57
  58. 58. 58
  59. 59. あとから参照する仕組み • 検索 • タグ 59
  60. 60. 60
  61. 61. タグで分類 • 階層分類しない 61
  62. 62. 共有 • 論文セミナーに利用 • おなじ興味をもつ人の読んでる論 文を知る 62
  63. 63. ブックマークレット • ユーザーインターフェイス • ワンクリックでいま見ている PubMedのページ(の論文)を 登録するブックマーク • JavaScriptでできたブックマーク 63
  64. 64. はてなブックマーク • URLをブックマーク • コメント • タグ付け • キーワードの自動抽出 64
  65. 65. 65
  66. 66. 66
  67. 67. あとから参照する仕組み • 検索 • タグ • キーワード • コメント 67
  68. 68. diigo.com • ソーシャル・アノテーション • URLをブックマーク • 本文から抜き書き • コメント、付箋化 • タグ 68
  69. 69. 69
  70. 70. 70
  71. 71. 71
  72. 72. 72
  73. 73. 73
  74. 74. 74
  75. 75. 抜き書きにコメントをつける仕組み • 情報カード • 情報整理ツール • 調査用のツール 75
  76. 76. 一般的な意味での アノテーション • ゲノム座標セットにタームをつける • 遺伝子産物にタームをつける • URLにコメントやタグをつける 76
  77. 77. gene_product association evidence term 根拠 遺伝子産物 用語 77
  78. 78. URL association evidence コメント タグ 任意 対象 任意 78
  79. 79. UI によるサポート • ブックマークレット • ワンクリックでブックマークできる • 領域選択による抜き書き、付箋化 79
  80. 80. 共有 • 参照可能なアノテーションの拡大 • マスコラボレーションの可能性 • Wikipedia の成功 • Wikiproteins の挑戦 80
  81. 81. Wikiprotains.org • UniProtの内容をWIkiに移してい るだけ? 81
  82. 82. 極端なアノテーションの定義 • データモデルから見ると • evidence code でわければ • 関連付けるのは全部アノテーション 82
  83. 83. ゲノムアノテーション • 更新問題 • 人でによる更新速度 • 人が少ない 83
  84. 84. コミュニティ・アノテーション • 共有 • 特定の興味分野(生物種、現象) • 改善の運動 84
  85. 85. UIやツールでなんと かなるかもしれない • 参照元を増やす • 参加障壁をさげる • 作業効率を上げる 85
  86. 86. かずさの取り組み • ゲノム配列決定機関 • ゲノムデータベース • ますます増えるゲノム配列 • アノテーションの新規作成と更新 86
  87. 87. かずさの取り組み • ソーシャルなゲノムアノテーション のツールを開発中 • ゲノムDBが遺伝子URLを提供 • 遺伝子URLにアノテーションする 87
  88. 88. • 個人的な情報整理からリリースする アノテーションまでおなじツールで 管理 • データにはアクセス権限の設定をす る • 個人、グループ、パブリック 88
  89. 89. • タグで分類 • タグにコンテクストを任せる 89
  90. 90. まとめ • アノテーションの更新は大変 • ソーシャルなツールで克服できる かもしれない • かずさで実証実験をする 90
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×