Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

[All in-one2017] 自宅でできるゲノム研究:DDBJ/GenBank/ENA

104 views

Published on

All-in-one 合同講習会 2017 ~生命科学の最先端に触れてみよう~
講師:有田 正規(国立遺伝学研究所 生命ネットワーク研究室 教授)
日時:2017年5月27日
場所:三島市民文化会館(ゆうゆうホール) 小ホール(静岡県三島市)
YouTube:https://youtu.be/ZdbtLF6DDeE

Published in: Science
  • Be the first to comment

  • Be the first to like this

[All in-one2017] 自宅でできるゲノム研究:DDBJ/GenBank/ENA

  1. 1. 自宅でできるゲノム研究 ―DDBJ/GenBank/ENA― 有田 正規 国立遺伝学研究所 arita@nig.ac.jp
  2. 2. 生物学を、自宅でできる時代 DIYBio.org (do it yourself) 欧米を中心に、部活動の 感覚で分子生物学を学ぶ コミュニティ活動 遺伝子情報のおおくは、 インターネットで入手可能。 「ゲノムデータは無償公開」 という大前提があって初め て、実現。 なぜ無料? 研究者が努力したから。 (もとは税金)
  3. 3. 生命 = 物理化学 + 情報 生物学ときくと、野外で生物を観察したり、顕微鏡で 微生物を観察しているイメージがありませんか? いまの医療やゲノム科学の多くは、 「コンピュータ 解析」が中心です。 木原生物学研究所のウェブサイトより
  4. 4. データベースの国際連携 DNA配列の 「登録」 がとても重要な作業。 登録して 「アクセッション番号」 を受け取らないと、 研究論文を発表できない。(研究者の義務) 配列は公開、だれでも使える。
  5. 5. DNA Data Bank of Japan (DDBJ) GenBank, EMBL データベースと連携した、3極構造 の一つとして 1986 年に発足、翌年から稼働。 International Nucleotide Sequence Database Collaborationという枠組みで ・次世代シーケンスデータ ・DNA配列 ・生物試料(Biosample)、計画 情報(Bioproject)などを共有
  6. 6. データサイズ 注釈のない生データは、 ペタバイト級 登録される生物種 B bp
  7. 7. X線結晶解析で初めて 立体構造がわかった タンパク質 (Perutz, Kendrew 1959) 筋肉に酸素を運ぶ, ミオグロビン 8本のアルファヘリックス 血液で酸素を運ぶ, ヘモグロビン アルファとベータ鎖が4量体を形成 テーマ:Globin 化合物ヘムに 酸素がつく ケンドリュー ペルーツ
  8. 8. ヘモ、ミオグロビンの違い いずれも、グロビンフォールドと 呼ばれる8本のαヘリックスを持つ。 ヘモグロビンは4量体 http://ptgl.uni-frankfurt.de/motif_overview.php
  9. 9. ヘモグロビンを検索してみよう PDBj では、日本語で検索できる (1buw) ヘモグロビンと入力
  10. 10. Hemoglobinの配列を検索する Human beta hemoglobin mRNA と入力
  11. 11. 検索結果 2000件以上もヒット 1, 2, 3番とも病気の配列 がヒットしてくる。 (説明付き) ファイル形式を選べる クリックして遺伝子情報へ。 FastA形式にすると、配列 だけを取り出せる。
  12. 12. 検索結果の絞込み ARSAでは高度な検索方法が使えます。 AND、OR、NOT の利用 “ ” でくくったフレーズ ワイルドカード (実はGoogle検索でも使える)
  13. 13. DNAからアミノ酸へ 検索結果の FEATURES 欄で、CDS (coding sequence) とあるのがアミノ酸配列です。 DNA … ATGC の4文字 アミノ酸 … 20文字 (比較が面倒!) Beta hemoglobin (disease type) Phe 42 Leu MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFLESFGDLSTPDAVMG NPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCV LAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH Normal beta hemoglobin MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMG NPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCV LAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH
  14. 14. アラインメントという作業 間のスペースをなるべく少なくしつつ、同じタイプの アミノ酸を縦に一致させて並べるアルゴリズム
  15. 15. ヒト、ウマ、クジラの配列比較 ヒトとウマのalpha鎖がとても似ていることがわかる。
  16. 16. 集めた配列のアラインメント アライメントで進化系統樹を作れる。 EMBL-EBIのものが便利
  17. 17. スパコン環境の提供 国内研究者なら 誰でもスパコンを 無料で利用可能。 (学生も指導教員の 承諾があればOK) 新規ユーザ登録の部分から申請しましょう
  18. 18. スパコンでできること 国内外、500以上の機関が利用しています。 (20コア64Gメモリ500台、2TBメモリ10台、10TB 1台) • 読み取ったゲノム配列をアセンブル • 遺伝子発現量の解析(マッピング) • 配列機能の予測(アノテーション) などなど。 配列はDDBJから入手、解析はスパコン いずれも 「無料で」 できる。
  19. 19. まとめ • これからの生物学は、情報処理が中心 コンピュータを扱えることが大前提。プログラミングも。 英語は重要。 • 遺伝研DDBJは世界3極で、データ無償公開 公開するからこそ、新規性や重要性がわかる。 科学の発展のためには必須。 • まずは遺伝子やタンパク質から調べてみよう 研究機関は信頼できる情報を多く提供しています。 情報アクセスの能力を身に着けよう。
  20. 20. まとめ • 本格的な解析にはスパコンを利用しよう 学校や研究室単位で申し込みます。 大量ユーザでなければ無料です。 • 説明書もインターネットにあります 便利な書籍もありますが、利用法も無償公開です。 制度はいろいろあるので、ぜひ利用してください。 高校や大学への出前授業 夏休みの研究室体験(高校生) 遺伝研体験入学プログラム(大学生) 研究者交流促進プログラム

×