Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス

156 views

Published on

初めての All-in-one 合同講習会〜生命科学DB・ツールの使い方~
講師:箕輪 真理(NBDC客員研究員/DBCLS特任准教授)
日時:2015年7月18日
場所:大阪大学中之島センター

Published in: Science
  • Be the first to comment

  • Be the first to like this

[All-in-one2015] データベース統合化の取り組みとNBDCで提供するサービス

  1. 1. 初めての All-in-one 合同講習会 (2015年7月18日) データベース統合化の取り組みと NBDCで提供するサービス 大学共同利用機関法人 情報・システム研究機構(ROIS) ライフサイエンス統合データベースセンター(DBCLS) 国立研究開発法人 科学技術振興機構(JST) バイオサイエンスデータベースセンター(NBDC) 箕輪真理 ©2015 箕輪真理 Licensed Under CC 表示2.1日本
  2. 2. 2 目次 I. データ駆動型科学とデータ共有をめぐる国内 外の状況 II. JST/NBDCとその取り組みについて III.主なサービス(カタログ、一括検索、データの 一括ダウンロード)の紹介 IV. ヒトに関するデータ関連のサービス V. その他のサービス例 VI. おわりに
  3. 3. 3 「第4パラダイム: データ集約型の科学的発見」 By マイクロソフト研究所 1.実験 観察された結果を自然原因により説明 2.理論 新たな現象の予測と実験による仮説の検証 3.計算とシミュレーション 大規模かつ緻密な計算によるモデリングや銀 河の形成など、実験や理論を超えた領域の探求 4.データ・マイニング 莫大なデータを出発点として関係性を強大な コンピューターパワーでマイニングし、規則を 発見 科学におけるパラダイムシフト
  4. 4. 4 研究スタイルの変化 1/2 従来の研究スキーム 仮説を立てる ↓ 研究のデザイン ↓ 必要な試料の収集と試験・実 験 ↓ 仮説の立証 ↓ 論文等による成果の公表 データ駆動型研究スキーム (網羅的な)試料収集 ↓ 網羅的なデータ取得or 大量データの集積 ↓ ・必要なデータを抽出 ・データ処理による現象の発見 ↓ 論文等による成果の公表 ・データ産生コスト↓ ・データ解析コスト↓ ・データ保存コスト↓
  5. 5. 5 情報の爆発と多様化 • データ爆発 –超高性能ゲノム配列決定装置 –コンピュターの性能の伸び(ムーアの法則)を凌駕 –数万を超えるゲノムプロジェクト進行中 –画像、動画データなどゲノム配列以外も急増 • 知識爆発 –論文数 2,000万件 –オープンアクセスの拡大 • データベース爆発 –世界 1万 –日本 1千 –解析ツール 2千 –内容も非常に多様化 ライフサイエンスは peta(1015) のオーダーの時代に突入
  6. 6. 6 研究スタイルの変化 2/2 データ駆動型研究スキーム (網羅的な)試料収集 ↓ 網羅的なデータ取得or 大量データの集積 ↓ ・必要なデータを抽出 ・データ処理による現象の発見 ↓ 論文等による成果の公表 データベース化の 必要性 《ビッグデータ??》 商業誌における独占状態から だれでもアクセス可能な状態へ (オープンアクセス=OA化) 論文の根拠データへの第3者の アクセスの確保 第3者の利用を可能とする (オープンデータ)
  7. 7. 7 海外でのOAの動き
  8. 8. 8 NIH Genomic Data Sharing (GDS) Policy 2014年8月  large-scale human or non-human genomic data  genome-wide association studies (GWAS), single nucleotide polymorphisms (SNP) arrays, genome sequence, transcriptomic, epigenomic, gene expression data
  9. 9. 9 国際的動向を踏まえた オープンサイエンスに関する検討会 (内閣府、H26(2014).12.9~H27(2015).3.30) 2013年6月 G8科学大臣会合 共同声明 「論文のオープンアクセス化に加え、研究データのオープン化を」 ↓ 世界的な議論が加速 ↓ 内閣府での検討 公的研究資金を用いた研究成果〈論文、生成された 研究データ等〉について、科学界はもとより産業界 及び社会一般から広く容易なアクセス・利用を可能 にし、知の創出に新たな道を開くとともに、効果的 に科学技術研究を推進することでイノベーションの 創出につなげることを目指した新たなサイ工ンス
  10. 10. 10 • データベースを指向した種々の大規模プロジェクト –多額の研究費がデータに化けている • 仮説駆動型からデータ駆動型(データ中心科学)へ –法人化、バイドール法 → データの囲い込み • データや知識の分断、断片化 • イノベーションには共有・統合化必要 –ブラウズ(検索)や一部のデータ公開では不十分 –データ生産者以外の不特定多数のイノベーターの存在 –再利用、 転用、マッシュアップが自由にできることが不可欠 ライフ分野におけるデータの共有・統合の重要性
  11. 11. 11 • DBが散在していて所在情報や利用法が分からない –我が国で1,000、世界で10,000ものDB –似たようなものがいくつもありどれを使ってよいか分からない • DBやDBのエントリに信頼性の高い注釈がついていない –DB構築、維持を行える人材不足、DB構築への評価の低さ • 大型プロジェクトの成果公開、共有が不十分 –我が国のライフ関係予算は年間3,000億円以上 –公開されているものもプロジェクトが終了すると更新ストップ • ばらばらに構築・管理されていて検索・解析・応用が困難 –現在の統合化は分子レベルで行われていて医療などへの応用困難 –日本語化されていないので研究動向や分野の状況の把握困難 •我が国にはDB戦略、中核センターがない  上記の問題を解決して、データの共有を促進し、価値を最大 化するための統合データベースプロジェクトが発足 我が国におけるライフサイエンスDBの問題点
  12. 12. 12 文部科学省委託研究開発事業 「統合データベースプロジェクト」
  13. 13. 13 文部科学省委託研究開発事業「統合データベースプロジェクト」
  14. 14. 14 総合科学技術会議統合DBタスクフォース報告書(H21.5.21)より 統合データベース整備のロードマップ
  15. 15. 15 世界との連携&国内の連携
  16. 16. 16 目次 I. データ駆動型科学とデータ共有をめぐる国内 外の状況 II. JST/NBDCとその取り組みについて III.主なサービス(カタログ、一括検索、データの 一括ダウンロード)の紹介 IV. ヒトに関するデータ関連のサービス V. その他のサービス例 VI. おわりに
  17. 17. 17 科学技術振興機構(JST) http://www.jst.go.jp/ 1.科学技術イノベーション創出に向けた研究開発戦略の立案 2.科学技術イノベーション創出の推進 ①戦略的な研究開発の推進 ②産学が連携した研究開発成果の展開 ③東日本大震災からの復興・再生支援 ④国際的な科学技術共同研究などの推進 ⑤知的財産の活用支援 ⑥革新的新技術研究開発の推進 3.科学技術イノベーション創出のための基盤形成 ①知識インフラの構築 ②人材インフラの構築 ③コミュニケーションインフラの構築 JSTとNBDCのご紹介 1/2
  18. 18. 18 バイオサイエンスデータベースセンター(NBDC) http://biosciencedbc.jp/ • JSTの中の1つのセンター 2011(平成23年)年4月に設立 • 生命科学分野のDBを使いやすくする! (1)データベース研究開発戦略の立案 (2)データベースの充実 府省間のデータベース統合 基盤技術開発 ファンディングプログラム (分野ごとにデータの統合を進めるため) (3)データの公開 (ポータルサイトや関連サービスも含めて) (4)国際連携 JSTとNBDCのご紹介 2/2
  19. 19. 19 NBDCの取り組み 連邦型統合DB (⇔中央集中型DB) 基盤技術開発 ファンディングプログラム (分野ごとにデータの統合を進めるため)
  20. 20. 20 1. どんなDBがどこ(URLは?)にあるのか? 欲しいデータは既に誰かが作成、 公開しているということも 2. 複数のDB内を横断的に検索できないか? DBごとに訪れて検索するのは手間 文献や特許など異なるDBを一括検索できれば 3. データセットを取得できないか? インタフェースに囚われずに⾃由に使いたい 手持ちのデータと組み合わせてみたい 生命科学分野のDBに対する要望 DBのカタログ DBの一括検索 データの一括 ダウンロード NBDCのサービス
  21. 21. 21 • どのようなデータが入っているのか? 多種多様なデータ データ項目の説明がばらばらor無 • 求められるデータが入っているか? 使いたいデータが見つからない • どのように使って良いのか? 利用に際しての条件がばらばらだし、 そもそもどこに書いてあるのか? 使用料とか? 論文に引用してもいいのか? 商用可能か? データを使って新しくDBを 作成したら公開してもいいのか? データを利用する際の問題点 3216549 87・・・ ・・・ ATGTGGC CT・・・ 契 約 書 データフォーマットの標準化 データの説明(メタデータ)の標準化 利用条件の標準化and明示 ・データ作成者の著作権表示 ・商用↔非商用 ・公開条件 ・引用方法 データを集めるための仕組み ・公的な研究には寄託を義務付け
  22. 22. 22 クリエイティブ・コモンズ(CC) 4種類のマークを組み合わせて 6種類の利用条件を選択することができる 再利用と共有を促進する仕組み CC-BY ジャパンクリエイティブ・コモンズ・ジャパン(http://creativecommons.jp/licenses/)
  23. 23. 23 ①CC表示-継承 ※作成者、URLなどのクレジットを表示する こと ※同じCC表示-継承で配布すること ③CC0(ゼロ) ※利用条件なし→ 自由に利用可能 ②CC表示 ※作成者、URLなどのクレジットを表示する こと NBDCで使用しているCCライセンス CC-BY ジャパンクリエイティブ・コモンズ・ジャパン (http://creativecommons.jp/licenses/) ※の条件で複製、再配布、改変、営利目的で利用可能 利用の自由度 高 低
  24. 24. 24 公募要領にデータ提供協力依頼記載 • 文科省ライフ課委託プロジェクト(H20〜) • JST戦略事業(CREST、さきがけ)(H23〜) • 厚労科研費(H24〜) • 文科省科研費(H25〜)
  25. 25. 25 目次 I. データ駆動型科学とデータ共有をめぐる国内 外の状況 II. JST/NBDCとその取り組みについて III.主なサービス(カタログ、一括検索、データの 一括ダウンロード)の紹介 IV. ヒトに関するデータ関連のサービス V. その他のサービス例 VI. おわりに
  26. 26. 26 NBDCのポータルサイト • 40種類以上のサービス • 生命科学のDB関連 • 登録不要 • 無料 • どこからでも、誰でも http://biosciencedbc.jp/ ポータルサイトへは 「NBDC」で検索 DBのカタログ DBの一括検索 データの一括 ダウンロード
  27. 27. 27 Integbioデータベースカタログ 概要 • 国内外の生命科学系DBの所在情報や 説明情報を提供するカタログ 収録DB数:1484件(国内1052件) • 20種類の記述項目 DB名、URL、運用機関名、生物種、説明など • DBをキーワード検索やカテゴリから探すことが可能 検索ボックス、絞込み機能 • 記述項目がダウンロード可能 複製、改変などが可能なCC0ライセンスで配布 DBのカタログ
  28. 28. 28 Integbioデータベースカタログ 使い方1 一覧内の検索 絞り込み DBの一覧 ・新着情報 ・更新履歴 ・ダウンロード ・関連リンク集
  29. 29. 29 Integbioデータベースカタログ 使い方2 オリジナルサイトへのリンク カタログ掲載内容
  30. 30. 30 生命科学データベース横断検索の特徴 • 生命科学分野のコンテンツを対象にした検索システム 分子DBの中を文献や特許情報とあわせて一括検索できる 検索対象DB数:533件 • 検索キーワードの日英相互翻訳 日英の辞書(京都大学 ライフサイエンス辞書)を搭載 • 検索結果の絞込み機能 DBのカテゴリ、遺伝子名称 • 類似キーワードの表示 DBの一括検索
  31. 31. 31 Googleと生命科学データベース横断検索 Googleで「マウス」と検索した場合 • 研究者は生き物の「マウス」を意図 • 結果にはコンピュータの付属物である「マウス」も表示 優先的に現れる結果は、 意図したものと異なる (実は網羅的でもない)
  32. 32. 32 公開Web検索サービスの弱点 データベースに多い「深層ウェブ」データを、 検索対象にできていない場合がある。 安形輝,宮田洋輔,池内淳,上田修一 学術情報流通における深層ウェブの実態 - 機関リポジトリに収録された文献を用いた調査 - 情報学会研究大会発表論文集 巻:2009 ページ:37-40 カバー率は 公開Webの53.2%程度
  33. 33. 33 生命科学データベース横断検索の検索対象一例(概数) DBカテゴリ DB 数 主なDB 文献 42 蛋白質核酸酵素(共立出版)(1985〜)、新着論文レ ビュー、文科省「ゲ ノム特定領域」報告書、各種実験 プロトコル集 学会要旨 4 日本農芸化学会、日本生物物理学会、トーゴーの日シンポ 要旨、医学・薬学予稿集全文データベース 特許関連文書 12 日本国特許公報(2004〜2015) 統合DBプロジェクト 100 生命科学DBアーカイブ、統合TV 用語解説 15 Gene Wiki、Proteopedia、Molecule of the Month ゲノム・遺伝子・RNA 76 EntrezGene、RefSeq、H-Invitational、FANTOM 遺伝子発現・転写制御 42 CGED(がん組織発現)、DBTSS(転写開始部位)、 coxpressdb(共発現) タンパク質 59 UniProt, PIR、PDBj パスウェイ・相互作用・ 生体反応 14 KEGG、ゲノムネットワークプロジェクト
  34. 34. 34 語句のサジェスト機能 (入力語句を含む単語の提案) 「データベース」か、 「ヒット件数」を選択して“検索” 横断検索インターフェース ~トップページ~ ヘルプページ DB一覧 モバイル版 クレジット英語版 上部ツールバーからのリンク 履歴※右隣の「設定」から CookieをONしたとき
  35. 35. 35 関連遺伝子 語句シソーラス(関連語句の提案) 外部リンク ツールボックス ヒット数 検索結果スニペット ナビゲーションバー(絞り込み機能あり→次スライド) 横断検索 ~検索結果(データベース)ページ~
  36. 36. 36 36 生命科学データベース横断検索mobile http://biosciencedbc.jp/dbsearch/mobile/
  37. 37. 37 生命科学系データベースアーカイブ 概要 • 国内で作成されたDBを丸ごとダウンロードできるサービス  収録DB数:103件 • CSVやRDF形式でデータをダウンロード可能  DBやデータについての説明(メタデータ) • データはCCライセンスで配布  CC表示-継承ライセンス、利用許諾を統一して明確に データの一括 ダウンロード
  38. 38. 38 生命科学系データベースアーカイブの収録DB DBカテゴリ DB 数 対象・生物種 ゲノム/遺伝子 7 マウス、イネ、トマト、植物、大腸菌、原核生物、微生物 遺伝子多型/変異 体/表現型 14 ヒト、イネ、ショウジョウバエ、マウス、シアノバクテリア、線虫 cDNA 18 イネ、トコジラミ、シダ、マボヤ、メダカ、粘菌、クラミドモナス、 シロイヌナズナ、ミヤコグサ、ムラサキツユクサ、酵母、カイコ 発現 7 カタユウレイボヤ、ヒト、マウス、粘菌、プラナリア、植物 蛋白質(配列/構 造/修飾/局在/相 互作用) 14 ヒト、マウス、線虫、酵母、トリパノソーマ、大腸菌、真核生物、 植物、生物全般 化合物/薬剤 4 ヒト、ラット、化合物全般 代謝物、代謝系/ シグナル伝達 15 ヒト、マウス、ラット、植物、藻類、酵母、生物全般 文献 5 遺伝子機能、微生物同定、安全性 カタログ 11 DB、ツール、学協会、プロジェクト、器官、生物画像、データ形式
  39. 39. 39 生命科学系データベースアーカイブ トップページ 表中の項目で検索が可能
  40. 40. 40 生命科学系データベースアーカイブ DB説明ページ DBの説明(メタデータ)ページ • 作成者 • 連絡先 • 予算的背景・プロジェクト • オリジナルサイト • 運用開始年月日 • 最終更新年月日 • など 40
  41. 41. 41 データを眺めてから ダウンロード可能 ZIP形式で丸ごと ダウンロード 生命科学系データベースアーカイブ データDL ダウンロードページ
  42. 42. 42 目次 I. データ駆動型科学とデータ共有をめぐる国内 外の状況 II. JST/NBDCとその取り組みについて III.主なサービス(カタログ、一括検索、データの 一括ダウンロード)の紹介 IV. ヒトに関するデータ関連のサービス V. その他のサービス例 VI. おわりに
  43. 43. 43 世界的な医学PJにおけるデータ共有 国際がんゲノムコンソーシアム 50種類のがんを選定、そのゲノム変異の全貌解明と包括的なカタログ化を目指す 2008年から活動、16カ国およびEUの機関や組織が参画(2014.5.15現在) 日本からは理化学研究所、国立がん研究センターなど6大学と4研究機関が参加 得られたデータは全世界の研究コミュニティに迅速かつ無償で公開 2015.6.16に19回目のデータ公開を実施、合計12979症例のがんゲノムデータ公開 Alzheimer’s Disease Neuroimaging Initiative (ADNI) アルツハイマー病の早期発見や進行度を測るマーカー発見プロジェクト 2004年から開始 健常高齢者 200 名,軽度認知障害(MCI) 患者 400 名,軽度 AD 患者 200 名を 含む合計 800 名の被験者を57 臨床施設でリクルート すべての臨床データと検査結果,画像データは品質管理,補正と匿名化を施された のち,ウェブ サイト上にすみやかに公表 ADNI に参加する研究者と製薬企業のみならず,誰からもアクセス可能
  44. 44. 44 世界的な医学データ共有の動き Global Alliance for Genomics and Health (GA4GH) ミッション:様々な機関が集結し、参加者の自主性を尊重しながらも、 ゲノムデータと臨床情報を最大限に統合・活用し、ヒトの健康増進を図る。 パートナーとして 34ヶ国から341の 団体が参加表明 (7月13日現在)。 日本からは、がん センター、理研、 阪大をはじめ、 11団体が参加。 NBDC、DBCLS、 DDBJも参加して いる。
  45. 45. 45 ヒトデータではアクセス制限が必要なものも 45 アクセス制限の必要な ヒトに関するデータを 収集・公開する仕組み
  46. 46. 46 NBDCヒトデータベース 基本方針: ・ヒトに関するあらゆるデータが対象 ・匿名化された情報のみ ⇒より詳細な情報は共同研究で! ・データ提供/利用に関する審査はNBDCが実施 提供者の要望はできる限り受け入れ(分類、公開時期、制限事項) ・社会的な理解や指針の変更に柔軟に対応 オープンデータ ウェブサイト等から制 限なく公開、提供の際 には審査を要する 公開待機 データ 論文公開な どで保留 制限公開データ ヒトデータ審査委員会 (NBDC)での審査に 基づき共有
  47. 47. 47 NBDCヒトデータ 共有ガイドライン データ共有分科会 NBDC 外部の有識者を含む審査機関 NBDCヒトデータ取扱い セキュリティガイドライン 策定・見直し ヒトデータ審査委員会 運営委員会 オープンデータ (利用申請不要) 制限公開データ NBDCヒト データベース提供者 ③データ送付 (メタ情報の提供、再度匿名化必要) ①申請 (インフォームド・コンセントおよび 倫理審査でのデータ共有承認必要) ②承認 ④ID付与 (論文等に利用可能) 利用者 NBDCヒトDB/提供者間の協議内容 ・データの分類(オープンor制限公開) ・データの公開日 ・データ利用時の制限事項、他 申請 (データ利用についての倫理審査必要) 承認 1 2 アクセス3利用状況を報告 (年1回および終了時) 4 NBDCヒトデータベース/データ共有の仕組み セキュリティの確保
  48. 48. 48 LAN内のサーバ上でのみ利用 データのコピーの原則禁止 アクセスできる人の限定・管理 セキュリティに関するチェックリストの提出 + 入室管理 ハイレベル(Type II)セキュリティ NBDCヒトデータベース/制限公開データの保護 標準レベル(Type I)セキュリティ ICにおける制限事項などによる
  49. 49. 49 制限公開データデポジトリ 研究内容の概要 分子データ 提供者情報 関連論文 利用者一覧 オープン 6 制限公開 15
  50. 50. 50 制限公開ヒトデータを扱うデータベース EGAdbGaP = JGA→データの格納 NBDC→データの審査
  51. 51. 51 ヒトデータを扱うデータベースに関する指針等 ヒトゲノム・遺伝子解析研究に関する倫理指針 http://www.lifescience.mext.go.jp/files/pdf/n1115_01.pdf 全てのヒトゲノム・遺伝子解析研究に適用 文部科学省、厚生労働省及び経済産業省 H13年~(H25年全部改正) 人を対象とする医学系研究に関する倫理指針 www.lifescience.mext.go.jp/files/pdf/n1443_01.pdf 文部科学省、厚生労働省 H26年~ 疫学研究に関する倫理指針(H14年~、文部科学省、厚生労働省) 臨床研究に関する倫理指針(H15年~、厚生労働省) “データベースや試料のバンクも倫理審査を受ける必要がある” 個人情報の保護に関する法律 http://law.e-gov.go.jp/htmldata/H15/H15HO057.html 上述の「ゲノム指針」では、匿名化されていれば個人情報ではないと規 定されているが、「ゲノム指針」の上位に位置する法律は本法である。
  52. 52. 52 個人情報保護法の見直しの動き パーソナルデータに関する検討会 http://www.kantei.go.jp/jp/singi/it2/pd/index.html 1.個人情報の定義の拡充 2.適切な規律の下で個人情報等の有用性を確保するための規定の 整備 3.個人情報の保護を強化するための規定の整備 4.個人情報保護委員会の新設及びその権限に関する規定の整備 5.個人情報の取扱いのグローバル化に対応するための規定の整備 を柱とする個人情報保護法の改正案。 検討当初では遺伝情報の扱いについては対象外。最終段階で「要配 慮個人情報」という概念が出されたが、その対象に遺伝情報は入っ ていないとされていた。 ※要配慮個人情報=人種、信条、病歴等、その取り扱いによって本 人が差別、偏見その他の不利益を受けるおそれがあるものを対象 しかし、最近の国会答弁等ではここにゲノムが入りうるという解釈 (→個人情報保護委員会の裁定にゆだねる)も!?
  53. 53. 53 目次 I. データ駆動型科学とデータ共有をめぐる国内 外の状況 II. JST/NBDCとその取り組みについて III.主なサービス(カタログ、一括検索、データの 一括ダウンロード)の紹介 IV. ヒトに関するデータ関連のサービス V. その他のサービス例 VI. おわりに
  54. 54. 54 新着論文レビュー/領域融合レビュー、統合TV 入口
  55. 55. 55 統合TV 概要 • DBやツールの使い方、講演を動画で配信 動画数:860本以上 吹き出しによる日本語の解説 • 好きなときに好きな場所で視聴可能 YouTubeからも視聴可能 • 本日紹介したカタログ・ 横断検索 ・アーカイブの 使い方動画もあります 55 http://togotv.dbcls.jp/ja/
  56. 56. 56 ライフサイエンス新着論文レビュー 概要 http://first.lifesciencedb.jp/ • 日本語による英語論文の解説記事 • Nature, Scienceなどのトップジャーナル掲載記事の 中から第一著者が日本人のものについて、著者本人に よる解説記事 • 公開数:830報以上 • 文章や図の再利用が可能 • CC表示により配布 • 著者、URLなどの クレジットを表示 すること
  57. 57. 57 ライフサイエンス領域融合レビュー 概要 • 学問分野/領域を対象にした日本語のレビュー • 2012年9月に開始 • 分子生物学会、蛋白質科学会、細胞生物学会、 植物生理学会が協力 • 現在46報掲載中 • 文章や図の再利用が可能 • CC表示により配布 • 著者、URLなどの クレジットを表示 すること http://leading.lifesciencedb.jp/
  58. 58. 58 目次 I. データ駆動型科学とデータ共有をめぐる国内 外の状況 II. JST/NBDCとその取り組みについて III.主なサービス(カタログ、一括検索、データの 一括ダウンロード)の紹介 IV. ヒトに関するデータ関連のサービス V. その他のサービス例 VI. おわりに
  59. 59. 59 バイオサイエンスデータベースセンター(NBDC) http://biosciencedbc.jp/ • JSTの中の1つのセンター 2011(平成23年)年4月に設立 • 生命科学分野のDBを使いやすくする! (1)データベース研究開発戦略の立案 (2)データベースの充実 府省間のデータベース統合 基盤技術開発 ファンディングプログラム (分野ごとにデータの統合を進めるため) (3)データの公開 (ポータルサイトや関連サービスも含めて) (4)国際連携 JSTとNBDCのご紹介 2/2 (再掲)
  60. 60. 60 JSTバイオサイエンス データベースセンター 産総研創薬分子プロファイリング 研究センター 農業生物資源研究所 医薬基盤・健康・栄養研究所 文科省 農水省 経産省 厚労省 4省によるDB統合 http://integbio.jp/
  61. 61. 61 世界との連携&国内の連携
  62. 62. 62 データ共有に関する我が国の課題 • データ共有に関する国レベルのルール、ガイドライン欠如 – データ生産者のデータ所有意識 – 研究者へのインセンティブ付与の仕組み • 機微情報のDB化のための国レベルのルール、ガイドライン欠如 – パーソナルゲノム等の共有と保護のバランス – 国外からの利用への対応 – AMEDとの連携 • 人員、予算の圧倒的な不足 – 欧米のDBセンターとの規模とは桁違い – ライフ分野のデータの特殊性、解析の複雑さ – バイオインフォマティクス人材の発掘、養成 • 持続可能な体制、予算の仕組みの構築 – データ量の爆発への対応 – 新たな種類のデータへの対応(フォーマット、オントロジー、品質管理) • 産出データの共有からプロジェクトの立案、実行時への貢献 まだまだ ある
  63. 63. 63 ご清聴ありがとうございました。 NBDCポータルサイト http://biosciencedbc.jp/

×