2014/6/19
第33回統合DBミーティング
Integrated MTG in NIBIO
2014/6/19 1
本日の予定
• Sagace
– アンケート解析結果
– 追加するDBについて
– 新規ファセット分類と項目について
– UI修正について
– 日本国外のDB導入の是非について
– 進捗報告
• 医薬基盤研内のデータのRDF化
– 進捗報告
2
アンケート解析結果
• 下記のユーザーに着目して解析
• Sagaceを知っていた vs 知らない
• リピーター vs 使用0回
3
知っていた vs 知らない
所属
0
5
10
15
20
25
30
研究機関 大学 企業 その他:
知っていた
知らなかった
4
知っていた vs 知らない
分野
0
2
4
6
8
10
12
14
16
18
20
医学系 薬学系 工学系 情報系 理学系 農学系 その他:
知っていた
知らなかった
5
知っていた vs 知らない
WET : DRY
0
2
4
6
8
10
12
14
16
18
20
0 : 10 1 : 9 2 : 8 3 : 7 4 : 6 5 : 5 6 : 4 7 : 3 8 : 2 9 : 1 10 : 0
知っ...
知っていた vs 知らない
生物種
0
5
10
15
20
25
30
知っていた
知らなかった
7
リピーター vs 検索0回
サービスを知った理由
0
2
4
6
8
10
12
リピーター
検索0回
8
今後の宣伝方針
• 特に大学で医学系,実験系の方に
もっと使って頂けるように宣伝す
る。
• 知名度を上げるために,学会等での
宣伝は効果的だが,実際に使っても
らうためには関係者が直接宣伝する
のが効果的。
9
リピーター vs 検索0回
各評価項目の平均値
0
0.5
1
1.5
2
2.5
3
3.5
4
リピーター
リピーター以外
10
リピーター vs 検索0回
考察
• 全般的にリピーターの方が評価が低
い。
• リピーターの傾向
– 平均ではファセットが低い
– 個々のデータでは,速度とファセットは中央
に分布が偏り,精度については評価がわかれ
ている。
11
追加候補のDBについて
ファセット分類/
データベース名
FANTOM5 伝統医薬データベー
ス
データベースの
種類
その他のデータベー
ス
その他のデータベース
生物種 ヒト,動物(ヒト以外) 植物
生体の階層 ゲノム・遺伝子 ゲノム,遺伝...
新規ファセット分類と
その項目について
• データベースの分類に移動,追加
– 生体の階層から移動
• 化合物
• 細胞・組織
– 新規追加
• レギュレーション・ガイドライン
• 研究者
13
データベースの分類に全て追加
すると…
• 研究者 → Pending
• 生物資源
• 細胞・組織
• 化合物
• 特許
• 実験プロトコル
• 文献・用語集・辞書
• レギュレーション・ガイドライン
14
• 分類を生体の階層から医薬品に変更
• 含まれる項目の是非
– 化合物
– 漢方薬
– 薬効・効能
– 副作用・有害情報
– 臨床試験
新規ファセット分類と
その項目について
15
UIの修正について
16
日本国外のデータベース導入の
是非
• 背景
– これまで国内の研究者と国内のデータベース
のマッチングを重視するために,国内DBを検
索対象
– これまで実施したアンケートで度々国外のDB
の追加の希望が寄せられていた。
17
国外DB追加のPros
• ユーザーの要望に応えられる。
• ファセットと上手く組み合わせれば,
国内と国外のDBのエントリ内容を比
較できる。
• メタデータが導入されたDBの内容を
反映できる。
18
国外DB追加のCons
• 現状,NBDCでクローリングしてい
る国外DBは22個のみで,カタログの
網羅性が確保されるまでは増える可
能性は低い。
• 国外DBにおいて,創薬疾患関連の
DBのインデックスは,NIBIOで作成
してその意義を示...
提案
• 方針1
– これまで通り,国内のみ
• 方針2
– 現状,NBDCがインデックスしているDBのう
ち有用そうなもののみ追加をして,様子を見
る。
– 国内と国外で比較したいDBが見つかった場合
にインデックスの作成&追加を検討する。
...
進捗報告
• NBDCと共同で新規検索エンジンの
調査をすることに
– テスト項目の作成
• NBDC生命科学データベース横断検
索のUIが更新(SagaceのUIがベー
ス)
• NCBNカタログデータベースにDB追
加の依頼
21
Schema.orgの進捗
• RDFa, JSON-LDを正式にサポート開始。
• Googleはリッチスニペットを手動でつけ
る場合には,microdata, microformats,
RDFaのみのサポート
• 構造化データマークアップ...
JSON-LD
23
提案
• SagaceのJSON-LDへの対応
• Sagace用,構造化データマークアッ
プ支援ツールの作成
24
実験動物研究資源バンクのRDF化
• MTG @ 疾患モデル小動物研究室
– 普段の研究では,MGI (Mouse Genome
Informatics) で完結する。
– OMIM,OMIAへのリンク,実際に創薬に使用
された例や特許へのリン...
今後の予定
• トーゴーの日
– 10月5日(日)?
• BioHackathon 2014
– 11月9日(日)〜14日(金)
• 分子生物学会
– 11月25日(火)〜27日(木)
26
Upcoming SlideShare
Loading in …5
×

33rd MTG In NIBIO

390 views

Published on

第33回統合DB MTGの発表スライドです。

Published in: Science
  • Be the first to comment

  • Be the first to like this

33rd MTG In NIBIO

  1. 1. 2014/6/19 第33回統合DBミーティング Integrated MTG in NIBIO 2014/6/19 1
  2. 2. 本日の予定 • Sagace – アンケート解析結果 – 追加するDBについて – 新規ファセット分類と項目について – UI修正について – 日本国外のDB導入の是非について – 進捗報告 • 医薬基盤研内のデータのRDF化 – 進捗報告 2
  3. 3. アンケート解析結果 • 下記のユーザーに着目して解析 • Sagaceを知っていた vs 知らない • リピーター vs 使用0回 3
  4. 4. 知っていた vs 知らない 所属 0 5 10 15 20 25 30 研究機関 大学 企業 その他: 知っていた 知らなかった 4
  5. 5. 知っていた vs 知らない 分野 0 2 4 6 8 10 12 14 16 18 20 医学系 薬学系 工学系 情報系 理学系 農学系 その他: 知っていた 知らなかった 5
  6. 6. 知っていた vs 知らない WET : DRY 0 2 4 6 8 10 12 14 16 18 20 0 : 10 1 : 9 2 : 8 3 : 7 4 : 6 5 : 5 6 : 4 7 : 3 8 : 2 9 : 1 10 : 0 知っていた 知らなかった WETDRY 6
  7. 7. 知っていた vs 知らない 生物種 0 5 10 15 20 25 30 知っていた 知らなかった 7
  8. 8. リピーター vs 検索0回 サービスを知った理由 0 2 4 6 8 10 12 リピーター 検索0回 8
  9. 9. 今後の宣伝方針 • 特に大学で医学系,実験系の方に もっと使って頂けるように宣伝す る。 • 知名度を上げるために,学会等での 宣伝は効果的だが,実際に使っても らうためには関係者が直接宣伝する のが効果的。 9
  10. 10. リピーター vs 検索0回 各評価項目の平均値 0 0.5 1 1.5 2 2.5 3 3.5 4 リピーター リピーター以外 10
  11. 11. リピーター vs 検索0回 考察 • 全般的にリピーターの方が評価が低 い。 • リピーターの傾向 – 平均ではファセットが低い – 個々のデータでは,速度とファセットは中央 に分布が偏り,精度については評価がわかれ ている。 11
  12. 12. 追加候補のDBについて ファセット分類/ データベース名 FANTOM5 伝統医薬データベー ス データベースの 種類 その他のデータベー ス その他のデータベース 生物種 ヒト,動物(ヒト以外) 植物 生体の階層 ゲノム・遺伝子 ゲノム,遺伝子, 化合物,個体 分類 B A 12
  13. 13. 新規ファセット分類と その項目について • データベースの分類に移動,追加 – 生体の階層から移動 • 化合物 • 細胞・組織 – 新規追加 • レギュレーション・ガイドライン • 研究者 13
  14. 14. データベースの分類に全て追加 すると… • 研究者 → Pending • 生物資源 • 細胞・組織 • 化合物 • 特許 • 実験プロトコル • 文献・用語集・辞書 • レギュレーション・ガイドライン 14
  15. 15. • 分類を生体の階層から医薬品に変更 • 含まれる項目の是非 – 化合物 – 漢方薬 – 薬効・効能 – 副作用・有害情報 – 臨床試験 新規ファセット分類と その項目について 15
  16. 16. UIの修正について 16
  17. 17. 日本国外のデータベース導入の 是非 • 背景 – これまで国内の研究者と国内のデータベース のマッチングを重視するために,国内DBを検 索対象 – これまで実施したアンケートで度々国外のDB の追加の希望が寄せられていた。 17
  18. 18. 国外DB追加のPros • ユーザーの要望に応えられる。 • ファセットと上手く組み合わせれば, 国内と国外のDBのエントリ内容を比 較できる。 • メタデータが導入されたDBの内容を 反映できる。 18
  19. 19. 国外DB追加のCons • 現状,NBDCでクローリングしてい る国外DBは22個のみで,カタログの 網羅性が確保されるまでは増える可 能性は低い。 • 国外DBにおいて,創薬疾患関連の DBのインデックスは,NIBIOで作成 してその意義を示すことが必要か。 19
  20. 20. 提案 • 方針1 – これまで通り,国内のみ • 方針2 – 現状,NBDCがインデックスしているDBのう ち有用そうなもののみ追加をして,様子を見 る。 – 国内と国外で比較したいDBが見つかった場合 にインデックスの作成&追加を検討する。 20
  21. 21. 進捗報告 • NBDCと共同で新規検索エンジンの 調査をすることに – テスト項目の作成 • NBDC生命科学データベース横断検 索のUIが更新(SagaceのUIがベー ス) • NCBNカタログデータベースにDB追 加の依頼 21
  22. 22. Schema.orgの進捗 • RDFa, JSON-LDを正式にサポート開始。 • Googleはリッチスニペットを手動でつけ る場合には,microdata, microformats, RDFaのみのサポート • 構造化データマークアップ支援ツールで は JSON-LDを使っているらしい。 – https://support.google.com/webmasters/answer/3069 489?hl=ja 22
  23. 23. JSON-LD 23
  24. 24. 提案 • SagaceのJSON-LDへの対応 • Sagace用,構造化データマークアッ プ支援ツールの作成 24
  25. 25. 実験動物研究資源バンクのRDF化 • MTG @ 疾患モデル小動物研究室 – 普段の研究では,MGI (Mouse Genome Informatics) で完結する。 – OMIM,OMIAへのリンク,実際に創薬に使用 された例や特許へのリンクへの需要はありそ う。 – OMIM,MGIとも,SPARQL endpointはある。 • →Endpointがbio2rdfなので,ライセンスの問題が 解決しているか確認が必要 25
  26. 26. 今後の予定 • トーゴーの日 – 10月5日(日)? • BioHackathon 2014 – 11月9日(日)〜14日(金) • 分子生物学会 – 11月25日(火)〜27日(木) 26

×