生命科学分野の横断検索サービス
とメタデータの活用	
医薬基盤研究所 伊藤真和吏
Sagace	
創薬・疾患研究のための生命科学分野の
データベースの横断検索サービス
http://sagace.nibio.go.jp/	

2
h"p://integbio.jp/ja/	
3
Search System	
NIBIO	

NBDC	
  /	
  DBCLS	

AgriTogo	
  

MEDALS	

Collaborate by
using P2P
architecture	

JCGGDB	
  

4
悪性リンパ腫での検索結果
Google 対 Sagace	

5
広告	

一般的な説明
やブログが	
  
ヒット
同義語展開	

悪性リンパ腫での検索結果	
研究関連の信頼	
  
出来るデータベース
からの情報	

7
例:生物資源で動物の
データを調べたい場合	

ファセット分類を	
  
使った効率的な絞り込み	

8
メタデータの活用	
•  メタデータ:データの情報を示したデータ。	

疾患:アルツハイマー病	
生物種:ヒト
最終更新日:2012-10-24
文献:PubMed ID 23110816
関連するエントリ:OMIM 134400	

9
検索結果への反映	
•  ユーザーが何に関するデータなのかを見つけやすく
なり,データベースへのアクセスがされやすくなる。	

10
メタデータを活用した検索結果例	

11
メタデータを活用した検索結果例
横断検索サービスはDBとの
出会いを支援するサービス	
•  ユーザー
–  検索結果を見てそのエントリーが自分が探してい
るものか否かを瞬時に判断可能に。	
  

•  データベース管理者
–  より多くの人にデータベースを発見してもらいや...
どうメタデータを入れるのか?	
•  htmlタグにメタデータを追記するだけ	
<div	
  itemscope=“”	
  itemtype=“h"p://schema.org/BiologicalDatabaseEntry”>	
  
<...
どうメタデータを入れるのか?	
•  htmlタグにメタデータを追記するだけ	
<div	
  itemscope=“”	
  itemtype=“h"p://schema.org/BiologicalDatabaseEntry”>	
  
<...
8つのDBが採用	
•  DoBISCUIT(Database Of BIoSynthesis clusters
CUrated and InTegrated)
•  JCRB細胞バンク
•  Functional Glycomics with...
これまでのBioHackathonにて	
•  Biological Database (Entry)に特化した
Schema.org 用の語彙を策定,宣伝
–  Proposal	
  :	
  h"p://www.w3.org/wiki/W...
HTMLをマークアップするため
の方法	
•  Microdata
–  書き方がシンプル。大手検索エンジンの採用。	
  

•  RDFa
–  マークアップ方法が複雑。書き方がひと通りでは
ない。	
  

•  Microformats...
現状の問題点	
•  提案した語彙をSchema.orgに追加させるに
は,より多くのDBの協力が必要。(by
Schema.org オーガナイザー)
•  Microdataだと(原則)Schema.orgの語彙し
か使えない。
•  Mic...
RDFa Lite	
•  Schema.orgやMicrodataの普及にともない,
W3CがRDFaをかなり単純化させて制定した
形式
–  W3C	
  recommendaon	
  

•  schema.orgの語彙体系を基本としな...
RDFa Liteのマークアップ方法	
<div	
  vocab=“h"p://schema.org/”	
  typeof=“BiologicalDatabaseEntry”>	
  
<span	
  property=“dateModi...
RDFの語彙を使う場合
(検索結果はイメージ)	
<div prefix="PDBo : http://rdf.wwpdb.org/schema/pdbx-v40.owl#">
<span property="PDBo:exptl.method...
Sagaceが検索結果に
反映するプロパティ	
• 
• 
• 
• 
• 
• 
• 
• 

image  (画像)
isEntryOf  (どのデータベース由来か)
entryID (エントリーID)
taxon(生物種)
disease...
•  現在対応しているマークアップ方法について詳しく
はこちら
–  h"p://sagace.nibio.go.jp/press/metadata/markup/ 	
  	
  
•  外部のRDF用の語彙も検索結果への反映を予定
•  複...
大募集	
•  皆さんのデータベースにもぜひマークアップを!
•  ライフサイエンス系のDBであれば,検索結果に
マークアップされたプロパティを反映
–  NBDC横断検索,MEDALS横断検索の検索結果にも
反映予定	
  

•  RDFa...
Upcoming SlideShare
Loading in...5
×

Bh13.13 sagace 1

251

Published on

国内版バイオハッカソン BH13.13 - http://wiki.lifesciencedb.jp/mw/index.php/BH13.13
内で発表した資料(抜粋)です。

Published in: Health & Medicine
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
251
On Slideshare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
1
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Bh13.13 sagace 1

  1. 1. 生命科学分野の横断検索サービス とメタデータの活用 医薬基盤研究所 伊藤真和吏
  2. 2. Sagace 創薬・疾患研究のための生命科学分野の データベースの横断検索サービス http://sagace.nibio.go.jp/ 2
  3. 3. h"p://integbio.jp/ja/ 3
  4. 4. Search System NIBIO NBDC  /  DBCLS AgriTogo   MEDALS Collaborate by using P2P architecture JCGGDB   4
  5. 5. 悪性リンパ腫での検索結果 Google 対 Sagace 5
  6. 6. 広告 一般的な説明 やブログが   ヒット
  7. 7. 同義語展開 悪性リンパ腫での検索結果 研究関連の信頼   出来るデータベース からの情報 7
  8. 8. 例:生物資源で動物の データを調べたい場合 ファセット分類を   使った効率的な絞り込み 8
  9. 9. メタデータの活用 •  メタデータ:データの情報を示したデータ。 疾患:アルツハイマー病 生物種:ヒト 最終更新日:2012-10-24 文献:PubMed ID 23110816 関連するエントリ:OMIM 134400 9
  10. 10. 検索結果への反映 •  ユーザーが何に関するデータなのかを見つけやすく なり,データベースへのアクセスがされやすくなる。 10
  11. 11. メタデータを活用した検索結果例 11
  12. 12. メタデータを活用した検索結果例
  13. 13. 横断検索サービスはDBとの 出会いを支援するサービス •  ユーザー –  検索結果を見てそのエントリーが自分が探してい るものか否かを瞬時に判断可能に。   •  データベース管理者 –  より多くの人にデータベースを発見してもらいや すくなる。アクセス増加に繋がる。   •  横断検索サービス –  クローラーが1つで良い。   13
  14. 14. どうメタデータを入れるのか? •  htmlタグにメタデータを追記するだけ <div  itemscope=“”  itemtype=“h"p://schema.org/BiologicalDatabaseEntry”>   <span  itemprop=“dateModified”>2013-­‐1-­‐24</span>   </div>   ウェブページ 2013-1-24 http://schema.org/BiologicalDatabaseEntry/dateModified 14
  15. 15. どうメタデータを入れるのか? •  htmlタグにメタデータを追記するだけ <div  itemscope=“”  itemtype=“h"p://schema.org/BiologicalDatabaseEntry”>   <span  itemprop=“dateModified”>2013-­‐1-­‐24</span>   </div>   15
  16. 16. 8つのDBが採用 •  DoBISCUIT(Database Of BIoSynthesis clusters CUrated and InTegrated) •  JCRB細胞バンク •  Functional Glycomics with KO mice database •  Glyco-Disease Genes Database •  JCGGDB Report •  MEDALS •  Integbio データベースカタログ •  LSDBアーカイブ 16
  17. 17. これまでのBioHackathonにて •  Biological Database (Entry)に特化した Schema.org 用の語彙を策定,宣伝 –  Proposal  :  h"p://www.w3.org/wiki/WebSchemas/ BioDatabases   –  独自のプロパティを策定   •  entryID,  isEntryOf,  taxon,  seeAlso,  reference   •  Schema.org –  大手検索エンジン(Google,Yahoo!,Bingなど)が共通で使 用することを宣言している横断検索用の語彙体系   •  Microdata –  htmlにメタデータを付与するための方法。Schema.orgの 語彙を使用してマークアップをする。 17
  18. 18. HTMLをマークアップするため の方法 •  Microdata –  書き方がシンプル。大手検索エンジンの採用。   •  RDFa –  マークアップ方法が複雑。書き方がひと通りでは ない。   •  Microformats –  書き方はシンプルだが,マークアップ定義が曖昧 で機械的処理がしにくい。   18
  19. 19. 現状の問題点 •  提案した語彙をSchema.orgに追加させるに は,より多くのDBの協力が必要。(by Schema.org オーガナイザー) •  Microdataだと(原則)Schema.orgの語彙し か使えない。 •  MicrodataはW3C Working Groupであり Recommendationではない。 19
  20. 20. RDFa Lite •  Schema.orgやMicrodataの普及にともない, W3CがRDFaをかなり単純化させて制定した 形式 –  W3C  recommendaon   •  schema.orgの語彙体系を基本としながら, 外部のRDFの語彙も柔軟に適用可能。 •  マークアップが簡単 20
  21. 21. RDFa Liteのマークアップ方法 <div  vocab=“h"p://schema.org/”  typeof=“BiologicalDatabaseEntry”>   <span  property=“dateModified”>2013-­‐1-­‐24</span>   </div>   21
  22. 22. RDFの語彙を使う場合 (検索結果はイメージ) <div prefix="PDBo : http://rdf.wwpdb.org/schema/pdbx-v40.owl#"> <span property="PDBo:exptl.method">X-RAY DIFFRACTION</span> </div> 22
  23. 23. Sagaceが検索結果に 反映するプロパティ •  •  •  •  •  •  •  •  image  (画像) isEntryOf  (どのデータベース由来か) entryID (エントリーID) taxon(生物種) disease (疾患名) seeAlso (他の参考となるデータベースのエントリ) dateModified (最終更新日) reference (文献) 23
  24. 24. •  現在対応しているマークアップ方法について詳しく はこちら –  h"p://sagace.nibio.go.jp/press/metadata/markup/     •  外部のRDF用の語彙も検索結果への反映を予定 •  複数の語彙でのマークアップにおいて混乱がないよ うに,検索結果に反映させる語彙とプロパティは Sagaceのページに掲載予定。 24
  25. 25. 大募集 •  皆さんのデータベースにもぜひマークアップを! •  ライフサイエンス系のDBであれば,検索結果に マークアップされたプロパティを反映 –  NBDC横断検索,MEDALS横断検索の検索結果にも 反映予定   •  RDFa Liteの活用方法についても相談したいで す! •  マークアップされたデータベースが増えれば,大手の検索エンジンにも反映され るかも... 25
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×