第28回統合DBミーティング
Integrated MTG in NIBIO	

2014/1/23
本日の予定
•  Sagace
‒ 
‒ 
‒ 
‒ 

アクセス解析
進捗報告
Sagaceに追加するDBについて
アンケート項目について

・医薬基盤研内のデータのRDF化
‒  進捗報告

•  今後の予定 

2
アクセス解析(12月)

3
Sagaceに追加するDBについて
ファセット分類/
データベース名	

NBDCヒトデータベース	

データベースの種類	

その他のデータベース	

生物種	

ヒト	

生体の階層	

ゲノム・遺伝子,個体	

分類	

B	

4
進捗報告(近況)
•  JAPICから使用許可
‒  添付文書検索
‒  臨床試験情報検索

•  山中さんに基盤研のトップページに
Sagaceのリンクを貼って頂く
•  BRC 細胞 リソースからメタデータ
の取り出しを交渉(OWLからのデ...
進捗報告(開発版)
•  DBを固定して検索する機能の追加

6
進捗報告
•  MEDALS(DB)にmicrodataが導入
‒  論文のポップアップに対応
•  http://sagace.nibio.go.jp/cgi-bin/
sagace/search.cgi?
action=search&key...
進捗報告
•  Apache Solrについて
‒  Sagaceで実装している機能は実装可能
‒  分散検索(サーバーの分散した場合の検索)
‒  データベース毎の結果表記(件数の表記)も
可能
‒  全体的に速度も速い印象
‒  NBDCと...
アンケートの実施について
•  昨年度と同様にウェブ上でのアン
ケートを実施予定
•  2月,3月開始。
•  対象者:創薬・疾患研究に関わる方。
•  人数:100人程度
•  目的:Sagaceの機能改善(別紙参
照)
9
医薬基盤研内のデータのRDF化
•  実験動物研究資源バンク
‒  RDF化開始
‒  8割程度は理研の動物バンクのデータと類似
‒  purl(Persistent Uniform Resource Locator)
を多用しているため,書き...
参考
•  理研で公開している
 RDF形式のデータの
 利用方法
•  biolod.orgにアクセス
•  Mouse Strainをクリック

11
参考
•  http://ja.biolod.org/class/
cria315s1i/Mouse_Strain

•  ページ下部のDownload
LOD filesから使用する形式
のファイルをダウンロード
•  ここでは,
semant...
もとのウェブサイト上の情報
(例:RBRC01389)

13
Turtle形式のファイルの中身
•  ページ上部
•  prefixで使用している語の定義
@prefix BioLOD_property_pria315s15i: <http://purl.jp/bio/13/property/pria315...
Turtle形式のファイルの中身
(例:RBRC01389)

<http://purl.jp/bio/13/RBRC01389/cria315s1ria315u100000001389i>
rdf:type BioLOD_class_cria...
RDF化をしていく上での問題点
•  (前提:RDFの要素はURLを持っていたほうが良い。)
•  NIBIOのデータのSubjectをどうすべきか。NIBIOのみで
使用しているpredicateに該当する情報はどう表記すべき
か。
‒  独...
参考: purlのメリット
•  こちらでurlの設計を悩む必要が無い。
•  RDF内のurlが変更されても,参照の
purlを変更してしまえば,RDFを変
更する必要がない。
•  NBDCが進めている4省連携に協力し
ていることが示せる。...
参考: purlのデメリット
•  URIの設計を柔軟にできない。
•  参照箇所増加に寄る処理速度の低下
の懸念
•  文科省系の機関に管理を任せるとい
うことが厚労省系のデータとしてど
うなのか。

18
今後の予定
•  1月,2月
‒  実験動物バンクのRDF化
‒  外部データベースとの連携
‒  BioHackathon 国内版(1月27日∼31日)
‒  アンケートの実施と集計
次回
•  2月21日(金)or 28日(金)?
•  予定
‒  実験動物研究資源バンクのRDF化の進捗
‒  BioHackathon 国内版の報告

20
Upcoming SlideShare
Loading in...5
×

28th mtg

722
-1

Published on

第28回統合DBミーティングの内容を共有します。
(なお,プライバシーの観点から一部発表資料を削除しています。)

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
722
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
1
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

28th mtg

  1. 1. 第28回統合DBミーティング Integrated MTG in NIBIO 2014/1/23
  2. 2. 本日の予定 •  Sagace ‒  ‒  ‒  ‒  アクセス解析 進捗報告 Sagaceに追加するDBについて アンケート項目について ・医薬基盤研内のデータのRDF化 ‒  進捗報告 •  今後の予定  2
  3. 3. アクセス解析(12月) 3
  4. 4. Sagaceに追加するDBについて ファセット分類/ データベース名 NBDCヒトデータベース データベースの種類 その他のデータベース 生物種 ヒト 生体の階層 ゲノム・遺伝子,個体 分類 B 4
  5. 5. 進捗報告(近況) •  JAPICから使用許可 ‒  添付文書検索 ‒  臨床試験情報検索 •  山中さんに基盤研のトップページに Sagaceのリンクを貼って頂く •  BRC 細胞 リソースからメタデータ の取り出しを交渉(OWLからのデー タの取り出し) 5
  6. 6. 進捗報告(開発版) •  DBを固定して検索する機能の追加 6
  7. 7. 進捗報告 •  MEDALS(DB)にmicrodataが導入 ‒  論文のポップアップに対応 •  http://sagace.nibio.go.jp/cgi-bin/ sagace/search.cgi? action=search&keyword=forte 7
  8. 8. 進捗報告 •  Apache Solrについて ‒  Sagaceで実装している機能は実装可能 ‒  分散検索(サーバーの分散した場合の検索) ‒  データベース毎の結果表記(件数の表記)も 可能 ‒  全体的に速度も速い印象 ‒  NBDCと協力して数個のデータベースでの横 断検索サービスのテストの提案をしたらどう か。 8
  9. 9. アンケートの実施について •  昨年度と同様にウェブ上でのアン ケートを実施予定 •  2月,3月開始。 •  対象者:創薬・疾患研究に関わる方。 •  人数:100人程度 •  目的:Sagaceの機能改善(別紙参 照) 9
  10. 10. 医薬基盤研内のデータのRDF化 •  実験動物研究資源バンク ‒  RDF化開始 ‒  8割程度は理研の動物バンクのデータと類似 ‒  purl(Persistent Uniform Resource Locator) を多用しているため,書き方などについて BH13.13で理研桝屋さんと相談することに。 •  purl.jpはNBDCが中心となってURL設計を行ってい る。http://bit.ly/1ecGCUk •  NBDCが進めるDB統合推進事業に該当するプ  ロジェクトはドメイン/bio/以下のURIを使用 •  cf.http://purl.jp/bio/グループ番号/識別番号・記号 10
  11. 11. 参考 •  理研で公開している  RDF形式のデータの  利用方法 •  biolod.orgにアクセス •  Mouse Strainをクリック 11
  12. 12. 参考 •  http://ja.biolod.org/class/ cria315s1i/Mouse_Strain •  ページ下部のDownload LOD filesから使用する形式 のファイルをダウンロード •  ここでは, semantic_web.ttl.txtを選択 12
  13. 13. もとのウェブサイト上の情報 (例:RBRC01389) 13
  14. 14. Turtle形式のファイルの中身 •  ページ上部 •  prefixで使用している語の定義 @prefix BioLOD_property_pria315s15i: <http://purl.jp/bio/13/property/pria315s15i/> . @prefix BioLOD_class_crib158s72i: <http://purl.jp/bio/13/class/crib158s72i/> . @prefix BioLOD_property_pria315s6i: <http://purl.jp/bio/13/property/pria315s6i/> . @prefix BioLOD_class_crib139u1i: <http://purl.jp/bio/13/class/crib139u1i/> . @prefix BioLOD_class_crib23s57i: <http://purl.jp/bio/13/class/crib23s57i/> . @prefix BioLOD_class_cria111s1i: <http://purl.jp/bio/13/class/cria111s1i/> . ・・・・・ 14
  15. 15. Turtle形式のファイルの中身 (例:RBRC01389) <http://purl.jp/bio/13/RBRC01389/cria315s1ria315u100000001389i> rdf:type BioLOD_class_cria315s1i:Mouse_Strain ; タイプ rdfs:label "Human AhR knock in mouse"@en ; ラベル もとのURL cc:attributionURL <http://www2.brc.riken.jp/lab/animal/detail.php?brc_no=RBRC01389 BioLOD_property_pria315s13i:taxon 生物種 <http://purl.jp/bio/13/10090/crib166u26rib166u10090i> ; ID BioLOD_property_pria315s14i:BRC_ID "RBRC01389"@en ; 保管者 BioLOD_property_pria315s15i:Depositor "Masayuki YAMAMOTO"@en ; 保管所 BioLOD_property_pria315s16i:Institute_Depositor <http://purl.jp/bio/13/Univ._Tsukuba/crio2046s1rio2046u615i> ; BioLOD_property_pria315s18i:Japanese_description 説明 "human AhR がノックインされたマウス"@en ; 系統 BioLOD_property_pria315s3i:BRC_Strain_Type <http://purl.jp/bio/13/Targeted_Knock-in/cria314s1ria314s15i> . 15
  16. 16. RDF化をしていく上での問題点 •  (前提:RDFの要素はURLを持っていたほうが良い。) •  NIBIOのデータのSubjectをどうすべきか。NIBIOのみで 使用しているpredicateに該当する情報はどう表記すべき か。 ‒  独自のURL or purl •  predicateやobjectに理研で使用しているURLが該当し ない場合にはどうするのか。 ‒  機関名や実験動物の提供までの時間については,理研に条件を追 加してもらうほうが素直 •  公開方法,データの共有方法 16
  17. 17. 参考: purlのメリット •  こちらでurlの設計を悩む必要が無い。 •  RDF内のurlが変更されても,参照の purlを変更してしまえば,RDFを変 更する必要がない。 •  NBDCが進めている4省連携に協力し ていることが示せる。 17
  18. 18. 参考: purlのデメリット •  URIの設計を柔軟にできない。 •  参照箇所増加に寄る処理速度の低下 の懸念 •  文科省系の機関に管理を任せるとい うことが厚労省系のデータとしてど うなのか。 18
  19. 19. 今後の予定 •  1月,2月 ‒  実験動物バンクのRDF化 ‒  外部データベースとの連携 ‒  BioHackathon 国内版(1月27日∼31日) ‒  アンケートの実施と集計
  20. 20. 次回 •  2月21日(金)or 28日(金)? •  予定 ‒  実験動物研究資源バンクのRDF化の進捗 ‒  BioHackathon 国内版の報告 20
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×