SlideShare a Scribd company logo
1 of 14
2014/9/30 
第36回統合DBミーティング 
Integrated MTG in NIBIO 
1
本日の予定 
• Sagace 
– アクセス解析 
– 新規ファセット項目に加えるDBの是非について 
– 進捗報告 
• 医薬基盤研内のデータのRDF化 
– 難病研究資源バンクのデータのRDF化について 
– これまでRDF化したデータの疾患別傾向について 
– 外部DBを繋げた検索について 
2
新規ファセット項目に加える 
DBの是非について 
• メンバーの皆さんに調査結果をご報 
告頂きます。 
– 担当したファセット分類の検索結果の印象 
– 各データベースの掲載の是非(特に非のもの 
について,その理由) 
– その他気がついた点についての報告 
3
医薬基盤研内のデータのRDF化 
• 進捗報告 
– 難病研究資源バンクのデータをRDF化 
– 難病研究資源バンク,実験動物研究資源バン 
ク,希少疾病用医薬品にICD10を付与 
– BioPortalのRay FergersonさんからICD10のttl 
を入手 
– DB毎にどの疾患が多いのか検索 
– OMIMと統合して外部のデータを得る 
4
難病研究資源バンクのRDF化 
@prefix Medical_condition: <http://schema.org/MedicalCondition/> . 
@prefix b2rv: <http://bio2rdf.org/bio2rdf_vocabulary:> . 
@prefix BioLOD_property_pria315s16i: 
<http://purl.jp/bio/13/property/pria315s16i/> . 
@prefix dbowl: <http://dbpedia.org/ontology/> . 
@prefix NIBIO_raredis: <http://www.nibio.go.jp/rarediseaseVocabulary#> . 
<http://raredis.nibio.go.jp/bioSample#27> 
b2rv:namespace "rareDisease" ; 
dbowl:icd10 "D44.1" ; 
BioLOD_property_pria315s16i:Institute_Depositor 
"京都医療センター"@ja ; 
Medical_condition:name "非機能性副腎腫瘍"@ja , "Nonfunctioning 
adrenal tumor" ; 
NIBIO_raredis:ID "0311" ; 
NIBIO_raredis:bioSample "Plasma" . 
5
難病研究資源バンクのRDF化 
• 今後の予定 
– NIBIO_raredis:bioSample "Plasma" . 
– 上記について適切なpredicate,objectのURIが見つかれ 
ば置き換えを検討する。 
– データ構成,データの増大に合わせてRDFデータも 
作り変えていく。 
– 今回は,ウェブページから表を取り出して作成 
– 将来的にはウェブページにマークアップ,クロー 
ラーが同時にRDF作成が現実的? 
6
ICD10の付与 
例:希少疾病用医薬品の場合 
以下の様なRDFをトリプルストアに入れると,既存のグラフ(下記ならば 
<http://www.nibio.go.jp/orphanDrugTarget#7>と統合してくれる。) 
@prefix dbowl: <http://dbpedia.org/ontology/> . 
@prefix Medical_condition: <http://schema.org/MedicalCondition/> . 
<http://www.nibio.go.jp/orphanDrugTarget#7> 
Medical_condition:name "動脈管開存症"@ja; 
dbowl:icd10 "Q25.0". 
7
BioPortal由来の 
ICD10のttlファイル 
@prefix skos: <http://www.w3.org/2004/02/skos/core#> . 
@prefix owl: <http://www.w3.org/2002/07/owl#> . 
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . 
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> . 
@prefix umls: <http://bioportal.bioontology.org/ontologies/umls/> . 
<http://purl.bioontology.org/ontology/ICD10/S66.9> 
a owl:Class ; 
skos:prefLabel """Injury of unspecified muscle and tendon at wrist and hand level"""@en ; 
skos:notation """S66.9"""^^xsd:string ; 
rdfs:subClassOf <http://purl.bioontology.org/ontology/ICD10/S66> ; 
umls:cui """C0478316"""^^xsd:string ; 
umls:tui """T037"""^^xsd:string ; 
umls:hasSTY <http://purl.bioontology.org/ontology/STY/T037> ; 
8
検索例 
1つの疾患IDに幾つのデータが紐づくかデータベース毎に出力 
prefix skos: <http://www.w3.org/2004/02/skos/core#> 
prefix dbowl: <http://dbpedia.org/ontology/> 
prefix b2rv: <http://bio2rdf.org/bio2rdf_vocabulary:> 
select ?id ?name ?namespace (count(*) as ?count) 
where 
{ 
?s skos:prefLabel ?name; 
skos:notation ?id. 
?nibio_db dbowl:icd10 ?id; 
b2rv:namespace ?namespace. 
} 
GROUP BY ?id ?name ?namespace 
ORDER BY ?id 
9
検索結果 
10
OMIMとの統合 
ICD10をキーとしてOMIMのIDや疾患名,遺伝子名を出力 
prefix dbowl: <http://dbpedia.org/ontology/> 
prefix b2rv: <http://bio2rdf.org/bio2rdf_vocabulary:> 
prefix b2ro: <http://bio2rdf.org/omim_vocabulary:> 
PREFIX dcterms: <http://purl.org/dc/terms/> 
select ?nibio_url ?icd10 ?omim_id ?title ?gene_name 
where 
{ 
?nibio_url dbowl:icd10 ?id. 
BIND (xsd:string(?id) as ?icd10) 
SERVICE<http://omim.bio2rdf.org/sparql>{ 
?s b2ro:x-icd10 ?o; 
b2rv:identifier ?omim_id; 
dcterms:title ?title; 
b2ro:gene-name ?gene_name. 
?o b2rv:identifier ?icd10. 
} 
} 
11
検索結果 
12
医薬基盤研内のデータのRDF化 
• 外部DBを繋げた検索について 
– 特許のSPARQL Endpointは情報が不足している。 
– Clinical Trialsは現状データを繋ぐとっかかりとな 
るIDがない。 
– 実験動物研究資源バンクのデータとMGIのデータ 
の統合 
• 系統名,遺伝子名ともにマッチするものが少ない。 
• OMIM経由で繋ごうとしたが,一致するIDを見つけら 
れず 
– 複数のSPARQL Endpointを経由した検索は現状 
では難しい(調査継続) 
13
今後の予定 
• 次回 
– 10月24日(金) 
• トーゴーの日 
– 10月5日(日)? 
• BioHackathon 2014 
– 11月9日(日)〜14日(金) 
• 分子生物学会 
– 11月25日(火)〜27日(木) 
14

More Related Content

What's hot

101209文献検索の方法
101209文献検索の方法101209文献検索の方法
101209文献検索の方法Yuko Matsumura
 
DDBJ Nucleotide Sequence Submission System の紹介
DDBJ Nucleotide Sequence Submission System の紹介DDBJ Nucleotide Sequence Submission System の紹介
DDBJ Nucleotide Sequence Submission System の紹介DNA Data Bank of Japan center
 
[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...
[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...
[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...DNA Data Bank of Japan center
 
Bh13.13 sagace 1
Bh13.13 sagace 1Bh13.13 sagace 1
Bh13.13 sagace 1Maori Ito
 
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」Hidemasa Bono
 
wikidataへの化合物idの追加
wikidataへの化合物idの追加wikidataへの化合物idの追加
wikidataへの化合物idの追加Kozo Nishida
 
37th mtg in NIBIO
37th mtg in NIBIO37th mtg in NIBIO
37th mtg in NIBIOMaori Ito
 

What's hot (8)

24th mtg 1
24th mtg 124th mtg 1
24th mtg 1
 
101209文献検索の方法
101209文献検索の方法101209文献検索の方法
101209文献検索の方法
 
DDBJ Nucleotide Sequence Submission System の紹介
DDBJ Nucleotide Sequence Submission System の紹介DDBJ Nucleotide Sequence Submission System の紹介
DDBJ Nucleotide Sequence Submission System の紹介
 
[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...
[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...
[DDBJing29]DDBJ Nucleotide Sequence Submission System の紹介(第29回 DDBJing 講習会 in...
 
Bh13.13 sagace 1
Bh13.13 sagace 1Bh13.13 sagace 1
Bh13.13 sagace 1
 
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
 
wikidataへの化合物idの追加
wikidataへの化合物idの追加wikidataへの化合物idの追加
wikidataへの化合物idの追加
 
37th mtg in NIBIO
37th mtg in NIBIO37th mtg in NIBIO
37th mtg in NIBIO
 

Viewers also liked

Michalena McCann power point
Michalena McCann power pointMichalena McCann power point
Michalena McCann power pointMichalena McCann
 
Overload Distinctions & Insights
Overload Distinctions & InsightsOverload Distinctions & Insights
Overload Distinctions & InsightsOverload Worldwide
 
Making a Deal: Unlocking Potential In Communities
Making a Deal: Unlocking Potential In CommunitiesMaking a Deal: Unlocking Potential In Communities
Making a Deal: Unlocking Potential In CommunitiesPaul Taylor
 
LinkedIn Presentation to BUA Network South East Ireland
LinkedIn Presentation to BUA Network South East IrelandLinkedIn Presentation to BUA Network South East Ireland
LinkedIn Presentation to BUA Network South East IrelandDenis
 
Esdipitchstartupvillage 130530064724-phpapp01
Esdipitchstartupvillage 130530064724-phpapp01Esdipitchstartupvillage 130530064724-phpapp01
Esdipitchstartupvillage 130530064724-phpapp01AnnaStrizhkina
 
Social media, sousveillance and civil unrest in the United Kingdom
Social media, sousveillance and civil unrest in the United KingdomSocial media, sousveillance and civil unrest in the United Kingdom
Social media, sousveillance and civil unrest in the United KingdomPaul Reilly
 
Autoriõigus, litsentsid ja avatud sisu
Autoriõigus, litsentsid ja avatud sisuAutoriõigus, litsentsid ja avatud sisu
Autoriõigus, litsentsid ja avatud sisuHans Põldoja
 
To boldly go.... into the archive by Adele Martin-Bowell and Rebekah Taylor, ...
To boldly go.... into the archive by Adele Martin-Bowell and Rebekah Taylor, ...To boldly go.... into the archive by Adele Martin-Bowell and Rebekah Taylor, ...
To boldly go.... into the archive by Adele Martin-Bowell and Rebekah Taylor, ...CILIP ARLG
 
Connected Cars: Assessing the Impact
Connected Cars: Assessing the Impact Connected Cars: Assessing the Impact
Connected Cars: Assessing the Impact Tavleen Mehendiratta
 
Sess12 3 abong g. & kabira j.– diversity and characteristics of potato flakes...
Sess12 3 abong g. & kabira j.– diversity and characteristics of potato flakes...Sess12 3 abong g. & kabira j.– diversity and characteristics of potato flakes...
Sess12 3 abong g. & kabira j.– diversity and characteristics of potato flakes...African Potato Association (APA)
 
A Compilation of all Astrological Info!
A Compilation of all Astrological Info!A Compilation of all Astrological Info!
A Compilation of all Astrological Info!frodo2222
 
104.09.09 1-德國農莊-顧客行為分析-創造顧客價值與創造消費者需求-詹翔霖教授
104.09.09 1-德國農莊-顧客行為分析-創造顧客價值與創造消費者需求-詹翔霖教授104.09.09 1-德國農莊-顧客行為分析-創造顧客價值與創造消費者需求-詹翔霖教授
104.09.09 1-德國農莊-顧客行為分析-創造顧客價值與創造消費者需求-詹翔霖教授文化大學
 

Viewers also liked (19)

disnaa
disnaadisnaa
disnaa
 
Michalena McCann power point
Michalena McCann power pointMichalena McCann power point
Michalena McCann power point
 
Overload Distinctions & Insights
Overload Distinctions & InsightsOverload Distinctions & Insights
Overload Distinctions & Insights
 
Making a Deal: Unlocking Potential In Communities
Making a Deal: Unlocking Potential In CommunitiesMaking a Deal: Unlocking Potential In Communities
Making a Deal: Unlocking Potential In Communities
 
LinkedIn Presentation to BUA Network South East Ireland
LinkedIn Presentation to BUA Network South East IrelandLinkedIn Presentation to BUA Network South East Ireland
LinkedIn Presentation to BUA Network South East Ireland
 
Postgres Open Keynote: The Next 25 Years
Postgres Open Keynote: The Next 25 YearsPostgres Open Keynote: The Next 25 Years
Postgres Open Keynote: The Next 25 Years
 
Paper based surveys
Paper based surveys Paper based surveys
Paper based surveys
 
Esdipitchstartupvillage 130530064724-phpapp01
Esdipitchstartupvillage 130530064724-phpapp01Esdipitchstartupvillage 130530064724-phpapp01
Esdipitchstartupvillage 130530064724-phpapp01
 
Social media, sousveillance and civil unrest in the United Kingdom
Social media, sousveillance and civil unrest in the United KingdomSocial media, sousveillance and civil unrest in the United Kingdom
Social media, sousveillance and civil unrest in the United Kingdom
 
Autoriõigus, litsentsid ja avatud sisu
Autoriõigus, litsentsid ja avatud sisuAutoriõigus, litsentsid ja avatud sisu
Autoriõigus, litsentsid ja avatud sisu
 
Kpi example
Kpi exampleKpi example
Kpi example
 
To boldly go.... into the archive by Adele Martin-Bowell and Rebekah Taylor, ...
To boldly go.... into the archive by Adele Martin-Bowell and Rebekah Taylor, ...To boldly go.... into the archive by Adele Martin-Bowell and Rebekah Taylor, ...
To boldly go.... into the archive by Adele Martin-Bowell and Rebekah Taylor, ...
 
Connected Cars: Assessing the Impact
Connected Cars: Assessing the Impact Connected Cars: Assessing the Impact
Connected Cars: Assessing the Impact
 
Sess12 3 abong g. & kabira j.– diversity and characteristics of potato flakes...
Sess12 3 abong g. & kabira j.– diversity and characteristics of potato flakes...Sess12 3 abong g. & kabira j.– diversity and characteristics of potato flakes...
Sess12 3 abong g. & kabira j.– diversity and characteristics of potato flakes...
 
A Compilation of all Astrological Info!
A Compilation of all Astrological Info!A Compilation of all Astrological Info!
A Compilation of all Astrological Info!
 
Remedies
RemediesRemedies
Remedies
 
104.09.09 1-德國農莊-顧客行為分析-創造顧客價值與創造消費者需求-詹翔霖教授
104.09.09 1-德國農莊-顧客行為分析-創造顧客價值與創造消費者需求-詹翔霖教授104.09.09 1-德國農莊-顧客行為分析-創造顧客價值與創造消費者需求-詹翔霖教授
104.09.09 1-德國農莊-顧客行為分析-創造顧客價值與創造消費者需求-詹翔霖教授
 
D.SCBL-NEW
D.SCBL-NEWD.SCBL-NEW
D.SCBL-NEW
 
CBI-dagen Sören
CBI-dagen SörenCBI-dagen Sören
CBI-dagen Sören
 

Similar to 36th mtg in NIBIO

ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状Takeru Nakazato
 
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続きSayuri Shimizu
 
フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料Amelieff
 
34th mtg in NIBIO
34th mtg in NIBIO34th mtg in NIBIO
34th mtg in NIBIOMaori Ito
 
Cross search and_semantic_web_mbsj2013
Cross search and_semantic_web_mbsj2013Cross search and_semantic_web_mbsj2013
Cross search and_semantic_web_mbsj2013Maori Ito
 
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料Amelieff
 
[2016-07-06] DDBJデータ解析チャレンジ概要
[2016-07-06] DDBJデータ解析チャレンジ概要[2016-07-06] DDBJデータ解析チャレンジ概要
[2016-07-06] DDBJデータ解析チャレンジ概要Eli Kaminuma
 
DDBJing on 20140612 by Hidemasa Bono
DDBJing on 20140612 by Hidemasa BonoDDBJing on 20140612 by Hidemasa Bono
DDBJing on 20140612 by Hidemasa BonoHidemasa Bono
 
39th MTG in NIBIO
39th MTG in NIBIO39th MTG in NIBIO
39th MTG in NIBIOMaori Ito
 
38th MTG in NIBIO
38th MTG in NIBIO38th MTG in NIBIO
38th MTG in NIBIOMaori Ito
 
35th mtg in NIBIO
35th mtg in NIBIO35th mtg in NIBIO
35th mtg in NIBIOMaori Ito
 
生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"
生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"
生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"arosawa
 
141122 sci data-japan_nov2014
141122 sci data-japan_nov2014141122 sci data-japan_nov2014
141122 sci data-japan_nov2014Hideya Kawaji
 
科研費分野-トピック分類マトリックスへの主成分分析の適用
科研費分野-トピック分類マトリックスへの主成分分析の適用科研費分野-トピック分類マトリックスへの主成分分析の適用
科研費分野-トピック分類マトリックスへの主成分分析の適用National Institute of Informatics
 
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜National Institute of Informatics (NII)
 
データベース研究の報告
データベース研究の報告データベース研究の報告
データベース研究の報告Yasuyuki Okumura
 

Similar to 36th mtg in NIBIO (20)

ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状
 
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
 
フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料
 
34th mtg in NIBIO
34th mtg in NIBIO34th mtg in NIBIO
34th mtg in NIBIO
 
27th mtg 1
27th mtg 127th mtg 1
27th mtg 1
 
Cross search and_semantic_web_mbsj2013
Cross search and_semantic_web_mbsj2013Cross search and_semantic_web_mbsj2013
Cross search and_semantic_web_mbsj2013
 
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
 
[2016-07-06] DDBJデータ解析チャレンジ概要
[2016-07-06] DDBJデータ解析チャレンジ概要[2016-07-06] DDBJデータ解析チャレンジ概要
[2016-07-06] DDBJデータ解析チャレンジ概要
 
DDBJing on 20140612 by Hidemasa Bono
DDBJing on 20140612 by Hidemasa BonoDDBJing on 20140612 by Hidemasa Bono
DDBJing on 20140612 by Hidemasa Bono
 
39th MTG in NIBIO
39th MTG in NIBIO39th MTG in NIBIO
39th MTG in NIBIO
 
データ共有基盤の構築に向けて
データ共有基盤の構築に向けてデータ共有基盤の構築に向けて
データ共有基盤の構築に向けて
 
38th MTG in NIBIO
38th MTG in NIBIO38th MTG in NIBIO
38th MTG in NIBIO
 
20151028koyama
20151028koyama20151028koyama
20151028koyama
 
35th mtg in NIBIO
35th mtg in NIBIO35th mtg in NIBIO
35th mtg in NIBIO
 
生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"
生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"
生物多様性情報の標準データフォーマットDarwin Core Archiveと生態学データに適合させる拡張形式"Sample-based Data"
 
141122 sci data-japan_nov2014
141122 sci data-japan_nov2014141122 sci data-japan_nov2014
141122 sci data-japan_nov2014
 
科研費分野-トピック分類マトリックスへの主成分分析の適用
科研費分野-トピック分類マトリックスへの主成分分析の適用科研費分野-トピック分類マトリックスへの主成分分析の適用
科研費分野-トピック分類マトリックスへの主成分分析の適用
 
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
 
20190320_data journal
20190320_data journal20190320_data journal
20190320_data journal
 
データベース研究の報告
データベース研究の報告データベース研究の報告
データベース研究の報告
 

More from Maori Ito

Test slide for the lab - Target prioritization
Test slide for the lab - Target prioritization Test slide for the lab - Target prioritization
Test slide for the lab - Target prioritization Maori Ito
 
Test for lab_j Psiver j
Test for lab_j Psiver jTest for lab_j Psiver j
Test for lab_j Psiver jMaori Ito
 
33rd MTG In NIBIO
33rd MTG In NIBIO33rd MTG In NIBIO
33rd MTG In NIBIOMaori Ito
 
32nd MTG in NIBIO
32nd MTG in NIBIO32nd MTG in NIBIO
32nd MTG in NIBIOMaori Ito
 
30th Integrated DB MTG in NIBIO
30th Integrated DB MTG in NIBIO30th Integrated DB MTG in NIBIO
30th Integrated DB MTG in NIBIOMaori Ito
 
29th Integrated DB MTG in NIBIO
29th Integrated DB MTG in NIBIO29th Integrated DB MTG in NIBIO
29th Integrated DB MTG in NIBIOMaori Ito
 
Presentation forpd bj_1
Presentation forpd bj_1Presentation forpd bj_1
Presentation forpd bj_1Maori Ito
 
The Progress on Sagace and Data Integration
The Progress on Sagace and Data IntegrationThe Progress on Sagace and Data Integration
The Progress on Sagace and Data IntegrationMaori Ito
 
Schema.org extension for biological database @ Biohackathon2013
Schema.org extension for biological database @ Biohackathon2013Schema.org extension for biological database @ Biohackathon2013
Schema.org extension for biological database @ Biohackathon2013Maori Ito
 
Life Science Database Cross Search and Metadata
Life Science Database Cross Search and MetadataLife Science Database Cross Search and Metadata
Life Science Database Cross Search and MetadataMaori Ito
 
Cell salon vol5
Cell salon vol5Cell salon vol5
Cell salon vol5Maori Ito
 
Cell salon vol5
Cell salon vol5Cell salon vol5
Cell salon vol5Maori Ito
 

More from Maori Ito (15)

Test slide for the lab - Target prioritization
Test slide for the lab - Target prioritization Test slide for the lab - Target prioritization
Test slide for the lab - Target prioritization
 
Test for lab_j Psiver j
Test for lab_j Psiver jTest for lab_j Psiver j
Test for lab_j Psiver j
 
Psiver j
Psiver jPsiver j
Psiver j
 
33rd MTG In NIBIO
33rd MTG In NIBIO33rd MTG In NIBIO
33rd MTG In NIBIO
 
32nd MTG in NIBIO
32nd MTG in NIBIO32nd MTG in NIBIO
32nd MTG in NIBIO
 
30th Integrated DB MTG in NIBIO
30th Integrated DB MTG in NIBIO30th Integrated DB MTG in NIBIO
30th Integrated DB MTG in NIBIO
 
29th Integrated DB MTG in NIBIO
29th Integrated DB MTG in NIBIO29th Integrated DB MTG in NIBIO
29th Integrated DB MTG in NIBIO
 
Presentation forpd bj_1
Presentation forpd bj_1Presentation forpd bj_1
Presentation forpd bj_1
 
The Progress on Sagace and Data Integration
The Progress on Sagace and Data IntegrationThe Progress on Sagace and Data Integration
The Progress on Sagace and Data Integration
 
25th mtg 1
25th mtg 125th mtg 1
25th mtg 1
 
Schema.org extension for biological database @ Biohackathon2013
Schema.org extension for biological database @ Biohackathon2013Schema.org extension for biological database @ Biohackathon2013
Schema.org extension for biological database @ Biohackathon2013
 
Life Science Database Cross Search and Metadata
Life Science Database Cross Search and MetadataLife Science Database Cross Search and Metadata
Life Science Database Cross Search and Metadata
 
Cellsalon5
Cellsalon5Cellsalon5
Cellsalon5
 
Cell salon vol5
Cell salon vol5Cell salon vol5
Cell salon vol5
 
Cell salon vol5
Cell salon vol5Cell salon vol5
Cell salon vol5
 

36th mtg in NIBIO

  • 2. 本日の予定 • Sagace – アクセス解析 – 新規ファセット項目に加えるDBの是非について – 進捗報告 • 医薬基盤研内のデータのRDF化 – 難病研究資源バンクのデータのRDF化について – これまでRDF化したデータの疾患別傾向について – 外部DBを繋げた検索について 2
  • 3. 新規ファセット項目に加える DBの是非について • メンバーの皆さんに調査結果をご報 告頂きます。 – 担当したファセット分類の検索結果の印象 – 各データベースの掲載の是非(特に非のもの について,その理由) – その他気がついた点についての報告 3
  • 4. 医薬基盤研内のデータのRDF化 • 進捗報告 – 難病研究資源バンクのデータをRDF化 – 難病研究資源バンク,実験動物研究資源バン ク,希少疾病用医薬品にICD10を付与 – BioPortalのRay FergersonさんからICD10のttl を入手 – DB毎にどの疾患が多いのか検索 – OMIMと統合して外部のデータを得る 4
  • 5. 難病研究資源バンクのRDF化 @prefix Medical_condition: <http://schema.org/MedicalCondition/> . @prefix b2rv: <http://bio2rdf.org/bio2rdf_vocabulary:> . @prefix BioLOD_property_pria315s16i: <http://purl.jp/bio/13/property/pria315s16i/> . @prefix dbowl: <http://dbpedia.org/ontology/> . @prefix NIBIO_raredis: <http://www.nibio.go.jp/rarediseaseVocabulary#> . <http://raredis.nibio.go.jp/bioSample#27> b2rv:namespace "rareDisease" ; dbowl:icd10 "D44.1" ; BioLOD_property_pria315s16i:Institute_Depositor "京都医療センター"@ja ; Medical_condition:name "非機能性副腎腫瘍"@ja , "Nonfunctioning adrenal tumor" ; NIBIO_raredis:ID "0311" ; NIBIO_raredis:bioSample "Plasma" . 5
  • 6. 難病研究資源バンクのRDF化 • 今後の予定 – NIBIO_raredis:bioSample "Plasma" . – 上記について適切なpredicate,objectのURIが見つかれ ば置き換えを検討する。 – データ構成,データの増大に合わせてRDFデータも 作り変えていく。 – 今回は,ウェブページから表を取り出して作成 – 将来的にはウェブページにマークアップ,クロー ラーが同時にRDF作成が現実的? 6
  • 7. ICD10の付与 例:希少疾病用医薬品の場合 以下の様なRDFをトリプルストアに入れると,既存のグラフ(下記ならば <http://www.nibio.go.jp/orphanDrugTarget#7>と統合してくれる。) @prefix dbowl: <http://dbpedia.org/ontology/> . @prefix Medical_condition: <http://schema.org/MedicalCondition/> . <http://www.nibio.go.jp/orphanDrugTarget#7> Medical_condition:name "動脈管開存症"@ja; dbowl:icd10 "Q25.0". 7
  • 8. BioPortal由来の ICD10のttlファイル @prefix skos: <http://www.w3.org/2004/02/skos/core#> . @prefix owl: <http://www.w3.org/2002/07/owl#> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . @prefix umls: <http://bioportal.bioontology.org/ontologies/umls/> . <http://purl.bioontology.org/ontology/ICD10/S66.9> a owl:Class ; skos:prefLabel """Injury of unspecified muscle and tendon at wrist and hand level"""@en ; skos:notation """S66.9"""^^xsd:string ; rdfs:subClassOf <http://purl.bioontology.org/ontology/ICD10/S66> ; umls:cui """C0478316"""^^xsd:string ; umls:tui """T037"""^^xsd:string ; umls:hasSTY <http://purl.bioontology.org/ontology/STY/T037> ; 8
  • 9. 検索例 1つの疾患IDに幾つのデータが紐づくかデータベース毎に出力 prefix skos: <http://www.w3.org/2004/02/skos/core#> prefix dbowl: <http://dbpedia.org/ontology/> prefix b2rv: <http://bio2rdf.org/bio2rdf_vocabulary:> select ?id ?name ?namespace (count(*) as ?count) where { ?s skos:prefLabel ?name; skos:notation ?id. ?nibio_db dbowl:icd10 ?id; b2rv:namespace ?namespace. } GROUP BY ?id ?name ?namespace ORDER BY ?id 9
  • 11. OMIMとの統合 ICD10をキーとしてOMIMのIDや疾患名,遺伝子名を出力 prefix dbowl: <http://dbpedia.org/ontology/> prefix b2rv: <http://bio2rdf.org/bio2rdf_vocabulary:> prefix b2ro: <http://bio2rdf.org/omim_vocabulary:> PREFIX dcterms: <http://purl.org/dc/terms/> select ?nibio_url ?icd10 ?omim_id ?title ?gene_name where { ?nibio_url dbowl:icd10 ?id. BIND (xsd:string(?id) as ?icd10) SERVICE<http://omim.bio2rdf.org/sparql>{ ?s b2ro:x-icd10 ?o; b2rv:identifier ?omim_id; dcterms:title ?title; b2ro:gene-name ?gene_name. ?o b2rv:identifier ?icd10. } } 11
  • 13. 医薬基盤研内のデータのRDF化 • 外部DBを繋げた検索について – 特許のSPARQL Endpointは情報が不足している。 – Clinical Trialsは現状データを繋ぐとっかかりとな るIDがない。 – 実験動物研究資源バンクのデータとMGIのデータ の統合 • 系統名,遺伝子名ともにマッチするものが少ない。 • OMIM経由で繋ごうとしたが,一致するIDを見つけら れず – 複数のSPARQL Endpointを経由した検索は現状 では難しい(調査継続) 13
  • 14. 今後の予定 • 次回 – 10月24日(金) • トーゴーの日 – 10月5日(日)? • BioHackathon 2014 – 11月9日(日)〜14日(金) • 分子生物学会 – 11月25日(火)〜27日(木) 14

Editor's Notes

  1. UMLS は米国国立医学図書館(National Library of Medicine: NLM)が1986年から取り 組んでいる統合型の医学用語システム。 CUIはID,TUIは分類体系,hasSTYも分類体系に繋がるURI(ここでは,Injury or Poisoningという意味らしい) ―このプロジェクトの目的は現在ある各種の電子的なファイル、文献データベース、患者 記録、ファクトデータバンク、知識ベースなどを検索、統合化するために構想された。 ―UMLS には約100種の既存の用語集、シソーラス、コードなどから医学用語が収集され UMLS のコンセプトごとに整理されて、巨大な医学用語データベースとして NLM から一般 に公開されている。