ライフサイエンス分野における
Linked Open Dataの活用例


    LODチャレンジ実行委員 細見,豊田



    Copyright: (C) 2011 LODチャレンジ実行委員会   1
ライフサイエンス分野のLOD
   病気、薬、様々なタンパク質、遺伝子、医学論文、
                                 従来の公開データ
    臨床試験などに関するデータが米欧や日本で公開 (相互にリンクが無く、フォーマットや名称表記も
   データ提供者・公開者とデータ公開URL        異なるため、相互参照が困難)

    – W3C Linking Open Drug Data project                  薬情報      臨床試験情報
      (http://www.w3.org/wiki/HCLSIG/LODD/Data)       DrugBank     ClinicalTrials

    – 欧州Ontotext社                                                  The human
                                                      DailyMed
      (http://linkedlifedata.com/)                                 diseasome
                                                          薬情報     病気,遺伝子情報
    – 理化学研究所(http://BioLOD.org/)
    – サーバーエッヂ社                                            W3CやOntotext社によるLOD化
      (http://www.semanticweb.jp/lod/LodOfLsd.html)       (互いの情報がリンクで容易に参照可能)

   データの規模
                                                           使用した薬の詳細
    – 種類によって数千(基本概念)                                                 臨床試験情報
                                                      薬情報
      ~数十億(タンパク質など)                                 DrugBank          LinkedCT
   データ形式                                                                 病気の詳細
                                                薬同士の関係
    – 殆どがRDF形式(構文はNotation3 or XML)
      で入手可能                                         DailyMed         Diseasome
                                                     薬情報             病気,遺伝子情報
                                                           病気と薬の関係


                      Copyright: (C) 2011 LODチャレンジ実行委員会                             2
病気に関するLOD(Diseasome)の例
<http://www4.wiwiss.fu-berlin.de/diseasome/resource/diseases/74>
                                                                   左記のRDF(Notation3)データを
<http://www.w3.org/2000/01/rdf-schema#label>
                                                                      図化&和訳したもの
 "Alzheimer_disease" .
                                                                   病気(Disease)
<http://www4.wiwiss.fu-berlin.de/diseasome/resource/diseases/74>
a                                                                          「アルツハイマー病」
                                                                 上位概念
 <http://www4.wiwiss.fu-
berlin.de/diseasome/resource/diseasome/diseases> .                                ラベル
                                                     Diseasomeの病気ID
                                                                           病気74
<http://www4.wiwiss.fu-berlin.de/diseasome/resource/diseases/74>
<http://www4.wiwiss.fu-                                                            病気種別
berlin.de/diseasome/resource/diseasome/class>
 <http://www4.wiwiss.fu-                                         関連遺伝子             神経疾患
berlin.de/diseasome/resource/diseaseClass/Neurological> .

<http://www4.wiwiss.fu-berlin.de/diseasome/resource/diseases/74>                  候補薬剤
                                                                       PSEN1
<http://www4.wiwiss.fu-
berlin.de/diseasome/resource/diseasome/associatedGene>
 <http://www4.wiwiss.fu-
berlin.de/diseasome/resource/genes/PSEN1> .                  DailyMedの薬ID
                                                                                 薬205
<http://www4.wiwiss.fu-berlin.de/diseasome/resource/diseases/74>
<http://www4.wiwiss.fu-
berlin.de/diseasome/resource/diseasome/possibleDrug>             DailyMedのデータセットへのリンクで
 <http://www4.wiwiss.fu-berlin.de/dailymed/resource/drugs/205> .  薬205の詳細な情報を参照可能

                           Copyright: (C) 2011 LODチャレンジ実行委員会                              3
TripleMapを用いたLOD活用例
     http://triplemap.com/




      臨床試験                         ピック病
       データ



                                          関連する
                                          遺伝子
                             認知症
     薬と標的疾患の候補




                                          アルツハイマー病



TripleMapでLODの検索と各種関連データのビジュアルな参照が可能。
「最近見つかったアルツハイマー病の新たな候補薬剤が、関連遺伝子PSEN1が共通するピック病に
活かせるかも?」 といった調査・検討が効率的にできる。
                   Copyright: (C) 2011 LODチャレンジ実行委員会   4
日本における大規模LOD公開サイト
   W3C のレイヤーケーキ図                                       詳細は http://ja.BioLOD.org
                                                                  Unifying logic

                                                               Logic for biology
                                                               BioSPARQL.org
                                                                    OWL-based
                                                                   Query builder
                                                                SemanticJSON.org
                                                                  Ontology: OWL
                                                      Query:       BioLOD.org      Rule
                                                     SPARQL            RDFS        RIF
                                                                    SciNetS.org
The Semantic Web layer cake: the technology
stack for the W3C Web architecture                             Data interchange:
http://www.ibm.com/developerworks/xml/tutorials/x-                    RDF
sparql/section2.html                                            LinkData.org

LinkData.jp はライフサイエンスに限定しない日本語LOD投稿サイトで、誰でも簡単にRDF作品を創って公
開できる(平成23年12月から運用開始)。その中から選ばれたデータがライフサイエンスの専門家によって
SciNetS.org の情報基盤で再編纂され、オントロジーで体系化されて BioLOD.org からダウンロードできる
                                   Copyright: (C) 2011 LODチャレンジ実行委員会                      5

ライフサイエンス分野におけるLinked Open Dataの活用例

  • 1.
    ライフサイエンス分野における Linked Open Dataの活用例 LODチャレンジ実行委員 細見,豊田 Copyright: (C) 2011 LODチャレンジ実行委員会 1
  • 2.
    ライフサイエンス分野のLOD  病気、薬、様々なタンパク質、遺伝子、医学論文、 従来の公開データ 臨床試験などに関するデータが米欧や日本で公開 (相互にリンクが無く、フォーマットや名称表記も  データ提供者・公開者とデータ公開URL 異なるため、相互参照が困難) – W3C Linking Open Drug Data project 薬情報 臨床試験情報 (http://www.w3.org/wiki/HCLSIG/LODD/Data) DrugBank ClinicalTrials – 欧州Ontotext社 The human DailyMed (http://linkedlifedata.com/) diseasome 薬情報 病気,遺伝子情報 – 理化学研究所(http://BioLOD.org/) – サーバーエッヂ社 W3CやOntotext社によるLOD化 (http://www.semanticweb.jp/lod/LodOfLsd.html) (互いの情報がリンクで容易に参照可能)  データの規模 使用した薬の詳細 – 種類によって数千(基本概念) 臨床試験情報 薬情報 ~数十億(タンパク質など) DrugBank LinkedCT  データ形式 病気の詳細 薬同士の関係 – 殆どがRDF形式(構文はNotation3 or XML) で入手可能 DailyMed Diseasome 薬情報 病気,遺伝子情報 病気と薬の関係 Copyright: (C) 2011 LODチャレンジ実行委員会 2
  • 3.
    病気に関するLOD(Diseasome)の例 <http://www4.wiwiss.fu-berlin.de/diseasome/resource/diseases/74> 左記のRDF(Notation3)データを <http://www.w3.org/2000/01/rdf-schema#label> 図化&和訳したもの "Alzheimer_disease" . 病気(Disease) <http://www4.wiwiss.fu-berlin.de/diseasome/resource/diseases/74> a 「アルツハイマー病」 上位概念 <http://www4.wiwiss.fu- berlin.de/diseasome/resource/diseasome/diseases> . ラベル Diseasomeの病気ID 病気74 <http://www4.wiwiss.fu-berlin.de/diseasome/resource/diseases/74> <http://www4.wiwiss.fu- 病気種別 berlin.de/diseasome/resource/diseasome/class> <http://www4.wiwiss.fu- 関連遺伝子 神経疾患 berlin.de/diseasome/resource/diseaseClass/Neurological> . <http://www4.wiwiss.fu-berlin.de/diseasome/resource/diseases/74> 候補薬剤 PSEN1 <http://www4.wiwiss.fu- berlin.de/diseasome/resource/diseasome/associatedGene> <http://www4.wiwiss.fu- berlin.de/diseasome/resource/genes/PSEN1> . DailyMedの薬ID 薬205 <http://www4.wiwiss.fu-berlin.de/diseasome/resource/diseases/74> <http://www4.wiwiss.fu- berlin.de/diseasome/resource/diseasome/possibleDrug> DailyMedのデータセットへのリンクで <http://www4.wiwiss.fu-berlin.de/dailymed/resource/drugs/205> . 薬205の詳細な情報を参照可能 Copyright: (C) 2011 LODチャレンジ実行委員会 3
  • 4.
    TripleMapを用いたLOD活用例 http://triplemap.com/ 臨床試験 ピック病 データ 関連する 遺伝子 認知症 薬と標的疾患の候補 アルツハイマー病 TripleMapでLODの検索と各種関連データのビジュアルな参照が可能。 「最近見つかったアルツハイマー病の新たな候補薬剤が、関連遺伝子PSEN1が共通するピック病に 活かせるかも?」 といった調査・検討が効率的にできる。 Copyright: (C) 2011 LODチャレンジ実行委員会 4
  • 5.
    日本における大規模LOD公開サイト W3C のレイヤーケーキ図 詳細は http://ja.BioLOD.org Unifying logic Logic for biology BioSPARQL.org OWL-based Query builder SemanticJSON.org Ontology: OWL Query: BioLOD.org Rule SPARQL RDFS RIF SciNetS.org The Semantic Web layer cake: the technology stack for the W3C Web architecture Data interchange: http://www.ibm.com/developerworks/xml/tutorials/x- RDF sparql/section2.html LinkData.org LinkData.jp はライフサイエンスに限定しない日本語LOD投稿サイトで、誰でも簡単にRDF作品を創って公 開できる(平成23年12月から運用開始)。その中から選ばれたデータがライフサイエンスの専門家によって SciNetS.org の情報基盤で再編纂され、オントロジーで体系化されて BioLOD.org からダウンロードできる Copyright: (C) 2011 LODチャレンジ実行委員会 5