Linked Data in Japan/Semantic Conference In Japan 2010
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share

Linked Data in Japan/Semantic Conference In Japan 2010

  • 3,412 views
Uploaded on

 

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
3,412
On Slideshare
3,400
From Embeds
12
Number of Embeds
1

Actions

Shares
Downloads
27
Comments
0
Likes
1

Embeds 12

http://www.slideshare.net 12

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Linked Dataの現状と日本の課題
    武田 英明
    国立情報学研究所
    東京大学 人工物工学研究センター
    takeda@nii.ac.jp
  • 2. Linked Data
    Linked Dataとは何か
    Linked Dataの現状
    Linking Open Data (LOD)
    Linked Dataの使い方
    検索エンジン
    ブラウザ
    アプリ
    日本におけるLinked Dataの課題
  • 3. Linked Data
    Linked Dataとは何か
    Linked Dataの現状
    Linking Open Data (LOD)
    Linked Dataの使い方
    検索エンジン
    ブラウザ
    アプリ
    日本におけるLinked Dataの課題
  • 4. Linked Data
    • Linked Dataとは “Web of Data”
    RDFで公開されるデータ
    外部から参照可能(dereferenceable)
    Linked Data, TBL, http://www.w3.org/DesignIssues/LinkedData.html
  • 5. Semantic Webの階梯
    RDF (Resource Description Framework)
    最も原始的な意味記述の枠組みを提供ー>SVOモデル
    Entity-Relation Model(実体関連モデル)
    セマンティックネット
    RDF Schema
    RDFに最も原始的な概念記述の仕組みを追加
    class-subclass関係,制約
    OWL (Web Ontology Language)
    記述論理(description logics)に基づいた概念とその関係を記述する言語
    Rule-ML

    もっと上へ、もっと上へ
    Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
  • 6. Semantic Webの階梯
    抽象問題から具体問題への回帰
    クラスに関する記述
    オントロジー
    インスタンスに関する記述
    Linked Data
    Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
  • 7. Semantic Webの階梯
    オントロジー
    クラスに関する記述
    RDFS、OWL
    オントロジー構築の課題
    オントロジー構築はそもそも大変
    一貫性、網羅性、論理性
    複数オントロジーの統合・関連付けはもっと大変
    クラスに関する記述
    オントロジー
    インスタンスに関する記述
    Linked Data
    Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
  • 8. Semantic Webの階梯
    Linked Data
    インスタンスに関する記述=個々の事物に関する記述
    RDF + (RDFS, OWL)
    Linked Dataの記述における利点
    書きやすい(事実に関する記述が主)
    リンクしやすい(同)
    LinkedDataの記述における問題点
    複雑な記述は難しい
    それでもクラス定義は必要(->オントロジー)
    クラスに関する記述
    オントロジー
    インスタンスに関する記述
    Linked Data
    Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
  • 9. Linked Data
    Linked Dataのための4条件
    事柄の名前にURIを使うことUse URIs as names for things
    すべてのモノ,コトにURIを!
    名前の参照がHTTP URIでできることUse HTTP URIs so that people can look up those names.
    DOIとかいったURNは使わないでね
    URIを参照したときに関連情報が手に入るようにWhen someone looks up a URI, provide useful information, using the standards (RDF, SPARQL)
    理解可能なデータを提供してね.
    外部へのリンクも含めようInclude links to other URIs. so that they can discover more things.
    Webのようにリンクでつながるデータを作ろう
    Linked Data, TBL, http://www.w3.org/DesignIssues/LinkedData.html
  • 10. Linked Data
    Linked Dataとは何か
    Linked Dataの現状
    Linking Open Data (LOD)
    Linked Dataの使い方
    検索エンジン
    ブラウザ
    アプリ
    日本におけるLinked Dataの課題
  • 11. Linking Open Data (LOD)
    公開されたLinked Dataを集めるプロジェクト
    主要なLinked Data
    (データ変換)
    Dbpedia (Wikipedia) : 百科事典, 2.7億文
    Geonames:地名と緯度経度, 9300万文
    MusicBrainz:音楽
    WordNet:辞書
    DBLP bibliography:論文の書誌,2800万文
    US Census Data: 米国国勢調査(2000年), 10億文
    (クロール)
    FOAF (Friend Of A Friend):個人と個人関係のプロファイル
    (ラッパー)
    Flickr Wrapper
  • 12. Dbpediaの例
  • 13. 131億文
    1.41 万個のリンク
  • 14. Web-based Information
    Music
    Papers
    Geographic information
    Life Science and Health Care
    131億文
    1.41 万個のリンク
  • 15. LODの発展(1)
    As of March 2008
  • 16. LODの発展(2)
  • 17. LODの発展(3)
  • 18. 131億文
    1.41 万個のリンク
    LODの発展(4)
  • 19. Linked Data
    Linked Dataとは何か
    Linked Dataの現状
    Linking Open Data (LOD)
    Linked Dataの使い方
    検索エンジン
    ブラウザ
    アプリ
    日本におけるLinked Dataの課題
  • 20. Linked Data Search Engine
    Link Data汎用サーチエンジン
    Swoogle
    Watson
    SWME
    http://swse.deri.org/
    Sindice
    http://sindice.com/
    特殊サーチ
    Sameas
    http://sameas.org/
  • 21. http://sameas.org/
  • 22.
  • 23. Linked Data Browser
    データをWebページのようにみていくツール
    システム
    Mables
    リンクを順に表示
    Tabulator
    Firefox plugin版/online 版
    1ページの中にどんどん情報を追加
    Sig.ma
    RDFのソースを同時提示して、操作可能
  • 24.
  • 25. Tabulator
  • 26.
  • 27. Linked Data Mashup
    Linked Data Browser
    Linked Data Mashup
    Linked Data Search Engine
    Things
    Things
    Things
    Things
    Things
  • 28. How to use Linked Data
    Semantic Data Mash-up Applications
    SemaPlorer
    http://btc.isweb.uni-koblenz.de/
    Dbpedia Mobile
    http://wiki.dbpedia.org/DBpediaMobile
    Bio2RDF
    http://bio2rdf.org/
  • 29. DBpedia Mobile
  • 30. Bio2RDF
    Bio系のリソース検索
    RDFでないものは勝手にRDF化
  • 31. Bio2RDF
  • 32. Web APIとLinked Dataの比較
    Linked Dataのメリット
    統一されたインタフェース
    RDF / SPARQL endpoint
    意味の明示
    サイトを越えた連携
    sameAs
    Linked Dataのデメリット
    速度
    意味解釈の曖昧さ
    データの信頼性
    由来
    新鮮さ
  • 33. Linked Data
    Linked Dataとは何か
    Linked Dataの現状
    Linking Open Data (LOD)
    Linked Dataの使い方
    検索エンジン
    ブラウザ
    アプリ
    日本におけるLinked Dataの課題
  • 34. 日本におけるLinked Data
    課題
    日本語の壁
    URI
    ハブの欠如
    Dbpedia
    RDFの普及の遅さ
    RDFa
    我々の取り組み
    WordNet日本語版RDF
    ことはぶ
    CiNii RDF
  • 35. 日本語WordNetRDF
    日本語WordNet (verson 0.9)
    NICTによるWordNetの日本語化
    Wordの翻訳のみ(synsetはそのまま)
    49,655 概念 (synset数)
    87,133 words 語
    146,811 語義 (synsetと単語のペア)
    日本語WordNet RDF
    日本語WordNetのRDF化
    RDF/OWL Representation of WordNet, W3C Working Draft 19 June 2006をWordNet 3.0用に変更
    HTMLおよびRDFで表示
    SUMOとの統合
  • 36.
  • 37.
  • 38. “ことはぶ/KotoHub”のコンセプト
    すべての言葉にURIを!
    言葉から定義へのハブ
    ネット上に散在している日本語辞書・百科事典・用語集のリポジトリ
    Dictionary of Dictionary
    分野を跨いだ横断検索
    専門家によって編纂された知識体系と,ユーザ参加型コミュニティによって生成された知識体系の融合
  • 39.
  • 40. 辞書のソース
    Wikipedia日本語版 : 549,521語
    http://download.wikimedia.org/jawiki/20090423/jawiki-20090423-pages-meta-history.xml.bz2
    kotobank.jp : 333,780語
    http://kotobank.jp
    はてなキーワード : 247,690語
    http://d.hatena.ne.jp/images/keyword/keywordlist_furigana_with_kid.csv
    Yahoo!百科事典 : 98,056語
    http://100.yahoo.co.jp/
    ニコニコ大百科(仮) : 48,911語
    http://dic.nicovideo.jp/m/a/a
    Weblio: 953,828語
    http://www.weblio.jp/
    WordNet日本語版0.9: 227,753語(うち日本語85,966語); 50,739概念; 151,831語義
    http://nlpwww.nict.go.jp/wn-ja/
    IPA辞書2.7: 231,900語
    http://sourceforge.jp/projects/ipadic/
    のべ単語数: 2,691,439語; 正規化済み: 2,113,688語; 読み: 546,364語
  • 41.
  • 42. RDFによるWebサービス連携
    http://wordnet.jp/kotohub/term/愛.rdf
    <?xml version='1.0' encoding='UTF-8'?>
    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
      xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
      xmlns:foaf="http://xmlns.com/foaf/0.1/"
    xmlns:linked="http://wordnet.jp/kotohub/ns/linked/0.1/" xml:lang="ja">
    <rdf:Description rdf:about="http://wordnet.jp/kotohub/term/愛">
    <foaf:isPrimaryTopicOf rdf:resource="http://wordnet.jp/kotohub/term/愛" />
    <rdfs:seeAlso rdf:resource="http://dic.nicovideo.jp/a/愛" />
    <rdfs:seeAlso rdf:resource="http://ja.wikipedia.org/wiki/愛" />
    <rdfs:seeAlso rdf:resource="http://ja.wikipedia.org/wiki/愛_(TBSテレビドラマ) " />
    <rdfs:seeAlso rdf:resource="http://100.yahoo.co.jp/detail/愛/" />
    <rdfs:seeAlso rdf:resource="http://kotobank.jp/word/愛" />
    <rdfs:seeAlso rdf:resource="http://www.weblio.jp/content/愛" />
    <rdfs:seeAlso rdf:resource="http://wordnet.jp/jp09/instances/word-愛" />
    <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/あい" />
    <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/ちか" />
    <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/めぐみ" />
    <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/まな" />
    </rdf:Description>
    </rdf:RDF>
  • 43. CiNii RDF
    CiNii: NIIが提供する論文目録データベースサービス
    約1300万件
    この各論文のメタデータをRDFで提供
  • 44.
  • 45.
  • 46.
  • 47.
  • 48. まとめ
    Linked DataはWeb of Data
    機械のためWeb
    つながることで広がる新しい世界
    cf. Web, SNS
    敷居の低いSemantic Web
    今すぐに参加できるSemantic Web
    今すぐにつかえるSemantic Web
    様々な問題点はあるが、それは普及してから考えましょう