Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

RDF Semantic Graph「RDF 超入門」

3,025 views

Published on

Oracle Spatial and Graph
RDF Semantic Graph
RDF 超入門

Published in: Engineering
  • Be the first to comment

RDF Semantic Graph「RDF 超入門」

  1. 1. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Spatial and Graph RDF Semantic Graph RDF 超入門 日本オラクル株式会社 データベース事業統括 製品戦略統括本部 データベースエンジニアリング本部 Big Data & Security技術部 中井亮矢 Oracle Confidential – Internal/Restricted/Highly Restricted this ducument Ryoya Nakai dc:Creater dc:Title vc:memberOf rdfs:label
  2. 2. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Safe Harbor Statement The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated into any contract. It is not a commitment to deliver any material, code, or functionality, and should not be relied upon in making purchasing decisions. The development, release, and timing of any features or functionality described for Oracle’s products remains at the sole discretion of Oracle. 2
  3. 3. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Agenda § Oracle Spatial and Graph § Linked Dataってなに § RDF Semantic Graph
  4. 4. 4 Copyright © 2011, Oracle and/or its affiliates. All rights reserved. Big Data Management System SOURCES DATA RESERVOIR DATA WAREHOUSE Oracle Database Oracle Industry Models Oracle Advanced Analytics Oracle Spatial & Graph Big Data Appliance Apache Flume Oracle GoldenGate Oracle Event Processing Cloudera Hadoop Oracle Big Data SQL Oracle NoSQL Oracle R Distribution Oracle Big Data Spatial and Graph Oracle Database In-Memory, Multi-tenant Oracle Industry Models Oracle Advanced Analytics Oracle Spatial and Graph Exadata Oracle GoldenGate Oracle Event Processing Oracle Data Integrator Oracle Big Data Connectors Oracle Data Integrator B 4
  5. 5. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Spatialの歩み 1995~ Oracle7 1999~ Oracle8i 2001~ Oracle9i 2004~ Oracle Database 10g 2007~ Oracle Database 11g Spatialの初リリース ポイント情報 ポリゴン 空間演算子 3Dデータサポート RDFセマンティック (10.2) Spatial Webサービス 2013~ Oracle Database 12c Spatial and Graphに改名 ベクター演算高速化 ラスター並列演算 ・Oracle 7.3 から実装 ・市場のニーズに応えた継続的な改善 ・挑戦的な機能追加 オブジェクト・サポート 円、円弧 R-Tree索引 Spatial関数のサポート 測地座標系 線形参照システム Spatial Partitioning Spatial Replication ラスター・データ トポロジ・データモデル ネットワーク・データ・モデル ジオコーディング ルーティング
  6. 6. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Spatial and Graph 6 Oracle Database 12c Spatial and Graph Option Spatial Features Graph Features Topology & Network Data Model Graph RDF Semantics Graph
  7. 7. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Graph Features - RDF Semantics Graph RDFセマンティックテクノロジーの実装 • 機能 – SPARQL 1.1 対応のRDFトリプルストアとして動作 – RDB2RDF の変換プロセッサ(DM,R2RML)とRDFビュー機能 – 推論エンジン機能 • RDF/RDFS/OWL/SKOS標準ボキャブラリ対応、ユーザ定義推論 • 特⻑ – 1兆トリプルを捌く #1 ⼤規模トリプルストア – 既存データ,RDBユーザに優しい • RDBからの変換、SQL内にSPARQLを記述可能、RDFビュー – 企業・軍情報機関での利⽤に耐える本格実装 • セキュリティ、推論結果の扱い、モデル単位の管理、仮想モデル 概要
  8. 8. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDF Semantic Graph 機能は 一言で言うと Oracle データベースのRDF/Linked Data の機能 § Linked Data ? § RDF?
  9. 9. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Agenda § Oracle Spatial and Graph § Linked Dataってなに – コンセプト – データの持ち⽅ – RDF § RDF Semantic Graph
  10. 10. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | コンセプト World Wide Web (1991-) ~ HTML を使った文書のウェブ Linked Data (1999-) ~ RDF を使ったデータのウェブ http://ja.wikipedia.org/wiki/Linked_Open_Datahttp://www.ted.com/talks/tim_berners_lee_on_the_next_web
  11. 11. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | World Wide Web (文書のウェブ) Oracle Confidential – Internal/Restricted/Highly Restricted 11 http://en.wikipedia.org/wiki/File:Internet_map_1024.jpg
  12. 12. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 文書のウェブで困ること ウェブという「ビッグデータ」があっても… 非構造: コンピュータが内容を理解してリンクを辿るのは難しい 異なるスキーマ: 複数ソースのデータを統合するのは手間がかかる http://www.kanzaki.com/works/2011/pub/0618scs.html#s4
  13. 13. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Webの現状 ホイコーローつくろう
  14. 14. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 例えば、、、、ホイコーローつくろう レシピを検索
  15. 15. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 例えば、、、、ホイコーローつくろう Oracle Confidential – Internal/Restricted/Highly Restricted 15 すごいいっぱいでてくる、、、
  16. 16. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 例えば、、、、ホイコーローつくろう 僕が欲しいレシピは アレルギー⾷材なし ⾟くなくて ⽢⼝で⼦供が⾷べれて ⼤⼈もおいしくて、、、
  17. 17. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 例えば、、、、ホイコーローつくろう Oracle Confidential – Internal/Restricted/Highly Restricted 17
  18. 18. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 例えば、、、、ホイコーローつくろう サイトごとに書式も違うから ⽐べるのも⼤変 (>_<) 作り出す前に2時間以上検索 実際はホイコーローでないですが、 ほぼ実体験
  19. 19. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | データのウェブでできること • データの再利用 • 複数ソースの統合 • 関連データの発見 • 全てのデータにURIをつける • そのURIが参照できるようにする • 参照されたらRDFで情報を返す • 外部データのURIを参照する
  20. 20. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 例えば、、、、ホイコーローつくろう データのWebなら 一発検索 ヾ(*´▽`*)ノ Oracle Confidential – Internal/Restricted/Highly Restricted 20 ホイコーロー レシピA レシピB レシピB 辛い 甘い おい しい アレルギー 食材無 喜ぶ レシピX
  21. 21. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Agenda § Oracle Spatial and Graph § Linked Dataってなに – コンセプト – データの持ち⽅ – RDF § RDF Semantic Graph
  22. 22. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | データの持ち方 データのWebのためには、、 • 情報をトリプル化して • グラフ化して • オントロジーを定義して • 大量に蓄積
  23. 23. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | データの持ち方 残念ながら用語が難しい (´・ω・`) ここから簡単に説明
  24. 24. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | データの持ち方 ~トリプル・トリプル化とは
  25. 25. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | データの持ち方 トリプル・トリプル化 織田信長は室町幕府を滅亡させ天下統一を狙った この情報をトリプル化してみます
  26. 26. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | データの持ち方 トリプル・トリプル化 天下統一を狙った 情報を分割します 織田信長は 室町幕府を滅亡させ
  27. 27. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | データの持ち方 トリプル・トリプル化 天下統一を狙った 分割完了ヾ(*´▽`*)ノ この情報は2つに! 織田信長は 室町幕府を滅亡させた 織田信長は
  28. 28. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | データの持ち方 トリプル・トリプル化 狙った 分割した情報を主語・述語・目的語(SVO)に並べ替え 織田信長 織田信長 室町幕府滅亡させた 天下統一 S V O
  29. 29. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | データの持ち方 トリプル・トリプル化 狙った 織田信長 織田信長 室町幕府滅亡させた 天下統一 S V O これが トリプル これも トリプル
  30. 30. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | "織田信長" "狙った" "天下統一". "織田信長" "滅亡させた" "室町幕府". データの持ち方 トリプル・トリプル化 実際のトリプルのファイルもただのスペース区切りでOK これが トリプル これも トリプル ※トリプルには他の書式もあります。
  31. 31. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | データの持ち方 グラフ化して
  32. 32. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | トリプルからグラフへ グラフって何? 円グラフ・棒グラフ 折れ線グラフ のグラフ?
  33. 33. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | トリプルからグラフへ グラフって何? グラフ理論のグラフ 点と線の集合のこと。
  34. 34. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | トリプルからグラフへ グラフって何? 関係を表現できる。 地下鉄の路線図、道路網、 コンピュータのネットワークとか ⼈間関係とかは グラフ化するとわかりやすい。 駅探とかカーナビでもたぶん使われてる
  35. 35. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | トリプルからグラフへ グラフって何? 出典:わけがわからない...CIA長官不倫スキャンダル人物相関図 http://www.gizmodo.jp/2012/11/cia_3.html
  36. 36. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | トリプルからグラフへ 狙った 述語を主語・⽬的語の2つの間の関係と⾒做して ⽮印で結びます。 織田信長 織田信長 室町幕府 滅亡させた 天下統一
  37. 37. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | トリプルからグラフへ 狙った トリプルを⽮印で書くとRDFグラフ。 織田信長 織田信長 室町幕府 滅亡させた 天下統一 これが RDF グラフ これも RDF グラフ
  38. 38. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | トリプルからグラフへ 「織⽥信⻑」をまとめます 織田信長 室町幕府 滅亡させた 天下統一 狙った
  39. 39. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | トリプルからグラフへ 合わせるとこんな形のグラフになりました 織田信長 室町幕府 滅亡させた 天下統一 狙った
  40. 40. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 大量に蓄積
  41. 41. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | トリプルからグラフへ RDFグラフをどんどん集めてつなげると 巨大で複雑なグラフネットワークが作れます。 これをRDFセマンティックグラフと呼びます。 織田信長 室町幕府 滅亡させた 作った 足利尊氏 征夷大将軍 代表
  42. 42. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | トリプルからグラフへ 巨大なRDFセマンティックグラフでは 色々なものがつながっているので、 色々なことがわかります 徳川家康 徳川秀忠 徳川家光 親親 家光のおじいちゃんは誰?
  43. 43. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | トリプルからグラフへ みんなが勝手にトリプル化していくと 重複データが増えて 結局探すのがたいへんなことに <(T◇T)> 織⽥信⻑ 尾張守護代 戦国⼤名 ⼤名 おしごと 職業 職 天下統⼀ 戦国⼤名 主な職歴
  44. 44. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | トリプルからグラフへ http://ja.dbpedia.org/resource/織田信長 http://ja.dbpedia.org/resource/戦国大名 http://example.com/職業 HTTP URIの利用 定義済みのものはどっかに書いて みんな、それを使おう! URIを使って書けば 誰だって使えるものに
  45. 45. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | データの持ち方 オントロジーとは
  46. 46. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | オントロジーとは コンピュータは何もわからない 「織⽥信⻑」というデータはあっても • 過去の⽇本⼈かどうかもわからない • ⽇本⼈かどうかもわからない • ⼈かモノか部品か何かわからない • 架空のものかもわからない Oracle Confidential – Internal/Restricted/Highly Restricted 46 (´・ω・`)モキュ
  47. 47. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | オントロジーとは 概念体系(オントロジー)を コンピュータに教えてあげるとスムーズ! 「⼈は動物の⼀種で名前を持ってるよ」 Oracle Confidential – Internal/Restricted/Highly Restricted 47 動物 人 上位概念 名前 名前持ってる 出典:wikipedia
  48. 48. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | オントロジーとは コンピュータに概念を教える為の 書き⽅の決まりが、 Web Ontology Language が由来の OWL この書式で書けば、 他のデータソースとも 概念を共有できちゃう!
  49. 49. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | オントロジーとは スキーマはOWLとRDF Schema で書く 動物 人 上位概念 名前 名前持ってる <owl:Class rdf:ID="人"> <rdfs:subClassOfrdf:resource="#動物" /> ..... <rdfs:subClassOf> <owl:onPropertyrdf:resource="#名前持ってる" /> </rdfs:subClassOf> .... </owl:Class>
  50. 50. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Agenda § Oracle Spatial and Graph § Linked Dataってなに – コンセプト – データの持ち⽅ – RDFってなに § RDF Semantic Graph
  51. 51. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDFってなに? Resource Description Framework W3C勧告のリソース記述の枠組み。 書式とそのスキーマの記述方法などがゆるく定義されてる
  52. 52. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDFってなに? ⾝近にあるRDFの応⽤ •RSS (RDF site summary) –ブログやニュースフィードとかに使われてる。更新情報をまとめ て配信するフォーマット • Webサイトの要約をRDFの形式で記述したもの •FOAF (Friend of a Friend) Project –⼈間に関する情報をRDF化して検索対象とするプロジェクト • 何⼈の友達を辿ってXXに辿りつけるかみたいのがわかるように
  53. 53. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDFってなに? RSSの例 (RDF/XML の記述になっている) <?xml version="1.0" encoding="utf-8"?> <?xml-stylesheet href="../../../../../css/rss/feedRss1.xsl" media="screen" type="text/xsl"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns="http://purl.org/rss/1.0/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" xmlns:content=http://purl.org/rss/1.0/modules/content/ xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/" xmlns:dc=http://purl.org/dc/elements/1.1/ xmlns:syn="http://purl.org/rss/1.0/modules/syndication/" xmlns:admin="http://webns.net/mvcb/"> <channel rdf:about="http://science.slashdot.jp/"> <title>スラッシュドット・ジャパン: サイエンス</title> <link>http://science.slashdot.jp/</link> <description>アレゲなニュースと雑談サイト</description> ...... <中略> <item rdf:about="http://science.slashdot.jp/story/14/09/16/0445242/"> <title>中国の考古学者、ジュラ紀の「神獣」の化石を発見?</title> <link>http://science.slashdot.jp/story/14/09/16/0445242/</link> <description>中国で新たに発見されたハラミヤ目の標本に「陸氏神獣」、「玲瓏仙獣」、「宋氏仙獣」</description> <dc:creator>hylom</dc:creator> <dc:date>2014-09-16T21:00:00+00:00</dc:date> <dc:subject>science</dc:subject> . .... </item> http://science.slashdot.jp title スラッシュドット・ジャパン: サイエンス link http://science.slashdot.jpアレゲなニュースと雑談サイト description
  54. 54. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDFってなに? 書き⽅については⾊々 • XMLをベースとしたもの(RDF/XML) • ⾏ベースでの記述⽅式 (N-Triples) • 独⾃フォーマット (Notation3/Turtle)
  55. 55. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDF (N-Triples) の例 <http://ja.dbpedia.org/resource/夢路いとし> <http://xmlns.com/foaf/0.1/name> "夢路 いとし"@ja . <http://ja.dbpedia.org/resource/夢路いとし> <http://xmlns.com/foaf/0.1/name> "夢路いとし・喜味こいし"@ja . <http://ja.dbpedia.org/resource/夢路いとし> <http://dbpedia.org/ontology/birthName> "篠原 博信"@ja . <http://ja.dbpedia.org/resource/夢路いとし> <http://dbpedia.org/ontology/birthName> "いとし先⽣"@ja . <http://ja.dbpedia.org/resource/夢路いとし> <http://dbpedia.org/ontology/birthPlace> <http://ja.dbpedia.org/resource/神奈川県> . <http://ja.dbpedia.org/resource/夢路いとし> <http://dbpedia.org/ontology/genre> <http://ja.dbpedia.org/resource/漫才> . <http://ja.dbpedia.org/resource/夢路いとし> <http://dbpedia.org/ontology/influencedBy> <http://ja.dbpedia.org/resource/荒川芳丸> . <http://ja.dbpedia.org/resource/夢路いとし> <http://dbpedia.org/ontology/notableWork> <http://ja.dbpedia.org/resource/がっちり買いまショウ> . <http://ja.dbpedia.org/resource/夢路いとし> <http://dbpedia.org/ontology/notableWork> <http://ja.dbpedia.org/resource/バラエティー⽣活笑百科> . <http://ja.dbpedia.org/resource/原哲夫> <http://xmlns.com/foaf/0.1/name> "原哲夫"@ja . <http://ja.dbpedia.org/resource/原哲夫> <http://dbpedia.org/ontology/nationality> <http://ja.dbpedia.org/resource/⽇本> . <http://ja.dbpedia.org/resource/原哲夫> <http://xmlns.com/foaf/0.1/homepage> <http://www.haratetsuo.com/> . <http://ja.dbpedia.org/resource/原哲夫> <http://dbpedia.org/ontology/genre> <http://ja.dbpedia.org/resource/少年漫画> . <http://ja.dbpedia.org/resource/原哲夫> <http://dbpedia.org/ontology/notableWork> <http://ja.dbpedia.org/resource/北⽃の拳> . <http://ja.dbpedia.org/resource/原哲夫> <http://dbpedia.org/ontology/notableWork> <http://ja.dbpedia.org/resource/花の慶次> . <http://ja.dbpedia.org/resource/原哲夫> <http://dbpedia.org/ontology/notableWork> <http://ja.dbpedia.org/resource/蒼天の拳> . 夢路いとし 神奈川県birthPlace 漫才ジャンル
  56. 56. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | SPARQL どうやって、データを探すの? そのための問い合わせ⾔語が SPARQL (すぱーくる) (SPARQL Protocol And RDF Query Language) SQLとパッと見、似た名前
  57. 57. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | SPARQL なんとなく SQLに似てます。 "お市の⽅"の兄弟を検索 (by ja.dbpedia.org) PREFIX dbpedia-owl: <http://dbpedia.org/ontology/> PREFIX ja-prop: <http://ja.dbpedia.org/property/> SELECT * WHERE { ?s a dbpedia-owl:Person . ?s ja-prop:兄弟 <http://ja.dbpedia.org/resource/お市の⽅> . } RDFのURLは⻑いし、 何回も書いたりするので、 PREFIXを使って aliasみたいなことができます 別にPREFIX使わないで 普通に書いてもいいです
  58. 58. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | SPARQL お市の⽅ 兄弟 ? SELECT * WHERE { ?s a dbpedia-owl:Person . ?s ja-prop:兄弟 <http://ja.dbpedia.org/resource/お市の⽅> . } お市の⽅と兄弟の⼈は? Person (人) クラス
  59. 59. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | クエリーの結果は、、、、 SPARQL PREFIX dbpedia-owl: <http://dbpedia.org/ontology/> PREFIX ja-prop: <http://ja.dbpedia.org/property/> SELECT * WHERE { ?s a dbpedia-owl:Person . ?s ja-prop:兄弟 <http://ja.dbpedia.org/resource/お市の⽅> . } s http://ja.dbpedia.org/resource/織田信長 http://ja.dbpedia.org/resource/織田信行 http://ja.dbpedia.org/resource/織田信興 http://ja.dbpedia.org/resource/織田長利 http://ja.dbpedia.org/resource/織田秀成 http://ja.dbpedia.org/resource/織田信照 http://ja.dbpedia.org/resource/織田信治 http://ja.dbpedia.org/resource/織田信包
  60. 60. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 宮崎駿の作品にでている人の配偶者の職業
  61. 61. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDFデータへのアクセス SPARQLクエリ @ja.dbpedia.org • http://ja.dbpedia.org/sparql • 宮崎駿 Oracle Confidential – Internal/Restricted/Highly Restricted 61 <http://ja.dbpedia.org/resource/宮崎駿> .宮崎駿
  62. 62. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDFデータへのアクセス SPARQLクエリ @ja.dbpedia.org • http://ja.dbpedia.org/sparql • 宮崎駿の作品 Oracle Confidential – Internal/Restricted/Highly Restricted 62 select * where { ?movie dbpedia-owl:director <http://ja.dbpedia.org/resource/宮崎駿> . } movie 宮崎駿 dbpedia-owl:director
  63. 63. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDFデータへのアクセス SPARQLクエリ @ja.dbpedia.org • http://ja.dbpedia.org/sparql • 宮崎駿の作品にでている人 Oracle Confidential – Internal/Restricted/Highly Restricted 63 select * where { ?movie dbpedia-owl:director <http://ja.dbpedia.org/resource/宮崎駿> . ?movie dbpedia-owl:starring ?cast . } movie 宮崎駿 dbpedia-owl:director dbpedia-owl:starring ?cast
  64. 64. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDFデータへのアクセス SPARQLクエリ @ja.dbpedia.org • http://ja.dbpedia.org/sparql • 宮崎駿の作品にでている人の配偶者 Oracle Confidential – Internal/Restricted/Highly Restricted 64 select * where { ?movie dbpedia-owl:director <http://ja.dbpedia.org/resource/宮崎駿> . ?movie dbpedia-owl:starring ?cast . ?cast prop-ja:配偶者 ?partner . } movie 宮崎駿 dbpedia-owl:director dbpedia-owl:starring ?cast ?partner prop-ja:配偶者
  65. 65. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDFデータへのアクセス SPARQLクエリ @ja.dbpedia.org • http://ja.dbpedia.org/sparql • 宮崎駿の作品にでている人の配偶者の職業 Oracle Confidential – Internal/Restricted/Highly Restricted 65 select * where { ?movie dbpedia-owl:director <http://ja.dbpedia.org/resource/宮崎駿> . ?movie dbpedia-owl:starring ?cast . ?cast prop-ja:配偶者 ?partner . ?partner dbpedia-owl:occupation ?job .} movie 宮崎駿 dbpedia-owl:director dbpedia-owl:starring ?cast ?partner prop-ja:配偶者 ?job dbpedia-owl:occupation
  66. 66. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDFデータへのアクセス SPARQLクエリ @ja.dbpedia.org Oracle Confidential – Internal/Restricted/Highly Restricted 66 movie cast partner job dbpedia-ja:⾵⽴ちぬ_(2013年 の映画) dbpedia-ja:庵野秀明 dbpedia-ja:安野モヨコ dbpedia-ja:漫画家 dbpedia-ja:紅の豚 dbpedia-ja:⼤塚明夫 dbpedia-ja:沢海陽⼦ dbpedia-ja:声優 dbpedia-ja:ハウルの動く城 dbpedia-ja:⼤塚明夫 dbpedia-ja:沢海陽⼦ dbpedia-ja:声優 dbpedia-ja:ハウルの動く城 dbpedia-ja:⽊村拓哉 dbpedia-ja:⼯藤静⾹ dbpedia-ja:歌⼿ dbpedia-ja:千と千尋の神隠し dbpedia-ja:夏⽊マリ dbpedia-ja:斎藤ノヴ dbpedia-ja:パーカッショニ スト dbpedia-ja:ハウルの動く城 dbpedia-ja:倍賞千恵⼦ dbpedia-ja:⼩六禮次郎 dbpedia-ja:作曲家 dbpedia-ja:ハウルの動く城 dbpedia-ja:倍賞千恵⼦ dbpedia-ja:⼩六禮次郎 dbpedia-ja:編曲家 • こんな結果になりました ※クエリ結果が少ないのはdbpedia側に配偶者や職業データの ⽋落が多いことに起因しています(>_<)
  67. 67. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Agenda § Oracle Spatial and Graph § Linked Dataってなに § RDF Semantic Graph
  68. 68. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Graph Features - RDF Semantics Graph RDFセマンティックテクノロジーの実装 • 機能 – SPARQL 1.1 対応のRDFトリプルストアとして動作 – RDB2RDF の変換プロセッサ(DM,R2RML)とRDFビュー機能 – 推論エンジン機能 • RDF/RDFS/OWL/SKOS標準ボキャブラリ対応、ユーザ定義推論 • 特⻑ – 1兆トリプルを捌く #1 ⼤規模トリプルストア – 既存データ,RDBユーザに優しい • RDBからの変換、SQL内にSPARQLを記述可能、RDFビュー – 企業・軍情報機関での利⽤に耐える本格実装 • セキュリティ、推論結果の扱い、モデル単位の管理、仮想モデル 概要
  69. 69. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 事例 Cisco WebEX Eli Lilly Allied Nations EU出版局
  70. 70. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Cisco WebEx Social Oracle Spatial and Graph による社内コラボレーションの促進 目的 § 意味的関係から⼈と⼈のつながり、コラボ レーションの創出を狙いたい § サイロ化した知⾒を引きずり出したい ソリューション § 永続的、且つ統合されたグラフのメタデー タモデルを構築 § 概念に対して固有の意味によるタグ付 § 意味的つながりや レコメンデーション を 辿ることにより関連したコンテンツ、グ ループの発⾒ 得られた利点 § フォーラム、ブログ、wikiなどの各種コンテンツ間で 統合されたメタデータモデル § メディア、ドキュメント、写真、ブログなどのコンテ ンツに対する企業内の⽤語やユーザ定義によるタグ付 § タグの意味的、構造的な整合性のチェック
  71. 71. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Graph Database | Eli Lilly様 目的 § 調査、研究、実験の効率化のため統一化された "ボキャブラリー" を構築 § 新薬開発のアイデア出し効率化と事前チェック 完全化 解決策 § 臨床試験記録、化学物質構成情報、遺伝子シーケンス、パ スウェイ、画像、化学論文データ等の統合ビュー § 関連するデータをグラフ(ネットワーク)として分かりやすく表 示 § グラフを横断的に自由に移動し新たな関係性を発見。語彙 検索。オントロジーブラウズ “[This technology…] provides improved insight into our business by bringing together related information from diverse data sources,” J. Phil Brooks Information Consultant, Eli Lilly and Company
  72. 72. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Graph Database | Eli Lilly様
  73. 73. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | セマンティック検索のクエリー例 意味的基盤の構築によって可能になったクエリ • ⼤腸がんに含まれるメチラーゼのすべての相互作⽤を同定 • RNAiのデータでDharmacon社の試薬を使⽤して⽣成された細胞株を検索 • MCF7におけるAKT1経路活性を評価するために使⽤された抗体を取得 • ⾃分のサンプルを使った全ての実験を検索 • グレードIIIの結腸直腸癌であるすべてのサンプルを検索し、発現、変異との aCGHデータを取得 Oracle Confidential – Internal/Restricted/Highly Restricted 73
  74. 74. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Business Challenge • 社内のデータと情報データベース(遺伝 ⼦・タンパク質・代謝経路・化合物・リガ ンドなど)の連携 • 社内外のデータの活⽤、検索、ナビゲート、 共有による⽣産性の向上 Solution • 160万語に及ぶ⼤量の術語(⽣物学、化学、 医学) • RDFグラフの利⽤による意味的統合 • 術語ハブ:データレポジトリ間を相互参照 するために8Gbもの参照⽤データ 事例: RDFを活用した統合データ基盤の構築
  75. 75. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |Oracle Confidential – Internal/Restricted/Highly Restricted 75 MetaStore III
  76. 76. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Graph Database | Allied Nation § 通話記録、Email、SNS情報から容疑者を推測 § Produce “data products” for analysts § 個人、グループや位置などの関連性を明らかに する § 個人やグループ間の関連性を明らかにする 偽名、暗号、専門用語の意味を明らかに § 業界標準テクノロジー: W3C RDF & SPARQL § 600 TB、10億行のトリプルストア § セキュリティを担保 - ファイングレイン監査機能をトリプルストアに実装 § 1億行 / 月のペースでデータ量が増加 § Find & label “same-as” relationships 目的 解決策 導入効果 SCREEN ONLY
  77. 77. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | EU Publications Office (欧州委員会出版局) 欧州連合の Linked Open Data(LOD) プラットフォーム 目的 § 共通メタデータモデルでの情報公開: § EU からの全てのアナウンスメントの検索と発見 § 複数の言語とドメイン ソリューション § Validate and tag EU law, tenders, and publicity to standardized vocabularies § Unified RDF graph metadata model § Supports discovery of content through user’s terminology and language § Provides variety of dissemination modes § Evolving data model that flexibly supports a variety of business use cases § Scalability: § Over billion RDF triples in Oracle Graph DB § 2.5 TB of compressed data in Oracle DB § Links to 3.9 TB (60M) files of EU pubs § Reliability and maintainability § Oracle ASM (Automatic Storage Management) § Two failover systems 得られた利点
  78. 78. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
  79. 79. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | § Appendix
  80. 80. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Transform & Modeling Tools • RDF/OWL Data Management • SQL & SPARQL Query • OWL Inferencing • Semantic Rules • Scalability & Security • Semantic Indexing • Java, HTTP access • JSON output • Graph visualization (Cytoscape) • Oracle Advanced Analytics • Oracle Business Intelligence (OBIEE) • Map (GIS) Visualization Load, Query & Inference Applications & Analysis Tools Other Data Formats RSS, email Transaction Systems Data Sources Unstructured Content R2RML Protégé for Oracle Jena for Oracle Sesame for Oracle NLP Extraction (partners) Oracle Database 12c Oracle Database 12c Spatial and Graph Tooling
  81. 81. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Spatial & Graph12c RDF Semantic Graph Leverages Oracle Manageability: • RAC & Exadata scalability • Compression & partitioning • SQL*Loader direct path load • Parallel load, inference, query • High Availability • Triple-level label security • Ladder based inference • Choice of SPARQL, SQL, or Java • Native inference engine • Enterprise Manager • Native RDF graph data store • Manages 10s of billions of triples • Relational to RDF mapping • SPARQL-Jena/Joseki, Sesame • SQL/graph query, B-tree indexing • Ontology assisted SQL query • RDFS, OWL2 RL, EL+, SKOS • User-defined rules • Incremental, parallel reasoning • User-defined inferencing • Plug-in architecture Load / Storage Query Reasoning • Semantic indexing framework • OBIEE •Oracle Advanced Analytics •SPARQL Property Paths Analytics
  82. 82. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Linked "Open" Data クロスドメイン (DBpedia, Freebase) ライフサイエンス (UniProt, Bio2RDF) 地理 (Geonames) 出版物 (米議会図書館, 独国立経済学図書館) メディア (BBC, New York Times) 政府 (data.gov, data.gov.uk)
  83. 83. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 補足資料 § グラフの種類
  84. 84. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | グラフ補足:グラフには色々な種類があります グラフには様々な特徴のあるモデルがあります 無向グラフ 有向グラフ プロパティグラフ RDFグラフ 表現⼒ 低 ⾼ 難易度 低 ⾼ 関係の種類 1種類 多数 84 プロパティグラフの例 尊敬(10) 信頼(3) 旧友(1) 尊敬(8)殺意(10) 重みつき 無向 グラフの例 5 4 3 便利(8)
  85. 85. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 無向グラフ 方向が無いグラフ • 点と線の最もシンプルなグラフ • 特定の関係の有無を表現することができる • コスト(重み)をもたせると少し表現⼒が上がり関係の強弱が表現できる • 仲良し度と数値化して⾼いと太い、近いなど • 例 – FacebookなどのSNSの知⼈関係 – 地下鉄の路線図 Oracle Confidential – Internal/Restricted/Highly Restricted 85 重みつき 無向 グラフの例 5 4 3 [Oracle 製品での実装] Network Data Model Graph ( Oracle Spatial and Graph Option)
  86. 86. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 有向グラフ 方向つきグラフ • 線に⽅向がある • 相互の関係を分けて表現できる • また線にコスト(重み)をもたせると少し表現⼒が上がり強弱が表現できる • 例:好意を数値化(⽉間の電話回数など、、) • 例 – じゃんけんの勝敗関係 – Twitterのフォロー関係 – ⼀⽅通⾏のある道路、経路 – 化学物質、原⼦の状態偏移 – 楽曲構成 Oracle Confidential – Internal/Restricted/Highly Restricted 86 3 7 3 6 2 重みつき 有向グラフの例 [Oracle 製品での実装] Network Data Model Graph ( Oracle Spatial and Graph Option)
  87. 87. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 複数の方向と関係の中身を表現したグラフ(マルチリレーショナルグラフ) • 関係を⽂字で直接表記できる • 同じノードに対して複数の関係を表現できる • 関係の中に属性を付与できる • 例 – 雑誌などの⼈物相関図 Oracle Confidential – Internal/Restricted/Highly Restricted 87 尊敬 信頼 便利 尊敬殺意 便利 旧友 マルチリレーショナルグラフの例 ラベル付有向グラフ [Oracle 製品での実装] Network Data Model Graph RDF Semantic Graph(部分利⽤) ( Oracle Spatial and Graph Option)
  88. 88. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | プロパティグラフ 関係の中身を表現することに特化したグラフ • 関係を直接表記し属性を与えれる • 同じノードに対して複数の関係を表現できる • 関係⾃体に⾊々な情報を付与できる • より複雑な関係の表現が可能 • ⼈の⽬にやさしい • 例 – 雑誌などの⼈物相関図 – 多重債務状況の図⽰ Oracle Confidential – Internal/Restricted/Highly Restricted 88 尊敬(10) 信頼(6) 便利(6) 尊敬(7)殺意(10) 便利(8) 恐怖(3) プロパティグラフの例 消費者 金融A Aさん 消費者 金融B 消費者 金融C 融資 ⾦額:50万円 ⾦利:8% 融資 ⾦額:20万円 ⾦利:11% Bさん 融資 ⾦額:120万円 ⾦利:5% 贈与 ⾦額:200万円 [Oracle 製品での実装] Property Graph (Oracle Big DataSpatial and Graph)
  89. 89. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDFセマンティックグラフ 多彩な関係を定義し、概念による意味の補足が可能に • 概念(オントロジー)を持てる • 柔軟性と再利⽤性のバランス – URI表記の利⽤による再利⽤性 – オントロジーによる • w3cで標準化されている • 同様の形式のLOD(※)と連結できる • 機械に優しい(⾃動処理に向く) • 例 – DBpedia (wikipediaのRDF版) – MusicBrainz – RSS Oracle Confidential – Internal/Restricted/Highly Restricted 89 尊敬 信頼 便利 尊敬殺意 便利 旧友 RDFセマンティックグラフの例 戦国大名 歴史上の人物 rdfs:type rdfs:subclassOf rdfs:type rdfs:type rdfs:type [Oracle 製品での実装] RDF Semantic Graph ( Oracle Spatial and Graph Option) ※LOD:Linked Open Dataの略称で 外部公開されているリンクデータ
  90. 90. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDFセマンティックグラフとプロパティグラフ • プロパティグラフの表現⼒、柔軟性は⾮常に⾼い – 分析⽤のデータモデルとしては⾮常に良い – ⼈間の⽬で⾒て分かり易く、扱いやすいモデル • RDFセマンティックグラフはデータの再利⽤性、可搬性に対する配 慮が⾼い。 – w3cで標準化されているため他のデータソース(LOD)との連結が容易 – オントロジーによる意味、概念的な情報抽出や処理が可能 – 推論機能による情報への補完や修正が可能 – コンピュータでの⾼度な処理に向いたモデル Oracle Confidential – Internal/Restricted/Highly Restricted 90
  91. 91. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | RDFセマンティックグラフとプロパティグラフ データモデルとしての使い分け Oracle Confidential – Internal/Restricted/Highly Restricted 91 RDFセマンティックグラフ プロパティグラフ 表現⼒ ⾼い ・マルチリレーショナルグラフ形式 ・オントロジーによる概念記述 ⾮常に⾼い ・ノード、エッジともにKVストアを持っている ような状態 柔軟性 ⾼い ・新たな関係性は新規トリプルとして追加 ⾮常に⾼い ・プロパティでの追加も利⽤できる データの可搬性 ⾼い ・w3cで標準化された規格 普通 ・設計は利⽤者による データの再利⽤性 ⾼い ・URI記述ルール 普通 ・同⼀モデル内では問題なく利⽤可能 探索・クエリー 標準規格がある ・w3cで標準化されたSPARQLによる問い合 わせが可能 鋭意発展中 ・標準的なアクセス⼿段を提供するライブラリ (Gremlin)の開発が進んでいる 永続的にストアされるデータモデル 柔軟な分析用のデータモデル
  92. 92. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 分析・可視化(Property Graph) データ ストア (RDF) 様々な切り⼝でのグラフ分析を可能に Oracle Confidential – Internal/Restricted/Highly Restricted92 多⾯的な分析を可能にします RDF Semantic Graph Facebook/Twitter/ Google+の⼈間関係に注 ⽬ 物の所有者や譲渡関係に注 ⽬ 電話、待ち合わせなどの 接触イベントに着⽬ 分析・可視 化 (Property Graph) S&G (PGX) on BDA データ ストア (RDF) S&G 外部 LOD 外部 RDF ストア RDFによる横断的データストア
  93. 93. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 3つのグラフと領域 Oracle Confidential – Internal/Restricted/Highly Restricted 93 グラフ理論 地理学 NDM 知識表現 オントロジ工学 RDF 社会学 ネットワーク論 PG グラフ理論は⽅法論として 様々な領域で利⽤されてい ます。 その領域の特徴によって、 加味される技術的な要素も 変わっています。 これらのグラフモデルに対 して最適な実装をするため に別なデータモデルとして 提供しています
  94. 94. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 3つのグラフと領域 Oracle Confidential – Internal/Restricted/Highly Restricted 94 グラフ理論 地理学 NDM 知識表現 オントロジ工学 RDF 社会学 ネットワーク論 PG 地球の上のリアルなネットワークを 取り扱う ポイント: ・地表⾯(球体)における距離 ・測地系の差異をまだくグラフ ・時間や状況によって構造が変化 例えば、地球上の正確な距離計 算には、地球を近似する回転楕 円体の情報や海⽔⾯の情報、上 空や地下であれば、その標⾼な どを加味したそれなりの演算が 必要です
  95. 95. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 3つのグラフと領域 Oracle Confidential – Internal/Restricted/Highly Restricted 95 グラフ理論 地理学 NDM 知識表現 オントロジ工学 RDF 社会学 ネットワーク論 PG 巨⼤情報を意味的に正しく取り扱う。 有形・無形の知識をコンピュータ上で表現していくために形式論理学的な表現を解釈し、推論などの⾏い、 論理的な整合性を担保しつつ、柔軟な管理を可能にする ポイント: ・莫⼤なデータ量 ・標準的な知識表現の解釈(推論) ・⾼速なアクセス ・標準技術への対応 w3c勧告の様々な標準仕様が存在している。 RDFS(RDF Schema): RDF⽤のスキーマ記述⾔語 OWL (Web Ontology Languadge):オントロジ記述⾔語と語彙。集合論 と形式論理学な⾵味(バージョンやセットによって利⽤できる語彙に違いが ある) SKOS(Simple Knowledge Organization System): 分類学的なアプ ローチによる知識表現語彙 SPARQL:RDFに対する標準クエリ⾔語
  96. 96. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 3つのグラフと領域 Oracle Confidential – Internal/Restricted/Highly Restricted 96 グラフ理論 地理学 NDM 知識表現 オントロジ工学 RDF 社会学 ネットワーク論 PG 社会や⾃然界にあるグラフ構造の解析を⽬的として いる。 構造を定量的に把握するための様々な指標やその解釈、分 析アルゴリズムがある。 ポイント: ・構造を定量化、可視化 ・構造に対する分析に特化 ・構造に対する解釈を踏まえたアルゴリズム ⼀般的によく⾔われる社会ネットワークの性質 スモールワールド性:任意の2つの頂点が、中間にわずかな数の頂点 を介するだけで接続される クラスター性:現実世界のネットワークには三⾓形(相互に知り合い、 相関がある)が沢⼭含まれている スケールフリー性:接続が偏在化していて、⼤多数の頂点はごく⼀部 の頂点としか接続していない 構造の定量化の例 中⼼性:ネットワーク内で中⼼的な役割を果たしている頂点を数値化 した指標。中⼼性の考え⽅により、次数中⼼性、媒介中⼼性、固有ベ クトル中⼼性など様々な算出⽅法がある
  97. 97. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | 姉妹品のご紹介 Oracle Big Data Spatial and Graph • Spatial and Graph機能が BDA(Big Data Appliance) 環境でもご利 ⽤頂けます • データベースのSpatial and Graph オプションと⼀部機能、利⽤⽅ 法に差異がございます – データの蒸留⼯程や⼤規模な分散環境を意識した実装 – Spatial • データエンリッチメントやイベント判定に特化 – Graph • 分散環境下でのグラフ分析に特化 Oracle Confidential – Internal/Restricted/Highly Restricted 97 姉妹品
  98. 98. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Big Data Spatial and Graph ORACLE CONFIDENTIAL Property Graph Spatial Big Data に 新しい分析機能をもたらす新機能 Oracle Technology Network product page: http://www.oracle.com/technetwork/database/database-technologies/bigdata-spatialandgraph/ 適⽤領域 • ソーシャルメディア分析 • IoT • サイバーセキュリティ ⾼い表現⼒をもって分析に 適したモデルを提供するプ ロパティグラフに⾼度なグ ラフ分析関数を多数実装し た新機能 空間データベースとして 最⼤⼿かつ実績豊富な Oracleが提供する空間演 算関数をBig Dataイン フラ上で提供 適⽤領域 • 近傍情報、ジオフェンス判定 • 位置情報への付帯情報の付加 • 空間データ、ラスタ(画像)データの加⼯・ 準備 姉妹品
  99. 99. Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Spatial and Graphオプション • Oracle Database EEのオプション – Exadata Database Machine • 位置付け – 永続的データストア – ⼤規模、⾼度な分析基盤 • 空間機能 – ⾼度な地理・空間分析機能 • グラフ機能 – RDFセマンティックグラフ – ネットワークデータモデル(地理空間向け) Big Data Spatial and Graph • Big Data 基盤⽤のオプション – Big Data Appliance • 位置付け – グラフ分析基盤 – (未整理データの保管と前処理) • 空間機能 – ⽐較的軽い空間演算処理の実装 • グラフ機能 – プロパティグラフ – 並列グラフ分析エンジン(PGX) Spatial and Graph と Big Data Spatial and Graphの違い 姉妹品

×