SlideShare a Scribd company logo
1 of 14
みんなで創る音声アシスタント:花之声
    ~あなたのつぶやきがオープンデータになる~




1
研究の背景
  近年,新規ITビジネス創出の期待からオープンデータに注目
   政府系,バイオ系,スマートシティ向けにデータ公開が進む
  一般に普及させるにはWebプログラマへのアピールが重要
   まずはどんなデータがあるか見てもらう⇒知ってもらう⇒使ってもらう
   …SPARQLは難しい,全文検索は断片化したデータにうまく当たらない
  もっと簡単に検索したい!
   データはトリプル,質問文(検索文)もトリプルにしてマッチングしては?
   質問文の<S, V, ?O>に合うLODの<instance, property, value>を検索
   ついでに,発話文からデータの登録もできればよいのでは?
   ついでに,発話文からデータの登録もできればよいのでは
           からデータ   もできればよいのでは?
  つぶやきをLOD化することで,検索や既存データとの連携が容易になる!?
  つぶやきをLOD化することで,検索や既存データとの連携 容易になる
                      データとの連携が  になる!?



 みんなで創るオープンデータによる音声アシスタント
※LOD(Linked Open Data):全世界に360億トリプル,Wikipediaも含む
                       ピンポイント情報検索の知識源として最適
オープンデータによる質問応答システムの実現に向けた
問題点とアプローチ
1. ユーザ質問文とLODスキーマとのマッピング

ユーザフィードバックによるマッピング候補の学習と精度向上
①シードとなる{述語, プロパティ}マッピングをKVSに事前登録,未知の動詞はWordnetで語彙
 を展開・英訳して,既知の述語,プロパティとLCS(Longest Common Substring)を計算
②主語に該当するリソースが検索された場合は,全プロパティと英訳した述語とのLCSを計算,
 暫定ランキングを構成
③ユーザがどのプロパティ値を参照したかをサーバーにFBして,未知のマッピングを動的に獲得
④登録済みマッピングに関しても,ユーザからのFB数に基いて信頼度を更新


2. LODデータの追加登録・拡充


ユーザ参加型・ソーシャル活用の仕掛け作り
✔自然文からのトリプル抽出により,誰でも簡単に追加登録可能に!
 登録データを自分で利用できる&人に利用してもらえる(登録者のTwitter IDをCreatorとして表示)
✔個人のライフログ(記録・記憶)の登録・検索も可能に!
✔一般情報や専門的情報はCRF(Conditional Random Fields)を用いてWebページから自動抽出
応用事例
 一般情報検索
 現在,DBpediaには10億超のトリプルが登録されており,Wikipediaの
 (一部)ピンポイント検索が可能
 フィールドワーク支援
 屋外での情報検索/記録/共有/提供に活用
 例)農作業,エレベータ保守,プラント点検,山歩き,震災時避難,旅行,
 Twitter連動
 クチコミやライフログの記録,共有を目的に,特定のハッシュタグでつぶやく
 と自動的にトリプルが抽出されLOD登録,ハッシュタグで質問するとLOD
 (過去のつぶやき)検索など.



フィールドでのLOD活用【第2弾】※
花之声:ガーデニング作業時の各種疑問に答える音声アシスタント
                       ※第1弾「花咲かめら」:LODチャレンジ2011応募作品
「花之声」とは
  スマートフォンを用いた園芸・農作業時の情報検索・作業記録システム
    ・・・発話意図を自動的に4分類(定性・記録×検索・登録※)
                                                                 ※作業の記録が精密農業の基本(農水省)




                       LOD検索結果 Google検索結果
          定性                                現状,LODプロパティを               定性
                                            直接表示
          検索                                                           登録



「インパチェンスはいつ咲くの?」⇒花期:5月                                       「ゼラニウムは一年草です」⇒一年草:True




          記録                                                           記録
          登録                                                           検索



「チューリップに肥料をやったよ」⇒施肥日:10/12                                 「いつチューリップに肥料あげたっけ」⇒施肥日:10/12
                                                      周りに人がおらず,手が汚れて
                                                      いるので音声操作が向いている
「花之声」ユースケース1 - ピンポイント(芋づる)検索

      その場で知りたいことにピンポイントで回答

 インパチェンスの花期はいつ
                        「5月」
                        from Plant LOD
(いま5月だし,なんで咲かないのかな…)

 インパチェンスの葉に白い
 斑点があるのはなぜ?
                        「うどんこ病」
                        from Plant LOD
(そのせいか,でも聞いたことはあるけど…)


 うどんこ病ってなに?
                        「うどんこ病子嚢菌のウドン
                        コカビ科の純活物寄生…」
                        from DBPedia
「花之声」ユースケース2 - ユーザ参加型登録

            ユーザが互いに知り得た情報を共有
生態調査的登録
                       去年,コマクサが咲いたの
今日,コマクサが    今日,チングルマ
咲きました       が咲いたよ
                       はいつかな?
ウスユキソウが咲    クロユリが咲いて
いたよ         たよ
                       「5月25日」
今日,コマクサが
枯れちゃった
            チングルマが実を   from @twitter_ID
            付けたよ


知恵袋的登録
            アブラムシの退    最近,ウメの葉に斑模様
 コチョウランには
 液体肥料がいい
            治にはにんにく    があるんだけど?
            汁がいいです
 ですよ
ウメの葉がまだら    プリムラには肥料
になったら新種の    は要りません
プラムポックスウ
                       「プラムポックスウイルス」
            インパチェンスは   from @twitter_ID
イルスかもしれま
            この時期に切り
せん
            戻してください
                        ※登録情報には登録者のtwitter IDを付記
「花之声」公開サイト




       lodmashups.appspot.com
サービス構成
                      クラウドサイド
                                                    Google          Google
                                                音声認識              Web検索
                          ②ユーザ参加型登録

                                                                    Yahoo!
                                                                 形態素解析
 音声
                                          発話をトリプル(S,V,O)
                                          発話をトリプル
 入力
                                         に起こしてLOD検索・登録
                                         に起こしてLOD検索・登録
(または    HTML5
                                         植物検索        植物登録
キー入力     CSS3                            クエリー        クエリー
       JavaScript           Google App                            LOD DB
                    質問文
                              Engine
                                         (SPARQL)    (SPARQL)                           LOD
 LOD    (jquery)                                                  SPARQL
検索結果
             検索結果            for Java         植物LOD               endpoint              Cloud
  +
Google
       スマートホン ユーザ            (GAE/J)          (RDF)                                   (植物LOD)
検索結果 クライアント    FB
                            アプリケーション
                              サーバー        述語・Propertyマッピング
                                          述語・Propertyマッピング
                                            ユーザFB登録
                                            ユーザFB登録                 Google
                                                                   BigTable
                                                                {述語, Property, 信頼度}

                      ①ユーザFBによる未知語           シソーラス展開
                         の獲得と学習
                                                    NICT          Microsoft
                                              Wordnet検索              翻訳
植物LOD概要
   DBPediaオントロジーPlantクラスのインスタンス10000超に国内種104を追加
          プロパティは既存の300に育成の観点から新たに37を追加

owl: Thing                                                                                         rdfs:
                                                                                                                        plant name
                                                                                                   label
           rdfs:subClassOf
                                                                                                   rdfs:                   plant
         dbpedia-owl:                                                                              comment
                                                                                                                         description
           Species
                             dbpedia:       dbpedia:         dbpedia:
                                             Beech                                                 gtcprop:
               dbpedia:       Cherry                          Apple                                                    flower season
                                                                              gtc:                 flowerMonth
              Dendrobium
                                                                            Bamboo
      dbpedia:                 dbpedia-owl:       rdf:type                            gtc:
       Erica                                                                                       gtcprop:            fertilizer
                                Eukaryote                                             Rise
  dbpedia:                                                                                         fertilizingAmountapplication level
                              rdf:type                          rdf:type                  gtc:
   Fennel
                                          dbpedia-owl:                                    Rose
dbpedia:          rdf:type                                                                         gtcprop:            ratio of three
 Guava                                         Plant                     rdf:type           gtc:   fertilizingElement fertilizer elements
 dbpedia:                                                                                 Violet
                                rdf:type                                                           gtcprop:
Hydrangea                                              dbpedia-owl:                      gtc:                              pruning
    dbpedia:                                                                            Saffron    pruningMonth
                                                                                                                           season
   Impatiens                                 rdf:type FloweringPlant             gtc:
             dbpedia:                                                           Petunia
          Jasmine_heathdbpedia:                                     gtc:                           gtcprop:             disease and
                                       dbpedia           gtc:     Pakira                           hasWhiteSpot             pest
                          Kenaf
                                   Lupinus_albus       Xmasrose
                                                                                                   foaf:
                                                                                                                         2D image
                                                                        PREFIX太字:追加分               depiction
拡張機能
 SPARQL endpoint変更機能
 植物LOD以外のデータを音声検索する機能(試験実装)
 但し,検索のみ,非対応サーバーあり(サーバーによっては遅いので注意)
 動作確認済みendpoint
     日本語DBpedia(ja.dbpedia.org/sparql)
     例) 「Siriって何?」,「Siriは誰が作ったの?」
     Dataシティさばえ(lod.ac/sabae/sparql)
     例) 「西山公園の住所は?」
     ヨコハマ・アート・LOD(archive.yafjp.org/test/inspection.php)など
     例) 「ピカソのイベントの場所は?」

• {述語,プロパティ}マッピング手動登録機能
 ユーザが明示的に述語とプロパティのマッピングを登録する機能
 検索対象プロパティが3候補以内に出てこない場合,{述語,プロパティ}
 の組みをインプットフィールドを通じてKVSに登録,次回検索時より反映

   LODに関する多少の知識があるユーザを対象としたもの
 機能を開放することでユーザ参加型での面白い使い方を探したい
まとめと今後の進め方
オープンデータ利活用促進を目指し,一般ユーザ向けLOD検索・
登録サービス(音声アシスタント)を開発
 応用事例として,フィールドワーク支援アプリを開発
 フィールドワークに適したピンポイント情報提供に加えて,ユーザFBを
 用いた精度向上,ユーザ参加型の未知データ獲得の仕掛け,等に特徴
 今後,LODを使ったサービスの可能性を示したい
 ユーザ参加促進の仕掛け作り,および評価
 反応を探りながら,他ドメインへの展開を検討

制限事項
抑揚は認識できないため,肯定文か疑問文かはliteralに表現要
複雑なクエリーは分割して質問(屋外で複雑な質問はしないという想定)
現状はS,VからO,Cを検索(逆検索は実装中)
【付録】登録植物例
 アキニレ     クリスマスローズ   ジンチョウゲ      ツユクサ       ヒナゲシ       ヤマボウシ
アグラオネマ     クレマチス     スイートピー      ツルバラ       ヒマワリ       ヤマユリ
 アサガオ      クロッカス      スイセン       デンファレ      ヒメシャガ      ユキノシタ
 アジサイ       ケヤキ       スズラン       ドラセナ       ヒヤシンス        ユリ
アンスリウム     コスモス       ストック      トルコキキョウ     フェンネル      ラッキョウ
  イネ        サクラ      ストロベリー       ナス         プミラ      ラッパスイセン
イロハモミジ     サクラソウ     スノードロップ     ナノハナ       フリージア      ラベンダー
インパチェンス     サツキ       スミレ       ハイビスカス     ブルーベリー      ランタナ
ウスユキソウ     サネカズラ      セージ        パキラ        ペチュニア      リシマキア
 エビネ       サフラン      セキショウ     ハゴロモジャスミン   ホタルブクロ       レンゲ
 オミナエシ    サンダーソニア    ゼラニウム       バジル       ホテイアオイ     ローズマリー
カーネーション     シイタケ      タイム         ハス         マツモ     ワイヤープランツ
 ガーベラ     シャコバサボテン     タケ       ハナショウブ      ミツマタ     ワイルドストロベリー
  カラー     シュウカイドウ    タチアオイ        バラ       ミヤコワスレ     ワスレナグサ
 カラテア     シュウメイギク     ダリア       ハルシャギク       ムギ
 キキョウ      ジュズダマ      タンポポ       パンジー       ムスカリ
  キク        シュロ      チューリップ       ビオラ      ムラサキハナナ
クマガイソウ      シラー      ツキミソウ      ヒガンバナ       ヤマイモ
【付録】質問・登録文例
定性検索                   定性登録                記録登録
・(植物名)の花期はいつ
・(植物名)に花が咲くのはいつ        ・(植物名)は5月に花が咲きます    ・(植物名)に水をあげました
・(植物名)はまだ咲かないの         ・(植物名)の花は12月に枯れます   ・(植物名)に肥料をあげました
・(植物名)はどんな花が咲くの
・(植物名)の花の色は            ・(植物名)は春に咲きます       ・(植物名)に花が咲きました
・(植物名)に水遣りしたほうがいい      ・(植物名)は晩秋に枯れる       ・(植物名)が咲きました
・(植物名)にどのくらい水をあげたらいい
・(植物名)に肥料をあげたほうがいい     ・(植物名)の潅水量は2です      ・(植物名)を剪定しました
・(植物名)に肥料はいつあげればいいの   ・(植物名)にはいっぱい水をあげて下さい ・(植物名)を切り戻しました
・(植物名)に肥料はどのくらいあげればいいの
・(植物名)の肥料は何をあげればいいの ・(植物名)の栄養はリンです
                                           ・(植物名)が枯れました
・(植物名)の栄養はなに
                    ・(植物名)の肥料はPです
・(植物名)は日当たりが好き?                            ・(植物名)を買いました
・(植物名)は冬枯れるの        ・(植物名)は半日影が好き
・(植物名)は夏に耐えられるの                            ・昨日(植物名)を買ったよ
・(植物名)はいつ実るの        ・(植物名)はおひさまが好き
・(植物名)はいつ熟すの        ・(植物名)は乾燥に弱い
・(植物名)はいくらで売ってるの                           記録検索
・(植物名)を育てるのは難しい?    ・(植物名)は暑さに弱い
・(植物名)は宿根草?         ・(植物名)の難易度は低い          ・いつ(植物名)に水をあげたの
・(植物名)の原産地はどこ
                                           ・(植物名)いつ買ったっけ
・(植物名)の葉に白い斑点があるのはなぜ・(植物名)を育てるのは簡単です
・(植物名)の葉の縁が枯れているのはなぜ                       ・(植物名)を剪定したのはいつだっけ
                    ・(植物名)は一年草です
・(植物名)の葉がしおれているのはなぜ
・(植物名)の花が咲かないのはなぜ   ・(植物名)の原産地はアフリカです      ・(植物名)にいつ肥料をやったっけ?

More Related Content

Recently uploaded

LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイルLoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイルCRI Japan, Inc.
 
2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用
2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用
2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用KLab Inc. / Tech
 
ネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdf
ネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdfネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdf
ネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdfTakayuki Nakayama
 
Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介
Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介
Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介Hyperleger Tokyo Meetup
 
MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。iPride Co., Ltd.
 
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアルLoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアルCRI Japan, Inc.
 
Keywordmap overview material/CINC.co.ltd
Keywordmap overview material/CINC.co.ltdKeywordmap overview material/CINC.co.ltd
Keywordmap overview material/CINC.co.ltdkokinagano2
 
情報を表現するときのポイント
情報を表現するときのポイント情報を表現するときのポイント
情報を表現するときのポイントonozaty
 

Recently uploaded (8)

LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイルLoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
 
2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用
2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用
2024年5月17日 先駆的科学計算フォーラム2024 機械学習を用いた新たなゲーム体験の創出の応用
 
ネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdf
ネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdfネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdf
ネットワーク可視化 振る舞い検知(NDR)ご紹介_キンドリル202405.pdf
 
Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介
Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介
Hyperledger Fabricコミュニティ活動体験& Hyperledger Fabric最新状況ご紹介
 
MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その1) 2024/05/17の勉強会で発表されたものです。
 
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアルLoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
 
Keywordmap overview material/CINC.co.ltd
Keywordmap overview material/CINC.co.ltdKeywordmap overview material/CINC.co.ltd
Keywordmap overview material/CINC.co.ltd
 
情報を表現するときのポイント
情報を表現するときのポイント情報を表現するときのポイント
情報を表現するときのポイント
 

Featured

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

花之声

  • 1. みんなで創る音声アシスタント:花之声 ~あなたのつぶやきがオープンデータになる~ 1
  • 2. 研究の背景 近年,新規ITビジネス創出の期待からオープンデータに注目 政府系,バイオ系,スマートシティ向けにデータ公開が進む 一般に普及させるにはWebプログラマへのアピールが重要 まずはどんなデータがあるか見てもらう⇒知ってもらう⇒使ってもらう …SPARQLは難しい,全文検索は断片化したデータにうまく当たらない もっと簡単に検索したい! データはトリプル,質問文(検索文)もトリプルにしてマッチングしては? 質問文の<S, V, ?O>に合うLODの<instance, property, value>を検索 ついでに,発話文からデータの登録もできればよいのでは? ついでに,発話文からデータの登録もできればよいのでは からデータ もできればよいのでは? つぶやきをLOD化することで,検索や既存データとの連携が容易になる!? つぶやきをLOD化することで,検索や既存データとの連携 容易になる データとの連携が になる!? みんなで創るオープンデータによる音声アシスタント ※LOD(Linked Open Data):全世界に360億トリプル,Wikipediaも含む ピンポイント情報検索の知識源として最適
  • 3. オープンデータによる質問応答システムの実現に向けた 問題点とアプローチ 1. ユーザ質問文とLODスキーマとのマッピング ユーザフィードバックによるマッピング候補の学習と精度向上 ①シードとなる{述語, プロパティ}マッピングをKVSに事前登録,未知の動詞はWordnetで語彙 を展開・英訳して,既知の述語,プロパティとLCS(Longest Common Substring)を計算 ②主語に該当するリソースが検索された場合は,全プロパティと英訳した述語とのLCSを計算, 暫定ランキングを構成 ③ユーザがどのプロパティ値を参照したかをサーバーにFBして,未知のマッピングを動的に獲得 ④登録済みマッピングに関しても,ユーザからのFB数に基いて信頼度を更新 2. LODデータの追加登録・拡充 ユーザ参加型・ソーシャル活用の仕掛け作り ✔自然文からのトリプル抽出により,誰でも簡単に追加登録可能に! 登録データを自分で利用できる&人に利用してもらえる(登録者のTwitter IDをCreatorとして表示) ✔個人のライフログ(記録・記憶)の登録・検索も可能に! ✔一般情報や専門的情報はCRF(Conditional Random Fields)を用いてWebページから自動抽出
  • 4. 応用事例 一般情報検索 現在,DBpediaには10億超のトリプルが登録されており,Wikipediaの (一部)ピンポイント検索が可能 フィールドワーク支援 屋外での情報検索/記録/共有/提供に活用 例)農作業,エレベータ保守,プラント点検,山歩き,震災時避難,旅行, Twitter連動 クチコミやライフログの記録,共有を目的に,特定のハッシュタグでつぶやく と自動的にトリプルが抽出されLOD登録,ハッシュタグで質問するとLOD (過去のつぶやき)検索など. フィールドでのLOD活用【第2弾】※ 花之声:ガーデニング作業時の各種疑問に答える音声アシスタント ※第1弾「花咲かめら」:LODチャレンジ2011応募作品
  • 5. 「花之声」とは スマートフォンを用いた園芸・農作業時の情報検索・作業記録システム ・・・発話意図を自動的に4分類(定性・記録×検索・登録※) ※作業の記録が精密農業の基本(農水省) LOD検索結果 Google検索結果 定性 現状,LODプロパティを 定性 直接表示 検索 登録 「インパチェンスはいつ咲くの?」⇒花期:5月 「ゼラニウムは一年草です」⇒一年草:True 記録 記録 登録 検索 「チューリップに肥料をやったよ」⇒施肥日:10/12 「いつチューリップに肥料あげたっけ」⇒施肥日:10/12 周りに人がおらず,手が汚れて いるので音声操作が向いている
  • 6. 「花之声」ユースケース1 - ピンポイント(芋づる)検索 その場で知りたいことにピンポイントで回答 インパチェンスの花期はいつ 「5月」 from Plant LOD (いま5月だし,なんで咲かないのかな…) インパチェンスの葉に白い 斑点があるのはなぜ? 「うどんこ病」 from Plant LOD (そのせいか,でも聞いたことはあるけど…) うどんこ病ってなに? 「うどんこ病子嚢菌のウドン コカビ科の純活物寄生…」 from DBPedia
  • 7. 「花之声」ユースケース2 - ユーザ参加型登録 ユーザが互いに知り得た情報を共有 生態調査的登録 去年,コマクサが咲いたの 今日,コマクサが 今日,チングルマ 咲きました が咲いたよ はいつかな? ウスユキソウが咲 クロユリが咲いて いたよ たよ 「5月25日」 今日,コマクサが 枯れちゃった チングルマが実を from @twitter_ID 付けたよ 知恵袋的登録 アブラムシの退 最近,ウメの葉に斑模様 コチョウランには 液体肥料がいい 治にはにんにく があるんだけど? 汁がいいです ですよ ウメの葉がまだら プリムラには肥料 になったら新種の は要りません プラムポックスウ 「プラムポックスウイルス」 インパチェンスは from @twitter_ID イルスかもしれま この時期に切り せん 戻してください ※登録情報には登録者のtwitter IDを付記
  • 8. 「花之声」公開サイト lodmashups.appspot.com
  • 9. サービス構成 クラウドサイド Google Google 音声認識 Web検索 ②ユーザ参加型登録 Yahoo! 形態素解析 音声 発話をトリプル(S,V,O) 発話をトリプル 入力 に起こしてLOD検索・登録 に起こしてLOD検索・登録 (または HTML5 植物検索 植物登録 キー入力 CSS3 クエリー クエリー JavaScript Google App LOD DB 質問文 Engine (SPARQL) (SPARQL) LOD LOD (jquery) SPARQL 検索結果 検索結果 for Java 植物LOD endpoint Cloud + Google スマートホン ユーザ (GAE/J) (RDF) (植物LOD) 検索結果 クライアント FB アプリケーション サーバー 述語・Propertyマッピング 述語・Propertyマッピング ユーザFB登録 ユーザFB登録 Google BigTable {述語, Property, 信頼度} ①ユーザFBによる未知語 シソーラス展開 の獲得と学習 NICT Microsoft Wordnet検索 翻訳
  • 10. 植物LOD概要 DBPediaオントロジーPlantクラスのインスタンス10000超に国内種104を追加 プロパティは既存の300に育成の観点から新たに37を追加 owl: Thing rdfs: plant name label rdfs:subClassOf rdfs: plant dbpedia-owl: comment description Species dbpedia: dbpedia: dbpedia: Beech gtcprop: dbpedia: Cherry Apple flower season gtc: flowerMonth Dendrobium Bamboo dbpedia: dbpedia-owl: rdf:type gtc: Erica gtcprop: fertilizer Eukaryote Rise dbpedia: fertilizingAmountapplication level rdf:type rdf:type gtc: Fennel dbpedia-owl: Rose dbpedia: rdf:type gtcprop: ratio of three Guava Plant rdf:type gtc: fertilizingElement fertilizer elements dbpedia: Violet rdf:type gtcprop: Hydrangea dbpedia-owl: gtc: pruning dbpedia: Saffron pruningMonth season Impatiens rdf:type FloweringPlant gtc: dbpedia: Petunia Jasmine_heathdbpedia: gtc: gtcprop: disease and dbpedia gtc: Pakira hasWhiteSpot pest Kenaf Lupinus_albus Xmasrose foaf: 2D image PREFIX太字:追加分 depiction
  • 11. 拡張機能 SPARQL endpoint変更機能 植物LOD以外のデータを音声検索する機能(試験実装) 但し,検索のみ,非対応サーバーあり(サーバーによっては遅いので注意) 動作確認済みendpoint 日本語DBpedia(ja.dbpedia.org/sparql) 例) 「Siriって何?」,「Siriは誰が作ったの?」 Dataシティさばえ(lod.ac/sabae/sparql) 例) 「西山公園の住所は?」 ヨコハマ・アート・LOD(archive.yafjp.org/test/inspection.php)など 例) 「ピカソのイベントの場所は?」 • {述語,プロパティ}マッピング手動登録機能 ユーザが明示的に述語とプロパティのマッピングを登録する機能 検索対象プロパティが3候補以内に出てこない場合,{述語,プロパティ} の組みをインプットフィールドを通じてKVSに登録,次回検索時より反映 LODに関する多少の知識があるユーザを対象としたもの 機能を開放することでユーザ参加型での面白い使い方を探したい
  • 12. まとめと今後の進め方 オープンデータ利活用促進を目指し,一般ユーザ向けLOD検索・ 登録サービス(音声アシスタント)を開発 応用事例として,フィールドワーク支援アプリを開発 フィールドワークに適したピンポイント情報提供に加えて,ユーザFBを 用いた精度向上,ユーザ参加型の未知データ獲得の仕掛け,等に特徴 今後,LODを使ったサービスの可能性を示したい ユーザ参加促進の仕掛け作り,および評価 反応を探りながら,他ドメインへの展開を検討 制限事項 抑揚は認識できないため,肯定文か疑問文かはliteralに表現要 複雑なクエリーは分割して質問(屋外で複雑な質問はしないという想定) 現状はS,VからO,Cを検索(逆検索は実装中)
  • 13. 【付録】登録植物例 アキニレ クリスマスローズ ジンチョウゲ ツユクサ ヒナゲシ ヤマボウシ アグラオネマ クレマチス スイートピー ツルバラ ヒマワリ ヤマユリ アサガオ クロッカス スイセン デンファレ ヒメシャガ ユキノシタ アジサイ ケヤキ スズラン ドラセナ ヒヤシンス ユリ アンスリウム コスモス ストック トルコキキョウ フェンネル ラッキョウ イネ サクラ ストロベリー ナス プミラ ラッパスイセン イロハモミジ サクラソウ スノードロップ ナノハナ フリージア ラベンダー インパチェンス サツキ スミレ ハイビスカス ブルーベリー ランタナ ウスユキソウ サネカズラ セージ パキラ ペチュニア リシマキア エビネ サフラン セキショウ ハゴロモジャスミン ホタルブクロ レンゲ オミナエシ サンダーソニア ゼラニウム バジル ホテイアオイ ローズマリー カーネーション シイタケ タイム ハス マツモ ワイヤープランツ ガーベラ シャコバサボテン タケ ハナショウブ ミツマタ ワイルドストロベリー カラー シュウカイドウ タチアオイ バラ ミヤコワスレ ワスレナグサ カラテア シュウメイギク ダリア ハルシャギク ムギ キキョウ ジュズダマ タンポポ パンジー ムスカリ キク シュロ チューリップ ビオラ ムラサキハナナ クマガイソウ シラー ツキミソウ ヒガンバナ ヤマイモ
  • 14. 【付録】質問・登録文例 定性検索 定性登録 記録登録 ・(植物名)の花期はいつ ・(植物名)に花が咲くのはいつ ・(植物名)は5月に花が咲きます ・(植物名)に水をあげました ・(植物名)はまだ咲かないの ・(植物名)の花は12月に枯れます ・(植物名)に肥料をあげました ・(植物名)はどんな花が咲くの ・(植物名)の花の色は ・(植物名)は春に咲きます ・(植物名)に花が咲きました ・(植物名)に水遣りしたほうがいい ・(植物名)は晩秋に枯れる ・(植物名)が咲きました ・(植物名)にどのくらい水をあげたらいい ・(植物名)に肥料をあげたほうがいい ・(植物名)の潅水量は2です ・(植物名)を剪定しました ・(植物名)に肥料はいつあげればいいの ・(植物名)にはいっぱい水をあげて下さい ・(植物名)を切り戻しました ・(植物名)に肥料はどのくらいあげればいいの ・(植物名)の肥料は何をあげればいいの ・(植物名)の栄養はリンです ・(植物名)が枯れました ・(植物名)の栄養はなに ・(植物名)の肥料はPです ・(植物名)は日当たりが好き? ・(植物名)を買いました ・(植物名)は冬枯れるの ・(植物名)は半日影が好き ・(植物名)は夏に耐えられるの ・昨日(植物名)を買ったよ ・(植物名)はいつ実るの ・(植物名)はおひさまが好き ・(植物名)はいつ熟すの ・(植物名)は乾燥に弱い ・(植物名)はいくらで売ってるの 記録検索 ・(植物名)を育てるのは難しい? ・(植物名)は暑さに弱い ・(植物名)は宿根草? ・(植物名)の難易度は低い ・いつ(植物名)に水をあげたの ・(植物名)の原産地はどこ ・(植物名)いつ買ったっけ ・(植物名)の葉に白い斑点があるのはなぜ・(植物名)を育てるのは簡単です ・(植物名)の葉の縁が枯れているのはなぜ ・(植物名)を剪定したのはいつだっけ ・(植物名)は一年草です ・(植物名)の葉がしおれているのはなぜ ・(植物名)の花が咲かないのはなぜ ・(植物名)の原産地はアフリカです ・(植物名)にいつ肥料をやったっけ?