Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
最近の機械学習テクノロジーと
ビジネスの応用先
古川 朋裕
ー自然言語処理を中心にー
自己紹介
<名前> 古川 朋裕
普段はNextremerという会社で
機械学習エンジニアをしています
取組分野:画像処理・自然言語処理など
<注意>
 ・主観が多分に含まれています
 ・正確さについて保証しておりません
現在の自然言語処理技術の
  得意分野は関連付けや分類
 不得意分野は文章の意味を想像すること
→そこでどんなビジネスに応用できるのか?
概要
<ニュース>
“IBMのWatson、
わずか10分で難症例患者の
正しい病名を見抜く”
得意:関連付け・分類
http://blog.fashionsealhealthcare.com/sites/
default/files/styles/...
<Watsonの中身> (予想)
得意:関連付け・分類
http://blog.fashionsealhealthcare.com/sites/
default/files/styles/blog_image_display/publi
c/f...
“text understanding from scratch” Xiang Zhang et al. 2015
得意:関連付け・分類
「Amazonレビュー分析」
例:カメラのレビュー
“すごい画質が綺麗でした。
・・・性能も良いと思います...
(http://commonsensereasoning.org/winograd.htmlより引用)
不得意:文章の意味を想像
The trophy would not fit in the brown suitcase
because it...
(http://commonsensereasoning.org/winograd.htmlより引用)
不得意:文章の意味を想像
The trophy would not fit in the brown suitcase
because it...
ビジネスの応用先
・webページなど情報の構造化
得意・不得意を把握した上で何ができるのか?
・士業全般のサポート・自動化
ビジネスの応用先
https://www.diffbot.com/
DIFFBOT・・・webページの構造化サービス
ビジネスの応用先
DIFFBOT・・・webページの構造化サービス
YAH! ニュース
先のロサンゼルス五輪
において、女子柔道は
金メダル1つ、銀メダル3
つ、銅メダル1つでメダ
ルを獲得するも・・・
柔道金メダル獲得
2016/9/20
w...
ビジネスの応用先 DIFFBOT
webページの構造化
・大量のwebページの一括自動処理が可能
YAH! ニュース
先のロサンゼルス五輪
において、女子柔道は
金メダル1つ、銀メダル3
つ、銅メダル1つでメダ
ルを獲得するも・・・
柔道金メダ...
ビジネスの応用先
弁護士・・・法律調査 Ross Intelligence社
税理士・・・自動仕分けによる会計 freee社
士業全般のサポート・自動化
IBM Watsonをベースとして
破産法関連の質問に回答できるシステム
他、弁理士でも中...
現在の自然言語処理技術の
  得意分野は関連付けや分類
 不得意分野は文章の意味を想像すること
ビジネスの応用先:webページの構造化
        士業のサポート・自動化
          などが有望と考える
まとめ
ドローン 機械学習✕
Precision Hawk
番外編
Precision Hawk
ドローン 機械学習✕
(2010年創業、カナダ)
ドローンを使ったデータ収集・分析
https://techcrunch.com/2016/04/20/precisionhawk-raises-18-million...
ドローン 機械学習✕
<応用例>
CEO Bob Young (元red hat CEO) 
  “ドローンを売ることではなく
   データのプラットフォームで収益化”
農業・・・収穫予測、肥料、水やりなど最適化
エネルギー・・・石油パイプライ...
ドローン 機械学習✕
<技術>(予想)
ヒートマップ・・・教師データさえあれば
       ディープラーニングなどで作成可能
       (例)乾いている、枯れている度合
Precision Hawk
自律飛行 ・・・強化学習 or ルール...
ドローン 機械学習✕ Precision Hawk
→日本でローカライズすれば事業として成立?
<これからできるビジネス>
農業:コメなど作物を特化、台風の予測など
   日本特有のデータを収集
エアロリンク・・・ソニーとZMPの合弁会社もある...
Upcoming SlideShare
Loading in …5
×

最近の機械学習テクノロジーとビジネスの応用先 自然言語処理を中心に

1,584 views

Published on

主に自然言語処理技術とビジネスの応用先を紹介

Published in: Business
  • Be the first to comment

最近の機械学習テクノロジーとビジネスの応用先 自然言語処理を中心に

  1. 1. 最近の機械学習テクノロジーと ビジネスの応用先 古川 朋裕 ー自然言語処理を中心にー
  2. 2. 自己紹介 <名前> 古川 朋裕 普段はNextremerという会社で 機械学習エンジニアをしています 取組分野:画像処理・自然言語処理など
  3. 3. <注意>  ・主観が多分に含まれています  ・正確さについて保証しておりません
  4. 4. 現在の自然言語処理技術の   得意分野は関連付けや分類  不得意分野は文章の意味を想像すること →そこでどんなビジネスに応用できるのか? 概要
  5. 5. <ニュース> “IBMのWatson、 わずか10分で難症例患者の 正しい病名を見抜く” 得意:関連付け・分類 http://blog.fashionsealhealthcare.com/sites/ default/files/styles/blog_image_display/publi c/field/image/blogs/ibm_watson.png? itok=KfjKZapuより引用 参考文献:http://japanese.engadget.com/2016/08/07/ibm-watson-10/ ・2000万件以上の癌に関する 論文を学習 Watsonの基本理念 情報や知識を備え、専門家に複数の選択肢を提示 ≒文章の関連付けを行う
  6. 6. <Watsonの中身> (予想) 得意:関連付け・分類 http://blog.fashionsealhealthcare.com/sites/ default/files/styles/blog_image_display/publi c/field/image/blogs/ibm_watson.png? itok=KfjKZapuより引用 主に予め記述した知識に従って 原因・結論などを予測 基礎技術:推論エンジン “Mike ate bread.” (Person) (eat) (food) (Person) (be) (hungry) 一般化 推論 パンを食べた原因は 「空腹であった」と推論 David Ferrucci・・・開発主要エンジニアが推論の専門家 “1994 with a Ph.D. degree in computer science specializing in knowledge representation and reasoning”(wikipediaより)
  7. 7. “text understanding from scratch” Xiang Zhang et al. 2015 得意:関連付け・分類 「Amazonレビュー分析」 例:カメラのレビュー “すごい画質が綺麗でした。 ・・・性能も良いと思います。” 機械学習 肯定的か? 否定的か? 判定 94%の精度で肯定・否定を判定可能 (skip-thought vector・paragraph vectorなど多数関連技術あり)
  8. 8. (http://commonsensereasoning.org/winograd.htmlより引用) 不得意:文章の意味を想像 The trophy would not fit in the brown suitcase because it was too big 文章の意味を想像することが正しい回答に必要 問題:“it”は何を指すでしょうか? 上記のような問題を集めたコンテスト <Winograd Schema Challenge 2016> 最優秀チームのスコア = 58% (http://www.cs.nyu.edu/faculty/davise/papers/WinogradSchemas/WS.html) 「trophyが大きすぎてsuitcaseに入らない」という
  9. 9. (http://commonsensereasoning.org/winograd.htmlより引用) 不得意:文章の意味を想像 The trophy would not fit in the brown suitcase because it was too big 解決案:推論エンジンにヒント? fitにはsizeがenoughである必要という知識を利用 size (attribute-of) suitcase size → enough → can fit → not enough → can not fit 知識を全部記述したシステムを作るべきか?  →網羅は困難だし、効率も悪い  →知識をどう扱うかは大きな問題
  10. 10. ビジネスの応用先 ・webページなど情報の構造化 得意・不得意を把握した上で何ができるのか? ・士業全般のサポート・自動化
  11. 11. ビジネスの応用先 https://www.diffbot.com/ DIFFBOT・・・webページの構造化サービス
  12. 12. ビジネスの応用先 DIFFBOT・・・webページの構造化サービス YAH! ニュース 先のロサンゼルス五輪 において、女子柔道は 金メダル1つ、銀メダル3 つ、銅メダル1つでメダ ルを獲得するも・・・ 柔道金メダル獲得 2016/9/20 webページ 構造化=項目ごとに分類 <title> 柔道金メダル獲得 <date> 2016/9/20 <text> 先のロサンゼルス五輪 において、女子柔道・・・ 他、商品情報を抽出したり 画像や顔を探すこと可能
  13. 13. ビジネスの応用先 DIFFBOT webページの構造化 ・大量のwebページの一括自動処理が可能 YAH! ニュース 先のロサンゼルス五輪 において、女子柔道は 金メダル1つ、銀メダル3 つ、銅メダル1つでメダ ルを獲得するも・・・ 柔道金メダル獲得 2016/9/20 価格・レビューなどの 商品情報一括取得   ・・・etc ニュース報道の トレンド分析
  14. 14. ビジネスの応用先 弁護士・・・法律調査 Ross Intelligence社 税理士・・・自動仕分けによる会計 freee社 士業全般のサポート・自動化 IBM Watsonをベースとして 破産法関連の質問に回答できるシステム 他、弁理士でも中小企業診断士でも 文章を扱う専門家なら少なくともサポートはできそう 参考:“エストニアの電子政府実現で税理士や会計士の職は消滅した” http://www.excite.co.jp/News/economy_g/20160823/Postseven_440295.html
  15. 15. 現在の自然言語処理技術の   得意分野は関連付けや分類  不得意分野は文章の意味を想像すること ビジネスの応用先:webページの構造化         士業のサポート・自動化           などが有望と考える まとめ
  16. 16. ドローン 機械学習✕ Precision Hawk 番外編
  17. 17. Precision Hawk ドローン 機械学習✕ (2010年創業、カナダ) ドローンを使ったデータ収集・分析 https://techcrunch.com/2016/04/20/precisionhawk-raises-18-million-to-bring-drones-safely-into-u-s-airspace/より引用 農業用土壌ヒートマップ ・3Dなどマップ作成 →データ分析 ・ドローンによる リアルタイム監視
  18. 18. ドローン 機械学習✕ <応用例> CEO Bob Young (元red hat CEO)    “ドローンを売ることではなく    データのプラットフォームで収益化” 農業・・・収穫予測、肥料、水やりなど最適化 エネルギー・・・石油パイプライン保守        鉱物発掘調査など Precision Hawk <戦略> →分析技術など含むソフトで価値を出す
  19. 19. ドローン 機械学習✕ <技術>(予想) ヒートマップ・・・教師データさえあれば        ディープラーニングなどで作成可能        (例)乾いている、枯れている度合 Precision Hawk 自律飛行 ・・・強化学習 or ルールベース 参考:機械学習でドローンを自律飛行させようという研究も行われている “Associative-memory-recall-based control system for learning hovering manoeuvres” Huang Pei-Hua et al. 2015 →個人的な所感では、  強化学習させると  行動決定の根拠がわからないため  ルールを決めたプログラミングの方が実用的
  20. 20. ドローン 機械学習✕ Precision Hawk →日本でローカライズすれば事業として成立? <これからできるビジネス> 農業:コメなど作物を特化、台風の予測など    日本特有のデータを収集 エアロリンク・・・ソニーとZMPの合弁会社もある →安全な自律飛行の実現 機械学習による詳細な状況判断の実現 データ分析による飛行マップの作成

×