Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

WordPress meets IBM Watson ~WordPress のコンテンツデータを IBM Watson に機械学習させてみよう~

713 views

Published on

WordCamp Tokyo 2018 登壇時の資料
WordPress コンテンツデータを IBM Watson の学習データとみなして学習→問い合わせを行う機能の紹介、デモ、まとめ

Published in: Business
  • Be the first to comment

  • Be the first to like this

WordPress meets IBM Watson ~WordPress のコンテンツデータを IBM Watson に機械学習させてみよう~

  1. 1. WordPress meets IBM Watson : アジェ ンダ • 人工知能 • IBM Watson • WordPress と IBM Watson が連携するプラグイン紹介&デモ • WordPress のデータを IBM Watson で活用することの可能性
  2. 2. 例題: これは何? 虎、トラ、 Tiger なぜ「トラ」だとわかりましたか?
  3. 3. トラを「学習」したから 黄色 白と黒の縦縞 四足で歩く 耳 猫っぽい 牙 :
  4. 4. システム化 ① データの学習 ② 学習内容への問い合わせ 人間のように見える トラ トラ IBM Watson ではその多くが REST API で提供されている
  5. 5. IBM Watson API でできること (大きく3つの機能) テキスト解析 数値解析バイナリデータ解析 テキスト内容を理解/分類する 感情を読み取る 翻訳する 要約する フォーマットを変換する   : 傾向を取り出す 相関関係(の有無)を見つける ダッシュボードを作る トレードオフ分析を行う   : 画像認識/顔認識 類似画像検索 音声 <-> テキスト変換   :
  6. 6. NLC(Natural Language Classifier) IBM Watson API の1つ 自然言語テキストをカテゴリに分類 学習によるカスタマイズ可 8ヶ国語対応(日本語含む) 例 こんにちは。預金口座を作りたいのです が 今日の最高気温は何度まで上がるんだろ う 夏 質問 新規契約
  7. 7. (改めて)今回のチャレンジ WordPress のコンテンツを IBM Watson NLC の学習データとして 利用できるのではないか!?
  8. 8. システム図 PHP アプリケーションサーバー MySQL サーバー IBM Watson NLC WordPress 専用プラグイン Challenge!
  9. 9. IBM Watson 用プラグイン • デモ用 • 管理下の WordPress から全ての文書を取り出し、それぞれ 「本文」と「カテゴリー」を取り出す。 • ↑ 全文書でこの作業を行い、その結果を   学習テキスト : 正解のカテゴリ として IBM Watson に学習させる • つまり学習データ数は WordPress の文書数 • 学習が完了すると、 WordPress の文書を元にしたテキスト分類コーパ スができあがる • 学習後、学習に使っていないテキストを与えると、「その文書 はどのカテゴリがふさわしいか」を IBM Watson が選んでくれ る https://github.com/dotnsf/wordpress_watson_nlc
  10. 10. デモ PHP アプリケーションサーバー MySQL サーバー IBM Watson NLC WordPress 専用プラグイン • 約 800 の技術文書 • 8つのカテゴリ • Cloud • Java • Linux • Mobile • Open Source • Web Services • Web • XML 学習 問い合わせ
  11. 11. 詳細参照 http://dotnsf.blog.jp/archives/1060137437.html
  12. 12. WordPress データの利活用に向けて • AI 、コグニティブの世界では「学習データ不足」 • 世の中のウェブデータの多くが WordPress で作られている • WordPress 内のデータが AI の学習データとして活用できる!? • 社内データを使うことで、社内用語の学習などにも応用できる • (考えられる応用先) • 自動カテゴライズ • Know Who (この内容に詳しいのは誰? 人をカテゴリーとみなす) • 季節傾向(この季節に多い質問は? 作成日をカテゴリーとみなす) 既存の WordPress データが活用できる。 WordPress を新規に導入する際の理由としても使える。
  13. 13. (おまけ) IBM Watson NLC の価格 無料枠あり! 1ヶ月あたり学習4回、問い合わせ 1000 回 無料枠を超えたぶんに課金 学習1回 315 円、問い合わせ1回 0.3675 円

×