いまからでも聞いていただきたい
Watsonの得意な3つのこと!
2017/06/20 BMXUG 九州支部 勉強会
IBMクラウド
テクニカル・セールス
アドバイザリー・アーキテクト
システム・アーキテクチャーの策定、提案
IBM Watson、Bluemixをテーマに講演
INNOVATE HUB KYUSHU
技術アドバイザー
https://jp.linkedin.com/in/misakiutou
cape@jp.ibm.com
宇藤 岬
Misaki Utou
日本アイ・ビー・エム株式会社
クラウド事業本部
クラウド・テクニカル・セールス
2
本LTのコンセプト
3
(当初)
THINK Watsonに掲載された
「今さら聞けない!? Watsonが得意な3つのこと」
の内容を徹底解説!
見えないチカラにより?
なぜか記事が削除…
記憶を頼りに3つを解説します!
ところが…
THINK Watson : 最新情報をニュースマガジン形式で発信
4https://www.ibm.com/think/jp-ja/watson/
© 2017 International Business Machines Corporation
イントロダクション : Watsonとは
5
近年の「人間 vs AI」におけるAIの躍進
6
2011年 : IBM Watson Jeopardy!
2017年 : Google AlphaGo
米国のクイズ番組 Jeopardy! に出場し、Watsonの能力を立証
 オープンドメインの質問応答
 複雑な問題文とカテゴリの解釈
 高い正解率 (約89%)
 確信度の推定 (ボタンを押すか否かの判断)
 高速な応答 (2~3秒で回答)
Watsonが解いた問題と情報源
 事実に基づく知識が問われる問題
• 歴史・文学・スポーツ・言葉遊び…
 百科事典・ニュース等の静的な情報源を利用
• 対戦中はインターネットには接続せず
 キーワードの一致だけでなく、意味内容に基いて
問題文と情報源を関連づけて、正解率を向上させた
クイズ王を打ち負かした質疑応答システムWatson
7
クラウド、Web企業がAIで歴史的提携発表
8
2016年9月、人工知能の普及とベストプラクティスを共有する非営利団体「Partnership on AI」を設立。
AIの倫理や公平性、プライバシー、透明性などを共同で研究し、その成果を公表することを目的とする。
2017年に入り、さらに参画企業、団体を増加して、協力体制を強化。
2017年1月
コグニティブ・システムの特長
~従来のコンピューター・システムとの違い~
推論: 会話文などあいまいな情報から、質問の意図などを推論する
学習: 教師データを与えることで徐々に賢くなる
認識: 画像、音声など従来コンピュータで扱えなかった
非定型データからも情報を抽出する
相互作用: 人とのやり取りを通じて、
情報探索や高度な意思決定の支援を行う
9
IBMの考えるコグニティブ・システム
~ ハイレベル・アーキテクチャー ~
ソリューション 知識を活用しビジネス課題を解決
照会応答
Engagement
探索・発見
Discovery
意思決定支援
Decision
Watson Solution Framework
個別領域文献
企業内データ
概念体系・辞書 文脈情報
専門家の
知見
自然言語処理・知識表現・機械学習・Deep Learning
考える
読む
聴く
見る
話す
Watsonが
提供する機能
知識
データ
Watsonコグニティブ・サービス
テキスト解析質問応答 音声認識・合成 画像認識 …… 探索 発見
10
機能別サービスとして提供 ー Watson Developer Cloud API
Personality Insights
テキストから筆者の性格を推定する
Language Translator(一部日本語未対応) ※1
自然言語テキストについて他言語へ翻訳を行う
Conversation
アプリケーションに自然言語インターフェース
を追加してエンドユーザとのやり取りを自動化
Natural Language Understanding(日本語未対応)
自然言語処理を通じてキーワード抽出、エンティ
ティー抽出、心情分析、感情分析、概念タグ付け、
関係抽出、分類法種別、作成者抽出などを行う
Text to Speech
テキスト文章を音声に変換する
Speech to Text
音声をテキスト文章に変換する
Discovery News(日本語未対応)
Discovery Service上に実装され、エンリッチ情報も付加されたニュースに関する公開データセット
Visual Recognition
画像コンテンツに含まれる意味を検出する
Natural Language Classifier
テキスト文章の分類を行う(質問の意図推定など)
Tone Analyzer(日本語未対応)
テキストの感情、社交性、文体を解析する
Retrieve and Rank
自然言語の質問に対して回答の候補を返す
分析系
音声系
画像系
言語系
Document Conversion
文書を新しい形式に変換する
Discovery(日本語未対応)
認知検索およびコンテンツ分析エンジンをアプリケーションに追加して、優れた意思決定を行うのに役立つパ
ターン、傾向、およびアクション可能な洞察を識別する
© 2017 International Business Machines Corporation
Watsonが得意な3つのこと
12
今からでも学びたい!!
Watsonが得意な3つのこと
13
自然言語の理解、応答
非定型データの認識
情報の探索・分析処理
THINK Watson内の幻の記事「今さら聞けない!? Watsonが得意な3つのこと」の内容を中心に記載。
それ以外にも得意な領域、機能は多くある点、ご了解ください。
© 2017 International Business Machines Corporation
得意領域を
IBM Bluemix上で提供している
Watson Developer Cloud に
マッピングすると?
14
赤枠が該当します!
Personality Insights
テキストから筆者の性格を推定する
Language Translator(一部日本語未対応) ※1
自然言語テキストについて他言語へ翻訳を行う
Conversation
アプリケーションに自然言語インターフェース
を追加してエンドユーザとのやり取りを自動化
Natural Language Understanding(日本語未対応)
自然言語処理を通じてキーワード抽出、エンティ
ティー抽出、心情分析、感情分析、概念タグ付け、
関係抽出、分類法種別、作成者抽出などを行う
Text to Speech
テキスト文章を音声に変換する
Speech to Text
音声をテキスト文章に変換する
Discovery News(日本語未対応)
Discovery Service上に実装され、エンリッチ情報も付加されたニュースに関する公開データセット
Visual Recognition
画像コンテンツに含まれる意味を検出する
Natural Language Classifier
テキスト文章の分類を行う(質問の意図推定など)
Tone Analyzer(日本語未対応)
テキストの感情、社交性、文体を解析する
Retrieve and Rank
自然言語の質問に対して回答の候補を返す
分析系
音声系
画像系
言語系
Document Conversion
文書を新しい形式に変換する
Discovery(日本語未対応)
認知検索およびコンテンツ分析エンジンをアプリケーションに追加して、優れた意思決定を行うのに役立つパ
ターン、傾向、およびアクション可能な洞察を識別する
自然言語系
音声・画像
認識系
探索分析系
Watsonが得意な3つのこと (1つ目)
16
自然言語の理解、応答
非定型データの認識
情報の探索・分析処理
THINK Watson内の幻の記事「今さら聞けない!? Watsonが得意な3つのこと」の内容を中心に記載。
それ以外にも得意な領域、機能は多くあります。
NLC (Natural Language Classifier)
NLC: 質問やテキストに含まれるひとつまたは複数の意図を判別する機能です。
意図: 質問や発言から言語に含まれるノイズを取り除いて、それが何を言おうとしているか、あるいは何
を聞こうとしているのかということを指します。
例)
「銀行口座はどうやって開けますか?」
「口座を開きたいのですが。」
はどちらも「銀行口座開設方法」という同じ意図を表す質問文のバリエーションです。
NLCでの学習とは
同じ意図を持つ複数の質問文(最低10個程度)を同じ意図のバリエーションとして学習させます。
-> 学習の結果、質問文と似た表現の質問文に対しても同じ「意図」を持つ質問文であると解釈できるよ
うになります。
-> FAQと呼ばれるよくある質問に対して適切な回答を見つける仕組みの実現に適しています。
(学習フェーズ)
銀行口座はどうやって開けますか
銀行で口座を開くために必要なものを
教えてください。
質問文 意図
銀行口座開設方法
学習
住所変更はどうやって行いますか
転居したのですが、どうしたらいいですか
住所変更手続き
(運用フェーズ)
銀行口座を開きたいのですが
質問(入力) NLC問い合わせ結果(出力)
銀行口座開設方法 0.95
住所変更手続き 0.10
:
:
意図候補 確信度
一つの「意図」に対して、表現の異なる複数の
「質問文」(最低5つ、20程度が望ましい)を
用意し、学習させる
学習させた質問文と似た表現の質問は同じ
「意図」と判断するようになる
NLC (Natural Language Classifier)
© 2017 International Business Machines Corporation
19
ユーザーとの対話nはChat BOTを実装するためのAPIです。
対話ユーザーの発言の言い回しなどの多様なバリエーションの解釈含めて単独のサービス
として提供します。
ユーザーの意図理解のため、NLC同等の「意図分類器」を使っています。
ユーザーとの対話
実行環境
(サーバー)
ジャンルは何?
BOT
API
BOT
UI
ロック
ロックな音楽を
再生します
Watson
Conversation
音楽をかけて
Conversation
© 2017 International Business Machines Corporation
20
• 意図(Intents)~ 「動詞」に該当
– ユーザーが入力したテキストに含まれる「目的」
• エンティティ(Entities)~「目的語」に該当
– 入力テキストから抽出すべき「キーワードのリスト」
– ユーザーの「目的」の対象物を示したりする。
• ダイアログ・ノード(Dialog)~「処理フロー」に該当
– 意図とエンティティとそれに対する回答の組み合わせ
– 複数の会話のやり取りのためのツリー構造化も可能
Conversation
ライトを付けて → スイッチ入
音楽をかけて → スイッチ入
音楽をもっと大きく → 音量UP
ライトを付けて → ライト
音楽をかけて → 音楽
音楽をもっと大きく → 音量
音楽をかけて
↓
ジャンル取得
↓
音楽再生
© 2017 International Business Machines Corporation
21
Conversation
• フローエディターで会話の流れを視覚的に開発
• 簡易テスト機能で、即座に会話の流れを確認可能
• 処理フローはJSON形式でexport/importが可能
簡易テスト機能フローエディター
Conversation内の分類器(インテント取得)は、機能的にはNLCと同等ですが、内部実装として
改善が加えられているため、振る舞いが異なる点があります。
この違いを踏まえた上で実装方式を検討することが望ましいです。
NLC Conversation
スペルミスへの対応 単語単位での認識なので苦手 スペルが違った表記も認識可能
学習時間 場合によって数時間必要 NLCと比較して短い
分類クラス数 最大で数10程度 数100でも可能
同意語への対応 得意 苦手
向いている言語種類 書き言葉 チャットのような話し言葉
向いている
ユースケース
自動応答システムの一次切り分け ピザの注文など複数項目入力用アプリ
ユーザーとやりとりが必要なアプリ
NLCとConversationの使い分け
博多弁を認識して会話できちゃう
23
http://qiita.com/asasaki/items/15e22f359da193669408
Watson
Watsonが得意な3つのこと (2つ目)
24
自然言語の理解、応答
非定型データの認識
情報の探索・分析処理
THINK Watson内の幻の記事「今さら聞けない!? Watsonが得意な3つのこと」の内容を中心に記載。
それ以外にも得意な領域、機能は多くあります。
博多弁を認識できるWatsonだが
博多名物 明太子は学習済みか !?
25
Watsonに
明太子食べさせてみた!
26
Watsonによる利き明太子?
27
共通の
画像認識
Watson
Watson的には、野菜?ニンジン?
28
人参も食べさせてみた
29
結論
博多弁を認識できるWatsonだが
明太子はまだ未学習
30
Visual Recognitionサービス機能一覧
明太子とニンジンを食べさせたのは、一般種別機能に対して。
画像トレーニング機能を活用して明太子を学習させよう!
General
Tagging
一般種別 画像の特徴を検知し、タグとして抽出しクラ
ス・キーワード(犬、山などの一般名詞)を生成します。
顔検出 イメージ内の人物の顔を検出し、顔の一般的な年齢
層と性別も示します。有名人はその名称も検出可能です。
Facial
Detection
Visual
Learning
Similarity
Search
画像トレーニング 識別を行いたいクラスのイメージを事前
学習させます。識別結果は確信度と共に返されます。
類似イメージ検索 イメージのコレクションをアップロード
した後、検索をかけると類似したイメージを検出します。
事前
学習
不要
事前
学習
必要
学習は、Visual Recognition Toolを使うと簡単!
(現在ベータ版として提供)
32ツールの使い方は、こちら → http://qiita.com/y-some/items/6addf597a81a48f04d59
30枚の明太子写真による学習成果
33
結論
もっとたくさんの明太子を
食べる必要があるが、
明太子を認識できるように!
(ニンジンと誤認はせず)
34
Watsonが得意な3つのこと (3つ目)
35
自然言語の理解、応答
非定型データの認識
情報の探索・分析処理
THINK Watson内の幻の記事「今さら聞けない!? Watsonが得意な3つのこと」の内容を中心に記載。
それ以外にも得意な領域、機能は多くあります。
既存の大量なテキストデータから洞察を得たい!
PDF
DOC
html
News
サポートデスクとのやりとりで顧客が一番多く
言及している言葉は何か?
私の流したキャンペーンは、この30日間で何回
ネット上で言及されているのか?
ロックのかかったアカウントで、新しい接続を
セットアップするにはどうしたらいいのか?
??
こんな課題・要望ありますよね?
Discoveryサービス概要 (日本語未対応)
データ取り込み
機能
Word/PDF/JSON
/DBなどに対応
エンリッチ・保存機能
コグニティブ機能(NLU/WKS)
を使って入力文を分析・タグ
付けしインデックス
(Elasticsearch)に保存
問い合わせ・分析機能
独自APIであるquery機能を活用
することで、高度な探索・分析が可能
ユースケース ユースケース
詳細
コーパス 目的となる
仮説
想定
ユーザー
価値
顧客の声分析 商品・サービスへの
顧客コメント・調査
結果を分析し、顧客
の意見のパターンと
トレンドを特定する。
•顧客のコメント
•顧客へのアン
ケート結果
•ニュース情報
•SNSデータ
製品・サービス
を改善するには
どうしたらいい
のか?
•製品販売
責任者
•製品
•分析者
•UXデザイ
ナー
•商品の継続的
な改善
•市場での評判
への対応
資料探索
特定の専門分野に関
する、論文・資料・
特許情報など膨大な
資料に帯する検索
•研究資料
違ったデータ構
造を持つ膨大な
文書から望む文
書を取り出すに
はどうしたらい
いか?
•研究者
•研究の迅速化
•研究の時間・
コストの削減
Discoveryサービスのユースケース詳細
従来のWatson APIソリューションは、複数のAPIの組み合わせが必要なため、
複雑で非効率的です。
Discoveryサービス未使用時の課題
Discoveryはシンプルな構成で、より多くの機能を実現できます。
Discoveryサービスの価値
Watsonに
自分のトリセツを
食べさせてみた!
41
Watson Developer API 解体新書
42
Volume 1. Getting Started (Watson概念)
Volume 2. Conversation (対話エンジン)
Volume 3. Visual Recognition (画像認識)
Volume 4. Natural Language Classifier (自然言語分類)
Volume 5. Language Translator (言語翻訳)
Volume 6. Speech to Text / Text to Speech (音声認識・音声合成)
Volume 7. Natural Language Understanding (自然言語理解)
Node-REDではなく、Java、Node.jsで
プログラミングする際には超参考になる手順書!
http://www.redbooks.ibm.com/Redbooks.nsf/domains/watson?Open&count=10#ibm-pcon
PDFだけではなく
モバイルアプリもあるよ!
デモタイム
Discoveryサービス
43
さらに深く、楽しく
Watsonを学びために
44
IBM Code
45
https://watsonaccelerators.mybluemix.net/welcome
アプリケーションのサンプルソースコードを公開。
AI、データ分析、クラウド全般と主要テーマをカバー。
Qiita
https://qiita.com/tags/bluemix 46
やってみた系、Tips系の投稿、お待ちしております!
タブは、Bluemix
迅速な環境構築、最小限のデータから学習開始
数クリックでの構築 少ない学習データで動かせる
} {
基礎データ
自然言語
言語辞書
音声データ
画像データ
Inputと
Outputの
ペア情報
学習データ
自動で機械学習モデルを作成
47
無料からご提供、使った分だけ課金
• 無料で使い始められる
• サービスごとに無料枠あり
• 従量課金でスモールスタート
• 対話26銭、イメージタグ付け21銭
• 音声1分2.1円
• 豊富なサービス
• Watson以外のサービスも利用可能
• データベース、IoT、ブロックチェーン
例えば:NLC 1リクエスト×0.3675円
無料
値
段
リクエスト
1000
リクエスト
48
Watsonが使えるクラウド IBM Bluemix
49
今からでも学びたい!!
Watsonが得意な3つのこと (まとめ)
50
自然言語の理解、応答
非定型データの認識
情報の探索・分析処理
THINK Watson内の幻の記事「今さら聞けない!? Watsonが得意な3つのこと」の内容を中心に記載。
それ以外にも得意な領域、機能は多くあります。

いまからでも聞いていただきたい Watsonの得意な3つのこと!

Editor's Notes

  • #39 Voice of Customer Analysis Look through reviews and surveys and identify patterns and trends in customer opinions. Customer reviews Customer surveys News data Social data How can I improve my product or service? Product Managers Product Analysts UX Designers Continuously Improve products Manage public opinion Document Discovery Search through a large data set of documents (e.g. white papers, abstracts, patents) for content relating to your field of study. Research documents How can I find proof within thousands of documents from different data sources? Researchers Speed up research process Save time and save money hiring less data professionals