Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

無脳スマートスピーカを 越えレレレのレ

154 views

Published on

Beyond Smart Speakers with Real Logical Inference AI

Published in: Technology
  • Be the first to comment

無脳スマートスピーカを 越えレレレのレ

  1. 1. 無脳スマートスピーカを 越えレレレのレ 2018.SEP.14 たけおか@AXE (京都で創業27年目)
  2. 2. たけおか って、誰?1977年(高校2年生)に、三目並べ(○×)を打つプログラムを開発、 ”Artificial Intelligence: The Heuristic Programming Approach”(1971/DEC)(日本語版,「人工知能 発見的プログラミング」(1972/JAN))を読んで…TK80(メモリ512Bytes,8080@2MHz)に機械語で実現 1980年代: UNIXの仮名漢字変換システムWnnやTemporal Prolog(時相 論理Prolog)を京大数解研の地下やKABAで作ったり。(Kyoto Common Lisp, Prolog-KABAの作者が居た) 渋谷や神保町辺りで国産X Window端末などの設計開発に携わる。TCP/IPスタックを自分で書く 1990年代初頭:豊橋技科大 湯淺研にて、1024PE規模の超並列計算 機“SM-1”のLSIハードウェア、基本ソフトウェアの設計開発に携わる。 当時、超並列計算機は、ニューラルネットのシミュレーションや、アニーリング計算に使用さ れた 現在:AI開発をしたり、 実時間OS,仮想マシン・ハイパバイザを作らせたり。 “SAN値Prolog”を開発。 湯淺研 SM-1 フロントエンドはSparc 開発環境はCommon LispとC 萩谷さん(KyotoCommonLisp開発者)に 貰った(サインはしてくれない) オリンパス デジカメザウルス SH-3版 (XTAL採用)
  3. 3. 論理推論AIを機械学習AIで高速化する特許 ・ルールの集合を「ルール・セット」と呼ぶ ・機械学習を使用して、推論対象の内容に より、 「ルール・セット」を切り替える。 ・ルール・セットが小さくなり、論理推論が 高速になる 特許番号【特許第6224811号】 登録日 【2017年10月13日】 「ルールセットを選択可能な推論エンジンを有するプログ ラム、装置及び方法」
  4. 4. 普通のスマート・スピーカ • AI技術は使っているだろうが… • 主に、機械学習による、文章のカテゴリ分け だと思われる • カテゴリがわかった後は、単純なコマンド実行 = 知能的な部分が ほぼ無い • エアコンを付ける/ニュース,天気の読み上げ • 一般に考えられている AI からはほど遠い
  5. 5. Google Assistant + Google Cloud Speech API + AXE AI “ごまめ”
  6. 6. Google AIY Voice kit ● Googleが開発 ● Do It YourselfでGoogle のAIを試せるキット ● RaspberryPi雑誌に載せた ● キットが販売されるようになった ● raspiに基板(hat)を取り付けたもの – マイク(ADC後I2C)×2 – DAC+アンプ+スピーカ – LED : PWMで明るさが変わる – 押しボタン ● Raspi1でもある程度動作 ● AIYには、カメラもある
  7. 7. Google AIY Voice kit ● Google Assistant ● Google Cloud Speech API が試せる ● Google Assistant – 「OK Google」で起動 ● いつも耳をすましている ● hotword を待つ – 天気、なぞなぞ ● ニュースは無料版では読んでくれない ● 日本語化可能 ● Google Cloud Speech API – 音声認識する – APIを使用すると課金される ● 少しだけなら無料 – hotword起動ではないので、ずっと聴かせていると、大変にお金が掛かる ● hotwordを認識させるために使用してはいけない!(これ重要) Goole AIYの中身を 綺麗な ケースに入れただけ Amazonで売ってる
  8. 8. 8 中間ゴール 生成 パターン マッチング 処理により 規則を起動 日本語解析部 (形態素解析 & 構文解析) 形態素解析 & 構文解析 辞書等 メール アクション1 アクション2 学習 (記憶更新) 短期記憶 長期記憶 (RDB) 帰納 推論 エンジン 中間ゴール 生成用 ルール ベース 中間 ゴール 中間 ゴール 中間 ゴール ルールベース ルール セット1 文書の内容 認識用 機械学習済み モデル カテゴリ 判定器 (機械学習) ルール セット2 自然言語 入力 AXE AIシステム ブロック図 選ばれた ルールセット ※特許取得済みの機構で高速 センサ 前処理 ● 精密な自然言語文 解析 ● 帰納論理推論により、精度の 高い推論を行う ● 機械学習と論理推論のハイ ブリッドAI
  9. 9. 今回のG_AIY+ごまめ 構成 ● Assistant と CloudSpeech の両方を使用 – それらを、ごまめのフロントエンドとする ● ※本システムのポイント ● hotwordを待つところと、一発目の音声認識は、Assistantにやらせる – 無料で音声認識が使える ● まともな対話が始まったらCloud Speechに移る ● 雑音を聴くためには、Cloud Speechは使用しない Assistant 音声認識 & 一発返答(音声合成) Cloud Speech 音声認識 専門 AXE AI ごまめ 音声認識結果漢字かな混じり文 音声認識結果 漢字かな混じり文 音声合成 Assistantに 投げた場合 音声合成も 対話セッション・ フラグ 対話セッション開始で生成 終了で消去 サーバ AIY スピーカ 音声合成 AI返答 漢字かな混じり文 スピーカ
  10. 10. G_AIY+ごまめ 動作1) Assistant でhotward(「OK google」) or ボタン押下 を待つ 2) その後、人間が喋る Assistant機能でヒアリング。無料 3) その文の中に「google」が含まれていたら → Google Assistant 動作(一発返答) → 1)へ戻る else ごまめに渡す 4) ごまめ の自然言語解析&ルール実行 5) ルールが、単純な応答 (一発 返答で終了) の場合 →ごまめ 音声合成で応答→ 1) へ戻る else シーケンスのある 対話(対話セッション)が始まる 6) ごまめ音声合成で応答 7)その後、Cloud Speech による音声認識 = 人間の発話を待つ(hotword無し) 8) 音声認識結果を ごまめ が解析、ルール実行、ごまめ音声合成で応答 9) 対話セッションが終了するまで、7) へループ 10)対話セッションが終了したら、1)へ Assistant 1)音声認識 3) 一発返答(音声合成) 7) Cloud Speech 音声認識 専門 4), 8)AXE AI ごまめ 音声認識結果漢字かな混じり文 音声認識結果 漢字かな混じり文 音声合成 音声合成 人間の発話に “google”が含まれていた時 assistant動作 ※ミソ ● hotwordを待つところは、 Assistantにやらせる。 ● 最初の1文の認識は、Assistantにやらせ る。(無料) ● まともな対話が始まったらCloud Speechに移る 対話セッション開始で生成 終了で消去 対話セッション・フラグ スピーカ スピーカ
  11. 11. Google Cloud Speech API + AXE AI “ごまめ” Cloud Speech API
  12. 12. 12 ごまめ 機械学習 顔認識 推論規則 ごまめ 論理推論システム 出力 カメラ メール SNSログ 入力 入力 日本語 処理 スケジュール抽出ニュース/ 天気予報 行動提案 マイク Google 音声認識 Google CloudSpeech API 入力 問題解決 対話 AXE AIスピーカ=AXE AI+音声認識(顔を見る版) ● 音声認識: Google Cloud Speech APIを使用 ● AIで顔認識。顔が見えたら、話を聞く – 人間が居ないときは、聴かない ● 後ろは、論理推論AI USB カメラ マイク付き
  13. 13. 13 推論規則 ごまめ 論理推論システム 出力 人感センサ メール SNSログ 入力 日本語 処理 スケジュール抽出ニュース/ 天気予報 行動提案 マイク Google 音声認識 Google CloudSpeech API 入力 問題解決 対話 AXE AIスピーカ=AXE AI+音声認識(人感センサ版) ● 音声認識: Google Cloud Speech APIを使用 ● 人間を検出したら、話を聞く – 人間が居ないときは、聴かない ● 後ろは、論理推論AI 赤外線 人感 センサ USB マイク
  14. 14. 現在の ごまめ 対話 ● 出前注文 ● 顔占い ● プリンタ異常相談 ● 一問一答 (反射的 返答) ● 無脳対話 (反射的 返答)
  15. 15. 15 AXE AI対話 1: 出前発注 • お弁当/出前ピザ/出前寿司 受注システム • AIが色々、対話的に尋ねる • 和食/洋風 • トッピング • 何人前 • ご予算 などを、AIが尋ねる • 昨日、食べたものと被らない • AIがユーザのことを記憶 • 趣味/嗜好について、AIが聞き出し記憶 • 後日、趣味に合った情報をAIが、提供 • 食品: ワイン、日本酒… •
  16. 16. 16 AXE AI対話 2: エキスパート・システム • 実例: 顔占い • 書籍の知識を AI のルールとした • 推論を行う • 専用アプリとの違い • 占いの途中で、関係無いことを言ってもよい • 雑談をしてもよい • 元の占いに戻れる • 現在、デモ用に「カメの病気診断」を開発中
  17. 17. 17 AXE AI対話 3: エキスパート・システム(2) • プリンタ異常 診断 • ビジネスホテルや小学 校での使用を想定 • メンテナンス担当が 居ない環境
  18. 18. 18 AXE AI対話 4:無脳ちゃん • 人工無脳ちゃん 機能 • 日本語 解析は、かなり真面目に行っている • 脊髄反射 対話 • 地名や組織名が入っていると、その場所を表示する ● テキスト無脳ちゃん対話 movie ● http://www.takeoka.org/~take/munou/robot-chat1.mpg ● http://www.takeoka.org/~take/munou/munou-chat.mp4
  19. 19. 19 AXE AI対話 4:無脳ちゃん クラス分け された単語に対して • 他者の クラス分け からの 応答システム • IBM NLC(Natural Language Classifier) • Microsoft 「りんな」 • 入力された文をクラス分け ↓ • クラスごとに、応答文がある • AXE AI も対応 • 現在は、単語をクラス分け → 応答文は、ルールとして用意 ● テキスト無脳ちゃん対話 movie ● http://www.takeoka.org/~take/munou/robot-chat1.mpg ● http://www.takeoka.org/~take/munou/munou-chat.mp4
  20. 20. 20 AXE AI対話 5: 嗜好分析 • 趣味/嗜好について、AIが聞き出し記憶 – 後日、趣味に合った情報をAIが、提供 ● 食品: ワイン、日本酒… ● 趣味: 釣り、鉄道、健康、アマチュア無線… • メール、スケジュール、SNSログの内容も分析対象 – AIが覗き見をして、嗜好分析を行う
  21. 21. 21 ごまめ 対話ツール&フレームワーク ● シナリオ作成ツール – Excel (CSV) → ルール 変換ツール – これが入力されたら、これを返答 のような反射神経的 応答を書く – 変数はあり、目的語 的な単語を、返答に埋めることが可能 ● AIML ツール – AIML → ルール 変換ツール (開発中) – https://ja.wikipedia.org/wiki/Artificial_Intelligence_Markup_Language ● Yes/No 診断 フレームワーク – 顔占い,プリンタ故障診断などで使用しているフレームワーク – Excelで記述したシナリオから、容易にルール化できる ● 現在、ルールへの書き下しは、AXEで請負 ● 高度な対話 – 出前注文は、シナリオからルールを書き下す
  22. 22. 以上

×