Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

ドコモAIエージェントAPIのご紹介

1,948 views

Published on

「ドコモAIエージェントAPIのご紹介」
吉川 貴、山崎 光司(NTTドコモ)
NTTドコモではお客さまのライフスタイルを革新する新AIエージェントの実現に向け、基盤の中核となる「AIエージェントAPI」 を開発いたしました。本講演では、AIエージェントAPIの概要と、それを構築する3つのエンジン、先読みエンジン、多目的対話エンジン、およびIoTアクセス制御エンジンについて紹介いたします。

Published in: Technology
  • Be the first to comment

ドコモAIエージェントAPIのご紹介

  1. 1. ドコモAIエージェントAPI のご紹介 ©2017 NTT DOCOMO, INC. All Rights Reserved. 株式会社NTTドコモ R&Dイノベーション本部 1
  2. 2. 『あらゆるモノに対話型AIサービスを提供したい』 自然な対話を通じて、会話が出来たり、コンテンツを提供したり、デバイスを操作したり まるであらゆるモノが意思を持ち、対話ができる。そんな新しい体験を提供します。 オープンパートナーイニシアティブ ©2017 NTT DOCOMO, INC. All Rights Reserved. 2
  3. 3. AIエージェント基盤 スマホ タブレット 様々なデバイス ドコモサービス 様々なサービス パートナー (サービス提供事業者や、メーカー等) 小売り 外食 金融 交通 etc… ドコモ 「ドコモAIエージェント・オープンパートナーイニシアティブ」の概要 ©2017 NTT DOCOMO, INC. All Rights Reserved. サービスオープン デバイスオープン 3
  4. 4. 「AIエージェント」利用イメージ ©2017 NTT DOCOMO, INC. All Rights Reserved. ●●してほしいな! 御用は ございますか? メイン エージェント あなたをよく知る エージェント 金融 交通 小売り ニュース 乗換 案内 グルメ 占い 情報 エン タメ ゲーム エキスパート エージェント 呼出 交代 私達が お応えします サービス提供の エキスパート 4
  5. 5. メインエージェント サービス提供者の好きなキャラクタを作成することができるようになり、 『サービス』と『デバイス』をつなぐ自由なサービスの提供ができる。 ©2017 NTT DOCOMO, INC. All Rights Reserved. スマホエージェント おもちゃ ロボット カーエージェント冷蔵庫エージェント 5
  6. 6. エキスパートエージェント サービス提供者がサービスを既存のメインエージェントの上に自由に提供できる。 ©2017 NTT DOCOMO, INC. All Rights Reserved. 自分の好きな エージェントを選んで 自分のメインエージェントに 追加できる “ユーザ” “デベロッパー” 登録 バックエンド実装 デベロッパーは自分のサービスを開発し、 オープンなインターフェースに繋いで マーケットプレイス上で公開できる。 “マーケットプレイス” こんな面白い エージェントを 思いついたぞ! サービス提供 サーバー/API 誰でも 作成可能 REST 6
  7. 7. メインエージェント と エキスパートエージェント 比較 メインエージェント エキスパートエージェント 特徴 フロントであり 利用者の事を理解する サービスに特化した 専用エージェント 呼び出し方 デバイスやアプリなどで 直接呼ばれる メインエージェントから 呼ばれる デバイスやアプリを 手に入れる マーケットプレイスから 探してくる 利用方法 パートナー企業が作成 (専門知識が必要)※1 セルフポータルで 誰でも作成可能 作成方法 基盤利用を申請※2 自由に作成可能※2利用開始方法 ※1 パートナー企業を絶賛募集中。 ※2 具体的な料金については、まだ決定しておりません。 ©2017 NTT DOCOMO, INC. All Rights Reserved. 7
  8. 8. AIエージェント基盤の役割 ©2017 NTT DOCOMO, INC. All Rights Reserved. ① ドコモの顧客に対する新AIエージェントの提供(B2C/既存からの顧客基盤の継承) ② 【メインエージェント】パートナー各社のデバイスへのAIエージェント機能の提供 ③ 【エキスパートエージェント】サービス提供者への顧客接点の提供 ① B2Cモデル ② B2Bモデル ③ マーケットプレイス AIエージェント基盤 Sebastien メインエージェント プロバイダ スマホ・タブレットを 中心としたデバイス マーケットプレイス 様々なデバイス エキスパート エージェント プロバイダ 【特徴】 • モバイルペイメント(ケータイ払い、iD等) dポイントの活用 • AI技術等を活用した、精度の高いマーケ ティング環境 API群・ツール API群・ツール 8
  9. 9. AIエージェント基盤の3つの機能 IoTアクセス 制御エンジン “Symphony” 先読みエンジン “Sense” 多目的対話エンジン “Speak” ©2017 NTT DOCOMO, INC. All Rights Reserved. 9
  10. 10. 多目的対話エンジン “Speak” ©2017 NTT DOCOMO, INC. All Rights Reserved. しゃべって コンシェル (2012年3月1日~) 自然対話 プラットフォーム (2015年6月4日~) 日本における4,300万人以上のお客様の 発話ログの蓄積による対話性能の向上 多目的対話エンジン おしゃべりロボット forBiz (2016年5月27日~) OHaNAS タカラトミー (2015年10月1日発売) ATOMプロジェクト 講談社・手塚プロダクション・富士ソフト・VAIO (2017年2月22日開始) 様々な法人顧客への提供実績 様々なデバイスへの 適用ノウハウ スマホ・タブレット での自然な対話 自然な対話 様々なエージェントデバイス しゃべってコンシェルで培った自然言語処理技術 自然対話プラットフォームでの様々なデバイスへの適用ノウハウ 数往復の連続対話 多往復対話 10
  11. 11. 多目的対話エンジン “Speak”の役割 ©2017 NTT DOCOMO, INC. All Rights Reserved. ふむふむ つまりこういうことが 言いたいらしいよ 音声入出力 テキスト入出力 サービス API等 あーお腹が空いたなぁ なんかおいしいラーメン食いたいなぁ 今日寒いなぁ 明日って朝何時に 起きればいい? 冷蔵庫のもので 何作れる? この前録画した 野球がみたい 多様・曖昧な表現・要求 現在位置周辺で 現在の時間で空いている こってり系ラーメン屋を 人気順+近い順の複合検索 エアコンをONにして、 部屋の温度を+2度に設定 明日の最初の予定の開始時間 を検索し、その時間を到着時間 にした路線検索で自宅の出発時間 を検索し、そこから1時間前に アラームをセット 冷蔵庫の中身のものを検索し、 賞味期限切れに最も近いもの を列挙し、その中から人気順で レシピ検索を行い、複合的にスコア の高いものから最大3個列挙 現在テレビのスイッチが付いていないなら スイッチを入れて、最後に 録画した野球ジャンルの映像を再生する 具体的かつ実行可能なサービス Virtual Personal Assistant(AIエージェント)を実現するためには 『自然言語』を解釈し、具体的かつ実行可能なサービスに変換する機構が必要になる 自然言語入力による人工知能 11
  12. 12. 多目的対話エンジン “Speak”の役割 ©2017 NTT DOCOMO, INC. All Rights Reserved. ふむふむ つまりこういうことが 言いたいらしいよ 音声入出力 テキスト入出力 サービス API等 あーはらへった なんかうまいラーメン食いたいなぁ 今日寒いなぁ 明日って朝何時に 起きればいい? 冷蔵庫のもので 何作れる? フジテレビが みたい 多様・曖昧な表現・要求 現在位置周辺で 現在の時間で空いている こってり系ラーメン屋を 人気順+近い順の複合検索 エアコンをONにして、 部屋の温度を+2度に設定 明日の最初の予定の開始時間 を検索し、その時間を到着時間 にした路線検索で自宅の出発時間 を検索し、そこから1時間前に アラームをセット 冷蔵庫の中身のものを検索し、 賞味期限切れに最も近いもの を列挙し、その中から人気順で レシピ検索を行い、複合的にスコア の高いものから最大3個列挙 現在テレビのスイッチが付いていないなら スイッチを入れて、デジタル放送の 8チャンネルに変更する 具体的かつ実行可能なサービス Virtual Personal Assistant(AIエージェント)を実現するためには 『自然言語』を解釈し、具体的かつ実行可能なサービスに変換する機構が必要になる 自然言語入力による人工知能 音声認識 (ASR) 音声合成 (TTS) 自然対話PF (NLU) 今日の天気は? 雨だよ 今日の 天気は? 雨だよ 時刻:2017/06/27 06:00:00 場所:TOKYO 天候:雨 天気予報 サービス 天気予報: 日時:2017/06/27 06:35:27 場所:東京 入力音声 出力音声 出力テキスト 入力テキスト API リクエスト API レスポンス 12
  13. 13. 各種デバイス サービス実装 多目的対話エンジン “Speak”の利用方法 サービス ロジック多目的対話 エンジン “Speak” サービス エンドポイント REST Call Response 13 Device SDK Android, (iOS) 汎用 AIスピーカー Raspberry Pi 例えば、AWS上に お客様が自由に実装 各種メッセンジャー エージェントの 設定をDeploy テキスト メタデータ 音声
  14. 14. 先読みエンジン “Sense” ©2017 NTT DOCOMO, INC. All Rights Reserved. 「AIインフォテイメントサービス」で培った行動分析技術 いつも近くに寄り添うAIエージェントが、 対話を通して、お客さまのことを深く理解し、 お客様一人ひとりに合わせたサービスを最適なタイミングで提供 サービスのパーソナライズ 14
  15. 15. 先読みエンジン ”Sense” サービス実現例 ©2017 NTT DOCOMO, INC. All Rights Reserved. スマホ上の位置や予定、メールから次の行動を先読みし、 最適なタイミングで必要な情報を提供します。 ①Pushで通知自宅:横浜 メインエージェント ②対話 自宅が横浜のAさんに、11時〜13時に届く予定の宅配物があるケース 11時〜13時の受け取り に間に合わないですね。 配送時間を 変更しませんか? 運送会社 (エキスパートエージェント) ③連携 配送時間を 18時~20時 に変更します 渋谷滞在中 ④配送時間変更 Aさん 15
  16. 16. IoTアクセス制御エンジン “Symphony” ©2017 NTT DOCOMO, INC. All Rights Reserved. IoT機器との相互接続性 デバイスWebAPI※の利用による実装の容易性 AIエージェント IoT機器 (例:ライト) ライトA ライトB ライトC ライトD ライトE 様々なデバイス 開発言語や開発環境に依存しない 共通インタフェース(API) 様々なIoT機器との接続インタフェースを共通化 (開発期間の短縮・コスト低減) 制御 ※ 121社の企業が参画するデバイスWebAPIコンソーシアムで議論・検討中の デバイス連携を実現する仕組み 規格A 規格B 規格C 規格D 規格E IoTアクセス制御エンジン 16
  17. 17. プラグインプラグイン HTTP デバイスWebAPIの特徴 • 機能による抽象化 • 統一の記述方式により、同一 機能であれば同じ実装でアク セスできるよう、抽象化を実 施 • WebAPIによる環境非依存化 • HTTPベースのWeb APIを採用 することで、開発言語や開発 環境、OSに依存せず、自由な 開発が可能 • 効果 • 開発期間/コスト低減 • デバイス非依存、容易な変更 && アプリの変更不要 これまで Philips社 Hue規格 NTTドコモ Linking規格 個別のアプリ 個別SDK 個別のアプリ 個別SDK デバイスWebAPI 一つのアプリ Philips社 Hue規格 NTTドコモ Linking規格 個別SDK 個別SDK デバイスWebAPI WebAPIで 環境非依存 規格は違うが どちらも同じ「ライト」 ©2016 NTT DOCOMO, INC. All Rights Reserved. 17 ライト ライト バイブ 通知 加速度 同一機能は 同じ記述で実装 例: PUT http://192.168.13.6:4035/gotapi/light?serviceId=AAAAAA
  18. 18. Symphony Architecture ©2017 NTT DOCOMO, INC. All Rights Reserved. 18 IoTデバイス スマホ/ホームGW 各 通 信 規 格 WebAPI ダッシュボー ド https プラグイン プラグイン プラグイン プラグイン エージェント アプリ http プラグイン プラグイン プラグイン プラグイン WebAPI Raspberry pi 各種PCDragonBoard ※Symphonyは開発コード名です (クラウド)
  19. 19. ふむふむ つまりこういうことが 言いたいらしいよ 多目的対話エンジンSpeak × IoTアクセス制御エンジンSymphony ©2017 NTT DOCOMO, INC. All Rights Reserved. 19 テレビつけ て 電気つけて ボリューム下げて ユーザ発話 Speak 赤くして 少し暗くして PUT https://*****.c om/device/v1/t v/ PUT https://*****.c om/device/v1/t v/volume POST https://*****.com /device/v1/tv/light PUT https://*****.c om/device/v1/t v/channel 音声認識 自然対話 音声合成 チャンネルを**にして DELETE https://*****.com /device/v1/tv/light WebAPI プラグイン プラグイン プラグイン
  20. 20. 20 PROJECT SEBASTIEN

×