SlideShare a Scribd company logo
1 of 32
Download to read offline
ntt.com
Transform your business, transcend expectations with our technologically advanced solutions.
Copyright © NTT Communications Corporation. All rights reserved.
Transform your business, transcend expectations with our technologically advanced solutions.
Copyright © NTT Communications Corporation. All rights reserved.
日本語における自然言語解析とその応用
〜COTOHA VA & API〜
NTTコミュニケーションズ株式会社
アプリケーション&コンテンツサービス部
AI推進室
Team MASAMASA (石井方邦 / 浜田正裕)
Copyright © NTT Communications Corporation. All rights reserved.
 名前:石井方邦(MASAkuni Ishii)
 所属:NTTコミュニケーションズ
 担当:COTOHAパートナーセールス/イノベーション
 趣味:音楽聴く/ライブ行く
 2大学生時代勉強したくなかったこと:DB、機械学習
 経歴
・学生時代:セキュリティの研究に従事
・NTT研究所入社:セキュリティ&BigDataチームに配属
OJTしてるときにチームが分割/なぜかBigDataチームへ
Twitterのデータをひたすら収集
オンライン機械学習エンジン「Jubatus」
・NTTコミュニケーションズへ異動:
なぜか海外製品を利用したオーダーシステムを開発
その後、”COTOHA”の販売チームに。。。
自己紹介
1
気づいたらAIやってました
Copyright © NTT Communications Corporation. All rights reserved.
 名前: 浜田正裕(MASAhiro Hamada)
 所属: NTTコミュニケーションズ
 担当: COTOHA API開発
 趣味: ソーイング・自転車・読書・レザークラフト・
車中泊旅行・カラオケ
 よく使う言語: Ruby, Bash
 経歴:
2006年電気通信大学卒。
チャットボット+質問応答が研究テーマ。
2006年NTTアドバンステクノロジ社入社。
入社後10年程度、
NTTレゾナントの検索システム関連開発に従事。
2016年 NTTコミュニケーションズ社に出向。
COTOHA開発に従事
自己紹介
2
気づいたらAIやってました
Copyright © NTT Communications Corporation. All rights reserved.
【参考】NTTコミュニケーションズについて
日本電信電話株式会社(持株会社)
・営業収益: 1兆2,830億円 ・営業利益: 1,325億円
グローバルに高品質な
ICTサービスを提供
<拠点の展開状況>
など
・約21,550名
[内訳] 国内 : 約11,900名 海外 : 約 9,650名
*1 2017年3月末時点 *2 データセンター拠点数は計画を含む
・41の国や地域の112都市で事業拠点展開
・196の国や地域でグローバルネットワークサービスを提供
・世界最大級のグローバルTier1 IPバックボーン
・全世界に140以上のデータセンターを展開*2
<2016年度の事業状況>
<従業員数>
Copyright © NTT Communications Corporation. All rights reserved.
COTOHAサービス
4
短期間で導入が可能な、ユーザーの自
己解決を支援するAIサービス
自然な日本語を高い精度で理解し、
必要な情報を自ら聞き出すといった
“人間らしい対話”ができるAI
AIによる超高精度の自動翻訳を実現す
る、企業向け翻訳ソリューション
NTTグループの40年以上にわたる研究
成果である日本語辞書・自然言語処理
を活用したAPIプラットフォーム
Copyright © NTT Communications Corporation. All rights reserved.
これだれかわかりますか?
5
Copyright © NTT Communications Corporation. All rights reserved. 6
Copyright © NTT Communications Corporation. All rights reserved. 7
7
NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
Copyright © NTT Communications Corporation. All rights reserved. 8
会話から欲しい商品をリコメンド
会話により、購入前の不安を解消
NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
Copyright © NTT Communications Corporation. All rights reserved. 9
会話から欲しい商品をリコメンド
会話により、購入前の不安を解消
NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
Copyright © NTT Communications Corporation. All rights reserved.
コリスのほうがかわいい。。。
10
Copyright © NTT Communications Corporation. All rights reserved. 11
11
なぜ、チャットボット等の
コミュニケーション系AI
にイマイチ感があるのか?
Copyright © NTT Communications Corporation. All rights reserved. 12
「会話」を理解する
なぜ、コミュニケーション系AIにイマイチ感があるのか
「画像・映像」を理解する
「状態」を理解する
*自動運転など
Copyright © NTT Communications Corporation. All rights reserved. 13
「会話」を理解する
なぜ、コミュニケーション系AIにイマイチ感があるのか
「画像・映像」を理解する
「状態」を理解する
*自動運転など
「人ができることできないのか」
と感じる
Copyright © NTT Communications Corporation. All rights reserved. 14
「会話」を理解する
なぜ、コミュニケーション系AIにイマイチ感があるのか
「画像・映像」を理解する
「状態」を理解する
*自動運転など
「人ができることできないのか」
と感じる
「人ではできないな」
と感じる
Copyright © NTT Communications Corporation. All rights reserved. 15
「会話」を理解する
なぜ、コミュニケーション系AIにイマイチ感があるのか
「画像・映像」を理解する
「状態」を理解する
*自動運転など
「人ができることできないのか」
と感じる
「人ではできないな」
と感じる
Copyright © NTT Communications Corporation. All rights reserved. 16
Hololens
X
COTOHA
X
IoT
Copyright © NTT Communications Corporation. All rights reserved.
 NTTコミュニケーションズのEnterprise Cloud上でのSaaS型サービスです。
 接続するインターフェースやデータベースについては、お客さまのご要件に応じてソ
リューションをご提供します。
COTOHAの利用イメージ(全体像)
17
質問
お客さま
API
自然言語解析
モジュール
チ
ャ
ッ
ト
シ
ス
テ
ム
辞書群
会話フロー設定
モジュール
FAQ設定
モジュール
エスカレーション
半自動学習
回答
オペレーター
社内システム
/DB
外
部
接
続
モ
ジ
ュ
ー
ル
コンテンツ群
チャット
ロボット
音声認識・合成
WEB Site
翻訳エンジン
Enterprise
Cloud インターネット
天候 ニュース 交通情報 金融情報 位置情報
Copyright © NTT Communications Corporation. All rights reserved.
COTOHAサービス
18
短期間で導入が可能な、ユーザーの自
己解決を支援するAIサービス
自然な日本語を高い精度で理解し、
必要な情報を自ら聞き出すといった
“人間らしい対話”ができるAI
AIによる超高精度の自動翻訳を実現す
る、企業向け翻訳ソリューション
NTTグループの40年以上にわたる研究
成果である日本語辞書・自然言語処理
を活用したAPIプラットフォーム
Copyright © NTT Communications Corporation. All rights reserved.
AIを脳で表してみる
19
19
会話脳
予測脳
・・・
記
憶
領
域
知
識
領
域
分析脳
言語脳
Copyright © NTT Communications Corporation. All rights reserved.
AIを脳で表してみる
20
20
言語脳
会話脳
予測脳
・・・
記
憶
領
域
知
識
領
域
分析脳
ここ
Copyright © NTT Communications Corporation. All rights reserved.
意味を利用した日本語解析とは?
21
Copyright © NTT Communications Corporation. All rights reserved.
意味を利用した日本語解析とは?
22
サラダは食べるけど妹は食べません!
Copyright © NTT Communications Corporation. All rights reserved.
意味を利用した日本語解析とは?
23
昨日、銀座でサラダと焼き肉を食べた。
昨日、銀座で妹と焼き肉を食べた。
私
サラダ
焼肉
食べる
私
妹
焼肉 食べる
+
+
サラダは食べるけど妹は食べません!
Copyright © NTT Communications Corporation. All rights reserved.
NTTグループの40年以上にわたる研究成果である日本語辞書・自然言語機能、および
COTOHAサービスの提供を通じて独自開発した機能をベースとした「テキスト・
言語解析」「対話」「音声認識」向けAPIサービスです。
COTOHA APIの概要
24
日本語テキストを扱う
様々なビジネスシーン
に活用可能
NTTグループの40年以上
にわたる研究成果である
日本語辞書・自然言語処理を
活用したAPI
辞書および
APIカスタマイズで
さらに精度向上
が可能 COTOHA API
テキスト
アナリティクス 翻訳
A
あ
接客応対 マーケティング ヘルプデスク
…
API設定
カスタマイズ
お客さま個別辞書
NTT業界用語辞書
NTT基本語辞書
テキスト
言語解析
対話 音声
Copyright © NTT Communications Corporation. All rights reserved.
COTOHA APIの活用シーン
RPAの前処理で表記揺れを検知・訂正することでRPAの適用範囲拡大
RPA導入による業務効率化を行ったが、
処理するファイル(メール等)にノイズ
が多く、Robotが業務処理を行えない。
…
COTOHA APIで表記揺れ等のノイズを
除去することでRobotが業務処理可能
に。RPA適用範囲拡大により導入効果
を更に向上。
表記揺れ正規化
2
活用が難しい非構造ビッグデータのマーケティング活用
ビッグデータをマーケティング等に活
用したいが、非構造データの解析が難
しく、価値ある資産が活かされること
なく塩漬けになっている。
COTOHA APIを用いて非構造データの
解析/ユーザー属性の抽出を行うことで、
ビッグデータ活用したマーケティング
が可能に。
1
ユーザー属性、
キーワード抽出
…
Copyright © NTT Communications Corporation. All rights reserved.
COTOHA APIの活用シーン
音声認識の精度改善による、応対システム導入効果向上
音声入力をUIとして後続の
VA/Chatbotへ連携するRobot中心の応
対システムを導入したが、認識精度が
低く、コスト削減効果が得られない。
COTOHA APIで音声特有の認識誤りを
検知・訂正することで、精度向上が可
能。人へのエスカレ率の低減等により、
コスト削減効果が増大。
3
ゼロベースでは対応が難しい日本語対応をAdd-onで実現
既存のVA製品の多言語化を進める際に、
習得/解析難易度が高い日本語は構築
に莫大な工数がかかる。
COTOHA APIではお客様のVA製品に、
必要な機能だけをAdd-onする形で日
本語化対応が可能。
4
ええと・・・、プリン
を4個ください …
ええとプリンをよんこう
ください
ええと・・・、プリン
を4個ください
プリンを4個ください
言い淀み除去・
誤り検知・訂正
How long does it
take to get there?
30min.
そこに着くまでどれくらい? ???
How long does it
take to get there?
30min.
そこに着くまでどれくらい? 30分です
構文解析・
翻訳
Copyright © NTT Communications Corporation. All rights reserved.
COTOHA APIの強み「①日本語辞書」「②意味属性利用」「③日本語文脈理解」
により、日本語文章を正しく詳細に理解できるため、実現不可能だった活用ケー
スにリーチできます。
COTOHA APIの強み
27
現状例
フレッツ光定額プラン…いや
2段階定額プランを申し込
みたい。
否定語
修正語
すみません、わかりません。
年代:不明
職業:不明
居住地:不明
VA利用者
VA対話ログ
年代:20-30代
職業:医療関係
居住地:田町
VA利用者
不良品の
クーリング
オフをした
いです
mail テーマ
返品依頼
後続業務
?
HEXが故障した。
すみません、
よくわかりません。
HEXが故障した。
熱交換器の
故障問合せですね。
COTOHA APIの強み
①世界最大級の
日本語辞書
(随時拡充中)
②単語を約3000種の
意味属性に分類
③日本語文章の文脈理解
将来活用例
私 / は / 昨日 / 、 / 彼 / が / 書 く/ い / た / 小説 / を / 本屋 / で / 買う / い / ました
動作主格 述語時間格 場所格対象格
動作主格 述語 対象格
フレッツ光定額プラン…いや
2段階定額プランを申し込
みたい。
否定語
修正語
2段階定額プランですね。
テーマ
返品問合せ
不良品の
クーリング
オフをした
いです
mail テーマ
返品依頼
後続業務
テーマ
返品問合せ
返品
対応
Copyright © NTT Communications Corporation. All rights reserved.
COTOHA API活用事例
Copyright © NTT Communications Corporation. All rights reserved.
自然言語3カテゴリ23種類のAPIを順次公開予定です。
提供API(言語・テキスト解析API)
言語・テキスト解析APIs
固有表現抽出 人名や地名などの固有表現を抽出します。 2018/1Q予定2
構文解析
日本語テキストの構造と意味を解析します。※
・形態素解析:文章を単語ごとに分割し、品詞タイプを出力
・表記ゆれ正規化:表記ゆれや崩れ語を正規化し出力
・意味解析:係り受けを解析し、文節間の意味関係を出力
2018/1Q予定1
キーワード抽出 人名や地名、組織など、文章の主要なキーワードを抽出します。 2018/1Q予定7
照応解析
「あれ」「これ」「次」「他」等の指示語・省略語を検知し、
内容を明記した文章を出力します。
2018/1Q予定
(BETA版)
4
Copyright © NTT Communications Corporation. All rights reserved.
自然言語3カテゴリ23種類のAPIを順次公開予定です。
提供API(対話API)
対話APIs
文タイプ判定 叙述文、命令文、質問文等の文タイプを出力します。 2018/1Q予定3
類似度判定 文章間の類似度を算出し、出力します。 2018/1Q予定7 A B
ユーザ属性推定 文章からユーザの年代、職業等の属性を推定します。
2018/1Q予定
(BETA版)
4
Copyright © NTT Communications Corporation. All rights reserved.
自然言語3カテゴリ23種類のAPIを順次公開予定です。
提供API(音声認識API)
音声認識APIs
言い淀み除去 ユーザからの音声入力時に含まれる言い淀みを除去します。 2018/3Q予定1
誤り箇所検知
音声認識処理後のテキストに対して、認識ミスの恐れがある単
語を検知・抽出します。
2018/3Q予定2
!
誤り箇所訂正
音声認識処理後のテキストに対して、認識ミスの恐れがある単
語を検知し、修正候補を提示します。
2018/3Q予定3
✔

More Related Content

What's hot

カルマンフィルタ入門
カルマンフィルタ入門カルマンフィルタ入門
カルマンフィルタ入門Yasunori Nihei
 
TensorFlow計算グラフ最適化処理
TensorFlow計算グラフ最適化処理TensorFlow計算グラフ最適化処理
TensorFlow計算グラフ最適化処理Atsushi Nukariya
 
異常検知 - 何を探すかよく分かっていないものを見つける方法
異常検知 - 何を探すかよく分かっていないものを見つける方法異常検知 - 何を探すかよく分かっていないものを見つける方法
異常検知 - 何を探すかよく分かっていないものを見つける方法MapR Technologies Japan
 
モデル高速化百選
モデル高速化百選モデル高速化百選
モデル高速化百選Yusuke Uchida
 
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイARISE analytics
 
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)ryotat
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標圭輔 大曽根
 
20190619 オートエンコーダーと異常検知入門
20190619 オートエンコーダーと異常検知入門20190619 オートエンコーダーと異常検知入門
20190619 オートエンコーダーと異常検知入門Kazuki Motohashi
 
Unreal Engine を用いた、駐車スペース検知のための学習データ生成
Unreal Engine を用いた、駐車スペース検知のための学習データ生成Unreal Engine を用いた、駐車スペース検知のための学習データ生成
Unreal Engine を用いた、駐車スペース検知のための学習データ生成Silicon Studio Corporation
 
Ponanzaにおける強化学習とディープラーニングの応用
Ponanzaにおける強化学習とディープラーニングの応用Ponanzaにおける強化学習とディープラーニングの応用
Ponanzaにおける強化学習とディープラーニングの応用HEROZ-JAPAN
 
Randomforestで高次元の変数重要度を見る #japanr LT
 Randomforestで高次元の変数重要度を見る #japanr LT Randomforestで高次元の変数重要度を見る #japanr LT
Randomforestで高次元の変数重要度を見る #japanr LTAkifumi Eguchi
 
【DL輪読会】Incorporating group update for speech enhancement based on convolutio...
【DL輪読会】Incorporating group update for speech enhancement  based on convolutio...【DL輪読会】Incorporating group update for speech enhancement  based on convolutio...
【DL輪読会】Incorporating group update for speech enhancement based on convolutio...Deep Learning JP
 
[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for VisionDeep Learning JP
 
テーブル・テキスト・画像の反実仮想説明
テーブル・テキスト・画像の反実仮想説明テーブル・テキスト・画像の反実仮想説明
テーブル・テキスト・画像の反実仮想説明tmtm otm
 
エッジ向けDeepLearningプロジェクトで必要なこと
エッジ向けDeepLearningプロジェクトで必要なことエッジ向けDeepLearningプロジェクトで必要なこと
エッジ向けDeepLearningプロジェクトで必要なことLeapMind Inc
 
A/Bテストのための検定
A/Bテストのための検定A/Bテストのための検定
A/Bテストのための検定Genki Ishibashi
 
Gunosyにおける仮説検証とABテスト
Gunosyにおける仮説検証とABテストGunosyにおける仮説検証とABテスト
Gunosyにおける仮説検証とABテストShunsuke Kozawa
 

What's hot (20)

GPT解説
GPT解説GPT解説
GPT解説
 
カルマンフィルタ入門
カルマンフィルタ入門カルマンフィルタ入門
カルマンフィルタ入門
 
TensorFlow計算グラフ最適化処理
TensorFlow計算グラフ最適化処理TensorFlow計算グラフ最適化処理
TensorFlow計算グラフ最適化処理
 
異常検知 - 何を探すかよく分かっていないものを見つける方法
異常検知 - 何を探すかよく分かっていないものを見つける方法異常検知 - 何を探すかよく分かっていないものを見つける方法
異常検知 - 何を探すかよく分かっていないものを見つける方法
 
モデル高速化百選
モデル高速化百選モデル高速化百選
モデル高速化百選
 
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイ
 
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
行列およびテンソルデータに対する機械学習(数理助教の会 2011/11/28)
 
いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標いまさら聞けない機械学習の評価指標
いまさら聞けない機械学習の評価指標
 
20190619 オートエンコーダーと異常検知入門
20190619 オートエンコーダーと異常検知入門20190619 オートエンコーダーと異常検知入門
20190619 オートエンコーダーと異常検知入門
 
Unreal Engine を用いた、駐車スペース検知のための学習データ生成
Unreal Engine を用いた、駐車スペース検知のための学習データ生成Unreal Engine を用いた、駐車スペース検知のための学習データ生成
Unreal Engine を用いた、駐車スペース検知のための学習データ生成
 
Group normalization
Group normalizationGroup normalization
Group normalization
 
Ponanzaにおける強化学習とディープラーニングの応用
Ponanzaにおける強化学習とディープラーニングの応用Ponanzaにおける強化学習とディープラーニングの応用
Ponanzaにおける強化学習とディープラーニングの応用
 
Randomforestで高次元の変数重要度を見る #japanr LT
 Randomforestで高次元の変数重要度を見る #japanr LT Randomforestで高次元の変数重要度を見る #japanr LT
Randomforestで高次元の変数重要度を見る #japanr LT
 
【DL輪読会】Incorporating group update for speech enhancement based on convolutio...
【DL輪読会】Incorporating group update for speech enhancement  based on convolutio...【DL輪読会】Incorporating group update for speech enhancement  based on convolutio...
【DL輪読会】Incorporating group update for speech enhancement based on convolutio...
 
[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]MetaFormer is Actually What You Need for Vision
 
テーブル・テキスト・画像の反実仮想説明
テーブル・テキスト・画像の反実仮想説明テーブル・テキスト・画像の反実仮想説明
テーブル・テキスト・画像の反実仮想説明
 
エッジ向けDeepLearningプロジェクトで必要なこと
エッジ向けDeepLearningプロジェクトで必要なことエッジ向けDeepLearningプロジェクトで必要なこと
エッジ向けDeepLearningプロジェクトで必要なこと
 
A/Bテストのための検定
A/Bテストのための検定A/Bテストのための検定
A/Bテストのための検定
 
Gunosyにおける仮説検証とABテスト
Gunosyにおける仮説検証とABテストGunosyにおける仮説検証とABテスト
Gunosyにおける仮説検証とABテスト
 
ResNetの仕組み
ResNetの仕組みResNetの仕組み
ResNetの仕組み
 

Similar to 日本語における自然言語解析とその応用 〜COTOHA VA & API〜

ロボットサービス開発の現場から
ロボットサービス開発の現場からロボットサービス開発の現場から
ロボットサービス開発の現場からKohei Kojima
 
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣aslead
 
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略NVIDIA Japan
 
ドコモの取り組みを事例としたクラウドとAi
ドコモの取り組みを事例としたクラウドとAi ドコモの取り組みを事例としたクラウドとAi
ドコモの取り組みを事例としたクラウドとAi Osaka University
 
IOT and Lean Manifacturing
IOT and Lean ManifacturingIOT and Lean Manifacturing
IOT and Lean ManifacturingOsaka University
 
AI(人工知能)技術を用いた自動応答サービスの今と未来
AI(人工知能)技術を用いた自動応答サービスの今と未来AI(人工知能)技術を用いた自動応答サービスの今と未来
AI(人工知能)技術を用いた自動応答サービスの今と未来Katsuo Inaya
 
ビックデータとシリコンバレースタートアップ事情
ビックデータとシリコンバレースタートアップ事情ビックデータとシリコンバレースタートアップ事情
ビックデータとシリコンバレースタートアップ事情Osaka University
 
NTT Communications' Initiatives to Utilize Infrastructure Data
NTT Communications' Initiatives to Utilize Infrastructure DataNTT Communications' Initiatives to Utilize Infrastructure Data
NTT Communications' Initiatives to Utilize Infrastructure DataDataWorks Summit
 
AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用
AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用
AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用Daiyu Hatakeyama
 
インタリオカンファレンス案内(修正版)3
インタリオカンファレンス案内(修正版)3インタリオカンファレンス案内(修正版)3
インタリオカンファレンス案内(修正版)3Tomoaki Sawada
 
クラウド座談会資料
クラウド座談会資料クラウド座談会資料
クラウド座談会資料知礼 八子
 
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
IT勉強会を支えるコミュニケーション
IT勉強会を支えるコミュニケーションIT勉強会を支えるコミュニケーション
IT勉強会を支えるコミュニケーションKoji Shiraishi
 
第7回ros勉強会 NTTデータのロボティクス分野取り組み
第7回ros勉強会 NTTデータのロボティクス分野取り組み第7回ros勉強会 NTTデータのロボティクス分野取り組み
第7回ros勉強会 NTTデータのロボティクス分野取り組みMasato Kawamura
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」Cybozucommunity
 
IoTデバイスデータ収集の難しい点
IoTデバイスデータ収集の難しい点IoTデバイスデータ収集の難しい点
IoTデバイスデータ収集の難しい点Tetsutaro Watanabe
 
テクノアカデミー郡山 現役ソフトウェアエンジニアが語る。IT の今と未来
テクノアカデミー郡山 現役ソフトウェアエンジニアが語る。IT の今と未来テクノアカデミー郡山 現役ソフトウェアエンジニアが語る。IT の今と未来
テクノアカデミー郡山 現役ソフトウェアエンジニアが語る。IT の今と未来Daiyu Hatakeyama
 
「IoTビジネスの嘘とホント~必要な検討事項と技術検証~」Developer Summit kansai 20160915
「IoTビジネスの嘘とホント~必要な検討事項と技術検証~」Developer Summit kansai 20160915「IoTビジネスの嘘とホント~必要な検討事項と技術検証~」Developer Summit kansai 20160915
「IoTビジネスの嘘とホント~必要な検討事項と技術検証~」Developer Summit kansai 20160915知礼 八子
 
実世界の人工知能@DeNA TechCon 2017
実世界の人工知能@DeNA TechCon 2017 実世界の人工知能@DeNA TechCon 2017
実世界の人工知能@DeNA TechCon 2017 Preferred Networks
 

Similar to 日本語における自然言語解析とその応用 〜COTOHA VA & API〜 (20)

ロボットサービス開発の現場から
ロボットサービス開発の現場からロボットサービス開発の現場から
ロボットサービス開発の現場から
 
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣
Mattermostが働き方を劇的改善!NRIの働き方改革の秘訣
 
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略
 
ドコモの取り組みを事例としたクラウドとAi
ドコモの取り組みを事例としたクラウドとAi ドコモの取り組みを事例としたクラウドとAi
ドコモの取り組みを事例としたクラウドとAi
 
IOT and Lean Manifacturing
IOT and Lean ManifacturingIOT and Lean Manifacturing
IOT and Lean Manifacturing
 
AI(人工知能)技術を用いた自動応答サービスの今と未来
AI(人工知能)技術を用いた自動応答サービスの今と未来AI(人工知能)技術を用いた自動応答サービスの今と未来
AI(人工知能)技術を用いた自動応答サービスの今と未来
 
ビックデータとシリコンバレースタートアップ事情
ビックデータとシリコンバレースタートアップ事情ビックデータとシリコンバレースタートアップ事情
ビックデータとシリコンバレースタートアップ事情
 
NTT Communications' Initiatives to Utilize Infrastructure Data
NTT Communications' Initiatives to Utilize Infrastructure DataNTT Communications' Initiatives to Utilize Infrastructure Data
NTT Communications' Initiatives to Utilize Infrastructure Data
 
AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用
AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用
AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用
 
インタリオカンファレンス案内(修正版)3
インタリオカンファレンス案内(修正版)3インタリオカンファレンス案内(修正版)3
インタリオカンファレンス案内(修正版)3
 
クラウド座談会資料
クラウド座談会資料クラウド座談会資料
クラウド座談会資料
 
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
IT勉強会を支えるコミュニケーション
IT勉強会を支えるコミュニケーションIT勉強会を支えるコミュニケーション
IT勉強会を支えるコミュニケーション
 
第7回ros勉強会 NTTデータのロボティクス分野取り組み
第7回ros勉強会 NTTデータのロボティクス分野取り組み第7回ros勉強会 NTTデータのロボティクス分野取り組み
第7回ros勉強会 NTTデータのロボティクス分野取り組み
 
基調講演「データのグループウェア化」
基調講演「データのグループウェア化」基調講演「データのグループウェア化」
基調講演「データのグループウェア化」
 
IoTデバイスデータ収集の難しい点
IoTデバイスデータ収集の難しい点IoTデバイスデータ収集の難しい点
IoTデバイスデータ収集の難しい点
 
テクノアカデミー郡山 現役ソフトウェアエンジニアが語る。IT の今と未来
テクノアカデミー郡山 現役ソフトウェアエンジニアが語る。IT の今と未来テクノアカデミー郡山 現役ソフトウェアエンジニアが語る。IT の今と未来
テクノアカデミー郡山 現役ソフトウェアエンジニアが語る。IT の今と未来
 
「IoTビジネスの嘘とホント~必要な検討事項と技術検証~」Developer Summit kansai 20160915
「IoTビジネスの嘘とホント~必要な検討事項と技術検証~」Developer Summit kansai 20160915「IoTビジネスの嘘とホント~必要な検討事項と技術検証~」Developer Summit kansai 20160915
「IoTビジネスの嘘とホント~必要な検討事項と技術検証~」Developer Summit kansai 20160915
 
Iot_demo_challenger
Iot_demo_challengerIot_demo_challenger
Iot_demo_challenger
 
実世界の人工知能@DeNA TechCon 2017
実世界の人工知能@DeNA TechCon 2017 実世界の人工知能@DeNA TechCon 2017
実世界の人工知能@DeNA TechCon 2017
 

日本語における自然言語解析とその応用 〜COTOHA VA & API〜

  • 1. ntt.com Transform your business, transcend expectations with our technologically advanced solutions. Copyright © NTT Communications Corporation. All rights reserved. Transform your business, transcend expectations with our technologically advanced solutions. Copyright © NTT Communications Corporation. All rights reserved. 日本語における自然言語解析とその応用 〜COTOHA VA & API〜 NTTコミュニケーションズ株式会社 アプリケーション&コンテンツサービス部 AI推進室 Team MASAMASA (石井方邦 / 浜田正裕)
  • 2. Copyright © NTT Communications Corporation. All rights reserved.  名前:石井方邦(MASAkuni Ishii)  所属:NTTコミュニケーションズ  担当:COTOHAパートナーセールス/イノベーション  趣味:音楽聴く/ライブ行く  2大学生時代勉強したくなかったこと:DB、機械学習  経歴 ・学生時代:セキュリティの研究に従事 ・NTT研究所入社:セキュリティ&BigDataチームに配属 OJTしてるときにチームが分割/なぜかBigDataチームへ Twitterのデータをひたすら収集 オンライン機械学習エンジン「Jubatus」 ・NTTコミュニケーションズへ異動: なぜか海外製品を利用したオーダーシステムを開発 その後、”COTOHA”の販売チームに。。。 自己紹介 1 気づいたらAIやってました
  • 3. Copyright © NTT Communications Corporation. All rights reserved.  名前: 浜田正裕(MASAhiro Hamada)  所属: NTTコミュニケーションズ  担当: COTOHA API開発  趣味: ソーイング・自転車・読書・レザークラフト・ 車中泊旅行・カラオケ  よく使う言語: Ruby, Bash  経歴: 2006年電気通信大学卒。 チャットボット+質問応答が研究テーマ。 2006年NTTアドバンステクノロジ社入社。 入社後10年程度、 NTTレゾナントの検索システム関連開発に従事。 2016年 NTTコミュニケーションズ社に出向。 COTOHA開発に従事 自己紹介 2 気づいたらAIやってました
  • 4. Copyright © NTT Communications Corporation. All rights reserved. 【参考】NTTコミュニケーションズについて 日本電信電話株式会社(持株会社) ・営業収益: 1兆2,830億円 ・営業利益: 1,325億円 グローバルに高品質な ICTサービスを提供 <拠点の展開状況> など ・約21,550名 [内訳] 国内 : 約11,900名 海外 : 約 9,650名 *1 2017年3月末時点 *2 データセンター拠点数は計画を含む ・41の国や地域の112都市で事業拠点展開 ・196の国や地域でグローバルネットワークサービスを提供 ・世界最大級のグローバルTier1 IPバックボーン ・全世界に140以上のデータセンターを展開*2 <2016年度の事業状況> <従業員数>
  • 5. Copyright © NTT Communications Corporation. All rights reserved. COTOHAサービス 4 短期間で導入が可能な、ユーザーの自 己解決を支援するAIサービス 自然な日本語を高い精度で理解し、 必要な情報を自ら聞き出すといった “人間らしい対話”ができるAI AIによる超高精度の自動翻訳を実現す る、企業向け翻訳ソリューション NTTグループの40年以上にわたる研究 成果である日本語辞書・自然言語処理 を活用したAPIプラットフォーム
  • 6. Copyright © NTT Communications Corporation. All rights reserved. これだれかわかりますか? 5
  • 7. Copyright © NTT Communications Corporation. All rights reserved. 6
  • 8. Copyright © NTT Communications Corporation. All rights reserved. 7 7 NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
  • 9. Copyright © NTT Communications Corporation. All rights reserved. 8 会話から欲しい商品をリコメンド 会話により、購入前の不安を解消 NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
  • 10. Copyright © NTT Communications Corporation. All rights reserved. 9 会話から欲しい商品をリコメンド 会話により、購入前の不安を解消 NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
  • 11. Copyright © NTT Communications Corporation. All rights reserved. コリスのほうがかわいい。。。 10
  • 12. Copyright © NTT Communications Corporation. All rights reserved. 11 11 なぜ、チャットボット等の コミュニケーション系AI にイマイチ感があるのか?
  • 13. Copyright © NTT Communications Corporation. All rights reserved. 12 「会話」を理解する なぜ、コミュニケーション系AIにイマイチ感があるのか 「画像・映像」を理解する 「状態」を理解する *自動運転など
  • 14. Copyright © NTT Communications Corporation. All rights reserved. 13 「会話」を理解する なぜ、コミュニケーション系AIにイマイチ感があるのか 「画像・映像」を理解する 「状態」を理解する *自動運転など 「人ができることできないのか」 と感じる
  • 15. Copyright © NTT Communications Corporation. All rights reserved. 14 「会話」を理解する なぜ、コミュニケーション系AIにイマイチ感があるのか 「画像・映像」を理解する 「状態」を理解する *自動運転など 「人ができることできないのか」 と感じる 「人ではできないな」 と感じる
  • 16. Copyright © NTT Communications Corporation. All rights reserved. 15 「会話」を理解する なぜ、コミュニケーション系AIにイマイチ感があるのか 「画像・映像」を理解する 「状態」を理解する *自動運転など 「人ができることできないのか」 と感じる 「人ではできないな」 と感じる
  • 17. Copyright © NTT Communications Corporation. All rights reserved. 16 Hololens X COTOHA X IoT
  • 18. Copyright © NTT Communications Corporation. All rights reserved.  NTTコミュニケーションズのEnterprise Cloud上でのSaaS型サービスです。  接続するインターフェースやデータベースについては、お客さまのご要件に応じてソ リューションをご提供します。 COTOHAの利用イメージ(全体像) 17 質問 お客さま API 自然言語解析 モジュール チ ャ ッ ト シ ス テ ム 辞書群 会話フロー設定 モジュール FAQ設定 モジュール エスカレーション 半自動学習 回答 オペレーター 社内システム /DB 外 部 接 続 モ ジ ュ ー ル コンテンツ群 チャット ロボット 音声認識・合成 WEB Site 翻訳エンジン Enterprise Cloud インターネット 天候 ニュース 交通情報 金融情報 位置情報
  • 19. Copyright © NTT Communications Corporation. All rights reserved. COTOHAサービス 18 短期間で導入が可能な、ユーザーの自 己解決を支援するAIサービス 自然な日本語を高い精度で理解し、 必要な情報を自ら聞き出すといった “人間らしい対話”ができるAI AIによる超高精度の自動翻訳を実現す る、企業向け翻訳ソリューション NTTグループの40年以上にわたる研究 成果である日本語辞書・自然言語処理 を活用したAPIプラットフォーム
  • 20. Copyright © NTT Communications Corporation. All rights reserved. AIを脳で表してみる 19 19 会話脳 予測脳 ・・・ 記 憶 領 域 知 識 領 域 分析脳 言語脳
  • 21. Copyright © NTT Communications Corporation. All rights reserved. AIを脳で表してみる 20 20 言語脳 会話脳 予測脳 ・・・ 記 憶 領 域 知 識 領 域 分析脳 ここ
  • 22. Copyright © NTT Communications Corporation. All rights reserved. 意味を利用した日本語解析とは? 21
  • 23. Copyright © NTT Communications Corporation. All rights reserved. 意味を利用した日本語解析とは? 22 サラダは食べるけど妹は食べません!
  • 24. Copyright © NTT Communications Corporation. All rights reserved. 意味を利用した日本語解析とは? 23 昨日、銀座でサラダと焼き肉を食べた。 昨日、銀座で妹と焼き肉を食べた。 私 サラダ 焼肉 食べる 私 妹 焼肉 食べる + + サラダは食べるけど妹は食べません!
  • 25. Copyright © NTT Communications Corporation. All rights reserved. NTTグループの40年以上にわたる研究成果である日本語辞書・自然言語機能、および COTOHAサービスの提供を通じて独自開発した機能をベースとした「テキスト・ 言語解析」「対話」「音声認識」向けAPIサービスです。 COTOHA APIの概要 24 日本語テキストを扱う 様々なビジネスシーン に活用可能 NTTグループの40年以上 にわたる研究成果である 日本語辞書・自然言語処理を 活用したAPI 辞書および APIカスタマイズで さらに精度向上 が可能 COTOHA API テキスト アナリティクス 翻訳 A あ 接客応対 マーケティング ヘルプデスク … API設定 カスタマイズ お客さま個別辞書 NTT業界用語辞書 NTT基本語辞書 テキスト 言語解析 対話 音声
  • 26. Copyright © NTT Communications Corporation. All rights reserved. COTOHA APIの活用シーン RPAの前処理で表記揺れを検知・訂正することでRPAの適用範囲拡大 RPA導入による業務効率化を行ったが、 処理するファイル(メール等)にノイズ が多く、Robotが業務処理を行えない。 … COTOHA APIで表記揺れ等のノイズを 除去することでRobotが業務処理可能 に。RPA適用範囲拡大により導入効果 を更に向上。 表記揺れ正規化 2 活用が難しい非構造ビッグデータのマーケティング活用 ビッグデータをマーケティング等に活 用したいが、非構造データの解析が難 しく、価値ある資産が活かされること なく塩漬けになっている。 COTOHA APIを用いて非構造データの 解析/ユーザー属性の抽出を行うことで、 ビッグデータ活用したマーケティング が可能に。 1 ユーザー属性、 キーワード抽出 …
  • 27. Copyright © NTT Communications Corporation. All rights reserved. COTOHA APIの活用シーン 音声認識の精度改善による、応対システム導入効果向上 音声入力をUIとして後続の VA/Chatbotへ連携するRobot中心の応 対システムを導入したが、認識精度が 低く、コスト削減効果が得られない。 COTOHA APIで音声特有の認識誤りを 検知・訂正することで、精度向上が可 能。人へのエスカレ率の低減等により、 コスト削減効果が増大。 3 ゼロベースでは対応が難しい日本語対応をAdd-onで実現 既存のVA製品の多言語化を進める際に、 習得/解析難易度が高い日本語は構築 に莫大な工数がかかる。 COTOHA APIではお客様のVA製品に、 必要な機能だけをAdd-onする形で日 本語化対応が可能。 4 ええと・・・、プリン を4個ください … ええとプリンをよんこう ください ええと・・・、プリン を4個ください プリンを4個ください 言い淀み除去・ 誤り検知・訂正 How long does it take to get there? 30min. そこに着くまでどれくらい? ??? How long does it take to get there? 30min. そこに着くまでどれくらい? 30分です 構文解析・ 翻訳
  • 28. Copyright © NTT Communications Corporation. All rights reserved. COTOHA APIの強み「①日本語辞書」「②意味属性利用」「③日本語文脈理解」 により、日本語文章を正しく詳細に理解できるため、実現不可能だった活用ケー スにリーチできます。 COTOHA APIの強み 27 現状例 フレッツ光定額プラン…いや 2段階定額プランを申し込 みたい。 否定語 修正語 すみません、わかりません。 年代:不明 職業:不明 居住地:不明 VA利用者 VA対話ログ 年代:20-30代 職業:医療関係 居住地:田町 VA利用者 不良品の クーリング オフをした いです mail テーマ 返品依頼 後続業務 ? HEXが故障した。 すみません、 よくわかりません。 HEXが故障した。 熱交換器の 故障問合せですね。 COTOHA APIの強み ①世界最大級の 日本語辞書 (随時拡充中) ②単語を約3000種の 意味属性に分類 ③日本語文章の文脈理解 将来活用例 私 / は / 昨日 / 、 / 彼 / が / 書 く/ い / た / 小説 / を / 本屋 / で / 買う / い / ました 動作主格 述語時間格 場所格対象格 動作主格 述語 対象格 フレッツ光定額プラン…いや 2段階定額プランを申し込 みたい。 否定語 修正語 2段階定額プランですね。 テーマ 返品問合せ 不良品の クーリング オフをした いです mail テーマ 返品依頼 後続業務 テーマ 返品問合せ 返品 対応
  • 29. Copyright © NTT Communications Corporation. All rights reserved. COTOHA API活用事例
  • 30. Copyright © NTT Communications Corporation. All rights reserved. 自然言語3カテゴリ23種類のAPIを順次公開予定です。 提供API(言語・テキスト解析API) 言語・テキスト解析APIs 固有表現抽出 人名や地名などの固有表現を抽出します。 2018/1Q予定2 構文解析 日本語テキストの構造と意味を解析します。※ ・形態素解析:文章を単語ごとに分割し、品詞タイプを出力 ・表記ゆれ正規化:表記ゆれや崩れ語を正規化し出力 ・意味解析:係り受けを解析し、文節間の意味関係を出力 2018/1Q予定1 キーワード抽出 人名や地名、組織など、文章の主要なキーワードを抽出します。 2018/1Q予定7 照応解析 「あれ」「これ」「次」「他」等の指示語・省略語を検知し、 内容を明記した文章を出力します。 2018/1Q予定 (BETA版) 4
  • 31. Copyright © NTT Communications Corporation. All rights reserved. 自然言語3カテゴリ23種類のAPIを順次公開予定です。 提供API(対話API) 対話APIs 文タイプ判定 叙述文、命令文、質問文等の文タイプを出力します。 2018/1Q予定3 類似度判定 文章間の類似度を算出し、出力します。 2018/1Q予定7 A B ユーザ属性推定 文章からユーザの年代、職業等の属性を推定します。 2018/1Q予定 (BETA版) 4
  • 32. Copyright © NTT Communications Corporation. All rights reserved. 自然言語3カテゴリ23種類のAPIを順次公開予定です。 提供API(音声認識API) 音声認識APIs 言い淀み除去 ユーザからの音声入力時に含まれる言い淀みを除去します。 2018/3Q予定1 誤り箇所検知 音声認識処理後のテキストに対して、認識ミスの恐れがある単 語を検知・抽出します。 2018/3Q予定2 ! 誤り箇所訂正 音声認識処理後のテキストに対して、認識ミスの恐れがある単 語を検知し、修正候補を提示します。 2018/3Q予定3 ✔