ntt.com
Transform your business, transcend expectations with our technologically advanced solutions.
Copyright © NTT Communications Corporation. All rights reserved.
Transform your business, transcend expectations with our technologically advanced solutions.
Copyright © NTT Communications Corporation. All rights reserved.
日本語における自然言語解析とその応用
〜COTOHA VA & API〜
NTTコミュニケーションズ株式会社
アプリケーション&コンテンツサービス部
AI推進室
Team MASAMASA (石井方邦 / 浜田正裕)
Copyright © NTT Communications Corporation. All rights reserved.
 名前:石井方邦(MASAkuni Ishii)
 所属:NTTコミュニケーションズ
 担当:COTOHAパートナーセールス/イノベーション
 趣味:音楽聴く/ライブ行く
 2大学生時代勉強したくなかったこと:DB、機械学習
 経歴
・学生時代:セキュリティの研究に従事
・NTT研究所入社:セキュリティ&BigDataチームに配属
OJTしてるときにチームが分割/なぜかBigDataチームへ
Twitterのデータをひたすら収集
オンライン機械学習エンジン「Jubatus」
・NTTコミュニケーションズへ異動:
なぜか海外製品を利用したオーダーシステムを開発
その後、”COTOHA”の販売チームに。。。
自己紹介
1
気づいたらAIやってました
Copyright © NTT Communications Corporation. All rights reserved.
 名前: 浜田正裕(MASAhiro Hamada)
 所属: NTTコミュニケーションズ
 担当: COTOHA API開発
 趣味: ソーイング・自転車・読書・レザークラフト・
車中泊旅行・カラオケ
 よく使う言語: Ruby, Bash
 経歴:
2006年電気通信大学卒。
チャットボット+質問応答が研究テーマ。
2006年NTTアドバンステクノロジ社入社。
入社後10年程度、
NTTレゾナントの検索システム関連開発に従事。
2016年 NTTコミュニケーションズ社に出向。
COTOHA開発に従事
自己紹介
2
気づいたらAIやってました
Copyright © NTT Communications Corporation. All rights reserved.
【参考】NTTコミュニケーションズについて
日本電信電話株式会社(持株会社)
・営業収益: 1兆2,830億円 ・営業利益: 1,325億円
グローバルに高品質な
ICTサービスを提供
<拠点の展開状況>
など
・約21,550名
[内訳] 国内 : 約11,900名 海外 : 約 9,650名
*1 2017年3月末時点 *2 データセンター拠点数は計画を含む
・41の国や地域の112都市で事業拠点展開
・196の国や地域でグローバルネットワークサービスを提供
・世界最大級のグローバルTier1 IPバックボーン
・全世界に140以上のデータセンターを展開*2
<2016年度の事業状況>
<従業員数>
Copyright © NTT Communications Corporation. All rights reserved.
COTOHAサービス
4
短期間で導入が可能な、ユーザーの自
己解決を支援するAIサービス
自然な日本語を高い精度で理解し、
必要な情報を自ら聞き出すといった
“人間らしい対話”ができるAI
AIによる超高精度の自動翻訳を実現す
る、企業向け翻訳ソリューション
NTTグループの40年以上にわたる研究
成果である日本語辞書・自然言語処理
を活用したAPIプラットフォーム
Copyright © NTT Communications Corporation. All rights reserved.
これだれかわかりますか?
5
Copyright © NTT Communications Corporation. All rights reserved. 6
Copyright © NTT Communications Corporation. All rights reserved. 7
7
NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
Copyright © NTT Communications Corporation. All rights reserved. 8
会話から欲しい商品をリコメンド
会話により、購入前の不安を解消
NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
Copyright © NTT Communications Corporation. All rights reserved. 9
会話から欲しい商品をリコメンド
会話により、購入前の不安を解消
NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
Copyright © NTT Communications Corporation. All rights reserved.
コリスのほうがかわいい。。。
10
Copyright © NTT Communications Corporation. All rights reserved. 11
11
なぜ、チャットボット等の
コミュニケーション系AI
にイマイチ感があるのか?
Copyright © NTT Communications Corporation. All rights reserved. 12
「会話」を理解する
なぜ、コミュニケーション系AIにイマイチ感があるのか
「画像・映像」を理解する
「状態」を理解する
*自動運転など
Copyright © NTT Communications Corporation. All rights reserved. 13
「会話」を理解する
なぜ、コミュニケーション系AIにイマイチ感があるのか
「画像・映像」を理解する
「状態」を理解する
*自動運転など
「人ができることできないのか」
と感じる
Copyright © NTT Communications Corporation. All rights reserved. 14
「会話」を理解する
なぜ、コミュニケーション系AIにイマイチ感があるのか
「画像・映像」を理解する
「状態」を理解する
*自動運転など
「人ができることできないのか」
と感じる
「人ではできないな」
と感じる
Copyright © NTT Communications Corporation. All rights reserved. 15
「会話」を理解する
なぜ、コミュニケーション系AIにイマイチ感があるのか
「画像・映像」を理解する
「状態」を理解する
*自動運転など
「人ができることできないのか」
と感じる
「人ではできないな」
と感じる
Copyright © NTT Communications Corporation. All rights reserved. 16
Hololens
X
COTOHA
X
IoT
Copyright © NTT Communications Corporation. All rights reserved.
 NTTコミュニケーションズのEnterprise Cloud上でのSaaS型サービスです。
 接続するインターフェースやデータベースについては、お客さまのご要件に応じてソ
リューションをご提供します。
COTOHAの利用イメージ(全体像)
17
質問
お客さま
API
自然言語解析
モジュール
チ
ャ
ッ
ト
シ
ス
テ
ム
辞書群
会話フロー設定
モジュール
FAQ設定
モジュール
エスカレーション
半自動学習
回答
オペレーター
社内システム
/DB
外
部
接
続
モ
ジ
ュ
ー
ル
コンテンツ群
チャット
ロボット
音声認識・合成
WEB Site
翻訳エンジン
Enterprise
Cloud インターネット
天候 ニュース 交通情報 金融情報 位置情報
Copyright © NTT Communications Corporation. All rights reserved.
COTOHAサービス
18
短期間で導入が可能な、ユーザーの自
己解決を支援するAIサービス
自然な日本語を高い精度で理解し、
必要な情報を自ら聞き出すといった
“人間らしい対話”ができるAI
AIによる超高精度の自動翻訳を実現す
る、企業向け翻訳ソリューション
NTTグループの40年以上にわたる研究
成果である日本語辞書・自然言語処理
を活用したAPIプラットフォーム
Copyright © NTT Communications Corporation. All rights reserved.
AIを脳で表してみる
19
19
会話脳
予測脳
・・・
記
憶
領
域
知
識
領
域
分析脳
言語脳
Copyright © NTT Communications Corporation. All rights reserved.
AIを脳で表してみる
20
20
言語脳
会話脳
予測脳
・・・
記
憶
領
域
知
識
領
域
分析脳
ここ
Copyright © NTT Communications Corporation. All rights reserved.
意味を利用した日本語解析とは?
21
Copyright © NTT Communications Corporation. All rights reserved.
意味を利用した日本語解析とは?
22
サラダは食べるけど妹は食べません!
Copyright © NTT Communications Corporation. All rights reserved.
意味を利用した日本語解析とは?
23
昨日、銀座でサラダと焼き肉を食べた。
昨日、銀座で妹と焼き肉を食べた。
私
サラダ
焼肉
食べる
私
妹
焼肉 食べる
+
+
サラダは食べるけど妹は食べません!
Copyright © NTT Communications Corporation. All rights reserved.
NTTグループの40年以上にわたる研究成果である日本語辞書・自然言語機能、および
COTOHAサービスの提供を通じて独自開発した機能をベースとした「テキスト・
言語解析」「対話」「音声認識」向けAPIサービスです。
COTOHA APIの概要
24
日本語テキストを扱う
様々なビジネスシーン
に活用可能
NTTグループの40年以上
にわたる研究成果である
日本語辞書・自然言語処理を
活用したAPI
辞書および
APIカスタマイズで
さらに精度向上
が可能 COTOHA API
テキスト
アナリティクス 翻訳
A
あ
接客応対 マーケティング ヘルプデスク
…
API設定
カスタマイズ
お客さま個別辞書
NTT業界用語辞書
NTT基本語辞書
テキスト
言語解析
対話 音声
Copyright © NTT Communications Corporation. All rights reserved.
COTOHA APIの活用シーン
RPAの前処理で表記揺れを検知・訂正することでRPAの適用範囲拡大
RPA導入による業務効率化を行ったが、
処理するファイル(メール等)にノイズ
が多く、Robotが業務処理を行えない。
…
COTOHA APIで表記揺れ等のノイズを
除去することでRobotが業務処理可能
に。RPA適用範囲拡大により導入効果
を更に向上。
表記揺れ正規化
2
活用が難しい非構造ビッグデータのマーケティング活用
ビッグデータをマーケティング等に活
用したいが、非構造データの解析が難
しく、価値ある資産が活かされること
なく塩漬けになっている。
COTOHA APIを用いて非構造データの
解析/ユーザー属性の抽出を行うことで、
ビッグデータ活用したマーケティング
が可能に。
1
ユーザー属性、
キーワード抽出
…
Copyright © NTT Communications Corporation. All rights reserved.
COTOHA APIの活用シーン
音声認識の精度改善による、応対システム導入効果向上
音声入力をUIとして後続の
VA/Chatbotへ連携するRobot中心の応
対システムを導入したが、認識精度が
低く、コスト削減効果が得られない。
COTOHA APIで音声特有の認識誤りを
検知・訂正することで、精度向上が可
能。人へのエスカレ率の低減等により、
コスト削減効果が増大。
3
ゼロベースでは対応が難しい日本語対応をAdd-onで実現
既存のVA製品の多言語化を進める際に、
習得/解析難易度が高い日本語は構築
に莫大な工数がかかる。
COTOHA APIではお客様のVA製品に、
必要な機能だけをAdd-onする形で日
本語化対応が可能。
4
ええと・・・、プリン
を4個ください …
ええとプリンをよんこう
ください
ええと・・・、プリン
を4個ください
プリンを4個ください
言い淀み除去・
誤り検知・訂正
How long does it
take to get there?
30min.
そこに着くまでどれくらい? ???
How long does it
take to get there?
30min.
そこに着くまでどれくらい? 30分です
構文解析・
翻訳
Copyright © NTT Communications Corporation. All rights reserved.
COTOHA APIの強み「①日本語辞書」「②意味属性利用」「③日本語文脈理解」
により、日本語文章を正しく詳細に理解できるため、実現不可能だった活用ケー
スにリーチできます。
COTOHA APIの強み
27
現状例
フレッツ光定額プラン…いや
2段階定額プランを申し込
みたい。
否定語
修正語
すみません、わかりません。
年代:不明
職業:不明
居住地:不明
VA利用者
VA対話ログ
年代:20-30代
職業:医療関係
居住地:田町
VA利用者
不良品の
クーリング
オフをした
いです
mail テーマ
返品依頼
後続業務
?
HEXが故障した。
すみません、
よくわかりません。
HEXが故障した。
熱交換器の
故障問合せですね。
COTOHA APIの強み
①世界最大級の
日本語辞書
(随時拡充中)
②単語を約3000種の
意味属性に分類
③日本語文章の文脈理解
将来活用例
私 / は / 昨日 / 、 / 彼 / が / 書 く/ い / た / 小説 / を / 本屋 / で / 買う / い / ました
動作主格 述語時間格 場所格対象格
動作主格 述語 対象格
フレッツ光定額プラン…いや
2段階定額プランを申し込
みたい。
否定語
修正語
2段階定額プランですね。
テーマ
返品問合せ
不良品の
クーリング
オフをした
いです
mail テーマ
返品依頼
後続業務
テーマ
返品問合せ
返品
対応
Copyright © NTT Communications Corporation. All rights reserved.
COTOHA API活用事例
Copyright © NTT Communications Corporation. All rights reserved.
自然言語3カテゴリ23種類のAPIを順次公開予定です。
提供API(言語・テキスト解析API)
言語・テキスト解析APIs
固有表現抽出 人名や地名などの固有表現を抽出します。 2018/1Q予定2
構文解析
日本語テキストの構造と意味を解析します。※
・形態素解析:文章を単語ごとに分割し、品詞タイプを出力
・表記ゆれ正規化:表記ゆれや崩れ語を正規化し出力
・意味解析:係り受けを解析し、文節間の意味関係を出力
2018/1Q予定1
キーワード抽出 人名や地名、組織など、文章の主要なキーワードを抽出します。 2018/1Q予定7
照応解析
「あれ」「これ」「次」「他」等の指示語・省略語を検知し、
内容を明記した文章を出力します。
2018/1Q予定
(BETA版)
4
Copyright © NTT Communications Corporation. All rights reserved.
自然言語3カテゴリ23種類のAPIを順次公開予定です。
提供API(対話API)
対話APIs
文タイプ判定 叙述文、命令文、質問文等の文タイプを出力します。 2018/1Q予定3
類似度判定 文章間の類似度を算出し、出力します。 2018/1Q予定7 A B
ユーザ属性推定 文章からユーザの年代、職業等の属性を推定します。
2018/1Q予定
(BETA版)
4
Copyright © NTT Communications Corporation. All rights reserved.
自然言語3カテゴリ23種類のAPIを順次公開予定です。
提供API(音声認識API)
音声認識APIs
言い淀み除去 ユーザからの音声入力時に含まれる言い淀みを除去します。 2018/3Q予定1
誤り箇所検知
音声認識処理後のテキストに対して、認識ミスの恐れがある単
語を検知・抽出します。
2018/3Q予定2
!
誤り箇所訂正
音声認識処理後のテキストに対して、認識ミスの恐れがある単
語を検知し、修正候補を提示します。
2018/3Q予定3
✔

日本語における自然言語解析とその応用 〜COTOHA VA & API〜

  • 1.
    ntt.com Transform your business,transcend expectations with our technologically advanced solutions. Copyright © NTT Communications Corporation. All rights reserved. Transform your business, transcend expectations with our technologically advanced solutions. Copyright © NTT Communications Corporation. All rights reserved. 日本語における自然言語解析とその応用 〜COTOHA VA & API〜 NTTコミュニケーションズ株式会社 アプリケーション&コンテンツサービス部 AI推進室 Team MASAMASA (石井方邦 / 浜田正裕)
  • 2.
    Copyright © NTTCommunications Corporation. All rights reserved.  名前:石井方邦(MASAkuni Ishii)  所属:NTTコミュニケーションズ  担当:COTOHAパートナーセールス/イノベーション  趣味:音楽聴く/ライブ行く  2大学生時代勉強したくなかったこと:DB、機械学習  経歴 ・学生時代:セキュリティの研究に従事 ・NTT研究所入社:セキュリティ&BigDataチームに配属 OJTしてるときにチームが分割/なぜかBigDataチームへ Twitterのデータをひたすら収集 オンライン機械学習エンジン「Jubatus」 ・NTTコミュニケーションズへ異動: なぜか海外製品を利用したオーダーシステムを開発 その後、”COTOHA”の販売チームに。。。 自己紹介 1 気づいたらAIやってました
  • 3.
    Copyright © NTTCommunications Corporation. All rights reserved.  名前: 浜田正裕(MASAhiro Hamada)  所属: NTTコミュニケーションズ  担当: COTOHA API開発  趣味: ソーイング・自転車・読書・レザークラフト・ 車中泊旅行・カラオケ  よく使う言語: Ruby, Bash  経歴: 2006年電気通信大学卒。 チャットボット+質問応答が研究テーマ。 2006年NTTアドバンステクノロジ社入社。 入社後10年程度、 NTTレゾナントの検索システム関連開発に従事。 2016年 NTTコミュニケーションズ社に出向。 COTOHA開発に従事 自己紹介 2 気づいたらAIやってました
  • 4.
    Copyright © NTTCommunications Corporation. All rights reserved. 【参考】NTTコミュニケーションズについて 日本電信電話株式会社(持株会社) ・営業収益: 1兆2,830億円 ・営業利益: 1,325億円 グローバルに高品質な ICTサービスを提供 <拠点の展開状況> など ・約21,550名 [内訳] 国内 : 約11,900名 海外 : 約 9,650名 *1 2017年3月末時点 *2 データセンター拠点数は計画を含む ・41の国や地域の112都市で事業拠点展開 ・196の国や地域でグローバルネットワークサービスを提供 ・世界最大級のグローバルTier1 IPバックボーン ・全世界に140以上のデータセンターを展開*2 <2016年度の事業状況> <従業員数>
  • 5.
    Copyright © NTTCommunications Corporation. All rights reserved. COTOHAサービス 4 短期間で導入が可能な、ユーザーの自 己解決を支援するAIサービス 自然な日本語を高い精度で理解し、 必要な情報を自ら聞き出すといった “人間らしい対話”ができるAI AIによる超高精度の自動翻訳を実現す る、企業向け翻訳ソリューション NTTグループの40年以上にわたる研究 成果である日本語辞書・自然言語処理 を活用したAPIプラットフォーム
  • 6.
    Copyright © NTTCommunications Corporation. All rights reserved. これだれかわかりますか? 5
  • 7.
    Copyright © NTTCommunications Corporation. All rights reserved. 6
  • 8.
    Copyright © NTTCommunications Corporation. All rights reserved. 7 7 NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
  • 9.
    Copyright © NTTCommunications Corporation. All rights reserved. 8 会話から欲しい商品をリコメンド 会話により、購入前の不安を解消 NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
  • 10.
    Copyright © NTTCommunications Corporation. All rights reserved. 9 会話から欲しい商品をリコメンド 会話により、購入前の不安を解消 NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
  • 11.
    Copyright © NTTCommunications Corporation. All rights reserved. コリスのほうがかわいい。。。 10
  • 12.
    Copyright © NTTCommunications Corporation. All rights reserved. 11 11 なぜ、チャットボット等の コミュニケーション系AI にイマイチ感があるのか?
  • 13.
    Copyright © NTTCommunications Corporation. All rights reserved. 12 「会話」を理解する なぜ、コミュニケーション系AIにイマイチ感があるのか 「画像・映像」を理解する 「状態」を理解する *自動運転など
  • 14.
    Copyright © NTTCommunications Corporation. All rights reserved. 13 「会話」を理解する なぜ、コミュニケーション系AIにイマイチ感があるのか 「画像・映像」を理解する 「状態」を理解する *自動運転など 「人ができることできないのか」 と感じる
  • 15.
    Copyright © NTTCommunications Corporation. All rights reserved. 14 「会話」を理解する なぜ、コミュニケーション系AIにイマイチ感があるのか 「画像・映像」を理解する 「状態」を理解する *自動運転など 「人ができることできないのか」 と感じる 「人ではできないな」 と感じる
  • 16.
    Copyright © NTTCommunications Corporation. All rights reserved. 15 「会話」を理解する なぜ、コミュニケーション系AIにイマイチ感があるのか 「画像・映像」を理解する 「状態」を理解する *自動運転など 「人ができることできないのか」 と感じる 「人ではできないな」 と感じる
  • 17.
    Copyright © NTTCommunications Corporation. All rights reserved. 16 Hololens X COTOHA X IoT
  • 18.
    Copyright © NTTCommunications Corporation. All rights reserved.  NTTコミュニケーションズのEnterprise Cloud上でのSaaS型サービスです。  接続するインターフェースやデータベースについては、お客さまのご要件に応じてソ リューションをご提供します。 COTOHAの利用イメージ(全体像) 17 質問 お客さま API 自然言語解析 モジュール チ ャ ッ ト シ ス テ ム 辞書群 会話フロー設定 モジュール FAQ設定 モジュール エスカレーション 半自動学習 回答 オペレーター 社内システム /DB 外 部 接 続 モ ジ ュ ー ル コンテンツ群 チャット ロボット 音声認識・合成 WEB Site 翻訳エンジン Enterprise Cloud インターネット 天候 ニュース 交通情報 金融情報 位置情報
  • 19.
    Copyright © NTTCommunications Corporation. All rights reserved. COTOHAサービス 18 短期間で導入が可能な、ユーザーの自 己解決を支援するAIサービス 自然な日本語を高い精度で理解し、 必要な情報を自ら聞き出すといった “人間らしい対話”ができるAI AIによる超高精度の自動翻訳を実現す る、企業向け翻訳ソリューション NTTグループの40年以上にわたる研究 成果である日本語辞書・自然言語処理 を活用したAPIプラットフォーム
  • 20.
    Copyright © NTTCommunications Corporation. All rights reserved. AIを脳で表してみる 19 19 会話脳 予測脳 ・・・ 記 憶 領 域 知 識 領 域 分析脳 言語脳
  • 21.
    Copyright © NTTCommunications Corporation. All rights reserved. AIを脳で表してみる 20 20 言語脳 会話脳 予測脳 ・・・ 記 憶 領 域 知 識 領 域 分析脳 ここ
  • 22.
    Copyright © NTTCommunications Corporation. All rights reserved. 意味を利用した日本語解析とは? 21
  • 23.
    Copyright © NTTCommunications Corporation. All rights reserved. 意味を利用した日本語解析とは? 22 サラダは食べるけど妹は食べません!
  • 24.
    Copyright © NTTCommunications Corporation. All rights reserved. 意味を利用した日本語解析とは? 23 昨日、銀座でサラダと焼き肉を食べた。 昨日、銀座で妹と焼き肉を食べた。 私 サラダ 焼肉 食べる 私 妹 焼肉 食べる + + サラダは食べるけど妹は食べません!
  • 25.
    Copyright © NTTCommunications Corporation. All rights reserved. NTTグループの40年以上にわたる研究成果である日本語辞書・自然言語機能、および COTOHAサービスの提供を通じて独自開発した機能をベースとした「テキスト・ 言語解析」「対話」「音声認識」向けAPIサービスです。 COTOHA APIの概要 24 日本語テキストを扱う 様々なビジネスシーン に活用可能 NTTグループの40年以上 にわたる研究成果である 日本語辞書・自然言語処理を 活用したAPI 辞書および APIカスタマイズで さらに精度向上 が可能 COTOHA API テキスト アナリティクス 翻訳 A あ 接客応対 マーケティング ヘルプデスク … API設定 カスタマイズ お客さま個別辞書 NTT業界用語辞書 NTT基本語辞書 テキスト 言語解析 対話 音声
  • 26.
    Copyright © NTTCommunications Corporation. All rights reserved. COTOHA APIの活用シーン RPAの前処理で表記揺れを検知・訂正することでRPAの適用範囲拡大 RPA導入による業務効率化を行ったが、 処理するファイル(メール等)にノイズ が多く、Robotが業務処理を行えない。 … COTOHA APIで表記揺れ等のノイズを 除去することでRobotが業務処理可能 に。RPA適用範囲拡大により導入効果 を更に向上。 表記揺れ正規化 2 活用が難しい非構造ビッグデータのマーケティング活用 ビッグデータをマーケティング等に活 用したいが、非構造データの解析が難 しく、価値ある資産が活かされること なく塩漬けになっている。 COTOHA APIを用いて非構造データの 解析/ユーザー属性の抽出を行うことで、 ビッグデータ活用したマーケティング が可能に。 1 ユーザー属性、 キーワード抽出 …
  • 27.
    Copyright © NTTCommunications Corporation. All rights reserved. COTOHA APIの活用シーン 音声認識の精度改善による、応対システム導入効果向上 音声入力をUIとして後続の VA/Chatbotへ連携するRobot中心の応 対システムを導入したが、認識精度が 低く、コスト削減効果が得られない。 COTOHA APIで音声特有の認識誤りを 検知・訂正することで、精度向上が可 能。人へのエスカレ率の低減等により、 コスト削減効果が増大。 3 ゼロベースでは対応が難しい日本語対応をAdd-onで実現 既存のVA製品の多言語化を進める際に、 習得/解析難易度が高い日本語は構築 に莫大な工数がかかる。 COTOHA APIではお客様のVA製品に、 必要な機能だけをAdd-onする形で日 本語化対応が可能。 4 ええと・・・、プリン を4個ください … ええとプリンをよんこう ください ええと・・・、プリン を4個ください プリンを4個ください 言い淀み除去・ 誤り検知・訂正 How long does it take to get there? 30min. そこに着くまでどれくらい? ??? How long does it take to get there? 30min. そこに着くまでどれくらい? 30分です 構文解析・ 翻訳
  • 28.
    Copyright © NTTCommunications Corporation. All rights reserved. COTOHA APIの強み「①日本語辞書」「②意味属性利用」「③日本語文脈理解」 により、日本語文章を正しく詳細に理解できるため、実現不可能だった活用ケー スにリーチできます。 COTOHA APIの強み 27 現状例 フレッツ光定額プラン…いや 2段階定額プランを申し込 みたい。 否定語 修正語 すみません、わかりません。 年代:不明 職業:不明 居住地:不明 VA利用者 VA対話ログ 年代:20-30代 職業:医療関係 居住地:田町 VA利用者 不良品の クーリング オフをした いです mail テーマ 返品依頼 後続業務 ? HEXが故障した。 すみません、 よくわかりません。 HEXが故障した。 熱交換器の 故障問合せですね。 COTOHA APIの強み ①世界最大級の 日本語辞書 (随時拡充中) ②単語を約3000種の 意味属性に分類 ③日本語文章の文脈理解 将来活用例 私 / は / 昨日 / 、 / 彼 / が / 書 く/ い / た / 小説 / を / 本屋 / で / 買う / い / ました 動作主格 述語時間格 場所格対象格 動作主格 述語 対象格 フレッツ光定額プラン…いや 2段階定額プランを申し込 みたい。 否定語 修正語 2段階定額プランですね。 テーマ 返品問合せ 不良品の クーリング オフをした いです mail テーマ 返品依頼 後続業務 テーマ 返品問合せ 返品 対応
  • 29.
    Copyright © NTTCommunications Corporation. All rights reserved. COTOHA API活用事例
  • 30.
    Copyright © NTTCommunications Corporation. All rights reserved. 自然言語3カテゴリ23種類のAPIを順次公開予定です。 提供API(言語・テキスト解析API) 言語・テキスト解析APIs 固有表現抽出 人名や地名などの固有表現を抽出します。 2018/1Q予定2 構文解析 日本語テキストの構造と意味を解析します。※ ・形態素解析:文章を単語ごとに分割し、品詞タイプを出力 ・表記ゆれ正規化:表記ゆれや崩れ語を正規化し出力 ・意味解析:係り受けを解析し、文節間の意味関係を出力 2018/1Q予定1 キーワード抽出 人名や地名、組織など、文章の主要なキーワードを抽出します。 2018/1Q予定7 照応解析 「あれ」「これ」「次」「他」等の指示語・省略語を検知し、 内容を明記した文章を出力します。 2018/1Q予定 (BETA版) 4
  • 31.
    Copyright © NTTCommunications Corporation. All rights reserved. 自然言語3カテゴリ23種類のAPIを順次公開予定です。 提供API(対話API) 対話APIs 文タイプ判定 叙述文、命令文、質問文等の文タイプを出力します。 2018/1Q予定3 類似度判定 文章間の類似度を算出し、出力します。 2018/1Q予定7 A B ユーザ属性推定 文章からユーザの年代、職業等の属性を推定します。 2018/1Q予定 (BETA版) 4
  • 32.
    Copyright © NTTCommunications Corporation. All rights reserved. 自然言語3カテゴリ23種類のAPIを順次公開予定です。 提供API(音声認識API) 音声認識APIs 言い淀み除去 ユーザからの音声入力時に含まれる言い淀みを除去します。 2018/3Q予定1 誤り箇所検知 音声認識処理後のテキストに対して、認識ミスの恐れがある単 語を検知・抽出します。 2018/3Q予定2 ! 誤り箇所訂正 音声認識処理後のテキストに対して、認識ミスの恐れがある単 語を検知し、修正候補を提示します。 2018/3Q予定3 ✔