Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
ネクストスケープ
PDF, PPTX
898 views
日本語における自然言語解析とその応用 〜COTOHA VA & API〜
NsStudy #13の資料となります。 https://nsstudy.connpass.com/event/89005/
Software
◦
Read more
1
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 32
2
/ 32
3
/ 32
4
/ 32
5
/ 32
6
/ 32
7
/ 32
8
/ 32
9
/ 32
10
/ 32
11
/ 32
12
/ 32
13
/ 32
14
/ 32
15
/ 32
16
/ 32
17
/ 32
18
/ 32
19
/ 32
20
/ 32
21
/ 32
22
/ 32
23
/ 32
24
/ 32
25
/ 32
26
/ 32
27
/ 32
28
/ 32
29
/ 32
30
/ 32
31
/ 32
32
/ 32
More Related Content
PDF
[DL Hacks]Simple Online Realtime Tracking with a Deep Association Metric
by
Deep Learning JP
PDF
Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised L...
by
harmonylab
PPTX
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
by
CData Software Japan
PPTX
RAPiD
by
harmonylab
PDF
QoS for ROS 2 Dashing/Eloquent
by
Hideki Takase
PDF
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
PDF
ぼくのかんがえたさいきょうのうぇぶあぷりけーしょんふれーむわーく - YAPC Asia 2011
by
Hiroh Satoh
PDF
いかなくてもよい博物館をつくる
by
NOGUCHI Atsushi
[DL Hacks]Simple Online Realtime Tracking with a Deep Association Metric
by
Deep Learning JP
Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised L...
by
harmonylab
なぜ、CData Softwareが Power BI 専用 コネクターを 開発したのか?
by
CData Software Japan
RAPiD
by
harmonylab
QoS for ROS 2 Dashing/Eloquent
by
Hideki Takase
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
by
Techon Organization
ぼくのかんがえたさいきょうのうぇぶあぷりけーしょんふれーむわーく - YAPC Asia 2011
by
Hiroh Satoh
いかなくてもよい博物館をつくる
by
NOGUCHI Atsushi
What's hot
PPTX
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
by
harmonylab
PDF
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
by
Preferred Networks
PDF
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
by
Google Cloud Platform - Japan
PDF
Kubernetesによる機械学習基盤への挑戦
by
Preferred Networks
PDF
MapReduce/YARNの仕組みを知る
by
日本ヒューレット・パッカード株式会社
PDF
Active Learning の基礎と最近の研究
by
Fumihiko Takahashi
PDF
Samba4を「ふつうに」使おう!
by
基信 高橋
PDF
MoveItの新機能、 OMPL Constrained Planningを試してみた
by
Ryo Kabutan
PDF
[D36] Michael Stonebrakerが生み出した列指向データベースは何が凄いのか? ~Verticaを例に列指向データベースのアーキテクチャ...
by
Insight Technology, Inc.
PDF
Protocol Buffers 入門
by
Yuichi Ito
PPTX
近年のHierarchical Vision Transformer
by
Yusuke Uchida
PPTX
Texture-Aware Superpixel Segmentation
by
yukihiro domae
PDF
Apache spark 2.3 and beyond
by
NTT DATA Technology & Innovation
PDF
文献紹介:YOLO series:v1-v5, X, F, and YOWO
by
Toru Tamaki
PDF
データ中心の時代を生き抜くエンジニアに知ってほしい10?のこと
by
Hideo Terada
PPTX
mcl_3dl: amcl並に軽量な3-D/6-DoFローカリゼーションパッケージ
by
Atsushi Watanabe
PDF
【Unity道場 名古屋SP】HMI及び自動運転におけるUnity活用事例
by
Unity Technologies Japan K.K.
PDF
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
by
NTT DATA Technology & Innovation
PPTX
SfM Learner系単眼深度推定手法について
by
Ryutaro Yamauchi
PPTX
Kubernetesでの性能解析 ~なんとなく遅いからの脱却~(Kubernetes Meetup Tokyo #33 発表資料)
by
NTT DATA Technology & Innovation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
by
harmonylab
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
by
Preferred Networks
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
by
Google Cloud Platform - Japan
Kubernetesによる機械学習基盤への挑戦
by
Preferred Networks
MapReduce/YARNの仕組みを知る
by
日本ヒューレット・パッカード株式会社
Active Learning の基礎と最近の研究
by
Fumihiko Takahashi
Samba4を「ふつうに」使おう!
by
基信 高橋
MoveItの新機能、 OMPL Constrained Planningを試してみた
by
Ryo Kabutan
[D36] Michael Stonebrakerが生み出した列指向データベースは何が凄いのか? ~Verticaを例に列指向データベースのアーキテクチャ...
by
Insight Technology, Inc.
Protocol Buffers 入門
by
Yuichi Ito
近年のHierarchical Vision Transformer
by
Yusuke Uchida
Texture-Aware Superpixel Segmentation
by
yukihiro domae
Apache spark 2.3 and beyond
by
NTT DATA Technology & Innovation
文献紹介:YOLO series:v1-v5, X, F, and YOWO
by
Toru Tamaki
データ中心の時代を生き抜くエンジニアに知ってほしい10?のこと
by
Hideo Terada
mcl_3dl: amcl並に軽量な3-D/6-DoFローカリゼーションパッケージ
by
Atsushi Watanabe
【Unity道場 名古屋SP】HMI及び自動運転におけるUnity活用事例
by
Unity Technologies Japan K.K.
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
by
NTT DATA Technology & Innovation
SfM Learner系単眼深度推定手法について
by
Ryutaro Yamauchi
Kubernetesでの性能解析 ~なんとなく遅いからの脱却~(Kubernetes Meetup Tokyo #33 発表資料)
by
NTT DATA Technology & Innovation
日本語における自然言語解析とその応用 〜COTOHA VA & API〜
1.
ntt.com Transform your business,
transcend expectations with our technologically advanced solutions. Copyright © NTT Communications Corporation. All rights reserved. Transform your business, transcend expectations with our technologically advanced solutions. Copyright © NTT Communications Corporation. All rights reserved. 日本語における自然言語解析とその応用 〜COTOHA VA & API〜 NTTコミュニケーションズ株式会社 アプリケーション&コンテンツサービス部 AI推進室 Team MASAMASA (石井方邦 / 浜田正裕)
2.
Copyright © NTT
Communications Corporation. All rights reserved. 名前:石井方邦(MASAkuni Ishii) 所属:NTTコミュニケーションズ 担当:COTOHAパートナーセールス/イノベーション 趣味:音楽聴く/ライブ行く 2大学生時代勉強したくなかったこと:DB、機械学習 経歴 ・学生時代:セキュリティの研究に従事 ・NTT研究所入社:セキュリティ&BigDataチームに配属 OJTしてるときにチームが分割/なぜかBigDataチームへ Twitterのデータをひたすら収集 オンライン機械学習エンジン「Jubatus」 ・NTTコミュニケーションズへ異動: なぜか海外製品を利用したオーダーシステムを開発 その後、”COTOHA”の販売チームに。。。 自己紹介 1 気づいたらAIやってました
3.
Copyright © NTT
Communications Corporation. All rights reserved. 名前: 浜田正裕(MASAhiro Hamada) 所属: NTTコミュニケーションズ 担当: COTOHA API開発 趣味: ソーイング・自転車・読書・レザークラフト・ 車中泊旅行・カラオケ よく使う言語: Ruby, Bash 経歴: 2006年電気通信大学卒。 チャットボット+質問応答が研究テーマ。 2006年NTTアドバンステクノロジ社入社。 入社後10年程度、 NTTレゾナントの検索システム関連開発に従事。 2016年 NTTコミュニケーションズ社に出向。 COTOHA開発に従事 自己紹介 2 気づいたらAIやってました
4.
Copyright © NTT
Communications Corporation. All rights reserved. 【参考】NTTコミュニケーションズについて 日本電信電話株式会社(持株会社) ・営業収益: 1兆2,830億円 ・営業利益: 1,325億円 グローバルに高品質な ICTサービスを提供 <拠点の展開状況> など ・約21,550名 [内訳] 国内 : 約11,900名 海外 : 約 9,650名 *1 2017年3月末時点 *2 データセンター拠点数は計画を含む ・41の国や地域の112都市で事業拠点展開 ・196の国や地域でグローバルネットワークサービスを提供 ・世界最大級のグローバルTier1 IPバックボーン ・全世界に140以上のデータセンターを展開*2 <2016年度の事業状況> <従業員数>
5.
Copyright © NTT
Communications Corporation. All rights reserved. COTOHAサービス 4 短期間で導入が可能な、ユーザーの自 己解決を支援するAIサービス 自然な日本語を高い精度で理解し、 必要な情報を自ら聞き出すといった “人間らしい対話”ができるAI AIによる超高精度の自動翻訳を実現す る、企業向け翻訳ソリューション NTTグループの40年以上にわたる研究 成果である日本語辞書・自然言語処理 を活用したAPIプラットフォーム
6.
Copyright © NTT
Communications Corporation. All rights reserved. これだれかわかりますか? 5
7.
Copyright © NTT
Communications Corporation. All rights reserved. 6
8.
Copyright © NTT
Communications Corporation. All rights reserved. 7 7 NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
9.
Copyright © NTT
Communications Corporation. All rights reserved. 8 会話から欲しい商品をリコメンド 会話により、購入前の不安を解消 NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
10.
Copyright © NTT
Communications Corporation. All rights reserved. 9 会話から欲しい商品をリコメンド 会話により、購入前の不安を解消 NTTコミュニケーションズLINE公式アカウントに「COTOHA」を搭載
11.
Copyright © NTT
Communications Corporation. All rights reserved. コリスのほうがかわいい。。。 10
12.
Copyright © NTT
Communications Corporation. All rights reserved. 11 11 なぜ、チャットボット等の コミュニケーション系AI にイマイチ感があるのか?
13.
Copyright © NTT
Communications Corporation. All rights reserved. 12 「会話」を理解する なぜ、コミュニケーション系AIにイマイチ感があるのか 「画像・映像」を理解する 「状態」を理解する *自動運転など
14.
Copyright © NTT
Communications Corporation. All rights reserved. 13 「会話」を理解する なぜ、コミュニケーション系AIにイマイチ感があるのか 「画像・映像」を理解する 「状態」を理解する *自動運転など 「人ができることできないのか」 と感じる
15.
Copyright © NTT
Communications Corporation. All rights reserved. 14 「会話」を理解する なぜ、コミュニケーション系AIにイマイチ感があるのか 「画像・映像」を理解する 「状態」を理解する *自動運転など 「人ができることできないのか」 と感じる 「人ではできないな」 と感じる
16.
Copyright © NTT
Communications Corporation. All rights reserved. 15 「会話」を理解する なぜ、コミュニケーション系AIにイマイチ感があるのか 「画像・映像」を理解する 「状態」を理解する *自動運転など 「人ができることできないのか」 と感じる 「人ではできないな」 と感じる
17.
Copyright © NTT
Communications Corporation. All rights reserved. 16 Hololens X COTOHA X IoT
18.
Copyright © NTT
Communications Corporation. All rights reserved. NTTコミュニケーションズのEnterprise Cloud上でのSaaS型サービスです。 接続するインターフェースやデータベースについては、お客さまのご要件に応じてソ リューションをご提供します。 COTOHAの利用イメージ(全体像) 17 質問 お客さま API 自然言語解析 モジュール チ ャ ッ ト シ ス テ ム 辞書群 会話フロー設定 モジュール FAQ設定 モジュール エスカレーション 半自動学習 回答 オペレーター 社内システム /DB 外 部 接 続 モ ジ ュ ー ル コンテンツ群 チャット ロボット 音声認識・合成 WEB Site 翻訳エンジン Enterprise Cloud インターネット 天候 ニュース 交通情報 金融情報 位置情報
19.
Copyright © NTT
Communications Corporation. All rights reserved. COTOHAサービス 18 短期間で導入が可能な、ユーザーの自 己解決を支援するAIサービス 自然な日本語を高い精度で理解し、 必要な情報を自ら聞き出すといった “人間らしい対話”ができるAI AIによる超高精度の自動翻訳を実現す る、企業向け翻訳ソリューション NTTグループの40年以上にわたる研究 成果である日本語辞書・自然言語処理 を活用したAPIプラットフォーム
20.
Copyright © NTT
Communications Corporation. All rights reserved. AIを脳で表してみる 19 19 会話脳 予測脳 ・・・ 記 憶 領 域 知 識 領 域 分析脳 言語脳
21.
Copyright © NTT
Communications Corporation. All rights reserved. AIを脳で表してみる 20 20 言語脳 会話脳 予測脳 ・・・ 記 憶 領 域 知 識 領 域 分析脳 ここ
22.
Copyright © NTT
Communications Corporation. All rights reserved. 意味を利用した日本語解析とは? 21
23.
Copyright © NTT
Communications Corporation. All rights reserved. 意味を利用した日本語解析とは? 22 サラダは食べるけど妹は食べません!
24.
Copyright © NTT
Communications Corporation. All rights reserved. 意味を利用した日本語解析とは? 23 昨日、銀座でサラダと焼き肉を食べた。 昨日、銀座で妹と焼き肉を食べた。 私 サラダ 焼肉 食べる 私 妹 焼肉 食べる + + サラダは食べるけど妹は食べません!
25.
Copyright © NTT
Communications Corporation. All rights reserved. NTTグループの40年以上にわたる研究成果である日本語辞書・自然言語機能、および COTOHAサービスの提供を通じて独自開発した機能をベースとした「テキスト・ 言語解析」「対話」「音声認識」向けAPIサービスです。 COTOHA APIの概要 24 日本語テキストを扱う 様々なビジネスシーン に活用可能 NTTグループの40年以上 にわたる研究成果である 日本語辞書・自然言語処理を 活用したAPI 辞書および APIカスタマイズで さらに精度向上 が可能 COTOHA API テキスト アナリティクス 翻訳 A あ 接客応対 マーケティング ヘルプデスク … API設定 カスタマイズ お客さま個別辞書 NTT業界用語辞書 NTT基本語辞書 テキスト 言語解析 対話 音声
26.
Copyright © NTT
Communications Corporation. All rights reserved. COTOHA APIの活用シーン RPAの前処理で表記揺れを検知・訂正することでRPAの適用範囲拡大 RPA導入による業務効率化を行ったが、 処理するファイル(メール等)にノイズ が多く、Robotが業務処理を行えない。 … COTOHA APIで表記揺れ等のノイズを 除去することでRobotが業務処理可能 に。RPA適用範囲拡大により導入効果 を更に向上。 表記揺れ正規化 2 活用が難しい非構造ビッグデータのマーケティング活用 ビッグデータをマーケティング等に活 用したいが、非構造データの解析が難 しく、価値ある資産が活かされること なく塩漬けになっている。 COTOHA APIを用いて非構造データの 解析/ユーザー属性の抽出を行うことで、 ビッグデータ活用したマーケティング が可能に。 1 ユーザー属性、 キーワード抽出 …
27.
Copyright © NTT
Communications Corporation. All rights reserved. COTOHA APIの活用シーン 音声認識の精度改善による、応対システム導入効果向上 音声入力をUIとして後続の VA/Chatbotへ連携するRobot中心の応 対システムを導入したが、認識精度が 低く、コスト削減効果が得られない。 COTOHA APIで音声特有の認識誤りを 検知・訂正することで、精度向上が可 能。人へのエスカレ率の低減等により、 コスト削減効果が増大。 3 ゼロベースでは対応が難しい日本語対応をAdd-onで実現 既存のVA製品の多言語化を進める際に、 習得/解析難易度が高い日本語は構築 に莫大な工数がかかる。 COTOHA APIではお客様のVA製品に、 必要な機能だけをAdd-onする形で日 本語化対応が可能。 4 ええと・・・、プリン を4個ください … ええとプリンをよんこう ください ええと・・・、プリン を4個ください プリンを4個ください 言い淀み除去・ 誤り検知・訂正 How long does it take to get there? 30min. そこに着くまでどれくらい? ??? How long does it take to get there? 30min. そこに着くまでどれくらい? 30分です 構文解析・ 翻訳
28.
Copyright © NTT
Communications Corporation. All rights reserved. COTOHA APIの強み「①日本語辞書」「②意味属性利用」「③日本語文脈理解」 により、日本語文章を正しく詳細に理解できるため、実現不可能だった活用ケー スにリーチできます。 COTOHA APIの強み 27 現状例 フレッツ光定額プラン…いや 2段階定額プランを申し込 みたい。 否定語 修正語 すみません、わかりません。 年代:不明 職業:不明 居住地:不明 VA利用者 VA対話ログ 年代:20-30代 職業:医療関係 居住地:田町 VA利用者 不良品の クーリング オフをした いです mail テーマ 返品依頼 後続業務 ? HEXが故障した。 すみません、 よくわかりません。 HEXが故障した。 熱交換器の 故障問合せですね。 COTOHA APIの強み ①世界最大級の 日本語辞書 (随時拡充中) ②単語を約3000種の 意味属性に分類 ③日本語文章の文脈理解 将来活用例 私 / は / 昨日 / 、 / 彼 / が / 書 く/ い / た / 小説 / を / 本屋 / で / 買う / い / ました 動作主格 述語時間格 場所格対象格 動作主格 述語 対象格 フレッツ光定額プラン…いや 2段階定額プランを申し込 みたい。 否定語 修正語 2段階定額プランですね。 テーマ 返品問合せ 不良品の クーリング オフをした いです mail テーマ 返品依頼 後続業務 テーマ 返品問合せ 返品 対応
29.
Copyright © NTT
Communications Corporation. All rights reserved. COTOHA API活用事例
30.
Copyright © NTT
Communications Corporation. All rights reserved. 自然言語3カテゴリ23種類のAPIを順次公開予定です。 提供API(言語・テキスト解析API) 言語・テキスト解析APIs 固有表現抽出 人名や地名などの固有表現を抽出します。 2018/1Q予定2 構文解析 日本語テキストの構造と意味を解析します。※ ・形態素解析:文章を単語ごとに分割し、品詞タイプを出力 ・表記ゆれ正規化:表記ゆれや崩れ語を正規化し出力 ・意味解析:係り受けを解析し、文節間の意味関係を出力 2018/1Q予定1 キーワード抽出 人名や地名、組織など、文章の主要なキーワードを抽出します。 2018/1Q予定7 照応解析 「あれ」「これ」「次」「他」等の指示語・省略語を検知し、 内容を明記した文章を出力します。 2018/1Q予定 (BETA版) 4
31.
Copyright © NTT
Communications Corporation. All rights reserved. 自然言語3カテゴリ23種類のAPIを順次公開予定です。 提供API(対話API) 対話APIs 文タイプ判定 叙述文、命令文、質問文等の文タイプを出力します。 2018/1Q予定3 類似度判定 文章間の類似度を算出し、出力します。 2018/1Q予定7 A B ユーザ属性推定 文章からユーザの年代、職業等の属性を推定します。 2018/1Q予定 (BETA版) 4
32.
Copyright © NTT
Communications Corporation. All rights reserved. 自然言語3カテゴリ23種類のAPIを順次公開予定です。 提供API(音声認識API) 音声認識APIs 言い淀み除去 ユーザからの音声入力時に含まれる言い淀みを除去します。 2018/3Q予定1 誤り箇所検知 音声認識処理後のテキストに対して、認識ミスの恐れがある単 語を検知・抽出します。 2018/3Q予定2 ! 誤り箇所訂正 音声認識処理後のテキストに対して、認識ミスの恐れがある単 語を検知し、修正候補を提示します。 2018/3Q予定3 ✔
Download