More Related Content
Similar to AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用 (20)
More from Daiyu Hatakeyama (20)
AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用
- 1. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AI for Media 2018 Update
~メディア業界のための AI との付き合い方~
2018/12/10
株式会社ユニゾンシステムズ
- 2. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
スピーチ AI を活用した
文字起こしプラットホームの活用
1
SESSION TITLE
自己紹介
株式会社ユニゾンシステムズ
取締役CTO R&D本部長
須山 佳典 (programmer)
M3 大阪府柏原市出身
- 3. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
社 名 株式会社ユニゾンシステムズ
UNIXON SYSTEMS CO.,LTD
本 社 〒810-0062 福岡市中央区荒戸2-1-5 大濠公園ビル3F
東 京 支 社 〒105-0012 東京都港区芝大門2-11-1 富士ビル6F
設 立 1991年11月15日
資 本 金 5千万円
代 表 取 締 役 今村勉也
従 業 員 数 70名 (2018/10/1現在)
C o m p a n y P r o f i l e
会社概要
創業28年目 福岡に本社を置く ソフトウェア開発会社です。
2
- 4. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMSC o m p a n y P r o f i l e
会社概要
3
先駆者、革新者、ベストパートナーたれ
革新的な技術で世界中の
世の中にないものを創り出し、世界をアッと驚かしてみよう。
- 5. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMSP r o d u c t s
主要製品
メディア業界様 向け ソフトウェアの開発
4
本日
- 6. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
「AI」 について
THEME
~メディア業界のための AI との付き合い方~
AIに詳しい皆様、すいません、初歩的な内容です
5
- 7. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AI化対象
プログラムの一部が
「AI」はプログラムを自動で作ってくれる?
表示
(画面)
入
力
受信
表示
(画面)
出
力
何か
処理
送信 格納 DATA
プログラム(1つの機能)の基本パターン
解析
6
全体で1つのプログラム
- 8. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
正規化:データを使いやすく整形する事
解
析
情報の数値化/正規化/加工
入力情報(群)
分析
・計算
・条件分岐
結果
「解析」の中身
・業務ノウハウ/情報の理解
・試験データの入手
・データ構造/相関性解析
・プログラミング
・推論/結果の説明
・根気と根性
・パズルゲーム好き
スペシャル
プログラマー
7
プログラム
AI
=
AIは情報を理解しない
- 9. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AIを使って何かをしよう!
AI自体(モデル)を
作って
学習をさせよう。
既に提供されている
AIを
利用しよう。
(A) (B)
大きく2つの道
(他にもたくさんの方法がありますが…)
8
働き方改革の一環で
- 10. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
(A) AI自体(モデル)を作って学習もさせよう。
AI モデル
学習データ
様々な情報
結果(答え)
数値化/正規化/加工
…
(入力)
(出力)
100%の信頼度
CNN
RNN
LSTM
…
数字を入れたら
数字がでてくる
100%の信頼度ではない
(教師付き学習の場合)
プログラム
「数値」をいれたら「数値」=「答え」が出てくる装置がAI
その装置を「プログラミング」ではなく「学習」によって作り上げる
(計算と条件分岐)
9
- 11. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
(A) AI自体(モデル)を作って学習もさせよう。
注意点
・モデル作成者(AIベンダー)と、学習データ準備側
(発注者?)側の役割分担/責任分界点(判断しにくい)
・入力データの数値化/正規化/加工は誰がするのか
・事前に精度(信頼度)の定義は難しい
・決して高めの精度(信頼度)目標は設定しない (稟議は通せても後で苦しい)
・精度が高くなくても、AIが使える方法を検討
・本当にそれをするにはAIが必要なのか/AIは得意な内容か
・お金は続くのか(いくらかかるのか)
・上位/下位のアプリケーション(入力/表示部分)を忘れずに
・学習用データの数、バラエティは十分に準備できるか
10
- 12. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
(B) 既に提供されているAIを利用しよう。
AI
(Service)
情報
結果
既に出来上がっているサービス等
Computer Vision
Video Indexer
Face
Content Moderator
Custom Vision
Speech to Text
Text to Speech
Speaker Recognition
Speech Translation
Text Analytics
Bing Spell Check
Language Understanding
Translator Text
QnA Maker Bing Web Search ………
Cognitive Services
11
例えば
- 13. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
(B) 既に提供されているAIを利用しよう。
利点
・すぐに試すことができる
・精度が検証(確認)ができる
・費用が明確(従量課金が多い)
・上位のアプリケーションに直ぐに専念できる
・システムの価値が検証できる
12
(以上)
・自動的にAIバージョンアップ
・学習時/推論時に高価なGPUマシンが不要
- 14. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
(人間)
人間とAIの比較
人が苦手な領域をAI化したほうが、成果はわかりやすい
13
映像・音声・文章等
の解析(理解)が得意
数値の羅列は苦手
(AI)
数値データの相関性
解析が得意
(それしかできない)
AIは映像、音声等も数値データに置き換えている
VS
- 15. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
(B)
(A) AI
構築
検証
評価
アプリケーション
アプリケーション
検証
評価
PoC PoV
(A) (B) 比較
(A)(B) 両方を検討すべき
…
…
14
独自のAIが作れる
直ぐにアプリが作れる
繰り返し
- 16. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AI (Speech to Text) を利用した
文字起こしプラットホーム
by
Main Part
15
(B) Pattern
- 17. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
Video
file
Audio
file
Overview
Web
Browser
Drag & Drop
SERVER
Cloud
Data Center
On Premises
(Services)
AI
Speech
to
Text
Audio
Only
Web Browser
results
(input)
表示修正
Capture
device
Text
results
AI
Translator
加工
加工
…
input
output
出力
CSV・SRT
LIVEの場合、10~15秒遅れで字幕表示
16
HDMI/SDILive
多言語対応
(30言語)
音声解析
翻訳
Proxy
- 18. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
Overview
17
Web BrowserJOIN-VIEW
- 19. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
Demo
デモをご覧ください
出典:首相官邸ホームページ
https://www.kantei.go.jp/jp/98_abe/statement/2018/_00034.html
18
③★U素材★ユニゾン偽アナウンサー (ファイル)
①★AZURE★安倍首相_明治150年式典(出展:首相官邸HP)
②★AZURE_BGM★安倍首相_明治150年式典(出展:首相官邸HP)
End:20~25/30
④★須山大阪弁風★明治150年式典
- 20. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AIの精度
出典:首相官邸ホームページ
加工:右上にロゴをスーパーしています
平成30年10月23日
明治150年記念式典 安倍内閣総理大臣式辞
(例)
90.6%
正解率
245文字中
ミス:23文字
https://www.kantei.go.jp/jp/98_abe/statement/2018/_00034.html
今から150年前の今日
明治会見改元の詔勅が出されました。
この節目の日に
各階各界多数のご参列を得て、明治150年記念式典を挙行致しますことは、
誠に喜びに足り堪えないところであります。
皆様と共にワークに我が国が近代国家に向けて、歩み出した王子往時を思いそれを成し遂げた。明治の人々に
ケイト敬意と
感謝を表したいとおもいます。
近代回化への道のりは大きな危機意識の中で、始まりました。
当時技術に先んじる列強が植民地支配おをすすめ
その波がアジアにも押し寄せていました。
国力に遅れをとっていたワークに我が国はまさに
国家存亡の危機に直面していたと言っても過言ではありません
19
句読点を除く
- 21. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AIの精度 BGM(-20dB) あり
出典:首相官邸ホームページ
加工:右上にロゴをスーパーしています
平成30年10月23日
明治150年記念式典 安倍内閣総理大臣式辞
(例)
84.1%
正解率
245文字中
ミス:39文字
https://www.kantei.go.jp/jp/98_abe/statement/2018/_00034.html
加工:BGMを付加しました
今から約150年前の今日も
明治会見改元の詔勅が出されました。この節目の日に書き換え各界多数のご参列を得て、明治150年に支店記念式典を
虚構挙行致しますことはまことに喜びに足り堪えないところであります。皆様と共に我が国が
近代国家でもに向けて歩み出した王子往時を思いそれを成し遂げた。明治の人々に敬意と感謝を表したいと思いましたす。
近代化への道のりは大きな品種危機意識の中で、始まりました。当時ニュース技術に先んじる。
ペット用列強が植民地支配おを勧進めその波がアジアにも星を捨押し寄せていました。
国力に遅れをとっていたworkに我が国はまさに国家存亡の危機に直面していたと言っても過言ではありません
BGMの音量がある程度までは、比較的解析できるが、ある閾値を超えると、壊滅状態となる
20
句読点を除く
BGMなし
90.6%
- 22. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AIの精度
60%~95%日本語の場合 (殆ど無茶苦茶な場合もあります)
・声の大きさ
・声の強弱
・話すスピード、単語間の無音の長さ
・読む > 話す > しゃべる の違い
・ノイズ、BGM等の背景音、エコー音、マイクの違い
・複数人での声の重なり
・方言、イントネーション、滑舌
・外国の地名や人名、専門的な用語、珍しい単語
(辞書=Custom Speech等で改善は可能)
...
21
精度変化(低下)の主要因 音源によりバラバラな結果
素材毎に試さないと
わからない
平均値は意味がない
- 23. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
文字起こし結果の修正
・Timed Metadataとして検索のみに使用する場合は修正不要
・文字起こしとしては 修正は必須 (100%の精度にはならない)
いかに使い勝手よく修正できるアプリか
(機能の一例)
・文章単位自動分離 ・文章の頭出し
・ループ再生 ・スロー等再生速度変更(音付き)
・音声波形表示 ・フレーム単位操作 ・タイムコード表示
・文章の結合/分割 ・複数人同時修正
・キーボードのみ (でも) 修正可能
22
- 24. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
お問合せ
ご質問等も大歓迎です。
是非、この後「個別相談ルーム」にお越し下さい。
23
デモの依頼も大歓迎です。
お問合せ
egy-sls-ml@unixon.co.jp