SlideShare a Scribd company logo
1 of 25
Download to read offline
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AI for Media 2018 Update
~メディア業界のための AI との付き合い方~
2018/12/10
株式会社ユニゾンシステムズ
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
スピーチ AI を活用した
文字起こしプラットホームの活用
1
SESSION TITLE
自己紹介
株式会社ユニゾンシステムズ
取締役CTO R&D本部長
須山 佳典 (programmer)
M3 大阪府柏原市出身
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
社 名 株式会社ユニゾンシステムズ
UNIXON SYSTEMS CO.,LTD
本 社 〒810-0062 福岡市中央区荒戸2-1-5 大濠公園ビル3F
東 京 支 社 〒105-0012 東京都港区芝大門2-11-1 富士ビル6F
設 立 1991年11月15日
資 本 金 5千万円
代 表 取 締 役 今村勉也
従 業 員 数 70名 (2018/10/1現在)
C o m p a n y P r o f i l e
会社概要
創業28年目 福岡に本社を置く ソフトウェア開発会社です。
2
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMSC o m p a n y P r o f i l e
会社概要
3
先駆者、革新者、ベストパートナーたれ
革新的な技術で世界中の
世の中にないものを創り出し、世界をアッと驚かしてみよう。
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMSP r o d u c t s
主要製品
メディア業界様 向け ソフトウェアの開発
4
本日
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
「AI」 について
THEME
~メディア業界のための AI との付き合い方~
AIに詳しい皆様、すいません、初歩的な内容です
5
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AI化対象
プログラムの一部が
「AI」はプログラムを自動で作ってくれる?
表示
(画面)
入
力
受信
表示
(画面)
出
力
何か
処理
送信 格納 DATA
プログラム(1つの機能)の基本パターン
解析
6
全体で1つのプログラム
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
正規化:データを使いやすく整形する事
解
析
情報の数値化/正規化/加工
入力情報(群)
分析
・計算
・条件分岐
結果
「解析」の中身
・業務ノウハウ/情報の理解
・試験データの入手
・データ構造/相関性解析
・プログラミング
・推論/結果の説明
・根気と根性
・パズルゲーム好き
スペシャル
プログラマー
7
プログラム
AI
=
AIは情報を理解しない
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AIを使って何かをしよう!
AI自体(モデル)を
作って
学習をさせよう。
既に提供されている
AIを
利用しよう。
(A) (B)
大きく2つの道
(他にもたくさんの方法がありますが…)
8
働き方改革の一環で
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
(A) AI自体(モデル)を作って学習もさせよう。
AI モデル
学習データ
様々な情報
結果(答え)
数値化/正規化/加工
…
(入力)
(出力)
100%の信頼度
CNN
RNN
LSTM
…
数字を入れたら
数字がでてくる
100%の信頼度ではない
(教師付き学習の場合)
プログラム
「数値」をいれたら「数値」=「答え」が出てくる装置がAI
その装置を「プログラミング」ではなく「学習」によって作り上げる
(計算と条件分岐)
9
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
(A) AI自体(モデル)を作って学習もさせよう。
注意点
・モデル作成者(AIベンダー)と、学習データ準備側
(発注者?)側の役割分担/責任分界点(判断しにくい)
・入力データの数値化/正規化/加工は誰がするのか
・事前に精度(信頼度)の定義は難しい
・決して高めの精度(信頼度)目標は設定しない (稟議は通せても後で苦しい)
・精度が高くなくても、AIが使える方法を検討
・本当にそれをするにはAIが必要なのか/AIは得意な内容か
・お金は続くのか(いくらかかるのか)
・上位/下位のアプリケーション(入力/表示部分)を忘れずに
・学習用データの数、バラエティは十分に準備できるか
10
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
(B) 既に提供されているAIを利用しよう。
AI
(Service)
情報
結果
既に出来上がっているサービス等
Computer Vision
Video Indexer
Face
Content Moderator
Custom Vision
Speech to Text
Text to Speech
Speaker Recognition
Speech Translation
Text Analytics
Bing Spell Check
Language Understanding
Translator Text
QnA Maker Bing Web Search ………
Cognitive Services
11
例えば
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
(B) 既に提供されているAIを利用しよう。
利点
・すぐに試すことができる
・精度が検証(確認)ができる
・費用が明確(従量課金が多い)
・上位のアプリケーションに直ぐに専念できる
・システムの価値が検証できる
12
(以上)
・自動的にAIバージョンアップ
・学習時/推論時に高価なGPUマシンが不要
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
(人間)
人間とAIの比較
人が苦手な領域をAI化したほうが、成果はわかりやすい
13
映像・音声・文章等
の解析(理解)が得意
数値の羅列は苦手
(AI)
数値データの相関性
解析が得意
(それしかできない)
AIは映像、音声等も数値データに置き換えている
VS
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
(B)
(A) AI
構築
検証
評価
アプリケーション
アプリケーション
検証
評価
PoC PoV
(A) (B) 比較
(A)(B) 両方を検討すべき
…
…
14
独自のAIが作れる
直ぐにアプリが作れる
繰り返し
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AI (Speech to Text) を利用した
文字起こしプラットホーム
by
Main Part
15
(B) Pattern
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
Video
file
Audio
file
Overview
Web
Browser
Drag & Drop
SERVER
Cloud
Data Center
On Premises
(Services)
AI
Speech
to
Text
Audio
Only
Web Browser
results
(input)
表示修正
Capture
device
Text
results
AI
Translator
加工
加工
…
input
output
出力
CSV・SRT
LIVEの場合、10~15秒遅れで字幕表示
16
HDMI/SDILive
多言語対応
(30言語)
音声解析
翻訳
Proxy
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
Overview
17
Web BrowserJOIN-VIEW
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
Demo
デモをご覧ください
出典:首相官邸ホームページ
https://www.kantei.go.jp/jp/98_abe/statement/2018/_00034.html
18
③★U素材★ユニゾン偽アナウンサー (ファイル)
①★AZURE★安倍首相_明治150年式典(出展:首相官邸HP)
②★AZURE_BGM★安倍首相_明治150年式典(出展:首相官邸HP)
End:20~25/30
④★須山大阪弁風★明治150年式典
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AIの精度
出典:首相官邸ホームページ
加工:右上にロゴをスーパーしています
平成30年10月23日
明治150年記念式典 安倍内閣総理大臣式辞
(例)
90.6%
正解率
245文字中
ミス:23文字
https://www.kantei.go.jp/jp/98_abe/statement/2018/_00034.html
今から150年前の今日
明治会見改元の詔勅が出されました。
この節目の日に
各階各界多数のご参列を得て、明治150年記念式典を挙行致しますことは、
誠に喜びに足り堪えないところであります。
皆様と共にワークに我が国が近代国家に向けて、歩み出した王子往時を思いそれを成し遂げた。明治の人々に
ケイト敬意と
感謝を表したいとおもいます。
近代回化への道のりは大きな危機意識の中で、始まりました。
当時技術に先んじる列強が植民地支配おをすすめ
その波がアジアにも押し寄せていました。
国力に遅れをとっていたワークに我が国はまさに
国家存亡の危機に直面していたと言っても過言ではありません
19
句読点を除く
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AIの精度 BGM(-20dB) あり
出典:首相官邸ホームページ
加工:右上にロゴをスーパーしています
平成30年10月23日
明治150年記念式典 安倍内閣総理大臣式辞
(例)
84.1%
正解率
245文字中
ミス:39文字
https://www.kantei.go.jp/jp/98_abe/statement/2018/_00034.html
加工:BGMを付加しました
今から約150年前の今日も
明治会見改元の詔勅が出されました。この節目の日に書き換え各界多数のご参列を得て、明治150年に支店記念式典を
虚構挙行致しますことはまことに喜びに足り堪えないところであります。皆様と共に我が国が
近代国家でもに向けて歩み出した王子往時を思いそれを成し遂げた。明治の人々に敬意と感謝を表したいと思いましたす。
近代化への道のりは大きな品種危機意識の中で、始まりました。当時ニュース技術に先んじる。
ペット用列強が植民地支配おを勧進めその波がアジアにも星を捨押し寄せていました。
国力に遅れをとっていたworkに我が国はまさに国家存亡の危機に直面していたと言っても過言ではありません
BGMの音量がある程度までは、比較的解析できるが、ある閾値を超えると、壊滅状態となる
20
句読点を除く
BGMなし
90.6%
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
AIの精度
60%~95%日本語の場合 (殆ど無茶苦茶な場合もあります)
・声の大きさ
・声の強弱
・話すスピード、単語間の無音の長さ
・読む > 話す > しゃべる の違い
・ノイズ、BGM等の背景音、エコー音、マイクの違い
・複数人での声の重なり
・方言、イントネーション、滑舌
・外国の地名や人名、専門的な用語、珍しい単語
(辞書=Custom Speech等で改善は可能)
...
21
精度変化(低下)の主要因 音源によりバラバラな結果
素材毎に試さないと
わからない
平均値は意味がない
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
文字起こし結果の修正
・Timed Metadataとして検索のみに使用する場合は修正不要
・文字起こしとしては 修正は必須 (100%の精度にはならない)
いかに使い勝手よく修正できるアプリか
(機能の一例)
・文章単位自動分離 ・文章の頭出し
・ループ再生 ・スロー等再生速度変更(音付き)
・音声波形表示 ・フレーム単位操作 ・タイムコード表示
・文章の結合/分割 ・複数人同時修正
・キーボードのみ (でも) 修正可能
22
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
お問合せ
ご質問等も大歓迎です。
是非、この後「個別相談ルーム」にお越し下さい。
23
デモの依頼も大歓迎です。
お問合せ
egy-sls-ml@unixon.co.jp
Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved.
UNIXON SYSTEMS
ご清聴ありがとうございました
24

More Related Content

What's hot

Setta soft layersummit(公開用)_creationline
Setta soft layersummit(公開用)_creationlineSetta soft layersummit(公開用)_creationline
Setta soft layersummit(公開用)_creationline
chenree3
 

What's hot (20)

APIエコノミーとは何か? それはどこへ続く道なのか(2017年) (in Japanese)
APIエコノミーとは何か? それはどこへ続く道なのか(2017年) (in Japanese)APIエコノミーとは何か? それはどこへ続く道なのか(2017年) (in Japanese)
APIエコノミーとは何か? それはどこへ続く道なのか(2017年) (in Japanese)
 
SORACOM Conference Discovery 2017 | B3. IoTでトップラインを伸ばす
SORACOM Conference Discovery 2017 | B3. IoTでトップラインを伸ばすSORACOM Conference Discovery 2017 | B3. IoTでトップラインを伸ばす
SORACOM Conference Discovery 2017 | B3. IoTでトップラインを伸ばす
 
Api meet up online#6 session1 ginco
Api meet up online#6 session1 gincoApi meet up online#6 session1 ginco
Api meet up online#6 session1 ginco
 
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
【C-2・醍醐様】AIとAPIがITインフラにもたらす変化 ~プログラマブルなクラウド型Wi-Fi~
 
IBM Bluemix + Watson(MS) + Eagle Eye で行う 表情認識システム
IBM Bluemix + Watson(MS) + Eagle Eye で行う 表情認識システムIBM Bluemix + Watson(MS) + Eagle Eye で行う 表情認識システム
IBM Bluemix + Watson(MS) + Eagle Eye で行う 表情認識システム
 
20180119 AI で業務効率化 ~B To Employee ではじめる Chat Bot~
20180119 AI で業務効率化 ~B To Employee ではじめる Chat Bot~20180119 AI で業務効率化 ~B To Employee ではじめる Chat Bot~
20180119 AI で業務効率化 ~B To Employee ではじめる Chat Bot~
 
2018年のハイブリッドクラウド事情と 2019年のクラウド予想!
2018年のハイブリッドクラウド事情と 2019年のクラウド予想!2018年のハイブリッドクラウド事情と 2019年のクラウド予想!
2018年のハイブリッドクラウド事情と 2019年のクラウド予想!
 
PepperとWatson音声関連API
PepperとWatson音声関連APIPepperとWatson音声関連API
PepperとWatson音声関連API
 
SEILはIIJのココに使われている
SEILはIIJのココに使われているSEILはIIJのココに使われている
SEILはIIJのココに使われている
 
第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる
 
SoftLayer Bluemix SUMMIT 2015 : Intel Edisonクラスタ x Bluemixによる IoTアプリケーションの実装
SoftLayer Bluemix SUMMIT 2015 : Intel Edisonクラスタ x Bluemixによる IoTアプリケーションの実装SoftLayer Bluemix SUMMIT 2015 : Intel Edisonクラスタ x Bluemixによる IoTアプリケーションの実装
SoftLayer Bluemix SUMMIT 2015 : Intel Edisonクラスタ x Bluemixによる IoTアプリケーションの実装
 
SORACOM Conference Discovery 2017 | C1. 機器のサービス化を実現するための遠隔管理
SORACOM Conference Discovery 2017 | C1. 機器のサービス化を実現するための遠隔管理SORACOM Conference Discovery 2017 | C1. 機器のサービス化を実現するための遠隔管理
SORACOM Conference Discovery 2017 | C1. 機器のサービス化を実現するための遠隔管理
 
ここがオモロイ!IBMクラウド ~入社して60日で分かったこと~
ここがオモロイ!IBMクラウド ~入社して60日で分かったこと~ここがオモロイ!IBMクラウド ~入社して60日で分かったこと~
ここがオモロイ!IBMクラウド ~入社して60日で分かったこと~
 
Bluemixを実案件(エンタープライズ)で使ってみてわかったこと
Bluemixを実案件(エンタープライズ)で使ってみてわかったことBluemixを実案件(エンタープライズ)で使ってみてわかったこと
Bluemixを実案件(エンタープライズ)で使ってみてわかったこと
 
de:code 2019登壇資料:MLOpsによるAIモデルの作り方
de:code 2019登壇資料:MLOpsによるAIモデルの作り方de:code 2019登壇資料:MLOpsによるAIモデルの作り方
de:code 2019登壇資料:MLOpsによるAIモデルの作り方
 
kintoneで変わる
kintoneで変わるkintoneで変わる
kintoneで変わる
 
SMBのバックオフィス業務を最適化するAPI連携
SMBのバックオフィス業務を最適化するAPI連携SMBのバックオフィス業務を最適化するAPI連携
SMBのバックオフィス業務を最適化するAPI連携
 
if-up 2017 | B2 デバイスデザインパターン〜ユースケース別デバイス選定〜
 if-up 2017 | B2 デバイスデザインパターン〜ユースケース別デバイス選定〜 if-up 2017 | B2 デバイスデザインパターン〜ユースケース別デバイス選定〜
if-up 2017 | B2 デバイスデザインパターン〜ユースケース別デバイス選定〜
 
Setta soft layersummit(公開用)_creationline
Setta soft layersummit(公開用)_creationlineSetta soft layersummit(公開用)_creationline
Setta soft layersummit(公開用)_creationline
 
株式会社アイ・ロボティクス サービス概要資料 2111
株式会社アイ・ロボティクス サービス概要資料 2111株式会社アイ・ロボティクス サービス概要資料 2111
株式会社アイ・ロボティクス サービス概要資料 2111
 

Similar to AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用

【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介
【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介
【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介
Shohei Yamamoto
 
第5回 デジタルガジェット祭り! スマートスピーカー特集(4)
第5回 デジタルガジェット祭り! スマートスピーカー特集(4)第5回 デジタルガジェット祭り! スマートスピーカー特集(4)
第5回 デジタルガジェット祭り! スマートスピーカー特集(4)
aitc_jp
 

Similar to AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用 (20)

Jazug-8th: Azure AKS & FIWARE & Robot
Jazug-8th: Azure AKS & FIWARE & RobotJazug-8th: Azure AKS & FIWARE & Robot
Jazug-8th: Azure AKS & FIWARE & Robot
 
Smfl20201001
Smfl20201001Smfl20201001
Smfl20201001
 
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略
 
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)
【FKEYセミナー 20150205 基調講演】「今こそクラウド活用」 講師:大和 敏彦 氏 (株式会社アイティアイ 代表取締役)
 
Toolsの杜- 弥生株式会社の自動仕訳エンジンを支えるフロントエンド ~ 「ダサいは、バグだ!」を標榜してUXを徹底的に追求する ~
Toolsの杜- 弥生株式会社の自動仕訳エンジンを支えるフロントエンド ~ 「ダサいは、バグだ!」を標榜してUXを徹底的に追求する ~Toolsの杜- 弥生株式会社の自動仕訳エンジンを支えるフロントエンド ~ 「ダサいは、バグだ!」を標榜してUXを徹底的に追求する ~
Toolsの杜- 弥生株式会社の自動仕訳エンジンを支えるフロントエンド ~ 「ダサいは、バグだ!」を標榜してUXを徹底的に追求する ~
 
AI×IoT活用サービスの拡大に必要なコト (JAWS-UG IoT専門支部)
AI×IoT活用サービスの拡大に必要なコト (JAWS-UG IoT専門支部)AI×IoT活用サービスの拡大に必要なコト (JAWS-UG IoT専門支部)
AI×IoT活用サービスの拡大に必要なコト (JAWS-UG IoT専門支部)
 
RPA製品とASTERIAで実現した業務効率化事例
RPA製品とASTERIAで実現した業務効率化事例RPA製品とASTERIAで実現した業務効率化事例
RPA製品とASTERIAで実現した業務効率化事例
 
日本語における自然言語解析とその応用 〜COTOHA VA & API〜
日本語における自然言語解析とその応用 〜COTOHA VA & API〜日本語における自然言語解析とその応用 〜COTOHA VA & API〜
日本語における自然言語解析とその応用 〜COTOHA VA & API〜
 
アプリエンジニアでもできる閉域網構築のススメ!
アプリエンジニアでもできる閉域網構築のススメ!アプリエンジニアでもできる閉域網構築のススメ!
アプリエンジニアでもできる閉域網構築のススメ!
 
Extreme Management Center を活用したネットワークの見える化
Extreme Management Center を活用したネットワークの見える化Extreme Management Center を活用したネットワークの見える化
Extreme Management Center を活用したネットワークの見える化
 
【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介
【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介
【NCMB】アプリのバックエンドを支えるサービス 「mBaaS」のご紹介
 
GTMF2017 アプリのバックエンドを支えるサービス「mBaaS」のご紹介 ニフティクラウド mobile backend
GTMF2017 アプリのバックエンドを支えるサービス「mBaaS」のご紹介  ニフティクラウド mobile backendGTMF2017 アプリのバックエンドを支えるサービス「mBaaS」のご紹介  ニフティクラウド mobile backend
GTMF2017 アプリのバックエンドを支えるサービス「mBaaS」のご紹介 ニフティクラウド mobile backend
 
顧客要望と情熱のあいだ - B2B SaaS のプロダクトマネジメント -
顧客要望と情熱のあいだ - B2B SaaS のプロダクトマネジメント -顧客要望と情熱のあいだ - B2B SaaS のプロダクトマネジメント -
顧客要望と情熱のあいだ - B2B SaaS のプロダクトマネジメント -
 
夏まつり2016 Session4(事例ローテーション:インフォテック 謝花様)
夏まつり2016 Session4(事例ローテーション:インフォテック 謝花様)夏まつり2016 Session4(事例ローテーション:インフォテック 謝花様)
夏まつり2016 Session4(事例ローテーション:インフォテック 謝花様)
 
システム運用の視点から考える「自動化&効率化」
システム運用の視点から考える「自動化&効率化」システム運用の視点から考える「自動化&効率化」
システム運用の視点から考える「自動化&効率化」
 
[GrapeCity Web TECH FORUM 2018]レガシーからの移行 - 株式会社日本プロテック
[GrapeCity Web TECH FORUM 2018]レガシーからの移行 - 株式会社日本プロテック[GrapeCity Web TECH FORUM 2018]レガシーからの移行 - 株式会社日本プロテック
[GrapeCity Web TECH FORUM 2018]レガシーからの移行 - 株式会社日本プロテック
 
JTF2018 FIWARE x robot x IoT
JTF2018 FIWARE x robot x IoTJTF2018 FIWARE x robot x IoT
JTF2018 FIWARE x robot x IoT
 
AI搭載型IP電話 MiiTel を支える組織とアーキテクチャ
AI搭載型IP電話 MiiTel を支える組織とアーキテクチャAI搭載型IP電話 MiiTel を支える組織とアーキテクチャ
AI搭載型IP電話 MiiTel を支える組織とアーキテクチャ
 
第5回 デジタルガジェット祭り! スマートスピーカー特集(4)
第5回 デジタルガジェット祭り! スマートスピーカー特集(4)第5回 デジタルガジェット祭り! スマートスピーカー特集(4)
第5回 デジタルガジェット祭り! スマートスピーカー特集(4)
 
雑食系ITエンジニアが挑む!今までにない、IoT&クラウドフル活用な保育園!?
雑食系ITエンジニアが挑む!今までにない、IoT&クラウドフル活用な保育園!?雑食系ITエンジニアが挑む!今までにない、IoT&クラウドフル活用な保育園!?
雑食系ITエンジニアが挑む!今までにない、IoT&クラウドフル活用な保育園!?
 

More from Daiyu Hatakeyama

More from Daiyu Hatakeyama (20)

ChatGPT Impact - その社会的/ビジネス価値を考える -
ChatGPT Impact - その社会的/ビジネス価値を考える -ChatGPT Impact - その社会的/ビジネス価値を考える -
ChatGPT Impact - その社会的/ビジネス価値を考える -
 
Ethics of AI - AIの倫理-
Ethics of AI - AIの倫理-Ethics of AI - AIの倫理-
Ethics of AI - AIの倫理-
 
郡山 Connect 2022 ハッカソン 基調講演 - Hackathon からサービスインになったらデータを扱いましょう
郡山 Connect 2022 ハッカソン 基調講演 - Hackathon からサービスインになったらデータを扱いましょう郡山 Connect 2022 ハッカソン 基調講演 - Hackathon からサービスインになったらデータを扱いましょう
郡山 Connect 2022 ハッカソン 基調講演 - Hackathon からサービスインになったらデータを扱いましょう
 
テクノアカデミー郡山 現役ソフトウェアエンジニアが語る。IT の今と未来
テクノアカデミー郡山 現役ソフトウェアエンジニアが語る。IT の今と未来テクノアカデミー郡山 現役ソフトウェアエンジニアが語る。IT の今と未来
テクノアカデミー郡山 現役ソフトウェアエンジニアが語る。IT の今と未来
 
Webサイトの最適化
Webサイトの最適化Webサイトの最適化
Webサイトの最適化
 
DXのための内製化のススメ
DXのための内製化のススメDXのための内製化のススメ
DXのための内製化のススメ
 
JDMC Azureアプリ開発入門
JDMC Azureアプリ開発入門JDMC Azureアプリ開発入門
JDMC Azureアプリ開発入門
 
JAZUG12周年 俺の Azure Cosmos DB
JAZUG12周年 俺の Azure Cosmos DBJAZUG12周年 俺の Azure Cosmos DB
JAZUG12周年 俺の Azure Cosmos DB
 
Microsoft の変革
Microsoft の変革Microsoft の変革
Microsoft の変革
 
データ分析概略
データ分析概略データ分析概略
データ分析概略
 
法政大学 MBA 中小企業向けITとの付き合うコツ
法政大学 MBA 中小企業向けITとの付き合うコツ法政大学 MBA 中小企業向けITとの付き合うコツ
法政大学 MBA 中小企業向けITとの付き合うコツ
 
明治大学 データサイエンス・AIに関するオムニバス授業 エバンジェリストというキャリア
明治大学 データサイエンス・AIに関するオムニバス授業 エバンジェリストというキャリア明治大学 データサイエンス・AIに関するオムニバス授業 エバンジェリストというキャリア
明治大学 データサイエンス・AIに関するオムニバス授業 エバンジェリストというキャリア
 
Green Software Foundation Global Summit 2022 Tokyo グリーンソフトウェアとは?
Green Software Foundation Global Summit 2022 Tokyo グリーンソフトウェアとは?Green Software Foundation Global Summit 2022 Tokyo グリーンソフトウェアとは?
Green Software Foundation Global Summit 2022 Tokyo グリーンソフトウェアとは?
 
コミュニケーション戦略を前提にしたOutlookやTeams活用
コミュニケーション戦略を前提にしたOutlookやTeams活用コミュニケーション戦略を前提にしたOutlookやTeams活用
コミュニケーション戦略を前提にしたOutlookやTeams活用
 
Python に行く前に Excel で学ぶデータ分析のいろは
Python に行く前に Excel で学ぶデータ分析のいろはPython に行く前に Excel で学ぶデータ分析のいろは
Python に行く前に Excel で学ぶデータ分析のいろは
 
AI の光と影
AI の光と影AI の光と影
AI の光と影
 
東京大学 メディアコンテンツ特別講義 Sustainability
東京大学 メディアコンテンツ特別講義 Sustainability東京大学 メディアコンテンツ特別講義 Sustainability
東京大学 メディアコンテンツ特別講義 Sustainability
 
Wiz国際情報工科自動車大学校 特別講演 Teams活用しよう!
Wiz国際情報工科自動車大学校 特別講演 Teams活用しよう!Wiz国際情報工科自動車大学校 特別講演 Teams活用しよう!
Wiz国際情報工科自動車大学校 特別講演 Teams活用しよう!
 
Wiz国際情報工科自動車大学校_特別講演_ITの織り成す未来
Wiz国際情報工科自動車大学校_特別講演_ITの織り成す未来Wiz国際情報工科自動車大学校_特別講演_ITの織り成す未来
Wiz国際情報工科自動車大学校_特別講演_ITの織り成す未来
 
東洋経済 製造業DXフォーラム 2022: 製造業のための Sustainability との 向き合い方
東洋経済 製造業DXフォーラム 2022: 製造業のための Sustainability との 向き合い方東洋経済 製造業DXフォーラム 2022: 製造業のための Sustainability との 向き合い方
東洋経済 製造業DXフォーラム 2022: 製造業のための Sustainability との 向き合い方
 

Recently uploaded

Recently uploaded (11)

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 

AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用

  • 1. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AI for Media 2018 Update ~メディア業界のための AI との付き合い方~ 2018/12/10 株式会社ユニゾンシステムズ
  • 2. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS スピーチ AI を活用した 文字起こしプラットホームの活用 1 SESSION TITLE 自己紹介 株式会社ユニゾンシステムズ 取締役CTO R&D本部長 須山 佳典 (programmer) M3 大阪府柏原市出身
  • 3. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS 社 名 株式会社ユニゾンシステムズ UNIXON SYSTEMS CO.,LTD 本 社 〒810-0062 福岡市中央区荒戸2-1-5 大濠公園ビル3F 東 京 支 社 〒105-0012 東京都港区芝大門2-11-1 富士ビル6F 設 立 1991年11月15日 資 本 金 5千万円 代 表 取 締 役 今村勉也 従 業 員 数 70名 (2018/10/1現在) C o m p a n y P r o f i l e 会社概要 創業28年目 福岡に本社を置く ソフトウェア開発会社です。 2
  • 4. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMSC o m p a n y P r o f i l e 会社概要 3 先駆者、革新者、ベストパートナーたれ 革新的な技術で世界中の 世の中にないものを創り出し、世界をアッと驚かしてみよう。
  • 5. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMSP r o d u c t s 主要製品 メディア業界様 向け ソフトウェアの開発 4 本日
  • 6. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS 「AI」 について THEME ~メディア業界のための AI との付き合い方~ AIに詳しい皆様、すいません、初歩的な内容です 5
  • 7. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AI化対象 プログラムの一部が 「AI」はプログラムを自動で作ってくれる? 表示 (画面) 入 力 受信 表示 (画面) 出 力 何か 処理 送信 格納 DATA プログラム(1つの機能)の基本パターン 解析 6 全体で1つのプログラム
  • 8. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS 正規化:データを使いやすく整形する事 解 析 情報の数値化/正規化/加工 入力情報(群) 分析 ・計算 ・条件分岐 結果 「解析」の中身 ・業務ノウハウ/情報の理解 ・試験データの入手 ・データ構造/相関性解析 ・プログラミング ・推論/結果の説明 ・根気と根性 ・パズルゲーム好き スペシャル プログラマー 7 プログラム AI = AIは情報を理解しない
  • 9. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AIを使って何かをしよう! AI自体(モデル)を 作って 学習をさせよう。 既に提供されている AIを 利用しよう。 (A) (B) 大きく2つの道 (他にもたくさんの方法がありますが…) 8 働き方改革の一環で
  • 10. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS (A) AI自体(モデル)を作って学習もさせよう。 AI モデル 学習データ 様々な情報 結果(答え) 数値化/正規化/加工 … (入力) (出力) 100%の信頼度 CNN RNN LSTM … 数字を入れたら 数字がでてくる 100%の信頼度ではない (教師付き学習の場合) プログラム 「数値」をいれたら「数値」=「答え」が出てくる装置がAI その装置を「プログラミング」ではなく「学習」によって作り上げる (計算と条件分岐) 9
  • 11. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS (A) AI自体(モデル)を作って学習もさせよう。 注意点 ・モデル作成者(AIベンダー)と、学習データ準備側 (発注者?)側の役割分担/責任分界点(判断しにくい) ・入力データの数値化/正規化/加工は誰がするのか ・事前に精度(信頼度)の定義は難しい ・決して高めの精度(信頼度)目標は設定しない (稟議は通せても後で苦しい) ・精度が高くなくても、AIが使える方法を検討 ・本当にそれをするにはAIが必要なのか/AIは得意な内容か ・お金は続くのか(いくらかかるのか) ・上位/下位のアプリケーション(入力/表示部分)を忘れずに ・学習用データの数、バラエティは十分に準備できるか 10
  • 12. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS (B) 既に提供されているAIを利用しよう。 AI (Service) 情報 結果 既に出来上がっているサービス等 Computer Vision Video Indexer Face Content Moderator Custom Vision Speech to Text Text to Speech Speaker Recognition Speech Translation Text Analytics Bing Spell Check Language Understanding Translator Text QnA Maker Bing Web Search ……… Cognitive Services 11 例えば
  • 13. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS (B) 既に提供されているAIを利用しよう。 利点 ・すぐに試すことができる ・精度が検証(確認)ができる ・費用が明確(従量課金が多い) ・上位のアプリケーションに直ぐに専念できる ・システムの価値が検証できる 12 (以上) ・自動的にAIバージョンアップ ・学習時/推論時に高価なGPUマシンが不要
  • 14. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS (人間) 人間とAIの比較 人が苦手な領域をAI化したほうが、成果はわかりやすい 13 映像・音声・文章等 の解析(理解)が得意 数値の羅列は苦手 (AI) 数値データの相関性 解析が得意 (それしかできない) AIは映像、音声等も数値データに置き換えている VS
  • 15. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS (B) (A) AI 構築 検証 評価 アプリケーション アプリケーション 検証 評価 PoC PoV (A) (B) 比較 (A)(B) 両方を検討すべき … … 14 独自のAIが作れる 直ぐにアプリが作れる 繰り返し
  • 16. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AI (Speech to Text) を利用した 文字起こしプラットホーム by Main Part 15 (B) Pattern
  • 17. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS Video file Audio file Overview Web Browser Drag & Drop SERVER Cloud Data Center On Premises (Services) AI Speech to Text Audio Only Web Browser results (input) 表示修正 Capture device Text results AI Translator 加工 加工 … input output 出力 CSV・SRT LIVEの場合、10~15秒遅れで字幕表示 16 HDMI/SDILive 多言語対応 (30言語) 音声解析 翻訳 Proxy
  • 18. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS Overview 17 Web BrowserJOIN-VIEW
  • 19. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS Demo デモをご覧ください 出典:首相官邸ホームページ https://www.kantei.go.jp/jp/98_abe/statement/2018/_00034.html 18 ③★U素材★ユニゾン偽アナウンサー (ファイル) ①★AZURE★安倍首相_明治150年式典(出展:首相官邸HP) ②★AZURE_BGM★安倍首相_明治150年式典(出展:首相官邸HP) End:20~25/30 ④★須山大阪弁風★明治150年式典
  • 20. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AIの精度 出典:首相官邸ホームページ 加工:右上にロゴをスーパーしています 平成30年10月23日 明治150年記念式典 安倍内閣総理大臣式辞 (例) 90.6% 正解率 245文字中 ミス:23文字 https://www.kantei.go.jp/jp/98_abe/statement/2018/_00034.html 今から150年前の今日 明治会見改元の詔勅が出されました。 この節目の日に 各階各界多数のご参列を得て、明治150年記念式典を挙行致しますことは、 誠に喜びに足り堪えないところであります。 皆様と共にワークに我が国が近代国家に向けて、歩み出した王子往時を思いそれを成し遂げた。明治の人々に ケイト敬意と 感謝を表したいとおもいます。 近代回化への道のりは大きな危機意識の中で、始まりました。 当時技術に先んじる列強が植民地支配おをすすめ その波がアジアにも押し寄せていました。 国力に遅れをとっていたワークに我が国はまさに 国家存亡の危機に直面していたと言っても過言ではありません 19 句読点を除く
  • 21. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AIの精度 BGM(-20dB) あり 出典:首相官邸ホームページ 加工:右上にロゴをスーパーしています 平成30年10月23日 明治150年記念式典 安倍内閣総理大臣式辞 (例) 84.1% 正解率 245文字中 ミス:39文字 https://www.kantei.go.jp/jp/98_abe/statement/2018/_00034.html 加工:BGMを付加しました 今から約150年前の今日も 明治会見改元の詔勅が出されました。この節目の日に書き換え各界多数のご参列を得て、明治150年に支店記念式典を 虚構挙行致しますことはまことに喜びに足り堪えないところであります。皆様と共に我が国が 近代国家でもに向けて歩み出した王子往時を思いそれを成し遂げた。明治の人々に敬意と感謝を表したいと思いましたす。 近代化への道のりは大きな品種危機意識の中で、始まりました。当時ニュース技術に先んじる。 ペット用列強が植民地支配おを勧進めその波がアジアにも星を捨押し寄せていました。 国力に遅れをとっていたworkに我が国はまさに国家存亡の危機に直面していたと言っても過言ではありません BGMの音量がある程度までは、比較的解析できるが、ある閾値を超えると、壊滅状態となる 20 句読点を除く BGMなし 90.6%
  • 22. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AIの精度 60%~95%日本語の場合 (殆ど無茶苦茶な場合もあります) ・声の大きさ ・声の強弱 ・話すスピード、単語間の無音の長さ ・読む > 話す > しゃべる の違い ・ノイズ、BGM等の背景音、エコー音、マイクの違い ・複数人での声の重なり ・方言、イントネーション、滑舌 ・外国の地名や人名、専門的な用語、珍しい単語 (辞書=Custom Speech等で改善は可能) ... 21 精度変化(低下)の主要因 音源によりバラバラな結果 素材毎に試さないと わからない 平均値は意味がない
  • 23. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS 文字起こし結果の修正 ・Timed Metadataとして検索のみに使用する場合は修正不要 ・文字起こしとしては 修正は必須 (100%の精度にはならない) いかに使い勝手よく修正できるアプリか (機能の一例) ・文章単位自動分離 ・文章の頭出し ・ループ再生 ・スロー等再生速度変更(音付き) ・音声波形表示 ・フレーム単位操作 ・タイムコード表示 ・文章の結合/分割 ・複数人同時修正 ・キーボードのみ (でも) 修正可能 22
  • 24. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS お問合せ ご質問等も大歓迎です。 是非、この後「個別相談ルーム」にお越し下さい。 23 デモの依頼も大歓迎です。 お問合せ egy-sls-ml@unixon.co.jp
  • 25. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS ご清聴ありがとうございました 24