Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Upcoming SlideShare
What to Upload to SlideShare
What to Upload to SlideShare
Loading in …3
×
1 of 25

AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用

1

Share

Download to read offline

Cognitive Service を活用した、文字起こしアプリケーションのご紹介と、機械学習アプリケーションとの向き合い方のご紹介
by ユニゾンシステムズ須山さん

Related Books

Free with a 30 day trial from Scribd

See all

Related Audiobooks

Free with a 30 day trial from Scribd

See all

AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用

  1. 1. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AI for Media 2018 Update ~メディア業界のための AI との付き合い方~ 2018/12/10 株式会社ユニゾンシステムズ
  2. 2. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS スピーチ AI を活用した 文字起こしプラットホームの活用 1 SESSION TITLE 自己紹介 株式会社ユニゾンシステムズ 取締役CTO R&D本部長 須山 佳典 (programmer) M3 大阪府柏原市出身
  3. 3. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS 社 名 株式会社ユニゾンシステムズ UNIXON SYSTEMS CO.,LTD 本 社 〒810-0062 福岡市中央区荒戸2-1-5 大濠公園ビル3F 東 京 支 社 〒105-0012 東京都港区芝大門2-11-1 富士ビル6F 設 立 1991年11月15日 資 本 金 5千万円 代 表 取 締 役 今村勉也 従 業 員 数 70名 (2018/10/1現在) C o m p a n y P r o f i l e 会社概要 創業28年目 福岡に本社を置く ソフトウェア開発会社です。 2
  4. 4. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMSC o m p a n y P r o f i l e 会社概要 3 先駆者、革新者、ベストパートナーたれ 革新的な技術で世界中の 世の中にないものを創り出し、世界をアッと驚かしてみよう。
  5. 5. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMSP r o d u c t s 主要製品 メディア業界様 向け ソフトウェアの開発 4 本日
  6. 6. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS 「AI」 について THEME ~メディア業界のための AI との付き合い方~ AIに詳しい皆様、すいません、初歩的な内容です 5
  7. 7. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AI化対象 プログラムの一部が 「AI」はプログラムを自動で作ってくれる? 表示 (画面) 入 力 受信 表示 (画面) 出 力 何か 処理 送信 格納 DATA プログラム(1つの機能)の基本パターン 解析 6 全体で1つのプログラム
  8. 8. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS 正規化:データを使いやすく整形する事 解 析 情報の数値化/正規化/加工 入力情報(群) 分析 ・計算 ・条件分岐 結果 「解析」の中身 ・業務ノウハウ/情報の理解 ・試験データの入手 ・データ構造/相関性解析 ・プログラミング ・推論/結果の説明 ・根気と根性 ・パズルゲーム好き スペシャル プログラマー 7 プログラム AI = AIは情報を理解しない
  9. 9. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AIを使って何かをしよう! AI自体(モデル)を 作って 学習をさせよう。 既に提供されている AIを 利用しよう。 (A) (B) 大きく2つの道 (他にもたくさんの方法がありますが…) 8 働き方改革の一環で
  10. 10. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS (A) AI自体(モデル)を作って学習もさせよう。 AI モデル 学習データ 様々な情報 結果(答え) 数値化/正規化/加工 … (入力) (出力) 100%の信頼度 CNN RNN LSTM … 数字を入れたら 数字がでてくる 100%の信頼度ではない (教師付き学習の場合) プログラム 「数値」をいれたら「数値」=「答え」が出てくる装置がAI その装置を「プログラミング」ではなく「学習」によって作り上げる (計算と条件分岐) 9
  11. 11. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS (A) AI自体(モデル)を作って学習もさせよう。 注意点 ・モデル作成者(AIベンダー)と、学習データ準備側 (発注者?)側の役割分担/責任分界点(判断しにくい) ・入力データの数値化/正規化/加工は誰がするのか ・事前に精度(信頼度)の定義は難しい ・決して高めの精度(信頼度)目標は設定しない (稟議は通せても後で苦しい) ・精度が高くなくても、AIが使える方法を検討 ・本当にそれをするにはAIが必要なのか/AIは得意な内容か ・お金は続くのか(いくらかかるのか) ・上位/下位のアプリケーション(入力/表示部分)を忘れずに ・学習用データの数、バラエティは十分に準備できるか 10
  12. 12. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS (B) 既に提供されているAIを利用しよう。 AI (Service) 情報 結果 既に出来上がっているサービス等 Computer Vision Video Indexer Face Content Moderator Custom Vision Speech to Text Text to Speech Speaker Recognition Speech Translation Text Analytics Bing Spell Check Language Understanding Translator Text QnA Maker Bing Web Search ……… Cognitive Services 11 例えば
  13. 13. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS (B) 既に提供されているAIを利用しよう。 利点 ・すぐに試すことができる ・精度が検証(確認)ができる ・費用が明確(従量課金が多い) ・上位のアプリケーションに直ぐに専念できる ・システムの価値が検証できる 12 (以上) ・自動的にAIバージョンアップ ・学習時/推論時に高価なGPUマシンが不要
  14. 14. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS (人間) 人間とAIの比較 人が苦手な領域をAI化したほうが、成果はわかりやすい 13 映像・音声・文章等 の解析(理解)が得意 数値の羅列は苦手 (AI) 数値データの相関性 解析が得意 (それしかできない) AIは映像、音声等も数値データに置き換えている VS
  15. 15. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS (B) (A) AI 構築 検証 評価 アプリケーション アプリケーション 検証 評価 PoC PoV (A) (B) 比較 (A)(B) 両方を検討すべき … … 14 独自のAIが作れる 直ぐにアプリが作れる 繰り返し
  16. 16. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AI (Speech to Text) を利用した 文字起こしプラットホーム by Main Part 15 (B) Pattern
  17. 17. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS Video file Audio file Overview Web Browser Drag & Drop SERVER Cloud Data Center On Premises (Services) AI Speech to Text Audio Only Web Browser results (input) 表示修正 Capture device Text results AI Translator 加工 加工 … input output 出力 CSV・SRT LIVEの場合、10~15秒遅れで字幕表示 16 HDMI/SDILive 多言語対応 (30言語) 音声解析 翻訳 Proxy
  18. 18. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS Overview 17 Web BrowserJOIN-VIEW
  19. 19. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS Demo デモをご覧ください 出典:首相官邸ホームページ https://www.kantei.go.jp/jp/98_abe/statement/2018/_00034.html 18 ③★U素材★ユニゾン偽アナウンサー (ファイル) ①★AZURE★安倍首相_明治150年式典(出展:首相官邸HP) ②★AZURE_BGM★安倍首相_明治150年式典(出展:首相官邸HP) End:20~25/30 ④★須山大阪弁風★明治150年式典
  20. 20. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AIの精度 出典:首相官邸ホームページ 加工:右上にロゴをスーパーしています 平成30年10月23日 明治150年記念式典 安倍内閣総理大臣式辞 (例) 90.6% 正解率 245文字中 ミス:23文字 https://www.kantei.go.jp/jp/98_abe/statement/2018/_00034.html 今から150年前の今日 明治会見改元の詔勅が出されました。 この節目の日に 各階各界多数のご参列を得て、明治150年記念式典を挙行致しますことは、 誠に喜びに足り堪えないところであります。 皆様と共にワークに我が国が近代国家に向けて、歩み出した王子往時を思いそれを成し遂げた。明治の人々に ケイト敬意と 感謝を表したいとおもいます。 近代回化への道のりは大きな危機意識の中で、始まりました。 当時技術に先んじる列強が植民地支配おをすすめ その波がアジアにも押し寄せていました。 国力に遅れをとっていたワークに我が国はまさに 国家存亡の危機に直面していたと言っても過言ではありません 19 句読点を除く
  21. 21. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AIの精度 BGM(-20dB) あり 出典:首相官邸ホームページ 加工:右上にロゴをスーパーしています 平成30年10月23日 明治150年記念式典 安倍内閣総理大臣式辞 (例) 84.1% 正解率 245文字中 ミス:39文字 https://www.kantei.go.jp/jp/98_abe/statement/2018/_00034.html 加工:BGMを付加しました 今から約150年前の今日も 明治会見改元の詔勅が出されました。この節目の日に書き換え各界多数のご参列を得て、明治150年に支店記念式典を 虚構挙行致しますことはまことに喜びに足り堪えないところであります。皆様と共に我が国が 近代国家でもに向けて歩み出した王子往時を思いそれを成し遂げた。明治の人々に敬意と感謝を表したいと思いましたす。 近代化への道のりは大きな品種危機意識の中で、始まりました。当時ニュース技術に先んじる。 ペット用列強が植民地支配おを勧進めその波がアジアにも星を捨押し寄せていました。 国力に遅れをとっていたworkに我が国はまさに国家存亡の危機に直面していたと言っても過言ではありません BGMの音量がある程度までは、比較的解析できるが、ある閾値を超えると、壊滅状態となる 20 句読点を除く BGMなし 90.6%
  22. 22. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS AIの精度 60%~95%日本語の場合 (殆ど無茶苦茶な場合もあります) ・声の大きさ ・声の強弱 ・話すスピード、単語間の無音の長さ ・読む > 話す > しゃべる の違い ・ノイズ、BGM等の背景音、エコー音、マイクの違い ・複数人での声の重なり ・方言、イントネーション、滑舌 ・外国の地名や人名、専門的な用語、珍しい単語 (辞書=Custom Speech等で改善は可能) ... 21 精度変化(低下)の主要因 音源によりバラバラな結果 素材毎に試さないと わからない 平均値は意味がない
  23. 23. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS 文字起こし結果の修正 ・Timed Metadataとして検索のみに使用する場合は修正不要 ・文字起こしとしては 修正は必須 (100%の精度にはならない) いかに使い勝手よく修正できるアプリか (機能の一例) ・文章単位自動分離 ・文章の頭出し ・ループ再生 ・スロー等再生速度変更(音付き) ・音声波形表示 ・フレーム単位操作 ・タイムコード表示 ・文章の結合/分割 ・複数人同時修正 ・キーボードのみ (でも) 修正可能 22
  24. 24. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS お問合せ ご質問等も大歓迎です。 是非、この後「個別相談ルーム」にお越し下さい。 23 デモの依頼も大歓迎です。 お問合せ egy-sls-ml@unixon.co.jp
  25. 25. Copyright© 2018 UNIXON SYSTEMS CO.,LTD. All Rights Reserved. UNIXON SYSTEMS ご清聴ありがとうございました 24

×