1. S t r i c t l y C o n f i d e n t i a l
Strictly Confidential
Hmcommは、3つの⾳音声認識識サービスを提供
クラウドソーシング型
⽂文字起こし
法⼈人向け
クラウド/オンプレミス
Youtube字幕化&
動画検索索プラットフォーム
×
2. S t r i c t l y C o n f i d e n t i a l
1
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
01 会社概要
3. S t r i c t l y C o n f i d e n t i a l
社名 Hmcomm株式会社
所在地 東京都渋⾕谷区恵⽐比寿南1-1-1 HumaxEbisu8階
URL http://www.hmcom.co.jp/
設⽴立立 2012 年年 7 ⽉月
代表者
技術顧問
代表取締役社⻑⾧長 三本 幸司
緒⽅方 淳(産総研主任研究員 博⼠士)
事業内容 産業総合研究所 ベンチャー企業
・⾳音声認識識エンジンを⽤用いた要素技術の開発
ソリューション、サービスの提供
拠点 中国オフィス
Room 1113, Zhongguancun Venture Building,No.26 Shangdi Information Road,Haidian District,
Beijing, China
インドオフィス
Surabha complex, #5,A M Industrial Estate,Hosur road,Bangalore -‐‑‒560 068.India.
取引銀⾏行行 三菱菱東京UFJ銀⾏行行
横浜銀⾏行行
新⽣生銀⾏行行
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved 2
4. S t r i c t l y C o n f i d e n t i a l
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
所属団体
パートナー
⼀一般社団法⼈人TXアントレプレナーパートナーズ(TEP)
クラウドソーシング協会
モバイルコンピューティング推進コンソシアム(MCPC)
九州組込みソフトウェアコンソーシアム(QUEST)
東京都ビジネスサービス株式会社
⼀一般社団法⼈人セカンドライフファクトリー
株式会社グローバルソフトウェア
かもめエンジニアリング株式会社
株式会社 科学情報システムズ
公益社団法⼈人 柏市シルバー⼈人材センター
3
5. S t r i c t l y C o n f i d e n t i a l
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved 3
×
6. S t r i c t l y C o n f i d e n t i a l
5
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
02 事業概要
7. S t r i c t l y C o n f i d e n t i a l
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved 6
事業概要
1.事業⽬目的
ICT技術の適⽤用により、従来⼈人⼿手に頼っていた⾮非構造化データの構造化作業の⾃自動化を⾏行行う
2.技術内容
①動画・⾳音声コンテンツ中の⾳音声データをテキスト化する産総研独⾃自の⾳音声認識識技術
②上記①を⾼高度度するため、インターネット上の⾮非構造データを⾃自動学習しシステムを
⽇日々⾃自動更更新し⾼高性能化を実現する⾳音声認識識学習技術
③上記②の⾳音声認識識結果をブラウザ上に表⽰示し、複数ユーザーによる⾳音声認識識結果の修正を
可能にするユーザー・インターフェース技術
④上記③のユーザーからの修正結果をもとに、⾳音声認識識システムを学習し⾼高性能化を実現する
⾳音声認識識学習技術
⑤動画・⾳音声コンテンツ中の⾳音声データをテキスト化し、コンテンツファイルメタ情報の更更新
を⾏行行い、情報検索索する技術
⑥動画・⾳音声コンテンツ中の⾳音声データをテキスト化し、字幕⽣生成を⾃自動で⾏行行う技術
3.事業内容
上記技術を⽤用いることにより
膨⼤大な動画・⾳音声コンテンツのテキスト化及び、情報管理理/情報検索索を可能にする
①クラウドソーシングサービス (⾳音声認識識+⼈人⼒力力)の提供 (TheVoice)
②⾳音声情報処理理システムのクラウドサービス(Saas型)の提供(vBox)
③法⼈人向けサービス(Enterprise Edition)
⾮非構造化データの構造化によりビッグデータ時代に貢献すること(⽇日本語語彙数No.1を⽬目指す)
8. S t r i c t l y C o n f i d e n t i a l
7
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
Hmcommは
⾳音声認識識をフルにお使いいただくために以下の3つのサービスを提供しています
クラウドソーシング型
⽂文字起こし
インターネットサービスにて低価格・短納期
⾼高品質を実現させた「クラウドソーシングサービ
ス (⾳音声認識識+⼈人⼒力力)」
法⼈人向け
クラウド/オンプレミス
(クラウド/オンプレミス)での暗号化機能や端末認証
機能など、ビジネス利用時のセキュリティも確保。
Youtube字幕化&
動画検索索プラットフォーム
Vbox にあなたの「動画」「録音データ」を保存すると
、ファイルはすべて自動的に、音声認識が実行さ
れて、テキスト化が行われます。これらを利用して、
動画や音声ファイルを検索したり、字幕を付けたり、
好みの場所から再生したり、文字を起こしたりするこ
とが可能となります。
9. S t r i c t l y C o n f i d e n t i a l
サービス概要①:クラウドソーシングサービス
インターネットサービスにて低価格・短納期・⾼高品質を実現させた
「クラウドソーシングサービス (⾳音声認識識+⼈人⼒力力) 」
【ポイント】
・機械+⼈人
・6,000円/1時間でサービスの提供・通常納期24時間以内の実現 (⽬目標)
*1) 産総研独⾃自の⾳音声認識識エンジンにて⼀一般、専⾨門語彙をあげることにより実現
クラウド(=Crowd(群衆)サービス)によるビジネスの提供
8
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
10. S t r i c t l y C o n f i d e n t i a l
サービス概要①:クラウドソーシングサービス
クラウド(=Crowd(群衆)サービス)によるビジネスの提供
9
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
https://thevoice.hmcom.co.jp/
11. S t r i c t l y C o n f i d e n t i a l
サービス概要②:クラウドサービス
・・・Dropboxの⾳音声/動画ファイル版の世界観・・・
10
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
Vbox :
Vbox にあなたの「動画」「録⾳音データ」を保存すると、ファイルはすべて⾃自動
的に、⾳音声認識識が実⾏行行されて、テキスト化が⾏行行われます。これらを利利⽤用して、
動画や⾳音声ファイルを検索索したり、字幕を付けたり、お好みの場所から再⽣生し
たり⽂文字を起こしたりすることが可能となります。
https://vbox.hmcom.co.jp/
12. S t r i c t l y C o n f i d e n t i a l
コンセプトサービス概要②:クラウドサービス
・・・Dropboxの⾳音声/動画ファイル版の世界観・・・
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
13. S t r i c t l y C o n f i d e n t i a l
12
2. 音声認識実施
4. 訂正結果を自動学習
1. 会話音声を登録
お客様
文字起こし
担当者
事例:企業様内の機密性の高い会話ログの作成システムとして、オンプロミスで導入
お客様自身で訂正を実施。(識字率90%以上を検収条件としクリア)
3. 音声認識結果を訂正
定期:Web上のデータを自動収集
お客様ネットワーク内
・ オンプレミスでも、機能制限はございません。
・ 外部からのアクセスはブロック。セキュリティリスクの心配がありません。
・ 過去の会話ログを用いてお客様専用の言語・音響モデルにカスタマイズいたします。
言語・音響
モデル
プライベートクラウド(オンプレミス)による企業内へのシステム提供
サービス概要③:法⼈人向けサービス
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
14. S t r i c t l y C o n f i d e n t i a l
企業様社内LAN
13
Download
音声認識
機械学習
Upload
Upload
Export
保存
Import
音声認識
Webサーバ
音声認識
サーバ
企業様
CRMサーバ
csv
csv
csv
音声ファイル
音声認識結果ファイル
データベース
CRM向けcsvファイル
Internet(http
s)
発話
Upload
結果表示
SmartPhon
e
データ移動
データ加工
プロセス
データ一時利用
3:デモについて
ローカルLAN接続
サービス概要③:法⼈人向けサービス(事例例①)
プライベートクラウド(オンプレミス)による企業内へのシステム提供
15. S t r i c t l y C o n f i d e n t i a l
05 技術競争力(強み)
14
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
16. S t r i c t l y C o n f i d e n t i a l
技術競争⼒力力(強み)
15
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
「最先端の⾳音声認識識技術」を実⽤用化
⾳音声認識識はまだまだ発展途上の技術であり、現在も⽇日進⽉月歩で研究開発、技術
⾰革新が進んでいます。研究現場で培われている最先端の⾳音声認識識技術を積極的
に導⼊入しました。そのためTheVoiceでは、AIST(独⽴立立⾏行行政法⼈人 産業技術総
合研究所)の研究開発成果を活⽤用するとともに、強固なパートナーシップを通
じて技術的⾼高度度化に取り組んでいます。
・マーケット動向
・技術・製品開発
・製品バージョンUP
・音声認識技術の
基礎研究開発
17. S t r i c t l y C o n f i d e n t i a l
• スマートフォン上から独⾃自アプリを⽤用いて、場所を選ばず⼿手軽に⾳音声を⼊入⼒力力
することが可能です。
• ⾳音声認識識結果の編集(認識識誤りの訂正)のための独⾃自の直感的なインタ
フェースを実現しており、効率率率的かつ迅速な情報⼊入⼒力力が可能です。
• ⾳音声認識識結果はWebブラウザ上で共有することができ、過去の⾳音声データの
検索索、さらに不不特定多数のユーザでの⾳音声書き起こし(議事録作成)が可能
です。
• 訂正⼊入⼒力力での⾳音声再⽣生では、スロー再⽣生や早送り再⽣生機能も備えており、
⼊入⼒力力の効率率率向上を実現しています。
⾳音声録⾳音、編集等、直感的で使いやすいユーザインタフェースを搭載
技術競争⼒力力(強み)
16
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
18. S t r i c t l y C o n f i d e n t i a l
• 認識識誤りの訂正学習(機械学習技術)により、使えば使うほど性能が
向上します。
• 使⽤用頻度度の⾼高い単語や⽂文章の学習だけでなく、発声者の声質の学習も
同時に⾏行行います。
• また、複数ユーザーでの訂正学習により、認識識率率率向上の進化度度が
加速的に向上します。
• 訂正学習は外部サーバに接続することなく、社内で閉じた形で⾏行行うことが
可能です。
corrected
corrected
corrected
社内ネットワーク
TheVoiceサーバ
TheVoice音声認識
学習
使えば使うほど進化する⾳音声認識識
技術競争⼒力力(強み)
17
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
19. S t r i c t l y C o n f i d e n t i a l
• 指定のWeb上のデータを取り込むことができ、時事⽤用語などタイムリーな情
報のアップデートを実現しています。
• これにより、⾳音声認識識の内部知識識を最新の状態に保つことができます。
• また、お客様の社内電⼦子データの取り込み、学習も可能です。
取り込み先Webサイトの例:
Yahoo!ニュース
日本金融通信社 ニッキン
最新の⽤用語・⽂文章の⾃自律律的な学習による⾳音声認識識の⾃自動アップデート
技術競争⼒力力(強み)
18
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
20. S t r i c t l y C o n f i d e n t i a l
顧客が他ではなくて、この商品を買うべき理理由①
サービス競争⼒力力(強み)
19
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
①「⾮非構造化データ(⾳音声/動画)の新たな価値創出」で問題を抱えている
②「⾮非構造データの情報管理理、情報検索索、情報分析」をしたいと思っている⼈人たち向けの
③「⾳音声/動画コンテンツ中の⾳音声データをテキスト化するサービス」であり
④「クラウドサービスで誰でも、どこでも、正確にテキスト化」することができる
⑤そして「他社の⾳音声認識識エンジン、テープ起こし会社」と違って
⑥この製品は「Saas型で分単位の課⾦金金」「⼈人⼒力力+機械(独⾃自のクラウドソーシング)でス
ケーラブルで
正確かつ素早い納品を実現」「APIを通して他クラウドサービスと連携アクセスできる」機能
を兼ね備えている
21. S t r i c t l y C o n f i d e n t i a l
顧客が他ではなくて、この商品を買うべき理理由②
サービス競争⼒力力(強み)
20
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
①「レコーダー機器の録⾳音データの取り扱い」で問題を抱えている
②「録⾳音データの管理理、書き起こし」をしたいと思っている⼈人たち向けの
③「録⾳音データをテキスト化するサービス」であり
④「専⽤用のスマホアプリで録⾳音することにより、誰でも、どこでも、いつでも
正確にテキスト化」することができる
⑤そして「他社の⾳音声認識識エンジン、テープ起こし会社」と違って
⑥この製品は「⾃自分の録⾳音データ全てを保存できる記憶容量量」「⼈人⼒力力+機械(独⾃自のクラウド
ソーシング)でスケーラブルで正確かつ素早い納品を実現」「APIを通して他クラウドサー
ビスと連携アクセスできる」
機能を兼ね備えている
22. S t r i c t l y C o n f i d e n t i a l
• 様々な業界に特化した⾳音声認識識辞書をご⽤用意しています。
• 既存の辞書をベースにお客様に特化した⾳音声認識識辞書のカスタマイズが⾏行行え
ます。部署毎や顧客毎など、カスタマイズは⾃自由に⾏行行えます。
• ⾳音声認識識を⾏行行う際に、⾳音声に適した辞書を選択することが可能です。
金融
医療
物流
IT
××システ
ム様
□□運送
様
〇〇銀行
様
△△病院
様
音声認識辞書
顧客毎の辞書
⾳音声認識識辞書のカスタマイズ
技術競争⼒力力(強み)
21
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
23. S t r i c t l y C o n f i d e n t i a l
06 特許
22
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
24. S t r i c t l y C o n f i d e n t i a l
特許
1.「⾳音声認識識装置及び⽅方法ならびにプログラム」
u 登録番号 特開2006-‐‑‒146008/特許4604178
u ⾳音声認識識結果の提⽰示・訂正インタフェースに関する特許
u ⾳音声認識識による認識識誤りを、ユーザがより効率率率的で容易易に訂正できる新たな⾳音声⼊入⼒力力インタフェース「⾳音声訂
正」を発明した。⾳音声訂正では、ユーザが⾳音声⼊入⼒力力を開始すると、認識識結果を単語ごとに区切切った表⽰示が発話
の最中から次々と画⾯面に描画される。同時に、区切切られた各区間の他候補(競合候補)も常に列列挙されていく。
ここで、競合候補の個数はその区間の曖昧さを反映しており、 ⾳音声認識識器にとって曖昧で⾃自信がない箇所ほ
ど、多数の候補が表⽰示される。ユー ザはそれを⾒見見ながら、発話中あるいは発話終了了後に正しい候補を選択す
るだけ で訂正ができる。
2.「⾳音声データ検索索⽤用WEBサイトシステム」
u 登録番号 特開2008-‐‑‒158511/特許4997601
u PodCastle Webシステム全体、検索索・閲覧・訂正機能に関する特許
u Web上の⾳音声データを⾳音声認識識によって⾃自動的にテキスト化することで,それらをユーザが全⽂文検索索できるだけ
ではなく,詳細な閲覧,編集も可能なシステム「PodCastle」を発明した.PodCastleでは,検索索した⾳音声デー
タの全⽂文をテキスト表⽰示することで,⾳音声再⽣生環境がなければ内容を把握できない⾳音声データを「読む」ことも
可能にする.また,PodCastleでは,ユーザが認識識結果を直接編集(訂正)する機能を持っており,これにより,
⾳音声データのより正確な検索索,閲覧が実現できる.
3.「⾳音声認識識システム及び⾳音声認識識システム⽤用プログラム」
u 登録番号 特開2008-‐‑‒158510/特許5366169
u PodCastle⾳音声認識識・学習⼿手法に関する特許
u ⾳音声認識識による認識識誤りをユーザが訂正し,その結果を利利⽤用することにより⾳音声認識識性能を向上させる⼿手法を発
明した.本⼿手法では,誤りを起こした発声区間の発⾳音系列列(⾳音素列列)を⾳音素を認識識単位とした特殊な⾳音声認識識器に
より⾃自動推定し,その実際の発⾳音系列列と正解単語の対応を辞書に追加登録する.こうすることで,同じように変
形した発声に対して辞書が適切切に参照でき,同じ誤認識識の発⽣生を防ぐことができる.また,ユーザがタイプして
訂正した,事前に辞書に登録されていなかった単語(未知語)も認識識できるようになる.
23
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
25. S t r i c t l y C o n f i d e n t i a l
07 ニュース
24
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
26. S t r i c t l y C o n f i d e n t i a l
リリース
25
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
27. S t r i c t l y C o n f i d e n t i a l
リリース
26
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
28. S t r i c t l y C o n f i d e n t i a l
27
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved
08 Appendix
29. S t r i c t l y C o n f i d e n t i a l
集積回路上のトランジスタの数は
18ヵ月毎に倍になる。
30. S t r i c t l y C o n f i d e n t i a l
情報量
1999年末までに、人類が30万年かけて蓄積した全情報
12EB(エクサバイト)
2020年には35ZB(ゼッタバイト)
31. S t r i c t l y C o n f i d e n t i a l
ヨッタバイト(Yottabyte) [ 1,000,000,000,000,000,000,000,000 バイト あるいは 1024 バイト]
66 ゼッタバイト:全人類の目から脳に伝えられる視覚情報の1年間の量
1.8 ゼッタバイト:世界中の砂浜の砂の数
ゼッタバイト(Zettabyte) [ 1,000,000,000,000,000,000,000 バイト あるいは 1021 バイト ]
175 エクサバイト:2010年の1年間にインターネットに流れたデータの量
5 エクサバイト:今まで人間によって話されたすべての言葉
2 エクサバイト:年間に世界中から集められた全情報量
エクサバイト(Exabyte) [ 1,000,000,000,000,000,000 バイト あるいは 1018 バイト]
200 ペタバイト:全ての印刷物
8 ペタバイト:ウェブで利用できる全ての情報
2 ペタバイト:全米の大学研究図書
1 ペタバイト:3 年間の地球観測システム(Earth Observing System :EOS )データ(2001 年)
ペタバイト(Petabyte) [ 1,000,000,000,000,000 バイト あるいは 1015 バイト]
400 テラバイト:国立気象データセンター(National Climatic Data Center : NOAA )データベース
50 テラバイト:大容量ストレージシステムに蓄積された情報量
10 テラバイト:米国連邦議会図書館(U.S. Library of Congress )の収蔵図書
2 テラバイト:大学の研究図書
1 テラバイト:50,000 本相当の木を紙に加工しこれに印刷された情報量
喜連川優「情報爆発のこれまでとこれから」,電子情報通信学会誌,Vol.94,No8,2011
32. S t r i c t l y C o n f i d e n t i a l
構造化、⾮非構造化データの分析のニーズ
31
33. S t r i c t l y C o n f i d e n t i a l
ガートナーのハイプサイクル(2013年年)
今、売るべき技術 ガートナーはハイプ・サイクルを⽤用いて、
新技術の登場によって⽣生じる過度度の興奮
や誇張(hype、ハイプ)、そしてそれに
続く失望を説明している。それはまた、
技術がいかにしてそしていつ次の段階に
進み、実際に利利益を⽣生み出し、そして広
範に受け⼊入れられるか、も⽰示す。ガート
ナーの唱えるハイプ・サイクルの⽬目的は、
現実から誇張(ハイプ)を切切り離離すこと
により、CIOやCEOが特定技術の採⽤用可
否を判断できるようにすることである。
4.マシンによる⼈人と環境の認識識⼒力力向上
⽣生体⾳音センサ、スマート・ダスト、⾃自⼰己
の量量的観測(QS)、ブレーン・コン
ピュータ・インタフェース、アクティ
ブ・コンピューティング、バイオチップ、
3Dスキャナ、⾃自然⾔言語質疑応答
(NLQA)、コンテンツ分析、モバイル・
ヘルス・モニタリング、ジェスチャーコ
ントロール、⾳音声認識識などがある
34. S t r i c t l y C o n f i d e n t i a l
33
■本ご提案書のお取り扱いについての注意事項
1.本ご提案書は、弊社が独⾃自に調査・収集した情報ならびに弊社が独⾃自に考案した財産的価値がある情報を含んでおります。従って、本ご提案
書および内容は、弊社へのご発注の可否をご検討していただくための、貴社の内部資料料としてのみご利利⽤用ください。なお、弊社の事前の承諾諾
を得ることなく、本ご提案書の内容を第三者に開⽰示・漏漏洩することは禁⽌止いたします。
2.本ご提案書は、貴社からご提供された資料料または情報の部分を除き、著作物としての権利利は弊社に帰属いたします。
3.本ご提案書は、貴社が有する機密情報と同程度度の注意義務をもって保管・管理理するものとし、弊社へのご発注がいただけない場合は、ご返却
していただくか、または裁断・焼却等の廃棄処置をご実施ください。
4.万⼀一、貴社が本注意事項の定めに違反したことにより弊社が損害を被った場合、弊社は、その損害を貴社にご請求できるものといたします。
■本ご提案書に関するお問い合わせは、下記までお願い申し上げます。
Hmcomm株式会社
三本 幸司
〒105-‐‑‒0004 東京都港区新橋2-‐‑‒20-‐‑‒15 新橋駅前ビル1号館 4階
Mail-‐‑‒Address: koji.mitsumoto@hmcom.co.jp
Hmcomm Inc,
http://www.hmcom.co.jp/
Copyright (c) 2015 Hmcomm Inc. All Rights Reserved