SlideShare a Scribd company logo
1 of 11
Web Audio API
と IBM Watson Speech to Text API の話
@ VoiceWorld Z vol.2
#voiceworldz
自己紹介
本アイ・ビー・エム クラウドエバンジェリスト
witter: @dotnsf
og: http://dotnsf.blog.jp/
mail: dotnsf@jp.ibm.com
趣味: マンホール
木村 桂(きむら けい)
プログラマー
マンホールマップ : http://manholemap.juge.me/
#voiceworldz
Web Audio API
• W3C 勧告候補 (2018/Sep/18)
• Web アプリケーションにおけるオーディオの処理および合成に
関する高レベルの JavaScript API
https://www.w3.org/TR/webaudio/
#voiceworldz
Web Audio API を超簡単に説明する
と・・
• 音声操作をオーディオコンテキスト操作として実現した API
• 入力元と出力先をつなげたり、途中でエフェクトをかけたり、
データを取り出したりする
① オーディオコンテキスト生成
② オーディオソースを指定 ④ 出力先を指定
③ エフェクタを指定
⑤ ソースとエフェクタを接続 ⑥ エフェクタと出力先を接続
#voiceworldz
例えば・・・ (その1)
• オーディオファイルをスピーカーから再生
① オーディオコンテキスト生成
② オーディオソースを指定 ④ 出力先を指定
③ エフェクタを指定
⑤ ソースとエフェクタを接続 ⑥ エフェクタと出力先を接続
#voiceworldz
オーディオファイル操作時の大まかな流
れ
// オーディオコンテキストの生成
var audio_context = new AudioContext();
//. Files API でオーディオファイルの読み込み
var file = "sample.mp3";
var reader = new FileReader();
reader.onload = function(){
var arrayBuffer = reader.result;
audio_context.decodeAudioData( arrayBuffer, function( audioBuffer ){
var source = audio_context.createBufferSource();
source.buffer = audioBuffer;
source.connect( audio_context.destination ); //. 標準オーディオ出力に接続
source.start( 0 ); //. 最初から再生
});
};
reader.readAsArrayBuffer( file );
http://dotnsf.blog.jp/archives/1072420283.html
#voiceworldz
例えば・・・ (その2)
• マイクから入力した音声データを取り出す
① オーディオコンテキスト生成
② オーディオソースをマイクに指定 ④ 出力先ファイルを指定
③ エフェクタを指定
⑤ ソースとエフェクタを接続 ⑥ エフェクタと出力先を接続
#voiceworldz
マイク操作時の大まかな流れ
// オーディオコンテキストの生成
var audio_context = new AudioContext();
// 標準メディアデバイス(マイク・スピーカー)の取得
Navigator.mediaDevices.getUserMedia( { audio: true } ).then( function( stream ){
// メディアストリームの作成
var media_stream = audio_context.createMediaStream( stream );
var processor = audio_context.createScriptProcessor( 1024, 1, 1 );
media_stream.connect( processor );
processor.onaudioprocess = function( e ){
// 音声データ
var inputdata = e.inputBuffer.getChannelData( 0 );
:
};
processor.connect( audio_context.destination );
});
http://dotnsf.blog.jp/archives/1072473945.html
#voiceworldz
例えば・・・ (その2の応用)
• 取り出した音声データをテキスト化する
① オーディオコンテキスト生成
② オーディオソースをマイクに指定 ④ 出力先ファイルを指定
③ エフェクタを指定
⑤ ソースとエフェクタを接続 ⑥ エフェクタと出力先を接続
⑦Speech to Text 機能で
 音声→テキストにして取り出す
IBM Watson
#voiceworldz
IBM Watson Speech to Text API
https://www.ibm.com/watson/jp-ja/developercloud/speech-to-text.html
音声データをテキストに変換(言語指定可能)
ライトプラン有り(1ヶ月あたり 100 分まで無料)
主な用途
・コールセンターのオペレーター音声の解析
・会議における発言のテキスト化
・音声操作時の中間処理
・電話の自動応答システム
・メディアファイルからの書き起こし など
#voiceworldz
【告知】 IBM Cloud Community Summit
2018 【 12/8 】
https://bmxug.connpass.com/event/105149/ https://bmxug.connpass.com/event/110051/
IBM Cloud ユーザーコミュニティ主催の年イチイベン
IBM Cloudant の細かすぎて伝わりにくい機能(その
2)
ブロックチェーン体験ハンズオン(先着順)

More Related Content

Similar to Web Audio API と IBM Watson Speech to Text の話

AudioとガジェットをWebで遊ぶ - Web Audio/MIDI Web Bluetooth -
AudioとガジェットをWebで遊ぶ - Web Audio/MIDI Web Bluetooth -AudioとガジェットをWebで遊ぶ - Web Audio/MIDI Web Bluetooth -
AudioとガジェットをWebで遊ぶ - Web Audio/MIDI Web Bluetooth -Ryoya Kawai
 
Speech API の概要(Microsoft Cognitive Services)
Speech API の概要(Microsoft Cognitive Services)Speech API の概要(Microsoft Cognitive Services)
Speech API の概要(Microsoft Cognitive Services)Atsushi Yokohama (BEACHSIDE)
 
TypeTalks第10回「もっと知りたい!Webフォント」
TypeTalks第10回「もっと知りたい!Webフォント」TypeTalks第10回「もっと知りたい!Webフォント」
TypeTalks第10回「もっと知りたい!Webフォント」Kosuke Yamada
 
AI先生と外国語会話を練習しよう!
AI先生と外国語会話を練習しよう!AI先生と外国語会話を練習しよう!
AI先生と外国語会話を練習しよう!K Kimura
 
Data API + AWS = (CMS どうでしょう 札幌編)
Data API + AWS =  (CMS どうでしょう 札幌編)Data API + AWS =  (CMS どうでしょう 札幌編)
Data API + AWS = (CMS どうでしょう 札幌編)Yuji Takayama
 
HTML5から始まる技術革新
HTML5から始まる技術革新HTML5から始まる技術革新
HTML5から始まる技術革新Wakasa Masao
 
HTML5とWeb開発に関する最新動向
HTML5とWeb開発に関する最新動向HTML5とWeb開発に関する最新動向
HTML5とWeb開発に関する最新動向Shumpei Shiraishi
 
スマホアプリ開発者のためのWeb api開発入門の入門
スマホアプリ開発者のためのWeb api開発入門の入門スマホアプリ開発者のためのWeb api開発入門の入門
スマホアプリ開発者のためのWeb api開発入門の入門Kenyu Miura
 
HTML5など社内勉強会 Vol.11 - High Performance Web and iOS 6 WebKit
HTML5など社内勉強会 Vol.11 - High Performance Web and iOS 6 WebKitHTML5など社内勉強会 Vol.11 - High Performance Web and iOS 6 WebKit
HTML5など社内勉強会 Vol.11 - High Performance Web and iOS 6 WebKitGeorge Harada
 
AngularとWeb Audio APIはじめてみました
AngularとWeb Audio APIはじめてみましたAngularとWeb Audio APIはじめてみました
AngularとWeb Audio APIはじめてみましたpastelInc
 
2011_9_9_AIR_LightningTalk
2011_9_9_AIR_LightningTalk2011_9_9_AIR_LightningTalk
2011_9_9_AIR_LightningTalkShozo Okada
 
2011_9_9_AIR_LightningTalk
2011_9_9_AIR_LightningTalk2011_9_9_AIR_LightningTalk
2011_9_9_AIR_LightningTalkShozo Okada
 
HTML5 Conference 2015 鹿児島
HTML5 Conference 2015 鹿児島HTML5 Conference 2015 鹿児島
HTML5 Conference 2015 鹿児島Ryoya Kawai
 
Kilimanjaro Event
Kilimanjaro EventKilimanjaro Event
Kilimanjaro Eventdynamis
 
はじめてのiOSアプリ開発 Swift対応版
はじめてのiOSアプリ開発 Swift対応版はじめてのiOSアプリ開発 Swift対応版
はじめてのiOSアプリ開発 Swift対応版Tomoki Hasegawa
 
ラズパイ+SL+BMでワトソンと話そう
ラズパイ+SL+BMでワトソンと話そうラズパイ+SL+BMでワトソンと話そう
ラズパイ+SL+BMでワトソンと話そうMaho Takara
 
オープンデータ Web API
オープンデータ Web APIオープンデータ Web API
オープンデータ Web APIHironori Sakamoto
 
Real time Media streaming Web technologies
Real time Media streaming Web technologiesReal time Media streaming Web technologies
Real time Media streaming Web technologiesNobo Okada
 

Similar to Web Audio API と IBM Watson Speech to Text の話 (20)

AudioとガジェットをWebで遊ぶ - Web Audio/MIDI Web Bluetooth -
AudioとガジェットをWebで遊ぶ - Web Audio/MIDI Web Bluetooth -AudioとガジェットをWebで遊ぶ - Web Audio/MIDI Web Bluetooth -
AudioとガジェットをWebで遊ぶ - Web Audio/MIDI Web Bluetooth -
 
Speech API の概要(Microsoft Cognitive Services)
Speech API の概要(Microsoft Cognitive Services)Speech API の概要(Microsoft Cognitive Services)
Speech API の概要(Microsoft Cognitive Services)
 
TypeTalks第10回「もっと知りたい!Webフォント」
TypeTalks第10回「もっと知りたい!Webフォント」TypeTalks第10回「もっと知りたい!Webフォント」
TypeTalks第10回「もっと知りたい!Webフォント」
 
AI先生と外国語会話を練習しよう!
AI先生と外国語会話を練習しよう!AI先生と外国語会話を練習しよう!
AI先生と外国語会話を練習しよう!
 
Data API + AWS = (CMS どうでしょう 札幌編)
Data API + AWS =  (CMS どうでしょう 札幌編)Data API + AWS =  (CMS どうでしょう 札幌編)
Data API + AWS = (CMS どうでしょう 札幌編)
 
HTML5から始まる技術革新
HTML5から始まる技術革新HTML5から始まる技術革新
HTML5から始まる技術革新
 
HTML5とWeb開発に関する最新動向
HTML5とWeb開発に関する最新動向HTML5とWeb開発に関する最新動向
HTML5とWeb開発に関する最新動向
 
スマホアプリ開発者のためのWeb api開発入門の入門
スマホアプリ開発者のためのWeb api開発入門の入門スマホアプリ開発者のためのWeb api開発入門の入門
スマホアプリ開発者のためのWeb api開発入門の入門
 
HTML5など社内勉強会 Vol.11 - High Performance Web and iOS 6 WebKit
HTML5など社内勉強会 Vol.11 - High Performance Web and iOS 6 WebKitHTML5など社内勉強会 Vol.11 - High Performance Web and iOS 6 WebKit
HTML5など社内勉強会 Vol.11 - High Performance Web and iOS 6 WebKit
 
Fetch apiについて
Fetch apiについてFetch apiについて
Fetch apiについて
 
AngularとWeb Audio APIはじめてみました
AngularとWeb Audio APIはじめてみましたAngularとWeb Audio APIはじめてみました
AngularとWeb Audio APIはじめてみました
 
2011_9_9_AIR_LightningTalk
2011_9_9_AIR_LightningTalk2011_9_9_AIR_LightningTalk
2011_9_9_AIR_LightningTalk
 
2011_9_9_AIR_LightningTalk
2011_9_9_AIR_LightningTalk2011_9_9_AIR_LightningTalk
2011_9_9_AIR_LightningTalk
 
HTML5 Conference 2015 鹿児島
HTML5 Conference 2015 鹿児島HTML5 Conference 2015 鹿児島
HTML5 Conference 2015 鹿児島
 
Kilimanjaro Event
Kilimanjaro EventKilimanjaro Event
Kilimanjaro Event
 
はじめてのiOSアプリ開発 Swift対応版
はじめてのiOSアプリ開発 Swift対応版はじめてのiOSアプリ開発 Swift対応版
はじめてのiOSアプリ開発 Swift対応版
 
Kmcn demo
Kmcn demoKmcn demo
Kmcn demo
 
ラズパイ+SL+BMでワトソンと話そう
ラズパイ+SL+BMでワトソンと話そうラズパイ+SL+BMでワトソンと話そう
ラズパイ+SL+BMでワトソンと話そう
 
オープンデータ Web API
オープンデータ Web APIオープンデータ Web API
オープンデータ Web API
 
Real time Media streaming Web technologies
Real time Media streaming Web technologiesReal time Media streaming Web technologies
Real time Media streaming Web technologies
 

More from K Kimura

ThinkPad を自慢できると聞いてやってきました
ThinkPad を自慢できると聞いてやってきましたThinkPad を自慢できると聞いてやってきました
ThinkPad を自慢できると聞いてやってきましたK Kimura
 
IBM FamilyDay 2022 - 帰ってきた LINE 手描きスタンプ
IBM FamilyDay 2022 - 帰ってきた LINE 手描きスタンプIBM FamilyDay 2022 - 帰ってきた LINE 手描きスタンプ
IBM FamilyDay 2022 - 帰ってきた LINE 手描きスタンプK Kimura
 
「プライベート版 Heroku」の "dokku" は Cloud Foundry 代替としてどこまで使えるか?
「プライベート版 Heroku」の "dokku" は Cloud Foundry 代替としてどこまで使えるか?「プライベート版 Heroku」の "dokku" は Cloud Foundry 代替としてどこまで使えるか?
「プライベート版 Heroku」の "dokku" は Cloud Foundry 代替としてどこまで使えるか?K Kimura
 
LINE お絵描きスタンプが NFT 対応するかも
LINE お絵描きスタンプが NFT 対応するかもLINE お絵描きスタンプが NFT 対応するかも
LINE お絵描きスタンプが NFT 対応するかもK Kimura
 
ICFO2021 コロナ時代のオンラインハンズオン体験
ICFO2021   コロナ時代のオンラインハンズオン体験ICFO2021   コロナ時代のオンラインハンズオン体験
ICFO2021 コロナ時代のオンラインハンズオン体験K Kimura
 
IBM Family Day 2020 - LINE で手描きスタンプに挑戦!
IBM Family Day 2020 - LINE で手描きスタンプに挑戦!IBM Family Day 2020 - LINE で手描きスタンプに挑戦!
IBM Family Day 2020 - LINE で手描きスタンプに挑戦!K Kimura
 
マンホールマップ10周年 20200725
マンホールマップ10周年 20200725マンホールマップ10周年 20200725
マンホールマップ10周年 20200725K Kimura
 
MashupAward6 Manholemap(2010)
MashupAward6 Manholemap(2010)MashupAward6 Manholemap(2010)
MashupAward6 Manholemap(2010)K Kimura
 
スライドパズルハンズオン資料
スライドパズルハンズオン資料スライドパズルハンズオン資料
スライドパズルハンズオン資料K Kimura
 
ユーザー投稿型位置情報プロットシステム - マンホールマップ
ユーザー投稿型位置情報プロットシステム - マンホールマップユーザー投稿型位置情報プロットシステム - マンホールマップ
ユーザー投稿型位置情報プロットシステム - マンホールマップK Kimura
 
Scratch でゲームプログラミング
Scratch でゲームプログラミングScratch でゲームプログラミング
Scratch でゲームプログラミングK Kimura
 
空耳アワーマシーンを作ってみた
空耳アワーマシーンを作ってみた空耳アワーマシーンを作ってみた
空耳アワーマシーンを作ってみたK Kimura
 
生まれ変わるマンホールマップ
生まれ変わるマンホールマップ生まれ変わるマンホールマップ
生まれ変わるマンホールマップK Kimura
 
地図データでレースゲームを作って遊ぼう!
地図データでレースゲームを作って遊ぼう!地図データでレースゲームを作って遊ぼう!
地図データでレースゲームを作って遊ぼう!K Kimura
 
IBM Watson IoT を用いた遠隔ゲームコントローラーと Node-RED による簡易カスタマイズによる実現
IBM Watson IoT を用いた遠隔ゲームコントローラーと Node-RED による簡易カスタマイズによる実現IBM Watson IoT を用いた遠隔ゲームコントローラーと Node-RED による簡易カスタマイズによる実現
IBM Watson IoT を用いた遠隔ゲームコントローラーと Node-RED による簡易カスタマイズによる実現K Kimura
 
「テトリスを作ってスマホで振って遊ぼう!」ハンズオン資料
「テトリスを作ってスマホで振って遊ぼう!」ハンズオン資料「テトリスを作ってスマホで振って遊ぼう!」ハンズオン資料
「テトリスを作ってスマホで振って遊ぼう!」ハンズオン資料K Kimura
 
LINE お絵描きアプリハンズオン 20190519
LINE お絵描きアプリハンズオン 20190519LINE お絵描きアプリハンズオン 20190519
LINE お絵描きアプリハンズオン 20190519K Kimura
 
LINE お絵描きハンズオン 2019.04.26
LINE お絵描きハンズオン 2019.04.26LINE お絵描きハンズオン 2019.04.26
LINE お絵描きハンズオン 2019.04.26K Kimura
 
Hyperledger Hands-on 2019-03-30 @ Singularity HIVE
Hyperledger Hands-on 2019-03-30 @ Singularity HIVEHyperledger Hands-on 2019-03-30 @ Singularity HIVE
Hyperledger Hands-on 2019-03-30 @ Singularity HIVEK Kimura
 
LINE お絵描きアプリハンズオン
LINE お絵描きアプリハンズオンLINE お絵描きアプリハンズオン
LINE お絵描きアプリハンズオンK Kimura
 

More from K Kimura (20)

ThinkPad を自慢できると聞いてやってきました
ThinkPad を自慢できると聞いてやってきましたThinkPad を自慢できると聞いてやってきました
ThinkPad を自慢できると聞いてやってきました
 
IBM FamilyDay 2022 - 帰ってきた LINE 手描きスタンプ
IBM FamilyDay 2022 - 帰ってきた LINE 手描きスタンプIBM FamilyDay 2022 - 帰ってきた LINE 手描きスタンプ
IBM FamilyDay 2022 - 帰ってきた LINE 手描きスタンプ
 
「プライベート版 Heroku」の "dokku" は Cloud Foundry 代替としてどこまで使えるか?
「プライベート版 Heroku」の "dokku" は Cloud Foundry 代替としてどこまで使えるか?「プライベート版 Heroku」の "dokku" は Cloud Foundry 代替としてどこまで使えるか?
「プライベート版 Heroku」の "dokku" は Cloud Foundry 代替としてどこまで使えるか?
 
LINE お絵描きスタンプが NFT 対応するかも
LINE お絵描きスタンプが NFT 対応するかもLINE お絵描きスタンプが NFT 対応するかも
LINE お絵描きスタンプが NFT 対応するかも
 
ICFO2021 コロナ時代のオンラインハンズオン体験
ICFO2021   コロナ時代のオンラインハンズオン体験ICFO2021   コロナ時代のオンラインハンズオン体験
ICFO2021 コロナ時代のオンラインハンズオン体験
 
IBM Family Day 2020 - LINE で手描きスタンプに挑戦!
IBM Family Day 2020 - LINE で手描きスタンプに挑戦!IBM Family Day 2020 - LINE で手描きスタンプに挑戦!
IBM Family Day 2020 - LINE で手描きスタンプに挑戦!
 
マンホールマップ10周年 20200725
マンホールマップ10周年 20200725マンホールマップ10周年 20200725
マンホールマップ10周年 20200725
 
MashupAward6 Manholemap(2010)
MashupAward6 Manholemap(2010)MashupAward6 Manholemap(2010)
MashupAward6 Manholemap(2010)
 
スライドパズルハンズオン資料
スライドパズルハンズオン資料スライドパズルハンズオン資料
スライドパズルハンズオン資料
 
ユーザー投稿型位置情報プロットシステム - マンホールマップ
ユーザー投稿型位置情報プロットシステム - マンホールマップユーザー投稿型位置情報プロットシステム - マンホールマップ
ユーザー投稿型位置情報プロットシステム - マンホールマップ
 
Scratch でゲームプログラミング
Scratch でゲームプログラミングScratch でゲームプログラミング
Scratch でゲームプログラミング
 
空耳アワーマシーンを作ってみた
空耳アワーマシーンを作ってみた空耳アワーマシーンを作ってみた
空耳アワーマシーンを作ってみた
 
生まれ変わるマンホールマップ
生まれ変わるマンホールマップ生まれ変わるマンホールマップ
生まれ変わるマンホールマップ
 
地図データでレースゲームを作って遊ぼう!
地図データでレースゲームを作って遊ぼう!地図データでレースゲームを作って遊ぼう!
地図データでレースゲームを作って遊ぼう!
 
IBM Watson IoT を用いた遠隔ゲームコントローラーと Node-RED による簡易カスタマイズによる実現
IBM Watson IoT を用いた遠隔ゲームコントローラーと Node-RED による簡易カスタマイズによる実現IBM Watson IoT を用いた遠隔ゲームコントローラーと Node-RED による簡易カスタマイズによる実現
IBM Watson IoT を用いた遠隔ゲームコントローラーと Node-RED による簡易カスタマイズによる実現
 
「テトリスを作ってスマホで振って遊ぼう!」ハンズオン資料
「テトリスを作ってスマホで振って遊ぼう!」ハンズオン資料「テトリスを作ってスマホで振って遊ぼう!」ハンズオン資料
「テトリスを作ってスマホで振って遊ぼう!」ハンズオン資料
 
LINE お絵描きアプリハンズオン 20190519
LINE お絵描きアプリハンズオン 20190519LINE お絵描きアプリハンズオン 20190519
LINE お絵描きアプリハンズオン 20190519
 
LINE お絵描きハンズオン 2019.04.26
LINE お絵描きハンズオン 2019.04.26LINE お絵描きハンズオン 2019.04.26
LINE お絵描きハンズオン 2019.04.26
 
Hyperledger Hands-on 2019-03-30 @ Singularity HIVE
Hyperledger Hands-on 2019-03-30 @ Singularity HIVEHyperledger Hands-on 2019-03-30 @ Singularity HIVE
Hyperledger Hands-on 2019-03-30 @ Singularity HIVE
 
LINE お絵描きアプリハンズオン
LINE お絵描きアプリハンズオンLINE お絵描きアプリハンズオン
LINE お絵描きアプリハンズオン
 

Recently uploaded

ストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdf
ストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdfストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdf
ストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdfmasakisaito12
 
コダワリ抜いた経営指南書(概要版) - コダワリ・ビジネス・コンサルティング株式会社
コダワリ抜いた経営指南書(概要版) - コダワリ・ビジネス・コンサルティング株式会社コダワリ抜いた経営指南書(概要版) - コダワリ・ビジネス・コンサルティング株式会社
コダワリ抜いた経営指南書(概要版) - コダワリ・ビジネス・コンサルティング株式会社hmoriyama
 
シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料
シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料
シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料シンフォニティ 株式会社
 
20240427 zaim academy counseling lesson .pdf
20240427 zaim academy counseling lesson .pdf20240427 zaim academy counseling lesson .pdf
20240427 zaim academy counseling lesson .pdfssuser80a51f
 
ストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdf
ストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdfストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdf
ストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdfmasakisaito12
 
202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)
202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)
202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)KayaSuetake1
 
Service-introduction-materials-misorae-leadership
Service-introduction-materials-misorae-leadershipService-introduction-materials-misorae-leadership
Service-introduction-materials-misorae-leadershipYasuyoshi Minehisa
 
株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店
株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店
株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店ssuserfb441f
 
UP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチ
UP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチUP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチ
UP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチユニパー株式会社
 
答えのないコンセンサスゲーム「無人島での出来事」運営用パワーポイントスライド説明資料
答えのないコンセンサスゲーム「無人島での出来事」運営用パワーポイントスライド説明資料答えのないコンセンサスゲーム「無人島での出来事」運営用パワーポイントスライド説明資料
答えのないコンセンサスゲーム「無人島での出来事」運営用パワーポイントスライド説明資料Jun Chiba
 

Recently uploaded (11)

KestrelPro Flyer Japan IT Week 2024 (Japanese)
KestrelPro Flyer Japan IT Week 2024 (Japanese)KestrelPro Flyer Japan IT Week 2024 (Japanese)
KestrelPro Flyer Japan IT Week 2024 (Japanese)
 
ストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdf
ストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdfストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdf
ストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdf
 
コダワリ抜いた経営指南書(概要版) - コダワリ・ビジネス・コンサルティング株式会社
コダワリ抜いた経営指南書(概要版) - コダワリ・ビジネス・コンサルティング株式会社コダワリ抜いた経営指南書(概要版) - コダワリ・ビジネス・コンサルティング株式会社
コダワリ抜いた経営指南書(概要版) - コダワリ・ビジネス・コンサルティング株式会社
 
シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料
シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料
シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料
 
20240427 zaim academy counseling lesson .pdf
20240427 zaim academy counseling lesson .pdf20240427 zaim academy counseling lesson .pdf
20240427 zaim academy counseling lesson .pdf
 
ストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdf
ストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdfストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdf
ストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdf
 
202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)
202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)
202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)
 
Service-introduction-materials-misorae-leadership
Service-introduction-materials-misorae-leadershipService-introduction-materials-misorae-leadership
Service-introduction-materials-misorae-leadership
 
株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店
株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店
株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店
 
UP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチ
UP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチUP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチ
UP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチ
 
答えのないコンセンサスゲーム「無人島での出来事」運営用パワーポイントスライド説明資料
答えのないコンセンサスゲーム「無人島での出来事」運営用パワーポイントスライド説明資料答えのないコンセンサスゲーム「無人島での出来事」運営用パワーポイントスライド説明資料
答えのないコンセンサスゲーム「無人島での出来事」運営用パワーポイントスライド説明資料
 

Web Audio API と IBM Watson Speech to Text の話

  • 1. Web Audio API と IBM Watson Speech to Text API の話 @ VoiceWorld Z vol.2 #voiceworldz
  • 2. 自己紹介 本アイ・ビー・エム クラウドエバンジェリスト witter: @dotnsf og: http://dotnsf.blog.jp/ mail: dotnsf@jp.ibm.com 趣味: マンホール 木村 桂(きむら けい) プログラマー マンホールマップ : http://manholemap.juge.me/ #voiceworldz
  • 3. Web Audio API • W3C 勧告候補 (2018/Sep/18) • Web アプリケーションにおけるオーディオの処理および合成に 関する高レベルの JavaScript API https://www.w3.org/TR/webaudio/ #voiceworldz
  • 4. Web Audio API を超簡単に説明する と・・ • 音声操作をオーディオコンテキスト操作として実現した API • 入力元と出力先をつなげたり、途中でエフェクトをかけたり、 データを取り出したりする ① オーディオコンテキスト生成 ② オーディオソースを指定 ④ 出力先を指定 ③ エフェクタを指定 ⑤ ソースとエフェクタを接続 ⑥ エフェクタと出力先を接続 #voiceworldz
  • 5. 例えば・・・ (その1) • オーディオファイルをスピーカーから再生 ① オーディオコンテキスト生成 ② オーディオソースを指定 ④ 出力先を指定 ③ エフェクタを指定 ⑤ ソースとエフェクタを接続 ⑥ エフェクタと出力先を接続 #voiceworldz
  • 6. オーディオファイル操作時の大まかな流 れ // オーディオコンテキストの生成 var audio_context = new AudioContext(); //. Files API でオーディオファイルの読み込み var file = "sample.mp3"; var reader = new FileReader(); reader.onload = function(){ var arrayBuffer = reader.result; audio_context.decodeAudioData( arrayBuffer, function( audioBuffer ){ var source = audio_context.createBufferSource(); source.buffer = audioBuffer; source.connect( audio_context.destination ); //. 標準オーディオ出力に接続 source.start( 0 ); //. 最初から再生 }); }; reader.readAsArrayBuffer( file ); http://dotnsf.blog.jp/archives/1072420283.html #voiceworldz
  • 7. 例えば・・・ (その2) • マイクから入力した音声データを取り出す ① オーディオコンテキスト生成 ② オーディオソースをマイクに指定 ④ 出力先ファイルを指定 ③ エフェクタを指定 ⑤ ソースとエフェクタを接続 ⑥ エフェクタと出力先を接続 #voiceworldz
  • 8. マイク操作時の大まかな流れ // オーディオコンテキストの生成 var audio_context = new AudioContext(); // 標準メディアデバイス(マイク・スピーカー)の取得 Navigator.mediaDevices.getUserMedia( { audio: true } ).then( function( stream ){ // メディアストリームの作成 var media_stream = audio_context.createMediaStream( stream ); var processor = audio_context.createScriptProcessor( 1024, 1, 1 ); media_stream.connect( processor ); processor.onaudioprocess = function( e ){ // 音声データ var inputdata = e.inputBuffer.getChannelData( 0 ); : }; processor.connect( audio_context.destination ); }); http://dotnsf.blog.jp/archives/1072473945.html #voiceworldz
  • 9. 例えば・・・ (その2の応用) • 取り出した音声データをテキスト化する ① オーディオコンテキスト生成 ② オーディオソースをマイクに指定 ④ 出力先ファイルを指定 ③ エフェクタを指定 ⑤ ソースとエフェクタを接続 ⑥ エフェクタと出力先を接続 ⑦Speech to Text 機能で  音声→テキストにして取り出す IBM Watson #voiceworldz
  • 10. IBM Watson Speech to Text API https://www.ibm.com/watson/jp-ja/developercloud/speech-to-text.html 音声データをテキストに変換(言語指定可能) ライトプラン有り(1ヶ月あたり 100 分まで無料) 主な用途 ・コールセンターのオペレーター音声の解析 ・会議における発言のテキスト化 ・音声操作時の中間処理 ・電話の自動応答システム ・メディアファイルからの書き起こし など #voiceworldz
  • 11. 【告知】 IBM Cloud Community Summit 2018 【 12/8 】 https://bmxug.connpass.com/event/105149/ https://bmxug.connpass.com/event/110051/ IBM Cloud ユーザーコミュニティ主催の年イチイベン IBM Cloudant の細かすぎて伝わりにくい機能(その 2) ブロックチェーン体験ハンズオン(先着順)