SlideShare a Scribd company logo
1 of 16
Download to read offline
日本音響学会 音響学入門ペディア shinnosuke-t [at] is.naist.jp
高道 慎之介
(奈良先端科学技術大学院大学,学生・若手フォーラム幹事会)
日本音響学会 2013年 秋季研究発表会
音響学入門ペディアセッション
Q2. z変換をやさしく教えて下さい
/12
はじめに
2
“時間信号 x(n) のz変換 X(z) は,….で与えれられる。”
“z-1は時間遅れを表す”
“零点と極”
“伝達関数”
“安定性” “フーリエ変換との関係”
本スライドではこれらの疑問に答えてきます!
色々なキーワードが出てくるけど,結局z変換って何なの?
z変換した結果と実際の音波ってどんな関係があるの?
z変換を学ぶ機会は少なからずあったはず
Z変換って何なの?
3
/12
z変換の前に: 波の足し合わせによる表現
4
おてもやん
音源
音波
マイクロホン
収音された時間波形
時間波形を”何かの波”の足し合わせで表現することで,
その波形の特徴を解析することが可能
波1 波2
/12
フーリエ変換
5
 tjA 11 exp 
時間波形
 tx
波1 波2
 tjA 22 exp 
時間 周波数(振動の速さ)振幅(振動の大きさ)
* 位相(振動の時間遅れ)もあるが省略
フーリエ変換とは・・・
時間波形を の波の足し合わせで表現する方法
時間的に一定の振幅で周期振動する波
時間波形って振動するだけなのか? ラプラス変換の導入
 tjexp
指数部が虚数だと、振動する波
/12
ラプラス変換
6
 tjA )0(exp 11 
時間波形
 tx
波1 波2
時間
波3
 tjA )(exp 333   tjA )(exp 222  
振動の周波数 増加 (σ>0) ・減衰 (σ<0)の周波数
ラプラス変換とは・・・
時間波形を の波の足し合わせで表現する方法
時間的に振幅が増加/減衰しながら振動する波
デジタル計算機で処理できないか?
 tj )(exp  
離散時間に対応する
手法が登場
指数部が複素数だと、振動・増加/減衰
/12
手法の関係性
7
振動する波 振動・増加/減衰する波
連続時間
フーリエ変換 ラプラス変換
離散時間
離散フーリエ変換
サンプリング
された点
z変換
/12
z変換
8
n
zzX 11)(
時間波形
 nx
波1 波2
離散時間
波3
n
zzX 33 )(n
zzX 22 )(
振幅(・位相)
z変換とは・・・
離散時間波形を の波の足し合わせで表現する手法
時間的に振幅が増加/減衰しながら振動する波
z変換という呼び方は,連続時間のラプラス変換(s変換)に対応
 nn
jbaz 
 
   njAjA
jbaz
n
nn
)(lnexp)exp(  
 増加/減衰 振動
音波とZ変換の関係って?
9
/12
収音された音波とそのz変換
10
以下の部屋で収音された音波のz変換を考えよう
音源 マイクロホン
直接到達する音波
収音後,反射してもう一度収音される音波
収音された時間波形をz変換してみよう
振幅
時間
1
1/2
1/4 1/8 1/16 ・・・ nx
n
  ...)8(
4
1
)4(
2
1
1  nnnx 
0 4 8 12 16
  ...
4
1
2
1
1 84
 
zzzX
z変換 *z変換がこうなる理由は省略
(少し後述)
/12
収音された音波とそのz変換 (Cont’d)
11
式を変形してみよう
  

 









0 4
484
2
1
1
1
2
1
...
4
1
2
1
1
n
n
z
zzzzX
X(z) (波zの振動の振幅(と位相))を解析してみよう
振幅が0となる波z (=> Q(z)=0となるz)
振幅が∞となる波z (=> P(z)=0となるz)
音波を繰り返し
収音した時の形
X(z)の一般式を考えてみよう
 
)(
)(
zP
zQ
zX 
例: 共振による反復的な収音により発生
例: 反射・散乱による信号の遅延により発生
零点と呼ばれ,波の打ち消しを表す
極と呼ばれ,波の増幅を表す
/12
まとめ
 z変換についての疑問点について解説
 疑問点①: 結局z変換って何なのか?
– z = a + jbとは,離散時間における波を表す
– z変換とは,時間波形を増加/減衰・振動する波(z)の足し合わせで
表現する手法
 疑問点②: 音波とz変換の関係って何なのか?
– 音波の挙動によって,式の形が変化
• 音波が反復的に収音されると,X(z)は分母を含む
• (音波が遅れて収音されると,X(z)は分子を含む)
12
/12
FU☆RO ☆KU
なぜZ-1は時間遅れを表すの?
(なぜ時間遅れでZ-1が生じるの?)
/12
波の遅れが生み出すもの
波の遅れがあると何が生み出されるのか?
時間
振幅
時間
振幅
T
 tsin   )sin()(sin   tTt
時間遅れでθ = ωTが生じる
フーリエ・z変換ではどうなる?
連続時間 T だけ遅れた時のフーリエ変換では・・・
離散時間 N だけ遅れた時のz変換では・・・
Tの時間遅れ
 tjexp       TjtjTtj   expexpexp
時間遅れで生じる
 njAzn
)(lnexp 
 
   
Nn
zz
NjAnjA
NnjA




)(lnexp)(lnexp
))((lnexp


時間遅れで生じる
/12
Acknowledgement
 貴重なご助言・ご指導を頂きました
– 電気通信大学 羽田 陽一様
– NICT 岡本 拓磨様
– NTT 鎌土 記良様
– 音響学入門ペディア作成委員会,学生・若手フォーラムの皆様
16

More Related Content

What's hot

Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門
Shuyo Nakatani
 

What's hot (20)

研究発表のためのプレゼンテーション技術
研究発表のためのプレゼンテーション技術研究発表のためのプレゼンテーション技術
研究発表のためのプレゼンテーション技術
 
みんなが知らない pytorch-pfn-extras
みんなが知らない pytorch-pfn-extrasみんなが知らない pytorch-pfn-extras
みんなが知らない pytorch-pfn-extras
 
深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術深層生成モデルに基づく音声合成技術
深層生成モデルに基づく音声合成技術
 
最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情
 
高効率音声符号化―MP3詳解―
高効率音声符号化―MP3詳解―高効率音声符号化―MP3詳解―
高効率音声符号化―MP3詳解―
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門
 
アンサンブル学習
アンサンブル学習アンサンブル学習
アンサンブル学習
 
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
 
近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer近年のHierarchical Vision Transformer
近年のHierarchical Vision Transformer
 
【解説】 一般逆行列
【解説】 一般逆行列【解説】 一般逆行列
【解説】 一般逆行列
 
多様なカートシスを持つ雑音に対応した低ミュージカルノイズ DNN 音声強調
多様なカートシスを持つ雑音に対応した低ミュージカルノイズ DNN 音声強調多様なカートシスを持つ雑音に対応した低ミュージカルノイズ DNN 音声強調
多様なカートシスを持つ雑音に対応した低ミュージカルノイズ DNN 音声強調
 
先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15
 
トップカンファレンスへの論文採択に向けて(AI研究分野版)/ Toward paper acceptance at top conferences (AI...
トップカンファレンスへの論文採択に向けて(AI研究分野版)/ Toward paper acceptance at top conferences (AI...トップカンファレンスへの論文採択に向けて(AI研究分野版)/ Toward paper acceptance at top conferences (AI...
トップカンファレンスへの論文採択に向けて(AI研究分野版)/ Toward paper acceptance at top conferences (AI...
 
論文紹介 wav2vec: Unsupervised Pre-training for Speech Recognition
論文紹介  wav2vec: Unsupervised Pre-training for Speech Recognition論文紹介  wav2vec: Unsupervised Pre-training for Speech Recognition
論文紹介 wav2vec: Unsupervised Pre-training for Speech Recognition
 
[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?[DL輪読会]When Does Label Smoothing Help?
[DL輪読会]When Does Label Smoothing Help?
 
モデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留するモデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留する
 
実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAE実装レベルで学ぶVQVAE
実装レベルで学ぶVQVAE
 
深層学習の数理
深層学習の数理深層学習の数理
深層学習の数理
 
ドメイン適応の原理と応用
ドメイン適応の原理と応用ドメイン適応の原理と応用
ドメイン適応の原理と応用
 

More from Shinnosuke Takamichi

Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
Interspeech 2020 読み会 "Incremental Text to Speech for Neural  Sequence-to-Sequ...Interspeech 2020 読み会 "Incremental Text to Speech for Neural  Sequence-to-Sequ...
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
Shinnosuke Takamichi
 
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
Shinnosuke Takamichi
 
音声合成・変換の国際コンペティションへの 参加を振り返って
音声合成・変換の国際コンペティションへの  参加を振り返って音声合成・変換の国際コンペティションへの  参加を振り返って
音声合成・変換の国際コンペティションへの 参加を振り返って
Shinnosuke Takamichi
 

More from Shinnosuke Takamichi (20)

JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
JTubeSpeech:  音声認識と話者照合のために YouTube から構築される日本語音声コーパスJTubeSpeech:  音声認識と話者照合のために YouTube から構築される日本語音声コーパス
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
 
音声合成のコーパスをつくろう
音声合成のコーパスをつくろう音声合成のコーパスをつくろう
音声合成のコーパスをつくろう
 
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパスJ-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
 
短時間発話を用いた話者照合のための音声加工の効果に関する検討
短時間発話を用いた話者照合のための音声加工の効果に関する検討短時間発話を用いた話者照合のための音声加工の効果に関する検討
短時間発話を用いた話者照合のための音声加工の効果に関する検討
 
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
 
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
 
国際会議 interspeech 2020 報告
国際会議 interspeech 2020 報告国際会議 interspeech 2020 報告
国際会議 interspeech 2020 報告
 
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
Interspeech 2020 読み会 "Incremental Text to Speech for Neural  Sequence-to-Sequ...Interspeech 2020 読み会 "Incremental Text to Speech for Neural  Sequence-to-Sequ...
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
 
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
 
P J S: 音素バランスを考慮した日本語歌声コーパス
P J S: 音素バランスを考慮した日本語歌声コーパスP J S: 音素バランスを考慮した日本語歌声コーパス
P J S: 音素バランスを考慮した日本語歌声コーパス
 
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
音響モデル尤度に基づくsubword分割の韻律推定精度における評価音響モデル尤度に基づくsubword分割の韻律推定精度における評価
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
 
音声合成研究を加速させるためのコーパスデザイン
音声合成研究を加速させるためのコーパスデザイン音声合成研究を加速させるためのコーパスデザイン
音声合成研究を加速させるためのコーパスデザイン
 
論文紹介 Unsupervised training of neural mask-based beamforming
論文紹介 Unsupervised training of neural  mask-based beamforming論文紹介 Unsupervised training of neural  mask-based beamforming
論文紹介 Unsupervised training of neural mask-based beamforming
 
論文紹介 Building the Singapore English National Speech Corpus
論文紹介 Building the Singapore English National Speech Corpus論文紹介 Building the Singapore English National Speech Corpus
論文紹介 Building the Singapore English National Speech Corpus
 
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
 
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
 
JVS:フリーの日本語多数話者音声コーパス
JVS:フリーの日本語多数話者音声コーパス JVS:フリーの日本語多数話者音声コーパス
JVS:フリーの日本語多数話者音声コーパス
 
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
 
音声合成・変換の国際コンペティションへの 参加を振り返って
音声合成・変換の国際コンペティションへの  参加を振り返って音声合成・変換の国際コンペティションへの  参加を振り返って
音声合成・変換の国際コンペティションへの 参加を振り返って
 
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
ユーザ歌唱のための generative moment matching network に基づく neural double-trackingユーザ歌唱のための generative moment matching network に基づく neural double-tracking
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
 

z変換をやさしく教えて下さい (音響学入門ペディア)