Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
Akinori Ito
29,626 views
音声生成の基礎と音声学
音声生成の基礎と音声学 東北大学大学院情報科学研究科「学際情報科学論」スライド
Education
◦
Read more
15
Save
Share
Embed
Embed presentation
1
/ 28
2
/ 28
3
/ 28
4
/ 28
5
/ 28
Most read
6
/ 28
7
/ 28
8
/ 28
9
/ 28
10
/ 28
11
/ 28
12
/ 28
13
/ 28
14
/ 28
15
/ 28
16
/ 28
17
/ 28
18
/ 28
19
/ 28
20
/ 28
21
/ 28
22
/ 28
23
/ 28
Most read
24
/ 28
Most read
25
/ 28
26
/ 28
27
/ 28
28
/ 28
More Related Content
PDF
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析
by
Shinnosuke Takamichi
ODP
音声認識の基礎
by
Akinori Ito
PDF
音情報処理における特徴表現
by
NU_I_TODALAB
PDF
Moment matching networkを用いた音声パラメータのランダム生成の検討
by
Shinnosuke Takamichi
PDF
高効率音声符号化―MP3詳解―
by
Akinori Ito
PDF
Asj2017 3invited
by
SaruwatariLabUTokyo
PDF
音楽を見る:情報可視化技術の音楽情報処理への適用
by
Takayuki Itoh
PDF
環境音の特徴を活用した音響イベント検出・シーン分類
by
Keisuke Imoto
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析
by
Shinnosuke Takamichi
音声認識の基礎
by
Akinori Ito
音情報処理における特徴表現
by
NU_I_TODALAB
Moment matching networkを用いた音声パラメータのランダム生成の検討
by
Shinnosuke Takamichi
高効率音声符号化―MP3詳解―
by
Akinori Ito
Asj2017 3invited
by
SaruwatariLabUTokyo
音楽を見る:情報可視化技術の音楽情報処理への適用
by
Takayuki Itoh
環境音の特徴を活用した音響イベント検出・シーン分類
by
Keisuke Imoto
What's hot
PDF
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
by
NU_I_TODALAB
PPTX
スペクトログラム無矛盾性に基づく独立低ランク行列分析
by
Kitamura Laboratory
PDF
深層生成モデルに基づく音声合成技術
by
NU_I_TODALAB
ODP
音声の認識と合成
by
Akinori Ito
PPTX
音源分離における音響モデリング(Acoustic modeling in audio source separation)
by
Daichi Kitamura
PDF
音声の声質を変換する技術とその応用
by
NU_I_TODALAB
PPTX
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
by
Daichi Kitamura
PDF
短時間発話を用いた話者照合のための音声加工の効果に関する検討
by
Shinnosuke Takamichi
PDF
統計的音声合成変換と近年の発展
by
Shinnosuke Takamichi
PDF
ICASSP 2019での音響信号処理分野の世界動向
by
Yuma Koizumi
PDF
音声合成のコーパスをつくろう
by
Shinnosuke Takamichi
PDF
Neural text-to-speech and voice conversion
by
Yuki Saito
PDF
Onoma-to-wave: オノマトペを利用した環境音合成手法の提案
by
Keisuke Imoto
PPTX
調波打撃音分離の時間周波数マスクを用いた線形ブラインド音源分離
by
Kitamura Laboratory
PPTX
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
by
Daichi Kitamura
PDF
音声感情認識の分野動向と実用化に向けたNTTの取り組み
by
Atsushi_Ando
ODP
音声合成の基礎
by
Akinori Ito
PDF
自称・世界一わかりやすい音声認識入門
by
Tom Hakamata
PPTX
基底共有型非負値行列因子分解に基づく楽器音の共通・固有成分の分析,
by
Kitamura Laboratory
PPTX
独立低ランク行列分析に基づくブラインド音源分離(Blind source separation based on independent low-rank...
by
Daichi Kitamura
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
by
NU_I_TODALAB
スペクトログラム無矛盾性に基づく独立低ランク行列分析
by
Kitamura Laboratory
深層生成モデルに基づく音声合成技術
by
NU_I_TODALAB
音声の認識と合成
by
Akinori Ito
音源分離における音響モデリング(Acoustic modeling in audio source separation)
by
Daichi Kitamura
音声の声質を変換する技術とその応用
by
NU_I_TODALAB
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
by
Daichi Kitamura
短時間発話を用いた話者照合のための音声加工の効果に関する検討
by
Shinnosuke Takamichi
統計的音声合成変換と近年の発展
by
Shinnosuke Takamichi
ICASSP 2019での音響信号処理分野の世界動向
by
Yuma Koizumi
音声合成のコーパスをつくろう
by
Shinnosuke Takamichi
Neural text-to-speech and voice conversion
by
Yuki Saito
Onoma-to-wave: オノマトペを利用した環境音合成手法の提案
by
Keisuke Imoto
調波打撃音分離の時間周波数マスクを用いた線形ブラインド音源分離
by
Kitamura Laboratory
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
by
Daichi Kitamura
音声感情認識の分野動向と実用化に向けたNTTの取り組み
by
Atsushi_Ando
音声合成の基礎
by
Akinori Ito
自称・世界一わかりやすい音声認識入門
by
Tom Hakamata
基底共有型非負値行列因子分解に基づく楽器音の共通・固有成分の分析,
by
Kitamura Laboratory
独立低ランク行列分析に基づくブラインド音源分離(Blind source separation based on independent low-rank...
by
Daichi Kitamura
Viewers also liked
PDF
ナイーブベイズによる言語判定
by
Shuyo Nakatani
PPTX
Weighting of acoustic cues shifts to frication duration in identification of ...
by
Keiichi Yasu
PDF
破擦音生成時の解放に伴う破裂が摩擦音・破擦音識別に与える影響〜若年者と高齢者の比較〜
by
Keiichi Yasu
PDF
第15回機械学習勉強会・説明用ノート
by
Etsuji Nakai
PPTX
英語学習者のための発話自動採点システムの開発.
by
Yutaka Ishii
PDF
言語と知識の深層学習@認知科学会サマースクール
by
Yuya Unno
PDF
Pythonはどうやってlen関数で長さを手にいれているの?
by
Takayuki Shimizukawa
ナイーブベイズによる言語判定
by
Shuyo Nakatani
Weighting of acoustic cues shifts to frication duration in identification of ...
by
Keiichi Yasu
破擦音生成時の解放に伴う破裂が摩擦音・破擦音識別に与える影響〜若年者と高齢者の比較〜
by
Keiichi Yasu
第15回機械学習勉強会・説明用ノート
by
Etsuji Nakai
英語学習者のための発話自動採点システムの開発.
by
Yutaka Ishii
言語と知識の深層学習@認知科学会サマースクール
by
Yuya Unno
Pythonはどうやってlen関数で長さを手にいれているの?
by
Takayuki Shimizukawa
More from Akinori Ito
PPTX
いろいろなプログラミング言語による互除法
by
Akinori Ito
PDF
人間と機械と音のコミュニケーション
by
Akinori Ito
PDF
マルチメディア情報ハイディング
by
Akinori Ito
PPTX
音声と音楽による人間・機械間メタコミュニケーション
by
Akinori Ito
PDF
研究発表のやり方
by
Akinori Ito
PPTX
歌声分析のエンタテイメント応用
by
Akinori Ito
PPTX
科学論文執筆・投稿にまつわる基礎知識
by
Akinori Ito
ODP
音楽の情報処理
by
Akinori Ito
ODP
音声の生成と符号化
by
Akinori Ito
いろいろなプログラミング言語による互除法
by
Akinori Ito
人間と機械と音のコミュニケーション
by
Akinori Ito
マルチメディア情報ハイディング
by
Akinori Ito
音声と音楽による人間・機械間メタコミュニケーション
by
Akinori Ito
研究発表のやり方
by
Akinori Ito
歌声分析のエンタテイメント応用
by
Akinori Ito
科学論文執筆・投稿にまつわる基礎知識
by
Akinori Ito
音楽の情報処理
by
Akinori Ito
音声の生成と符号化
by
Akinori Ito
音声生成の基礎と音声学
1.
学際情報科学論 I. 音声学と音声認識・合成 伊藤 彰則 aito@spcom.ecei.tohoku.ac.jp
2.
この講義の概要 ● 音声:音と言語のインタフェース ● 音声の生成と音声学 –
声を生み出す器官 – 人間の音声の特徴と分類 – 音声の音としての特徴 ● 音声の認識 – パターン認識の枠組み – 特徴抽出 – 音響モデル・言語モデル・デコーダ ● 音声の合成 – フォルマント合成 / 波形接続合成 /HMM 合成
3.
音声の生成と音声学 ● 人間の声はどうやって作られているのか? ● 人間の声はなぜ多様なのか? ●
人間はどんな種類の声を言語に使っているの か? ● 発声器官と声の種類との関係は? ● 声の種類と音声の物理的性質との関係は? ● 音声の物理的性質と音声の知覚の関係は?
4.
音声の生成 ● 声を生成する器官 Organs
for speech production ● 声帯 vocal cord ● 喉頭 larynx ● 咽頭 pharynx ● 舌 tongue ● 歯茎 teethridge ● 歯 teeth ● 口唇 lips ● 鼻腔 nasal cavity 声道 vocal tract
5.
声を生成する器官 声帯 vocal cord 気管 trachea 食道 esophagus 喉頭
larynx 咽頭 pharynx 舌 tongue 軟口蓋 soft palate 硬口蓋 hard palate 鼻腔 nasal cavity 歯茎 teeth ridge 口唇 lips
6.
声帯:声のもとを作る 前 後 声帯 食道へ 梨状窩 (梨状陥凹) 気 管 ビデオをご覧ください vocal cord piriform fossa
7.
調音:音を形作る ● 調音 articulation ● 調音位置 Place
of articulatuon ● 調音様式 Manner of articulation
8.
調音:音を形作る ●調音位置 Place of articulation ●母音
vowels ●前舌 / 中舌 / 後舌 ●Tongue front - back ●子音 consonants ●喉頭 grottal ●咽頭 pharyngeal ●舌背 velar - palatal ●歯 alveolar - dental ●唇 labial
9.
調音:音を形作る ●調音様式 Method of articulation –破裂音
plosive –鼻音 nasal –摩擦音 fricative –流音 liquid –はじき音 flap/tap –ふるえ音 trill –破擦音 affricate ビデオをご覧ください
10.
IPA: 音韻の表記法 ● 母音
(Wikipedia より ) ● 半母音 (semivowel) [w], [j]
11.
IPA: 音韻の表記法 ● 子音
(Wikipedia より )
12.
IPA :音韻の表記法 ● 変な発音
(Wikipedia より )
13.
音韻 (phone) と音素
(phoneme) ● 音韻:人間が発声する、区別できる音 ● 言語によらない ● すべての言語ですべての音韻を言語的に区別す るわけではない – 複数の音韻が区別されない(異音) – 言語として使われない音韻がある ● 音素:言語的に区別される音の最小単位 ● 音韻と必ずしも一対一に対応しない ● 例 : いろいろな「ん」の音韻(音素は一つ) – あんがい [ŋ] / あんざい [n] / あんばい [m]
14.
音素 (phoneme) と音節
(syllable) ● 音節 (syllable) :子音 (C) と母音 (V) からなる音 の塊 (cluster) ● happiness [hæ-pi-nis] 3 音節 ● unscramble [ʌn-skræm-bəl] 3 音節 ● 音節の構造 ● 0 個以上の子音 ● 母音(長母音、多重母音) ● 0 個以上の子音 ● 長い音節例: scratched [skræʧt] CCCVCC
15.
音声の生成と音声波形 ● 音声の生成は物理的にどういう過程か ● 音声波形の特徴はどこにあるのか ●
音声の特徴と発音の関係は
16.
音響管モデル ● 人間の発声機構は 管楽器に似ている 声 帯
声 道 喉 頭 唇 鼻 腔 声の高さ 発声内容 個人性
17.
音韻性と個人性 声 帯 声
道 喉 頭 唇 鼻 腔 この辺の形は 自分で制御できる
18.
音韻性と個人性 声 帯 声
道 喉 頭 唇 鼻 腔 この辺の形,全体の長さ,平均 的な太さなどは自分で制御できな い
19.
音声の波形 ● 結構複雑です /a/ /i/
/u/ /o//e/
20.
音声の波形 ● 複雑だけどおおむね周期的 基本周期 基本周期 T
[s] 基本周波数 F0 [Hz] = 1/T
21.
いろいろな「あ」 ● 基本周波数の違う2つの /a/ ●
音韻としては同じ:声道の形が同じ(と思われる) ● 波形はまったく異なる ● 物理量の何が同じなのか?
22.
音声のスペクトル ● 2つの「あ」のスペクトル ● 大まかな形が似ている→声道形状 ●
細かいギザギザは異なる→声帯音源波の周波数
23.
音声のスペクトルとフォルマント周 波数 ● F0: 基本周波数 ●
F1,F2,..: フォルマント (formant) 周波数 基 本 周 波 数 ホ ル マ ン ト 周 波 数 F 0 F 1 F 2 F 3 F 4
24.
母音とフォルマント周波数 ●日本語 5 母音はほぼ F1-F2
周波数で説明さ れる ●調音とフォルマント の対応関係 –F1 が舌の位置 (front-back) –F2 があごの開き (open-close) 音声合成デモ
25.
音声の知覚 ● 発声された音声を人間はどう聞いているのか ● 音声信号に含まれる要素 ●
言語情報 (linguistic information) – 言語的な内容(文字に起こせる情報) ● パラ言語情報 (para-linguistic information) – 文字には起こせないが、発話の意味や雰囲気、 ニュアンス、感情などに関係する音声の変化 – 音声の高さ(ピッチ)、強さ(パワー)、母音 の引き延ばし、速さなどが関係している ● 非言語情報 (non-linguistic information) – 自分ではコントロールできない個人性(性別、 体格)
26.
母音の知覚 ● 基本的にはフォルマント周波数による ● 範疇的知覚
(categorical perception)
27.
母音の知覚 ● フォルマント周波数の値だけでなく、その動き が重要
28.
子音の知覚 ● 子音の種類ごとに異なる ● 音韻の長さ ●
スペクトル概形 ● パワーの時間変化 ● 先行・後続母音の影響