Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Shinnosuke Takamichi
866 views
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
音学シンポジウム2021
Technology
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 4
2
/ 4
Most read
3
/ 4
4
/ 4
More Related Content
PDF
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
by
Shinnosuke Takamichi
PDF
音声合成のコーパスをつくろう
by
Shinnosuke Takamichi
PDF
GAN-based statistical speech synthesis (in Japanese)
by
Yuki Saito
PDF
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
by
Shinnosuke Takamichi
PDF
JVS:フリーの日本語多数話者音声コーパス
by
Shinnosuke Takamichi
PDF
深層生成モデルに基づく音声合成技術
by
NU_I_TODALAB
PDF
Neural text-to-speech and voice conversion
by
Yuki Saito
PDF
音情報処理における特徴表現
by
NU_I_TODALAB
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
by
Shinnosuke Takamichi
音声合成のコーパスをつくろう
by
Shinnosuke Takamichi
GAN-based statistical speech synthesis (in Japanese)
by
Yuki Saito
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
by
Shinnosuke Takamichi
JVS:フリーの日本語多数話者音声コーパス
by
Shinnosuke Takamichi
深層生成モデルに基づく音声合成技術
by
NU_I_TODALAB
Neural text-to-speech and voice conversion
by
Yuki Saito
音情報処理における特徴表現
by
NU_I_TODALAB
What's hot
PDF
敵対的学習による統合型ソースフィルタネットワーク
by
NU_I_TODALAB
PDF
研究効率化Tips Ver.2
by
cvpaper. challenge
PDF
統計的音声合成変換と近年の発展
by
Shinnosuke Takamichi
PDF
Moment matching networkを用いた音声パラメータのランダム生成の検討
by
Shinnosuke Takamichi
PPTX
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
by
Daichi Kitamura
PDF
ICASSP 2019での音響信号処理分野の世界動向
by
Yuma Koizumi
PDF
Interspeech2022 参加報告
by
Yuki Saito
PDF
ウィナーフィルタと適応フィルタ
by
Toshihisa Tanaka
PPTX
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
by
Yui Sudo
PPTX
【DL輪読会】時系列予測 Transfomers の精度向上手法
by
Deep Learning JP
PPTX
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
by
Daichi Kitamura
PDF
実環境音響信号処理における収音技術
by
Yuma Koizumi
PDF
【メタサーベイ】数式ドリブン教師あり学習
by
cvpaper. challenge
PPTX
音源分離における音響モデリング(Acoustic modeling in audio source separation)
by
Daichi Kitamura
PDF
音声の声質を変換する技術とその応用
by
NU_I_TODALAB
PDF
機械学習で嘘をつく話
by
Satoshi Hara
PDF
深層学習を利用した音声強調
by
Yuma Koizumi
PDF
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
by
Naoya Takahashi
PDF
高効率音声符号化―MP3詳解―
by
Akinori Ito
PPTX
研究計画発表 完成版
by
Ryota Matsunaga
敵対的学習による統合型ソースフィルタネットワーク
by
NU_I_TODALAB
研究効率化Tips Ver.2
by
cvpaper. challenge
統計的音声合成変換と近年の発展
by
Shinnosuke Takamichi
Moment matching networkを用いた音声パラメータのランダム生成の検討
by
Shinnosuke Takamichi
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
by
Daichi Kitamura
ICASSP 2019での音響信号処理分野の世界動向
by
Yuma Koizumi
Interspeech2022 参加報告
by
Yuki Saito
ウィナーフィルタと適応フィルタ
by
Toshihisa Tanaka
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
by
Yui Sudo
【DL輪読会】時系列予測 Transfomers の精度向上手法
by
Deep Learning JP
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
by
Daichi Kitamura
実環境音響信号処理における収音技術
by
Yuma Koizumi
【メタサーベイ】数式ドリブン教師あり学習
by
cvpaper. challenge
音源分離における音響モデリング(Acoustic modeling in audio source separation)
by
Daichi Kitamura
音声の声質を変換する技術とその応用
by
NU_I_TODALAB
機械学習で嘘をつく話
by
Satoshi Hara
深層学習を利用した音声強調
by
Yuma Koizumi
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
by
Naoya Takahashi
高効率音声符号化―MP3詳解―
by
Akinori Ito
研究計画発表 完成版
by
Ryota Matsunaga
More from Shinnosuke Takamichi
PDF
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
by
Shinnosuke Takamichi
PDF
テキスト音声合成技術と多様性への挑戦 (名古屋大学 知能システム特論)
by
Shinnosuke Takamichi
PDF
音声コーパス設計と次世代音声研究に向けた提言
by
Shinnosuke Takamichi
PDF
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
by
Shinnosuke Takamichi
PDF
短時間発話を用いた話者照合のための音声加工の効果に関する検討
by
Shinnosuke Takamichi
PPTX
多様なカートシスを持つ雑音に対応した低ミュージカルノイズ DNN 音声強調
by
Shinnosuke Takamichi
PDF
論文紹介 Unsupervised training of neural mask-based beamforming
by
Shinnosuke Takamichi
PDF
統計的ボイチェン研究事情
by
Shinnosuke Takamichi
PDF
P J S: 音素バランスを考慮した日本語歌声コーパス
by
Shinnosuke Takamichi
PDF
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
by
Shinnosuke Takamichi
PDF
国際会議 interspeech 2020 報告
by
Shinnosuke Takamichi
PDF
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
by
Shinnosuke Takamichi
PDF
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
by
Shinnosuke Takamichi
PDF
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
by
Shinnosuke Takamichi
PDF
音声合成研究を加速させるためのコーパスデザイン
by
Shinnosuke Takamichi
PDF
End-to-end 韻律推定に向けた DNN 音響モデルに基づく subword 分割
by
Shinnosuke Takamichi
PDF
音声合成・変換の国際コンペティションへの 参加を振り返って
by
Shinnosuke Takamichi
PDF
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
by
Shinnosuke Takamichi
PDF
論文紹介 Building the Singapore English National Speech Corpus
by
Shinnosuke Takamichi
PDF
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
by
Shinnosuke Takamichi
リアルタイムDNN音声変換フィードバックによるキャラクタ性の獲得手法
by
Shinnosuke Takamichi
テキスト音声合成技術と多様性への挑戦 (名古屋大学 知能システム特論)
by
Shinnosuke Takamichi
音声コーパス設計と次世代音声研究に向けた提言
by
Shinnosuke Takamichi
サブバンドフィルタリングに基づくリアルタイム広帯域DNN声質変換の実装と評価
by
Shinnosuke Takamichi
短時間発話を用いた話者照合のための音声加工の効果に関する検討
by
Shinnosuke Takamichi
多様なカートシスを持つ雑音に対応した低ミュージカルノイズ DNN 音声強調
by
Shinnosuke Takamichi
論文紹介 Unsupervised training of neural mask-based beamforming
by
Shinnosuke Takamichi
統計的ボイチェン研究事情
by
Shinnosuke Takamichi
P J S: 音素バランスを考慮した日本語歌声コーパス
by
Shinnosuke Takamichi
差分スペクトル法に基づく DNN 声質変換の計算量削減に向けたフィルタ推定
by
Shinnosuke Takamichi
国際会議 interspeech 2020 報告
by
Shinnosuke Takamichi
音響モデル尤度に基づくsubword分割の韻律推定精度における評価
by
Shinnosuke Takamichi
話者V2S攻撃: 話者認証から構築される 声質変換とその音声なりすまし可能性の評価
by
Shinnosuke Takamichi
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
by
Shinnosuke Takamichi
音声合成研究を加速させるためのコーパスデザイン
by
Shinnosuke Takamichi
End-to-end 韻律推定に向けた DNN 音響モデルに基づく subword 分割
by
Shinnosuke Takamichi
音声合成・変換の国際コンペティションへの 参加を振り返って
by
Shinnosuke Takamichi
ユーザ歌唱のための generative moment matching network に基づく neural double-tracking
by
Shinnosuke Takamichi
論文紹介 Building the Singapore English National Speech Corpus
by
Shinnosuke Takamichi
Interspeech 2020 読み会 "Incremental Text to Speech for Neural Sequence-to-Sequ...
by
Shinnosuke Takamichi
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
1.
日本語オーディオブック・ 紙芝居朗読音声コーパス (東京大学 高道慎之介) 概要 ● 音声合成の難タスクを整備 ●
感情豊かなコーパスを作成 ● 無償で公開中 内容物 ● 小説25作品・紙芝居17作品 ● 声優による音声9時間 ● 刊行物の挿絵・平絵画像 評価 ● 音声合成モデルを学習 ● 文章構造を利用して音質改善 展望 ● 言語理解に基づく音声合成 ● 画像理解に基づく音声合成 ● 音声理解に基づく画像合成 概要 ● 高難易度な音声合成タスクとコーパスを整備したい ○ 普通の短文読み上げ音声は十分に高品質化した ○ タスクを定め,誰でも使えるコーパスを提供したい ○ ● オーディオブック音声合成 ○ 多様な感情,キャラクタ,情景 ○ 短文読み上げよりも深い言語理解が必要 ○ ● J-KAC (Japanese Kamishibai and audiobook corpus) ○ 小説25作品,紙芝居17作品 ○ 章・節・段落などに構造化されたテキスト ○ 男性声優1名による9時間の音声 ■ オーディオブック音声合成の国際コンペの量と同程度 ○ 刊行物の挿絵・平絵 ○ 無償で公開中 (リンクは論文を参照)
2.
日本語オーディオブック・ 紙芝居朗読音声コーパス (東京大学 高道慎之介) 概要 ● 音声合成の難タスクを整備 ●
感情豊かなコーパスを作成 ● 無償で公開中 内容物 ● 小説25作品・紙芝居17作品 ● 声優による音声9時間 ● 刊行物の挿絵・平絵画像 評価 ● 音声合成モデルを学習 ● 文章構造を利用して音質改善 展望 ● 言語理解に基づく音声合成 ● 画像理解に基づく音声合成 ● 音声理解に基づく画像合成 内容物 ● 作品の選定 (抜粋) ○ 文と絵の著作権が消滅した小説 (左表) … 青空文庫など ○ 著作権の存続している紙芝居(右表) … 著者の許諾を得て利用 ● 音声収録と後処理 ○ 文章を章・段落などに構造化 ○ 再帰CTCセグメンテーションで文 アライメントを獲得 ● 挿絵・平絵 ○ キャラクタや情景の画像 ○ 著者と出版社の許諾のもとで スキャンしてディジタル化 著者 (文・絵) タイトル 田中六大 むしにごようじん 大島妙子 おばけいぬの おハナちゃん ようふゆか ありくんとかえるくん 著者 (文) タイトル 新美南吉 ごん狐 楠山正雄 花咲かじじい 太宰治 桜桃 chapt000: # 章 parag000: # 段落 style000: # 文種 sent: ある日の事でございます。 time: [0.96, 3.32] # 開始終了時刻 [蜘蛛の糸.yaml (芥川龍之介)] 宮沢 賢治(作) 茂田井 武(絵) 福音館書店(刊) “セロひきのゴーシュ” 終盤の演奏場面
3.
日本語オーディオブック・ 紙芝居朗読音声コーパス (東京大学 高道慎之介) 概要 ● 音声合成の難タスクを整備 ●
感情豊かなコーパスを作成 ● 無償で公開中 内容物 ● 小説25作品・紙芝居17作品 ● 声優による音声9時間 ● 刊行物の挿絵・平絵画像 評価 ● 音声合成モデルを学習 ● 文章構造を利用して音質改善 展望 ● 言語理解に基づく音声合成 ● 画像理解に基づく音声合成 ● 音声理解に基づく画像合成 評価 ● コーパスで音声合成モデルを学習して評価 ○ 構造化テキストで得られる隣接文は,音声合成に有効か? ○ 言語モデルBERT [Devlin19] &音声合成モデルTacotron2 [Shen18] ■ 詳細は既発表原稿[中田21] と本原稿参照 当該文だけを使って音声合成 隣接文も使って音声合成 0.302 vs 0.698 (朗読としての適切さに関するプリファレンス ABテスト.40名が参加)
4.
日本語オーディオブック・ 紙芝居朗読音声コーパス (東京大学 高道慎之介) 概要 ● 音声合成の難タスクを整備 ●
感情豊かなコーパスを作成 ● 無償で公開中 内容物 ● 小説25作品・紙芝居17作品 ● 声優による音声9時間 ● 刊行物の挿絵・平絵画像 評価 ● 音声合成モデルを学習 ● 文章構造を利用して音質改善 展望 ● 言語理解に基づく音声合成 ● 画像理解に基づく音声合成 ● 音声理解に基づく画像合成 展望 ● 言語理解に基づく音声合成 ○ 物語の文脈を理解して音声に反映? ○ 文章からキャラクタ,感情,情景を推定 ○ ● 画像理解に基づく音声合成 ○ 画像で人物や情景情報を補助? ○ 例:“セロひきのゴーシュ”の演奏会の画像を見ると 我々は観客の規模と声援を想像できる ○ ● 音声言語理解に基づく画像合成 ○ 合成音声に同期して絵を動かす? ○ 例:演奏シーンに同期して,画像のゴーシュ (演奏者)を動かす?
Download