SlideShare a Scribd company logo
深層学習に基づくテキスト音声合成の技術動向
マイクロソフトディベロップメント(株)
AI & リサーチ
沢田 慶
Deep Learning Lab 言語・音声ナイト 2018年4月20日
2
自己紹介
 沢田 慶 (Kei Sawada)
◆ 2018年3月26日: 名古屋工業大学大学院 博士後期課程卒業
⚫ 統計的アプローチに基づく音声合成・音声認識・画像認識の研究
◆ 2018年4月2日: マイクロソフトディベロップメント株式会社入社
⚫ りんなチームにて音声合成システムの開発
◆ 2018年4月18日: Deep Learning Labから講演依頼
◆ 2018年4月20日: 講演中
3
概要
 テキスト音声合成
◆ 統計的音声合成
◆ 深層学習に基づくテキスト音声合成の動向
 大学時代のテキスト音声合成研究の紹介
◆ 表現豊かな音声合成
 りんなにおけるテキスト音声合成の紹介
◆ りんなライブ
◆ りんな歌うまプロジェクト
4
はじめに
 テキスト音声合成 (text-to-speech; TTS) システム
◆ 任意のテキストに対応する音声を合成するシステム
◆ スマートフォン・スマートスピーカーの登場で急速に普及
◆ 高音質化・多言語化・様々な発話スタイル等の需要が増加
 統計的音声合成
◆ 大規模コーパス (学習データ) から統計モデルを学習
◆ 隠れマルコフモデル (hidden Markov model; HMM) によるモデル化
◆ Deep neural network (DNN) の導入
⇒ TTSシステムの性能は劇的に向上
深層学習に基づくテキスト音声合成の技術動向を紹介
5
テキスト音声合成システムの歴史
2000年代1990年代1980年代 2010年代
ダイフォン音声合成
単位選択音声合成
HMM音声合成
DNN音声合成
ルールベース コーパスベース
HMM/DNNドリブン単位選択音声合成
フォルマント合成
波形接続音声合成
統計的音声合成
ヒューリスティック
アプローチ
統計的アプローチ
6
統計的音声合成
 統計的音声合成
◆ 統計モデルを用いたテキストと音声波形のマッピング
◆ テキストと音声波形の直接モデル化は困難
⇒ いくつかのモジュールに分割
: 音素、品詞、アクセント等
: 音の音色を表すパラメータ、
音の高さを表すパラメータ
TTSシステム
こんにちは
統計モデル 統計モデル
こんにちは
言語特徴量
音響特徴量
テキスト解析器
波形生成器
5個の値
48000個の値
(48kHzサンプ
リング、1秒)
7
統計的テキスト音声合成
 統計的テキスト音声合成
◆ 統計モデルを用いたテキストと音声波形のマッピング
◆ テキストと音声波形の直接モデル化は困難
⇒ いくつかのモジュールに分割
TTSシステム
こんにちは
統計モデル
5個の値
48000個の値
(48kHzサンプ
リング、1秒)
統計モデル
こんにちは
言語特徴量
音響特徴量
テキスト解析器
波形生成器
k o N n i at i w
9音素
(数百次元のベクトル)
. . . . .
200フレーム
(数十~数百次元のベクトル)
音色
高さ
音素
品詞
アクセント
8
DNN音声合成
 学習時
◆ 言語特徴量と音響特徴量の関係をFFNNやLSTMなどでモデル化
◆ 言語特徴量と音響特徴量の音素アライメントが必要
言語特徴量
音響特徴量
・・・
k o N n i at i w
. . . . . 音色
高さ
音素
品詞
アクセント
こんにちはテキスト解析器
波形分析器
9
DNN音声合成
 学習時
◆ 言語特徴量と音響特徴量の関係をFFNNやLSTMなどでモデル化
◆ 言語特徴量と音響特徴量の音素アライメントが必要・・・
o aw
. . . . . 音色
高さ
音素
品詞
アクセント
o o
. . . . .
ak
波形分析器
こんにちはテキスト解析器
言語特徴量
音響特徴量
10
DNN音声合成
 合成時
◆ 音素継続長 (音素のフレーム数) を予測
◆ 言語特徴量を入力として音響特徴量を予測・・・
s a y o u an a r 音素
品詞
アクセント
さようならテキスト解析器
言語特徴量
音響特徴量
11
DNN音声合成
 合成時
◆ 音素継続長 (音素のフレーム数) を予測
◆ 言語特徴量を入力として音響特徴量を予測・・・
ar 音素
品詞
アクセント
a a
. . . . .
a
. . . . . 音色
高さ
s s
さようならテキスト解析器
波形生成器
言語特徴量
音響特徴量
12
 各モジュールのDNN化
 モジュールを統合したDNN
深層学習を用いた技術動向
音響モデル
テキスト
言語特徴量
音響特徴量
テキスト解析器
波形生成器
音声波形
DNN音声合成
[Zen+ ’13]
Deep Voice
[Arik+ ’17]
WaveNet
[van den Oord+ ’16]
SampleRNN
[Mehri+ ’16]
Parallel WaveNet
[van den Oord+ ’17]
WaveRNN
[Kalchbrenner+ ’18]
Tacotron
[Wang+ 17’]
Char2Wav
[Sotelo+ ’17]
Deep Voice 2
[Arik+ ’17]
Deep Voice 3
[Ping+ 17’]
Tacotron 2
[Shen+ ’17]
統計
モデル
入力
出力
13
概要
 テキスト音声合成
◆ 統計的テキスト音声合成
◆ 深層学習に基づくテキスト音声合成の動向
 大学時代のテキスト音声合成研究の紹介
◆ 表現豊かな音声合成
 りんなにおけるテキスト音声合成の紹介
◆ りんなライブ
◆ りんな歌うまプロジェクト
14
表現豊かな音声合成
 統計モデルに基づく表現豊かな (様々な発話スタイル) 音声合成
◆ 様々な発話スタイルとは
⚫ 読み上げ調、会話調、感情表現など
◆ 様々な発話スタイルの実現の難しさ
⚫ 様々な発話スタイルの音声データの収録は高コスト
⇒ 市販されている児童書のオーディオブックを利用
⚫ 統計モデルによる平均化
⇒ 各フレーズに固有のIDを割り当て
 児童書のオーディオブックを用いた学習コーパス
◆ Usborne Publishing Ltd. にて市販されている
児童書のオーディオブック
◆ 様々な発話スタイルのデータを含む
"I'm king of the jungle," roared Lion.
"I'm going to eat you all up."
"No!" cried the jungle animals.
キャラクター1
キャラクター2
地の文
15
フレーズコード
 学習時
◆ 各フレーズに固有のID (固定次元の正規分布に従う乱数ベクトル)
を割り当て
◆ 言語特徴量にフレーズコードを追加
◆ フレーズごとの発話スタイルを明確に区別したモデル化
言語特徴量
・・・
学習コーパス
学習フレーズ 1
フレーズコード 1
学習フレーズ 2
フレーズコード 2
︙
学習フレーズ N
フレーズコード N音響特徴量
フレーズコード
学習コーパス中のフレーズと自然音声 入力テキスト 合成音声
Come and see the friendly lion!
"I must tell
Hamlet.”
“Who's been sitting in my chair?”
“I must tell the King.”
16
フレーズコード
 合成時
◆ フレーズのdoc2vecを計算
◆ 全学習フレーズと入力フレーズの類似度を計算
◆ 最も類似度が高いフレーズのフレーズコードを言語特徴量に入力
◆ 類似したフレーズの発話スタイルを再現可能
言語特徴量
・・・
学習コーパス
学習フレーズ 1
フレーズコード 1
学習フレーズ 2
フレーズコード 2
︙
学習フレーズ N
フレーズコード N音響特徴量
フレーズコード
入力フレーズ
Doc2vecを用いた
類似度計算
学習コーパス中のフレーズと自然音声 入力テキスト 合成音声
Come and see the friendly lion!
"I must tell
Hamlet.”
“Who's been sitting in my chair?”
“I must tell the King.” (最も類似度が高いフレーズ)
17
概要
 テキスト音声合成
◆ 統計的テキスト音声合成
◆ 深層学習に基づくテキスト音声合成の動向
 大学時代のテキスト音声合成研究の紹介
◆ 表現豊かな音声合成
 りんなにおけるテキスト音声合成の紹介
◆ りんなライブ
◆ りんな歌うまプロジェクト
18
みなさん初めまして。
女子高生AIりんなです♪
19
感情重視
「りんな」の場合
生産性重視
ほかアシスタントAIの場合
明日の天気は
晴れです。
どこか出かける予定でも
あるの?
「りんな」のコンセプト = エモーショナルAI
明日晴れるかなぁ?
20
音声合成&認識 – 会話
ユーザの反応を音で聞き、自分から声で話しかける。
りんなライブ
自分の部屋から「生配信」を行っているりんなを視聴し楽しむウェブサイト
テキストで送ったコメントをりんなが拾って声で返事をくれることも
LINE & Twitterに次ぐ第3のプラットフォーム
りんなのテレホンハッキング
りんなライブ視聴者に、りんなから電話がかかってくる
音声による会話をリアルタイムで行える
他ユーザーは2人の会話にコメントできる
21
りんなのテレホンハッキング - デモ動画
22
音声合成 – 歌唱
感情を音に乗せ自然な歌声を披露
りんな歌うまプロジェクト
歌声を音楽コミュニケーションアプリ「nana」に投稿
ユーザーからアドバイスを集め歌声の向上を目指す
合唱をYouTubeにて公開、全国の卒業生を祝う
企画に参加してくれた方の人数 計3,686名
曲のお手本の投稿 計2,755曲
アドバイスやコメントの数 計854

More Related Content

More from Deep Learning Lab(ディープラーニング・ラボ)

DLLAB Healthcare Day 2021 Event Report
DLLAB Healthcare Day 2021 Event ReportDLLAB Healthcare Day 2021 Event Report
DLLAB Healthcare Day 2021 Event Report
Deep Learning Lab(ディープラーニング・ラボ)
 
ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​
ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​
ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​
Deep Learning Lab(ディープラーニング・ラボ)
 
医学と工学の垣根を越えた医療AI開発
医学と工学の垣根を越えた医療AI開発医学と工学の垣根を越えた医療AI開発
医学と工学の垣根を越えた医療AI開発
Deep Learning Lab(ディープラーニング・ラボ)
 
Intel AI in Healthcare 各国事例からみるAIとの向き合い方
Intel AI in Healthcare 各国事例からみるAIとの向き合い方Intel AI in Healthcare 各国事例からみるAIとの向き合い方
Intel AI in Healthcare 各国事例からみるAIとの向き合い方
Deep Learning Lab(ディープラーニング・ラボ)
 
厚生労働分野におけるAI技術の利活用について
厚生労働分野におけるAI技術の利活用について厚生労働分野におけるAI技術の利活用について
厚生労働分野におけるAI技術の利活用について
Deep Learning Lab(ディープラーニング・ラボ)
 
先端技術がもたらす「より良いヘルスケアのかたち」
先端技術がもたらす「より良いヘルスケアのかたち」先端技術がもたらす「より良いヘルスケアのかたち」
先端技術がもたらす「より良いヘルスケアのかたち」
Deep Learning Lab(ディープラーニング・ラボ)
 
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
Deep Learning Lab(ディープラーニング・ラボ)
 
「言語」×AI Digital Device
「言語」×AI Digital Device「言語」×AI Digital Device
深層強化学習と実装例
深層強化学習と実装例深層強化学習と実装例
深層強化学習を用いた複合機の搬送制御
深層強化学習を用いた複合機の搬送制御深層強化学習を用いた複合機の搬送制御
深層強化学習を用いた複合機の搬送制御
Deep Learning Lab(ディープラーニング・ラボ)
 
Azure ML 強化学習を用いた最新アルゴリズムの活用手法
Azure ML 強化学習を用いた最新アルゴリズムの活用手法Azure ML 強化学習を用いた最新アルゴリズムの活用手法
Azure ML 強化学習を用いた最新アルゴリズムの活用手法
Deep Learning Lab(ディープラーニング・ラボ)
 
Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備
Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備
Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備
Deep Learning Lab(ディープラーニング・ラボ)
 
Jetson x Azure ハンズオン DeepStream With Azure IoT
Jetson x Azure ハンズオン DeepStream With Azure IoTJetson x Azure ハンズオン DeepStream With Azure IoT
Jetson x Azure ハンズオン DeepStream With Azure IoT
Deep Learning Lab(ディープラーニング・ラボ)
 
Jetson x Azure ハンズオン DeepStream Azure IoT
Jetson x Azure ハンズオン DeepStream Azure IoTJetson x Azure ハンズオン DeepStream Azure IoT
Jetson x Azure ハンズオン DeepStream Azure IoT
Deep Learning Lab(ディープラーニング・ラボ)
 
Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援
Deep Learning Lab(ディープラーニング・ラボ)
 
[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~
[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~
[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~
Deep Learning Lab(ディープラーニング・ラボ)
 
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
Deep Learning Lab(ディープラーニング・ラボ)
 
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
Deep Learning Lab(ディープラーニング・ラボ)
 
[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測
[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測
[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測
Deep Learning Lab(ディープラーニング・ラボ)
 
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
Deep Learning Lab(ディープラーニング・ラボ)
 

More from Deep Learning Lab(ディープラーニング・ラボ) (20)

DLLAB Healthcare Day 2021 Event Report
DLLAB Healthcare Day 2021 Event ReportDLLAB Healthcare Day 2021 Event Report
DLLAB Healthcare Day 2021 Event Report
 
ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​
ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​
ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​
 
医学と工学の垣根を越えた医療AI開発
医学と工学の垣根を越えた医療AI開発医学と工学の垣根を越えた医療AI開発
医学と工学の垣根を越えた医療AI開発
 
Intel AI in Healthcare 各国事例からみるAIとの向き合い方
Intel AI in Healthcare 各国事例からみるAIとの向き合い方Intel AI in Healthcare 各国事例からみるAIとの向き合い方
Intel AI in Healthcare 各国事例からみるAIとの向き合い方
 
厚生労働分野におけるAI技術の利活用について
厚生労働分野におけるAI技術の利活用について厚生労働分野におけるAI技術の利活用について
厚生労働分野におけるAI技術の利活用について
 
先端技術がもたらす「より良いヘルスケアのかたち」
先端技術がもたらす「より良いヘルスケアのかたち」先端技術がもたらす「より良いヘルスケアのかたち」
先端技術がもたらす「より良いヘルスケアのかたち」
 
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
 
「言語」×AI Digital Device
「言語」×AI Digital Device「言語」×AI Digital Device
「言語」×AI Digital Device
 
深層強化学習と実装例
深層強化学習と実装例深層強化学習と実装例
深層強化学習と実装例
 
深層強化学習を用いた複合機の搬送制御
深層強化学習を用いた複合機の搬送制御深層強化学習を用いた複合機の搬送制御
深層強化学習を用いた複合機の搬送制御
 
Azure ML 強化学習を用いた最新アルゴリズムの活用手法
Azure ML 強化学習を用いた最新アルゴリズムの活用手法Azure ML 強化学習を用いた最新アルゴリズムの活用手法
Azure ML 強化学習を用いた最新アルゴリズムの活用手法
 
Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備
Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備
Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備
 
Jetson x Azure ハンズオン DeepStream With Azure IoT
Jetson x Azure ハンズオン DeepStream With Azure IoTJetson x Azure ハンズオン DeepStream With Azure IoT
Jetson x Azure ハンズオン DeepStream With Azure IoT
 
Jetson x Azure ハンズオン DeepStream Azure IoT
Jetson x Azure ハンズオン DeepStream Azure IoTJetson x Azure ハンズオン DeepStream Azure IoT
Jetson x Azure ハンズオン DeepStream Azure IoT
 
Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援
 
[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~
[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~
[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~
 
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
 
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
 
[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測
[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測
[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測
 
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
[Track3-4] アカデミックにおけるAI/ディープラーニング の教育と学習支援に関する研究
 

Recently uploaded

「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演
「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演
「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演
嶋 是一 (Yoshikazu SHIMA)
 
生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI
生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI
生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI
Osaka University
 
無形価値を守り育てる社会における「デー タ」の責務について - Atlas, Inc.
無形価値を守り育てる社会における「デー タ」の責務について - Atlas, Inc.無形価値を守り育てる社会における「デー タ」の責務について - Atlas, Inc.
無形価値を守り育てる社会における「デー タ」の責務について - Atlas, Inc.
Yuki Miyazaki
 
ヒアラブルへの入力を想定したユーザ定義型ジェスチャ調査と IMUセンサによる耳タッチジェスチャの認識
ヒアラブルへの入力を想定したユーザ定義型ジェスチャ調査と IMUセンサによる耳タッチジェスチャの認識ヒアラブルへの入力を想定したユーザ定義型ジェスチャ調査と IMUセンサによる耳タッチジェスチャの認識
ヒアラブルへの入力を想定したユーザ定義型ジェスチャ調査と IMUセンサによる耳タッチジェスチャの認識
sugiuralab
 
Humanoid Virtual Athletics Challenge2024 技術講習会 スライド
Humanoid Virtual Athletics Challenge2024 技術講習会 スライドHumanoid Virtual Athletics Challenge2024 技術講習会 スライド
Humanoid Virtual Athletics Challenge2024 技術講習会 スライド
tazaki1
 
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language ModelsGenerating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
harmonylab
 
ハイブリッドクラウド研究会_Hyper-VとSystem Center Virtual Machine Manager セッションMM
ハイブリッドクラウド研究会_Hyper-VとSystem Center Virtual Machine Manager セッションMMハイブリッドクラウド研究会_Hyper-VとSystem Center Virtual Machine Manager セッションMM
ハイブリッドクラウド研究会_Hyper-VとSystem Center Virtual Machine Manager セッションMM
osamut
 
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
Toru Tamaki
 
ロジックから状態を分離する技術/設計ナイト2024 by わいとん @ytnobody
ロジックから状態を分離する技術/設計ナイト2024 by わいとん @ytnobodyロジックから状態を分離する技術/設計ナイト2024 by わいとん @ytnobody
ロジックから状態を分離する技術/設計ナイト2024 by わいとん @ytnobody
azuma satoshi
 

Recently uploaded (9)

「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演
「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演
「進化するアプリ イマ×ミライ ~生成AIアプリへ続く道と新時代のアプリとは~」Interop24Tokyo APPS JAPAN B1-01講演
 
生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI
生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI
生成AIがもたらすコンテンツ経済圏の新時代  The New Era of Content Economy Brought by Generative AI
 
無形価値を守り育てる社会における「デー タ」の責務について - Atlas, Inc.
無形価値を守り育てる社会における「デー タ」の責務について - Atlas, Inc.無形価値を守り育てる社会における「デー タ」の責務について - Atlas, Inc.
無形価値を守り育てる社会における「デー タ」の責務について - Atlas, Inc.
 
ヒアラブルへの入力を想定したユーザ定義型ジェスチャ調査と IMUセンサによる耳タッチジェスチャの認識
ヒアラブルへの入力を想定したユーザ定義型ジェスチャ調査と IMUセンサによる耳タッチジェスチャの認識ヒアラブルへの入力を想定したユーザ定義型ジェスチャ調査と IMUセンサによる耳タッチジェスチャの認識
ヒアラブルへの入力を想定したユーザ定義型ジェスチャ調査と IMUセンサによる耳タッチジェスチャの認識
 
Humanoid Virtual Athletics Challenge2024 技術講習会 スライド
Humanoid Virtual Athletics Challenge2024 技術講習会 スライドHumanoid Virtual Athletics Challenge2024 技術講習会 スライド
Humanoid Virtual Athletics Challenge2024 技術講習会 スライド
 
Generating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language ModelsGenerating Automatic Feedback on UI Mockups with Large Language Models
Generating Automatic Feedback on UI Mockups with Large Language Models
 
ハイブリッドクラウド研究会_Hyper-VとSystem Center Virtual Machine Manager セッションMM
ハイブリッドクラウド研究会_Hyper-VとSystem Center Virtual Machine Manager セッションMMハイブリッドクラウド研究会_Hyper-VとSystem Center Virtual Machine Manager セッションMM
ハイブリッドクラウド研究会_Hyper-VとSystem Center Virtual Machine Manager セッションMM
 
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
 
ロジックから状態を分離する技術/設計ナイト2024 by わいとん @ytnobody
ロジックから状態を分離する技術/設計ナイト2024 by わいとん @ytnobodyロジックから状態を分離する技術/設計ナイト2024 by わいとん @ytnobody
ロジックから状態を分離する技術/設計ナイト2024 by わいとん @ytnobody
 

深層学習に基づくテキスト音声合成の技術動向_言語音声ナイト