SlideShare a Scribd company logo
1 of 33
Download to read offline
機械学習を用いた最近の聴覚研究
上村卓也
NTT コミュニケーション科学基礎研究所
2017.09.10
音響学会サマーセミナー
スライドは後日ここにアップロードします
http://cycentum.com/presentation/asj20170910/
2
2017.09.10
Takuya KOUMURA
⚫上村卓也(こうむらたくや)
⚫NTT コミュニケーション科学基礎研究所
⚫専門分野
⚪機械学習・データ解析
⚪神経科学(電気生理・計算機シミュレーション)
⚪音の心理学(聴覚・発声)
自己紹介
3
2017.09.10
Takuya KOUMURA
⚫機械学習の基礎の基礎の基礎的な考え方の基礎
⚫機械学習を用いた最近の聴覚研究
⚪音の自動認識・生成
⚪データ解析の道具
⚪神経系の計算機モデル
今日のお話
4
2017.09.10
Takuya KOUMURA
機械学習の基礎の基礎の基礎的な考え方の基礎
⚫明日の天気?
⚫データ
⚪今日の気温=23℃ 今日の湿度=16%
⚪過去の気温・湿度
⚪過去の(翌日の)天気
or ?
ある日の
気温(℃)
ある日の
湿度(%)
翌日の
天気
18 14 晴
25 27 雨
18 28 雨
3 38 雨
32 25 晴
33 19 晴
・・・
・・・
・・・
(架空のデータ)
5
2017.09.10
Takuya KOUMURA
ある日の
気温(℃)
ある日の
湿度(%)
翌日の
天気
9 30 雨
26 35 雨
11 11 晴
10 25 晴
28 19 晴
9 17 晴
22 31 晴
23 41 雨
20 21 晴
4 12 晴
4 24 雨
31 30 雨
15 20 晴
ある日の
気温(℃)
ある日の
湿度(%)
翌日の
天気
18 14 晴
25 27 雨
18 28 雨
3 38 雨
32 25 晴
33 19 晴
16 34 雨
3 17 雨
9 35 雨
15 40 雨
2 29 雨
25 11 晴
32 13 晴
今日の気温 & 今日の湿度→明日の天気?
(架空のデータ)
6
2017.09.10
Takuya KOUMURA
今日の気温 & 今日の湿度→明日の天気?
?
?
?
今日の湿度
今日の気温 30℃0℃
40%
10%
7
2017.09.10
Takuya KOUMURA
直線で分けられる?
今日の湿度
今日の気温 30℃0℃
40%
10%
f = 0
f < 0
f > 0
f = w1 + w2 + w0
雨
晴
8
2017.09.10
Takuya KOUMURA
どんな直線?
今日の湿度
今日の気温 30℃0℃
40%
10%
0.05 − 0.15 + 3.00 = 0
0.40 − 0.20 − 2.00 = 0
0.30 + 0.30 − 9.00 = 0
w1 + w2 + w0 = 0
9
2017.09.10
Takuya KOUMURA
どんな直線?
今日の湿度
今日の気温 30℃0℃
40%
10%
10
2017.09.10
Takuya KOUMURA
どんな直線?
今日の湿度
今日の気温 30℃0℃
40%
10%
?
f = 0.05 − 0.15 + 3.00
f < 0 → 雨
f > 0 → 晴
f = 0
線形判別分析
11
2017.09.10
Takuya KOUMURA
未知の値を含んだデータ
気温 湿度 天気?
モデル f = 0.05 − 0.15 + 3.00
f > 0 →
f < 0 →
(線形)
データ
気温 湿度 天気
データの関係を学習 未知の値を予測
w1 + w2 w0
機械学習の基礎の基礎の基礎的な考え方の基礎
⚫モデルを考える
⚫モデルを使ってデータの関係を学習
⚫学習した関係を元に未知の値を予測
12
2017.09.10
Takuya KOUMURA
振幅値 → 発話内容?
時刻(ms)
振幅値
0 650
? ?
あ い う え お
あ い う え お
・・・
・・・
・・・
・・・
・・・
13
2017.09.10
Takuya KOUMURA
振幅値 → 発話内容?
振幅値
0 ms
振幅値
0.1 ms
振幅値
0.2 ms
振幅値
0.3 ms
振幅値
0.4 ms
・・・
振幅値
650 ms
発話
内容
−0.329 0.409 0.093 1.277 1.493 ・・・ 0.330 ?
−0.002 0.011 0.071 0.326 0.649 0.002 ?
0.030 −0.014 0.005 −0.236 −0.565 ・・・ −0.029 あ
0.497 −0.480 0.821 −0.079 1.318 ・・・ −0.487 い
−0.019 −0.048 −0.294 −0.615 −1.197 ・・・ 0.019 う
−0.066 0.022 −0.339 −0.643 −1.517 ・・・ 0.063 え
−0.212 0.233 −0.158 0.340 0.018 ・・・ 0.210 お
0.400 −0.405 0.490 −0.225 0.423 ・・・ −0.396 あ
0.106 −0.130 0.112 0.166 0.581 ・・・ −0.109 い
0.029 −0.004 0.153 0.283 0.659 ・・・ −0.029 う
−0.011 −0.009 −0.152 −0.380 −0.748 ・・・ 0.011 え
−0.005 0.042 0.079 −0.003 −0.376 ・・・ 0.005 お
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
データ
振幅値(0 ms)
振幅値(0.1 ms)
振幅値(0.2 ms)
︙
振幅値(650 ms)
発話
内容
未知の値を含んだデータ
振幅値(0 ms)
振幅値(0.1 ms)
振幅値(0.2 ms)
︙
振幅値(650 ms)
?
14
2017.09.10
Takuya KOUMURA
振幅値 → 発話内容?
振幅値(時刻 0 ms)
?
?
あ
い
う
え
お
振幅値(時刻0.1ms)
−2 2
−2
2
15
2017.09.10
Takuya KOUMURA
線形モデル
f1
f2
f1 = − 0.82x1 + 4.80x2 + 6.93x3 + …
f2 = + 0.55x1 − 1.68x2 − 0.19x3 + …
?
?
x1 :振幅値(0.0 ms)
x2 :振幅値(0.1 ms)
x3 :振幅値(0.2 ms)
あ
い
う
え
お
−10 10
−10
5
・・・
16
2017.09.10
Takuya KOUMURA
もっと複雑なモデル
?
?
あ
い
う
え
お
f1
f2
−10 5
−5
10
x1 :振幅値(0.0 ms)
x2 :振幅値(0.1 ms)
x3 :振幅値(0.2 ms)
・・・
f1 = −0.02tanh(−0.03x1−0.003x2−0.009x3+ …)−0.08tanh(…
f2 = +0.05tanh(−0.03x1−0.003x2−0.009x3+ …)+0.01tanh(…
17
2017.09.10
Takuya KOUMURA
モデル f1 = x1
f2 = x2
モデル f1 = w1x1 + w1x1 + w2x2 + …
f1 = v1x1 + v1x1 + v2x2 + …
モデル f1 = w1tanh(u1x1+u2x2+u3x3+ …)+w2tanh(…
f2 = v1tanh(s1x1+s2x2+s3x3+ …)+v2tanh(…
データ
振幅値(0 ms)
振幅値(0.1 ms)
振幅値(0.2 ms)
︙
振幅値(650 ms)
発話
内容
未知の値を含んだデータ
振幅値(0 ms)
振幅値(0.1 ms)
振幅値(0.2 ms)
︙
振幅値(650 ms)
データの関係を学習 未知の値を予測
?
未知のデータをより良く予測できるモデルを探す
18
2017.09.10
Takuya KOUMURA
⚫機械学習の基礎の基礎の基礎的な考え方の基礎
⚫機械学習を用いた最近の聴覚研究
⚪音の自動認識・生成
⚪データ解析の道具として
⚪神経系の計算機モデル
今日のお話
音響
19
2017.09.10
Takuya KOUMURA
⚫ 音の自動認識・生成
⚪ Koumura, T. & Okanoya, K. Automatic Recognition of Element Classes and Boundaries in
the Birdsong with Variable Sequences. PLoS One. 2016.
⚪ van den Oord, A. et al. WaveNet: A Generative Model for Raw Audio. arXiv Prepr. 2016.
⚫ データ解析の道具として
⚪ Shiramatsu, T. I., Noda, T., Akutsu, K. & Takahashi, H. Tonotopic and Field-Specific
Representation of Long-Lasting Sustained Activity in Rat Auditory Cortex. Front Neural
Circuits. 2016.
⚪ Koumura, T. & Furukawa, S. Context-Dependent Effect of Reverberation on Material
Perception from Impact Sound. 投稿中.
⚫ 神経系の計算機モデル
⚪ 上村卓也, 寺島裕貴 & 古川茂人. 神経生理学的手法による深層ニューラルネットワークの周波数特
性解析. in 日本音響学会 2017年 秋季研究発表会. 予定.
⚪ Koumura, T. & Okanoya, K. Probabilistic syntax model of the birdsong using a simple
artificial neural network with feedback of the previous sequences. in 31st ICP. 2016.
参考文献
20
2017.09.10
Takuya KOUMURA
データ
振幅値
データの関係を学習
音の自動認識
モデル
発話内容 振幅値
未知の値を予測
発話内容?
未知の値を含んだデータ
データ
振幅値
データの関係を学習
音の生成
モデル
発話内容 振幅値
未知の値を予測
発話内容?
未知の値を含んだデータ
21
2017.09.10
Takuya KOUMURA
音の自動認識
⚫Googleドキュメント
⚪https://www.google.com/intl/ja_jp/docs/about/
22
2017.09.10
Takuya KOUMURA
⚫機械学習の基礎の基礎の基礎的な考え方の基礎
⚫機械学習を用いた最近の音響研究
⚪音の自動認識・生成 99%
⚫機械学習を用いた最近の聴覚研究
⚪データ解析の道具として 1%
⚪神経系の計算機モデル 0.00001%
今日のお話
データ解析の道具として
23
2017.09.10
Takuya KOUMURA
データ 未知の値を含んだデータ
気温 湿度 天気
モデル
データ解析の道具として
?気温 湿度 天気
データの関係を学習 未知の値を予測
f = w1 + w2 + w0
f > 0 →
f < 0 →
24
2017.09.10
Takuya KOUMURA
モデル
データ解析の道具として
⚫データに関係性があるか?
⚫どのデータが重要か?
データ
データの関係を学習
明日の
天気
︙日
照
時
間
降
水
量
湿
度
気
温
未知の値を含んだデータ
未知の値を予測
︙日
照
時
間
降
水
量
湿
度
気
温
f = w1 + w2 + w3 + w4 +
f > 0 →
f < 0 →
?
25
2017.09.10
Takuya KOUMURA
??
木
残響下での聞き取りに重要な音響特徴量は?
残響に
慣れる
音のどのような特徴が重要なのか?
Koumura 投稿中
1.0 (s) 木 or 金属 or ガラス
残響がかかる
26
2017.09.10
Takuya KOUMURA
モデル
データ
残響下での聞き取りに重要な音響特徴量は?
立ち上がり時間 x1
減衰速度 x2
スペクトル幅 x3
ラフネス x4
選ばれた材質
Koumura 投稿中
0.0 0.6
寄与率
残響への慣れ→無し
残響への慣れ→有り
f1
f2
−2 6
−4
2
f1 = −0.032x1+0.707x2+0.707x3+0.003x4
f2 = +0.137x1−0.408x2+0.790x3−0.438x4
木
金属
ガラス
係数から寄与率が計算できる
27
2017.09.10
Takuya KOUMURA
電極位置
音の情報をコードする脳領域
コア
ベルト
電位
時刻
音の情報をコードする脳領域は?
神経活動
モデル 音が鳴っているかどうか
データ
Shiramatsu 2016
Front Neural Circuits
音が鳴っているかどうかを予測できる領域
→ 音の情報が乗っている
28
2017.09.10
Takuya KOUMURA
⚫機械学習の基礎の基礎の基礎的な考え方の基礎
⚫機械学習を用いた最近の音響研究
⚪音の自動認識・生成
⚫機械学習を用いた最近の音響研究
⚪データ解析の道具として
⚪神経系の計算機モデル
今日のお話
29
2017.09.10
Takuya KOUMURA
神経系の計算機モデル
比
較
モデルデータ
発話内容
振幅値
データの
関係を
学習
⚫データの関係を学習した
モデルと、神経活動を比較
⚫「データの関係を学習する
こと」自体の重要性?
おーい
30
2017.09.10
Takuya KOUMURA発話内容
モデル
聴覚神経系の階層性
1層目
2層目
3層目
4層目
5層目
6層目
7層目
8層目
9層目
10層目
11層目
12層目
細胞数
最適変調
周波数(Hz)
1 10 100 1k
最適変調周波数(Hz)
1 10 100 1k変数数
0
20
蝸牛神経核
上オリーブ核
外側毛帯
下丘
内側膝状体
聴覚皮質
Principles of
Neural Science
上村卓也 2017 音響学会
31
2017.09.10
Takuya KOUMURA
神経活動
0
周波数
(kHz)
5
10
0.2 s
モデル
神経活動との直接比較
40
60
80
内部変数
40
60
80
発火頻度(Hz)
Koumura 2016 ICP
?
重回帰
32
2017.09.10
Takuya KOUMURA
⚫機械学習の基礎の基礎の基礎的な考え方の基礎
⚫機械学習を用いた最近の音響研究
⚪音の自動認識・生成
⚫機械学習を用いた最近の音響研究
⚪データ解析の道具として
⚪神経系の計算機モデル
⚫スライドは後日ここにアップロードします
⚪ http://cycentum.com/presentation/asj20170910/
今日のお話
33
2017.09.10
Takuya KOUMURA
⚫NTT
⚪古川茂人
⚪寺島裕貴
⚫東大
⚪岡ノ谷一夫
⚫研究費
⚪ JSPS科研費JP15H05915(新学術領域研究、多元質感知)
謝辞
イラスト素材

More Related Content

More from Takuya Koumura

専修大学 応用心理学入門・心理学102 適応・不適応
専修大学 応用心理学入門・心理学102 適応・不適応専修大学 応用心理学入門・心理学102 適応・不適応
専修大学 応用心理学入門・心理学102 適応・不適応Takuya Koumura
 
専修大学 応用心理学入門・心理学102 パーソナリティ
専修大学 応用心理学入門・心理学102 パーソナリティ専修大学 応用心理学入門・心理学102 パーソナリティ
専修大学 応用心理学入門・心理学102 パーソナリティTakuya Koumura
 
専修大学 応用心理学入門・心理学102 心の発達
専修大学 応用心理学入門・心理学102 心の発達専修大学 応用心理学入門・心理学102 心の発達
専修大学 応用心理学入門・心理学102 心の発達Takuya Koumura
 
言語表現モデルBERTで文章生成してみた
言語表現モデルBERTで文章生成してみた言語表現モデルBERTで文章生成してみた
言語表現モデルBERTで文章生成してみたTakuya Koumura
 
専修大学 応用心理学入門・心理学102 情動
専修大学 応用心理学入門・心理学102 情動専修大学 応用心理学入門・心理学102 情動
専修大学 応用心理学入門・心理学102 情動Takuya Koumura
 
専修大学 応用心理学入門・心理学102 動機づけ
専修大学 応用心理学入門・心理学102 動機づけ専修大学 応用心理学入門・心理学102 動機づけ
専修大学 応用心理学入門・心理学102 動機づけTakuya Koumura
 
専修大学 応用心理学入門・心理学102 オペラント条件づけ
専修大学 応用心理学入門・心理学102 オペラント条件づけ専修大学 応用心理学入門・心理学102 オペラント条件づけ
専修大学 応用心理学入門・心理学102 オペラント条件づけTakuya Koumura
 
専修大学 応用心理学入門・心理学102 学習・古典的条件づけ
専修大学 応用心理学入門・心理学102 学習・古典的条件づけ専修大学 応用心理学入門・心理学102 学習・古典的条件づけ
専修大学 応用心理学入門・心理学102 学習・古典的条件づけTakuya Koumura
 
専修大学 応用心理学入門・心理学102 導入
専修大学 応用心理学入門・心理学102 導入専修大学 応用心理学入門・心理学102 導入
専修大学 応用心理学入門・心理学102 導入Takuya Koumura
 
専修大学 基礎心理学入門・心理学101 脳の区分
専修大学 基礎心理学入門・心理学101 脳の区分専修大学 基礎心理学入門・心理学101 脳の区分
専修大学 基礎心理学入門・心理学101 脳の区分Takuya Koumura
 
専修大学 基礎心理学入門・心理学101 言語
専修大学 基礎心理学入門・心理学101 言語専修大学 基礎心理学入門・心理学101 言語
専修大学 基礎心理学入門・心理学101 言語Takuya Koumura
 
専修大学 基礎心理学入門・心理学101 記憶
専修大学 基礎心理学入門・心理学101 記憶専修大学 基礎心理学入門・心理学101 記憶
専修大学 基礎心理学入門・心理学101 記憶Takuya Koumura
 
専修大学 基礎心理学入門・心理学101 嗅覚・味覚
専修大学 基礎心理学入門・心理学101 嗅覚・味覚専修大学 基礎心理学入門・心理学101 嗅覚・味覚
専修大学 基礎心理学入門・心理学101 嗅覚・味覚Takuya Koumura
 
専修大学 基礎心理学入門・心理学101 耳
専修大学 基礎心理学入門・心理学101 耳専修大学 基礎心理学入門・心理学101 耳
専修大学 基礎心理学入門・心理学101 耳Takuya Koumura
 
専修大学 基礎心理学入門・心理学101 聴覚・音
専修大学 基礎心理学入門・心理学101 聴覚・音専修大学 基礎心理学入門・心理学101 聴覚・音
専修大学 基礎心理学入門・心理学101 聴覚・音Takuya Koumura
 
専修大学 基礎心理学入門・心理学101 視覚神経系
専修大学 基礎心理学入門・心理学101 視覚神経系専修大学 基礎心理学入門・心理学101 視覚神経系
専修大学 基礎心理学入門・心理学101 視覚神経系Takuya Koumura
 
専修大学 基礎心理学入門・心理学101 眼
専修大学 基礎心理学入門・心理学101 眼専修大学 基礎心理学入門・心理学101 眼
専修大学 基礎心理学入門・心理学101 眼Takuya Koumura
 
専修大学 基礎心理学入門・心理学101 視覚
専修大学 基礎心理学入門・心理学101 視覚専修大学 基礎心理学入門・心理学101 視覚
専修大学 基礎心理学入門・心理学101 視覚Takuya Koumura
 
専修大学 基礎心理学入門・心理学101 神経系
専修大学 基礎心理学入門・心理学101 神経系専修大学 基礎心理学入門・心理学101 神経系
専修大学 基礎心理学入門・心理学101 神経系Takuya Koumura
 

More from Takuya Koumura (20)

専修大学 応用心理学入門・心理学102 適応・不適応
専修大学 応用心理学入門・心理学102 適応・不適応専修大学 応用心理学入門・心理学102 適応・不適応
専修大学 応用心理学入門・心理学102 適応・不適応
 
専修大学 応用心理学入門・心理学102 パーソナリティ
専修大学 応用心理学入門・心理学102 パーソナリティ専修大学 応用心理学入門・心理学102 パーソナリティ
専修大学 応用心理学入門・心理学102 パーソナリティ
 
専修大学 応用心理学入門・心理学102 心の発達
専修大学 応用心理学入門・心理学102 心の発達専修大学 応用心理学入門・心理学102 心の発達
専修大学 応用心理学入門・心理学102 心の発達
 
言語表現モデルBERTで文章生成してみた
言語表現モデルBERTで文章生成してみた言語表現モデルBERTで文章生成してみた
言語表現モデルBERTで文章生成してみた
 
専修大学 応用心理学入門・心理学102 情動
専修大学 応用心理学入門・心理学102 情動専修大学 応用心理学入門・心理学102 情動
専修大学 応用心理学入門・心理学102 情動
 
専修大学 応用心理学入門・心理学102 動機づけ
専修大学 応用心理学入門・心理学102 動機づけ専修大学 応用心理学入門・心理学102 動機づけ
専修大学 応用心理学入門・心理学102 動機づけ
 
専修大学 応用心理学入門・心理学102 オペラント条件づけ
専修大学 応用心理学入門・心理学102 オペラント条件づけ専修大学 応用心理学入門・心理学102 オペラント条件づけ
専修大学 応用心理学入門・心理学102 オペラント条件づけ
 
専修大学 応用心理学入門・心理学102 学習・古典的条件づけ
専修大学 応用心理学入門・心理学102 学習・古典的条件づけ専修大学 応用心理学入門・心理学102 学習・古典的条件づけ
専修大学 応用心理学入門・心理学102 学習・古典的条件づけ
 
専修大学 応用心理学入門・心理学102 導入
専修大学 応用心理学入門・心理学102 導入専修大学 応用心理学入門・心理学102 導入
専修大学 応用心理学入門・心理学102 導入
 
Journal Club: VQ-VAE2
Journal Club: VQ-VAE2Journal Club: VQ-VAE2
Journal Club: VQ-VAE2
 
専修大学 基礎心理学入門・心理学101 脳の区分
専修大学 基礎心理学入門・心理学101 脳の区分専修大学 基礎心理学入門・心理学101 脳の区分
専修大学 基礎心理学入門・心理学101 脳の区分
 
専修大学 基礎心理学入門・心理学101 言語
専修大学 基礎心理学入門・心理学101 言語専修大学 基礎心理学入門・心理学101 言語
専修大学 基礎心理学入門・心理学101 言語
 
専修大学 基礎心理学入門・心理学101 記憶
専修大学 基礎心理学入門・心理学101 記憶専修大学 基礎心理学入門・心理学101 記憶
専修大学 基礎心理学入門・心理学101 記憶
 
専修大学 基礎心理学入門・心理学101 嗅覚・味覚
専修大学 基礎心理学入門・心理学101 嗅覚・味覚専修大学 基礎心理学入門・心理学101 嗅覚・味覚
専修大学 基礎心理学入門・心理学101 嗅覚・味覚
 
専修大学 基礎心理学入門・心理学101 耳
専修大学 基礎心理学入門・心理学101 耳専修大学 基礎心理学入門・心理学101 耳
専修大学 基礎心理学入門・心理学101 耳
 
専修大学 基礎心理学入門・心理学101 聴覚・音
専修大学 基礎心理学入門・心理学101 聴覚・音専修大学 基礎心理学入門・心理学101 聴覚・音
専修大学 基礎心理学入門・心理学101 聴覚・音
 
専修大学 基礎心理学入門・心理学101 視覚神経系
専修大学 基礎心理学入門・心理学101 視覚神経系専修大学 基礎心理学入門・心理学101 視覚神経系
専修大学 基礎心理学入門・心理学101 視覚神経系
 
専修大学 基礎心理学入門・心理学101 眼
専修大学 基礎心理学入門・心理学101 眼専修大学 基礎心理学入門・心理学101 眼
専修大学 基礎心理学入門・心理学101 眼
 
専修大学 基礎心理学入門・心理学101 視覚
専修大学 基礎心理学入門・心理学101 視覚専修大学 基礎心理学入門・心理学101 視覚
専修大学 基礎心理学入門・心理学101 視覚
 
専修大学 基礎心理学入門・心理学101 神経系
専修大学 基礎心理学入門・心理学101 神経系専修大学 基礎心理学入門・心理学101 神経系
専修大学 基礎心理学入門・心理学101 神経系
 

機械学習を用いた最近の聴覚研究(日本音響学会サマーセミナー講演資料)