SlideShare a Scribd company logo
即興合奏支援システムのための
スマートフォンセンサーを用いた
身体動作認識手法
水野創太1 一ノ瀬修吾1 白松俊1 北原鉄朗2
1.名古屋工業大学 2.日本大学
本研究の目的と課題
目的
• 演奏未経験者でも背景楽曲と即興合奏できる合奏支援システム
– 難しい要素:調性(コード進行など)→システムが補う
– 簡単な要素: リズム、旋律の上り下がり(旋律線)
→ 身体動作で入力
– [一ノ瀬 16]の先行研究では専用のモーションセンサーで実現していたが
本研究では広く普及したスマートフォンセンサーを用いて実現する
• 将来的には複数人での即興合奏への拡張も想定
本研究の課題
1. ユーザの手の上下動の推定 (ポジショントラッキング)
2. 直感的な動作による発音タイミングの入力方法
3. 不協和にならないように音高を補正
[一ノ瀬 16] 一ノ瀬ら,”調性判断の不要な身体動作入力による即興合奏支援システ
ムの試作”第78回全国大会講演論文集 (2016): 235-236.
手を下げると
音高も下がる
手を上げると
音高も上がる
不協和音に
ならない音を出力
(調性を補う)
音高決定のための2つのアプローチ
ユーザの手の上下動を基に音高決定を行う手法として2手法を検討
アプローチ1 ポジショントラッキング: 加速度センサー,ジャイロセン
サーの値から鉛直方向の位置を推定し,音高を決定
アプローチ2 ポジショントラッキング+機械学習: センサー値とポジショ
ントラッキングの結果を機械学習(例:ベイジアンネットワーク,HMM,
LSTMなど)の入力として利用し音高を決定
ポジショントラッキング
使用するスマートフォンセンサー
• 重力加速度センサー
• 加速度センサー
• ジャイロセンサー
鉛直方向の加速度 ・ 経過時間
移動距離(ユーザの手の上下動)
1. スマートフォンセンサーから手の上下動→音高の上下動を推定
移動距離:p
推定した移動距離を基に音高を変化
ポジショントラッキング精度評価
5人の被験者によってあらかじめ定めた距離(50cm)をスマートフォン
を持って持ち上げた際の移動距離を測定
個人差によって変化(推定精度が低い)
機械学習を使ったアプローチ2を利用
背景楽曲の伴奏音
システムの構成
機械学習(ベイジアンネットワーク)
ユーザ動作と背景楽曲の
コード進行に基づいた出力音名,
発音タイミングを決定
ポジショントラッキング
スマートフォンセンサーによって
ユーザ動作の特徴量を検出
合奏支援システム
ユーザの身体動作
(リズムと旋律線の入力)
背景楽曲の
伴奏音を出力
背景楽曲とユーザの動き
に基づいた音名を予測
(システムによる調性補助)
背景楽曲のコード進行を
ベイジアンネットに入力
検出した特徴量を入力
発音タイミングの入力方法
スマートフォンを振ること
によって発音
• より直感的動作で演奏
できる
• センサー値から検出す
ることが簡単でない
画面内のボタンをタッチする
ことによって発音
• 直感的動作らしさが低い
• 入力手法が簡単なため確
実な発音ができる
タイミング推定と音高補正のための訓練データ
被験者5人に背景楽曲に合わせてスマートフォンを動かしてもらうことでユーザ動作
の特徴量を表すデータ約65000サンプルを取得
これを訓練データとして学習し以下の3要素を予測するベイジアンネットワークを作成
1. 発音タイミング
2. 出力する音名
3. ユーザ動作の上下動
ベイジアンネットワーク(発音タイミング)
入力
ax:x軸方向の加速度
ay:y軸方向の加速度
v:速度
vc:速度の変化量
g:重力加速度
出力
t:発音タイミング(時刻毎に0or1を判定)
演奏におけるリズムの決定
ベイジアンネットワーク(出力音名)
入力
a:y軸方向の加速度
v:速度
vc:速度の変化量
g:重力加速度
p:移動距離
t:発音タイミング
rm:直前m回の最多予測結果
調性などの文脈
c:背景楽曲の伴奏コード
ni-1:1つ前に出力した音名
出力
ni:出力する音名(1~12)
C,ni-1を入力に含めることによって
背景楽曲との調性を満たす音名を予測
ベイジアンネットワーク(ユーザ動作の上下動)
入力
P:移動距離
a:y軸方向の加速度
v:速度
vc:速度の変化量
g:重力加速度
出力
h:ユーザ動作の上下動
(0:変化なし,1:上昇,2:下降)
音名の予測結果と合わせてオクターブ変化
移動距離の定義
ベイジアンネットワークに用いる移動距離を表す入力pの定義を変更
1. 絶対距離: 演奏開始位置からの移動距離
2. 相対距離: 1つ前の発音位置からの移動距離
- ユーザの手の動きと音高変化の一致精度の向上が目的
1回目の
発音タイミング
2回目の
発音タイミング
高さ
時刻
評価実験
実験1. 訓練データで想定したメロディを生成できるか?
- 音名予測の正解率
- 上下動予測の正解率
- 発音タイミング予測の再現率と適合率
実験2. ユーザ動作と合致した音高変化を生成できるか?
- ユーザ動作と音高変化の合致率
訓練データを使ったメロディ生成精度
• 訓練データで想定したメロディを生成できるか?
- 出力する音名とユーザ動作の上下動の予測の正解率を比較
- テストデータと訓練データは同一
- 使用楽曲:エーデルワイス
• 精度を測る粒度
- サンプル単位
- ノート単位
• 発音タイミングの推定についてノート単位での再現率,適合率を確認した.
- 再現率 =
システムの判定した発音タイミングのうち原曲の発音タイミングだった数
原曲の発音タイミングの数
- 適合率 =
システムの判定した発音タイミングのうち原曲の発音タイミングだった数
システムの判定した発音タイミングの数
C
D
E
1ノート(音符単位)
音高
時間
1サンプル(約5ms毎)
1つ目のサンプルの予測結果を
ノート全体の予測結果と仮定
ノート数:3
サンプル数:24
サンプル単位
音名予測の正解率
(正解サンプル数/全サンプル数)
上下動予測の正解率
(正解サンプル数/全サンプル数)
シェイク動作 0.70 (45888/65278) 0.60 (42975/65278)
タッチ動作 0.82 (53764/65251) 0.78 (50909/65251)
実験1の結果
絶対距離 相対距離 絶対距離 相対距離
シェイク動作 0.45 (121/270) 未実験 (今後の課題) 0.56 (152/270) 未実験 (今後の課題)
タッチ動作 0.56 (152/270) 0.71 (192/270) 0.68 (184/270) 0.91 (247/270)
ノート単位
音名予測の正解率
(正解ノート数/全ノート数)
上下動予測の正解率
(正解ノート数/全ノート数)
ユーザ動作と音高変化の合致率評価
ユーザがあらかじめ定めた上下動作を行った際の音高とユーザの動
きそれぞれの上下動の一致率を評価
- 絶対距離,相対距離のそれぞれで比較
- 文脈有. 1つ前の音名を表すni-1を入力に含めた
- 文脈無. 1つ前の音名を表すni-1を入力に含めない場合での精度
- 絶対距離を用いた場合大きな変化はない
- 相対距離を用いた場合は精度の向上が見られた
シェイク動作 絶対距離 相対距離
文脈有 0.48 (31/64)
文脈無 0.53 (34/64)
未実験
(今後の課題)
まとめ
• スマートフォンセンサーを用いて計測したユーザ動作の特徴量から
ユーザの手の上下動を推定するシステムを開発した
• スマートフォンセンサーから取得した値を入力とした発音タイミング
と出力音名を予測するベイジアンネットワークを作成した
– タッチ動作では一定の精度が得られたが,シェイク動作では改善の必要性
• ユーザの直感的動作から背景楽曲に合う音名を出力することで背
景楽曲との即興合奏を行う演奏インターフェースを開発した
今後の課題
• LSTM,HMMなどによる時系列データに適した予測手法の実装
• 複数デバイスでの通信による複数人での同時合奏
• 複数の楽曲による訓練データの作成
• 相対距離を用いたシェイク動作による訓練データ作成
まとめと今後の課題

More Related Content

What's hot

時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?
Fumihiko Takahashi
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
RyuichiKanoh
 
AHC-Lab M1勉強会 論文の読み方・書き方
AHC-Lab M1勉強会 論文の読み方・書き方AHC-Lab M1勉強会 論文の読み方・書き方
AHC-Lab M1勉強会 論文の読み方・書き方
Shinagawa Seitaro
 
確率ロボティクス第12回
確率ロボティクス第12回確率ロボティクス第12回
確率ロボティクス第12回
Ryuichi Ueda
 
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォームAutoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Takuya Azumi
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
cvpaper. challenge
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門
Takuji Tahara
 
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
Deep Learning JP
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向
Motokawa Tetsuya
 
マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向
Koichiro Mori
 
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
joisino
 
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Preferred Networks
 
Transformerを多層にする際の勾配消失問題と解決法について
Transformerを多層にする際の勾配消失問題と解決法についてTransformerを多層にする際の勾配消失問題と解決法について
Transformerを多層にする際の勾配消失問題と解決法について
Sho Takase
 
研究発表のためのプレゼンテーション技術
研究発表のためのプレゼンテーション技術研究発表のためのプレゼンテーション技術
研究発表のためのプレゼンテーション技術
Shinnosuke Takamichi
 
先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15
Yoichi Ochiai
 
Tensorflow Liteの量子化アーキテクチャ
Tensorflow Liteの量子化アーキテクチャTensorflow Liteの量子化アーキテクチャ
Tensorflow Liteの量子化アーキテクチャ
HitoshiSHINABE1
 
画像認識と深層学習
画像認識と深層学習画像認識と深層学習
画像認識と深層学習
Yusuke Uchida
 
tf,tf2完全理解
tf,tf2完全理解tf,tf2完全理解
tf,tf2完全理解
Koji Terada
 
SSII2018TS: 3D物体検出とロボットビジョンへの応用
SSII2018TS: 3D物体検出とロボットビジョンへの応用SSII2018TS: 3D物体検出とロボットビジョンへの応用
SSII2018TS: 3D物体検出とロボットビジョンへの応用
SSII
 
生成モデルの Deep Learning
生成モデルの Deep Learning生成モデルの Deep Learning
生成モデルの Deep Learning
Seiya Tokui
 

What's hot (20)

時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
 
AHC-Lab M1勉強会 論文の読み方・書き方
AHC-Lab M1勉強会 論文の読み方・書き方AHC-Lab M1勉強会 論文の読み方・書き方
AHC-Lab M1勉強会 論文の読み方・書き方
 
確率ロボティクス第12回
確率ロボティクス第12回確率ロボティクス第12回
確率ロボティクス第12回
 
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォームAutoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
Autoware: ROSを用いた一般道自動運転向けソフトウェアプラットフォーム
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
 
backbone としての timm 入門
backbone としての timm 入門backbone としての timm 入門
backbone としての timm 入門
 
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
 
Optimizer入門&最新動向
Optimizer入門&最新動向Optimizer入門&最新動向
Optimizer入門&最新動向
 
マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向
 
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
 
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
 
Transformerを多層にする際の勾配消失問題と解決法について
Transformerを多層にする際の勾配消失問題と解決法についてTransformerを多層にする際の勾配消失問題と解決法について
Transformerを多層にする際の勾配消失問題と解決法について
 
研究発表のためのプレゼンテーション技術
研究発表のためのプレゼンテーション技術研究発表のためのプレゼンテーション技術
研究発表のためのプレゼンテーション技術
 
先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15
 
Tensorflow Liteの量子化アーキテクチャ
Tensorflow Liteの量子化アーキテクチャTensorflow Liteの量子化アーキテクチャ
Tensorflow Liteの量子化アーキテクチャ
 
画像認識と深層学習
画像認識と深層学習画像認識と深層学習
画像認識と深層学習
 
tf,tf2完全理解
tf,tf2完全理解tf,tf2完全理解
tf,tf2完全理解
 
SSII2018TS: 3D物体検出とロボットビジョンへの応用
SSII2018TS: 3D物体検出とロボットビジョンへの応用SSII2018TS: 3D物体検出とロボットビジョンへの応用
SSII2018TS: 3D物体検出とロボットビジョンへの応用
 
生成モデルの Deep Learning
生成モデルの Deep Learning生成モデルの Deep Learning
生成モデルの Deep Learning
 

Viewers also liked

Linked Open Data を用いた シビックテックプロジェクトの 透明性向上と協働促進
Linked Open Data を用いたシビックテックプロジェクトの透明性向上と協働促進Linked Open Data を用いたシビックテックプロジェクトの透明性向上と協働促進
Linked Open Data を用いた シビックテックプロジェクトの 透明性向上と協働促進
Shun Shiramatsu
 
白松研卒論発表_渡辺
白松研卒論発表_渡辺白松研卒論発表_渡辺
白松研卒論発表_渡辺
siramatu-lab
 
社会課題とその解決目標のLOD化による公共圏での協働促進サービス
社会課題とその解決目標のLOD化による公共圏での協働促進サービス社会課題とその解決目標のLOD化による公共圏での協働促進サービス
社会課題とその解決目標のLOD化による公共圏での協働促進サービスShun Shiramatsu
 
東海大会発表 0927
東海大会発表 0927東海大会発表 0927
東海大会発表 0927
IchinoseShugo
 
徘徊高齢者捜索のための BLEビーコンの電波強度分布を用いた 位置推定手法
徘徊高齢者捜索のためのBLEビーコンの電波強度分布を用いた位置推定手法徘徊高齢者捜索のためのBLEビーコンの電波強度分布を用いた位置推定手法
徘徊高齢者捜索のための BLEビーコンの電波強度分布を用いた 位置推定手法
Shun Shiramatsu
 
2017ipsj全国大会発表スライド_福本
2017ipsj全国大会発表スライド_福本2017ipsj全国大会発表スライド_福本
2017ipsj全国大会発表スライド_福本
siramatu-lab
 
東海支部西田
東海支部西田東海支部西田
東海支部西田
nishida-srmtlab
 
2017ipsj全国大会発表スライド_宮脇
2017ipsj全国大会発表スライド_宮脇2017ipsj全国大会発表スライド_宮脇
2017ipsj全国大会発表スライド_宮脇
siramatu-lab
 
2017ipsj全国大会発表スライド_成瀬
2017ipsj全国大会発表スライド_成瀬2017ipsj全国大会発表スライド_成瀬
2017ipsj全国大会発表スライド_成瀬
siramatu-lab
 
東海支部成瀬2
東海支部成瀬2東海支部成瀬2
東海支部成瀬2
masatonaruse
 

Viewers also liked (10)

Linked Open Data を用いた シビックテックプロジェクトの 透明性向上と協働促進
Linked Open Data を用いたシビックテックプロジェクトの透明性向上と協働促進Linked Open Data を用いたシビックテックプロジェクトの透明性向上と協働促進
Linked Open Data を用いた シビックテックプロジェクトの 透明性向上と協働促進
 
白松研卒論発表_渡辺
白松研卒論発表_渡辺白松研卒論発表_渡辺
白松研卒論発表_渡辺
 
社会課題とその解決目標のLOD化による公共圏での協働促進サービス
社会課題とその解決目標のLOD化による公共圏での協働促進サービス社会課題とその解決目標のLOD化による公共圏での協働促進サービス
社会課題とその解決目標のLOD化による公共圏での協働促進サービス
 
東海大会発表 0927
東海大会発表 0927東海大会発表 0927
東海大会発表 0927
 
徘徊高齢者捜索のための BLEビーコンの電波強度分布を用いた 位置推定手法
徘徊高齢者捜索のためのBLEビーコンの電波強度分布を用いた位置推定手法徘徊高齢者捜索のためのBLEビーコンの電波強度分布を用いた位置推定手法
徘徊高齢者捜索のための BLEビーコンの電波強度分布を用いた 位置推定手法
 
2017ipsj全国大会発表スライド_福本
2017ipsj全国大会発表スライド_福本2017ipsj全国大会発表スライド_福本
2017ipsj全国大会発表スライド_福本
 
東海支部西田
東海支部西田東海支部西田
東海支部西田
 
2017ipsj全国大会発表スライド_宮脇
2017ipsj全国大会発表スライド_宮脇2017ipsj全国大会発表スライド_宮脇
2017ipsj全国大会発表スライド_宮脇
 
2017ipsj全国大会発表スライド_成瀬
2017ipsj全国大会発表スライド_成瀬2017ipsj全国大会発表スライド_成瀬
2017ipsj全国大会発表スライド_成瀬
 
東海支部成瀬2
東海支部成瀬2東海支部成瀬2
東海支部成瀬2
 

More from siramatu-lab

高出力BLEビーコンによる 認知症高齢者見守りのための 徘徊経路可視化機構の試作
高出力BLEビーコンによる認知症高齢者見守りのための徘徊経路可視化機構の試作高出力BLEビーコンによる認知症高齢者見守りのための徘徊経路可視化機構の試作
高出力BLEビーコンによる 認知症高齢者見守りのための 徘徊経路可視化機構の試作
siramatu-lab
 
Web 議論の自動ファシリテーションのための事前知識を用いた質問生成手法
Web 議論の自動ファシリテーションのための事前知識を用いた質問生成手法Web 議論の自動ファシリテーションのための事前知識を用いた質問生成手法
Web 議論の自動ファシリテーションのための事前知識を用いた質問生成手法
siramatu-lab
 
Filtering out improper user accounts from twitter user accounts for discoveri...
Filtering out improper user accounts from twitter user accounts for discoveri...Filtering out improper user accounts from twitter user accounts for discoveri...
Filtering out improper user accounts from twitter user accounts for discoveri...
siramatu-lab
 
議題の関連情報推薦によるIBIS構造作成支援システムの試作
議題の関連情報推薦によるIBIS構造作成支援システムの試作議題の関連情報推薦によるIBIS構造作成支援システムの試作
議題の関連情報推薦によるIBIS構造作成支援システムの試作
siramatu-lab
 
Watanabe civictechforum
Watanabe civictechforumWatanabe civictechforum
Watanabe civictechforum
siramatu-lab
 
Supporting System of Improvisational Ensemble Based on User's Motion Using Sm...
Supporting System of Improvisational Ensemble Based on User's Motion Using Sm...Supporting System of Improvisational Ensemble Based on User's Motion Using Sm...
Supporting System of Improvisational Ensemble Based on User's Motion Using Sm...
siramatu-lab
 
Prototype System for Recommending Academic Subjects for Students' Self Design...
Prototype System for Recommending Academic Subjects for Students' Self Design...Prototype System for Recommending Academic Subjects for Students' Self Design...
Prototype System for Recommending Academic Subjects for Students' Self Design...
siramatu-lab
 
Tag-based Approaches to Sharing Background Information regarding Social Probl...
Tag-based Approaches to Sharing Background Information regarding Social Probl...Tag-based Approaches to Sharing Background Information regarding Social Probl...
Tag-based Approaches to Sharing Background Information regarding Social Probl...
siramatu-lab
 
Improvisation Ensemble Support Systems for Music Beginners based on Body Mot...
Improvisation Ensemble Support Systems for Music  Beginners based on Body Mot...Improvisation Ensemble Support Systems for Music  Beginners based on Body Mot...
Improvisation Ensemble Support Systems for Music Beginners based on Body Mot...
siramatu-lab
 
韻律情報による議論の場の空気推定手法の検討
韻律情報による議論の場の空気推定手法の検討韻律情報による議論の場の空気推定手法の検討
韻律情報による議論の場の空気推定手法の検討
siramatu-lab
 
即興合奏時のコード進行をユーザがデザインする機構の検討
即興合奏時のコード進行をユーザがデザインする機構の検討即興合奏時のコード進行をユーザがデザインする機構の検討
即興合奏時のコード進行をユーザがデザインする機構の検討
siramatu-lab
 
BLEビーコンを所持する徘徊高齢者のいち推定結果可視化機構の試作
BLEビーコンを所持する徘徊高齢者のいち推定結果可視化機構の試作BLEビーコンを所持する徘徊高齢者のいち推定結果可視化機構の試作
BLEビーコンを所持する徘徊高齢者のいち推定結果可視化機構の試作
siramatu-lab
 
議論参加者の脳波による議論の場の空気推定手法の検討
議論参加者の脳波による議論の場の空気推定手法の検討議論参加者の脳波による議論の場の空気推定手法の検討
議論参加者の脳波による議論の場の空気推定手法の検討
siramatu-lab
 
視線と表情を用いた議論の場の空気の推定手法の検討
視線と表情を用いた議論の場の空気の推定手法の検討視線と表情を用いた議論の場の空気の推定手法の検討
視線と表情を用いた議論の場の空気の推定手法の検討
siramatu-lab
 
Ikeda ica2017
Ikeda ica2017Ikeda ica2017
Ikeda ica2017
siramatu-lab
 

More from siramatu-lab (15)

高出力BLEビーコンによる 認知症高齢者見守りのための 徘徊経路可視化機構の試作
高出力BLEビーコンによる認知症高齢者見守りのための徘徊経路可視化機構の試作高出力BLEビーコンによる認知症高齢者見守りのための徘徊経路可視化機構の試作
高出力BLEビーコンによる 認知症高齢者見守りのための 徘徊経路可視化機構の試作
 
Web 議論の自動ファシリテーションのための事前知識を用いた質問生成手法
Web 議論の自動ファシリテーションのための事前知識を用いた質問生成手法Web 議論の自動ファシリテーションのための事前知識を用いた質問生成手法
Web 議論の自動ファシリテーションのための事前知識を用いた質問生成手法
 
Filtering out improper user accounts from twitter user accounts for discoveri...
Filtering out improper user accounts from twitter user accounts for discoveri...Filtering out improper user accounts from twitter user accounts for discoveri...
Filtering out improper user accounts from twitter user accounts for discoveri...
 
議題の関連情報推薦によるIBIS構造作成支援システムの試作
議題の関連情報推薦によるIBIS構造作成支援システムの試作議題の関連情報推薦によるIBIS構造作成支援システムの試作
議題の関連情報推薦によるIBIS構造作成支援システムの試作
 
Watanabe civictechforum
Watanabe civictechforumWatanabe civictechforum
Watanabe civictechforum
 
Supporting System of Improvisational Ensemble Based on User's Motion Using Sm...
Supporting System of Improvisational Ensemble Based on User's Motion Using Sm...Supporting System of Improvisational Ensemble Based on User's Motion Using Sm...
Supporting System of Improvisational Ensemble Based on User's Motion Using Sm...
 
Prototype System for Recommending Academic Subjects for Students' Self Design...
Prototype System for Recommending Academic Subjects for Students' Self Design...Prototype System for Recommending Academic Subjects for Students' Self Design...
Prototype System for Recommending Academic Subjects for Students' Self Design...
 
Tag-based Approaches to Sharing Background Information regarding Social Probl...
Tag-based Approaches to Sharing Background Information regarding Social Probl...Tag-based Approaches to Sharing Background Information regarding Social Probl...
Tag-based Approaches to Sharing Background Information regarding Social Probl...
 
Improvisation Ensemble Support Systems for Music Beginners based on Body Mot...
Improvisation Ensemble Support Systems for Music  Beginners based on Body Mot...Improvisation Ensemble Support Systems for Music  Beginners based on Body Mot...
Improvisation Ensemble Support Systems for Music Beginners based on Body Mot...
 
韻律情報による議論の場の空気推定手法の検討
韻律情報による議論の場の空気推定手法の検討韻律情報による議論の場の空気推定手法の検討
韻律情報による議論の場の空気推定手法の検討
 
即興合奏時のコード進行をユーザがデザインする機構の検討
即興合奏時のコード進行をユーザがデザインする機構の検討即興合奏時のコード進行をユーザがデザインする機構の検討
即興合奏時のコード進行をユーザがデザインする機構の検討
 
BLEビーコンを所持する徘徊高齢者のいち推定結果可視化機構の試作
BLEビーコンを所持する徘徊高齢者のいち推定結果可視化機構の試作BLEビーコンを所持する徘徊高齢者のいち推定結果可視化機構の試作
BLEビーコンを所持する徘徊高齢者のいち推定結果可視化機構の試作
 
議論参加者の脳波による議論の場の空気推定手法の検討
議論参加者の脳波による議論の場の空気推定手法の検討議論参加者の脳波による議論の場の空気推定手法の検討
議論参加者の脳波による議論の場の空気推定手法の検討
 
視線と表情を用いた議論の場の空気の推定手法の検討
視線と表情を用いた議論の場の空気の推定手法の検討視線と表情を用いた議論の場の空気の推定手法の検討
視線と表情を用いた議論の場の空気の推定手法の検討
 
Ikeda ica2017
Ikeda ica2017Ikeda ica2017
Ikeda ica2017
 

ipsj全国大会発表スライド_水野

Editor's Notes

  1. それでは,表記の題目で名古屋工業大学の水野が発表いたします。
  2. まず、本研究における目的と課題についてご説明します。 本研究では、演奏未経験者が即興合奏を行う上で困難な要素となるコード進行などの調性を不協和音とならない音を出力するようにシステムが補い、未経験者でもわかりやすい リズムや旋律の上り下がりである旋律線と呼ばれる要素を身体動作で入力することによって演奏未経験者でも背景楽曲と即興合奏ができる 合奏支援システムの開発を目的としています。 先行研究では、専用のモーションセンサーカメラを用いて実現していました。本研究では、これをスマートフォンに搭載されたセンサーを用いた実現を目指しています。 次に本研究における課題になります. 1つは,直感的動作からリズムと旋律線を入力するため,ユーザの手の上下動を推定し,図のようにユーザがスマートフォンを持ち上げると音高も上がり,手を下げると音高も下がるといったように手の上下動に基づいた音高決定を行うことです. 2つ目は,直感的な発音タイミングの入力方法の決定です 3つ目は,出力音が不協和にならないように音高を補正することです
  3. まず1つ目の課題であるユーザの手の上下動推定を行い,手の上下動に基づいた音高決定を行うためのアプローチとして 本研究では,2つの方法を検討しました. 1つ目のアプローチでは,加速度センサー,ジャイロセンサーの値から鉛直方向の位置を推定するポジショントラッキングを行い,その結果から音高を決定する方法です. 2つ目のアプローチでは,ポジショントラッキングによって得た結果を機械学習に入力することでユーザ動作に基づいた音名を予測することで音高を決定する方法です. 次に,スマートフォンセンサー使ったポジショントラッキングを行う手法についてご説明させていただきます.
  4. 本研究におけるポジショントラッキング手法では 加速度センサーとジャイロセンサーによって計測した スマートフォン本体の加速度,回転速度から鉛直方向の加速度を求め,加速度とセンサーからの値取得の経過時間からユーザの手の上下動を表す移動距離を求めます. しかし,この移動距離を求めることによるユーザの手の上下動推定手法では推定精度が低いことがわかりました
  5. こちらは,実際にあらかじめ定めた距離を被験者にスマートフォンを持ち上げてもらった際に計測された値を表す表になります. このように個人の移動速度のなどの違いが原因によって同じ距離を測定しているにも関わらず,被験者ごとに結果が大きく変化 してしまっていることがわかります. よって本研究では,検出した移動距離から音高の変化を行う1つ目のアプローチではなく,加速度や速度などのユーザ動作の特徴量も含めて 機械学習に入力として用いることで出力する音高を予測する2つ目のアプローチ手法を実装しました.
  6. こちらが機械学習を用いた2つ目のアプローチ手法の場合のシステムの全体を表す構成図になります. 背景楽曲に合わせたユーザの身体動作によって演奏におけるリズムと旋律線の入力を行います. 次に,スマートフォンセンサーを用いたポジショントラッキングを用いてユーザ動作の特徴量を検出します. 検出した特徴量や背景楽曲のコード進行などを入力とした機械学習によってユーザ動作と背景楽曲に基づいた音名や発音タイミングを予測することで背景楽曲との即興合奏を行います.今回は機械学習の内ベイジアンネットワークを用いた予測システムを実装しました. 次に,本研究における発音タイミングの決定方法についてご説明いたします
  7. 本研究における発音タイミングの入力方法では,スマートフォンを振るシェイク動作とスマートフォンの画面内に配置されたボタンをタッチするタッチ動作の2つを想定しています シェイク動作ではベイジアンネットワークを用いてスマートフォンセンサーから取得した値を入力することで発音タイミングであるかどうかを予測することによって 発音タイミングの入力を行います.シェイク動作では,タッチ動作よりもより直感的な動作で演奏を行うことができる代わりに,システム上で配置されたボタンタッチによって確実に発音タイミングの入力を行えるタッチ動作よりも発音タイミングの検出が簡単でないと予想されます 次に,本研究におけるベイジアンネットワークを用いた予測システムについてご説明いたします
  8. まず,ベイジアンネットワークを作成するためにスマートフォンセンサーを用いて,実際に背景楽曲に合わせて被験者にスマートフォンを動かしてもらうことで訓練データサンプルを取得する実験を行いました.こちらがその時の映像になります. この実験によって約5msごとにセンサーから取得した値を1サンプルとして,約65000サンプル取得することができました. このサンプルを訓練データとして学習することで,発音タイミング,出力する音名,ユーザ動作の上下動を予測するベイジアンネットワークを作成しました
  9. こちらが,発音タイミングを予測するベイジアンネットワークを表す図になります. センサー値を基に求めたこれらの要素を入力として発音タイミングを表すtを予測し 演奏におけるリズムを決定します.
  10. 次にこちらが出力音名を予測するベイジアンネットワークを表す図になります. こちらではセンサーから取得した値に加えて背景楽曲の伴奏コードや直前に出力した音名など,調性などの文脈も入力として 出力するべき音名niを予測します. このベイジアンネットワークによって予測される音名はユーザの上下動に基づいて背景楽曲に合う音名を予測することで背景楽曲と不協和にならない音を出力します
  11. こちらが,ユーザ動作の上下動を予測するベイジアンネットワークを表す図になります. 発音タイミングを予測するベイジアンネットワークと同様にセンサー値を基に求めたこれらの要素を入力としてユーザ動作の上下動を表すhを予測し,出力する音名の予測結果と合わせて出力音のオクターブを変化させます
  12. 本研究では,ベイジアンネットワークの入力に用いる移動距離の定義を演奏開始位置からの絶対距離から 1つ前の発音位置からの相対距離に変更することで,ユーザの手の動きと音高の変化の 一致精度を向上させる試みを行いました. また,シェイク動作については発音タイミング推定の精度が不安定であることから訓練データの作成が困難であったため今回はタッチ動作における訓練データのみを作成しました.
  13. 次に本研究では,評価実験として2つの実験を行いました. 1つ目は,ベイジアンネットワーク作成に用いた訓練データから想定したメロディを生成する実験を行いました 2つ目に,ユーザ動作と合致した音高変化を生成する実験を行いました まず,1つ目の実験内容についてご説明いたします
  14. まず1つ目の実験では,各ベイジアンネットワークについて,訓練データをテストデータとした場合の予測精度を確認しました. 出力する音名,ユーザ動作の上下動の推定については原曲と同一の音名を予測できているか,原曲と同一の上下動を予測できているかを評価項目とし, 訓練データサンプル単位,ノート単位それぞれの粒度における正解率を比較しました. 今回は,各ノートにおける1つ目のサンプルの予測結果をノート全体の予測結果と仮定しました. また,発音タイミングの推定については各ノートの発音タイミングにおける再現率と適合率の確認を行いました. 再現率は原曲における発音タイミングのうちシステムが原曲通りに予測できている数の割合を 適合率はシステムの判定した発音タイミングのうち原曲における発音タイミングだった数の割合を確認しました.
  15. こちらが出力する音名,ユーザ動作の上下動の予測におけるサンプル単位とノート単位での予測精度を表す表になります サンプル単位での精度とノート単位での精度をそれぞれ比較した際,音名予測を比較した場合,上下動予測を比較した場合,どちらにおいてもサンプル単位での予測精度に比べて,ノート単位での予測精度が大きく低下していることがわかります. これは各ノートにおける発音タイミングでの予測精度が低く,音が持続する間に予測精度が高まる傾向にあることが考えられます. また,相対距離を用いたモデルによる予測精度が特にユーザ動作の上下動推定について大きく向上していることから移動距離の定義として相対距離を用いることが有効である可能性が示唆されています.なお,シェイク動作での相対距離を用いた実験については今後の課題とさせていただきます. 次に,こちらが発音タイミング予測における再現率と適合率を表す表になります. 再現率に比べて,適合率の割合が大きく低下していることから発音タイミングでない場合でも発音タイミングと誤判定されている場合が 多いことがわかります.
  16. 次に2つ目の実験では,ユーザにあらかじめ定めた上下動作を行った際の音高とユーザの動きそれぞれの上下動が一致するかどうかの実験を行いました. シェイク動作とタッチ動作の2手法での演奏で絶対距離,相対距離それぞれを用いた場合において,調性などの文脈である1つ前に出力した音名を入力に含めるか含めないかの2パターンで精度の確認を行いました.
  17. 最後に本研究のまとめと今後の課題になります 本研究では,スマートフォンのセンサーを用いてユーザ動作の特徴量を取得しユーザの手の上下動から出力音高を決定するシステムを開発しました.しかし,手の上下動の推定精度が低いことがわかったため取得したユーザ動作の特徴量や上下動推定結果からベイジアンネットワークを用いて発音タイミングと背景楽曲に合う 音名を予測することでユーザの直感的動作から背景楽曲に合わせた即興合奏を行う演奏インターフェースを開発しました 今後の課題としては LSTM,HMMなどの時系列データに適した予測システムの実装や複数デバイスの通信による複数ユーザでの同時合奏機能,複数楽曲による訓練データの作成が今後の課題となります. これで発表を終わります
  18. これは、一ノ瀬らの先行研究において用いられていた手法になります。 「Intel RealSense 3D」カメラを用いてユーザの手の上下動を入力とする手法を用いてきました。 しかし、この手法では特別なデバイスを必要とすること。また、カメラが認識できる範囲内でしか実行することができない という点から、複数人数の参加が困難であるという問題点が存在しました。 そこで、我々は新しい手法として多くの人々から利用されているスマートフォンに搭載されたセンサーを用いてユーザがスマートフォンを 上下させる動きを入力として旋律概形を決定する手法を提案しました。
  19. こちらが評価結果を表すグラフになります. どの項目についてもシェイク動作よりもタッチ動作のほうが評価が高くなっています. 特に発音タイミングについてシェイク動作では,シェイク動作時のみでなく音高操作のための手の上下移動時にも発音される場合が 多かったことからタッチ動作を大きく下回る評価となりました
  20. こちらは1つ目の発音タイミングを評価する実験結果になります.タッチ動作についてはボタンタッチに連動して確実に発音できるため高い評価を得ましたが,シェイク動作についてはシェイク動作時だけでなく音高操作のための上下移動の際にも発音される場合があるなどの問題から低い評価となりました.