IMU 搭載ヘッドホンを用いた
注視位置の簡易推定
関西大学
○ 森友吾・佐藤光起・松下光範
1
背景
ライト1
ライト2
ライト3
3
ex).Switchbot
I o T の 増 加 に よ っ て デ バ イ ス 選 択 が 困 難 に
注視位置に基づいたデバイス選択
目的
4
注視位 置からど のデバ イスを
見てい るか識別
識別子 の把握が 不要
直感的 な操作
先行手法
ウェアラブルアイトラッカー
http s: / /
www. t obi i . com/
メリット
高い精度で注視位置を推定可能
デメリット
導入、設置コストが高い
5
視 線 に よ る 注 視 位 置 推 定 手 法 に つ い て
提案手法
ウェアラブルアイトラッカー
http s: / /
www. t obi i . com/
メリット
高い精度で注視位置を推定可能
デメリット
導入、設置コストが高い
メリット
導入コストが低く、簡易な手法
デメリット
精度が低い
6
提案手法
視 線 に よ る 注 視 位 置 推 定 手 法 に つ い て
提案手法の詳細
頭 部 姿 勢 に 基 づ く 注 視 位 置 推 定
• I MU を搭 載した A irPo ds を用いて 頭
部姿勢か ら注視 位置を 算出
• ジャ イロセ ンサを用 いてユ ーザの 頭部の
回転 角をリ アルタイ ムに取 得
7
IM U ( In e rti al Me as ure me n t U ni t )とは
加速度センサ・ジャイロセンサを内蔵した
動き(姿勢・回転)を測るためのセンサモジュール
基準点 1(w₁,h₁)
基準点2 (w₂,h₂)
推定手法
注 視 位 置 の 算 出
• 2 つの既知の座標を持つ
基準点に対してキャリブレーション
→ ユーザの注視位置を推定
• 基準点と現在の頭部姿勢の
回転角に基づき座標を
線形補完を用いて算出する
計 算 式
8
回転角( α₁,β₁ )
回転角( α₂,β₂ )
基準点
ターゲット
精度検証
実 験 環 境
• 参加者:大学生、大学院生 25 名
• 面のサイズ:幅 240cm 高さ 240cm
• 計 54 回ターゲティングを行う
9
100cm
200cm
300cm
STEP1: 基準点 を注視 し
キャリ ブレー ションを 行う
STEP2: ターゲ ットを ランダ ムに指 示
精度検証
実 験 手 順
実 験参 加 者は タ ーゲ ッ ト を2 秒 程度 注 視後 、
手 元の ト ラッ ク パッ ド を クリ ッ クし 、
回 転角 を 記録
10
考察
11
1 . 提 案 手 法 の 精 度 に つ い て
2 . 注 視 に お け る 眼 球 の 影 響 に つ い て
考察
12
1 . 提 案 手 法 の 精 度 に つ い て
2 . 注 視 に お け る 視 線 の 影 響 に つ い て
考察①:提案手法の精度について
距離 100cm からのターゲティング 距離 200cm からのターゲティング 距離 300cm からのターゲティング
13
考察①:提案手法の精度について
距離 100cm からのターゲティング 距離 200cm からのターゲティング 距離 300cm からのターゲティング
14
考察①:提案手法の精度について
15
距離 100cm からのターゲティングの分布
考察①:提案手法の精度について
誤 差 を 算 出
• 距離が遠いほど誤差が
大きくなる
誤差 =算出位置と本来の
ターゲットの位置との絶対値
• X 座標よりも Y 座標の方
が誤差が大きい
16
x 座標の誤
差
y 座標の誤
差
考察
17
1 . 提 案 手 法 の 精 度 に つ い て
2 . 注 視 に お け る 眼 球 の 影 響 に つ い て
頭部の動き 眼球の動き
+
注視に関わる行為
本シス テムで検出 本システムでは考慮せず
考察②:注視における眼球の影響について
18
考察②:注視における眼球の影響について
眼 球 が 及 ぼ す 影 響
• システムで取得される値は理論値
よりも小さくなる
• ターゲットを眼球で補って注視す
るため、角度が内側になっている
19
考察②:注視における眼球の影響について
眼 球 が 及 ぼ す 影 響
• 視野角の外側に存在するターゲットが
眼球の影響が大きくなる
• 300cm の時の方が 100cm の時に
比べ理論値との角度の差が小さい
本システムでは視野角が重要になる
20
課題
1. 移動すると注視位置推定が 正 しく 機 能しなくなる
→ ユーザ位置を考慮したシステムの検 討
2. 最初 にキャリブレーションの操作が 煩雑
→ 自 動的に角度を推定し設定を行 え るシステムの検 討
3. 線形による座標推定を行っているため、精度に課 題
→ 頭部 特性 を考慮した 非 線形による推定手法の検 討
21
応用
期 待 さ れ る 応 用 手 法
Io T 操作
→ Io T が まばらに存在している 空間 で 機器指定に 利 用可能
広 い空間 での注視位置可視 化
→ 講義 、ライブなどの 広 い 空間 での 応用
22
まとめ
背 景
IoT の増加によってデバイス選択が困難に
検 証
求められる回転角が小さいほど精度は低い
上下より 左右の方が精度が高い
回転角が大きくなると視線の影響が大きく、
実際の値より小さくなる
目 的
見るという行為に 着目したデバイス選択手法
の提案
結 果
おおよその視線位置を推定する 場合において
応用可能
提 案 手 法
IM U 搭載ヘッドホンを用いて注視位置を簡易
的に推定
23
24
終わ
り

YugoMori_IMU搭載ヘッドホンを用いた注視位置の簡易推定_FIT2025

Editor's Notes

  • #2 それでは発表に入ります。 本研究では、先ほど提案したシステムをIoTのデバイス操作に応用します。 IoTが出てきたことで家電などのものをスマホ上で遠隔に操作が可能になりました。 しかし、それらのiotの増加によってそのデバイスの選択が困難になっています。 画像の状況を想定してください。 ここにはIoTとしてスマホ上で操作ができるライトが複数存在しています。 それぞれライト1、ライト2、ライト3と名前がついていて、 これらの名前をスマホ上で指定することでライトを消したりつけたりすることができます これらは、どの位置のライトがどの名前のライトなのかを事前に識別しないと操作ができないです。 iotの数が増えると名前と位置の把握することが難しくなることがわかると思います
  • #3 そこで、本研究では、見るという行為に注目して、見ている場所からデバイス選択を行うことでIoTデバイスの直感的な選択を実現します。 ここでは、デモで行った手法を用いて、注視位置から操作したい対象を指定します。 スマホ操作では、空間上のデバイスの名前を把握して操作する必要がありましたが、 見ている位置から操作対象のデバイスを自動的に選択をすることが可能となり、デバイス指定を直観的に行えます。
  • #4 視線位置の推定について、先行手法としてアイトラッカーなどの、専門機器を用いた手法が存在します。 このような手法では、高い精度で注視位置を推定することが可能ですが、このような手法は、導入コストが高く、日常的な利用には適しません。
  • #5 そこで、本研究では、イヤホンなどの普及しているデバイス用いることで低コストでの注視位置推定を実現します。 この手法では、専用機器に比べて精度が劣りますが、日常的に普及しているデバイスを用いることで、低コストでの視線位置の推定が可能になります。
  • #6 続いて、本提案手法の詳細について解説します。 本手法では、IMU搭載ヘッドホンを用いて頭部姿勢を検出し、得られた回転角の値から注視位置の座標を算出します。 IMUとは加速度センサ・ジャイロセンサを内蔵した動きを測るためのセンサモジュールのことです。 ここでは、IMUに搭載されているジャイロセンサから、頭の回転角をPitch,Yawとして取得します。
  • #7 次に、頭部姿勢の回転角の値から、注視位置の座標を算出する手法について解説します。 本システムでは、座標が与えられている2点に対して注視をすることで、キャリブレーションが可能です。 この点を見た時の回転角の値を記録することで注視位置を算出できるようになります。 この基準点の座標と回転角、リアルタイムに取得される回転角から線形補完を行うことで、注視位置の座標を推定しています。 式はこちらです。
  • #8 ここでは、本提案手法を用いて、注視位置の座標を計測する実験を行いました。 ここでは、注視位置を計測することをターゲティングと呼んでいます。 実験環境について説明します。 対象者は情報学部に所属する大学生、大学院生で、25名を対象に行いました。 まず、幅240cm、高さ240cmの面に対してターゲティングを行い、座標推定を行います。 ここでは、面から離れた3つの位置からターゲティングを行います。 距離は面から平行に100cm200cm,300cmの3つになっています。 面の左上、右下には基準点を設置し、キャリブレーション後、そのうちにある計9つの点に対してターゲティングを行いました。 一つのターゲットに対して2回の、それを3つの距離から行うため、計54回のターゲティングを行うことになります。
  • #9 実験手順についてです。 実験では実験者にトラックパッドを手元に持ってもらい、こちらで、注視を行う位置を指示します。 指示した位置を2秒程度見た後にトラックパッドをクリックしてもらうことで、その時の値を記録します。 手順についてですが STEP1として、2点の基準点を見るように指示し、キャリブレーションを行います。 その後、STEP2として、ランダムな順序で9このターゲットを注視するように指示し、計測時の値を記録してもらいます。 ターゲティングを行う距離につきましても、順序はランダムで指示をしました。
  • #10 実験の考察についてです。 本実験では、提案手法の精度について 注視における眼球の影響について の2点で考察を行いました。
  • #12 こちらが結果をプロットした図になります。 ターゲットから100cm,200cm,300cmの距離から行なった結果を示しています。 黒い点が指示した本来の位置で、その周りに分布している色の点がそれぞれの点で算出された結果です。 左上の結果は赤色、中心の結果は黄色、右下の結果は水色というように、それぞれ場所ごとに色で示しています。 全体として、おおよそ黒い点を中心に分布しているため、ターゲティングは行えていることがわかります。 結果を見ると、結構ばらつきはあることがわかりますが、この実験ではターゲティング中に当たり判定などのフィードバックは行なっておらずそれでこの結果なので、フィードバックがあればより精度は向上すると考えられます。
  • #13 また、100cmの時の結果に注目してみます。
  • #14 こでは一つの点の位置に注目し、左上、中心、右下のターゲティング結果赤色で表示しています。 この両端の結果についてみてください、本来、ターゲティング結果は黒い点を中心に分布すると考えられますが、ここでは本来の点よりも外側を中心に分布していることがわかります。
  • #15 続いて、結果について、その誤差を計算したものが右の図となっています。 ここでは誤差を実際に取得された座標とターゲットの本来の座標の絶対値を取ることで計算しています。 紫がx座標の誤差で、オレンジがy座標の誤差です。 左が100cmの時距離での誤差で中央が200cmの時の誤差で、300cmの時の誤差が右です。 図から、距離が遠いほど、誤差が大きくなっていること、X座標よりもY座標の方が誤差が大きいことがわかります。 距離ごとの誤差を比較すると、 100cmの時のX座標の誤差は19.8cmで300cmの時は27cmと、距離が大きくなるほど誤差が大きくなっていました。 X座標とY座標を比較すると 100cmの時のx座標は19.8cmで、Y座標の誤差は32.5cmと、ターゲティングにおいて、X座標よりもY座標の方が誤差が大きいことがわかりました。
  • #16 続いて、注視における眼球の影響についてです
  • #17 ひとはものを見るさい、頭を動かしてみるのと、目を動かして見るという二つの動作によってみていると考えられます。 しかし、本システムで眼球の影響については考慮せず、頭部の角度によって注視位置を算出しています。 ここでは、眼球運動がどう本提案システムに与える影響しているのかについて考察します。
  • #18 右の図をご覧ください。 こちらは、100cmの時の平面に対して左端から右端をみる際に理論上必要な頭部の角度の値を示しています。 この平面において、左端から右端を向くのに必要な角度は理論的には100.4度になります。 しかしながら、本システムで取得された値では、この幅の角度が61.5度となっていました。 ここから、本システムで取得される値は理論値よりも小さく、頭部を実際に必要な角度よりも動かしていないことがわかります。 これが、眼球運動の影響であると考えられます。 ユーザはターゲットを見るときに眼球で補ってみており、その眼球による影響が理論値と実際の値の差に出ていると考えられます。
  • #19 また、必要な角度によっても眼球運動の影響に違いが見られることが明らかになりました。 300cm地点でのターゲティングでは必要な角度が43.6度なのに対して、計測される値が27.8度となっています。 これは100cmの時の理論上の値と実際の角度と比べて差が小さいです。 このような現象は、視野角が広い場合、注視が頭部の動きだけでカバーできたいないため、眼球の動きを使ってみるという特性があるからであると考えられます。 300cmからのターゲティングは視野角が狭く、注視が頭部の動きだけでカバーできるため、眼球の影響が小さく、実際の角度が理論値と近く、 100cmの時は、視野角が広いため、頭部の動きでカバーできない分を眼球で見るため、実際の値よりも小さい値で角度が取得されると考えられます。 本実験では、100cmと300cmにおいて同じ幅のものをターゲティングしていたため、誤差が大きくなりましたが、 本システムは視野角が重要になるため、遠い地点での注視においても、ターゲットごとの間隔を調節して 適切な視野角での注視を行うことで、このシステムは利用可能であると考えられます。
  • #20 本システムでは、3つの課題があります。 一つ目が、本システムでは、移動すると注視位置推定が正しく機能しなくなるという課題です。 これに対しては、ユーザ位置を考慮したシステムの検討を行います。 二つ目に、最初に行うキャリブレーション設定の操作が煩雑という課題があります。 これに対しては、キャリブレーション時に自動的に角度を推定し設定を行えるシステムの検討を行い、直感的な操作を可能にします。 最後に、本システムの推定手法の課題です。 本システムでは、線形による座標推定を行っているため、精度に限界があるという課題があります。 これに対しては、本実験で明らかになった注視の特性を考慮した非線形による推定手法の検討を行なっていきます。
  • #21 本研究で提案したシステムを用いることで、 IoT操作のデバイス選択が可能になります。 実験の結果から、注視結果がターゲット周辺で分布していることが明らかになりました。 そのため、IoTがまばらに存在している空間での機器指定に利用可能と考えられます。 また、視覚的なフィードバックやイヤホンの特性を活かした音声のフィードバックを行うことで、 デバイス選択において精度の向上が期待されます。 そのほか、講義、ライブなどの広い空間での応用が考えられます。 本システムは視野角が適切であれば、広い空間でも使用が可能です。 ライブでは、何か指示を行いたい際にも、手元が使えないことが想定されるため、ハンズフリーで意図した位置を注視により示せることがメリットとなります。 導入コストが低いため、複数人での利用もできます。 推しを見てるのを可視化できたり、ある点を見ることで色が変わる、一つの画面を見てみんなで投票ができるなどの演出も期待されます。
  • #22 まとめです。 本研究ではIMU搭載ヘッドホンを用いて注視位置を推定する手法を提案しました。 実験では、おおよその視線位置の推定が可能で、その頭部特性についても明らかになりました。