SlideShare a Scribd company logo
1 of 1
Download to read offline
研究背景・目的
• 圧縮画像の認識精度向上,画像圧縮と画像認識を1つのネットワークで構成
参考文献
• 実験1:画像圧縮適用前後のデータサイズの比較
• 実験2:画像分類精度の比較
• 実験3:物体検出精度の比較
実験1:データサイズの比較
実験結果
評価実験
今後の予定
提案手法
• ImageNet[4]では95.4[%],VOC2007[5]では
74.7[%]の平均画像容量を削減
• エッジコンピューティングを用いた画像認識が普及し,低スペックなデバイスでも高度な認識が可能
→ 容量の大きいデータを送受信するとネットワーク回線への負担や通信時間が増加
• 送受信するデータサイズを減らしたい
→ 認識に必要な情報が欠落するため,認識性能が低下
画像認識モデル
• 提案手法は様々な画像認識技術に適用可能
→ 本研究では画像分類と物体検出に適用
• 物体検出
→ MobileNet-SSD[3]
• 画像分類
→ ResNet50[2]
RNNに基づいた画像圧縮器
• RNNがベースのエンコーダ,デコーダ,バイナライザ,
デシマライザで構成
• 画像を入力し,元の画像になるべく類似するように
圧縮・復元した画像を出力
→ 圧縮・復元を繰り返すことで画質の高い画像を出力
ImageNet VOC2007
元画像[kB] 65.5 87.9
圧縮画像[kB] 3.00 22.2
実験2:画像分類精度の比較
• データセットにはImageNetを使用
• 提案手法は平均画像容量を85[%]以上削減
• 圧縮モデルでは平均画像容量を削減しつつ,
66[%]以上の分類精度を維持
機械学習を用いた画像の圧縮・復元と画像認識を行うフレームワーク
• RNNに基づいた画像圧縮器[1] + 画像認識モデル で構成
分類精度を維持しつつ画像容量を85[%]以上削減
1,クライアント側でエンコーダにより画像を圧縮してエッジサーバへ送信
2,エッジサーバで圧縮データをデコーダにより画像を復元し,画像を認識
3,認識結果をクライアントへ送信
[1] T,George et al. "Full resolution image compression with recurrent neural networks." , CVPR 2017
[2] H, Kaiming et al. "Deep residual learning for image recognition." , CVPR 2016.
[3] H, Andrew G et al. "Mobilenets: Efficient convolutional neural networks for mobile vision applications.“ , arXiv preprint 2017.
[4] D, Jia et al. "Imagenet: A large-scale hierarchical image database.“ , CVPR 2009.
[5] E, Mark et al. "The pascal visual object classes challenge: A retrospective.“ , IJCV 2015.
データサイズを削減しつつ,認識精度を維持する画像認識フレームワークを提案
実験3:物体検出精度の比較
• データセットにはPASCAL VOC 2007を使用
• 提案手法は平均画像容量を75[%]以上削減
• 圧縮モデルでは平均画像容量を削減しつつ,
63[%]以上のmAPを維持
mAPを維持しつつ画像容量を75[%]以上削減
• 従来手法:未圧縮画像で学習,未圧縮画像で評価
• 提案手法(未圧縮モデル):未圧縮画像で学習,圧縮画像で評価
• 提案手法(圧縮モデル):圧縮画像で学習,圧縮画像で評価
エッジコンピューティングのための圧縮画像認識 IS4-05 高瀬 俊希,戸谷 響,西片 智広,山内 悠嗣 (中部大学)

More Related Content

More from MILab

未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習
未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習 未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習
未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習 MILab
 
動的環境における動作計画のための C-space の予測
動的環境における動作計画のための C-space の予測動的環境における動作計画のための C-space の予測
動的環境における動作計画のための C-space の予測MILab
 
人の姿勢予測に基づいた協働ロボットの動作計画
人の姿勢予測に基づいた協働ロボットの動作計画人の姿勢予測に基づいた協働ロボットの動作計画
人の姿勢予測に基づいた協働ロボットの動作計画MILab
 
時系列予測モデルを導入した価値関数に基づく強化学習
時系列予測モデルを導入した価値関数に基づく強化学習時系列予測モデルを導入した価値関数に基づく強化学習
時系列予測モデルを導入した価値関数に基づく強化学習MILab
 
Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成
Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成
Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成MILab
 
機械学習に基づく経路計画, 電子情報通信学会総合大会, 2022
機械学習に基づく経路計画, 電子情報通信学会総合大会, 2022機械学習に基づく経路計画, 電子情報通信学会総合大会, 2022
機械学習に基づく経路計画, 電子情報通信学会総合大会, 2022MILab
 
機械学習による変形ARマーカの位置・姿勢推定, 電気・電子・情報関係学会東海支部連合大会, 2021
機械学習による変形ARマーカの位置・姿勢推定, 電気・電子・情報関係学会東海支部連合大会, 2021機械学習による変形ARマーカの位置・姿勢推定, 電気・電子・情報関係学会東海支部連合大会, 2021
機械学習による変形ARマーカの位置・姿勢推定, 電気・電子・情報関係学会東海支部連合大会, 2021MILab
 

More from MILab (7)

未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習
未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習 未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習
未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習
 
動的環境における動作計画のための C-space の予測
動的環境における動作計画のための C-space の予測動的環境における動作計画のための C-space の予測
動的環境における動作計画のための C-space の予測
 
人の姿勢予測に基づいた協働ロボットの動作計画
人の姿勢予測に基づいた協働ロボットの動作計画人の姿勢予測に基づいた協働ロボットの動作計画
人の姿勢予測に基づいた協働ロボットの動作計画
 
時系列予測モデルを導入した価値関数に基づく強化学習
時系列予測モデルを導入した価値関数に基づく強化学習時系列予測モデルを導入した価値関数に基づく強化学習
時系列予測モデルを導入した価値関数に基づく強化学習
 
Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成
Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成
Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成
 
機械学習に基づく経路計画, 電子情報通信学会総合大会, 2022
機械学習に基づく経路計画, 電子情報通信学会総合大会, 2022機械学習に基づく経路計画, 電子情報通信学会総合大会, 2022
機械学習に基づく経路計画, 電子情報通信学会総合大会, 2022
 
機械学習による変形ARマーカの位置・姿勢推定, 電気・電子・情報関係学会東海支部連合大会, 2021
機械学習による変形ARマーカの位置・姿勢推定, 電気・電子・情報関係学会東海支部連合大会, 2021機械学習による変形ARマーカの位置・姿勢推定, 電気・電子・情報関係学会東海支部連合大会, 2021
機械学習による変形ARマーカの位置・姿勢推定, 電気・電子・情報関係学会東海支部連合大会, 2021
 

エッジコンピューティングのための圧縮画像認識

  • 1. 研究背景・目的 • 圧縮画像の認識精度向上,画像圧縮と画像認識を1つのネットワークで構成 参考文献 • 実験1:画像圧縮適用前後のデータサイズの比較 • 実験2:画像分類精度の比較 • 実験3:物体検出精度の比較 実験1:データサイズの比較 実験結果 評価実験 今後の予定 提案手法 • ImageNet[4]では95.4[%],VOC2007[5]では 74.7[%]の平均画像容量を削減 • エッジコンピューティングを用いた画像認識が普及し,低スペックなデバイスでも高度な認識が可能 → 容量の大きいデータを送受信するとネットワーク回線への負担や通信時間が増加 • 送受信するデータサイズを減らしたい → 認識に必要な情報が欠落するため,認識性能が低下 画像認識モデル • 提案手法は様々な画像認識技術に適用可能 → 本研究では画像分類と物体検出に適用 • 物体検出 → MobileNet-SSD[3] • 画像分類 → ResNet50[2] RNNに基づいた画像圧縮器 • RNNがベースのエンコーダ,デコーダ,バイナライザ, デシマライザで構成 • 画像を入力し,元の画像になるべく類似するように 圧縮・復元した画像を出力 → 圧縮・復元を繰り返すことで画質の高い画像を出力 ImageNet VOC2007 元画像[kB] 65.5 87.9 圧縮画像[kB] 3.00 22.2 実験2:画像分類精度の比較 • データセットにはImageNetを使用 • 提案手法は平均画像容量を85[%]以上削減 • 圧縮モデルでは平均画像容量を削減しつつ, 66[%]以上の分類精度を維持 機械学習を用いた画像の圧縮・復元と画像認識を行うフレームワーク • RNNに基づいた画像圧縮器[1] + 画像認識モデル で構成 分類精度を維持しつつ画像容量を85[%]以上削減 1,クライアント側でエンコーダにより画像を圧縮してエッジサーバへ送信 2,エッジサーバで圧縮データをデコーダにより画像を復元し,画像を認識 3,認識結果をクライアントへ送信 [1] T,George et al. "Full resolution image compression with recurrent neural networks." , CVPR 2017 [2] H, Kaiming et al. "Deep residual learning for image recognition." , CVPR 2016. [3] H, Andrew G et al. "Mobilenets: Efficient convolutional neural networks for mobile vision applications.“ , arXiv preprint 2017. [4] D, Jia et al. "Imagenet: A large-scale hierarchical image database.“ , CVPR 2009. [5] E, Mark et al. "The pascal visual object classes challenge: A retrospective.“ , IJCV 2015. データサイズを削減しつつ,認識精度を維持する画像認識フレームワークを提案 実験3:物体検出精度の比較 • データセットにはPASCAL VOC 2007を使用 • 提案手法は平均画像容量を75[%]以上削減 • 圧縮モデルでは平均画像容量を削減しつつ, 63[%]以上のmAPを維持 mAPを維持しつつ画像容量を75[%]以上削減 • 従来手法:未圧縮画像で学習,未圧縮画像で評価 • 提案手法(未圧縮モデル):未圧縮画像で学習,圧縮画像で評価 • 提案手法(圧縮モデル):圧縮画像で学習,圧縮画像で評価 エッジコンピューティングのための圧縮画像認識 IS4-05 高瀬 俊希,戸谷 響,西片 智広,山内 悠嗣 (中部大学)