Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
MILab
252 views
画像の圧縮・復元モデルと認識モデルのEnd-to-End学習
題目:画像の圧縮・復元モデルと認識モデルのEnd-to-End学習 学会名:動的画像処理実利用化ワークショップ 学会の開催期間:2024年 3月4-5日 著者:柴田 蓮,山内 悠嗣
Education
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 1
More Related Content
PDF
画像の圧縮・復元モデルと認識モデルのEnd-to-End学習
by
MILab
PDF
エッジコンピューティングのための圧縮画像認識
by
MILab
PDF
画像の圧縮復元認識フレームワークの軽量化及び軽量化
by
MILab
PPTX
冗長変換とその画像復元応用
by
Shogo Muramatsu
PPTX
Globally and Locally Consistent Image Completion
by
harmonylab
PPTX
CartoonGAN@名古屋CV・PRML勉強会 2018-06-23
by
enoken
PDF
ICASSP2017読み会 (Deep Learning III) [電通大 中鹿先生]
by
Shinnosuke Takamichi
PDF
自己教師あり学習を導入した局所拡張型異常生成による異常検知の高精度化
by
MILab
画像の圧縮・復元モデルと認識モデルのEnd-to-End学習
by
MILab
エッジコンピューティングのための圧縮画像認識
by
MILab
画像の圧縮復元認識フレームワークの軽量化及び軽量化
by
MILab
冗長変換とその画像復元応用
by
Shogo Muramatsu
Globally and Locally Consistent Image Completion
by
harmonylab
CartoonGAN@名古屋CV・PRML勉強会 2018-06-23
by
enoken
ICASSP2017読み会 (Deep Learning III) [電通大 中鹿先生]
by
Shinnosuke Takamichi
自己教師あり学習を導入した局所拡張型異常生成による異常検知の高精度化
by
MILab
More from MILab
PDF
複数データセットを用いたマシンアンラーニング手法の性能比較に関する実験的検討
by
MILab
PDF
テキストタグを併用した画像の品質評価モデルの提案
by
MILab
PDF
選択的破壊的忘却に基づくマシン・アンラーニングの高速化
by
MILab
PDF
Enhancing Anomaly Detection Accuracy with Conditional CutPaste
by
MILab
PDF
Aesthetic Quality Assessment of Images Using Text Tags with CLIP
by
MILab
PDF
視覚強化学習における画像予測モデルを導入した顕著性誘導 Q ネットワーク
by
MILab
PDF
変形ARマーカの高速,高精度な3次元位置・姿勢推定と組み込みボードへの実装
by
MILab
PDF
変形ARマーカの高速,高精度な3次元位置・姿勢推定と組み込みボードへの実装
by
MILab
PDF
変形ARマーカの位置・姿勢推定の高速化
by
MILab
PDF
条件付きCutPasteを用いた異常検知の高精度化,電子情報通信学会 東海支部 卒業研究発表会,2025
by
MILab
PDF
変形ARマーカの高速かつ高精度な姿勢推定
by
MILab
PDF
自己教師あり学習を導入したWavelet Vision TransformerによるDeepfake検出の高精度化
by
MILab
PDF
未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習
by
MILab
PDF
動的環境における動作計画のための C-space の予測
by
MILab
PDF
人の姿勢予測に基づいた協働ロボットの動作計画
by
MILab
PDF
時系列予測モデルを導入した価値関数に基づく強化学習
by
MILab
PDF
Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成
by
MILab
PDF
機械学習に基づく経路計画, 電子情報通信学会総合大会, 2022
by
MILab
PPTX
機械学習による変形ARマーカの位置・姿勢推定, 電気・電子・情報関係学会東海支部連合大会, 2021
by
MILab
複数データセットを用いたマシンアンラーニング手法の性能比較に関する実験的検討
by
MILab
テキストタグを併用した画像の品質評価モデルの提案
by
MILab
選択的破壊的忘却に基づくマシン・アンラーニングの高速化
by
MILab
Enhancing Anomaly Detection Accuracy with Conditional CutPaste
by
MILab
Aesthetic Quality Assessment of Images Using Text Tags with CLIP
by
MILab
視覚強化学習における画像予測モデルを導入した顕著性誘導 Q ネットワーク
by
MILab
変形ARマーカの高速,高精度な3次元位置・姿勢推定と組み込みボードへの実装
by
MILab
変形ARマーカの高速,高精度な3次元位置・姿勢推定と組み込みボードへの実装
by
MILab
変形ARマーカの位置・姿勢推定の高速化
by
MILab
条件付きCutPasteを用いた異常検知の高精度化,電子情報通信学会 東海支部 卒業研究発表会,2025
by
MILab
変形ARマーカの高速かつ高精度な姿勢推定
by
MILab
自己教師あり学習を導入したWavelet Vision TransformerによるDeepfake検出の高精度化
by
MILab
未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習
by
MILab
動的環境における動作計画のための C-space の予測
by
MILab
人の姿勢予測に基づいた協働ロボットの動作計画
by
MILab
時系列予測モデルを導入した価値関数に基づく強化学習
by
MILab
Vox2C-space:動作計画のための機械学習に基づくC-spaceの生成
by
MILab
機械学習に基づく経路計画, 電子情報通信学会総合大会, 2022
by
MILab
機械学習による変形ARマーカの位置・姿勢推定, 電気・電子・情報関係学会東海支部連合大会, 2021
by
MILab
画像の圧縮・復元モデルと認識モデルのEnd-to-End学習
1.
画像の圧縮・復元モデルと認識モデルのEnd-to-End学習 IS3-3 柴田 蓮,山内
悠嗣 (中部大学) 研究背景,目的 圧縮・復元した画像を用いた画像認識タスクは 未圧縮の画像を用いた場合と比較して認識精度が低下 1.認識精度[%]とデータ通信量[kB] 2.PSNR[dB]による画像の類似度比較 今後の展望 圧縮・復元モデル:RNNに基づく再帰型オートエンコーダ[1] :ResNet50[2] 認識モデル • 入力画像と復元画像の差分画像を再びネットワークへ入力 圧縮・復元モデルと認識モデルを直列に結合した構成 𝐿 = 𝐿 + 𝜆𝐿 提案手法 実験概要 認識モデルの損失 圧縮・復元モデルの損失 • 本アプローチに適した画像の圧縮・復元モデルを検討する [1] G.Toderici,et al.“Full resolution image compression with recurrent neural networks”, CVPR, 2017. [2] K.He,et al.“Deep residual learning for image recognition”, CVPR, 2016. [3] I.Goodfellow,et al.“Generative adversarial nets”, NIPS, 2014. 画像を圧縮する際に一部の情報が削減され, ノイズの発生や認識に寄与する情報が欠落することが原因 • 繰り返し回数が多いほど,入力に近い画像を出力 𝐿 = 𝑥 − 𝑥 𝐿 = −𝑝(𝑅(𝑥 )) log 𝑞(𝑅(𝑥 )) 同時最適化 交互最適化 • 2つのモデルを同時に最適化することで認識モデルを考慮した 画像の圧縮・復元が可能となる • ただし,モデルが大きく複雑な場合,局所最適解に陥りやすい • Generative adversarial nets[3]のように交互に最適化 • 圧縮・復元モデルを最適化する際には 損失関数の第2項を固定し,第1項のみを最適化 • 認識モデルを最適化する際には 損失関数の第1項を固定し,第2項のみを最適化 • 未圧縮モデル:未圧縮画像で認識モデルを学習 • 個別最適化モデル:圧縮・復元モデルと認識モデルを個々に学習 • 同時最適化モデル:圧縮・復元モデルと認識モデルを同時に学習 • 交互最適化モデル:圧縮・復元モデルと認識モデルを交互に学習 比較手法 実験結果 • 未圧縮画像と各手法の圧縮・復元画像のPSNRを計算 3.各手法の圧縮・復元画像と判断根拠の可視化画像 未圧縮 同時最適化 交互最適化 個別最適化 𝜆は重み調整用のハイパーパラメータ • 損失関数:入力画像と復元画像の平均絶対誤差 • 損失関数:交差エントロピー誤差 提案手法の損失関数 提案手法の最適化方法 タスク • 10クラスの画像分類 圧縮・復元した画像を用いた画像認識精度が向上 圧縮・復元モデルと認識モデルのEnd-to-End学習により 圧縮・復元画像を用いた画像認識精度の低下の抑制を目指す • 未圧縮モデルの平均データ通信量は118.2kB • 値が高いほど,類似度が高いことを示す 𝑅 :認識モデル 𝑞 :予測ラベルの確率分布 𝑝 :正解ラベルの確率分布 𝑥 :復元画像 𝑇:RNNの繰り返し回数 𝑥 :入力画像 𝑥 :復元画像
Download