SlideShare a Scribd company logo
1 of 25
Download to read offline
不確実性の較正評価による
不変リスク最小化近似手法
の比較理解
吉田晃太朗
(")
, 長沼大樹($) (&)
(1)東京工業大学
(2)Université de Montréal
(3)Mila
情報処理学会第86回全国大会
2024/3/15 ~ 2024/3/17
1
研究概観
Scope: 深層学習
分布外汎化 不確実性の較正
o 不変リスク最小化(IRM)
ü 最適化が困難
ü 近似手法(IRMv1, etc)
ü 近年の大規模なモデルの確信度は
正しくない傾向
ü 複数の環境にわたる確信度の正し
さがモデルの不変性の指標となる
IRM近似手法を不確実性の較正(確信度の正しさ)の観点で評価した
2
学習アルゴリズム
o 経験損失最小化(ERM)
o 未知なデータにおいても不変的な
特徴量を捉えたい
ü 最も一般的なアルゴリズム
ü 分布外での汎化が難しい
• Well-tunedなERMに勝てない
• 実際にどのくらい不変的なのか
明確でない
有効
o “モデルの確信度=実際の精度”
が理想(確信度の正しさ)
アジェンダ
1)研究背景
2)IRM近似手法
3)実験手法
4)実験結果
5)結論, 展望
3
アジェンダ
1)研究背景
2)IRM近似手法
3)実験手法
4)実験結果
5)結論, 展望
4
研究背景
q分布外汎化(Out-of-Distribution Generalization)
5
一般の深層学習モデルでは学習データとテストデータに対して独立同分布(IID)を仮定
実応用の世界では未知のデータ分布(環境)が存在し、モデルの予測性能が低下する問題
不変的な特徴量学習による改善
学習データ テストデータ
[Arjovsky 19]
Camel
“Camel” と予測
Cow
研究背景
ü不変リスク最小化 (IRM: Invariant Risk Minimization)
7
分布外汎化性能向上のために提案された学習アルゴリズム
発想
① 特定のデータ分布に依存しない特徴量(不変特徴量)を抽出
② 抽出された不変特徴量を用いて予測
→データ分布の変化に頑健な(不変的な)モデルの実現
“Cow”
研究背景
ü不変リスク最小化 (IRM: Invariant Risk Minimization)
入力空間 特徴量空間 出力空間
8
環境に依存した特徴量(例: 背景)
を削り、不変特徴量のみを抽出する
ように学習
抽出された特徴量から正しく
分類できるように学習
抽出 分類
Φ 𝜔
特徴抽出器 分類器
研究背景
q不確実性の較正(キャリブレーション)
9
罹患予測確率(確信度)90%
理想的なモデル
100人集めたら,,,
… 10人
… 90人
モデルの予測確信度と実際の予測精度は一致すべき
研究背景
q不確実性の較正(キャリブレーション)
10
近年の深層ニューラルネットワークでは正しく較正されない傾向がある [Guo 17]
研究背景
q分布外汎化と不確実性の較正のつながり
11
分布外汎化の文脈 / モデルが環境不変である :
キャリブレーションの文脈 / モデルの不確実性が任意の環境で較正されている :
𝔼 𝑌'! 𝑓 𝑋'! = 𝔼 𝑌'" 𝑓 𝑋'" , ∀𝑒", 𝑒$ ∈ 𝐸
𝔼 𝑌'
𝑓 𝑋'
= 𝛼 = 𝛼, ∀𝑒 ∈ 𝐸
(1)
(2)
(2)が(1)の十分条件
𝑋 : 入力データ
𝑌 : ラベル
𝑓 : モデル
𝐸 : データ分布(環境)集合
アジェンダ
1)研究背景
2)IRM近似手法
3)実験手法
4)実験結果
5)結論, 展望
13
IRM近似手法
IRMの定式化
min
%,'
)
(∈*!"#$%
𝑅( 𝜔 ∘ Φ 𝑠𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜 𝜔 ∈ 𝑎𝑟𝑔 min
+
'
𝑅( ;
𝜔 ∘ Φ , 𝑓𝑜𝑟 𝑎𝑙𝑙 𝑒 ∈ 𝐸,-./0
Bi-level最適化であり、一般に、最適解を求めることが困難 [Arjovsky 19]
→近似によって実装可能に
14
𝜔 : 分類器
Φ : 特徴抽出器
𝐸!"#$% : 学習環境集合
IRM近似手法
15
手法 アプローチ
IRM [Arjovsky 19] オリジナルなIRM, 最適化が困難
IRMv1 [Arjovsky 19] 分類器𝜔に線形性の制約
IBIRM [Ahuja 22] 分類器𝜔に線形性の制約, 情報ボトルネック法による抽出器Φの情報圧縮
IRM Game [Ahuja 20] ゲーム理論を応用, 環境間のアンサンブル学習
PAIR [Chen 23] ERM・IRMv1・vREx[Krueger 21] のパレート最適
BIRM [Lin 22] ベイズ推定の応用, IRMv1のデータへの過適合を克服
IRM近似手法
16
o 予測精度の観点でWell-tunedなERMに勝てない
o テストデータでの予測精度だけでは不変性が測りきれない
• 本当に不変的な特徴量を捉えているのか?
o どの近似アプローチがより適している?
ü問題点
→不確実性の較正の観点からIRM近似手法の比較評価をした
※ERM(経験損失最小化) : 深層学習に
おける一般的な学習アルゴリズム
アジェンダ
1)研究背景
2)IRM近似手法
3)実験手法
4)実験結果
5)結論, 展望
17
実験手法
18
o キャリブレーション性能評価によりIRM近似手法の分布外汎化性能の比較評価
o キャリブレーション性能指標としてECE(Expected Calibration Error) [Johansson 21]
𝐸𝐶𝐸 = 5
&'(
)
𝐵&
𝑁
𝐴𝑐𝑐 𝐵& − 𝐶𝑜𝑛𝑓(𝐵&)
𝐴𝑐𝑐 𝐵! : ビンm内における予測精度
𝐶𝑜𝑛𝑓 𝐵! : ビンm内における確信度の平均
Ø 確信度と実際の精度のギャップを示す
Ø 値が小さいほど正しい不確実性
q概要
タイプ Correlation Shift [Ye 22] Diversity Shift [Ye 22]
確率分布 𝑃!"#$%(𝑌|𝑋*+,"$-,*) ≠ 𝑃!.*!(𝑌|𝑋*+,"$-,*) 𝑃!"#$%(𝑋*+,"$-,*) ≠ 𝑃!.*!(𝑋*+,"$-,*)
概要
環境依存の特徴量が与えられた時のラベルの
条件付き確率がシフト
環境依存の特徴量の事前確率がシフト
データセット ColoredMNIST RotatedMNIST, PACS, VLCS
図
実験手法
19
qデータセット ※𝑋*+,"$-,*は環境に依存した特徴量
アジェンダ
1)研究背景
2)IRM近似手法
3)実験手法
4)実験結果
5)結論, 展望
20
実験結果
21
qCorrelation Shift
曖昧な予測
過剰な自信
o ERM・IRM Gameは赤実線付近に分布
☞環境に依存した特徴量への過度な依存
→不当に高い確信度
o IRMv1・IBIRM・BIRMは青実線付近に分
布
☞予測を曖昧にすることで環境依存の特徴
量への過度な適合を抑えられている
※同等の予測精度での比較のためID Validation Accuracyによって早期停止
実験結果
23
qDiversity Shift 情報ボトルネック法
o 同等の分布外予測精度を達成しているものの、
ECEの値にばらつきがある
o IBIRMが平均的にECEが低い
実験結果
24
qDiversity Shift ※赤実線 : 学習・テストデータでECEが等しい場合
→環境を跨いだ不確実性の較正
o 特にIBIRMが分布内及び分布外にお
いてより同等のキャリブレーション性能
☞環境を跨いだ不確実性の較正
アジェンダ
1)研究背景
2)IRM近似手法
3)実験手法
4)実験結果
5)結論, 展望
26
結論, 展望
27
o 不変特徴量学習の程度は単に分布外での予測精度だけでは測りきれない
o IBIRMが不確実性の較正の観点から優れている
☞情報ボトルネック法によって特徴抽出の複雑性を抑えることで、環境特有の特
徴量への依存による過度に高い確信度を防いでいることに起因するか
q結論
結論, 展望
28
o 広義の分布外汎化指標や測定方法の開発
o 本研究結果に基づくIRMの新たな近似手法の開発
o LLMにおける情報ボトルネック法の応用
• LoRA
ü 少数の学習パラメータによるファインチューニング手法
ü ドメインにおける情報を圧縮している
• CLIP
ü 情報ボトルネック法を用いて分布外汎化性能が向上 [Ruan 22]
q展望
参考文献
29
• [Arjovsky 19] Arjovsky, M., Bottou, L., Gulrajani, I. and Lopez-Paz, D.: Invariant risk minimization, arXiv preprint arXiv:1907.02893
(2019).
• [Guo 17] Guo, C., Pleiss, G., Sun, Y. and Weinberger, K. Q.: On calibration of modern neural networks, International Conference on
Machine Learning, PMLR, pp. 1321–1330 (2017).
• [Johansson 21] Johansson, U., L ̈ofstr ̈om, T., Bostr ̈om, H. and Nguyen, K.: Calibrating multi-class models, International Symposium on
Conformal and Probabilistic Prediction with Applications (2021).
• [Ovadia 19] Ovadia, Y., Fertig, E., Ren, J., Nado, Z., Sculley, D., Nowozin, S., Dillon, J., Lakshminarayanan, B. and Snoek, J.: Can you
trust your model’s uncertainty? Evaluating predictive uncertainty under dataset shift, Advances in neural information processing
systems, Vol. 32 (2019).
• [Wald 21] Wald, Y., Feder, A., Greenfeld, D. and Shalit, U.: On calibration and out-of-domain generalization, Advances in Neural
Information Processing Systems, Vol. 34 (2021).
• [Ahuja 22] Ahuja, K., Caballero, E., Zhang, D., Gagnon-Audet, J.- C., Bengio, Y., Mitliagkas, I., and Rish, I.: Invariance Principle Meets
Information Bottleneck for Out-of-Distribution Generaliza- tion (2022)
• [Lin 22] Lin, Y., Dong, H., Wang, H., and Zhang, T.: Bayesian Invariant Risk Minimization, in Proceedings of the IEEE/CVF Conference
on Computer Vision and Pattern Recognition (CVPR), pp. 16021–16030 (2022)
• [Ahuja 20] Ahuja, K., Shanmugam, K., Varshney, K. R., and Dhu- randhar, A.: Invariant Risk Minimization Games (2020)
• [Chen 23] Chen, Y., Zhou, K., Bian, Y., Xie, B., Wu, B., Zhang, Y., Ma, K., Yang, H., Zhao, P., Han, B., and Cheng, J.: Pareto In- variant
Risk Minimization: Towards Mitigating the Optimization Dilemma in Out-of-Distribution Generalization (2023)
• [Krueger 21] Krueger, D., Caballero, E., Jacobsen, J.-H., Zhang, A., Binas, J., Zhang, D., Priol, R. L., and Courville, A.: Out-of-
Distribution Generalization via Risk Extrapolation (REx) (2021)
• [Ruan 22] Ruan, Y., Dubois, Y., and Maddison, C. J.: Optimal Representations for Covariate Shift, in International Conference on
Learning Representations (2022)
• [Ye 22] Ye, N., Li, K., Bai, H., Yu, R., Hong, L., Zhou, F., Li, Z., and Zhu, J.: OoD-Bench: Quantifying and Understanding Two
Dimensions of Out-of-Distribution Generalization (2022)
• [Johansson 21] Johansson, U., L ̈ofstro ̈m, T., Bostr ̈om, H., and Nguyen, K.: Calibrating multi-class models, in International Symposium
on Conformal and Probabilistic Prediction with Ap- plications (2021)

More Related Content

Featured

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

The 86th National Convention of IPSJ (Student Encouragement Award))