SlideShare a Scribd company logo
1 of 12
Download to read offline
Machine Learning Design Patterns
Design
Pattern 29:
Explainable
Predictions
hei4
図は以下から引用:
Lakshmanan, Valliappa, Sara Robinson, and Michael Munn.
Machine learning design patterns. " O'Reilly Media, Inc.", 2020.
Problem
• エンドユーザーは、機械学習モデルの出力をそのまま受け入れることを躊躇する
事例)網膜の画像から糖尿病性網膜症(DR)の重症度を予測するモデル
もし病気の兆候と無関係なピクセルに基づいてモデルが予測していたら?
• 機械学習モデルの規制や監査に携わるステークホルダーは、モデルの使用とその
影響が正しいか判断するために、モデルが予測結果に至った理由を求める
• 機械学習エンジニアは、モデルが予測に使用した特徴量を理解していなければモ
デルの品質を向上させることができない
事例)モデルを20個の特徴量で学習したが、2個の特徴量にしか依存していない
Solution
• 機械学習モデルがどのように予測を行うのかを理解し、伝えるための技術は、活
発な研究が行われている分野
• 説明可能性(Explainability)*は、機械学習の中でも急速に発展している
分野であり、モデルの構造や学習するデータの種類に応じて様々な形が存在
* 解釈可能性(interpretability)やモデル理解(model understanding)とも呼ばれる
Solution
• 決定木や線形回帰モデルでは、モデルがどの
ように予測しているか直接知ることができる
(interpretable by design)
事例)自動車の燃料効率の線形回帰モデル
気筒数が1つ増えるごとに、予測MPGは減少
• 解釈する際には、特徴量ごとに単位が異な
る点や、ダミー変数の存在に注意すること
係数は特徴量とMPG (Miles Per Gallon)
に対する関係を意味している
気筒数が
1増えると
MPGは
0.93下がる
発売年が
1年新しいと
MPGは
0.72上がる
Solution
• 複雑なモデルは、特徴量と出力の関係を近似するために、事後的な(post
hoc)説明可能性手法を使用する
• feature attributionsは、特徴量に帰属値を割り当て、その特徴量が出力にど
れだけ貢献したかを示す。Instance-level と Global の2種類が存在する
• Instance-level :個々の予測に対する、貢献した特徴量
• Global : 予測する際に全体的に重要な特徴量
Solution
• feature attributions は、ベースライン予
測値からの相対値で特徴量が出力に貢献
した量を示す
• 情報量の少ないベースライン:訓練
データセットの平均的なケース
• 情報量の多いベースライン:特定のシナ
リオ
事例)自転車旅行の期間の予測
Instance-level の feature attribution
情報量の少ないベースライン
予測値はベースラインより
2.9低い
予測値がベースラインより低いので、
ほとんどのattribution値が負になっている
Solution
• オープンソースライブラリのSHAPは、多くのモ
デルに対応したfeature attributionを求
めるAPIを提供している
ベースラインはexplorerを作成したときのデータセットの出力平均
モデル出力は
ベースラインより11低い
重量のattributionは約6
attributionの合計はモデル出力とベースラインの差分に相当
テストデータセットの
attributionのサマリープロット
Solution
• SHAPは開発環境でのノートブックやスクリプトに有効。デプロイされたモデルには、
Google CloudのExplainable AIなどクラウドベースの説明用ツールが最適
入力画像
Integrated Gradient:
ピクセルレベルでの説明
XRAI:重要な領域を
より高いレベルで要約
Integrated Gradientは、医療現場や工場、
研究室などで撮影された「非自然」な画像に向いている
Trade-Offs and Alternatives (1)
• 機械学習は “garbage in, garbage out ”(=モデルは学習するために使用
されたデータと同等の性能しか持たない)。
• モデルを訓練する前にデータの不均衡を把握できていない場合、説明手法によっ
て、データ選択のバイアスを明らかにすることができる
事例)画像に写っているボートの種類を予測するモデル
ボートの形状ではなくパドルに依存して「カヤック」と予測していた。訓練データにパド
ルがある場合とない場合のカヤックの画像を追加することを検討する
Data selection bias
Trade-Offs and Alternatives (2)
Counterfactual analysis and example-based explanations
What-ifツールでの
Counterfactual analysis
選択しているデータと
予測結果が異なるが
最も近いデータを表示
住宅ローン申請データセットでの
2つのデータポイントの反例比較
Example-based explanations の例
ゲーム「Quick, Draw!」
新しい例題とその予測値を、
訓練データセット内の
類似した例題と比較
プレイヤーが
描いた絵
訓練データセット内の例
Trade-Offs and Alternatives (3)
• 説明性手法はモデルの理解と解釈を大きく向上させるが、モデルの説明を信頼し
すぎたり、説明がモデルに対する完璧な洞察を提供すると思い込むと危険。訓練
データがモデルに反映されるグループを不正確に表現していたり、ベースラインが問
題に対してうまく機能していなかったりすると、説明の質は高くならない
• 説明によって特徴量と出力の間に見出される関係は、自分のデータとモデルのみ
を代表するもので、その外の環境を代表するものではない
Limitations of explanations
Explainable Predictions パターン
どんなメリットがある?
• 機械学習モデルがどのように予測を行うのかを理解し、
伝えることができる
どうやって解決する?
• 説明可能性は、モデルの構造や学習するデータの種
類に応じて様々な形が存在
• feature attributionは、ベースライン値からの相対
比較で、特徴量が出力に貢献した量を示す
どんなときに使う?
• エンドユーザーに予測出力を納得してもらいたいとき
• 規制や監査に携わるステークホルダーに、予測出力
に至った理由を説明したいとき
• エンジニアがモデル改善を行いたいとき
トレードオフや関連手法はある?
• 関連手法:反事例的説明、事例ベースの説明
• トレードオフ:モデルの説明を信頼しすぎたり、説明
がモデルに対する完璧な洞察を提供すると思い込む
と危険

More Related Content

More from yohei okawa

Workflow pipeline pattern
Workflow pipeline patternWorkflow pipeline pattern
Workflow pipeline patternyohei okawa
 
Keyed predictions pattern
Keyed predictions patternKeyed predictions pattern
Keyed predictions patternyohei okawa
 
Batch serving pattern
Batch serving patternBatch serving pattern
Batch serving patternyohei okawa
 
Distribution Strategy pattern
Distribution Strategy patternDistribution Strategy pattern
Distribution Strategy patternyohei okawa
 
Multilabel pattern
Multilabel patternMultilabel pattern
Multilabel patternyohei okawa
 
はじめての方向け GANチュートリアル
はじめての方向け GANチュートリアルはじめての方向け GANチュートリアル
はじめての方向け GANチュートリアルyohei okawa
 
semantic segmentation サーベイ
semantic segmentation サーベイsemantic segmentation サーベイ
semantic segmentation サーベイyohei okawa
 
Attention-Guided GANについて
Attention-Guided GANについてAttention-Guided GANについて
Attention-Guided GANについてyohei okawa
 
SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎yohei okawa
 
CycleGANについて
CycleGANについてCycleGANについて
CycleGANについてyohei okawa
 

More from yohei okawa (11)

Workflow pipeline pattern
Workflow pipeline patternWorkflow pipeline pattern
Workflow pipeline pattern
 
Keyed predictions pattern
Keyed predictions patternKeyed predictions pattern
Keyed predictions pattern
 
Batch serving pattern
Batch serving patternBatch serving pattern
Batch serving pattern
 
Distribution Strategy pattern
Distribution Strategy patternDistribution Strategy pattern
Distribution Strategy pattern
 
Multilabel pattern
Multilabel patternMultilabel pattern
Multilabel pattern
 
20190630_VoVNet
20190630_VoVNet20190630_VoVNet
20190630_VoVNet
 
はじめての方向け GANチュートリアル
はじめての方向け GANチュートリアルはじめての方向け GANチュートリアル
はじめての方向け GANチュートリアル
 
semantic segmentation サーベイ
semantic segmentation サーベイsemantic segmentation サーベイ
semantic segmentation サーベイ
 
Attention-Guided GANについて
Attention-Guided GANについてAttention-Guided GANについて
Attention-Guided GANについて
 
SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎SLAM入門 第2章 SLAMの基礎
SLAM入門 第2章 SLAMの基礎
 
CycleGANについて
CycleGANについてCycleGANについて
CycleGANについて
 

Recently uploaded

論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 

Recently uploaded (14)

論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 

Explainable predictions pattern