SlideShare a Scribd company logo
1 of 24
Download to read offline
模倣ルールを用いた機械学習
モデルの説明手法
第34回 人工知能学会全国大会
東北大学 情報科学研究科
浅野孝平
• 研究背景
• 説明可能な機械学習
• 先行研究
• 提案手法
• 計算機実験
• まとめと今後の課題
研究背景
様々なタスクで高精度な予測を実現
問題:モデルの複雑化,予測の根拠が不明.なぜその結果が得られたか説
明できない
• 複雑/ブラックボックスなモデルの例
• 非線形なモデル(多層ニューラルネット,非線形カーネルSVM)
• Web APIで実装されたモデル(結果だけ得られる)
「機械学習」の検索結果,朝日新聞デジタルから一部抜粋
分類器 𝒇
入力
𝑥: インスタンス
出力
𝑓(𝑥): クラス
1
説明可能な機械学習
説明手法:モデルから予測の判断根拠を読みとるための手法
• 予測に大きく影響を与えた特徴の提示
• 深層学習に対する説明手法
• モデルが重要視している特徴の提示
・・・
本研究では,モデル依存性のないルールモデルを用いた予測の
説明手法を提案する.
2
• 研究背景
• 先行研究
• ルールモデルを用いた説明手法
• Anchor
• LORE
• 問題点
• 提案手法
• 計算機実験
• まとめと今後の課題
ルールモデルを用いた説明手法
ルールモデル
• 特徴の条件分岐によって予測を行うモデル
• 決定木,ルールリスト
• IF-THENの形式で表現でき可読なモデル
ブラックボックスなモデルを
• 局所的にルールモデルで近似,
• 内部に含まれるルールを抽出
することで説明
𝑥
𝑥1
𝑥2
特徴空間上で,ルールモデル
は矩形領域となる
3
Anchor [Ribeiro et. al. 2018]
• どの特徴があれば予測に十分であるか
を調べる
• 高い確率でもとの予測を再現できる特徴
集合を求める
説明例(元論文より引用)
4
問題点
•データを二値表現に変換して扱う
•数値データ: 区間化による離散化
•画像データ: 領域分割による離散化
•元のモデルとギャップが生じる
LORE [Guidotti et. al. 2018]
• 説明対象のデータの近傍を決定木で学習
• 数値特徴にも対応
• 決定木の教師データはGenetic Algorithm
で生成
Genetic Algorithmによる教師データの
生成(元論文より引用)
GeneticAlgorithmによって正例と負例
のバランスのよい教師データを生成
5
問題点
• 決定木による局所的な近似
• 大域的には利用不可
先行研究の問題点
6
• あくまで近似モデルによる説明なので,元のモデルとの
ギャップが生じる
• Anchor: インスタンスの二値表現
• LORE: 決定木による近似
• ルール内に説明対象のデータと異なる分類結果となる領
域がある.
Anchor LORE
Iris 0.633 0.924
BC 0.365 0.489
𝑥
𝑥1
𝑥2
ルールないにランダムにデータを生成し,そのデータが,
説明対象のデータと同じクラスに分類されるかを評価
先行研究の問題点
6
• あくまで近似モデルによる説明なので,元のモデルとの
ギャップが生じる
• Anchor: インスタンスの二値表現
• LORE: 決定木による近似
• 説明がほしいデータごとに説明を作る
• 大域的に利用できない→ データごとに説明の生成が必要
• 複数のデータの説明を求めると計算コスト大
• 研究背景
• 先行研究
• 提案手法
• 模倣ルールを用いた説明手法
• アルゴリズム
• 計算機実験
• まとめと今後の課題
模倣ルールを用いた説明手法
7
𝑥
𝑥1
𝑥2
先行研究の問題点
• 元のモデルとのギャップが生じる
• 大域的に利用できない
研究目的・モチベーション
あるインスタンスの周辺で分類器
を厳密に模倣する,大域的に利用
可能なルールを見つける.
模倣ルールを用いた説明手法
8
模倣ルールの定義
特徴𝑖 𝑖 = 1, … , 𝑑 の閉区間[𝑠𝑖, 𝑒𝑖]の直積
満たしてほしい性質
厳密性:ルールに含まれる全てのインスタン
ス𝑥′
は𝑓(𝑥)に分類
∀𝑥′
∈ 𝑟, 𝑓(𝑥′
) = 𝑓(𝑥)
極大性:領域を少しでも拡張すると,厳密性
が満たされない
IF (𝑠1 ≤ 𝑥1 ≤ 𝑒1) AND (𝑠2 ≤ 𝑥2 ≤ 𝑒2)
THEN class = y
𝑥
𝑥1
𝑥2
𝑠2
𝑒2
𝑠1 𝑒1
模倣ルールを求める際の問題点
• 厳密に模倣ルールを求めるのは困難
• モデルを仮定しないので,全通りのチェック
• 特徴は連続値
→ サンプリングで対応
• 模倣ルールは無数に存在しうる
→ 全て見つけるのは困難
𝑥
𝑥1
𝑥2
9
模倣ルール導出のアルゴリズム
Key Idea
• 説明対象のデータの近傍のデータ
をサンプリング
• 近傍のデータは等間隔に生成
• 組み合わせ的にデータを変化させて
サンプリング
• 同じクラスに属するデータのみ(赤
点)から構成されるようなルール(緑
の領域)を見つける
10
模倣ルール導出のアルゴリズム
データのサンプリング
• まずは1つの特徴を変化
• 異なるクラスの領域にたどり着くま
で生成
11
模倣ルール導出のアルゴリズム
データのサンプリング
• まずは1つの特徴を変化
• 異なるクラスの領域にたどり着くま
で生成
• 変化させる特徴数を増やす
ただし,すべての特徴を変化させると,
2 𝑑
通り
→ パラメータ𝑃を導入し,𝑃個の特徴ま
でを変化させる
12
• 研究背景
• 先行研究
• 提案手法
• 計算機実験
• 実験設定
• 説明手法の定量的な性能評価
• まとめと今後の課題
実験設定
説明ルールがモデルを模倣できているかを定量的に評価
説明ルール内にランダムに1,000,000点を生成し,𝑓 𝑥 = 𝑓 𝑥′
が成り立つかどう
かを検証
計算時間も評価
データセット: Iris (d=4),BreastCancer (d=30)
モデル: 3層パーセプトロン
パラメータ: 𝑃 = 4,一次元あたり10点サンプリング
13
実験結果
• 1.0に近いほどモデルを模倣
しているといえる.
• 各データセットにおいて先行
研究よりも厳密なルールを生
成できている.
• 大域的に利用可能
提案手法 Anchor LORE
Iris 0.956 0.633 0.924
BC 1.000 0.365 0.489
提案手法 Anchor LORE
Iris 0.024 0.266 1.054
BC 46.24 10.32 2.160
説明ルールの厳密性
計算時間[sec]
• 次元が大きいと計算時間が増加
• 特徴数に対して指数時間
• ただし,ルールは再利用可能
14
模倣ルールの図示
人口データを学習したRBF-SVC
星印のインスタンスの周辺の模倣ルール(3つ)を図示
いずれのルールも各領域に内包されている.
15
• 研究背景
• 先行研究
• 提案手法
• 計算機実験
• まとめと今後の課題
まとめ
模倣ルールを用いた説明手法の提案
• 模倣ルール: 説明対象データと同じ予測結果を持つ極大なルール
先行研究に対する利点
• 先行研究よりも正しくモデルの挙動を捉えている
• 大域的に利用可能なルール
今後の課題
• 模倣ルールは複数存在しうる → よりよいルールをどのよう
にして求めるか
• 計算量などの理論的な考察
𝑥
𝑥1
𝑥2
𝑠2
𝑒2
𝑠1 𝑒1
16
Jsai2020

More Related Content

What's hot

ラビットチャレンジレポート 機械学習
ラビットチャレンジレポート 機械学習ラビットチャレンジレポート 機械学習
ラビットチャレンジレポート 機械学習HiroyukiTerada4
 
130418 discrete choiceseminar_no.1
130418 discrete choiceseminar_no.1130418 discrete choiceseminar_no.1
130418 discrete choiceseminar_no.1隆浩 安
 
130425 discrete choiceseminar_no.2
130425 discrete choiceseminar_no.2130425 discrete choiceseminar_no.2
130425 discrete choiceseminar_no.2隆浩 安
 
文献紹介:Mine the Easy, Classify the Hard: A Semi-Supervised Approach to Automati...
文献紹介:Mine the Easy, Classify the Hard: A Semi-Supervised Approach to Automati...文献紹介:Mine the Easy, Classify the Hard: A Semi-Supervised Approach to Automati...
文献紹介:Mine the Easy, Classify the Hard: A Semi-Supervised Approach to Automati...Shohei Okada
 
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...sekizawayuuki
 
続わかりやすいパターン認識7章
続わかりやすいパターン認識7章続わかりやすいパターン認識7章
続わかりやすいパターン認識7章Akiyoshi Hara
 

What's hot (8)

PRML1.3
PRML1.3PRML1.3
PRML1.3
 
ラビットチャレンジレポート 機械学習
ラビットチャレンジレポート 機械学習ラビットチャレンジレポート 機械学習
ラビットチャレンジレポート 機械学習
 
130418 discrete choiceseminar_no.1
130418 discrete choiceseminar_no.1130418 discrete choiceseminar_no.1
130418 discrete choiceseminar_no.1
 
130425 discrete choiceseminar_no.2
130425 discrete choiceseminar_no.2130425 discrete choiceseminar_no.2
130425 discrete choiceseminar_no.2
 
文献紹介:Mine the Easy, Classify the Hard: A Semi-Supervised Approach to Automati...
文献紹介:Mine the Easy, Classify the Hard: A Semi-Supervised Approach to Automati...文献紹介:Mine the Easy, Classify the Hard: A Semi-Supervised Approach to Automati...
文献紹介:Mine the Easy, Classify the Hard: A Semi-Supervised Approach to Automati...
 
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
 
Ml ch2
Ml ch2Ml ch2
Ml ch2
 
続わかりやすいパターン認識7章
続わかりやすいパターン認識7章続わかりやすいパターン認識7章
続わかりやすいパターン認識7章
 

Similar to Jsai2020

令和元年度 実践セミナー - Deep Learning 概論 -
令和元年度 実践セミナー - Deep Learning 概論 -令和元年度 実践セミナー - Deep Learning 概論 -
令和元年度 実践セミナー - Deep Learning 概論 -Yutaka KATAYAMA
 
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太Preferred Networks
 
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線kunihikokaneko1
 
(修正)機械学習デザインパターン(ML Design Patterns)の解説
(修正)機械学習デザインパターン(ML Design Patterns)の解説(修正)機械学習デザインパターン(ML Design Patterns)の解説
(修正)機械学習デザインパターン(ML Design Patterns)の解説Hironori Washizaki
 
自動チューニングとビックデータ:機械学習の適用の可能性
自動チューニングとビックデータ:機械学習の適用の可能性自動チューニングとビックデータ:機械学習の適用の可能性
自動チューニングとビックデータ:機械学習の適用の可能性Takahiro Katagiri
 
機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)Satoshi Hara
 
第3回システム系輪講会:IPDPS'17 の機械学習系論文
第3回システム系輪講会:IPDPS'17 の機械学習系論文第3回システム系輪講会:IPDPS'17 の機械学習系論文
第3回システム系輪講会:IPDPS'17 の機械学習系論文Junya Arai
 
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for PredictionDeep Learning JP
 
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII
 
[DL輪読会]Making Sense of Vision and Touch: Self-Supervised Learning of Multimod...
[DL輪読会]Making Sense of Vision and Touch: Self-Supervised Learning of Multimod...[DL輪読会]Making Sense of Vision and Touch: Self-Supervised Learning of Multimod...
[DL輪読会]Making Sense of Vision and Touch: Self-Supervised Learning of Multimod...Deep Learning JP
 
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介Ryohei Ueda
 
20141220 tokyowebmining state_spacemodel
20141220 tokyowebmining state_spacemodel20141220 tokyowebmining state_spacemodel
20141220 tokyowebmining state_spacemodelKenny ISHIMURA
 
機械学習応用アーキテクチャ・デザインパターン概観
機械学習応用アーキテクチャ・デザインパターン概観機械学習応用アーキテクチャ・デザインパターン概観
機械学習応用アーキテクチャ・デザインパターン概観Hironori Washizaki
 
MapReduceによる大規模データを利用した機械学習
MapReduceによる大規模データを利用した機械学習MapReduceによる大規模データを利用した機械学習
MapReduceによる大規模データを利用した機械学習Preferred Networks
 
Azure Machine Learning getting started
Azure Machine Learning getting startedAzure Machine Learning getting started
Azure Machine Learning getting startedMasayuki Ota
 
確率的深層学習における中間層の改良と高性能学習法の提案
確率的深層学習における中間層の改良と高性能学習法の提案確率的深層学習における中間層の改良と高性能学習法の提案
確率的深層学習における中間層の改良と高性能学習法の提案__106__
 
Jubatusの特徴変換と線形分類器の仕組み
Jubatusの特徴変換と線形分類器の仕組みJubatusの特徴変換と線形分類器の仕組み
Jubatusの特徴変換と線形分類器の仕組みJubatusOfficial
 

Similar to Jsai2020 (20)

令和元年度 実践セミナー - Deep Learning 概論 -
令和元年度 実践セミナー - Deep Learning 概論 -令和元年度 実践セミナー - Deep Learning 概論 -
令和元年度 実践セミナー - Deep Learning 概論 -
 
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
 
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
 
(修正)機械学習デザインパターン(ML Design Patterns)の解説
(修正)機械学習デザインパターン(ML Design Patterns)の解説(修正)機械学習デザインパターン(ML Design Patterns)の解説
(修正)機械学習デザインパターン(ML Design Patterns)の解説
 
自動チューニングとビックデータ:機械学習の適用の可能性
自動チューニングとビックデータ:機械学習の適用の可能性自動チューニングとビックデータ:機械学習の適用の可能性
自動チューニングとビックデータ:機械学習の適用の可能性
 
機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)
 
第3回システム系輪講会:IPDPS'17 の機械学習系論文
第3回システム系輪講会:IPDPS'17 の機械学習系論文第3回システム系輪講会:IPDPS'17 の機械学習系論文
第3回システム系輪講会:IPDPS'17 の機械学習系論文
 
Machine learning
Machine learningMachine learning
Machine learning
 
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
[DL輪読会]Meta-Learning Probabilistic Inference for Prediction
 
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
SSII2020TS: 機械学習モデルの判断根拠の説明​ 〜 Explainable AI 研究の近年の展開 〜​
 
mi-4. 機械学習
mi-4. 機械学習mi-4. 機械学習
mi-4. 機械学習
 
[DL輪読会]Making Sense of Vision and Touch: Self-Supervised Learning of Multimod...
[DL輪読会]Making Sense of Vision and Touch: Self-Supervised Learning of Multimod...[DL輪読会]Making Sense of Vision and Touch: Self-Supervised Learning of Multimod...
[DL輪読会]Making Sense of Vision and Touch: Self-Supervised Learning of Multimod...
 
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
 
20141220 tokyowebmining state_spacemodel
20141220 tokyowebmining state_spacemodel20141220 tokyowebmining state_spacemodel
20141220 tokyowebmining state_spacemodel
 
組込みSW開発技術研究会キックオフミーティング
組込みSW開発技術研究会キックオフミーティング組込みSW開発技術研究会キックオフミーティング
組込みSW開発技術研究会キックオフミーティング
 
機械学習応用アーキテクチャ・デザインパターン概観
機械学習応用アーキテクチャ・デザインパターン概観機械学習応用アーキテクチャ・デザインパターン概観
機械学習応用アーキテクチャ・デザインパターン概観
 
MapReduceによる大規模データを利用した機械学習
MapReduceによる大規模データを利用した機械学習MapReduceによる大規模データを利用した機械学習
MapReduceによる大規模データを利用した機械学習
 
Azure Machine Learning getting started
Azure Machine Learning getting startedAzure Machine Learning getting started
Azure Machine Learning getting started
 
確率的深層学習における中間層の改良と高性能学習法の提案
確率的深層学習における中間層の改良と高性能学習法の提案確率的深層学習における中間層の改良と高性能学習法の提案
確率的深層学習における中間層の改良と高性能学習法の提案
 
Jubatusの特徴変換と線形分類器の仕組み
Jubatusの特徴変換と線形分類器の仕組みJubatusの特徴変換と線形分類器の仕組み
Jubatusの特徴変換と線形分類器の仕組み
 

Jsai2020