More Related Content
PDF
PDF
【論文調査】XAI技術の効能を ユーザ実験で評価する研究 PDF
PPTX
LightGBMを少し改造してみた ~カテゴリ変数の動的エンコード~ PDF
PDF
PPTX
【DL輪読会】Efficiently Modeling Long Sequences with Structured State Spaces PDF
What's hot
PPTX
PDF
Cmdstanr入門とreduce_sum()解説 PDF
PDF
PPTX
PPTX
[DL輪読会]NVAE: A Deep Hierarchical Variational Autoencoder PDF
PDF
ブレインパッドにおける機械学習プロジェクトの進め方 PPTX
PPTX
PDF
PDF
深層学習の不確実性 - Uncertainty in Deep Neural Networks - PDF
PDF
Layer Normalization@NIPS+読み会・関西 PPTX
PDF
Sparse Codingをなるべく数式を使わず理解する(PCAやICAとの関係) PPTX
PDF
PDF
PDF
一般化線形モデル (GLM) & 一般化加法モデル(GAM) Viewers also liked
PDF
PDF
はじめてでもわかるベイズ分類器 -基礎からMahout実装まで- PDF
PPTX
PDF
トピックモデルを用いた 潜在ファッション嗜好の推定 PDF
PDF
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京 PDF
ロジスティック回帰の考え方・使い方 - TokyoR #33 PPTX
PDF
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築 PDF
機械学習チュートリアル@Jubatus Casual Talks PDF
PPTX
Pythonとdeep learningで手書き文字認識 PDF
scikit-learnを用いた機械学習チュートリアル PDF
PDF
PDF
PPTX
30分でわかる『R』によるデータ分析|データアーティスト PDF
PDF
Newman アルゴリズムによるソーシャルグラフのクラスタリング Similar to 決定木学習
PPTX
Machine learning-dicision-bda-furukawa PDF
PDF
機械学習によるモデル自動生成の一考察 ー 決定表と決定木によるアプローチ - PDF
PPTX
0610 TECH & BRIDGE MEETING PPTX
20190725 taguchi decision_tree_for_pubshare PDF
PPTX
PDF
PDF
PDF
分類問題 - 機械学習ライブラリ scikit-learn の活用 PPTX
PDF
レコメンドアルゴリズムの基本と周辺知識と実装方法 PDF
PDF
PDF
PDF
PPTX
PPTX
PDF
決定木学習
- 1.
- 2.
- 3.
- 4.
生成手順②: 分割基準
4
天気 気温湿度 風
晴れ 曇り 雨 強い 弱い18~29 65~96
分割基準 対応ツール
Information Gain C4.5
Gini係数 CART
検定統計量 CHAID
分割した2つのデータについて
右の指標のいずれかを計算し、
もっとも分類能力の高い分割を採用
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
決定木学習はよく使われている (1)
11
1 C4.5
2K-Means
3 Support Vector Machine
4 Apriori
5 EM
6 PageRank
7 AdaBoost
8 kNN
9 Naive Bayes
10 CART IEEE ICDM, 2006
Data Miningで使われるTop10アルゴリズム
決定木学習は1位と10位に入っている
- 12.
- 13.
例題
架空のテストマーケティング調査 (乱数で作成)
対象都市: 東京、大阪、高知 カテゴリ変数
対象年代: 20代, 30代, 40代, 50代, 60代 順序変数
対象性別: 男性、女性 カテゴリ変数
調査内容:「この商品を買いますか?」
※ 東京で、女性で、若いほど買う傾向が高くなるように仕込み
有望なセグメントを判別したい
13
- 14.
- 15.
20代 30代 40代50代 60代
020406080
「年代」での決定木(順序尺度)
15
20代,30代 40代,50代,60代
O
74/46
X
43/137
年代
20,30代と40,50,60代の2つに分けると
買う・買わないが最も偏るよう分類される
- 16.
- 17.
- 18.
全変数を用いた決定木
18
女性
東京
東京
男性
高知,大阪
高知,大阪
O
53/7
O
26/4
X
12/48
O
22/8
X
0/20
X
4/96
性別
住所年代
年代住所
①
③②
① 女性 &20,30代 購入率:88.3%
② 女性 & 40,50,60代 & 東京 購入率:86.7%
③ 男性 & 東京&20,30,40代 購入率:73.3%
有望セグメント・・・(購入率 > 50%)
20代,30代 40代,50代,60代
20代,30代,40代 50代,60代
- 19.
- 20.
発展編(2) ・・・ハイブリッド型決定木
決定木学習と回帰分析の組み合わせ
20
ptratio
p <0.001
1
20.1 20.1
tax
p < 0.001
2
265 265
Node 3 (n = 84)
3.1 9.3
1
54
Node 4 (n = 226)
3.1 9.3
1
54
nox
p < 0.001
5
0.668 0.668
Node 6 (n = 111)
3.1 9.3
1
54
Node 7 (n = 85)
3.1 9.3
1
54
4 5 6 7 8
1020304050
Boston$rm
Boston$medv
※ 決定係数=0.4835
決定係数 0.86 0.78 0.06 0.03
傾き 11.9 10.0 3.50 1.22
異なる回帰モデルになるようにデータを分割
データ全体
(Bostonの住宅価格と部屋数の分布)
- 21.