More Related Content
More from anonymousouj (6)
C10
- 18. ӌॲಀ ໎ १ല ॐ
1 40 ݖෆෂ ટ१ 70 Τࣣ
2 40 ݖෆෂ १ 70 Τࣣ
3 40 ݖෆෂ ટ१ 70 Τࣣ
4 40 ݖෆෂ ટ१ 70 Τࣣ
5 40 ݖΤࣣ ટ१ 70 Τࣣ
6 40 ݖෆෂ ટ१ 70 ෆෂ
7 40 ݖΤࣣ १ 70 ෆෂ
8 40 ݖΤࣣ १ 70 ෆෂ
9 40 ݖΤࣣ ટ१ 70 ෆෂ
10 40 ݖΤࣣ १ 70 ෆෂ
(例題)成績データ
ある科⽬目の10⼈人の試験結果
- 19. ӌॲಀ ໎ १ല ॐ
1 40 ݖෆෂ ટ१ 70 Τࣣ
2 40 ݖෆෂ १ 70 Τࣣ
3 40 ݖෆෂ ટ१ 70 Τࣣ
4 40 ݖෆෂ ટ१ 70 Τࣣ
5 40 ݖΤࣣ ટ१ 70 Τࣣ
6 40 ݖෆෂ ટ१ 70 ෆෂ
7 40 ݖΤࣣ १ 70 ෆෂ
8 40 ݖΤࣣ १ 70 ෆෂ
9 40 ݖΤࣣ ટ१ 70 ෆෂ
10 40 ݖΤࣣ १ 70 ෆෂ
(例題)成績データ
ある科⽬目の10⼈人の試験結果
カテゴリー変数
(数種類)
バイナリー変数
( 2種類)
連続変数
↕
- 20. ӌॲಀ ໎ १ല ॐ
1 40 ݖෆෂ ટ१ 70 Τࣣ
2 40 ݖෆෂ १ 70 Τࣣ
3 40 ݖෆෂ ટ१ 70 Τࣣ
4 40 ݖෆෂ ટ१ 70 Τࣣ
5 40 ݖΤࣣ ટ१ 70 Τࣣ
6 40 ݖෆෂ ટ१ 70 ෆෂ
7 40 ݖΤࣣ १ 70 ෆෂ
8 40 ݖΤࣣ १ 70 ෆෂ
9 40 ݖΤࣣ ટ१ 70 ෆෂ
10 40 ݖΤࣣ १ 70 ෆෂ
(例題)成績データ
ある科⽬目の10⼈人の試験結果
⽬目的変数
カテゴリー変数
(数種類)
バイナリー変数
( 2種類)
連続変数
↕
- 21. ӌॲಀ ໎ १ല ॐ
1 40 ݖෆෂ ટ१ 70 Τࣣ
2 40 ݖෆෂ १ 70 Τࣣ
3 40 ݖෆෂ ટ१ 70 Τࣣ
4 40 ݖෆෂ ટ१ 70 Τࣣ
5 40 ݖΤࣣ ટ१ 70 Τࣣ
6 40 ݖෆෂ ટ१ 70 ෆෂ
7 40 ݖΤࣣ १ 70 ෆෂ
8 40 ݖΤࣣ १ 70 ෆෂ
9 40 ݖΤࣣ ટ१ 70 ෆෂ
10 40 ݖΤࣣ १ 70 ෆෂ
(例題)成績データ
ある科⽬目の10⼈人の試験結果
カテゴリー変数
(数種類)
バイナリー変数
( 2種類)
連続変数
↕ ⽬目的変数
- 22. ӌॲಀ ໎ १ല ॐ
1 40 ݖෆෂ ટ१ 70 Τࣣ
2 40 ݖෆෂ १ 70 Τࣣ
3 40 ݖෆෂ ટ१ 70 Τࣣ
4 40 ݖෆෂ ટ१ 70 Τࣣ
5 40 ݖΤࣣ ટ१ 70 Τࣣ
6 40 ݖෆෂ ટ१ 70 ෆෂ
7 40 ݖΤࣣ १ 70 ෆෂ
8 40 ݖΤࣣ १ 70 ෆෂ
9 40 ݖΤࣣ ટ१ 70 ෆෂ
10 40 ݖΤࣣ १ 70 ෆෂ
(例題)成績データ
ある科⽬目の10⼈人の試験結果
カテゴリー変数
(数種類)
バイナリー変数
( 2種類)
連続変数
↕
・カテゴリー変数
分類⽊木
・連続変数
回帰⽊木
- 23. 不純度とデータの分割
ӌॲಀ ໎ १ല ॐ
1 40 ݖෆෂ 70 Τࣣ
2 40 ݖෆෂ 70 Τࣣ
3 40 ݖෆෂ ટ१ 70 Τࣣ
4 40 ݖෆෂ ટ१ 70 Τࣣ
5 40 ݖΤࣣ ટ१ 70 Τࣣ
6 40 ݖෆෂ ટ१ 70 ෆෂ
7 40 ݖΤࣣ १ 70 ෆෂ
8 40 ݖΤࣣ १ 70 ෆෂ
9 40 ݖΤࣣ ટ१ 70 ෆෂ
10 40 ݖΤࣣ १ 70 ෆෂ
ટ१
१
ટ१ १
40 ݖෆෂ
40 ݖΤࣣ
- 24. ड़ധ ௰ໃ
ઔड़ ࢌड़ 40
Ιࣘ
40
රභ
70 රභ
70 Ιࣘ
不純度とデータの分割
集合の分割
- 25. ड़ധ ௰ໃ
ઔड़ ࢌड़ 40
Ιࣘ
40
රභ
70 රභ
70 Ιࣘ
不純度とデータの分割
集合の分割
不純度が低くなるように分割
- 26. ड़ധ ௰ໃ
ઔड़ ࢌड़ 40
Ιࣘ
40
රභ
70 රභ
70 Ιࣘ
不純度とデータの分割
不純度が低くなるように分割
集合の分割 ジニ係数
- 27. ड़ധ ௰ໃ
ઔड़ ࢌड़ 40
Ιࣘ
40
රභ
70 රභ
70 Ιࣘ
不純度とデータの分割
AとBという 2種類のボール:
1つ取り出して、元に戻して
もう1つ取り出すとする。
不純度が低い
⇔ 別のものを取り出す割合が⼩小さい
集合の分割 ジニ係数
不純度が低くなるように分割
I = 1 − p2
A − p2
B
= 2pA(1 − pA)
- 28. ड़ധ ௰ໃ
ઔड़ ࢌड़ 40
Ιࣘ
40
රභ
70 රභ
70 Ιࣘ
不純度とデータの分割
不純度が低くなるように分割
ジニ係数
AとBという 2種類のボール:
1つ取り出して、元に戻して
もう1つ取り出すとする。
不純度が低い
⇔ 別のものを取り出す割合が⼩小さい
集合の分割
I = 1 − p2
A − p2
B
= 2pA(1 − pA)
- 29. ड़ധ ௰ໃ
ઔड़ ࢌड़ 40
Ιࣘ
40
රභ
70 රභ
70 Ιࣘ
不純度とデータの分割
IP = 1 −
!
5
10
#2
+
5
10
#2
$
= 0.5
分割前
- 30. ड़ധ ௰ໃ
ઔड़ ࢌड़ 40
Ιࣘ
40
රභ
70 රභ
70 Ιࣘ
不純度とデータの分割
IP = 1 −
!
5
10
#2
+
5
10
#2
$
= 0.5
IS(ઔड़) = 1 −
4
6
2
+
2
6
2
=
4
9
= 0.444 . . .
IS(ࢌड़) = 1 −
1
4
2
+
3
4
2
=
3
8
= 0.375
IS =
6
10
×
4
9
+
4
10
×
3
8
=
5
12
= 0.416 . . .
性別
分割前
- 31. ड़ധ ௰ໃ
ઔड़ ࢌड़ 40
Ιࣘ
40
රභ
70 රභ
70 Ιࣘ
不純度とデータの分割
IP = 1 −
!
5
10
#2
+
5
10
#2
$
= 0.5
IY (40 Ιࣘ) = 1 −
4
5
2
+
1
5
2
=
8
25
= 0.32
IY (40 රභ) = 1 −
1
5
2
+
4
5
2
=
8
25
= 0.32
IY =
5
10
×
8
25
+
5
10
×
8
25
=
8
25
= 0.32
年齢
分割前
- 32. ड़ധ ௰ໃ
ઔड़ ࢌड़ 40
Ιࣘ
40
රභ
70 රභ
70 Ιࣘ
不純度とデータの分割
IP = 1 −
!
5
10
#2
+
5
10
#2
$
= 0.5
IS =
6
10
×
4
9
+
4
10
×
3
8
=
5
12
= 0.416 . . .
性別
年齢
IY =
5
10
×
8
25
+
5
10
×
8
25
=
8
25
= 0.32
∆IP Y = IP − IY = 0.5 − 0.32 = 0.18
∆IP S = IP − IS = 0.5 − 0.416 · · · = 0.083 · · ·
- 34. データについて
R
number, age, sex, trial, score
1, Under40, Man, New, Under70
2, Under40, Woman, New, Under70
3, Over40, Woman, Retry, Under70
4, Over40, Man, New, Over70
5, Over40, Woman, New, Over70
6, Under40, Man, New, Over70
7, Under40, Woman, New, Under70
8, Under40, Man, New, Over70
9, Under40, Woman, Retry, Under70
10, Under40, Man, New, Over70
.
.
.
(Τђࣈຊ)
- 35. 決定⽊木の演習
library( mvpart )
s1 - read.csv( “exam.csv”, header=T, row.names=1)
plot ( s2 )
text( s2, pretty=0, all.leaves=T )
R
s2 - rpart( score~ age + sex + trial , data=s1,method=“class” )
s2 - rpart( score~. , data=s1,method=“class” )
- 36. 決定⽊木の演習
library( mvpart )
s1 - read.csv( “exam.csv”, header=T, row.names=1)
plot ( s2 )
text( s2, pretty=0, all.leaves=T )
R
s2 - rpart( score~ age + sex + trial , data=s1,method=“class” )
s2 - rpart( score~. , data=s1,method=“class” )
- 37. 決定⽊木の演習
library( mvpart )
s1 - read.csv( “exam.csv”, header=T, row.names=1)
plot ( s2 )
text( s2, pretty=0, all.leaves=T )
s2 - rpart( score~ age + sex + trial , data=s1,method=“class” )
s2 - rpart( score~. , data=s1,method=“class” )
R