SlideShare a Scribd company logo
1 of 72
人工智慧
教師:陳志華博士
報告大綱-貝氏分類和貝氏網路
貝氏分類定義和說明
基礎統計回顧
單純貝氏分類(Naive Bayesian Classifier)
單純貝氏分類實作
單純貝氏分類限制
單純貝氏分類優點
貝氏網路分類(Bayesian Network Classifier)
貝氏網路分類實作
貝氏分類實例應用
2
貝氏分類定義和說明
貝氏分類(Bayesian Classifier)藉由資料中分析屬性與反應變數之間的機率模型,根據貝氏
定理(Bayes’Theorem)來更新資訊以推理判斷樣本資料歸屬類別,作為分類和推論的依據。
常用的方式有單純貝氏分類(Naive Bayesian Classifier)和貝氏網路分類(Bayesian Network
Classifier)。
由於並非所有的事件都有大量的歷史資料或可以重複實驗,因此面對沒有經驗、可參考的
資訊過或者沒有頻率機率存在的情況,貝氏網路亦可採用主觀機率,亦即將認為該事件是
否會發生的信念(degree of belief)的主觀判斷轉為主觀機率。
3
顧客編號 婚姻 年齡 收入 購買不動產
C01 單身 中年 高 無
C02 單身 青年 高 有
C03 已婚 青年 高 有
C04 已婚 中年 高 無
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
單身:0
已婚:1
青年:0
中年:1
低:0
高:1
無:0
有:1
貝氏分類定義和說明
古典機率(事前機率)和條件機率計算
4
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
  %504/20Pr 婚姻
  %504/21Pr 婚姻
  %502/10|0Pr  購買不動產婚姻
  %502/10|1Pr  購買不動產婚姻
  %504/20Pr 年齡
  %504/21Pr 年齡
  %02/00|0Pr  購買不動產年齡
  %1002/20|1Pr  購買不動產年齡
  %502/11|0Pr  購買不動產婚姻
  %502/11|1Pr  購買不動產婚姻
  %1002/21|0Pr  購買不動產年齡
  %02/01|1Pr  購買不動產年齡
  %04/00Pr 收入
  %1004/41Pr 收入
  %02/00|0Pr  購買不動產收入
  %1002/20|1Pr  購買不動產收入
  %02/01|0Pr  購買不動產收入
  %1002/21|1Pr  購買不動產收入
貝氏分類主要運用事前機
率和條件機率,結合貝氏
定理進行計算和推論
婚姻的事前機率和條件機率 年齡的事前機率和條件機率 收入的事前機率和條件機率
  %504/20Pr 購買不動產
  %504/21Pr 購買不動產
購買不動產的事前機率
以婚姻、年齡、收入判斷是否購買不動產
基礎統計回顧
貝氏定理
貝氏定理的主要概念為:一開始不知道目標事件Y的真實狀態,但知道Y服從一個機率分
佈Pr(Y),當得到新的樣本資訊或證據x後,yi發生的條件機率(事後機率)
5
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
     
 x
xy
xyxyY i
ii
Pr
Pr
|Pr|Pr


         iiii yyxxxyxy Pr|PrPr|PrPr 
   
 
   
 
 i
i
ii
i y
y
yx
x
x
xy
xy Pr
Pr
Pr
Pr
Pr
Pr
Pr 




 
 
 0Pr
00Pr
0|0Pr




婚姻
婚姻購買不動產
婚姻購買不動產
 
   
   0Pr0|0Pr
0Pr0|0Pr
00Pr



購買不動產購買不動產婚姻
婚姻婚姻購買不動產
婚姻購買不動產
以婚姻、年齡、收入判斷是否購買不動產之案例
   
 
   
 x
yyx
x
xy
xy iii
i
Pr
Pr|Pr
Pr
Pr
|Pr




基礎統計回顧
貝氏定理
假設事件共有m種,Pr(x)可定義如下:
6
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
             
   


m
i
ii
mm
yyx
yyxyyxyyxx
1
2211
Pr|Pr
Pr|Pr...Pr|PrPr|PrPr
 
       1Pr1|0Pr0Pr0|0Pr
0Pr


購買不動產購買不動產婚姻購買不動產購買不動產婚姻
婚姻
以婚姻、年齡、收入判斷是否購買不動產之案例
基礎統計回顧
貝氏定理
在取得的新資訊事件x下,貝氏定理可修正條件機率為
7
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
 
   
       1Pr1|0Pr0Pr0|0Pr
0Pr0|0Pr
0|0Pr




購買不動產購買不動產婚姻購買不動產購買不動產婚姻
購買不動產購買不動產婚姻
婚姻購買不動產
以婚姻、年齡、收入判斷是否購買不動產之案例
   
 
   
 
   
   






 m
i
ii
iiiii
i
yyx
yyx
x
yyx
x
xy
xy
1
Pr|Pr
Pr|Pr
Pr
Pr|Pr
Pr
Pr
|Pr
基礎統計回顧
獨立(Independence)
◦ 一事件發生與否,不會影響另一事件發生之機率
◦ 當 即事件A與事件B互相獨立
◦ 例如:
◦ 「單身」與「青年」為獨立事件
◦ 「已婚」與「青年」為獨立事件
88
BA 
c
A
     BPrAPrBAPr 
      %25%50%500Pr0Pr00Pr  年齡婚姻年齡婚姻
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
BA 
      %25%50%500Pr1Pr01Pr  年齡婚姻年齡婚姻
基礎統計回顧
如何驗證獨立(Independence)?
皮爾森相關係數可用來分析正相關、獨立、負相關
皮爾森相關係數的值域為[-1, 1],當係數值為1代表完全正相關、0代表獨立、-1代表完全負相關
9
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
   
    

 



n
i
n
i
ii
n
i
ii
BbAa
BbAa
1 1
22
1
顧客編號 婚姻 年齡 婚姻-婚姻平均值 年齡-年齡平均值
C01 0 1 -0.5 0.5
C02 0 0 -0.5 -0.5
C03 1 0 0.5 -0.5
C04 1 1 0.5 0.5
婚姻和年齡進行皮爾森相關係數
計算結果為0
故婚姻和年齡為互相獨立
單純貝氏分類
單純貝氏分類有兩個基本假設
◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定
◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立
當資料中共有k個屬性時,則X = {x1, x2, …, xk},基於貝氏定理可得:
10
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
   
 
   
 
   
 
   
 k
iik
k
iik
iii
i
xxx
yyxxx
xxx
yyxxx
X
yyX
X
Xy
Xy









...Pr
Pr|...Pr
,...,,Pr
Pr|,...,,Pr
Pr
Pr|Pr
Pr
Pr
|Pr
21
21
21
21
 
   
 000Pr
0Pr0|000Pr
00,0,|0Pr




收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
評估單身、青年、低收入
不會購買不動產的機率
單純貝氏分類
單純貝氏分類有兩個基本假設
◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定
◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立
假設屬性資料相互獨立:
11
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
   
     ikii
iki
yxyxyx
yxxxyX
|Pr...|Pr|Pr
|...Pr|Pr
21
21


 
 
     0|0Pr0|0Pr0|0Pr
0|000Pr
0|00,0,Pr



購買不動產收入購買不動產年齡購買不動產婚姻
購買不動產收入年齡婚姻
購買不動產收入年齡婚姻
評估單身、青年、低收入
不會購買不動產的機率
條件獨立      CBCACBA |Pr|Pr|Pr 
單純貝氏分類
單純貝氏分類有兩個基本假設
◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定
◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立
12
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
        

m
i
iik yyXxxxX
1
21 Pr|Pr...PrPr
 
   
   1Pr1|000Pr
0Pr0|000Pr
00,0,Pr



購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻
評估單身、青年、低收入
不會購買不動產的機率
單純貝氏分類
「單身」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率
「單身」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率
13
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
 
   
 
        
       
 
   
%0
%50%0%100%50%50%0%0%50
%50%0%0%50
1Pr1|000Pr0Pr0|000Pr
0Pr0|0Pr0|0Pr0|0Pr
000Pr
0Pr0|000Pr
00,0,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%0
%50%0%100%50%50%0%0%50
%50%0%100%50
1Pr1|000Pr0Pr0|000Pr
1Pr1|0Pr1|0Pr1|0Pr
000Pr
1Pr1|000Pr
00,0,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 0%
購買不動產機率 = 0%
購買與否無顯著差異
不考慮「收入」因子,
購買不動產的機率高
單純貝氏分類
「單身」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率
「單身」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率
14
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
 
   
 
        
       
 
   
%0
%50%100%100%50%50%100%0%50
%50%100%0%50
1Pr1|100Pr0Pr0|100Pr
0Pr0|1Pr0|0Pr0|0Pr
100Pr
0Pr0|100Pr
10,0,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%100
%50%100%100%50%50%100%0%50
%50%100%100%50
1Pr1|100Pr0Pr0|100Pr
1Pr1|1Pr1|0Pr1|0Pr
100Pr
1Pr1|100Pr
10,0,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 0%
購買不動產機率 = 100%
此族群將會購買不動產
單純貝氏分類
「單身」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率
「單身」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率
15
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
 
   
 
        
       
 
   
%0
%50%0%0%50%50%0%100%50
%50%0%100%50
1Pr1|010Pr0Pr0|010Pr
0Pr0|0Pr0|1Pr0|0Pr
010Pr
0Pr0|010Pr
01,0,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%0
%50%0%0%50%50%0%100%50
%50%0%0%50
1Pr1|010Pr0Pr0|010Pr
1Pr1|0Pr1|1Pr1|0Pr
010Pr
1Pr1|010Pr
01,0,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 0%
購買不動產機率 = 0%
購買與否無顯著差異
不考慮「收入」因子,
不購買不動產的機率高
單純貝氏分類
「單身」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率
「單身」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率
16
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
 
   
 
        
       
 
   
%100
%50%100%0%50%50%100%100%50
%50%100%100%50
1Pr1|110Pr0Pr0|110Pr
0Pr0|1Pr0|1Pr0|0Pr
110Pr
0Pr0|110Pr
11,0,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%0
%50%100%0%50%50%100%100%50
%50%100%0%50
1Pr1|110Pr0Pr0|110Pr
1Pr1|1Pr1|1Pr1|0Pr
110Pr
1Pr1|110Pr
11,0,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 100%
購買不動產機率 = 0%
此族群將不會購買不動產
單純貝氏分類
「已婚」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率
「已婚」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率
17
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
 
   
 
        
       
 
   
%0
%50%0%100%50%50%0%0%50
%50%0%0%50
1Pr1|001Pr0Pr0|001Pr
0Pr0|0Pr0|0Pr0|1Pr
001Pr
0Pr0|001Pr
00,1,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%0
%50%0%100%50%50%0%0%50
%50%0%100%50
1Pr1|001Pr0Pr0|001Pr
1Pr1|0Pr1|0Pr1|1Pr
001Pr
1Pr1|001Pr
00,1,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 0%
購買不動產機率 = 0%
購買與否無顯著差異
不考慮「收入」因子,
購買不動產的機率高
單純貝氏分類
「已婚」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率
「已婚」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率
18
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
 
   
 
        
       
 
   
%0
%50%100%100%50%50%100%0%50
%50%100%0%50
1Pr1|101Pr0Pr0|101Pr
0Pr0|1Pr0|0Pr0|1Pr
101Pr
0Pr0|101Pr
10,1,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%100
%50%100%100%50%50%100%0%50
%50%100%100%50
1Pr1|101Pr0Pr0|101Pr
1Pr1|1Pr1|0Pr1|1Pr
101Pr
1Pr1|101Pr
10,1,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 0%
購買不動產機率 = 100%
此族群將會購買不動產
單純貝氏分類
「已婚」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率
「已婚」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率
19
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
 
   
 
        
       
 
   
%0
%50%0%0%50%50%0%100%50
%50%0%100%50
1Pr1|011Pr0Pr0|011Pr
0Pr0|0Pr0|1Pr0|1Pr
011Pr
0Pr0|011Pr
01,1,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%0
%50%0%0%50%50%0%100%50
%50%0%0%50
1Pr1|011Pr0Pr0|011Pr
1Pr1|0Pr1|1Pr1|1Pr
011Pr
1Pr1|011Pr
01,1,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 0%
購買不動產機率 = 0%
購買與否無顯著差異
不考慮「收入」因子,
不購買不動產的機率高
單純貝氏分類
「已婚」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率
「已婚」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率
20
顧客編號 婚姻 年齡 收入 購買不動產
C01 0 1 1 0
C02 0 0 1 1
C03 1 0 1 1
C04 1 1 1 0
 
   
 
        
       
 
   
%100
%50%100%0%50%50%100%100%50
%50%100%100%50
1Pr1|111Pr0Pr0|111Pr
0Pr0|1Pr0|1Pr0|1Pr
111Pr
0Pr0|111Pr
11,1,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%0
%50%100%0%50%50%100%100%50
%50%100%0%50
1Pr1|111Pr0Pr0|111Pr
1Pr1|1Pr1|1Pr1|1Pr
111Pr
1Pr1|111Pr
11,1,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 100%
購買不動產機率 = 0%
此族群將不會購買不動產
單純貝氏分類實作
建立訓練資料,並儲存為csv檔
請參考「案例1_購買不動產(訓練資料).csv」
21
顧客編號 婚姻 年齡 收入 購買不動產
C01 單身 中年 高 無
C02 單身 青年 高 有
C03 已婚 青年 高 有
C04 已婚 中年 高 無
婚姻 年齡 收入 Class
0 1 1 0
0 0 1 1
1 0 1 1
1 1 1 0
單身:0
已婚:1
青年:0
中年:1
低:0
高:1
無:0
有:1
單純貝氏分類實作
新增RScript檔案,並編輯程式碼
#安裝e1071函式庫
install.packages('e1071')
#引用e1071函式庫
library(e1071)
22
單純貝氏分類實作
#讀取訓練資料
training_data <- read.csv(file.choose(),
header = TRUE)
#轉換為因子矩陣
training_data <-
data.frame(lapply(training_data, as.factor))
23
單純貝氏分類實作
#訓練單純貝氏模型
model <- naiveBayes(Class ~ ., data =
training_data)
24
設定目標欄位為「Class」,
其他欄位為訓練資料
單純貝氏分類實作
#讀取測試資料
testing_data <- read.csv(file.choose(),
header = TRUE)
#轉換為因子矩陣
testing_data <-
data.frame(lapply(testing_data, as.factor))
25
單純貝氏分類實作
#將測試資料代入模型進行預測,並取得
預測結果
pred <- predict(model, testing_data)
#運用表格呈現和比對預測結果
table(pred, testing_data$Class)
26
單純貝氏分類實作
可經由table瀏覽分類結果
27
正確答案為
「目標類別」
正確答案為
「非目標類別」
機器答案為
「目標類別」
True Positive (TP)
False Positive (FP)
(型一(Type I)誤差)
機器答案為
「非目標類別」
False Negative (FN)
(型二(Type II)誤差)
True Negative (TN)
不購買不動產 購買不動產
不購買不動產 2 0
購買不動產 0 2
%100
2
2
Precision 


FPTP
TP
%100
2
2
Recall 


FNTP
TP
假設測試資料同訓練資料
單純貝氏分類限制
單純貝氏分類有兩個基本假設
◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定
◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立
單純貝氏分類不適用之情境
◦ 屬性資料具有關聯性
◦ 下列案例:婚姻與年齡負相關、婚姻與收入正相關、年齡與收入負相關、屬性資料與目標資料互相獨立
28
顧客編號 婚姻 年齡 收入 購買不動產
C11 單身 中年 低 無
C12 單身 中年 低 有
C13 已婚 青年 高 有
C14 已婚 青年 高 無
顧客編號 婚姻 年齡 收入 購買不動產
C11 0 1 0 0
C12 0 1 0 1
C13 1 0 1 1
C14 1 0 1 0
單身:0
已婚:1
青年:0
中年:1
低:0
高:1
無:0
有:1
單純貝氏分類限制
「單身」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率
「單身」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率
29
顧客編號 婚姻 年齡 收入 購買不動產
C11 0 1 0 0
C12 0 1 0 1
C13 1 0 1 1
C14 1 0 1 0
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|000Pr0Pr0|000Pr
0Pr0|0Pr0|0Pr0|0Pr
000Pr
0Pr0|000Pr
00,0,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|000Pr0Pr0|000Pr
1Pr1|0Pr1|0Pr1|0Pr
000Pr
1Pr1|000Pr
00,0,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 50%
購買不動產機率 = 50%
並且機率非0%,則演算法
會猜測為「不購買不動產」
單純貝氏分類限制
「單身」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率
「單身」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率
30
顧客編號 婚姻 年齡 收入 購買不動產
C11 0 1 0 0
C12 0 1 0 1
C13 1 0 1 1
C14 1 0 1 0
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|100Pr0Pr0|100Pr
0Pr0|1Pr0|0Pr0|0Pr
100Pr
0Pr0|100Pr
10,0,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|100Pr0Pr0|100Pr
1Pr1|1Pr1|0Pr1|0Pr
100Pr
1Pr1|100Pr
10,0,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 50%
購買不動產機率 = 50%
並且機率非0%,則演算法
會猜測為「不購買不動產」
單純貝氏分類限制
「單身」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率
「單身」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率
31
顧客編號 婚姻 年齡 收入 購買不動產
C11 0 1 0 0
C12 0 1 0 1
C13 1 0 1 1
C14 1 0 1 0
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|010Pr0Pr0|010Pr
0Pr0|0Pr0|1Pr0|0Pr
010Pr
0Pr0|010Pr
01,0,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|010Pr0Pr0|010Pr
1Pr1|0Pr1|1Pr1|0Pr
010Pr
1Pr1|010Pr
01,0,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 50%
購買不動產機率 = 50%
並且機率非0%,則演算法
會猜測為「不購買不動產」
單純貝氏分類限制
「單身」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率
「單身」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率
32
顧客編號 婚姻 年齡 收入 購買不動產
C11 0 1 0 0
C12 0 1 0 1
C13 1 0 1 1
C14 1 0 1 0
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|110Pr0Pr0|110Pr
0Pr0|1Pr0|1Pr0|0Pr
110Pr
0Pr0|110Pr
11,0,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|110Pr0Pr0|110Pr
1Pr1|1Pr1|1Pr1|0Pr
110Pr
1Pr1|110Pr
11,0,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 50%
購買不動產機率 = 50%
並且機率非0%,則演算法
會猜測為「不購買不動產」
單純貝氏分類限制
「已婚」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率
「已婚」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率
33
顧客編號 婚姻 年齡 收入 購買不動產
C11 0 1 0 0
C12 0 1 0 1
C13 1 0 1 1
C14 1 0 1 0
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|001Pr0Pr0|001Pr
0Pr0|0Pr0|0Pr0|1Pr
001Pr
0Pr0|001Pr
00,1,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|001Pr0Pr0|001Pr
1Pr1|0Pr1|0Pr1|1Pr
001Pr
1Pr1|001Pr
00,1,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 50%
購買不動產機率 = 50%
並且機率非0%,則演算法
會猜測為「不購買不動產」
單純貝氏分類限制
「已婚」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率
「已婚」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率
34
顧客編號 婚姻 年齡 收入 購買不動產
C11 0 1 0 0
C12 0 1 0 1
C13 1 0 1 1
C14 1 0 1 0
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|101Pr0Pr0|101Pr
0Pr0|1Pr0|0Pr0|1Pr
101Pr
0Pr0|101Pr
10,1,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|101Pr0Pr0|101Pr
1Pr1|1Pr1|0Pr1|1Pr
101Pr
1Pr1|101Pr
10,1,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 50%
購買不動產機率 = 50%
並且機率非0%,則演算法
會猜測為「不購買不動產」
單純貝氏分類限制
「已婚」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率
「已婚」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率
35
顧客編號 婚姻 年齡 收入 購買不動產
C11 0 1 0 0
C12 0 1 0 1
C13 1 0 1 1
C14 1 0 1 0
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|011Pr0Pr0|011Pr
0Pr0|0Pr0|1Pr0|1Pr
011Pr
0Pr0|011Pr
01,1,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|011Pr0Pr0|011Pr
1Pr1|0Pr1|1Pr1|1Pr
011Pr
1Pr1|011Pr
01,1,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 50%
購買不動產機率 = 50%
並且機率非0%,則演算法
會猜測為「不購買不動產」
單純貝氏分類限制
「已婚」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率
「已婚」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率
36
顧客編號 婚姻 年齡 收入 購買不動產
C11 0 1 0 0
C12 0 1 0 1
C13 1 0 1 1
C14 1 0 1 0
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|111Pr0Pr0|111Pr
0Pr0|1Pr0|1Pr0|1Pr
111Pr
0Pr0|111Pr
11,1,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%50
%50%50%50%50%50%50%50%50
%50%50%50%50
1Pr1|111Pr0Pr0|111Pr
1Pr1|1Pr1|1Pr1|1Pr
111Pr
1Pr1|111Pr
11,1,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 50%
購買不動產機率 = 50%
並且機率非0%,則演算法
會猜測為「不購買不動產」
單純貝氏分類限制
建立訓練資料,並儲存為csv檔
請參考「案例2_購買不動產(訓練資料).csv」
37
顧客編號 婚姻 年齡 收入 購買不動產
C11 單身 中年 低 無
C12 單身 中年 低 有
C13 已婚 青年 高 有
C14 已婚 青年 高 無
婚姻 年齡 收入 Class
0 1 0 0
0 1 0 1
1 0 1 1
1 0 1 0
單身:0
已婚:1
青年:0
中年:1
低:0
高:1
無:0
有:1
單純貝氏分類限制
執行單純貝氏分類
38
正確答案為
「目標類別」
正確答案為
「非目標類別」
機器答案為
「目標類別」
True Positive (TP)
False Positive (FP)
(型一(Type I)誤差)
機器答案為
「非目標類別」
False Negative (FN)
(型二(Type II)誤差)
True Negative (TN)
不購買不動產 購買不動產
不購買不動產 2 2
購買不動產 0 0
%50
4
2
Precision 


FPTP
TP
%100
2
2
Recall 


FNTP
TP
假設測試資料同訓練資料
單純貝氏分類優點
單純貝氏分類有兩個基本假設
◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定
◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立
單純貝氏分類適用情境
◦ 當符合「屬性資料相互獨立」條件下,可預測未知資料
39
顧客編號 婚姻 年齡 收入 購買不動產
C21 單身 中年 低 無
C22 單身 中年 高 無
C23 單身 青年 高 有
C24 已婚 中年 低 無
C25 已婚 青年 低 有
C26 已婚 青年 高 有
顧客編號 婚姻 年齡 收入 購買不動產
C21 0 0 0 0
C22 0 0 1 0
C23 0 1 1 1
C24 1 0 0 0
C25 1 1 0 1
C26 1 1 1 1
單身:0
已婚:1
青年:0
中年:1
低:0
高:1
無:0
有:1
顧客編號 婚姻 年齡 收入 購買不動產
單身 中年 低 有
已婚 青年 高 無
訓練資料
訓練資料
中缺少之
資料組合
單純貝氏分類優點
「單身」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率
「單身」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率
40
 
   
 
        
       
 
   
%100
%50%33%0%33%50%67%100%67
%50%67%100%67
1Pr1|000Pr0Pr0|000Pr
0Pr0|0Pr0|0Pr0|0Pr
000Pr
0Pr0|000Pr
00,0,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%0
%50%33%0%33%50%67%100%67
%50%33%0%33
1Pr1|000Pr0Pr0|000Pr
1Pr1|0Pr1|0Pr1|0Pr
000Pr
1Pr1|000Pr
00,0,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
不購買不動產機率 = 100%
購買不動產機率 = 0%
此族群將不會購買不動產
顧客編號 婚姻 年齡 收入 購買不動產
C21 0 0 0 0
C22 0 0 1 0
C23 0 1 1 1
C24 1 0 0 0
C25 1 1 0 1
C26 1 1 1 1
單純貝氏分類優點
「單身」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率
「單身」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率
41
 
   
 
        
       
 
   
%100
%50%67%0%33%50%33%100%67
%50%33%100%67
1Pr1|100Pr0Pr0|100Pr
0Pr0|1Pr0|0Pr0|0Pr
100Pr
0Pr0|100Pr
10,0,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%0
%50%67%0%33%50%33%100%67
%50%67%0%33
1Pr1|100Pr0Pr0|100Pr
1Pr1|1Pr1|0Pr1|0Pr
100Pr
1Pr1|100Pr
10,0,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
顧客編號 婚姻 年齡 收入 購買不動產
C21 0 0 0 0
C22 0 0 1 0
C23 0 1 1 1
C24 1 0 0 0
C25 1 1 0 1
C26 1 1 1 1
不購買不動產機率 = 100%
購買不動產機率 = 0%
此族群將不會購買不動產
單純貝氏分類優點
「單身」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率
「單身」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率
42
 
   
 
        
       
 
   
%0
%50%33%100%33%50%67%0%67
%50%67%0%67
1Pr1|010Pr0Pr0|010Pr
0Pr0|0Pr0|1Pr0|0Pr
010Pr
0Pr0|010Pr
01,0,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%100
%50%33%100%33%50%67%0%67
%50%33%100%33
1Pr1|010Pr0Pr0|010Pr
1Pr1|0Pr1|1Pr1|0Pr
010Pr
1Pr1|010Pr
01,0,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
顧客編號 婚姻 年齡 收入 購買不動產
C21 0 0 0 0
C22 0 0 1 0
C23 0 1 1 1
C24 1 0 0 0
C25 1 1 0 1
C26 1 1 1 1
不購買不動產機率 = 0%
購買不動產機率 = 100%
此族群將會購買不動產
單純貝氏分類優點
「單身」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率
「單身」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率
43
 
   
 
        
       
 
   
%0
%50%67%100%33%50%33%0%67
%50%33%0%67
1Pr1|110Pr0Pr0|110Pr
0Pr0|1Pr0|1Pr0|0Pr
110Pr
0Pr0|110Pr
11,0,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%100
%50%67%100%33%50%33%0%67
%50%67%100%33
1Pr1|110Pr0Pr0|110Pr
1Pr1|1Pr1|1Pr1|0Pr
110Pr
1Pr1|110Pr
11,0,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
顧客編號 婚姻 年齡 收入 購買不動產
C21 0 0 0 0
C22 0 0 1 0
C23 0 1 1 1
C24 1 0 0 0
C25 1 1 0 1
C26 1 1 1 1
43
不購買不動產機率 = 0%
購買不動產機率 = 100%
此族群將會購買不動產
單純貝氏分類優點
「已婚」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率
「已婚」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率
44
 
   
 
        
       
 
   
%100
%50%33%0%67%50%67%100%33
%50%67%100%33
1Pr1|001Pr0Pr0|001Pr
0Pr0|0Pr0|0Pr0|1Pr
001Pr
0Pr0|001Pr
00,1,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%0
%50%33%0%67%50%67%100%33
%50%33%0%67
1Pr1|001Pr0Pr0|001Pr
1Pr1|0Pr1|0Pr1|1Pr
001Pr
1Pr1|001Pr
00,1,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
顧客編號 婚姻 年齡 收入 購買不動產
C21 0 0 0 0
C22 0 0 1 0
C23 0 1 1 1
C24 1 0 0 0
C25 1 1 0 1
C26 1 1 1 1
不購買不動產機率 = 100%
購買不動產機率 = 0%
此族群將不會購買不動產
單純貝氏分類優點
「已婚」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率
「已婚」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率
45
 
   
 
        
       
 
   
%100
%50%67%0%67%50%33%100%33
%50%33%100%33
1Pr1|101Pr0Pr0|101Pr
0Pr0|1Pr0|0Pr0|1Pr
101Pr
0Pr0|101Pr
10,1,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%0
%50%67%0%67%50%33%100%33
%50%67%0%67
1Pr1|101Pr0Pr0|101Pr
1Pr1|1Pr1|0Pr1|1Pr
101Pr
1Pr1|101Pr
10,1,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
顧客編號 婚姻 年齡 收入 購買不動產
C21 0 0 0 0
C22 0 0 1 0
C23 0 1 1 1
C24 1 0 0 0
C25 1 1 0 1
C26 1 1 1 1
不購買不動產機率 = 100%
購買不動產機率 = 0%
此族群將不會購買不動產
單純貝氏分類優點
「已婚」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率
「已婚」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率
46
 
   
 
        
       
 
   
%0
%50%33%100%67%50%67%0%33
%50%67%0%33
1Pr1|011Pr0Pr0|011Pr
0Pr0|0Pr0|1Pr0|1Pr
011Pr
0Pr0|011Pr
01,1,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%100
%50%33%100%67%50%67%0%33
%50%33%100%67
1Pr1|011Pr0Pr0|011Pr
1Pr1|0Pr1|1Pr1|1Pr
011Pr
1Pr1|011Pr
01,1,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
顧客編號 婚姻 年齡 收入 購買不動產
C21 0 0 0 0
C22 0 0 1 0
C23 0 1 1 1
C24 1 0 0 0
C25 1 1 0 1
C26 1 1 1 1
不購買不動產機率 = 0%
購買不動產機率 = 100%
此族群將會購買不動產
單純貝氏分類優點
「已婚」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率
「已婚」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率
47
 
   
 
        
       
 
   
%0
%50%67%100%67%50%33%0%33
%50%33%0%33
1Pr1|111Pr0Pr0|111Pr
0Pr0|1Pr0|1Pr0|1Pr
111Pr
0Pr0|111Pr
11,1,|0Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
 
   
 
        
       
 
   
%100
%50%67%100%67%50%33%0%33
%50%67%100%67
1Pr1|111Pr0Pr0|111Pr
1Pr1|1Pr1|1Pr1|1Pr
111Pr
1Pr1|111Pr
11,1,|1Pr











購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻
購買不動產購買不動產收入購買不動產年齡購買不動產婚姻
收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
收入年齡婚姻購買不動產
顧客編號 婚姻 年齡 收入 購買不動產
C21 0 0 0 0
C22 0 0 1 0
C23 0 1 1 1
C24 1 0 0 0
C25 1 1 0 1
C26 1 1 1 1
不購買不動產機率 = 0%
購買不動產機率 = 100%
此族群將會購買不動產
單純貝氏分類優點
建立訓練資料,並儲存為csv檔
請參考「案例3_購買不動產(訓練資料).csv」
48
顧客編號 婚姻 年齡 收入 購買不動產
C21 單身 中年 低 無
C22 單身 中年 高 無
C23 單身 青年 高 有
C24 已婚 中年 低 無
C25 已婚 青年 低 有
C26 已婚 青年 高 有
顧客編號 婚姻 年齡 收入 購買不動產
C21 0 0 0 0
C22 0 0 1 0
C23 0 1 1 1
C24 1 0 0 0
C25 1 1 0 1
C26 1 1 1 1
單身:0
已婚:1
青年:0
中年:1
低:0
高:1
無:0
有:1
單純貝氏分類優點
建立測試資料,並儲存為csv檔
請參考「案例3_購買不動產(測試資料).csv」
49
顧客編號 婚姻 年齡 收入 購買不動產
C31 單身 青年 低 無
C32 單身 青年 高 無
C33 單身 中年 低 有
C34 單身 中年 高 有
C35 已婚 青年 低 無
C36 已婚 青年 高 無
C37 已婚 中年 低 有
C38 已婚 中年 高 有
顧客編號 婚姻 年齡 收入 購買不動產
C31 0 0 0 0
C32 0 0 1 0
C33 0 1 0 1
C34 0 1 1 1
C35 1 0 0 0
C36 1 0 1 0
C37 1 1 0 1
C38 1 1 1 1
單身:0
已婚:1
青年:0
中年:1
低:0
高:1
無:0
有:1
訓練資料中缺少之資料組合
單純貝氏分類優點
執行單純貝氏分類
50
正確答案為
「目標類別」
正確答案為
「非目標類別」
機器答案為
「目標類別」
True Positive (TP)
False Positive (FP)
(型一(Type I)誤差)
機器答案為
「非目標類別」
False Negative (FN)
(型二(Type II)誤差)
True Negative (TN)
不購買不動產 購買不動產
不購買不動產 4 0
購買不動產 0 4
%100
4
4
Precision 


FPTP
TP
%100
4
4
Recall 


FNTP
TP
貝氏網路分類
單純貝氏分類基本假設
◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立
貝氏網路分類
◦ 分析具有相依性的屬性資料,將具有相依性的屬性資料一起計算其條件機率,不假設條件獨立
◦ 具有獨立性的屬性資料,仍假設為屬性資料條件獨立
51
顧客編號 婚姻 年齡 收入 購買不動產
C41 0 0 1 0
C42 0 1 1 1
C43 1 0 0 1
C44 1 1 0 0
C45 1 1 0 0
C46 1 0 0 1
C47 0 1 1 1
C48 0 0 1 0
單純貝氏分類 貝氏網路分類
此案例用單純貝氏
分類之正確率50%
此案例用貝氏網路
分類之正確率100%
貝氏網路分類
需計算下列機率
◦ Pr(購買不動產)
◦ Pr(婚姻 | 購買不動產)
◦ Pr(收入 | 購買不動產, 婚姻)
◦ Pr(年齡 | 購買不動產, 收入)
52
顧客編號 婚姻 年齡 收入 購買不動產
C41 0 0 1 0
C42 0 1 1 1
C43 1 0 0 1
C44 1 1 0 0
C45 1 1 0 0
C46 1 0 0 1
C47 0 1 1 1
C48 0 0 1 0
貝氏網路分類
需計算下列機率
◦ Pr(購買不動產)
53
顧客編號 婚姻 年齡 收入 購買不動產
C41 0 0 1 0
C42 0 1 1 1
C43 1 0 0 1
C44 1 1 0 0
C45 1 1 0 0
C46 1 0 0 1
C47 0 1 1 1
C48 0 0 1 0
  %500Pr 購買不動產
  %501Pr 購買不動產
貝氏網路分類
需計算下列機率
◦ Pr(婚姻 | 購買不動產)
54
顧客編號 婚姻 年齡 收入 購買不動產
C41 0 0 1 0
C42 0 1 1 1
C43 1 0 0 1
C44 1 1 0 0
C45 1 1 0 0
C46 1 0 0 1
C47 0 1 1 1
C48 0 0 1 0
  %500|0Pr  購買不動產婚姻
  %501|0Pr  購買不動產婚姻
  %500|1Pr  購買不動產婚姻
  %501|1Pr  購買不動產婚姻
貝氏網路分類
需計算下列機率
◦ Pr(收入 | 購買不動產, 婚姻)
55
顧客編號 婚姻 年齡 收入 購買不動產
C41 0 0 1 0
C42 0 1 1 1
C43 1 0 0 1
C44 1 1 0 0
C45 1 1 0 0
C46 1 0 0 1
C47 0 1 1 1
C48 0 0 1 0
  %000|0Pr  婚姻購買不動產收入
  %001|0Pr  婚姻購買不動產收入
  %10000|1Pr  婚姻購買不動產收入
  %10001|1Pr  婚姻購買不動產收入
  %10010|0Pr  婚姻購買不動產收入
  %10011|0Pr  婚姻購買不動產收入
  %010|1Pr  婚姻購買不動產收入
  %011|1Pr  婚姻購買不動產收入
貝氏網路分類
需計算下列機率
◦ Pr(年齡 | 購買不動產, 收入)
56
顧客編號 婚姻 年齡 收入 購買不動產
C41 0 0 1 0
C42 0 1 1 1
C43 1 0 0 1
C44 1 1 0 0
C45 1 1 0 0
C46 1 0 0 1
C47 0 1 1 1
C48 0 0 1 0
  %000|0Pr  收入購買不動產年齡
  %10001|0Pr  收入購買不動產年齡
  %10000|1Pr  收入購買不動產年齡
  %001|1Pr  收入購買不動產年齡
  %10010|0Pr  收入購買不動產年齡
  %011|0Pr  收入購買不動產年齡
  %010|1Pr  收入購買不動產年齡
  %10011|1Pr  收入購買不動產年齡
貝氏網路分類
判斷「單身、青年、高收入」族群
◦ Pr(購買不動產)
◦ Pr(婚姻 | 購買不動產)
◦ Pr(收入 | 購買不動產, 婚姻)
◦ Pr(年齡 | 購買不動產, 收入)
57
顧客編號 婚姻 年齡 收入 購買不動產
C41 0 0 1 0
C42 0 1 1 1
C43 1 0 0 1
C44 1 1 0 0
C45 1 1 0 0
C46 1 0 0 1
C47 0 1 1 1
C48 0 0 1 0
  %500Pr 購買不動產
  %500|0Pr  購買不動產婚姻
  %10000|1Pr  婚姻購買不動產收入
  %10010|0Pr  收入購買不動產年齡
 
%50%100%100%50
0|1,0,0Pr

 購買不動產收入年齡婚姻
   
 
   
%100
%50%0%50%50
%50%50
1,0,0Pr
0Pr0|1,0,0Pr






收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
不購買不動產機率 = 100%
購買不動產機率 = 0%
此族群將不會購買不動產
貝氏網路分類
判斷「單身、青年、高收入」族群
◦ Pr(購買不動產)
◦ Pr(婚姻 | 購買不動產)
◦ Pr(收入 | 購買不動產, 婚姻)
◦ Pr(年齡 | 購買不動產, 收入)
58
顧客編號 婚姻 年齡 收入 購買不動產
C41 0 0 1 0
C42 0 1 1 1
C43 1 0 0 1
C44 1 1 0 0
C45 1 1 0 0
C46 1 0 0 1
C47 0 1 1 1
C48 0 0 1 0
  %501Pr 購買不動產
  %501|0Pr  購買不動產婚姻
 
%0%0%100%50
1|1,0,0Pr

 購買不動產收入年齡婚姻
  %10001|1Pr  婚姻購買不動產收入
  %011|0Pr  收入購買不動產年齡
   
 
   
%0
%50%0%50%50
%50%0
1,0,0Pr
1Pr1|1,0,0Pr






收入年齡婚姻
購買不動產購買不動產收入年齡婚姻
不購買不動產機率 = 100%
購買不動產機率 = 0%
此族群將不會購買不動產
貝氏網路分類實作
建立訓練資料,並儲存為csv檔
請參考「案例4_購買不動產(訓練資料).csv」
59
顧客編號 婚姻 年齡 收入 購買不動產
C41 單身 青年 高 無
C42 單身 中年 高 有
C43 已婚 青年 低 有
C44 已婚 中年 低 無
C45 已婚 中年 低 無
C46 已婚 青年 低 有
C47 單身 中年 高 有
C48 單身 青年 高 無
婚姻 年齡 收入 購買不動產
0 0 1 0
0 1 1 1
1 0 0 1
1 1 0 0
1 1 0 0
1 0 0 1
0 1 1 1
0 0 1 0
單身:0
已婚:1
青年:0
中年:1
低:0
高:1
無:0
有:1
貝氏網路分類實作
新增RScript檔案,並編輯程式碼
#安裝bnlearn函式庫
install.packages('bnlearn')
#引用bnlearn函式庫
library(bnlearn)
60
貝氏網路分類實作
#讀取訓練資料
training_data <- read.csv(file.choose(),
header = TRUE)
#轉換為因子矩陣
training_data <-
data.frame(lapply(training_data, as.factor))
61
貝氏網路分類實作
#訓練貝氏網路模型
bn <- tree.bayes(training_data, "Class")
model <- bn.fit(bn, training_data)
62
設定目標欄位為「Class」,
其他欄位為訓練資料
貝氏網路分類實作
#讀取測試資料
testing_data <- read.csv(file.choose(),
header = TRUE)
#轉換為因子矩陣
testing_data <-
data.frame(lapply(testing_data, as.factor))
63
貝氏網路分類實作
#將測試資料代入模型進行預測,並取得
預測結果
pred <- predict(model, testing_data)
#運用表格呈現和比對預測結果
table(pred, testing_data$Class)
64
貝氏網路分類實作
#繪製貝氏網路模型
plot(bn)
65
貝氏網路分類實作
可經由table瀏覽分類結果
66
正確答案為
「目標類別」
正確答案為
「非目標類別」
機器答案為
「目標類別」
True Positive (TP)
False Positive (FP)
(型一(Type I)誤差)
機器答案為
「非目標類別」
False Negative (FN)
(型二(Type II)誤差)
True Negative (TN)
不購買不動產 購買不動產
不購買不動產 4 0
購買不動產 0 4
假設測試資料同訓練資料
%100
4
4
Precision 


FPTP
TP
%100
4
4
Recall 


FNTP
TP
貝氏分類實例應用
開放資料-臺灣證券交易所
◦ 網址:
http://www.twse.com.tw/zh/page/trading/ex
change/FMTQIK.html
資料集服務分類
◦ 盤後資訊
◦ 臺灣跨市場指數
◦ TWSE自行編製指數
◦ 與FTSE合作編製指數
◦ 與銳聯合作編製指數
◦ 與S&PDJI合作編製指數
◦ 升降幅度/首五日無漲跌幅
◦ 當日沖銷交易標的及統計
◦ 融資融券與可借券賣出額度
67
貝氏分類實例應用
選擇資料日期和股票代碼
本例資料日期以2017年為例
挑選電信業者股票代碼
◦ 2412中華電
◦ 3045台灣大
◦ 3682亞太電
◦ 4904遠傳
68
貝氏分類實例應用
將目標個股每個月的加權平均價存到Excel
依漲跌情況,漲以1表示,跌以0表示,編碼為0、1二元表,
69
個股每個月加權平均價 個股漲跌二元表
漲以1表示,跌以0表示
貝氏分類實例應用
將個股漲跌二元表存成CSV檔
作為關聯規則學習的訓練資料
70
中華電欄位更名為Class
貝氏分類實例應用
單純貝氏分類實驗結果
71
正確答案為
「目標類別」
正確答案為
「非目標類別」
機器答案為
「目標類別」
True Positive (TP)
False Positive (FP)
(型一(Type I)誤差)
機器答案為
「非目標類別」
False Negative (FN)
(型二(Type II)誤差)
True Negative (TN)
中華電_跌 中華電_漲
中華電_跌 5 1
中華電_漲 1 4
%83
6
5
Precision 


FPTP
TP
%83
6
5
Recall 


FNTP
TP
貝氏分類實例應用
貝氏網路分類實驗結果
72
正確答案為
「目標類別」
正確答案為
「非目標類別」
機器答案為
「目標類別」
True Positive (TP)
False Positive (FP)
(型一(Type I)誤差)
機器答案為
「非目標類別」
False Negative (FN)
(型二(Type II)誤差)
True Negative (TN)
中華電_跌 中華電_漲
中華電_跌 6 2
中華電_漲 0 3
%75
8
6
Precision 


FPTP
TP
%100
6
6
Recall 


FNTP
TP

More Related Content

What's hot

リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介Recruit Technologies
 
パターン認識 第10章 決定木
パターン認識 第10章 決定木 パターン認識 第10章 決定木
パターン認識 第10章 決定木 Miyoshi Yuya
 
分類問題 - 機械学習ライブラリ scikit-learn の活用
分類問題 - 機械学習ライブラリ scikit-learn の活用分類問題 - 機械学習ライブラリ scikit-learn の活用
分類問題 - 機械学習ライブラリ scikit-learn の活用y-uti
 
AWS電商和零售業解決方案介紹
AWS電商和零售業解決方案介紹AWS電商和零售業解決方案介紹
AWS電商和零售業解決方案介紹Amazon Web Services
 
WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成Koji Sekiguchi
 
機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料
機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料
機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料at grandpa
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心takehikoihayashi
 
2015年因果フェススライド
2015年因果フェススライド2015年因果フェススライド
2015年因果フェススライドJun Otsuka
 
20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則koba cky
 
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用Hiroyuki Masuda
 
プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列
プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列
プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列Taketo Sano
 
Hiiir 百人團隊導入敏捷實踐經驗
Hiiir 百人團隊導入敏捷實踐經驗Hiiir 百人團隊導入敏捷實踐經驗
Hiiir 百人團隊導入敏捷實踐經驗ChiaHsien Lee
 
大規模データに基づく自然言語処理
大規模データに基づく自然言語処理大規模データに基づく自然言語処理
大規模データに基づく自然言語処理JunSuzuki21
 
公開鍵暗号5: 離散対数問題
公開鍵暗号5: 離散対数問題公開鍵暗号5: 離散対数問題
公開鍵暗号5: 離散対数問題Joe Suzuki
 
混合ガウスモデルとEMアルゴリスム
混合ガウスモデルとEMアルゴリスム混合ガウスモデルとEMアルゴリスム
混合ガウスモデルとEMアルゴリスム貴之 八木
 
20230628_教學服務設計工作坊
20230628_教學服務設計工作坊20230628_教學服務設計工作坊
20230628_教學服務設計工作坊Winny Wang
 
基礎からのベイズ統計学 3章(3.1~3.3)
基礎からのベイズ統計学 3章(3.1~3.3)基礎からのベイズ統計学 3章(3.1~3.3)
基礎からのベイズ統計学 3章(3.1~3.3)TeranishiKeisuke
 
混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)Takao Yamanaka
 
20220410_DT.pptx
20220410_DT.pptx20220410_DT.pptx
20220410_DT.pptxWinny Wang
 

What's hot (20)

リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
 
パターン認識 第10章 決定木
パターン認識 第10章 決定木 パターン認識 第10章 決定木
パターン認識 第10章 決定木
 
分類問題 - 機械学習ライブラリ scikit-learn の活用
分類問題 - 機械学習ライブラリ scikit-learn の活用分類問題 - 機械学習ライブラリ scikit-learn の活用
分類問題 - 機械学習ライブラリ scikit-learn の活用
 
AWS電商和零售業解決方案介紹
AWS電商和零售業解決方案介紹AWS電商和零售業解決方案介紹
AWS電商和零售業解決方案介紹
 
WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成
 
機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料
機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料
機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
 
2015年因果フェススライド
2015年因果フェススライド2015年因果フェススライド
2015年因果フェススライド
 
20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則
 
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
 
プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列
プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列
プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列
 
Hiiir 百人團隊導入敏捷實踐經驗
Hiiir 百人團隊導入敏捷實踐經驗Hiiir 百人團隊導入敏捷實踐經驗
Hiiir 百人團隊導入敏捷實踐經驗
 
Chapter9 2
Chapter9 2Chapter9 2
Chapter9 2
 
大規模データに基づく自然言語処理
大規模データに基づく自然言語処理大規模データに基づく自然言語処理
大規模データに基づく自然言語処理
 
公開鍵暗号5: 離散対数問題
公開鍵暗号5: 離散対数問題公開鍵暗号5: 離散対数問題
公開鍵暗号5: 離散対数問題
 
混合ガウスモデルとEMアルゴリスム
混合ガウスモデルとEMアルゴリスム混合ガウスモデルとEMアルゴリスム
混合ガウスモデルとEMアルゴリスム
 
20230628_教學服務設計工作坊
20230628_教學服務設計工作坊20230628_教學服務設計工作坊
20230628_教學服務設計工作坊
 
基礎からのベイズ統計学 3章(3.1~3.3)
基礎からのベイズ統計学 3章(3.1~3.3)基礎からのベイズ統計学 3章(3.1~3.3)
基礎からのベイズ統計学 3章(3.1~3.3)
 
混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)
 
20220410_DT.pptx
20220410_DT.pptx20220410_DT.pptx
20220410_DT.pptx
 

More from Fuzhou University

遞歸神經網路(Python+TensorFlow+Keras)
遞歸神經網路(Python+TensorFlow+Keras)遞歸神經網路(Python+TensorFlow+Keras)
遞歸神經網路(Python+TensorFlow+Keras)Fuzhou University
 
卷積神經網路(Python+TensorFlow+Keras)
卷積神經網路(Python+TensorFlow+Keras)卷積神經網路(Python+TensorFlow+Keras)
卷積神經網路(Python+TensorFlow+Keras)Fuzhou University
 
神經網路(Python+TensorFlow+Keras)
神經網路(Python+TensorFlow+Keras)神經網路(Python+TensorFlow+Keras)
神經網路(Python+TensorFlow+Keras)Fuzhou University
 
人工智慧11_遞歸神經網路
人工智慧11_遞歸神經網路人工智慧11_遞歸神經網路
人工智慧11_遞歸神經網路Fuzhou University
 
多媒體系統10_3D繪圖軟體Blender
多媒體系統10_3D繪圖軟體Blender多媒體系統10_3D繪圖軟體Blender
多媒體系統10_3D繪圖軟體BlenderFuzhou University
 
多媒體系統09_3D互動擴增實境
多媒體系統09_3D互動擴增實境多媒體系統09_3D互動擴增實境
多媒體系統09_3D互動擴增實境Fuzhou University
 
人工智慧10_卷積神經網路
人工智慧10_卷積神經網路人工智慧10_卷積神經網路
人工智慧10_卷積神經網路Fuzhou University
 
人工智慧09_神經網路(TensorFlow+Keras)
人工智慧09_神經網路(TensorFlow+Keras)人工智慧09_神經網路(TensorFlow+Keras)
人工智慧09_神經網路(TensorFlow+Keras)Fuzhou University
 
多媒體系統08_Inkscape繪製圖形與漸層
多媒體系統08_Inkscape繪製圖形與漸層多媒體系統08_Inkscape繪製圖形與漸層
多媒體系統08_Inkscape繪製圖形與漸層Fuzhou University
 
機器學習工具_微軟Azure Machine Learning Studio
機器學習工具_微軟Azure Machine Learning Studio機器學習工具_微軟Azure Machine Learning Studio
機器學習工具_微軟Azure Machine Learning StudioFuzhou University
 
論文導讀03_集成神經網路(智慧交通)
論文導讀03_集成神經網路(智慧交通)論文導讀03_集成神經網路(智慧交通)
論文導讀03_集成神經網路(智慧交通)Fuzhou University
 
論文導讀02_神經網路(智慧交通)
論文導讀02_神經網路(智慧交通)論文導讀02_神經網路(智慧交通)
論文導讀02_神經網路(智慧交通)Fuzhou University
 
論文導讀01_k個最近鄰居(行動定位)
論文導讀01_k個最近鄰居(行動定位)論文導讀01_k個最近鄰居(行動定位)
論文導讀01_k個最近鄰居(行動定位)Fuzhou University
 
多媒體系統02_影像處理原理與技術
多媒體系統02_影像處理原理與技術多媒體系統02_影像處理原理與技術
多媒體系統02_影像處理原理與技術Fuzhou University
 
多媒體系統07_Android App影音互動擴增實境
多媒體系統07_Android App影音互動擴增實境多媒體系統07_Android App影音互動擴增實境
多媒體系統07_Android App影音互動擴增實境Fuzhou University
 
多媒體系統06_影音編輯軟體Movie Maker
多媒體系統06_影音編輯軟體Movie Maker多媒體系統06_影音編輯軟體Movie Maker
多媒體系統06_影音編輯軟體Movie MakerFuzhou University
 
多媒體系統05_Android App圖形元件
多媒體系統05_Android App圖形元件多媒體系統05_Android App圖形元件
多媒體系統05_Android App圖形元件Fuzhou University
 
多媒體系統04_GIMP繪圖、特效、動畫
多媒體系統04_GIMP繪圖、特效、動畫多媒體系統04_GIMP繪圖、特效、動畫
多媒體系統04_GIMP繪圖、特效、動畫Fuzhou University
 
多媒體系統03_GIMP影像合成與圖層應用
多媒體系統03_GIMP影像合成與圖層應用多媒體系統03_GIMP影像合成與圖層應用
多媒體系統03_GIMP影像合成與圖層應用Fuzhou University
 

More from Fuzhou University (20)

遞歸神經網路(Python+TensorFlow+Keras)
遞歸神經網路(Python+TensorFlow+Keras)遞歸神經網路(Python+TensorFlow+Keras)
遞歸神經網路(Python+TensorFlow+Keras)
 
卷積神經網路(Python+TensorFlow+Keras)
卷積神經網路(Python+TensorFlow+Keras)卷積神經網路(Python+TensorFlow+Keras)
卷積神經網路(Python+TensorFlow+Keras)
 
神經網路(Python+TensorFlow+Keras)
神經網路(Python+TensorFlow+Keras)神經網路(Python+TensorFlow+Keras)
神經網路(Python+TensorFlow+Keras)
 
人工智慧11_遞歸神經網路
人工智慧11_遞歸神經網路人工智慧11_遞歸神經網路
人工智慧11_遞歸神經網路
 
多媒體系統10_3D繪圖軟體Blender
多媒體系統10_3D繪圖軟體Blender多媒體系統10_3D繪圖軟體Blender
多媒體系統10_3D繪圖軟體Blender
 
多媒體系統09_3D互動擴增實境
多媒體系統09_3D互動擴增實境多媒體系統09_3D互動擴增實境
多媒體系統09_3D互動擴增實境
 
人工智慧10_卷積神經網路
人工智慧10_卷積神經網路人工智慧10_卷積神經網路
人工智慧10_卷積神經網路
 
人工智慧09_神經網路(TensorFlow+Keras)
人工智慧09_神經網路(TensorFlow+Keras)人工智慧09_神經網路(TensorFlow+Keras)
人工智慧09_神經網路(TensorFlow+Keras)
 
多媒體系統08_Inkscape繪製圖形與漸層
多媒體系統08_Inkscape繪製圖形與漸層多媒體系統08_Inkscape繪製圖形與漸層
多媒體系統08_Inkscape繪製圖形與漸層
 
機器學習工具_微軟Azure Machine Learning Studio
機器學習工具_微軟Azure Machine Learning Studio機器學習工具_微軟Azure Machine Learning Studio
機器學習工具_微軟Azure Machine Learning Studio
 
論文導讀03_集成神經網路(智慧交通)
論文導讀03_集成神經網路(智慧交通)論文導讀03_集成神經網路(智慧交通)
論文導讀03_集成神經網路(智慧交通)
 
論文導讀02_神經網路(智慧交通)
論文導讀02_神經網路(智慧交通)論文導讀02_神經網路(智慧交通)
論文導讀02_神經網路(智慧交通)
 
論文導讀01_k個最近鄰居(行動定位)
論文導讀01_k個最近鄰居(行動定位)論文導讀01_k個最近鄰居(行動定位)
論文導讀01_k個最近鄰居(行動定位)
 
人工智慧08_神經網路
人工智慧08_神經網路人工智慧08_神經網路
人工智慧08_神經網路
 
多媒體系統02_影像處理原理與技術
多媒體系統02_影像處理原理與技術多媒體系統02_影像處理原理與技術
多媒體系統02_影像處理原理與技術
 
多媒體系統07_Android App影音互動擴增實境
多媒體系統07_Android App影音互動擴增實境多媒體系統07_Android App影音互動擴增實境
多媒體系統07_Android App影音互動擴增實境
 
多媒體系統06_影音編輯軟體Movie Maker
多媒體系統06_影音編輯軟體Movie Maker多媒體系統06_影音編輯軟體Movie Maker
多媒體系統06_影音編輯軟體Movie Maker
 
多媒體系統05_Android App圖形元件
多媒體系統05_Android App圖形元件多媒體系統05_Android App圖形元件
多媒體系統05_Android App圖形元件
 
多媒體系統04_GIMP繪圖、特效、動畫
多媒體系統04_GIMP繪圖、特效、動畫多媒體系統04_GIMP繪圖、特效、動畫
多媒體系統04_GIMP繪圖、特效、動畫
 
多媒體系統03_GIMP影像合成與圖層應用
多媒體系統03_GIMP影像合成與圖層應用多媒體系統03_GIMP影像合成與圖層應用
多媒體系統03_GIMP影像合成與圖層應用
 

人工智慧04_貝氏分類和貝氏網路

  • 3. 貝氏分類定義和說明 貝氏分類(Bayesian Classifier)藉由資料中分析屬性與反應變數之間的機率模型,根據貝氏 定理(Bayes’Theorem)來更新資訊以推理判斷樣本資料歸屬類別,作為分類和推論的依據。 常用的方式有單純貝氏分類(Naive Bayesian Classifier)和貝氏網路分類(Bayesian Network Classifier)。 由於並非所有的事件都有大量的歷史資料或可以重複實驗,因此面對沒有經驗、可參考的 資訊過或者沒有頻率機率存在的情況,貝氏網路亦可採用主觀機率,亦即將認為該事件是 否會發生的信念(degree of belief)的主觀判斷轉為主觀機率。 3 顧客編號 婚姻 年齡 收入 購買不動產 C01 單身 中年 高 無 C02 單身 青年 高 有 C03 已婚 青年 高 有 C04 已婚 中年 高 無 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1
  • 4. 貝氏分類定義和說明 古典機率(事前機率)和條件機率計算 4 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0   %504/20Pr 婚姻   %504/21Pr 婚姻   %502/10|0Pr  購買不動產婚姻   %502/10|1Pr  購買不動產婚姻   %504/20Pr 年齡   %504/21Pr 年齡   %02/00|0Pr  購買不動產年齡   %1002/20|1Pr  購買不動產年齡   %502/11|0Pr  購買不動產婚姻   %502/11|1Pr  購買不動產婚姻   %1002/21|0Pr  購買不動產年齡   %02/01|1Pr  購買不動產年齡   %04/00Pr 收入   %1004/41Pr 收入   %02/00|0Pr  購買不動產收入   %1002/20|1Pr  購買不動產收入   %02/01|0Pr  購買不動產收入   %1002/21|1Pr  購買不動產收入 貝氏分類主要運用事前機 率和條件機率,結合貝氏 定理進行計算和推論 婚姻的事前機率和條件機率 年齡的事前機率和條件機率 收入的事前機率和條件機率   %504/20Pr 購買不動產   %504/21Pr 購買不動產 購買不動產的事前機率 以婚姻、年齡、收入判斷是否購買不動產
  • 5. 基礎統計回顧 貝氏定理 貝氏定理的主要概念為:一開始不知道目標事件Y的真實狀態,但知道Y服從一個機率分 佈Pr(Y),當得到新的樣本資訊或證據x後,yi發生的條件機率(事後機率) 5 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0        x xy xyxyY i ii Pr Pr |Pr|Pr            iiii yyxxxyxy Pr|PrPr|PrPr               i i ii i y y yx x x xy xy Pr Pr Pr Pr Pr Pr Pr           0Pr 00Pr 0|0Pr     婚姻 婚姻購買不動產 婚姻購買不動產          0Pr0|0Pr 0Pr0|0Pr 00Pr    購買不動產購買不動產婚姻 婚姻婚姻購買不動產 婚姻購買不動產 以婚姻、年齡、收入判斷是否購買不動產之案例            x yyx x xy xy iii i Pr Pr|Pr Pr Pr |Pr    
  • 6. 基礎統計回顧 貝氏定理 假設事件共有m種,Pr(x)可定義如下: 6 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0                     m i ii mm yyx yyxyyxyyxx 1 2211 Pr|Pr Pr|Pr...Pr|PrPr|PrPr          1Pr1|0Pr0Pr0|0Pr 0Pr   購買不動產購買不動產婚姻購買不動產購買不動產婚姻 婚姻 以婚姻、年齡、收入判斷是否購買不動產之案例
  • 7. 基礎統計回顧 貝氏定理 在取得的新資訊事件x下,貝氏定理可修正條件機率為 7 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0              1Pr1|0Pr0Pr0|0Pr 0Pr0|0Pr 0|0Pr     購買不動產購買不動產婚姻購買不動產購買不動產婚姻 購買不動產購買不動產婚姻 婚姻購買不動產 以婚姻、年齡、收入判斷是否購買不動產之案例                            m i ii iiiii i yyx yyx x yyx x xy xy 1 Pr|Pr Pr|Pr Pr Pr|Pr Pr Pr |Pr
  • 8. 基礎統計回顧 獨立(Independence) ◦ 一事件發生與否,不會影響另一事件發生之機率 ◦ 當 即事件A與事件B互相獨立 ◦ 例如: ◦ 「單身」與「青年」為獨立事件 ◦ 「已婚」與「青年」為獨立事件 88 BA  c A      BPrAPrBAPr        %25%50%500Pr0Pr00Pr  年齡婚姻年齡婚姻 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 BA        %25%50%500Pr1Pr01Pr  年齡婚姻年齡婚姻
  • 9. 基礎統計回顧 如何驗證獨立(Independence)? 皮爾森相關係數可用來分析正相關、獨立、負相關 皮爾森相關係數的值域為[-1, 1],當係數值為1代表完全正相關、0代表獨立、-1代表完全負相關 9 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0                n i n i ii n i ii BbAa BbAa 1 1 22 1 顧客編號 婚姻 年齡 婚姻-婚姻平均值 年齡-年齡平均值 C01 0 1 -0.5 0.5 C02 0 0 -0.5 -0.5 C03 1 0 0.5 -0.5 C04 1 1 0.5 0.5 婚姻和年齡進行皮爾森相關係數 計算結果為0 故婚姻和年齡為互相獨立
  • 10. 單純貝氏分類 單純貝氏分類有兩個基本假設 ◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定 ◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立 當資料中共有k個屬性時,則X = {x1, x2, …, xk},基於貝氏定理可得: 10 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0                        k iik k iik iii i xxx yyxxx xxx yyxxx X yyX X Xy Xy          ...Pr Pr|...Pr ,...,,Pr Pr|,...,,Pr Pr Pr|Pr Pr Pr |Pr 21 21 21 21        000Pr 0Pr0|000Pr 00,0,|0Pr     收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 評估單身、青年、低收入 不會購買不動產的機率
  • 11. 單純貝氏分類 單純貝氏分類有兩個基本假設 ◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定 ◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立 假設屬性資料相互獨立: 11 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0          ikii iki yxyxyx yxxxyX |Pr...|Pr|Pr |...Pr|Pr 21 21            0|0Pr0|0Pr0|0Pr 0|000Pr 0|00,0,Pr    購買不動產收入購買不動產年齡購買不動產婚姻 購買不動產收入年齡婚姻 購買不動產收入年齡婚姻 評估單身、青年、低收入 不會購買不動產的機率 條件獨立      CBCACBA |Pr|Pr|Pr 
  • 12. 單純貝氏分類 單純貝氏分類有兩個基本假設 ◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定 ◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立 12 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0           m i iik yyXxxxX 1 21 Pr|Pr...PrPr          1Pr1|000Pr 0Pr0|000Pr 00,0,Pr    購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻 評估單身、青年、低收入 不會購買不動產的機率
  • 13. 單純貝氏分類 「單身」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 13 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0                                %0 %50%0%100%50%50%0%0%50 %50%0%0%50 1Pr1|000Pr0Pr0|000Pr 0Pr0|0Pr0|0Pr0|0Pr 000Pr 0Pr0|000Pr 00,0,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %0 %50%0%100%50%50%0%0%50 %50%0%100%50 1Pr1|000Pr0Pr0|000Pr 1Pr1|0Pr1|0Pr1|0Pr 000Pr 1Pr1|000Pr 00,0,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 0% 購買不動產機率 = 0% 購買與否無顯著差異 不考慮「收入」因子, 購買不動產的機率高
  • 14. 單純貝氏分類 「單身」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 14 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0                                %0 %50%100%100%50%50%100%0%50 %50%100%0%50 1Pr1|100Pr0Pr0|100Pr 0Pr0|1Pr0|0Pr0|0Pr 100Pr 0Pr0|100Pr 10,0,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %100 %50%100%100%50%50%100%0%50 %50%100%100%50 1Pr1|100Pr0Pr0|100Pr 1Pr1|1Pr1|0Pr1|0Pr 100Pr 1Pr1|100Pr 10,0,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 0% 購買不動產機率 = 100% 此族群將會購買不動產
  • 15. 單純貝氏分類 「單身」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 15 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0                                %0 %50%0%0%50%50%0%100%50 %50%0%100%50 1Pr1|010Pr0Pr0|010Pr 0Pr0|0Pr0|1Pr0|0Pr 010Pr 0Pr0|010Pr 01,0,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %0 %50%0%0%50%50%0%100%50 %50%0%0%50 1Pr1|010Pr0Pr0|010Pr 1Pr1|0Pr1|1Pr1|0Pr 010Pr 1Pr1|010Pr 01,0,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 0% 購買不動產機率 = 0% 購買與否無顯著差異 不考慮「收入」因子, 不購買不動產的機率高
  • 16. 單純貝氏分類 「單身」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 16 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0                                %100 %50%100%0%50%50%100%100%50 %50%100%100%50 1Pr1|110Pr0Pr0|110Pr 0Pr0|1Pr0|1Pr0|0Pr 110Pr 0Pr0|110Pr 11,0,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %0 %50%100%0%50%50%100%100%50 %50%100%0%50 1Pr1|110Pr0Pr0|110Pr 1Pr1|1Pr1|1Pr1|0Pr 110Pr 1Pr1|110Pr 11,0,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
  • 17. 單純貝氏分類 「已婚」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 17 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0                                %0 %50%0%100%50%50%0%0%50 %50%0%0%50 1Pr1|001Pr0Pr0|001Pr 0Pr0|0Pr0|0Pr0|1Pr 001Pr 0Pr0|001Pr 00,1,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %0 %50%0%100%50%50%0%0%50 %50%0%100%50 1Pr1|001Pr0Pr0|001Pr 1Pr1|0Pr1|0Pr1|1Pr 001Pr 1Pr1|001Pr 00,1,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 0% 購買不動產機率 = 0% 購買與否無顯著差異 不考慮「收入」因子, 購買不動產的機率高
  • 18. 單純貝氏分類 「已婚」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 18 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0                                %0 %50%100%100%50%50%100%0%50 %50%100%0%50 1Pr1|101Pr0Pr0|101Pr 0Pr0|1Pr0|0Pr0|1Pr 101Pr 0Pr0|101Pr 10,1,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %100 %50%100%100%50%50%100%0%50 %50%100%100%50 1Pr1|101Pr0Pr0|101Pr 1Pr1|1Pr1|0Pr1|1Pr 101Pr 1Pr1|101Pr 10,1,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 0% 購買不動產機率 = 100% 此族群將會購買不動產
  • 19. 單純貝氏分類 「已婚」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 19 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0                                %0 %50%0%0%50%50%0%100%50 %50%0%100%50 1Pr1|011Pr0Pr0|011Pr 0Pr0|0Pr0|1Pr0|1Pr 011Pr 0Pr0|011Pr 01,1,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %0 %50%0%0%50%50%0%100%50 %50%0%0%50 1Pr1|011Pr0Pr0|011Pr 1Pr1|0Pr1|1Pr1|1Pr 011Pr 1Pr1|011Pr 01,1,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 0% 購買不動產機率 = 0% 購買與否無顯著差異 不考慮「收入」因子, 不購買不動產的機率高
  • 20. 單純貝氏分類 「已婚」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 20 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0                                %100 %50%100%0%50%50%100%100%50 %50%100%100%50 1Pr1|111Pr0Pr0|111Pr 0Pr0|1Pr0|1Pr0|1Pr 111Pr 0Pr0|111Pr 11,1,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %0 %50%100%0%50%50%100%100%50 %50%100%0%50 1Pr1|111Pr0Pr0|111Pr 1Pr1|1Pr1|1Pr1|1Pr 111Pr 1Pr1|111Pr 11,1,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
  • 21. 單純貝氏分類實作 建立訓練資料,並儲存為csv檔 請參考「案例1_購買不動產(訓練資料).csv」 21 顧客編號 婚姻 年齡 收入 購買不動產 C01 單身 中年 高 無 C02 單身 青年 高 有 C03 已婚 青年 高 有 C04 已婚 中年 高 無 婚姻 年齡 收入 Class 0 1 1 0 0 0 1 1 1 0 1 1 1 1 1 0 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1
  • 23. 單純貝氏分類實作 #讀取訓練資料 training_data <- read.csv(file.choose(), header = TRUE) #轉換為因子矩陣 training_data <- data.frame(lapply(training_data, as.factor)) 23
  • 24. 單純貝氏分類實作 #訓練單純貝氏模型 model <- naiveBayes(Class ~ ., data = training_data) 24 設定目標欄位為「Class」, 其他欄位為訓練資料
  • 25. 單純貝氏分類實作 #讀取測試資料 testing_data <- read.csv(file.choose(), header = TRUE) #轉換為因子矩陣 testing_data <- data.frame(lapply(testing_data, as.factor)) 25
  • 26. 單純貝氏分類實作 #將測試資料代入模型進行預測,並取得 預測結果 pred <- predict(model, testing_data) #運用表格呈現和比對預測結果 table(pred, testing_data$Class) 26
  • 27. 單純貝氏分類實作 可經由table瀏覽分類結果 27 正確答案為 「目標類別」 正確答案為 「非目標類別」 機器答案為 「目標類別」 True Positive (TP) False Positive (FP) (型一(Type I)誤差) 機器答案為 「非目標類別」 False Negative (FN) (型二(Type II)誤差) True Negative (TN) 不購買不動產 購買不動產 不購買不動產 2 0 購買不動產 0 2 %100 2 2 Precision    FPTP TP %100 2 2 Recall    FNTP TP 假設測試資料同訓練資料
  • 28. 單純貝氏分類限制 單純貝氏分類有兩個基本假設 ◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定 ◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立 單純貝氏分類不適用之情境 ◦ 屬性資料具有關聯性 ◦ 下列案例:婚姻與年齡負相關、婚姻與收入正相關、年齡與收入負相關、屬性資料與目標資料互相獨立 28 顧客編號 婚姻 年齡 收入 購買不動產 C11 單身 中年 低 無 C12 單身 中年 低 有 C13 已婚 青年 高 有 C14 已婚 青年 高 無 顧客編號 婚姻 年齡 收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1
  • 29. 單純貝氏分類限制 「單身」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 29 顧客編號 婚姻 年齡 收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|000Pr0Pr0|000Pr 0Pr0|0Pr0|0Pr0|0Pr 000Pr 0Pr0|000Pr 00,0,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|000Pr0Pr0|000Pr 1Pr1|0Pr1|0Pr1|0Pr 000Pr 1Pr1|000Pr 00,0,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
  • 30. 單純貝氏分類限制 「單身」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 30 顧客編號 婚姻 年齡 收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|100Pr0Pr0|100Pr 0Pr0|1Pr0|0Pr0|0Pr 100Pr 0Pr0|100Pr 10,0,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|100Pr0Pr0|100Pr 1Pr1|1Pr1|0Pr1|0Pr 100Pr 1Pr1|100Pr 10,0,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
  • 31. 單純貝氏分類限制 「單身」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 31 顧客編號 婚姻 年齡 收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|010Pr0Pr0|010Pr 0Pr0|0Pr0|1Pr0|0Pr 010Pr 0Pr0|010Pr 01,0,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|010Pr0Pr0|010Pr 1Pr1|0Pr1|1Pr1|0Pr 010Pr 1Pr1|010Pr 01,0,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
  • 32. 單純貝氏分類限制 「單身」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 32 顧客編號 婚姻 年齡 收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|110Pr0Pr0|110Pr 0Pr0|1Pr0|1Pr0|0Pr 110Pr 0Pr0|110Pr 11,0,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|110Pr0Pr0|110Pr 1Pr1|1Pr1|1Pr1|0Pr 110Pr 1Pr1|110Pr 11,0,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
  • 33. 單純貝氏分類限制 「已婚」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 33 顧客編號 婚姻 年齡 收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|001Pr0Pr0|001Pr 0Pr0|0Pr0|0Pr0|1Pr 001Pr 0Pr0|001Pr 00,1,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|001Pr0Pr0|001Pr 1Pr1|0Pr1|0Pr1|1Pr 001Pr 1Pr1|001Pr 00,1,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
  • 34. 單純貝氏分類限制 「已婚」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 34 顧客編號 婚姻 年齡 收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|101Pr0Pr0|101Pr 0Pr0|1Pr0|0Pr0|1Pr 101Pr 0Pr0|101Pr 10,1,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|101Pr0Pr0|101Pr 1Pr1|1Pr1|0Pr1|1Pr 101Pr 1Pr1|101Pr 10,1,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
  • 35. 單純貝氏分類限制 「已婚」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 35 顧客編號 婚姻 年齡 收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|011Pr0Pr0|011Pr 0Pr0|0Pr0|1Pr0|1Pr 011Pr 0Pr0|011Pr 01,1,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|011Pr0Pr0|011Pr 1Pr1|0Pr1|1Pr1|1Pr 011Pr 1Pr1|011Pr 01,1,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
  • 36. 單純貝氏分類限制 「已婚」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 36 顧客編號 婚姻 年齡 收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|111Pr0Pr0|111Pr 0Pr0|1Pr0|1Pr0|1Pr 111Pr 0Pr0|111Pr 11,1,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|111Pr0Pr0|111Pr 1Pr1|1Pr1|1Pr1|1Pr 111Pr 1Pr1|111Pr 11,1,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
  • 37. 單純貝氏分類限制 建立訓練資料,並儲存為csv檔 請參考「案例2_購買不動產(訓練資料).csv」 37 顧客編號 婚姻 年齡 收入 購買不動產 C11 單身 中年 低 無 C12 單身 中年 低 有 C13 已婚 青年 高 有 C14 已婚 青年 高 無 婚姻 年齡 收入 Class 0 1 0 0 0 1 0 1 1 0 1 1 1 0 1 0 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1
  • 38. 單純貝氏分類限制 執行單純貝氏分類 38 正確答案為 「目標類別」 正確答案為 「非目標類別」 機器答案為 「目標類別」 True Positive (TP) False Positive (FP) (型一(Type I)誤差) 機器答案為 「非目標類別」 False Negative (FN) (型二(Type II)誤差) True Negative (TN) 不購買不動產 購買不動產 不購買不動產 2 2 購買不動產 0 0 %50 4 2 Precision    FPTP TP %100 2 2 Recall    FNTP TP 假設測試資料同訓練資料
  • 39. 單純貝氏分類優點 單純貝氏分類有兩個基本假設 ◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定 ◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立 單純貝氏分類適用情境 ◦ 當符合「屬性資料相互獨立」條件下,可預測未知資料 39 顧客編號 婚姻 年齡 收入 購買不動產 C21 單身 中年 低 無 C22 單身 中年 高 無 C23 單身 青年 高 有 C24 已婚 中年 低 無 C25 已婚 青年 低 有 C26 已婚 青年 高 有 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1 顧客編號 婚姻 年齡 收入 購買不動產 單身 中年 低 有 已婚 青年 高 無 訓練資料 訓練資料 中缺少之 資料組合
  • 40. 單純貝氏分類優點 「單身」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 40                                %100 %50%33%0%33%50%67%100%67 %50%67%100%67 1Pr1|000Pr0Pr0|000Pr 0Pr0|0Pr0|0Pr0|0Pr 000Pr 0Pr0|000Pr 00,0,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %0 %50%33%0%33%50%67%100%67 %50%33%0%33 1Pr1|000Pr0Pr0|000Pr 1Pr1|0Pr1|0Pr1|0Pr 000Pr 1Pr1|000Pr 00,0,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1
  • 41. 單純貝氏分類優點 「單身」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 41                                %100 %50%67%0%33%50%33%100%67 %50%33%100%67 1Pr1|100Pr0Pr0|100Pr 0Pr0|1Pr0|0Pr0|0Pr 100Pr 0Pr0|100Pr 10,0,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %0 %50%67%0%33%50%33%100%67 %50%67%0%33 1Pr1|100Pr0Pr0|100Pr 1Pr1|1Pr1|0Pr1|0Pr 100Pr 1Pr1|100Pr 10,0,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
  • 42. 單純貝氏分類優點 「單身」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 42                                %0 %50%33%100%33%50%67%0%67 %50%67%0%67 1Pr1|010Pr0Pr0|010Pr 0Pr0|0Pr0|1Pr0|0Pr 010Pr 0Pr0|010Pr 01,0,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %100 %50%33%100%33%50%67%0%67 %50%33%100%33 1Pr1|010Pr0Pr0|010Pr 1Pr1|0Pr1|1Pr1|0Pr 010Pr 1Pr1|010Pr 01,0,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 不購買不動產機率 = 0% 購買不動產機率 = 100% 此族群將會購買不動產
  • 43. 單純貝氏分類優點 「單身」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 43                                %0 %50%67%100%33%50%33%0%67 %50%33%0%67 1Pr1|110Pr0Pr0|110Pr 0Pr0|1Pr0|1Pr0|0Pr 110Pr 0Pr0|110Pr 11,0,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %100 %50%67%100%33%50%33%0%67 %50%67%100%33 1Pr1|110Pr0Pr0|110Pr 1Pr1|1Pr1|1Pr1|0Pr 110Pr 1Pr1|110Pr 11,0,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 43 不購買不動產機率 = 0% 購買不動產機率 = 100% 此族群將會購買不動產
  • 44. 單純貝氏分類優點 「已婚」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 44                                %100 %50%33%0%67%50%67%100%33 %50%67%100%33 1Pr1|001Pr0Pr0|001Pr 0Pr0|0Pr0|0Pr0|1Pr 001Pr 0Pr0|001Pr 00,1,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %0 %50%33%0%67%50%67%100%33 %50%33%0%67 1Pr1|001Pr0Pr0|001Pr 1Pr1|0Pr1|0Pr1|1Pr 001Pr 1Pr1|001Pr 00,1,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
  • 45. 單純貝氏分類優點 「已婚」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 45                                %100 %50%67%0%67%50%33%100%33 %50%33%100%33 1Pr1|101Pr0Pr0|101Pr 0Pr0|1Pr0|0Pr0|1Pr 101Pr 0Pr0|101Pr 10,1,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %0 %50%67%0%67%50%33%100%33 %50%67%0%67 1Pr1|101Pr0Pr0|101Pr 1Pr1|1Pr1|0Pr1|1Pr 101Pr 1Pr1|101Pr 10,1,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
  • 46. 單純貝氏分類優點 「已婚」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 46                                %0 %50%33%100%67%50%67%0%33 %50%67%0%33 1Pr1|011Pr0Pr0|011Pr 0Pr0|0Pr0|1Pr0|1Pr 011Pr 0Pr0|011Pr 01,1,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %100 %50%33%100%67%50%67%0%33 %50%33%100%67 1Pr1|011Pr0Pr0|011Pr 1Pr1|0Pr1|1Pr1|1Pr 011Pr 1Pr1|011Pr 01,1,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 不購買不動產機率 = 0% 購買不動產機率 = 100% 此族群將會購買不動產
  • 47. 單純貝氏分類優點 「已婚」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 47                                %0 %50%67%100%67%50%33%0%33 %50%33%0%33 1Pr1|111Pr0Pr0|111Pr 0Pr0|1Pr0|1Pr0|1Pr 111Pr 0Pr0|111Pr 11,1,|0Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產                                %100 %50%67%100%67%50%33%0%33 %50%67%100%67 1Pr1|111Pr0Pr0|111Pr 1Pr1|1Pr1|1Pr1|1Pr 111Pr 1Pr1|111Pr 11,1,|1Pr            購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 不購買不動產機率 = 0% 購買不動產機率 = 100% 此族群將會購買不動產
  • 48. 單純貝氏分類優點 建立訓練資料,並儲存為csv檔 請參考「案例3_購買不動產(訓練資料).csv」 48 顧客編號 婚姻 年齡 收入 購買不動產 C21 單身 中年 低 無 C22 單身 中年 高 無 C23 單身 青年 高 有 C24 已婚 中年 低 無 C25 已婚 青年 低 有 C26 已婚 青年 高 有 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1
  • 49. 單純貝氏分類優點 建立測試資料,並儲存為csv檔 請參考「案例3_購買不動產(測試資料).csv」 49 顧客編號 婚姻 年齡 收入 購買不動產 C31 單身 青年 低 無 C32 單身 青年 高 無 C33 單身 中年 低 有 C34 單身 中年 高 有 C35 已婚 青年 低 無 C36 已婚 青年 高 無 C37 已婚 中年 低 有 C38 已婚 中年 高 有 顧客編號 婚姻 年齡 收入 購買不動產 C31 0 0 0 0 C32 0 0 1 0 C33 0 1 0 1 C34 0 1 1 1 C35 1 0 0 0 C36 1 0 1 0 C37 1 1 0 1 C38 1 1 1 1 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1 訓練資料中缺少之資料組合
  • 50. 單純貝氏分類優點 執行單純貝氏分類 50 正確答案為 「目標類別」 正確答案為 「非目標類別」 機器答案為 「目標類別」 True Positive (TP) False Positive (FP) (型一(Type I)誤差) 機器答案為 「非目標類別」 False Negative (FN) (型二(Type II)誤差) True Negative (TN) 不購買不動產 購買不動產 不購買不動產 4 0 購買不動產 0 4 %100 4 4 Precision    FPTP TP %100 4 4 Recall    FNTP TP
  • 51. 貝氏網路分類 單純貝氏分類基本假設 ◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立 貝氏網路分類 ◦ 分析具有相依性的屬性資料,將具有相依性的屬性資料一起計算其條件機率,不假設條件獨立 ◦ 具有獨立性的屬性資料,仍假設為屬性資料條件獨立 51 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0 單純貝氏分類 貝氏網路分類 此案例用單純貝氏 分類之正確率50% 此案例用貝氏網路 分類之正確率100%
  • 52. 貝氏網路分類 需計算下列機率 ◦ Pr(購買不動產) ◦ Pr(婚姻 | 購買不動產) ◦ Pr(收入 | 購買不動產, 婚姻) ◦ Pr(年齡 | 購買不動產, 收入) 52 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0
  • 53. 貝氏網路分類 需計算下列機率 ◦ Pr(購買不動產) 53 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0   %500Pr 購買不動產   %501Pr 購買不動產
  • 54. 貝氏網路分類 需計算下列機率 ◦ Pr(婚姻 | 購買不動產) 54 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0   %500|0Pr  購買不動產婚姻   %501|0Pr  購買不動產婚姻   %500|1Pr  購買不動產婚姻   %501|1Pr  購買不動產婚姻
  • 55. 貝氏網路分類 需計算下列機率 ◦ Pr(收入 | 購買不動產, 婚姻) 55 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0   %000|0Pr  婚姻購買不動產收入   %001|0Pr  婚姻購買不動產收入   %10000|1Pr  婚姻購買不動產收入   %10001|1Pr  婚姻購買不動產收入   %10010|0Pr  婚姻購買不動產收入   %10011|0Pr  婚姻購買不動產收入   %010|1Pr  婚姻購買不動產收入   %011|1Pr  婚姻購買不動產收入
  • 56. 貝氏網路分類 需計算下列機率 ◦ Pr(年齡 | 購買不動產, 收入) 56 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0   %000|0Pr  收入購買不動產年齡   %10001|0Pr  收入購買不動產年齡   %10000|1Pr  收入購買不動產年齡   %001|1Pr  收入購買不動產年齡   %10010|0Pr  收入購買不動產年齡   %011|0Pr  收入購買不動產年齡   %010|1Pr  收入購買不動產年齡   %10011|1Pr  收入購買不動產年齡
  • 57. 貝氏網路分類 判斷「單身、青年、高收入」族群 ◦ Pr(購買不動產) ◦ Pr(婚姻 | 購買不動產) ◦ Pr(收入 | 購買不動產, 婚姻) ◦ Pr(年齡 | 購買不動產, 收入) 57 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0   %500Pr 購買不動產   %500|0Pr  購買不動產婚姻   %10000|1Pr  婚姻購買不動產收入   %10010|0Pr  收入購買不動產年齡   %50%100%100%50 0|1,0,0Pr   購買不動產收入年齡婚姻           %100 %50%0%50%50 %50%50 1,0,0Pr 0Pr0|1,0,0Pr       收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
  • 58. 貝氏網路分類 判斷「單身、青年、高收入」族群 ◦ Pr(購買不動產) ◦ Pr(婚姻 | 購買不動產) ◦ Pr(收入 | 購買不動產, 婚姻) ◦ Pr(年齡 | 購買不動產, 收入) 58 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0   %501Pr 購買不動產   %501|0Pr  購買不動產婚姻   %0%0%100%50 1|1,0,0Pr   購買不動產收入年齡婚姻   %10001|1Pr  婚姻購買不動產收入   %011|0Pr  收入購買不動產年齡           %0 %50%0%50%50 %50%0 1,0,0Pr 1Pr1|1,0,0Pr       收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
  • 59. 貝氏網路分類實作 建立訓練資料,並儲存為csv檔 請參考「案例4_購買不動產(訓練資料).csv」 59 顧客編號 婚姻 年齡 收入 購買不動產 C41 單身 青年 高 無 C42 單身 中年 高 有 C43 已婚 青年 低 有 C44 已婚 中年 低 無 C45 已婚 中年 低 無 C46 已婚 青年 低 有 C47 單身 中年 高 有 C48 單身 青年 高 無 婚姻 年齡 收入 購買不動產 0 0 1 0 0 1 1 1 1 0 0 1 1 1 0 0 1 1 0 0 1 0 0 1 0 1 1 1 0 0 1 0 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1
  • 61. 貝氏網路分類實作 #讀取訓練資料 training_data <- read.csv(file.choose(), header = TRUE) #轉換為因子矩陣 training_data <- data.frame(lapply(training_data, as.factor)) 61
  • 62. 貝氏網路分類實作 #訓練貝氏網路模型 bn <- tree.bayes(training_data, "Class") model <- bn.fit(bn, training_data) 62 設定目標欄位為「Class」, 其他欄位為訓練資料
  • 63. 貝氏網路分類實作 #讀取測試資料 testing_data <- read.csv(file.choose(), header = TRUE) #轉換為因子矩陣 testing_data <- data.frame(lapply(testing_data, as.factor)) 63
  • 64. 貝氏網路分類實作 #將測試資料代入模型進行預測,並取得 預測結果 pred <- predict(model, testing_data) #運用表格呈現和比對預測結果 table(pred, testing_data$Class) 64
  • 66. 貝氏網路分類實作 可經由table瀏覽分類結果 66 正確答案為 「目標類別」 正確答案為 「非目標類別」 機器答案為 「目標類別」 True Positive (TP) False Positive (FP) (型一(Type I)誤差) 機器答案為 「非目標類別」 False Negative (FN) (型二(Type II)誤差) True Negative (TN) 不購買不動產 購買不動產 不購買不動產 4 0 購買不動產 0 4 假設測試資料同訓練資料 %100 4 4 Precision    FPTP TP %100 4 4 Recall    FNTP TP
  • 67. 貝氏分類實例應用 開放資料-臺灣證券交易所 ◦ 網址: http://www.twse.com.tw/zh/page/trading/ex change/FMTQIK.html 資料集服務分類 ◦ 盤後資訊 ◦ 臺灣跨市場指數 ◦ TWSE自行編製指數 ◦ 與FTSE合作編製指數 ◦ 與銳聯合作編製指數 ◦ 與S&PDJI合作編製指數 ◦ 升降幅度/首五日無漲跌幅 ◦ 當日沖銷交易標的及統計 ◦ 融資融券與可借券賣出額度 67
  • 71. 貝氏分類實例應用 單純貝氏分類實驗結果 71 正確答案為 「目標類別」 正確答案為 「非目標類別」 機器答案為 「目標類別」 True Positive (TP) False Positive (FP) (型一(Type I)誤差) 機器答案為 「非目標類別」 False Negative (FN) (型二(Type II)誤差) True Negative (TN) 中華電_跌 中華電_漲 中華電_跌 5 1 中華電_漲 1 4 %83 6 5 Precision    FPTP TP %83 6 5 Recall    FNTP TP
  • 72. 貝氏分類實例應用 貝氏網路分類實驗結果 72 正確答案為 「目標類別」 正確答案為 「非目標類別」 機器答案為 「目標類別」 True Positive (TP) False Positive (FP) (型一(Type I)誤差) 機器答案為 「非目標類別」 False Negative (FN) (型二(Type II)誤差) True Negative (TN) 中華電_跌 中華電_漲 中華電_跌 6 2 中華電_漲 0 3 %75 8 6 Precision    FPTP TP %100 6 6 Recall    FNTP TP