Submit Search
Upload
人工智慧04_貝氏分類和貝氏網路
•
4 likes
•
3,935 views
Fuzhou University
Follow
人工智慧04_貝氏分類和貝氏網路
Read less
Read more
Engineering
Report
Share
Report
Share
1 of 72
Recommended
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
horihorio
Webと経済学 數見拓朗
Webと経済学 數見拓朗
cyberagent
商業模式創新講座_130307
商業模式創新講座_130307
基欽 劉
ベイズ推論とシミュレーション法の基礎
ベイズ推論とシミュレーション法の基礎
Tomoshige Nakamura
《貝佐斯經濟學》--是商業典範,還是未來威脅?以飛輪思維驅動的數位零售巨人 Bezonomics
《貝佐斯經濟學》--是商業典範,還是未來威脅?以飛輪思維驅動的數位零售巨人 Bezonomics
Charles Lee
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
Teruyuki Sakaue
SlideShareの使い方 アップロード編
SlideShareの使い方 アップロード編
itno
Datamining 8th Hclustering
Datamining 8th Hclustering
sesejun
Recommended
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
horihorio
Webと経済学 數見拓朗
Webと経済学 數見拓朗
cyberagent
商業模式創新講座_130307
商業模式創新講座_130307
基欽 劉
ベイズ推論とシミュレーション法の基礎
ベイズ推論とシミュレーション法の基礎
Tomoshige Nakamura
《貝佐斯經濟學》--是商業典範,還是未來威脅?以飛輪思維驅動的數位零售巨人 Bezonomics
《貝佐斯經濟學》--是商業典範,還是未來威脅?以飛輪思維驅動的數位零售巨人 Bezonomics
Charles Lee
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
Teruyuki Sakaue
SlideShareの使い方 アップロード編
SlideShareの使い方 アップロード編
itno
Datamining 8th Hclustering
Datamining 8th Hclustering
sesejun
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
Recruit Technologies
パターン認識 第10章 決定木
パターン認識 第10章 決定木
Miyoshi Yuya
分類問題 - 機械学習ライブラリ scikit-learn の活用
分類問題 - 機械学習ライブラリ scikit-learn の活用
y-uti
AWS電商和零售業解決方案介紹
AWS電商和零售業解決方案介紹
Amazon Web Services
WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成
Koji Sekiguchi
機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料
機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料
at grandpa
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
takehikoihayashi
2015年因果フェススライド
2015年因果フェススライド
Jun Otsuka
20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則
koba cky
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
Hiroyuki Masuda
プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列
プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列
Taketo Sano
Hiiir 百人團隊導入敏捷實踐經驗
Hiiir 百人團隊導入敏捷實踐經驗
ChiaHsien Lee
Chapter9 2
Chapter9 2
Takuya Minagawa
大規模データに基づく自然言語処理
大規模データに基づく自然言語処理
JunSuzuki21
公開鍵暗号5: 離散対数問題
公開鍵暗号5: 離散対数問題
Joe Suzuki
混合ガウスモデルとEMアルゴリスム
混合ガウスモデルとEMアルゴリスム
貴之 八木
20230628_教學服務設計工作坊
20230628_教學服務設計工作坊
Winny Wang
基礎からのベイズ統計学 3章(3.1~3.3)
基礎からのベイズ統計学 3章(3.1~3.3)
TeranishiKeisuke
混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)
Takao Yamanaka
20220410_DT.pptx
20220410_DT.pptx
Winny Wang
遞歸神經網路(Python+TensorFlow+Keras)
遞歸神經網路(Python+TensorFlow+Keras)
Fuzhou University
卷積神經網路(Python+TensorFlow+Keras)
卷積神經網路(Python+TensorFlow+Keras)
Fuzhou University
More Related Content
What's hot
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
Recruit Technologies
パターン認識 第10章 決定木
パターン認識 第10章 決定木
Miyoshi Yuya
分類問題 - 機械学習ライブラリ scikit-learn の活用
分類問題 - 機械学習ライブラリ scikit-learn の活用
y-uti
AWS電商和零售業解決方案介紹
AWS電商和零售業解決方案介紹
Amazon Web Services
WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成
Koji Sekiguchi
機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料
機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料
at grandpa
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
takehikoihayashi
2015年因果フェススライド
2015年因果フェススライド
Jun Otsuka
20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則
koba cky
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
Hiroyuki Masuda
プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列
プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列
Taketo Sano
Hiiir 百人團隊導入敏捷實踐經驗
Hiiir 百人團隊導入敏捷實踐經驗
ChiaHsien Lee
Chapter9 2
Chapter9 2
Takuya Minagawa
大規模データに基づく自然言語処理
大規模データに基づく自然言語処理
JunSuzuki21
公開鍵暗号5: 離散対数問題
公開鍵暗号5: 離散対数問題
Joe Suzuki
混合ガウスモデルとEMアルゴリスム
混合ガウスモデルとEMアルゴリスム
貴之 八木
20230628_教學服務設計工作坊
20230628_教學服務設計工作坊
Winny Wang
基礎からのベイズ統計学 3章(3.1~3.3)
基礎からのベイズ統計学 3章(3.1~3.3)
TeranishiKeisuke
混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)
Takao Yamanaka
20220410_DT.pptx
20220410_DT.pptx
Winny Wang
What's hot
(20)
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
パターン認識 第10章 決定木
パターン認識 第10章 決定木
分類問題 - 機械学習ライブラリ scikit-learn の活用
分類問題 - 機械学習ライブラリ scikit-learn の活用
AWS電商和零售業解決方案介紹
AWS電商和零售業解決方案介紹
WikipediaからのSolr用類義語辞書の自動生成
WikipediaからのSolr用類義語辞書の自動生成
機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料
機械学習プロフェッショナルシリーズ輪読会 #5 異常検知と変化検知 Chapter 1 & 2 資料
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
2015年因果フェススライド
2015年因果フェススライド
20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列
プログラマのための線形代数再入門2 〜 要件定義から学ぶ行列式と逆行列
Hiiir 百人團隊導入敏捷實踐經驗
Hiiir 百人團隊導入敏捷實踐經驗
Chapter9 2
Chapter9 2
大規模データに基づく自然言語処理
大規模データに基づく自然言語処理
公開鍵暗号5: 離散対数問題
公開鍵暗号5: 離散対数問題
混合ガウスモデルとEMアルゴリスム
混合ガウスモデルとEMアルゴリスム
20230628_教學服務設計工作坊
20230628_教學服務設計工作坊
基礎からのベイズ統計学 3章(3.1~3.3)
基礎からのベイズ統計学 3章(3.1~3.3)
混合モデルとEMアルゴリズム(PRML第9章)
混合モデルとEMアルゴリズム(PRML第9章)
20220410_DT.pptx
20220410_DT.pptx
More from Fuzhou University
遞歸神經網路(Python+TensorFlow+Keras)
遞歸神經網路(Python+TensorFlow+Keras)
Fuzhou University
卷積神經網路(Python+TensorFlow+Keras)
卷積神經網路(Python+TensorFlow+Keras)
Fuzhou University
神經網路(Python+TensorFlow+Keras)
神經網路(Python+TensorFlow+Keras)
Fuzhou University
人工智慧11_遞歸神經網路
人工智慧11_遞歸神經網路
Fuzhou University
多媒體系統10_3D繪圖軟體Blender
多媒體系統10_3D繪圖軟體Blender
Fuzhou University
多媒體系統09_3D互動擴增實境
多媒體系統09_3D互動擴增實境
Fuzhou University
人工智慧10_卷積神經網路
人工智慧10_卷積神經網路
Fuzhou University
人工智慧09_神經網路(TensorFlow+Keras)
人工智慧09_神經網路(TensorFlow+Keras)
Fuzhou University
多媒體系統08_Inkscape繪製圖形與漸層
多媒體系統08_Inkscape繪製圖形與漸層
Fuzhou University
機器學習工具_微軟Azure Machine Learning Studio
機器學習工具_微軟Azure Machine Learning Studio
Fuzhou University
論文導讀03_集成神經網路(智慧交通)
論文導讀03_集成神經網路(智慧交通)
Fuzhou University
論文導讀02_神經網路(智慧交通)
論文導讀02_神經網路(智慧交通)
Fuzhou University
論文導讀01_k個最近鄰居(行動定位)
論文導讀01_k個最近鄰居(行動定位)
Fuzhou University
人工智慧08_神經網路
人工智慧08_神經網路
Fuzhou University
多媒體系統02_影像處理原理與技術
多媒體系統02_影像處理原理與技術
Fuzhou University
多媒體系統07_Android App影音互動擴增實境
多媒體系統07_Android App影音互動擴增實境
Fuzhou University
多媒體系統06_影音編輯軟體Movie Maker
多媒體系統06_影音編輯軟體Movie Maker
Fuzhou University
多媒體系統05_Android App圖形元件
多媒體系統05_Android App圖形元件
Fuzhou University
多媒體系統04_GIMP繪圖、特效、動畫
多媒體系統04_GIMP繪圖、特效、動畫
Fuzhou University
多媒體系統03_GIMP影像合成與圖層應用
多媒體系統03_GIMP影像合成與圖層應用
Fuzhou University
More from Fuzhou University
(20)
遞歸神經網路(Python+TensorFlow+Keras)
遞歸神經網路(Python+TensorFlow+Keras)
卷積神經網路(Python+TensorFlow+Keras)
卷積神經網路(Python+TensorFlow+Keras)
神經網路(Python+TensorFlow+Keras)
神經網路(Python+TensorFlow+Keras)
人工智慧11_遞歸神經網路
人工智慧11_遞歸神經網路
多媒體系統10_3D繪圖軟體Blender
多媒體系統10_3D繪圖軟體Blender
多媒體系統09_3D互動擴增實境
多媒體系統09_3D互動擴增實境
人工智慧10_卷積神經網路
人工智慧10_卷積神經網路
人工智慧09_神經網路(TensorFlow+Keras)
人工智慧09_神經網路(TensorFlow+Keras)
多媒體系統08_Inkscape繪製圖形與漸層
多媒體系統08_Inkscape繪製圖形與漸層
機器學習工具_微軟Azure Machine Learning Studio
機器學習工具_微軟Azure Machine Learning Studio
論文導讀03_集成神經網路(智慧交通)
論文導讀03_集成神經網路(智慧交通)
論文導讀02_神經網路(智慧交通)
論文導讀02_神經網路(智慧交通)
論文導讀01_k個最近鄰居(行動定位)
論文導讀01_k個最近鄰居(行動定位)
人工智慧08_神經網路
人工智慧08_神經網路
多媒體系統02_影像處理原理與技術
多媒體系統02_影像處理原理與技術
多媒體系統07_Android App影音互動擴增實境
多媒體系統07_Android App影音互動擴增實境
多媒體系統06_影音編輯軟體Movie Maker
多媒體系統06_影音編輯軟體Movie Maker
多媒體系統05_Android App圖形元件
多媒體系統05_Android App圖形元件
多媒體系統04_GIMP繪圖、特效、動畫
多媒體系統04_GIMP繪圖、特效、動畫
多媒體系統03_GIMP影像合成與圖層應用
多媒體系統03_GIMP影像合成與圖層應用
人工智慧04_貝氏分類和貝氏網路
1.
人工智慧 教師:陳志華博士
2.
報告大綱-貝氏分類和貝氏網路 貝氏分類定義和說明 基礎統計回顧 單純貝氏分類(Naive Bayesian Classifier) 單純貝氏分類實作 單純貝氏分類限制 單純貝氏分類優點 貝氏網路分類(Bayesian
Network Classifier) 貝氏網路分類實作 貝氏分類實例應用 2
3.
貝氏分類定義和說明 貝氏分類(Bayesian Classifier)藉由資料中分析屬性與反應變數之間的機率模型,根據貝氏 定理(Bayes’Theorem)來更新資訊以推理判斷樣本資料歸屬類別,作為分類和推論的依據。 常用的方式有單純貝氏分類(Naive Bayesian
Classifier)和貝氏網路分類(Bayesian Network Classifier)。 由於並非所有的事件都有大量的歷史資料或可以重複實驗,因此面對沒有經驗、可參考的 資訊過或者沒有頻率機率存在的情況,貝氏網路亦可採用主觀機率,亦即將認為該事件是 否會發生的信念(degree of belief)的主觀判斷轉為主觀機率。 3 顧客編號 婚姻 年齡 收入 購買不動產 C01 單身 中年 高 無 C02 單身 青年 高 有 C03 已婚 青年 高 有 C04 已婚 中年 高 無 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1
4.
貝氏分類定義和說明 古典機率(事前機率)和條件機率計算 4 顧客編號 婚姻 年齡
收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 %504/20Pr 婚姻 %504/21Pr 婚姻 %502/10|0Pr 購買不動產婚姻 %502/10|1Pr 購買不動產婚姻 %504/20Pr 年齡 %504/21Pr 年齡 %02/00|0Pr 購買不動產年齡 %1002/20|1Pr 購買不動產年齡 %502/11|0Pr 購買不動產婚姻 %502/11|1Pr 購買不動產婚姻 %1002/21|0Pr 購買不動產年齡 %02/01|1Pr 購買不動產年齡 %04/00Pr 收入 %1004/41Pr 收入 %02/00|0Pr 購買不動產收入 %1002/20|1Pr 購買不動產收入 %02/01|0Pr 購買不動產收入 %1002/21|1Pr 購買不動產收入 貝氏分類主要運用事前機 率和條件機率,結合貝氏 定理進行計算和推論 婚姻的事前機率和條件機率 年齡的事前機率和條件機率 收入的事前機率和條件機率 %504/20Pr 購買不動產 %504/21Pr 購買不動產 購買不動產的事前機率 以婚姻、年齡、收入判斷是否購買不動產
5.
基礎統計回顧 貝氏定理 貝氏定理的主要概念為:一開始不知道目標事件Y的真實狀態,但知道Y服從一個機率分 佈Pr(Y),當得到新的樣本資訊或證據x後,yi發生的條件機率(事後機率) 5 顧客編號 婚姻 年齡
收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 x xy xyxyY i ii Pr Pr |Pr|Pr iiii yyxxxyxy Pr|PrPr|PrPr i i ii i y y yx x x xy xy Pr Pr Pr Pr Pr Pr Pr 0Pr 00Pr 0|0Pr 婚姻 婚姻購買不動產 婚姻購買不動產 0Pr0|0Pr 0Pr0|0Pr 00Pr 購買不動產購買不動產婚姻 婚姻婚姻購買不動產 婚姻購買不動產 以婚姻、年齡、收入判斷是否購買不動產之案例 x yyx x xy xy iii i Pr Pr|Pr Pr Pr |Pr
6.
基礎統計回顧 貝氏定理 假設事件共有m種,Pr(x)可定義如下: 6 顧客編號 婚姻 年齡
收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 m i ii mm yyx yyxyyxyyxx 1 2211 Pr|Pr Pr|Pr...Pr|PrPr|PrPr 1Pr1|0Pr0Pr0|0Pr 0Pr 購買不動產購買不動產婚姻購買不動產購買不動產婚姻 婚姻 以婚姻、年齡、收入判斷是否購買不動產之案例
7.
基礎統計回顧 貝氏定理 在取得的新資訊事件x下,貝氏定理可修正條件機率為 7 顧客編號 婚姻 年齡
收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 1Pr1|0Pr0Pr0|0Pr 0Pr0|0Pr 0|0Pr 購買不動產購買不動產婚姻購買不動產購買不動產婚姻 購買不動產購買不動產婚姻 婚姻購買不動產 以婚姻、年齡、收入判斷是否購買不動產之案例 m i ii iiiii i yyx yyx x yyx x xy xy 1 Pr|Pr Pr|Pr Pr Pr|Pr Pr Pr |Pr
8.
基礎統計回顧 獨立(Independence) ◦ 一事件發生與否,不會影響另一事件發生之機率 ◦ 當
即事件A與事件B互相獨立 ◦ 例如: ◦ 「單身」與「青年」為獨立事件 ◦ 「已婚」與「青年」為獨立事件 88 BA c A BPrAPrBAPr %25%50%500Pr0Pr00Pr 年齡婚姻年齡婚姻 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 BA %25%50%500Pr1Pr01Pr 年齡婚姻年齡婚姻
9.
基礎統計回顧 如何驗證獨立(Independence)? 皮爾森相關係數可用來分析正相關、獨立、負相關 皮爾森相關係數的值域為[-1, 1],當係數值為1代表完全正相關、0代表獨立、-1代表完全負相關 9 顧客編號 婚姻
年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 n i n i ii n i ii BbAa BbAa 1 1 22 1 顧客編號 婚姻 年齡 婚姻-婚姻平均值 年齡-年齡平均值 C01 0 1 -0.5 0.5 C02 0 0 -0.5 -0.5 C03 1 0 0.5 -0.5 C04 1 1 0.5 0.5 婚姻和年齡進行皮爾森相關係數 計算結果為0 故婚姻和年齡為互相獨立
10.
單純貝氏分類 單純貝氏分類有兩個基本假設 ◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定 ◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立 當資料中共有k個屬性時,則X
= {x1, x2, …, xk},基於貝氏定理可得: 10 顧客編號 婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 k iik k iik iii i xxx yyxxx xxx yyxxx X yyX X Xy Xy ...Pr Pr|...Pr ,...,,Pr Pr|,...,,Pr Pr Pr|Pr Pr Pr |Pr 21 21 21 21 000Pr 0Pr0|000Pr 00,0,|0Pr 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 評估單身、青年、低收入 不會購買不動產的機率
11.
單純貝氏分類 單純貝氏分類有兩個基本假設 ◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定 ◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立 假設屬性資料相互獨立: 11 顧客編號
婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 ikii iki yxyxyx yxxxyX |Pr...|Pr|Pr |...Pr|Pr 21 21 0|0Pr0|0Pr0|0Pr 0|000Pr 0|00,0,Pr 購買不動產收入購買不動產年齡購買不動產婚姻 購買不動產收入年齡婚姻 購買不動產收入年齡婚姻 評估單身、青年、低收入 不會購買不動產的機率 條件獨立 CBCACBA |Pr|Pr|Pr
12.
單純貝氏分類 單純貝氏分類有兩個基本假設 ◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定 ◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立 12 顧客編號
婚姻 年齡 收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 m i iik yyXxxxX 1 21 Pr|Pr...PrPr 1Pr1|000Pr 0Pr0|000Pr 00,0,Pr 購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻 評估單身、青年、低收入 不會購買不動產的機率
13.
單純貝氏分類 「單身」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 13 顧客編號 婚姻 年齡
收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 %0 %50%0%100%50%50%0%0%50 %50%0%0%50 1Pr1|000Pr0Pr0|000Pr 0Pr0|0Pr0|0Pr0|0Pr 000Pr 0Pr0|000Pr 00,0,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %0 %50%0%100%50%50%0%0%50 %50%0%100%50 1Pr1|000Pr0Pr0|000Pr 1Pr1|0Pr1|0Pr1|0Pr 000Pr 1Pr1|000Pr 00,0,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 0% 購買不動產機率 = 0% 購買與否無顯著差異 不考慮「收入」因子, 購買不動產的機率高
14.
單純貝氏分類 「單身」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 14 顧客編號 婚姻 年齡
收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 %0 %50%100%100%50%50%100%0%50 %50%100%0%50 1Pr1|100Pr0Pr0|100Pr 0Pr0|1Pr0|0Pr0|0Pr 100Pr 0Pr0|100Pr 10,0,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %100 %50%100%100%50%50%100%0%50 %50%100%100%50 1Pr1|100Pr0Pr0|100Pr 1Pr1|1Pr1|0Pr1|0Pr 100Pr 1Pr1|100Pr 10,0,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 0% 購買不動產機率 = 100% 此族群將會購買不動產
15.
單純貝氏分類 「單身」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 15 顧客編號 婚姻 年齡
收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 %0 %50%0%0%50%50%0%100%50 %50%0%100%50 1Pr1|010Pr0Pr0|010Pr 0Pr0|0Pr0|1Pr0|0Pr 010Pr 0Pr0|010Pr 01,0,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %0 %50%0%0%50%50%0%100%50 %50%0%0%50 1Pr1|010Pr0Pr0|010Pr 1Pr1|0Pr1|1Pr1|0Pr 010Pr 1Pr1|010Pr 01,0,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 0% 購買不動產機率 = 0% 購買與否無顯著差異 不考慮「收入」因子, 不購買不動產的機率高
16.
單純貝氏分類 「單身」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 16 顧客編號 婚姻 年齡
收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 %100 %50%100%0%50%50%100%100%50 %50%100%100%50 1Pr1|110Pr0Pr0|110Pr 0Pr0|1Pr0|1Pr0|0Pr 110Pr 0Pr0|110Pr 11,0,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %0 %50%100%0%50%50%100%100%50 %50%100%0%50 1Pr1|110Pr0Pr0|110Pr 1Pr1|1Pr1|1Pr1|0Pr 110Pr 1Pr1|110Pr 11,0,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
17.
單純貝氏分類 「已婚」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 17 顧客編號 婚姻 年齡
收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 %0 %50%0%100%50%50%0%0%50 %50%0%0%50 1Pr1|001Pr0Pr0|001Pr 0Pr0|0Pr0|0Pr0|1Pr 001Pr 0Pr0|001Pr 00,1,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %0 %50%0%100%50%50%0%0%50 %50%0%100%50 1Pr1|001Pr0Pr0|001Pr 1Pr1|0Pr1|0Pr1|1Pr 001Pr 1Pr1|001Pr 00,1,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 0% 購買不動產機率 = 0% 購買與否無顯著差異 不考慮「收入」因子, 購買不動產的機率高
18.
單純貝氏分類 「已婚」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 18 顧客編號 婚姻 年齡
收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 %0 %50%100%100%50%50%100%0%50 %50%100%0%50 1Pr1|101Pr0Pr0|101Pr 0Pr0|1Pr0|0Pr0|1Pr 101Pr 0Pr0|101Pr 10,1,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %100 %50%100%100%50%50%100%0%50 %50%100%100%50 1Pr1|101Pr0Pr0|101Pr 1Pr1|1Pr1|0Pr1|1Pr 101Pr 1Pr1|101Pr 10,1,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 0% 購買不動產機率 = 100% 此族群將會購買不動產
19.
單純貝氏分類 「已婚」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 19 顧客編號 婚姻 年齡
收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 %0 %50%0%0%50%50%0%100%50 %50%0%100%50 1Pr1|011Pr0Pr0|011Pr 0Pr0|0Pr0|1Pr0|1Pr 011Pr 0Pr0|011Pr 01,1,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %0 %50%0%0%50%50%0%100%50 %50%0%0%50 1Pr1|011Pr0Pr0|011Pr 1Pr1|0Pr1|1Pr1|1Pr 011Pr 1Pr1|011Pr 01,1,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 0% 購買不動產機率 = 0% 購買與否無顯著差異 不考慮「收入」因子, 不購買不動產的機率高
20.
單純貝氏分類 「已婚」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 20 顧客編號 婚姻 年齡
收入 購買不動產 C01 0 1 1 0 C02 0 0 1 1 C03 1 0 1 1 C04 1 1 1 0 %100 %50%100%0%50%50%100%100%50 %50%100%100%50 1Pr1|111Pr0Pr0|111Pr 0Pr0|1Pr0|1Pr0|1Pr 111Pr 0Pr0|111Pr 11,1,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %0 %50%100%0%50%50%100%100%50 %50%100%0%50 1Pr1|111Pr0Pr0|111Pr 1Pr1|1Pr1|1Pr1|1Pr 111Pr 1Pr1|111Pr 11,1,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
21.
單純貝氏分類實作 建立訓練資料,並儲存為csv檔 請參考「案例1_購買不動產(訓練資料).csv」 21 顧客編號 婚姻 年齡
收入 購買不動產 C01 單身 中年 高 無 C02 單身 青年 高 有 C03 已婚 青年 高 有 C04 已婚 中年 高 無 婚姻 年齡 收入 Class 0 1 1 0 0 0 1 1 1 0 1 1 1 1 1 0 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1
22.
單純貝氏分類實作 新增RScript檔案,並編輯程式碼 #安裝e1071函式庫 install.packages('e1071') #引用e1071函式庫 library(e1071) 22
23.
單純貝氏分類實作 #讀取訓練資料 training_data <- read.csv(file.choose(), header
= TRUE) #轉換為因子矩陣 training_data <- data.frame(lapply(training_data, as.factor)) 23
24.
單純貝氏分類實作 #訓練單純貝氏模型 model <- naiveBayes(Class
~ ., data = training_data) 24 設定目標欄位為「Class」, 其他欄位為訓練資料
25.
單純貝氏分類實作 #讀取測試資料 testing_data <- read.csv(file.choose(), header
= TRUE) #轉換為因子矩陣 testing_data <- data.frame(lapply(testing_data, as.factor)) 25
26.
單純貝氏分類實作 #將測試資料代入模型進行預測,並取得 預測結果 pred <- predict(model,
testing_data) #運用表格呈現和比對預測結果 table(pred, testing_data$Class) 26
27.
單純貝氏分類實作 可經由table瀏覽分類結果 27 正確答案為 「目標類別」 正確答案為 「非目標類別」 機器答案為 「目標類別」 True Positive (TP) False
Positive (FP) (型一(Type I)誤差) 機器答案為 「非目標類別」 False Negative (FN) (型二(Type II)誤差) True Negative (TN) 不購買不動產 購買不動產 不購買不動產 2 0 購買不動產 0 2 %100 2 2 Precision FPTP TP %100 2 2 Recall FNTP TP 假設測試資料同訓練資料
28.
單純貝氏分類限制 單純貝氏分類有兩個基本假設 ◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定 ◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立 單純貝氏分類不適用之情境 ◦
屬性資料具有關聯性 ◦ 下列案例:婚姻與年齡負相關、婚姻與收入正相關、年齡與收入負相關、屬性資料與目標資料互相獨立 28 顧客編號 婚姻 年齡 收入 購買不動產 C11 單身 中年 低 無 C12 單身 中年 低 有 C13 已婚 青年 高 有 C14 已婚 青年 高 無 顧客編號 婚姻 年齡 收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1
29.
單純貝氏分類限制 「單身」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 29 顧客編號 婚姻 年齡
收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|000Pr0Pr0|000Pr 0Pr0|0Pr0|0Pr0|0Pr 000Pr 0Pr0|000Pr 00,0,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|000Pr0Pr0|000Pr 1Pr1|0Pr1|0Pr1|0Pr 000Pr 1Pr1|000Pr 00,0,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
30.
單純貝氏分類限制 「單身」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 30 顧客編號 婚姻 年齡
收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|100Pr0Pr0|100Pr 0Pr0|1Pr0|0Pr0|0Pr 100Pr 0Pr0|100Pr 10,0,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|100Pr0Pr0|100Pr 1Pr1|1Pr1|0Pr1|0Pr 100Pr 1Pr1|100Pr 10,0,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
31.
單純貝氏分類限制 「單身」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 31 顧客編號 婚姻 年齡
收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|010Pr0Pr0|010Pr 0Pr0|0Pr0|1Pr0|0Pr 010Pr 0Pr0|010Pr 01,0,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|010Pr0Pr0|010Pr 1Pr1|0Pr1|1Pr1|0Pr 010Pr 1Pr1|010Pr 01,0,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
32.
單純貝氏分類限制 「單身」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 32 顧客編號 婚姻 年齡
收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|110Pr0Pr0|110Pr 0Pr0|1Pr0|1Pr0|0Pr 110Pr 0Pr0|110Pr 11,0,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|110Pr0Pr0|110Pr 1Pr1|1Pr1|1Pr1|0Pr 110Pr 1Pr1|110Pr 11,0,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
33.
單純貝氏分類限制 「已婚」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 33 顧客編號 婚姻 年齡
收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|001Pr0Pr0|001Pr 0Pr0|0Pr0|0Pr0|1Pr 001Pr 0Pr0|001Pr 00,1,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|001Pr0Pr0|001Pr 1Pr1|0Pr1|0Pr1|1Pr 001Pr 1Pr1|001Pr 00,1,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
34.
單純貝氏分類限制 「已婚」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 34 顧客編號 婚姻 年齡
收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|101Pr0Pr0|101Pr 0Pr0|1Pr0|0Pr0|1Pr 101Pr 0Pr0|101Pr 10,1,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|101Pr0Pr0|101Pr 1Pr1|1Pr1|0Pr1|1Pr 101Pr 1Pr1|101Pr 10,1,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
35.
單純貝氏分類限制 「已婚」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 35 顧客編號 婚姻 年齡
收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|011Pr0Pr0|011Pr 0Pr0|0Pr0|1Pr0|1Pr 011Pr 0Pr0|011Pr 01,1,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|011Pr0Pr0|011Pr 1Pr1|0Pr1|1Pr1|1Pr 011Pr 1Pr1|011Pr 01,1,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
36.
單純貝氏分類限制 「已婚」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 36 顧客編號 婚姻 年齡
收入 購買不動產 C11 0 1 0 0 C12 0 1 0 1 C13 1 0 1 1 C14 1 0 1 0 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|111Pr0Pr0|111Pr 0Pr0|1Pr0|1Pr0|1Pr 111Pr 0Pr0|111Pr 11,1,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %50 %50%50%50%50%50%50%50%50 %50%50%50%50 1Pr1|111Pr0Pr0|111Pr 1Pr1|1Pr1|1Pr1|1Pr 111Pr 1Pr1|111Pr 11,1,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 50% 購買不動產機率 = 50% 並且機率非0%,則演算法 會猜測為「不購買不動產」
37.
單純貝氏分類限制 建立訓練資料,並儲存為csv檔 請參考「案例2_購買不動產(訓練資料).csv」 37 顧客編號 婚姻 年齡
收入 購買不動產 C11 單身 中年 低 無 C12 單身 中年 低 有 C13 已婚 青年 高 有 C14 已婚 青年 高 無 婚姻 年齡 收入 Class 0 1 0 0 0 1 0 1 1 0 1 1 1 0 1 0 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1
38.
單純貝氏分類限制 執行單純貝氏分類 38 正確答案為 「目標類別」 正確答案為 「非目標類別」 機器答案為 「目標類別」 True Positive (TP) False
Positive (FP) (型一(Type I)誤差) 機器答案為 「非目標類別」 False Negative (FN) (型二(Type II)誤差) True Negative (TN) 不購買不動產 購買不動產 不購買不動產 2 2 購買不動產 0 0 %50 4 2 Precision FPTP TP %100 2 2 Recall FNTP TP 假設測試資料同訓練資料
39.
單純貝氏分類優點 單純貝氏分類有兩個基本假設 ◦ 已知各類別的事前機率常依據專家意見、歷史資料、訓練資料設定 ◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立 單純貝氏分類適用情境 ◦
當符合「屬性資料相互獨立」條件下,可預測未知資料 39 顧客編號 婚姻 年齡 收入 購買不動產 C21 單身 中年 低 無 C22 單身 中年 高 無 C23 單身 青年 高 有 C24 已婚 中年 低 無 C25 已婚 青年 低 有 C26 已婚 青年 高 有 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1 顧客編號 婚姻 年齡 收入 購買不動產 單身 中年 低 有 已婚 青年 高 無 訓練資料 訓練資料 中缺少之 資料組合
40.
單純貝氏分類優點 「單身」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 40
%100 %50%33%0%33%50%67%100%67 %50%67%100%67 1Pr1|000Pr0Pr0|000Pr 0Pr0|0Pr0|0Pr0|0Pr 000Pr 0Pr0|000Pr 00,0,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %0 %50%33%0%33%50%67%100%67 %50%33%0%33 1Pr1|000Pr0Pr0|000Pr 1Pr1|0Pr1|0Pr1|0Pr 000Pr 1Pr1|000Pr 00,0,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1
41.
單純貝氏分類優點 「單身」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 41
%100 %50%67%0%33%50%33%100%67 %50%33%100%67 1Pr1|100Pr0Pr0|100Pr 0Pr0|1Pr0|0Pr0|0Pr 100Pr 0Pr0|100Pr 10,0,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %0 %50%67%0%33%50%33%100%67 %50%67%0%33 1Pr1|100Pr0Pr0|100Pr 1Pr1|1Pr1|0Pr1|0Pr 100Pr 1Pr1|100Pr 10,0,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
42.
單純貝氏分類優點 「單身」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 42
%0 %50%33%100%33%50%67%0%67 %50%67%0%67 1Pr1|010Pr0Pr0|010Pr 0Pr0|0Pr0|1Pr0|0Pr 010Pr 0Pr0|010Pr 01,0,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %100 %50%33%100%33%50%67%0%67 %50%33%100%33 1Pr1|010Pr0Pr0|010Pr 1Pr1|0Pr1|1Pr1|0Pr 010Pr 1Pr1|010Pr 01,0,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 不購買不動產機率 = 0% 購買不動產機率 = 100% 此族群將會購買不動產
43.
單純貝氏分類優點 「單身」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「單身」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 43
%0 %50%67%100%33%50%33%0%67 %50%33%0%67 1Pr1|110Pr0Pr0|110Pr 0Pr0|1Pr0|1Pr0|0Pr 110Pr 0Pr0|110Pr 11,0,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %100 %50%67%100%33%50%33%0%67 %50%67%100%33 1Pr1|110Pr0Pr0|110Pr 1Pr1|1Pr1|1Pr1|0Pr 110Pr 1Pr1|110Pr 11,0,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 43 不購買不動產機率 = 0% 購買不動產機率 = 100% 此族群將會購買不動產
44.
單純貝氏分類優點 「已婚」、「青年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「青年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 44
%100 %50%33%0%67%50%67%100%33 %50%67%100%33 1Pr1|001Pr0Pr0|001Pr 0Pr0|0Pr0|0Pr0|1Pr 001Pr 0Pr0|001Pr 00,1,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %0 %50%33%0%67%50%67%100%33 %50%33%0%67 1Pr1|001Pr0Pr0|001Pr 1Pr1|0Pr1|0Pr1|1Pr 001Pr 1Pr1|001Pr 00,1,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
45.
單純貝氏分類優點 「已婚」、「青年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「青年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 45
%100 %50%67%0%67%50%33%100%33 %50%33%100%33 1Pr1|101Pr0Pr0|101Pr 0Pr0|1Pr0|0Pr0|1Pr 101Pr 0Pr0|101Pr 10,1,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %0 %50%67%0%67%50%33%100%33 %50%67%0%67 1Pr1|101Pr0Pr0|101Pr 1Pr1|1Pr1|0Pr1|1Pr 101Pr 1Pr1|101Pr 10,1,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
46.
單純貝氏分類優點 「已婚」、「中年」、「低收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「中年」、「低收入」的族群,購買不動產(即購買不動產=1)機率 46
%0 %50%33%100%67%50%67%0%33 %50%67%0%33 1Pr1|011Pr0Pr0|011Pr 0Pr0|0Pr0|1Pr0|1Pr 011Pr 0Pr0|011Pr 01,1,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %100 %50%33%100%67%50%67%0%33 %50%33%100%67 1Pr1|011Pr0Pr0|011Pr 1Pr1|0Pr1|1Pr1|1Pr 011Pr 1Pr1|011Pr 01,1,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 不購買不動產機率 = 0% 購買不動產機率 = 100% 此族群將會購買不動產
47.
單純貝氏分類優點 「已婚」、「中年」、「高收入」的族群,「不」購買不動產(即購買不動產=0)機率 「已婚」、「中年」、「高收入」的族群,購買不動產(即購買不動產=1)機率 47
%0 %50%67%100%67%50%33%0%33 %50%33%0%33 1Pr1|111Pr0Pr0|111Pr 0Pr0|1Pr0|1Pr0|1Pr 111Pr 0Pr0|111Pr 11,1,|0Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 %100 %50%67%100%67%50%33%0%33 %50%67%100%67 1Pr1|111Pr0Pr0|111Pr 1Pr1|1Pr1|1Pr1|1Pr 111Pr 1Pr1|111Pr 11,1,|1Pr 購買不動產購買不動產收入年齡婚姻購買不動產購買不動產收入年齡婚姻 購買不動產購買不動產收入購買不動產年齡購買不動產婚姻 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 收入年齡婚姻購買不動產 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 不購買不動產機率 = 0% 購買不動產機率 = 100% 此族群將會購買不動產
48.
單純貝氏分類優點 建立訓練資料,並儲存為csv檔 請參考「案例3_購買不動產(訓練資料).csv」 48 顧客編號 婚姻 年齡
收入 購買不動產 C21 單身 中年 低 無 C22 單身 中年 高 無 C23 單身 青年 高 有 C24 已婚 中年 低 無 C25 已婚 青年 低 有 C26 已婚 青年 高 有 顧客編號 婚姻 年齡 收入 購買不動產 C21 0 0 0 0 C22 0 0 1 0 C23 0 1 1 1 C24 1 0 0 0 C25 1 1 0 1 C26 1 1 1 1 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1
49.
單純貝氏分類優點 建立測試資料,並儲存為csv檔 請參考「案例3_購買不動產(測試資料).csv」 49 顧客編號 婚姻 年齡
收入 購買不動產 C31 單身 青年 低 無 C32 單身 青年 高 無 C33 單身 中年 低 有 C34 單身 中年 高 有 C35 已婚 青年 低 無 C36 已婚 青年 高 無 C37 已婚 中年 低 有 C38 已婚 中年 高 有 顧客編號 婚姻 年齡 收入 購買不動產 C31 0 0 0 0 C32 0 0 1 0 C33 0 1 0 1 C34 0 1 1 1 C35 1 0 0 0 C36 1 0 1 0 C37 1 1 0 1 C38 1 1 1 1 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1 訓練資料中缺少之資料組合
50.
單純貝氏分類優點 執行單純貝氏分類 50 正確答案為 「目標類別」 正確答案為 「非目標類別」 機器答案為 「目標類別」 True Positive (TP) False
Positive (FP) (型一(Type I)誤差) 機器答案為 「非目標類別」 False Negative (FN) (型二(Type II)誤差) True Negative (TN) 不購買不動產 購買不動產 不購買不動產 4 0 購買不動產 0 4 %100 4 4 Precision FPTP TP %100 4 4 Recall FNTP TP
51.
貝氏網路分類 單純貝氏分類基本假設 ◦ 給定任一類別下,屬性資料相互獨立,即屬性資料條件獨立 貝氏網路分類 ◦ 分析具有相依性的屬性資料,將具有相依性的屬性資料一起計算其條件機率,不假設條件獨立 ◦
具有獨立性的屬性資料,仍假設為屬性資料條件獨立 51 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0 單純貝氏分類 貝氏網路分類 此案例用單純貝氏 分類之正確率50% 此案例用貝氏網路 分類之正確率100%
52.
貝氏網路分類 需計算下列機率 ◦ Pr(購買不動產) ◦ Pr(婚姻
| 購買不動產) ◦ Pr(收入 | 購買不動產, 婚姻) ◦ Pr(年齡 | 購買不動產, 收入) 52 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0
53.
貝氏網路分類 需計算下列機率 ◦ Pr(購買不動產) 53 顧客編號 婚姻
年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0 %500Pr 購買不動產 %501Pr 購買不動產
54.
貝氏網路分類 需計算下列機率 ◦ Pr(婚姻 |
購買不動產) 54 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0 %500|0Pr 購買不動產婚姻 %501|0Pr 購買不動產婚姻 %500|1Pr 購買不動產婚姻 %501|1Pr 購買不動產婚姻
55.
貝氏網路分類 需計算下列機率 ◦ Pr(收入 |
購買不動產, 婚姻) 55 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0 %000|0Pr 婚姻購買不動產收入 %001|0Pr 婚姻購買不動產收入 %10000|1Pr 婚姻購買不動產收入 %10001|1Pr 婚姻購買不動產收入 %10010|0Pr 婚姻購買不動產收入 %10011|0Pr 婚姻購買不動產收入 %010|1Pr 婚姻購買不動產收入 %011|1Pr 婚姻購買不動產收入
56.
貝氏網路分類 需計算下列機率 ◦ Pr(年齡 |
購買不動產, 收入) 56 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0 %000|0Pr 收入購買不動產年齡 %10001|0Pr 收入購買不動產年齡 %10000|1Pr 收入購買不動產年齡 %001|1Pr 收入購買不動產年齡 %10010|0Pr 收入購買不動產年齡 %011|0Pr 收入購買不動產年齡 %010|1Pr 收入購買不動產年齡 %10011|1Pr 收入購買不動產年齡
57.
貝氏網路分類 判斷「單身、青年、高收入」族群 ◦ Pr(購買不動產) ◦ Pr(婚姻
| 購買不動產) ◦ Pr(收入 | 購買不動產, 婚姻) ◦ Pr(年齡 | 購買不動產, 收入) 57 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0 %500Pr 購買不動產 %500|0Pr 購買不動產婚姻 %10000|1Pr 婚姻購買不動產收入 %10010|0Pr 收入購買不動產年齡 %50%100%100%50 0|1,0,0Pr 購買不動產收入年齡婚姻 %100 %50%0%50%50 %50%50 1,0,0Pr 0Pr0|1,0,0Pr 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
58.
貝氏網路分類 判斷「單身、青年、高收入」族群 ◦ Pr(購買不動產) ◦ Pr(婚姻
| 購買不動產) ◦ Pr(收入 | 購買不動產, 婚姻) ◦ Pr(年齡 | 購買不動產, 收入) 58 顧客編號 婚姻 年齡 收入 購買不動產 C41 0 0 1 0 C42 0 1 1 1 C43 1 0 0 1 C44 1 1 0 0 C45 1 1 0 0 C46 1 0 0 1 C47 0 1 1 1 C48 0 0 1 0 %501Pr 購買不動產 %501|0Pr 購買不動產婚姻 %0%0%100%50 1|1,0,0Pr 購買不動產收入年齡婚姻 %10001|1Pr 婚姻購買不動產收入 %011|0Pr 收入購買不動產年齡 %0 %50%0%50%50 %50%0 1,0,0Pr 1Pr1|1,0,0Pr 收入年齡婚姻 購買不動產購買不動產收入年齡婚姻 不購買不動產機率 = 100% 購買不動產機率 = 0% 此族群將不會購買不動產
59.
貝氏網路分類實作 建立訓練資料,並儲存為csv檔 請參考「案例4_購買不動產(訓練資料).csv」 59 顧客編號 婚姻 年齡
收入 購買不動產 C41 單身 青年 高 無 C42 單身 中年 高 有 C43 已婚 青年 低 有 C44 已婚 中年 低 無 C45 已婚 中年 低 無 C46 已婚 青年 低 有 C47 單身 中年 高 有 C48 單身 青年 高 無 婚姻 年齡 收入 購買不動產 0 0 1 0 0 1 1 1 1 0 0 1 1 1 0 0 1 1 0 0 1 0 0 1 0 1 1 1 0 0 1 0 單身:0 已婚:1 青年:0 中年:1 低:0 高:1 無:0 有:1
60.
貝氏網路分類實作 新增RScript檔案,並編輯程式碼 #安裝bnlearn函式庫 install.packages('bnlearn') #引用bnlearn函式庫 library(bnlearn) 60
61.
貝氏網路分類實作 #讀取訓練資料 training_data <- read.csv(file.choose(), header
= TRUE) #轉換為因子矩陣 training_data <- data.frame(lapply(training_data, as.factor)) 61
62.
貝氏網路分類實作 #訓練貝氏網路模型 bn <- tree.bayes(training_data,
"Class") model <- bn.fit(bn, training_data) 62 設定目標欄位為「Class」, 其他欄位為訓練資料
63.
貝氏網路分類實作 #讀取測試資料 testing_data <- read.csv(file.choose(), header
= TRUE) #轉換為因子矩陣 testing_data <- data.frame(lapply(testing_data, as.factor)) 63
64.
貝氏網路分類實作 #將測試資料代入模型進行預測,並取得 預測結果 pred <- predict(model,
testing_data) #運用表格呈現和比對預測結果 table(pred, testing_data$Class) 64
65.
貝氏網路分類實作 #繪製貝氏網路模型 plot(bn) 65
66.
貝氏網路分類實作 可經由table瀏覽分類結果 66 正確答案為 「目標類別」 正確答案為 「非目標類別」 機器答案為 「目標類別」 True Positive (TP) False
Positive (FP) (型一(Type I)誤差) 機器答案為 「非目標類別」 False Negative (FN) (型二(Type II)誤差) True Negative (TN) 不購買不動產 購買不動產 不購買不動產 4 0 購買不動產 0 4 假設測試資料同訓練資料 %100 4 4 Precision FPTP TP %100 4 4 Recall FNTP TP
67.
貝氏分類實例應用 開放資料-臺灣證券交易所 ◦ 網址: http://www.twse.com.tw/zh/page/trading/ex change/FMTQIK.html 資料集服務分類 ◦ 盤後資訊 ◦
臺灣跨市場指數 ◦ TWSE自行編製指數 ◦ 與FTSE合作編製指數 ◦ 與銳聯合作編製指數 ◦ 與S&PDJI合作編製指數 ◦ 升降幅度/首五日無漲跌幅 ◦ 當日沖銷交易標的及統計 ◦ 融資融券與可借券賣出額度 67
68.
貝氏分類實例應用 選擇資料日期和股票代碼 本例資料日期以2017年為例 挑選電信業者股票代碼 ◦ 2412中華電 ◦ 3045台灣大 ◦
3682亞太電 ◦ 4904遠傳 68
69.
貝氏分類實例應用 將目標個股每個月的加權平均價存到Excel 依漲跌情況,漲以1表示,跌以0表示,編碼為0、1二元表, 69 個股每個月加權平均價 個股漲跌二元表 漲以1表示,跌以0表示
70.
貝氏分類實例應用 將個股漲跌二元表存成CSV檔 作為關聯規則學習的訓練資料 70 中華電欄位更名為Class
71.
貝氏分類實例應用 單純貝氏分類實驗結果 71 正確答案為 「目標類別」 正確答案為 「非目標類別」 機器答案為 「目標類別」 True Positive (TP) False
Positive (FP) (型一(Type I)誤差) 機器答案為 「非目標類別」 False Negative (FN) (型二(Type II)誤差) True Negative (TN) 中華電_跌 中華電_漲 中華電_跌 5 1 中華電_漲 1 4 %83 6 5 Precision FPTP TP %83 6 5 Recall FNTP TP
72.
貝氏分類實例應用 貝氏網路分類實驗結果 72 正確答案為 「目標類別」 正確答案為 「非目標類別」 機器答案為 「目標類別」 True Positive (TP) False
Positive (FP) (型一(Type I)誤差) 機器答案為 「非目標類別」 False Negative (FN) (型二(Type II)誤差) True Negative (TN) 中華電_跌 中華電_漲 中華電_跌 6 2 中華電_漲 0 3 %75 8 6 Precision FPTP TP %100 6 6 Recall FNTP TP