SlideShare a Scribd company logo
1 of 89
政治大學圖檔所博士
陳勇汀
pudding@nccu.edu.tw
2021年
資料探勘技術於
圖書館讀者資料分析與應用
Chapter 2.
看穿因果
熱點分析
── Section 1 ──
什麼樣的讀者容易借書逾期?
── Section 2 ──
實機操作:熱點分析
── Section 3 ──
熱點分析簡介
── Section 4 ──
看穿因果:深入數據因果之下
2
本章大綱
看穿因果 熱點分析
3
什麼樣的讀者容易借書逾期?
Section 1.
4
https://www.uwlax.edu/textbook-rental/book-return-due-dates/
我來跑
畢業離校...
同學,你借的
書還沒還喔!
5
借書逾期讀者資料
類別型
● 讀者類型
● 所屬單位、所屬系所
● 帳號狀態、性別
數值型
● 借閱總數、0到9類借閱總數
目標屬性
● 是否有逾期記錄
6
什麼樣的讀者比較容易借書逾期?
是否有逾期
記錄=是
讀者類型=? 所屬單位=?
借閱總數>? ?類借閱總數>?
7
資料集下載
課程網頁 借閱逾期讀者
資料集2020
8
初步分析
什麼樣的讀者容易借書逾期?
9
先來看看所屬單位...
是否有逾期
記錄=是
讀者類型=? 所屬單位=?
借閱總數>? ?類借閱總數>?
10
Data Pivot Table
資料透視表分析
借閱逾期讀者
資料集2020
是否有逾期
記錄=是
11
有逾期記錄的讀者所屬單位分佈
所屬單位 有逾期記錄=是
社科院 443
文學院 337
商學院 320
外語學院 234
傳播學院 232
法學院 151
國務院 142
其他 134
理學院 82
教育學院 59
行政 52
館際 17
研究 14
創國學院 2
社科院
文學院
商學院
12
甘阿捏?
13
Data Pivot Table
資料透視表分析
借閱逾期讀者
資料集2020
是否有逾期
記錄=是
是否有逾期
記錄=否
14
所屬單位中逾期的所佔比例
所屬單位
有逾期
記錄=是
有逾期記
錄=否 總和
有逾期記錄=是
的所佔比例
社科院 443 1400 1843 24.04%
文學院 337 857 1194 28.22%
商學院 320 1258 1578 20.28%
外語學院 234 771 1005 23.28%
傳播學院 232 627 859 27.01%
法學院 151 575 726 20.80%
國務院 142 389 531 26.74%
其他 134 586 720 18.61%
理學院 82 296 378 21.69%
教育學院 59 231 290 20.34%
行政 52 160 212 24.53%
館際 17 53 70 24.29%
研究 14 46 60 23.33%
創國學院 2 11 13 15.38%
443
(有逾期記錄=是)
/
1843 (總和)
=
24.04%
15
所屬單位中逾期的所佔比例
所屬單位
有逾期記錄=是
的所佔比例
文學院 28.22%
傳播學院 27.01%
國務院 26.74%
行政 24.53%
館際 24.29%
社科院 24.04%
研究 23.33%
外語學院 23.28%
理學院 21.69%
法學院 20.80%
教育學院 20.34%
商學院 20.28%
其他 18.61%
創國學院 15.38%
傳播學院
27.01%
文學院
28.22%
國務院
26.74%
16
所屬單位
有逾期
記錄=是
有逾期記
錄=否 總和
有逾期記錄=是
的所佔比例
文學院 337 857 1194 28.22%
傳播學院 232 627 859 27.01%
國務院 142 389 531 20.28%
17
https://www.chinatimes.com/realtimenews/20210617005971-260405?chdtv
「有打疫苗」的死亡案例
18
如果要比較各個屬性的話...
是否有逾期
記錄=是
讀者類型=? 所屬單位=?
借閱總數>? 各類借閱總數>?
19
實機操作:熱點分析
Section 2.
步驟大綱
1. 下載檔案
2. 開啟Explorer 探索器
3. 開啟CSV檔案
4. 選擇資料探勘演算法
5. 設定演算法
6. 開始探勘
20
21
1. 下載檔案
課程網頁 借閱逾期讀者
資料集2020
22
2. 開啟Explorer 探索器
23
3. 開啟CSV檔案
A
D
C. CSV檔案
B. 檔案類型
24
4. 選擇資料探勘演算法
選擇資料探勘類型
分類
分群 時間序列預測
關聯分析
探索器介面說明
關聯規則探勘 (Associate)
A. Associator ⇨
Choose
選擇關聯規則探勘
演算法
B. 演算法進階設定
C. Start 開始執行
D. Result list
探勘結果列表
E. Associator output
探勘結果
25
A B
C
D
E
26
4. 選擇資料探勘演算法
選擇演算法:HotSpot
● Associator ⇨ Choose
選擇關聯規則探勘演算法
weka.associations
.HotSpot
※ 如果沒出現此演算法,
表示您需要需安裝套件hotSpot
!
27
5. 設定演算法
開啟設定
4. 按下粗體字的
演算法名稱
HosSpot
開啟進階設定
!
28
5. 設定演算法
設定細節
A. 請設定以下參數:
maxBranchingFactor: 100
最後顯示的規則數量
maxRuleLength: 1
組成規則的屬性數量
outputRules: True
顯示關聯規則
support: 0.01
只要案例數量超過1%就納入分析
target: last
目標屬性設為最後一項
targetIndex: first
目標屬性的目標值編號
A. OK 離開進階設定
B
A
29
想瞭解設定的意思嗎?
Information
● SYNOPSIS 演算法介紹
● OPTIONS 設定說明
More
30
6. 開始探勘
A
B
A. Start 開始執行
B. Result list
探勘結果
C. Associator output
探勘結果細節
1. 下載檔案
2. 開啟Explorer 探索器
3. 開啟CSV檔案
4. 選擇資料探勘演算法
5. 設定演算法
6. 開始探勘
我完成了
我有問題 打開麥克風
直接問
31
熱點分析 前半部分
練習囉
步驟大綱
7. 轉換探勘結果細節
8. 解讀探勘結果
32
33
7. 轉換探勘結果細節
複製Assocator output
A
B
A. 按滑鼠右鍵全選
B. 按Ctrl+C複製
34
7. 轉換探勘結果細節
開啟HotSpot分析結果轉換器
課程網頁 HotSpot分析結果
轉換工具
35
7. 轉換探勘結果細節
轉換並下載轉換結果
A. Ctrl+v貼上
B. 下載
36
7. 轉換探勘結果細節
用LibreOffice Calc開啟ods
37
8. 解讀探勘結果
開啟Auto Filter
A
B
C
38
8. 解讀探勘結果
使用Auto Filter
排序
搜尋
只顯示有打勾的列
● LHS-rule
前提規則
● LHS-length
前提規則組成長度
● LHS-count
前提規則符合案例數量
39
8. 解讀探勘結果
欄位說明
● RHS-rule
後果規則
● RHS-count
前提與後果規則皆符合
的案例數量
● conf, lift, lev, conv,sup
評估指標
40
8. 解讀探勘結果
欄位說明
所屬系所 = 台文所(60)
Left-Hand-Side
LHS 前提規則
是否有逾期記錄 = 是(24)
Right-Hand-Side
RHS 結果規則
conf: 0.4 / lift: 1.71 / lev / 0 / conv: 1.24 / sup:
Metric Type
評估指標
41
8. 解讀探勘結果
規則排序
依conf > lift > lev > conv排序
42
那些單位的讀者容易逾期?
使用Auto Filter
前提規則 結果規則 conf
所屬單位=文學院 是否有逾期記錄=是 0.28
所屬單位=傳播學院 是否有逾期記錄=是 0.27
所屬單位=國務院 是否有逾期記錄=是 0.27
所屬單位=行政 是否有逾期記錄=是 0.25
所屬單位=社科院 是否有逾期記錄=是 0.24
43
那些單位的讀者容易逾期?
跟前面的分析比較
前提規則 結果規則 conf
所屬單位=文學院 是否有逾期記錄=是 0.28
所屬單位=傳播學院 是否有逾期記錄=是 0.27
所屬單位=國務院 是否有逾期記錄=是 0.27
所屬單位=行政 是否有逾期記錄=是 0.25
所屬單位=社科院 是否有逾期記錄=是 0.24
所屬單位
有逾期記錄=是
的所佔比例
文學院 28.22%
傳播學院 27.01%
國務院 26.74%
行政 24.53%
44
借哪些書的讀者容易逾期?
使用Auto Filter
前提規則 結果規則 conf
2宗教類借閱總數 > 14 是否有逾期記錄=是 0.39
3自然科學類借閱總數 > 15 是否有逾期記錄=是 0.33
1哲學類借閱總數 > 7 是否有逾期記錄=是 0.32
借閱總數 > 88 是否有逾期記錄=是 0.29
8文學類借閱總數 > 4 是否有逾期記錄=是 0.28
0總類借閱總數 > 2 是否有逾期記錄=是 0.27
5社會科學類借閱總數 > 18 是否有逾期記錄=是 0.27
7外國史地類借閱總數 > 2 是否有逾期記錄=是 0.24
4應用科學類借閱總數 <= 0 是否有逾期記錄=是 0.24
9美術類借閱總數 <= 12 是否有逾期記錄=是 0.24
45
借哪些書的讀者容易逾期?
連續數值型的區間
> 14
14為2宗教類借閱
總數的平均值
前提規則 結果規則 conf
2宗教類借閱總數 > 14 是否有逾期記錄=是 0.39
3自然科學類借閱總數 > 15 是否有逾期記錄=是 0.33
1哲學類借閱總數 > 7 是否有逾期記錄=是 0.32
借閱總數 > 88 是否有逾期記錄=是 0.29
8文學類借閱總數 > 4 是否有逾期記錄=是 0.28
0總類借閱總數 > 2 是否有逾期記錄=是 0.27
5社會科學類借閱總數 > 18 是否有逾期記錄=是 0.27
7外國史地類借閱總數 > 2 是否有逾期記錄=是 0.24
4應用科學類借閱總數 <= 0 是否有逾期記錄=是 0.24
9美術類借閱總數 <= 12 是否有逾期記錄=是 0.24
前提規則 結果規則 conf
2宗教類借閱總數 > 14 是否有逾期記錄=是 0.39
3自然科學類借閱總數 > 15 是否有逾期記錄=是 0.33
1哲學類借閱總數 > 7 是否有逾期記錄=是 0.32
借閱總數 > 88 是否有逾期記錄=是 0.29
8文學類借閱總數 > 4 是否有逾期記錄=是 0.28
0總類借閱總數 > 2 是否有逾期記錄=是 0.27
5社會科學類借閱總數 > 18 是否有逾期記錄=是 0.27
7外國史地類借閱總數 > 2 是否有逾期記錄=是 0.24
4應用科學類借閱總數 <= 0 是否有逾期記錄=是 0.24
9美術類借閱總數 <= 12 是否有逾期記錄=是 0.24
46
借哪些書的讀者容易逾期?
不能只看表面數據的規則
沒有借應用
科學類也逾
期?
47
那種因素更容易造成逾期?
前提規則 數量 結果規則 數量 conf lift lev conv
所屬系所=台文所 60 逾期記錄=是 24 0.4 1.71 0 1.24
2宗教類借閱總數 > 14 56 逾期記錄=是 22 0.39 1.68 0 1.23
所屬系所=企研所 103 逾期記錄=是 36 0.35 1.49 0 1.16
3自然科學類借閱總數 >15 99 逾期記錄=是 33 0.33 1.42 0 1.13
1哲學類借閱總數 > 7 287 逾期記錄=是 91 0.32 1.35 0 1.12
所屬系所=民族系 179 逾期記錄=是 54 0.3 1.29 0 1.09
所屬系所=中文系 479 逾期記錄=是 143 0.3 1.28 0 1.09
讀者類型=休學 74 逾期記錄=是 22 0.3 1.27 0 1.07
所屬系所=哲學系 181 逾期記錄=是 53 0.29 1.25 0 1.07
借閱總數 > 88 82 逾期記錄=是 24 0.29 1.25 0 1.06
48
是否有逾期
記錄=是
讀者類型=休學
所屬單位
=文學院
借閱總數>88 宗教類
借閱總數> 14
所屬系所=台文所
我完成了
我有問題 打開麥克風
直接問
1. 轉換探勘結果細節:將探勘
結果轉換成ods表格
2. 解讀探勘結果:在
LibreOffice Calc中
檢視探勘結果
49
熱點分析 後半部分
練習囉
50
HotSpot (Patient Rule Induction Method, PRIM)
熱點分析簡介
(Friedman & Fisher, 1999)
Section 3.
● 根據使用者所感興趣的目標屬性與項目,找出最能代表
該屬性與項目的關聯規則
● 關聯規則的組成:前提規則、結果規則、評估指標
51
熱點分析
購買尿布 = Yes
Left-Hand-Side
LHS 前提規則
購買啤酒 = Yes
Right-Hand-Side
RHS 結果規則
conf= 0.77, lift = 1.18
Metric Type
評估指標
52
熱點分析演算法流程
目標屬性=目標值
目標屬性≠目標值
借閱逾期讀者
資料集2020
找出各種
前提規則的
符合案例
Metric Type
評估指標
Conviction
Conv. 肯定度
Leverage
Lev. 槓桿度
53
評估指標
Lift 增益度
Confidence
Conf. 信賴度
● 測量了前提項目集LHS發生時,結果項目集RHS也出現
的條件機率
● 信賴度最高為1,此時表示LHS出現的時候,肯定會出現
RHS
54
Confidence
Conf. 信賴度 (1/3)
http://blog.pulipuli.info/2017/08/wekahotspot-association-rule-mining.html
因病退伍 = Yes 心理疾病 = Yes
信賴度= 0.8
Metric Type
評估指標
55
Confidence
Conf. 信賴度(2/3)
http://www.ntdtv.com.tw/b5/20160511/video/171381.html?ptt
56
Confidence
Conf. 信賴度(3/3)
所屬單位
有逾期
記錄=是
有逾期記
錄=否 總和
有逾期記錄=是
的所佔比例
文學院 337 857 1194 28.22%
傳播學院 232 627 859 27.01%
國務院 142 389 531 20.28%
信賴度
337
(有逾期記錄=是)
/
1194 (總和)
=
28.22%
● 信賴度並未考慮到RHS發生機率
● 增益度比較信賴度與結果項目集RHS單獨發生時機率的
大小
● Lift值若大於1,表示LHS導致出現RHS的機率,比RHS
單獨出現的機率還要高
57
Lift 增益度
http://blog.pulipuli.info/2017/08/wekahotspot-association-rule-mining.html
● 比較LHS跟RHS
兩者同時出現的機率 對 兩者各別出現機率相乘
的增加程度
58
Leverage
Lev. 槓桿度
● 表示LHS與RHS兩者的相關程度。
● 如果肯定度為1,表示兩者並不相關。
● 如果大於1,例如肯定度為1.17,
表示比起LHS與RHS在完全隨機組合所出現的機率相比,
此規則的機率更提高了117%
59
Conviction
Conv. 肯定度
● 此規則涵蓋案例數量(A),佔全部符合目標符合案例(B)的
比例
60
Support
Sup. 支持度
61
利用評估指標來選出重要規則吧!
前提規則 數量 結果規則 數量 conf lift lev conv
所屬系所=台文所 60 逾期記錄=是 24 0.4 1.71 0 1.24
2宗教類借閱總數 > 14 56 逾期記錄=是 22 0.39 1.68 0 1.23
所屬系所=企研所 103 逾期記錄=是 36 0.35 1.49 0 1.16
3自然科學類借閱總數 >15 99 逾期記錄=是 33 0.33 1.42 0 1.13
1哲學類借閱總數 > 7 287 逾期記錄=是 91 0.32 1.35 0 1.12
所屬系所=民族系 179 逾期記錄=是 54 0.3 1.29 0 1.09
所屬系所=中文系 479 逾期記錄=是 143 0.3 1.28 0 1.09
讀者類型=休學 74 逾期記錄=是 22 0.3 1.27 0 1.07
所屬系所=哲學系 181 逾期記錄=是 53 0.29 1.25 0 1.07
借閱總數 > 88 82 逾期記錄=是 24 0.29 1.25 0 1.06
● 什麼前提規則最可能造成讀者
沒有逾期記錄?
● 在探勘得到的規則中,請挑選
一個你覺得最合理的規則,並
說明你認爲合理的理由。
62
快問快答
什麼讀者不會逾期?
提示:演算法設定細節
63
targetIndex = 2
表示欲分析「是否有逾期記
錄」的第二個值「否」
學習單填答
64
課程網頁 什麼讀者不逾期
我完成了
我有問題 打開麥克風
直接問
1. 使用熱點分析,探勘那些讀
者借書不逾期
2. 填答學習單
65
熱點分析
練習囉
66
看穿因果:深入數據因果之下
Section 4.
67
所屬系所 = 台文所(60)
Left-Hand-Side
LHS 前提規則
是否有逾期記錄 = 是(24)
Right-Hand-Side
RHS 結果規則
conf: 0.4 / lift: 1.71 / lev / 0 / conv: 1.24
Metric Type
評估指標
甘阿捏?
68
所屬系所 = 台文所(60)
Left-Hand-Side
LHS 前提規則
是否有逾期記錄 = 是(24)
Right-Hand-Side
RHS 結果規則
conf: 0.4 / lift: 1.71 / lev / 0 / conv: 1.24
Metric Type
評估指標
數據上的因果關係
借閱逾期讀者
資料集2020
真實的因果關係
只有神知道的世界...
69
所屬系所 = 台文所(60)
Left-Hand-Side
LHS 前提規則
是否有逾期記錄 = 是(24)
Right-Hand-Side
RHS 結果規則
conf: 0.4 / lift: 1.71 / lev: 0 / conv: 1.24
Metric Type
評估指標
1. 少數特殊案例?符合此規則的案例數量是不是太少了?
2. 刻意篩選屬性?可能存在其他更重要的規則?
3. 目標變項只能用類別值?能夠分析其他資料嗎?
1
2 3
70
Q1. 少數特殊案例?
所屬系所 = 台文所(60)
Left-Hand-Side
LHS 前提規則
是否有逾期記錄 = 是(24)
Right-Hand-Side
RHS 結果規則
24 (台文所&有逾期)
2219 (有逾期)
=1%
71
Q1. 少數特殊案例?
所屬系所 = 台文所(60)
Left-Hand-Side
LHS 前提規則
是否有逾期記錄 = 是(24)
Right-Hand-Side
RHS 結果規則
24 (台文所&有逾期)
2219 (有逾期)
=1%
support: 0.01
只要案例數量超過1%
就納入分析
72
支持度的設定
探勘結果數量的差異
support = 0.01 support = 0.33
42條規則 5條規則
73
支持度的設定
要高還是低?
support = 0.01 support = 0.33
42條規則 5條規則
適合深
入研究
適合快
速決策
74
手動篩選支持度
Standard
Filter...
sup >= 0.05
75
Q2. 刻意篩選屬性?
所屬系所 = 台文所(60)
Left-Hand-Side
LHS 前提規則
是否有逾期記錄 = 是(24)
Right-Hand-Side
RHS 結果規則
是否有逾期
記錄=是
所屬單位=?
借閱總數
各類借閱總數
讀者類型=?
所屬系所=?
76
看電視會延年益壽?
(Moore、Notz,2012)
國民平均壽命=長
電視機
人均數量 = 多
電視脫貧計劃啟動!
77
探索其他屬性
借閱總數
各類借閱
總數
讀者類型
所屬系所
所屬單位
內部屬性 外部屬性
不在目前已經蒐集的資料之中,其他可能造成影響的因素
78
探索其他屬性
外部屬性
外部屬性
●學生的修課類型
●業務工作類型
●書籍的內容
是否有逾期
記錄=是
79
探索其他屬性
內部屬性
類別屬性 數值屬性 屬性的合併
所屬系所
所屬單位
分組分班
上層類別
下層類別
借閱總數
平均數切分
裝箱法
區間更大
區間更小
所屬系所 借閱總數
聯集
交集
涵蓋更大
涵蓋更小
80
探索其他屬性
內部屬性:交集設定
所屬系所 借閱總數
交集
涵蓋更小
maxRuleLength: 1
組成規則的屬性數量
maxRuleLength = 1
81
探索其他屬性
內部屬性:交集設定
maxRuleLength = 2
42條規則 556條規則
maxRuleLength = 1
82
探索其他屬性
內部屬性:交集設定
maxRuleLength = 2
所屬系所 = 台文所(60)
LHS
是否有逾期記錄 = 是(24)
RHS
conf: 0.4 / lift: 1.71 /
lev: 0 / conv: 1.24
Metric
所屬系所=台文所,
7外國史地類借閱總數 <= 6
LHS
是否有逾期記錄 = 是(23)
RHS
conf: 0.46 / lift: 1.97 /
lev: 0 / conv: 1.37
Metric
83
Q3. 目標變項只能用類別值?
所屬系所 = 台文所(60)
Left-Hand-Side
LHS 前提規則
是否有逾期記錄 = 是(24)
Right-Hand-Side
RHS 結果規則
能不能讓分析的目標改成
逾期更多 或 逾期較少 ?
84
超越熱點分析
多目標演化型模糊
子群組探勘
(Carmona, et al., 2014)
特殊模型探勘
(Duivesteijn, et al., 2016)
子群組探勘
(Herrera, et al., 2011)
目標概念
模糊子群組探勘
演化型子群組探勘
模糊特殊模型探勘
(陳勇汀,2021)
熱點分析
● 調整熱點分析的設定
● 找出你一條能夠解釋的關聯規
則
● 說明你的理由
85
大挑戰
深入瞭解會逾期的讀者
86
提示:設定演算法細節
maxRuleLength: 1
組成規則的屬性數量
support: 0.01
只要案例數量超過1%就納入分析
學習單填答
87
課程網頁 學習單 繳交學習單
我完成了
我有問題 打開麥克風
直接問
1. 使用熱點分析,調整參數後
進行分析
2. 填答學習單
88
深入熱點分析
練習囉
Chapter 3.
洞悉未來:時間序列預測
89
看穿因果之後...

More Related Content

More from Yung-Ting Chen

論文神器+ChatGPT - blog - 2023.pptx
論文神器+ChatGPT - blog - 2023.pptx論文神器+ChatGPT - blog - 2023.pptx
論文神器+ChatGPT - blog - 2023.pptxYung-Ting Chen
 
大數據時代下的文本分析 - 22 dils text.pptx
大數據時代下的文本分析 - 22 dils text.pptx大數據時代下的文本分析 - 22 dils text.pptx
大數據時代下的文本分析 - 22 dils text.pptxYung-Ting Chen
 
人工智慧的可解釋性 - blog - 2023.pptx
人工智慧的可解釋性 - blog - 2023.pptx人工智慧的可解釋性 - blog - 2023.pptx
人工智慧的可解釋性 - blog - 2023.pptxYung-Ting Chen
 
Introduction to TextRank - 22.pptx
Introduction to TextRank - 22.pptxIntroduction to TextRank - 22.pptx
Introduction to TextRank - 22.pptxYung-Ting Chen
 
Subgroup-Discovery-2021.pptx
Subgroup-Discovery-2021.pptxSubgroup-Discovery-2021.pptx
Subgroup-Discovery-2021.pptxYung-Ting Chen
 
1. introduction of weka
1. introduction of weka1. introduction of weka
1. introduction of wekaYung-Ting Chen
 
3. classification and regression
3. classification and regression3. classification and regression
3. classification and regressionYung-Ting Chen
 
2. clustering and association rule mining
2. clustering and association rule mining2. clustering and association rule mining
2. clustering and association rule miningYung-Ting Chen
 
Word專業文件排版:第8堂面授 (20151223) blog
Word專業文件排版:第8堂面授 (20151223) blogWord專業文件排版:第8堂面授 (20151223) blog
Word專業文件排版:第8堂面授 (20151223) blogYung-Ting Chen
 
Word專業文件排版:第6堂面授 (20151202) blog
Word專業文件排版:第6堂面授 (20151202) blogWord專業文件排版:第6堂面授 (20151202) blog
Word專業文件排版:第6堂面授 (20151202) blogYung-Ting Chen
 
Word專業文件排版:第3堂面授 (20151014) blog
Word專業文件排版:第3堂面授 (20151014) blogWord專業文件排版:第3堂面授 (20151014) blog
Word專業文件排版:第3堂面授 (20151014) blogYung-Ting Chen
 
Word專業文件排版:第2堂面授 (20150923) blog
Word專業文件排版:第2堂面授 (20150923) blogWord專業文件排版:第2堂面授 (20150923) blog
Word專業文件排版:第2堂面授 (20150923) blogYung-Ting Chen
 
Apache solr教學介紹 20150501
Apache solr教學介紹 20150501Apache solr教學介紹 20150501
Apache solr教學介紹 20150501Yung-Ting Chen
 
20161110 行為分析之對數線性模式 blog
20161110 行為分析之對數線性模式 blog20161110 行為分析之對數線性模式 blog
20161110 行為分析之對數線性模式 blogYung-Ting Chen
 
20161027 行為分析之時間序列分析 public
20161027 行為分析之時間序列分析   public20161027 行為分析之時間序列分析   public
20161027 行為分析之時間序列分析 publicYung-Ting Chen
 
簡易文本語義分類入門 (20170331)
簡易文本語義分類入門 (20170331)簡易文本語義分類入門 (20170331)
簡易文本語義分類入門 (20170331)Yung-Ting Chen
 
國際會議經驗分享 20171013 blog
國際會議經驗分享 20171013   blog國際會議經驗分享 20171013   blog
國際會議經驗分享 20171013 blogYung-Ting Chen
 

More from Yung-Ting Chen (20)

論文神器+ChatGPT - blog - 2023.pptx
論文神器+ChatGPT - blog - 2023.pptx論文神器+ChatGPT - blog - 2023.pptx
論文神器+ChatGPT - blog - 2023.pptx
 
大數據時代下的文本分析 - 22 dils text.pptx
大數據時代下的文本分析 - 22 dils text.pptx大數據時代下的文本分析 - 22 dils text.pptx
大數據時代下的文本分析 - 22 dils text.pptx
 
人工智慧的可解釋性 - blog - 2023.pptx
人工智慧的可解釋性 - blog - 2023.pptx人工智慧的可解釋性 - blog - 2023.pptx
人工智慧的可解釋性 - blog - 2023.pptx
 
Introduction to TextRank - 22.pptx
Introduction to TextRank - 22.pptxIntroduction to TextRank - 22.pptx
Introduction to TextRank - 22.pptx
 
Subgroup-Discovery-2021.pptx
Subgroup-Discovery-2021.pptxSubgroup-Discovery-2021.pptx
Subgroup-Discovery-2021.pptx
 
1. introduction of weka
1. introduction of weka1. introduction of weka
1. introduction of weka
 
4. applications
4. applications4. applications
4. applications
 
3. classification and regression
3. classification and regression3. classification and regression
3. classification and regression
 
2. clustering and association rule mining
2. clustering and association rule mining2. clustering and association rule mining
2. clustering and association rule mining
 
20180518 pbl
20180518 pbl20180518 pbl
20180518 pbl
 
20180518 kals
20180518 kals20180518 kals
20180518 kals
 
Word專業文件排版:第8堂面授 (20151223) blog
Word專業文件排版:第8堂面授 (20151223) blogWord專業文件排版:第8堂面授 (20151223) blog
Word專業文件排版:第8堂面授 (20151223) blog
 
Word專業文件排版:第6堂面授 (20151202) blog
Word專業文件排版:第6堂面授 (20151202) blogWord專業文件排版:第6堂面授 (20151202) blog
Word專業文件排版:第6堂面授 (20151202) blog
 
Word專業文件排版:第3堂面授 (20151014) blog
Word專業文件排版:第3堂面授 (20151014) blogWord專業文件排版:第3堂面授 (20151014) blog
Word專業文件排版:第3堂面授 (20151014) blog
 
Word專業文件排版:第2堂面授 (20150923) blog
Word專業文件排版:第2堂面授 (20150923) blogWord專業文件排版:第2堂面授 (20150923) blog
Word專業文件排版:第2堂面授 (20150923) blog
 
Apache solr教學介紹 20150501
Apache solr教學介紹 20150501Apache solr教學介紹 20150501
Apache solr教學介紹 20150501
 
20161110 行為分析之對數線性模式 blog
20161110 行為分析之對數線性模式 blog20161110 行為分析之對數線性模式 blog
20161110 行為分析之對數線性模式 blog
 
20161027 行為分析之時間序列分析 public
20161027 行為分析之時間序列分析   public20161027 行為分析之時間序列分析   public
20161027 行為分析之時間序列分析 public
 
簡易文本語義分類入門 (20170331)
簡易文本語義分類入門 (20170331)簡易文本語義分類入門 (20170331)
簡易文本語義分類入門 (20170331)
 
國際會議經驗分享 20171013 blog
國際會議經驗分享 20171013   blog國際會議經驗分享 20171013   blog
國際會議經驗分享 20171013 blog
 

2. 看穿因果:熱點分析 - 2021.pptx

Editor's Notes

  1. 課程編輯網頁 https://docs.google.com/document/d/1XiSkOSbaqEzFC7X_-Q1FewS-9Hhw2a_pjGfKv9uGvMI/edit# W14 分類與預測:貝氏網路 https://docs.google.com/presentation/d/1fXzH2xWUigsy8bD8usxrO4V9fPW8xjAdtEHU6_Jui3A/edit?usp=sharing 文本探勘 http://l.pulipuli.info/19/ncku-tm 活動說明網頁 https://docs.google.com/document/d/1QuApzboOkpHZjEBe0Q7uruOqh6xlDB4sHNIXVZ9oQdk/edit 90分鐘+90分鐘 13:00 - 14:30 WEKA簡介與實作-1 陳勇汀 老師/ 洪麗娟 督導長 開放(內含儲備資訊護理師6名) 14:30 - 14:40 休息 14:40 - 16:20 WEKA簡介與實作-2 陳勇汀 老師/ 洪麗娟 督導長 開放(內含儲備資訊護理師6名)
  2. 如何探索資料 的共同模式?
  3. 如何探索資料 的共同模式?
  4. 如何探索資料 的共同模式?
  5. 先為重要的選項標亮
  6. 如何探索資料 的共同模式?
  7. http://blog.pulipuli.info/2017/08/wekahotspot-association-rule-mining.html https://www.vectorstock.com/royalty-free-vector/baby-diaper-icon-flat-style-vector-7902069 https://www.vectorstock.com/royalty-free-vector/beer-bottle-template-in-modern-flat-style-icon-on-vector-14974267
  8. 資料夾 切割一部分 計算評估指標
  9. 要有四個指標的英文簡稱與考慮項目
  10. http://blog.pulipuli.info/2017/08/wekahotspot-association-rule-mining.html
  11. http://blog.pulipuli.info/2017/08/wekahotspot-association-rule-mining.html
  12. 公式的部分
  13. 公式的部分
  14. 公式的部分 support -- The minimum support. Values between 0 and 1 are interpreted as a percentage of the total population; values > 1 are interpreted as an absolute number of instances
  15. 如何探索資料 的共同模式?
  16. https://www.albertaprimetimes.com/opinion/why-young-people-dont-watch-tv-the-old-way-2044909
  17. 外部 內部
  18. 內部 多個屬性之間構成了更複雜的規則 用圖示表示
  19. 設定細節
  20. 設定細節
  21. 設定細節
  22. 先為重要的選項標亮