資料分析的快樂(?)
就是如此樸實無華且枯燥
Bryan Yang 2020/06/19
Agenda
● 如何看懂一張圖
● 只要加減乘除就能學會的基本統計值
● 化繁為簡的圖表呈現
● 由淺入深的資料挖掘
● 起承轉合說個好故事
案例一:如何表達時間序列
A Finding
圖表標題
X 軸
Y
軸
圖例 資料來源
補
充
說
明
補
充
說
明
頁數
圖表標題
X 軸
Y
軸
圖例 資料來源
補
充
說
明
補
充
說
明
頁數
X 軸
Y
軸
圖例 資料來源
補
充
說
明
補
充
說
明
頁數
圖例 資料來源
補
充
說
明
補
充
說
明
頁數
資料來源
補
充
說
明
補
充
說
明
頁數
補
充
說
明
補
充
說
明
頁數
頁數
累積人數
各種累積人數
請問:
1. 圖表想要表達什麼?
2. 如何解釋呈現的資料?
3. 上面兩件事情能搭在一起嗎?
下標是否與意圖及圖表配合?
確診人數增加速度減緩
病患康復情況良好
確診人數與出院個案數差異逐漸減少
Attention: 有沒有其他呈現方式?
各種累積人數 -> 單日新增人數
案例二:如何表達比例
1:1 1:2
比例-先搞清楚跟誰比
1 1
請問:
1. 圖表想要表達什麼?
2. 如何解釋呈現的資料?
3. 上面兩件事情能搭在一起嗎?
Attention: 如何呈現比例?
真實的比例會是這樣
案例三:與受眾溝通
Attention: 這樣講大家就理解了?
名詞解釋的解釋 - 比較數值高低的差異
● 當敏感性越高,越能減少偽陰性的比例;特異性越高,越能減少偽陽性的比例。
名詞解釋的解釋 - 舉例
● 當敏感性越高,越能減少偽陰性的比例。也就是說當你被檢驗出陽性時,真正確
診的機率越高。
● 特異性越高,越能減少偽陽性的比例。也就是說,當你檢驗出陰性時,就是真的
沒事的機率越高。
名詞解釋的解釋 - 試算
名詞解釋的解釋的解釋
1
2
3 4
5
案例四:平均一顆蛋蛋
你會去哪家公司?
A
48,000
B
48,000
資料分佈可能比平均值更重要
案例五:資料呈現
請問:
1. 圖表想要表達什麼?
2. 如何解釋呈現的資料?
3. 上面兩件事情能搭在一起嗎?
Attention: 如何整理資訊?
Attention: 貪心是大忌
案例六:從零開始做一份報告?
流程
聽眾是誰 決定主題 蒐集資料 草擬大綱 製圖
根據聽眾屬性決定口氣和深度
你/同事
老闆
直屬 客戶用戶
跨部門 同業
老師股東
權力
淺 <- 領域專業 -> 深
講聽眾在意的主題
你/同事
老闆
直屬 客戶用戶
跨部門 同業
老師股東
資料蒐集
● 私有 <> 公開
● 難整理 <> 好整理
● 難取得 <> 容易取得
● 個資 <> 去識別資料
● 原始資料 <> 整理過資料
大綱整理心法(一)演繹與歸納
https://dyzo.consulting/3535/
大綱心法(二)A/B 測試
大綱常用套路(一)由古至今
大綱常用套路(二)由廣至深
全球經濟概況
台灣經濟概況
台灣房市概況
台灣房市不合理
大綱常用套路(三)各種比較各種傷害
● 跨版本比較
● 跨平台比較
● 一天不同時段比較
● 週間/週末比較
● WOW/ MOM/ YOY 比較
● 不同階段轉換率比較
● 競品比較
● 跨國比較
製圖心法(一)不同圖表的使用時機
https://www.businesstoday.com.tw/article/category/80408/post/201903260012/不同圖表不同使用
時機,我的報表適合什麼圖形?你用對了嗎?
製圖心法(二)不要貪心
https://www.pinterest.com/pin/131800726564261154/
常見誤區
沒有區分事實與觀點
https://www.youtube.com/watch?v=aEIkL_TXzyU
先入為主 - 先指認兇手再找證據
不相信資料 - 視而不見,懷疑人生
不懷疑資料 - garbage in garbage out
整理後的資料
呈現的圖表
原始資料
資料傳送
標題
資料蒐集
資料定義
資料源
水 雜質
Any Question?
Thank you for your time
FB: 臺灣資料工程協會

資料分析的快樂就是如此樸實無華且枯燥