SlideShare a Scribd company logo
1 of 72
Download to read offline
資料分析的快樂(?)
就是如此樸實無華且枯燥
Bryan Yang 2020/06/19
Agenda
● 如何看懂一張圖
● 只要加減乘除就能學會的基本統計值
● 化繁為簡的圖表呈現
● 由淺入深的資料挖掘
● 起承轉合說個好故事
案例一:如何表達時間序列
A Finding
圖表標題
X 軸
Y
軸
圖例 資料來源
補
充
說
明
補
充
說
明
頁數
圖表標題
X 軸
Y
軸
圖例 資料來源
補
充
說
明
補
充
說
明
頁數
X 軸
Y
軸
圖例 資料來源
補
充
說
明
補
充
說
明
頁數
圖例 資料來源
補
充
說
明
補
充
說
明
頁數
資料來源
補
充
說
明
補
充
說
明
頁數
補
充
說
明
補
充
說
明
頁數
頁數
累積人數
各種累積人數
請問:
1. 圖表想要表達什麼?
2. 如何解釋呈現的資料?
3. 上面兩件事情能搭在一起嗎?
下標是否與意圖及圖表配合?
確診人數增加速度減緩
病患康復情況良好
確診人數與出院個案數差異逐漸減少
Attention: 有沒有其他呈現方式?
各種累積人數 -> 單日新增人數
案例二:如何表達比例
1:1 1:2
比例-先搞清楚跟誰比
1 1
請問:
1. 圖表想要表達什麼?
2. 如何解釋呈現的資料?
3. 上面兩件事情能搭在一起嗎?
Attention: 如何呈現比例?
真實的比例會是這樣
案例三:與受眾溝通
Attention: 這樣講大家就理解了?
名詞解釋的解釋 - 比較數值高低的差異
● 當敏感性越高,越能減少偽陰性的比例;特異性越高,越能減少偽陽性的比例。
名詞解釋的解釋 - 舉例
● 當敏感性越高,越能減少偽陰性的比例。也就是說當你被檢驗出陽性時,真正確
診的機率越高。
● 特異性越高,越能減少偽陽性的比例。也就是說,當你檢驗出陰性時,就是真的
沒事的機率越高。
名詞解釋的解釋 - 試算
名詞解釋的解釋的解釋
1
2
3 4
5
案例四:平均一顆蛋蛋
你會去哪家公司?
A
48,000
B
48,000
資料分佈可能比平均值更重要
案例五:資料呈現
請問:
1. 圖表想要表達什麼?
2. 如何解釋呈現的資料?
3. 上面兩件事情能搭在一起嗎?
Attention: 如何整理資訊?
Attention: 貪心是大忌
案例六:從零開始做一份報告?
流程
聽眾是誰 決定主題 蒐集資料 草擬大綱 製圖
根據聽眾屬性決定口氣和深度
你/同事
老闆
直屬 客戶用戶
跨部門 同業
老師股東
權力
淺 <- 領域專業 -> 深
講聽眾在意的主題
你/同事
老闆
直屬 客戶用戶
跨部門 同業
老師股東
資料蒐集
● 私有 <> 公開
● 難整理 <> 好整理
● 難取得 <> 容易取得
● 個資 <> 去識別資料
● 原始資料 <> 整理過資料
大綱整理心法(一)演繹與歸納
https://dyzo.consulting/3535/
大綱心法(二)A/B 測試
大綱常用套路(一)由古至今
大綱常用套路(二)由廣至深
全球經濟概況
台灣經濟概況
台灣房市概況
台灣房市不合理
大綱常用套路(三)各種比較各種傷害
● 跨版本比較
● 跨平台比較
● 一天不同時段比較
● 週間/週末比較
● WOW/ MOM/ YOY 比較
● 不同階段轉換率比較
● 競品比較
● 跨國比較
製圖心法(一)不同圖表的使用時機
https://www.businesstoday.com.tw/article/category/80408/post/201903260012/不同圖表不同使用
時機,我的報表適合什麼圖形?你用對了嗎?
製圖心法(二)不要貪心
https://www.pinterest.com/pin/131800726564261154/
常見誤區
沒有區分事實與觀點
https://www.youtube.com/watch?v=aEIkL_TXzyU
先入為主 - 先指認兇手再找證據
不相信資料 - 視而不見,懷疑人生
不懷疑資料 - garbage in garbage out
整理後的資料
呈現的圖表
原始資料
資料傳送
標題
資料蒐集
資料定義
資料源
水 雜質
Any Question?
Thank you for your time
FB: 臺灣資料工程協會

More Related Content

More from Bryan Yang

敏捷開發心法
敏捷開發心法敏捷開發心法
敏捷開發心法Bryan Yang
 
Introduction to docker
Introduction to dockerIntroduction to docker
Introduction to dockerBryan Yang
 
Spark Sql for Training
Spark Sql for TrainingSpark Sql for Training
Spark Sql for TrainingBryan Yang
 
Spark MLlib - Training Material
Spark MLlib - Training Material Spark MLlib - Training Material
Spark MLlib - Training Material Bryan Yang
 
Building your bi system-HadoopCon Taiwan 2015
Building your bi system-HadoopCon Taiwan 2015Building your bi system-HadoopCon Taiwan 2015
Building your bi system-HadoopCon Taiwan 2015Bryan Yang
 
Build your ETL job using Jenkins - step by step
Build your ETL job using Jenkins - step by stepBuild your ETL job using Jenkins - step by step
Build your ETL job using Jenkins - step by stepBryan Yang
 
Data Scientist's Daily Life
Data Scientist's Daily LifeData Scientist's Daily Life
Data Scientist's Daily LifeBryan Yang
 
Introduce to Spark sql 1.3.0
Introduce to Spark sql 1.3.0 Introduce to Spark sql 1.3.0
Introduce to Spark sql 1.3.0 Bryan Yang
 

More from Bryan Yang (8)

敏捷開發心法
敏捷開發心法敏捷開發心法
敏捷開發心法
 
Introduction to docker
Introduction to dockerIntroduction to docker
Introduction to docker
 
Spark Sql for Training
Spark Sql for TrainingSpark Sql for Training
Spark Sql for Training
 
Spark MLlib - Training Material
Spark MLlib - Training Material Spark MLlib - Training Material
Spark MLlib - Training Material
 
Building your bi system-HadoopCon Taiwan 2015
Building your bi system-HadoopCon Taiwan 2015Building your bi system-HadoopCon Taiwan 2015
Building your bi system-HadoopCon Taiwan 2015
 
Build your ETL job using Jenkins - step by step
Build your ETL job using Jenkins - step by stepBuild your ETL job using Jenkins - step by step
Build your ETL job using Jenkins - step by step
 
Data Scientist's Daily Life
Data Scientist's Daily LifeData Scientist's Daily Life
Data Scientist's Daily Life
 
Introduce to Spark sql 1.3.0
Introduce to Spark sql 1.3.0 Introduce to Spark sql 1.3.0
Introduce to Spark sql 1.3.0
 

資料分析的快樂就是如此樸實無華且枯燥