SlideShare a Scribd company logo
群聚資料
—以氣象資料計算為例例
嘉義⼤大學⽣生物資源學系 林林政道
mutolisp@mail.ncyu.edu.tw
睡前床邊R故事
什什麼是群聚? 先從分類開始
這裡有⼀一些圖形,你會怎麼分類?
按照形狀狀排列列⼀一下
5 個 6 個 4 個
Group C
Group T
Group R
來來看⼀一下資料
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1
Duster 360 14.3 8 360.0 245 3.21 3.570 15.84 0 0 3 4
Merc 240D 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2
Merc 230 22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2
Merc 280 19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4
Merc 280C 17.8 6 167.6 123 3.92 3.440 18.90 1 0 4 4
Merc 450SE 16.4 8 275.8 180 3.07 4.070 17.40 0 0 3 3
Merc 450SL 17.3 8 275.8 180 3.07 3.730 17.60 0 0 3 3
Merc 450SLC 15.2 8 275.8 180 3.07 3.780 18.00 0 0 3 3
Cadillac Fleetwood 10.4 8 472.0 205 2.93 5.250 17.98 0 0 3 4
Lincoln
Continental
10.4 8 460.0 215 3.00 5.424 17.82 0 0 3 4
R 內建的 mtcars
汽⾞車車型號
規格
mtcars 汽⾞車車各項欄欄位說明
mpg Miles/(US) gallon 油耗(英哩/加侖)
cyl Number of cylinders 汽缸數
disp Displacement (cu.in.) 排氣量量(立⽅方英吋)
hp Gross horsepower 淨⾺馬⼒力力
drat Rear axle ratio 後輪輪軸比
wt Weight (1000 lbs) 重量量 (1000 磅)
qsec 1/4 mile time 加速⾄至 1/4 英哩時間
vs V/S 汽缸排列列: V 型或直列列式 (欸,沒有⽔水平對臥!)
am Transmission (0 = automatic, 1 = manual) 變速系統 (0 = ⾃自排, 1 = ⼿手排)
gear Number of forward gears 驅動輪輪數量量
carb Number of carburetors 化油器數量量
我想知道,不同汽缸的
平均⾺馬⼒力力數是多少?
• 傳統上可以這樣做:使⽤用 aggregate function
aggregate(data, by, function)
資料 根據哪個欄欄位
(需要使⽤用list)
⽤用什什麼⽅方式計算
不同汽缸的平均⾺馬⼒力力數是多少?
*)如果在資料庫SQL中,aggregate function 通常稱為 group by
> aggregate(mtcars$hp, by=list(cyl),
+ FUN=mean, omit.na=T)
Group.1 x
1 4 82.63636
2 6 122.28571
3 8 209.21429
同樣的觀念念,使⽤用
data.table 的⽅方式來來做
data.table 的⽤用法
aggregate(i, j, by)
i 列列、j ⾏行行、group by
> library(data.table)
> mtcars.dt <- data.table::as.data.table(mtcars)
> mtcars.dt[, mean(hp, na.rm = T), by = cyl]
cyl V1
1: 6 122.28571
2: 4 82.63636
3: 8 209.21429
接下來來看⼀一下氣象資料
氣象資料的特性
• 中央氣象局局屬測站通常⼀一個⼩小時會觀測⼀一次
• 例例如逐時觀測氣溫、濕度、雨量量等資料
如果要計算⼀一天的平均氣溫、最⾼高
溫、最低溫等,要怎麼計算?
• ⼀一樣使⽤用群聚的觀念念,把⼀一整天當成⼀一組資料,再個
別計算其平均、最⼤大值、最⼩小值等
https://git.io/vSDHI範例例

More Related Content

More from Chengtao Lin

Taqm yunlin
Taqm yunlinTaqm yunlin
Taqm yunlin
Chengtao Lin
 
Forest ecology — Vegetation classification and analysis
Forest ecology — Vegetation classification and analysisForest ecology — Vegetation classification and analysis
Forest ecology — Vegetation classification and analysis
Chengtao Lin
 
QGIS第三講—地圖展示與匯出
QGIS第三講—地圖展示與匯出QGIS第三講—地圖展示與匯出
QGIS第三講—地圖展示與匯出
Chengtao Lin
 
QGIS第二講 — 向量處理(1) 地理空間運算工具
QGIS第二講 — 向量處理(1) 地理空間運算工具QGIS第二講 — 向量處理(1) 地理空間運算工具
QGIS第二講 — 向量處理(1) 地理空間運算工具
Chengtao Lin
 
QGIS第一講 數位化向量地圖
QGIS第一講 數位化向量地圖QGIS第一講 數位化向量地圖
QGIS第一講 數位化向量地圖
Chengtao Lin
 
使用 zotero 做文獻管理及引用(1)
使用 zotero 做文獻管理及引用(1)使用 zotero 做文獻管理及引用(1)
使用 zotero 做文獻管理及引用(1)Chengtao Lin
 

More from Chengtao Lin (6)

Taqm yunlin
Taqm yunlinTaqm yunlin
Taqm yunlin
 
Forest ecology — Vegetation classification and analysis
Forest ecology — Vegetation classification and analysisForest ecology — Vegetation classification and analysis
Forest ecology — Vegetation classification and analysis
 
QGIS第三講—地圖展示與匯出
QGIS第三講—地圖展示與匯出QGIS第三講—地圖展示與匯出
QGIS第三講—地圖展示與匯出
 
QGIS第二講 — 向量處理(1) 地理空間運算工具
QGIS第二講 — 向量處理(1) 地理空間運算工具QGIS第二講 — 向量處理(1) 地理空間運算工具
QGIS第二講 — 向量處理(1) 地理空間運算工具
 
QGIS第一講 數位化向量地圖
QGIS第一講 數位化向量地圖QGIS第一講 數位化向量地圖
QGIS第一講 數位化向量地圖
 
使用 zotero 做文獻管理及引用(1)
使用 zotero 做文獻管理及引用(1)使用 zotero 做文獻管理及引用(1)
使用 zotero 做文獻管理及引用(1)
 

R aggregate data