SlideShare a Scribd company logo
A day in the library:
Introduction to R
Oleh:
Dasapta Erwin Irawan
@dasaptaerwin
ITB Central Library
26 Mei 2015
Pendahuluan
Siapa saya?
Dosen KK Geologi Terapan, FITB, ITB
Mengajar di: Prodi S1 Teknik Geologi dan S2 Teknik Air Tanah
Media sosial: @dasaptaerwin, +Dasapta Erwin Irawan
Lisensi dokumen
Dengan menyebutkan penulis dan dokumen ini dalam Daftar
Pustaka, anda boleh:
memperbanyak, menyebarkan, memodifikasi sebagian atau seluruh
dokumen ini,
untuk kegiatan non-komersial.
Sumber
Beberapa bagian dari paparan ini diadaptasi dari:
Slide Coursera RD.Peng: R.D. Peng on Github
Slide Coursera Data Specialization oleh J.T. Leek: Data
Specialization
Slide tutorial Kevin Markham: Kevin Markham on Github
Website Quick R Tutorial
Website R Introduction to Statistics
Website saya R from Dummies
dll
Data
Data yang disertakan dalam tutorial ini adalah
BandungData.csv.
Berisi data kualitas air (major element) air S. Cikapundung dan
air tanah di bantaran sungainya.
Apakah R?
Apakah R?
Alfabet ke-18
Apakah R?
R adalah bahasa pemrograman (statistik) yang dikembangkan
dari Bahasa S.
S ditulis pada tahun 1976 (saya lahir) oleh John Chambers dkk
di Bell Labs.
S awalnya ditulis sebagai library statistik Bahasa Fortran.
S pada tahun 1988 mulai ditulis ulang dengan Bahasa C++,
hingga kemudian menjadi R yang kita kenal sekarang.
Mengapa R?
Free dan Lightweight: free as breathing yang diperlukan
hanya koneksi internet, ukuran installer R base < 70 MB, R
Studio < 60 MB. (Bandingkan dengan SPSS, Matlab)
(Bandingkan dengan SPSS, Matlab)
Cross platform: R tersedia untuk Linux, Mac, dan (tentunya)
Windows. (Sebagian besar Windows only)
Peran komunitas open source: sangat aktif, mailing lists, R
Stack Overflow, Youtube, dll.
Mengapa R cocok untuk engineer?
Reproducibility: semua yang ditulis dengan R bisa diulang
oleh orang lain untuk diperbaiki dan dikembangkan. Karena
basisnya open source, maka semangat saling berbagi diantara
pemakai R sangat tinggi.
Terstruktur: basis command line, memang sulit pada awalnya,
tapi membuat analisis lebih terstruktur, tiap langkah dapat
didokumentasikan dengan memberi komentar dll.
Visualisasi: R dapat menghasilkan grafis yang sangat bagus
dan plot yang fully-customizeable. Banyak output grafik yang
tidak dapat dibuat dengan piranti lunak spreadsheet
konvensional.
Mengapa R cocok untuk non-programmer?
Mudah: sudah banyak tutorial dilengkapi codenya di internet,
tinggal mengetik how to .... in R.
Sederhana: syntax penulisan kode sederhana, berbasis obyek.
Pengembangan intensif: R dapat dikembangkan melalui >
4000 R packages, bahkan untuk web-authoring, web-scraping,
analisis spasial, dll.
Memulai R
Karakter R
case sensitive
command line
what you mean is what you get
Karakter R 2
R base telah memiliki perbendaharaan fungsi yang sangat kaya
Beberapa package juga telah dimasukkan ke dalam R base
Pengembangan package tujuannya untuk:
memudahkan dan menyingkat kode, misal: dari 10 baris
menjadi tiga baris saja
meningkatkan kualitas grafis
Karakter R 3
Jadi jangan heran kalau anda telah fasih menjalankan satu proses,
kemudian dengan perkembangan baru, baris kode anda menjadi
tidak optimal (terlalu panjang).
Komponen R
Sebelum ke tahap instalasi, kita kenali dulu komponen R yang
terdiri dari:
R base atau R core
R IDE
R packages
R base atau R core
Inti dari R, full functionality.
Jendela script, console, proses, dan output terpisah.
Unduh installer dari Server CRAN. Mirrors di Indonesia:
Mirror BPPT
Mirror Uni Jember
R IDE (Integrated Development Environment)
Ada R Studio atau R Commander.
Jendela script, console, proses, dan output menyatu.
Unduh installer dari Website RStudio
Jendela R base
Jendela R Studio
R packages
Pengembangan dari fungsi-fungsi R base dikemas sebagai R
packages.
Saat ini ada lebih dari 4000 packages di sini yang telah
terklasifikasi klik menu Task Views, diantaranya:
Spasial
Timeseries
Lingkungan
bahkan Medis
R packages 2
Beberapa packages yang sangat fungsional dari pengembang
individu dapat dimasukkan ke dalam fungsi dasar R base versi
berikutnya, misal: utils, stats, datasets, graphics,
grDevices, grid, methods, tools, parallel, compiler, splines,
tcltk, stats4.
R packages 3
Beberapa packages yang sering saya pakai, diantaranya:
cluster, foreign, mgcv, rpart, spatial, dll.
Beberapa package yang dikembangkan oleh ahli biologi dan
lingkungan, dapat diunduh dari Website Bioconductor Project
Atau dari individu langsung via repo Github. Perlu
menginstalasi devtools package
R packages 4
Package harus diunduh dan diinstalasi terlebih dahulu dengan
perintah:
install.packages("packageName")
Kemudian package harus dimuat ke memory dengan perintah:
library(packageName)
atau
require(packageName)
Instalasi
Sekarang mulailah “pekerjaan kotor kita”, yaitu menginstalasi R ke
dalam PC atau laptop kita. Untuk itu coba perhatikan beberapa hal
berikut ini:
Spesifikasi komputer/laptop: Tidak ada spesifikasi khusus
untuk R, tetapi prinsip utamanya adalah makin besar data yang
anda gunakan, makin kompleks analisis yang anda lakukan,
akan memerlukan spesifikasi prosesor dan RAM yang makin
besar. Jadi ini akan sangat bergantung kepada kebutuhan anda.
Untuk keperluan pembelajaran gunakan saja komputer yang
anda miliki sekarang.
Sistem operasi (OS): Seperti yang telah saya sampaikan
sebelumnya, R berjalan di semua OS: Linux (bisa Ubuntu,
Fedora dll), Mac OS, dan tentunya Windows. Jangan kuatir,
yang manapun OS yang anda pakai, spesifikasi R nya akan
sama persis.
Instalasi 2
Apa saja yang perlu anda unduh dan install:
R base: Inti dari R.
Kunjungi Situs R Project
Pilih mirror server. Pilih server yang ada di Indonesia. Klik
CRAN mirror di dalam kotak “Getting Started”. Cari server di
Indonesia. Ada dua, silahkan anda pilih:
Server BPPT
Server Universitas Jember
Setelah server CRAN-BPPT terbuka, klik versi R sesuai dengan
OS yang anda miliki.
Instalasi 3
R Studio: lingkungan pemrograman.
Kunjungi Situs R Studio
Klik menu Products > RStudio > klik tombol Download
RStudio Desktop. Secara otomatis R Studio akan membaca
OS yang anda pakai dan proses pengunduhan akan segera
dimulai.
Instalasi 4
Atau anda bisa langsung buka halaman
http://www.rstudio.com/products/rstudio/download/,
Pilih versi RStudio.
Pilihan installer yang ada per tanggal 04 September 2014
adalah:
RStudio 0.98.1049 - Windows XP/Vista/7/8 ukuran file 48.2
MB tanggal update 2014-09-02
RStudio 0.98.1049 - Mac OS X 10.6+ (64-bit) ukuran file 37.8
MB tanggal update 2014-09-02
RStudio 0.98.1049 - Debian 6+/Ubuntu 10.04+ (32-bit)
ukuran file 56.3 MB tanggal update 2014-09-02
Instalasi 5
RStudio 0.98.1049 - Debian 6+/Ubuntu 10.04+ (64-bit)
ukuran file 58 MB tanggal update 2014-09-02
RStudio 0.98.1049 - Fedora 13+/openSUSE 11.4+ (32-bit)
ukuran file 56.6 MB tanggal update 2014-09-02
RStudio 0.98.1049 - Fedora 13+/openSUSE 11.4+ (64-bit)
ukuran file 57.9 MB tanggal update 2014-09-02
Instalasi 6
Setelah proses pengunduhan selesai, jalankan file program
instalasinya:
Untuk Linux: jalankan file xRstudioxx.deb dan ikuti
perintahnya
Untuk Mac OSX: jalankan file xRstudioxx.dmg dan ikuti
perintahnya
Untuk Windows: jalankan file xRstudioxx.exe dan ikuti
perintahnya
Bekerja dengan R
Format data
format database:
kasus/sampel dalam baris
variable/parameter/pengukuran dalam kolom
tanpa judul tabel dan aksesori lainnya
Format data 2
dulu data harus format text/ASCII bukan binary (xls, xlsx, dll),
misal:
txt
csv (comma separated values)
dengan fungsi dasar R
Format data 3
sekarang dengan fungsi dari package tambahan, seperti
foreign, read.table, readxl, R dapat meng-import
berbagai format file text maupun binary, misal:
xls, xlsx (Ms Office)
sav (SPPS)
dta (Stata)
odt (LibreOffice)
Format data 4
Memuat data ke dalam R
data <- read.csv("BandungData.csv", header = TRUE)
attach(data)
## The following object is masked from package:datasets:
##
## CO2
Dimensi data
dim(data)
## [1] 295 34
Jenis data
str(data)
## 'data.frame': 295 obs. of 34 variables:
## $ no : int 16 22 263 17 12 18 13 19 14 20 ...
## $ code : int 116 122 8 117 112 118 113 119 114 120 .
## $ year : int 1997 1997 1997 1997 1997 1997 1997 1997
## $ type : Factor w/ 2 levels "groundwater",..: 1 1 2 1
## $ x : num 785175 785168 799275 785175 785181 ...
## $ y : num 10752836 10752843 10753680 10752840 107
## $ distx : num 6897 6904 0 6897 6891 ...
## $ elv : int 1338 1336 1336 1320 1300 1247 1240 1230
## $ aq : Factor w/ 3 levels "breccias","clay",..: 3 3
## $ zone : Factor w/ 2 levels "eff","inf": 1 1 1 1 1 1
## $ ec : num 71.9 71.9 77 71.9 71.9 71.9 71.9 71.9 7
## $ ph : num 6.89 6.89 6.39 6.89 6.89 ...
## $ hard : num 11 11 26.4 11 11 11 11 11 11 11 ...
## $ tds : num 58.7 58.7 50 58.7 58.7 ...
## $ temp : num 21 21 16.1 21 21 ...
Beberapa contoh visualisasi dan analisis dengan
fungsi dasar R
Scatter plot
plot(tds, temp,
xlab = "tds (ppm)",
ylab = "temp (^oC)",
bg = "lightblue",
col = "black",
cex = 1.1,
pch = 21,
frame = FALSE)
abline(lm(tds~temp), col="red") # regression line (y~x)
lines(lowess(tds,temp), col="blue") # lowess line (x,y)
Note: semua yang diketik di belakang simbol # tidak dieksekusi oleh
R, disebut comment. Biasa digunakan untuk memberi penjelasan
baris atau kelompok baris kode.
Scatter plot 2
0 200 400 600 800 1000 1200
1520253035
tds (ppm)
temp(C)
Mengapa garis regresi tidak diagonal?
Histogram
hist(tds, col="red")
Histogram of tds
tds
Frequency
0 200 400 600 800 1000 1200
020406080
Multiple Histogram 2
par(mfrow=c(1,3))
hist(tds, col="red")
hist(ph, col="green")
hist(hard, col="blue")
Histogram of tds
tds
Frequency
0 400 1000
020406080
Histogram of ph
ph
Frequency
5 6 7 8 9
020406080100
Histogram of hard
hard
Frequency
0 40 80
050100150
Multiple Histogram 3
par(mfrow=c(2,2))
hist(tds, col="cyan")
hist(ph, col="magenta")
hist(hard, col="yellow")
hist(eh, col="blue")
Histogram of tds
tds
Frequency
0 200 600 1000
060
Histogram of ph
ph
Frequency
5 6 7 8 9
060
Histogram of hard
Frequency
0150
Histogram of eh
Frequency
080
Analisis regresi
Berikut contoh perintah untuk mengetahui koef dan intercept
persamaan regresi.
fit <- lm(tds ~ temp, data = data)
coef(fit)
Analisis regresi 2
fit <- lm(data$tds ~ data$temp, data = data)
coef(fit)
## (Intercept) data$temp
## -650.96402 37.93123
Pairs analysis
Untuk memvisualisasikan matriks korelasi.
group1 <- data[,c("x", "y", "elv", "aq", "ec", "ph",
"hard", "tds", "temp", "eh", "Q")]
pairs(group1,labels=colnames(group1),
main="Physical parameter",
pch=21, bg=c("red", "blue")
[unclass(data$type)],
upper.panel=NULL)
legend(x=0.6, y=0.8, levels(data$type),
pt.bg=c("red", blue"),
pch=21,
bty="n",
ncol=2,
horiz=F)
Pairs analysis 2
700 900 1100 1300
7001000
elv
5678
ph
04080
hard
04001000
tds
152535
temp
700 900 1100 1300
048
5 6 7 8 0 20 40 60 80 0 400 800 1200 15 20 25 30 35 0 2 4 6 8 10
048
Q
Physical parameter
groundwater river
Multiple linear regression
Misal:
Apakah tds merupakan fungsi linear dari unsur Ca, Mg, dan Fe?
atau tds adalah fungsi dari unsur HCO3, CO3, SO4, Cl?
Multiple linear regression 2
fit <- lm(tds ~ Ca + Mg + Fe, data=data)
summary(fit)
##
## Call:
## lm(formula = tds ~ Ca + Mg + Fe, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -352.11 -57.96 -29.36 36.98 835.27
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 77.7128 12.3875 6.273 1.28e-09 ***
## Ca 2.8913 0.4657 6.209 1.84e-09 ***
## Mg 11.2824 1.2024 9.384 < 2e-16 ***
## Fe -43.5776 33.5691 -1.298 0.195
Multiple linear regression 3
fit2 <- lm(tds ~ HCO3 + CO3 + SO4 + Cl, data=data)
summary(fit2)
##
## Call:
## lm(formula = tds ~ HCO3 + CO3 + SO4 + Cl, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -369.64 -37.61 -23.53 24.36 688.83
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 55.08578 10.67173 5.162 4.55e-07 ***
## HCO3 0.77447 0.06993 11.075 < 2e-16 ***
## CO3 1.13775 0.73530 1.547 0.123
## SO4 1.47805 0.25607 5.772 2.01e-08 ***
Multiple linear regression 4
anova(fit, fit2)
## Analysis of Variance Table
##
## Model 1: tds ~ Ca + Mg + Fe
## Model 2: tds ~ HCO3 + CO3 + SO4 + Cl
## Res.Df RSS Df Sum of Sq F Pr(>F)
## 1 291 4246450
## 2 290 2778559 1 1467891 153.2 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1
PCA
# Prepare Data
mydata <- data[,c("elv", "ph",
"hard", "tds", "temp", "Q")]
mydata <- na.omit(mydata) # listwise deletion of missing
mydata <- scale(mydata)
# run PCA
fit <- princomp(mydata, cor=TRUE)
PCA 2
summary(fit) # print variance accounted for
## Importance of components:
## Comp.1 Comp.2 Comp.3
## Standard deviation 1.3597606 1.1297573 0.9700609 0.8
## Proportion of Variance 0.3081582 0.2127253 0.1568364 0.1
## Cumulative Proportion 0.3081582 0.5208834 0.6777198 0.8
## Comp.6
## Standard deviation 0.66931040
## Proportion of Variance 0.07466273
## Cumulative Proportion 1.00000000
PCA 3
loadings(fit) # pc loadings
##
## Loadings:
## Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6
## elv 0.488 -0.133 0.800 0.132 -0.294
## ph -0.111 0.687 0.709
## hard 0.250 0.368 -0.791 -0.395 0.141
## tds -0.605 -0.206 0.130 -0.153 -0.737
## temp -0.561 -0.101 0.558 -0.111 0.589
## Q -0.598 -0.568 -0.159 0.537
##
## Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6
## SS loadings 1.000 1.000 1.000 1.000 1.000 1.000
## Proportion Var 0.167 0.167 0.167 0.167 0.167 0.167
## Cumulative Var 0.167 0.333 0.500 0.667 0.833 1.000
PCA 4
plot(fit,type="lines") # scree plot
fit
Variances
0.40.60.81.01.21.41.61.8
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6
PCA 5
fit$scores # the principal components
## Comp.1 Comp.2 Comp.3 Comp.4
## 1 2.555170709 4.137174e-01 -0.401835894 0.692409628
## 2 2.550748586 4.149192e-01 -0.401556057 0.685160307
## 4 2.515371607 4.245332e-01 -0.399317361 0.627165736
## 5 2.471150383 4.365508e-01 -0.396518992 0.554672522
## 6 2.353964139 4.683973e-01 -0.389103312 0.362565505
## 7 2.338486711 4.726035e-01 -0.388123883 0.337192881
## 8 2.316376099 4.786123e-01 -0.386724698 0.300946274
## 9 2.311953977 4.798140e-01 -0.386444861 0.293696952
## 10 2.305320793 4.816167e-01 -0.386025106 0.282822970
## 11 2.250044263 4.966386e-01 -0.382527144 0.192206453
## 12 2.227933651 5.026474e-01 -0.381127959 0.155959846
## 13 1.867410026 -2.616254e-01 -0.089218290 0.321085216
## 14 1.645181935 -7.239144e-01 1.219284576 0.021630346
## 16 1.105647572 -1.059011e+00 1.265951112 0.539519751
PCA 6
biplot(fit)
−0.3 −0.2 −0.1 0.0 0.1 0.2
−0.3−0.2−0.10.00.10.2
Comp.1
Comp.2
12456789101112
13
14
16
17
18
19
20
21
22
23
26
2728
30
31 32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
49
50
51
5253
54
56
57
58
60
61
63
64 65
66
6768
69
70
71
72
73
75
76
77
78
79
80
81
82
85
86
87
89
90
91
92
93949596
97
98
99
100
101
102
103
104
105
106
108
109
110111 112
113
115
116
117
119120
122
123
124
125
126
127128129130
131
132
134
135
136137
138
139
140141
144
145
146
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164 165
167
168
169170
171
172
174175
176
178
179
181
182
183
184
185
186
187
188
189
190
191
193
194
195196
197
198
199
200203
204
205
207
208
209
210
211
212213
214 215
216
217
218
219
220
221
222
223
224
226
227
228
229
230
231
233
234
235 237
238
240 241
242
243
244
245
246
247
248
249
250
252
253
254
255
256
257 258
259
262
263264
266
267
268
269
270
271
272
273
274
275276
277
278
279
280
281
282
283
285
286
287
288
289
290
292
293
294
−15 −10 −5 0 5 10
−15−10−50510
elv
ph
hard
tds
temp
Q
Cluster analysis
# Ward Hierarchical Clustering
d <- dist(as.matrix(mydata), method="euclidean") # distance
fit <- hclust(d, method="complete", members=NULL)
Cluster analysis 2
plot(fit) # display dendogram
10424219437101267286289288270287257281279278282283292293462131161621641121101111511454022910015410915716789165821081171701681741751551561602752761131061761712694435982741633634219230301055049223285512051611692592802682562722552582622662902942732642772632712312342262212092129695939479196195771362041401411531598133210382001391981494715854562032810214822026228851913878135201973221641103222159222257319121411515258233522181992787212314699150972071252481221371775721886317812414191166117971183661316470190126186185252187189246249245247691821313419351234181119160212010128867127968665718473132111291213024325025325423724123824024417276392089042217188086144227534322423545211
024681012
Cluster Dendrogram
hclust (*, "complete")
d
Height
Coba tweak grafik ini agar id sampel terbaca.
Penutup
Workshop selanjutnya
tematik: basic stats, multivariate stats, plotting, exploratory
data analysis
sharing session dari pengguna: kasus, data, kode
Slide dan kode
Slide:
format pdf tersedia di SlideShare
format ioslide tersedia di Rpubs
Kode: tersedia di Github
Media sosial
Facebook Group Indonesia R User
Me on Twitter: @dasaptaerwin
Me on G+: +Dasapta Erwin Irawan
Me on ResearchGate:
www.researchgate.net/profile/dasapta_irawan
I used Ubuntu 14.04 and R Markdown
Terimakasih

More Related Content

Similar to 3rd Workshop: Introduction to R (Institut Teknologi Bandung)

TUGAS KE II SO2 - JAMALUDIN ISHAK - 171
TUGAS KE II SO2 - JAMALUDIN ISHAK - 171TUGAS KE II SO2 - JAMALUDIN ISHAK - 171
TUGAS KE II SO2 - JAMALUDIN ISHAK - 171Tugas_SO2
 
Installasi Perangkat Jaringan Lokal (LAN) (merancang jaringan lokal, mensimul...
Installasi Perangkat Jaringan Lokal (LAN) (merancang jaringan lokal, mensimul...Installasi Perangkat Jaringan Lokal (LAN) (merancang jaringan lokal, mensimul...
Installasi Perangkat Jaringan Lokal (LAN) (merancang jaringan lokal, mensimul...
Anca Septiawan
 
Remastering Ubuntu 17.10 Dengan Ubuntu Customization Kit
Remastering Ubuntu 17.10 Dengan Ubuntu Customization KitRemastering Ubuntu 17.10 Dengan Ubuntu Customization Kit
Remastering Ubuntu 17.10 Dengan Ubuntu Customization Kit
Muhammad Yuga Nugraha
 
Install Netbeans dan JDK di Linux
Install Netbeans dan JDK di LinuxInstall Netbeans dan JDK di Linux
Install Netbeans dan JDK di Linux
Putu Shinoda
 
Slide-INF202-INF202-Slide-01.pdf
Slide-INF202-INF202-Slide-01.pdfSlide-INF202-INF202-Slide-01.pdf
Slide-INF202-INF202-Slide-01.pdf
GratechComputer
 
Java
JavaJava
Java
minmon
 
Membuat Aplikasi Todo dengan IGNSDK
Membuat Aplikasi Todo dengan IGNSDKMembuat Aplikasi Todo dengan IGNSDK
Membuat Aplikasi Todo dengan IGNSDK
Ridwan Fadjar
 
Open source
Open sourceOpen source
Open sourceEddy_TKJ
 
Cara Install Openbravo 2.50 MP 43 di Ubuntu
Cara Install Openbravo 2.50 MP 43 di UbuntuCara Install Openbravo 2.50 MP 43 di Ubuntu
Cara Install Openbravo 2.50 MP 43 di Ubuntu
Wirabumi Software
 
Internet Programming v2.0 Comp
Internet Programming v2.0 CompInternet Programming v2.0 Comp
Internet Programming v2.0 CompNurdin Al-Azies
 
Presentation dyan
Presentation dyanPresentation dyan
Presentation dyan
Dyan Restyani Safitri
 
pengenalan c+
pengenalan c+pengenalan c+
pengenalan c+aks247
 
Network simulator_handbook
Network simulator_handbookNetwork simulator_handbook
Network simulator_handbookArdi Bolang
 
Laporan ta router dhcp server
Laporan ta router dhcp serverLaporan ta router dhcp server
Laporan ta router dhcp server
Suhestin Hezztun
 
Adminserver --smk teladan
Adminserver --smk teladanAdminserver --smk teladan
Adminserver --smk teladanNoviana Sitorus
 
RPM YUM RPMForge EPEL
RPM YUM RPMForge EPELRPM YUM RPMForge EPEL
RPM YUM RPMForge EPEL
manafhsb
 

Similar to 3rd Workshop: Introduction to R (Institut Teknologi Bandung) (20)

TUGAS KE II SO2 - JAMALUDIN ISHAK - 171
TUGAS KE II SO2 - JAMALUDIN ISHAK - 171TUGAS KE II SO2 - JAMALUDIN ISHAK - 171
TUGAS KE II SO2 - JAMALUDIN ISHAK - 171
 
Installasi Perangkat Jaringan Lokal (LAN) (merancang jaringan lokal, mensimul...
Installasi Perangkat Jaringan Lokal (LAN) (merancang jaringan lokal, mensimul...Installasi Perangkat Jaringan Lokal (LAN) (merancang jaringan lokal, mensimul...
Installasi Perangkat Jaringan Lokal (LAN) (merancang jaringan lokal, mensimul...
 
Remastering Ubuntu 17.10 Dengan Ubuntu Customization Kit
Remastering Ubuntu 17.10 Dengan Ubuntu Customization KitRemastering Ubuntu 17.10 Dengan Ubuntu Customization Kit
Remastering Ubuntu 17.10 Dengan Ubuntu Customization Kit
 
Install Netbeans dan JDK di Linux
Install Netbeans dan JDK di LinuxInstall Netbeans dan JDK di Linux
Install Netbeans dan JDK di Linux
 
Slide-INF202-INF202-Slide-01.pdf
Slide-INF202-INF202-Slide-01.pdfSlide-INF202-INF202-Slide-01.pdf
Slide-INF202-INF202-Slide-01.pdf
 
Java
JavaJava
Java
 
Membuat Aplikasi Todo dengan IGNSDK
Membuat Aplikasi Todo dengan IGNSDKMembuat Aplikasi Todo dengan IGNSDK
Membuat Aplikasi Todo dengan IGNSDK
 
Routing
RoutingRouting
Routing
 
Open source
Open sourceOpen source
Open source
 
Cara Install Openbravo 2.50 MP 43 di Ubuntu
Cara Install Openbravo 2.50 MP 43 di UbuntuCara Install Openbravo 2.50 MP 43 di Ubuntu
Cara Install Openbravo 2.50 MP 43 di Ubuntu
 
Internet Programming v2.0 Comp
Internet Programming v2.0 CompInternet Programming v2.0 Comp
Internet Programming v2.0 Comp
 
Presentation dyan
Presentation dyanPresentation dyan
Presentation dyan
 
Modul latihan-c -
Modul latihan-c -Modul latihan-c -
Modul latihan-c -
 
pengenalan c+
pengenalan c+pengenalan c+
pengenalan c+
 
Network simulator_handbook
Network simulator_handbookNetwork simulator_handbook
Network simulator_handbook
 
Laporan ta router dhcp server
Laporan ta router dhcp serverLaporan ta router dhcp server
Laporan ta router dhcp server
 
Adminserver --smk teladan
Adminserver --smk teladanAdminserver --smk teladan
Adminserver --smk teladan
 
KK_17_TKJ
KK_17_TKJKK_17_TKJ
KK_17_TKJ
 
RPM YUM RPMForge EPEL
RPM YUM RPMForge EPELRPM YUM RPMForge EPEL
RPM YUM RPMForge EPEL
 
Ebook pascal.pdf
Ebook pascal.pdfEbook pascal.pdf
Ebook pascal.pdf
 

More from Dasapta Erwin Irawan

Fischer and Schminke - Pyroclastic rocks
Fischer and Schminke - Pyroclastic rocksFischer and Schminke - Pyroclastic rocks
Fischer and Schminke - Pyroclastic rocks
Dasapta Erwin Irawan
 
Mcphie - Volcanic Textures
Mcphie - Volcanic TexturesMcphie - Volcanic Textures
Mcphie - Volcanic Textures
Dasapta Erwin Irawan
 
Pentingnya Berbagi Data untuk Pengembangan Prediksi dan Pemodelan Iklim
Pentingnya Berbagi Data untuk Pengembangan Prediksi dan  Pemodelan IklimPentingnya Berbagi Data untuk Pengembangan Prediksi dan  Pemodelan Iklim
Pentingnya Berbagi Data untuk Pengembangan Prediksi dan Pemodelan Iklim
Dasapta Erwin Irawan
 
KOLOKIUM | AHMAD FAIRUZ APRISNA
KOLOKIUM | AHMAD FAIRUZ APRISNAKOLOKIUM | AHMAD FAIRUZ APRISNA
KOLOKIUM | AHMAD FAIRUZ APRISNA
Dasapta Erwin Irawan
 
Analisis Kualitas Airtanah Dengan Statistik Multivariat Untuk Identifikasi Si...
Analisis Kualitas Airtanah Dengan Statistik Multivariat Untuk Identifikasi Si...Analisis Kualitas Airtanah Dengan Statistik Multivariat Untuk Identifikasi Si...
Analisis Kualitas Airtanah Dengan Statistik Multivariat Untuk Identifikasi Si...
Dasapta Erwin Irawan
 
Identification of Anthropogenic Influences to Groundwater in Pangalengan High...
Identification of Anthropogenic Influences to Groundwater in Pangalengan High...Identification of Anthropogenic Influences to Groundwater in Pangalengan High...
Identification of Anthropogenic Influences to Groundwater in Pangalengan High...
Dasapta Erwin Irawan
 
MODEL KESESUAIAN POLA RUANG BERBASIS GEOLOGI TERINTEGRASI SOSIOEKONOMI DI KAW...
MODEL KESESUAIAN POLA RUANG BERBASIS GEOLOGI TERINTEGRASI SOSIOEKONOMI DI KAW...MODEL KESESUAIAN POLA RUANG BERBASIS GEOLOGI TERINTEGRASI SOSIOEKONOMI DI KAW...
MODEL KESESUAIAN POLA RUANG BERBASIS GEOLOGI TERINTEGRASI SOSIOEKONOMI DI KAW...
Dasapta Erwin Irawan
 
POLA INTERAKSI AIR TANAH DAN AIR PERMUKAAN SUNGAI BEJI DI WILAYAH KABUPATEN M...
POLA INTERAKSI AIR TANAH DAN AIR PERMUKAAN SUNGAI BEJI DI WILAYAH KABUPATEN M...POLA INTERAKSI AIR TANAH DAN AIR PERMUKAAN SUNGAI BEJI DI WILAYAH KABUPATEN M...
POLA INTERAKSI AIR TANAH DAN AIR PERMUKAAN SUNGAI BEJI DI WILAYAH KABUPATEN M...
Dasapta Erwin Irawan
 
Rencana Induk Pengembangan ITB 2006-2025 Roadmap
Rencana Induk Pengembangan ITB 2006-2025 RoadmapRencana Induk Pengembangan ITB 2006-2025 Roadmap
Rencana Induk Pengembangan ITB 2006-2025 Roadmap
Dasapta Erwin Irawan
 
Peta Jalan Road Map KK Geologi Terapan FITB ITB
Peta Jalan Road Map KK Geologi Terapan FITB ITBPeta Jalan Road Map KK Geologi Terapan FITB ITB
Peta Jalan Road Map KK Geologi Terapan FITB ITB
Dasapta Erwin Irawan
 
Peta Jalan Road Map KK Geologi Terapan FITB ITB
Peta Jalan Road Map KK Geologi Terapan FITB ITB Peta Jalan Road Map KK Geologi Terapan FITB ITB
Peta Jalan Road Map KK Geologi Terapan FITB ITB
Dasapta Erwin Irawan
 
FENOMENA DAS MAHAKAM
FENOMENA DAS MAHAKAMFENOMENA DAS MAHAKAM
FENOMENA DAS MAHAKAM
Dasapta Erwin Irawan
 
Curah ide pengelolaan DAS Mahakam
Curah ide pengelolaan DAS MahakamCurah ide pengelolaan DAS Mahakam
Curah ide pengelolaan DAS Mahakam
Dasapta Erwin Irawan
 
A LandSAT-driven approach to describe meander stream phenomenon in Mahakam Wa...
A LandSAT-driven approach to describe meander stream phenomenon in Mahakam Wa...A LandSAT-driven approach to describe meander stream phenomenon in Mahakam Wa...
A LandSAT-driven approach to describe meander stream phenomenon in Mahakam Wa...
Dasapta Erwin Irawan
 
DELINEATION OF FLOOD-PRONE AREAS THROUGH THE PERSPECTIVE OF RIVER HYDRAULICS
DELINEATION OF FLOOD-PRONE AREAS THROUGH THE PERSPECTIVE OF   RIVER HYDRAULICSDELINEATION OF FLOOD-PRONE AREAS THROUGH THE PERSPECTIVE OF   RIVER HYDRAULICS
DELINEATION OF FLOOD-PRONE AREAS THROUGH THE PERSPECTIVE OF RIVER HYDRAULICS
Dasapta Erwin Irawan
 
Analisis bibliometrik topik riset “overpressure”
Analisis bibliometrik topik riset “overpressure”Analisis bibliometrik topik riset “overpressure”
Analisis bibliometrik topik riset “overpressure”
Dasapta Erwin Irawan
 
KKGT-Dokumen Kebutuhan dan Formasi Jabfung
KKGT-Dokumen Kebutuhan dan Formasi JabfungKKGT-Dokumen Kebutuhan dan Formasi Jabfung
KKGT-Dokumen Kebutuhan dan Formasi Jabfung
Dasapta Erwin Irawan
 
Biodata Usulan Lektor Kepala - Dasapta Erwin Irawan
Biodata Usulan Lektor Kepala - Dasapta Erwin IrawanBiodata Usulan Lektor Kepala - Dasapta Erwin Irawan
Biodata Usulan Lektor Kepala - Dasapta Erwin Irawan
Dasapta Erwin Irawan
 
Perbaikan Keabsahan Karya Ilmiah Usulan Lektor Kepala - Dasapta Erwin Irawan
Perbaikan Keabsahan Karya Ilmiah Usulan Lektor Kepala - Dasapta Erwin IrawanPerbaikan Keabsahan Karya Ilmiah Usulan Lektor Kepala - Dasapta Erwin Irawan
Perbaikan Keabsahan Karya Ilmiah Usulan Lektor Kepala - Dasapta Erwin Irawan
Dasapta Erwin Irawan
 
Rekam Jejak Biodata Calon Lektor Kepala - Dasapta Erwin Irawan
Rekam Jejak Biodata Calon Lektor Kepala - Dasapta Erwin IrawanRekam Jejak Biodata Calon Lektor Kepala - Dasapta Erwin Irawan
Rekam Jejak Biodata Calon Lektor Kepala - Dasapta Erwin Irawan
Dasapta Erwin Irawan
 

More from Dasapta Erwin Irawan (20)

Fischer and Schminke - Pyroclastic rocks
Fischer and Schminke - Pyroclastic rocksFischer and Schminke - Pyroclastic rocks
Fischer and Schminke - Pyroclastic rocks
 
Mcphie - Volcanic Textures
Mcphie - Volcanic TexturesMcphie - Volcanic Textures
Mcphie - Volcanic Textures
 
Pentingnya Berbagi Data untuk Pengembangan Prediksi dan Pemodelan Iklim
Pentingnya Berbagi Data untuk Pengembangan Prediksi dan  Pemodelan IklimPentingnya Berbagi Data untuk Pengembangan Prediksi dan  Pemodelan Iklim
Pentingnya Berbagi Data untuk Pengembangan Prediksi dan Pemodelan Iklim
 
KOLOKIUM | AHMAD FAIRUZ APRISNA
KOLOKIUM | AHMAD FAIRUZ APRISNAKOLOKIUM | AHMAD FAIRUZ APRISNA
KOLOKIUM | AHMAD FAIRUZ APRISNA
 
Analisis Kualitas Airtanah Dengan Statistik Multivariat Untuk Identifikasi Si...
Analisis Kualitas Airtanah Dengan Statistik Multivariat Untuk Identifikasi Si...Analisis Kualitas Airtanah Dengan Statistik Multivariat Untuk Identifikasi Si...
Analisis Kualitas Airtanah Dengan Statistik Multivariat Untuk Identifikasi Si...
 
Identification of Anthropogenic Influences to Groundwater in Pangalengan High...
Identification of Anthropogenic Influences to Groundwater in Pangalengan High...Identification of Anthropogenic Influences to Groundwater in Pangalengan High...
Identification of Anthropogenic Influences to Groundwater in Pangalengan High...
 
MODEL KESESUAIAN POLA RUANG BERBASIS GEOLOGI TERINTEGRASI SOSIOEKONOMI DI KAW...
MODEL KESESUAIAN POLA RUANG BERBASIS GEOLOGI TERINTEGRASI SOSIOEKONOMI DI KAW...MODEL KESESUAIAN POLA RUANG BERBASIS GEOLOGI TERINTEGRASI SOSIOEKONOMI DI KAW...
MODEL KESESUAIAN POLA RUANG BERBASIS GEOLOGI TERINTEGRASI SOSIOEKONOMI DI KAW...
 
POLA INTERAKSI AIR TANAH DAN AIR PERMUKAAN SUNGAI BEJI DI WILAYAH KABUPATEN M...
POLA INTERAKSI AIR TANAH DAN AIR PERMUKAAN SUNGAI BEJI DI WILAYAH KABUPATEN M...POLA INTERAKSI AIR TANAH DAN AIR PERMUKAAN SUNGAI BEJI DI WILAYAH KABUPATEN M...
POLA INTERAKSI AIR TANAH DAN AIR PERMUKAAN SUNGAI BEJI DI WILAYAH KABUPATEN M...
 
Rencana Induk Pengembangan ITB 2006-2025 Roadmap
Rencana Induk Pengembangan ITB 2006-2025 RoadmapRencana Induk Pengembangan ITB 2006-2025 Roadmap
Rencana Induk Pengembangan ITB 2006-2025 Roadmap
 
Peta Jalan Road Map KK Geologi Terapan FITB ITB
Peta Jalan Road Map KK Geologi Terapan FITB ITBPeta Jalan Road Map KK Geologi Terapan FITB ITB
Peta Jalan Road Map KK Geologi Terapan FITB ITB
 
Peta Jalan Road Map KK Geologi Terapan FITB ITB
Peta Jalan Road Map KK Geologi Terapan FITB ITB Peta Jalan Road Map KK Geologi Terapan FITB ITB
Peta Jalan Road Map KK Geologi Terapan FITB ITB
 
FENOMENA DAS MAHAKAM
FENOMENA DAS MAHAKAMFENOMENA DAS MAHAKAM
FENOMENA DAS MAHAKAM
 
Curah ide pengelolaan DAS Mahakam
Curah ide pengelolaan DAS MahakamCurah ide pengelolaan DAS Mahakam
Curah ide pengelolaan DAS Mahakam
 
A LandSAT-driven approach to describe meander stream phenomenon in Mahakam Wa...
A LandSAT-driven approach to describe meander stream phenomenon in Mahakam Wa...A LandSAT-driven approach to describe meander stream phenomenon in Mahakam Wa...
A LandSAT-driven approach to describe meander stream phenomenon in Mahakam Wa...
 
DELINEATION OF FLOOD-PRONE AREAS THROUGH THE PERSPECTIVE OF RIVER HYDRAULICS
DELINEATION OF FLOOD-PRONE AREAS THROUGH THE PERSPECTIVE OF   RIVER HYDRAULICSDELINEATION OF FLOOD-PRONE AREAS THROUGH THE PERSPECTIVE OF   RIVER HYDRAULICS
DELINEATION OF FLOOD-PRONE AREAS THROUGH THE PERSPECTIVE OF RIVER HYDRAULICS
 
Analisis bibliometrik topik riset “overpressure”
Analisis bibliometrik topik riset “overpressure”Analisis bibliometrik topik riset “overpressure”
Analisis bibliometrik topik riset “overpressure”
 
KKGT-Dokumen Kebutuhan dan Formasi Jabfung
KKGT-Dokumen Kebutuhan dan Formasi JabfungKKGT-Dokumen Kebutuhan dan Formasi Jabfung
KKGT-Dokumen Kebutuhan dan Formasi Jabfung
 
Biodata Usulan Lektor Kepala - Dasapta Erwin Irawan
Biodata Usulan Lektor Kepala - Dasapta Erwin IrawanBiodata Usulan Lektor Kepala - Dasapta Erwin Irawan
Biodata Usulan Lektor Kepala - Dasapta Erwin Irawan
 
Perbaikan Keabsahan Karya Ilmiah Usulan Lektor Kepala - Dasapta Erwin Irawan
Perbaikan Keabsahan Karya Ilmiah Usulan Lektor Kepala - Dasapta Erwin IrawanPerbaikan Keabsahan Karya Ilmiah Usulan Lektor Kepala - Dasapta Erwin Irawan
Perbaikan Keabsahan Karya Ilmiah Usulan Lektor Kepala - Dasapta Erwin Irawan
 
Rekam Jejak Biodata Calon Lektor Kepala - Dasapta Erwin Irawan
Rekam Jejak Biodata Calon Lektor Kepala - Dasapta Erwin IrawanRekam Jejak Biodata Calon Lektor Kepala - Dasapta Erwin Irawan
Rekam Jejak Biodata Calon Lektor Kepala - Dasapta Erwin Irawan
 

Recently uploaded

Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdfPulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
MRoyanzainuddin9A
 
MINGGU 03_Metode Consistent Deformation (1).pdf
MINGGU 03_Metode Consistent Deformation (1).pdfMINGGU 03_Metode Consistent Deformation (1).pdf
MINGGU 03_Metode Consistent Deformation (1).pdf
AlmaDani8
 
Konsep dasar asuhan neonatus ,bayi dan balita
Konsep dasar asuhan neonatus ,bayi dan balitaKonsep dasar asuhan neonatus ,bayi dan balita
Konsep dasar asuhan neonatus ,bayi dan balita
Dilasambong
 
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
idoer11
 
Modul Ajar Seni Rupa - Melukis Pemandangan - Fase B.pdf
Modul Ajar Seni Rupa - Melukis Pemandangan  - Fase B.pdfModul Ajar Seni Rupa - Melukis Pemandangan  - Fase B.pdf
Modul Ajar Seni Rupa - Melukis Pemandangan - Fase B.pdf
MiliaSumendap
 
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docxCONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
WagKuza
 

Recently uploaded (6)

Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdfPulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
Pulupugbglueysoyaoyatiaitstisitatjsigsktstj.pdf
 
MINGGU 03_Metode Consistent Deformation (1).pdf
MINGGU 03_Metode Consistent Deformation (1).pdfMINGGU 03_Metode Consistent Deformation (1).pdf
MINGGU 03_Metode Consistent Deformation (1).pdf
 
Konsep dasar asuhan neonatus ,bayi dan balita
Konsep dasar asuhan neonatus ,bayi dan balitaKonsep dasar asuhan neonatus ,bayi dan balita
Konsep dasar asuhan neonatus ,bayi dan balita
 
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
Pertemuan 9 - PERT CPM.pdfPertemuan 9 - PERT CPM.pdf
 
Modul Ajar Seni Rupa - Melukis Pemandangan - Fase B.pdf
Modul Ajar Seni Rupa - Melukis Pemandangan  - Fase B.pdfModul Ajar Seni Rupa - Melukis Pemandangan  - Fase B.pdf
Modul Ajar Seni Rupa - Melukis Pemandangan - Fase B.pdf
 
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docxCONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
CONTOH CATATAN OBSERVASI KEPALA SEKOLAH.docx
 

3rd Workshop: Introduction to R (Institut Teknologi Bandung)

  • 1. A day in the library: Introduction to R Oleh: Dasapta Erwin Irawan @dasaptaerwin ITB Central Library 26 Mei 2015
  • 3. Siapa saya? Dosen KK Geologi Terapan, FITB, ITB Mengajar di: Prodi S1 Teknik Geologi dan S2 Teknik Air Tanah Media sosial: @dasaptaerwin, +Dasapta Erwin Irawan
  • 4. Lisensi dokumen Dengan menyebutkan penulis dan dokumen ini dalam Daftar Pustaka, anda boleh: memperbanyak, menyebarkan, memodifikasi sebagian atau seluruh dokumen ini, untuk kegiatan non-komersial.
  • 5. Sumber Beberapa bagian dari paparan ini diadaptasi dari: Slide Coursera RD.Peng: R.D. Peng on Github Slide Coursera Data Specialization oleh J.T. Leek: Data Specialization Slide tutorial Kevin Markham: Kevin Markham on Github Website Quick R Tutorial Website R Introduction to Statistics Website saya R from Dummies dll
  • 6. Data Data yang disertakan dalam tutorial ini adalah BandungData.csv. Berisi data kualitas air (major element) air S. Cikapundung dan air tanah di bantaran sungainya.
  • 7.
  • 10. Apakah R? R adalah bahasa pemrograman (statistik) yang dikembangkan dari Bahasa S. S ditulis pada tahun 1976 (saya lahir) oleh John Chambers dkk di Bell Labs. S awalnya ditulis sebagai library statistik Bahasa Fortran. S pada tahun 1988 mulai ditulis ulang dengan Bahasa C++, hingga kemudian menjadi R yang kita kenal sekarang.
  • 11. Mengapa R? Free dan Lightweight: free as breathing yang diperlukan hanya koneksi internet, ukuran installer R base < 70 MB, R Studio < 60 MB. (Bandingkan dengan SPSS, Matlab) (Bandingkan dengan SPSS, Matlab) Cross platform: R tersedia untuk Linux, Mac, dan (tentunya) Windows. (Sebagian besar Windows only) Peran komunitas open source: sangat aktif, mailing lists, R Stack Overflow, Youtube, dll.
  • 12. Mengapa R cocok untuk engineer? Reproducibility: semua yang ditulis dengan R bisa diulang oleh orang lain untuk diperbaiki dan dikembangkan. Karena basisnya open source, maka semangat saling berbagi diantara pemakai R sangat tinggi. Terstruktur: basis command line, memang sulit pada awalnya, tapi membuat analisis lebih terstruktur, tiap langkah dapat didokumentasikan dengan memberi komentar dll. Visualisasi: R dapat menghasilkan grafis yang sangat bagus dan plot yang fully-customizeable. Banyak output grafik yang tidak dapat dibuat dengan piranti lunak spreadsheet konvensional.
  • 13. Mengapa R cocok untuk non-programmer? Mudah: sudah banyak tutorial dilengkapi codenya di internet, tinggal mengetik how to .... in R. Sederhana: syntax penulisan kode sederhana, berbasis obyek. Pengembangan intensif: R dapat dikembangkan melalui > 4000 R packages, bahkan untuk web-authoring, web-scraping, analisis spasial, dll.
  • 14.
  • 16. Karakter R case sensitive command line what you mean is what you get
  • 17. Karakter R 2 R base telah memiliki perbendaharaan fungsi yang sangat kaya Beberapa package juga telah dimasukkan ke dalam R base Pengembangan package tujuannya untuk: memudahkan dan menyingkat kode, misal: dari 10 baris menjadi tiga baris saja meningkatkan kualitas grafis
  • 18. Karakter R 3 Jadi jangan heran kalau anda telah fasih menjalankan satu proses, kemudian dengan perkembangan baru, baris kode anda menjadi tidak optimal (terlalu panjang).
  • 19. Komponen R Sebelum ke tahap instalasi, kita kenali dulu komponen R yang terdiri dari: R base atau R core R IDE R packages
  • 20. R base atau R core Inti dari R, full functionality. Jendela script, console, proses, dan output terpisah. Unduh installer dari Server CRAN. Mirrors di Indonesia: Mirror BPPT Mirror Uni Jember
  • 21. R IDE (Integrated Development Environment) Ada R Studio atau R Commander. Jendela script, console, proses, dan output menyatu. Unduh installer dari Website RStudio
  • 24. R packages Pengembangan dari fungsi-fungsi R base dikemas sebagai R packages. Saat ini ada lebih dari 4000 packages di sini yang telah terklasifikasi klik menu Task Views, diantaranya: Spasial Timeseries Lingkungan bahkan Medis
  • 25. R packages 2 Beberapa packages yang sangat fungsional dari pengembang individu dapat dimasukkan ke dalam fungsi dasar R base versi berikutnya, misal: utils, stats, datasets, graphics, grDevices, grid, methods, tools, parallel, compiler, splines, tcltk, stats4.
  • 26. R packages 3 Beberapa packages yang sering saya pakai, diantaranya: cluster, foreign, mgcv, rpart, spatial, dll. Beberapa package yang dikembangkan oleh ahli biologi dan lingkungan, dapat diunduh dari Website Bioconductor Project Atau dari individu langsung via repo Github. Perlu menginstalasi devtools package
  • 27. R packages 4 Package harus diunduh dan diinstalasi terlebih dahulu dengan perintah: install.packages("packageName") Kemudian package harus dimuat ke memory dengan perintah: library(packageName) atau require(packageName)
  • 28. Instalasi Sekarang mulailah “pekerjaan kotor kita”, yaitu menginstalasi R ke dalam PC atau laptop kita. Untuk itu coba perhatikan beberapa hal berikut ini: Spesifikasi komputer/laptop: Tidak ada spesifikasi khusus untuk R, tetapi prinsip utamanya adalah makin besar data yang anda gunakan, makin kompleks analisis yang anda lakukan, akan memerlukan spesifikasi prosesor dan RAM yang makin besar. Jadi ini akan sangat bergantung kepada kebutuhan anda. Untuk keperluan pembelajaran gunakan saja komputer yang anda miliki sekarang. Sistem operasi (OS): Seperti yang telah saya sampaikan sebelumnya, R berjalan di semua OS: Linux (bisa Ubuntu, Fedora dll), Mac OS, dan tentunya Windows. Jangan kuatir, yang manapun OS yang anda pakai, spesifikasi R nya akan sama persis.
  • 29. Instalasi 2 Apa saja yang perlu anda unduh dan install: R base: Inti dari R. Kunjungi Situs R Project Pilih mirror server. Pilih server yang ada di Indonesia. Klik CRAN mirror di dalam kotak “Getting Started”. Cari server di Indonesia. Ada dua, silahkan anda pilih: Server BPPT Server Universitas Jember Setelah server CRAN-BPPT terbuka, klik versi R sesuai dengan OS yang anda miliki.
  • 30. Instalasi 3 R Studio: lingkungan pemrograman. Kunjungi Situs R Studio Klik menu Products > RStudio > klik tombol Download RStudio Desktop. Secara otomatis R Studio akan membaca OS yang anda pakai dan proses pengunduhan akan segera dimulai.
  • 31. Instalasi 4 Atau anda bisa langsung buka halaman http://www.rstudio.com/products/rstudio/download/, Pilih versi RStudio. Pilihan installer yang ada per tanggal 04 September 2014 adalah: RStudio 0.98.1049 - Windows XP/Vista/7/8 ukuran file 48.2 MB tanggal update 2014-09-02 RStudio 0.98.1049 - Mac OS X 10.6+ (64-bit) ukuran file 37.8 MB tanggal update 2014-09-02 RStudio 0.98.1049 - Debian 6+/Ubuntu 10.04+ (32-bit) ukuran file 56.3 MB tanggal update 2014-09-02
  • 32. Instalasi 5 RStudio 0.98.1049 - Debian 6+/Ubuntu 10.04+ (64-bit) ukuran file 58 MB tanggal update 2014-09-02 RStudio 0.98.1049 - Fedora 13+/openSUSE 11.4+ (32-bit) ukuran file 56.6 MB tanggal update 2014-09-02 RStudio 0.98.1049 - Fedora 13+/openSUSE 11.4+ (64-bit) ukuran file 57.9 MB tanggal update 2014-09-02
  • 33. Instalasi 6 Setelah proses pengunduhan selesai, jalankan file program instalasinya: Untuk Linux: jalankan file xRstudioxx.deb dan ikuti perintahnya Untuk Mac OSX: jalankan file xRstudioxx.dmg dan ikuti perintahnya Untuk Windows: jalankan file xRstudioxx.exe dan ikuti perintahnya
  • 34.
  • 36. Format data format database: kasus/sampel dalam baris variable/parameter/pengukuran dalam kolom tanpa judul tabel dan aksesori lainnya
  • 37. Format data 2 dulu data harus format text/ASCII bukan binary (xls, xlsx, dll), misal: txt csv (comma separated values) dengan fungsi dasar R
  • 38. Format data 3 sekarang dengan fungsi dari package tambahan, seperti foreign, read.table, readxl, R dapat meng-import berbagai format file text maupun binary, misal: xls, xlsx (Ms Office) sav (SPPS) dta (Stata) odt (LibreOffice)
  • 40. Memuat data ke dalam R data <- read.csv("BandungData.csv", header = TRUE) attach(data) ## The following object is masked from package:datasets: ## ## CO2
  • 42. Jenis data str(data) ## 'data.frame': 295 obs. of 34 variables: ## $ no : int 16 22 263 17 12 18 13 19 14 20 ... ## $ code : int 116 122 8 117 112 118 113 119 114 120 . ## $ year : int 1997 1997 1997 1997 1997 1997 1997 1997 ## $ type : Factor w/ 2 levels "groundwater",..: 1 1 2 1 ## $ x : num 785175 785168 799275 785175 785181 ... ## $ y : num 10752836 10752843 10753680 10752840 107 ## $ distx : num 6897 6904 0 6897 6891 ... ## $ elv : int 1338 1336 1336 1320 1300 1247 1240 1230 ## $ aq : Factor w/ 3 levels "breccias","clay",..: 3 3 ## $ zone : Factor w/ 2 levels "eff","inf": 1 1 1 1 1 1 ## $ ec : num 71.9 71.9 77 71.9 71.9 71.9 71.9 71.9 7 ## $ ph : num 6.89 6.89 6.39 6.89 6.89 ... ## $ hard : num 11 11 26.4 11 11 11 11 11 11 11 ... ## $ tds : num 58.7 58.7 50 58.7 58.7 ... ## $ temp : num 21 21 16.1 21 21 ...
  • 43.
  • 44. Beberapa contoh visualisasi dan analisis dengan fungsi dasar R
  • 45. Scatter plot plot(tds, temp, xlab = "tds (ppm)", ylab = "temp (^oC)", bg = "lightblue", col = "black", cex = 1.1, pch = 21, frame = FALSE) abline(lm(tds~temp), col="red") # regression line (y~x) lines(lowess(tds,temp), col="blue") # lowess line (x,y) Note: semua yang diketik di belakang simbol # tidak dieksekusi oleh R, disebut comment. Biasa digunakan untuk memberi penjelasan baris atau kelompok baris kode.
  • 46. Scatter plot 2 0 200 400 600 800 1000 1200 1520253035 tds (ppm) temp(C) Mengapa garis regresi tidak diagonal?
  • 47. Histogram hist(tds, col="red") Histogram of tds tds Frequency 0 200 400 600 800 1000 1200 020406080
  • 48. Multiple Histogram 2 par(mfrow=c(1,3)) hist(tds, col="red") hist(ph, col="green") hist(hard, col="blue") Histogram of tds tds Frequency 0 400 1000 020406080 Histogram of ph ph Frequency 5 6 7 8 9 020406080100 Histogram of hard hard Frequency 0 40 80 050100150
  • 49. Multiple Histogram 3 par(mfrow=c(2,2)) hist(tds, col="cyan") hist(ph, col="magenta") hist(hard, col="yellow") hist(eh, col="blue") Histogram of tds tds Frequency 0 200 600 1000 060 Histogram of ph ph Frequency 5 6 7 8 9 060 Histogram of hard Frequency 0150 Histogram of eh Frequency 080
  • 50. Analisis regresi Berikut contoh perintah untuk mengetahui koef dan intercept persamaan regresi. fit <- lm(tds ~ temp, data = data) coef(fit)
  • 51. Analisis regresi 2 fit <- lm(data$tds ~ data$temp, data = data) coef(fit) ## (Intercept) data$temp ## -650.96402 37.93123
  • 52. Pairs analysis Untuk memvisualisasikan matriks korelasi. group1 <- data[,c("x", "y", "elv", "aq", "ec", "ph", "hard", "tds", "temp", "eh", "Q")] pairs(group1,labels=colnames(group1), main="Physical parameter", pch=21, bg=c("red", "blue") [unclass(data$type)], upper.panel=NULL) legend(x=0.6, y=0.8, levels(data$type), pt.bg=c("red", blue"), pch=21, bty="n", ncol=2, horiz=F)
  • 53. Pairs analysis 2 700 900 1100 1300 7001000 elv 5678 ph 04080 hard 04001000 tds 152535 temp 700 900 1100 1300 048 5 6 7 8 0 20 40 60 80 0 400 800 1200 15 20 25 30 35 0 2 4 6 8 10 048 Q Physical parameter groundwater river
  • 54. Multiple linear regression Misal: Apakah tds merupakan fungsi linear dari unsur Ca, Mg, dan Fe? atau tds adalah fungsi dari unsur HCO3, CO3, SO4, Cl?
  • 55. Multiple linear regression 2 fit <- lm(tds ~ Ca + Mg + Fe, data=data) summary(fit) ## ## Call: ## lm(formula = tds ~ Ca + Mg + Fe, data = data) ## ## Residuals: ## Min 1Q Median 3Q Max ## -352.11 -57.96 -29.36 36.98 835.27 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 77.7128 12.3875 6.273 1.28e-09 *** ## Ca 2.8913 0.4657 6.209 1.84e-09 *** ## Mg 11.2824 1.2024 9.384 < 2e-16 *** ## Fe -43.5776 33.5691 -1.298 0.195
  • 56. Multiple linear regression 3 fit2 <- lm(tds ~ HCO3 + CO3 + SO4 + Cl, data=data) summary(fit2) ## ## Call: ## lm(formula = tds ~ HCO3 + CO3 + SO4 + Cl, data = data) ## ## Residuals: ## Min 1Q Median 3Q Max ## -369.64 -37.61 -23.53 24.36 688.83 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 55.08578 10.67173 5.162 4.55e-07 *** ## HCO3 0.77447 0.06993 11.075 < 2e-16 *** ## CO3 1.13775 0.73530 1.547 0.123 ## SO4 1.47805 0.25607 5.772 2.01e-08 ***
  • 57. Multiple linear regression 4 anova(fit, fit2) ## Analysis of Variance Table ## ## Model 1: tds ~ Ca + Mg + Fe ## Model 2: tds ~ HCO3 + CO3 + SO4 + Cl ## Res.Df RSS Df Sum of Sq F Pr(>F) ## 1 291 4246450 ## 2 290 2778559 1 1467891 153.2 < 2.2e-16 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1
  • 58. PCA # Prepare Data mydata <- data[,c("elv", "ph", "hard", "tds", "temp", "Q")] mydata <- na.omit(mydata) # listwise deletion of missing mydata <- scale(mydata) # run PCA fit <- princomp(mydata, cor=TRUE)
  • 59. PCA 2 summary(fit) # print variance accounted for ## Importance of components: ## Comp.1 Comp.2 Comp.3 ## Standard deviation 1.3597606 1.1297573 0.9700609 0.8 ## Proportion of Variance 0.3081582 0.2127253 0.1568364 0.1 ## Cumulative Proportion 0.3081582 0.5208834 0.6777198 0.8 ## Comp.6 ## Standard deviation 0.66931040 ## Proportion of Variance 0.07466273 ## Cumulative Proportion 1.00000000
  • 60. PCA 3 loadings(fit) # pc loadings ## ## Loadings: ## Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 ## elv 0.488 -0.133 0.800 0.132 -0.294 ## ph -0.111 0.687 0.709 ## hard 0.250 0.368 -0.791 -0.395 0.141 ## tds -0.605 -0.206 0.130 -0.153 -0.737 ## temp -0.561 -0.101 0.558 -0.111 0.589 ## Q -0.598 -0.568 -0.159 0.537 ## ## Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 ## SS loadings 1.000 1.000 1.000 1.000 1.000 1.000 ## Proportion Var 0.167 0.167 0.167 0.167 0.167 0.167 ## Cumulative Var 0.167 0.333 0.500 0.667 0.833 1.000
  • 61. PCA 4 plot(fit,type="lines") # scree plot fit Variances 0.40.60.81.01.21.41.61.8 Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6
  • 62. PCA 5 fit$scores # the principal components ## Comp.1 Comp.2 Comp.3 Comp.4 ## 1 2.555170709 4.137174e-01 -0.401835894 0.692409628 ## 2 2.550748586 4.149192e-01 -0.401556057 0.685160307 ## 4 2.515371607 4.245332e-01 -0.399317361 0.627165736 ## 5 2.471150383 4.365508e-01 -0.396518992 0.554672522 ## 6 2.353964139 4.683973e-01 -0.389103312 0.362565505 ## 7 2.338486711 4.726035e-01 -0.388123883 0.337192881 ## 8 2.316376099 4.786123e-01 -0.386724698 0.300946274 ## 9 2.311953977 4.798140e-01 -0.386444861 0.293696952 ## 10 2.305320793 4.816167e-01 -0.386025106 0.282822970 ## 11 2.250044263 4.966386e-01 -0.382527144 0.192206453 ## 12 2.227933651 5.026474e-01 -0.381127959 0.155959846 ## 13 1.867410026 -2.616254e-01 -0.089218290 0.321085216 ## 14 1.645181935 -7.239144e-01 1.219284576 0.021630346 ## 16 1.105647572 -1.059011e+00 1.265951112 0.539519751
  • 63. PCA 6 biplot(fit) −0.3 −0.2 −0.1 0.0 0.1 0.2 −0.3−0.2−0.10.00.10.2 Comp.1 Comp.2 12456789101112 13 14 16 17 18 19 20 21 22 23 26 2728 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 49 50 51 5253 54 56 57 58 60 61 63 64 65 66 6768 69 70 71 72 73 75 76 77 78 79 80 81 82 85 86 87 89 90 91 92 93949596 97 98 99 100 101 102 103 104 105 106 108 109 110111 112 113 115 116 117 119120 122 123 124 125 126 127128129130 131 132 134 135 136137 138 139 140141 144 145 146 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 167 168 169170 171 172 174175 176 178 179 181 182 183 184 185 186 187 188 189 190 191 193 194 195196 197 198 199 200203 204 205 207 208 209 210 211 212213 214 215 216 217 218 219 220 221 222 223 224 226 227 228 229 230 231 233 234 235 237 238 240 241 242 243 244 245 246 247 248 249 250 252 253 254 255 256 257 258 259 262 263264 266 267 268 269 270 271 272 273 274 275276 277 278 279 280 281 282 283 285 286 287 288 289 290 292 293 294 −15 −10 −5 0 5 10 −15−10−50510 elv ph hard tds temp Q
  • 64. Cluster analysis # Ward Hierarchical Clustering d <- dist(as.matrix(mydata), method="euclidean") # distance fit <- hclust(d, method="complete", members=NULL)
  • 65. Cluster analysis 2 plot(fit) # display dendogram 10424219437101267286289288270287257281279278282283292293462131161621641121101111511454022910015410915716789165821081171701681741751551561602752761131061761712694435982741633634219230301055049223285512051611692592802682562722552582622662902942732642772632712312342262212092129695939479196195771362041401411531598133210382001391981494715854562032810214822026228851913878135201973221641103222159222257319121411515258233522181992787212314699150972071252481221371775721886317812414191166117971183661316470190126186185252187189246249245247691821313419351234181119160212010128867127968665718473132111291213024325025325423724123824024417276392089042217188086144227534322423545211 024681012 Cluster Dendrogram hclust (*, "complete") d Height Coba tweak grafik ini agar id sampel terbaca.
  • 66.
  • 68. Workshop selanjutnya tematik: basic stats, multivariate stats, plotting, exploratory data analysis sharing session dari pengguna: kasus, data, kode
  • 69. Slide dan kode Slide: format pdf tersedia di SlideShare format ioslide tersedia di Rpubs Kode: tersedia di Github
  • 70. Media sosial Facebook Group Indonesia R User Me on Twitter: @dasaptaerwin Me on G+: +Dasapta Erwin Irawan Me on ResearchGate: www.researchgate.net/profile/dasapta_irawan I used Ubuntu 14.04 and R Markdown
  • 71.