Pelatihan Bahasa R

5,567 views
5,450 views

Published on

Slide ini digunakan untuk pelatihan pemrograman R di Universatas Bina Nusantara Jakarta.

Published in: Education, Technology
0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
5,567
On SlideShare
0
From Embeds
0
Number of Embeds
2,351
Actions
Shares
0
Downloads
172
Comments
0
Likes
3
Embeds 0
No embeds

No notes for slide

Pelatihan Bahasa R

  1. 1. Pengenalan Bahasa R I G.A. Anom Yudistira E-mail: anom.yudistira@gmail.com
  2. 2. Websites <ul><li>SimpleR www.math.csi.cuny.edu/Statistics/R/simpleR/Simple </li></ul><ul><ul><li>package, data, dan dokumen </li></ul></ul><ul><li>R www.r-project.org </li></ul><ul><ul><li>software;  cran.r-project.org </li></ul></ul><ul><ul><li>dokumen; </li></ul></ul><ul><ul><li>packages </li></ul></ul><ul><ul><li>RNews. </li></ul></ul>
  3. 3. Bahasa R: Selayang Pandang <ul><li>Open source dan open development . </li></ul><ul><li>Merupakan sofware yang dirancangan dan penyebarannya bersifat portable , extensible , dan scalable . </li></ul><ul><li>Interoperability dengan bahasa lain: C, XML, FORTRAN . </li></ul><ul><li>Disediakan untuk berbagai metode statistik dan numerik . </li></ul><ul><li>Memiliki tools graphics dan visualisasi dengan kualitas tinggi. </li></ul><ul><li>Memiliki user interface yang efektif, dan extensible </li></ul><ul><li>Didukung dengan creation , testing , dan distribusi software dan data modul: packages .  gratis </li></ul>
  4. 4. Pemrograman Berorientasi Objek (OOP) <ul><li>Class </li></ul><ul><li>abstraksi software mengenai objek dalam dunia nyata. </li></ul><ul><li>refleksi dari bagaimana kita memandang objek dan informasi apa yang dikandungnya. </li></ul><ul><li>Method </li></ul><ul><li>fungsi melakukan aksi terhadap data (objects). </li></ul><ul><li>aksi fungsi tergantung pada class dari argumen-argumennya. </li></ul><ul><li>sebuah fungsi generic dapat segera digunakan. </li></ul>
  5. 5. R antarmuka pengguna <ul><li>Pemrosesan baris perintah ( command line processing ) </li></ul><ul><ul><li>Klik R mulai </li></ul></ul><ul><ul><li>> q() keluar; quit </li></ul></ul><ul><li>Graphik windows </li></ul><ul><ul><li>> X11() atau > window() </li></ul></ul><ul><ul><li>> postscript() </li></ul></ul><ul><ul><li>> dev.off() </li></ul></ul><ul><li>File path terhadap working directory </li></ul><ul><ul><li>> getwd() </li></ul></ul><ul><ul><li>> setwd() </li></ul></ul><ul><li>meload a package library dengan library() </li></ul><ul><li>GUIs , tcltk </li></ul>
  6. 6. Memperoleh Bantuan (Help) <ul><li>Detail tentang perintah spesifik yang namanya anda ketahui: </li></ul><ul><li>> ? t.test </li></ul><ul><li>> help(t.test) </li></ul><ul><li>Teladan penggunaan: </li></ul><ul><li>> demo(graphics) </li></ul><ul><li>> example(mean) </li></ul><ul><li>mean> x <- c(0:10, 50) </li></ul><ul><li>mean> xm <- mean(x) </li></ul><ul><li>mean> c(xm, mean(x, trim = 0.1)) </li></ul><ul><li>[1] 8.75 5.50 </li></ul>
  7. 7. <ul><li>Mesin pencari HTML membantu anda mencari topik tertentu: </li></ul><ul><li>> help.search(“mean”) </li></ul><ul><li>Mencari perintah yang mengandung ekspresi atau nama objek tertentu: </li></ul><ul><li>> apropos(&quot;var&quot;) </li></ul><ul><li>[1] &quot;var.na&quot; &quot;.__M__varLabels:Biobase&quot; </li></ul><ul><li>[3] &quot;varLabels&quot; &quot;var.test&quot; </li></ul><ul><li>[5] &quot;varimax&quot; &quot;all.vars&quot; </li></ul><ul><li>[7] &quot;var&quot; &quot;variable.names&quot; </li></ul><ul><li>[9] &quot;variable.names.default&quot; &quot;variable.names.lm&quot; </li></ul>Memperoleh Bantuan (Help)
  8. 8. Memperoleh Bantuan (Help) <ul><li>Melihat code suatu fungsi, ketik nama fungsi tanpa parentheses/() or arguments: </li></ul><ul><li>> plot </li></ul>
  9. 9. R sebagai Calculator > log2(32) [1] 5 > print(sqrt(2)) [1] 1.414214 > pi [1] 3.141593 > seq(0, 5, length=6) [1] 0 1 2 3 4 5 > 1+1:10 [1] 2 3 4 5 6 7 8 9 10 11
  10. 10. R sebagai alat pembuat Graphics > plot(sin(seq(0, 2*pi, length=100)))
  11. 11. > a <- 49 > sqrt(a) [1] 7 > b <- &quot;Saya sedang belajar R&quot; > sub(&quot;Saya&quot;,&quot;Kamu&quot;,b) [1] &quot;Kamu sedang belajar R &quot; > c <- (1+1==3) > c [1] FALSE > is.character(c) [1] &quot; FALSE &quot; numeric character string logical Variabel
  12. 12. Missing Values Peubah setiap tipe data (numeric, character, logical) dapat mempunyai nilai NA : not available. o NA tidak sama dengan 0 o NA tidak sama dengan “” o NA tidak sama dengan FALSE o NA tidak sama dengan NULL Opersi-operasi yang melibatkan NA bisa saja menghasilkan NA atau tidak: > NA==1 [1] NA > 1+NA [1] NA > max(c(NA, 4, 7)) [1] NA > max(c(NA, 4, 7), na.rm=T) [1] 7 > NA | TRUE [1] TRUE > NA & TRUE [1] NA
  13. 13. Vektor vektor: suatu kumpulan data terurut dengan tipe sama > a <- c(1,2,3) > a*2 [1] 2 4 6 Teladan: Nilai UTS statistik dan probabilitas kelas 02PBT adalah sebuah vektor numeric Pada R, sebuah vektor bisa saja hanya memilki sebuah nilai tunggal. Tipe-tipe vektor lain: character strings, logical
  14. 14. Matriks dan Array matrix: table data berbentuk segi empat dengan tipe sama Teladan: ?. array: 3-,4-,.. matrix dimensional Teladan: nilai-nilai foreground and background merah dan hijau untuk 20000 spots pada 120 arrays adalah array 4 x 20000 x 120 (3D).
  15. 15. Himpunan ( list ) list: kumpulan data terurut dari sembarang tipe. Teladan: > doe <- list(name=&quot;john&quot;,age=28,married=F) > doe$name [1] &quot;john“ > doe$age [1] 28 > doe[[3]] [1] FALSE Elemen-elemen vektor diakses dengan nilai indexnya (integer) sedangkan elemen-elemen list oleh $nama (suatu character string).
  16. 16. Data Frame data frame: tabel segiempat dengan baris-baris dan kolom-kolom; data didalam setiap kolom harus bertipe sama (mis. angka, text, logikal), tetapi kolom berbeda bisa saja bertipe tidak sama. Teladan: > a <-data.frame(localization,tumorsize,progress,row.names=patients) > a l o c alization tumorsize p rogress XX348 proximal 6.3 FALSE XX234 distal 8.0 TRUE XX987 proximal 10.0 FALSE
  17. 17. Apa tipe data saya? Names, class, etc. attributes Names for each dim of array dimnames Names associated with object names Logical (TRUE if missing) is.na Logical (TRUE if function) is.function Mode used by R to store object (double, integer, character, logical, …) storage.mode typeof Numeric, character, logical, … mode Class from which object inherits (vector, matrix, function, logical, list, … ) class
  18. 18. Subsetting Elemen-elemen individual sebuah vektor, matriks, array atau data frame diakses dengan “[ ]” dengan menentukan nilai indeksnya, atau namanya > a localization tumorsize progress XX348 proximal 6.3 0 XX234 distal 8.0 1 XX987 proximal 10.0 0 > a[3, 2] [1] 10 > a[&quot;XX987&quot;, &quot;tumorsize&quot;] [1] 10 > a[&quot;XX987&quot;,] l o c alization tumorsize p rogress XX987 proximal 10 0
  19. 19. >a localization tumorsize progress XX348 proximal 6.3 0 XX234 distal 8.0 1 XX987 proximal 10.0 0 > a[c(1,3),] l o c alization tumorsize p rogress XX348 proximal 6.3 0 XX987 proximal 10.0 0 > a[-c(1,2),] l o c alization tumorsize p rogress XX987 proximal 10.0 0 > a[c(T,F,T),] l o c alization tumorsize p rogress XX348 proximal 6.3 0 XX987 proximal 10.0 0 > a$ l o c alization [1] &quot;proximal&quot; &quot;distal&quot; &quot;proximal&quot; > a$ l o c alization==&quot;proximal&quot; [1] TRUE FALSE TRUE > a[ a$ l o c alization==&quot;proximal&quot;, ] l o c alization tumorsize p rogress XX348 proximal 6.3 0 XX987 proximal 10.0 0 subset baris-baris dengan vektor indeks subset baris-baris dg. Vektor logikal subset kolom-kolom Hasil pembandingan dalam vektor logikal subset baris-baris yang dipilih Teladan:
  20. 20. Fungsi dan Operator Fungsi melakukan sesuatu terhadap data “ Input”: argumen-argumen fungsi (0,1,2,…) “ Output”: hasil fungsi Teladan: add <- function(a,b) { result <- a+b return(result) } Operator: Penulisan cepat untuk fungsi-fungsi yang sering digunakan dengan satu atau dua argument.
  21. 21. Operator-operator yang sering digunakan Assign <- Exponent ^ Subset %in% Integer division %/% Dot product %*% Mod %% Division / Multiplication * Difference - Sum + Is equal == Less or = <= Greater or = >= Less < Greater > Not equal != Not ! And & Or |
  22. 22. Fungsi-fungsi yang sering digunakan # values length Max integer in floor Concatenate vectors cbind,rbind Counts table Concatenate c Minimum min Maximum max # rows, cols dim TRUE indices which Round round c() as char paste Sort, order, rank a vector Sort, order, rank Repeat over rows, cols apply Print as char cat Show value print Generic stats summary
  23. 23. Fungsi-fungsi Statistik Linear algebra svd, qr, chol, eigen Scale statistics var, cor, cov, mad, range Location statistics mean, median Normal distribution random sample, density, cdf and quantiles rnorm, dnorm, pnorm, qnorm Model fitting lm, glm, anova Smooth curve fitting loess, lowess Resampling (bootstrap, permutation) sample Random number generation .Random.seed
  24. 24. Fungsi-fungsi Grafik Plotting parameters (lots!) par Add a legend legend Generic plot eg: scatter plot Add points points Add lines lines, abline Use colors colors, palette Add box around all axes box Add axes axis Add text text, mtext
  25. 25. Percabangan if (logical expression) { statements } else { alternative statements } else branch is optional { } are optional with one statement ifelse (logical expression, yes statement, no statement)
  26. 26. Loops Bila perintah yang sama diperlukan beberapa kali; untuk semua elemen dalam sebuah list; semua kolom dalam sebuah array; dsb. for (i in 1:10) { print(i*i) } i<-1 while (i<=10) { print(i*i) i<-i+sqrt(i) } Also: repeat, break, next
  27. 27. Expressi Regular Perintah untuk pencocokan text dan replacement yang juga tersedia dalam bentuk yang sama dengan kebanyakan bahasa pemrograman (Perl, Unix shells, Java) > a <- c(&quot;CENP-F&quot;,&quot;Ly-9&quot;, &quot;MLN50&quot;, &quot;ZNF191&quot;, &quot;CLH-17&quot;) > grep(&quot;L&quot;, a) [1] 2 3 5 > grep(&quot;L&quot;, a, value=T) [1] &quot;Ly-9&quot; &quot;MLN50&quot; &quot;CLH-17&quot; > grep(&quot;^L&quot;, a, value=T) [1] &quot;Ly-9&quot; > grep(&quot;[0-9]&quot;, a, value=T) [1] &quot;Ly-9&quot; &quot;MLN50&quot; &quot;ZNF191&quot; &quot;CLH-17&quot; > gsub(&quot;[0-9]&quot;, &quot;X&quot;, a) [1] &quot;CENP-F&quot; &quot;Ly-X&quot; &quot;MLNXX&quot; &quot;ZNFXXX&quot; &quot;CLH-XX&quot;
  28. 28. Menyimpan Data Setiap objek R dapat disimpan dan dipanggil kembali dari sebuah file dengan menggunakan perintah: “ save” and “load”. Menggunkan standard XDR (external data representation) dari Sun Microsystems dan mempunyai keseuaian terhadap MS-Windows, Unix, Mac. > save(x, file=“x.Rdata”) > load(“x.Rdata”)
  29. 29. Importing dan Exporting Data Ada banyak cara untuk mengambil dan mengirim data. Kebanyakan program (seperti Excel), disimpan dalam bentuk tabel segiempat berbentuk tab-delimited text files. > x <- read.delim(“filename.txt”) Lihat juga: read.table, read.csv, scan > write.table(x, file=“x.txt”, sep=“ ”) Lihat juga: write.matrix, write
  30. 30. Importing dan Exporting Data <ul><li>Mengambil data dari format minitab, SAS, STATA dapat dilakukan dengan menggunakan package foreign </li></ul><ul><li>> library(foreign) </li></ul><ul><li>> read.mtp(“file.mtp”) # format minitab </li></ul>
  31. 31. Simulasi <ul><li>Teorema Limit Pusat </li></ul><ul><li>> n<-10; p<-.25; S<-rbinom(100,n,p) </li></ul><ul><li>> X<-(S-n*p)/sqrt(n*p*(1-p)) # ada 100 angka acak </li></ul><ul><li>> hist(X,prob=TRUE) </li></ul><ul><li>> xval=seq(-3,3,.01) </li></ul><ul><li>> points(xval,dnorm(xval),type=&quot;l&quot;) </li></ul>
  32. 32. Simulasi <ul><li>200 sampel diambil dari populasi N(10,5) masing-masing berukutan 100 </li></ul><ul><li>> samp<-numeric(0) </li></ul><ul><li>> mu<-10;sigma<-5 </li></ul><ul><li>> for (i in 1:200) { </li></ul><ul><li>+ x<-rnorm(100,mu,sigma) # bangkikan 100 data </li></ul><ul><li>+ samp[i]<-(mean(x)-mu)/(sigma/sqrt(100)) </li></ul><ul><li>+ } </li></ul><ul><li>> hist(samp,prob=T,col=gray(0.85)) </li></ul><ul><li>> xval=seq(-3,3,.01) </li></ul><ul><li>> points(xval,dnorm(xval),type=&quot;l&quot;) </li></ul>
  33. 33. QQ-Plot <ul><li>Plot quantil-quantil adalah plot yang lebih baik digunakan untuk memutuskan apakah suatu data acak teraproksimasi normal </li></ul><ul><li>> par(mfrow=c(1,4)) </li></ul><ul><li>> x<-rnorm(100);qqnorm(x,main=&quot;normal(0,1)&quot;); qqline(x) </li></ul><ul><li>> x<-rnorm(100,10,15);qqnorm(x,main=&quot;normal(10,15)&quot;) </li></ul><ul><li>> qqline(x) </li></ul><ul><li>> x<-rexp(100,1/10);qqnorm(x,main=&quot;exponensial mu=10&quot;) </li></ul><ul><li>> qqline(x) </li></ul><ul><li>> x<-runif(100);qqnorm(x,main=&quot;uniform(0,1)&quot;); qqline(x) </li></ul>
  34. 34. Statistik Inferensia <ul><li>> library(Devore6) # panggil package Devore6 </li></ul><ul><li>> xmp07.06 # lihat datanya </li></ul><ul><li>> names(xmp07.06) # apa saja variabelnya </li></ul><ul><li>> with(xmp07.06,mean(Voltage)+ </li></ul><ul><li>+ c(1,-1)*qnorm(0.025)* </li></ul><ul><li>+ sd(Voltage)/sqrt(length(Voltage))) </li></ul><ul><li>[1] 53.22859 56.18807 </li></ul>
  35. 35. Statistik Inferensia <ul><li>Uji t </li></ul><ul><li>> with(xmp07.06,t.test(Voltage)) </li></ul><ul><li>One Sample t-test </li></ul><ul><li>data: Voltage </li></ul><ul><li>t = 72.4631, df = 47, p-value < 2.2e-16 </li></ul><ul><li>alternative hypothesis: true mean is not equal to 0 </li></ul><ul><li>95 percent confidence interval: </li></ul><ul><li>53.18950 56.22716 </li></ul><ul><li>sample estimates: </li></ul><ul><li>mean of x </li></ul><ul><li>54.70833 </li></ul>
  36. 36. Statistik Inferensia <ul><li>Selang kepercayaan untuk ragam </li></ul><ul><li>> with(xmp07.15,(length(voltage)-1)* </li></ul><ul><li>+ var(voltage)/qchisq(c(0.975,0.025), </li></ul><ul><li>+ df=length(voltage)-1)) </li></ul><ul><li>[1] 76171.31 318079.76 </li></ul><ul><li>> with(xmp08.08,t.test(DCP,mu=30,alt=&quot;less&quot;)) </li></ul><ul><li>One Sample t-test </li></ul><ul><li>data: DCP </li></ul><ul><li>t = -0.7282, df = 51, p-value = 0.2349 </li></ul><ul><li>alternative hypothesis: true mean is less than 30 </li></ul><ul><li>95 percent confidence interval: </li></ul><ul><li>-Inf 31.61088 </li></ul><ul><li>sample estimates: </li></ul><ul><li>mean of x </li></ul><ul><li>28.76154 </li></ul>

×