SlideShare a Scribd company logo
Statistik Deskriptif dan
Inferensial
WA ODE SYAIDATUL AULIAH
(F1A222020)
2024
DEFINISI
DEFINISI
Visualisasi data adalah representasi grafis dari informasi dan data numerik. Ini
melibatkan penggunaan berbagai jenis grafik, plot, dan diagram untuk
menggambarkan pola, tren, dan hubungan dalam dataset. Visualisasi data dalam
RStudio adalah proses membuat grafik, plot, atau diagram yang menggambarkan
informasi dari dataset menggunakan bahasa pemrograman R. RStudio adalah
lingkungan pengembangan terintegrasi (IDE) yang populer untuk analisis data dan
pemrograman dalam bahasa R. Dalam RStudio, visualisasi data biasanya dilakukan
menggunakan paket-paket grafik seperti ggplot2, plotly, atau ggvis. Proses visualisasi
ini biasanya melibatkan manipulasi data menggunakan fungsi-fungsi R, seperti
memfilter, mengelompokkan, dan menghitung statistik ringkasan sebelum membuat
grafik.
ISTILAH-ISTILAH
Berikut adalah beberapa istilah umum yang sering digunakan dalam visualisasi data menggunakan
RStudio:
1. Plot: Representasi visual dari data menggunakan simbol-simbol grafis seperti titik, garis, dan
bentuk geometris lainnya.
2. Grafik: Istilah yang umum digunakan secara luas untuk merujuk pada visualisasi data dalam
bentuk grafis.
3. Layer: Konsep dalam paket grafik ggplot2 di RStudio, di mana setiap komponen grafik
ditambahkan secara berurutan untuk membangun visualisasi data yang kompleks.
4. Aes (Aesthetic mappings): Pengaturan yang menghubungkan variabel dalam dataset dengan
elemen-elemen visual seperti warna, ukuran, atau bentuk dalam plot.
5. Geometri: Objek grafis yang digunakan untuk mewakili data dalam plot. Contoh geometri
termasuk titik, garis, bar, area, dan lain-lain.
6. Theme: Pengaturan estetika visual seperti font, warna latar belakang, dan ukuran font yang
digunakan dalam plot untuk memberikan tampilan yang konsisten dan menarik.
ISTILAH-ISTILAH
7. Facet: Memecah plot menjadi beberapa panel berdasarkan nilai variabel yang diberikan,
memungkinkan pembandingan antara subset data dengan lebih mudah.
8. ggplot2: Paket R yang populer digunakan untuk membuat visualisasi data yang kaya dan
fleksibel, terutama dengan pendekatan "grammar of graphics".
9. Plotly: Paket R yang memungkinkan pembuatan visualisasi data interaktif dan dinamis dalam
RStudio, dengan dukungan untuk berbagai jenis grafik.
10. ggplotly: Fungsi dalam paket plotly yang mengonversi plot ggplot2 menjadi plot interaktif
menggunakan plotly.
11. Shiny: Paket R untuk membuat aplikasi web interaktif dengan RStudio, yang memungkinkan
pengguna untuk mengeksplorasi data dan visualisasi dengan antarmuka yang ramah pengguna.
12. Leaflet: Paket R untuk membuat peta interaktif dalam RStudio menggunakan antarmuka
Leaflet JavaScript.
TUJUAN
Tujuan utama dari visualisasi data menggunakan RStudio adalah untuk mengubah data mentah
menjadi informasi yang dapat dimengerti dengan lebih baik melalui representasi grafis yang jelas
dan informatif. Beberapa tujuan spesifik dari visualisasi data menggunakan RStudio meliputi:
1. Memahami Data.
2. Mengidentifikasi Pola dan Anomali.
3. Komunikasi Informasi.
4. Mendukung Pengambilan Keputusan.
5. Validasi Model dan Hipotesis.
6. Menemukan Peluang dan Tantangan.
7. Membuat Laporan dan Presentasi.
Dengan demikian, tujuan visualisasi data menggunakan RStudio adalah untuk mengubah data
mentah menjadi informasi yang bermakna dan actionable, serta untuk mendukung pengambilan
keputusan yang berbasis data.
JENIS-JENIS VISUALISASI DATA
Terdapat banyak jenis visualisasi data yang dapat dibuat menggunakan RStudio,
tergantung pada jenis data yang dimiliki dan tujuan analisis data. Berikut beberapa
jenis visualisasi data umum yang sering digunakan:
1. Bar Plot/Diagram Batang.
2. Pie Chart/Diagram Lingkaran.
3. Line Chart/Diagram Garis.
4. Histogram.
5. Box Plot
6. Scatter Plot/Diagram Pencar
7. Steam and Leaf Plot/Diagram Batang dan Daun
Berikut data yang akan digunakan untuk membuat visualisasi data menggunakan Software
Rstudio:
Tabel 1.1 Pengaruh Gaya Belajar Terhadap Nilai IPK
gaya belajar ipk
visual 3.3
inestetik 3.25
visual 3.5
visual 3
auditorial 3.57
auditorial 3
kinestetik 3.5
kinestetik 3.6
kinestetik 3.2
visual 3.1
auditorial 3.75
visual 3
visual 4
visual 3
visual 3.5
visual 3.5
auditorial 3.7
auditorial 3.5
auditorial 3.4
auditorial 3.1
auditorial 3.8
auditorial 3.6
inestetik 3.55
kinestetik 3.45
kinestetik 3.54
visual 3.21
visual 3.67
visual 3.64
visual 3.45
visual 3.3
Bar Plot/Diagram Batang
Diagram batang atau bar plot adalah jenis grafik yang umum digunakan dalam visualisasi data
untuk membandingkan frekuensi atau jumlah dari beberapa kategori. Dalam bar plot, sumbu
horizontal digunakan untuk mewakili kategori atau variabel kategori, sementara sumbu vertikal
digunakan untuk mewakili frekuensi atau jumlah dari kategori-kategori tersebut. Dalam RStudio,
Kita dapat membuat bar plot menggunakan berbagai paket, tetapi salah satu yang paling umum
digunakan adalah ggplot2. Bar plot berguna dalam mengeksplorasi distribusi atau perbandingan
antara kategori-kategori dalam dataset, dan sering digunakan dalam berbagai analisis data dan
laporan. Dari data di atas Kita akan membuat diagram batang menggunakan Software RStudio.
Program:
#Memasukkan data
data <- data.frame(
gaya_belajar = c("visual", "inestetik", "visual", "visual",
"auditorial",
"auditorial", "kinestetik", "kinestetik",
"kinestetik",
"visual", "auditorial", "visual", "visual",
"visual",
"visual", "visual", "auditorial", "auditorial",
"auditorial",
"auditorial", "auditorial", "auditorial",
"inestetik",
"kinestetik", "kinestetik", "visual", "visual",
"visual",
"visual", "visual"),
ipk = c(3.30, 3.25, 3.50, 3.00, 3.57, 3.00, 3.50, 3.60, 3.20, 3.10,
3.75, 3.00, 4.00, 3.00, 3.50, 3.50, 3.70, 3.50, 3.40, 3.10,
3.80, 3.60, 3.55, 3.45, 3.54, 3.21, 3.67, 3.64, 3.45, 3.30)
)
data
#Membuat diagram batang
library(ggplot2)
library(dplyr)
# Menghitung rata-rata IPK untuk setiap gaya belajar
data_summary <- data %>%
group_by(gaya_belajar) %>%
summarise(rata_ipk = mean(ipk))
# Membuat diagram batang
ggplot(data_summary, aes(x = gaya_belajar, y = rata_ipk, fill
= gaya_belajar)) +
geom_bar(stat = "identity") +
labs(title = "Rata-rata IPK berdasarkan Gaya Belajar",
x = "Gaya Belajar",
y = "Rata-rata IPK") +
theme_minimal() +
theme(legend.position = "none")
Output:
Interpretasi:
Dari diagram disamping, Kita dapat
melihat bahwa gaya belajar kinestetik
memiliki rata-rata IPK yang paling tinggi
dibandingkan dengan gaya belajar lainnya,
diikuti oleh gaya belajar auditorial dan visual.
Gaya belajar inestetik memiliki rata-rata IPK
yang paling rendah. Grafik ini memberikan
informasi visual yang jelas tentang hubungan
antara gaya belajar dan kinerja akademik
(diwakili oleh IPK) mahasiswa. Dengan
demikian, dapat disimpulkan bahwa terdapat
perbedaan dalam kinerja akademik
berdasarkan gaya belajar, dengan gaya belajar
kinestetik menunjukkan kinerja yang lebih
tinggi secara rata-rata.
Pie Chart/Diagram Lingkaran
Diagram lingkaran atau pie chart adalah jenis grafik yang umum digunakan dalam visualisasi
data untuk menunjukkan komposisi atau perbandingan proporsional dari bagian-bagian yang
menyusun suatu keseluruhan. Dalam pie chart, area atau sudut dari setiap "potongan pie"
(bagian) adalah proporsional terhadap nilai yang diwakilinya dalam keseluruhan. Pie chart
bertujuan untuk menampilkan perbandingan antara kategori-kategori dalam dataset, jika Kita
ingin menunjukkan bagaimana bagian-bagian tersebut berkontribusi terhadap keseluruhan.
Dari data yang telah dipaparkan sebelumnya, Kita akan membuat diagram lingkaran menggunakan
Software RStudio.
Program:
#Memasukkan data
data <- data.frame(
gaya_belajar = c("visual", "inestetik", "visual",
"visual", "auditorial",
"auditorial", "kinestetik", "kinestetik",
"kinestetik",
"visual", "auditorial", "visual", "visual",
"visual",
"visual", "visual", "auditorial", "auditorial",
"auditorial",
"auditorial", "auditorial", "auditorial",
"inestetik",
"kinestetik", "kinestetik", "visual", "visual",
"visual",
"visual", "visual"),
ipk = c(3.30, 3.25, 3.50, 3.00, 3.57, 3.00, 3.50, 3.60, 3.20,
3.10,
3.75, 3.00, 4.00, 3.00, 3.50, 3.50, 3.70, 3.50, 3.40, 3.10,
3.80, 3.60, 3.55, 3.45, 3.54, 3.21, 3.67, 3.64, 3.45, 3.30)
)
data
# Membuat diagram lingkaran
installed.packages("plotly")
library(plotly)
# Menghitung jumlah mahasiswa untuk setiap gaya belajar
data_count <- data %>%
group_by(gaya_belajar) %>%
summarise(jumlah_mahasiswa = n())
# Membuat diagram lingkaran
plot_ly(data_count, labels = ~gaya_belajar, values =
~jumlah_mahasiswa, type = 'pie') %>%
layout(title = "Jumlah Mahasiswa berdasarkan Gaya Belajar")
Output:
Interpretasi:
Program di atas dimulai dengan mendefinisikan sebuah data
frame yang berisi dua kolom yakni gaya_belajar dan ipk. Kolom
gaya_belajar berisi jenis gaya belajar setiap mahasiswa, sedangkan
kolom ipk berisi nilai Indeks Prestasi Kumulatif (IPK) dari setiap
mahasiswa. Kemudian, program tersebut menghitung jumlah
mahasiswa untuk setiap jenis gaya belajar menggunakan fungsi
group_by() dan summarise() dari paket dplyr. Hasilnya disimpan
dalam data frame baru yang disebut data_count. Kemudian,
program membuat diagram lingkaran menggunakan plot_ly() dari
paket plotly. Diagram lingkaran akan menampilkan jumlah
mahasiswa untuk setiap jenis gaya belajar. Layout diagram
lingkaran disesuaikan dengan menambahkan judul "Jumlah
Mahasiswa berdasarkan Gaya Belajar". Dari data yang diberikan,
diagram lingkaran tersebut menunjukkan distribusi jumlah
mahasiswa berdasarkan jenis gaya belajar. Mayoritas mahasiswa
cenderung memiliki gaya belajar visual, diikuti oleh gaya belajar
auditorial lalu kinestetik dan terakhir inestetik dengan persentase
sebesar 46,7% untuk gaya belajar visual, 30% gaya belajar
auditorial, 16,7% gaya belajar kinestetik dan 6,67% untuk gaya
belajar inestetik.
Line Chart/Diagram Garis
Diagram garis, atau line chart, adalah jenis grafik yang digunakan untuk menampilkan
perubahan nilai variabel seiring waktu atau kondisi lainnya. Dalam line chart, sumbu horizontal
biasanya mewakili waktu atau kondisi lainnya (misalnya, kategori atau variabel independen),
sementara sumbu vertikal mewakili nilai dari variabel yang diamati. Berikut data yang akan
digunakan untuk membuat diagram garis.
Tabel 1.2 Volume Air yang Disalurkan Perusahan Untuk Wilayah Sulawesi Tenggara
Tahun volume air yang disalurkan (M^3)
2018 12417
2019 14642
2020 15439
2021 17519
Output:
# Membaca data dari file CSV
data <- read.csv("D:/DataPPT1.csv", header = TRUE, sep = ";")
Data
# Membuat diagram garis
library(ggplot2)
ggplot(data, aes(x = Tahun, y = volume.air.yang.disalurkan..M.3.)) +
geom_line(color = "skyblue") +
geom_point(color = "purple") +
labs(title = "Volume Air yang Disalurkan per Tahun", x =
"Tahun", y = "Volume Air yang disalurkan (m^3)")
Program:
Interpretasi:
Program dimulai dengan membaca data dari file CSV "D:/DataPPT1.csv" menggunakan fungsi
read.csv(). Data kemudian disimpan dalam variabel data. Data tersebut kemudian dicetak ke konsol,
menampilkan struktur data yang dimuat. Setelah itu, paket ggplot2 dimuat menggunakan library(ggplot2).
Kemudian, sebuah diagram garis dibuat menggunakan ggplot2 dengan menggunakan data yang dimuat
sebelumnya. Diagram garis ini menunjukkan volume air yang disalurkan perusahaan air terhadap provinsi
Sulawesi Tenggara per tahun. Garis pada plot diwarnai dengan skyblue, sementara titik-titik data diwarnai
dengan purple. Judul dan label sumbu juga ditambahkan untuk menjelaskan plot tersebut. Dari diagram
garis di atas dapat dilihat bahwa jumlah air yang disalurkan Perusahaan untuk wilayah Sulawesi Tenggara
per tahunnya mengalami perubahan. Dimana pada tahun 2018 Perusahaan tersebut menyalurkan air
sebesar 12.417M3, pada tahun 2019 Perusahaan tersebut menyalurkan air sebesar 14.642 M3, pada tahun
2020 Perusahaan tersebut menyalurkan air sebesar 15.439 M3 dan pada tahun 2021 Perusahaan tersebut
menyalurkan air sebesar 17.519 M3.
Histogram
Histogram adalah jenis grafik yang digunakan untuk menampilkan distribusi frekuensi atau
probabilitas dari suatu variabel kontinu. Dalam histogram, rentang nilai variabel dibagi menjadi
interval atau "bin", dan tinggi dari setiap bar di histogram mewakili frekuensi atau probabilitas
kemunculan nilai-nilai dalam interval tersebut. Dalam konteks visualisasi data menggunakan
RStudio, KIta dapat membuat histogram menggunakan fungsi geom_histogram() dari paket ggplot2.
Berikut data yang akan digunakan untuk membuat histogram menggunakan Software Rstudio.
Tabel 1.3 Pendapatan Tahunan Penduduk DIY
Nilai frekuensi Batas bawah Batas atas Frekuesni kumulatif Jumlah data (n)
15-20 6 14,5 20,5 6 90
21-26 14 20,5 26,5 20
27-32 24 26,5 32,5 44
33-38 25 32,5 38,5 69
39-44 10 38,5 44,5 79
45-50 7 44,5 50,5 86
51-56 4 50,5 56,5 90
jumlah 90
Program:
# Membuat data
data <- data.frame(
Kelompok = c("15-20", "21-26", "27-32", "33-38", "39-44", "45-50", "51-56"),
Frekuensi = c(6, 14, 24, 25, 10, 7, 4),
Batas_Bawah = c(14.5, 20.5, 26.5, 32.5, 38.5, 44.5, 50.5),
Batas_Atas = c(20.5, 26.5, 32.5, 38.5, 44.5, 50.5, 56.5),
Frekuensi_Kumulatif = c(6, 20, 44, 69, 79, 86, 90))data
# Memperkirakan titik Tengah
data$Titik_Tengah <- (data$Batas_Bawah + data$Batas_Atas) / 2
# Membuat histogram
library(ggplot2)
ggplot(data, aes(x = Titik_Tengah, y = Frekuensi)) + geom_bar(stat = "identity", fill = "blue", color = "black") + labs(title =
"Histogram Pendapatan Tahunan Penduduk DIY", x = "Nilai", y = "Frekuensi")
Output:
Interpretasi:
Program R di atas menciptakan data frame yang berisi
informasi tentang kelompok pendapatan tahunan penduduk
DIY, frekuensi masing-masing kelompok, batas bawah dan
batas atas setiap kelompok, serta frekuensi kumulatif.
Program akan menambahkan kolom baru bernama
"Titik_Tengah" ke data frame dengan menggunakan rumus
penjumlahan batas bawah dan batas atas setiap kelompok,
kemudian membaginya dengan 2. Program menggunakan
library ggplot2 untuk membuat histogram. Gambar yang
dihasilkan akan menjadi histogram dari data pendapatan
tahunan penduduk DIY. Sumbu x akan mewakili nilai atau
titik tengah untuk setiap kelompok pendapatan (misalnya,
17.5 untuk kelompok 15-20). Sumbu y akan mewakili
frekuensi (jumlah individu dalam setiap kelompok). Setiap
baris pada histogram akan mewakili satu kelompok
pendapatan dengan warna biru dan garis tepi hitam. Dari
histogram disamping dapat dilihat bahwa Histogram
berdistribusi normal yang ditandai dengan bentuk kurva
yang hampir sempurna.
Boxplot
Boxplot, juga dikenal sebagai diagram kotak dan jangkauan, adalah salah satu teknik visualisasi
data yang digunakan untuk meringkas distribusi data numerik dengan cara grafis. Boxplot
memberikan gambaran tentang sejumlah statistik deskriptif kunci dari data, seperti nilai median,
kuartil, jangkauan, serta deteksi outlier (pencilan). Dalam boxplot, data dikelompokkan ke dalam
kuartil, yaitu kuartil bawah (Q1), median (Q2), dan kuartil atas (Q3). Garis dalam kotak
menunjukkan median, sedangkan kotak menunjukkan jangkauan antara kuartil pertama dan
ketiga (Q1 dan Q3). Garis-garis di luar kotak, yang disebut 'whiskers', menunjukkan rentang data
yang dianggap normal. Adanya titik-titik di luar whiskers menandakan adanya outlier. Berikut
data yang digunakan untuk membuat boxplot di Rstudio.
Tabel 1.5 Data Hasil Belajar Statistika
Program:
# Membaca data dari file CSV
data <- read.csv("D:/DataBoxplot.csv", header = TRUE, sep = ";") data
# Membuat boxplot
library(ggplot2)
ggplot(data, aes(x = "", y = Hasil.Belajar.Statistika)) + geom_boxplot(fill = "orange",
color = "blue") + labs(title = "Boxplot Hasil Belajar Statistika", x = "", y =
"Hasil Belajar Statistika")
Hasil Belajar Statistika
82
80
78
70
75
85
78
78
84
86
79
90
77
72
85
Output:
Interpretasi:
Program R di atas membaca data dari file CSV yang disimpan
di lokasi "D:/DataBoxplot.csv". Opsi "header = TRUE"
menunjukkan bahwa file CSV memiliki baris header, dan "sep =
";" menunjukkan bahwa data dalam file dipisahkan oleh tanda
titik koma. Setelah membaca data, program mencetak tabel yang
berisi satu kolom dengan judul "Hasil.Belajar.Statistika".
Program kemudian menggunakan library ggplot2 untuk
membuat boxplot dari data yang telah dibaca. Dalam kode ggplot,
"x = "" dan "y = Hasil.Belajar.Statistika" menentukan variabel
yang akan digunakan pada sumbu x dan sumbu y masing-
masing. Dalam hal ini, x tidak memiliki nilai (ditandai dengan
""), sedangkan y adalah kolom "Hasil.Belajar.Statistika". Opsi
"fill = 'orange'" dan "color = 'blue'" mengatur warna latar
belakang dan garis dalam boxplot. Ini memberikan estetika
visual pada grafik. Labs() digunakan untuk memberi judul pada
grafik, serta label untuk sumbu x dan sumbu y. Dari boxplot di
atas dapat Kita lihat bahwa datanya cenderung tidak
berdistribusi normal. Oleh karena itu, perlu dilakukan
transformasi data agar dihasilkan boxplot yang mendekati
distribusi normal
Scatter Plot/Diagram Pencar
Diagram pencar (scatter plot) adalah salah satu jenis plot yang digunakan dalam visualisasi data
untuk menampilkan hubungan antara dua variabel numerik. Dalam scatter plot, setiap titik
mewakili satu pengamatan dan posisinya ditentukan oleh nilai dari dua variabel tersebut. Scatter
plot sangat berguna untuk menunjukkan pola atau hubungan antara dua variabel, seperti
korelasi, distribusi, atau tren. Berikut data yang akan digunakan untuk membuat diagram
pencar di RStudio.
Tabel 1.6 Pengaruh Kemampuan Matematika (x) terhadap Hasil Belajar Statistika (y)
Hasil Belajar Statistika (y) Kemampuan Matematika (x)
82 73
80 74
78 79
70 73
75 70
85 79
78 77
78 78
84 77
86 85
Program:
# Membaca data dari file CSV
data <- read.csv("D:/DataDiagramPencar.csv", header
= TRUE, sep = ";")
Data
# Membuat scatter plot
ggplot(data, aes(x = Kemampuan.Matematika..x., y =
Hasil.Belajar.Statistika..y.)) +
geom_point(color = "brown") +
geom_smooth(method = "lm", se = FALSE, color =
"blue") +
labs(title = "Diagram Pencar Hasil Belajar Statistika vs
Kemampuan Matematika", x = "Kemampuan
Matematika", y = "Hasil Belajar Statistika")
Output:
Interpretasi:
Program di atas menggunakan bahasa pemrograman R untuk membaca data dari file CSV yang disebut
"DataDiagramPencar.csv". Data tersebut kemudian disimpan dalam variabel "data". Setelah membaca
data, program menampilkan 10 baris pertama dari data menggunakan perintah "data". Setiap baris terdiri
dari dua kolom yakni "Hasil.Belajar.Statistika..y." dan "Kemampuan.Matematika..x.". Ini menunjukkan
hasil belajar statistika dan kemampuan matematika masing-masing siswa. Selanjutnya, program membuat
scatter plot dengan garis regresi menggunakan paket ggplot2. Scatter plot ini mencerminkan hubungan antara
"Hasil.Belajar.Statistika..y." dan "Kemampuan.Matematika..x.". Garis regresi ditambahkan untuk
memvisualisasikan hubungan linear antara kedua variabel ini. Dalam perintah ggplot, kita menggunakan
estetika (aes) untuk menentukan variabel x dan y yang akan digunakan dalam scatter plot. Kemudian, kita
menambahkan geom_point untuk menampilkan titik-titik data sebagai scatter plot. Warna titik adalah coklat.
Selanjutnya, kita menggunakan geom_smooth dengan metode regresi linier (lm) untuk menambahkan garis
regresi ke scatter plot. Parameter se = FALSE menghilangkan konfiden interval garis regresi, dan warna
garis adalah biru. Kemudian, kita menggunakan labs untuk memberi judul pada grafik, serta label sumbu x
dan y. Dari scatter plot di atas dapat Kita lihat bahwa plot tersebut menunjukkan hubungan yang positif,
dimana peningkatan yang terjadi pada variabel 1 juga diikuti peningkatan pada variabel 2. Dan jika variabel
1 mengalami penurunan, variabel 2 juga mengalami penurunan
Diagram Batang dan Daun
Steam and leaf plot, juga dikenal sebagai steamplot, adalah metode visualisasi
sederhana yang digunakan untuk menampilkan distribusi data numerik. Plot ini
sering digunakan dalam eksplorasi data dan analisis statistik deskriptif. Steamplot
menggabungkan elemen dari diagram batang dan daun (stem and leaf display)
dengan histogram. Cara kerja steamplot hampir sama dengan histogram, di mana
data dikelompokkan ke dalam interval. Namun, alih-alih menggunakan batang
vertikal, steamplot menggunakan angka untuk mewakili batang dan daun. Digit
pertama disebut "stem" dan digit kedua disebut "leaf". Berikut data yang akan
digunakan untuk membuat diagram batang dan daun menggunakan Rstudio.
Tabel 1.6 data kemampuan Matematika
Kemampuan Matematika
73
74
79
73
70
79
77
78
77
85
77
85
76
69
82
74
74
80
75
80
69
81
77
73
80
79
70
81
76
73
Program:
# Membaca data dari file CSV
data <- read.csv("D:/DataDiagramBatangDaun.csv", header =
TRUE, sep = ";")
Data
#Membuat diagram batang dan daun
stem(data$Kemampuan.Matematika)
Output:
Interpretasi:
Program tersebut menggunakan bahasa pemrograman R untuk membaca
data dari file CSV yang berjudul "DataDiagramBatangDaun.csv". File CSV ini
berisi data kemampuan matematika dengan header yang menunjukkan kolom
"Kemampuan.Matematika". Dalam program tersebut, fungsi read.csv()
digunakan untuk membaca data dari file CSV. Parameter yang diberikan
adalah lokasi file, yaitu "D:/DataDiagramBatangDaun.csv", serta beberapa
opsi seperti header = TRUE untuk menunjukkan bahwa file memiliki header,
dan sep = ";" untuk menentukan pemisah koma dalam file CSV. Setelah
membaca data, program mencetak data yang telah dibaca menggunakan
perintah data. Ini akan menampilkan tabel dengan dua kolom: satu kolom
untuk indeks (mulai dari 1 hingga 30) dan satu kolom lainnya untuk nilai
kemampuan matematika. Selanjutnya, program menggunakan fungsi stem()
untuk membuat diagram batang dan daun dari data kemampuan matematika.
Diagram ini akan menampilkan distribusi frekuensi nilai-nilai kemampuan
matematika dalam bentuk batang dan daun. Dari diagram tersebut, Kita dapat
melihat sebaran nilai Kemampuan Matematika dari data. Dimana nilai-nlai tersebut
terkonsentrasi di rentang 70-80, dengan beberapa nilai di atas dan di bawah rentang
tersebut.
stem(data$Kemampuan.Matematika)
The decimal point is at the |
68 | 00
70 | 00
72 | 0000
74 | 0000
76 | 000000
78 | 0000
80 | 00000
82 | 0
84 | 00
PPT 2 Komputasi Statistik_Wa Ode Syaidatul Auliah_F1A222020.pptx

More Related Content

Similar to PPT 2 Komputasi Statistik_Wa Ode Syaidatul Auliah_F1A222020.pptx

TM pengolahan citra digital
TM pengolahan citra digitalTM pengolahan citra digital
TM pengolahan citra digital
hegie13
 
TM pengolahan citra digital
TM pengolahan citra digitalTM pengolahan citra digital
TM pengolahan citra digital
Fiki Mardani
 
Analisa spasial -_vektor
Analisa spasial -_vektorAnalisa spasial -_vektor
Analisa spasial -_vektor
Irma Wahyuni
 
Presentasi (sistem pengolahan data spasial dengan arc view)
Presentasi (sistem pengolahan data spasial dengan arc view)Presentasi (sistem pengolahan data spasial dengan arc view)
Presentasi (sistem pengolahan data spasial dengan arc view)Isya Ansyari
 
Pengantar R
Pengantar RPengantar R
Pengantar R
Raden Maulana
 
Pertemuan 1 revisijan2013-mhs
Pertemuan 1 revisijan2013-mhsPertemuan 1 revisijan2013-mhs
Pertemuan 1 revisijan2013-mhs
Bina Sarana Informatika
 
MAKALAH DIAGRAM DAN GRAFIK STATISTIK PENDIDIKAN
MAKALAH DIAGRAM DAN GRAFIK STATISTIK PENDIDIKANMAKALAH DIAGRAM DAN GRAFIK STATISTIK PENDIDIKAN
MAKALAH DIAGRAM DAN GRAFIK STATISTIK PENDIDIKAN
Putriana Sari
 
Bab v
Bab vBab v
tugas matematika
tugas matematikatugas matematika
tugas matematika
muazis febrianto
 
Ayuk pcd
Ayuk pcdAyuk pcd
Ayuk pcd
ayuxdewi89
 
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
Arif Rahman
 
Pengantar Visualisasi Data 2024 Terbaru.pptx
Pengantar Visualisasi Data 2024 Terbaru.pptxPengantar Visualisasi Data 2024 Terbaru.pptx
Pengantar Visualisasi Data 2024 Terbaru.pptx
NandaNursyahAlam
 
Bab 2 (penyajian data dan aplikasi pada data penelitian)
Bab 2 (penyajian data dan aplikasi pada data penelitian)Bab 2 (penyajian data dan aplikasi pada data penelitian)
Bab 2 (penyajian data dan aplikasi pada data penelitian)
fatria anggita
 
Makalah statistik
Makalah statistikMakalah statistik
Makalah statistik
roji muhidin
 
Mater-4-Visualisasi-Data-1Mater-4-Visualisasi-Data-1.pdf
Mater-4-Visualisasi-Data-1Mater-4-Visualisasi-Data-1.pdfMater-4-Visualisasi-Data-1Mater-4-Visualisasi-Data-1.pdf
Mater-4-Visualisasi-Data-1Mater-4-Visualisasi-Data-1.pdf
MerindaLestandySKom
 
Pertemuan 9 - Report Chart
Pertemuan 9 - Report ChartPertemuan 9 - Report Chart
Pertemuan 9 - Report Chart
Adi Triyatmoko
 
Laporan 1 penngantar program r
Laporan 1 penngantar program rLaporan 1 penngantar program r
Laporan 1 penngantar program r
Khair Norrasid
 
Penyajian data dalam diagram
Penyajian data dalam diagramPenyajian data dalam diagram
Penyajian data dalam diagram
RipangiRipangi
 
P4_Penyajian Data_Diagram dan Grafik
P4_Penyajian Data_Diagram dan GrafikP4_Penyajian Data_Diagram dan Grafik
P4_Penyajian Data_Diagram dan Grafik
M. Jainuri, S.Pd., M.Pd
 

Similar to PPT 2 Komputasi Statistik_Wa Ode Syaidatul Auliah_F1A222020.pptx (20)

TM pengolahan citra digital
TM pengolahan citra digitalTM pengolahan citra digital
TM pengolahan citra digital
 
TM pengolahan citra digital
TM pengolahan citra digitalTM pengolahan citra digital
TM pengolahan citra digital
 
Analisa spasial -_vektor
Analisa spasial -_vektorAnalisa spasial -_vektor
Analisa spasial -_vektor
 
Presentasi (sistem pengolahan data spasial dengan arc view)
Presentasi (sistem pengolahan data spasial dengan arc view)Presentasi (sistem pengolahan data spasial dengan arc view)
Presentasi (sistem pengolahan data spasial dengan arc view)
 
Pengantar R
Pengantar RPengantar R
Pengantar R
 
Pertemuan 1 revisijan2013-mhs
Pertemuan 1 revisijan2013-mhsPertemuan 1 revisijan2013-mhs
Pertemuan 1 revisijan2013-mhs
 
MAKALAH DIAGRAM DAN GRAFIK STATISTIK PENDIDIKAN
MAKALAH DIAGRAM DAN GRAFIK STATISTIK PENDIDIKANMAKALAH DIAGRAM DAN GRAFIK STATISTIK PENDIDIKAN
MAKALAH DIAGRAM DAN GRAFIK STATISTIK PENDIDIKAN
 
Bab v
Bab vBab v
Bab v
 
tugas matematika
tugas matematikatugas matematika
tugas matematika
 
Ayuk pcd
Ayuk pcdAyuk pcd
Ayuk pcd
 
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 06
 
Pengantar Visualisasi Data 2024 Terbaru.pptx
Pengantar Visualisasi Data 2024 Terbaru.pptxPengantar Visualisasi Data 2024 Terbaru.pptx
Pengantar Visualisasi Data 2024 Terbaru.pptx
 
R1
R1R1
R1
 
Bab 2 (penyajian data dan aplikasi pada data penelitian)
Bab 2 (penyajian data dan aplikasi pada data penelitian)Bab 2 (penyajian data dan aplikasi pada data penelitian)
Bab 2 (penyajian data dan aplikasi pada data penelitian)
 
Makalah statistik
Makalah statistikMakalah statistik
Makalah statistik
 
Mater-4-Visualisasi-Data-1Mater-4-Visualisasi-Data-1.pdf
Mater-4-Visualisasi-Data-1Mater-4-Visualisasi-Data-1.pdfMater-4-Visualisasi-Data-1Mater-4-Visualisasi-Data-1.pdf
Mater-4-Visualisasi-Data-1Mater-4-Visualisasi-Data-1.pdf
 
Pertemuan 9 - Report Chart
Pertemuan 9 - Report ChartPertemuan 9 - Report Chart
Pertemuan 9 - Report Chart
 
Laporan 1 penngantar program r
Laporan 1 penngantar program rLaporan 1 penngantar program r
Laporan 1 penngantar program r
 
Penyajian data dalam diagram
Penyajian data dalam diagramPenyajian data dalam diagram
Penyajian data dalam diagram
 
P4_Penyajian Data_Diagram dan Grafik
P4_Penyajian Data_Diagram dan GrafikP4_Penyajian Data_Diagram dan Grafik
P4_Penyajian Data_Diagram dan Grafik
 

Recently uploaded

1.2 Merdeka Belajar certificate-1.pdf sertifikat
1.2 Merdeka Belajar certificate-1.pdf sertifikat1.2 Merdeka Belajar certificate-1.pdf sertifikat
1.2 Merdeka Belajar certificate-1.pdf sertifikat
imronalfarizi48
 
Rangkuman Buku “KORUPSI Melacak Arti, Menyimak Implikasi” Oleh : B. HERRY PR...
Rangkuman Buku “KORUPSI Melacak Arti, Menyimak Implikasi”  Oleh : B. HERRY PR...Rangkuman Buku “KORUPSI Melacak Arti, Menyimak Implikasi”  Oleh : B. HERRY PR...
Rangkuman Buku “KORUPSI Melacak Arti, Menyimak Implikasi” Oleh : B. HERRY PR...
attikahgzl
 
Dampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptx
Dampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptxDampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptx
Dampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptx
sidiqhardianto1181
 
anamnesa-dan-pemeriksaan-fisik-penderita-urologi.ppt
anamnesa-dan-pemeriksaan-fisik-penderita-urologi.pptanamnesa-dan-pemeriksaan-fisik-penderita-urologi.ppt
anamnesa-dan-pemeriksaan-fisik-penderita-urologi.ppt
DianIslamiatiIswan1
 
Contoh pengisian Formulir metadataq.pptx
Contoh pengisian Formulir metadataq.pptxContoh pengisian Formulir metadataq.pptx
Contoh pengisian Formulir metadataq.pptx
4301170149rizkiekose
 
Materi lokmin klaster 4 puskesmas gajah 1
Materi lokmin klaster 4 puskesmas gajah 1Materi lokmin klaster 4 puskesmas gajah 1
Materi lokmin klaster 4 puskesmas gajah 1
RizkyAji15
 
Artificial Neural Network Backpropafation
Artificial Neural Network BackpropafationArtificial Neural Network Backpropafation
Artificial Neural Network Backpropafation
muhandhis1
 
power point HUKUM DAN KEKUASAAN PPT.pptx
power point HUKUM DAN KEKUASAAN PPT.pptxpower point HUKUM DAN KEKUASAAN PPT.pptx
power point HUKUM DAN KEKUASAAN PPT.pptx
MamaDanish2
 
688868224-Template-Ppt-Sidang-Skripsi-part-2.pptx
688868224-Template-Ppt-Sidang-Skripsi-part-2.pptx688868224-Template-Ppt-Sidang-Skripsi-part-2.pptx
688868224-Template-Ppt-Sidang-Skripsi-part-2.pptx
SitiLaila11
 

Recently uploaded (9)

1.2 Merdeka Belajar certificate-1.pdf sertifikat
1.2 Merdeka Belajar certificate-1.pdf sertifikat1.2 Merdeka Belajar certificate-1.pdf sertifikat
1.2 Merdeka Belajar certificate-1.pdf sertifikat
 
Rangkuman Buku “KORUPSI Melacak Arti, Menyimak Implikasi” Oleh : B. HERRY PR...
Rangkuman Buku “KORUPSI Melacak Arti, Menyimak Implikasi”  Oleh : B. HERRY PR...Rangkuman Buku “KORUPSI Melacak Arti, Menyimak Implikasi”  Oleh : B. HERRY PR...
Rangkuman Buku “KORUPSI Melacak Arti, Menyimak Implikasi” Oleh : B. HERRY PR...
 
Dampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptx
Dampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptxDampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptx
Dampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptx
 
anamnesa-dan-pemeriksaan-fisik-penderita-urologi.ppt
anamnesa-dan-pemeriksaan-fisik-penderita-urologi.pptanamnesa-dan-pemeriksaan-fisik-penderita-urologi.ppt
anamnesa-dan-pemeriksaan-fisik-penderita-urologi.ppt
 
Contoh pengisian Formulir metadataq.pptx
Contoh pengisian Formulir metadataq.pptxContoh pengisian Formulir metadataq.pptx
Contoh pengisian Formulir metadataq.pptx
 
Materi lokmin klaster 4 puskesmas gajah 1
Materi lokmin klaster 4 puskesmas gajah 1Materi lokmin klaster 4 puskesmas gajah 1
Materi lokmin klaster 4 puskesmas gajah 1
 
Artificial Neural Network Backpropafation
Artificial Neural Network BackpropafationArtificial Neural Network Backpropafation
Artificial Neural Network Backpropafation
 
power point HUKUM DAN KEKUASAAN PPT.pptx
power point HUKUM DAN KEKUASAAN PPT.pptxpower point HUKUM DAN KEKUASAAN PPT.pptx
power point HUKUM DAN KEKUASAAN PPT.pptx
 
688868224-Template-Ppt-Sidang-Skripsi-part-2.pptx
688868224-Template-Ppt-Sidang-Skripsi-part-2.pptx688868224-Template-Ppt-Sidang-Skripsi-part-2.pptx
688868224-Template-Ppt-Sidang-Skripsi-part-2.pptx
 

PPT 2 Komputasi Statistik_Wa Ode Syaidatul Auliah_F1A222020.pptx

  • 1. Statistik Deskriptif dan Inferensial WA ODE SYAIDATUL AULIAH (F1A222020) 2024
  • 3. DEFINISI Visualisasi data adalah representasi grafis dari informasi dan data numerik. Ini melibatkan penggunaan berbagai jenis grafik, plot, dan diagram untuk menggambarkan pola, tren, dan hubungan dalam dataset. Visualisasi data dalam RStudio adalah proses membuat grafik, plot, atau diagram yang menggambarkan informasi dari dataset menggunakan bahasa pemrograman R. RStudio adalah lingkungan pengembangan terintegrasi (IDE) yang populer untuk analisis data dan pemrograman dalam bahasa R. Dalam RStudio, visualisasi data biasanya dilakukan menggunakan paket-paket grafik seperti ggplot2, plotly, atau ggvis. Proses visualisasi ini biasanya melibatkan manipulasi data menggunakan fungsi-fungsi R, seperti memfilter, mengelompokkan, dan menghitung statistik ringkasan sebelum membuat grafik.
  • 4. ISTILAH-ISTILAH Berikut adalah beberapa istilah umum yang sering digunakan dalam visualisasi data menggunakan RStudio: 1. Plot: Representasi visual dari data menggunakan simbol-simbol grafis seperti titik, garis, dan bentuk geometris lainnya. 2. Grafik: Istilah yang umum digunakan secara luas untuk merujuk pada visualisasi data dalam bentuk grafis. 3. Layer: Konsep dalam paket grafik ggplot2 di RStudio, di mana setiap komponen grafik ditambahkan secara berurutan untuk membangun visualisasi data yang kompleks. 4. Aes (Aesthetic mappings): Pengaturan yang menghubungkan variabel dalam dataset dengan elemen-elemen visual seperti warna, ukuran, atau bentuk dalam plot. 5. Geometri: Objek grafis yang digunakan untuk mewakili data dalam plot. Contoh geometri termasuk titik, garis, bar, area, dan lain-lain. 6. Theme: Pengaturan estetika visual seperti font, warna latar belakang, dan ukuran font yang digunakan dalam plot untuk memberikan tampilan yang konsisten dan menarik.
  • 5. ISTILAH-ISTILAH 7. Facet: Memecah plot menjadi beberapa panel berdasarkan nilai variabel yang diberikan, memungkinkan pembandingan antara subset data dengan lebih mudah. 8. ggplot2: Paket R yang populer digunakan untuk membuat visualisasi data yang kaya dan fleksibel, terutama dengan pendekatan "grammar of graphics". 9. Plotly: Paket R yang memungkinkan pembuatan visualisasi data interaktif dan dinamis dalam RStudio, dengan dukungan untuk berbagai jenis grafik. 10. ggplotly: Fungsi dalam paket plotly yang mengonversi plot ggplot2 menjadi plot interaktif menggunakan plotly. 11. Shiny: Paket R untuk membuat aplikasi web interaktif dengan RStudio, yang memungkinkan pengguna untuk mengeksplorasi data dan visualisasi dengan antarmuka yang ramah pengguna. 12. Leaflet: Paket R untuk membuat peta interaktif dalam RStudio menggunakan antarmuka Leaflet JavaScript.
  • 6. TUJUAN Tujuan utama dari visualisasi data menggunakan RStudio adalah untuk mengubah data mentah menjadi informasi yang dapat dimengerti dengan lebih baik melalui representasi grafis yang jelas dan informatif. Beberapa tujuan spesifik dari visualisasi data menggunakan RStudio meliputi: 1. Memahami Data. 2. Mengidentifikasi Pola dan Anomali. 3. Komunikasi Informasi. 4. Mendukung Pengambilan Keputusan. 5. Validasi Model dan Hipotesis. 6. Menemukan Peluang dan Tantangan. 7. Membuat Laporan dan Presentasi. Dengan demikian, tujuan visualisasi data menggunakan RStudio adalah untuk mengubah data mentah menjadi informasi yang bermakna dan actionable, serta untuk mendukung pengambilan keputusan yang berbasis data.
  • 7. JENIS-JENIS VISUALISASI DATA Terdapat banyak jenis visualisasi data yang dapat dibuat menggunakan RStudio, tergantung pada jenis data yang dimiliki dan tujuan analisis data. Berikut beberapa jenis visualisasi data umum yang sering digunakan: 1. Bar Plot/Diagram Batang. 2. Pie Chart/Diagram Lingkaran. 3. Line Chart/Diagram Garis. 4. Histogram. 5. Box Plot 6. Scatter Plot/Diagram Pencar 7. Steam and Leaf Plot/Diagram Batang dan Daun
  • 8. Berikut data yang akan digunakan untuk membuat visualisasi data menggunakan Software Rstudio: Tabel 1.1 Pengaruh Gaya Belajar Terhadap Nilai IPK gaya belajar ipk visual 3.3 inestetik 3.25 visual 3.5 visual 3 auditorial 3.57 auditorial 3 kinestetik 3.5 kinestetik 3.6 kinestetik 3.2 visual 3.1 auditorial 3.75 visual 3
  • 9. visual 4 visual 3 visual 3.5 visual 3.5 auditorial 3.7 auditorial 3.5 auditorial 3.4 auditorial 3.1 auditorial 3.8 auditorial 3.6 inestetik 3.55 kinestetik 3.45 kinestetik 3.54 visual 3.21 visual 3.67 visual 3.64 visual 3.45 visual 3.3
  • 10. Bar Plot/Diagram Batang Diagram batang atau bar plot adalah jenis grafik yang umum digunakan dalam visualisasi data untuk membandingkan frekuensi atau jumlah dari beberapa kategori. Dalam bar plot, sumbu horizontal digunakan untuk mewakili kategori atau variabel kategori, sementara sumbu vertikal digunakan untuk mewakili frekuensi atau jumlah dari kategori-kategori tersebut. Dalam RStudio, Kita dapat membuat bar plot menggunakan berbagai paket, tetapi salah satu yang paling umum digunakan adalah ggplot2. Bar plot berguna dalam mengeksplorasi distribusi atau perbandingan antara kategori-kategori dalam dataset, dan sering digunakan dalam berbagai analisis data dan laporan. Dari data di atas Kita akan membuat diagram batang menggunakan Software RStudio.
  • 11. Program: #Memasukkan data data <- data.frame( gaya_belajar = c("visual", "inestetik", "visual", "visual", "auditorial", "auditorial", "kinestetik", "kinestetik", "kinestetik", "visual", "auditorial", "visual", "visual", "visual", "visual", "visual", "auditorial", "auditorial", "auditorial", "auditorial", "auditorial", "auditorial", "inestetik", "kinestetik", "kinestetik", "visual", "visual", "visual", "visual", "visual"), ipk = c(3.30, 3.25, 3.50, 3.00, 3.57, 3.00, 3.50, 3.60, 3.20, 3.10, 3.75, 3.00, 4.00, 3.00, 3.50, 3.50, 3.70, 3.50, 3.40, 3.10, 3.80, 3.60, 3.55, 3.45, 3.54, 3.21, 3.67, 3.64, 3.45, 3.30) ) data #Membuat diagram batang library(ggplot2) library(dplyr) # Menghitung rata-rata IPK untuk setiap gaya belajar data_summary <- data %>% group_by(gaya_belajar) %>% summarise(rata_ipk = mean(ipk)) # Membuat diagram batang ggplot(data_summary, aes(x = gaya_belajar, y = rata_ipk, fill = gaya_belajar)) + geom_bar(stat = "identity") + labs(title = "Rata-rata IPK berdasarkan Gaya Belajar", x = "Gaya Belajar", y = "Rata-rata IPK") + theme_minimal() + theme(legend.position = "none")
  • 12. Output: Interpretasi: Dari diagram disamping, Kita dapat melihat bahwa gaya belajar kinestetik memiliki rata-rata IPK yang paling tinggi dibandingkan dengan gaya belajar lainnya, diikuti oleh gaya belajar auditorial dan visual. Gaya belajar inestetik memiliki rata-rata IPK yang paling rendah. Grafik ini memberikan informasi visual yang jelas tentang hubungan antara gaya belajar dan kinerja akademik (diwakili oleh IPK) mahasiswa. Dengan demikian, dapat disimpulkan bahwa terdapat perbedaan dalam kinerja akademik berdasarkan gaya belajar, dengan gaya belajar kinestetik menunjukkan kinerja yang lebih tinggi secara rata-rata.
  • 13. Pie Chart/Diagram Lingkaran Diagram lingkaran atau pie chart adalah jenis grafik yang umum digunakan dalam visualisasi data untuk menunjukkan komposisi atau perbandingan proporsional dari bagian-bagian yang menyusun suatu keseluruhan. Dalam pie chart, area atau sudut dari setiap "potongan pie" (bagian) adalah proporsional terhadap nilai yang diwakilinya dalam keseluruhan. Pie chart bertujuan untuk menampilkan perbandingan antara kategori-kategori dalam dataset, jika Kita ingin menunjukkan bagaimana bagian-bagian tersebut berkontribusi terhadap keseluruhan. Dari data yang telah dipaparkan sebelumnya, Kita akan membuat diagram lingkaran menggunakan Software RStudio.
  • 14. Program: #Memasukkan data data <- data.frame( gaya_belajar = c("visual", "inestetik", "visual", "visual", "auditorial", "auditorial", "kinestetik", "kinestetik", "kinestetik", "visual", "auditorial", "visual", "visual", "visual", "visual", "visual", "auditorial", "auditorial", "auditorial", "auditorial", "auditorial", "auditorial", "inestetik", "kinestetik", "kinestetik", "visual", "visual", "visual", "visual", "visual"), ipk = c(3.30, 3.25, 3.50, 3.00, 3.57, 3.00, 3.50, 3.60, 3.20, 3.10, 3.75, 3.00, 4.00, 3.00, 3.50, 3.50, 3.70, 3.50, 3.40, 3.10, 3.80, 3.60, 3.55, 3.45, 3.54, 3.21, 3.67, 3.64, 3.45, 3.30) ) data # Membuat diagram lingkaran installed.packages("plotly") library(plotly) # Menghitung jumlah mahasiswa untuk setiap gaya belajar data_count <- data %>% group_by(gaya_belajar) %>% summarise(jumlah_mahasiswa = n()) # Membuat diagram lingkaran plot_ly(data_count, labels = ~gaya_belajar, values = ~jumlah_mahasiswa, type = 'pie') %>% layout(title = "Jumlah Mahasiswa berdasarkan Gaya Belajar")
  • 15. Output: Interpretasi: Program di atas dimulai dengan mendefinisikan sebuah data frame yang berisi dua kolom yakni gaya_belajar dan ipk. Kolom gaya_belajar berisi jenis gaya belajar setiap mahasiswa, sedangkan kolom ipk berisi nilai Indeks Prestasi Kumulatif (IPK) dari setiap mahasiswa. Kemudian, program tersebut menghitung jumlah mahasiswa untuk setiap jenis gaya belajar menggunakan fungsi group_by() dan summarise() dari paket dplyr. Hasilnya disimpan dalam data frame baru yang disebut data_count. Kemudian, program membuat diagram lingkaran menggunakan plot_ly() dari paket plotly. Diagram lingkaran akan menampilkan jumlah mahasiswa untuk setiap jenis gaya belajar. Layout diagram lingkaran disesuaikan dengan menambahkan judul "Jumlah Mahasiswa berdasarkan Gaya Belajar". Dari data yang diberikan, diagram lingkaran tersebut menunjukkan distribusi jumlah mahasiswa berdasarkan jenis gaya belajar. Mayoritas mahasiswa cenderung memiliki gaya belajar visual, diikuti oleh gaya belajar auditorial lalu kinestetik dan terakhir inestetik dengan persentase sebesar 46,7% untuk gaya belajar visual, 30% gaya belajar auditorial, 16,7% gaya belajar kinestetik dan 6,67% untuk gaya belajar inestetik.
  • 16. Line Chart/Diagram Garis Diagram garis, atau line chart, adalah jenis grafik yang digunakan untuk menampilkan perubahan nilai variabel seiring waktu atau kondisi lainnya. Dalam line chart, sumbu horizontal biasanya mewakili waktu atau kondisi lainnya (misalnya, kategori atau variabel independen), sementara sumbu vertikal mewakili nilai dari variabel yang diamati. Berikut data yang akan digunakan untuk membuat diagram garis. Tabel 1.2 Volume Air yang Disalurkan Perusahan Untuk Wilayah Sulawesi Tenggara Tahun volume air yang disalurkan (M^3) 2018 12417 2019 14642 2020 15439 2021 17519
  • 17. Output: # Membaca data dari file CSV data <- read.csv("D:/DataPPT1.csv", header = TRUE, sep = ";") Data # Membuat diagram garis library(ggplot2) ggplot(data, aes(x = Tahun, y = volume.air.yang.disalurkan..M.3.)) + geom_line(color = "skyblue") + geom_point(color = "purple") + labs(title = "Volume Air yang Disalurkan per Tahun", x = "Tahun", y = "Volume Air yang disalurkan (m^3)") Program:
  • 18. Interpretasi: Program dimulai dengan membaca data dari file CSV "D:/DataPPT1.csv" menggunakan fungsi read.csv(). Data kemudian disimpan dalam variabel data. Data tersebut kemudian dicetak ke konsol, menampilkan struktur data yang dimuat. Setelah itu, paket ggplot2 dimuat menggunakan library(ggplot2). Kemudian, sebuah diagram garis dibuat menggunakan ggplot2 dengan menggunakan data yang dimuat sebelumnya. Diagram garis ini menunjukkan volume air yang disalurkan perusahaan air terhadap provinsi Sulawesi Tenggara per tahun. Garis pada plot diwarnai dengan skyblue, sementara titik-titik data diwarnai dengan purple. Judul dan label sumbu juga ditambahkan untuk menjelaskan plot tersebut. Dari diagram garis di atas dapat dilihat bahwa jumlah air yang disalurkan Perusahaan untuk wilayah Sulawesi Tenggara per tahunnya mengalami perubahan. Dimana pada tahun 2018 Perusahaan tersebut menyalurkan air sebesar 12.417M3, pada tahun 2019 Perusahaan tersebut menyalurkan air sebesar 14.642 M3, pada tahun 2020 Perusahaan tersebut menyalurkan air sebesar 15.439 M3 dan pada tahun 2021 Perusahaan tersebut menyalurkan air sebesar 17.519 M3.
  • 19. Histogram Histogram adalah jenis grafik yang digunakan untuk menampilkan distribusi frekuensi atau probabilitas dari suatu variabel kontinu. Dalam histogram, rentang nilai variabel dibagi menjadi interval atau "bin", dan tinggi dari setiap bar di histogram mewakili frekuensi atau probabilitas kemunculan nilai-nilai dalam interval tersebut. Dalam konteks visualisasi data menggunakan RStudio, KIta dapat membuat histogram menggunakan fungsi geom_histogram() dari paket ggplot2. Berikut data yang akan digunakan untuk membuat histogram menggunakan Software Rstudio. Tabel 1.3 Pendapatan Tahunan Penduduk DIY Nilai frekuensi Batas bawah Batas atas Frekuesni kumulatif Jumlah data (n) 15-20 6 14,5 20,5 6 90 21-26 14 20,5 26,5 20 27-32 24 26,5 32,5 44 33-38 25 32,5 38,5 69 39-44 10 38,5 44,5 79 45-50 7 44,5 50,5 86 51-56 4 50,5 56,5 90 jumlah 90
  • 20. Program: # Membuat data data <- data.frame( Kelompok = c("15-20", "21-26", "27-32", "33-38", "39-44", "45-50", "51-56"), Frekuensi = c(6, 14, 24, 25, 10, 7, 4), Batas_Bawah = c(14.5, 20.5, 26.5, 32.5, 38.5, 44.5, 50.5), Batas_Atas = c(20.5, 26.5, 32.5, 38.5, 44.5, 50.5, 56.5), Frekuensi_Kumulatif = c(6, 20, 44, 69, 79, 86, 90))data # Memperkirakan titik Tengah data$Titik_Tengah <- (data$Batas_Bawah + data$Batas_Atas) / 2 # Membuat histogram library(ggplot2) ggplot(data, aes(x = Titik_Tengah, y = Frekuensi)) + geom_bar(stat = "identity", fill = "blue", color = "black") + labs(title = "Histogram Pendapatan Tahunan Penduduk DIY", x = "Nilai", y = "Frekuensi")
  • 21. Output: Interpretasi: Program R di atas menciptakan data frame yang berisi informasi tentang kelompok pendapatan tahunan penduduk DIY, frekuensi masing-masing kelompok, batas bawah dan batas atas setiap kelompok, serta frekuensi kumulatif. Program akan menambahkan kolom baru bernama "Titik_Tengah" ke data frame dengan menggunakan rumus penjumlahan batas bawah dan batas atas setiap kelompok, kemudian membaginya dengan 2. Program menggunakan library ggplot2 untuk membuat histogram. Gambar yang dihasilkan akan menjadi histogram dari data pendapatan tahunan penduduk DIY. Sumbu x akan mewakili nilai atau titik tengah untuk setiap kelompok pendapatan (misalnya, 17.5 untuk kelompok 15-20). Sumbu y akan mewakili frekuensi (jumlah individu dalam setiap kelompok). Setiap baris pada histogram akan mewakili satu kelompok pendapatan dengan warna biru dan garis tepi hitam. Dari histogram disamping dapat dilihat bahwa Histogram berdistribusi normal yang ditandai dengan bentuk kurva yang hampir sempurna.
  • 22. Boxplot Boxplot, juga dikenal sebagai diagram kotak dan jangkauan, adalah salah satu teknik visualisasi data yang digunakan untuk meringkas distribusi data numerik dengan cara grafis. Boxplot memberikan gambaran tentang sejumlah statistik deskriptif kunci dari data, seperti nilai median, kuartil, jangkauan, serta deteksi outlier (pencilan). Dalam boxplot, data dikelompokkan ke dalam kuartil, yaitu kuartil bawah (Q1), median (Q2), dan kuartil atas (Q3). Garis dalam kotak menunjukkan median, sedangkan kotak menunjukkan jangkauan antara kuartil pertama dan ketiga (Q1 dan Q3). Garis-garis di luar kotak, yang disebut 'whiskers', menunjukkan rentang data yang dianggap normal. Adanya titik-titik di luar whiskers menandakan adanya outlier. Berikut data yang digunakan untuk membuat boxplot di Rstudio.
  • 23. Tabel 1.5 Data Hasil Belajar Statistika Program: # Membaca data dari file CSV data <- read.csv("D:/DataBoxplot.csv", header = TRUE, sep = ";") data # Membuat boxplot library(ggplot2) ggplot(data, aes(x = "", y = Hasil.Belajar.Statistika)) + geom_boxplot(fill = "orange", color = "blue") + labs(title = "Boxplot Hasil Belajar Statistika", x = "", y = "Hasil Belajar Statistika") Hasil Belajar Statistika 82 80 78 70 75 85 78 78 84 86 79 90 77 72 85
  • 24. Output: Interpretasi: Program R di atas membaca data dari file CSV yang disimpan di lokasi "D:/DataBoxplot.csv". Opsi "header = TRUE" menunjukkan bahwa file CSV memiliki baris header, dan "sep = ";" menunjukkan bahwa data dalam file dipisahkan oleh tanda titik koma. Setelah membaca data, program mencetak tabel yang berisi satu kolom dengan judul "Hasil.Belajar.Statistika". Program kemudian menggunakan library ggplot2 untuk membuat boxplot dari data yang telah dibaca. Dalam kode ggplot, "x = "" dan "y = Hasil.Belajar.Statistika" menentukan variabel yang akan digunakan pada sumbu x dan sumbu y masing- masing. Dalam hal ini, x tidak memiliki nilai (ditandai dengan ""), sedangkan y adalah kolom "Hasil.Belajar.Statistika". Opsi "fill = 'orange'" dan "color = 'blue'" mengatur warna latar belakang dan garis dalam boxplot. Ini memberikan estetika visual pada grafik. Labs() digunakan untuk memberi judul pada grafik, serta label untuk sumbu x dan sumbu y. Dari boxplot di atas dapat Kita lihat bahwa datanya cenderung tidak berdistribusi normal. Oleh karena itu, perlu dilakukan transformasi data agar dihasilkan boxplot yang mendekati distribusi normal
  • 25. Scatter Plot/Diagram Pencar Diagram pencar (scatter plot) adalah salah satu jenis plot yang digunakan dalam visualisasi data untuk menampilkan hubungan antara dua variabel numerik. Dalam scatter plot, setiap titik mewakili satu pengamatan dan posisinya ditentukan oleh nilai dari dua variabel tersebut. Scatter plot sangat berguna untuk menunjukkan pola atau hubungan antara dua variabel, seperti korelasi, distribusi, atau tren. Berikut data yang akan digunakan untuk membuat diagram pencar di RStudio. Tabel 1.6 Pengaruh Kemampuan Matematika (x) terhadap Hasil Belajar Statistika (y) Hasil Belajar Statistika (y) Kemampuan Matematika (x) 82 73 80 74 78 79 70 73 75 70 85 79 78 77 78 78 84 77 86 85
  • 26. Program: # Membaca data dari file CSV data <- read.csv("D:/DataDiagramPencar.csv", header = TRUE, sep = ";") Data # Membuat scatter plot ggplot(data, aes(x = Kemampuan.Matematika..x., y = Hasil.Belajar.Statistika..y.)) + geom_point(color = "brown") + geom_smooth(method = "lm", se = FALSE, color = "blue") + labs(title = "Diagram Pencar Hasil Belajar Statistika vs Kemampuan Matematika", x = "Kemampuan Matematika", y = "Hasil Belajar Statistika") Output:
  • 27. Interpretasi: Program di atas menggunakan bahasa pemrograman R untuk membaca data dari file CSV yang disebut "DataDiagramPencar.csv". Data tersebut kemudian disimpan dalam variabel "data". Setelah membaca data, program menampilkan 10 baris pertama dari data menggunakan perintah "data". Setiap baris terdiri dari dua kolom yakni "Hasil.Belajar.Statistika..y." dan "Kemampuan.Matematika..x.". Ini menunjukkan hasil belajar statistika dan kemampuan matematika masing-masing siswa. Selanjutnya, program membuat scatter plot dengan garis regresi menggunakan paket ggplot2. Scatter plot ini mencerminkan hubungan antara "Hasil.Belajar.Statistika..y." dan "Kemampuan.Matematika..x.". Garis regresi ditambahkan untuk memvisualisasikan hubungan linear antara kedua variabel ini. Dalam perintah ggplot, kita menggunakan estetika (aes) untuk menentukan variabel x dan y yang akan digunakan dalam scatter plot. Kemudian, kita menambahkan geom_point untuk menampilkan titik-titik data sebagai scatter plot. Warna titik adalah coklat. Selanjutnya, kita menggunakan geom_smooth dengan metode regresi linier (lm) untuk menambahkan garis regresi ke scatter plot. Parameter se = FALSE menghilangkan konfiden interval garis regresi, dan warna garis adalah biru. Kemudian, kita menggunakan labs untuk memberi judul pada grafik, serta label sumbu x dan y. Dari scatter plot di atas dapat Kita lihat bahwa plot tersebut menunjukkan hubungan yang positif, dimana peningkatan yang terjadi pada variabel 1 juga diikuti peningkatan pada variabel 2. Dan jika variabel 1 mengalami penurunan, variabel 2 juga mengalami penurunan
  • 28. Diagram Batang dan Daun Steam and leaf plot, juga dikenal sebagai steamplot, adalah metode visualisasi sederhana yang digunakan untuk menampilkan distribusi data numerik. Plot ini sering digunakan dalam eksplorasi data dan analisis statistik deskriptif. Steamplot menggabungkan elemen dari diagram batang dan daun (stem and leaf display) dengan histogram. Cara kerja steamplot hampir sama dengan histogram, di mana data dikelompokkan ke dalam interval. Namun, alih-alih menggunakan batang vertikal, steamplot menggunakan angka untuk mewakili batang dan daun. Digit pertama disebut "stem" dan digit kedua disebut "leaf". Berikut data yang akan digunakan untuk membuat diagram batang dan daun menggunakan Rstudio. Tabel 1.6 data kemampuan Matematika Kemampuan Matematika 73 74 79 73 70
  • 29. 79 77 78 77 85 77 85 76 69 82 74 74 80 75 80 69 81 77 73 80 79 70 81 76 73 Program: # Membaca data dari file CSV data <- read.csv("D:/DataDiagramBatangDaun.csv", header = TRUE, sep = ";") Data #Membuat diagram batang dan daun stem(data$Kemampuan.Matematika)
  • 30. Output: Interpretasi: Program tersebut menggunakan bahasa pemrograman R untuk membaca data dari file CSV yang berjudul "DataDiagramBatangDaun.csv". File CSV ini berisi data kemampuan matematika dengan header yang menunjukkan kolom "Kemampuan.Matematika". Dalam program tersebut, fungsi read.csv() digunakan untuk membaca data dari file CSV. Parameter yang diberikan adalah lokasi file, yaitu "D:/DataDiagramBatangDaun.csv", serta beberapa opsi seperti header = TRUE untuk menunjukkan bahwa file memiliki header, dan sep = ";" untuk menentukan pemisah koma dalam file CSV. Setelah membaca data, program mencetak data yang telah dibaca menggunakan perintah data. Ini akan menampilkan tabel dengan dua kolom: satu kolom untuk indeks (mulai dari 1 hingga 30) dan satu kolom lainnya untuk nilai kemampuan matematika. Selanjutnya, program menggunakan fungsi stem() untuk membuat diagram batang dan daun dari data kemampuan matematika. Diagram ini akan menampilkan distribusi frekuensi nilai-nilai kemampuan matematika dalam bentuk batang dan daun. Dari diagram tersebut, Kita dapat melihat sebaran nilai Kemampuan Matematika dari data. Dimana nilai-nlai tersebut terkonsentrasi di rentang 70-80, dengan beberapa nilai di atas dan di bawah rentang tersebut. stem(data$Kemampuan.Matematika) The decimal point is at the | 68 | 00 70 | 00 72 | 0000 74 | 0000 76 | 000000 78 | 0000 80 | 00000 82 | 0 84 | 00