Visualisasi data adalah representasi grafis dari informasi dan data numerik. Ini melibatkan penggunaan berbagai jenis grafik, plot, dan diagram untuk menggambarkan pola, tren, dan hubungan dalam dataset. Visualisasi data dalam RStudio adalah proses membuat grafik, plot, atau diagram yang menggambarkan informasi dari dataset menggunakan bahasa pemrograman R. RStudio adalah lingkungan pengembangan terintegrasi (IDE) yang populer untuk analisis data dan pemrograman dalam bahasa R. Dalam RStudio, visualisasi data biasanya dilakukan menggunakan paket-paket grafik seperti ggplot2, plotly, atau ggvis. Proses visualisasi ini biasanya melibatkan manipulasi data menggunakan fungsi-fungsi R, seperti memfilter, mengelompokkan, dan menghitung statistik ringkasan sebelum membuat grafik.
Praktikum ini bertujuan agar mahasiswa memahami konsep statistika deskriptif dan mampu mengaplikasikannya menggunakan R. Mahasiswa diajarkan cara menggunakan R untuk menganalisis data meliputi rerata, median, visualisasi grafik, dan histogram.
Makalah epidemiologi penyajian interpretasi data grafik atau diagramWarung Bidan
Makalah ini membahas tentang penyajian data dan grafik dalam epidemiologi. Ada beberapa cara penyajian data seperti tabulasi dan grafik. Grafik merupakan gambaran data berupa angka yang dapat menunjukkan secara visual. Ada beberapa jenis grafik seperti histogram, poligon, garis, ogive, lingkaran, dan pictogram.
Teknik Penyajian Data pada penuisan laporan praktek lapangpolteksidoarjo1
Tujuan artikel ilmiah adalah untuk mengakumulasi dan menyebarkan ilmu pengetahuan. Terlepas dari gaya menulisnya, dilansir dari writingcenter.unc.edu, semua karya penulisan ilmiah memiliki tujuan yang sama yaitu menyajikan data dan/atau gagasan dengan tingkat kerincian yang jelas.
Sehingga memungkinkan pembaca menilai validitas hasil dan kesimpulan hanya berdasarkan fakta dan informasi yang disajikan dalam artikel tersebut.
Modul praktikum ini membahas tentang serat optik single mode dan multimode. Mahasiswa akan belajar tentang prinsip kerja dan karakteristik serat optik serta melakukan simulasi sistem komunikasi serat optik point to point menggunakan perangkat lunak Optisystem 7.0.
Teks ini membahas visualisasi algoritma pengurutan data menggunakan bahasa pemrograman Java. Program visualisasi ini menampilkan proses pengurutan data menggunakan tiga metode pengurutan dasar: bubble sort, selection sort, dan insertion sort. Program ini dapat menghitung jumlah perbandingan dan pertukaran data selama proses pengurutan berlangsung.
Praktikum ini bertujuan agar mahasiswa memahami konsep statistika deskriptif dan mampu mengaplikasikannya menggunakan R. Mahasiswa diajarkan cara menggunakan R untuk menganalisis data meliputi rerata, median, visualisasi grafik, dan histogram.
Makalah epidemiologi penyajian interpretasi data grafik atau diagramWarung Bidan
Makalah ini membahas tentang penyajian data dan grafik dalam epidemiologi. Ada beberapa cara penyajian data seperti tabulasi dan grafik. Grafik merupakan gambaran data berupa angka yang dapat menunjukkan secara visual. Ada beberapa jenis grafik seperti histogram, poligon, garis, ogive, lingkaran, dan pictogram.
Teknik Penyajian Data pada penuisan laporan praktek lapangpolteksidoarjo1
Tujuan artikel ilmiah adalah untuk mengakumulasi dan menyebarkan ilmu pengetahuan. Terlepas dari gaya menulisnya, dilansir dari writingcenter.unc.edu, semua karya penulisan ilmiah memiliki tujuan yang sama yaitu menyajikan data dan/atau gagasan dengan tingkat kerincian yang jelas.
Sehingga memungkinkan pembaca menilai validitas hasil dan kesimpulan hanya berdasarkan fakta dan informasi yang disajikan dalam artikel tersebut.
Modul praktikum ini membahas tentang serat optik single mode dan multimode. Mahasiswa akan belajar tentang prinsip kerja dan karakteristik serat optik serta melakukan simulasi sistem komunikasi serat optik point to point menggunakan perangkat lunak Optisystem 7.0.
Teks ini membahas visualisasi algoritma pengurutan data menggunakan bahasa pemrograman Java. Program visualisasi ini menampilkan proses pengurutan data menggunakan tiga metode pengurutan dasar: bubble sort, selection sort, dan insertion sort. Program ini dapat menghitung jumlah perbandingan dan pertukaran data selama proses pengurutan berlangsung.
Tugas mandiri ini membahas tutorial pengolahan citra digital menggunakan Octave. Terdapat 13 poin utama yang dijelaskan mulai dari pengertian pengolahan citra digital, pengenalan Octave, cara menjalankan dan membaca citra di Octave, sampai contoh-contoh operasi dasar seperti mengubah ke skala abu-abu, meningkatkan kecerahan, meregangkan kontrast, memutar, dan menyimpan hasil pengolahan citra.
Tugas mandiri ini membahas tutorial pengolahan citra digital menggunakan Octave. Secara singkat, dibahas tentang pengertian pengolahan citra digital, pengenalan Octave, cara menjalankan program Octave, membaca dan menampilkan citra, menampilkan banyak citra, mengubah citra berwarna ke citra abu-abu, menyimpan citra, menggunakan histogram citra, meningkatkan kecerahan citra, meregangkan kontrast citra, kombinasi kecerahan dan kontrast, meng
Praktikum ini bertujuan agar mahasiswa dapat memahami dan menggunakan software R untuk analisis data statistika. Tujuan khususnya adalah agar mahasiswa mengenal, menggunakan, dan memahami dasar-dasar R serta komponen-komponennya, serta mampu menganalisis data menggunakan R.
Dokumen tersebut membahas tentang kontrak perkuliahan mata kuliah Struktur Data yang meliputi jadwal pertemuan, sistem penilaian, bentuk tugas yang diberikan, dan penjelasan singkat tentang struktur data dan type data sederhana dalam bahasa C++.
MAKALAH DIAGRAM DAN GRAFIK STATISTIK PENDIDIKANPutriana Sari
Makalah ini membahas tentang diagram dan grafik. Diagram terbagi menjadi diagram batang, lingkaran dan garis. Grafik dibedakan menjadi histogram, polygon, ogive, garis, batang, lingkaran dan area.
Dokumen tersebut memberikan penjelasan singkat tentang statistika deskriptif dalam bahasa R, termasuk rerata, median, minimum, maksimum, histogram, dan plot. Secara khusus, dibahas cara menghitung dan menampilkan rerata, median, serta grafik seperti scatter plot, histogram, dan ecdf plot untuk dataset iris dan eruption dalam R.
Tugas mandiri ini membahas tutorial pengolahan citra digital menggunakan Octave, meliputi pengertian pengolahan citra digital, pengenalan Octave, cara membaca dan menampilkan citra, mengubah citra berwarna ke citra abu-abu, menyimpan citra, menggunakan histogram citra, meningkatkan kecerahan dan kontrast citra, serta operasi-operasi lain seperti penggeseran dan pemutaran citra.
Laporan ini membahas tentang teknik visualisasi chart berbasis sumber terbuka untuk memproses dan menampilkan data secara dinamis dan interaktif. Teknik ini memungkinkan pengolahan data menjadi informasi yang mudah diinterpretasi. Salah satu teknik yang dijelaskan adalah JpGraph, perangkat lunak sumber terbuka untuk membuat berbagai jenis chart seperti bar, line, dan pie chart berdasarkan data dari basis data. Contoh coding PHP juga ditunjukkan unt
Dokumen tersebut membahas tentang penyajian data menggunakan diagram dan grafik, termasuk definisi diagram dan grafik, contoh-contoh diagram batang, diagram lingkaran, histogram, poligon frekuensi, dan ogive beserta langkah-langkah pembuatannya.
Tugas mandiri ini membahas tutorial pengolahan citra digital menggunakan Octave. Terdapat 13 poin utama yang dijelaskan mulai dari pengertian pengolahan citra digital, pengenalan Octave, cara menjalankan dan membaca citra di Octave, sampai contoh-contoh operasi dasar seperti mengubah ke skala abu-abu, meningkatkan kecerahan, meregangkan kontrast, memutar, dan menyimpan hasil pengolahan citra.
Tugas mandiri ini membahas tutorial pengolahan citra digital menggunakan Octave. Secara singkat, dibahas tentang pengertian pengolahan citra digital, pengenalan Octave, cara menjalankan program Octave, membaca dan menampilkan citra, menampilkan banyak citra, mengubah citra berwarna ke citra abu-abu, menyimpan citra, menggunakan histogram citra, meningkatkan kecerahan citra, meregangkan kontrast citra, kombinasi kecerahan dan kontrast, meng
Praktikum ini bertujuan agar mahasiswa dapat memahami dan menggunakan software R untuk analisis data statistika. Tujuan khususnya adalah agar mahasiswa mengenal, menggunakan, dan memahami dasar-dasar R serta komponen-komponennya, serta mampu menganalisis data menggunakan R.
Dokumen tersebut membahas tentang kontrak perkuliahan mata kuliah Struktur Data yang meliputi jadwal pertemuan, sistem penilaian, bentuk tugas yang diberikan, dan penjelasan singkat tentang struktur data dan type data sederhana dalam bahasa C++.
MAKALAH DIAGRAM DAN GRAFIK STATISTIK PENDIDIKANPutriana Sari
Makalah ini membahas tentang diagram dan grafik. Diagram terbagi menjadi diagram batang, lingkaran dan garis. Grafik dibedakan menjadi histogram, polygon, ogive, garis, batang, lingkaran dan area.
Dokumen tersebut memberikan penjelasan singkat tentang statistika deskriptif dalam bahasa R, termasuk rerata, median, minimum, maksimum, histogram, dan plot. Secara khusus, dibahas cara menghitung dan menampilkan rerata, median, serta grafik seperti scatter plot, histogram, dan ecdf plot untuk dataset iris dan eruption dalam R.
Tugas mandiri ini membahas tutorial pengolahan citra digital menggunakan Octave, meliputi pengertian pengolahan citra digital, pengenalan Octave, cara membaca dan menampilkan citra, mengubah citra berwarna ke citra abu-abu, menyimpan citra, menggunakan histogram citra, meningkatkan kecerahan dan kontrast citra, serta operasi-operasi lain seperti penggeseran dan pemutaran citra.
Laporan ini membahas tentang teknik visualisasi chart berbasis sumber terbuka untuk memproses dan menampilkan data secara dinamis dan interaktif. Teknik ini memungkinkan pengolahan data menjadi informasi yang mudah diinterpretasi. Salah satu teknik yang dijelaskan adalah JpGraph, perangkat lunak sumber terbuka untuk membuat berbagai jenis chart seperti bar, line, dan pie chart berdasarkan data dari basis data. Contoh coding PHP juga ditunjukkan unt
Dokumen tersebut membahas tentang penyajian data menggunakan diagram dan grafik, termasuk definisi diagram dan grafik, contoh-contoh diagram batang, diagram lingkaran, histogram, poligon frekuensi, dan ogive beserta langkah-langkah pembuatannya.
Similar to PPT 2 Komputasi Statistik_Wa Ode Syaidatul Auliah_F1A222020.pptx (20)
3. DEFINISI
Visualisasi data adalah representasi grafis dari informasi dan data numerik. Ini
melibatkan penggunaan berbagai jenis grafik, plot, dan diagram untuk
menggambarkan pola, tren, dan hubungan dalam dataset. Visualisasi data dalam
RStudio adalah proses membuat grafik, plot, atau diagram yang menggambarkan
informasi dari dataset menggunakan bahasa pemrograman R. RStudio adalah
lingkungan pengembangan terintegrasi (IDE) yang populer untuk analisis data dan
pemrograman dalam bahasa R. Dalam RStudio, visualisasi data biasanya dilakukan
menggunakan paket-paket grafik seperti ggplot2, plotly, atau ggvis. Proses visualisasi
ini biasanya melibatkan manipulasi data menggunakan fungsi-fungsi R, seperti
memfilter, mengelompokkan, dan menghitung statistik ringkasan sebelum membuat
grafik.
4. ISTILAH-ISTILAH
Berikut adalah beberapa istilah umum yang sering digunakan dalam visualisasi data menggunakan
RStudio:
1. Plot: Representasi visual dari data menggunakan simbol-simbol grafis seperti titik, garis, dan
bentuk geometris lainnya.
2. Grafik: Istilah yang umum digunakan secara luas untuk merujuk pada visualisasi data dalam
bentuk grafis.
3. Layer: Konsep dalam paket grafik ggplot2 di RStudio, di mana setiap komponen grafik
ditambahkan secara berurutan untuk membangun visualisasi data yang kompleks.
4. Aes (Aesthetic mappings): Pengaturan yang menghubungkan variabel dalam dataset dengan
elemen-elemen visual seperti warna, ukuran, atau bentuk dalam plot.
5. Geometri: Objek grafis yang digunakan untuk mewakili data dalam plot. Contoh geometri
termasuk titik, garis, bar, area, dan lain-lain.
6. Theme: Pengaturan estetika visual seperti font, warna latar belakang, dan ukuran font yang
digunakan dalam plot untuk memberikan tampilan yang konsisten dan menarik.
5. ISTILAH-ISTILAH
7. Facet: Memecah plot menjadi beberapa panel berdasarkan nilai variabel yang diberikan,
memungkinkan pembandingan antara subset data dengan lebih mudah.
8. ggplot2: Paket R yang populer digunakan untuk membuat visualisasi data yang kaya dan
fleksibel, terutama dengan pendekatan "grammar of graphics".
9. Plotly: Paket R yang memungkinkan pembuatan visualisasi data interaktif dan dinamis dalam
RStudio, dengan dukungan untuk berbagai jenis grafik.
10. ggplotly: Fungsi dalam paket plotly yang mengonversi plot ggplot2 menjadi plot interaktif
menggunakan plotly.
11. Shiny: Paket R untuk membuat aplikasi web interaktif dengan RStudio, yang memungkinkan
pengguna untuk mengeksplorasi data dan visualisasi dengan antarmuka yang ramah pengguna.
12. Leaflet: Paket R untuk membuat peta interaktif dalam RStudio menggunakan antarmuka
Leaflet JavaScript.
6. TUJUAN
Tujuan utama dari visualisasi data menggunakan RStudio adalah untuk mengubah data mentah
menjadi informasi yang dapat dimengerti dengan lebih baik melalui representasi grafis yang jelas
dan informatif. Beberapa tujuan spesifik dari visualisasi data menggunakan RStudio meliputi:
1. Memahami Data.
2. Mengidentifikasi Pola dan Anomali.
3. Komunikasi Informasi.
4. Mendukung Pengambilan Keputusan.
5. Validasi Model dan Hipotesis.
6. Menemukan Peluang dan Tantangan.
7. Membuat Laporan dan Presentasi.
Dengan demikian, tujuan visualisasi data menggunakan RStudio adalah untuk mengubah data
mentah menjadi informasi yang bermakna dan actionable, serta untuk mendukung pengambilan
keputusan yang berbasis data.
7. JENIS-JENIS VISUALISASI DATA
Terdapat banyak jenis visualisasi data yang dapat dibuat menggunakan RStudio,
tergantung pada jenis data yang dimiliki dan tujuan analisis data. Berikut beberapa
jenis visualisasi data umum yang sering digunakan:
1. Bar Plot/Diagram Batang.
2. Pie Chart/Diagram Lingkaran.
3. Line Chart/Diagram Garis.
4. Histogram.
5. Box Plot
6. Scatter Plot/Diagram Pencar
7. Steam and Leaf Plot/Diagram Batang dan Daun
8. Berikut data yang akan digunakan untuk membuat visualisasi data menggunakan Software
Rstudio:
Tabel 1.1 Pengaruh Gaya Belajar Terhadap Nilai IPK
gaya belajar ipk
visual 3.3
inestetik 3.25
visual 3.5
visual 3
auditorial 3.57
auditorial 3
kinestetik 3.5
kinestetik 3.6
kinestetik 3.2
visual 3.1
auditorial 3.75
visual 3
10. Bar Plot/Diagram Batang
Diagram batang atau bar plot adalah jenis grafik yang umum digunakan dalam visualisasi data
untuk membandingkan frekuensi atau jumlah dari beberapa kategori. Dalam bar plot, sumbu
horizontal digunakan untuk mewakili kategori atau variabel kategori, sementara sumbu vertikal
digunakan untuk mewakili frekuensi atau jumlah dari kategori-kategori tersebut. Dalam RStudio,
Kita dapat membuat bar plot menggunakan berbagai paket, tetapi salah satu yang paling umum
digunakan adalah ggplot2. Bar plot berguna dalam mengeksplorasi distribusi atau perbandingan
antara kategori-kategori dalam dataset, dan sering digunakan dalam berbagai analisis data dan
laporan. Dari data di atas Kita akan membuat diagram batang menggunakan Software RStudio.
11. Program:
#Memasukkan data
data <- data.frame(
gaya_belajar = c("visual", "inestetik", "visual", "visual",
"auditorial",
"auditorial", "kinestetik", "kinestetik",
"kinestetik",
"visual", "auditorial", "visual", "visual",
"visual",
"visual", "visual", "auditorial", "auditorial",
"auditorial",
"auditorial", "auditorial", "auditorial",
"inestetik",
"kinestetik", "kinestetik", "visual", "visual",
"visual",
"visual", "visual"),
ipk = c(3.30, 3.25, 3.50, 3.00, 3.57, 3.00, 3.50, 3.60, 3.20, 3.10,
3.75, 3.00, 4.00, 3.00, 3.50, 3.50, 3.70, 3.50, 3.40, 3.10,
3.80, 3.60, 3.55, 3.45, 3.54, 3.21, 3.67, 3.64, 3.45, 3.30)
)
data
#Membuat diagram batang
library(ggplot2)
library(dplyr)
# Menghitung rata-rata IPK untuk setiap gaya belajar
data_summary <- data %>%
group_by(gaya_belajar) %>%
summarise(rata_ipk = mean(ipk))
# Membuat diagram batang
ggplot(data_summary, aes(x = gaya_belajar, y = rata_ipk, fill
= gaya_belajar)) +
geom_bar(stat = "identity") +
labs(title = "Rata-rata IPK berdasarkan Gaya Belajar",
x = "Gaya Belajar",
y = "Rata-rata IPK") +
theme_minimal() +
theme(legend.position = "none")
12. Output:
Interpretasi:
Dari diagram disamping, Kita dapat
melihat bahwa gaya belajar kinestetik
memiliki rata-rata IPK yang paling tinggi
dibandingkan dengan gaya belajar lainnya,
diikuti oleh gaya belajar auditorial dan visual.
Gaya belajar inestetik memiliki rata-rata IPK
yang paling rendah. Grafik ini memberikan
informasi visual yang jelas tentang hubungan
antara gaya belajar dan kinerja akademik
(diwakili oleh IPK) mahasiswa. Dengan
demikian, dapat disimpulkan bahwa terdapat
perbedaan dalam kinerja akademik
berdasarkan gaya belajar, dengan gaya belajar
kinestetik menunjukkan kinerja yang lebih
tinggi secara rata-rata.
13. Pie Chart/Diagram Lingkaran
Diagram lingkaran atau pie chart adalah jenis grafik yang umum digunakan dalam visualisasi
data untuk menunjukkan komposisi atau perbandingan proporsional dari bagian-bagian yang
menyusun suatu keseluruhan. Dalam pie chart, area atau sudut dari setiap "potongan pie"
(bagian) adalah proporsional terhadap nilai yang diwakilinya dalam keseluruhan. Pie chart
bertujuan untuk menampilkan perbandingan antara kategori-kategori dalam dataset, jika Kita
ingin menunjukkan bagaimana bagian-bagian tersebut berkontribusi terhadap keseluruhan.
Dari data yang telah dipaparkan sebelumnya, Kita akan membuat diagram lingkaran menggunakan
Software RStudio.
14. Program:
#Memasukkan data
data <- data.frame(
gaya_belajar = c("visual", "inestetik", "visual",
"visual", "auditorial",
"auditorial", "kinestetik", "kinestetik",
"kinestetik",
"visual", "auditorial", "visual", "visual",
"visual",
"visual", "visual", "auditorial", "auditorial",
"auditorial",
"auditorial", "auditorial", "auditorial",
"inestetik",
"kinestetik", "kinestetik", "visual", "visual",
"visual",
"visual", "visual"),
ipk = c(3.30, 3.25, 3.50, 3.00, 3.57, 3.00, 3.50, 3.60, 3.20,
3.10,
3.75, 3.00, 4.00, 3.00, 3.50, 3.50, 3.70, 3.50, 3.40, 3.10,
3.80, 3.60, 3.55, 3.45, 3.54, 3.21, 3.67, 3.64, 3.45, 3.30)
)
data
# Membuat diagram lingkaran
installed.packages("plotly")
library(plotly)
# Menghitung jumlah mahasiswa untuk setiap gaya belajar
data_count <- data %>%
group_by(gaya_belajar) %>%
summarise(jumlah_mahasiswa = n())
# Membuat diagram lingkaran
plot_ly(data_count, labels = ~gaya_belajar, values =
~jumlah_mahasiswa, type = 'pie') %>%
layout(title = "Jumlah Mahasiswa berdasarkan Gaya Belajar")
15. Output:
Interpretasi:
Program di atas dimulai dengan mendefinisikan sebuah data
frame yang berisi dua kolom yakni gaya_belajar dan ipk. Kolom
gaya_belajar berisi jenis gaya belajar setiap mahasiswa, sedangkan
kolom ipk berisi nilai Indeks Prestasi Kumulatif (IPK) dari setiap
mahasiswa. Kemudian, program tersebut menghitung jumlah
mahasiswa untuk setiap jenis gaya belajar menggunakan fungsi
group_by() dan summarise() dari paket dplyr. Hasilnya disimpan
dalam data frame baru yang disebut data_count. Kemudian,
program membuat diagram lingkaran menggunakan plot_ly() dari
paket plotly. Diagram lingkaran akan menampilkan jumlah
mahasiswa untuk setiap jenis gaya belajar. Layout diagram
lingkaran disesuaikan dengan menambahkan judul "Jumlah
Mahasiswa berdasarkan Gaya Belajar". Dari data yang diberikan,
diagram lingkaran tersebut menunjukkan distribusi jumlah
mahasiswa berdasarkan jenis gaya belajar. Mayoritas mahasiswa
cenderung memiliki gaya belajar visual, diikuti oleh gaya belajar
auditorial lalu kinestetik dan terakhir inestetik dengan persentase
sebesar 46,7% untuk gaya belajar visual, 30% gaya belajar
auditorial, 16,7% gaya belajar kinestetik dan 6,67% untuk gaya
belajar inestetik.
16. Line Chart/Diagram Garis
Diagram garis, atau line chart, adalah jenis grafik yang digunakan untuk menampilkan
perubahan nilai variabel seiring waktu atau kondisi lainnya. Dalam line chart, sumbu horizontal
biasanya mewakili waktu atau kondisi lainnya (misalnya, kategori atau variabel independen),
sementara sumbu vertikal mewakili nilai dari variabel yang diamati. Berikut data yang akan
digunakan untuk membuat diagram garis.
Tabel 1.2 Volume Air yang Disalurkan Perusahan Untuk Wilayah Sulawesi Tenggara
Tahun volume air yang disalurkan (M^3)
2018 12417
2019 14642
2020 15439
2021 17519
17. Output:
# Membaca data dari file CSV
data <- read.csv("D:/DataPPT1.csv", header = TRUE, sep = ";")
Data
# Membuat diagram garis
library(ggplot2)
ggplot(data, aes(x = Tahun, y = volume.air.yang.disalurkan..M.3.)) +
geom_line(color = "skyblue") +
geom_point(color = "purple") +
labs(title = "Volume Air yang Disalurkan per Tahun", x =
"Tahun", y = "Volume Air yang disalurkan (m^3)")
Program:
18. Interpretasi:
Program dimulai dengan membaca data dari file CSV "D:/DataPPT1.csv" menggunakan fungsi
read.csv(). Data kemudian disimpan dalam variabel data. Data tersebut kemudian dicetak ke konsol,
menampilkan struktur data yang dimuat. Setelah itu, paket ggplot2 dimuat menggunakan library(ggplot2).
Kemudian, sebuah diagram garis dibuat menggunakan ggplot2 dengan menggunakan data yang dimuat
sebelumnya. Diagram garis ini menunjukkan volume air yang disalurkan perusahaan air terhadap provinsi
Sulawesi Tenggara per tahun. Garis pada plot diwarnai dengan skyblue, sementara titik-titik data diwarnai
dengan purple. Judul dan label sumbu juga ditambahkan untuk menjelaskan plot tersebut. Dari diagram
garis di atas dapat dilihat bahwa jumlah air yang disalurkan Perusahaan untuk wilayah Sulawesi Tenggara
per tahunnya mengalami perubahan. Dimana pada tahun 2018 Perusahaan tersebut menyalurkan air
sebesar 12.417M3, pada tahun 2019 Perusahaan tersebut menyalurkan air sebesar 14.642 M3, pada tahun
2020 Perusahaan tersebut menyalurkan air sebesar 15.439 M3 dan pada tahun 2021 Perusahaan tersebut
menyalurkan air sebesar 17.519 M3.
19. Histogram
Histogram adalah jenis grafik yang digunakan untuk menampilkan distribusi frekuensi atau
probabilitas dari suatu variabel kontinu. Dalam histogram, rentang nilai variabel dibagi menjadi
interval atau "bin", dan tinggi dari setiap bar di histogram mewakili frekuensi atau probabilitas
kemunculan nilai-nilai dalam interval tersebut. Dalam konteks visualisasi data menggunakan
RStudio, KIta dapat membuat histogram menggunakan fungsi geom_histogram() dari paket ggplot2.
Berikut data yang akan digunakan untuk membuat histogram menggunakan Software Rstudio.
Tabel 1.3 Pendapatan Tahunan Penduduk DIY
Nilai frekuensi Batas bawah Batas atas Frekuesni kumulatif Jumlah data (n)
15-20 6 14,5 20,5 6 90
21-26 14 20,5 26,5 20
27-32 24 26,5 32,5 44
33-38 25 32,5 38,5 69
39-44 10 38,5 44,5 79
45-50 7 44,5 50,5 86
51-56 4 50,5 56,5 90
jumlah 90
20. Program:
# Membuat data
data <- data.frame(
Kelompok = c("15-20", "21-26", "27-32", "33-38", "39-44", "45-50", "51-56"),
Frekuensi = c(6, 14, 24, 25, 10, 7, 4),
Batas_Bawah = c(14.5, 20.5, 26.5, 32.5, 38.5, 44.5, 50.5),
Batas_Atas = c(20.5, 26.5, 32.5, 38.5, 44.5, 50.5, 56.5),
Frekuensi_Kumulatif = c(6, 20, 44, 69, 79, 86, 90))data
# Memperkirakan titik Tengah
data$Titik_Tengah <- (data$Batas_Bawah + data$Batas_Atas) / 2
# Membuat histogram
library(ggplot2)
ggplot(data, aes(x = Titik_Tengah, y = Frekuensi)) + geom_bar(stat = "identity", fill = "blue", color = "black") + labs(title =
"Histogram Pendapatan Tahunan Penduduk DIY", x = "Nilai", y = "Frekuensi")
21. Output:
Interpretasi:
Program R di atas menciptakan data frame yang berisi
informasi tentang kelompok pendapatan tahunan penduduk
DIY, frekuensi masing-masing kelompok, batas bawah dan
batas atas setiap kelompok, serta frekuensi kumulatif.
Program akan menambahkan kolom baru bernama
"Titik_Tengah" ke data frame dengan menggunakan rumus
penjumlahan batas bawah dan batas atas setiap kelompok,
kemudian membaginya dengan 2. Program menggunakan
library ggplot2 untuk membuat histogram. Gambar yang
dihasilkan akan menjadi histogram dari data pendapatan
tahunan penduduk DIY. Sumbu x akan mewakili nilai atau
titik tengah untuk setiap kelompok pendapatan (misalnya,
17.5 untuk kelompok 15-20). Sumbu y akan mewakili
frekuensi (jumlah individu dalam setiap kelompok). Setiap
baris pada histogram akan mewakili satu kelompok
pendapatan dengan warna biru dan garis tepi hitam. Dari
histogram disamping dapat dilihat bahwa Histogram
berdistribusi normal yang ditandai dengan bentuk kurva
yang hampir sempurna.
22. Boxplot
Boxplot, juga dikenal sebagai diagram kotak dan jangkauan, adalah salah satu teknik visualisasi
data yang digunakan untuk meringkas distribusi data numerik dengan cara grafis. Boxplot
memberikan gambaran tentang sejumlah statistik deskriptif kunci dari data, seperti nilai median,
kuartil, jangkauan, serta deteksi outlier (pencilan). Dalam boxplot, data dikelompokkan ke dalam
kuartil, yaitu kuartil bawah (Q1), median (Q2), dan kuartil atas (Q3). Garis dalam kotak
menunjukkan median, sedangkan kotak menunjukkan jangkauan antara kuartil pertama dan
ketiga (Q1 dan Q3). Garis-garis di luar kotak, yang disebut 'whiskers', menunjukkan rentang data
yang dianggap normal. Adanya titik-titik di luar whiskers menandakan adanya outlier. Berikut
data yang digunakan untuk membuat boxplot di Rstudio.
23. Tabel 1.5 Data Hasil Belajar Statistika
Program:
# Membaca data dari file CSV
data <- read.csv("D:/DataBoxplot.csv", header = TRUE, sep = ";") data
# Membuat boxplot
library(ggplot2)
ggplot(data, aes(x = "", y = Hasil.Belajar.Statistika)) + geom_boxplot(fill = "orange",
color = "blue") + labs(title = "Boxplot Hasil Belajar Statistika", x = "", y =
"Hasil Belajar Statistika")
Hasil Belajar Statistika
82
80
78
70
75
85
78
78
84
86
79
90
77
72
85
24. Output:
Interpretasi:
Program R di atas membaca data dari file CSV yang disimpan
di lokasi "D:/DataBoxplot.csv". Opsi "header = TRUE"
menunjukkan bahwa file CSV memiliki baris header, dan "sep =
";" menunjukkan bahwa data dalam file dipisahkan oleh tanda
titik koma. Setelah membaca data, program mencetak tabel yang
berisi satu kolom dengan judul "Hasil.Belajar.Statistika".
Program kemudian menggunakan library ggplot2 untuk
membuat boxplot dari data yang telah dibaca. Dalam kode ggplot,
"x = "" dan "y = Hasil.Belajar.Statistika" menentukan variabel
yang akan digunakan pada sumbu x dan sumbu y masing-
masing. Dalam hal ini, x tidak memiliki nilai (ditandai dengan
""), sedangkan y adalah kolom "Hasil.Belajar.Statistika". Opsi
"fill = 'orange'" dan "color = 'blue'" mengatur warna latar
belakang dan garis dalam boxplot. Ini memberikan estetika
visual pada grafik. Labs() digunakan untuk memberi judul pada
grafik, serta label untuk sumbu x dan sumbu y. Dari boxplot di
atas dapat Kita lihat bahwa datanya cenderung tidak
berdistribusi normal. Oleh karena itu, perlu dilakukan
transformasi data agar dihasilkan boxplot yang mendekati
distribusi normal
25. Scatter Plot/Diagram Pencar
Diagram pencar (scatter plot) adalah salah satu jenis plot yang digunakan dalam visualisasi data
untuk menampilkan hubungan antara dua variabel numerik. Dalam scatter plot, setiap titik
mewakili satu pengamatan dan posisinya ditentukan oleh nilai dari dua variabel tersebut. Scatter
plot sangat berguna untuk menunjukkan pola atau hubungan antara dua variabel, seperti
korelasi, distribusi, atau tren. Berikut data yang akan digunakan untuk membuat diagram
pencar di RStudio.
Tabel 1.6 Pengaruh Kemampuan Matematika (x) terhadap Hasil Belajar Statistika (y)
Hasil Belajar Statistika (y) Kemampuan Matematika (x)
82 73
80 74
78 79
70 73
75 70
85 79
78 77
78 78
84 77
86 85
26. Program:
# Membaca data dari file CSV
data <- read.csv("D:/DataDiagramPencar.csv", header
= TRUE, sep = ";")
Data
# Membuat scatter plot
ggplot(data, aes(x = Kemampuan.Matematika..x., y =
Hasil.Belajar.Statistika..y.)) +
geom_point(color = "brown") +
geom_smooth(method = "lm", se = FALSE, color =
"blue") +
labs(title = "Diagram Pencar Hasil Belajar Statistika vs
Kemampuan Matematika", x = "Kemampuan
Matematika", y = "Hasil Belajar Statistika")
Output:
27. Interpretasi:
Program di atas menggunakan bahasa pemrograman R untuk membaca data dari file CSV yang disebut
"DataDiagramPencar.csv". Data tersebut kemudian disimpan dalam variabel "data". Setelah membaca
data, program menampilkan 10 baris pertama dari data menggunakan perintah "data". Setiap baris terdiri
dari dua kolom yakni "Hasil.Belajar.Statistika..y." dan "Kemampuan.Matematika..x.". Ini menunjukkan
hasil belajar statistika dan kemampuan matematika masing-masing siswa. Selanjutnya, program membuat
scatter plot dengan garis regresi menggunakan paket ggplot2. Scatter plot ini mencerminkan hubungan antara
"Hasil.Belajar.Statistika..y." dan "Kemampuan.Matematika..x.". Garis regresi ditambahkan untuk
memvisualisasikan hubungan linear antara kedua variabel ini. Dalam perintah ggplot, kita menggunakan
estetika (aes) untuk menentukan variabel x dan y yang akan digunakan dalam scatter plot. Kemudian, kita
menambahkan geom_point untuk menampilkan titik-titik data sebagai scatter plot. Warna titik adalah coklat.
Selanjutnya, kita menggunakan geom_smooth dengan metode regresi linier (lm) untuk menambahkan garis
regresi ke scatter plot. Parameter se = FALSE menghilangkan konfiden interval garis regresi, dan warna
garis adalah biru. Kemudian, kita menggunakan labs untuk memberi judul pada grafik, serta label sumbu x
dan y. Dari scatter plot di atas dapat Kita lihat bahwa plot tersebut menunjukkan hubungan yang positif,
dimana peningkatan yang terjadi pada variabel 1 juga diikuti peningkatan pada variabel 2. Dan jika variabel
1 mengalami penurunan, variabel 2 juga mengalami penurunan
28. Diagram Batang dan Daun
Steam and leaf plot, juga dikenal sebagai steamplot, adalah metode visualisasi
sederhana yang digunakan untuk menampilkan distribusi data numerik. Plot ini
sering digunakan dalam eksplorasi data dan analisis statistik deskriptif. Steamplot
menggabungkan elemen dari diagram batang dan daun (stem and leaf display)
dengan histogram. Cara kerja steamplot hampir sama dengan histogram, di mana
data dikelompokkan ke dalam interval. Namun, alih-alih menggunakan batang
vertikal, steamplot menggunakan angka untuk mewakili batang dan daun. Digit
pertama disebut "stem" dan digit kedua disebut "leaf". Berikut data yang akan
digunakan untuk membuat diagram batang dan daun menggunakan Rstudio.
Tabel 1.6 data kemampuan Matematika
Kemampuan Matematika
73
74
79
73
70
30. Output:
Interpretasi:
Program tersebut menggunakan bahasa pemrograman R untuk membaca
data dari file CSV yang berjudul "DataDiagramBatangDaun.csv". File CSV ini
berisi data kemampuan matematika dengan header yang menunjukkan kolom
"Kemampuan.Matematika". Dalam program tersebut, fungsi read.csv()
digunakan untuk membaca data dari file CSV. Parameter yang diberikan
adalah lokasi file, yaitu "D:/DataDiagramBatangDaun.csv", serta beberapa
opsi seperti header = TRUE untuk menunjukkan bahwa file memiliki header,
dan sep = ";" untuk menentukan pemisah koma dalam file CSV. Setelah
membaca data, program mencetak data yang telah dibaca menggunakan
perintah data. Ini akan menampilkan tabel dengan dua kolom: satu kolom
untuk indeks (mulai dari 1 hingga 30) dan satu kolom lainnya untuk nilai
kemampuan matematika. Selanjutnya, program menggunakan fungsi stem()
untuk membuat diagram batang dan daun dari data kemampuan matematika.
Diagram ini akan menampilkan distribusi frekuensi nilai-nilai kemampuan
matematika dalam bentuk batang dan daun. Dari diagram tersebut, Kita dapat
melihat sebaran nilai Kemampuan Matematika dari data. Dimana nilai-nlai tersebut
terkonsentrasi di rentang 70-80, dengan beberapa nilai di atas dan di bawah rentang
tersebut.
stem(data$Kemampuan.Matematika)
The decimal point is at the |
68 | 00
70 | 00
72 | 0000
74 | 0000
76 | 000000
78 | 0000
80 | 00000
82 | 0
84 | 00