1. Kelas D
LAPORAN PRAKTIKUM
Statistika Multivariat Terapan
Modul 1 : Pemeriksaan Data
Nama Praktikan
Nomor
Mahasiswa
Tanggal
Kumpul
Tanda Tangan
Praktikan
Lintang Puspita 18611088 01/04/2021
Nama Penilai
Tanggal
Koreksi
Nilai
Tanda tangan
Asisten Dosen
Kamaluddin Simamora
Nadia Fitriana Dewi
Muhammad Muhajir, S.Si., M.Sc.
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2021
2. ii
Daftar Isi
Halaman sampul....................................................................................................... i
1 Pendahuluan.................................................................................................... 1
1.1 Landasan Teori......................................................................................... 1
1.2 Uji Data Outlier........................................................................................ 1
1.3 Uji Linearitas Data ................................................................................... 1
1.4 Uji Homoskedastisitas Data ..................................................................... 2
2 Deskripsi Kerja................................................................................................ 3
2.1 Studi Kasus............................................................................................... 3
2.2 Langkah Kerja .......................................................................................... 3
3 Pembahasan..................................................................................................... 7
4 Penutup.......................................................................................................... 15
4.1 Kesimpulan............................................................................................. 15
5 Daftar Pustaka............................................................................................... 16
3. iii
Daftar Gambar
Gambar 1.1. Tampilan bagian-bagian dari boxplot ............................................... 1
Gambar 1.2. Tampilan grafik scatterplot .............................................................. 2
Gambar 2.1. Tampilan Data Laporan 1 pada Excel .............................................. 3
Gambar 2.2. Tampilan variabel PP........................................................................ 3
Gambar 2.3. Formula variabel PP ......................................................................... 4
Gambar 2.4. Tampilan variabel Kategori .............................................................. 4
Gambar 2.5. Formula variabel Kategori................................................................ 4
Gambar 2.6. Tampilan data Data Laporan 1 sekarang .......................................... 4
Gambar 2.7. Tampilan jendela Rstudio................................................................. 5
Gambar 2.8. Sintaks memanggil data.................................................................... 5
Gambar 2.9. Sintaks menampilkan data berbentuk tabel ...................................... 5
Gambar 2.10. Sintaks uji outlier tiap variabel....................................................... 5
Gambar 2.11. Sintaks uji outlier tiap variabel....................................................... 5
Gambar 2.12. Sintaks uji homoskedastisitas ......................................................... 6
Gambar 3.1. Output data Data Laporan 1.............................................................. 7
Gambar 3.2. Output boxplot variabel Harapan Lama Sekolah.............................. 8
Gambar 3.3. Output boxplot variabel Pengeluran Perkapital................................ 8
Gambar 3.4. Output boxplot variabel Umur Harapan Hidup ................................ 9
Gambar 3.5. Output boxplot variabel Indeks Pembangunan Manusia .................. 9
Gambar 3.6. Output boxplot variabel Rata-rata Lama Sekolah........................... 10
Gambar 3.7. Output Scatterplot antar variabel Harapan Lama Sekolah dan IPM
....................................................................................................................... 11
Gambar 3.8. Output Scatterplot antar variabel Pengeluran Perkapital dan IPM. 12
Gambar 3.9. Output Scatterplot antar variabel Umur Harapan Hidup dan variabel
IPM................................................................................................................ 12
Gambar 3.10. Output boxplot antar variabel Rata-rata Lama Sekolah dan IPM. 13
Gambar 3.11. Output Uji Homoskedastisitas antar kelompok IPM berdasarkan
kategori pengeluaran perkapita ..................................................................... 14
4. 1
1 Pendahuluan
1.1 Landasan Teori
Statistika dapat didefinisikan sebagai ilmu yang dipergunakan untuk
menyimpulkan kondisi populasi berdasarkan kondisi sampel, untuk melakukan hal
ini biasanya dilakukan tahapan yang disebut pengujian hipotesis, hasil dari
pengujian hipotesis ini dapat dikatakan valid jika beberapa syarat terpenuhi,
diantaranya yaitu: kenormalan, kehomogenan variansi dan kelinearan.
1.2 Uji Data Outlier
Data outlier adalah data yang secara nyata terlihat berbeda dengan pola data
yang lain, dimana secara visual persebaran data jauh dari ukuran pemusatan data.
Data outlier biasanya terjadi karena kesalahan dalam pemasukan data, kesalahan
dalam pengambilan sampel, atau memang ada data ekstrim yang tidak dapat
dihindarkan keberadaannya. Pengujian data outlier dapat dilakukan dengan
beberapa cara antara lain histogram, boxplot dan scatterplot (Izenman, 2013).
Pengecekan data outlier sering dilakukan dengan boxplot. Penjelasan bagian-bagian
dari boxplot adalah sebagai berikut:
Gambar 1.1. Tampilan bagian-bagian dari boxplot
1.3 Uji Linearitas Data
Linieritas adalah suatu keadaan dimana hubungan antara variabel independen
dan variabel dependen bersifat linier (garis lurus) dalam range variabel independen
5. 2
tertentu. Uji linieritas adalah suatu prosedur yang digunakan untuk mengetahui
status linier atau tidaknya suatu distribusi data penelitian. Uji linieritas dapat
dilakukan dengan menggunakan scatterplot dengan cara menambahkan garis
regresi dalam scatterplot tersebut. Scatterplot merupakan salah satu sarana
mengekplorasi hubungan antara dua variabel, serta dari grafiknya dapat
menggambarkan sebaran variansi data pengamatan. Scatterplot dapat menilai
hubungan antara kedua variabel yang diplotkan, ketika plot data mengikuti garis
regresinya secara garis lurus, maka data yang digunakan bersifat linier (Hothorn
dan Everitt, 2011). Grafik scatterplot dapat disajikan seperti berikut:
Gambar 1.2. Tampilan grafik scatterplot
1.4 Uji Homoskedastisitas Data
Uji homoskedastisitas pada prinsipnya ingin menguji apakah sebuah grup
(dua kategori) mempunyai variansi yang sama diantara anggota grup tersebut. Jika
variansi sama, dan ini yang seharusnya terjadi, maka dikatakan ada
homoskedastisitas. Pengujian homoskedastisitas bisa dikerjakan dengan analisis
Bartlett test, atau dengan analisis residual yang berupa grafik.
Hipotesis dalam pengujian ini:
H0: Homoskedastisitas (adanya kesamaan variansi antara kedua kelompok)
H1: Heteroskedastisitas (adanya perbedaan variansi antara kedua kelompok).
(Muhajir, 2021)
6. 3
2 Deskripsi Kerja
2.1 Studi Kasus
Data berikut adalah Indeks Pembangunan Manusia Provinsi Sumatera Utara
2020 yang terdiri dari 5 variabel. Dari data tersebut maka:
1. Lakukan uji data outlier dan uji linearitas pada setiap variabel yang dipilih.
2. Lakukan uji homoskedastisitas antar kelompok IPM berdasarkan kategori
pengeluaran perkapita, jika variabel pengeluaran perkapita dikelompokkan
menjadi 2, yaitu:
Kelompok Besar: provinsi dengan pengeluaran perkapita Rp 9.000.000,
Kelompok Sedang: provinsi dengan pengeluaran perkapita < Rp 9.000.000,-
2.2 Langkah Kerja
1. Langkah pertama download data yang telah diberikan dengan nama Data
Laporan 1>klik panah atas>open when done. Secara otomatis data tersebut
tertampil pada aplikasi Excel. Sebagai berikut.
Gambar 2.1. Tampilan Data Laporan 1 pada Excel
2. Kemudian tambahkan variabel baru dengan nama“PP” untuk membuat
kategori yang telah ditentukan. Sebagai berikut.
Gambar 2.2. Tampilan variabel PP
3. Selanjutnya masukan formula untuk variabel PP sebagai berikut.
7. 4
Gambar 2.3. Formula variabel PP
4. Setelah itu, tambahkan variabel baru dengan nama “Kategori”. Sebagai
berikut.
Gambar 2.4. Tampilan variabel Kategori
5. Kemudian masukan formula untuk variabel Kategori sesuai perintah.
Sebagai berikut.
Gambar 2.5. Formula variabel Kategori
6. Setelah di-drag kebawah kolom yang berisi formula variabel PP dan
variabel kategori akan muncul hasilnya. Sebagai berikut.
Gambar 2.6. Tampilan data Data Laporan 1 sekarang
7. Buka aplikasi Rstudio pada desktop, maka akan muncul tampilan awal R
Studio seperti pada gambar di bawah ini.
8. 5
Gambar 2.7. Tampilan jendela Rstudio
8. Selanjutnya lakukan input data dengan menggunakan data Data Laporan
1 terdapat pada Excel yang sebelumnya telah di-copy dengan sintaks
sebagai berikut.
Gambar 2.8. Sintaks memanggil data
9. Tambahkan sintaks View(data), untuk mengeluarkan output yang pada
sheet lain berbentuk tabel. Sebagai berikut.
Gambar 2.9. Sintaks menampilkan data berbentuk tabel
10. Kemudian lakukan uji data outlier pada setiap variabel yang
dipilih. Dengan sintaks sebagai berikut.
Gambar 2.10. Sintaks uji outlier tiap variabel
11. Dan lakukan uji linearitas pada setiap variabel yang dipilih.
Dengan sintaks sebagai berikut.
Gambar 2.11. Sintaks uji outlier tiap variabel
9. 6
12. Untuk soal 2, lakukan uji homoskedastisitas antar kelompok IPM
berdasarkan kategori pengeluaran perkapita menggunakan sintaks
bartlett.test(). Sebagai berikut.
Gambar 2.12. Sintaks uji homoskedastisitas
10. 7
3 Pembahasan
Pada bab sebelumnya yaitu bab deskripsi kerja telah dipaparkan mengenai
deskripsi kerja dan langkah-langkah penyelesaian kasus menggunakan software
R. Pada bab ini praktikan akan membahas mengenai output hasil analisis studi
kasus secara detail dan jelas.
Pada studi kasus yang pertama, praktikan diminta melakukan beberapa uji
untuk melakukan pemeriksaan data. Sebelum melakukan pemeriksaan data,
praktikan memasukkan data ke dalam software RStudio dan berikut tampilan dari
variabel yang sudah dimasukkan kedalam RStudio dengan menggunakan sintaks
View(data). Sebagai berikut.
Gambar 3.1. Output data Data Laporan 1
Setelah menampilkan data pada jendela RStudio, praktikan melakukan uji
outlier atau sering disebut dengan “pencilan”. Data dikatakan outlier jika nilai dari
data tersebut sangat berbeda dengan data-data yang lain atau nilainya terlalu rendah
atau tinggi dari data yang lain. Disini praktikan menguji outlier menggunakan
boxpot. Ada beberapa variabel praktikan uji, uji outlier pertama pada variabel
Harapan Lama Sekolah (HLS) dengan sintaks
boxplot(data$Harapan.Lama.Sekolah..HLS.,main="Harapan Lama
Sekolah", col = "blue") dimana main berfungsi untuk menamai plot
praktikan, col berfungsi sebagai warna pilihan praktikan. Maka muncul output
sebagai berikut:
11. 8
Gambar 3.2. Output boxplot variabel Harapan Lama Sekolah
Dapat dilihat pada Gambar 3.2. diatas, ternyata terdapat dua data outlier
pada variabel Harapan Lama Sekolah, ditunjukkan dengan adanya titik yang
melebihi titik maksimum ekstrim.
Uji outlier kedua pada variabel Pengeluaran Perkapital, dengan sintaks
boxplot(data$Pengeluaran.Per.Kapita, main="Pengeluaran Perkapita",
col = "red") maka muncul output sebagai berikut:
Gambar 3.3. Output boxplot variabel Pengeluran Perkapital
Dapat dilihat pada Gambar 3.3. diatas, tidak terdapat outlier dalam variabel
Pengeluaran Perkapital, ditunjukkan dengan tidak adanya titik yang melebihi titik
maksimum maupun titik minimum.
12. 9
Uji outlier ketiga pada variabel Umur Harapan Hidup Saat Lahir, dengan
sintaks boxplot(data$Umur.Harapan.Hidup.Saat.Lahir, main="Umur
Harapan Hidup", col = "pink") maka muncul output sebagai berikut:
Gambar 3.4. Output boxplot variabel Umur Harapan Hidup
Dapat dilihat pada Gambar 3.4. diatas, ternyata terdapat dua data outlier
pada variabel Harapan Lama Sekolah, ditunjukkan dengan adanya titik yang
melebihi titik minimum ekstrim.
Uji outlier keempat pada variabel Indeks Pembangunan Manusia, dengan
sintaks boxplot(data$Indeks.Pembangunan.Manusia,main="IPM",col =
"green") maka muncul output sebagai berikut:
Gambar 3.5. Output boxplot variabel Indeks Pembangunan Manusia
13. 10
Dapat dilihat pada Gambar 3.4. diatas, tidak terdapat outlier dalam variabel
Indeks Pembangunan Manusia, ditunjukkan dengan tidak adanya titik yang
melebihi titik maksimum maupun titik minimum.
Uji outlier kelima pada variabel Rata-rata Lama Sekolah, dengan sintaks
boxplot(data$Rata.Rata.Lama.Sekolah, main="Rata-rata Lama
Sekolah", col = "yellow") maka muncul output sebagai berikut:
Gambar 3.6. Output boxplot variabel Rata-rata Lama Sekolah
Dapat dilihat pada Gambar 3.6. diatas, ternyata terdapat dua data outlier
pada variabel Rata-rata Lama Sekolah, ditunjukkan dengan adanya titik yang
melebihi titik minimum ekstrim.
Selanjutnya praktikan diminta untuk melakukan uji linieritas hal tersebut
digunakan untuk melihat apakah ada atau tidak hubungan linear antar variabel,
beberapa pendapat muncul terkait perlu tidaknya kita menguji asumsi linearitas ini
terlebuh dahulu sebelum melakukan uji hipotesis. Praktikan melakukan uji linieritas
dengan membuat sebuah scatterplot. Uji linieritas pertama pada variabel Harapan
Lama Sekolah (HLS) sebagai X terhadap Indeks Pembangunan Manusia (IPM)
sebagai Y. Dengan sintaks
plot(data$Harapan.Lama.Sekolah..HLS.,data$Indeks.Pembangunan.Manus
ia,main = "Scaterplot", xlab = "Harapan Lama Sekolah", ylab = "IPM",
pch=9, col="deep pink"). Kemudian untuk menambahkan garis regresi agar
lebih mudah memeriksa, dengan sintaks
14. 11
abline(lm(data$Indeks.Pembangunan.Manusia~data$Harapan.Lama.Sekola
h..HLS.), lwd=2,col="fire brick"). Maka muncul output sebagai berikut:
Gambar 3.7. Output Scatterplot antar variabel Harapan Lama Sekolah dan
IPM
Dapat dilihat pada Gambar 3.7. diatas output scatterplot variabel Harapan
Lama Sekolah dan IPM garis tersebut positif karena garis tersebut mengarah ke
kanan atas. Membuktikan adanya hubungan linier antara variabel Harapan Lama
Sekolah dengan variabel IPM.
Uji linieritas kedua pada variabel Pengeluaran Per Kapital sebagai X terhadap
IPM sebagai Y. Dengan sintaks plot(data$Pengeluaran.Per.Kapita,
data$Indeks.Pembangunan.Manusia,main = "Scaterplot", xlab =
"Pengeluaran Per Kapita", ylab = "IPM", pch=9, col="deep pink").
Kemudian untuk menambahkan garis agar lebih mudah memeriksa, dengan sintaks
abline(lm(data$Indeks.Pembangunan.Manusia~data$Pengeluaran.Per.Kap
ita), lwd=2,col="purple"). Maka muncul output sebagai berikut:
15. 12
Gambar 3.8. Output Scatterplot antar variabel Pengeluran Perkapital dan
IPM
Dapat dilihat pada Gambar 3.8. diatas output scatterplot variabel Pengeluran
Perkapital dan IPM garis tersebut positif karena garis tersebut mengarah ke kanan
atas. Membuktikan adanya hubungan linier antara variabel Pengeluran Perkapital
dengan variabel IPM.
Uji linieritas ketiga pada variabel Umur Harapan Hidup Saat Lahir sebagai X
terhadap IPM sebagai Y. Dengan sintaks
plot(data$Umur.Harapan.Hidup.Saat.Lahir,data$Indeks.Pembangunan.Ma
nusia,main = "Scaterplot", xlab = "Umur Harapan Hidup Saat Lahir",
ylab = "IPM", pch=9, col="deep pink"). Kemudian untuk menambahkan
garis agar lebih mudah memeriksa, dengan sintaks
abline(lm(data$Indeks.Pembangunan.Manusia~data$Umur.Harapan.Hidup.
Saat.Lahir), lwd=2,col="orange"). Maka muncul output sebagai berikut:
Gambar 3.9. Output Scatterplot antar variabel Umur Harapan Hidup dan
variabel IPM
Dapat dilihat pada Gambar 3.9. diatas output scatterplot variabel Umur
Harapan Hidup dan IPM garis tersebut positif karena garis tersebut mengarah ke
kanan atas. Membuktikan adanya hubungan linier antara variabel Umur Harapan
Hidup dengan variabel IPM.
Uji linieritas keempat pada variabel Rata-rata Lama Sekolah sebagai X
terhadap IPM sebagai Y. Dengan sintaks plot(data$Rata.Rata.Lama.Sekolah,
data$Indeks.Pembangunan.Manusia,main = "Scaterplot", xlab = "Rata-
16. 13
rata Lama Sekolah", ylab = "IPM", pch=9, col="deep pink"). Kemudian
untuk menambahkan garis agar lebih mudah memeriksa, dengan sintaks
abline(lm(data$Indeks.Pembangunan.Manusia~data$Rata.Rata.Lama.Seko
lah), lwd=2,col="navy"). Maka muncul output sebagai berikut:
Gambar 3.10. Output boxplot antar variabel Rata-rata Lama Sekolah dan
IPM
Dapat dilihat pada Gambar 3.10. diatas output scatterplot variabel Rata-rata
Lama Sekolah dan IPM garis tersebut positif karena garis tersebut mengarah ke
kanan atas. Membuktikan adanya hubungan linier antara variabel Rata-rata Lama
Sekolah dengan variabel IPM.
Pada studi kasus yang kedua, praktikan diminta untuk melakukan uji
homogenitas atau homoskedastisitas antar kelompok IPM berdasarkan kategori
pengeluaran perkapita. Dimana praktikan akan melihat apakah kedua variabel
tersebut akan ada gejala homoskedastisitas atau apakah ada kesamaan variasi antar
kelompok IPM kategori pengeluaran perkapita sedang dengan kelompok IPM
kategori pengeluaran perkapita besar. Atau malah terjadi gejala homoskedastisitas
antar kelompok IPM kategori pengeluaran perkapita sedang dengan kelompok IPM
kategori pengeluaran perkapita besar. Jika variabel pengeluaran perkapita
dikelompokkan menjadi 2 yang telah ditentukan sebelumnya. Praktikan memberi
nama variabel pengeluaran perkapita dikelompokkan menjadi variabel baru yaitu
Kategori dengan sintaks bartlett.test(data$Indeks.Pembangunan.Manusia,
data$Kategori). Maka setelah di-run didapatkan hasil sebagai berikut.
17. 14
Gambar 3.11. Output Uji Homoskedastisitas antar kelompok IPM
berdasarkan kategori pengeluaran perkapita
Dapat dilihat pada Gambar 3.11. diatas Output Uji Homoskedastisitas antar
kelompok IPM berdasarkan kategori pengeluaran perkapita, Jika variabel
pengeluaran perkapita dikelompokkan menjadi 2 yang telah ditentukan
sebelumnya. Praktikan memberi nama variabel pengeluaran perkapita menjadi
Kategori. Berikut pengujian hipotesis yang dilakukan pada output Gambar 3.11:
i. Hipotesis :
H0 : Terjadi gejala homoskedastisitas (adanya kesamaan variansi antara
kelompok IPM berdasarkan kategori pengeluaran perkapita sedang dengan
kelompok IPM berdasarkan kategori pengeluaran perkapita besar)
H1 : Terjadi gejala heteroskedastisitas (adanya perbedaan variansi antara
kelompok IPM berdasarkan kategori pengeluaran perkapita sedang dengan
kelompok IPM berdasarkan kategori pengeluaran perkapita besar)
ii. Tingkat Signifikasi
α = 5%
iii. Daerah Kritis
p-value < α maka tolak 𝐻0
iv. Statistik Uji
Diperoleh p-value = 0.6935 > α = 0,05
v. Keputusan
Karena nilai p-value > 𝛼, maka keputusannya adalah gagal tolak H0
vi. Kesimpulan
Dengan tingkat kepercayaan 95% maka keputusannya adalah gagal tolak H0,
yang artinya adanya kesamaan variansi antara kelompok IPM berdasarkan
kategori pengeluaran perkapita sedang dengan kelompok IPM berdasarkan
kategori pengeluaran perkapita besar.
18. 15
4 Penutup
4.1 Kesimpulan
1. Pada studi kasus 1 uji outlier, terdapat dua data outlier ditandai adanya titik
yang melebihi titik maksimum ekstrim pada variabel Harapan Lama Sekolah,
dan juga terdapat dua data outlier ditandai adanya titik yang melebihi titik
minimum ekstrim pada variabel Umur Harapan Hidup dan Rata-rata lama
sekolah.
2. Pada uji outlier juga terdapat data yang tidak outlier yaitu pada variabel
Indeks Pembangunan Manusia dan variabel Pengeluaran Perkapital.
3. Pada uji linieritas variabel Rata-rata Lama Sekolah dan IPM garis tersebut
positif karena garis tersebut mengarah ke kanan atas. Membuktikan adanya
hubungan linier antara variabel Rata-rata Lama Sekolah dengan variabel
IPM.
4. Pada uji linieritas terlihat bahwa setiap variabel terhadap IPM menyatakan
positif karena hubungan linear antar variabel kekanan atas .
5. Pada studi kasus 2, yaitu melakukan uji homogenitas atau homoskedastisitas
antar kelompok IPM berdasarkan kategori pengeluaran perkapita. Didapatkan
adanya kesamaan variansi antara kelompok IPM berdasarkan kategori
pengeluaran perkapita sedang dengan kelompok IPM berdasarkan kategori
pengeluaran perkapita besar.
19. 16
5 Daftar Pustaka
Muhajir, M. (2021). MODUL PRAKTIKUM STATISTIKA MULTIVARIAT
TERAPAN. Yogyakarta: Univarsitas Islam Indonesia.