1. LAPORAN
PRAKTIKUM ANALISIS DATA EKSPLORATIF
Dosen Pengampu :
Sri Haryatmi, M.Sc.,Dr.,Prof.
Asisten Dosen :
1. Wahyu Kartika(12523)
2. Susi Utami (12769)
Oleh :
Adhitya Akbar
10/297716/PA/13065
LABORATORIUM KOMPUTASI
MATEMATIKA DAN STATISTIKA
JURUSAN MATEMATIKA
2. FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
ALAM
UNIVERSITAS GADJAH MADA
2011
BAB I
PERMASALAHAN
1. Bangunlah data dalam variable “data” yang berdistribusi binomial dengan
banyak data n=50 dan banyak percobaan 500, serta peluang sukses 0.20,
lakukan sebanyak 2 kali (‘data1’ dan ‘data2’). Lalu :
a. Buatlah daftar tally dan steam and leaf (menggunakan 1 digit pertama
sebagai batang, 2 digit pertama sebagai batang, dan 3 digit pertama
sebagai batang) dengan panjang kelas terserah, interpretasikan hasilnya
secara lengkap!
b. Carilah rata-rata, max, minimum, dan standar deviasi dari masing-masing
data tersebut.
c. Carilah rata-rata, max, minimum, dan standar deviasi dari kedua data
tersebut! Lalu bandingkan!
d. Buatlah boxplot untuk kedua data tersebut, dan lakukan standardisasi
menggunakan mean dan median. Lalu buat boxplot baru hasil
standardisasi tersebut. Bandingkan dengan boxplot sebelum standardisasi.
e. Diketahui data seperti berikut :
Data 1
601.4 597.6 598.8 598.8 601 601 598 601.2 597.8 601.4
601.6 601.6 601.4 599.4 601.4 601.4 598 601 598.2 599
598 599.4 598.4 597.2 601.4 601 598.8 600.8 598.2 601.4
6. 110 1
111 1
113 1
115 1
N= 50
Interpretasi: Jumlah data(N)=50, Count menampilkan hitungan atau frekuensi setiap
kelas, untuk daftar Tally diatas tidak mempunyai interval/panjang kelas, sehingga
datanya individual dan dapat dilihat nilai keseluruhan dari data, data diurutkan dari data
terkecil ke data terbesar(ascending).
Daftar Tally di atas menunjukkan data yang bernilai 78 berjumlah 1, 86 berjumlah 1, 87
berjumlah 1, 88 berjumlah 1, 89 berjumlah 1, 90 berjumlah 2, 92 berjumlah 2, dst.
Daftar Tally diatas merupakan daftar Tally yang sederhana dan dapat dikerjakan secara
manual. Untuk daftar Tally yang lebih kompleks dapat dilihat di bawah ini.
Output: Daftar Tally ‘DATA1’ (complicated)
Tally for Discrete Variables: DATA1
DATA1 Count CumCnt Percent CumPct
78 1 1 2.00 2.00
86 1 2 2.00 4.00
87 1 3 2.00 6.00
88 1 4 2.00 8.00
89 1 5 2.00 10.00
90 2 7 4.00 14.00
92 2 9 4.00 18.00
93 4 13 8.00 26.00
94 3 16 6.00 32.00
95 3 19 6.00 38.00
96 2 21 4.00 42.00
98 1 22 2.00 44.00
100 1 23 2.00 46.00
101 4 27 8.00 54.00
102 6 33 12.00 66.00
104 6 39 12.00 78.00
105 1 40 2.00 80.00
106 4 44 8.00 88.00
108 1 45 2.00 90.00
109 1 46 2.00 92.00
110 1 47 2.00 94.00
111 1 48 2.00 96.00
113 1 49 2.00 98.00
115 1 50 2.00 100.00
N= 50
Untuk daftar Tally diatas terlihat CumCnt (cumulative counts) yaitu menampilkan
frekuensi kumulatif setiap kelas, Percent menampilkan frekuensi relatif setiap kelas, dan
CumPct (cumulative percents) menampilkan frekuensi relatif kumulatif setiap kelas.
Output: Daftar Tally ‘DATA2’(simple)
7. Tally for Discrete Variables: DATA2
DATA2 Count
78 1
89 2
91 2
92 2
93 2
95 3
96 3
97 2
98 4
99 3
100 3
101 5
102 2
103 4
104 1
106 2
107 5
108 1
110 1
111 1
115 1
N= 50
Interpretasi: Jumlah data(N)=50, Count menampilkan hitungan atau frekuensi setiap
kelas, untuk daftar Tally diatas tidak mempunyai interval/panjang kelas, sehingga
datanya individual dan dapat dilihat nilai keseluruhan dari data, data diurutkan dari data
terkecil ke data terbesar(ascending).
Daftar Tally diatas menunjukkan data yang bernilai 78 berjumlah 1, 89 berjumlah 2, 91
berjumlah 2, 92 berjumlah 2, 93 berjumlah 2, 95 berjumlah 3, 96 berjumlah 3, dst.
Output: Daftar Tally ‘DATA2’ (complicated)
Tally for Discrete Variables: DATA2
DATA2 Count CumCnt Percent CumPct
78 1 1 2.00 2.00
89 2 3 4.00 6.00
91 2 5 4.00 10.00
92 2 7 4.00 14.00
93 2 9 4.00 18.00
95 3 12 6.00 24.00
96 3 15 6.00 30.00
97 2 17 4.00 34.00
98 4 21 8.00 42.00
99 3 24 6.00 48.00
100 3 27 6.00 54.00
101 5 32 10.00 64.00
102 2 34 4.00 68.00
103 4 38 8.00 76.00
104 1 39 2.00 78.00
106 2 41 4.00 82.00
8. 107 5 46 10.00 92.00
108 1 47 2.00 94.00
110 1 48 2.00 96.00
111 1 49 2.00 98.00
115 1 50 2.00 100.00
N= 50
Untuk daftar Tally diatas terlihat CumCnt (cumulative counts) yaitu menampilkan
frekuensi kumulatif setiap kelas, Percent menampilkan frekuensi relatif setiap kelas, dan
CumPct (cumulative percents) menampilkan frekuensi relatif kumulatif setiap kelas.
Kelebihan daftar Tally:
Dapat melihat bentuk distribusi data
Dapat menghitung frekuensi dengan cepat
Melihat ada/tidaknya data ekstrim
Output: Stem and Leaf ‘DATA1’ dengan increment=100
Stem-and-Leaf Display: DATA1
Stem-and-leaf of DATA1 N = 50
Leaf Unit = 10
22 0 7888899999999999999999
(28) 1 0000000000000000000000001111
Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=100→leaf unit(unit
daun)=10. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat
dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke bawah. Tanda
kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut.
Output: Stem and Leaf ‘DATA1’ dengan increment=10
Stem-and-Leaf Display: DATA1
Stem-and-leaf of DATA1 N = 50
Leaf Unit = 1.0
1 7 8
5 8 6789
9. 22 9 00223333444555668
(24) 10 011112222224444445666689
4 11 0135
Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=10→leaf unit(unit
daun)=1. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(puluhan) dan kolom ketiga adalah daun(satuan). Terlihat(dapat
dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke bawah. Tanda
kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut.
Output: Stem and Leaf ‘DATA1’ dengan increment=1
Stem-and-Leaf Display: DATA1
Stem-and-leaf of DATA1 N = 50
Leaf Unit = 0.10
1 78 0
1 79
1 80
1 81
1 82
1 83
1 84
1 85
2 86 0
3 87 0
4 88 0
5 89 0
7 90 00
7 91
9 92 00
13 93 0000
16 94 000
19 95 000
21 96 00
21 97
22 98 0
22 99
23 100 0
(4) 101 0000
23 102 000000
17 103
17 104 000000
11 105 0
10 106 0000
6 107
6 108 0
5 109 0
4 110 0
3 111 0
2 112
2 113 0
1 114
10. 1 115 0
Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=1→leaf unit(unit
daun)=0.1. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(karena panjang kelasnya hanya 1, maka data dijabarkan seluruhnya
secara ascending) dan kolom ketiga adalah daun(satuan), karena pada batang telah
dijabarkan keseluruhan nilai dari data, maka otomatis daunnya pun bernilai 0.
Terlihat(dapat dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke
bawah. Tanda kurung (….) menunjukkan median(nilai tengah) data berada pada kelas
tersebut.
Output: Stem and Leaf ‘DATA2’ dengan increment=100
Stem-and-Leaf Display: DATA2
Stem-and-leaf of DATA2 N = 50
Leaf Unit = 10
LO 7
24 0 88999999999999999999999
(25) 1 0000000000000000000000011
HI 11
Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=100→leaf unit(unit
daun)=10. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat
dibuktikan dengan boxplot) bahwa distribusi angkatan di atas mendekati normal. Tanda
kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut. Terlihat
adanya data ekstrim bawah(LO) dan data ekstrim atas(HI). Data ekstrim bawah berada
pada batang 0 dan daun 7(LO 7) atau data (0,7)→bernilai 78. Data ekstrim atas berada
pada batang 1 dan daun 1(HI 11) atau data (1,1)→bernilai 115.
Output: Stem and Leaf ‘DATA2’ dengan increment=10
Stem-and-Leaf Display: DATA2
Stem-and-leaf of DATA2 N = 50
Leaf Unit = 1.0
11. LO 78
3 8 99
24 9 112233555666778888999
(23) 10 00011111223333466777778
3 11 01
HI 115
Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=10→leaf unit(unit
daun)=1. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat
dibuktikan dengan boxplot) bahwa distribusi angkatan di atas mendekati normal. Tanda
kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut. Terlihat
adanya data ekstrim bawah(LO) dan data ekstrim atas(HI). Data ekstrim bawah berada
pada batang 0 dan daun 7(LO 7) atau data (0,7)→bernilai 78. Data ekstrim atas berada
pada batang 1 dan daun 1(HI 11) atau data (1,1)→bernilai 115.
Output: Stem and Leaf ‘DATA2’ dengan increment=1
Stem-and-Leaf Display: DATA2
Stem-and-leaf of DATA2 N = 50
Leaf Unit = 0.10
LO 780
3 89 00
3 90
5 91 00
7 92 00
9 93 00
9 94
12 95 000
15 96 000
17 97 00
21 98 0000
24 99 000
(3) 100 000
23 101 00000
18 102 00
16 103 0000
12 104 0
11 105
11 106 00
9 107 00000
4 108 0
3 109
12. 3 110 0
2 111 0
HI 1150
Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=100→leaf unit(unit
daun)=10. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat
dibuktikan dengan boxplot) bahwa distribusi angkatan di atas mendekati normal. Tanda
kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut. Terlihat
adanya data ekstrim bawah(LO) dan data ekstrim atas(HI). Data ekstrim bawah berada
pada batang 0 dan daun 7(LO 7) atau data (0,7)→bernilai 78. Data ekstrim atas berada
pada batang 1 dan daun 1(HI 11) atau data (1,1)→bernilai 115.
b)
Output: Mean, StDev, Minimum, Maximum ‘DATA1’
Descriptive Statistics:DATA1
Total
Variable Count Mean StDev Minimum Maximum
DATA1 50 99.12 7.65 78.00 115.00
Output: Mean, StDev, Minimum, Maximum ‘DATA2’
Descriptive Statistics:DATA2
Total
Variable Count Mean StDev Minimum Maximum
DATA2 50 99.600 6.636 78.000 115.000
c)
Output: Mean, StDev, Minimum, Maximum dari kedua data(data gabungan)
Descriptive Statistics:DATA1+2
Total
Variable Count Mean StDev Minimum Maximum
DATA1+2 100 99.360 7.132 78.000 115.000
Output: Perbandingan Mean, StDev, Minimum, Maximum dari DATA1, DATA2, dan
DATA1+2(data gabungan)
Descriptive Statistics:DATA1, DATA2, DATA1+2
13. Total
Variable Count Mean StDev Minimum Maximum
DATA1 50 99.12 7.65 78.00 115.00
DATA2 50 99.600 6.636 78.000 115.000
DATA1+2 100 99.360 7.132 78.000 115.000
Perbandingan mean antara DATA1, DATA2, dan data gabungan
o Selisih antara mean DATA1 dengan DATA2 adalah 0.48
o Selisih antara mean DATA1 dengan data gabungan adalah 0.24
o Selisih antara mean DATA2 dengan data gabungan adalah 0.24
Selisih mean antara DATA1 dan DATA2 dengan data gabungan adalah
sama 0.24, tetapi bukan berarti mean DATA1 dan DATA2 adalah sama,
mean DATA1 0.24 dibawah mean data gabungan, sedangkan mean
DATA2 0.24 diatas mean data gabungan.
Perbandingan standar deviasi antara DATA1, DATA2, dan data gabungan
o Selisih antara st.dev DATA1 dengan DATA2 adalah 1.014
o Selisih antara st.dev DATA1 dengan data gabungan adalah 0.518
o Selisih antara st.dev DATA2 dengan data gabungan adalah 0.496
Nilai minimum dan maksimum DATA1 dan DATA2 sama, maka otomatis nilai
minimum dan maksimum data gabungan pun sama.
d)
Output: Boxplot data gabungan DATA1 dan DATA2
14. DATA1+2 120
110
100
90
80
7878
Boxplot Data Gabungan
Interpretasi:
Boxplot menunjukkan bentuk distribusi data(normal/menjurai ke atas/menjurai ke bawah)
Boxplot diatas sedikit menjurai ke bawah.
Dari boxplot, kita dapat memperkirakan nilai dari Q1, median, Q3, nilai maksimum dan
minimum. Garis tengah dalam kotak menunjukkan median(bernilai 100.5). Garis
horizontal atasnya menunjukkan Q3(bernilai 104). Garis horizontal bawahnya
menunjukkan Q1(bernilai 94.25). Ujung atas garis vertikal menunjukkan nilai
maksimum(bernilai 115), dan ujung bawah garis vertikal menunjukkan nilai
minimum(bernilai 78←ditunjukkan oleh outlier).
Output: Boxplot hasil standarisasi mean
16. stndarisasimedian
0.50
0.25
0.00
-0.25
-0.50
-0.75
0
Standarisasi Median
Standarisasi median yaitu mengurangi setiap data dengan median lalu
membaginya dengan range(jangkauan). Standarisasi median ini menghasilkan
pusat data menjadi 0(dapat dilihat pada pusat data di atas). Jadi dapat disimpulkan
bahwa standarisasi median lebih baik, karena tujuan dari standarisasi adalah
membuat pusat data menjadi 0.
Output: Boxplot sebelum dan sesudah standarisasi
Data
standarisasi medianstandarisasi meanDATA1+2
120
100
80
60
40
20
0
100.5
0.159853 0
Perbandingan Boxplot Sebelum dan Sesudah Standarisasi
e)
17. data_gab
600
500
400
300
200
100
0
Boxplot Data Asli
Boxplot di atas(hasil dari gabungan data1 dan data2) sama sekali belum
simetri(sangat menjurai ke bawah), untuk itu, perlu dilakukan transformasi
sampai data berdistribusi normal(pusat data berada di tengah-tengah). Berikut ini
adalah boxplot hasil transformasi yang sudah cukup simetris.
data_gab
-2.000E-14
-4.000E-14
-6.000E-14
-8.000E-14
-1.000E-13
-1.200E-13
-1.400E-13
-1.600E-13
Boxplot Hasil Transformasi