Analisis Data Eksploratif

LAPORAN
PRAKTIKUM ANALISIS DATA EKSPLORATIF
Dosen Pengampu :
Sri Haryatmi, M.Sc.,Dr.,Prof.
Asisten Dosen :
1. Wahyu Kartika(12523)
2. Susi Utami (12769)
Oleh :
Adhitya Akbar
10/297716/PA/13065
LABORATORIUM KOMPUTASI
MATEMATIKA DAN STATISTIKA
JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
ALAM
UNIVERSITAS GADJAH MADA
2011
BAB I
PERMASALAHAN
1. Bangunlah data dalam variable “data” yang berdistribusi binomial dengan
banyak data n=50 dan banyak percobaan 500, serta peluang sukses 0.20,
lakukan sebanyak 2 kali (‘data1’ dan ‘data2’). Lalu :
a. Buatlah daftar tally dan steam and leaf (menggunakan 1 digit pertama
sebagai batang, 2 digit pertama sebagai batang, dan 3 digit pertama
sebagai batang) dengan panjang kelas terserah, interpretasikan hasilnya
secara lengkap!
b. Carilah rata-rata, max, minimum, dan standar deviasi dari masing-masing
data tersebut.
c. Carilah rata-rata, max, minimum, dan standar deviasi dari kedua data
tersebut! Lalu bandingkan!
d. Buatlah boxplot untuk kedua data tersebut, dan lakukan standardisasi
menggunakan mean dan median. Lalu buat boxplot baru hasil
standardisasi tersebut. Bandingkan dengan boxplot sebelum standardisasi.
e. Diketahui data seperti berikut :
Data 1
601.4 597.6 598.8 598.8 601 601 598 601.2 597.8 601.4
601.6 601.6 601.4 599.4 601.4 601.4 598 601 598.2 599
598 599.4 598.4 597.2 601.4 601 598.8 600.8 598.2 601.4

601.4 601.2 601.6 600.8 598.8 601.2 601 601.2 598.2 601.8
599.4 598.4 598.8 600.6 598.8 601.4 600.8 601.6 599.2 601.6
600 599.2 601.2 599.6 598.8 601.8 598.8 601.4 599.2 601.2
600.2 598.8 599.6 599.4 598.2 601.6 599.4 601.4 600.6 601.2
601.2 601.4 601.2 598 601.8 601 601 600 601.2 601.2
598.4 599 598.2 600.8 601 600.2 598.8 599 598.4 601.2
599 601 598.8 597.8 601.4 599 599.6 600.4 602.2 601
Data 2
44.2 42.4 43.1 49.1 45 50.7
44.3 42.2 43.2 48.9 44.8 50.7
44.4 41.8 42.8 49.4 44.9 50.9
43.4 40.1 43 50 45.2 50.5
42.8 42 42.8 50 45.2 51.2
44.3 42.4 42.5 49.6 45 50.7
44.4 43.1 42.6 49.9 45.5 50.3
44.8 42.4 42.3 49.6 46.2 49.2
44.4 48.3 42.9 44.7 46.8 48.1
43.1 42.6 43.6 44.5 47.5 48.3
Buatlah boxplot untuk kedua data tersebut, lalu jika belum simetri , lakukanlah
transformasi sampai didapatkan boxplot yang simetri.

BAB II
PEMBAHASAN
Output: Data random binomial dengan n=50, number of trials=500, dan probability of
success=0.2
DATA1 DATA2
90 107
102 98
92 106
104 102
95 92
102 103
105 89
102 100
101 91
102 103
88 89
93 96
93 99
89 104
86 97
111 101
104 111
110 95
108 110
92 95
95 103
94 107
104 96
104 95

102 97
115 99
78 103
101 99
106 98
94 93
93 78
109 100
90 92
96 107
102 102
94 101
101 96
98 98
106 106
95 108
87 98
106 107
104 101
104 101
101 91
106 93
96 101
113 115
93 107
100 100
a) Output: Daftar Tally ‘DATA1’ (simple)
Tally for Discrete Variables: DATA1
DATA1 Count
78 1
86 1
87 1
88 1
89 1
90 2
92 2
93 4
94 3
95 3
96 2
98 1
100 1
101 4
102 6
104 6
105 1
106 4
108 1
109 1

110 1
111 1
113 1
115 1
N= 50
Interpretasi: Jumlah data(N)=50, Count menampilkan hitungan atau frekuensi setiap
kelas, untuk daftar Tally diatas tidak mempunyai interval/panjang kelas, sehingga
datanya individual dan dapat dilihat nilai keseluruhan dari data, data diurutkan dari data
terkecil ke data terbesar(ascending).
Daftar Tally di atas menunjukkan data yang bernilai 78 berjumlah 1, 86 berjumlah 1, 87
berjumlah 1, 88 berjumlah 1, 89 berjumlah 1, 90 berjumlah 2, 92 berjumlah 2, dst.
Daftar Tally diatas merupakan daftar Tally yang sederhana dan dapat dikerjakan secara
manual. Untuk daftar Tally yang lebih kompleks dapat dilihat di bawah ini.
Output: Daftar Tally ‘DATA1’ (complicated)
DATA1 Count CumCnt Percent CumPct
78 1 1 2.00 2.00
86 1 2 2.00 4.00
87 1 3 2.00 6.00
88 1 4 2.00 8.00
89 1 5 2.00 10.00
90 2 7 4.00 14.00
92 2 9 4.00 18.00
93 4 13 8.00 26.00
94 3 16 6.00 32.00
95 3 19 6.00 38.00
96 2 21 4.00 42.00
98 1 22 2.00 44.00
100 1 23 2.00 46.00
101 4 27 8.00 54.00
102 6 33 12.00 66.00
104 6 39 12.00 78.00
105 1 40 2.00 80.00
106 4 44 8.00 88.00
108 1 45 2.00 90.00
109 1 46 2.00 92.00
110 1 47 2.00 94.00
111 1 48 2.00 96.00
113 1 49 2.00 98.00
115 1 50 2.00 100.00
N= 50
Untuk daftar Tally diatas terlihat CumCnt (cumulative counts) yaitu menampilkan
frekuensi kumulatif setiap kelas, Percent menampilkan frekuensi relatif setiap kelas, dan
CumPct (cumulative percents) menampilkan frekuensi relatif kumulatif setiap kelas.
 Output: Daftar Tally ‘DATA2’(simple)

DATA2 Count
78 1
89 2
91 2
92 2
93 2
95 3
96 3
97 2
98 4
99 3
100 3
101 5
102 2
103 4
104 1
106 2
107 5
108 1
110 1
111 1
115 1
N= 50
Interpretasi: Jumlah data(N)=50, Count menampilkan hitungan atau frekuensi setiap
kelas, untuk daftar Tally diatas tidak mempunyai interval/panjang kelas, sehingga
datanya individual dan dapat dilihat nilai keseluruhan dari data, data diurutkan dari data
terkecil ke data terbesar(ascending).
Daftar Tally diatas menunjukkan data yang bernilai 78 berjumlah 1, 89 berjumlah 2, 91
berjumlah 2, 92 berjumlah 2, 93 berjumlah 2, 95 berjumlah 3, 96 berjumlah 3, dst.
Output: Daftar Tally ‘DATA2’ (complicated)
DATA2 Count CumCnt Percent CumPct
78 1 1 2.00 2.00
89 2 3 4.00 6.00
91 2 5 4.00 10.00
92 2 7 4.00 14.00
93 2 9 4.00 18.00
95 3 12 6.00 24.00
96 3 15 6.00 30.00
97 2 17 4.00 34.00
98 4 21 8.00 42.00
99 3 24 6.00 48.00
100 3 27 6.00 54.00
101 5 32 10.00 64.00
102 2 34 4.00 68.00
103 4 38 8.00 76.00
104 1 39 2.00 78.00
106 2 41 4.00 82.00

107 5 46 10.00 92.00
108 1 47 2.00 94.00
110 1 48 2.00 96.00
111 1 49 2.00 98.00
115 1 50 2.00 100.00
N= 50
Untuk daftar Tally diatas terlihat CumCnt (cumulative counts) yaitu menampilkan
frekuensi kumulatif setiap kelas, Percent menampilkan frekuensi relatif setiap kelas, dan
CumPct (cumulative percents) menampilkan frekuensi relatif kumulatif setiap kelas.
 Kelebihan daftar Tally:
 Dapat melihat bentuk distribusi data
 Dapat menghitung frekuensi dengan cepat
 Melihat ada/tidaknya data ekstrim
 Output: Stem and Leaf ‘DATA1’ dengan increment=100
Stem-and-Leaf Display: DATA1
Stem-and-leaf of DATA1 N = 50
Leaf Unit = 10
22 0 7888899999999999999999
(28) 1 0000000000000000000000001111
Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=100→leaf unit(unit
daun)=10. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat
dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke bawah. Tanda
kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut.
Leaf Unit = 1.0
1 7 8
5 8 6789

22 9 00223333444555668
(24) 10 011112222224444445666689
4 11 0135
kedua adalah batang(puluhan) dan kolom ketiga adalah daun(satuan). Terlihat(dapat
dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke bawah. Tanda
kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut.
Leaf Unit = 0.10
1 78 0
1 79
1 80
1 81
1 82
1 83
1 84
1 85
2 86 0
3 87 0
4 88 0
5 89 0
7 90 00
7 91
9 92 00
13 93 0000
16 94 000
19 95 000
21 96 00
21 97
22 98 0
22 99
23 100 0
(4) 101 0000
23 102 000000
17 103
17 104 000000
11 105 0
10 106 0000
6 107
6 108 0
5 109 0
4 110 0
3 111 0
2 112
2 113 0
1 114

1 115 0
daun)=0.1. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom
kedua adalah batang(karena panjang kelasnya hanya 1, maka data dijabarkan seluruhnya
secara ascending) dan kolom ketiga adalah daun(satuan), karena pada batang telah
dijabarkan keseluruhan nilai dari data, maka otomatis daunnya pun bernilai 0.
Terlihat(dapat dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke
bawah. Tanda kurung (….) menunjukkan median(nilai tengah) data berada pada kelas
tersebut.
Leaf Unit = 10
LO 7
24 0 88999999999999999999999
(25) 1 0000000000000000000000011
HI 11
dibuktikan dengan boxplot) bahwa distribusi angkatan di atas mendekati normal. Tanda
kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut. Terlihat
adanya data ekstrim bawah(LO) dan data ekstrim atas(HI). Data ekstrim bawah berada
pada batang 0 dan daun 7(LO 7) atau data (0,7)→bernilai 78. Data ekstrim atas berada
pada batang 1 dan daun 1(HI 11) atau data (1,1)→bernilai 115.
Leaf Unit = 1.0

LO 78
3 8 99
24 9 112233555666778888999
(23) 10 00011111223333466777778
3 11 01
HI 115
Output: Stem and Leaf ‘DATA2’ dengan increment=1
 Stem-and-Leaf Display: DATA2
Leaf Unit = 0.10
LO 780
3 89 00
3 90
5 91 00
7 92 00
9 93 00
9 94
12 95 000
15 96 000
17 97 00
21 98 0000
24 99 000
(3) 100 000
23 101 00000
18 102 00
16 103 0000
12 104 0
11 105
11 106 00
9 107 00000
4 108 0
3 109

3 110 0
2 111 0
HI 1150
b)
 Output: Mean, StDev, Minimum, Maximum ‘DATA1’
Descriptive Statistics:DATA1
Total
Variable Count Mean StDev Minimum Maximum
DATA1 50 99.12 7.65 78.00 115.00
 Output: Mean, StDev, Minimum, Maximum ‘DATA2’
Descriptive Statistics:DATA2
Total
DATA2 50 99.600 6.636 78.000 115.000
c)
Output: Mean, StDev, Minimum, Maximum dari kedua data(data gabungan)
Descriptive Statistics:DATA1+2
Total
DATA1+2 100 99.360 7.132 78.000 115.000
Output: Perbandingan Mean, StDev, Minimum, Maximum dari DATA1, DATA2, dan
DATA1+2(data gabungan)
Descriptive Statistics:DATA1, DATA2, DATA1+2

Total
DATA1 50 99.12 7.65 78.00 115.00
DATA2 50 99.600 6.636 78.000 115.000
DATA1+2 100 99.360 7.132 78.000 115.000
Perbandingan mean antara DATA1, DATA2, dan data gabungan
o Selisih antara mean DATA1 dengan DATA2 adalah 0.48
o Selisih antara mean DATA1 dengan data gabungan adalah 0.24
o Selisih antara mean DATA2 dengan data gabungan adalah 0.24
 Selisih mean antara DATA1 dan DATA2 dengan data gabungan adalah
sama 0.24, tetapi bukan berarti mean DATA1 dan DATA2 adalah sama,
mean DATA1 0.24 dibawah mean data gabungan, sedangkan mean
DATA2 0.24 diatas mean data gabungan.
Perbandingan standar deviasi antara DATA1, DATA2, dan data gabungan
o Selisih antara st.dev DATA1 dengan DATA2 adalah 1.014
o Selisih antara st.dev DATA1 dengan data gabungan adalah 0.518
o Selisih antara st.dev DATA2 dengan data gabungan adalah 0.496
Nilai minimum dan maksimum DATA1 dan DATA2 sama, maka otomatis nilai
minimum dan maksimum data gabungan pun sama.
d)
Output: Boxplot data gabungan DATA1 dan DATA2

DATA1+2 120
110
100
90
80
7878
Boxplot Data Gabungan
Interpretasi:
Boxplot menunjukkan bentuk distribusi data(normal/menjurai ke atas/menjurai ke bawah)
Boxplot diatas sedikit menjurai ke bawah.
Dari boxplot, kita dapat memperkirakan nilai dari Q1, median, Q3, nilai maksimum dan
minimum. Garis tengah dalam kotak menunjukkan median(bernilai 100.5). Garis
horizontal atasnya menunjukkan Q3(bernilai 104). Garis horizontal bawahnya
menunjukkan Q1(bernilai 94.25). Ujung atas garis vertikal menunjukkan nilai
maksimum(bernilai 115), dan ujung bawah garis vertikal menunjukkan nilai
minimum(bernilai 78←ditunjukkan oleh outlier).
 Output: Boxplot hasil standarisasi mean

stndrisasimean
2
1
0
-1
-2
-3
0.159853
Standarisasi Mean
Interpretasi:
Standarisasi mean yaitu mengurangi setiap data dengan mean lalu dibagi dengan
standar deviasi(s). Standarisasi mean ini menghasilkan pusat data menjadi
0.159853(dapat dilihat pada pusat data di atas).
 Output: Boxplot hasil standarisasi median

stndarisasimedian
0.50
0.25
0.00
-0.25
-0.50
-0.75
0
Standarisasi Median
Standarisasi median yaitu mengurangi setiap data dengan median lalu
membaginya dengan range(jangkauan). Standarisasi median ini menghasilkan
pusat data menjadi 0(dapat dilihat pada pusat data di atas). Jadi dapat disimpulkan
bahwa standarisasi median lebih baik, karena tujuan dari standarisasi adalah
membuat pusat data menjadi 0.
 Output: Boxplot sebelum dan sesudah standarisasi
Data
standarisasi medianstandarisasi meanDATA1+2
120
100
80
60
40
20
0
100.5
0.159853 0
Perbandingan Boxplot Sebelum dan Sesudah Standarisasi
e)

data_gab
600
500
400
300
200
100
0
Boxplot Data Asli
Boxplot di atas(hasil dari gabungan data1 dan data2) sama sekali belum
simetri(sangat menjurai ke bawah), untuk itu, perlu dilakukan transformasi
sampai data berdistribusi normal(pusat data berada di tengah-tengah). Berikut ini
adalah boxplot hasil transformasi yang sudah cukup simetris.
data_gab
-2.000E-14
-4.000E-14
-6.000E-14
-8.000E-14
-1.000E-13
-1.200E-13
-1.400E-13
-1.600E-13
Boxplot Hasil Transformasi

Analisis Data Eksploratif

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (12)

Similar to Analisis Data Eksploratif

Similar to Analisis Data Eksploratif (20)

Recently uploaded

Recently uploaded (9)

Analisis Data Eksploratif