[Ringkasan]
Statistik deskriptif digunakan untuk meringkas dan menggambarkan karakteristik data. Terdapat berbagai ukuran kecenderungan pusat seperti rata-rata, median, dan modus serta ukuran penyebaran seperti simpangan baku dan rentang interkuartil untuk mendeskripsikan pola data. Grafik penting untuk mengeksplorasi hubungan antara variabel dan mendeteksi pola yang mungkin tidak terlihat secara numerik.
2. ■ Memahami konsep dan
tujuan statistik deskriptif
■ Menghitung ukuran
kecenderungan pusat dan
penyebaran data
■ Meringkas data berdasarkan
tipe variabel dan skala
pengukuran
■ Memahami berbagai cara
untuk menggambarkan data
secara grafis
■ Memilih dan
menggambarkan data
secara grafis dengan tepat
3. Tujuan Meringkas Data
Tipe Data dan Skala Pengukuran
Ukuran Kecenderungan Pusat dan Penyebaran
Penyajian Data Secara Grafis
Grafis yang Buruk
4.
5. Tujuan Meringkas (Summarize) Data
Meringkas data
Menerapkan konsep yang
dapat dipahami
(menunjukkan ada suatu
pola dasar tertentu)
Mengkomunikasikan pola
yang pokok/yang
mendasari
Menggeneralisir hasil dari
sampel pada populasi
6. Contoh
■ Sebanyak 50 orang ditanya
mengenai warna favoritnya.
Jawaban yang diperoleh
sebagai berikut
Biru, merah, merah, hijau,
merah, hijau, merah merah,
biru, ....
■ Cara paling sederhana
adalah dengan mendaftar
banyaknya orang yang
memilih warna tertentu yaitu
sbb
Merah 30
Biru 10
Hijau 10
9. Tidak perlu axis vertikal, dengan penggambaran yang
tepat dapat melihat proporsi relatif
10. Grafik Batang dan Persentase
Warna Proporsi Persentase
Merah 3/5 60%
Biru 1/5 20%
Hijau 1/5 20%
11. ■ VARIABEL: suatu sifat atau
karakteristik dari beberapa
obyek, kejadian, atau orang
yang nilainya dapat bervariasi
dan dapat dihitung atau diukur
– Jenis kelamin
– Tinggi badan
■ DATA : Unit dalam variabel
13. ■ Data kontinu yaitu data yang
diperoleh dari hasil pengukuran.
Data kontinu dapat
dikelompokkan menjadi:
o Data interval yaitu data yang
jaraknya sama tetapi tidak
mempunyai nilai nol absolut
(mutlak). Misal nol derajat Celcius.
o Data rasio yaitu data yang jaraknya
sama dan mempunyai nilai nol
absolut. Misal hasil pengukuran
panjang (m), berat (kg),dll
■ Data diskrit yaitu data yang
diperoleh dari hasil
menghitung atau membilang.
Misal jumlah meja ada 20
buah , jumlah orang ada 12
dsbnya
Data Numerik
14. Data kualitatif adalah data
yang tidak memiliki
interpretasi secara kuantitatif,
yaitu data hanya dapat
diklasifikasikan ke dalam
kategori-kategori.
Dalam aplikasi sehari-hari
data kualitatif berbentuk
kalimat, kata, atau gambar,
jika diinginkan pengolahan
secara kuantitatif, data ini
dapat diangkakan (skoring).
o Data biner (dichotomous data)
– Ya vs Tidak
o Data Nominal
– Data yang hanya meghasilkan
satu dan hanya satu-satunya
kategori. Contoh pendidikan, jenis
kelamin
o Data ordinal
– Data yang memiliki tingkatan data,
urutan data
Data Kualitatif
16. Ukuran Kecenderungan Sentral (Pusat/Lokasi)
Suatu ukuran atau informasi
yang menggambarkan
sebagian besar jawaban atas
suatu pertanyaan
Mean = Rataan = Rerata
Median = Nilai Tengah
Modus
17. Median = nilai tengah distribusi (persentil 50/ Q2)
Modus = nilai pengamatan yang paling sering keluar
Mean = Rataan Aritmetik
n = ukuran sampel
N = ukuran populasi
atau
Jika n ganjil
Jika n genap
19. Manakah Ukuran Pusat yang lebih Baik? Rataan
atau Median?
■ Rataan merupakan ukuran
terbaik untuk distribusi
simetris tanpa outlier
■ Median lebih bagus
digunakan untuk distribusi
data yang mencong (skew)
atau data dengan outlier
Mean = 3
Median = 3
Mean = 4
Median = 3
20. Left Skew (Mencong Kiri) Right Skew (Mencong Kanan)
Kemencongan (Skewness) vs Ukuran Pusat
21. Ukuran Penyebaran (Variabilitas)
Digunakan untuk menjelaskan
perbedaan khas antara nilai-nilai
dalam suatu himpunan nilai
Range (Rentangan)
Variansi
Standard Deviation (Simpangan
Baku/Deviasi Standar)
Inter Quartile Range (IQR)
Quartile
Persentil
22. Range = Max - Min
Variansi
Deviasi Standar: simpangan seluruh data di sekitar rataan
atau
atau
23. ■ Mengapa dalam mencari variansi dikuadratkan?
Agar negatif dan positif tidak saling membatalkan satu
sama lain
Penyimpangan yang lebih besar akan
mendapatkan bobot lebih besar
24. Manakah di antara himpunan mobil berikut yang memiliki variabilitas
jarak tempuh lebih besar?
25. ■ Quartil pertama, Q1 adalah nilai
dimana 25% pengamatan lebih kecil
dan 75% lebih besar
■ Quartil kedua atau Q2 sama dengan
median, 50% lebih kecil dan 50%
lebih besar
■ Quartil 3, Q3, hanya 25%
pengamatan lebih besar
Quartile
26. Secara umum persentil ke-n adalah nilai
sedemikian rupa n% dari pengamatan
terletak dibawah nilai tersebut
■ Contoh Penggunaan:
– Untuk merancang tinggi pintu maka kita
menggunakan persentil 95 dari populasi
– Untuk merancang tinggi letak stop kontak,
kita menggunakan persentil 5 atau 10
panjang jangkauan tangan ke atas
Persentil
28. Skala Pengukuran
1. Nominal. Skala kualitatif
paling sederhana. Fungsinya
membedakan kategori dalam
variabel yang kedudukannya
setara dan bersifat mutually
exclusive. Contoh jenis kelamin,
agama, suku/ras, dll
2. Ordinal. Skala kualitatif yang
menunjukkan perbedaan dan
memiliki tingkatan/jenjang.
Contoh tingkat pendidikan,
rating konsumen pada suatu
produk, dll
3. Interval. Skala kuantitatif
yang membedakan kategori
dengan selang atau jarak
tertentu dengan jarak antar
kategorinya sama. Contoh
tingkat kepuasan layanan
pelanggan yang dinilai dengan
skala sangat puas (5), puas
(4), ragu-ragu (3), tidak puas
(2), sangat tidak puas (1).
Besarnya perbedaan titik
sangat puas (5) dan puas (4)
sama dengan jarak antara
sangat tidak puas (1) dan tidak
puas (2).
29. Sebarang nilai yang
ditambahkan tidak mengubah
besarnya perbedaan tersebut.
Misal kita tambahkan angka 6
untuk setiap titik skala sehingga
skala pengukuran berubah dari
7-11 (dari 1-5) maka jarak
antara poin 7 ke 8 sama tetap
sama dengan jarak antara 9-11.
Skala ini tidak memiliki nol
mutlak. Contoh. Suhu
00 Celcius suatu benda bukan
berarti benda tersebut tidak
memiliki suhu/panas. Suhunya
tentu ada yaitu 00 Celcius.
4. Skala Rasio. Skala kuantitatif
yang dapat membedakan,
mengurutkan, memiliki jarak
tertentu dan dapat
dibandingkan sehingga
merupakan tingkatan skala
paling tinggi dan paling lengkap.
Skala ini memiliki nol mutlak,
artinya nilai nol berarti benar-
benar tidak ada. Contoh hasil
pengukuran anak A usia 2
tahun berat 20 kg dan anak B
usia 8 tahun berat 40kg Kita
bisa mengatakan usia anak B 3
kali lebih tua dengan berat 2
kali lipat dibandingkan anak A.
30. Ringkasan Sifat-sifat Skala Pengukuran
Skala Perbedaan Urutan Jarak
Nol
Mutlak
Ukuran
Kecenderungan
Pusat
Ukuran
Penyebaran
Uji Statistik
Perbedaan
Nominal
Modus --- 2
Ordinal
Median Semi-
interquartile
range
Korelasi Rank-
order
Interval
Rataan Deviasi
standar,
variansi
t, F
Rasio
Rataan atau
Rataan
geometrik
Deviasi
standar,
variansi
t, F
31.
32. There is no single statistical tool that is as powerful as a well-chosen graph.
Penyajian Data Secara Grafis
33. Kegunaan Metode Grafis
1. Mendeteksi adanya error
dalam data
2. Mengenali pola data
3. Mengeksplorasi hubungan
antara variabel
4. Menemukan fenomena
baru
5. Mengkonfirmasi atau
menegasikan asumsi-
asumsi
6. Menilai kecukupan (baik
tidaknya) kesesuaian
model yang diperoleh
7. Menyarankan tindakan
perbaikan (misal data perlu
ditransformasi, eksperimen
perlu didesain ulang,
mengumpulkan lebih
banyak data, dll)
8. Meningkatkan analisis
numerik secara umum
36. 1. Pie Chart
Untuk menggambarkan proporsi
variabel kualitatif (kategori).
Membagi lingkaran ke dalam
bagian-bagian (slices) yang
masing-masing berhubungan
dengan setiap kategori. Sudut
tengah bagian tersebut
proporsional terhadap frekuensi
relatif kategori.
37. 2. Bar Chart (Grafik Batang)
Untuk menggambarkan variabel
kualitatif
Grafik batang memberikan
frekuensi (atau frekuensi relatif)
yang berkaitan dengan setiap
kategori, dengan tinggi
menyatakan proporsional batang
terhadap frekuensi kategori
(frekuensi relatif)
38. Contoh: distribusi frekuensi tingkat pendidikan
Tingkat Pendidikan Frekuensi
Tidak tamat SD 697
SD 1252
SMP 889
SMA 1557
Perguruan Tinggi 364
41. 3. Dot Plot
Termasuk grafik paling
sederhana, cocok untuk data
kecil. Nilai numerik dari
pengamatan diletakkan pada
skala horisontal dengan
menempatkan suatu titik pada
nilai yang bersesuaian. Jika
nilai tersebut berulang, maka
titik-titik ditempatkan
diatasnya, membentuk
semacam tumpukan
4. Box Plot
Untuk menunjukkan
frekuensi atau proporsi suatu
variabel kategori dalam
setiap kategori
Digunakan untuk
menekankan adanya outlier,
median, dan IQR
45. 5. Stem-Leaf Plot (Diagram
Tangkai-Daun)
Membantu
memvisualisasikan bentuk
distribusi data
6. Histogram
Memberikan gambaran
kepadatan (density) data
Digunakan untuk
menggambarkan suatu
distribusi (bentuk, pusat,
range, variasi) dari variabel
kontinu
Ukuran Bin penting
46. Sampel Data Usia aki mobil (dalam tahun), n = 40
2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6
3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7
2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1
3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4
4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5
Cara Menyusun Stem-Leaf Plot
47. ■ Bagilah setiap pengamatan
dalam sekumpulan data ke
dalam dua bagian, yaitu stem
(tangkai) dan leaf (daun). Kita
akan menandakan digit
pertama usia aki mobil
sebagai stem (digit yang
berada disebelah kiri titik
desimal) dan menamakan
dua digit terakhir sebagai leaf.
■ Sebagai contoh, untuk data
usia aki mobil misalkan 3.7
maka bagian stem adalah 3
dan leaf untuk 7.
■ Daftarlah seluruh stem dalam
urutan sebuah kolom, diawali
dengan stem terkecil dan
berakhir dengan yang terbesar
■ Lakukan untuk seluruh set
data, tempatkan daun untuk
setiap pengamatan dalam
barisan stem yang tepat
menurut urutan naik. Display
stem-leaf yang lengkap
ditunjukkan dalam tabel berikut
48. ■ Kasus diatas hanya terdiri dari empat stem
sehingga belum dapat memberikan
gambaran seperti apa bentuk distribusinya.
Untuk mengatasi hal ini, kita dapat
menambahkan banyaknya tangkai (stem)
dalam plot tersebut
Stem Leaf Frekuensi
1 69 2
2 25669 5
3 0011112223334445567778899 25
4 11234577 8
49. ■ Cara sederhana untuk ini
adalah menuliskan nilai
tangkai sebanyak dua kali
dan mencatat daun 0, 1, 2,
3, dan 4 berseberangan
dengan nilai stem yang
tepat dimana nilai itu muncul
pertama kali, dan daun 5, 6,
7, 8, dan 9 berseberangan
dengan nilai tangkai dimana
nilai itu muncul untuk kedua
kali.
■ Modifikasi plot double-stem-
and-leaf digambarkan dalam
tabel berikut, dimana stem
yang berkaitan dengan daun
0 sampai 4 dikodekan
dengan simbol * dan stem
yang berkaitan dengan daun
5 sampai dengan 9
disimbolkan dengan -
51. Cara Menyusun Histogram
■ Hitung jarak (range) data
• Range = Pengamatan terbesar –
Pengamatan terkecil
• Range untuk data tabel usia aki
mobil
• Range = 4.7 – 1.6 = 3.1
■ Bagilah range tersebut ke
dalam 5 – 20 kelas yang
sama.
• Gunakan sedikit kelas untuk
banyak data yang kecil dan
sejumlah besar kelas untuk
sekumpulan data yang lebih
besar.
• Banyaknya kelas juga dapat
ditentukan menggunakan
rumus
52. ■ Batas kelas terkecil
(pertama) sebaiknya
diletakkan dibawah
pengukuran terkecil, dan
lebar kelas dipilih
sedemikian rupa sehingga
tidak ada pengamatan yang
tepat berada pada batas
kelas.
■ Untuk data tabel usia aki
mobil digunakan 7 kelas
(jika menggunakan rumus
diperoleh 6.28 yang dapat
dibulatkan ke atas)
sehingga pendekatan untuk
lebar kelas adalah
Banyaknya Pengamatan dalam
Sekumpulan Data
Banyaknya Kelas
Kurang dari 25 5 atau 6
25 – 50 7 – 14
Lebih dari 50 15 - 20
53. Hasil ini dibulatkan keatas, selanjutnya digunakan suatu kelas
dengan lebar 0.44. Hasil interval kelas ditunjukkan dalam tabel
berikut
44.0
7
1.3
7
range
kelaslebarpendekatan
Kelas Interval
Kelas
Titik tengah
Kelas
Frekuensi
Kelas
Frekuensi
Kelas Relatif
1 1.5 – 1.9 1.7 2 0.05
2 2.0 – 2.4 2.2 1 0,025
3 2.5 – 2.9 2.7 4 0.100
4 3.0 – 3.4 3.2 15 0.375
5 3.5 – 3.9 3.7 10 0.250
6 4.0 – 4.4 4.2 5 0.125
7 4.5 – 4.9 4.7 3 0.075
n =40 1.00
54. ■ Untuk setiap kelas, hitung
banyaknya pengamatan
untuk yang masuk dalam
kelas tersebut. Hasil
perhitungan ini disebut
frekuensi kelas yaitu
■ Frekuensi kelas dan frekuensi
relatif data dari tabel
ditunjukkan masing-masing
dalam kolom 4 dan 5 di tabel di
atas
pengukuranbanyaknyaTotal
kelasfrekuensiTotal
kelasrelatiffrekuensi
55. ■ Histogram pada prinsipnya
merupakan suatu grafik batang
yang menggambarkan kategori
kelas-kelas. Dalam suatu
histogram frekuensi, tinggi
batang ditentukan oleh frekuensi
kelas.
■ Dalam suatu histogram frekuensi
relatif, tinggi batang ditentukan
oleh frekuensi kelas relatif .
Histogram frekuensi relatif untuk
data usia aki mobil ditunjukkan
dalam gambar berikut
62. 7. Scatterplot
Untuk menunjukkan pola
hubungan antara dua variabel
kontinu
8. Line Graphs
Untuk menggambarkan variabel
kuantitatif menurut runtun waktu
67. Contoh Penyajian Data Secara Grafis
yang Buruk
■ Grafik yang Baik
Menyajikan data secara
akurat dan jelas
■ Grafik yang Buruk
Menggambarkan informasi yang
sedikit
Mengaburkan apa yang hendak
disampaikan (dengan chart
“sampah’)
Menggunakan pie chart (terutama
dalam warna dan 3 dimensi)
Menggunakan skala yang tidak
tepat
70. 2. Berikut ini adalah data yang diurutkan dari kecil ke besar
25, 26, 26, 30, y, y, y, 33, 150
Apakah rataannya lebih besar dari mediannya?
Apakah 26 merupakan nilai modusnya?
Manakah yang merupakan outlier (pencilan) data?