Berisi bab 2 Materi Kuliah Statistik Industri
Statistik Deskriptif :
- Tipe Variabel, Tipe Data
- Ukuran Kecenderungan Pusat
- Ukuran Sebaran (Variabilitas)
- Penggambaran Data secara Grafis
4. Meringkas data
Menerapkan konsep yang dapat dipahami
(menunjukkan ada suatu pola dasar tertentu)
Mengkomunikasikan pola yang pokok/yang
mendasari
Menggeneralisir hasil dari sampel pada populasi
5. Meringkas Data
Harga rata-rata PC merek Gateway $2,489
Range harga $999 hingga $4,678
Modus $2,200
Menunjukkan pola dasar dalam data
30% pembelian pada harga ≤ $1,500
50% pembelian terjadi pada harga $1,500 - $2,500
20% pembelian pada harga > $2,500
6. Mengintepretasikan pola tersebut
Mayoritas pembeli Gateway membeli dengan
harga kurang ≤ $2,500
Menggeneralisir pola tersebut pada
populasi
95% dari seluruh pembeli Gateway membayar
membeli PC dengan harga antara $2,000 - $3,000
7. VARIABEL: suatu sifat atau karakteristik dari
beberapa obyek, kejadian, atau orang yang
nilainya dapat bervariasi dan dapat dihitung
atau diukur
Jenis kelamin
Tinggi badan
DATA : Unit dalam variabel
8. Variabel
Numerik /
Kuantitatif
Kontinu Diskrit
Kategori /
Kualitatif
Kategori Biasa Ordinal
9. DATA
Numerik /
Kuantitatif
Kontinu Diskrit
Kategori /
Kualitatif
Biner
2 kategori
Nominal
> 2 kategori
Ordinal
Urutan
penting
10. Data Kontinu
Data kontinu yaitu data yang diperoleh dari hasil
pengukuran. Data kontinu dapat dikelompokkan
menjadi:
Data interval yaitu data yang jaraknya sama tetapi tidak
mempunyai nilai nol absolut (mutlak). Misal nol derajat
Celcius.
Data rasio yaitu data yang jaraknya sama dan
mempunyai nilai nol absolut. Misal hasil pengukuran
panjang (m), berat (kg), dsbnya
Data Diskrit
Data diskrit yaitu data yang diperoleh dari hasil
menghitung atau membilang. Misal jumlah meja
ada 20 buah , jumlah orang ada 12 dsbnya
11. • Data kualitatif adalah data yang tidak memiliki
interpretasi secara kuantitatif, yaitu data hanya dapat
diklasifikasikan ke dalam kategori-kategori.
• Dalam aplikasi sehari-hari data kualitatif berbentuk
kalimat, kata, atau gambar, jika diinginkan pengolahan
secara kuantitatif, data ini dapat diangkakan (skoring).
Data biner (dichotomous data)
Ya vs Tidak
Data Nominal
Data yang hanya meghasilkan satu dan hanya
satu-satunya kategori. Contoh pendidikan, jenis
kelamin
Data ordinal
Data yang memiliki tingkatan data, urutan data
12.
13.
14. Statistik Deksriptif
Ukuran
Kecenderungan Pusat
Mean
Median
Modus
Ukuran Penyebaran
(Variabilitas
Range
Inter Quartile Range
Standar Deviasi
Variansi
15. Mean = Rataan
Median = Nilai Tengah
Modus
Suatu ukuran atau informasi yang
menggambarkan sebagian besar jawaban atas
suatu pertanyaan
16. Median = nilai tengah distribusi (persentil 50)
Modus = nilai pengamatan yang paling
sering keluar
17.
18. Rataan merupakan ukuran terbaik untuk
distribusi simetris tanpa outlier
Median lebih bagus digunakan untuk
distribusi data yang mencong (skew) atau data
dengan outlier
Mean = 3
Median = 3
Mean = 4
Median = 3
21. Range = Max - Min
Variansi Sampel
Deviasi Standar: simpangan seluruh data
di sekitar rataan
22. Mengapa dalam mencari variansi
dikuadratkan?
Agar negatif dan positif tidak saling
membatalkan satu sama lain
Penyimpangan yang lebih besar
akan mendapatkan bobot lebih
besar
23. Manakah diantara himpunan mobil berikut
yang memiliki variabilitas jarak tempuh lebih
besar?
24. Quartil pertama, Q1 adalah nilai dimana 25%
pengamatan lebih kecil dan 75% lebih besar
Quartil kedua atau Q2 sama dengan median,
50% lebih kecil dan 50% lebih besar
Quartil 3 , Q3, hanya 25% pengamatan lebih
besar
25. Secara umum persentil ke-n adalah nilai
sedemikian rupa n% dari pengamatan terletak
dibawah nilai tersebut
Contoh Penggunaan:
Untuk merancang tinggi pintu maka kita
menggunakan persentil 95 dari populasi
Untuk merancang tinggi letak stop kontak, kita
menggunakan persentil 5 atau 10 panjang jangkauan
tangan ke atas
29. Pie Chart
Untuk menggambarkan proporsi variabel kualitatif
(kategori).
Membagi lingkaran ke dalam bagian-bagian (slices)
yang masing-masing berhubungan dengan setiap
kategori. Sudut tengah bagian tersebut proporsional
terhadap frekuensi relatif kategori.
Bar Chart (Grafik Batang)
Untuk menggambarkan variabel kualitatif
Grafik batang memberikan frekuensi (atau frekuensi
relatif) yang berkaitan dengan setiap kategori,
dengan tinggi menyatakan proporsional batang
terhadap frekuensi kategori (frekuensi relatif)
30. Kategori Frekuensi Frekuensi Relatif
Negara
Banyaknya Reaktor
Nuklir
Proporsi
Belgia 4 0.0408
Perancis 22 0.2245
Finlandia 2 0.0204
Jerman 7 0.0714
Belanda 1 0.0102
Jepang 11 0.1123
Swedia 3 0.0306
Swiss 1 0.0102
Amerika Serikat 47 0.4796
TOTAL 98 1.000
32. 4%
23%
2%
7%
11% 1%
3%
1%
48%
Belgia
Perancis
Finlandia
Jerman
Belanda
Jepang
Swedia
Swiss
Amerika Serikat
33. Dot Plot
Termasuk grafik paling sederhana, cocok untuk data
kecil. Nilai numerik dari pengamatan diletakkan
pada skala horisontal dengan menempatkan suatu
titik pada nilai yang bersesuaian. Jika nilai tersebut
berulang, maka titik-titik ditempatkan diatasnya,
membentuk semacam tumpukan
Box Plot
Untuk menunjukkan frekuensi atau proporsi suatu
variabel kategori dalam setiap kategori
Digunakan untuk menekankan adanya outlier,
median, dan IQR
Stem-Leaf Plot (Diagram Tangkai-Daun)
Membantu memvisualisasikan bentuk distribusi
data
34. Histogram
Memberikan gambaran kepadatan (density) data
Digunakan untuk menggambarkan suatu distribusi
(bentuk, pusat, range, variasi) dari variabel kontinu
Ukuran Bin penting
Scatterplot
Untuk menunjukkan hubungan antara dua variabel
kontinu
Line Graphs
Untuk menggambarkan variabel kuantitatif menurut
runtun waktu
46. Bagilah setiap pengamatan dalam sekumpulan data ke
dalam dua bagian, yaitu stem (tangkai) dan leaf (daun).
Kita akan menandakan digit pertama usia aki mobil
sebagai stem (digit yang berada disebelah kiri titik
desimal) dan menamakan dua digit terakhir sebagai
leaf. Sebagai contoh, untuk data usia aki mobil
misalkan 3.7 maka bagian stem adalah 3 dan leaf untuk
7.
47. Daftarlah seluruh stem dalam urutan sebuah kolom,
diawali dengan stem terkecil dan berakhir dengan yang
terbesar
Lakukan untuk seluruh set data, tempatkan daun
untuk setiap pengamatan dalam barisan stem yang
tepat menurut urutan naik. Display stem-leaf yang
lengkap ditunjukkan dalam tabel berikut
Stem Leaf Frekuensi
1 69 2
2 25669 5
3 0011112223334445567778899 25
4 11234577 8
48. Kasus diatas hanya terdiri dari empat stem sehingga
belum dapat memberikan gambaran seperti apa bentuk
distribusinya. Untuk mengatasi hal ini, kita dapat
menambahkan banyaknya tangkai (stem) dalam plot
tersebut. Cara sederhana untuk ini adalah menuliskan
nilai tangkai sebanyak dua kali dan mencatat daun 0, 1, 2,
3, dan 4 berseberangan dengan nilai stem yang tepat
dimana nilai itu muncul pertama kali, dan daun 5, 6, 7, 8,
dan 9 berseberangan dengan nilai tangkai dimana nilai itu
muncul untuk kedua kali. Modifikasi plot double-stem-and-leaf
digambarkan dalam tabel berikut, dimana stem yang
berkaitan dengan daun 0 sampai 4 dikodekan dengan
simbol * dan stem yang berkaitan dengan daun 5 sampai
dengan 9 disimbolkan dengan -
50. Hitung jarak (range) data
Range = Pengamatan terbesar – Pengamatan terkecil
Range untuk data tabel usia aki mobil
Range = 4.7 – 1.6 = 3.1
Bagilah range tersebut ke dalam 5 – 20 kelas yang sama.
Banyaknya kelas sembarang, tetapi gambaran yang
lebih bagus akan diperoleh jika menggunakan sedikit
kelas untuk banyak data yang kecil dan sejumlah
besar kelas untuk sekumpulan data yang lebih besar.
Banyaknya kelas juga dapat ditentukan menggunakan
rumus
51. Batas kelas terkecil (pertama) sebaiknya diletakkan
dibawah pengukuran terkecil, dan lebar kelas dipilih
sedemikian rupa sehingga tidak ada pengamatan
yang tepat berada pada batas kelas.
Banyaknya Pengamatan dalam
Sekumpulan Data
Banyaknya Kelas
Kurang dari 25 5 atau 6
25 – 50 7 – 14
Lebih dari 50 15 - 20
Untuk data tabel usia aki mobil digunakan 7 kelas (jika
menggunakan rumus diperoleh 6.28 yang dapat
dibulatkan ke atas) sehingga pendekatan untuk lebar
kelas adalah
52. 0.44
3.1
pendekatan lebar kelas
7
range
7
Hasil ini dibulatkan keatas, selanjutnya digunakan suatu
kelas dengan lebar 0.44. Hasil interval kelas ditunjukkan
dalam tabel berikut
Kelas Interval
Kelas
Titik tengah
Kelas
Frekuensi
Kelas
Frekuensi
Kelas Relatif
1 1.5 – 1.9 1.7 2 0.05
2 2.0 – 2.4 2.2 1 0,025
3 2.5 – 2.9 2.7 4 0.100
4 3.0 – 3.4 3.2 15 0.375
5 3.5 – 3.9 3.7 10 0.250
6 4.0 – 4.4 4.2 5 0.125
7 4.5 – 4.9 4.7 3 0.075
n =40 1.00
53. Untuk setiap kelas, hitung banyaknya pengamatan untuk
yang masuk dalam kelas tersebut. Hasil perhitungan ini
disebut frekuensi kelas yaitu
Total frekuensi kelas
Total banyaknya pengukuran
frekuensi relatif kelas
Frekuensi kelas dan frekuensi relatif data dari tabel
ditunjukkan masing-masing dalam kolom 4 dan 5 di tabel
di atas
Histogram pada prinsipnya merupakan suatu grafik
batang yang menggambarkan kategori kelas-kelas. Dalam
suatu histogram frekuensi, tinggi batang ditentukan oleh
frekuensi kelas. Serupa dengan hal tersebut, dalam suatu
histogram frekuensi relatif, tinggi batang ditentukan oleh
frekuensi kelas relatif . Histogram frekuensi relatif untuk
data usia aki mobil ditunjukkan dalam gambar berikut
54.
55. Grafik yang Baik Menyajikan
data secara akurat dan jelas
Grafik yang Buruk
Menggambarkan informasi yang sedikit
Mengaburkan apa yang hendak
disampaikan (dengan chart “sampah’)
Menggunakan pie chart (terutama
dalam warna dan 3 dimensi)
Menggunakan skala yang tidak tepat
56.
57.
58. Hitunglah rataan, median,
Q1 (persentil 25), Q3
(persentil 75), range, dan
variansi untuk data
penurunan berat badan
dalam tabel
Berikut ini adalah data yang diurutkan dari kecil ke
besar
25, 26, 26, 30, y, y, y, 33, 150
a. Apakah rataannya lebih besar dari mediannya?
b. Apakah 26 merupakan nilai modusnya?
c. Manakah yang merupakan outlier (pencilan) data?