Dokumen tersebut membahas tentang statistika deskriptif yang mencakup pengumpulan, penyajian, dan analisis data. Terdapat penjelasan mengenai jenis data, skala pengukuran, sampel dan populasi, penyajian data dalam tabel dan grafik, ukuran tengah dan variabilitas data, serta hubungan antara rata-rata dan deviasi standar.
1. 1-1
Descriptive Statistics
Using Statistics
Percentiles dan Quartiles
Penyajian Data
Pengelompokkan Data dan Histogram
Measures of Central Tendency (Ukuran Gejala Pusat)
Measures of Variability
Skewness and Kurtosis
Hubungan antara Mean dan Standard Deviation
Exploratory Data Analysis
11
2. 1-2
LEARNING OBJECTIVES
Membedakana :qualitative data dan quantitative data.
Menjelaskan Skala Pengukuran: nominal, ordinal,
interval, dan ratio .
Menjelaskan perbedaan antara : populasi dan sampel.
Menghitung dan menginterpretasikan kuantil.
Menghitung dan menjelaskan Ukuran Gejala Pusat
(measures of central tendency)
Menyajikan data melalui tabel dan grafik.
Menggunakan Excel templates untuk menghitung
berbagai ukuran statistik dan membuat grafik.
11
Setelah mempelajari bagian ini diharapkan dapat :Setelah mempelajari bagian ini diharapkan dapat :
3. 1-3
Statistics adalah suatu ilmu yg membantu
kita untuk membuat keputusan yg terbaik.
Statistics mengajari kita bagaimana untuk
meringkas, menganalisis, dan membuat
kesimpulan berdasarkan data sehingga kita
dapat membuat keputusan .
WHAT IS STATISTICSWHAT IS STATISTICS??
4. 1-4
Pembagian Statistika
Inferential Statistics
Memprediksi dan
meramalkan nilai
parameter populasi
Pengujian Hipotesis
untuk nilai parameter
populasi
Membuat kesimpulan
Descriptive Statistics
Mengumpulkan
Mengorganisir
Meringkas
Menyajikan
Menganalisis
5. 1-5
Types of Data
Qualitative -
Categorical atau
Nominal:
Contoh:
Warna
Gender
Suku bangsa
Quantitative -
Measurable atau
Countable
(numerical):
Contoh:
Temperatur
Besar Gaji
Skor Ujian
7. 1-7
Sampel dan Populasi
Populasi berisi suatu set seluruh pengukuran dari
karakteristikn yang diteliti
Sample adalah bagian dari pengukuran yang dipilih
dari populasinya
Sensus adalah pengamatan terhadap keseluruhan
obyek penelitian dalam populasinya tanpa ada yang
terlewat
10. 1-10
Organizing Categorical Data:
Summary Table
A summary table menunjukkan frekuensi atau
jumlah atau persentase dari setiap kategori sehingga
dapat dibedakan satu sama lainnya.
How do you spend the holidays? Percent
At home with family 45%
Travel to visit family 38%
Vacation 5%
Catching up on work 5%
Other 7%
11. 1-11
Melalui Bar chart /Diagram Batang
frekuensi tiap kategori diperlihatkan
berupa tinggi / panjang kurva .
How Do You Spend the Holidays?
45%
38%
5%
5%
7%
0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 50%
At home w ith family
Travel to visit family
Vacation
Catching up on w ork
Other
12. 1-12
The pie chart / diagram lingkaran merupakan penyajian data kategori yang
berupa persentase dimana untuk tiap kategorinya telah dikonversi ke sudut
geometris.
How Do You Spend the Holiday's
45%
38%
5%
5%
7%
At home with family
Travel to visit family
Vacation
Catching up on work
Other
13. 1-13
Bagaimana penyajian data untuk
golongan darah dari 30 orang
berikut ini :
O A A B B B A A A AB AB B B
B A A A A O O O O AB O AB
AB AB O A O
15. 1-15
1. Diketahui banyaknya karyawan
yang tidak masuk kerja perhari di
suatu perusahaan selama 20 hari
yang dipilih secara acak
2. Lama waktu yang diperlukan
oleh 10 karyawan dalam menit
untuk menyelesaikan suatu
pekerjaan
17. 1-17
Graphical Errors:
No Relative Basis
A’s received by students. A’s received by students.
Bad Presentation
0
200
300
FR SO JR SR
Freq.
10%
30%
FR SO JR SR
FR = Freshmen, SO = Sophomore, JR = Junior, SR = Senior
100
20%
0%
%
Good Presentation
18. 1-18
Graphical Errors: No Zero Point on
the Vertical Axis
Monthly Sales
36
39
42
45
J F M A M J
$
Graphing the first six months of sales
Monthly Sales
0
39
42
45
J F M A M J
$
36
Good PresentationsBad Presentation
19. 1-19
Tabel Distribusi Frekuensi
Penyajian Data secara dikelompokkan dalam
kelas interval
• Jumlah observasi
– N untuk Populasi
– n untuk sampel
Kelas midpoint atau Titik Tengah merupakan
nilai tengah dari tiap kelas interval
Relative frequency adalah persentase dari
tiap frekuensi dari tiap kelas interval
Jumlah dari relative frequencies = 1
20. 1-20
x f(x) f(x)/n
Spending Class ($) Frequency (number of customers) Relative Frequency
0 to less than 100 30 0.163
100 to less than 200 38 0.207
200 to less than 300 50 0.272
300 to less than 400 31 0.168
400 to less than 500 22 0.120
500 to less than 600 13 0.070
184 1.000
x f(x) f(x)/n
Spending Class ($) Frequency (number of customers) Relative Frequency
0 to less than 100 30 0.163
100 to less than 200 38 0.207
200 to less than 300 50 0.272
300 to less than 400 31 0.168
400 to less than 500 22 0.120
500 to less than 600 13 0.070
184 1.000
• Example of relative frequency: 30/184 = 0.163
• Sum of relative frequencies = 1
Contoh: Tabel Distribusi Frekuensi
23. 1-23
x F(x) F(x)/n
Spending Class ($) Cumulative Frequency Cumulative Relative Frequency
Kurang dari 100 30 0.163
Kurang dari 200 68 0.370
Kurang dari 300 118 0.641
Kurang dari 400 149 0.810
Kurang dari 500 171 0.929
Kurang dari 600 184 1.000
x F(x) F(x)/n
Spending Class ($) Cumulative Frequency Cumulative Relative Frequency
Kurang dari 100 30 0.163
Kurang dari 200 68 0.370
Kurang dari 300 118 0.641
Kurang dari 400 149 0.810
Kurang dari 500 171 0.929
Kurang dari 600 184 1.000
The cumulative frequency of each group is the sum of the
frequencies of that and all preceding groups.
The cumulative frequency of each group is the sum of the
frequencies of that and all preceding groups.
Cumulative Frequency Distribution
24. 1-24
Relative Frequency Polygon Ogive
Frequency Polygon and Ogive
50403020100
0.3
0.2
0.1
0.0
RelativeFrequency
Sales
50403020100
1.0
0.5
0.0
CumulativeRelativeFrequency
Sales
(Cumulative frequency or
relative frequency graph)
25. 1-25
Langkah-2 Menyajikan Data dalam
Dist.Frekuensi:
1. Tentukan Range
2. Tentukan banyak kelas Interval k
3. Tentukan Panjang Kelas Interval = p = i
Tentukan Kelas interval pertama
26. 1-26
Contoh :
Data di bawah ini menunjukkan masa hidup dari 30 lampu pijar yang
dipilih secara acak dari pabrik lampu pijar “G”
43 54 51 12 10 36 45 51 43
23 24 36 41 45 48 50 61 76
78 54 19 21 32 38 40 38 50
28 25 36 (dalam puluhan jam)
Sajikan data di atas dalam : Tabel Distribusi Frekuensi - Tabel Distribusi
Frekuensi Relatif- Tabel Distribusi Frekuensi Kumulatif – Tabel Distribusi
Frekuensi Kumulatif Relatif
Sajikan Pula Dalam Grafik : Histogram – Polygon - Ogive
Apa yang terlihat pada Diagram Batang Daun ?
Berikan interpretasi untuk semua hasil di atas.
27. 1-27
Summary Measures: Population Parameters
Sample Statistics
Measures of Variability
Range
Interquartile range
Variance
Standard Deviation
Measures of Central
Tendency
Median
Modus
Mean
Other summary
measures:
Skewness
Kurtosis
28. 1-28
Measures of Central Tendency
Summary
Central Tendency
Arithmetic Mean Median Mode Geometric Mean
n
X
X
n
i
i∑=
= 1
n/1
n21G )XXX(X ×××=
Middle value in the
ordered array
Most frequently
observed value
29. 1-29
Contoh:
Misalkan diperoleh data sampel dari 20
mahasiswa , tentang lamanya waktu yg
digunakan untuk browsing internet dalam
satu bulan (jam) :
16,13,12,6, 16,10,9, 14,14,16,20,19,18,17,17,18,
21, 24,22,15
Buatkan diagram titiknya
30. 1-30
Mean dari satu set observasi adalah nilai dari
jumlah observasi dibagi dengan banyaknya
observasi.
Population Mean Sample Mean
µ = =
∑x
N
i
N
1
x
x
n
i
n
= =
∑
1
Arithmetic Mean or Average
31. 1-31
x
x
n
i
n
= = ==
∑
1 317
20
1585.
WKT
9
6
12
10
13
15
16
14
14
16
17
16
24
21
22
18
19
18
20
17
317
Contoh: – Mean
32. 1-32
.
. . . . . : . : : : . . . . .
---------------------------------------------------------------
6 9 10 12 13 14 15 16 17 18 19 20 21 22 24
.
. . . . . : . : : : . . . . .
---------------------------------------------------------------
6 9 10 12 13 14 15 16 17 18 19 20 21 22 24
Mode = 16
The mode is the most frequently occurring value. It
is the value with the highest frequency.
Contoh: Modus
34. 1-34
Ukuran Variabilitas (Dispersion)
Range
Perbedaan antara nilai terbesar dengan nilai
terkecil
Interquartile Range
Perbedaan antara Quartil atas dengan quartil
bawah (Q3- Q1)
Variance
Rata – rata kuadrat jarak dari data dengan mean
Standard Deviation
Akar dari variance
35. 1-35
Contoh:
Misalkan diperoleh data tentang jumlah ketidak
hadiran karyawan di tiga perusahaan selama delapan
bulan sbb
Perusahaan:
A : 18, 21, 16, 16, 17, 13, 12, 11
B : 15, 15, 15, 14, 17, 16, 16, 16
C : 11, 11, 12, 11, 20, 20, 20, 19
Bandingkan ketidak hadiran karyawan selama 8 bulan
tersebut, berdasarkan : Mean, Modus, Median, Range,
RAK dan Deviasi Standardnya.
36. 1-36
Variance and Standard Deviation
( )
σ
µ
σ σ
2
2
1
2
1
2
2
1
=
−
=
−
=
=
=
∑
∑ =
∑
( )x
N
x
N
N
i
N
i
N x
i
N
Population Variance
( )
( )
s
x x
n
x
x
n
n
s s
i
n
i
n
i
n
2
2
1
2
1
2
2
1
1
1
=
−∑
−
=
−∑
−
=
=
=
=
∑
( )
Sample Variance
( )
37. 1-37
Skewness dan Kurtosis
Skewness
– Measure of asymmetry of a frequency
distribution
• Skewed to left
• Symmetric or unskewed
• Skewed to right
Kurtosis
– Measure of flatness or peakedness of a
frequency distribution
• Platykurtic (relatively flat)
• Mesokurtic (normal)
• Leptokurtic (relatively peaked)
44. 1-44
Hubungan antara Mean dan
Standard Deviation
Chebyshev’s Theorem
Applies to any distribution, regardless of shape
Places lower limits on the percentages of
observations within a given number of standard
deviations from the mean
Empirical Rule
Applies only to roughly mound-shaped and
symmetric distributions
Specifies approximate percentages of observations
within a given number of standard deviations from
the mean
48. 1-48
1-9 Exploratory Data Analysis -
EDA
• Stem-and-Leaf Displays
Quick-and-dirty listing of all observations
Conveys some of the same information as a histogram
• Box Plots
Median
Lower and upper quartiles
Maximum and minimum
Techniques to determine relationships and trends,
identify outliers and influential observations, and
quickly describe or summarize data sets.
Techniques to determine relationships and trends,
identify outliers and influential observations, and
quickly describe or summarize data sets.
50. 1-50
X X *o
Median
Q1 Q3Inner
Fence
Inner
Fence
Outer
Fence
Outer
Fence
Interquartile Range
Smallest data
point not
below inner
fence
Largest data point
not exceeding
inner fence
Suspected
outlierOutlier
Q1-3(IQR)
Q1-1.5(IQR) Q3+1.5(IQR)
Q3+3(IQR)
Elements of a Box PlotElements of a Box Plot
Box Plot