1. ANALISIS STATISTIK
PEUBAH BANYAK (MULTIVARIATE)
DIKLAT FINANCIAL STATISTICS ANGKATAN 1
PUSDIKLAT KEUANGAN UMUM, KEMENTRIAN KEUANGAN
26‐30 JANUARI 2015
Khoirunurrofik
Peneliti, LPEM dan Dosen, Departemen Ilmu Ekonomi,
Fakultas Ekonomi Universitas Indonesia
Khoirunurrofik@ui.ac.id ; rofiq76@gmail.com
Mobile : 08‐1111‐76‐444
2. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Panduan Materi
2
Tujuan Setelah mempelajari materi ini, peserta diklat dapat mengetahui
konsep dasar analisis multivarite, mampu memilih teknik yang tepat
serta mengolah data, menganalisis output SPSS, dan membuat
kesimpulan dan rekomendasi atas permasalahan yang diteliti.
Waktu
8 sesi (@ 45 menit)
Kata Kunci Pengantar Analisis Multivariate
Analisis Komponen Utama dan Faktor
Analisis Diskriminan
Analisis Kluster
Metode Diskusi
Pembahasan Kasus
Latihan computer
Diskusi Kelompok
Bahan Bacaan
Joseph F. Hair, Jr, et al (2009). Multivariate Data Analysis
Sharma, S. (1996). Applied Multivariate Technique
Santoso, S. (2002). Buku Latihan SPSS Statistik Multivariat
3. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Agenda
3
• Pengantar (1 Sesi)
• Analisis Komponen Utama dan Faktor (2 Sesi)
• Analisis Diskriminan (2 Sesi)
• Analisis Kluster (1 Sesi)
• Latihan Studi Kasus dengan SPSS (2 Sesi)
5. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Pengertian Multivariate Analysis
Analisis peubah ganda (Multivarite Analysis) merupakan
suatu teknik analisis statistika yang menganalisa data
dengan banyak variabel secara semultan. Seringkali suatu
penelitian atau pengambilan keputusan dihadapkan
dengan banyak peubah.
Metode statistik yang menganalisa multiple measurement
secara simultan pada setiap individu atau obyek yang sedang
diteliti.
Merupakan perluasan dari analisis univariate (analisis dari distribusi variabel
tunggal) dan analisis bivariate (Analisis dari dua distribusi variables)
Tujuan dari analisis multivariate adalah untuk mengukur, menjelaskan, dan
memprediksi derajat hubungan diantara variate‐variate (kombinasi variabel
terbobot)
6. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Mengapa Masih Memerlukan
Analisis Multivariate?
Realitas
Statistik univariat masih terbatas penggunaanya
Data "Real" biasanya mengandung lebih dari satu
varaiabel
Analisis multivariat jauh lebih realistis dan layak
Dapat me"Minimal“kan Peningkatan Kompleksitas dari
banyaknya variabel
Dapat mengontrol besarnya informasi yang akan
digunakan
Mempunyai asumsi yang lebih longgar
Mempunyai banyak pilihan teknik yang dapat
digunakan
7. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Contoh Aplikasi
7
Pertanian
Penelitian tentang efektifitas pupuk tehadap tanaman dan variabel yang diukur
adalah daya kecambah, tinggi, diameter batang, daya tahan penyakit dan lain
sebagainya. Untuk melakukan analisis terdapat data bisa saja mengunakan analisis
univariate (peubah tunggal) tapi kesulitan akan dihadapi jika mengmbil
kesimpulan secara general terhadap apakah pupuk berpengaruh terhadap semua
variabel pengamatan.
Ekonomi
Untuk melakukan evaluasi kredit suatu perusahaan biasanya bank melihat laporan
keuangan yang berisi asset, kewajiban, modal, pendapatan, keuntungan bersih
dan sebagainya. Jika analisis dilakukan terhadap setiap peubah maka kesimpulan
yang diambil akan berbeda untuk setiap peubah. Oleh karena itu dibutuhkan
analisis peubah ganda untuk mengambil keputusan apakah suatu perusahaan
beresiko atau tidak dalam pengendalian kredit
Sosiologi dan Politik
Untuk menyalurkan bantuan dana jaring pengaman sosial, biasanya lembaga
donor menginginkan dana tersebut sampai pada orang yang benar‐benar
membutuhkan dengan proporsi tertentu untuk setiap kelas sosialnya. Oleh karena
itu dibutuhkan pengelompokan kelas sosial berdasarkan variabel pendapatan,
jumlah keluarga, status kepemilikan rumah, pendidikan dan sebagainya.Dalam
kasus diatas analisis peubah ganda memegang peranan penting untuk melakukan
pengelompokan berdasarkan semua variable diatas.
8. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Konsep Variate dan Struktur Data
Komponen penyusun Analisis multivariate adalah variate
Variate adalah suatu kombinasi linear dari variabel‐2 dengan bobot
empiris yang ditentukan
Suatu variate dari sejumlah n variabel terbobot (X1 to Xn) dapat
dinyatakan secara mathematika sebagai :
variate value = w1X1+ w2X2 +…+ wnXn
Data
Arrays
Var1 Var2 Var3 ……Var p
Object 1 X11 X12 X13 X1p
Object 2 X21 X22 X23 X2p
…..
Object n Xn1 Xn2 Xn3 Xnp
9. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Jenis Data Dasar dalam Multivariate Analysis
1. Non Metric (Qualitative)
Data non metrik bisa berupa Atribut, karakteristik, atau sifat
kategorik yang menunjukkan atau menggambarkan suatu
subyek.
Variabel yang diukur menggunakan skala nominal dan ordinal
umumnya merupakan variabel non metric
2. Metric (Quantitative)
Pengukuran dilakukan sehingga suatu subyek dapat
diketahui perbedaannya dalam jumlah atau derajat.
Variabel yang diukur mengunakan skala Interval dan
Ratio umumnya merupakan variabel metric
10. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Klasifikasi dalam Multivariate Analysis
Dependence Methods (ketergantungan) : Apabila fokus
penelitian adalah pada asosiasi antara dua kelompok variable
Dapat didefinisikan sebagai suatu metode di mana kumpulan variabel
(sets of variabel) yang diketahui sebagai variabel‐variabel tak bebas
diprediksi atau dijelaskan oleh variabel‐variabel yang lain yang disebut
sebagai variabel‐variabel bebas.
Interdependence Methods (saling ketergantungan) : Apabila
fokus penelitian adalah asosiasi antar variabel‐variabel
independent, sesuai dengan sifat data.
Adalah suatu metode dimana tidak ada satu atau sekelompok variabel
yang didefinisikan sebagai variabel bebas ataupun variabel tak bebas.
11. Bagan Klasifikasi Analisis Multivariate
Cluster
Analysis
Cases/Respondent Object
Interdependence
What type of relationship is
being examined?
Structural
equation
modeling
Canonical
correlationanalysi
s with dummy
variales
MANOVA
Canonical
correlation
Multiple relationship of
dependent & independent
variables
One dependent variable
in singgle relationship
Dependence
Several dependent
variable in single
relationship
variables
metric Non metric
metric
metric Non metric
Non metric
What is the
measurement
scale of the
dependent
variable ?
How many variable are being
predicted ?
What is the
measurement
scale of the
dependent
variale
What is the
measurement
scale of the
predictor
variable ?
Multiple
regression
Conjoint
analysis
Multiple
discriminant
Analysis
Linear
Probability
models
Factor
Analysis
Correspondenc
e analysis
Multidimen‐
sional Scaling
metric Non metric
Is the structure of
relationships among :
How are the
atributes
measurement ?
Principle
Component
Analysis
13. Klasifikasi Multivariate Techniques
(Dependence Method)
Dependent Variable (s)
One More than One
Independent
Variable(s)
Metric Non Metric Metric Non Metrik
One
Metric
Non Metric
Regression
t-test
Discriminan nalysis
Logistic regression
Discrete Discriminan
Analysis
Canonical
Correlation
Manova
(Multivariate
Analysis of Variance)
Multiple group
discriminan
analysis (MDA)
Discrete MDA
More than One
Metric
Non Metric
Multiple
regression
Anova
Discriminan nalysis
Logistic regression
Discrete Discriminan
Analysis
Conjoint Analysis
(MONANOVA)
Canonical
Correlation
Manova
(Multivariate
Analysis of Variance)
Multiple group
discriminan
analysis (MDA)
Discrete MDA
Sumber : Lihat subbash Sharma hal 6
14. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Dependence Methods
Regresi Berganda: mempelajari keterkaitan antara satu variabel dependent
dengan beberapa variabel independent.
Analisis Diskriminan: menghasilkan suatu kombinasi linear yang
menjelaskan keterkaitan antar 2 kelompok variabel.
Analisis Logit: digunakan apabila variabel dependen merupakan variabel
discrete dan variabel‐variabel independent juga merupakan variabel
kategorik.
Multivariate Analysis‐of‐Variance (MANOVA): menguji signifikansi
perbedaan antara sejumlah variabel atau “profile” dari variable apabila
terjadi perubahan pada satu atau lebih variabel penjelas.
Canonical Correlation Analysis: menentukan asosiasi linear antara
sekelompok variabel penjelas dan sekelompok kriteria pengukuran.
15. Klasifikasi of Multivariate Techniques
(Interdependence Method)
Number of variable
Type of Data
Metric Non Metric
Two • Simple Corelation
• Two way contingency
table
More than two
• Principal Componen
Analysis
Faktor Analysis
• Multiway
Contingency table
Loglinear model
Corespondence
Analysis
Sumber : Lihat subbash Sharma hal 11
16. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Interdependence Methods
Principal Component Analysis: teknik reduksi yang bertujuan untuk menyusun
kombinasi linear dari variabel utama yang memiliki variasi total yang sama.
Analisis Faktor: teknik reduksi data yang memisahkan bagian‐bagian variasi total
yang bersesuaian dengan variabel‐variabel penyusunnya.
Metric Multidimensional Scaling: mengeksplorasi kriteria atau dimensi
ketidaksamaan antar objek.
Cluster Analysis: mengidentifikasi data menjadi kelompok yang lebih kecil
sehingga elemen dalam satu kelompok memiliki kesamaan yang lebih
daripada dengan elemen dari kelompok lain.
Nonmetric Multidimensional Scaling: mentransformasi ketidaksamaan antar
kelompok menjadi jarak dan menempatkannya pada multidimensional
space.
Loglinear Models: mempelajari interrelationships antara variabel kategorik
yang membentuk tabel kontingensi.
18. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Pengantar
Dalam banyak kesempatan, pengambilan keputusan sering dihadapkan
pada kompleksnya persoalan banyaknya variabel, sehingga sulit
mengambil inti sari persoalan dan underlying persoalan tersebut
Jika kita punya 10 variabel 45 correlations yang harus
dipertimbangkan
Jika kita punya 20 variable 190 correlations yang juga harus
dipertimbangkan
Dibutuhkan penyederhanaan jumlah variable yang dianalisis tanpa
harus membuang banyak informasi yang terkandung dalam data
Dibutuhkan metode untuk mereduksi jumlah variable tersebut, sehingga
mudah diinterprestasikan
Teknik reduksi banyak variabel menjadi hanya beberapa komponen atau
faktor tanpa mengurangi variasi yang bisa dijelaskan oleh data dinamakan
Analisis Komponen Utama (Principle Component Analysis)
19. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Analisis Kompone Utama
19
Metode ini salah satunya bertujuan untuk mereduksi p peubah
yang saling berkorelasi menjadi q peubah yang saling bebas.
Jika p buah peubah asal saling berkorelasi mungkin kita bisa
dapatkan q < p peubah yang tidak berkorelasi dan tidak
menyebabkan hilangnya informasi terlalu besar dari peubah
asal.
Keunggulan metode ini selain menghasilkan banyaknya peubah
yang lebih sedikit namun memberikan informasi yang hampir
sama besar dengan peubah asal, juga menghasilkan peubah
baru yang tidak saling berkorelasi yang umumnya diperlukan
oleh berbagai metode lain.
Data yang dapat diolah minimal memiliki skala pengukuran
interval.
20. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Persamaan Analisis Komponen Utama
Menjelaskan struktur varians‐kovarians dari sekelompok variabel
melalui beberapa kombinasi linear dari variabel‐variabel tersebut.
Banyaknya komponen utama yang dipilih tergantung dari besarnya
persentase keragaman kumulatif komponen utama tersebut.
Persentase keragaman yang dianggap cukup mewakili total keragaman
data jika 75% (Morrison, 1976).
Suatu komponen utama ( PCi ) didefinisikan sebagai kombinasi linear
terboboti dari peubah asal.
PC1 = w11X1+w21X2+ . . . + wp1Xp
PC2 = w12X1+w22X2+ . . . + wp2Xp
W11, W12, …, W1p dipilih yang memaksimumkan rasio dari variance PC(1)
terhadap total variance dengan kendala: Σ Wij
2 = 1
Untuk melihat peubah asal apa yang diwakili oleh komponen utama
ke‐j, bisa ditempuh melalui pengamatan terhadap nilai koefisien (wij).
Jika wij bernilai tinggi maka komponen utama PCi mewakili Xi. Atau bisa
juga menilai komponen utama ke‐j sebagai nilai wij yang positif lawan
wij negatif.
21. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Persamaan Analisis Komponen Utama
21
PC(1), PC(2), …., PC(m) = variabel‐variabel baru yang tidak
berkorelasi satu dengan yang lainnya tetapi memuat total variance
dari data asli (original data)
PC(2):
Kombinasi linear tertimbang dari variabel‐variabel yang diobservasi
Tidak berkorelasi dengan PC(1)
Dalam perhitungannya menggunakan:
1. Variance‐ covariance
2. Eigenvalue ‐ Eigenfactor
Intepretasi Principle Component Analysis:
1. Mereduksi data
2. Mengelompokan variable
3. Hasil analisis ini bisa dilanjutkan untuk analisis lanjutan seperti analisis
kluster, biplot dan lain‐lain.
4. Bisa juga sebagai hasil analisis akhir untuk melihat karakteristik dari
suatu obyek.
22. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Analisis Faktor
22
Analisis ini pada dasarnya untuk mencari suatu bentuk hubungan di
antara beberapa peubah tak bebas, hingga akhirnya ditemukan
sesuatu yang alami pada peubah‐peubah bebas (respon vasibles)
yang mempengaruhi peubah‐peubah tak bebas (dependent
variables).
Perbedaan antara analisis faktor dengan analisis statistik lainnya
yang mempelajari hubungan antara peubah tak bebas adalah bahwa
dalam analisis faktor tidak mengukur variabel bebas secara langsung,
melainkan diukur melalui peubah‐peubah tak bebasnya.
Analisis faktor juga merupakan suatu metode untuk menetukan k
buah faktor yang penting (alami) dari n buah peubah dari hasil
pengamatan, dimana k<n.
Analisis faktor juga bisa dipandang sebagai perluasan dari analisis
komponen utama (Johnson & Wichern,1998).
23. Analisis Faktor
Tujuan dan intepretasi dari factor analysis tidak berbeda
dengan principle component analysis
Perbedaannya adalah terletak pada:
Factor Analysis Principle Component Analysis
Faktor diestimasi hanya berdasarkan
common variance, communalities
dimasukkan dalam matriks korelasi
Jumlah variance dalam data
dipertimbangkan
Mengenali / mengidentifikasi dimensi
yang mendasari dan common
variance yang menarik perhatian
Menentukan banyaknya faktor
minimum dengan
mempertimbangkan variance
maximum dalam data
Memisahkan data berdasarkan
karakteristik tertentu
Menggabungkan data yang memiliki
kesamaan dalam beberapa
komponen prinsip
24. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Persamaan Analisis Faktor
Misalnya: Data terdiri dari variabel‐variabel:
Xj, i = 1,2,…p
X1 = w11F1 + w12F2 + …. + wk2Fk + e1
X2 = w21F1 + w22F2 + …. + wk2Fk + e2
Xp = wp1F1 + wp2F2 + …. + wp2Fk + ep
25. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Persamaan Analisis Faktor
Secara umum dalam bentuk matriks, model dari analisis faktor
dapat dituliskan sebagai berikut :
X ‐ = W F +
(pxl) (pxl) (pxm) (mxl) (pxl)
Xi adalah vektor acak yang memiliki p komponen pada amatan ke‐i
I adalah rataan dari peubah ke‐i
Wij adalah bobot faktor (factor loading) dari peubah ke‐i dan Faktor yang ke‐j
Fj adalah faktor laten (common factor) yang ke‐j
i adalah sisaan atau error dari peubah ke‐i (unique factor)
Persamaan masing‐masing factor adalah:
X1 = w11F1 + w12F2 + …. + wk2Fk + e1
X2 = w21F1 + w22F2 + …. + wk2Fk + e2
Xp = wp1F1 + wp2F2 + …. + wp2Fk + ep
26. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Interpretasi Analisi Faktor
26
Metode yang sering digunakan dalam penentuan jumlah
faktor yang akan digunakan, diantaranya adalah:
1. Digunakan n buah faktor yang memiliki n buah akar ciri dengan proporsi
lebih dari 75% (morisson, 1978).
2. Digunakan n buah faktor yang memiliki n buah akar ciri dengan proporsi
lebih dari 80% atau n buah akar ciri yang bernilai lebih dari satu (Jhonson
& Wichcern, 1998).
Langkah‐langkah yang digunakan dalam menginterpretasikan
model faktor yang terbentuk adalah sebagai berikut :
1. Identifikasikan peubah‐peubah yang memiliki bobot faktor mutlak terbesar
pada masing‐masing faktor.
2. Tentukan peubah‐peubah yang memiliki hubungan yang nyata pada masing‐
masing faktor. Menurut sharma (1996), suatu peubah memiliki hubungan yang
nyata dengan sebuah faktor apabila memiliki bobot faktor > 0.6.
27. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Statistik Uji untuk Analisis Faktor
Bartlett’s test of sphericity :
Untuk menguji hipotesis bahwa variabel saling berkorelasi
Ho : matriks korelasi merupakan matriks identity
Hi : matriks korelasi bukan merupakan matriks identity. ( FA dapat
digunakan )
KMO (Kaiser‐Meyer‐Olkin) :
Untukmengukur kecukupan sampling.
Nilai KMO > 0,5 ( FA dapat digunakan )
28. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Istilah dalam Output SPSS
Communality : jumlah varians yg disumbangkan oleh
suatu variabel
Eigenvalues : jumlah varian yg dijelaskan oleh setiap
faktor dalam menghitung semua variabel.
(kepentingan relatif masing‐masing faktor dalam
menghitung varians semua variabel yang dianalisis.
Factor loading : korelasi antara variabel dengan faktor
29. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Ilustrasi penerapan Analisis Faktor
Sebuah Departemen Store ingin mengetahui apa saja yang mendorong
seorang konsumen berbelanja di toko tersebut.
Setiap responden diberikan daftar kuesioner yang memuat pertanyaan
tentang pendapat responden tentang toko tersebut.
Nama Variabel Label
LAYOUT tata letak barang
LENGKAP kelengkapan jenis barang
HARGA harga barang yg kompetitif
PELKAR pelayanan karyawan
PELKASIR pelayanan kasir
PROMOSI promosi yg dilakukan toko
IMAGE citra toko
BERSIH kebersihan toko
30. FA PRINT OUT
KMO and Bartlett’s test
Kaiser-Meyer-Olkin Measure of Sampling
Adequacy
Bartlett’s Test of Approx. Chi-Square
Sphericity df
Sig.
,627
47,773
15
,000
36. 6 Variabel telah direduksi menjadi 2 Faktor
VARIABEL Factor
1
Factor
2
BERSIH
HARGA
IMAGE
LAYOUT
LENGKAP
PROMOSI
HARGA
IMAGE
PROMOSI
BERSIH
LAYOUT
LENGKAP
37. Factor Plot in Rotated Space
● LAYOUT
LENGKAP ●
● BERSIH
● IMAGE
HARGA
●
● PROMOSI
0
0
Faktor 1
Faktor
2
38. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Aplikasi
38
Seorang peneliti ingin meneliti tentang faktor‐faktor apa saja yang
mepengaruhi kinerja dari sebuah KPP. Data yang dikumpulkan dari
setiap KPP dapat dilihat pada daftar di slide berikut:
a. Buatlah perhitungan analisis faktor dari data KPP?
b. Jelaskan korelasi antara variabel? Apa maknanya dalam kaitannya
bahwa perlu digunakan analisis faktor?
c. Apakah semua variabel layak untuk menjadi bagian dalam analisis
faktor? Jelaskan!
d. Buatlah persamaan faktornya?
e. Interpretasikan makna dari faktor‐faktor yang terbentuk! Berilah
nama pada masing‐masing faktor tersebut yang relevan!
f. Apa yang bisa anda simpulkan dari hasil analisis faktor yang
mempengaruhi kinerja sebuah KPP!
39. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Daftar Variabel
39
Variabel Wilayah Menurut Pulau
nokpp No KPP
nko NKO
WPdaftar_LAYAN Jumlah WP terdaftar per pelaksana di Seksi Pelayanan
WPefektif_LAYAN Jumlah WP efektif per pelaksana di Seksi Pelayanan
SPT_LAYAN Jumlah SPT Tahunan per pelaksana di Seksi Pelayanan
WIL_EKSTEN Luas wilayah kerja per pelaksana di Seksi Ekstensifikasi
PDDK_EKSTEN Jumlah penduduk per pelaksana di Seksi Ekstensifikasi
AKRJ_EKSTEN Perkiraan angkatan kerja per pelaksana di Seksi Ekstensifikasi
SPT_PDI Jumlah SPT Tahunan per pelaksana di Seksi PDI
TARGET_AR Target penerimaan per AR
REALISASI_AR Realisasi penerimaan per AR
WPdaftar_AR Jumlah WP terdaftar per AR
WPefektif_AR Jumlah WP efektif per AR
SPT_AR Jumlah SPT Tahunan per AR
SOSIALISASI_AR Jumlah penyuluhan/sosialisasi per AR
REVENUE_AR Total Revenu per AR
51. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Pengantar
Dalam kehidupan nyata sering kali kita menduga apakah suatu objek
yang memiliki karakteristik tertentu akan masuk dalam kelompok A
atau Kelompok B.
Contoh,
Jika kita mengamati calon debitur dengan berbagai variable (karakteristik), maka
bagi pemberi kredit akan bertanya apakah calon debitur ini jika disetujui usulan
kreditnya akan termasuk dalam kelompok yang kerditnya lancar atau kreditnya
macet.
Jika kita menyeleksi mahasiswa untuk masuk PT, maka yang menjadi pertanyaan
adalah apakah mahasiswa tersebut kelak akan bisa masuk dalam kelompok
mahasiswa yang berhasil atau mahasiswa yang gagal
Agar kita tidak salah mengelompokkan objek, maka diperlukan alat
atau metode untuk membedakan apakah objek tersebut masuk
dalam Kelompok A atau Kelompok B.
Salah satu metode untuk mengelompokkan individu/objek ke dalam
kelompok A atau Kelompok B adalah Analisis Diskriminan
52. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Pengantar
Analisis diskriminan pertama kali diperkenalkan oleh Sir Ronald Fisher dan
merupakan teknik statistika yang paling sering dipakai untuk meneliti
kumpulan‐kumpulan dari suatu masalah.
Masalah yang dihadapi dalam analisis peubah ganda adalah bagaimana
mendapatkan faktor penentu yang membedakan populasi atau
mendapatkan kombinasi linear dari peubah‐peubah yang menunjukkan
ukuran pembeda dalam nilai tengah populasi tersebut.
Untuk mengatasi hal ini analisis diskriminan merupakan suatu metode
yang dapat digunakan untuk mendapatkan setiap kombinasi linear dari
peubah tersebut.
Analisis diskriminan merupakan suatu metode untuk menghasilkan
pemisah yang terbaik antara berbagai macam populasi (kelompok).
Fungsi diskriminan dapat dibentuk bila terdapat perbedaan nilai tengah
antara dua kelompok yang ada (Johnson, 1982). Oleh karena itu sebelum
fungsi diskriminan dibentuk, perlu dilakukan pengujian perbedaan nilai
tengah dari kelompok tersebut
53. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Persamaan Analisis Diskriminan
Mengelompokkan setiap objek/responden ke dalam dua atau
lebih kelompok berdasarkan pada kriteria sejumlah variabel
bebas.
Menentukan variabel bebas mana yang memberikan
sumbangan terbesar terhadap terjadinya perbedaan antar
kelompok.
Agar bisa dilakukan pengelompokkan diperlukan fungsi
pembeda (discriminant function) yaitu D=b’X
Di = b0 + b1Xi1 + b2Xi2 + b3Xi3 + … + bkXik
Di = Skore diskriminan dari responden ke –I, bersifat non metric (nominal)
Xij = Variabel ke‐j dari responden ke‐I, dengan skala metric
bj = koefisien diskriminan dari variabel ke‐j
54. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
X2
X1
Z
B
Discriminant
Function
A’
B’
A
Ilustrasi Analisis Diskriminan 2 Kelompok
55. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Diskriminan Analisis untuk Lebih dari
Dua Kelompok
Untuk tiga kelompok akan ada dua fungsi diskriminan
Pengelompokkannya dilakukan dengan membuat
skor setiap individu menurut funsi diskriminan 1 dan
fungsi diskiriminan dua
Setelah itu membuat batas‐batas pembeda menurut
rata‐rata skor diskiriminan 1 dan skor diskiminan 2
56. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Teknik Estimasi
1. Direct Method
Estimasi koefisien fungsi diskriminan dimana seluruh
variabel bebas diikutkan dalam analysisi secara
bersama‐sama
2. Stepwise Method
Variabel bebas diikutsertakan secara berurutan,
didasarkan pada kemampuannya untuk
mendiskriminasi antar kelompok
57. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Data
Kasus: seorang peneliti ingin mengetahui faktor apa saja yang
mempengaruhi seseorang untuk memutuskan pembelian motor. Maka
digunakanlah beberapa atribut seperti keiritan, ketersediaan suku cadang,
harga, model dan desain, kombinasi warna, keawetan mesin, promosi,
serta sistem pelunasan. Setiap atribut bernilai antara 1 hingga 5, dimana 1
(sangat tidak penting) dan 5 (sangat penting). Jumlah responden yang diuji
berjumlah 50 orang.
Variabel Dependen Variabel Bebas
D , keputusan
Kode 0 = tidak beli
Kode 1 = beli
X1 … irit
X2 … awet
…..
X8 … warna
58. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Tujuan Analysis
Apakah perilaku beli konsumen benar‐benar berbeda. Perilaku
kelompok “membeli” berbeda dengan perilaku kelompok
“tidak membeli”
Jika berbeda (no. 1), variabel bebas mana yg membedakan
perilaku konsumen ? Semua variabel atau sebagian variabel ?
Jika ada sejumlah variabel yg membedakan (diskriminan)
perilaku, maka ada sebuah model diskriminan.
Variabel mana yg paling penting dan mana selanjutnya yg
penting ?
Seberapa tepat model diskriminan mampu memprediksi
responden yang diteliti.
59. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Tabel : Analysis Case Processing Summary
Tabel ini menyatakan
bahwa responden
semuanya valid (sah)
untuk diproses.
60. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Tabel : Group Statistics
Menunjukkan
perbandingan Mean
(rata‐rata) antara grup
“beli” dan grup “tidak
beli”. Makin besar nilai
Mean, semakin positif
penilaian responden
thd variabel tersebut.
61. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Tabel : Tests of Equality of Group Means
Tabel ini menguji apakah ada perbedaan yg signifikan antar grup untuk
setiap variabel bebas yg ada.
F Test :
> Jika Sig > 0,05, berarti tdk ada perbedaan antar grup.
> Jika Sig < 0,05, berarti ada perbedaan antar grup
Dari 8 variabel, hanya 3
variabel yang menunjukkan
perbedaan antar grup yaitu
warna, mesin dan promosi.
62. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Tabel : Variables Entered/Removed
Tabel ini menunjukkan variabel mana yang dimasukkan dalam
persamaan diskriminan.
Terlihat ada 3 variabel yaitu promosi, mesin dan warna. Jadi perilaku
beli/tidak beli dipengaruhi sikap responden thd ke 3 variabel
tersebut.
63. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Tabel : Variable In the Analysis
Rangkaian proses tahapan pemasukan variabel satu persatu ke
dalam model.
64. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Tabel : Eigenvalues
Pada tabel Eigenvalues terlihat angka canonical correlation adalah
0,726, yang jika dikuadratkan akan menjadi 0,726 ² = 0,527.
Hal ini berarti 52,7% varians dari variabel beli atau tidak dapat
dijelaskan oleh model diskriminan yg terbentuk. (oleh 3 variabel
bebas : promosi, mesin dan warna).
65. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Tabel : Wilk’s Lambda
Terlihat angka Sig 0,000, hal ini menunjukkan perbedaan yg nyata
antara kedua grup (beli dan tidak beli) pada model diskriminan
66. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Tabel : Standardized Canonical Discriminant Function
Coefficients
Menunjukkan koefisien determinan.
D = 0,483 (warna) – 0,850 (mesin) + 0,912 (promosi)
67. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Tabel : Structure Matrix
Dapat dilihat variabel mana yg dipakai
dan mana yg tidak dipakai dalam
model diskriminan.
Dapat dilihat variabel mana yang
paling diskriminan
68. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Tabel : Function at Group Centroids
Jumlah responden “tidak beli’ = 19
Jumlah responden “beli” = 21
Nilai pemisah Do
(19 x 1,320) + (21 x ‐0,809) =
‐25,280 + 25,280 = 0
Ketika dilakukan prediksi dg menggunakan fungsi determinan,
jika skore D negatif < 0 maka responden tsb masuk grup “tidak
beli” (kode 0). Jika skore D > 0 maka responden tsb masuk
grup “beli”
69. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Tabel : Classification Result
Dapat melihat ketepatan model diskriminan
Dari grup tidak beli (pd data awal) yg tetap pada
grup tidak beli (prediksi) = 16
Dari grup beli (pd data awal) yg tetap pada grup
beli (prediksi) = 27
Sehingga ketepatan model adalah :
(16 + 27) / 50 = 0,86 atau 86 %
70. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Kesimpulan Analysis Diskriminan
Ada perbedaan perilaku yg nyata antara mereka yg
mebeli dan yang tidak membeli.
Atribut (var. bebas) yg paling membedakan perilaku
kedua kelompok adalah mesin, warna, dan promosi.
Model diskriminan yg diperoleh memiliki tingkat
ketepatan yg cukup tinggi 86%
71. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Studi Kasus
71
Seorang peneliti ingin mengetahui variable apa saja yang menjadi
pembeda kinerja dari sebuah KPP. Sebuah KPP dikatakan berhasil
berkinerja baik (diberi kode 1), jika rasio antara realisasi dan target dari
seorang Account Representatif (AR) di sebuah KPP mencapai diatas atau
sama dengan 60 %. Dibawah 60%, KPP tersebut dianggap belum berhasil.
Dengan menggunakan data yang digunakan pada analisis factor, maka
a. Buatlah perbandingan deskriptif antar KPP “Baik” dangan “Belum Baik”!,
apa yang bisa anda simpulkan?
b. Bagaimana karakteristik kinerja antar kelompok KPP menurut data yang
ada?
c. Buatlah persamaan diskriminan yang mampu membedakan karakteristik
antar kelompok KPP?
d. Variabel apa saja yang berperanan menjadi pembeda?
e. Berapa besar tingkat akurasi model diskriman yang dibuat?
f. Apa yang bisa anda simpulkan dari hasil analisis diskriminan bagi KPP!
77. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Modifikasi Studi Kasus
77
Seorang peneliti ingin mengetahui variable apa saja yang menjadi
pembeda kinerja dari sebuah KPP. Sebuah KPP dikatakan berhasil
berkinerja “BAIK” (diberi kode 1), jika rasio antara realisasi dan target dari
seorang Account Representatif (AR) di sebuah KPP mencapai diatas atau
sama dengan 75 %,berkinerja “SEDANG” Dibawah 75% tapi diatas 50%,
dan berkinerja “KURANG” jika rasionya kurang dari 50%.. Dengan
menggunakan data yang digunakan pada analisis faktor, maka
a. Buatlah perbandingan deskriptif antar KPP “Baik”, “Sedang”, dan
“Kurang”!, apa yang bisa anda simpulkan?
b. Bagaimana karakteristik kinerja antar kelompok KPP menurut data yang
ada?
c. Buatlah persamaan diskriminan yang mampu membedakan karakteristik
antar kelompok KPP?
d. Variabel apa saja yang berperanan menjadi pembeda?
e. Berapa besar tingkat akurasi model diskriman yang dibuat?
f. Apa yang bisa anda simpulkan dari hasil analisis diskriminan bagi KPP!
79. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Pengantar
Akademisi dan para peneliti sering dihadapkan pada persoalan
bagaimana membuat kelompok‐kelompok objek, baik itu
individu, perusahaan ataupun produk.
Contoh Aplikasi
Dalam pemasaran sering ingin dilakukan segmentasi pasar dan target pasar
Dalam psikologi sering ingin dikelompokkan psychatric profile
Dalam ekonomi regional, misalnya, ingin dikelompokkan daerah menurut
karakteristik ekonomi, demografi dll
Intinya, banyak hal ingin menentukan kelompok “natural”
structure antar objek base on multivarite profile
Cluster Analysis merupakan salah satu teknik yang sering
digunakan untuk tujuan‐tujuan di atas
80. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Analisis Kelompok (Kluster)
Analisis Kluster adalah salah satu tehnik multivariate yang tujuan
utamanya adalah mengelompokkan objek berdasarakan
karakateristik yang dimilikinya.
Analisis ini digunakan untuk mengelompokkan objek‐objek menjadi beberapa
gerombol berdasarkan pengukuran peubah‐peubah yang diamati, sehingga
diperoleh kemiripan objek dalam gerombol yang sama dibandingkan antar objek
pada gerombol yang lain.
Pengelompokkannya dilakukan sedemikian rupa sehingga setiap
objek dalam satu kluster bersifat homogen dan antar objek dari
kluster yang berbeda akan bersifat heterogen.
Adapun ukuran kedekatan dapat dihitung berdasarkan jarak Eucledian,
Manhattan, Pearson dan sebagainya.
Secara geometri, objek dalam satu kluster akan sangat dekat dan
objek antar kluster akan relatif sangat jauh.
Teknik hierarki disajikan dalam bentuk dendrogram sehingga penggerombolan
akan lebih mudah dan informatif.
81. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
High
Low
Low High
Frequency of going to fast food restaurants
Frequency
of
eating
out
Contoh: Scatter Distribusi Objek Pengamatan
82. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
1
3
2
Low Frequency of Going to Fast Food Restaurants High
Low
Frequency
of
Eating
Out
High
Analisis Kluster 2 Variabel
83. Contoh Aplikasi
Misalkan kita ingin mengelompokkan 7 daerah berikut
berdasarkan pola pembangunan ekonominya (misal
pertumbuhan PDRB) dan tingkat pengangguran
Datanya
ClusteringVariabel A B C D E F G
PertumbuhanEkonomi 3 4 4 2 6 7 6
TingkatPengangguran 2 5 7 7 6 7 4
Daerah
85. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Analisis Kluster
Tujuan Analisis Kluster mengelompokkan objek berdasarkan
similarity
Ada tiga pertanyaan yang muncul :
Bagaimana mengukur kemiripan (similarity) ?
Bagaimana membentuk kluster ?
Berapa kluster yang kita bentuk ?
86. Ukuran Kemiripan (similarity)
Ukuran Kemiripan : Jarak Euclidean
A B C D E F G
A
B 3.162
C 3.099 2.000
D 5.099 2.828 2.000
E 5.000 2.236 2.236 4.123
F 6.403 3.606 3.000 5.000 1.414
G 3.606 2.236 3.606 5.000 2.000 3.162
87. Pembentukan Cluster
Aglomerative Hierarchical Clustering Process
Step
Minimum
Distance
Unclustered
Objek
Observartions
Pair Cluster Membership
Number
of
Cluster
Overall
Similiarity
Measure
Initial Solutions (A) (B) ( C ) (D) (E) (F) (G) 7 -
1 1.414 E, F (A) (B) ( C ) , (D) (E-F) (G) 6 1.414
2 2.000 E, G (A) (B) ( C ) , (D) (E-F-G) 5 2.192
3 2.000 C,D (A) (B) (C- D) (E-F-G) 4 2.144
4 2.000 B,C (A) (B-C- D) (E-F-G) 3 2.234
5 2.236 B,E (A) (B-C- D-E-F-G) 2 2.896
6 3.162 A-B (A-B-C- D-E-F-G) 1 3.420
88. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Penentuan Banyaknya Cluster
Tidak ada standar , tergantung pada tujuan dan prosedur yang dipilih
Sebaga acuan dapat menggunakan
1. rata‐rata jarak dalam cluster, yakni jika terjadi peningkatan jarak rata‐
rata dalam cluster yang cukup besar, maka dipilih banyaknya cluster
sebelum terjadi peningkatan jarak rata‐rata antar cluster
2. Berdasarkan value judgement empiris sesua dengan yang disarankan
berdasarkan konsep teori yang secara alamiah menentukan
banyaknya cluster
89. Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Aplikasi
89
Dari data yang ada, seorang peneliti ingin mengetahui kelompok‐
kelompok yang terbentuk dari KPP berdasarkan variable yang ada.
Tentukan bagaimana pengelompokan yang terbentuk antara KPP?,
jelaskan karakteristik dari setiap kelompok yang terbentuk!
Apa yang bisa anda simpulkan dari analisis kelompok bagi daerah
tertinggal!