2. Analisis Multivariate-Rofik_Diklat_KU_With Solution.pdf

ANALISIS STATISTIK
PEUBAH BANYAK (MULTIVARIATE)
DIKLAT FINANCIAL STATISTICS ANGKATAN 1
PUSDIKLAT KEUANGAN UMUM, KEMENTRIAN KEUANGAN
26‐30 JANUARI 2015
Khoirunurrofik
Peneliti, LPEM dan Dosen, Departemen Ilmu Ekonomi,
Fakultas Ekonomi Universitas Indonesia
Khoirunurrofik@ui.ac.id ; rofiq76@gmail.com
Mobile : 08‐1111‐76‐444

Khoirunurrofik Diklat Financial Statistics, Pusdiklat Keuangan Umum, Kementrian Keuangan RI
Panduan Materi
2
Tujuan Setelah mempelajari materi ini, peserta diklat dapat mengetahui
konsep dasar analisis multivarite, mampu memilih teknik yang tepat
serta mengolah data, menganalisis output SPSS, dan membuat
kesimpulan dan rekomendasi atas permasalahan yang diteliti.
Waktu
8 sesi (@ 45 menit)
Kata Kunci  Pengantar Analisis Multivariate
 Analisis Komponen Utama dan Faktor
 Analisis Diskriminan
 Analisis Kluster
Metode  Diskusi
 Pembahasan Kasus
 Latihan computer
 Diskusi Kelompok
Bahan Bacaan
 Joseph F. Hair, Jr, et al (2009). Multivariate Data Analysis
 Sharma, S. (1996). Applied Multivariate Technique
 Santoso, S. (2002). Buku Latihan SPSS Statistik Multivariat

Agenda
3
• Pengantar (1 Sesi)
• Analisis Komponen Utama dan Faktor (2 Sesi)
• Analisis Diskriminan (2 Sesi)
• Analisis Kluster (1 Sesi)
• Latihan Studi Kasus dengan SPSS (2 Sesi)

PENGANTAR ANALISIS MULTIVARIAT
4

Pengertian Multivariate Analysis
 Analisis peubah ganda (Multivarite Analysis) merupakan
suatu teknik analisis statistika yang menganalisa data
dengan banyak variabel secara semultan. Seringkali suatu
penelitian atau pengambilan keputusan dihadapkan
dengan banyak peubah.
 Metode statistik yang menganalisa multiple measurement
secara simultan pada setiap individu atau obyek yang sedang
diteliti.
 Merupakan perluasan dari analisis univariate (analisis dari distribusi variabel
tunggal) dan analisis bivariate (Analisis dari dua distribusi variables)
 Tujuan dari analisis multivariate adalah untuk mengukur, menjelaskan, dan
memprediksi derajat hubungan diantara variate‐variate (kombinasi variabel
terbobot)

Mengapa Masih Memerlukan
Analisis Multivariate?
 Realitas
 Statistik univariat masih terbatas penggunaanya
 Data "Real" biasanya mengandung lebih dari satu
varaiabel
 Analisis multivariat jauh lebih realistis dan layak
 Dapat me"Minimal“kan Peningkatan Kompleksitas dari
banyaknya variabel
 Dapat mengontrol besarnya informasi yang akan
digunakan
 Mempunyai asumsi yang lebih longgar
 Mempunyai banyak pilihan teknik yang dapat
digunakan

Contoh Aplikasi
7
 Pertanian
 Penelitian tentang efektifitas pupuk tehadap tanaman dan variabel yang diukur
adalah daya kecambah, tinggi, diameter batang, daya tahan penyakit dan lain
sebagainya. Untuk melakukan analisis terdapat data bisa saja mengunakan analisis
univariate (peubah tunggal) tapi kesulitan akan dihadapi jika mengmbil
kesimpulan secara general terhadap apakah pupuk berpengaruh terhadap semua
variabel pengamatan.
 Ekonomi
 Untuk melakukan evaluasi kredit suatu perusahaan biasanya bank melihat laporan
keuangan yang berisi asset, kewajiban, modal, pendapatan, keuntungan bersih
dan sebagainya. Jika analisis dilakukan terhadap setiap peubah maka kesimpulan
yang diambil akan berbeda untuk setiap peubah. Oleh karena itu dibutuhkan
analisis peubah ganda untuk mengambil keputusan apakah suatu perusahaan
beresiko atau tidak dalam pengendalian kredit
 Sosiologi dan Politik
 Untuk menyalurkan bantuan dana jaring pengaman sosial, biasanya lembaga
donor menginginkan dana tersebut sampai pada orang yang benar‐benar
membutuhkan dengan proporsi tertentu untuk setiap kelas sosialnya. Oleh karena
itu dibutuhkan pengelompokan kelas sosial berdasarkan variabel pendapatan,
jumlah keluarga, status kepemilikan rumah, pendidikan dan sebagainya.Dalam
kasus diatas analisis peubah ganda memegang peranan penting untuk melakukan
pengelompokan berdasarkan semua variable diatas.

Konsep Variate dan Struktur Data
 Komponen penyusun Analisis multivariate adalah variate
 Variate adalah suatu kombinasi linear dari variabel‐2 dengan bobot
empiris yang ditentukan
 Suatu variate dari sejumlah n variabel terbobot (X1 to Xn) dapat
dinyatakan secara mathematika sebagai :
variate value = w1X1+ w2X2 +…+ wnXn
Data
Arrays
Var1 Var2 Var3 ……Var p
Object 1 X11 X12 X13 X1p
Object 2 X21 X22 X23 X2p
…..
Object n Xn1 Xn2 Xn3 Xnp

Jenis Data Dasar dalam Multivariate Analysis
1. Non Metric (Qualitative)
 Data non metrik bisa berupa Atribut, karakteristik, atau sifat
kategorik yang menunjukkan atau menggambarkan suatu
subyek.
 Variabel yang diukur menggunakan skala nominal dan ordinal
umumnya merupakan variabel non metric
2. Metric (Quantitative)
 Pengukuran dilakukan sehingga suatu subyek dapat
diketahui perbedaannya dalam jumlah atau derajat.
 Variabel yang diukur mengunakan skala Interval dan
Ratio umumnya merupakan variabel metric

Klasifikasi dalam Multivariate Analysis
 Dependence Methods (ketergantungan) : Apabila fokus
penelitian adalah pada asosiasi antara dua kelompok variable
 Dapat didefinisikan sebagai suatu metode di mana kumpulan variabel
(sets of variabel) yang diketahui sebagai variabel‐variabel tak bebas
diprediksi atau dijelaskan oleh variabel‐variabel yang lain yang disebut
sebagai variabel‐variabel bebas.
 Interdependence Methods (saling ketergantungan) : Apabila
fokus penelitian adalah asosiasi antar variabel‐variabel
independent, sesuai dengan sifat data.
 Adalah suatu metode dimana tidak ada satu atau sekelompok variabel
yang didefinisikan sebagai variabel bebas ataupun variabel tak bebas.

Bagan Klasifikasi Analisis Multivariate
Cluster
Analysis
Cases/Respondent Object
Interdependence
What type of relationship is
being examined?
Structural
equation
modeling
Canonical
correlationanalysi
s with dummy
variales
MANOVA
Canonical
correlation
Multiple relationship of
dependent & independent
variables
One dependent variable
in singgle relationship
Dependence
Several dependent
variable in single
relationship
variables
metric Non metric
metric
metric Non metric
Non metric
What is the
measurement
scale of the
dependent
variable ?
How many variable are being
predicted ?
What is the
measurement
scale of the
dependent
variale
What is the
measurement
scale of the
predictor
variable ?
Multiple
regression
Conjoint
analysis
Multiple
discriminant
Analysis
Linear
Probability
models
Factor
Analysis
Correspondenc
e analysis
Multidimen‐
sional Scaling
metric Non metric
Is the structure of
relationships among :
How are the
atributes
measurement ?
Principle
Component
Analysis

Jenis Teknik Multivariate
1. Principal Componen Analysis (PCA)
2. Factor Analysis (FA)
3. Canonical Correlation Analysis (CCA)
4. Cluster Analysis (CA)
5. Discriminan Analysis (DA)
6. Multiple Regression Analysis (MRA)
7. Conjoint Analysis (CoA)
8. Analisis Variansi Multivariate (MANOVA),
9. Multidimensional Scalling
10. Structural Equation Modelling (SEM)

Klasifikasi Multivariate Techniques
(Dependence Method)
Dependent Variable (s)
One More than One
Independent
Variable(s)
Metric Non Metric Metric Non Metrik
One
Metric
Non Metric
Regression
t-test
Discriminan nalysis
Logistic regression
Discrete Discriminan
Analysis
Canonical
Correlation
Manova
(Multivariate
Analysis of Variance)
Multiple group
discriminan
analysis (MDA)
Discrete MDA
More than One
Metric
Non Metric
Multiple
regression
Anova
Discriminan nalysis
Logistic regression
Discrete Discriminan
Analysis
Conjoint Analysis
(MONANOVA)
Canonical
Correlation
Manova
(Multivariate
Analysis of Variance)
Multiple group
discriminan
analysis (MDA)
Discrete MDA
Sumber : Lihat subbash Sharma hal 6

Dependence Methods
 Regresi Berganda: mempelajari keterkaitan antara satu variabel dependent
dengan beberapa variabel independent.
 Analisis Diskriminan: menghasilkan suatu kombinasi linear yang
menjelaskan keterkaitan antar 2 kelompok variabel.
 Analisis Logit: digunakan apabila variabel dependen merupakan variabel
discrete dan variabel‐variabel independent juga merupakan variabel
kategorik.
 Multivariate Analysis‐of‐Variance (MANOVA): menguji signifikansi
perbedaan antara sejumlah variabel atau “profile” dari variable apabila
terjadi perubahan pada satu atau lebih variabel penjelas.
 Canonical Correlation Analysis: menentukan asosiasi linear antara
sekelompok variabel penjelas dan sekelompok kriteria pengukuran.

Klasifikasi of Multivariate Techniques
(Interdependence Method)
Number of variable
Type of Data
Metric Non Metric
Two • Simple Corelation
• Two way contingency
table
More than two
• Principal Componen
Analysis
 Faktor Analysis
• Multiway
Contingency table
 Loglinear model
 Corespondence
Analysis
Sumber : Lihat subbash Sharma hal 11

Interdependence Methods
Principal Component Analysis: teknik reduksi yang bertujuan untuk menyusun
kombinasi linear dari variabel utama yang memiliki variasi total yang sama.
Analisis Faktor: teknik reduksi data yang memisahkan bagian‐bagian variasi total
yang bersesuaian dengan variabel‐variabel penyusunnya.
Metric Multidimensional Scaling: mengeksplorasi kriteria atau dimensi
ketidaksamaan antar objek.
Cluster Analysis: mengidentifikasi data menjadi kelompok yang lebih kecil
sehingga elemen dalam satu kelompok memiliki kesamaan yang lebih
daripada dengan elemen dari kelompok lain.
Nonmetric Multidimensional Scaling: mentransformasi ketidaksamaan antar
kelompok menjadi jarak dan menempatkannya pada multidimensional
space.
Loglinear Models: mempelajari interrelationships antara variabel kategorik
yang membentuk tabel kontingensi.

ANALISIS KOMPONEN UTAMA DAN
ANALISIS FAKTOR
17

Pengantar
 Dalam banyak kesempatan, pengambilan keputusan sering dihadapkan
pada kompleksnya persoalan banyaknya variabel, sehingga sulit
mengambil inti sari persoalan dan underlying persoalan tersebut
 Jika kita punya 10 variabel  45 correlations yang harus
dipertimbangkan
 Jika kita punya 20 variable  190 correlations yang juga harus
dipertimbangkan
 Dibutuhkan penyederhanaan jumlah variable yang dianalisis tanpa
harus membuang banyak informasi yang terkandung dalam data
 Dibutuhkan metode untuk mereduksi jumlah variable tersebut, sehingga
mudah diinterprestasikan
 Teknik reduksi banyak variabel menjadi hanya beberapa komponen atau
faktor tanpa mengurangi variasi yang bisa dijelaskan oleh data dinamakan
Analisis Komponen Utama (Principle Component Analysis)

Analisis Kompone Utama
19
 Metode ini salah satunya bertujuan untuk mereduksi p peubah
yang saling berkorelasi menjadi q peubah yang saling bebas.
 Jika p buah peubah asal saling berkorelasi mungkin kita bisa
dapatkan q < p peubah yang tidak berkorelasi dan tidak
menyebabkan hilangnya informasi terlalu besar dari peubah
asal.
 Keunggulan metode ini selain menghasilkan banyaknya peubah
yang lebih sedikit namun memberikan informasi yang hampir
sama besar dengan peubah asal, juga menghasilkan peubah
baru yang tidak saling berkorelasi yang umumnya diperlukan
oleh berbagai metode lain.
 Data yang dapat diolah minimal memiliki skala pengukuran
interval.

Persamaan Analisis Komponen Utama
 Menjelaskan struktur varians‐kovarians dari sekelompok variabel
melalui beberapa kombinasi linear dari variabel‐variabel tersebut.
 Banyaknya komponen utama yang dipilih tergantung dari besarnya
persentase keragaman kumulatif komponen utama tersebut.
Persentase keragaman yang dianggap cukup mewakili total keragaman
data jika 75% (Morrison, 1976).
 Suatu komponen utama ( PCi ) didefinisikan sebagai kombinasi linear
terboboti dari peubah asal.
PC1 = w11X1+w21X2+ . . . + wp1Xp
PC2 = w12X1+w22X2+ . . . + wp2Xp
W11, W12, …, W1p dipilih yang memaksimumkan rasio dari variance PC(1)
terhadap total variance dengan kendala: Σ Wij
2 = 1
 Untuk melihat peubah asal apa yang diwakili oleh komponen utama
ke‐j, bisa ditempuh melalui pengamatan terhadap nilai koefisien (wij).
Jika wij bernilai tinggi maka komponen utama PCi mewakili Xi. Atau bisa
juga menilai komponen utama ke‐j sebagai nilai wij yang positif lawan
wij negatif.

Persamaan Analisis Komponen Utama
21
 PC(1), PC(2), …., PC(m) = variabel‐variabel baru yang tidak
berkorelasi satu dengan yang lainnya tetapi memuat total variance
dari data asli (original data)
 PC(2):
 Kombinasi linear tertimbang dari variabel‐variabel yang diobservasi
 Tidak berkorelasi dengan PC(1)
 Dalam perhitungannya menggunakan:
1. Variance‐ covariance
2. Eigenvalue ‐ Eigenfactor
 Intepretasi Principle Component Analysis:
1. Mereduksi data
2. Mengelompokan variable
3. Hasil analisis ini bisa dilanjutkan untuk analisis lanjutan seperti analisis
kluster, biplot dan lain‐lain.
4. Bisa juga sebagai hasil analisis akhir untuk melihat karakteristik dari
suatu obyek.

Analisis Faktor
22
 Analisis ini pada dasarnya untuk mencari suatu bentuk hubungan di
antara beberapa peubah tak bebas, hingga akhirnya ditemukan
sesuatu yang alami pada peubah‐peubah bebas (respon vasibles)
yang mempengaruhi peubah‐peubah tak bebas (dependent
variables).
 Perbedaan antara analisis faktor dengan analisis statistik lainnya
yang mempelajari hubungan antara peubah tak bebas adalah bahwa
dalam analisis faktor tidak mengukur variabel bebas secara langsung,
melainkan diukur melalui peubah‐peubah tak bebasnya.
 Analisis faktor juga merupakan suatu metode untuk menetukan k
buah faktor yang penting (alami) dari n buah peubah dari hasil
pengamatan, dimana k<n.
 Analisis faktor juga bisa dipandang sebagai perluasan dari analisis
komponen utama (Johnson & Wichern,1998).

Analisis Faktor
 Tujuan dan intepretasi dari factor analysis tidak berbeda
dengan principle component analysis
 Perbedaannya adalah terletak pada:
Factor Analysis Principle Component Analysis
Faktor diestimasi hanya berdasarkan
common variance, communalities
dimasukkan dalam matriks korelasi
Jumlah variance dalam data
dipertimbangkan
Mengenali / mengidentifikasi dimensi
yang mendasari dan common
variance yang menarik perhatian
Menentukan banyaknya faktor
minimum dengan
mempertimbangkan variance
maximum dalam data
Memisahkan data berdasarkan
karakteristik tertentu
Menggabungkan data yang memiliki
kesamaan dalam beberapa
komponen prinsip

Persamaan Analisis Faktor
 Misalnya: Data terdiri dari variabel‐variabel:
Xj, i = 1,2,…p
 X1 = w11F1 + w12F2 + …. + wk2Fk + e1
 X2 = w21F1 + w22F2 + …. + wk2Fk + e2
 Xp = wp1F1 + wp2F2 + …. + wp2Fk + ep

Persamaan Analisis Faktor
Secara umum dalam bentuk matriks, model dari analisis faktor
dapat dituliskan sebagai berikut :
X ‐  = W F + 
(pxl) (pxl) (pxm) (mxl) (pxl)
Xi adalah vektor acak yang memiliki p komponen pada amatan ke‐i
 I adalah rataan dari peubah ke‐i
 Wij adalah bobot faktor (factor loading) dari peubah ke‐i dan Faktor yang ke‐j
 Fj adalah faktor laten (common factor) yang ke‐j
 i adalah sisaan atau error dari peubah ke‐i (unique factor)
Persamaan masing‐masing factor adalah:
X1 = w11F1 + w12F2 + …. + wk2Fk + e1
X2 = w21F1 + w22F2 + …. + wk2Fk + e2
Xp = wp1F1 + wp2F2 + …. + wp2Fk + ep

Interpretasi Analisi Faktor
26
 Metode yang sering digunakan dalam penentuan jumlah
faktor yang akan digunakan, diantaranya adalah:
1. Digunakan n buah faktor yang memiliki n buah akar ciri dengan proporsi
lebih dari 75% (morisson, 1978).
2. Digunakan n buah faktor yang memiliki n buah akar ciri dengan proporsi
lebih dari 80% atau n buah akar ciri yang bernilai lebih dari satu (Jhonson
& Wichcern, 1998).
 Langkah‐langkah yang digunakan dalam menginterpretasikan
model faktor yang terbentuk adalah sebagai berikut :
1. Identifikasikan peubah‐peubah yang memiliki bobot faktor mutlak terbesar
pada masing‐masing faktor.
2. Tentukan peubah‐peubah yang memiliki hubungan yang nyata pada masing‐
masing faktor. Menurut sharma (1996), suatu peubah memiliki hubungan yang
nyata dengan sebuah faktor apabila memiliki bobot faktor > 0.6.

Statistik Uji untuk Analisis Faktor
 Bartlett’s test of sphericity :
 Untuk menguji hipotesis bahwa variabel saling berkorelasi
 Ho : matriks korelasi merupakan matriks identity
 Hi : matriks korelasi bukan merupakan matriks identity. ( FA dapat
digunakan )
 KMO (Kaiser‐Meyer‐Olkin) :
 Untukmengukur kecukupan sampling.
 Nilai KMO > 0,5 ( FA dapat digunakan )

Istilah dalam Output SPSS
 Communality : jumlah varians yg disumbangkan oleh
suatu variabel
 Eigenvalues : jumlah varian yg dijelaskan oleh setiap
faktor dalam menghitung semua variabel.
(kepentingan relatif masing‐masing faktor dalam
menghitung varians semua variabel yang dianalisis.
 Factor loading : korelasi antara variabel dengan faktor

Ilustrasi penerapan Analisis Faktor
 Sebuah Departemen Store ingin mengetahui apa saja yang mendorong
seorang konsumen berbelanja di toko tersebut.
 Setiap responden diberikan daftar kuesioner yang memuat pertanyaan
tentang pendapat responden tentang toko tersebut.
 Nama Variabel Label
 LAYOUT tata letak barang
 LENGKAP kelengkapan jenis barang
 HARGA harga barang yg kompetitif
 PELKAR pelayanan karyawan
 PELKASIR pelayanan kasir
 PROMOSI promosi yg dilakukan toko
 IMAGE citra toko
 BERSIH kebersihan toko

FA PRINT OUT
 KMO and Bartlett’s test
Kaiser-Meyer-Olkin Measure of Sampling
Adequacy
Bartlett’s Test of Approx. Chi-Square
Sphericity df
Sig.
,627
47,773
15
,000

Communalities
Inital Extraction
BERSIH
HARGA
IMAGE
LAYOUT
LENGKAP
PROMOSI
1.000
1.000
1.000
1.000
1.000
1.000
.548
.549
.599
.308
.577
.465
Interpretasi
Variabel BERSIH, angka 0,548, berarti 54,8% varians dari variabel BERSIH
dapat dijelaskan oleh faktor yang nanti terbentuk

Total Varance Explained
Factor Total % of variance Cumulative %
1
2
3
4
5
6
1.829
1.217
.944
.758
.639
.613
30.488
20.266
15.732
12.637
10.642
10.215
30.488
50.774
66.506
79.143
89.785
100.000
Factor Total % of variance Cumulative %
1
2
1.829
1.217
1.829
1.217
30.488
50.774
Initial Eigenvalues

Scree Plot
1 2 3 4 5 6
●
●
●
●
●
●
Eigenvalues
Component/Faktor

Factor Matrix
Factor
1
Factor
2
BERSIH
HARGA
IMAGE
LAYOUT
LENGKAP
PROMOSI
-.348
.563
.648
-.301
-.654
.673
.654
.482
.423
.466
.386
.111

Rotated Factor Matrix
Factor
1
Factor
2
BERSIH
HARGA
IMAGE
LAYOUT
LENGKAP
PROMOSI
.071
.735
.774
.007
-.331
.622
.737
.090
-.006
.555
.683
-.280

6 Variabel telah direduksi menjadi 2 Faktor
VARIABEL Factor
1
Factor
2
BERSIH
HARGA
IMAGE
LAYOUT
LENGKAP
PROMOSI
HARGA
IMAGE
PROMOSI
BERSIH
LAYOUT
LENGKAP

Factor Plot in Rotated Space
● LAYOUT
LENGKAP ●
● BERSIH
● IMAGE
HARGA
●
● PROMOSI
0
0
Faktor 1
Faktor
2

Aplikasi
38
 Seorang peneliti ingin meneliti tentang faktor‐faktor apa saja yang
mepengaruhi kinerja dari sebuah KPP. Data yang dikumpulkan dari
setiap KPP dapat dilihat pada daftar di slide berikut:
a. Buatlah perhitungan analisis faktor dari data KPP?
b. Jelaskan korelasi antara variabel? Apa maknanya dalam kaitannya
bahwa perlu digunakan analisis faktor?
c. Apakah semua variabel layak untuk menjadi bagian dalam analisis
faktor? Jelaskan!
d. Buatlah persamaan faktornya?
e. Interpretasikan makna dari faktor‐faktor yang terbentuk! Berilah
nama pada masing‐masing faktor tersebut yang relevan!
f. Apa yang bisa anda simpulkan dari hasil analisis faktor yang
mempengaruhi kinerja sebuah KPP!

Daftar Variabel
39
Variabel Wilayah Menurut Pulau
nokpp No KPP
nko NKO
WPdaftar_LAYAN Jumlah WP terdaftar per pelaksana di Seksi Pelayanan
WPefektif_LAYAN Jumlah WP efektif per pelaksana di Seksi Pelayanan
SPT_LAYAN Jumlah SPT Tahunan per pelaksana di Seksi Pelayanan
WIL_EKSTEN Luas wilayah kerja per pelaksana di Seksi Ekstensifikasi
PDDK_EKSTEN Jumlah penduduk per pelaksana di Seksi Ekstensifikasi
AKRJ_EKSTEN Perkiraan angkatan kerja per pelaksana di Seksi Ekstensifikasi
SPT_PDI Jumlah SPT Tahunan per pelaksana di Seksi PDI
TARGET_AR Target penerimaan per AR
REALISASI_AR Realisasi penerimaan per AR
WPdaftar_AR Jumlah WP terdaftar per AR
WPefektif_AR Jumlah WP efektif per AR
SPT_AR Jumlah SPT Tahunan per AR
SOSIALISASI_AR Jumlah penyuluhan/sosialisasi per AR
REVENUE_AR Total Revenu per AR

Analisis Deskriptif
40

Korelasi Antar Variabel
41

Test Ketepatan
Interpretasi
Variabel Jumlah SPT Tahunan per AR,
angka 0,793, berarti 79,3% varians
dari variabel SPT/AR dapat dijelaskan
oleh faktor yang nanti terbentuk

Anti Image
43

Rotated Factor
Matrix
WP
SPT
SOSIO
DEMOGRAFI

Analisis Regresi Faktor dengan Kinerja
49

Pengantar
 Dalam kehidupan nyata sering kali kita menduga apakah suatu objek
yang memiliki karakteristik tertentu akan masuk dalam kelompok A
atau Kelompok B.
 Contoh,
 Jika kita mengamati calon debitur dengan berbagai variable (karakteristik), maka
bagi pemberi kredit akan bertanya apakah calon debitur ini jika disetujui usulan
kreditnya akan termasuk dalam kelompok yang kerditnya lancar atau kreditnya
macet.
 Jika kita menyeleksi mahasiswa untuk masuk PT, maka yang menjadi pertanyaan
adalah apakah mahasiswa tersebut kelak akan bisa masuk dalam kelompok
mahasiswa yang berhasil atau mahasiswa yang gagal
 Agar kita tidak salah mengelompokkan objek, maka diperlukan alat
atau metode untuk membedakan apakah objek tersebut masuk
dalam Kelompok A atau Kelompok B.
 Salah satu metode untuk mengelompokkan individu/objek ke dalam
kelompok A atau Kelompok B adalah Analisis Diskriminan

Pengantar
 Analisis diskriminan pertama kali diperkenalkan oleh Sir Ronald Fisher dan
merupakan teknik statistika yang paling sering dipakai untuk meneliti
kumpulan‐kumpulan dari suatu masalah.
 Masalah yang dihadapi dalam analisis peubah ganda adalah bagaimana
mendapatkan faktor penentu yang membedakan populasi atau
mendapatkan kombinasi linear dari peubah‐peubah yang menunjukkan
ukuran pembeda dalam nilai tengah populasi tersebut.
 Untuk mengatasi hal ini analisis diskriminan merupakan suatu metode
yang dapat digunakan untuk mendapatkan setiap kombinasi linear dari
peubah tersebut.
 Analisis diskriminan merupakan suatu metode untuk menghasilkan
pemisah yang terbaik antara berbagai macam populasi (kelompok).
 Fungsi diskriminan dapat dibentuk bila terdapat perbedaan nilai tengah
antara dua kelompok yang ada (Johnson, 1982). Oleh karena itu sebelum
fungsi diskriminan dibentuk, perlu dilakukan pengujian perbedaan nilai
tengah dari kelompok tersebut

Persamaan Analisis Diskriminan
 Mengelompokkan setiap objek/responden ke dalam dua atau
lebih kelompok berdasarkan pada kriteria sejumlah variabel
bebas.
 Menentukan variabel bebas mana yang memberikan
sumbangan terbesar terhadap terjadinya perbedaan antar
kelompok.
 Agar bisa dilakukan pengelompokkan diperlukan fungsi
pembeda (discriminant function) yaitu D=b’X
Di = b0 + b1Xi1 + b2Xi2 + b3Xi3 + … + bkXik
Di = Skore diskriminan dari responden ke –I, bersifat non metric (nominal)
Xij = Variabel ke‐j dari responden ke‐I, dengan skala metric
bj = koefisien diskriminan dari variabel ke‐j

X2
X1
Z
B
Discriminant
Function
A’
B’
A
Ilustrasi Analisis Diskriminan 2 Kelompok

Diskriminan Analisis untuk Lebih dari
Dua Kelompok
 Untuk tiga kelompok akan ada dua fungsi diskriminan
 Pengelompokkannya dilakukan dengan membuat
skor setiap individu menurut funsi diskriminan 1 dan
fungsi diskiriminan dua
 Setelah itu membuat batas‐batas pembeda menurut
rata‐rata skor diskiriminan 1 dan skor diskiminan 2

Teknik Estimasi
1. Direct Method
 Estimasi koefisien fungsi diskriminan dimana seluruh
variabel bebas diikutkan dalam analysisi secara
bersama‐sama
2. Stepwise Method
 Variabel bebas diikutsertakan secara berurutan,
didasarkan pada kemampuannya untuk
mendiskriminasi antar kelompok

Data
 Kasus: seorang peneliti ingin mengetahui faktor apa saja yang
mempengaruhi seseorang untuk memutuskan pembelian motor. Maka
digunakanlah beberapa atribut seperti keiritan, ketersediaan suku cadang,
harga, model dan desain, kombinasi warna, keawetan mesin, promosi,
serta sistem pelunasan. Setiap atribut bernilai antara 1 hingga 5, dimana 1
(sangat tidak penting) dan 5 (sangat penting). Jumlah responden yang diuji
berjumlah 50 orang.
Variabel Dependen Variabel Bebas
D , keputusan
Kode 0 = tidak beli
Kode 1 = beli
X1 … irit
X2 … awet
…..
X8 … warna

Tujuan Analysis
 Apakah perilaku beli konsumen benar‐benar berbeda. Perilaku
kelompok “membeli” berbeda dengan perilaku kelompok
“tidak membeli”
 Jika berbeda (no. 1), variabel bebas mana yg membedakan
perilaku konsumen ? Semua variabel atau sebagian variabel ?
 Jika ada sejumlah variabel yg membedakan (diskriminan)
perilaku, maka ada sebuah model diskriminan.
 Variabel mana yg paling penting dan mana selanjutnya yg
penting ?
 Seberapa tepat model diskriminan mampu memprediksi
responden yang diteliti.

Tabel : Analysis Case Processing Summary
 Tabel ini menyatakan
bahwa responden
semuanya valid (sah)
untuk diproses.

Tabel : Group Statistics
 Menunjukkan
perbandingan Mean
(rata‐rata) antara grup
“beli” dan grup “tidak
beli”. Makin besar nilai
Mean, semakin positif
penilaian responden
thd variabel tersebut.

Tabel : Tests of Equality of Group Means
Tabel ini menguji apakah ada perbedaan yg signifikan antar grup untuk
setiap variabel bebas yg ada.
F Test :
> Jika Sig > 0,05, berarti tdk ada perbedaan antar grup.
> Jika Sig < 0,05, berarti ada perbedaan antar grup
Dari 8 variabel, hanya 3
variabel yang menunjukkan
perbedaan antar grup yaitu
warna, mesin dan promosi.

Tabel : Variables Entered/Removed
 Tabel ini menunjukkan variabel mana yang dimasukkan dalam
persamaan diskriminan.
 Terlihat ada 3 variabel yaitu promosi, mesin dan warna. Jadi perilaku
beli/tidak beli dipengaruhi sikap responden thd ke 3 variabel
tersebut.

Tabel : Variable In the Analysis
 Rangkaian proses tahapan pemasukan variabel satu persatu ke
dalam model.

Tabel : Eigenvalues
 Pada tabel Eigenvalues terlihat angka canonical correlation adalah
0,726, yang jika dikuadratkan akan menjadi 0,726 ² = 0,527.
 Hal ini berarti 52,7% varians dari variabel beli atau tidak dapat
dijelaskan oleh model diskriminan yg terbentuk. (oleh 3 variabel
bebas : promosi, mesin dan warna).

Tabel : Wilk’s Lambda
 Terlihat angka Sig 0,000, hal ini menunjukkan perbedaan yg nyata
antara kedua grup (beli dan tidak beli) pada model diskriminan

Tabel : Standardized Canonical Discriminant Function
Coefficients
 Menunjukkan koefisien determinan.
 D = 0,483 (warna) – 0,850 (mesin) + 0,912 (promosi)

Tabel : Structure Matrix
 Dapat dilihat variabel mana yg dipakai
dan mana yg tidak dipakai dalam
model diskriminan.
 Dapat dilihat variabel mana yang
paling diskriminan

Tabel : Function at Group Centroids
 Jumlah responden “tidak beli’ = 19
 Jumlah responden “beli” = 21
 Nilai pemisah Do
 (19 x 1,320) + (21 x ‐0,809) =
 ‐25,280 + 25,280 = 0
 Ketika dilakukan prediksi dg menggunakan fungsi determinan,
jika skore D negatif < 0 maka responden tsb masuk grup “tidak
beli” (kode 0). Jika skore D > 0 maka responden tsb masuk
grup “beli”

Tabel : Classification Result
 Dapat melihat ketepatan model diskriminan
 Dari grup tidak beli (pd data awal) yg tetap pada
grup tidak beli (prediksi) = 16
 Dari grup beli (pd data awal) yg tetap pada grup
beli (prediksi) = 27
 Sehingga ketepatan model adalah :
 (16 + 27) / 50 = 0,86 atau 86 %

Kesimpulan Analysis Diskriminan
 Ada perbedaan perilaku yg nyata antara mereka yg
mebeli dan yang tidak membeli.
 Atribut (var. bebas) yg paling membedakan perilaku
kedua kelompok adalah mesin, warna, dan promosi.
 Model diskriminan yg diperoleh memiliki tingkat
ketepatan yg cukup tinggi 86%

Studi Kasus
71
 Seorang peneliti ingin mengetahui variable apa saja yang menjadi
pembeda kinerja dari sebuah KPP. Sebuah KPP dikatakan berhasil
berkinerja baik (diberi kode 1), jika rasio antara realisasi dan target dari
seorang Account Representatif (AR) di sebuah KPP mencapai diatas atau
sama dengan 60 %. Dibawah 60%, KPP tersebut dianggap belum berhasil.
Dengan menggunakan data yang digunakan pada analisis factor, maka
a. Buatlah perbandingan deskriptif antar KPP “Baik” dangan “Belum Baik”!,
apa yang bisa anda simpulkan?
b. Bagaimana karakteristik kinerja antar kelompok KPP menurut data yang
ada?
c. Buatlah persamaan diskriminan yang mampu membedakan karakteristik
antar kelompok KPP?
d. Variabel apa saja yang berperanan menjadi pembeda?
e. Berapa besar tingkat akurasi model diskriman yang dibuat?
f. Apa yang bisa anda simpulkan dari hasil analisis diskriminan bagi KPP!

Deskriptif
72

Persamaan Diskriminan
73

Persamaan Diskriminan
74

Klasifikasi
75

Klasifikasi
76

Modifikasi Studi Kasus
77
 Seorang peneliti ingin mengetahui variable apa saja yang menjadi
pembeda kinerja dari sebuah KPP. Sebuah KPP dikatakan berhasil
berkinerja “BAIK” (diberi kode 1), jika rasio antara realisasi dan target dari
seorang Account Representatif (AR) di sebuah KPP mencapai diatas atau
sama dengan 75 %,berkinerja “SEDANG” Dibawah 75% tapi diatas 50%,
dan berkinerja “KURANG” jika rasionya kurang dari 50%.. Dengan
menggunakan data yang digunakan pada analisis faktor, maka
a. Buatlah perbandingan deskriptif antar KPP “Baik”, “Sedang”, dan
“Kurang”!, apa yang bisa anda simpulkan?
b. Bagaimana karakteristik kinerja antar kelompok KPP menurut data yang
ada?
c. Buatlah persamaan diskriminan yang mampu membedakan karakteristik
antar kelompok KPP?
d. Variabel apa saja yang berperanan menjadi pembeda?
e. Berapa besar tingkat akurasi model diskriman yang dibuat?
f. Apa yang bisa anda simpulkan dari hasil analisis diskriminan bagi KPP!

ANALISIS KELOMPOK (KLUSTER)
78

Pengantar
 Akademisi dan para peneliti sering dihadapkan pada persoalan
bagaimana membuat kelompok‐kelompok objek, baik itu
individu, perusahaan ataupun produk.
 Contoh Aplikasi
 Dalam pemasaran sering ingin dilakukan segmentasi pasar dan target pasar
 Dalam psikologi sering ingin dikelompokkan psychatric profile
 Dalam ekonomi regional, misalnya, ingin dikelompokkan daerah menurut
karakteristik ekonomi, demografi dll
 Intinya, banyak hal ingin menentukan kelompok “natural”
structure antar objek base on multivarite profile
 Cluster Analysis merupakan salah satu teknik yang sering
digunakan untuk tujuan‐tujuan di atas

Analisis Kelompok (Kluster)
 Analisis Kluster adalah salah satu tehnik multivariate yang tujuan
utamanya adalah mengelompokkan objek berdasarakan
karakateristik yang dimilikinya.
 Analisis ini digunakan untuk mengelompokkan objek‐objek menjadi beberapa
gerombol berdasarkan pengukuran peubah‐peubah yang diamati, sehingga
diperoleh kemiripan objek dalam gerombol yang sama dibandingkan antar objek
pada gerombol yang lain.
 Pengelompokkannya dilakukan sedemikian rupa sehingga setiap
objek dalam satu kluster bersifat homogen dan antar objek dari
kluster yang berbeda akan bersifat heterogen.
 Adapun ukuran kedekatan dapat dihitung berdasarkan jarak Eucledian,
Manhattan, Pearson dan sebagainya.
 Secara geometri, objek dalam satu kluster akan sangat dekat dan
objek antar kluster akan relatif sangat jauh.
 Teknik hierarki disajikan dalam bentuk dendrogram sehingga penggerombolan
akan lebih mudah dan informatif.

High
Low
Low High
Frequency of going to fast food restaurants
Frequency
of
eating
out
Contoh: Scatter Distribusi Objek Pengamatan

1
3
2
Low Frequency of Going to Fast Food Restaurants High
Low
Frequency
of
Eating
Out
High
Analisis Kluster 2 Variabel

Contoh Aplikasi
 Misalkan kita ingin mengelompokkan 7 daerah berikut
berdasarkan pola pembangunan ekonominya (misal
pertumbuhan PDRB) dan tingkat pengangguran
 Datanya
ClusteringVariabel A B C D E F G
PertumbuhanEkonomi 3 4 4 2 6 7 6
TingkatPengangguran 2 5 7 7 6 7 4
Daerah

Scater Plot

Analisis Kluster
 Tujuan Analisis Kluster mengelompokkan objek berdasarkan
similarity
 Ada tiga pertanyaan yang muncul :
 Bagaimana mengukur kemiripan (similarity) ?
 Bagaimana membentuk kluster ?
 Berapa kluster yang kita bentuk ?

Ukuran Kemiripan (similarity)
 Ukuran Kemiripan : Jarak Euclidean
A B C D E F G
A
B 3.162
C 3.099 2.000
D 5.099 2.828 2.000
E 5.000 2.236 2.236 4.123
F 6.403 3.606 3.000 5.000 1.414
G 3.606 2.236 3.606 5.000 2.000 3.162

Pembentukan Cluster
 Aglomerative Hierarchical Clustering Process
Step
Minimum
Distance
Unclustered
Objek
Observartions
Pair Cluster Membership
Number
of
Cluster
Overall
Similiarity
Measure
Initial Solutions (A) (B) ( C ) (D) (E) (F) (G) 7 -
1 1.414 E, F (A) (B) ( C ) , (D) (E-F) (G) 6 1.414
2 2.000 E, G (A) (B) ( C ) , (D) (E-F-G) 5 2.192
3 2.000 C,D (A) (B) (C- D) (E-F-G) 4 2.144
4 2.000 B,C (A) (B-C- D) (E-F-G) 3 2.234
5 2.236 B,E (A) (B-C- D-E-F-G) 2 2.896
6 3.162 A-B (A-B-C- D-E-F-G) 1 3.420

Penentuan Banyaknya Cluster
 Tidak ada standar , tergantung pada tujuan dan prosedur yang dipilih
 Sebaga acuan dapat menggunakan
1. rata‐rata jarak dalam cluster, yakni jika terjadi peningkatan jarak rata‐
rata dalam cluster yang cukup besar, maka dipilih banyaknya cluster
sebelum terjadi peningkatan jarak rata‐rata antar cluster
2. Berdasarkan value judgement empiris sesua dengan yang disarankan
berdasarkan konsep teori yang secara alamiah menentukan
banyaknya cluster

Aplikasi
89
 Dari data yang ada, seorang peneliti ingin mengetahui kelompok‐
kelompok yang terbentuk dari KPP berdasarkan variable yang ada.
 Tentukan bagaimana pengelompokan yang terbentuk antara KPP?,
jelaskan karakteristik dari setiap kelompok yang terbentuk!
 Apa yang bisa anda simpulkan dari analisis kelompok bagi daerah
tertinggal!

2. Analisis Multivariate-Rofik_Diklat_KU_With Solution.pdf

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to 2. Analisis Multivariate-Rofik_Diklat_KU_With Solution.pdf

Similar to 2. Analisis Multivariate-Rofik_Diklat_KU_With Solution.pdf (20)

Recently uploaded

Recently uploaded (20)

2. Analisis Multivariate-Rofik_Diklat_KU_With Solution.pdf