The document provides a standard mortality table from 1941 used to calculate life insurance premiums and benefits. It contains the probability of death (qx) and life expectancy (ex) for individuals ages 0 to 80 based on actuarial calculations. The table allows insurers to determine expected mortality rates and price policies accordingly.
Makalah ini membahas tentang Aljabar Linear Elementer yang merupakan rangkuman dari buku karya Howard Anton. Makalah ini terdiri dari bab pendahuluan, sistem persamaan linear dan matriks, determinan, dan penutup. Pembahasan mencakup konsep dasar sistem persamaan linear, eliminasi Gauss, matriks dan operasi matriks, serta determinan.
Dokumen tersebut membahas tentang ukuran gejala pusat dan ukuran letak dalam statistika. Ukuran gejala pusat mencakup rata-rata hitung, rata-rata ukur, rata-rata harmonik, dan modus, sedangkan ukuran letak mencakup median, kuartil, desil, dan persentil."
Dokumen tersebut membahas analisis data spasial yang mencakup beberapa topik seperti jenis data spasial, pola spasial, autokorelasi spasial, pemodelan data spasial, dan geostatistika. Metode-metode seperti regresi berbobot geografis dan model autoregresif spasial digunakan untuk menganalisis hubungan antar lokasi dan memodelkan data spasial.
The document provides a standard mortality table from 1941 used to calculate life insurance premiums and benefits. It contains the probability of death (qx) and life expectancy (ex) for individuals ages 0 to 80 based on actuarial calculations. The table allows insurers to determine expected mortality rates and price policies accordingly.
Makalah ini membahas tentang Aljabar Linear Elementer yang merupakan rangkuman dari buku karya Howard Anton. Makalah ini terdiri dari bab pendahuluan, sistem persamaan linear dan matriks, determinan, dan penutup. Pembahasan mencakup konsep dasar sistem persamaan linear, eliminasi Gauss, matriks dan operasi matriks, serta determinan.
Dokumen tersebut membahas tentang ukuran gejala pusat dan ukuran letak dalam statistika. Ukuran gejala pusat mencakup rata-rata hitung, rata-rata ukur, rata-rata harmonik, dan modus, sedangkan ukuran letak mencakup median, kuartil, desil, dan persentil."
Dokumen tersebut membahas analisis data spasial yang mencakup beberapa topik seperti jenis data spasial, pola spasial, autokorelasi spasial, pemodelan data spasial, dan geostatistika. Metode-metode seperti regresi berbobot geografis dan model autoregresif spasial digunakan untuk menganalisis hubungan antar lokasi dan memodelkan data spasial.
Ukuran Penyebaran Data
Dokumen ini membahas beberapa ukuran penyebaran data untuk mengukur seberapa jauh suatu data menyebar dari rata-ratanya, seperti jangkauan data, jangkauan antar kuartil, simpangan rata-rata, dan simpangan baku. Ukuran-ukuran ini berguna untuk membandingkan tingkat variasi dari dua himpunan data.
Analisis korelasi kanonik digunakan untuk mengukur hubungan antara dua set variabel, yaitu variabel bebas dan variabel terikat. Metode ini menghasilkan pasangan variabel kanonik baru dimana setiap pasangan memiliki korelasi maksimum. Dokumen ini menjelaskan konsep dan prosedur analisis korelasi kanonik serta memberikan contoh penerapannya untuk meneliti hubungan antara variabel lingkungan dan variabel penyebaran kupu-kupu.
Ruang Hasil kali Dalam ( Aljabar Linear Elementer )Kelinci Coklat
Mata kuliah Aljabar Linear membahas konsep-konsep dasar aljabar linear seperti matriks, determinan, sistem persamaan linear, vektor, ruang vektor, transformasi linear, dan ruang eigen. Silabus mencakup delapan bab yang mendiskusikan topik-topik tersebut beserta contoh-contoh penerapannya.
Soal dan jawaban uci chi kuadrat dan regresiVivin Dolpin
Uji chi kuadrat digunakan untuk menguji dua kelompok data baik variabel independen maupun dependennya berbentuk kategori atau dapat di katakan sebagaai uji proporsi untuk dua peristiwa atau lebih, sehingga datanya bersifat diskrit.Regresi sedehana dapat dianalisi karena didasari oleh hubungan fungsional atau hubungan sebab akibat (kausal) variabel bebas (x) terhadap variabel terikat(y)
Skripsi ini membahas peramalan produksi gula pada PT Perkebunan Nusantara IX dengan menggunakan model ARIMA. Tujuannya adalah menentukan model terbaik dan meramalkan produksi hingga tahun 2007. Hasilnya menunjukkan model ARIMA(2,2,1) paling cocok dan produksi akan terus meningkat meskipun tidak signifikan.
The document provides a table of critical values for the chi-square distribution for degrees of freedom ranging from 1 to 100. The table includes critical values for several common significance levels including 0.25, 0.10, 0.05, 0.01, 0.005, and 0.001. Each row of the table lists the critical value of the chi-square distribution for a given degree of freedom at each of the six significance levels.
Dokumen tersebut membahas tentang anuitas hidup yang merupakan serangkaian pembayaran berkala yang dilakukan selama seseorang masih hidup. Terdapat tiga jenis anuitas hidup yang dijelaskan yaitu anuitas seumur hidup, anuitas sementara, dan anuitas ditunda.
The document discusses the Schrodinger equation and its applications in quantum mechanics. It covers:
1. The postulates of quantum mechanics including that systems are described by wavefunctions and observables are represented by Hermitian operators.
2. Examples of operators for observables like position, momentum, energy.
3. The time-independent Schrodinger equation for a time-independent potential and its solution for an infinite square well potential.
4. Other examples like an infinite square well potential trapping an electron and calculating its energy levels and wavefunctions.
Ukuran Penyebaran Data
Dokumen ini membahas beberapa ukuran penyebaran data untuk mengukur seberapa jauh suatu data menyebar dari rata-ratanya, seperti jangkauan data, jangkauan antar kuartil, simpangan rata-rata, dan simpangan baku. Ukuran-ukuran ini berguna untuk membandingkan tingkat variasi dari dua himpunan data.
Analisis korelasi kanonik digunakan untuk mengukur hubungan antara dua set variabel, yaitu variabel bebas dan variabel terikat. Metode ini menghasilkan pasangan variabel kanonik baru dimana setiap pasangan memiliki korelasi maksimum. Dokumen ini menjelaskan konsep dan prosedur analisis korelasi kanonik serta memberikan contoh penerapannya untuk meneliti hubungan antara variabel lingkungan dan variabel penyebaran kupu-kupu.
Ruang Hasil kali Dalam ( Aljabar Linear Elementer )Kelinci Coklat
Mata kuliah Aljabar Linear membahas konsep-konsep dasar aljabar linear seperti matriks, determinan, sistem persamaan linear, vektor, ruang vektor, transformasi linear, dan ruang eigen. Silabus mencakup delapan bab yang mendiskusikan topik-topik tersebut beserta contoh-contoh penerapannya.
Soal dan jawaban uci chi kuadrat dan regresiVivin Dolpin
Uji chi kuadrat digunakan untuk menguji dua kelompok data baik variabel independen maupun dependennya berbentuk kategori atau dapat di katakan sebagaai uji proporsi untuk dua peristiwa atau lebih, sehingga datanya bersifat diskrit.Regresi sedehana dapat dianalisi karena didasari oleh hubungan fungsional atau hubungan sebab akibat (kausal) variabel bebas (x) terhadap variabel terikat(y)
Skripsi ini membahas peramalan produksi gula pada PT Perkebunan Nusantara IX dengan menggunakan model ARIMA. Tujuannya adalah menentukan model terbaik dan meramalkan produksi hingga tahun 2007. Hasilnya menunjukkan model ARIMA(2,2,1) paling cocok dan produksi akan terus meningkat meskipun tidak signifikan.
The document provides a table of critical values for the chi-square distribution for degrees of freedom ranging from 1 to 100. The table includes critical values for several common significance levels including 0.25, 0.10, 0.05, 0.01, 0.005, and 0.001. Each row of the table lists the critical value of the chi-square distribution for a given degree of freedom at each of the six significance levels.
Dokumen tersebut membahas tentang anuitas hidup yang merupakan serangkaian pembayaran berkala yang dilakukan selama seseorang masih hidup. Terdapat tiga jenis anuitas hidup yang dijelaskan yaitu anuitas seumur hidup, anuitas sementara, dan anuitas ditunda.
The document discusses the Schrodinger equation and its applications in quantum mechanics. It covers:
1. The postulates of quantum mechanics including that systems are described by wavefunctions and observables are represented by Hermitian operators.
2. Examples of operators for observables like position, momentum, energy.
3. The time-independent Schrodinger equation for a time-independent potential and its solution for an infinite square well potential.
4. Other examples like an infinite square well potential trapping an electron and calculating its energy levels and wavefunctions.
K-means clustering digunakan untuk mengelompokkan mahasiswa berdasarkan karakteristiknya seperti jurusan dan kota asal. Data mahasiswa dikelompokkan menjadi tiga cluster. Hasil analisis menunjukkan karakteristik masing-masing cluster, seperti cluster 1 didominasi mahasiswa DKI Jakarta dan Jawa Barat jurusan Teknologi Informasi dan Pemasaran, cluster 2 didominasi mahasiswa DKI Jakarta dan Jawa Barat jurusan Akuntansi dan Bisnis Internas
Ukuran Penyebaran Data
Dokumen ini membahas lima ukuran penyebaran data, yaitu jangkauan data, jangkauan antar kuartil dan simpangan kuartil, simpangan rata-rata, dan simpangan baku. Ukuran-ukuran ini digunakan untuk mengukur seberapa jauh suatu data menyebar dari rata-ratanya.
1. Unsupervised learning digunakan untuk pengelompokkan data tanpa label melalui clustering.
2. K-means clustering dan hierarchical clustering adalah dua pendekatan utama clustering.
3. Pemilihan parameter seperti jumlah cluster pada k-means mempengaruhi akurasi hasil clustering.
Ringkasan dokumen tersebut adalah:
1. Dokumen tersebut membahas tentang pengumpulan dan penyajian data serta ukuran pemusatan dan letak data dalam ilmu pengetahuan alam di sekolah dasar.
Slide ini berisi penjelasan tentang Data Mining Klasifikasi. Di dalamnya ada tiga algoritma yang dibahas, yaitu: Naive Bayes, kNN, dan ID3 (Decision Tree).
Dokumen tersebut memberikan penjelasan singkat tentang algoritma K-Means untuk clustering data. Algoritma ini digunakan untuk memecah data menjadi beberapa kelompok berdasarkan karakteristiknya dengan menentukan pusat kluster secara acak dan menghitung jarak setiap data ke kluster terdekat. Contoh kasusnya mengelompokkan 15 mahasiswa ke dalam 3 kelompok berdasarkan nilai UTS, Tugas, dan UAS.
Dokumen tersebut membahas tentang statistika, yang mencakup definisi statistika sebagai hasil pengolahan dan analisis data, metode pengumpulan data, penyajian data berkelompok dalam bentuk tabel, ukuran pemusatan data seperti rata-rata, median, dan modus, serta ukuran penyebaran data seperti rentang dan simpangan rataan.
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...Muhammad Nur Hadi
Jurnal "Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ayat 26 dan 32 dan Surah Al-Hujurat Ayat 13), Ditulis oleh Muhammmad Nur Hadi, Mahasiswa Program Studi Ilmu Hadist di UIN SUSKA RIAU.
Tugas DIT Supervisor K3 - Sidik Permana Putra.pptx
analisis kluster
1. CLUSTER ANALYSIS
KELOMPOK 5
1. GUSTI WIRA BAYUTAMA (2513204002)
2. NATHANIA NIWEDYA (2513201004)
3. SOFYAN MUZAKKI (2513204009)
4. NI PUTU WANSRI SEPTI DEWI (2513201010)
5. JAZILATUR RIZQIYAH DEVIABAHARI (2513203012)
1
2. WHAT IS CLUSTER ANALYSIS?
Analisis cluster adalah salah satu teknik multivariate untuk
mengelompokkan obyek berdasarkan kesamaan
karakteristik di antara obyek-obyek tersebut sehingga
obyek-obyek yang berada dalam satu cluster akan
Cimrie-cmipriunCylaui sketemrir iypaannsgatBuasaikma lain.
• Homogenitas internal (within cluster) : kesamaan
antar anggota dalam satu cluster.
• Heterogenitas external (between cluster): perbedaan
antara cluster yang satu dengan cluster yang lain.
2
Asusmsi
• Representativeness of the sample : sampel yang
diambil dapat mewakili populasi yang ada.
•Multokolinieritas: Terdapat hubungan yang linier antar
variabel .
3. CLUSTER ANALYSIS
3
Metode
Pengelompokan
Hirarchical
Clustering
Method
Single Linkage
Complete
Linkage
Average Linkage Ward’s Method Centroid Method
Non Hirarchical
Clustering
Method
K-Mean Method
Tidak baik
untuk
mengolah
sampel ukuran
besar
Untuk data sampel
ukuran besar
5. HIRARCHICAL CLUSTERING METHOD
nearest neighbor
5
1. Single Linkage didasarkan pada jarak minimum
(nearest neighbor ). Dimulai dengan dua objek yang
dipisahkan dengan jarak paling pendek maka keduanya
akan ditempatkan pada cluster pertama, dan seterusnya.
Example :
Jarak antara
Jarak yang Paling
Minimum
6. HIRARCHICAL CLUSTERING METHOD CONT…
Object 5 dan object 3 digabungkan, kemudian dicari terdekat
menuju object berikutnya
6
Jarak yang
paling minimum
adalah dari
object (3,5) ke
object 1
Object (5,3) digabungkan
dengan object 1.
7. HIRARCHICAL CLUSTERING METHOD CONT…
7
Jarak yang
paling minimum
adalah dari
object (1,3,5) ke
object 4
Jarak yang
Paling
Minimum
Jarak
antar
cluster
DENDOGRAM
Cluster 1 Cluster 2
8. HIRARCHICAL CLUSTERING METHOD CONT…
2. Complete linkage dasarnya adalah jarak maksimum.
Dalam metode ini seluruh objek dalam suatu cluster dikaitkan
satu sama lain pada suatu jarak maksimuma atau dengan
kesamaan minimum.
Jarak antara most
distance members
8
Example :
dari cluster
Awalnya dicari Jarak
yang Paling Minimum
3 dan 5
didekatkan/digabungkan
9. HIRARCHICAL CLUSTERING METHOD CONT…
Jarak paling
minimum
adalah dari
object 4 ke 2
9
Jarak yang paling
minimum.
Sehingga (2,4)
didekatkan
dengan object 1
DENDOGRAM
Cluster 1 Cluster 2
10. HIRARCHICAL CLUSTERING METHOD CONT…
10
3. Average Linkage Dasarnya adalah jarak rata-rata
antar object. Dimana jarak antar cluster merupakan
jarak rata-rata antar object Jarak antara object ke i
dalam cluster (UV) dan
object ke j dalam cluster
(w)
Banyaknya item di cluster
(UV) dan W
Example :
Subject
Id
Income
($ thous.)
Educatio
n (years)
S1 5 5
S2 6 6
S3 15 14
S4 16 15
S5 25 20
S6 30 19
11. HIRARCHICAL CLUSTERING METHOD CONT…
Dengan menggunakan
euclidean distance
diperoleh jarak paling
minimum yaitu S1 dan
11
S2
Jarak paling
minimum selanjutnya
sehingga S3 dan S4
digabungkan
12. HIRARCHICAL CLUSTERING METHOD CONT…
12
4. Centroid Method mempertimbangkan jarak
centroid pada cluster.
dimana
Jarak antara
klaster A dan
klaster B adalah
jarak rata-rata
data x dan y dari
klaster A dan B
Example :
Subject
nA dan nB masing-masing adalah
banyaknya data dalam set A dan B
Id
Income
($)
Educati
on
(years)
S1 5 5
S2 6 6
S3 15 14
S4 16 15
S5 25 20
S6 30 19
13. HIRARCHICAL CLUSTERING METHOD CONT…
13
Dengan
menggunakan
euclidean distance
dicari jarak paling
minimum yaitu (S1,
S2)
S1&S2 digabungkan
menjadi 1 klaster dengan
rata-rata income :
(5+6)/2 = 5,5 dan rata-rata
education : (5+6)/2 =
5,5
15. HIRARCHICAL CLUSTERING METHOD CONT…
5. Ward’s Method Dalam metode ini jarak antara dua
15
cluster adalah jumlah kuadrat antara dua cluster
untuk seluruh variabel.
dimana :
nA dan nB masing-masing adalah banyaknya data
dalam set A dan B
s2
AB adalah jarak antara klaster A dan B menggunakan
centroid linkage
Metode ini bertujuan untuk meminimasi jumlah
kuadrat dalam cluster (within-cluster sum of square)
16. HIRARCHICAL CLUSTERING METHOD CONT…
16
Example :
•ESS adalah error sum of square
ESS untuk S1 dan S2 :
(5-5,5)2+(6-5,5)2+(5-5,5)2+(6-5,5)2 = 1
Metode ward ini menghitung
kemungkinan tiap cluster
DENDOGRAM
Cluster 1 Cluster 2
17. NON HIRARCHICAL CLUSTERING
METHOD
• K-MEAN CLUSTERING METHOD
: Dimulai dengan menentukan
terlebih dahulu jumlah cluster yang
diinginkan (dua, tiga, atau yang
lain). Setelah jumlah cluster
ditentukan, maka proses cluster
dilakukan tanpa mengikuti proses
hirarki.
• KELEBIHAN : Cukup efisien,
algoritma berhenti dalam kondisi
optimum.
• KELEMAHAN : Harus
menentukan jumlah cluster yang
dibentuk, tidak dapat menangani
data yang mengalami
penyimpangan (outlier).
17
Menentukan Banyaknya
cluster (K)
Menentukan pusat
(centroid )
Menghitung jarak object
ke pusat (centroid)
Mengelompokan object
berdasarkan jarak minimum
Terdapat object yang harus
dipindahkan
ya
Tidak
Selesai
19. ALGORITMA 1
19
1. Tentukan jumlah cluster
(k)
2. Tentukan observasi yang menjadi centroid
sejumlah (k)
3. Menghitung jarak dari Cluster Centroids
D2
Initial
Cluster
Centroid
13= (5-15)2 + (5-14)2 = 181
S3, S4, S5, & S6
tergabung dalam
satu cluster
k = 3
20. ALGORITMA 1 CONT ...
• ITERASI 1
20
a. Mengubah Cluster Centroids
DATA
Rata-rata
b. Menghitung jarak dari Cluster
Centroids
D2
13= (5-21,5)2 + (5-17)2 = 416,25
Iterasi selesai karena
Reassigment = Previous
Assigment
21. ALGORITMA 1 VS ALGORITMA 2
• ALGORITMA 1 : KITA BEBAS MENENTUKAN INITIAL
CLUSTER CENTROID
• ALGORITMA 2 : INITIAL CLUSTER CENTROID DIMODIFIKASI
• LANGKAH SELANJUTNYA SAMA
21
22. ALGORITMA 2
22
1. Tentukan jumlah cluster
k = 3
(k)
2. Tentukan observasi yang menjadi centroid
sejumlah (k)
Initial
Cluster
Centroid
3. Modifikasi Initial Cluster Centroid
3.1 Tentukan jarak terkecil (selain nol) antar observasi
Jarak terkecil :
S1 & S2
23. 23
ALGORITMA 2 CONT...
3.2 Menetukan replacement seeds
S4 tidak dapat dijadikan replacement
seed karena jarak S1 dan S2 tidak
lebih kecil dari jarak S4 dengan seed
terdekat (S3).
S5 dijadikan replacement seed karena
jarak S1 dan S2 lebih kecil dari jarak
S5 dengan seed terdekat (S3).
3.3 Cluster Centroid hasil modifikasi
S5 menggantikan seed S2
karena jarak S5 dan S2 lebih
kecil daripada S5 dan S1.
15
25
14 20
24. ALGORITMA 2 CONT ...
• ITERASI 1
24
4. Menghitung jarak dari Cluster Centroids
D2
12= (5-15)2 + (5-14)2 = 181 D2
13= (5-25)2 + (5-20)2 = 625
a. Mengubah Cluster Centroids
S1 &
S2
S3 & S4 S5 & S6
b. Menghitung jarak dari Cluster Centroids
D2
13= (5-27,5)2 + (5-19,5)2 = 716,5
Iterasi selesai karena
Reassigment = Previous
Assigment
25. ALGORITMA 3
• Initial seeds (Ci) ditentukan dengan rumus
25
• Sum(i) : total nilai semua variable tiap observasi
• Min : nilai terkecil sum(i) dari data
• Max : nilai terbesar sum(i) dari data
• K : jumlah cluster
• Reassigment berdasarkan minimum Error Sum of
Square (ESS)
27. 27
2. Reassignment cluster melalui ESS
• S1 jika dipindah ke cluster 3
Subject berpindah cluster menuju cluster
dengan perubahan ESS yang paling
negatif
Cluster sudah
optimal karena
reassignment =
previous
assignment
ALGORITMA 3 CONT ...
28. SIMILARITY MEASURES
dengan j dan p adalah jumlah
variable
28
• Similarity measures dapat
diklasifikasikan menjadi tiga
bentuk :
1. Distance measures
2. Association coefficient
3. Correlation coefficient
Distance Measures
Terdapat beberapa metode dalam
mengukur jarak, seperti
Euclidean; Minkowski; City-block;
Mahalanobis; dan lain
sebagainya.
1. Euclidean Distance untuk
mengukur similarity Jarak
euclidean antara titik i dengan
j dalam dimensi p :
Dij adalah jarak antara titik i
2. Minkowski Metric general
metric dari Euclidean
distance.
Jika n = 2 akan menghasilkan
euclidean distance, maka n = 1
akan menghasilkan city-block
distance
29. 29
SIMILARITY MEASURES CONT...
3. City-block or manhattan
distance bentuk khusus dari
minkowski metric dengan n = 1.
Example
:
Menghitung Jarak Dengan
menggunakan euclidean
distance :
D2 = (5-6)2 + (5-6)2 = 2
12
D12 = 1,41
Dengan menggunakan city-block
distance :
D12 = I5-6I + I5-6I = 2
30. SIMILARITY MEASURES CONT...
30
4. Mahalanobis Distance
menghitung korelasi diantara
variabel.
dimana Σ adalah covariance
matrix
Dalam hal Σ = 1, maka jarak ini
menjadi Euclidean
variable yang tidak berkorelasi
mahalanobis distance mengurangi
euclidean distance untuk
unstandardized data.
sehingga euclidean distance untuk
standardized data merupakan bentuk
khusus dari mahalanobis distance.
31. 31
CORRELATION COEFFICIENT
• Untuk mengukur similarity juga
dapat menggunakan pearson
product moment correlation
coefficient.
• Baik correlation coefficient
maupun association coefficient
merupakan bentuk dissimilarity,
dimana nilai tertinggi
menunjukkan similarity dan
kebalikannya.
• Koefisien korelasi dapat dengan
mudah dirubah ke bentuk
similarity dengan menambahkan
variabel satu dengan yang lain,
namun tidak bisa untuk beberapa
Association Coefficient
digunakan untuk menunjukkan
similarity untuk variabel biner.
Untuk data biner dapat
menggunakan ukuran seperti
polychoric correlation atau
simple matching coefficients
atau variasi untuk
menunjukkan similarity antar
observasi.
1 0
1 a b
0 c d
a, b, c, d adalah frekuensi
kejadian, similarity antara 2
variabel tersebut adalah :
a
d
a b c d
Example
:
32. RELIABILITY AND EXTERNAL VALIDITY
32
Reliability
Salah satu indikator reliability adalah degree of
agreement antara assignment dengan analisis klaster.
External Validity diperoleh dengan
membandingkan hasil dari analisis klaster dengan
kriteria eksternal.
Misalnya mengelompokkan perusahaan berdasarkan
rasio keuangan sehingga diperoleh 2 klaster, yaitu
perusahaan yang sehat secara finansial dan
perusahaan yang tidak sehat secara finansial.