ALGORITMA K-NEAREST NEIGHBOR (KNN)
DATA MINING : KLASIFIKASI DAN PREDIKSI
Dedi Darwis, M.Kom.
Konsep K-NN
• Nearest Neighbor adalah pendekatan untuk mencari
kasus dengan menghitung kedekatan antara kasus
baru dengan kasus lama, yaitu berdasarkan pada
pencocokan bobot dari sejumlah fitur yang ada.
• Misalkan diinginkan untuk mencari solusi terhadap
seorang pasien baru dengan menggunakan solusi
dari pasien terdahulu. Untuk mencari kasus pasien
mana yang akan digunakan maka dihitung
kedekatan kasus pasien baru dengan semua kasus
pasien lama. Kasus pasien lama dengan kedekatan
terbesar-lah yang akan diambil solusinya untuk
digunakan pada kasus pasien baru.
Konsep K-NN
Persamaan Matematis Algortima K-NN
• Kedekatan biasanya berada pada nilai antara 0 s/d 1.
Nilai 0 artinya kedua kasus mutlak tidak mirip,
sebaliknya untuk nilai 1 kasus mirip dengan mutlak.
Studi Kasus
• Kasus : Kemungkinan seorang nasabah bank
akan bermasalah dalam pembayarannya atau
tidak
Menentukan Bobot pada Atribut / Fitur
Menentukan Nilai Kedekatan (JK)
Menentukan Nilai Kedekatan
(Pendidikan)
Menentukan Nilai Kedekatan (Status)
Data Uji
Penyelesaian
Penyelesaian
Penyelesaian
Penyelesaiain
Analisa Hasil
• Memilih kasus dengan kedekatan terdekat. Dari
langkah 1, 2 dan 3 dapat diketahui bahwa nilai
tertinggi adalah kasus 2. Berarti kasus yang terdekat
dengan kasus baru adalah kasus 2.
• Menggunakan klasifikasi dari kasus dengan
kedekatan terdekat.
• Berdasarkan hasil pada langkah 4, maka klasifikasi
dari kasus 2 yang akan digunakan untuk
memprediksi kasus baru. Yaitu kemungkinan
nasabah baru akan Tidak Bermasalah
Data Uji
• JK : P
• Pend : S1
• Status : Tidak Bekerja
• Apakah nasabah tersebut bermasalah atau tidak
dalam melakukan peminjaman ?

Data Mining - KNN

  • 1.
    ALGORITMA K-NEAREST NEIGHBOR(KNN) DATA MINING : KLASIFIKASI DAN PREDIKSI Dedi Darwis, M.Kom.
  • 2.
    Konsep K-NN • NearestNeighbor adalah pendekatan untuk mencari kasus dengan menghitung kedekatan antara kasus baru dengan kasus lama, yaitu berdasarkan pada pencocokan bobot dari sejumlah fitur yang ada. • Misalkan diinginkan untuk mencari solusi terhadap seorang pasien baru dengan menggunakan solusi dari pasien terdahulu. Untuk mencari kasus pasien mana yang akan digunakan maka dihitung kedekatan kasus pasien baru dengan semua kasus pasien lama. Kasus pasien lama dengan kedekatan terbesar-lah yang akan diambil solusinya untuk digunakan pada kasus pasien baru.
  • 3.
  • 4.
    Persamaan Matematis AlgortimaK-NN • Kedekatan biasanya berada pada nilai antara 0 s/d 1. Nilai 0 artinya kedua kasus mutlak tidak mirip, sebaliknya untuk nilai 1 kasus mirip dengan mutlak.
  • 5.
    Studi Kasus • Kasus: Kemungkinan seorang nasabah bank akan bermasalah dalam pembayarannya atau tidak
  • 6.
    Menentukan Bobot padaAtribut / Fitur
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
    Analisa Hasil • Memilihkasus dengan kedekatan terdekat. Dari langkah 1, 2 dan 3 dapat diketahui bahwa nilai tertinggi adalah kasus 2. Berarti kasus yang terdekat dengan kasus baru adalah kasus 2. • Menggunakan klasifikasi dari kasus dengan kedekatan terdekat. • Berdasarkan hasil pada langkah 4, maka klasifikasi dari kasus 2 yang akan digunakan untuk memprediksi kasus baru. Yaitu kemungkinan nasabah baru akan Tidak Bermasalah
  • 16.
    Data Uji • JK: P • Pend : S1 • Status : Tidak Bekerja • Apakah nasabah tersebut bermasalah atau tidak dalam melakukan peminjaman ?