PINAR BAYRAK
K MEANS CLUSTER
K MEANS CLUSTER -
KÜMELEME
 Gruplanmış verileri benzerliklerine göre
sınıflandırmada kullanılır.
 2 temel yönteme ayrılır:
 Hiyerarişik Kümeleme
 Hiyerarşik Olmayan Kümeleme
 K Means Kümeleme
 Diğer yöntemlerden farkı küme sayısının,
analizden önce belirlenmiş olmasıdır. Bu da
araştırmacının bilgi ve tecrübesİnin ön plana
çıkmasına neden olmaktadır.
K MEANS CLUSTER -
KÜMELEME
K MEANS CLUSTER -
KÜMELEME
K MEANS CLUSTER -
KÜMELEME
K MEANS CLUSTER – KÜMELEME
ADIMLARI
 Küme sayısı belirlenir.
 Her kümenin bir gözlemi seçilir.
 Benzer gözlemler belirlenen bu gözlemler
etrafında kümelenir.
 Burada kümeye girecek gözlemler belirlenirken
ANOVA kullanılır.
 İşlemlerin tekrarlanma sayısı (iterasyon) ve
yakınsama kriteri (convergence criterion)
belirlenir.
 İterasyonun en fazla 10, yakınsama kriterinin de
0-1 arasında olması beklenir.
K MEANS CLUSTER – ÖRNEK OLAY
K MEANS CLUSTER – ÖRNEK OLAY
K MEANS CLUSTER – ÖRNEK OLAY
K MEANS CLUSTER – ÖRNEK OLAY
K MEANS CLUSTER – ÖRNEK OLAY
K MEANS CLUSTER – ÖRNEK OLAY
 İlk küme merkezleri – Initial Cluster Centers:
Analize başlamadan önce küme sayısını
belirlediğimiz için, bu kümelerin her bir değişkene
göre ilk merkezlerini gösteren tablodur.
K MEANS CLUSTER – ÖRNEK OLAY
 Tekrarlama Tablosu – Analizin tekrarlanma
sayısını verir ancak belirlediğimiz sayıda tekrar
olması şart değildir. Optimum sayıya erişildiğinde
analiz tamamlanır.
K MEANS CLUSTER – ÖRNEK OLAY
 Küme Üyeliği Tablosu – Hangi gözlemin hangi
kümenin üyesi olduğunun gösterildiği tablodur.
Gözlemin küme merkezinden uzaklığı da
gösterilmiştir. Buradan yola çıkarak ortak
kümelere bir isim verilebilir.
K MEANS CLUSTER – ÖRNEK OLAY
 Final Küme Merkezleri – Değişkenlerin kümelere
göre ortalamaları gösterilir.
K MEANS CLUSTER – ÖRNEK OLAY
 Final Küme Merkezleri Arasındaki Mesafeler–
Küme merkezlerinin birbirlerine olan uzaklıklarını
verir. Uzaklık değeri büyüdükçe benzerlikler
azalmaktadır.
K MEANS CLUSTER – ÖRNEK OLAY
 ANOVA Sonuçları – Küme üyeliklerinin
hesaplanmasını gösteren yardımcı bir tablodur.
TEŞEKKÜR EDERİM.

K means cluster

  • 1.
  • 2.
    K MEANS CLUSTER- KÜMELEME  Gruplanmış verileri benzerliklerine göre sınıflandırmada kullanılır.  2 temel yönteme ayrılır:  Hiyerarişik Kümeleme  Hiyerarşik Olmayan Kümeleme  K Means Kümeleme  Diğer yöntemlerden farkı küme sayısının, analizden önce belirlenmiş olmasıdır. Bu da araştırmacının bilgi ve tecrübesİnin ön plana çıkmasına neden olmaktadır.
  • 3.
    K MEANS CLUSTER- KÜMELEME
  • 4.
    K MEANS CLUSTER- KÜMELEME
  • 5.
    K MEANS CLUSTER- KÜMELEME
  • 6.
    K MEANS CLUSTER– KÜMELEME ADIMLARI  Küme sayısı belirlenir.  Her kümenin bir gözlemi seçilir.  Benzer gözlemler belirlenen bu gözlemler etrafında kümelenir.  Burada kümeye girecek gözlemler belirlenirken ANOVA kullanılır.  İşlemlerin tekrarlanma sayısı (iterasyon) ve yakınsama kriteri (convergence criterion) belirlenir.  İterasyonun en fazla 10, yakınsama kriterinin de 0-1 arasında olması beklenir.
  • 7.
    K MEANS CLUSTER– ÖRNEK OLAY
  • 8.
    K MEANS CLUSTER– ÖRNEK OLAY
  • 9.
    K MEANS CLUSTER– ÖRNEK OLAY
  • 10.
    K MEANS CLUSTER– ÖRNEK OLAY
  • 11.
    K MEANS CLUSTER– ÖRNEK OLAY
  • 12.
    K MEANS CLUSTER– ÖRNEK OLAY  İlk küme merkezleri – Initial Cluster Centers: Analize başlamadan önce küme sayısını belirlediğimiz için, bu kümelerin her bir değişkene göre ilk merkezlerini gösteren tablodur.
  • 13.
    K MEANS CLUSTER– ÖRNEK OLAY  Tekrarlama Tablosu – Analizin tekrarlanma sayısını verir ancak belirlediğimiz sayıda tekrar olması şart değildir. Optimum sayıya erişildiğinde analiz tamamlanır.
  • 14.
    K MEANS CLUSTER– ÖRNEK OLAY  Küme Üyeliği Tablosu – Hangi gözlemin hangi kümenin üyesi olduğunun gösterildiği tablodur. Gözlemin küme merkezinden uzaklığı da gösterilmiştir. Buradan yola çıkarak ortak kümelere bir isim verilebilir.
  • 15.
    K MEANS CLUSTER– ÖRNEK OLAY  Final Küme Merkezleri – Değişkenlerin kümelere göre ortalamaları gösterilir.
  • 16.
    K MEANS CLUSTER– ÖRNEK OLAY  Final Küme Merkezleri Arasındaki Mesafeler– Küme merkezlerinin birbirlerine olan uzaklıklarını verir. Uzaklık değeri büyüdükçe benzerlikler azalmaktadır.
  • 17.
    K MEANS CLUSTER– ÖRNEK OLAY  ANOVA Sonuçları – Küme üyeliklerinin hesaplanmasını gösteren yardımcı bir tablodur.
  • 18.