SlideShare a Scribd company logo
K-Means & K-Medoids
Kümeleme Algoritmaları



                     Hazırlayan:
                Sinem Altan
                Fatih Dartıcı
K-Means Algoritması Nedir?

 En    eski kümeleme algoritmalarından olan
    K-Means, 1967 yılında J.B. MacQueen
    tarafından geliştirilmiştir.
    K-Means’in atama mekanizması, her
    verinin sadece bir kümeye ait
    olabilmesine izin verir.
 Merkez     noktanın kümeyi temsil etmesi
    ana fikrine dayalı bir metottur.
K-Means Algoritması Nedir? -2-

 Verileribelirlenen küme sayısına göre, her küme için
  belirlenen ortalama değer doğrultusunda
  kümelenmesi üzerine çalışır. K-Means algoritması
  eldeki verileri k adet kümede ve kümelerin
  ortalamalarına göre kümelere ayırır. K küme sayısı
  kullanıcı tarafından verilir.
 Kısaca n tane nesneyi –küme içi benzerlik
  maksimum, kümeler arası benzerlik minimum
  olacak şekilde- k tane kümeye böler.
K-Means algoritması Nasıl Çalışır?

 K-Means algoritmasının çalışma mekanizmasına göre öncelikle her
 kümenin merkez noktasını (centroid) veya ortalamasını temsil etmek
 üzere k adet nesne -rasgele- seçilir.
 Kalandiğer nesneler, kümelerin ortalama değerlerine olan uzaklıkları
 dikkate alınarak en benzer oldukları kümelere dahil edilir.
 Daha sonra, her bir kümenin ortalama değeri hesaplanarak yeni
 küme merkezleri belirlenir ve tekrar nesne-merkez uzaklıkları
 incelenir. Herhangi bir değişim olmayıncaya kadar algoritma
 ötelenmeye devam eder.
 Enyaygın olarak kullanılan uzaklık hesaplama formülü Öklit uzaklık
 formülüdür.
K-Means algoritması Nasıl Çalışır?
-2-
Merkez Noktaların Belirlenmesi

Başlangıç küme merkezlerinin seçimi k-means’in sonucunu önemli
oranda etkiler. Başlangıç noktalarının belirlenmesinde çeşitli teknikler
vardır. Bu tekniklerden bazıları:
1)   k sayısı kadar rastgele veri seçilip küme merkezleri olarak atanır.
2)    Veriler rastgele k tane kümeye atanır ve küme ortalamaları alınarak
     başlangıç küme merkezleri belirlenir.
3)   En uç değerlere sahip veriler küme merkezleri olarak seçilir.
4)   Veri setinin merkezine en yakın noktalar başlangıç noktaları olarak
     seçilir.
K-Means Kümeleme Adımları
K-Means Kümeleme Örneği -1
K-Means Kümeleme Örneği -2
K-Means Kümeleme Örneği -3
K-Means Kümeleme Örneği -4
K-Means Kümeleme Örneği -5
Açıklama:
K- Means Algoritmasına göre kümeleme yapılırken,
 İlk   olarak karışık halde verilmiş olan veri seti sıralanır.   (K-Means Kümeleme Örneği
  -2)
 Sıralama işleminden sonra, her verinin başlangıçta rastgele belirlenmiş olan
  merkez noktalarına göre uzaklığı alınır. Veriler en yakın olduğu merkez
  noktasının kümesine dahil olur .(K-Means Kümeleme Örneği -3)
 Bu  adımdan sonra her küme için küme elemanlarının ortalaması alınır. Bu
  ortalama yeni merkez noktasıdır.(K-Means Kümeleme Örneği -4’de merkez noktalarının
  değerleri değişiyor.)
 Sonraki  adımda, tekrar her verinin merkez noktalarına olan uzaklığı hesaplanır ve
  veriler en yakın olduğu merkez noktasının kümesine dahil edilir. Küme
  elemanlarının ortalaması alınıp yeni merkez noktaları belirlenir.
 Kümeleme       işleminin sonucu, bir sonraki adımda aynı çıkına kadar bu işlem
  tekrarlanır.
K-means Algoritmasının Avantajları
ve Dezavantajları
Avantajı:
 Uygulanabilirliğikolaydır ve büyük veri kümelerinde hızlı çalışabilir.
 Veri sayısı çok fazla olan hesaplamalarda, K-Means, küme sayısı
 küçük ise hesaplamaları, hiyerarşik kümelemeden daha hızlı yapar.
Dezavantajı:
 K-Means algoritması k küme sayısını tespit edememektedir. Bu
 nedenle uygun k sayısını bulana kadar bir deneme yanılma süreci
 gerçekleşmektedir.
 Gürültülü   verilere duyarlıdır. Bu veriler de kümelere dahil edilir.
K-Medoids Algoritması Nedir?

 K-Medoids algoritmasının temeli, verinin çeşitli yapısal özelliklerini temsil
 eden k tane temsilci nesneyi bulma esasına dayanır.
 Bir
    grup nesneyi k tane kümeye bölerken esas amaç, birbirine çok
 benzeyen nesnelerin bir arada olduğu ve farklı kümelerdeki nesnelerin
 mümkün olduğunca birbirinden benzersiz olduğu kümeleri bulmaktır.
 En
   yaygın kullanılan K-Medoids algoritması, 1987 yılında Kaufman and
 Rousseeuw tarafından geliştirilmiştir.
 Amacın k tane nesneyi bulmak olmasından dolayı, K-Medoids metodu
 olarak adlandırılmaktadır.
Temsilci Nesne Nedir?

 Temsilcinesne diğer nesnelere olan ortalama
 uzaklığı minimum yapan kümenin en merkezi
 nesnesidir. Bu nedenle, bu bölünme metodu her
 bir nesne ve onun referans noktası arasındaki
 benzersizliklerin(uzaklıkların) toplamını
 küçültme mantığı esas alınarak uygulanır.
 Kümeleme literatüründe temsilci nesnelere
 çoğunlukla merkeztipler (centrotypes)
 denilmektedir.
K-Medoids Algoritması Nasıl
Çalışır?
k adet temsilci nesne tespit edildikten sonra
 her bir nesne en yakın olduğu temsilciye
 atanarak k tane küme oluşturulur. Sonraki
 adımlarda her bir temsilci nesne temsilci
 olmayan nesne ile değiştirilerek kümelemenin
 kalitesi yükseltilinceye kadar ötelenir. Bu kalite
 nesne ile ait olduğu kümenin temsilci nesnesi
 arasındaki ortalama benzersizliğe göre
 değişir.
K-Medoids Kümeleme Adımları

   K-Medoids algoritmasında birinci aşama yapılandırma aşamasıdır. Bu
aşama kümelemenin başlangıç aşamasıdır, k adet temsilci nesne
seçilene kadar devam eder. Başlangıç merkezleri rastgele atanabileceği
gibi çeşitli işlemler sonucu da belirlenebilir. Algoritmanın ikinci aşaması
değiştirme ( Swap ) aşamasıdır. Bu aşama temsilci nesneleri geliştirerek
kümeleme işleminin verimini arttırmak için uygulanır. Her bir nesne
merkez nokta çifti için hesaplama yapılır. Değişim ihtimallerinin
kümelemeye nasıl bir etkisi olduğu incelenerek her bir kombinasyon için
kümeleme kalitesi hesaplanır.
K-Means kümeleme örneğini
hatırlayalım..
K-Medoids Kümeleme Örneği
Açıklama:
K- Medoids Algoritmasına göre kümeleme yapılırken,
 İlk   olarak karışık halde verilmiş olan veri seti sıralanır.
 Sıralama  işleminden sonra, her verinin başlangıçta rastgele
  belirlenmiş olan merkez noktalarına göre uzaklığı alınır. Veriler en
  yakın olduğu merkez noktasının kümesine dahil olur.
 Bu adımdan sonra her küme için küme elemanlarının ortalaması alınır. K-
  Medoids algoritmasında küme elemanı olmayan bir değer merkez
  noktası olamaz. Bu nedenle küme ortalamasına en yakın olan nokta
  yeni merkez noktası olur.
 Sonraki   adımda, tekrar her verinin merkez noktalarına olan uzaklığı
  hesaplanır ve veriler en yakın olduğu merkez noktasının kümesine dahil
  edilir. Küme elemanlarının ortalaması alınıp, ortalamaya en yakın noktalar
  yeni merkez noktaları olarak belirlenir.
 Kümeleme    işleminin sonucu, bir sonraki adımda aynı çıkına kadar bu
  işlem tekrarlanır.
Not**

   Görüldüğü gibi K-Medoids kümeleme
algoritmasını K-Means kümeleme
algoritmasından ayıran özellik, merkez
noktalarının belirlenme şeklidir. Küme
elemanı olmayan bir değerin merkez
noktası kabul edilmemesi ise gürültülü
verilerin kümelere dahil edilmesine rağmen,
küme üzerindeki etkilerini ortadan kaldırır.
K-Medoids Algoritmasının
Avantajları ve Dezavantajları
Avantajı:
   Bölünmeli metotlar içinde K-Medoids daha iyi ve kararlı kümeleme sonuçları
    üreten bir algoritmadır. Verilerin işleniş sırası ve ilk atamadaki merkez
    noktaların kümeleme üzerinde etkisi yoktur.(Çünkü ilerideki adımlarda kümenin
    elemanı olmayan hiçbir nokta merkez noktası olamaz.)
   Ayrıca en merkezi elemanların kümeyi temsil etmesi özelliği örnekte görüldüğü
    gibi gürültülü verilerin kümeleme üzerindeki etkisini ortadan kaldırır.
• 2, 4, 6, 8, 10 ortalama: 6
• 2, 4, 6, 8 , 10, 1002 ortalama: 172
• 2, 4, 6, 8 ,10, 1002 orta nokta: 6
Dezavantajı:
   K-medoids, k-means’de olduğu gibi küme sayısının başlangıçta tanımlanmasını
    gerektiren bir metottur. Veriye uygun k sayısının belirlenmesi için birden fazla
    denemenin yapılması gerekir.
K-Medoids Algoriymasının K-Means Algoritması ile
Karşılaştırılması


K-Medoids                                K-Means

   K-Medoids algoritmasında her
    küme, kümede bulunan bir                K-means her küme kendi
    nesneyle temsil edilir.
                                             merkeziyle temsil edilir.
   K-Medoids algoritması gürültülü
    verilerden etkilenmez.                  K-Means algoritması
   Medoid (Merkez nokta) küme               gürültülü verilerden
    içerisinde en merkezi veridir.           etkilenir.
   Küçük verilerde daha güvenilirdir.
                                            K-Means algoritması
   K-Medoids’in K-means’e
    üstünlüğü benzemezlik değerini
                                             büyük verilerde de
    en aza indirmesidir.                     güvenilirdir.
Kaynaklar:
   http://
    www.belgeler.com/blg/of1/blnmeli-kmeleme-yntemleri-ile-veri-madenci
    lii-uygulamalari-data-mining-applications-using-partitional-cluster
    ing-methods
   http://www.iticu.edu.tr/uploads/Kutuphane/dergi/f11/M00176.pdf
   http://web.itu.edu.tr/kiris/08%20Firat%202012.pdf

More Related Content

What's hot

Perceptron & Neural Networks
Perceptron & Neural NetworksPerceptron & Neural Networks
Perceptron & Neural Networks
NAGUR SHAREEF SHAIK
 
KNN
KNN KNN
Machine Learning 3 - Decision Tree Learning
Machine Learning 3 - Decision Tree LearningMachine Learning 3 - Decision Tree Learning
Machine Learning 3 - Decision Tree Learningbutest
 
Machine Learning - Ensemble Methods
Machine Learning - Ensemble MethodsMachine Learning - Ensemble Methods
Machine Learning - Ensemble Methods
Andrew Ferlitsch
 
Random forest algorithm
Random forest algorithmRandom forest algorithm
Random forest algorithm
Rashid Ansari
 
K-means clustering algorithm
K-means clustering algorithmK-means clustering algorithm
K-means clustering algorithm
Vinit Dantkale
 
Random graph models
Random graph modelsRandom graph models
Random graph models
networksuw
 
A Simple Introduction to Neural Information Retrieval
A Simple Introduction to Neural Information RetrievalA Simple Introduction to Neural Information Retrieval
A Simple Introduction to Neural Information Retrieval
Bhaskar Mitra
 
Genetic Algorithms
Genetic AlgorithmsGenetic Algorithms
Genetic Algorithms
Shruti Railkar
 
Hierarchical clustering.pptx
Hierarchical clustering.pptxHierarchical clustering.pptx
Hierarchical clustering.pptx
NTUConcepts1
 
Maximum Likelihood Estimation
Maximum Likelihood EstimationMaximum Likelihood Estimation
Maximum Likelihood Estimationguestfee8698
 
Naïve Bayes Classifier Algorithm.pptx
Naïve Bayes Classifier Algorithm.pptxNaïve Bayes Classifier Algorithm.pptx
Naïve Bayes Classifier Algorithm.pptx
Shubham Jaybhaye
 
Multi-armed Bandits
Multi-armed BanditsMulti-armed Bandits
Multi-armed Bandits
Dongmin Lee
 
KNN Algorithm - How KNN Algorithm Works With Example | Data Science For Begin...
KNN Algorithm - How KNN Algorithm Works With Example | Data Science For Begin...KNN Algorithm - How KNN Algorithm Works With Example | Data Science For Begin...
KNN Algorithm - How KNN Algorithm Works With Example | Data Science For Begin...
Simplilearn
 
BAS 250 Lecture 8
BAS 250 Lecture 8BAS 250 Lecture 8
BAS 250 Lecture 8
Wake Tech BAS
 
K Means Clustering Algorithm | K Means Example in Python | Machine Learning A...
K Means Clustering Algorithm | K Means Example in Python | Machine Learning A...K Means Clustering Algorithm | K Means Example in Python | Machine Learning A...
K Means Clustering Algorithm | K Means Example in Python | Machine Learning A...
Edureka!
 
. An introduction to machine learning and probabilistic ...
. An introduction to machine learning and probabilistic .... An introduction to machine learning and probabilistic ...
. An introduction to machine learning and probabilistic ...butest
 
Cross-validation Tutorial: What, how and which?
Cross-validation Tutorial: What, how and which?Cross-validation Tutorial: What, how and which?
Cross-validation Tutorial: What, how and which?
Pradeep Redddy Raamana
 
GMM
GMMGMM
Density based clustering
Density based clusteringDensity based clustering
Density based clustering
YaswanthHariKumarVud
 

What's hot (20)

Perceptron & Neural Networks
Perceptron & Neural NetworksPerceptron & Neural Networks
Perceptron & Neural Networks
 
KNN
KNN KNN
KNN
 
Machine Learning 3 - Decision Tree Learning
Machine Learning 3 - Decision Tree LearningMachine Learning 3 - Decision Tree Learning
Machine Learning 3 - Decision Tree Learning
 
Machine Learning - Ensemble Methods
Machine Learning - Ensemble MethodsMachine Learning - Ensemble Methods
Machine Learning - Ensemble Methods
 
Random forest algorithm
Random forest algorithmRandom forest algorithm
Random forest algorithm
 
K-means clustering algorithm
K-means clustering algorithmK-means clustering algorithm
K-means clustering algorithm
 
Random graph models
Random graph modelsRandom graph models
Random graph models
 
A Simple Introduction to Neural Information Retrieval
A Simple Introduction to Neural Information RetrievalA Simple Introduction to Neural Information Retrieval
A Simple Introduction to Neural Information Retrieval
 
Genetic Algorithms
Genetic AlgorithmsGenetic Algorithms
Genetic Algorithms
 
Hierarchical clustering.pptx
Hierarchical clustering.pptxHierarchical clustering.pptx
Hierarchical clustering.pptx
 
Maximum Likelihood Estimation
Maximum Likelihood EstimationMaximum Likelihood Estimation
Maximum Likelihood Estimation
 
Naïve Bayes Classifier Algorithm.pptx
Naïve Bayes Classifier Algorithm.pptxNaïve Bayes Classifier Algorithm.pptx
Naïve Bayes Classifier Algorithm.pptx
 
Multi-armed Bandits
Multi-armed BanditsMulti-armed Bandits
Multi-armed Bandits
 
KNN Algorithm - How KNN Algorithm Works With Example | Data Science For Begin...
KNN Algorithm - How KNN Algorithm Works With Example | Data Science For Begin...KNN Algorithm - How KNN Algorithm Works With Example | Data Science For Begin...
KNN Algorithm - How KNN Algorithm Works With Example | Data Science For Begin...
 
BAS 250 Lecture 8
BAS 250 Lecture 8BAS 250 Lecture 8
BAS 250 Lecture 8
 
K Means Clustering Algorithm | K Means Example in Python | Machine Learning A...
K Means Clustering Algorithm | K Means Example in Python | Machine Learning A...K Means Clustering Algorithm | K Means Example in Python | Machine Learning A...
K Means Clustering Algorithm | K Means Example in Python | Machine Learning A...
 
. An introduction to machine learning and probabilistic ...
. An introduction to machine learning and probabilistic .... An introduction to machine learning and probabilistic ...
. An introduction to machine learning and probabilistic ...
 
Cross-validation Tutorial: What, how and which?
Cross-validation Tutorial: What, how and which?Cross-validation Tutorial: What, how and which?
Cross-validation Tutorial: What, how and which?
 
GMM
GMMGMM
GMM
 
Density based clustering
Density based clusteringDensity based clustering
Density based clustering
 

Viewers also liked

Veri Madenciliği (Data Mining)
Veri Madenciliği (Data Mining)Veri Madenciliği (Data Mining)
Veri Madenciliği (Data Mining)
Murat Azimli
 
İşlemciler
İşlemciler İşlemciler
İşlemciler
Sinem Altan
 
Naive Bayes Sınıflandırma Uygulaması
Naive Bayes Sınıflandırma UygulamasıNaive Bayes Sınıflandırma Uygulaması
Naive Bayes Sınıflandırma Uygulaması
Harun Çetin
 
K means cluster
K means clusterK means cluster
K means cluster
B. Pınar BAYRAK, Ph.D.c
 
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...
Metin Uslu
 
K-MEDOIDS CLUSTERING USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...
K-MEDOIDS CLUSTERING  USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...K-MEDOIDS CLUSTERING  USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...
K-MEDOIDS CLUSTERING USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...
ijscmc
 
K means Clustering
K means ClusteringK means Clustering
K means ClusteringEdureka!
 
K-means Clustering with Scikit-Learn
K-means Clustering with Scikit-LearnK-means Clustering with Scikit-Learn
K-means Clustering with Scikit-Learn
Sarah Guido
 
Clustering
ClusteringClustering
Clustering
M Rizwan Aqeel
 
K mean-clustering algorithm
K mean-clustering algorithmK mean-clustering algorithm
K mean-clustering algorithm
parry prabhu
 
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİ
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİGINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİ
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİArma?an ?ahin
 
Apriori Algorithm
Apriori AlgorithmApriori Algorithm
Metin Madenciliği ile Cümleleri Kategorilendirme
Metin Madenciliği ile Cümleleri KategorilendirmeMetin Madenciliği ile Cümleleri Kategorilendirme
Metin Madenciliği ile Cümleleri Kategorilendirme
Oğuzcan Pamuk
 

Viewers also liked (17)

Veri Madenciliği (Data Mining)
Veri Madenciliği (Data Mining)Veri Madenciliği (Data Mining)
Veri Madenciliği (Data Mining)
 
İşlemciler
İşlemciler İşlemciler
İşlemciler
 
Naive Bayes Sınıflandırma Uygulaması
Naive Bayes Sınıflandırma UygulamasıNaive Bayes Sınıflandırma Uygulaması
Naive Bayes Sınıflandırma Uygulaması
 
K means cluster
K means clusterK means cluster
K means cluster
 
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...
 
K-MEDOIDS CLUSTERING USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...
K-MEDOIDS CLUSTERING  USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...K-MEDOIDS CLUSTERING  USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...
K-MEDOIDS CLUSTERING USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...
 
Apriori algoritması
Apriori algoritmasıApriori algoritması
Apriori algoritması
 
Yapay Sinir Ağları
Yapay Sinir AğlarıYapay Sinir Ağları
Yapay Sinir Ağları
 
Apriori algoritması
Apriori algoritmasıApriori algoritması
Apriori algoritması
 
K means Clustering
K means ClusteringK means Clustering
K means Clustering
 
K-means Clustering with Scikit-Learn
K-means Clustering with Scikit-LearnK-means Clustering with Scikit-Learn
K-means Clustering with Scikit-Learn
 
Clustering
ClusteringClustering
Clustering
 
K mean-clustering algorithm
K mean-clustering algorithmK mean-clustering algorithm
K mean-clustering algorithm
 
Simulation/Simülasyon
Simulation/SimülasyonSimulation/Simülasyon
Simulation/Simülasyon
 
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİ
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİGINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİ
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİ
 
Apriori Algorithm
Apriori AlgorithmApriori Algorithm
Apriori Algorithm
 
Metin Madenciliği ile Cümleleri Kategorilendirme
Metin Madenciliği ile Cümleleri KategorilendirmeMetin Madenciliği ile Cümleleri Kategorilendirme
Metin Madenciliği ile Cümleleri Kategorilendirme
 

K-Means & K-Medoids Algoritması

  • 1. K-Means & K-Medoids Kümeleme Algoritmaları Hazırlayan: Sinem Altan Fatih Dartıcı
  • 2. K-Means Algoritması Nedir?  En eski kümeleme algoritmalarından olan K-Means, 1967 yılında J.B. MacQueen tarafından geliştirilmiştir.  K-Means’in atama mekanizması, her verinin sadece bir kümeye ait olabilmesine izin verir.  Merkez noktanın kümeyi temsil etmesi ana fikrine dayalı bir metottur.
  • 3. K-Means Algoritması Nedir? -2-  Verileribelirlenen küme sayısına göre, her küme için belirlenen ortalama değer doğrultusunda kümelenmesi üzerine çalışır. K-Means algoritması eldeki verileri k adet kümede ve kümelerin ortalamalarına göre kümelere ayırır. K küme sayısı kullanıcı tarafından verilir.  Kısaca n tane nesneyi –küme içi benzerlik maksimum, kümeler arası benzerlik minimum olacak şekilde- k tane kümeye böler.
  • 4. K-Means algoritması Nasıl Çalışır?  K-Means algoritmasının çalışma mekanizmasına göre öncelikle her kümenin merkez noktasını (centroid) veya ortalamasını temsil etmek üzere k adet nesne -rasgele- seçilir.  Kalandiğer nesneler, kümelerin ortalama değerlerine olan uzaklıkları dikkate alınarak en benzer oldukları kümelere dahil edilir.  Daha sonra, her bir kümenin ortalama değeri hesaplanarak yeni küme merkezleri belirlenir ve tekrar nesne-merkez uzaklıkları incelenir. Herhangi bir değişim olmayıncaya kadar algoritma ötelenmeye devam eder.  Enyaygın olarak kullanılan uzaklık hesaplama formülü Öklit uzaklık formülüdür.
  • 5. K-Means algoritması Nasıl Çalışır? -2-
  • 6. Merkez Noktaların Belirlenmesi Başlangıç küme merkezlerinin seçimi k-means’in sonucunu önemli oranda etkiler. Başlangıç noktalarının belirlenmesinde çeşitli teknikler vardır. Bu tekniklerden bazıları: 1) k sayısı kadar rastgele veri seçilip küme merkezleri olarak atanır. 2) Veriler rastgele k tane kümeye atanır ve küme ortalamaları alınarak başlangıç küme merkezleri belirlenir. 3) En uç değerlere sahip veriler küme merkezleri olarak seçilir. 4) Veri setinin merkezine en yakın noktalar başlangıç noktaları olarak seçilir.
  • 13. Açıklama: K- Means Algoritmasına göre kümeleme yapılırken,  İlk olarak karışık halde verilmiş olan veri seti sıralanır. (K-Means Kümeleme Örneği -2)  Sıralama işleminden sonra, her verinin başlangıçta rastgele belirlenmiş olan merkez noktalarına göre uzaklığı alınır. Veriler en yakın olduğu merkez noktasının kümesine dahil olur .(K-Means Kümeleme Örneği -3)  Bu adımdan sonra her küme için küme elemanlarının ortalaması alınır. Bu ortalama yeni merkez noktasıdır.(K-Means Kümeleme Örneği -4’de merkez noktalarının değerleri değişiyor.)  Sonraki adımda, tekrar her verinin merkez noktalarına olan uzaklığı hesaplanır ve veriler en yakın olduğu merkez noktasının kümesine dahil edilir. Küme elemanlarının ortalaması alınıp yeni merkez noktaları belirlenir.  Kümeleme işleminin sonucu, bir sonraki adımda aynı çıkına kadar bu işlem tekrarlanır.
  • 14. K-means Algoritmasının Avantajları ve Dezavantajları Avantajı:  Uygulanabilirliğikolaydır ve büyük veri kümelerinde hızlı çalışabilir. Veri sayısı çok fazla olan hesaplamalarda, K-Means, küme sayısı küçük ise hesaplamaları, hiyerarşik kümelemeden daha hızlı yapar. Dezavantajı:  K-Means algoritması k küme sayısını tespit edememektedir. Bu nedenle uygun k sayısını bulana kadar bir deneme yanılma süreci gerçekleşmektedir.  Gürültülü verilere duyarlıdır. Bu veriler de kümelere dahil edilir.
  • 15. K-Medoids Algoritması Nedir?  K-Medoids algoritmasının temeli, verinin çeşitli yapısal özelliklerini temsil eden k tane temsilci nesneyi bulma esasına dayanır.  Bir grup nesneyi k tane kümeye bölerken esas amaç, birbirine çok benzeyen nesnelerin bir arada olduğu ve farklı kümelerdeki nesnelerin mümkün olduğunca birbirinden benzersiz olduğu kümeleri bulmaktır.  En yaygın kullanılan K-Medoids algoritması, 1987 yılında Kaufman and Rousseeuw tarafından geliştirilmiştir.  Amacın k tane nesneyi bulmak olmasından dolayı, K-Medoids metodu olarak adlandırılmaktadır.
  • 16. Temsilci Nesne Nedir?  Temsilcinesne diğer nesnelere olan ortalama uzaklığı minimum yapan kümenin en merkezi nesnesidir. Bu nedenle, bu bölünme metodu her bir nesne ve onun referans noktası arasındaki benzersizliklerin(uzaklıkların) toplamını küçültme mantığı esas alınarak uygulanır. Kümeleme literatüründe temsilci nesnelere çoğunlukla merkeztipler (centrotypes) denilmektedir.
  • 17. K-Medoids Algoritması Nasıl Çalışır? k adet temsilci nesne tespit edildikten sonra her bir nesne en yakın olduğu temsilciye atanarak k tane küme oluşturulur. Sonraki adımlarda her bir temsilci nesne temsilci olmayan nesne ile değiştirilerek kümelemenin kalitesi yükseltilinceye kadar ötelenir. Bu kalite nesne ile ait olduğu kümenin temsilci nesnesi arasındaki ortalama benzersizliğe göre değişir.
  • 18. K-Medoids Kümeleme Adımları K-Medoids algoritmasında birinci aşama yapılandırma aşamasıdır. Bu aşama kümelemenin başlangıç aşamasıdır, k adet temsilci nesne seçilene kadar devam eder. Başlangıç merkezleri rastgele atanabileceği gibi çeşitli işlemler sonucu da belirlenebilir. Algoritmanın ikinci aşaması değiştirme ( Swap ) aşamasıdır. Bu aşama temsilci nesneleri geliştirerek kümeleme işleminin verimini arttırmak için uygulanır. Her bir nesne merkez nokta çifti için hesaplama yapılır. Değişim ihtimallerinin kümelemeye nasıl bir etkisi olduğu incelenerek her bir kombinasyon için kümeleme kalitesi hesaplanır.
  • 21. Açıklama: K- Medoids Algoritmasına göre kümeleme yapılırken,  İlk olarak karışık halde verilmiş olan veri seti sıralanır.  Sıralama işleminden sonra, her verinin başlangıçta rastgele belirlenmiş olan merkez noktalarına göre uzaklığı alınır. Veriler en yakın olduğu merkez noktasının kümesine dahil olur.  Bu adımdan sonra her küme için küme elemanlarının ortalaması alınır. K- Medoids algoritmasında küme elemanı olmayan bir değer merkez noktası olamaz. Bu nedenle küme ortalamasına en yakın olan nokta yeni merkez noktası olur.  Sonraki adımda, tekrar her verinin merkez noktalarına olan uzaklığı hesaplanır ve veriler en yakın olduğu merkez noktasının kümesine dahil edilir. Küme elemanlarının ortalaması alınıp, ortalamaya en yakın noktalar yeni merkez noktaları olarak belirlenir.  Kümeleme işleminin sonucu, bir sonraki adımda aynı çıkına kadar bu işlem tekrarlanır.
  • 22. Not** Görüldüğü gibi K-Medoids kümeleme algoritmasını K-Means kümeleme algoritmasından ayıran özellik, merkez noktalarının belirlenme şeklidir. Küme elemanı olmayan bir değerin merkez noktası kabul edilmemesi ise gürültülü verilerin kümelere dahil edilmesine rağmen, küme üzerindeki etkilerini ortadan kaldırır.
  • 23. K-Medoids Algoritmasının Avantajları ve Dezavantajları Avantajı:  Bölünmeli metotlar içinde K-Medoids daha iyi ve kararlı kümeleme sonuçları üreten bir algoritmadır. Verilerin işleniş sırası ve ilk atamadaki merkez noktaların kümeleme üzerinde etkisi yoktur.(Çünkü ilerideki adımlarda kümenin elemanı olmayan hiçbir nokta merkez noktası olamaz.)  Ayrıca en merkezi elemanların kümeyi temsil etmesi özelliği örnekte görüldüğü gibi gürültülü verilerin kümeleme üzerindeki etkisini ortadan kaldırır. • 2, 4, 6, 8, 10 ortalama: 6 • 2, 4, 6, 8 , 10, 1002 ortalama: 172 • 2, 4, 6, 8 ,10, 1002 orta nokta: 6 Dezavantajı:  K-medoids, k-means’de olduğu gibi küme sayısının başlangıçta tanımlanmasını gerektiren bir metottur. Veriye uygun k sayısının belirlenmesi için birden fazla denemenin yapılması gerekir.
  • 24. K-Medoids Algoriymasının K-Means Algoritması ile Karşılaştırılması K-Medoids K-Means  K-Medoids algoritmasında her küme, kümede bulunan bir  K-means her küme kendi nesneyle temsil edilir. merkeziyle temsil edilir.  K-Medoids algoritması gürültülü verilerden etkilenmez.  K-Means algoritması  Medoid (Merkez nokta) küme gürültülü verilerden içerisinde en merkezi veridir. etkilenir.  Küçük verilerde daha güvenilirdir.  K-Means algoritması  K-Medoids’in K-means’e üstünlüğü benzemezlik değerini büyük verilerde de en aza indirmesidir. güvenilirdir.
  • 25. Kaynaklar:  http:// www.belgeler.com/blg/of1/blnmeli-kmeleme-yntemleri-ile-veri-madenci lii-uygulamalari-data-mining-applications-using-partitional-cluster ing-methods  http://www.iticu.edu.tr/uploads/Kutuphane/dergi/f11/M00176.pdf  http://web.itu.edu.tr/kiris/08%20Firat%202012.pdf