SlideShare a Scribd company logo
1 of 32
Korelasyon Tabanlı Nitelik Seçimi F.Özgür ÇATAK İstanbul Üniversitesi Enformatik Doktora Programı
Konular Giriş Nitelik Seçim Algoritmaları Sezgisel Aramalar Filtreleme Algoritmaları Sarmal Algoritmalar Korelasyon Tabanlı Nitelik Seçimi Uygulama Örnekleri
Giriş Veri madenciliğinde Nitelikler Üzerinde ki Sorunlar
Giriş
Örnek Veriseti
Örnek Veriseti Nitelik Alt Küme Uzayı
Nitelik Seçim Algoritmalarının Özellikleri
Nitelik Seçim Algoritmalarının Özellikleri
Nitelik Seçim Algoritmalarının Özellikleri
Nitelik Seçim Algoritmalarının Özellikleri
Nitelik Seçim Algoritmalarının Özellikleri
Sezgisel Arama Algoritmaları Kullanılan Yöntemler Algoritma nitelik kümesine sadece ekleme yapıyorsa ileri yönelimli seçim(forwardselection) Algoritma nitelik kümesine sadece çıkarma yapıyorsa geri yönelimli seçim(backwardselection) Hem ekleme hem de çıkarma işlemi yapılıyorsa çift yönlü arama(stepwisebi-directionalsearch)
Sezgisel Arama Algoritmaları Hırslı Seçim Algoritması(GreedyHillClimbing) En iyi ilk algoritması(BestFirst) Genetik Algoritmalar(GeneticAlgorithms)
Sürekli Niteliklerin Ayrıklaştırılması Korelasyon tabanlı nitelik seçimi ayrık giriş değerlerine sahip nitelikler için uygulanabilir. Çeşitli Yöntemler mevcut Eğitimli-Eğitimsiz Genel-Yerel Statik-Dinamik Korelasyon Tabanlı Nitelik Seçiminde kullanılan yöntem “Minimum Entropi Sezgisi” dir.
Minimum Entropi Sezgisi Bir S kümesi için, A niteliği T kesim noktasında oluşan sınıf entopi değeri Kesim noktaları son bulma kriteri ise
Korelasyon Tabanlı Nitelik Seçimi
Değerleri Sürekli Değişkenlerin Korelasyonu
NOMİNAL DEĞERLERE SAHİP ÖZELLİKLERİN KORELASYONU
Simetrik Belirsizlik Entropi kullanılarak yapılmaktadır X niteliğinin gözlemine göre Y niteliğinin entropi değeri hesaplanmaktadır.
Simetrik Belirsizlik
RELIEF Relief algoritması veri setinde yer alan niteliklerin ağırlıklandırmasında kullanılmaktadır. En yakın k komşuluğu kullanılmaktadır. Iterasyona dayalı bir algoritmadır
RELIEF Denklem Wx = X niteliğinin ağırlığı Diff(X,R,H) (HIT): Veri seti kümesinde ki X örneklemine en yakın aynı sınıfta yer alan niteliklerin m ortalama uzaklığı Diff(X,R,M) (MISS): Veri seti kümesinde ki X örneklemine en yakın farklı sınıfta yer alan niteliklerin m ortalama uzaklığı m rassal olarak seçilen örneklerin sayısı
RELIEF set all W[A] = 0.0 for i=1 to m do begin randomlyselectinstanceRi findnearest hit H andnearestmiss M for A=1 toallattribute do W(A) = W(A) – diff(A,Ri,H) + diff(A,Ri,M) end
MDL(En Küçük Tanımlama Uzaklığı) Enformasyon Teorisinde Veri Sıkıştırma kullanılan kuraldır. Nitelik seçiminde nominal değişkenlerin korelasyonu için kullanılmaktadır
MDL(En düşük Tanımlama Uzaklığı) n eğitim verisinin sayısı, C sınıf değerlerinin sayısı, ni, Ci’ye ait olan eğitim setinin sayısı, nj j. Elemanın sahip olduğu değerin eğitim seti sayısı, nij ise Ci sınıf değerine ait olan eğitim setinin sayısı
Korelasyon Tabanlı Nitelik Seçimi Ana hedef, hedef nitelik ile yüksek korelasyonlu birbirleri ile düşük korelasyonlu niteliklerin seçilmesi Veri seti “MERİT” değeri Burada , k farklı nitelik içeren S nitelik alt kümesinin merit değeri,  ortalama sınıf-nitelik korelasyonu,  ortalama nitelik-nitelik korelasyonu
Korelasyon Tabanlı Nitelik Seçimi
Oyun Veri Seti
Örnek Uygulama UCI MachineLearningDatabase California Üniversitesi’nin Enformatik ve Bilgisayar Bilimleri bölümü tarafından yayınlanmakta Kullanılan veri setleri
Örnek Uygulama – Weka Modeli
Örnek Uygulama
Sonuç Her veri seti için kullanılabilecek tek bir nitelik seçim algoritması yoktur. Genellikle, KNS sınıflandırma algoritmasının performansını artırmaktadır.(zaman ve sonuç) Fakat birbiri ile yüksek ilişki bulunan niteliklerde hatalı sonuçlar üretebilir.

More Related Content

Viewers also liked

Dağıtık Servis Dışı Bırakma Saldırıları
Dağıtık Servis Dışı Bırakma SaldırılarıDağıtık Servis Dışı Bırakma Saldırıları
Dağıtık Servis Dışı Bırakma SaldırılarıFerhat Ozgur Catak
 
Sızma Testi ve Güvenlik Denetlemeleri - Giriş
Sızma Testi ve Güvenlik Denetlemeleri - GirişSızma Testi ve Güvenlik Denetlemeleri - Giriş
Sızma Testi ve Güvenlik Denetlemeleri - GirişFerhat Ozgur Catak
 
Sızma Testi ve Güvenlik Denetlemeleri - Temel Linux Bilgisi
Sızma Testi ve Güvenlik Denetlemeleri - Temel Linux BilgisiSızma Testi ve Güvenlik Denetlemeleri - Temel Linux Bilgisi
Sızma Testi ve Güvenlik Denetlemeleri - Temel Linux BilgisiFerhat Ozgur Catak
 
Temel Linux Kullanımı ve Komutları
Temel Linux Kullanımı ve KomutlarıTemel Linux Kullanımı ve Komutları
Temel Linux Kullanımı ve KomutlarıAhmet Gürel
 
Fuzzy Analytic Hierarchy Based DBMS Selection In Turkish National Identity Ca...
Fuzzy Analytic Hierarchy Based DBMS Selection In Turkish National Identity Ca...Fuzzy Analytic Hierarchy Based DBMS Selection In Turkish National Identity Ca...
Fuzzy Analytic Hierarchy Based DBMS Selection In Turkish National Identity Ca...Ferhat Ozgur Catak
 
Berezha Security
Berezha SecurityBerezha Security
Berezha SecurityVlad Styran
 
Dağıtık Sistemler İçin Mahremiyet Korumalı Uç Öğrenme Makinesi Sınıflandırma ...
Dağıtık Sistemler İçin Mahremiyet Korumalı Uç Öğrenme Makinesi Sınıflandırma ...Dağıtık Sistemler İçin Mahremiyet Korumalı Uç Öğrenme Makinesi Sınıflandırma ...
Dağıtık Sistemler İçin Mahremiyet Korumalı Uç Öğrenme Makinesi Sınıflandırma ...Ferhat Ozgur Catak
 
Embracing Distributed Version Control
Embracing Distributed Version ControlEmbracing Distributed Version Control
Embracing Distributed Version ControlNowell Strite
 
Network ve Sistem 101 etkinliği
Network ve Sistem 101 etkinliği Network ve Sistem 101 etkinliği
Network ve Sistem 101 etkinliği Ahmet Han
 
Ethical Hacking & Penetration Testing
Ethical Hacking & Penetration TestingEthical Hacking & Penetration Testing
Ethical Hacking & Penetration Testingecmee
 
IP Security
IP SecurityIP Security
IP SecurityS H
 
Network101 murat arslan
Network101 murat arslanNetwork101 murat arslan
Network101 murat arslanMURAT ARSLAN
 

Viewers also liked (19)

Ddos Sızma Testleri - 2
Ddos Sızma Testleri - 2Ddos Sızma Testleri - 2
Ddos Sızma Testleri - 2
 
Dağıtık Servis Dışı Bırakma Saldırıları
Dağıtık Servis Dışı Bırakma SaldırılarıDağıtık Servis Dışı Bırakma Saldırıları
Dağıtık Servis Dışı Bırakma Saldırıları
 
Sızma Testi ve Güvenlik Denetlemeleri - Giriş
Sızma Testi ve Güvenlik Denetlemeleri - GirişSızma Testi ve Güvenlik Denetlemeleri - Giriş
Sızma Testi ve Güvenlik Denetlemeleri - Giriş
 
Pivoting ve Tunneling
Pivoting ve TunnelingPivoting ve Tunneling
Pivoting ve Tunneling
 
Sızma Testi ve Güvenlik Denetlemeleri - Temel Linux Bilgisi
Sızma Testi ve Güvenlik Denetlemeleri - Temel Linux BilgisiSızma Testi ve Güvenlik Denetlemeleri - Temel Linux Bilgisi
Sızma Testi ve Güvenlik Denetlemeleri - Temel Linux Bilgisi
 
Temel Linux Kullanımı ve Komutları
Temel Linux Kullanımı ve KomutlarıTemel Linux Kullanımı ve Komutları
Temel Linux Kullanımı ve Komutları
 
PAROLA KIRMA SALDIRILARI
PAROLA KIRMA SALDIRILARIPAROLA KIRMA SALDIRILARI
PAROLA KIRMA SALDIRILARI
 
Fuzzy Analytic Hierarchy Based DBMS Selection In Turkish National Identity Ca...
Fuzzy Analytic Hierarchy Based DBMS Selection In Turkish National Identity Ca...Fuzzy Analytic Hierarchy Based DBMS Selection In Turkish National Identity Ca...
Fuzzy Analytic Hierarchy Based DBMS Selection In Turkish National Identity Ca...
 
MapReduce based SVM
MapReduce based SVMMapReduce based SVM
MapReduce based SVM
 
Berezha Security
Berezha SecurityBerezha Security
Berezha Security
 
Windows hacking 1
Windows hacking 1Windows hacking 1
Windows hacking 1
 
Tablo oluşturma
Tablo oluşturmaTablo oluşturma
Tablo oluşturma
 
Dağıtık Sistemler İçin Mahremiyet Korumalı Uç Öğrenme Makinesi Sınıflandırma ...
Dağıtık Sistemler İçin Mahremiyet Korumalı Uç Öğrenme Makinesi Sınıflandırma ...Dağıtık Sistemler İçin Mahremiyet Korumalı Uç Öğrenme Makinesi Sınıflandırma ...
Dağıtık Sistemler İçin Mahremiyet Korumalı Uç Öğrenme Makinesi Sınıflandırma ...
 
Embracing Distributed Version Control
Embracing Distributed Version ControlEmbracing Distributed Version Control
Embracing Distributed Version Control
 
Network ve Sistem 101 etkinliği
Network ve Sistem 101 etkinliği Network ve Sistem 101 etkinliği
Network ve Sistem 101 etkinliği
 
Hesaplamalarım
HesaplamalarımHesaplamalarım
Hesaplamalarım
 
Ethical Hacking & Penetration Testing
Ethical Hacking & Penetration TestingEthical Hacking & Penetration Testing
Ethical Hacking & Penetration Testing
 
IP Security
IP SecurityIP Security
IP Security
 
Network101 murat arslan
Network101 murat arslanNetwork101 murat arslan
Network101 murat arslan
 

Korelasyon tabanlı nitelik seçimi