2. Özet
➔ Nedir?
➔ Kısa bir tarihi bilgi
➔ Amaçları
➔ Kullanılan teknikler
➔ Veri madenciliği uygulama adımlar
➔ Uygulama alanları
➔ Kaynak yönetimi ve sağlık ile ilgili uygulamalar
➔ Ülkemizdeki sağlık harcamaları
3. Nedir?
Büyük ölçekli veriler arasından veriye ulaşma, anlamlı veri ortaya çıkarma
işlemidir.
Diğer isimleri:
● Veri tabanında bilgi arama
● Veri çıkarımı
● Veri analizi
● Veri tarama
● Veri arkeolojisi
4. Kısa bir tarihi bilgi
● 1960
○ Veri koleksiyonu, veri tabanı oluşturma, IBM Information Management System, network DBMS
● 1970
○ İlişkisel veri modeli, ilişkisel DBMS implementasyonları
● 1980
○ RDBMS, ileri seviye veri modeller ve uygulamaya yönelik DBMS(spatial, scientific, engineering, etc.)
● 1990 - 2000
○ Veri madenciliği, veri depolama, multimedia veri tabanları ve web veri tabanları
● 2010
○ Büyük veri, graph veri tabanları(NoSQL, Örnekler: CouchDB, MongoDB)
5. Amaçları
● Tahmin: eldeki veriler ile gelecek hakkında tahminlerde bulunma
● Belirleme: olay, durum gibi elemanların varlıklarını belirleme
● Sınıflandırma: verileri kümelere ayırma
● Optimizasyon: sınırlı kaynakların kullanımını iyileştirme
6. Kullanılan teknikler
● Klasik teknikler:
○ İstatistik
○ Komşuluk
○ Kümeleme
● Yeni jenerasyon teknikler:
○ Ağaçlar
○ Ağlar
○ Kurallar
7. Veri madenciliği uygulama adımları
● Veri temizleme
○ gürültülü ve tutarsız verileri çıkarmak
● Veri bütünleştirme
○ birçok veri kaynağını birleştirebilmek
● Veri seçme
○ yapılacak olan analizle ilgili olan verileri belirlemek
● Veri dönüşümü
○ verinin veri madenciliği tekniğinden kullanılabilecek hale dönüşümünü gerçekleştirmek
● Veri madenciliği
○ veri örüntülerini yakalayabilmek için akıllı metotları uygulamak
● Örüntü değerlendirme
○ bazı ölçümlere göre elde edilmiş bilgiyi temsil eden ilginç örüntüleri tanımlamak
● Bilgi sunumu
○ madenciliği yapılmış olan elde edilmiş bilginin kullanıcıya sunumunu gerçekleştirmek
8. Uygulama alanları
● Finans: Kredi analizlerinde
● Sigorta: Sahtekarlık Analizi, Hasar tespiti
● Telekomünikasyon: Arama kayıtlarının analizi
● Müşteri tüketimleri: Promosyon analizlerinde
● Bilimsel araştırmalar: Resim, video, konuşma
● Kamu hizmetlerinde: Enerji kullanım analizlerinde
● Sağlık ve Biyoloji: DNA verilerinin analizi
● Taşımacılık: Lojistik yönetimi
9. Kaynak yönetimi ve sağlık ile ilgili uygulamalar
● Kaynak yönetimi ile ilgili uygulamalar bulunmakta.
○ İnsan kaynaklarının yönetimi vb.
○ Otobüs güzergah optimizasyonu yapılabilir.
● Şeker hastalığı için 30,383 hasta verisi incelenmiş. Sınıflandırma ağaç
yaklaşımı kullanılmış.
● Hasta yoğunluğu için destek simülasyon modellemeleri. Kısıtlı
kapasitelerin verimli kullanılması amaçlanmıştır. Kümeleme teknikleri
kullanılmıştır. (K-means gibi)
● Etkili hastane yönetimi uygulamaları
10. Ülkemizdeki sağlık harcamaları
● Yanlış ilaç kullanımı ve buna bağlı olarak hastanın tekrar hastaneye muayene için gelmesi
durumları sonucu oluşan maliyetler
● Bölgelere göre hastalık sebepleri
12. Referanslar
1. Data Mining: Wikipedia https://en.wikipedia.org/wiki/Data_mining
2. An Overview of Data Mining Techniques: Building Data Mining Applications for CRMby Alex Berson, Stephen Smith, and Kurt
Thearling http://www.thearling.com/index.htm
3. http://www.tuik.gov.tr