SlideShare a Scribd company logo
1 of 17
TIP ALANINDA DATA
MINING UYGULAMALARI


    ESRANUR ÖĞRETMEN
    080401040
Verilerin dijital ortamda saklanmaya başlanması ile
birlikte, yeryüzündeki bilgi miktarının her 20 ayda bir
iki katına çıktığı günümüzde, veri tabanlarının sayısı da
benzer, hatta daha yüksek bir oranda artmaktadır.
Akıllı veri işleme metodu olan veri madenciliği, dünya
üzerinde artan veri miktarının etkili bir biçimde
kullanılmasının neredeyse tek çözümü olarak
görünmektedir. Bu gelişme diğer alanlarda olduğu gibi
tıp alanında da ilgi odağı haline gelmiştir. Özellikle tıp
alanındaki verinin büyüklüğü ve hayati önem taşıması
bu alandaki uygulamaları daha da önemli kılmaktadır.
   Tıpta birçok alanda aşırı veri birikmesinin en yoğun
    yaşandığı alanlardan birisi de tıbbi verilerdir.
   Özellikle günümüzde artık neredeyse tüm tıbbi
    cihazların dijital hale gelmesi bu sonucu doğal hale
    getirmiştir.
   Kağıt üzerinde veri toplanan klasik hastane bilgi
    sistemlerinden farklı olarak buradaki verilerden
    yararlanmak her ne kadar çok daha kolay gibi görünse
    de, aslında diğer alanlardaki veriler gibi bunların da
    bireysel çalışmalarla işlenmesi ve yorumlanması
    imkansız hale gelmiştir.
Tıp alanında veri madenciliği uygulamalarına örnek
olarak;
   antipsikotik ilaçların kalp kası hastalıkları üzerine etkisi
   solunum fonksiyon testlerinin analizi
   genetik bozuklukların tespiti
   ilaç yan etkilerinin tanımlanması
    gibi çeşitli çalışmaları sayabiliriz.
   Veri madenciliği; belirli bir alanda ve belirli bir amaç için
toplanan   veriler   arasındaki   gizli   kalmış   ilişkilerin   ortaya
konulmasıdır.
   Bunun yanında, geleceğe dönük kararlar almamızda bize fikir
verir.
   Veri madenciliği, disiplinler arası doğasından dolayı istatistik,
veri tabanları, makine öğrenmesi, bilgi toplama, görselleştirme,
paralel ve dağıtık hesaplama gibi birçok disiplinden yardım alır.
Data Mining Aşamaları;


   Uygulama Alanın Ortaya Konulması

   Veri Ambarının Oluşturulması

   Modelin Kurulması ve Değerlendirilmesi

   Şablonların ve İlişkilerin Yorumlanması
Veri Madenciliğindeki Problemler;

  Veri madenciliği girdi olarak ham veriyi sağlamak
 üzere veri tabanlarına dayanır.
  Bu da veri tabanlarının dinamik, eksiksiz, geniş
 ve net veri içermemesi durumunda sorunlar
 doğurur. Diğer sorunlar da verinin konu ile
 uyumsuzluğundan doğabilir.
  Sınıflandırmak gerekirse başlıca sorunlar
 şunlardır :
   Sınırlı Bilgi : Veri tabanları genel olarak veri madenciliği dışındaki amaçlar için
    tasarlanmışlardır. Bu yüzden, öğrenme görevini kolaylaştıracak bazı özellikler
    bulunmayabilir.

   Gürültü ve Eksik Değerler : Veri özellikleri ya da sınıflarındaki hatalara gürültü
    adı verilir. Veri tabanlarındaki eksik bilgi ve bu yanlışlardan dolayı veri
    madenciliği amacına tam olarak ulaşmayabilir. Bu bilgi yanlışlığı, ölçüm
    hatalarından, ya da öznel yaklaşımdan olabilir.

   Belirsizlik : Yanlışlıkların şiddeti ve verideki gürültünün derecesi ile ilgilidir. Veri
    tahmini bir keşif sisteminde önemli bir husustur.

   Ebat, güncellemeler ve konu dışı sahalar : Veri tabanlarındaki bilgiler, veri
    eklendikçe ya da silindikçe değişebilir. Veri madenciliği perspektifinden
    bakıldığında, kuralların hala aynı kalıp kalmadığı ve istikrarlılığı problemi ortaya
    çıkar. Öğrenme sistemi, kimi verilerin zamanla değişmesine ve keşif sisteminin
    verinin zamansızlığına karşın zaman duyarlı olmalıdır.
Tıbbi Verinin Oluşturulması;
   Tıbbi veriler üzerinde çalışma yapmak bu verileri iyi tanımakla
    mümkündür.
   Tıp alanında belirli bir standardın olmayışı ve varolan standartlar
    arasında tam bir uyumun olmaması nedeniyle, bu alanında bir veri
    ambarının oluşturulması oldukça zor bir işlemdir.
    Bunun yanı sıra tıp alanındaki terimlerin hem karışık hem de
    birbirine yaklaşık olması da veri ambarı oluşumunu negatif yönde
    etkilemektedir.
   Tıp alanındaki veri genellikle farklı kaynaklarda toplanmaktadır.
    Örneğin hastanın laboratuar ile ilgili verileri ile hastanın teşhis
    bilgileri farklı kaynaklarda ve farklı şekillerde tutulmaktadır.
Tıpta Veri Madenciliği Uygulama Alanları;

   A.Kusiak ve arkadaşları tarafından akciğer deki tümörün iyi huylu
    olup olmadığına dair, karar destek amaçlı bir çalışma yapılmıştır.
    İstatistiklere göre Amerika da 160.000 den fazla akciğer kanseri
    vakasının olduğu ve bunların %90’ının öldüğü belirlenmiştir. Bu
    bağlamda bu tümörün erken ve doğru olarak teşhisi önem
    kazanmaktadır. Noninvaziv testler ile elde edilen bilgi sayesinde
    %40-60 oranında doğru teşhis konabilmektedir. İnsanlar kanser
    olup olmadıklarından emin olmak için biyopsi yaptırmayı tercih
    etmektedirler. Biyopsi gibi invaziv testler hem maliyeti yüksek
    hem çeşitli riskler taşımaktadır. Faklı yerlerde ve farklı
    zamanlarda kliniklerde toplanan invaziv test verileri arasında
    yapılan veri madenciliği çalışmaları teşhiste %100 oranında
    doğruluk sağlamıştır.
   Başka bir çalışma ise Kore Tıbbi Sigorta Kurumu
    tarafından hazırlanan bir veri tabanı üzerinde yapılan
    yüksek tansiyon ile ilgili bir çalışmadır. Bu çalışma 1998
    yılına ait 127,886 kayıt üzerinde yapılmıştır. İlk aşamada
    yüksek tansiyona sahip 9,103 kayıt üzerinde, daha sonra
    aynı sayıda yüksek tansiyonu olmayan kayıtlar üzerinde
    çalışılmıştır. Bu örnek 13,689 kayıttan oluşan öğrenme ve
    4,588 kayıttan oluşan test setine bölünerek modelin eğitimi
    yapılmıştır. Bu çalışmalar sonuçunda yüksek tansiyon
    tahmininde etkili değerler urinary protein, kan glikozu,
    kolesterol değerleridir. Yaşam koşullarının (diyet, alınan tuz
    miktarı, alkol, tütün gibi) hiçbirinin tahminde etkili
    olmadığı ayrıca grafiksel değerlerde de yalnızca yaşın etkili
    olduğu saptanmıştır.
WEKA;

   WEKA bir proje olarak başlayıp bugün dünya üzerinde birçok
    insan tarafından kullanılmaya başlanan bir Veri Madenciliği
    uygulaması geliştirme programıdır.
   Java platformu üzerinde geliştirilmiş açık kodlu bir
    programdır.
   WEKA ’nın içerisinde Veri İşleme, Veri Sınıflandırma, Veri
    Kümeleme, Veri İlişkilendirme özellikleri mevcuttur.
   Projenin amacına göre uygun algoritma veya algoritmalar
    seçilerek veriler üzerine uygulanmakta ve en doğru sonucu
    veren algoritma seçilebilmektedir.
Her bir veri madenciliği algoritmasının WEKA’ daki
    kullanımına ilişkin örnek uygulaması;

   Bu uygulamalar esnasında kullanılacak veri kümesi 285
    adet örnek mide kanseri verisi içermekte olup 9 sınıf ve
    7 adeti nümerik kalanları ise kategorik olmak üzere 68
    niteliğe sahiptir. Veritabanı içerisinde 970 adet kayıp veri
    bulunmakta olup bütün veritabanı içerisinde %5’lik bir
    belirsizlik söz konusudur.
Sınıflandırma;
Kümeleme;
   Son olarak şunu söyleyebiliriz; Data Mining
    özellikle insan sağlığı ile ilgili olduğu için tıbbi
    kullanımı ile oldukça önemli bir uygulama alanı
    bulacaktır. Bu konuda önemini son yıllarda giderek
    artan çalışmalar ile de ortaya koymaya başlamıştır.

More Related Content

Viewers also liked

FUTURAPOLIS - Écrans, Sources et Capteurs : Les Outils Marketing de Demain - ...
FUTURAPOLIS - Écrans, Sources et Capteurs : Les Outils Marketing de Demain - ...FUTURAPOLIS - Écrans, Sources et Capteurs : Les Outils Marketing de Demain - ...
FUTURAPOLIS - Écrans, Sources et Capteurs : Les Outils Marketing de Demain - ...Unitag
 
Goldplated Tabletops(Premium Products) - 1
Goldplated Tabletops(Premium Products) - 1Goldplated Tabletops(Premium Products) - 1
Goldplated Tabletops(Premium Products) - 1Avik Enterprises
 
203385462 o-net-53-ปีการศึกษา-2552
203385462 o-net-53-ปีการศึกษา-2552203385462 o-net-53-ปีการศึกษา-2552
203385462 o-net-53-ปีการศึกษา-2552apichaya413
 
Presentazione Eleonora Poli
Presentazione Eleonora PoliPresentazione Eleonora Poli
Presentazione Eleonora Polieleonorapoli
 
Textos infantins (3)
Textos infantins (3)Textos infantins (3)
Textos infantins (3)Joyce Romão
 
ใบงานที่ 3 เรื่อง ขอบข่ายและประเภทของโครงงาน
ใบงานที่ 3 เรื่อง ขอบข่ายและประเภทของโครงงานใบงานที่ 3 เรื่อง ขอบข่ายและประเภทของโครงงาน
ใบงานที่ 3 เรื่อง ขอบข่ายและประเภทของโครงงานJustice MengKing
 
Formúlario servicios 1
Formúlario servicios 1Formúlario servicios 1
Formúlario servicios 1angiedaiana
 
Avantika srivastava ppt
Avantika srivastava pptAvantika srivastava ppt
Avantika srivastava pptAshish Kumar
 
презентация к конкурсному уроку
презентация к конкурсному урокупрезентация к конкурсному уроку
презентация к конкурсному урокуkillaruns
 
Evaluation - Question Three
Evaluation - Question ThreeEvaluation - Question Three
Evaluation - Question ThreeJoel Berkowitz
 

Viewers also liked (14)

140722 exetastea uli_gel_g
140722 exetastea uli_gel_g140722 exetastea uli_gel_g
140722 exetastea uli_gel_g
 
FUTURAPOLIS - Écrans, Sources et Capteurs : Les Outils Marketing de Demain - ...
FUTURAPOLIS - Écrans, Sources et Capteurs : Les Outils Marketing de Demain - ...FUTURAPOLIS - Écrans, Sources et Capteurs : Les Outils Marketing de Demain - ...
FUTURAPOLIS - Écrans, Sources et Capteurs : Les Outils Marketing de Demain - ...
 
Goldplated Tabletops(Premium Products) - 1
Goldplated Tabletops(Premium Products) - 1Goldplated Tabletops(Premium Products) - 1
Goldplated Tabletops(Premium Products) - 1
 
203385462 o-net-53-ปีการศึกษา-2552
203385462 o-net-53-ปีการศึกษา-2552203385462 o-net-53-ปีการศึกษา-2552
203385462 o-net-53-ปีการศึกษา-2552
 
Presentazione Eleonora Poli
Presentazione Eleonora PoliPresentazione Eleonora Poli
Presentazione Eleonora Poli
 
Textos infantins (3)
Textos infantins (3)Textos infantins (3)
Textos infantins (3)
 
ใบงานที่ 3 เรื่อง ขอบข่ายและประเภทของโครงงาน
ใบงานที่ 3 เรื่อง ขอบข่ายและประเภทของโครงงานใบงานที่ 3 เรื่อง ขอบข่ายและประเภทของโครงงาน
ใบงานที่ 3 เรื่อง ขอบข่ายและประเภทของโครงงาน
 
Formúlario servicios 1
Formúlario servicios 1Formúlario servicios 1
Formúlario servicios 1
 
Shashank ppt
Shashank pptShashank ppt
Shashank ppt
 
Avantika srivastava ppt
Avantika srivastava pptAvantika srivastava ppt
Avantika srivastava ppt
 
Project presentation
Project presentation Project presentation
Project presentation
 
CDPL content examples
CDPL content examplesCDPL content examples
CDPL content examples
 
презентация к конкурсному уроку
презентация к конкурсному урокупрезентация к конкурсному уроку
презентация к конкурсному уроку
 
Evaluation - Question Three
Evaluation - Question ThreeEvaluation - Question Three
Evaluation - Question Three
 

Similar to Medical data mining applications

Veri̇ madenci̇li̇ği̇
Veri̇ madenci̇li̇ği̇Veri̇ madenci̇li̇ği̇
Veri̇ madenci̇li̇ği̇Musa BEKTAŞ
 
Tıpta Uygulama Hataları ve Engelleme Yolları
Tıpta Uygulama Hataları ve Engelleme YollarıTıpta Uygulama Hataları ve Engelleme Yolları
Tıpta Uygulama Hataları ve Engelleme Yollarıwww.tipfakultesi. org
 
Prof.dr. halit hami oz 06-sağlık kurumlarında bilgi sistemi-veri̇ toplamanin ...
Prof.dr. halit hami oz 06-sağlık kurumlarında bilgi sistemi-veri̇ toplamanin ...Prof.dr. halit hami oz 06-sağlık kurumlarında bilgi sistemi-veri̇ toplamanin ...
Prof.dr. halit hami oz 06-sağlık kurumlarında bilgi sistemi-veri̇ toplamanin ...Prof. Dr. Halit Hami Öz
 
KanıTa Dayalı TıP
KanıTa Dayalı TıPKanıTa Dayalı TıP
KanıTa Dayalı TıPTurquaz
 
Prof.dr. halit hami oz 01-sağlık kurumlarında bilgi sistemi-sağlık bilgi sist...
Prof.dr. halit hami oz 01-sağlık kurumlarında bilgi sistemi-sağlık bilgi sist...Prof.dr. halit hami oz 01-sağlık kurumlarında bilgi sistemi-sağlık bilgi sist...
Prof.dr. halit hami oz 01-sağlık kurumlarında bilgi sistemi-sağlık bilgi sist...Prof. Dr. Halit Hami Öz
 
presentation.pptx
presentation.pptxpresentation.pptx
presentation.pptxstemiZDEMR
 
hasta_guvenligi_equip_erzurum_kasim_2012_r._kahveci_2_.ppt
hasta_guvenligi_equip_erzurum_kasim_2012_r._kahveci_2_.ppthasta_guvenligi_equip_erzurum_kasim_2012_r._kahveci_2_.ppt
hasta_guvenligi_equip_erzurum_kasim_2012_r._kahveci_2_.pptMhmtYt
 
Ltfen aadaki makaleyi kendi kelimelerinizle zetleyin intih.pdf
Ltfen aadaki makaleyi kendi kelimelerinizle zetleyin intih.pdfLtfen aadaki makaleyi kendi kelimelerinizle zetleyin intih.pdf
Ltfen aadaki makaleyi kendi kelimelerinizle zetleyin intih.pdfabhitravel01
 
Prof.dr. halit hami oz 03-sağlık kurumlarında bilgi sistemi-sağlık kayıtların...
Prof.dr. halit hami oz 03-sağlık kurumlarında bilgi sistemi-sağlık kayıtların...Prof.dr. halit hami oz 03-sağlık kurumlarında bilgi sistemi-sağlık kayıtların...
Prof.dr. halit hami oz 03-sağlık kurumlarında bilgi sistemi-sağlık kayıtların...Prof. Dr. Halit Hami Öz
 
Sağlık politikalarında yönelim
Sağlık politikalarında yönelimSağlık politikalarında yönelim
Sağlık politikalarında yönelimUzmankişi
 
3 hafta-paz arşt
3 hafta-paz arşt3 hafta-paz arşt
3 hafta-paz arştcll-o
 
Sağlık Politikalarında Yönelim
Sağlık Politikalarında YönelimSağlık Politikalarında Yönelim
Sağlık Politikalarında YönelimUzmankisi0A
 
Byk Verinin Karanlk Yz Gnmzde kurulular bu teknoloji.pdf
Byk Verinin Karanlk Yz Gnmzde kurulular bu teknoloji.pdfByk Verinin Karanlk Yz Gnmzde kurulular bu teknoloji.pdf
Byk Verinin Karanlk Yz Gnmzde kurulular bu teknoloji.pdfjaipur2
 
Medikal Ve Betimsel Istatistik Analizi.pdf
Medikal Ve Betimsel Istatistik Analizi.pdfMedikal Ve Betimsel Istatistik Analizi.pdf
Medikal Ve Betimsel Istatistik Analizi.pdfBacklink Paketleri
 
ÖNCEL AKADEMİ: ÖZEL KONULAR
ÖNCEL AKADEMİ: ÖZEL KONULARÖNCEL AKADEMİ: ÖZEL KONULAR
ÖNCEL AKADEMİ: ÖZEL KONULARAli Osman Öncel
 
Bi̇yobankalar ve bi̇yobankalamada eti̇k konular
Bi̇yobankalar ve bi̇yobankalamada eti̇k konularBi̇yobankalar ve bi̇yobankalamada eti̇k konular
Bi̇yobankalar ve bi̇yobankalamada eti̇k konularFatih University
 
Kanıta dayalı tıp
Kanıta dayalı tıpKanıta dayalı tıp
Kanıta dayalı tıpguest3b989a
 

Similar to Medical data mining applications (20)

AKADEMİK TEZLER VE MAKALELERDE EN SIK YAPILAN HATALAR.pptx
AKADEMİK TEZLER VE MAKALELERDE EN SIK YAPILAN HATALAR.pptxAKADEMİK TEZLER VE MAKALELERDE EN SIK YAPILAN HATALAR.pptx
AKADEMİK TEZLER VE MAKALELERDE EN SIK YAPILAN HATALAR.pptx
 
Veri̇ madenci̇li̇ği̇
Veri̇ madenci̇li̇ği̇Veri̇ madenci̇li̇ği̇
Veri̇ madenci̇li̇ği̇
 
Tıpta Uygulama Hataları ve Engelleme Yolları
Tıpta Uygulama Hataları ve Engelleme YollarıTıpta Uygulama Hataları ve Engelleme Yolları
Tıpta Uygulama Hataları ve Engelleme Yolları
 
Prof.dr. halit hami oz 06-sağlık kurumlarında bilgi sistemi-veri̇ toplamanin ...
Prof.dr. halit hami oz 06-sağlık kurumlarında bilgi sistemi-veri̇ toplamanin ...Prof.dr. halit hami oz 06-sağlık kurumlarında bilgi sistemi-veri̇ toplamanin ...
Prof.dr. halit hami oz 06-sağlık kurumlarında bilgi sistemi-veri̇ toplamanin ...
 
KanıTa Dayalı TıP
KanıTa Dayalı TıPKanıTa Dayalı TıP
KanıTa Dayalı TıP
 
Kanita Dayali Tip
Kanita Dayali TipKanita Dayali Tip
Kanita Dayali Tip
 
Prof.dr. halit hami oz 01-sağlık kurumlarında bilgi sistemi-sağlık bilgi sist...
Prof.dr. halit hami oz 01-sağlık kurumlarında bilgi sistemi-sağlık bilgi sist...Prof.dr. halit hami oz 01-sağlık kurumlarında bilgi sistemi-sağlık bilgi sist...
Prof.dr. halit hami oz 01-sağlık kurumlarında bilgi sistemi-sağlık bilgi sist...
 
presentation.pptx
presentation.pptxpresentation.pptx
presentation.pptx
 
hasta_guvenligi_equip_erzurum_kasim_2012_r._kahveci_2_.ppt
hasta_guvenligi_equip_erzurum_kasim_2012_r._kahveci_2_.ppthasta_guvenligi_equip_erzurum_kasim_2012_r._kahveci_2_.ppt
hasta_guvenligi_equip_erzurum_kasim_2012_r._kahveci_2_.ppt
 
Ltfen aadaki makaleyi kendi kelimelerinizle zetleyin intih.pdf
Ltfen aadaki makaleyi kendi kelimelerinizle zetleyin intih.pdfLtfen aadaki makaleyi kendi kelimelerinizle zetleyin intih.pdf
Ltfen aadaki makaleyi kendi kelimelerinizle zetleyin intih.pdf
 
Prof.dr. halit hami oz 03-sağlık kurumlarında bilgi sistemi-sağlık kayıtların...
Prof.dr. halit hami oz 03-sağlık kurumlarında bilgi sistemi-sağlık kayıtların...Prof.dr. halit hami oz 03-sağlık kurumlarında bilgi sistemi-sağlık kayıtların...
Prof.dr. halit hami oz 03-sağlık kurumlarında bilgi sistemi-sağlık kayıtların...
 
Sağlık politikalarında yönelim
Sağlık politikalarında yönelimSağlık politikalarında yönelim
Sağlık politikalarında yönelim
 
3 hafta-paz arşt
3 hafta-paz arşt3 hafta-paz arşt
3 hafta-paz arşt
 
Taslak
TaslakTaslak
Taslak
 
Sağlık Politikalarında Yönelim
Sağlık Politikalarında YönelimSağlık Politikalarında Yönelim
Sağlık Politikalarında Yönelim
 
Byk Verinin Karanlk Yz Gnmzde kurulular bu teknoloji.pdf
Byk Verinin Karanlk Yz Gnmzde kurulular bu teknoloji.pdfByk Verinin Karanlk Yz Gnmzde kurulular bu teknoloji.pdf
Byk Verinin Karanlk Yz Gnmzde kurulular bu teknoloji.pdf
 
Medikal Ve Betimsel Istatistik Analizi.pdf
Medikal Ve Betimsel Istatistik Analizi.pdfMedikal Ve Betimsel Istatistik Analizi.pdf
Medikal Ve Betimsel Istatistik Analizi.pdf
 
ÖNCEL AKADEMİ: ÖZEL KONULAR
ÖNCEL AKADEMİ: ÖZEL KONULARÖNCEL AKADEMİ: ÖZEL KONULAR
ÖNCEL AKADEMİ: ÖZEL KONULAR
 
Bi̇yobankalar ve bi̇yobankalamada eti̇k konular
Bi̇yobankalar ve bi̇yobankalamada eti̇k konularBi̇yobankalar ve bi̇yobankalamada eti̇k konular
Bi̇yobankalar ve bi̇yobankalamada eti̇k konular
 
Kanıta dayalı tıp
Kanıta dayalı tıpKanıta dayalı tıp
Kanıta dayalı tıp
 

More from Esranur Öğretmen

An efficient implementation of pattern growth approach
An efficient implementation of pattern growth approachAn efficient implementation of pattern growth approach
An efficient implementation of pattern growth approachEsranur Öğretmen
 
Som algorithms in artificial neural networks
Som algorithms in artificial neural networksSom algorithms in artificial neural networks
Som algorithms in artificial neural networksEsranur Öğretmen
 
Medical data mining applications
Medical data mining applicationsMedical data mining applications
Medical data mining applicationsEsranur Öğretmen
 
An improved genetic algorithm and its blending
An improved genetic algorithm and its blendingAn improved genetic algorithm and its blending
An improved genetic algorithm and its blendingEsranur Öğretmen
 

More from Esranur Öğretmen (7)

An efficient implementation of pattern growth approach
An efficient implementation of pattern growth approachAn efficient implementation of pattern growth approach
An efficient implementation of pattern growth approach
 
Dolby sound encoders
Dolby sound encodersDolby sound encoders
Dolby sound encoders
 
Som algorithms in artificial neural networks
Som algorithms in artificial neural networksSom algorithms in artificial neural networks
Som algorithms in artificial neural networks
 
Raid technologies
Raid technologiesRaid technologies
Raid technologies
 
Medical data mining applications
Medical data mining applicationsMedical data mining applications
Medical data mining applications
 
An improved genetic algorithm and its blending
An improved genetic algorithm and its blendingAn improved genetic algorithm and its blending
An improved genetic algorithm and its blending
 
Health Chase Systems
Health Chase SystemsHealth Chase Systems
Health Chase Systems
 

Medical data mining applications

  • 1. TIP ALANINDA DATA MINING UYGULAMALARI ESRANUR ÖĞRETMEN 080401040
  • 2. Verilerin dijital ortamda saklanmaya başlanması ile birlikte, yeryüzündeki bilgi miktarının her 20 ayda bir iki katına çıktığı günümüzde, veri tabanlarının sayısı da benzer, hatta daha yüksek bir oranda artmaktadır. Akıllı veri işleme metodu olan veri madenciliği, dünya üzerinde artan veri miktarının etkili bir biçimde kullanılmasının neredeyse tek çözümü olarak görünmektedir. Bu gelişme diğer alanlarda olduğu gibi tıp alanında da ilgi odağı haline gelmiştir. Özellikle tıp alanındaki verinin büyüklüğü ve hayati önem taşıması bu alandaki uygulamaları daha da önemli kılmaktadır.
  • 3. Tıpta birçok alanda aşırı veri birikmesinin en yoğun yaşandığı alanlardan birisi de tıbbi verilerdir.  Özellikle günümüzde artık neredeyse tüm tıbbi cihazların dijital hale gelmesi bu sonucu doğal hale getirmiştir.  Kağıt üzerinde veri toplanan klasik hastane bilgi sistemlerinden farklı olarak buradaki verilerden yararlanmak her ne kadar çok daha kolay gibi görünse de, aslında diğer alanlardaki veriler gibi bunların da bireysel çalışmalarla işlenmesi ve yorumlanması imkansız hale gelmiştir.
  • 4. Tıp alanında veri madenciliği uygulamalarına örnek olarak;  antipsikotik ilaçların kalp kası hastalıkları üzerine etkisi  solunum fonksiyon testlerinin analizi  genetik bozuklukların tespiti  ilaç yan etkilerinin tanımlanması gibi çeşitli çalışmaları sayabiliriz.
  • 5. Veri madenciliği; belirli bir alanda ve belirli bir amaç için toplanan veriler arasındaki gizli kalmış ilişkilerin ortaya konulmasıdır.  Bunun yanında, geleceğe dönük kararlar almamızda bize fikir verir.  Veri madenciliği, disiplinler arası doğasından dolayı istatistik, veri tabanları, makine öğrenmesi, bilgi toplama, görselleştirme, paralel ve dağıtık hesaplama gibi birçok disiplinden yardım alır.
  • 6. Data Mining Aşamaları;  Uygulama Alanın Ortaya Konulması  Veri Ambarının Oluşturulması  Modelin Kurulması ve Değerlendirilmesi  Şablonların ve İlişkilerin Yorumlanması
  • 7. Veri Madenciliğindeki Problemler;  Veri madenciliği girdi olarak ham veriyi sağlamak üzere veri tabanlarına dayanır.  Bu da veri tabanlarının dinamik, eksiksiz, geniş ve net veri içermemesi durumunda sorunlar doğurur. Diğer sorunlar da verinin konu ile uyumsuzluğundan doğabilir.  Sınıflandırmak gerekirse başlıca sorunlar şunlardır :
  • 8. Sınırlı Bilgi : Veri tabanları genel olarak veri madenciliği dışındaki amaçlar için tasarlanmışlardır. Bu yüzden, öğrenme görevini kolaylaştıracak bazı özellikler bulunmayabilir.  Gürültü ve Eksik Değerler : Veri özellikleri ya da sınıflarındaki hatalara gürültü adı verilir. Veri tabanlarındaki eksik bilgi ve bu yanlışlardan dolayı veri madenciliği amacına tam olarak ulaşmayabilir. Bu bilgi yanlışlığı, ölçüm hatalarından, ya da öznel yaklaşımdan olabilir.  Belirsizlik : Yanlışlıkların şiddeti ve verideki gürültünün derecesi ile ilgilidir. Veri tahmini bir keşif sisteminde önemli bir husustur.  Ebat, güncellemeler ve konu dışı sahalar : Veri tabanlarındaki bilgiler, veri eklendikçe ya da silindikçe değişebilir. Veri madenciliği perspektifinden bakıldığında, kuralların hala aynı kalıp kalmadığı ve istikrarlılığı problemi ortaya çıkar. Öğrenme sistemi, kimi verilerin zamanla değişmesine ve keşif sisteminin verinin zamansızlığına karşın zaman duyarlı olmalıdır.
  • 9. Tıbbi Verinin Oluşturulması;  Tıbbi veriler üzerinde çalışma yapmak bu verileri iyi tanımakla mümkündür.  Tıp alanında belirli bir standardın olmayışı ve varolan standartlar arasında tam bir uyumun olmaması nedeniyle, bu alanında bir veri ambarının oluşturulması oldukça zor bir işlemdir.  Bunun yanı sıra tıp alanındaki terimlerin hem karışık hem de birbirine yaklaşık olması da veri ambarı oluşumunu negatif yönde etkilemektedir.  Tıp alanındaki veri genellikle farklı kaynaklarda toplanmaktadır. Örneğin hastanın laboratuar ile ilgili verileri ile hastanın teşhis bilgileri farklı kaynaklarda ve farklı şekillerde tutulmaktadır.
  • 10. Tıpta Veri Madenciliği Uygulama Alanları;  A.Kusiak ve arkadaşları tarafından akciğer deki tümörün iyi huylu olup olmadığına dair, karar destek amaçlı bir çalışma yapılmıştır. İstatistiklere göre Amerika da 160.000 den fazla akciğer kanseri vakasının olduğu ve bunların %90’ının öldüğü belirlenmiştir. Bu bağlamda bu tümörün erken ve doğru olarak teşhisi önem kazanmaktadır. Noninvaziv testler ile elde edilen bilgi sayesinde %40-60 oranında doğru teşhis konabilmektedir. İnsanlar kanser olup olmadıklarından emin olmak için biyopsi yaptırmayı tercih etmektedirler. Biyopsi gibi invaziv testler hem maliyeti yüksek hem çeşitli riskler taşımaktadır. Faklı yerlerde ve farklı zamanlarda kliniklerde toplanan invaziv test verileri arasında yapılan veri madenciliği çalışmaları teşhiste %100 oranında doğruluk sağlamıştır.
  • 11. Başka bir çalışma ise Kore Tıbbi Sigorta Kurumu tarafından hazırlanan bir veri tabanı üzerinde yapılan yüksek tansiyon ile ilgili bir çalışmadır. Bu çalışma 1998 yılına ait 127,886 kayıt üzerinde yapılmıştır. İlk aşamada yüksek tansiyona sahip 9,103 kayıt üzerinde, daha sonra aynı sayıda yüksek tansiyonu olmayan kayıtlar üzerinde çalışılmıştır. Bu örnek 13,689 kayıttan oluşan öğrenme ve 4,588 kayıttan oluşan test setine bölünerek modelin eğitimi yapılmıştır. Bu çalışmalar sonuçunda yüksek tansiyon tahmininde etkili değerler urinary protein, kan glikozu, kolesterol değerleridir. Yaşam koşullarının (diyet, alınan tuz miktarı, alkol, tütün gibi) hiçbirinin tahminde etkili olmadığı ayrıca grafiksel değerlerde de yalnızca yaşın etkili olduğu saptanmıştır.
  • 12. WEKA;  WEKA bir proje olarak başlayıp bugün dünya üzerinde birçok insan tarafından kullanılmaya başlanan bir Veri Madenciliği uygulaması geliştirme programıdır.  Java platformu üzerinde geliştirilmiş açık kodlu bir programdır.  WEKA ’nın içerisinde Veri İşleme, Veri Sınıflandırma, Veri Kümeleme, Veri İlişkilendirme özellikleri mevcuttur.  Projenin amacına göre uygun algoritma veya algoritmalar seçilerek veriler üzerine uygulanmakta ve en doğru sonucu veren algoritma seçilebilmektedir.
  • 13. Her bir veri madenciliği algoritmasının WEKA’ daki kullanımına ilişkin örnek uygulaması;  Bu uygulamalar esnasında kullanılacak veri kümesi 285 adet örnek mide kanseri verisi içermekte olup 9 sınıf ve 7 adeti nümerik kalanları ise kategorik olmak üzere 68 niteliğe sahiptir. Veritabanı içerisinde 970 adet kayıp veri bulunmakta olup bütün veritabanı içerisinde %5’lik bir belirsizlik söz konusudur.
  • 16.
  • 17. Son olarak şunu söyleyebiliriz; Data Mining özellikle insan sağlığı ile ilgili olduğu için tıbbi kullanımı ile oldukça önemli bir uygulama alanı bulacaktır. Bu konuda önemini son yıllarda giderek artan çalışmalar ile de ortaya koymaya başlamıştır.