Çalışmada ilk olarak WEKA programı, veri madenciliği ve LABOR veri seti hakkında gerekli bilgilerden bahsedilmiştir. Ayrıca veri madenciliği başlığı altında veri, veri tabanı ve veri ambarı ile ilgili detaylı bilgi eklenmiştir. LABOR veri seti incelenmiş, içermiş olduğu özniteliklerle ilgili detaylı bilgi verilmiş ve veri seti üzerinde en yaygın kullanılan sınıflandırma algoritmalarından olan OneR, ZeroR, Naive Bayes algoritmaları uygulanmış ve karşılaştırılmıştır.
12.04.2012 Tarihinde Çorlu Namık Kemal Üniversitesi ev sahipliğinde, Gökmen Güreşçi tarafından düzenlenen İnternet Haftası etkinliklerinde LabSec Community olarak yerimizi aldık.
12.04.2012 Tarihinde Çorlu Namık Kemal Üniversitesi ev sahipliğinde, Gökmen Güreşçi tarafından düzenlenen İnternet Haftası etkinliklerinde LabSec Community olarak yerimizi aldık.
Building Advanced Analytics Pipelines with Azure DatabricksLace Lofranco
Participants will get a deep dive into one of Azure’s newest offering: Azure Databricks, a fast, easy and collaborative Apache® Spark™ based analytics platform optimized for Azure. In this session, we start with a technical overview of Spark and quickly jump into Azure Databricks’ key collaboration features, cluster management, and tight data integration with Azure data sources. Concepts are made concrete via a detailed walk through of an advance analytics pipeline built using Spark and Azure Databricks.
Full video of the presentation: https://www.youtube.com/watch?v=14D9VzI152o
Presentation demo: https://github.com/devlace/azure-databricks-anomaly
Azure Synapse Analytics is Azure SQL Data Warehouse evolved: a limitless analytics service, that brings together enterprise data warehousing and Big Data analytics into a single service. It gives you the freedom to query data on your terms, using either serverless on-demand or provisioned resources, at scale. Azure Synapse brings these two worlds together with a unified experience to ingest, prepare, manage, and serve data for immediate business intelligence and machine learning needs. This is a huge deck with lots of screenshots so you can see exactly how it works.
Sunum, iş analisti ve iş analizi hakkında en temel bilgileri içermektedir.
Aynı konuda eğitim de düzenliyoruz; temasa geçmek için : info@erkmendanismanlik.com
Eğitimin Tanımı:
Son günlerde sıkça duyduğumuz "İş Analisti" kelimesi 2005 yılından sonra yükselen bir değer olarak hayatımıza girmiştir. Bu yıllarda ardı ardına kurulan Bilişim/Teknoloji şirketleri başta banka, sigorta ve telekomünikasyon olmak üzere tüm sektörlerde yoğun olarak iş analisti pozisyonları açmış ve bu açıklarını kapatmaya çalışmıştır. Yıllar içinde artan iş analisti sayısı sonucunda da analiz sektöründe kurum ya da geleneksel yöntemler terk edilerek, tüm dünyada kullanılan adımlar takip edilmeye başlanmıştır.
İş Analistliği, sektörler üzerinde bir birimdir. Analitik düşünme becerisine sahip olan ve BABOK kurallarına uyan her analist her hangi bir sektör hakkında kısa sürede fikir sahibi olabilir ve sektörü-alt sektörleri analiz edebilir.
İş Analistleri günümüzde “Business Analyst” ve “IT Business Analyst” olarak ikiye ayrılmış durumdadır. Eğitimimizde, analiz dünyasına IT Business Analyst perspektifi ile bakmaya ve bu dünyanın temel bilgileri üzerinde duracağız. Analistlerde olması gereken "Analitik düşünce", "BlackBox ve WhiteBox" düşünce yapılarını irdelemeye ve BABOK kurallar bütünlüğü içinde talep yönetimi, domain modelleme, analiz teknikleri ve analiz dokumanı hazırlama yöntemlerini anlatacağız.
Short introduction to different options for ETL & ELT in the Cloud with Microsoft Azure. This is a small accompanying set of slides for my presentations and blogs on this topic
Kaputun Altndan Bakmak ORION UPSte Yeni Navigasyon Sistemi.pdfaarthitimesgd
Kaputun Altndan Bakmak: ORION
UPS'te Yeni Navigasyon Sistemi
Endstriler genelinde, bilgi ve iletiim teknolojisi (BT) byk
dnyann en karmak kresel evresel ve
sosyal zorluklar Bununla birlikte, iyi teknolojinin var olduu yerlerde bile, yine de bir anahtar vardr.
benimsemeyle ilgili zorluk: bir zmn seilmesi ve kurulmas, zmn kendi bnyesine entegre edilmesi
mevcut sistemler ve dorulamak iin kullanclar tarafndan baarl bir ekilde alnmasnn salanmas
teknoloji vaadini yerine getiriyor.
Yeni teknolojiler genellikle yeni i sreleri gerektirir ve bu sreler
daha fazla verimlilik, maliyet tasarrufu ve/veya dier iyiletirmeler vaat ederler, ayrca
davran deiikliive deiiklik zordur.
Frsat
UPS, ORION veya On-Road Integrated Optimization and Navigation tarafndan gelitirilmitir.
dahil olmak zere bir veri noktalar koleksiyonunu analiz eden bir rota optimizasyon sistemi
oluturmak iin gnn paket teslimatlar, teslim alma sreleri ve gemi rota performans
srcler iin en verimli gnlk rota.
UPS, ORION', verileri ve tahmine dayal modelleri kullanmaya ynelik daha geni bir abann paras
olarak yaratt.
verimlilii artrr, bylece hem maliyetleri hem de evresel etkileri azaltr. le
UPS, daha verimli rotalar izerek, teslimat kullanmn en st dzeye karmay baard.
UPS'in en byk maliyetlerinden biri olan nemli lde yakt tasarrufu salayan aralar ve srcler.
ORION'un iletme maliyetlerini ylda 300 milyon ABD dolar drerek 400 milyon ABD dolarna drmesi
bekleniyor.
2017'de ABD'de tam olarak uygulandnda bir yl sonra.
irketin 55.000 ABD rotas artk yazlm kullanyor ve gnlk ortalama
alt ila sekiz mil arasnda sr azalmas. Bunu bir perspektife oturtmak iin, UPS
gnlk toplam ortalamay bir mil azaltarak ylda 50 milyon ABD dolar tasarruf edebilir
srclerinin seyahati.
Orion iin zel Deiiklik Ynetimi Zorluklar
Maksimum maliyet ve emisyon azaltm elde etmek iin UPS,
her biri kendine zg deiiklik ynetimine sahip birka farkl proje aamas
zorluklar:
Gelitirme: Ar-Ge liderlerinden bir teknoloji zm tasarlamalar istendi.
mevcut uygulamadan daha iyi alt ve i liderlerine
yaklamn potansiyeli vard.
Gsterim: Prototip testi ve i durumu dorulamas.
Laboratuarda gelitirilen prototipler daha sonra sahada test edildi, nce daha kk
ve daha sonra daha byk UPS src gruplar iin.
Benimseme: Operasyonel hale getirme ve yaygnlatrma. Binlerce UPS'i ikna etmek
alanlarnn ORION'un gnlk ilerine entegrasyonunu benimsemeleri.
UPS'in Yaklam
ORION'un uygulanmas ana aamada gerekleti:
1. Gelitirme: Fikir
UPS, tahmine dayal katmanlama amacyla ORION'u gelitirmeye 2003 ylnda balad.
UPS'in mevcut paket ve ara takip sistemlerine ek algoritmalar. bu
gelitirme, Yneylem Aratrmas ve leri Dzey kapsamnda gerekleti.
Kk, eitlilie sahip bir ekiple balayan analitik gruplar: operasyonlarda doktora
aratrma, bir endstri mhendisi, bir UPS iletme yneticisi ve birka
Yazlm mhendisleri.
UPS, rotalar optimize etmek iin iyi bilinen yazlm algoritmalarn birletirdi.
mevcut i kurallar (paket teslim emri gibi), ancak ilk sonular
sinir bozucu derecede tutarszd ve UPS srcleri tarafnda.
Building Advanced Analytics Pipelines with Azure DatabricksLace Lofranco
Participants will get a deep dive into one of Azure’s newest offering: Azure Databricks, a fast, easy and collaborative Apache® Spark™ based analytics platform optimized for Azure. In this session, we start with a technical overview of Spark and quickly jump into Azure Databricks’ key collaboration features, cluster management, and tight data integration with Azure data sources. Concepts are made concrete via a detailed walk through of an advance analytics pipeline built using Spark and Azure Databricks.
Full video of the presentation: https://www.youtube.com/watch?v=14D9VzI152o
Presentation demo: https://github.com/devlace/azure-databricks-anomaly
Azure Synapse Analytics is Azure SQL Data Warehouse evolved: a limitless analytics service, that brings together enterprise data warehousing and Big Data analytics into a single service. It gives you the freedom to query data on your terms, using either serverless on-demand or provisioned resources, at scale. Azure Synapse brings these two worlds together with a unified experience to ingest, prepare, manage, and serve data for immediate business intelligence and machine learning needs. This is a huge deck with lots of screenshots so you can see exactly how it works.
Sunum, iş analisti ve iş analizi hakkında en temel bilgileri içermektedir.
Aynı konuda eğitim de düzenliyoruz; temasa geçmek için : info@erkmendanismanlik.com
Eğitimin Tanımı:
Son günlerde sıkça duyduğumuz "İş Analisti" kelimesi 2005 yılından sonra yükselen bir değer olarak hayatımıza girmiştir. Bu yıllarda ardı ardına kurulan Bilişim/Teknoloji şirketleri başta banka, sigorta ve telekomünikasyon olmak üzere tüm sektörlerde yoğun olarak iş analisti pozisyonları açmış ve bu açıklarını kapatmaya çalışmıştır. Yıllar içinde artan iş analisti sayısı sonucunda da analiz sektöründe kurum ya da geleneksel yöntemler terk edilerek, tüm dünyada kullanılan adımlar takip edilmeye başlanmıştır.
İş Analistliği, sektörler üzerinde bir birimdir. Analitik düşünme becerisine sahip olan ve BABOK kurallarına uyan her analist her hangi bir sektör hakkında kısa sürede fikir sahibi olabilir ve sektörü-alt sektörleri analiz edebilir.
İş Analistleri günümüzde “Business Analyst” ve “IT Business Analyst” olarak ikiye ayrılmış durumdadır. Eğitimimizde, analiz dünyasına IT Business Analyst perspektifi ile bakmaya ve bu dünyanın temel bilgileri üzerinde duracağız. Analistlerde olması gereken "Analitik düşünce", "BlackBox ve WhiteBox" düşünce yapılarını irdelemeye ve BABOK kurallar bütünlüğü içinde talep yönetimi, domain modelleme, analiz teknikleri ve analiz dokumanı hazırlama yöntemlerini anlatacağız.
Short introduction to different options for ETL & ELT in the Cloud with Microsoft Azure. This is a small accompanying set of slides for my presentations and blogs on this topic
Kaputun Altndan Bakmak ORION UPSte Yeni Navigasyon Sistemi.pdfaarthitimesgd
Kaputun Altndan Bakmak: ORION
UPS'te Yeni Navigasyon Sistemi
Endstriler genelinde, bilgi ve iletiim teknolojisi (BT) byk
dnyann en karmak kresel evresel ve
sosyal zorluklar Bununla birlikte, iyi teknolojinin var olduu yerlerde bile, yine de bir anahtar vardr.
benimsemeyle ilgili zorluk: bir zmn seilmesi ve kurulmas, zmn kendi bnyesine entegre edilmesi
mevcut sistemler ve dorulamak iin kullanclar tarafndan baarl bir ekilde alnmasnn salanmas
teknoloji vaadini yerine getiriyor.
Yeni teknolojiler genellikle yeni i sreleri gerektirir ve bu sreler
daha fazla verimlilik, maliyet tasarrufu ve/veya dier iyiletirmeler vaat ederler, ayrca
davran deiikliive deiiklik zordur.
Frsat
UPS, ORION veya On-Road Integrated Optimization and Navigation tarafndan gelitirilmitir.
dahil olmak zere bir veri noktalar koleksiyonunu analiz eden bir rota optimizasyon sistemi
oluturmak iin gnn paket teslimatlar, teslim alma sreleri ve gemi rota performans
srcler iin en verimli gnlk rota.
UPS, ORION', verileri ve tahmine dayal modelleri kullanmaya ynelik daha geni bir abann paras
olarak yaratt.
verimlilii artrr, bylece hem maliyetleri hem de evresel etkileri azaltr. le
UPS, daha verimli rotalar izerek, teslimat kullanmn en st dzeye karmay baard.
UPS'in en byk maliyetlerinden biri olan nemli lde yakt tasarrufu salayan aralar ve srcler.
ORION'un iletme maliyetlerini ylda 300 milyon ABD dolar drerek 400 milyon ABD dolarna drmesi
bekleniyor.
2017'de ABD'de tam olarak uygulandnda bir yl sonra.
irketin 55.000 ABD rotas artk yazlm kullanyor ve gnlk ortalama
alt ila sekiz mil arasnda sr azalmas. Bunu bir perspektife oturtmak iin, UPS
gnlk toplam ortalamay bir mil azaltarak ylda 50 milyon ABD dolar tasarruf edebilir
srclerinin seyahati.
Orion iin zel Deiiklik Ynetimi Zorluklar
Maksimum maliyet ve emisyon azaltm elde etmek iin UPS,
her biri kendine zg deiiklik ynetimine sahip birka farkl proje aamas
zorluklar:
Gelitirme: Ar-Ge liderlerinden bir teknoloji zm tasarlamalar istendi.
mevcut uygulamadan daha iyi alt ve i liderlerine
yaklamn potansiyeli vard.
Gsterim: Prototip testi ve i durumu dorulamas.
Laboratuarda gelitirilen prototipler daha sonra sahada test edildi, nce daha kk
ve daha sonra daha byk UPS src gruplar iin.
Benimseme: Operasyonel hale getirme ve yaygnlatrma. Binlerce UPS'i ikna etmek
alanlarnn ORION'un gnlk ilerine entegrasyonunu benimsemeleri.
UPS'in Yaklam
ORION'un uygulanmas ana aamada gerekleti:
1. Gelitirme: Fikir
UPS, tahmine dayal katmanlama amacyla ORION'u gelitirmeye 2003 ylnda balad.
UPS'in mevcut paket ve ara takip sistemlerine ek algoritmalar. bu
gelitirme, Yneylem Aratrmas ve leri Dzey kapsamnda gerekleti.
Kk, eitlilie sahip bir ekiple balayan analitik gruplar: operasyonlarda doktora
aratrma, bir endstri mhendisi, bir UPS iletme yneticisi ve birka
Yazlm mhendisleri.
UPS, rotalar optimize etmek iin iyi bilinen yazlm algoritmalarn birletirdi.
mevcut i kurallar (paket teslim emri gibi), ancak ilk sonular
sinir bozucu derecede tutarszd ve UPS srcleri tarafnda.
Kaputun Altndan Bakmak ORION UPSte Yeni Navigasyon Sistem.pdfaaseletronics2013
Kaputun Altndan Bakmak: ORION
UPS'te Yeni Navigasyon Sistemi
Endstriler genelinde, bilgi ve iletiim teknolojisi (BT), dnyann en karmak kresel evresel ve
sosyal zorluklarndan bazlarn ele alma konusunda byk bir potansiyele sahiptir. Bununla
birlikte, iyi teknolojinin mevcut olduu yerlerde bile, benimsemeyle ilgili nemli bir zorluk
vardr: bir zmn seilmesi ve kurulmas, mevcut sistemlere entegre edilmesi ve teknolojinin
vaadini yerine getirdiini dorulamak iin kullanclar tarafndan baarl bir ekilde benimsenmesini
salamak.
Yeni teknolojiler genellikle yeni i sreleri gerektirir ve bu sreler daha fazla verimlilik, maliyet
tasarrufu ve/veya dier iyiletirmeler vaat etse bile, ayn zamanda davran deiiklii gerektirir ve
deiim zordur.
Frsat
UPS, ORION veya Yolda Entegre Optimizasyon ve Navigasyon tarafndan gelitirilen, srcler
iin en verimli gnlk rotay oluturmak iin gnn paket teslimatlar, teslim alma sreleri ve gemi rota
performans dahil olmak zere bir veri noktalar koleksiyonunu analiz eden bir rota
optimizasyon sistemidir. .
UPS, ORION', verimlilii artrmak ve bylece hem maliyetleri hem de evresel etkileri azaltmak
iin verileri ve tahmine dayal modelleri kullanmaya ynelik daha geni bir abann paras olarak
yaratt. UPS, daha verimli rotalar izerek teslimat aralarnn ve srclerin kullanmn en st dzeye
karabildi ve bu da UPS'in en byk maliyetlerinden biri olan nemli yakt tasarrufu salad.
ORION'un, 2017'de ABD'de tamamen hayata geirildiinde iletme maliyetlerini ylda 300 milyon
ABD dolar drerek 400 milyon ABD dolarna drmesi bekleniyor. irketin 55.000 ABD rotasnn
yzde 70'inden fazlas u anda yazlm kullanyor ve ortalama gnlk sr d alt ila sekiz mil arasnda.
Bunu bir perspektife oturtmak iin UPS, srclerinin ortalama gnlk toplam seyahatini bir mil
azaltarak ylda 50 milyon ABD dolar tasarruf edebilir.
Orion iin zel Deiiklik Ynetimi Zorluklar
Maksimum maliyet ve emisyon azaltm elde etmek iin UPS'in, her biri kendine zg deiiklik
ynetimi zorluklar olan birka farkl proje aamasnda kabul salamas gerekiyordu:
Gelitirme: Ar-Ge liderlerinden, mevcut uygulamadan daha iyi alan bir teknoloji zm
tasarlamalar ve i liderlerine bu yaklamn potansiyeli olduunu kantlamalar istendi.
Gsterim: Prototip testi ve i durumu dorulamas. Laboratuarda gelitirilen prototipler daha
sonra, nce daha kk, ardndan daha byk UPS src gruplar iin sahada test edildi.
Benimseme: Operasyonelletirme ve yayma. Binlerce UPS alann ORION'un gnlk ilerine
entegrasyonunu benimsemeye ikna etmek.
UPS'in Yaklam
ORION'un uygulanmas ana aamada gerekleti:
Gelitirme: Fikir
UPS, UPS'in mevcut paket ve ara takip sistemlerinin zerine tahmine dayal algoritmalar
yerletirmek amacyla 2003 ylnda ORION'u gelitirmeye balad. Gelitirme, Yneylem Aratrmas ve
Gelimi Analitik gruplar iinde, kk ve farkl bir ekiple balad: yneylem aratrmasnda doktora
sahibi, bir endstri mhendisi, bir UPS iletme yneticisi ve birka yazlm mhendisi.
UPS, rotalar optimize etmek iin iyi bilinen yazlm algoritmalarn mevcut i kurallaryla (paket
teslim emri gibi) birletirdi, an.
Google Güvenli Yapay Zeka Framework Yaklaşımı(Türkçe Çeviri)AISecLab
Güvenli Yapay Zeka Frameworku (Secure AI Framework (SAIF)), güvenli yapay zeka (AI) sistemleri için kavramsal bir frameworktur. Google'ın yazılım geliştirmeye uyguladığı tedarik zincirini gözden geçirme, test etme ve kontrol etme gibi en iyi güvenlik uygulamalarından esinlenirken, yapay zeka sistemlerine özgü güvenlik mega trendleri ve riskleri hakkındaki anlayışımızı da dahil etmektedir.
Here are the data management presentations that were delivered during the Veritas Vision Solution Day 2020, Istanbul, Turkey. Note that the content is in Turkish.
Utku Demirhan @Digitalzone Meetups - Dijitalde 5 Veri Görselleştirme YöntemiZeo
28 Kasım 2017'de gerçekleşen Digitalzone Meetups'ta Zeo Agency'de Data Analisti olarak görev alan Utku Demirhan'ın "Dijitalde 5 Veri Görselleştirme Yöntemi" isimli sunumuna ait slaytlara buradan ulaşabilirsiniz.
* What is Engineering?
* Who is an Engineer?
* The reasons to become an Engineer
* What is Software Engineering?
* Software Engineering: History
* The principles of Software Engineering
* Who is a Software Engineer?
* The reasons to become Software Engineer
* Requirements of being Software Engineer
* The Areas of Software Engineers
* The working areas of Software Engineers
* Difference between Computer Science and Software Engineering
* Pros and Cons of being Software Engineer
* A Software Engineer Responsibilities
* The Most Popular Software Development Methodologies(Waterfall, Rapid Application, Agile and DevOps) Development Methodology
* Version control
* Centralized Version Control
* What is Business Analysis?
* Who is a Business Analyst?
* The reasons to become a Business Analyst
* The principles of Business Analysis
* Business Analyst’s role
* S.W.O.T and M.O.S.T Analysis
* Requirements of being Business Analyst
* Business Analysts’ work
* Business Analysts’ workplaces
* Difference between Data Scientist and a Business Analyst
* Analysis work
* What is a Software?
* What is Software Testing?
* Software Testing History
* The principles of Software Testing
* Who is a Software Tester?
* The requirements of being Software Tester
* The principles of testing
* What Do Software Testers Do?
* The difference between Software Developers and Software Testers
* A Software Tester Responsibilities
* The relation of Testing and Quality Assurance
* Why is a Software Defect Called a Bug?
* Why does Software have Defects?
* Automated Testing
* Manual Testing
4. WEKA
Programı
Hakkında
WEKA, makine öğrenimi amacıyla
Waikato Üniversitesinde geliştirilmiş ve
Waikato Environment for Knowledge
Analysis kelimelerinin baş harflerinden
oluşmuş yazılımın ismidir.
Günümüzde yaygın kullanımı olan
çoğu makine öğrenimi algoritmalarını
ve metotlarını içermektedir. WEKA,
tamamen modüler bir tasarıma sahip
olup, içerdiği özelliklerle veri kümeleri
üzerinde görselleştirme, veri analizi, iş
zekası uygulamaları, veri madenciliği
gibi işlemler yapabilmektedir.
6. Veri
Madenciliği
Hakkında
Büyük veri kaynaklarından
yararlı ve ilginç bilgi bulunmalı
ve bulunan bilgi, gizli, önemli,
önceden bilinmeyen ve yararlı
olmalıdır. Teoride veri
madenciliği bilgi keşfi işleminin
aşamalarından biridir ama
pratikte ise veri madenciliği ve
bilgi keşfi eş anlamlı olarak
kullanılır.
7. Veri, Veri
Tabanı ve Veri
Ambarı
Veri: Veri sayılar, metinler, sesler, görüntüler,
rasat parkında kayıt cihazında depolananlar,
otomasyonda öğrenci kayıtlarıdır. Genel
olarak veri karar vermeye yarayan soyut
simge dizileridir.
Veri Tabanı: Veri tabanı, birbiri ile ilişkili
verilerin toplanması ve depolanmasıdır.
Sistematik erişim imkanı olan, yönetilebilir,
güncellenebilir, taşınabilir, birbirleri arasında
tanımlı ilişkiler bulunabilen verilerdir ve belli
bir amaç için verilerin toplanması ve
tasarımıdır.
Veri Ambarı: Veri ambarları kesin bir tanım
yapmayı zorlaştıran bir şekilde, pek çok
biçimde tanımlanmaktadırlar. Veri ambarı bir
organizasyonun kullanılmakta olan veri
tabanlarından ayrı olarak sürdürülen bir
karar destek veritabanıdır.
9. LABOR Veri
Seti Hakkında
LABOR veri seti işçiler hakkında
bilgiler vermektedir. Bu veriler
Kanada endüstrisinde işçi
müzakereleri sonucunda
toplanmıştır. Çalışma saatleri,
işçilerin maaşı, tatilleri, maaş artış
veya azalışları, sağlık ve başka
yardımlar gibi özellikleri dikkate
alarak, bize çalışma ortamı veya
şartlarının iyi mi kötü mü olduğunu
söylemektedir. Veri seti içerisinde
17 adet öznitelik ve 57 adet kayıt
bulunmaktadır.
10. Öznitelikler
1. Anlaşma süreleri (duration)
2. İlk yıl ücret artışı (wage-increase-first-year)
3. İkinci yıl ücret artışı (wage-increase-second-year)
4. Üçüncü yıl ücret artışı (wage-increase-third-year)
5. Yaşam maliyeti ayarlaması (cost-of-living-adjustment)
6. Çalışma saatleri (working-hours)
7. Emekli maaşı (pension)
8. Bekleme ücreti: Görev için derhal hazır bulunması gereken
çalışanlar için ek ücrettir (standby-pay)
9. Vardiya Değişimi (shift-differential)
10. Eğitim ödeneği (education-allowance)
11. Resmi Tatiller (statutory-holidays)
12. Ücretli tatil günleri (vacation)
13. Uzun süreli engellilik yardımı (longterm-disability-assistance)
14. Diş planına katkı (contribution-to-dental-plan)
15. Cenaze masraflarına işverenin mali katkısı (bereavement-
assistance)
16. Sağlık planına katkı (contribution-to-health-plan)
17. Sınıf (class)
11. OneR
Algoritması
Bu algoritmanın amacı hangi
sınıfı kullanırsak daha iyi
sonucu tespit ederiz sorusuna
cevap bulmaktır. Algoritma
bunu yaparken sınıflandırmak
istediğimiz sınıfla elindeki
diğer sınıflar arasındaki
bağlantıya bakıp hangisi ile
daha fazla benzerlik
gösteriyorsa o sınıfı almaktır.
12. Veri Seti
Üzerinde
Uygulanması
Veri seti için ilk olarak bir sınıflandırma
algoritması olan OneR algoritması
uygulanmıştır. Burada test seçenekleri
içerisinde en çok kullanılan cross-
validation modeli kullanılmıştır. Veri seti
büyük bir veri seti olmadığı için algoritma
uygulanırken 3 katmana (fold)
bölünmüştür. Bu modelde “2 set eğitim, 1
set test verisi” olarak, tüm setlerin
üzerinden geçene kadar kullanılır ve her
bir parça test ve eğitim verisi olarak
kullanılmış olur. Sınıflandırma modeline
göre ilk yıl ücret artışı (wage-increase-
first-year) özniteliği seçilmiştir. 42 kayıt
doğru 15 kayıt ise yanlış
sınıflandırılmıştır. Sonuç olarak algoritma
uygulandığında %73.6842 başarı oranı
vermektedir.
13. ZeroR
Algoritması
ZeroR algoritması veri
madenciliği için en basit
ve çok kullanılan
algoritmalardan biridir.
Veri setindeki
sınıflandırmalardan
hangisinin sıklığı daha
çok ise gelen herşeyi o
sınıftan kabul eder.
14. Veri Seti
Üzerinde
Uygulanması
İkinci olarak sınıflandırma
algoritmalarından biri olan ZeroR
algoritması veri seti üzerinde
uygulanmıştır. Burada ZeroR
algoritması sınıf (class) özniteliği
için uygulanmıştır. ZeroR
algoritması veri setindeki
sınıflandırmalardan hangisinin
sıklığı daha çok ise gelen her şeyi
o sınıftan kabul ettiği için 37’ye 20
şeklinde bir dağılım olduğu için
daha sık olan sınıflandırmayı
almış ve %64.9123 başarı oranı
elde edilmiştir.
15. Naive Bayes
Algoritması
Naive Bayes
algoritmasının temeli
Bayes teoremine dayanır.
Naive Bayes
algoritmasının çalışma
şekli bir eleman için her
durumun olasılığını
hesaplamak ve olasılık
değeri en yüksek olana
göre sınıflandırmak
olarak özetlenebilir.
16. Veri Seti
Üzerinde
Uygulanması
En son olarak sınıflandırma
algoritmalarından biri olan Naive
Bayes algoritması veri seti üzerinde
uygulanmıştır. Burada F-Measure’a
baktığımızda ‘good’ sonucunun ‘bad’
sonucundan daha iyi olduğu
görülmektedir. Toplam 57 veriden 54
tanesi doğru tamamlanmış ve %
94.7368 başarı oranı elde edilmiştir.
Confusion Matrix’e bakıldığı zaman
iyi bir sonuç görülmektedir. Model
‘good’ sonuçlarının tamamını doğru
tahmin etmişken, ‘bad’
sonuçlarından 3 tanesini ‘good’
olarak karıştırmıştır.
17. Sonuç
Çalışmada ilk olarak WEKA programı hakkında gerekli bilgilerden bahsedilmiş, dosya tipleri ve önemli paneller
hakkında bilgi verilmiştir. Ayrıca veri madenciliği başlığı altında veri, veri tabanı ve veri ambarı ile ilgili detaylı bilgi
eklenmiştir.
Genel olarak veri seti üzerinde sınıflandırma yapıldığı için sınıflandırma algoritmalarına değinilmiştir.
LABOR veri seti incelenmiş, içermiş olduğu özniteliklerle ilgili detaylı bilgi verilmiş ve veri seti üzerinde en yaygın
kullanılan sınıflandırma algoritmalarından olan OneR, ZeroR, Naive Bayes algoritmaları uygulanmış ve
karşılaştırılmıştır.
Bu üç algoritma başarı oranına göre karşılaştırıldığı zaman en iyi sonucu veren algoritma Naive Bayes algoritması
olmuştur. Bunun nedeni Naive Bayes algoritmasının çalışma şekli bir eleman için her durumun olasılığını
hesaplamak ve olasılık değeri en yüksek olana göre sınıflandırmak olarak özetlenebilir.