Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...Metin Uslu
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analysis Using Association Rules)
Birliktelik Kuralları yöntemlerinden Apriori algoritması kullanılarak 11 değişken ve 1000 gözlemden oluşan veri seti kullanılarak birliktelik kuralları oluşturulmuştur. Burada amaç müşterilerin satın aldıkları ürünler arasındaki birliktelik ilişkisini bulmak, bu ilişki verisi doğrultusunda müşterilerin satın alma alışkanlıklarını tespit etmektir. Uygulama sonucunda müşterilerin satın aldıkları ürünlere ilişkin destek, güven ölçütü değerleri bulunmuş ve web grafiği ilişkiler gösterilmiştir. Çalışma IBM SPSS Modeler paket programı kullanılarak gerçekleştirilmiştir.
ASSOCIATION RULE LEARNING (BİRLİKTELİK KURALI ÖĞRENİMİ)RabiaKo
Veri Bilimi Okulu tarafından organize edilen Veri Bilimci Yetiştirme Programı kapsamında öğrendiğimiz ASSOCIATION RULE LEARNING (BİRLİKTELİK KURALI ÖĞRENİMİ) sunumumu paylaşmaktayım.
Our fall 12-Week Data Science bootcamp starts on Sept 21st,2015. Apply now to get a spot!
If you are hiring Data Scientists, call us at (1)888-752-7585 or reach info@nycdatascience.com to share your openings and set up interviews with our excellent students.
---------------------------------------------------------------
Come join our meet-up and learn how easily you can use R for advanced Machine learning. In this meet-up, we will demonstrate how to understand and use Xgboost for Kaggle competition. Tong is in Canada and will do remote session with us through google hangout.
---------------------------------------------------------------
Speaker Bio:
Tong is a data scientist in Supstat Inc and also a master students of Data Mining. He has been an active R programmer and developer for 5 years. He is the author of the R package of XGBoost, one of the most popular and contest-winning tools on kaggle.com nowadays.
Pre-requisite(if any): R /Calculus
Preparation: A laptop with R installed. Windows users might need to have RTools installed as well.
Agenda:
Introduction of Xgboost
Real World Application
Model Specification
Parameter Introduction
Advanced Features
Kaggle Winning Solution
Event arrangement:
6:45pm Doors open. Come early to network, grab a beer and settle in.
7:00-9:00pm XgBoost Demo
Reference:
https://github.com/dmlc/xgboost
Hidrolik Yük Asansörü Tasarımı ve Maliyet Analizitst34
Bu projede hidrolik yük asansörleri ile ilgili geniş bi araştırma yapılarak, 5 ton yük kaldırması planlanan bir hidrolik yük asansörü tasarlanarak tüm mukavemet hesapları gerçekleştirilmiştir.
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...Metin Uslu
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analysis Using Association Rules)
Birliktelik Kuralları yöntemlerinden Apriori algoritması kullanılarak 11 değişken ve 1000 gözlemden oluşan veri seti kullanılarak birliktelik kuralları oluşturulmuştur. Burada amaç müşterilerin satın aldıkları ürünler arasındaki birliktelik ilişkisini bulmak, bu ilişki verisi doğrultusunda müşterilerin satın alma alışkanlıklarını tespit etmektir. Uygulama sonucunda müşterilerin satın aldıkları ürünlere ilişkin destek, güven ölçütü değerleri bulunmuş ve web grafiği ilişkiler gösterilmiştir. Çalışma IBM SPSS Modeler paket programı kullanılarak gerçekleştirilmiştir.
ASSOCIATION RULE LEARNING (BİRLİKTELİK KURALI ÖĞRENİMİ)RabiaKo
Veri Bilimi Okulu tarafından organize edilen Veri Bilimci Yetiştirme Programı kapsamında öğrendiğimiz ASSOCIATION RULE LEARNING (BİRLİKTELİK KURALI ÖĞRENİMİ) sunumumu paylaşmaktayım.
Our fall 12-Week Data Science bootcamp starts on Sept 21st,2015. Apply now to get a spot!
If you are hiring Data Scientists, call us at (1)888-752-7585 or reach info@nycdatascience.com to share your openings and set up interviews with our excellent students.
---------------------------------------------------------------
Come join our meet-up and learn how easily you can use R for advanced Machine learning. In this meet-up, we will demonstrate how to understand and use Xgboost for Kaggle competition. Tong is in Canada and will do remote session with us through google hangout.
---------------------------------------------------------------
Speaker Bio:
Tong is a data scientist in Supstat Inc and also a master students of Data Mining. He has been an active R programmer and developer for 5 years. He is the author of the R package of XGBoost, one of the most popular and contest-winning tools on kaggle.com nowadays.
Pre-requisite(if any): R /Calculus
Preparation: A laptop with R installed. Windows users might need to have RTools installed as well.
Agenda:
Introduction of Xgboost
Real World Application
Model Specification
Parameter Introduction
Advanced Features
Kaggle Winning Solution
Event arrangement:
6:45pm Doors open. Come early to network, grab a beer and settle in.
7:00-9:00pm XgBoost Demo
Reference:
https://github.com/dmlc/xgboost
Hidrolik Yük Asansörü Tasarımı ve Maliyet Analizitst34
Bu projede hidrolik yük asansörleri ile ilgili geniş bi araştırma yapılarak, 5 ton yük kaldırması planlanan bir hidrolik yük asansörü tasarlanarak tüm mukavemet hesapları gerçekleştirilmiştir.
Data mining involves discovering patterns from large data sources and has evolved from database technology. It includes data cleaning, integration, selection, transformation, mining, evaluation, and presentation. Mining can occur on different data sources and involves characterizing, associating, classifying, clustering, and identifying outliers and trends in data. Major issues include scalability, noise handling, pattern evaluation, and privacy concerns.
YZ insan istihbarat süreçlerinin makineler, özellikle de bilgisayar sistemleri ile simülasyonudur. Bu süreçler arasında öğrenme (bilgi edinme için bilgi ve kuralların edinilmesi), mantıksallaştırma (yaklaşık veya nihYZ sonuçlara ulaşmak için kuralları kullanarak) ve kendini düzeltme yer alır. YZ'nın özel uygulamaları, uzman sistem konuşma tanıma ve suni görme içerir.
The document discusses various decision tree learning methods. It begins by defining decision trees and issues in decision tree learning, such as how to split training records and when to stop splitting. It then covers impurity measures like misclassification error, Gini impurity, information gain, and variance reduction. The document outlines algorithms like ID3, C4.5, C5.0, and CART. It also discusses ensemble methods like bagging, random forests, boosting, AdaBoost, and gradient boosting.
This document describes using machine learning techniques to detect heart disease. It discusses applying data analytics methods like SVM and genetic algorithms to large datasets to better predict, prevent, and manage cardiovascular diseases. The proposed system aims to use these machine learning methods to predict heart attacks and reduce treatment costs by providing effective treatments. It evaluates models based on accuracy, elapsed time, and energy consumption to determine the best optimized prediction model.
Introduction to machine learning. Basics of machine learning. Overview of machine learning. Linear regression. logistic regression. cost function. Gradient descent. sensitivity, specificity. model selection.
The document discusses the random forest algorithm. It introduces random forest as a supervised classification algorithm that builds multiple decision trees and merges them to provide a more accurate and stable prediction. It then provides an example pseudocode that randomly selects features to calculate the best split points to build decision trees, repeating the process to create a forest of trees. The document notes key advantages of random forest are that it avoids overfitting and can be used for both classification and regression tasks.
This document provides an overview of behavioural economics. It begins by explaining that behavioural economics has emerged from psychological studies exploring biases in decision-making. It then contrasts the assumptions of classic economics, which considers consumers to be entirely rational, with the findings of behavioural economics and psychology, which recognize that consumers are emotional and can be persuaded in irrational ways. The document goes on to provide examples of behavioral economic concepts in action from various companies. It also describes the two thinking systems - system 1 being fast, emotional thinking and system 2 being slow, logical thinking. Finally, it outlines and explains a number of key behavioral economic principles that influence human decision-making.
Data mining involves discovering patterns from large data sources and has evolved from database technology. It includes data cleaning, integration, selection, transformation, mining, evaluation, and presentation. Mining can occur on different data sources and involves characterizing, associating, classifying, clustering, and identifying outliers and trends in data. Major issues include scalability, noise handling, pattern evaluation, and privacy concerns.
YZ insan istihbarat süreçlerinin makineler, özellikle de bilgisayar sistemleri ile simülasyonudur. Bu süreçler arasında öğrenme (bilgi edinme için bilgi ve kuralların edinilmesi), mantıksallaştırma (yaklaşık veya nihYZ sonuçlara ulaşmak için kuralları kullanarak) ve kendini düzeltme yer alır. YZ'nın özel uygulamaları, uzman sistem konuşma tanıma ve suni görme içerir.
The document discusses various decision tree learning methods. It begins by defining decision trees and issues in decision tree learning, such as how to split training records and when to stop splitting. It then covers impurity measures like misclassification error, Gini impurity, information gain, and variance reduction. The document outlines algorithms like ID3, C4.5, C5.0, and CART. It also discusses ensemble methods like bagging, random forests, boosting, AdaBoost, and gradient boosting.
This document describes using machine learning techniques to detect heart disease. It discusses applying data analytics methods like SVM and genetic algorithms to large datasets to better predict, prevent, and manage cardiovascular diseases. The proposed system aims to use these machine learning methods to predict heart attacks and reduce treatment costs by providing effective treatments. It evaluates models based on accuracy, elapsed time, and energy consumption to determine the best optimized prediction model.
Introduction to machine learning. Basics of machine learning. Overview of machine learning. Linear regression. logistic regression. cost function. Gradient descent. sensitivity, specificity. model selection.
The document discusses the random forest algorithm. It introduces random forest as a supervised classification algorithm that builds multiple decision trees and merges them to provide a more accurate and stable prediction. It then provides an example pseudocode that randomly selects features to calculate the best split points to build decision trees, repeating the process to create a forest of trees. The document notes key advantages of random forest are that it avoids overfitting and can be used for both classification and regression tasks.
This document provides an overview of behavioural economics. It begins by explaining that behavioural economics has emerged from psychological studies exploring biases in decision-making. It then contrasts the assumptions of classic economics, which considers consumers to be entirely rational, with the findings of behavioural economics and psychology, which recognize that consumers are emotional and can be persuaded in irrational ways. The document goes on to provide examples of behavioral economic concepts in action from various companies. It also describes the two thinking systems - system 1 being fast, emotional thinking and system 2 being slow, logical thinking. Finally, it outlines and explains a number of key behavioral economic principles that influence human decision-making.
Eğitimde Bilişim Teknolojileri dersim için hazırlamış olduğum sunumudur.Sınıfta çeşitli disiplinlerde öğrenciler bulunduğu için teknik detay içermeyen bir sunumdur.
2. BİRLİKTELİK KURALLARI
• Birliktelik kuralı, geçmiş verilerin analiz edilerek bu
veriler içindeki birliktelik davranışlarının tespiti ile
geleceğe yönelik çalışmalar yapılmasını destekleyen bir
yaklaşımdır.
• Birliktelik kurallarının kullanıldığı en tipik örnek Market
Sepeti Analizidir (Market Basket Analysis). Bu
işlem, müşterilerin yaptıkları alışverişlerdeki ürünler
arasındaki birliktelikleri bularak müşterilerin satın alma
alışkanlıklarını analiz eder. Bu tip birlikteliklerin
keşfedilmesi, müşterilerin hangi ürünleri bir arada
aldıkları bilgisini ortaya çıkarır ve market yöneticileri de
bu bilgi ışığında daha etkili satış stratejileri
geliştirebilirler.
Apriori Algoritması 2
3. Market Sepet Analizi
• Bir müşteri süt satın alıyorsa, aynı
alışverişte sütün yanında ekmek alma
olasılığı nedir? Bu tip bir bilgi ışığında
rafları düzenleyen market yöneticileri
ürünlerindeki satış oranını
arttırabilirler. Örneğin bir marketin
müşterilerinin süt ile birlikte ekmek
satın alma oranı yüksekse, market
yöneticileri süt ile ekmek raflarını yan
yana koyarak ekmek satışlarını
arttırabilirler.
• Örneğin; bir A ürününü satın alan
müşteriler aynı zamanda B ürününü
da satın alıyorlarsa, bu durum
Birliktelik Kuralı ile gösterilir.
Apriori Algoritması 3
4. APRIORI ALGORİTMASI
• Apriori algoritması, Agrawal ve Srikant
tarafından 1994 yılında geliştirilmiştir.
• Veri Madenciliğinde, birliktelik kuralı çıkarım
algoritmaları içerisinde en fazla bilinen ve
kullanılan algoritmadır.
• Algoritmanın ismi, yaygın nesnelerin önsel
bilgilerini kullanmasından yani bilgileri bir
önceki adımdan almasından “önceki (prior)”
anlamında aprioridir.
Apriori Algoritması 4
5. Temel Yaklaşım
• Öğe kümesi (itemset)
– Bir veya daha çok öğeden oluşan küme
– k-öğe kümesi (k-itemset): k öğeden oluşan küme
• 3-öğe kümesi: {Bal, Süt, Ekmek}
• Bu algoritmada temel yaklaşım, “eğer k-öğe
kümesi minimum destek kriterini
sağlıyorsa, bu kümenin alt kümeleri de
minimum destek kriterini sağlar. ” şeklindedir.
Apriori Algoritması 5
6. Destek ve Güven Kriterleri
• Birliktelik Kuralında, öğeler arasındaki birliktelik, destek ve
güven kriterleri ile hesaplanır.
• Destek (support) kriteri, veride öğeler arasındaki bağıntının ne
kadar sık olduğunu belirtir.
• X ve Y farklı ürünler olmak üzere,
– X ürünü için destek, tüm alışverişler içinde X ürününün oranıdır.
– X ve Y ürünleri için destek, X ve Y’ nin bir arada tüm alışverişler içinde
bulunma olasılığıdır.
Apriori Algoritması 6
7. Destek ve Güven Kriterleri
• Güven (confidence) kriteri ise Y ürününün hangi
olasılıkla X ürünü ile beraber olacağını söyler.
• Elde edilen kuralların güvenirliliği, destek ve güven
değerleri ile doğru orantılıdır.
Apriori Algoritması 7
8. Destek ve Güven Kriterleri
• Her kural bir destek ve güven değeri ile ifade edilir.
• A⇒B [destek = 2%, güven = 60%]
• Birliktelik kuralı için 2% destek değeri, analiz edilen
tüm alışverişlerden 2%’sinde A ile B ürünlerinin
birlikte satıldığını belirtir.
• 60% oranındaki güven değeri ise A ürününü satın
alan müşterilerin 60%’ının aynı alışverişte B ürününü
de satın aldığını gösterir.
Apriori Algoritması 8
9. Algoritmanın Adımları
1. Minimum destek sayısı (min.support ) ve minimum güven değerinin
(min.confidence) belirlenmesi
2. Öğe kümeler içerisindeki her bir öğenin destek değerinin bulunması
3. Minimum destek değerinden daha düşük desteğe sahip olan
öğelerin devre dışı bırakılması
4. Elde edilen tekli birliktelikler dikkate alınarak ikili birlikteliklerin
oluşturulması
5. Minimum destek değerinden düşük olan öğe kümelerin çıkartılması
6. Üçlü birlikteliklerin oluşturulması
7. Üçlü birlikteliklerden minimum destek değerini geçenlerin
dışındakilerin çıkarılması
8. Üçlü birlikteliklerden birliktelik kurallarının çıkarılması
Apriori Algoritması 9
10. Uygulama Alanları
• Eğitim
• Tıp
• Mühendislik
• Finans
• Telekomünikasyon
• Pazarlama
• Bankacılık
• E-Ticaret
• …
Apriori Algoritması 10
11. Kaynaklar
• Karabatak M. ve İnce M.C., Apriori Algoritması ile Öğrenci Başarısı
Analizi.
• Şen F., 2008, Veri Madenciliği ile Birliktelik Kurallarının
Bulunması, Sakarya Üniversitesi.
• Yıldız E., 2011, ASP.NET ile Kitap Takas Sitesi ve Birliktelik Kuralları ile
Kitap Önerileri Oluşturma Sistemi, Kocaeli Üniversitesi.
• Takçı H., 2008, Birliktelik Kuralları: Temel Kavramlar ve Algoritmalar.
• Altıntop Ü., 2006, Internet Tabanlı Öğretimde Veri Madenciliği
Tekniklerinin Uygulanması, Kocaeli Üniversitesi.
• Özseven T. ve Düğenci M., 2011, LOG Analiz: Erişim Kayıt Dosyaları
Analiz Yazılımı ve GOP Üniversitesi Uygulaması, Bilişim Teknolojileri
Dergisi, 4(2).
• Döşlü A., 2008, Veri Madenciliğinde Market Sepet Analizi ve
• Birliktelik Kurallarının Belirlenmesi, Yıldız Teknik Üniversitesi.
Apriori Algoritması 11