SlideShare a Scribd company logo
1 of 15
‫مشتریان‬ ‫خرید‬ ‫سبد‬ ‫تحلیل‬
Market Basket Analysis
Ehsan Kamali
Email
LinkedIn
Market Basket Analysis
1
‫ی‬‫ک‬‫ی‬‫ها‬ ‫دغدغه‬ ‫از‬‫ی‬‫بس‬ ‫امروزه‬‫ی‬‫ار‬‫ی‬‫ها‬ ‫شرکت‬ ‫از‬‫ی‬‫دارا‬‫ی‬‫و‬‫ی‬‫ژگ‬‫ی‬‫فروشگاه‬ ‫فروش‬‫ی‬‫و‬‫ی‬‫ا‬‫مفهوم‬ ،‫پخش‬‫ی‬‫نام‬ ‫به‬
‫تحل‬‫ی‬‫ل‬‫خر‬ ‫سبد‬‫ی‬‫د‬‫مشتر‬‫ی‬‫ان‬1
‫م‬‫ی‬‫باشد‬.
‫تحل‬‫ی‬‫ل‬‫خر‬ ‫سبد‬‫ی‬‫د‬‫مشتر‬‫ی‬‫مفاه‬ ‫با‬‫ی‬‫م‬‫ی‬‫چ‬ ‫همچون‬‫ی‬‫دمان‬‫فروشگاه‬ ‫فروش‬ ‫در‬ ‫هم‬ ‫کنار‬ ‫در‬ ‫ها‬ ‫کاال‬ ‫مناسب‬‫ی‬‫و‬‫ی‬‫ا‬
‫ا‬‫ی‬‫جاد‬‫ها‬ ‫بسته‬‫ی‬‫تخف‬ ‫مناسب‬‫ی‬‫ف‬‫ی‬‫پخش‬ ‫در‬‫سو‬ ‫هم‬‫م‬‫ی‬‫باشد‬.
‫تحل‬‫ی‬‫ل‬‫خر‬ ‫سبد‬‫ی‬‫د‬‫مشتر‬‫ی‬‫ان‬‫ا‬ ‫به‬‫ی‬‫ن‬‫م‬ ‫مفهوم‬‫ی‬‫مشتر‬ ‫رفتار‬ ‫شناخت‬ ‫با‬ ‫که‬ ‫باشد‬‫ی‬،‫ان‬‫مشتر‬ ‫اگر‬ ‫اغلب‬‫ی‬‫کاال‬‫ی‬a‫را‬
‫خر‬‫ی‬‫دار‬‫ی‬‫نما‬‫ی‬‫د‬‫احتمال‬ ‫چه‬ ‫با‬‫ی‬‫کاال‬‫ی‬b‫ن‬ ‫را‬‫ی‬‫ز‬‫خر‬‫ی‬‫دار‬‫ی‬‫م‬‫ی‬‫نما‬‫ی‬‫د‬.
‫با‬‫ا‬ ‫شدن‬ ‫مشخص‬‫ی‬‫ن‬‫قوان‬‫ی‬‫ن‬‫م‬‫ی‬‫ها‬ ‫مثال‬ ‫به‬ ‫توان‬‫یی‬‫ز‬ ‫موارد‬ ‫همچون‬‫ی‬‫ر‬‫دست‬‫ی‬‫افت‬:
‫ارتقا‬‫ی‬‫بازر‬‫ی‬‫اب‬‫ی‬‫فروش‬ ‫و‬:
‫فرض‬‫کن‬‫ی‬‫د‬‫ا‬ ‫به‬ ‫شده‬ ‫کشف‬ ‫قانون‬‫ی‬‫ن‬‫باشد‬ ‫صورت‬:
} ‫{همبرگر‬=<‫س‬ {‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬‫پ‬ ،‫ی‬‫از‬}
‫ا‬‫ی‬‫ن‬‫ا‬ ‫به‬ ‫رابطه‬‫ی‬‫ن‬‫م‬ ‫مفهوم‬‫ی‬‫مشتر‬ ‫اگر‬ ‫که‬ ‫باشد‬‫ی‬‫س‬‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬‫پ‬ ‫و‬‫ی‬‫از‬‫ز‬ ‫احتمال‬ ‫به‬ ‫بخرد‬‫ی‬‫اد‬‫ن‬ ‫همبرگر‬‫ی‬‫ز‬‫م‬‫ی‬.‫خرد‬
‫ا‬ ‫با‬ ‫پس‬‫ی‬‫ن‬‫م‬ ‫حساب‬‫ی‬‫توان‬‫ی‬‫م‬‫ا‬ ‫بسته‬‫ی‬‫ا‬ ‫شامل‬‫ی‬‫ن‬‫ا‬ ‫کاال‬ ‫سه‬‫ی‬‫جاد‬‫نما‬‫یی‬‫م‬‫مشتر‬ ‫به‬ ‫و‬‫ی‬‫ان‬‫نما‬ ‫ارائه‬‫یی‬‫م‬‫طرف‬ ‫از‬ .‫ی‬‫ا‬‫ی‬‫ن‬
‫برا‬ ‫را‬ ‫هشدار‬‫ی‬‫س‬ ‫فروش‬ ‫قطع‬ ‫صورت‬ ‫در‬ ‫که‬ ‫دارد‬ ‫ما‬‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬‫ی‬‫ا‬‫پ‬‫ی‬‫از‬‫م‬‫ی‬‫تواند‬‫شود‬ ‫همبرگر‬ ‫فروش‬ ‫در‬ ‫ضرر‬ ‫باعث‬.
‫مد‬‫ی‬‫ر‬‫ی‬‫ت‬‫سوپرمارکت‬ ‫در‬ ‫قفسه‬:
‫فرض‬‫کن‬‫ی‬‫د‬‫ا‬ ‫به‬ ‫شده‬ ‫کشف‬ ‫قانون‬‫ی‬‫ن‬‫باشد‬ ‫صورت‬:
} ‫{همبرگر‬=<‫س‬ {‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬‫پ‬ ،‫ی‬‫از‬}
‫با‬‫ا‬ ‫شدن‬ ‫مشخص‬‫ی‬‫ن‬‫م‬ ‫مارکت‬ ‫سوپر‬ ‫در‬ ‫رابطه‬‫ی‬‫ا‬ ‫توان‬‫ی‬‫ن‬‫س‬ ‫کنار‬ ‫در‬ ‫را‬ ‫همبرگر‬ ‫قفسه‬ ‫که‬ ‫داشت‬ ‫را‬ ‫فرض‬‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬
‫پ‬ ‫و‬‫ی‬‫از‬‫ده‬ ‫قرار‬‫ی‬‫م‬‫ب‬ ‫سوپرمارکت‬ ‫در‬ ‫همبرگر‬ ‫فروش‬ ‫احتمال‬ ‫تا‬‫ی‬‫شتر‬‫شود‬.
‫مد‬‫ی‬‫ر‬‫ی‬‫ت‬‫انبار‬:
‫با‬‫ا‬ ‫از‬ ‫استفاده‬‫ی‬‫ن‬‫ب‬ ‫در‬ ‫قواعد‬‫ی‬‫ن‬‫و‬ ‫قطعات‬‫ی‬‫ا‬‫مصرف‬ ‫مواد‬‫ی‬‫در‬‫ی‬‫ک‬‫م‬ ‫شرکت‬‫ی‬‫توان‬‫ی‬‫م‬‫ا‬ ‫به‬‫ی‬‫ن‬‫نت‬‫ی‬‫جه‬‫برس‬‫ی‬‫م‬‫به‬ ‫که‬‫ی‬‫نه‬
‫تر‬‫ی‬‫ن‬‫چ‬‫ی‬‫دمان‬‫وسا‬‫ی‬‫ل‬‫و‬ ‫باشد‬ ‫چگونه‬ ‫انبار‬ ‫در‬‫ی‬‫ا‬‫ی‬‫ک‬‫تعم‬‫ی‬‫رکار‬‫س‬‫ی‬‫ار‬‫ا‬ ‫بسته‬ ‫چه‬‫ی‬‫تجه‬ ‫از‬‫ی‬‫زات‬‫داشته‬ ‫همراه‬ ‫به‬ ‫اغلب‬ ‫را‬
‫بس‬ ‫احتمال‬ ‫با‬ ‫تا‬ ‫باشد‬‫ی‬‫ار‬‫باال‬‫یی‬‫تعم‬ ‫زمان‬ ‫در‬‫ی‬‫ر‬‫دچا‬‫ر‬‫محدود‬‫ی‬‫ت‬‫نشود‬ ‫قطعات‬.
1
Market Basket Analysis
Market Basket Analysis
2
‫سفارش‬‫خر‬‫ی‬‫د‬:
‫با‬‫ا‬ ‫شدن‬ ‫مشخص‬‫ی‬‫ن‬‫م‬ ‫قواعد‬‫ی‬‫در‬ ‫نمود‬ ‫مشخص‬ ‫توان‬‫ی‬‫ک‬‫مواد‬ ‫چه‬ ‫شرکت‬‫ی‬‫هم‬‫ی‬‫شه‬‫با‬‫ی‬‫د‬‫عنوان‬ ‫به‬‫ی‬‫ک‬‫در‬ ‫بسته‬
‫ها‬ ‫زمان‬ ‫به‬ ‫توجه‬ ‫با‬ ‫و‬ ‫باشند‬ ‫موجود‬ ‫شرکت‬‫ی‬‫ر‬ ‫برنامه‬ ‫هرکدام‬ ‫سفارش‬‫ی‬‫ز‬‫ی‬‫مناسب‬‫ی‬‫خر‬ ‫زمان‬ ‫خصوص‬ ‫در‬‫ی‬‫د‬‫آنها‬
‫ا‬ ‫تا‬ ‫شود‬ ‫انجام‬‫ی‬‫ن‬‫اهم‬ ‫با‬ ‫بسته‬‫ی‬‫ت‬‫هم‬‫ی‬‫شه‬‫موجود‬ ‫شرکت‬ ‫در‬‫ی‬‫باشد‬ ‫داشته‬.
‫برا‬‫ی‬‫رس‬‫ی‬‫دن‬‫ا‬ ‫به‬‫ی‬‫ن‬‫ن‬ ‫مفهوم‬‫ی‬‫از‬‫پ‬ ‫و‬ ‫اطالعات‬ ‫داشتن‬ ‫به‬‫ی‬‫ش‬‫ها‬ ‫فرض‬‫یی‬‫ز‬ ‫شرح‬ ‫به‬‫ی‬‫ر‬‫م‬‫ی‬‫باش‬‫ی‬‫م‬.
‫در‬‫کاو‬ ‫داده‬‫ی‬‫قواعد‬‫ی‬‫ا‬ ‫به‬‫ی‬‫ن‬‫وابستگ‬ ‫که‬ ‫شکل‬‫ی‬‫ب‬‫ی‬‫ن‬‫اعضا‬‫ی‬‫ی‬‫ک‬‫گ‬ ‫اندازه‬ ‫را‬ ‫مجموعه‬‫ی‬‫ر‬‫ی‬‫م‬‫ی‬‫نما‬‫ی‬،‫د‬‫قواعد‬ ‫عنوان‬ ‫با‬
‫انجمن‬‫ی‬2
‫م‬ ‫شناخته‬‫ی‬‫انجمن‬ ‫قواعد‬ ‫هدف‬ .‫شوند‬‫ی‬،‫شناسا‬‫یی‬‫قوان‬‫ی‬‫ن‬‫ی‬‫ا‬‫پا‬ ‫در‬ ‫قدرتمند‬ ‫قواعد‬‫ی‬‫گاه‬‫کارگ‬ ‫به‬ ‫با‬ ‫داده‬‫ی‬‫ر‬‫ی‬
‫بعض‬‫ی‬‫مع‬ ‫از‬‫ی‬‫ارها‬‫ی‬‫جذاب‬‫ی‬‫ت‬‫اس‬‫ت‬.
‫محقق‬‫ی‬‫ن‬‫انجمن‬ ‫قواعد‬ ،‫قدرتمند‬ ‫قواعد‬ ‫مفهوم‬ ‫براساس‬‫ی‬3
‫برا‬ ‫را‬‫ی‬‫محدود‬ ‫کشف‬‫ی‬‫ت‬‫ب‬ ‫ها‬‫ی‬‫ن‬‫ها‬ ‫داده‬ ‫در‬ ‫محصوالت‬‫یی‬
‫ها‬ ‫تراکنش‬ ‫از‬ ‫که‬‫ی‬‫ها‬ ‫دستگاه‬‫ی‬‫وجه‬ ‫پرداخت‬4
‫معرف‬ ‫است‬ ‫شده‬ ‫ثبت‬ ‫ها‬ ‫سوپرمارکت‬ ‫در‬‫ی‬‫برا‬ .‫کردند‬‫ی‬‫قاعده‬ ،‫مثال‬
‫ز‬‫ی‬‫ر‬:
} ‫{همبرگر‬=<‫س‬ {‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬‫پ‬ ،‫ی‬‫از‬}
‫در‬‫ها‬ ‫داده‬‫ی‬‫سو‬ ‫فروش‬‫پ‬‫م‬ ‫نشان‬ ‫رمارکت‬‫ی‬‫مشتر‬ ‫اگر‬ ‫که‬ ‫دهد‬‫ی‬‫پ‬‫ی‬‫از‬‫س‬ ‫و‬‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬‫ز‬ ‫احتمال‬ ‫به‬ ،‫بخرد‬‫ی‬‫اد‬‫همبرگر‬
‫خر‬ ‫خواهد‬ ‫هم‬ ‫را‬‫ی‬‫د‬‫چن‬ .‫ی‬‫ن‬‫اطالعات‬‫ی‬‫م‬ ‫را‬‫ی‬‫پا‬ ‫عنوان‬ ‫به‬ ‫توان‬‫ی‬‫ه‬‫تصم‬ ‫اساس‬ ‫و‬‫ی‬‫مات‬‫فعال‬ ‫در‬‫ی‬‫ت‬‫ها‬‫ی‬‫بازار‬‫ی‬‫اب‬‫ی‬‫فروش‬ ‫و‬
‫برد‬ ‫کار‬ ‫به‬.
‫تعر‬‫ی‬‫ف‬‫انجمن‬ ‫قواعد‬‫ی‬
‫مسئله‬‫انجمن‬ ‫قواعد‬ ‫کشف‬‫ی‬‫اول‬ ‫که‬‫ی‬‫ن‬‫توسط‬ ‫بار‬‫اگراوال‬5
‫ز‬ ‫صورت‬ ‫به‬ ‫شد‬ ‫مطرح‬ ‫همکارانش‬ ‫و‬‫ی‬‫ر‬‫تعر‬‫ی‬‫ف‬‫م‬‫ی‬،‫شود‬
‫کن‬ ‫فرض‬‫ی‬‫د‬:
I = {i1,i2,…,in}
2
Association Rule Mining
3
‫وابستگی‬ ‫قواعد‬
4
POS
5
Agrawal
Market Basket Analysis
3
‫مجموعه‬‫ا‬‫ی‬‫از‬n‫دودو‬ ‫صفت‬‫یی‬‫ا‬ ‫که‬ ‫است‬‫ی‬‫ن‬‫آ‬ ‫را‬ ‫مجموعه‬‫ی‬‫تم‬‫ها‬6
‫نامگذار‬‫ی‬‫م‬‫ی‬‫کن‬‫ی‬‫م‬.
‫عالوه‬‫برا‬‫ی‬‫ن‬‫م‬ ‫فرض‬‫ی‬‫کن‬‫ی‬‫م‬:
D = {t1,t2,…,tn}
‫مجموعه‬‫ا‬‫ی‬‫پا‬ ‫را‬ ‫آن‬ ‫که‬ ‫باشد‬ ‫ها‬ ‫تراکنش‬ ‫از‬‫ی‬‫گاه‬‫داده‬7
‫م‬‫ی‬‫نام‬‫ی‬‫م‬.
‫هر‬‫پا‬ ‫در‬ ‫تراکنش‬‫ی‬‫گاه‬‫داده‬( D )‫ی‬‫ک‬‫شناسا‬ ‫شماره‬‫یی‬‫ی‬‫کتا‬‫ز‬ ‫شامل‬ ‫و‬ ‫دارد‬‫ی‬‫رمجموعه‬‫ا‬‫ی‬‫آ‬ ‫از‬‫ی‬‫تم‬‫ها‬‫ی‬‫درون‬
‫مجموعه‬I‫است‬.
‫ی‬‫ک‬‫ز‬ ‫صورت‬ ‫به‬ ‫قاعده‬‫ی‬‫ر‬‫تعر‬‫ی‬‫ف‬‫م‬‫ی‬‫شود‬:
X => Y
‫با‬‫ا‬‫ی‬‫ن‬‫توض‬‫ی‬‫ح‬‫که‬X‫و‬Y‫ز‬‫ی‬‫رمجموعه‬‫ها‬‫یی‬‫از‬I‫اشتراک‬ ‫و‬ ‫هستند‬X‫با‬Y‫ته‬‫ی‬‫است‬.
‫هر‬‫آ‬ ‫از‬ ‫متفاوت‬ ‫مجموعه‬ ‫دو‬ ‫از‬ ‫قاعده‬‫ی‬‫تم‬‫تشک‬ ‫ها‬‫ی‬‫ل‬‫عنوان‬ ‫به‬ ‫که‬ ‫است‬ ‫شده‬«‫آ‬ ‫مجموعه‬‫ی‬‫تم‬‫ها‬»‫ن‬‫ی‬‫ز‬‫م‬ ‫شناخته‬‫ی‬
‫مثل‬ .‫شوند‬X‫و‬Y‫که‬ ،X‫آ‬ ‫مجموعه‬ ‫را‬‫ی‬‫تم‬‫ها‬‫ی‬‫و‬ ‫مقدم‬Y‫آ‬ ‫مجموعه‬ ‫را‬‫ی‬‫تم‬‫ها‬‫ی‬‫م‬ ‫متاثر‬‫ی‬‫نام‬‫ی‬‫م‬.
‫برا‬‫ی‬‫توض‬‫ی‬‫ح‬‫مثال‬ ‫مفهوم‬‫ی‬‫خر‬ ‫سبد‬ ‫از‬‫ی‬‫د‬‫م‬ ‫کار‬ ‫به‬ ‫را‬ ‫سوپرمارکت‬ ‫در‬‫ی‬‫بر‬‫ی‬‫م‬‫آ‬ ‫مجموعه‬ .‫ی‬‫تم‬‫ز‬ ‫صورت‬ ‫به‬ ‫ها‬‫ی‬‫ر‬‫است‬:
I = { Milk, Bread, Butter, Beer, Diapers}
6
Items
7
DataBase
Market Basket Analysis
4
‫و‬‫ی‬‫ک‬‫پا‬‫ی‬‫گاه‬‫آ‬ ‫شامل‬ ‫کوچک‬ ‫داده‬‫ی‬‫تم‬‫ها‬‫ی‬1‫معن‬ ‫به‬‫ی‬‫و‬ ‫وجود‬۰‫معن‬ ‫به‬‫ی‬‫آ‬ ‫وجود‬ ‫عدم‬‫ی‬‫تم‬‫به‬ ‫که‬ ‫است‬ ‫تراکنش‬ ‫در‬
‫ز‬ ‫جدول‬ ‫صورت‬‫ی‬‫ر‬‫نما‬‫ی‬‫ش‬‫م‬ ‫داده‬‫ی‬‫شود‬:
‫برا‬‫ی‬‫مثال‬‫ی‬‫ک‬‫وابستگ‬ ‫قاعده‬‫ی‬‫انجمن‬ ‫با‬‫ی‬‫پا‬ ‫در‬ ‫موجود‬‫ی‬‫گاه‬‫ز‬ ‫صورت‬ ‫به‬ ‫داده‬‫ی‬‫ر‬‫است‬:
{Beer,Butter} => {Milk}
‫معن‬‫ی‬‫ا‬ ‫فوق‬ ‫قاعده‬‫ی‬‫ن‬‫مشتر‬ ‫اگر‬ ‫که‬ ‫است‬‫ی‬‫نوش‬ ‫هم‬ ‫و‬ ‫کره‬ ‫هم‬‫ی‬‫دن‬‫ی‬‫ش‬ ‫بخرد‬‫ی‬‫ر‬‫خر‬ ‫خواهد‬ ‫هم‬‫ی‬‫د‬.
‫برا‬‫ی‬‫قوان‬ ‫انتخاب‬‫ی‬‫ن‬‫ب‬ ‫از‬ ‫جذاب‬‫ی‬‫ن‬‫قوان‬ ‫مجموعه‬‫ی‬‫ن‬‫محدود‬ ،‫ممکن‬‫ی‬‫ت‬‫ها‬‫ی‬‫رو‬ ‫مختلف‬‫ی‬‫مع‬‫ی‬‫ارها‬‫ی‬‫اهم‬ ‫سنجش‬‫ی‬‫ت‬
‫جذاب‬ ‫و‬‫ی‬‫ت‬‫م‬ ‫کار‬ ‫به‬‫ی‬‫رود‬‫تر‬ ‫معروف‬ .‫ی‬‫ن‬‫محدود‬‫ی‬‫ت‬‫ها‬‫ضرا‬ ‫شامل‬‫ی‬‫ب‬‫اطم‬‫ی‬‫نان‬‫پشت‬ ‫و‬‫ی‬‫بان‬‫ی‬‫است‬.
‫پشت‬‫ی‬‫بان‬‫پشت‬ :‫ی‬‫بان‬‫آ‬ ‫مجموعه‬‫ی‬‫تم‬X‫صورت‬ ‫به‬ ‫که‬Supp(X)‫م‬ ‫داده‬ ‫نشان‬‫ی‬‫ها‬ ‫تراکنش‬ ‫نسبت‬ ،‫شود‬‫ی‬‫شامل‬
‫آ‬ ‫مجموعه‬‫ی‬‫تم‬X‫پا‬ ‫در‬ .‫است‬‫ی‬‫گاه‬‫آ‬ ‫مجموعه‬ ،‫مثال‬ ‫داده‬‫ی‬‫تم‬{Milk,Bread,Butter}‫دارا‬‫ی‬‫پشت‬‫ی‬‫بان‬5/1=۰.2
‫م‬‫ی‬‫ا‬ ‫که‬ ‫چرا‬ .‫باشد‬‫ی‬‫ن‬‫آ‬ ‫مجموعه‬‫ی‬‫تم‬‫در‬2۰‫م‬ ‫اتفاق‬ ‫مواقع‬ ‫درصد‬‫ی‬‫افتد‬.
‫اطم‬‫ی‬‫نان‬:‫ضر‬‫ی‬‫ب‬‫اطم‬‫ی‬‫نان‬‫ی‬‫ک‬‫ا‬ ‫به‬ ‫قانون‬‫ی‬‫ن‬‫تعر‬ ‫صورت‬‫ی‬‫ف‬‫م‬‫ی‬‫شود‬:
Conf(X=>Y) = Supp(X U Y)/Supp(X)
‫برا‬‫ی‬‫قانون‬ ‫در‬ ‫مثال‬{ Milk,Bread } => { Butter }‫دارا‬‫ی‬‫اطم‬‫ی‬‫نان‬۰.2/۰.4=۰.5‫م‬‫ی‬‫ا‬ ‫به‬ .‫باشد‬‫ی‬‫ن‬‫معنا‬
‫برا‬ ‫فوق‬ ‫قانون‬ ‫که‬‫ی‬‫تراکنش‬ ‫درصد‬ ‫پنجاه‬‫ها‬‫ی‬‫شامل‬8
ilkM‫و‬9
Bread‫م‬ ‫صدق‬‫ی‬‫کند‬.
‫عالوه‬‫ا‬ ‫بر‬‫ی‬‫ن‬‫مع‬ ،‫موارد‬‫ی‬‫ارها‬‫ی‬‫د‬‫ی‬‫گر‬‫ی‬‫ن‬‫ی‬‫ز‬‫برا‬‫ی‬‫جذاب‬ ‫سنجش‬‫ی‬‫ت‬‫قوان‬‫ی‬‫ن‬‫تر‬ ‫مهم‬ ‫از‬ ‫که‬ ،‫است‬ ‫شده‬ ‫مطرح‬‫ی‬‫ن‬‫آن‬‫ها‬
‫م‬‫ی‬‫توان‬‫ز‬ ‫موارد‬ ‫به‬‫ی‬‫ر‬‫کرد‬ ‫اشاره‬:
8
‫شیر‬
9
‫نان‬
DiapersBeerButterBreadMilkID
000111
001002
110003
001114
000105
Market Basket Analysis
5
‫اطم‬‫ی‬‫نان‬-‫جمع‬ ‫توان‬ ،‫کامل‬‫ی‬،‫عق‬‫ی‬،‫ده‬‫باالبر‬ ،‫نفوذ‬‫ی‬
‫در‬‫الگور‬ ،‫زمان‬ ‫طول‬‫ی‬‫تم‬‫ها‬‫ی‬‫متعدد‬‫ی‬‫برا‬‫ی‬‫تول‬‫ی‬‫د‬‫قوان‬‫ی‬‫ن‬‫وابستگ‬‫ی‬‫پ‬‫ی‬‫شنهاد‬‫شده‬‫اند‬.
‫بعض‬‫ی‬‫الگور‬‫ی‬‫تم‬‫ها‬‫ی‬‫ا‬ ‫در‬ ‫معروف‬‫ی‬‫ن‬‫زم‬‫ی‬‫نه‬‫آپر‬ :‫از‬ ‫عبارتند‬‫ی‬‫ور‬‫ی‬1۰
،‫اکالت‬11
‫و‬‫رشد‬ ‫مکرر‬ ‫الگوهای‬12
‫تمام‬‫ی‬‫ا‬‫ی‬‫ن‬
‫الگور‬‫ی‬‫تم‬‫ها‬‫ن‬ ‫دهنده‬ ‫انجام‬ ‫تنها‬‫ی‬‫م‬‫ی‬‫مس‬ ‫از‬‫ی‬‫ر‬‫تول‬‫ی‬‫د‬‫قوان‬‫ی‬‫ن‬‫وابستگ‬‫ی‬‫ا‬ ‫که‬ ‫چرا‬ .‫هستند‬‫ی‬‫ن‬‫الگور‬‫ی‬‫تم‬‫ها‬‫برا‬‫ی‬‫کاوش‬
‫آ‬ ‫مجموعه‬‫ی‬‫تم‬‫ها‬‫ی‬‫مکرر‬13
‫شده‬ ‫ساخته‬‫اند‬‫د‬ ‫پروسه‬ ‫و‬‫ی‬‫گر‬‫ی‬‫رو‬‫ی‬‫آ‬ ‫مجموعه‬‫ی‬‫تم‬‫ها‬‫ی‬‫با‬ ‫مکرر‬‫ی‬‫د‬‫منته‬ ‫تا‬ ‫شود‬ ‫انجام‬‫ی‬
‫قوان‬ ‫به‬‫ی‬‫ن‬‫وابستگ‬‫ی‬‫شوند‬.
‫الگور‬‫ی‬‫تم‬‫رشد‬ ‫مکرر‬ ‫الگوهای‬14
‫روش‬‫جالب‬‫ی‬‫تول‬ ‫بدون‬ ‫را‬ ‫پرتکرار‬ ‫اقالم‬ ‫مجموعه‬ ‫که‬‫ی‬‫د‬‫کاند‬ ‫اقالم‬ ‫مجموعه‬‫ی‬‫د‬‫م‬ ‫دست‬ ‫به‬‫ی‬،‫آورد‬‫رشد‬ ‫مکرر‬ ‫الگوهای‬
‫نام‬‫ی‬‫ده‬‫م‬‫ی‬‫از‬ ‫که‬ ‫شود‬‫ی‬‫ک‬‫استراتژ‬‫ی‬‫تقس‬‫ی‬‫م‬‫م‬ ‫استفاده‬ ‫وحل‬‫ی‬‫ا‬ .‫کند‬‫ی‬‫ن‬‫پا‬ ‫روش‬‫ی‬‫گاه‬‫ا‬ ‫مجموعه‬ ‫به‬ ‫را‬ ‫داده‬‫ی‬‫پا‬ ‫از‬‫ی‬‫گاه‬
‫هرکدام‬ ‫که‬ ‫ها‬ ‫داده‬‫ی‬‫ک‬‫تقس‬ ،‫دارند‬ ‫پرتکرار‬ ‫قلم‬‫ی‬‫م‬‫م‬‫ی‬‫ه‬ ‫و‬ ‫کند‬‫ر‬‫پا‬‫ی‬‫گاه‬‫م‬ ‫کاوش‬ ‫جداگانه‬ ‫را‬ ‫داده‬‫ی‬‫کند‬.
‫در‬‫اول‬‫ی‬‫ن‬‫پا‬ ‫اسکن‬‫ی‬‫گاه‬‫همانند‬ ‫داده‬‫آ‬‫پر‬‫ی‬‫ور‬‫ی‬15
‫آ‬ ‫مجموعه‬‫ی‬‫تم‬‫ها‬‫ی‬‫ی‬‫ک‬‫عضو‬‫ی‬‫پشت‬ ‫و‬‫ی‬‫بان‬‫ی‬‫م‬ ‫مشخص‬ ‫آنها‬‫ی‬.‫شود‬
‫ترت‬ ‫به‬ ‫پرتکرار‬ ‫اقالم‬ ‫مجموعه‬‫ی‬‫ب‬‫نزول‬‫ی‬‫پشت‬‫ی‬‫بان‬‫ی‬‫م‬ ‫مرتب‬ ‫شان‬‫ی‬‫شوند‬.
‫سپس‬‫ی‬‫ک‬‫ا‬ ‫به‬ ‫درخت‬‫ی‬‫ن‬‫م‬ ‫ساخته‬ ‫صورت‬‫ی‬‫ر‬ ‫ّل‬‫و‬‫ا‬ :‫که‬ ‫شود‬‫ی‬‫شة‬‫با‬ ‫درخت‬‫خالی‬ ‫برچسب‬16
‫م‬ ‫ساخته‬‫ی‬‫از‬ ‫بعد‬ .‫شود‬
‫پا‬ ‫آن‬‫ی‬‫گاه‬‫برا‬ ‫داده‬‫ی‬‫م‬ ‫اسکن‬ ‫دوم‬ ‫بار‬‫ی‬‫به‬ ‫تراکنش‬ ‫هر‬ ‫اقالم‬ .‫شود‬‫ترتی‬‫ب‬L‫م‬ ‫پردازش‬‫ی‬‫و‬ ‫شوند‬‫ی‬‫ک‬‫برا‬ ‫شاخه‬‫ی‬‫هر‬
‫ا‬ ‫تراکنش‬‫ی‬‫جاد‬‫م‬‫ی‬.‫شود‬‫تسه‬ ‫منظور‬ ‫به‬‫ی‬‫ل‬‫پ‬‫ی‬‫ما‬‫ی‬‫ش‬،‫درخت‬‫ی‬‫ک‬‫م‬ ‫ساخته‬ ‫جدول‬‫ی‬‫شود‬‫محل‬ ‫به‬ ‫درآن‬ ‫قلم‬ ‫هر‬ ‫که‬
‫در‬ ‫خودش‬‫م‬ ‫اشاره‬ ‫درخت‬‫ی‬‫تراکنش‬ ‫همه‬ ‫اسکن‬ ‫از‬ ‫پس‬ ‫درخت‬ .‫کند‬‫م‬ ‫کامل‬ ‫ها‬‫ی‬‫شود‬17
.
10
Apriori
11
Eclat
12
Frequent Patterns Growth
13
Frequent item-set mining
14
Fp-growth
15
https://en.wikipedia.org/wiki/Apriori_algorithm
16
Null
17
:‫نمایید‬ ‫مراجعه‬ ‫زیر‬ ‫آدرس‬ ‫به‬ ‫بیشتر‬ ‫اطالعات‬ ‫برای‬
-https://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Frequent_Pattern_Mining/The_FP
Growth_Algorithm
Market Basket Analysis
6
‫به‬‫همین‬‫منظور‬‫یک‬‫نمونه‬‫از‬‫کشف‬‫قواعد‬‫انجمنی‬‫بر‬‫روی‬‫داده‬‫های‬‫یک‬‫شرکت‬‫دارای‬‫سیستم‬‫فروش‬‫فروشگاهی‬
‫انجام‬‫شد‬.
‫به‬‫علت‬‫واقعی‬‫بودن‬‫داده‬‫ها‬‫از‬‫ذکر‬‫کد‬‫کاال‬‫و‬‫عنوان‬‫کاال‬‫خودداری‬‫می‬‫شود‬.
‫پایگاه‬‫داده‬‫شرکت‬ ‫این‬ ‫فروشگاهی‬ ‫فروش‬ ‫افزار‬ ‫نرم‬SQL‫می‬‫باشد‬‫ولی‬‫تجزیه‬‫و‬‫تحلیل‬‫اطالعات‬‫با‬‫ابزار‬‫تخصصی‬
18
Rapidminer‫انجام‬‫می‬‫شود‬.‫این‬‫تجزیه‬‫و‬‫تحلیل‬‫ها‬‫قابلیت‬‫انجام‬‫از‬‫طریق‬SQL‫را‬‫دارد‬‫اما‬‫به‬‫علت‬‫تخصصی‬
‫نبودن‬،‫دارای‬‫محدودیت‬‫ها‬‫و‬‫کندی‬‫های‬‫زیادی‬‫می‬‫باشد‬‫داده‬ ‫پایگاه‬ ‫این‬ ‫های‬ ‫نسخه‬ ‫جدیدترین‬ ‫در‬ ‫حتی‬ ‫که‬19
‫همانند‬ ‫نویسی‬ ‫برنامه‬ ‫های‬ ‫زبان‬ ‫از‬ ‫کمک‬ ‫بدون‬R.‫نمود‬ ‫پیدا‬ ‫دست‬ ‫نظر‬ ‫مورد‬ ‫نتیجه‬ ‫به‬ ‫توان‬ ‫می‬ ‫سختی‬ ‫به‬‫به‬‫عنوان‬
‫نمونه‬‫در‬‫تشکیل‬‫ماتریس‬‫وابستگی‬‫به‬‫علت‬‫محدودیت‬4۰96‫ستونی‬‫در‬‫هر‬‫خروجی‬‫اسکریپت‬‫ها‬‫در‬TSQL،
‫تشکیل‬‫چنین‬‫جدولی‬‫در‬‫صورت‬‫زیاد‬‫بودن‬‫اطالعات‬‫امکان‬‫پذیر‬‫نمی‬‫باشد‬‫و‬‫این‬‫جدول‬‫باید‬‫با‬‫ابزار‬‫دیگری‬‫ساخته‬
‫شود‬.
‫در‬‫گام‬‫اول‬‫ابتدا‬‫اطالعات‬‫را‬‫از‬‫جداول‬‫مربوط‬‫به‬‫فروشگاهی‬‫خارج‬‫میکنیم‬‫و‬‫در‬‫جدول‬‫دیگری‬‫قرار‬‫میدهیم‬.‫در‬‫این‬
‫مورد‬‫به‬‫علت‬‫نیاز‬،‫بررسی‬ ‫مورد‬ ‫شرکت‬‫صرفا‬‫اطالعات‬‫سال‬‫های‬2۰15‫به‬‫بعد‬‫مورد‬‫نیاز‬‫بوده‬‫است‬:
if object_id ('dbo.DM','u')is not null drop table dbo.DM
GO
select InvoiceRef,PartRef
into dbo.DM
from pos.PosInvoiceItm
where InvoiceRef in (
select InvoiceId from pos.posinvoice
where datepart(year,date) >=2015)
GO
18
‫علت‬‫انتخاب‬‫این‬‫ابزار‬‫تصویری‬‫بودن‬‫آن‬‫و‬‫سادگی‬‫در‬‫کارکرد‬‫و‬‫عدم‬‫نیاز‬‫به‬‫دانش‬‫برنامه‬‫نویسی‬‫می‬‫باشد‬‫در‬‫غیر‬‫این‬‫صورت‬‫می‬‫توان‬‫از‬
‫ابزار‬‫های‬‫دیگری‬‫نیز‬‫استفاده‬‫نمود‬
19
DataBase
Market Basket Analysis
7
‫برای‬‫مرتب‬‫کردن‬‫داده‬‫ها‬‫همانطور‬‫که‬‫از‬‫مفاهیم‬‫داده‬‫ها‬‫مشخص‬‫است‬‫ما‬‫نیازی‬‫به‬‫فاکتورهای‬‫با‬‫تک‬‫ردیف‬‫نداریم‬
‫چون‬‫تعداد‬‫خرید‬‫یک‬‫کاال‬‫در‬‫نتیجه‬‫ما‬‫موثر‬‫نیست‬‫و‬‫صرفا‬‫کنار‬‫هم‬‫قرار‬‫گرفتن‬‫کاال‬‫ها‬‫برای‬‫ما‬‫با‬‫اهمیت‬‫است‬:
with CTE_RemoveOnePart AS (
SELECT InvoiceRef, COUNT(Partref) AS Cnt
FROM dbo.DM
GROUP BY InvoiceRef
HAVING (COUNT(Partref) = 1))
delete dbo.DM
where InvoiceRef in (
select InvoiceRef from CTE_RemoveOnePart)
GO
‫به‬‫عنوان‬‫داده‬‫های‬‫پرت‬2۰
‫در‬‫این‬‫مفهوم‬‫کاالهایی‬‫که‬‫در‬‫این‬‫بازه‬‫زمانی‬‫صرفا‬‫یکبار‬‫فروخته‬‫شده‬‫اند‬‫قواعد‬‫مناسبی‬
‫را‬‫ارائه‬‫نمیدهند‬‫چون‬‫احتمال‬‫تصادفی‬‫بودن‬‫آن‬‫خرید‬‫بسیار‬‫باال‬‫می‬‫باشد‬.‫به‬‫این‬‫منظور‬‫با‬‫دستور‬‫زیر‬‫این‬‫موارد‬‫را‬
‫حذف‬‫می‬‫کنیم‬:
With CTE_RemoveOnlyOneFrequence AS (
select PartRef,count(PartRef) Cntr from dbo.DM
group by PartRef
having count(PartRef)<10)
delete dbo.DM
where PartRef in (select PartRef from
CTE_RemoveOnlyOneFrequence)
Go
‫پس‬‫از‬‫این‬‫فراهم‬‫سازی‬‫و‬‫پیش‬‫پردازش‬‫داده‬‫ها‬‫نیاز‬‫به‬‫جدولی‬‫داریم‬‫که‬‫در‬‫آن‬‫ستون‬‫ها‬‫عنوان‬‫کاال‬‫باشند‬‫و‬‫در‬
‫سطر‬‫ها‬‫به‬‫ازای‬‫هر‬‫فاکتور‬‫فروش‬‫مشخص‬‫نماید‬‫که‬‫چه‬‫کاالهایی‬‫وجود‬‫داشته‬‫اند‬.‫مقادیر‬‫موجود‬‫از‬‫نوع‬‫باینری‬
20
Outlier
Market Basket Analysis
8
‫می‬‫باشند‬‫زیرا‬‫مقدار‬‫اشاره‬‫به‬‫وجود‬‫و‬‫یا‬‫عدم‬‫وجود‬‫کاال‬‫در‬‫فاکتور‬‫مربوطه‬‫دارد‬‫و‬‫این‬‫مقادیر‬‫باینری‬‫از‬‫نوع‬‫باینری‬
‫متقارن‬‫می‬‫باشند‬.
‫برای‬‫تشکیل‬‫چنین‬‫ماتریسی‬‫از‬‫دستور‬‫زیر‬‫استفاده‬‫می‬‫نماییم‬:
/*****Create PivoteTable*****/
DECLARE @COL NVARCHAR(MAX) ='',@SQL NVARCHAR(MAX) =''
DECLARE @COL2 NVARCHAR(MAX) =''
SELECT @COL+= ','+QUOTENAME(Partref)FROM
(
select distinct Partref from dbo.DM
) AS D
SELECT @COL2+= ', isnull ('+QUOTENAME(Partref)+' , 0)'+ ' As '+QUOTENAME(Partref) FROM
(
select distinct Partref
from dbo.DM) AS D
SELECT @COL= SUBSTRING (@COL,2,LEN(@COL)-1)
SELECT @COL2= SUBSTRING (@COL2,2,LEN(@COL2)-1)
SELECT @SQL= 'SELECT InvoiceRef, '+ @COL2 +'
FROM (
select InvoiceRef, Partref from dbo.DM
) AS J
PIVOT
(
Count (Partref) FOR Partref IN ('+ @COL +'
)) AS P '
exec sp_executesql @sql
‫نکته‬:‫در‬‫صورتی‬‫که‬‫تعداد‬‫کاال‬‫ها‬‫بیش‬‫از‬4۰96‫عدد‬‫باشد‬‫نمی‬‫توان‬‫این‬‫خروجی‬‫را‬‫از‬SQL‫تهیه‬‫نمود‬‫و‬‫باید‬‫با‬
‫ابزار‬‫های‬‫دیگری‬‫همانند‬‫اکسل‬(‫در‬‫صورت‬‫توانایی‬‫پردازش‬‫حجم‬‫بسیار‬‫زیاد‬‫اطالعات‬)!!!‫با‬‫توجه‬‫به‬‫مفهوم‬‫ذکر‬
‫شده‬،‫ایجاد‬‫نمود‬.
‫خروجی‬‫ایجاد‬‫شده‬‫را‬‫در‬‫یک‬‫فایل‬‫اکسل‬‫یا‬CSV‫قرار‬‫می‬‫دهیم‬‫که‬‫در‬‫این‬‫مورد‬‫به‬‫علت‬‫زیاد‬‫بودن‬‫داده‬‫ها‬‫آن‬‫را‬
‫در‬‫فایل‬CSV‫قرار‬‫دادیم‬.
‫در‬‫خروجی‬‫اطالعات‬‫ماتریس‬‫دارای‬‫حجم‬1۰718176‫دیتا‬‫می‬‫باشد‬:
Market Basket Analysis
9
‫حال‬‫این‬‫خروجی‬‫را‬‫وارد‬‫نرم‬‫افزار‬Rapidminer‫می‬‫کنیم‬‫و‬‫تنظیمات‬‫الزم‬‫را‬‫انجام‬‫می‬‫دهیم‬:
‫در‬‫ابتدا‬‫با‬‫پردازشگر‬Read CSV‫فایل‬‫ماتریسی‬‫آماده‬‫شده‬‫در‬‫مرحله‬‫قبل‬‫را‬‫وارد‬‫نرم‬‫افزار‬‫می‬‫نماییم‬:
Market Basket Analysis
10
‫چون‬‫در‬‫فایل‬‫ما‬‫از‬‫کاراکتر‬‫فاصله‬‫برای‬‫جدا‬‫کردن‬‫اطالعات‬‫استفاده‬‫نمودیم‬‫در‬‫این‬‫تنظیمات‬‫باید‬‫کاراکتر‬‫فاصله‬‫را‬
‫برای‬‫جدا‬‫کردن‬‫اطالعات‬‫مشخص‬‫نماییم‬.
‫پس‬‫از‬‫آن‬‫پردازشگر‬‫مربوط‬‫به‬‫الگوریتم‬‫رشد‬ ‫مکرر‬ ‫الگوهای‬21
‫را‬‫انتخاب‬‫میکنیم‬‫تا‬‫تشکیل‬‫قواعد‬‫انجمنی‬‫را‬‫انجام‬
‫دهیم‬.‫این‬‫عملگر‬‫جزو‬‫عملگرهای‬‫موارد‬ ‫مجموعه‬ ‫از‬ ‫مکرر‬ ‫استخراج‬22
‫می‬‫باشند‬‫به‬‫این‬‫مفهوم‬‫که‬‫کار‬‫آنها‬‫نمایش‬
‫مجموعه‬‫اشیا‬‫متداول‬‫و‬‫تعیین‬‫این‬‫که‬‫کدام‬‫یک‬‫از‬‫مجموعه‬‫اشیا‬‫در‬‫کنار‬‫هم‬‫قرار‬‫گرفته‬،‫اند‬‫می‬‫باشد‬.
‫این‬‫عملگر‬‫دارای‬‫پارامتر‬‫های‬‫متفاوتی‬‫می‬‫باشد‬‫که‬‫مهمترین‬‫پارامتر‬‫آن‬‫پشتیبانی‬ ‫حداقل‬23
‫می‬‫باشد‬‫که‬‫حداقل‬
‫ضریب‬‫پشتیبانی‬‫را‬‫برای‬‫مجموعه‬‫های‬‫شناسایی‬‫شده‬‫مشخص‬‫می‬‫نماید‬‫و‬‫مجموعه‬‫های‬‫با‬‫ضریب‬‫پشتیبانی‬‫کمتر‬
‫از‬‫آن‬‫را‬‫در‬‫نظر‬‫نمیگیرد‬‫و‬‫از‬‫محدوده‬‫ارزیابی‬‫خارج‬‫می‬‫نماید‬.‫در‬‫این‬‫مورد‬‫حداقل‬‫مقدار‬‫پشتیبانی‬‫عدد‬۰.95
‫مشخص‬‫گردیده‬‫است‬.‫این‬‫عدد‬‫به‬‫این‬‫مفهوم‬‫می‬‫باشد‬‫که‬‫مجموعه‬‫هایی‬‫را‬‫که‬‫دارای‬‫حداقل‬‫تکرار‬95‫درصدی‬
‫می‬‫باشند‬‫برای‬‫ایجاد‬‫قوانین‬‫انتخاب‬‫کن‬.
21
FP-Growth
22
Frequent item-set mining
23
min_support
Market Basket Analysis
11
‫پس‬‫از‬‫این‬‫که‬‫مجموعه‬‫اشیا‬‫متداول‬‫ایجاد‬‫گردید‬‫باید‬‫آن‬‫را‬‫به‬‫عملگر‬‫انجمنی‬ ‫قوانین‬ ‫ایجاد‬24
‫بدهیم‬‫تا‬‫این‬‫عملگر‬
‫قوانین‬‫انجمنی‬‫موجود‬‫را‬‫شناسایی‬‫نماید‬.
‫مهمترین‬‫پارامتر‬‫این‬‫عملگر‬‫اطمینان‬ ‫حداقل‬25
‫می‬‫باشد‬‫که‬‫تنظیم‬‫آن‬‫با‬‫مقدار‬۰.8‫به‬‫این‬‫مفهوم‬‫می‬‫باشد‬‫که‬
‫صرفا‬‫قواعدی‬‫را‬‫به‬‫عنوان‬‫خروجی‬‫نمایش‬‫دهد‬‫که‬‫دارای‬‫ضریب‬‫اطمینان‬‫حداقل‬8۰‫درصدی‬‫باشد‬.
‫تولید‬‫قانون‬:
‫آنچه‬‫ما‬‫در‬‫خروجی‬‫این‬‫عملگر‬،‫داریم‬‫یک‬‫مجموعه‬‫قانون‬‫است‬‫که‬‫به‬‫صورت‬‫متنی‬‫یا‬‫جدولی‬‫و‬‫یا‬‫گرافی‬‫ارائه‬
‫خواهد‬‫شد‬.
24
Create Association Rules
25
min confidence
Market Basket Analysis
12
‫این‬‫شکل‬‫تمامی‬‫قواعد‬‫انجمنی‬‫به‬‫دست‬‫آمده‬‫را‬‫نمایش‬‫می‬‫دهد‬.‫ستون‬‫مقدمات‬26
‫یعنی‬‫همان‬‫بخش‬‫اول‬‫یا‬
‫شرط‬27
‫قانون‬‫و‬‫ستون‬‫نتیجه‬28
‫قانون‬‫یعنی‬‫بخش‬‫دوم‬‫یا‬‫آنگاه‬29
‫را‬‫نمایش‬‫می‬‫دهد‬.
26
Premises
27
If
28
Conclusion
29
Then
Market Basket Analysis
13
‫این‬‫تصویر‬‫هم‬‫نمایی‬‫از‬‫خروجی‬‫گراف‬‫این‬‫قوانین‬‫می‬‫باشد‬‫که‬‫به‬‫صورت‬‫شبکه‬‫ای‬‫ارتباط‬‫میان‬‫کاال‬‫ها‬‫را‬‫نمایش‬
‫می‬‫دهد‬.
Market Basket Analysis
14
‫و‬‫در‬‫انتها‬‫این‬‫تصویر‬‫خروجی‬‫متنی‬‫قواعد‬‫می‬‫باشد‬‫طی‬ ‫موارد‬ ‫تمام‬ ‫نتیجه‬ ‫و‬ ‫ها‬ ‫ارتباط‬ ‫تمامی‬ ‫کننده‬ ‫تعیین‬ ‫که‬
.‫باشد‬ ‫می‬ ‫شده‬

More Related Content

Featured

PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...DevGAMM Conference
 

Featured (20)

Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 

Market basket analysis

  • 1. ‫مشتریان‬ ‫خرید‬ ‫سبد‬ ‫تحلیل‬ Market Basket Analysis Ehsan Kamali Email LinkedIn
  • 2. Market Basket Analysis 1 ‫ی‬‫ک‬‫ی‬‫ها‬ ‫دغدغه‬ ‫از‬‫ی‬‫بس‬ ‫امروزه‬‫ی‬‫ار‬‫ی‬‫ها‬ ‫شرکت‬ ‫از‬‫ی‬‫دارا‬‫ی‬‫و‬‫ی‬‫ژگ‬‫ی‬‫فروشگاه‬ ‫فروش‬‫ی‬‫و‬‫ی‬‫ا‬‫مفهوم‬ ،‫پخش‬‫ی‬‫نام‬ ‫به‬ ‫تحل‬‫ی‬‫ل‬‫خر‬ ‫سبد‬‫ی‬‫د‬‫مشتر‬‫ی‬‫ان‬1 ‫م‬‫ی‬‫باشد‬. ‫تحل‬‫ی‬‫ل‬‫خر‬ ‫سبد‬‫ی‬‫د‬‫مشتر‬‫ی‬‫مفاه‬ ‫با‬‫ی‬‫م‬‫ی‬‫چ‬ ‫همچون‬‫ی‬‫دمان‬‫فروشگاه‬ ‫فروش‬ ‫در‬ ‫هم‬ ‫کنار‬ ‫در‬ ‫ها‬ ‫کاال‬ ‫مناسب‬‫ی‬‫و‬‫ی‬‫ا‬ ‫ا‬‫ی‬‫جاد‬‫ها‬ ‫بسته‬‫ی‬‫تخف‬ ‫مناسب‬‫ی‬‫ف‬‫ی‬‫پخش‬ ‫در‬‫سو‬ ‫هم‬‫م‬‫ی‬‫باشد‬. ‫تحل‬‫ی‬‫ل‬‫خر‬ ‫سبد‬‫ی‬‫د‬‫مشتر‬‫ی‬‫ان‬‫ا‬ ‫به‬‫ی‬‫ن‬‫م‬ ‫مفهوم‬‫ی‬‫مشتر‬ ‫رفتار‬ ‫شناخت‬ ‫با‬ ‫که‬ ‫باشد‬‫ی‬،‫ان‬‫مشتر‬ ‫اگر‬ ‫اغلب‬‫ی‬‫کاال‬‫ی‬a‫را‬ ‫خر‬‫ی‬‫دار‬‫ی‬‫نما‬‫ی‬‫د‬‫احتمال‬ ‫چه‬ ‫با‬‫ی‬‫کاال‬‫ی‬b‫ن‬ ‫را‬‫ی‬‫ز‬‫خر‬‫ی‬‫دار‬‫ی‬‫م‬‫ی‬‫نما‬‫ی‬‫د‬. ‫با‬‫ا‬ ‫شدن‬ ‫مشخص‬‫ی‬‫ن‬‫قوان‬‫ی‬‫ن‬‫م‬‫ی‬‫ها‬ ‫مثال‬ ‫به‬ ‫توان‬‫یی‬‫ز‬ ‫موارد‬ ‫همچون‬‫ی‬‫ر‬‫دست‬‫ی‬‫افت‬: ‫ارتقا‬‫ی‬‫بازر‬‫ی‬‫اب‬‫ی‬‫فروش‬ ‫و‬: ‫فرض‬‫کن‬‫ی‬‫د‬‫ا‬ ‫به‬ ‫شده‬ ‫کشف‬ ‫قانون‬‫ی‬‫ن‬‫باشد‬ ‫صورت‬: } ‫{همبرگر‬=<‫س‬ {‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬‫پ‬ ،‫ی‬‫از‬} ‫ا‬‫ی‬‫ن‬‫ا‬ ‫به‬ ‫رابطه‬‫ی‬‫ن‬‫م‬ ‫مفهوم‬‫ی‬‫مشتر‬ ‫اگر‬ ‫که‬ ‫باشد‬‫ی‬‫س‬‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬‫پ‬ ‫و‬‫ی‬‫از‬‫ز‬ ‫احتمال‬ ‫به‬ ‫بخرد‬‫ی‬‫اد‬‫ن‬ ‫همبرگر‬‫ی‬‫ز‬‫م‬‫ی‬.‫خرد‬ ‫ا‬ ‫با‬ ‫پس‬‫ی‬‫ن‬‫م‬ ‫حساب‬‫ی‬‫توان‬‫ی‬‫م‬‫ا‬ ‫بسته‬‫ی‬‫ا‬ ‫شامل‬‫ی‬‫ن‬‫ا‬ ‫کاال‬ ‫سه‬‫ی‬‫جاد‬‫نما‬‫یی‬‫م‬‫مشتر‬ ‫به‬ ‫و‬‫ی‬‫ان‬‫نما‬ ‫ارائه‬‫یی‬‫م‬‫طرف‬ ‫از‬ .‫ی‬‫ا‬‫ی‬‫ن‬ ‫برا‬ ‫را‬ ‫هشدار‬‫ی‬‫س‬ ‫فروش‬ ‫قطع‬ ‫صورت‬ ‫در‬ ‫که‬ ‫دارد‬ ‫ما‬‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬‫ی‬‫ا‬‫پ‬‫ی‬‫از‬‫م‬‫ی‬‫تواند‬‫شود‬ ‫همبرگر‬ ‫فروش‬ ‫در‬ ‫ضرر‬ ‫باعث‬. ‫مد‬‫ی‬‫ر‬‫ی‬‫ت‬‫سوپرمارکت‬ ‫در‬ ‫قفسه‬: ‫فرض‬‫کن‬‫ی‬‫د‬‫ا‬ ‫به‬ ‫شده‬ ‫کشف‬ ‫قانون‬‫ی‬‫ن‬‫باشد‬ ‫صورت‬: } ‫{همبرگر‬=<‫س‬ {‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬‫پ‬ ،‫ی‬‫از‬} ‫با‬‫ا‬ ‫شدن‬ ‫مشخص‬‫ی‬‫ن‬‫م‬ ‫مارکت‬ ‫سوپر‬ ‫در‬ ‫رابطه‬‫ی‬‫ا‬ ‫توان‬‫ی‬‫ن‬‫س‬ ‫کنار‬ ‫در‬ ‫را‬ ‫همبرگر‬ ‫قفسه‬ ‫که‬ ‫داشت‬ ‫را‬ ‫فرض‬‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬ ‫پ‬ ‫و‬‫ی‬‫از‬‫ده‬ ‫قرار‬‫ی‬‫م‬‫ب‬ ‫سوپرمارکت‬ ‫در‬ ‫همبرگر‬ ‫فروش‬ ‫احتمال‬ ‫تا‬‫ی‬‫شتر‬‫شود‬. ‫مد‬‫ی‬‫ر‬‫ی‬‫ت‬‫انبار‬: ‫با‬‫ا‬ ‫از‬ ‫استفاده‬‫ی‬‫ن‬‫ب‬ ‫در‬ ‫قواعد‬‫ی‬‫ن‬‫و‬ ‫قطعات‬‫ی‬‫ا‬‫مصرف‬ ‫مواد‬‫ی‬‫در‬‫ی‬‫ک‬‫م‬ ‫شرکت‬‫ی‬‫توان‬‫ی‬‫م‬‫ا‬ ‫به‬‫ی‬‫ن‬‫نت‬‫ی‬‫جه‬‫برس‬‫ی‬‫م‬‫به‬ ‫که‬‫ی‬‫نه‬ ‫تر‬‫ی‬‫ن‬‫چ‬‫ی‬‫دمان‬‫وسا‬‫ی‬‫ل‬‫و‬ ‫باشد‬ ‫چگونه‬ ‫انبار‬ ‫در‬‫ی‬‫ا‬‫ی‬‫ک‬‫تعم‬‫ی‬‫رکار‬‫س‬‫ی‬‫ار‬‫ا‬ ‫بسته‬ ‫چه‬‫ی‬‫تجه‬ ‫از‬‫ی‬‫زات‬‫داشته‬ ‫همراه‬ ‫به‬ ‫اغلب‬ ‫را‬ ‫بس‬ ‫احتمال‬ ‫با‬ ‫تا‬ ‫باشد‬‫ی‬‫ار‬‫باال‬‫یی‬‫تعم‬ ‫زمان‬ ‫در‬‫ی‬‫ر‬‫دچا‬‫ر‬‫محدود‬‫ی‬‫ت‬‫نشود‬ ‫قطعات‬. 1 Market Basket Analysis
  • 3. Market Basket Analysis 2 ‫سفارش‬‫خر‬‫ی‬‫د‬: ‫با‬‫ا‬ ‫شدن‬ ‫مشخص‬‫ی‬‫ن‬‫م‬ ‫قواعد‬‫ی‬‫در‬ ‫نمود‬ ‫مشخص‬ ‫توان‬‫ی‬‫ک‬‫مواد‬ ‫چه‬ ‫شرکت‬‫ی‬‫هم‬‫ی‬‫شه‬‫با‬‫ی‬‫د‬‫عنوان‬ ‫به‬‫ی‬‫ک‬‫در‬ ‫بسته‬ ‫ها‬ ‫زمان‬ ‫به‬ ‫توجه‬ ‫با‬ ‫و‬ ‫باشند‬ ‫موجود‬ ‫شرکت‬‫ی‬‫ر‬ ‫برنامه‬ ‫هرکدام‬ ‫سفارش‬‫ی‬‫ز‬‫ی‬‫مناسب‬‫ی‬‫خر‬ ‫زمان‬ ‫خصوص‬ ‫در‬‫ی‬‫د‬‫آنها‬ ‫ا‬ ‫تا‬ ‫شود‬ ‫انجام‬‫ی‬‫ن‬‫اهم‬ ‫با‬ ‫بسته‬‫ی‬‫ت‬‫هم‬‫ی‬‫شه‬‫موجود‬ ‫شرکت‬ ‫در‬‫ی‬‫باشد‬ ‫داشته‬. ‫برا‬‫ی‬‫رس‬‫ی‬‫دن‬‫ا‬ ‫به‬‫ی‬‫ن‬‫ن‬ ‫مفهوم‬‫ی‬‫از‬‫پ‬ ‫و‬ ‫اطالعات‬ ‫داشتن‬ ‫به‬‫ی‬‫ش‬‫ها‬ ‫فرض‬‫یی‬‫ز‬ ‫شرح‬ ‫به‬‫ی‬‫ر‬‫م‬‫ی‬‫باش‬‫ی‬‫م‬. ‫در‬‫کاو‬ ‫داده‬‫ی‬‫قواعد‬‫ی‬‫ا‬ ‫به‬‫ی‬‫ن‬‫وابستگ‬ ‫که‬ ‫شکل‬‫ی‬‫ب‬‫ی‬‫ن‬‫اعضا‬‫ی‬‫ی‬‫ک‬‫گ‬ ‫اندازه‬ ‫را‬ ‫مجموعه‬‫ی‬‫ر‬‫ی‬‫م‬‫ی‬‫نما‬‫ی‬،‫د‬‫قواعد‬ ‫عنوان‬ ‫با‬ ‫انجمن‬‫ی‬2 ‫م‬ ‫شناخته‬‫ی‬‫انجمن‬ ‫قواعد‬ ‫هدف‬ .‫شوند‬‫ی‬،‫شناسا‬‫یی‬‫قوان‬‫ی‬‫ن‬‫ی‬‫ا‬‫پا‬ ‫در‬ ‫قدرتمند‬ ‫قواعد‬‫ی‬‫گاه‬‫کارگ‬ ‫به‬ ‫با‬ ‫داده‬‫ی‬‫ر‬‫ی‬ ‫بعض‬‫ی‬‫مع‬ ‫از‬‫ی‬‫ارها‬‫ی‬‫جذاب‬‫ی‬‫ت‬‫اس‬‫ت‬. ‫محقق‬‫ی‬‫ن‬‫انجمن‬ ‫قواعد‬ ،‫قدرتمند‬ ‫قواعد‬ ‫مفهوم‬ ‫براساس‬‫ی‬3 ‫برا‬ ‫را‬‫ی‬‫محدود‬ ‫کشف‬‫ی‬‫ت‬‫ب‬ ‫ها‬‫ی‬‫ن‬‫ها‬ ‫داده‬ ‫در‬ ‫محصوالت‬‫یی‬ ‫ها‬ ‫تراکنش‬ ‫از‬ ‫که‬‫ی‬‫ها‬ ‫دستگاه‬‫ی‬‫وجه‬ ‫پرداخت‬4 ‫معرف‬ ‫است‬ ‫شده‬ ‫ثبت‬ ‫ها‬ ‫سوپرمارکت‬ ‫در‬‫ی‬‫برا‬ .‫کردند‬‫ی‬‫قاعده‬ ،‫مثال‬ ‫ز‬‫ی‬‫ر‬: } ‫{همبرگر‬=<‫س‬ {‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬‫پ‬ ،‫ی‬‫از‬} ‫در‬‫ها‬ ‫داده‬‫ی‬‫سو‬ ‫فروش‬‫پ‬‫م‬ ‫نشان‬ ‫رمارکت‬‫ی‬‫مشتر‬ ‫اگر‬ ‫که‬ ‫دهد‬‫ی‬‫پ‬‫ی‬‫از‬‫س‬ ‫و‬‫ی‬‫ب‬‫زم‬‫ی‬‫ن‬‫ی‬‫ز‬ ‫احتمال‬ ‫به‬ ،‫بخرد‬‫ی‬‫اد‬‫همبرگر‬ ‫خر‬ ‫خواهد‬ ‫هم‬ ‫را‬‫ی‬‫د‬‫چن‬ .‫ی‬‫ن‬‫اطالعات‬‫ی‬‫م‬ ‫را‬‫ی‬‫پا‬ ‫عنوان‬ ‫به‬ ‫توان‬‫ی‬‫ه‬‫تصم‬ ‫اساس‬ ‫و‬‫ی‬‫مات‬‫فعال‬ ‫در‬‫ی‬‫ت‬‫ها‬‫ی‬‫بازار‬‫ی‬‫اب‬‫ی‬‫فروش‬ ‫و‬ ‫برد‬ ‫کار‬ ‫به‬. ‫تعر‬‫ی‬‫ف‬‫انجمن‬ ‫قواعد‬‫ی‬ ‫مسئله‬‫انجمن‬ ‫قواعد‬ ‫کشف‬‫ی‬‫اول‬ ‫که‬‫ی‬‫ن‬‫توسط‬ ‫بار‬‫اگراوال‬5 ‫ز‬ ‫صورت‬ ‫به‬ ‫شد‬ ‫مطرح‬ ‫همکارانش‬ ‫و‬‫ی‬‫ر‬‫تعر‬‫ی‬‫ف‬‫م‬‫ی‬،‫شود‬ ‫کن‬ ‫فرض‬‫ی‬‫د‬: I = {i1,i2,…,in} 2 Association Rule Mining 3 ‫وابستگی‬ ‫قواعد‬ 4 POS 5 Agrawal
  • 4. Market Basket Analysis 3 ‫مجموعه‬‫ا‬‫ی‬‫از‬n‫دودو‬ ‫صفت‬‫یی‬‫ا‬ ‫که‬ ‫است‬‫ی‬‫ن‬‫آ‬ ‫را‬ ‫مجموعه‬‫ی‬‫تم‬‫ها‬6 ‫نامگذار‬‫ی‬‫م‬‫ی‬‫کن‬‫ی‬‫م‬. ‫عالوه‬‫برا‬‫ی‬‫ن‬‫م‬ ‫فرض‬‫ی‬‫کن‬‫ی‬‫م‬: D = {t1,t2,…,tn} ‫مجموعه‬‫ا‬‫ی‬‫پا‬ ‫را‬ ‫آن‬ ‫که‬ ‫باشد‬ ‫ها‬ ‫تراکنش‬ ‫از‬‫ی‬‫گاه‬‫داده‬7 ‫م‬‫ی‬‫نام‬‫ی‬‫م‬. ‫هر‬‫پا‬ ‫در‬ ‫تراکنش‬‫ی‬‫گاه‬‫داده‬( D )‫ی‬‫ک‬‫شناسا‬ ‫شماره‬‫یی‬‫ی‬‫کتا‬‫ز‬ ‫شامل‬ ‫و‬ ‫دارد‬‫ی‬‫رمجموعه‬‫ا‬‫ی‬‫آ‬ ‫از‬‫ی‬‫تم‬‫ها‬‫ی‬‫درون‬ ‫مجموعه‬I‫است‬. ‫ی‬‫ک‬‫ز‬ ‫صورت‬ ‫به‬ ‫قاعده‬‫ی‬‫ر‬‫تعر‬‫ی‬‫ف‬‫م‬‫ی‬‫شود‬: X => Y ‫با‬‫ا‬‫ی‬‫ن‬‫توض‬‫ی‬‫ح‬‫که‬X‫و‬Y‫ز‬‫ی‬‫رمجموعه‬‫ها‬‫یی‬‫از‬I‫اشتراک‬ ‫و‬ ‫هستند‬X‫با‬Y‫ته‬‫ی‬‫است‬. ‫هر‬‫آ‬ ‫از‬ ‫متفاوت‬ ‫مجموعه‬ ‫دو‬ ‫از‬ ‫قاعده‬‫ی‬‫تم‬‫تشک‬ ‫ها‬‫ی‬‫ل‬‫عنوان‬ ‫به‬ ‫که‬ ‫است‬ ‫شده‬«‫آ‬ ‫مجموعه‬‫ی‬‫تم‬‫ها‬»‫ن‬‫ی‬‫ز‬‫م‬ ‫شناخته‬‫ی‬ ‫مثل‬ .‫شوند‬X‫و‬Y‫که‬ ،X‫آ‬ ‫مجموعه‬ ‫را‬‫ی‬‫تم‬‫ها‬‫ی‬‫و‬ ‫مقدم‬Y‫آ‬ ‫مجموعه‬ ‫را‬‫ی‬‫تم‬‫ها‬‫ی‬‫م‬ ‫متاثر‬‫ی‬‫نام‬‫ی‬‫م‬. ‫برا‬‫ی‬‫توض‬‫ی‬‫ح‬‫مثال‬ ‫مفهوم‬‫ی‬‫خر‬ ‫سبد‬ ‫از‬‫ی‬‫د‬‫م‬ ‫کار‬ ‫به‬ ‫را‬ ‫سوپرمارکت‬ ‫در‬‫ی‬‫بر‬‫ی‬‫م‬‫آ‬ ‫مجموعه‬ .‫ی‬‫تم‬‫ز‬ ‫صورت‬ ‫به‬ ‫ها‬‫ی‬‫ر‬‫است‬: I = { Milk, Bread, Butter, Beer, Diapers} 6 Items 7 DataBase
  • 5. Market Basket Analysis 4 ‫و‬‫ی‬‫ک‬‫پا‬‫ی‬‫گاه‬‫آ‬ ‫شامل‬ ‫کوچک‬ ‫داده‬‫ی‬‫تم‬‫ها‬‫ی‬1‫معن‬ ‫به‬‫ی‬‫و‬ ‫وجود‬۰‫معن‬ ‫به‬‫ی‬‫آ‬ ‫وجود‬ ‫عدم‬‫ی‬‫تم‬‫به‬ ‫که‬ ‫است‬ ‫تراکنش‬ ‫در‬ ‫ز‬ ‫جدول‬ ‫صورت‬‫ی‬‫ر‬‫نما‬‫ی‬‫ش‬‫م‬ ‫داده‬‫ی‬‫شود‬: ‫برا‬‫ی‬‫مثال‬‫ی‬‫ک‬‫وابستگ‬ ‫قاعده‬‫ی‬‫انجمن‬ ‫با‬‫ی‬‫پا‬ ‫در‬ ‫موجود‬‫ی‬‫گاه‬‫ز‬ ‫صورت‬ ‫به‬ ‫داده‬‫ی‬‫ر‬‫است‬: {Beer,Butter} => {Milk} ‫معن‬‫ی‬‫ا‬ ‫فوق‬ ‫قاعده‬‫ی‬‫ن‬‫مشتر‬ ‫اگر‬ ‫که‬ ‫است‬‫ی‬‫نوش‬ ‫هم‬ ‫و‬ ‫کره‬ ‫هم‬‫ی‬‫دن‬‫ی‬‫ش‬ ‫بخرد‬‫ی‬‫ر‬‫خر‬ ‫خواهد‬ ‫هم‬‫ی‬‫د‬. ‫برا‬‫ی‬‫قوان‬ ‫انتخاب‬‫ی‬‫ن‬‫ب‬ ‫از‬ ‫جذاب‬‫ی‬‫ن‬‫قوان‬ ‫مجموعه‬‫ی‬‫ن‬‫محدود‬ ،‫ممکن‬‫ی‬‫ت‬‫ها‬‫ی‬‫رو‬ ‫مختلف‬‫ی‬‫مع‬‫ی‬‫ارها‬‫ی‬‫اهم‬ ‫سنجش‬‫ی‬‫ت‬ ‫جذاب‬ ‫و‬‫ی‬‫ت‬‫م‬ ‫کار‬ ‫به‬‫ی‬‫رود‬‫تر‬ ‫معروف‬ .‫ی‬‫ن‬‫محدود‬‫ی‬‫ت‬‫ها‬‫ضرا‬ ‫شامل‬‫ی‬‫ب‬‫اطم‬‫ی‬‫نان‬‫پشت‬ ‫و‬‫ی‬‫بان‬‫ی‬‫است‬. ‫پشت‬‫ی‬‫بان‬‫پشت‬ :‫ی‬‫بان‬‫آ‬ ‫مجموعه‬‫ی‬‫تم‬X‫صورت‬ ‫به‬ ‫که‬Supp(X)‫م‬ ‫داده‬ ‫نشان‬‫ی‬‫ها‬ ‫تراکنش‬ ‫نسبت‬ ،‫شود‬‫ی‬‫شامل‬ ‫آ‬ ‫مجموعه‬‫ی‬‫تم‬X‫پا‬ ‫در‬ .‫است‬‫ی‬‫گاه‬‫آ‬ ‫مجموعه‬ ،‫مثال‬ ‫داده‬‫ی‬‫تم‬{Milk,Bread,Butter}‫دارا‬‫ی‬‫پشت‬‫ی‬‫بان‬5/1=۰.2 ‫م‬‫ی‬‫ا‬ ‫که‬ ‫چرا‬ .‫باشد‬‫ی‬‫ن‬‫آ‬ ‫مجموعه‬‫ی‬‫تم‬‫در‬2۰‫م‬ ‫اتفاق‬ ‫مواقع‬ ‫درصد‬‫ی‬‫افتد‬. ‫اطم‬‫ی‬‫نان‬:‫ضر‬‫ی‬‫ب‬‫اطم‬‫ی‬‫نان‬‫ی‬‫ک‬‫ا‬ ‫به‬ ‫قانون‬‫ی‬‫ن‬‫تعر‬ ‫صورت‬‫ی‬‫ف‬‫م‬‫ی‬‫شود‬: Conf(X=>Y) = Supp(X U Y)/Supp(X) ‫برا‬‫ی‬‫قانون‬ ‫در‬ ‫مثال‬{ Milk,Bread } => { Butter }‫دارا‬‫ی‬‫اطم‬‫ی‬‫نان‬۰.2/۰.4=۰.5‫م‬‫ی‬‫ا‬ ‫به‬ .‫باشد‬‫ی‬‫ن‬‫معنا‬ ‫برا‬ ‫فوق‬ ‫قانون‬ ‫که‬‫ی‬‫تراکنش‬ ‫درصد‬ ‫پنجاه‬‫ها‬‫ی‬‫شامل‬8 ilkM‫و‬9 Bread‫م‬ ‫صدق‬‫ی‬‫کند‬. ‫عالوه‬‫ا‬ ‫بر‬‫ی‬‫ن‬‫مع‬ ،‫موارد‬‫ی‬‫ارها‬‫ی‬‫د‬‫ی‬‫گر‬‫ی‬‫ن‬‫ی‬‫ز‬‫برا‬‫ی‬‫جذاب‬ ‫سنجش‬‫ی‬‫ت‬‫قوان‬‫ی‬‫ن‬‫تر‬ ‫مهم‬ ‫از‬ ‫که‬ ،‫است‬ ‫شده‬ ‫مطرح‬‫ی‬‫ن‬‫آن‬‫ها‬ ‫م‬‫ی‬‫توان‬‫ز‬ ‫موارد‬ ‫به‬‫ی‬‫ر‬‫کرد‬ ‫اشاره‬: 8 ‫شیر‬ 9 ‫نان‬ DiapersBeerButterBreadMilkID 000111 001002 110003 001114 000105
  • 6. Market Basket Analysis 5 ‫اطم‬‫ی‬‫نان‬-‫جمع‬ ‫توان‬ ،‫کامل‬‫ی‬،‫عق‬‫ی‬،‫ده‬‫باالبر‬ ،‫نفوذ‬‫ی‬ ‫در‬‫الگور‬ ،‫زمان‬ ‫طول‬‫ی‬‫تم‬‫ها‬‫ی‬‫متعدد‬‫ی‬‫برا‬‫ی‬‫تول‬‫ی‬‫د‬‫قوان‬‫ی‬‫ن‬‫وابستگ‬‫ی‬‫پ‬‫ی‬‫شنهاد‬‫شده‬‫اند‬. ‫بعض‬‫ی‬‫الگور‬‫ی‬‫تم‬‫ها‬‫ی‬‫ا‬ ‫در‬ ‫معروف‬‫ی‬‫ن‬‫زم‬‫ی‬‫نه‬‫آپر‬ :‫از‬ ‫عبارتند‬‫ی‬‫ور‬‫ی‬1۰ ،‫اکالت‬11 ‫و‬‫رشد‬ ‫مکرر‬ ‫الگوهای‬12 ‫تمام‬‫ی‬‫ا‬‫ی‬‫ن‬ ‫الگور‬‫ی‬‫تم‬‫ها‬‫ن‬ ‫دهنده‬ ‫انجام‬ ‫تنها‬‫ی‬‫م‬‫ی‬‫مس‬ ‫از‬‫ی‬‫ر‬‫تول‬‫ی‬‫د‬‫قوان‬‫ی‬‫ن‬‫وابستگ‬‫ی‬‫ا‬ ‫که‬ ‫چرا‬ .‫هستند‬‫ی‬‫ن‬‫الگور‬‫ی‬‫تم‬‫ها‬‫برا‬‫ی‬‫کاوش‬ ‫آ‬ ‫مجموعه‬‫ی‬‫تم‬‫ها‬‫ی‬‫مکرر‬13 ‫شده‬ ‫ساخته‬‫اند‬‫د‬ ‫پروسه‬ ‫و‬‫ی‬‫گر‬‫ی‬‫رو‬‫ی‬‫آ‬ ‫مجموعه‬‫ی‬‫تم‬‫ها‬‫ی‬‫با‬ ‫مکرر‬‫ی‬‫د‬‫منته‬ ‫تا‬ ‫شود‬ ‫انجام‬‫ی‬ ‫قوان‬ ‫به‬‫ی‬‫ن‬‫وابستگ‬‫ی‬‫شوند‬. ‫الگور‬‫ی‬‫تم‬‫رشد‬ ‫مکرر‬ ‫الگوهای‬14 ‫روش‬‫جالب‬‫ی‬‫تول‬ ‫بدون‬ ‫را‬ ‫پرتکرار‬ ‫اقالم‬ ‫مجموعه‬ ‫که‬‫ی‬‫د‬‫کاند‬ ‫اقالم‬ ‫مجموعه‬‫ی‬‫د‬‫م‬ ‫دست‬ ‫به‬‫ی‬،‫آورد‬‫رشد‬ ‫مکرر‬ ‫الگوهای‬ ‫نام‬‫ی‬‫ده‬‫م‬‫ی‬‫از‬ ‫که‬ ‫شود‬‫ی‬‫ک‬‫استراتژ‬‫ی‬‫تقس‬‫ی‬‫م‬‫م‬ ‫استفاده‬ ‫وحل‬‫ی‬‫ا‬ .‫کند‬‫ی‬‫ن‬‫پا‬ ‫روش‬‫ی‬‫گاه‬‫ا‬ ‫مجموعه‬ ‫به‬ ‫را‬ ‫داده‬‫ی‬‫پا‬ ‫از‬‫ی‬‫گاه‬ ‫هرکدام‬ ‫که‬ ‫ها‬ ‫داده‬‫ی‬‫ک‬‫تقس‬ ،‫دارند‬ ‫پرتکرار‬ ‫قلم‬‫ی‬‫م‬‫م‬‫ی‬‫ه‬ ‫و‬ ‫کند‬‫ر‬‫پا‬‫ی‬‫گاه‬‫م‬ ‫کاوش‬ ‫جداگانه‬ ‫را‬ ‫داده‬‫ی‬‫کند‬. ‫در‬‫اول‬‫ی‬‫ن‬‫پا‬ ‫اسکن‬‫ی‬‫گاه‬‫همانند‬ ‫داده‬‫آ‬‫پر‬‫ی‬‫ور‬‫ی‬15 ‫آ‬ ‫مجموعه‬‫ی‬‫تم‬‫ها‬‫ی‬‫ی‬‫ک‬‫عضو‬‫ی‬‫پشت‬ ‫و‬‫ی‬‫بان‬‫ی‬‫م‬ ‫مشخص‬ ‫آنها‬‫ی‬.‫شود‬ ‫ترت‬ ‫به‬ ‫پرتکرار‬ ‫اقالم‬ ‫مجموعه‬‫ی‬‫ب‬‫نزول‬‫ی‬‫پشت‬‫ی‬‫بان‬‫ی‬‫م‬ ‫مرتب‬ ‫شان‬‫ی‬‫شوند‬. ‫سپس‬‫ی‬‫ک‬‫ا‬ ‫به‬ ‫درخت‬‫ی‬‫ن‬‫م‬ ‫ساخته‬ ‫صورت‬‫ی‬‫ر‬ ‫ّل‬‫و‬‫ا‬ :‫که‬ ‫شود‬‫ی‬‫شة‬‫با‬ ‫درخت‬‫خالی‬ ‫برچسب‬16 ‫م‬ ‫ساخته‬‫ی‬‫از‬ ‫بعد‬ .‫شود‬ ‫پا‬ ‫آن‬‫ی‬‫گاه‬‫برا‬ ‫داده‬‫ی‬‫م‬ ‫اسکن‬ ‫دوم‬ ‫بار‬‫ی‬‫به‬ ‫تراکنش‬ ‫هر‬ ‫اقالم‬ .‫شود‬‫ترتی‬‫ب‬L‫م‬ ‫پردازش‬‫ی‬‫و‬ ‫شوند‬‫ی‬‫ک‬‫برا‬ ‫شاخه‬‫ی‬‫هر‬ ‫ا‬ ‫تراکنش‬‫ی‬‫جاد‬‫م‬‫ی‬.‫شود‬‫تسه‬ ‫منظور‬ ‫به‬‫ی‬‫ل‬‫پ‬‫ی‬‫ما‬‫ی‬‫ش‬،‫درخت‬‫ی‬‫ک‬‫م‬ ‫ساخته‬ ‫جدول‬‫ی‬‫شود‬‫محل‬ ‫به‬ ‫درآن‬ ‫قلم‬ ‫هر‬ ‫که‬ ‫در‬ ‫خودش‬‫م‬ ‫اشاره‬ ‫درخت‬‫ی‬‫تراکنش‬ ‫همه‬ ‫اسکن‬ ‫از‬ ‫پس‬ ‫درخت‬ .‫کند‬‫م‬ ‫کامل‬ ‫ها‬‫ی‬‫شود‬17 . 10 Apriori 11 Eclat 12 Frequent Patterns Growth 13 Frequent item-set mining 14 Fp-growth 15 https://en.wikipedia.org/wiki/Apriori_algorithm 16 Null 17 :‫نمایید‬ ‫مراجعه‬ ‫زیر‬ ‫آدرس‬ ‫به‬ ‫بیشتر‬ ‫اطالعات‬ ‫برای‬ -https://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Frequent_Pattern_Mining/The_FP Growth_Algorithm
  • 7. Market Basket Analysis 6 ‫به‬‫همین‬‫منظور‬‫یک‬‫نمونه‬‫از‬‫کشف‬‫قواعد‬‫انجمنی‬‫بر‬‫روی‬‫داده‬‫های‬‫یک‬‫شرکت‬‫دارای‬‫سیستم‬‫فروش‬‫فروشگاهی‬ ‫انجام‬‫شد‬. ‫به‬‫علت‬‫واقعی‬‫بودن‬‫داده‬‫ها‬‫از‬‫ذکر‬‫کد‬‫کاال‬‫و‬‫عنوان‬‫کاال‬‫خودداری‬‫می‬‫شود‬. ‫پایگاه‬‫داده‬‫شرکت‬ ‫این‬ ‫فروشگاهی‬ ‫فروش‬ ‫افزار‬ ‫نرم‬SQL‫می‬‫باشد‬‫ولی‬‫تجزیه‬‫و‬‫تحلیل‬‫اطالعات‬‫با‬‫ابزار‬‫تخصصی‬ 18 Rapidminer‫انجام‬‫می‬‫شود‬.‫این‬‫تجزیه‬‫و‬‫تحلیل‬‫ها‬‫قابلیت‬‫انجام‬‫از‬‫طریق‬SQL‫را‬‫دارد‬‫اما‬‫به‬‫علت‬‫تخصصی‬ ‫نبودن‬،‫دارای‬‫محدودیت‬‫ها‬‫و‬‫کندی‬‫های‬‫زیادی‬‫می‬‫باشد‬‫داده‬ ‫پایگاه‬ ‫این‬ ‫های‬ ‫نسخه‬ ‫جدیدترین‬ ‫در‬ ‫حتی‬ ‫که‬19 ‫همانند‬ ‫نویسی‬ ‫برنامه‬ ‫های‬ ‫زبان‬ ‫از‬ ‫کمک‬ ‫بدون‬R.‫نمود‬ ‫پیدا‬ ‫دست‬ ‫نظر‬ ‫مورد‬ ‫نتیجه‬ ‫به‬ ‫توان‬ ‫می‬ ‫سختی‬ ‫به‬‫به‬‫عنوان‬ ‫نمونه‬‫در‬‫تشکیل‬‫ماتریس‬‫وابستگی‬‫به‬‫علت‬‫محدودیت‬4۰96‫ستونی‬‫در‬‫هر‬‫خروجی‬‫اسکریپت‬‫ها‬‫در‬TSQL، ‫تشکیل‬‫چنین‬‫جدولی‬‫در‬‫صورت‬‫زیاد‬‫بودن‬‫اطالعات‬‫امکان‬‫پذیر‬‫نمی‬‫باشد‬‫و‬‫این‬‫جدول‬‫باید‬‫با‬‫ابزار‬‫دیگری‬‫ساخته‬ ‫شود‬. ‫در‬‫گام‬‫اول‬‫ابتدا‬‫اطالعات‬‫را‬‫از‬‫جداول‬‫مربوط‬‫به‬‫فروشگاهی‬‫خارج‬‫میکنیم‬‫و‬‫در‬‫جدول‬‫دیگری‬‫قرار‬‫میدهیم‬.‫در‬‫این‬ ‫مورد‬‫به‬‫علت‬‫نیاز‬،‫بررسی‬ ‫مورد‬ ‫شرکت‬‫صرفا‬‫اطالعات‬‫سال‬‫های‬2۰15‫به‬‫بعد‬‫مورد‬‫نیاز‬‫بوده‬‫است‬: if object_id ('dbo.DM','u')is not null drop table dbo.DM GO select InvoiceRef,PartRef into dbo.DM from pos.PosInvoiceItm where InvoiceRef in ( select InvoiceId from pos.posinvoice where datepart(year,date) >=2015) GO 18 ‫علت‬‫انتخاب‬‫این‬‫ابزار‬‫تصویری‬‫بودن‬‫آن‬‫و‬‫سادگی‬‫در‬‫کارکرد‬‫و‬‫عدم‬‫نیاز‬‫به‬‫دانش‬‫برنامه‬‫نویسی‬‫می‬‫باشد‬‫در‬‫غیر‬‫این‬‫صورت‬‫می‬‫توان‬‫از‬ ‫ابزار‬‫های‬‫دیگری‬‫نیز‬‫استفاده‬‫نمود‬ 19 DataBase
  • 8. Market Basket Analysis 7 ‫برای‬‫مرتب‬‫کردن‬‫داده‬‫ها‬‫همانطور‬‫که‬‫از‬‫مفاهیم‬‫داده‬‫ها‬‫مشخص‬‫است‬‫ما‬‫نیازی‬‫به‬‫فاکتورهای‬‫با‬‫تک‬‫ردیف‬‫نداریم‬ ‫چون‬‫تعداد‬‫خرید‬‫یک‬‫کاال‬‫در‬‫نتیجه‬‫ما‬‫موثر‬‫نیست‬‫و‬‫صرفا‬‫کنار‬‫هم‬‫قرار‬‫گرفتن‬‫کاال‬‫ها‬‫برای‬‫ما‬‫با‬‫اهمیت‬‫است‬: with CTE_RemoveOnePart AS ( SELECT InvoiceRef, COUNT(Partref) AS Cnt FROM dbo.DM GROUP BY InvoiceRef HAVING (COUNT(Partref) = 1)) delete dbo.DM where InvoiceRef in ( select InvoiceRef from CTE_RemoveOnePart) GO ‫به‬‫عنوان‬‫داده‬‫های‬‫پرت‬2۰ ‫در‬‫این‬‫مفهوم‬‫کاالهایی‬‫که‬‫در‬‫این‬‫بازه‬‫زمانی‬‫صرفا‬‫یکبار‬‫فروخته‬‫شده‬‫اند‬‫قواعد‬‫مناسبی‬ ‫را‬‫ارائه‬‫نمیدهند‬‫چون‬‫احتمال‬‫تصادفی‬‫بودن‬‫آن‬‫خرید‬‫بسیار‬‫باال‬‫می‬‫باشد‬.‫به‬‫این‬‫منظور‬‫با‬‫دستور‬‫زیر‬‫این‬‫موارد‬‫را‬ ‫حذف‬‫می‬‫کنیم‬: With CTE_RemoveOnlyOneFrequence AS ( select PartRef,count(PartRef) Cntr from dbo.DM group by PartRef having count(PartRef)<10) delete dbo.DM where PartRef in (select PartRef from CTE_RemoveOnlyOneFrequence) Go ‫پس‬‫از‬‫این‬‫فراهم‬‫سازی‬‫و‬‫پیش‬‫پردازش‬‫داده‬‫ها‬‫نیاز‬‫به‬‫جدولی‬‫داریم‬‫که‬‫در‬‫آن‬‫ستون‬‫ها‬‫عنوان‬‫کاال‬‫باشند‬‫و‬‫در‬ ‫سطر‬‫ها‬‫به‬‫ازای‬‫هر‬‫فاکتور‬‫فروش‬‫مشخص‬‫نماید‬‫که‬‫چه‬‫کاالهایی‬‫وجود‬‫داشته‬‫اند‬.‫مقادیر‬‫موجود‬‫از‬‫نوع‬‫باینری‬ 20 Outlier
  • 9. Market Basket Analysis 8 ‫می‬‫باشند‬‫زیرا‬‫مقدار‬‫اشاره‬‫به‬‫وجود‬‫و‬‫یا‬‫عدم‬‫وجود‬‫کاال‬‫در‬‫فاکتور‬‫مربوطه‬‫دارد‬‫و‬‫این‬‫مقادیر‬‫باینری‬‫از‬‫نوع‬‫باینری‬ ‫متقارن‬‫می‬‫باشند‬. ‫برای‬‫تشکیل‬‫چنین‬‫ماتریسی‬‫از‬‫دستور‬‫زیر‬‫استفاده‬‫می‬‫نماییم‬: /*****Create PivoteTable*****/ DECLARE @COL NVARCHAR(MAX) ='',@SQL NVARCHAR(MAX) ='' DECLARE @COL2 NVARCHAR(MAX) ='' SELECT @COL+= ','+QUOTENAME(Partref)FROM ( select distinct Partref from dbo.DM ) AS D SELECT @COL2+= ', isnull ('+QUOTENAME(Partref)+' , 0)'+ ' As '+QUOTENAME(Partref) FROM ( select distinct Partref from dbo.DM) AS D SELECT @COL= SUBSTRING (@COL,2,LEN(@COL)-1) SELECT @COL2= SUBSTRING (@COL2,2,LEN(@COL2)-1) SELECT @SQL= 'SELECT InvoiceRef, '+ @COL2 +' FROM ( select InvoiceRef, Partref from dbo.DM ) AS J PIVOT ( Count (Partref) FOR Partref IN ('+ @COL +' )) AS P ' exec sp_executesql @sql ‫نکته‬:‫در‬‫صورتی‬‫که‬‫تعداد‬‫کاال‬‫ها‬‫بیش‬‫از‬4۰96‫عدد‬‫باشد‬‫نمی‬‫توان‬‫این‬‫خروجی‬‫را‬‫از‬SQL‫تهیه‬‫نمود‬‫و‬‫باید‬‫با‬ ‫ابزار‬‫های‬‫دیگری‬‫همانند‬‫اکسل‬(‫در‬‫صورت‬‫توانایی‬‫پردازش‬‫حجم‬‫بسیار‬‫زیاد‬‫اطالعات‬)!!!‫با‬‫توجه‬‫به‬‫مفهوم‬‫ذکر‬ ‫شده‬،‫ایجاد‬‫نمود‬. ‫خروجی‬‫ایجاد‬‫شده‬‫را‬‫در‬‫یک‬‫فایل‬‫اکسل‬‫یا‬CSV‫قرار‬‫می‬‫دهیم‬‫که‬‫در‬‫این‬‫مورد‬‫به‬‫علت‬‫زیاد‬‫بودن‬‫داده‬‫ها‬‫آن‬‫را‬ ‫در‬‫فایل‬CSV‫قرار‬‫دادیم‬. ‫در‬‫خروجی‬‫اطالعات‬‫ماتریس‬‫دارای‬‫حجم‬1۰718176‫دیتا‬‫می‬‫باشد‬:
  • 11. Market Basket Analysis 10 ‫چون‬‫در‬‫فایل‬‫ما‬‫از‬‫کاراکتر‬‫فاصله‬‫برای‬‫جدا‬‫کردن‬‫اطالعات‬‫استفاده‬‫نمودیم‬‫در‬‫این‬‫تنظیمات‬‫باید‬‫کاراکتر‬‫فاصله‬‫را‬ ‫برای‬‫جدا‬‫کردن‬‫اطالعات‬‫مشخص‬‫نماییم‬. ‫پس‬‫از‬‫آن‬‫پردازشگر‬‫مربوط‬‫به‬‫الگوریتم‬‫رشد‬ ‫مکرر‬ ‫الگوهای‬21 ‫را‬‫انتخاب‬‫میکنیم‬‫تا‬‫تشکیل‬‫قواعد‬‫انجمنی‬‫را‬‫انجام‬ ‫دهیم‬.‫این‬‫عملگر‬‫جزو‬‫عملگرهای‬‫موارد‬ ‫مجموعه‬ ‫از‬ ‫مکرر‬ ‫استخراج‬22 ‫می‬‫باشند‬‫به‬‫این‬‫مفهوم‬‫که‬‫کار‬‫آنها‬‫نمایش‬ ‫مجموعه‬‫اشیا‬‫متداول‬‫و‬‫تعیین‬‫این‬‫که‬‫کدام‬‫یک‬‫از‬‫مجموعه‬‫اشیا‬‫در‬‫کنار‬‫هم‬‫قرار‬‫گرفته‬،‫اند‬‫می‬‫باشد‬. ‫این‬‫عملگر‬‫دارای‬‫پارامتر‬‫های‬‫متفاوتی‬‫می‬‫باشد‬‫که‬‫مهمترین‬‫پارامتر‬‫آن‬‫پشتیبانی‬ ‫حداقل‬23 ‫می‬‫باشد‬‫که‬‫حداقل‬ ‫ضریب‬‫پشتیبانی‬‫را‬‫برای‬‫مجموعه‬‫های‬‫شناسایی‬‫شده‬‫مشخص‬‫می‬‫نماید‬‫و‬‫مجموعه‬‫های‬‫با‬‫ضریب‬‫پشتیبانی‬‫کمتر‬ ‫از‬‫آن‬‫را‬‫در‬‫نظر‬‫نمیگیرد‬‫و‬‫از‬‫محدوده‬‫ارزیابی‬‫خارج‬‫می‬‫نماید‬.‫در‬‫این‬‫مورد‬‫حداقل‬‫مقدار‬‫پشتیبانی‬‫عدد‬۰.95 ‫مشخص‬‫گردیده‬‫است‬.‫این‬‫عدد‬‫به‬‫این‬‫مفهوم‬‫می‬‫باشد‬‫که‬‫مجموعه‬‫هایی‬‫را‬‫که‬‫دارای‬‫حداقل‬‫تکرار‬95‫درصدی‬ ‫می‬‫باشند‬‫برای‬‫ایجاد‬‫قوانین‬‫انتخاب‬‫کن‬. 21 FP-Growth 22 Frequent item-set mining 23 min_support
  • 12. Market Basket Analysis 11 ‫پس‬‫از‬‫این‬‫که‬‫مجموعه‬‫اشیا‬‫متداول‬‫ایجاد‬‫گردید‬‫باید‬‫آن‬‫را‬‫به‬‫عملگر‬‫انجمنی‬ ‫قوانین‬ ‫ایجاد‬24 ‫بدهیم‬‫تا‬‫این‬‫عملگر‬ ‫قوانین‬‫انجمنی‬‫موجود‬‫را‬‫شناسایی‬‫نماید‬. ‫مهمترین‬‫پارامتر‬‫این‬‫عملگر‬‫اطمینان‬ ‫حداقل‬25 ‫می‬‫باشد‬‫که‬‫تنظیم‬‫آن‬‫با‬‫مقدار‬۰.8‫به‬‫این‬‫مفهوم‬‫می‬‫باشد‬‫که‬ ‫صرفا‬‫قواعدی‬‫را‬‫به‬‫عنوان‬‫خروجی‬‫نمایش‬‫دهد‬‫که‬‫دارای‬‫ضریب‬‫اطمینان‬‫حداقل‬8۰‫درصدی‬‫باشد‬. ‫تولید‬‫قانون‬: ‫آنچه‬‫ما‬‫در‬‫خروجی‬‫این‬‫عملگر‬،‫داریم‬‫یک‬‫مجموعه‬‫قانون‬‫است‬‫که‬‫به‬‫صورت‬‫متنی‬‫یا‬‫جدولی‬‫و‬‫یا‬‫گرافی‬‫ارائه‬ ‫خواهد‬‫شد‬. 24 Create Association Rules 25 min confidence
  • 15. Market Basket Analysis 14 ‫و‬‫در‬‫انتها‬‫این‬‫تصویر‬‫خروجی‬‫متنی‬‫قواعد‬‫می‬‫باشد‬‫طی‬ ‫موارد‬ ‫تمام‬ ‫نتیجه‬ ‫و‬ ‫ها‬ ‫ارتباط‬ ‫تمامی‬ ‫کننده‬ ‫تعیین‬ ‫که‬ .‫باشد‬ ‫می‬ ‫شده‬