SlideShare a Scribd company logo
1 of 37
Download to read offline
‫در‬ ‫شده‬ ‫ارائه‬‫در‬ ‫شده‬ ‫ارائه‬
‫نویس‬‫برنامه‬ ‫زبان‬ ‫و‬ ‫کاوی‬‫داده‬R ‫نویس‬‫برنامه‬ ‫زبان‬ ‫و‬ ‫کاوی‬‫داده‬R
:‫مقاله‬ ‫نویسندگان‬
) ‫حصارک‬ ‫الهام‬‫ارشد‬ ‫کارشناس‬ ‫مقطع‬ ‫دانشجوی‬(
) ‫جزی‬ ‫داورپناه‬ ‫محمد‬ ‫دکتر‬‫دانشگاه‬ ‫استادیار‬(
‫فولدا‬ ‫صنعتی‬ ‫عالی‬ ‫آموزش‬ ‫موسسه‬
‫در‬ ‫شده‬ ‫ارائه‬‫در‬ ‫شده‬ ‫ارائه‬
‫نویس‬‫برنامه‬ ‫زبان‬ ‫و‬ ‫کاوی‬‫داده‬R ‫نویس‬‫برنامه‬ ‫زبان‬ ‫و‬ ‫کاوی‬‫داده‬R
:‫دهنده‬‫ارائه‬
‫حصارک‬ ‫الهام‬
. @ .Elham hesaraki gmail com
۱‫از‬۳۲
‫کارگاه‬ ‫محتوای‬
‫مقدمه‬
‫کاوی‬‫داده‬
R‫و‬RStudio
‫پاسخ‬ ‫و‬ ‫پرسش‬
‫انسان‬ ‫ذهن‬ ‫ب‏ندی‬‫دسته‬‫)اکاف‬۱۹۸۹(
•‫داده‬
•‫اطلعاات‬
•‫دانش‬
•‫ادراک‬
•‫خرد‬
•‫نویز‬
:‫مقدمه‬‫خرد‬ ‫تا‬ ‫داده‬ ‫از‬
‫شکل‬۱‫)اکاف‬ ‫خرد‬ ‫تا‬ ‫داده‬ ‫از‬ :۱۹۸۹.(
۲‫از‬۳۲
‫داده‬ ‫تولید‬ ‫رشد‬‫ب‏ه‬‫رو‬‫روند‬
•‫گیگاب‏ایت‬ ‫ب‏ه‬ ‫مگاب‏ایت‬
•‫تراب‏ایت‬ ‫ب‏ه‬ ‫گیگاب‏ایت‬
•‫پتاب‏ایت‬ ‫ب‏ه‬ ‫تراب‏ایت‬
•‫اگزاب‏ایت‬ ‫ب‏ه‬ ‫پتاب‏ایت‬
‫شکل‬۲:‫داده‬ ‫تولید‬ ‫رشد‬‫ب‏ه‬‫رو‬ ‫روند‬‫ل‬ ‫و‬ ‫چوآ‬ ،‫ون‬ ،‫)هو‬۲۰۱۴.(
:‫مقدمه‬‫ابداع‬ ‫تا‬ ‫نیاز‬ ‫از‬
۳‫از‬۳۲
‫شکل‬۳:‫اطلعاات‬ ‫فقر‬ ‫و‬ ‫داده‬ ‫از‬ ‫غن‬ ‫جهان‬.
:‫مقدمه‬.... ،‫داده‬ ،‫داده‬
۴‫از‬۳۲
•‫آورم‬ ‫دست‬‫ب‏ه‬ ‫توانم‬‫نم‬ ‫را‬ ‫نیازم‬ ‫مورد‬ ‫داده‬
•‫اند‬‫شده‬ ‫پراکنده‬ ‫شبکه‬ ‫در‬ ‫نیازم‬ ‫مورد‬ ‫های‬‫داده‬
•‫کنم‬‫نم‬ ‫درک‬ ‫را‬ ‫نیازم‬ ‫مورد‬ ‫های‬‫داده‬
•‫کنم‬ ‫استفاده‬ ‫توانم‬‫نم‬ ‫را‬ ‫کرده‬ ‫کشف‬ ‫های‬‫داده‬
●
‫ی‬‫ای‬‫رشته‬‫میان‬ ‫عالم‬ ‫ک‬(‫داده‬ ‫پایگاه‬ ‫های‬‫سیستم‬ ،‫ماشین‬ ‫یادگیری‬ ،‫آمار‬ ،‫مصنوعای‬ ‫)هوش‬
•‫داده‬ ‫انبود‬ ‫حجم‬ ‫از‬ ‫دانش‬ ‫و‬ ‫جالب‬ ‫الگوهای‬ ‫کشف‬
:‫کاوی‬‫داده‬‫چیست؟‬ ‫کاوی‬‫داده‬
۵‫از‬۳۲
‫شکل‬۴.‫کاوی‬‫داده‬ :
●
‫واحد‬ ‫فرآیند‬ ‫یک‬ ‫ب‏رای‬ ‫گوناگون‬ ‫عابارات‬ ‫از‬ ‫استفاده‬
:‫کاوی‬‫داده‬‫چیست؟‬ ‫کاوی‬‫داده‬
۶‫از‬۳۲
‫کنندگان‬‫استفاده‬ ‫نام‬ ‫سال‬
‫آمار‬ ‫کارشناسان‬ ،‫داده‬ ‫لیروب‬
‫داده‬ ‫گیری‬‫ماهی‬
۱۹۶۰
،‫مصنوعای‬ ‫هوش‬
‫کارب‏ری‬ ‫جامعه‬
‫ماشین‬ ‫یادگیری‬
‫در‬ ‫دانش‬ ‫کشف‬
‫داده‬ ‫های‬‫پایگاه‬
۱۹۸۹
،‫داده‬ ‫پایگاه‬ ‫جامعه‬
‫کار‬‫و‬‫کسب‬
‫کاوی‬‫داده‬ ۱۹۹۰
‫کشف‬ ،‫اطلعاات‬ ‫هرس‬ ،‫داده‬ ‫شناس‬‫ب‏استان‬ :‫اسام‬ ‫سایر‬
‫دانش‬ ‫استخراج‬ ،‫اطلعاات‬
‫جدول‬۱.‫فرآیند‬ ‫یک‬ ‫ب‏رای‬ ‫گوناگون‬ ‫های‬‫نام‬ :
●
‫اطلعاات‬ ‫فناوری‬ ‫طبیعی‬ ‫تکامل‬ ‫نتیجه‬ ‫کاوی‬‫داده‬
:‫کاوی‬‫داده‬‫چیست؟‬ ‫کاوی‬‫داده‬
۷‫از‬۳۲
‫شکل‬۵‫همکاران‬ ‫و‬ ‫)هان‬ ‫کاوی‬‫داده‬ ‫و‬ ‫اطلعاات‬ ‫فناوری‬ ‫تکامل‬ :۲۰۱۲.(
•‫است‬ ‫پذیر‬‫ب‏ازگشت‬ ‫و‬ ‫تکرارشونده‬ ‫ای‬‫مرحله‬ ‫هفت‬ ‫فرآیند‬ ‫یک‬ ‫کاوی‬‫داده‬
:‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫فرآیند‬
۸‫از‬۳۲
‫شکل‬۶‫همکاران‬ ‫و‬ ‫)هان‬ ‫کاوی‬‫داده‬ ‫فرآیند‬ ‫گام‬ ‫هفت‬ :۲۰۱۲.(
•‫داده‬ ‫پاکسازی‬(‫ناسازگار‬ ‫های‬‫داده‬ ‫و‬ ‫نویز‬ ‫)حذف‬
•‫داده‬ ‫سازی‬‫یکپارچه‬(‫چندگانه‬ ‫داده‬ ‫مناب‏ع‬ ‫)ترکیب‬
•‫داده‬ ‫انتخاب‬(‫تحلیل‬ ‫ب‏ا‬ ‫مرتبط‬ ‫های‬‫داده‬ ‫)انتخاب‬
•‫داده‬ ‫نگاشت‬
•‫کاوی‬‫داده‬(‫دانش‬ ‫کشف‬ ‫جهت‬ ‫هوشمندانه‬ ‫های‬‫روش‬ ‫از‬ ‫)استفاده‬
•‫الگو‬ ‫ارزیاب‬(‫ب‏ودن‬ ‫جالب‬ ‫های‬‫)سنجه‬
•‫دانش‬ ‫ارائه‬
:‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫فرآیند‬
۹‫از‬۳۲
‫پردازش‬‫پیش‬
●
Cross Industry Standard Process for Data Mining
•‫مسائل‬ ‫حل‬ ‫در‬ ‫کاوی‬‫داده‬ ‫کارشناسان‬ ‫استفاده‬ ‫مورد‬ ‫رویکردهای‬ ‫از‬ ‫مدل‬
:‫کاوی‬‫داده‬‫فرآیند‬ ‫مدل‬-CRISP DM
۱۰‫از‬۳۲
‫شکل‬۷:‫مدل‬-CRISP DM.
●
(‫ای‬‫)راب‏طه‬ ‫داده‬ ‫پایگاه‬ ‫های‬‫داده‬
•(‫تراکنش‬ ‫داده‬ ‫)پایگاه‬ ‫تراکنش‬ ‫های‬‫داده‬
•‫داده‬ ‫انبار‬ ‫های‬‫داده‬
•‫زمان‬ ،‫فضای‬ ‫های‬‫داده‬ ،‫داده‬ ‫جریان‬ ‫های‬‫داده‬
•‫ترتیب‬ ،‫متن‬ ،‫ای‬‫چندرسانه‬ ‫های‬‫داده‬
•‫ها‬‫درخت‬ ‫و‬ ‫ها‬‫گراف‬
:‫کاوی‬‫داده‬‫کاوش‬ ‫قابل‬ ‫های‬‫داده‬ ‫انواع‬
۱۱‫از‬۳۲
●
‫کلس/مفهوم‬ ‫توصیف‬(‫تمایز‬ ‫و‬ ‫سازی‬‫)مشخصه‬
•‫همبستگ‬ ‫و‬ ‫واب‏ستگ‬ ،‫مکرر‬ ‫الگوهای‬
•‫رگرسیون‬ ‫و‬ ‫ب‏ندی‬‫طبقه‬
•‫ب‏ندی‬‫خوشه‬
•‫دورافتادگ‬ ‫تحلیل‬
:‫کاوی‬‫داده‬‫کشف‬ ‫قابل‬ ‫الگوهای‬ ‫انواع‬
۱۲‫از‬۳۲
‫شکل‬۸:.‫الگو‬ ‫کشف‬
●
‫ب‏ودن‬ ‫ب‏دیع‬ ‫و‬ ‫نو‬
•‫انسان‬ ‫ب‏رای‬ ‫ب‏ودن‬ ‫درک‬ ‫قاب‏ل‬
•‫ب‏ودن‬ ‫کارا‬
•‫قطعیت‬ ‫از‬ ‫ای‬‫درجه‬ ‫ب‏ا‬ ‫آزمون‬ ‫یا‬ ‫جدید‬ ‫های‬‫داده‬ ‫ب‏رای‬ ‫داشتن‬ ‫صحت‬
•(‫منطقی‬ ‫فرض‬‫پیش‬ ‫یک‬ ‫ب‏ر‬ ‫گذاشتن‬ ‫)صحه‬
.‫کند‬‫م‬ ‫ارائه‬ ‫دانش‬ ،‫جالب‬ ‫الگوی‬ ‫یک‬
:‫کاوی‬‫داده‬‫الگوها‬ ‫جالب‬ ‫های‬‫سنجه‬
۱۳‫از‬۳۲
●
‫هرکجا‬ ‫در‬ ‫کاوی‬‫داده‬ ،‫جا‬‫همه‬
:‫کاوی‬‫داده‬‫کاربرد‬ ‫های‬‫زمینه‬
۱۴‫از‬۳۲
‫شکل‬۹:.‫شرح‬ ‫ب‏دون‬
:‫کاوی‬‫داده‬‫کلیدی‬ ‫واژگان‬ ‫از‬ ‫برخی‬ ‫با‬ ‫آشنای‬
۱۵‫از‬۳۲
‫جدول‬۲:.‫کاوی‬‫داده‬ ‫در‬ ‫کلیدی‬ ‫واژگان‬ ‫ب‏رخی‬
Instances Attribute
Sample Feature
Example Dimention
Data Point Column
Objects Variable
Raw Field
Record
Tuple
:‫کاوی‬‫داده‬‫ها‬‫خصیصه‬ ‫انواع‬
۱۶‫از‬۳۲
‫عاددی‬
●‫ای‬‫فاصله‬ ‫عاددی‬ ‫های‬‫خصیصه‬
●‫نسبت‬ ‫عاددی‬ ‫های‬‫خصیصه‬
‫ترتیب‬ (‫ای‬‫)دسته‬ ‫اسم‬
●‫اسم‬
●(‫)ب‏ولین‬ ‫دودوی‬
‫پیوسته‬ ‫یا‬ ‫گسسته‬
‫جدول‬۳:.‫ها‬‫خصیصه‬ ‫انواع‬
:‫کاوی‬‫داده‬‫مقدمات‬ ‫آماری‬ ‫مفاهیم‬
۱۷‫از‬۳۲
●
‫وسط‬ ‫رنج‬ ،‫مد‬ ،‫میانه‬ ،‫میانگین‬ :‫مرکزی‬ ‫گرایش‬
●
‫و‬ ‫واریانس‬ ، ‫چارک‬‫میان‬ ‫ج‬ ‫رن‬ ،‫چندک‬ ‫و‬ ‫چارک‬ ،‫ج‬ ‫رن‬ :‫پراکندی‬ ‫نجش‬ ‫س‬
‫معیار‬ ‫انحراف‬
●
‫آماری‬ ‫نمودارهای‬
●
‫مشاب‏هت‬ ‫عادم‬ ‫و‬ ‫مشاب‏هت‬ ‫گیری‬‫اندازه‬ ‫های‬‫روش‬
●
،‫نمایه‬ ‫ب‏ر‬ ‫مبتن‬ ،‫هندس‬ ‫تصویرسازی‬ ،‫پیکسل‬ ‫ب‏ر‬ ‫)مبتن‬ ‫داده‬ ‫سازی‬‫ب‏صری‬
(‫پیچیده‬ ‫های‬‫داده‬ ‫نمایش‬ ،‫مراتب‬‫سلسله‬
:‫کاوی‬‫داده‬‫مقدمات‬ ‫آماری‬ ‫مفاهیم‬
۱۸‫از‬۳۲
‫شکل‬۱۰:.‫مرکزی‬ ‫های‬‫گرایش‬
‫شکل‬۱۱:.‫چندک‬ ‫و‬ ‫چارک‬
:‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫روش‬
۱۹‫از‬۳۲
‫شکل‬۱۲:.‫ها‬‫الگوریتم‬ ‫ب‏ندی‬‫دسته‬
:‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫الگوریتم‬ ‫مقایسه‬
۲۰‫از‬۳۲
‫شکل‬۱۳:) ‫داده‬ ‫دانشمندان‬ ‫توسط‬ ‫شده‬ ‫استفاده‬ ‫ب‏رتر‬ ‫روش‬ ‫و‬ ‫الگوریتم‬ ‫ده‬.kdnuggets com.(
:‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫الگوریتم‬ ‫مقایسه‬
۲۱‫از‬۳۲
‫سایر‬
‫ها‬‫روش‬
‫استفاده‬
‫متا‬ ‫از‬
‫نظارت‬
‫نشده‬
‫نظارت‬
‫شده‬
‫میانگین‬
‫استفاده‬
‫ها‬‫الگوریتم‬
‫رأی‬
‫دهندگان‬
‫اساس‬ ‫بر‬ ‫استفاده‬
‫کاربری‬ ‫نوع‬
۸۳٪ ۵۵٪ ۸۱٪ ۹۴٪ ۸/۴ ۵۹٪ ‫صنعت‬
۸۹٪ ۴۹٪ ۸۹٪ ۹۱٪ ۹/۵ ۴/۱٪ ‫دولت/ناسودب‏ر‬
۷۷٪ ۴۷٪ ۷۶٪ ۹۴٪ ۸/۱ ۱۶٪ ‫آموزی‬‫دانش‬
۷۷٪ ۴۴٪ ۸۱٪ ۹۵٪ ۷/۲ ۱۲٪ ‫آکادمیک‬
۸۱٪ ۴۸٪ ۸۲٪ ۹۴٪ ۸/۳ ‫همه‬
‫جدول‬۴) ‫کارب‏ری‬ ‫نوع‬ ‫اساس‬ ‫ب‏ر‬ ‫ها‬‫الگوریتم‬ ‫از‬ ‫استفاده‬ :.kdnuggets com.(
:‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫الگوریتم‬ ‫مقایسه‬
۲۲‫از‬۳۲
‫جدول‬۵) .‫کارب‏ری‬ ‫نوع‬ ‫و‬ ‫عامیق‬ ‫یادگیری‬ +‫ب‏رتر‬ ‫الگوریتم‬ ‫ده‬ :.kdnuggets com.(
‫همه‬ ‫آموزی‬‫دانش‬ ‫آکادمیک‬ ‫دولت/ناسودبر‬ ‫صنعت‬ ‫الگوریتم‬
۶۷٪ ۶۴٪ ۵۱٪ ۶۳٪ ۷۱٪ ‫رگرسیون‬
۵۷٪ ۵۸٪ ۵۱٪ ۶۳٪ ۵۸٪ ‫بندی‬‫خوشه‬
۵۵٪ ۵۷٪ ۳۸٪ ۶۳٪ ۵۹٪ ‫تصمیم‬
۴۹٪ ۴۷٪ ۲۸٪ ۷۱٪ ۵۵٪ ‫سازی‬‫بصری‬
۴۶٪ ۴۷٪ ۴۸٪ ۵۴٪ ۴۶٪ KNN
۴۳٪ ۴۰٪ ۴۸٪ ۵۷٪ ۴۳٪ PCA
۴۳٪ ۳۶٪ ۳۷٪ ۴۹٪ ۴۷٪ ‫ها‬‫آماری‬
۳۸٪ ۳۶٪ ۲۹٪ ۴۰٪ ۴۰٪ ‫تصادفی‬ ‫جنگل‬
۳۷٪ ۲۴٪ ۲۶٪ ۵۴٪ ۴۲٪ ‫زمانی‬ ‫های‬‫سری‬
۳۶٪ ۳۸٪ ۳۳٪ ۴۰٪ ۳۶٪ ‫کاوی‬‫متن‬
۱۹٪ ۱۹٪ ۲۴٪ ۹٪ ۱۸٪ ‫عمیق‬ ‫یادگیری‬
:‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫الگوریتم‬ ‫مقایسه‬
۲۳‫از‬۳۲
‫شکل‬۱۴:‫کارب‏رد‬ ‫اساس‬ ‫ب‏ر‬ ‫ها‬‫الگوریتم‬ ‫از‬ ‫استفاده‬ ‫سوگیری‬).kdnuggets com(.
:‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫روش‬ ‫انتخاب‬
۲۴‫از‬۳۲
●
!‫کنم‬‫می‬ ‫استفاده‬ ‫را‬ ‫هستم‬ ‫مسلط‬ ‫آن‬ ‫به‬ ‫که‬ ‫روشی‬
●
‫داده‬ ‫حجم‬ ،‫داده‬ ‫نوع‬ ،‫مساله‬ ‫هدف‬ ‫اساس‬ ‫ب‏ر‬ ‫ها‬‫الگوریتم‬ ‫ب‏ندی‬‫دسته‬
●
‫کارب‏رد‬ ‫دامنه‬ ‫آن‬ ‫در‬ ‫شده‬ ‫انجام‬ ‫پیشین‬ ‫کارهای‬ ‫ب‏ررس‬
‫شکل‬۱۵:.‫شرح‬ ‫ب‏دون‬
:‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫ابزارهای‬
۲۵‫از‬۳۲
●
‫نویس‬‫ب‏رنامه‬ ‫های‬‫زب‏ان‬)R(‫موارد‬ ‫سایر‬ ‫و‬ ‫پایتون‬ ،
●
‫کارب‏ردی‬ ‫افزارهای‬‫نرم‬،‫مطلب‬ ،‫)وکا‬IBM SPSS Modeler(‫موارد‬ ‫سایر‬ ‫و‬
‫شکل‬۱۶:.‫کاوی‬‫داده‬ ‫آزاد‬ ‫اب‏زارهای‬ ‫ب‏رخی‬
:‫کاوی‬‫داده‬‫واقعی‬ ‫جهان‬ ‫های‬‫مثال‬
۲۶‫از‬۳۲
●
‫گوگل‬
●
‫سرطان‬ ‫ب‏ین‬‫پیش‬
●
‫انتخاب‏ات‬ ‫نتایج‬ ‫تعیین‬ ‫راستای‬ ‫در‬ ‫اجتماعای‬ ‫های‬‫شبکه‬ ‫تحلیل‬
●
‫مشتریان‬ ‫ب‏ندی‬‫ب‏خش‬(‫اینترنت‬ ‫خدمات‬ ‫دهنده‬‫ارائه‬ ‫یک‬ ‫)ایران‬–
●
‫ب‏دحساب‬ ‫و‬ ‫حساب‬‫خوش‬ ‫مشتریان‬ ‫شناسای‬(‫)ایران-ایرانسل‬
●
‫دیگر‬ ‫ب‏سیار‬ ‫موارد‬ ‫و‬(‫پنهان‬ ‫کاوی‬‫داده‬ ‫)شامل‬
:‫آر‬‫نویس‬‫برنامه‬ ‫زبان‬R
۲۷‫از‬۳۲
●
‫نویس‬‫ب‏رنامه‬ ‫زب‏ان‬+‫ها‬‫داده‬ ‫عالم‬ ‫و‬ ‫آماری‬ ‫محاسبات‬ ‫ب‏رای‬ ‫افزاری‬‫نرم‬ ‫محیط‬
●
‫ب‏راساس‬ ‫شده‬ ‫سازی‬‫پیاده‬‫اسکیم‬ ‫و‬ ‫اس‬ ‫های‬‫زب‏ان‬
●
‫گنو‬ ‫همگان‬ ‫عاموم‬ ‫نامه‬‫اجازه‬ ‫تحت‬ ،‫آزاد‬ ‫افزار‬‫نرم‬
●
‫رایگان‬
●
‫و‬ ‫خطی‬ ‫ازی‬ ‫س‬‫)مدل‬ ‫آماری‬ ‫های‬‫تکنیک‬ ‫از‬ ‫ای‬‫ترده‬ ‫گس‬ ‫محدوده‬ ‫حاوی‬
،‫ب‏ندی‬‫رده‬ ،‫زمان‬ ‫های‬‫سری‬ ‫تحلیل‬ ،‫آماری‬ ‫کلسیک‬ ‫های‬‫آزمون‬ ،‫غیرخطی‬
(‫موارد‬ ‫سایر‬ ‫و‬ ‫ب‏ندی‬‫خوشه‬
●
‫نمودارها‬ ‫و‬ ‫گرافیک‬ ‫اشکال‬ ‫تولید‬ ‫در‬ ‫قدرتمند‬
●
‫در‬R‫س‬ ،‫س‬ ‫کدهای‬ ،++‫دارند‬ ‫فراخوان‬ ‫و‬ ‫اتصال‬ ‫قاب‏لیت‬ ‫فورترن‬ ‫و‬
:‫آر‬‫نویس‬‫برنامه‬ ‫زبان‬R
۲۸‫از‬۳۲
‫شکل‬۱۷:‫سال‬ ‫ب‏رتر‬ ‫کاوی‬‫داده‬ ‫اب‏زارهای‬۲۰۱۵).kdnuggets com.(
:‫آر‬‫نویس‬‫برنامه‬ ‫زبان‬R
۲۹‫از‬۳۲
‫شکل‬۱۸:)‫کاوی‬‫داده‬ ‫اب‏زارهای‬ ‫از‬ ‫استفاده‬.kdnuggets com.(
:‫آر‬‫یکپارچه‬ ‫توسعه‬ ‫محیط‬R
۳۰‫از‬۳۲
●
‫نویس‬‫ب‏رنامه‬ ‫زب‏ان‬ ‫ب‏رای‬ ‫یکپارچه‬ ‫توسعه‬ ‫محیط‬ ‫یک‬‫ی‬R
●
‫آفرو‬ ‫گنو‬ ‫همگان‬ ‫عاموم‬ ‫افزاری‬ ‫نرم‬ ‫نامه‬‫اجازه‬ ‫تحت‬ ‫و‬ ‫آزاد‬
●
‫سرور‬ ‫و‬ ‫رومیزی‬ ‫ویرایش‬ ‫دو‬ ‫دارای‬
●
++‫س‬ ‫زب‏ان‬ ‫ب‏ه‬ ‫شده‬ ‫نوشته‬
●
‫گرافیک‬ ‫کارب‏ری‬ ‫راب‏ط‬ ‫طراحی‬ ‫جهت‬ ‫کیوت‬ ‫چارچوب‬ ‫از‬ ‫استفاده‬
:‫آر‬‫با‬ ‫کاوی‬‫داده‬R
۳۱‫از‬۳۲
●
‫اب‏تدا‬R‫سپس‬ ،‫کنید‬ ‫نصب‬Rstudio
●
‫ه‬‫ک‬ ‫های‬‫داده‬ ‫نوع‬R،‫دیتافرم‬ ،‫لیست‬ ،‫س‬‫ماتری‬ ،‫ب‏ردار‬ :‫د‬‫کن‬‫م‬ ‫پشتیبان‬
‫ای‬‫نرده‬ ‫های‬‫کمیت‬
●
‫سرور‬ ‫و‬ ‫رومیزی‬ ‫ویرایش‬ ‫دو‬ ‫دارای‬
●
++‫س‬ ‫زب‏ان‬ ‫ب‏ه‬ ‫شده‬ ‫نوشته‬
●
‫گرافیک‬ ‫کارب‏ری‬ ‫راب‏ط‬ ‫طراحی‬ ‫جهت‬ ‫کیوت‬ ‫چارچوب‬ ‫از‬ ‫استفاده‬
:‫آر‬‫با‬ ‫کاوی‬‫داده‬R(‫افزار‬‫نرم‬ ‫در‬ ‫)ادامه‬
۳۲‫از‬۳۲
●
‫در‬ ‫کدزندی‬ ‫ب‏ه‬ ‫مقدمات‬ ‫نگاه‬R
●
‫در‬ ‫خافظ‬ ‫اشعار‬ ‫کلودتگ‬ ‫ترسیم‬R
‫مراجع‬ ‫و‬ ‫منابع‬
[۱] , ., , ., & , . (2004). , , , .Bellinger G Castro D Mills A Data information knowledge and wisdom
: :// . - . / / . .URL http www systems thinking org dikw dikw htm
[۲] ' ,Mouthann N Efects of big data analytic on organization s value creation Faculty of
,science and faculty of economics and business University of Amsterdam
[۳] , . (2012, 4). - ? , 45.Ras P May Big data wat was de vraag Computable
[۴] , . . ( . .). : . . 17,Leeuwen R V n d De opvolger van de cloud big data Sync Retrieved October
2011, :// . / - - - - - - .from http sync nl de opvolger van de cloud big data
[۵] , , . , " :Hu H Wen Y Chua T S Li X Toward sable systems for big data analytics A technology
", 2014, .tutorial IEEE
[۶] , " : ",Han J and Kamber M and Cerra d Data Mining Concepts and Techniques Morgan
, , , , 2012.Kaufmann Waltham Massachusetts USA
[۷] , " : , , , ", &Kantardzic M Data Mining Concepts Models Methods and Algorithms John Wiley
, , , , , , , 2011.Sons Inc Hoboken NJ USA Second Edition
‫مراجع‬ ‫و‬ ‫منابع‬
[۸] , " ",Tamilselvi R and Kalaiselvi s An Overview of Data Mining Techniques and Applications
( ), 2(2), 506-509, 2013.International Journal of Science and Research IJSR
[۹] , - , "Gibert K Sànchez Marrè M and Codina V Choosing the Right Data Mining
: ",Technique Classifcation of Methods and Intelligent Recommendation International
,Congress on Environmental Modelling and Software Modelling for Environment’s Sake
, , 2010.Ottawa Canada
[۱۰] :// . . /2016/09/ - - - - .http www kdnuggets com poll algorithms used data scientists html (‫آخرین‬
‫تتتاریخ‬‫ت‬ ‫در‬ ‫تتتازدید‬‫ب‬۱۳۹۵/۰۷/۰۷ ).
[۱۱] :// . . /2015/05/ - - - - - - .http www kdnuggets com poll r rapidminer python big data spark html (‫آخرین‬
‫تتتاریخ‬‫ت‬ ‫در‬ ‫تتتازدید‬‫ب‬۱۳۹۵/۰۷/۰۷ ).
[۱۲] , : , 2012.Zahao Y “R and Data mining Examples and Case Studies” junuary
داده‌کاوی و زبان برنامه‌نویسی R

More Related Content

Viewers also liked

استفاده از شبکه عصبی مصنوعی در پی‌اچ‌پی
استفاده از شبکه عصبی مصنوعی در پی‌اچ‌پیاستفاده از شبکه عصبی مصنوعی در پی‌اچ‌پی
استفاده از شبکه عصبی مصنوعی در پی‌اچ‌پیAla Alam Falaki
 
"TextMining with ElasticSearch", Saskia Vola, CEO at textminers.io
"TextMining with ElasticSearch", Saskia Vola, CEO at textminers.io"TextMining with ElasticSearch", Saskia Vola, CEO at textminers.io
"TextMining with ElasticSearch", Saskia Vola, CEO at textminers.ioDataconomy Media
 
ابزارهای پردازش زبان طبیعی
ابزارهای پردازش زبان طبیعیابزارهای پردازش زبان طبیعی
ابزارهای پردازش زبان طبیعیEhsan Asgarian
 
Data Culture Keynote and Exec Track Birm Dec 8th
Data Culture Keynote and Exec Track Birm Dec 8thData Culture Keynote and Exec Track Birm Dec 8th
Data Culture Keynote and Exec Track Birm Dec 8thJonathan Woodward
 
Role of Text Mining in Search Engine
Role of Text Mining in Search EngineRole of Text Mining in Search Engine
Role of Text Mining in Search EngineJay R Modi
 
DAMA Webinar - Big and Little Data Quality
DAMA Webinar - Big and Little Data QualityDAMA Webinar - Big and Little Data Quality
DAMA Webinar - Big and Little Data QualityDATAVERSITY
 
UX, ethnography and possibilities: for Libraries, Museums and Archives
UX, ethnography and possibilities: for Libraries, Museums and ArchivesUX, ethnography and possibilities: for Libraries, Museums and Archives
UX, ethnography and possibilities: for Libraries, Museums and ArchivesNed Potter
 
3 Things Every Sales Team Needs to Be Thinking About in 2017
3 Things Every Sales Team Needs to Be Thinking About in 20173 Things Every Sales Team Needs to Be Thinking About in 2017
3 Things Every Sales Team Needs to Be Thinking About in 2017Drift
 

Viewers also liked (10)

استفاده از شبکه عصبی مصنوعی در پی‌اچ‌پی
استفاده از شبکه عصبی مصنوعی در پی‌اچ‌پیاستفاده از شبکه عصبی مصنوعی در پی‌اچ‌پی
استفاده از شبکه عصبی مصنوعی در پی‌اچ‌پی
 
"TextMining with ElasticSearch", Saskia Vola, CEO at textminers.io
"TextMining with ElasticSearch", Saskia Vola, CEO at textminers.io"TextMining with ElasticSearch", Saskia Vola, CEO at textminers.io
"TextMining with ElasticSearch", Saskia Vola, CEO at textminers.io
 
Rights in CopyLeft
Rights in CopyLeftRights in CopyLeft
Rights in CopyLeft
 
ابزارهای پردازش زبان طبیعی
ابزارهای پردازش زبان طبیعیابزارهای پردازش زبان طبیعی
ابزارهای پردازش زبان طبیعی
 
چرایی تغییر دیدگاه شرکت های انحصاری نسبت به نرم افزار آزاد
چرایی تغییر دیدگاه شرکت های انحصاری نسبت به نرم افزار آزادچرایی تغییر دیدگاه شرکت های انحصاری نسبت به نرم افزار آزاد
چرایی تغییر دیدگاه شرکت های انحصاری نسبت به نرم افزار آزاد
 
Data Culture Keynote and Exec Track Birm Dec 8th
Data Culture Keynote and Exec Track Birm Dec 8thData Culture Keynote and Exec Track Birm Dec 8th
Data Culture Keynote and Exec Track Birm Dec 8th
 
Role of Text Mining in Search Engine
Role of Text Mining in Search EngineRole of Text Mining in Search Engine
Role of Text Mining in Search Engine
 
DAMA Webinar - Big and Little Data Quality
DAMA Webinar - Big and Little Data QualityDAMA Webinar - Big and Little Data Quality
DAMA Webinar - Big and Little Data Quality
 
UX, ethnography and possibilities: for Libraries, Museums and Archives
UX, ethnography and possibilities: for Libraries, Museums and ArchivesUX, ethnography and possibilities: for Libraries, Museums and Archives
UX, ethnography and possibilities: for Libraries, Museums and Archives
 
3 Things Every Sales Team Needs to Be Thinking About in 2017
3 Things Every Sales Team Needs to Be Thinking About in 20173 Things Every Sales Team Needs to Be Thinking About in 2017
3 Things Every Sales Team Needs to Be Thinking About in 2017
 

Similar to داده‌کاوی و زبان برنامه‌نویسی R

Neu ir data mining ghavidel 10 08 1398
Neu ir   data mining ghavidel 10 08 1398Neu ir   data mining ghavidel 10 08 1398
Neu ir data mining ghavidel 10 08 1398Somayeh GhaviDel
 
Bi and data mining with Oracle
Bi and data mining with OracleBi and data mining with Oracle
Bi and data mining with Oracleghanadbashi
 
چارچوب متن باز جهت توسعه سیستم های نرم افزاری
چارچوب متن باز جهت توسعه سیستم های نرم افزاریچارچوب متن باز جهت توسعه سیستم های نرم افزاری
چارچوب متن باز جهت توسعه سیستم های نرم افزاریعباس بني اسدي مقدم
 
Big Data and select suitable tools
Big Data and select suitable toolsBig Data and select suitable tools
Big Data and select suitable toolsMeghdad Hatami
 
مقدمه ای بر جمع آوری اطلاعات
مقدمه ای بر جمع آوری اطلاعاتمقدمه ای بر جمع آوری اطلاعات
مقدمه ای بر جمع آوری اطلاعاتiuvmtech
 
Instructions for Big data analysis and modelling
Instructions for Big data analysis and modellingInstructions for Big data analysis and modelling
Instructions for Big data analysis and modellingkeivan mahdavi
 
امتحان دی ماه وب مقدماتی
امتحان دی ماه وب مقدماتیامتحان دی ماه وب مقدماتی
امتحان دی ماه وب مقدماتیsomayeh daneshparvar
 
Neu ir data mining ghavidel 10 08 1398
Neu ir   data mining ghavidel 10 08 1398Neu ir   data mining ghavidel 10 08 1398
Neu ir data mining ghavidel 10 08 1398Somayeh GhaviDel
 
Data Fusion model for web analytics
Data Fusion model for web analyticsData Fusion model for web analytics
Data Fusion model for web analyticsMahdi Sayyad
 
Method for Two Dimensional Honeypot in a Web Application
Method for Two Dimensional Honeypot in a Web ApplicationMethod for Two Dimensional Honeypot in a Web Application
Method for Two Dimensional Honeypot in a Web ApplicationRamin Najjarbashi
 
Rezome.Ali.Bagheri
Rezome.Ali.BagheriRezome.Ali.Bagheri
Rezome.Ali.BagheriAli Bagheri
 
Foreign Market Entry mode. final
Foreign Market Entry mode. finalForeign Market Entry mode. final
Foreign Market Entry mode. finalFarzad Kheiriasl
 
1393 itrc-ارائه-مدل-مفهومی-روندها-و-حوزه-های-تحقیقاتی-داده-های-عظیم
1393 itrc-ارائه-مدل-مفهومی-روندها-و-حوزه-های-تحقیقاتی-داده-های-عظیم1393 itrc-ارائه-مدل-مفهومی-روندها-و-حوزه-های-تحقیقاتی-داده-های-عظیم
1393 itrc-ارائه-مدل-مفهومی-روندها-و-حوزه-های-تحقیقاتی-داده-های-عظیمEbrahim S. Barazandeh
 
Aliaskari,fayazi resource sharing.markor.. .docx
Aliaskari,fayazi resource sharing.markor.. .docxAliaskari,fayazi resource sharing.markor.. .docx
Aliaskari,fayazi resource sharing.markor.. .docxfahime aliaskari
 
an introduction to Web 3.0 - Semantic Web
an introduction to Web 3.0 - Semantic Weban introduction to Web 3.0 - Semantic Web
an introduction to Web 3.0 - Semantic WebHossein sharafi
 
Autonomous Rescue Robot Mapping(Presentation)
Autonomous Rescue Robot Mapping(Presentation)Autonomous Rescue Robot Mapping(Presentation)
Autonomous Rescue Robot Mapping(Presentation)Amir Hossein Mandegar
 
کلان داده کاربردها و چالش های آن
کلان داده کاربردها و چالش های آنکلان داده کاربردها و چالش های آن
کلان داده کاربردها و چالش های آنHamed Azizi
 

Similar to داده‌کاوی و زبان برنامه‌نویسی R (20)

Neu ir data mining ghavidel 10 08 1398
Neu ir   data mining ghavidel 10 08 1398Neu ir   data mining ghavidel 10 08 1398
Neu ir data mining ghavidel 10 08 1398
 
Bi and data mining with Oracle
Bi and data mining with OracleBi and data mining with Oracle
Bi and data mining with Oracle
 
چارچوب متن باز جهت توسعه سیستم های نرم افزاری
چارچوب متن باز جهت توسعه سیستم های نرم افزاریچارچوب متن باز جهت توسعه سیستم های نرم افزاری
چارچوب متن باز جهت توسعه سیستم های نرم افزاری
 
داده‏اي سازي کسب و کار
داده‏اي سازي کسب و کارداده‏اي سازي کسب و کار
داده‏اي سازي کسب و کار
 
Sharding
ShardingSharding
Sharding
 
Crisp dm.1.0
Crisp dm.1.0Crisp dm.1.0
Crisp dm.1.0
 
Big Data and select suitable tools
Big Data and select suitable toolsBig Data and select suitable tools
Big Data and select suitable tools
 
مقدمه ای بر جمع آوری اطلاعات
مقدمه ای بر جمع آوری اطلاعاتمقدمه ای بر جمع آوری اطلاعات
مقدمه ای بر جمع آوری اطلاعات
 
Instructions for Big data analysis and modelling
Instructions for Big data analysis and modellingInstructions for Big data analysis and modelling
Instructions for Big data analysis and modelling
 
امتحان دی ماه وب مقدماتی
امتحان دی ماه وب مقدماتیامتحان دی ماه وب مقدماتی
امتحان دی ماه وب مقدماتی
 
Neu ir data mining ghavidel 10 08 1398
Neu ir   data mining ghavidel 10 08 1398Neu ir   data mining ghavidel 10 08 1398
Neu ir data mining ghavidel 10 08 1398
 
Data Fusion model for web analytics
Data Fusion model for web analyticsData Fusion model for web analytics
Data Fusion model for web analytics
 
Method for Two Dimensional Honeypot in a Web Application
Method for Two Dimensional Honeypot in a Web ApplicationMethod for Two Dimensional Honeypot in a Web Application
Method for Two Dimensional Honeypot in a Web Application
 
Rezome.Ali.Bagheri
Rezome.Ali.BagheriRezome.Ali.Bagheri
Rezome.Ali.Bagheri
 
Foreign Market Entry mode. final
Foreign Market Entry mode. finalForeign Market Entry mode. final
Foreign Market Entry mode. final
 
1393 itrc-ارائه-مدل-مفهومی-روندها-و-حوزه-های-تحقیقاتی-داده-های-عظیم
1393 itrc-ارائه-مدل-مفهومی-روندها-و-حوزه-های-تحقیقاتی-داده-های-عظیم1393 itrc-ارائه-مدل-مفهومی-روندها-و-حوزه-های-تحقیقاتی-داده-های-عظیم
1393 itrc-ارائه-مدل-مفهومی-روندها-و-حوزه-های-تحقیقاتی-داده-های-عظیم
 
Aliaskari,fayazi resource sharing.markor.. .docx
Aliaskari,fayazi resource sharing.markor.. .docxAliaskari,fayazi resource sharing.markor.. .docx
Aliaskari,fayazi resource sharing.markor.. .docx
 
an introduction to Web 3.0 - Semantic Web
an introduction to Web 3.0 - Semantic Weban introduction to Web 3.0 - Semantic Web
an introduction to Web 3.0 - Semantic Web
 
Autonomous Rescue Robot Mapping(Presentation)
Autonomous Rescue Robot Mapping(Presentation)Autonomous Rescue Robot Mapping(Presentation)
Autonomous Rescue Robot Mapping(Presentation)
 
کلان داده کاربردها و چالش های آن
کلان داده کاربردها و چالش های آنکلان داده کاربردها و چالش های آن
کلان داده کاربردها و چالش های آن
 

More from جشنوارهٔ روز آزادی نرم‌افزار تهران

More from جشنوارهٔ روز آزادی نرم‌افزار تهران (20)

Jekyll
JekyllJekyll
Jekyll
 
چرا اکثر ابررایانه‌ها از گنو/لینوکس استفاده می‌کنند؟
چرا اکثر ابررایانه‌ها از گنو/لینوکس استفاده می‌کنند؟چرا اکثر ابررایانه‌ها از گنو/لینوکس استفاده می‌کنند؟
چرا اکثر ابررایانه‌ها از گنو/لینوکس استفاده می‌کنند؟
 
StarCalendar
StarCalendarStarCalendar
StarCalendar
 
حرکت شتابدار به سوی دنیای Embedded System و نقش نرم‌افزارهای آزاد بر آن
حرکت شتابدار به سوی دنیای Embedded System و نقش نرم‌افزارهای آزاد بر آنحرکت شتابدار به سوی دنیای Embedded System و نقش نرم‌افزارهای آزاد بر آن
حرکت شتابدار به سوی دنیای Embedded System و نقش نرم‌افزارهای آزاد بر آن
 
خلاقیت و دانش آزاد؛ ظهور طبقه‌ای جدید در جامعه
خلاقیت و دانش آزاد؛ ظهور طبقه‌ای جدید در جامعهخلاقیت و دانش آزاد؛ ظهور طبقه‌ای جدید در جامعه
خلاقیت و دانش آزاد؛ ظهور طبقه‌ای جدید در جامعه
 
برنامهٔ آموزشی ویکی‌پدیا
برنامهٔ آموزشی ویکی‌پدیابرنامهٔ آموزشی ویکی‌پدیا
برنامهٔ آموزشی ویکی‌پدیا
 
چه هنگام نرم‌افزار آزاد به دام غیرآزاد می‌افتد؟
چه هنگام نرم‌افزار آزاد به دام غیرآزاد می‌افتد؟چه هنگام نرم‌افزار آزاد به دام غیرآزاد می‌افتد؟
چه هنگام نرم‌افزار آزاد به دام غیرآزاد می‌افتد؟
 
با سوزان آشنا شوید! (معرفی نرم افزار بلندر)
با سوزان آشنا شوید! (معرفی نرم افزار بلندر)با سوزان آشنا شوید! (معرفی نرم افزار بلندر)
با سوزان آشنا شوید! (معرفی نرم افزار بلندر)
 
آزادی و محرمانگی در رایانش همراه
آزادی و محرمانگی در رایانش همراهآزادی و محرمانگی در رایانش همراه
آزادی و محرمانگی در رایانش همراه
 
سیاست‌های کمتر شناخته‌شده ویکی‌پدیا
سیاست‌های کمتر شناخته‌شده ویکی‌پدیاسیاست‌های کمتر شناخته‌شده ویکی‌پدیا
سیاست‌های کمتر شناخته‌شده ویکی‌پدیا
 
معرفی بنیاد ویکی‌مدیا و پروژه‌هایش (به جز ویکی‌پدیا)
معرفی بنیاد ویکی‌مدیا و پروژه‌هایش (به جز ویکی‌پدیا)معرفی بنیاد ویکی‌مدیا و پروژه‌هایش (به جز ویکی‌پدیا)
معرفی بنیاد ویکی‌مدیا و پروژه‌هایش (به جز ویکی‌پدیا)
 
معرفی و ساخت یک فریم‌ورک شخصی به کمک لاراول
معرفی و ساخت یک فریم‌ورک شخصی به کمک لاراولمعرفی و ساخت یک فریم‌ورک شخصی به کمک لاراول
معرفی و ساخت یک فریم‌ورک شخصی به کمک لاراول
 
چگونگی ارسال packet در شبکه و مروری بر Wireshark
چگونگی ارسال packet در شبکه و مروری بر Wiresharkچگونگی ارسال packet در شبکه و مروری بر Wireshark
چگونگی ارسال packet در شبکه و مروری بر Wireshark
 
چگونگی ارسال packet در شبکه و مروری بر Wireshark
چگونگی ارسال packet در شبکه و مروری بر Wiresharkچگونگی ارسال packet در شبکه و مروری بر Wireshark
چگونگی ارسال packet در شبکه و مروری بر Wireshark
 
کار با اوپن‌استریت‌مپ (OSM) از مبتدی تا پیشرفته
کار با اوپن‌استریت‌مپ (OSM) از مبتدی تا پیشرفتهکار با اوپن‌استریت‌مپ (OSM) از مبتدی تا پیشرفته
کار با اوپن‌استریت‌مپ (OSM) از مبتدی تا پیشرفته
 
متاپست (MetaPost)
متاپست (MetaPost)متاپست (MetaPost)
متاپست (MetaPost)
 
آموزش کار با GIT
آموزش کار با GITآموزش کار با GIT
آموزش کار با GIT
 
یادگیری هک کلاه سفید و تست نفوذ به شبکه
یادگیری هک کلاه سفید و تست نفوذ به شبکهیادگیری هک کلاه سفید و تست نفوذ به شبکه
یادگیری هک کلاه سفید و تست نفوذ به شبکه
 
کارگاه امنیت با عنوان Stop Disabling SElinux
کارگاه امنیت با عنوان Stop Disabling SElinuxکارگاه امنیت با عنوان Stop Disabling SElinux
کارگاه امنیت با عنوان Stop Disabling SElinux
 
Embedded linux from scratch
Embedded linux from scratchEmbedded linux from scratch
Embedded linux from scratch
 

داده‌کاوی و زبان برنامه‌نویسی R

  • 1. ‫در‬ ‫شده‬ ‫ارائه‬‫در‬ ‫شده‬ ‫ارائه‬ ‫نویس‬‫برنامه‬ ‫زبان‬ ‫و‬ ‫کاوی‬‫داده‬R ‫نویس‬‫برنامه‬ ‫زبان‬ ‫و‬ ‫کاوی‬‫داده‬R :‫مقاله‬ ‫نویسندگان‬ ) ‫حصارک‬ ‫الهام‬‫ارشد‬ ‫کارشناس‬ ‫مقطع‬ ‫دانشجوی‬( ) ‫جزی‬ ‫داورپناه‬ ‫محمد‬ ‫دکتر‬‫دانشگاه‬ ‫استادیار‬( ‫فولدا‬ ‫صنعتی‬ ‫عالی‬ ‫آموزش‬ ‫موسسه‬
  • 2. ‫در‬ ‫شده‬ ‫ارائه‬‫در‬ ‫شده‬ ‫ارائه‬ ‫نویس‬‫برنامه‬ ‫زبان‬ ‫و‬ ‫کاوی‬‫داده‬R ‫نویس‬‫برنامه‬ ‫زبان‬ ‫و‬ ‫کاوی‬‫داده‬R :‫دهنده‬‫ارائه‬ ‫حصارک‬ ‫الهام‬ . @ .Elham hesaraki gmail com
  • 5. ‫داده‬ ‫تولید‬ ‫رشد‬‫ب‏ه‬‫رو‬‫روند‬ •‫گیگاب‏ایت‬ ‫ب‏ه‬ ‫مگاب‏ایت‬ •‫تراب‏ایت‬ ‫ب‏ه‬ ‫گیگاب‏ایت‬ •‫پتاب‏ایت‬ ‫ب‏ه‬ ‫تراب‏ایت‬ •‫اگزاب‏ایت‬ ‫ب‏ه‬ ‫پتاب‏ایت‬ ‫شکل‬۲:‫داده‬ ‫تولید‬ ‫رشد‬‫ب‏ه‬‫رو‬ ‫روند‬‫ل‬ ‫و‬ ‫چوآ‬ ،‫ون‬ ،‫)هو‬۲۰۱۴.( :‫مقدمه‬‫ابداع‬ ‫تا‬ ‫نیاز‬ ‫از‬ ۳‫از‬۳۲
  • 6. ‫شکل‬۳:‫اطلعاات‬ ‫فقر‬ ‫و‬ ‫داده‬ ‫از‬ ‫غن‬ ‫جهان‬. :‫مقدمه‬.... ،‫داده‬ ،‫داده‬ ۴‫از‬۳۲ •‫آورم‬ ‫دست‬‫ب‏ه‬ ‫توانم‬‫نم‬ ‫را‬ ‫نیازم‬ ‫مورد‬ ‫داده‬ •‫اند‬‫شده‬ ‫پراکنده‬ ‫شبکه‬ ‫در‬ ‫نیازم‬ ‫مورد‬ ‫های‬‫داده‬ •‫کنم‬‫نم‬ ‫درک‬ ‫را‬ ‫نیازم‬ ‫مورد‬ ‫های‬‫داده‬ •‫کنم‬ ‫استفاده‬ ‫توانم‬‫نم‬ ‫را‬ ‫کرده‬ ‫کشف‬ ‫های‬‫داده‬
  • 7. ● ‫ی‬‫ای‬‫رشته‬‫میان‬ ‫عالم‬ ‫ک‬(‫داده‬ ‫پایگاه‬ ‫های‬‫سیستم‬ ،‫ماشین‬ ‫یادگیری‬ ،‫آمار‬ ،‫مصنوعای‬ ‫)هوش‬ •‫داده‬ ‫انبود‬ ‫حجم‬ ‫از‬ ‫دانش‬ ‫و‬ ‫جالب‬ ‫الگوهای‬ ‫کشف‬ :‫کاوی‬‫داده‬‫چیست؟‬ ‫کاوی‬‫داده‬ ۵‫از‬۳۲ ‫شکل‬۴.‫کاوی‬‫داده‬ :
  • 8. ● ‫واحد‬ ‫فرآیند‬ ‫یک‬ ‫ب‏رای‬ ‫گوناگون‬ ‫عابارات‬ ‫از‬ ‫استفاده‬ :‫کاوی‬‫داده‬‫چیست؟‬ ‫کاوی‬‫داده‬ ۶‫از‬۳۲ ‫کنندگان‬‫استفاده‬ ‫نام‬ ‫سال‬ ‫آمار‬ ‫کارشناسان‬ ،‫داده‬ ‫لیروب‬ ‫داده‬ ‫گیری‬‫ماهی‬ ۱۹۶۰ ،‫مصنوعای‬ ‫هوش‬ ‫کارب‏ری‬ ‫جامعه‬ ‫ماشین‬ ‫یادگیری‬ ‫در‬ ‫دانش‬ ‫کشف‬ ‫داده‬ ‫های‬‫پایگاه‬ ۱۹۸۹ ،‫داده‬ ‫پایگاه‬ ‫جامعه‬ ‫کار‬‫و‬‫کسب‬ ‫کاوی‬‫داده‬ ۱۹۹۰ ‫کشف‬ ،‫اطلعاات‬ ‫هرس‬ ،‫داده‬ ‫شناس‬‫ب‏استان‬ :‫اسام‬ ‫سایر‬ ‫دانش‬ ‫استخراج‬ ،‫اطلعاات‬ ‫جدول‬۱.‫فرآیند‬ ‫یک‬ ‫ب‏رای‬ ‫گوناگون‬ ‫های‬‫نام‬ :
  • 9. ● ‫اطلعاات‬ ‫فناوری‬ ‫طبیعی‬ ‫تکامل‬ ‫نتیجه‬ ‫کاوی‬‫داده‬ :‫کاوی‬‫داده‬‫چیست؟‬ ‫کاوی‬‫داده‬ ۷‫از‬۳۲ ‫شکل‬۵‫همکاران‬ ‫و‬ ‫)هان‬ ‫کاوی‬‫داده‬ ‫و‬ ‫اطلعاات‬ ‫فناوری‬ ‫تکامل‬ :۲۰۱۲.(
  • 10. •‫است‬ ‫پذیر‬‫ب‏ازگشت‬ ‫و‬ ‫تکرارشونده‬ ‫ای‬‫مرحله‬ ‫هفت‬ ‫فرآیند‬ ‫یک‬ ‫کاوی‬‫داده‬ :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫فرآیند‬ ۸‫از‬۳۲ ‫شکل‬۶‫همکاران‬ ‫و‬ ‫)هان‬ ‫کاوی‬‫داده‬ ‫فرآیند‬ ‫گام‬ ‫هفت‬ :۲۰۱۲.(
  • 11. •‫داده‬ ‫پاکسازی‬(‫ناسازگار‬ ‫های‬‫داده‬ ‫و‬ ‫نویز‬ ‫)حذف‬ •‫داده‬ ‫سازی‬‫یکپارچه‬(‫چندگانه‬ ‫داده‬ ‫مناب‏ع‬ ‫)ترکیب‬ •‫داده‬ ‫انتخاب‬(‫تحلیل‬ ‫ب‏ا‬ ‫مرتبط‬ ‫های‬‫داده‬ ‫)انتخاب‬ •‫داده‬ ‫نگاشت‬ •‫کاوی‬‫داده‬(‫دانش‬ ‫کشف‬ ‫جهت‬ ‫هوشمندانه‬ ‫های‬‫روش‬ ‫از‬ ‫)استفاده‬ •‫الگو‬ ‫ارزیاب‬(‫ب‏ودن‬ ‫جالب‬ ‫های‬‫)سنجه‬ •‫دانش‬ ‫ارائه‬ :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫فرآیند‬ ۹‫از‬۳۲ ‫پردازش‬‫پیش‬
  • 12. ● Cross Industry Standard Process for Data Mining •‫مسائل‬ ‫حل‬ ‫در‬ ‫کاوی‬‫داده‬ ‫کارشناسان‬ ‫استفاده‬ ‫مورد‬ ‫رویکردهای‬ ‫از‬ ‫مدل‬ :‫کاوی‬‫داده‬‫فرآیند‬ ‫مدل‬-CRISP DM ۱۰‫از‬۳۲ ‫شکل‬۷:‫مدل‬-CRISP DM.
  • 13. ● (‫ای‬‫)راب‏طه‬ ‫داده‬ ‫پایگاه‬ ‫های‬‫داده‬ •(‫تراکنش‬ ‫داده‬ ‫)پایگاه‬ ‫تراکنش‬ ‫های‬‫داده‬ •‫داده‬ ‫انبار‬ ‫های‬‫داده‬ •‫زمان‬ ،‫فضای‬ ‫های‬‫داده‬ ،‫داده‬ ‫جریان‬ ‫های‬‫داده‬ •‫ترتیب‬ ،‫متن‬ ،‫ای‬‫چندرسانه‬ ‫های‬‫داده‬ •‫ها‬‫درخت‬ ‫و‬ ‫ها‬‫گراف‬ :‫کاوی‬‫داده‬‫کاوش‬ ‫قابل‬ ‫های‬‫داده‬ ‫انواع‬ ۱۱‫از‬۳۲
  • 14. ● ‫کلس/مفهوم‬ ‫توصیف‬(‫تمایز‬ ‫و‬ ‫سازی‬‫)مشخصه‬ •‫همبستگ‬ ‫و‬ ‫واب‏ستگ‬ ،‫مکرر‬ ‫الگوهای‬ •‫رگرسیون‬ ‫و‬ ‫ب‏ندی‬‫طبقه‬ •‫ب‏ندی‬‫خوشه‬ •‫دورافتادگ‬ ‫تحلیل‬ :‫کاوی‬‫داده‬‫کشف‬ ‫قابل‬ ‫الگوهای‬ ‫انواع‬ ۱۲‫از‬۳۲ ‫شکل‬۸:.‫الگو‬ ‫کشف‬
  • 15. ● ‫ب‏ودن‬ ‫ب‏دیع‬ ‫و‬ ‫نو‬ •‫انسان‬ ‫ب‏رای‬ ‫ب‏ودن‬ ‫درک‬ ‫قاب‏ل‬ •‫ب‏ودن‬ ‫کارا‬ •‫قطعیت‬ ‫از‬ ‫ای‬‫درجه‬ ‫ب‏ا‬ ‫آزمون‬ ‫یا‬ ‫جدید‬ ‫های‬‫داده‬ ‫ب‏رای‬ ‫داشتن‬ ‫صحت‬ •(‫منطقی‬ ‫فرض‬‫پیش‬ ‫یک‬ ‫ب‏ر‬ ‫گذاشتن‬ ‫)صحه‬ .‫کند‬‫م‬ ‫ارائه‬ ‫دانش‬ ،‫جالب‬ ‫الگوی‬ ‫یک‬ :‫کاوی‬‫داده‬‫الگوها‬ ‫جالب‬ ‫های‬‫سنجه‬ ۱۳‫از‬۳۲
  • 16. ● ‫هرکجا‬ ‫در‬ ‫کاوی‬‫داده‬ ،‫جا‬‫همه‬ :‫کاوی‬‫داده‬‫کاربرد‬ ‫های‬‫زمینه‬ ۱۴‫از‬۳۲ ‫شکل‬۹:.‫شرح‬ ‫ب‏دون‬
  • 17. :‫کاوی‬‫داده‬‫کلیدی‬ ‫واژگان‬ ‫از‬ ‫برخی‬ ‫با‬ ‫آشنای‬ ۱۵‫از‬۳۲ ‫جدول‬۲:.‫کاوی‬‫داده‬ ‫در‬ ‫کلیدی‬ ‫واژگان‬ ‫ب‏رخی‬ Instances Attribute Sample Feature Example Dimention Data Point Column Objects Variable Raw Field Record Tuple
  • 18. :‫کاوی‬‫داده‬‫ها‬‫خصیصه‬ ‫انواع‬ ۱۶‫از‬۳۲ ‫عاددی‬ ●‫ای‬‫فاصله‬ ‫عاددی‬ ‫های‬‫خصیصه‬ ●‫نسبت‬ ‫عاددی‬ ‫های‬‫خصیصه‬ ‫ترتیب‬ (‫ای‬‫)دسته‬ ‫اسم‬ ●‫اسم‬ ●(‫)ب‏ولین‬ ‫دودوی‬ ‫پیوسته‬ ‫یا‬ ‫گسسته‬ ‫جدول‬۳:.‫ها‬‫خصیصه‬ ‫انواع‬
  • 19. :‫کاوی‬‫داده‬‫مقدمات‬ ‫آماری‬ ‫مفاهیم‬ ۱۷‫از‬۳۲ ● ‫وسط‬ ‫رنج‬ ،‫مد‬ ،‫میانه‬ ،‫میانگین‬ :‫مرکزی‬ ‫گرایش‬ ● ‫و‬ ‫واریانس‬ ، ‫چارک‬‫میان‬ ‫ج‬ ‫رن‬ ،‫چندک‬ ‫و‬ ‫چارک‬ ،‫ج‬ ‫رن‬ :‫پراکندی‬ ‫نجش‬ ‫س‬ ‫معیار‬ ‫انحراف‬ ● ‫آماری‬ ‫نمودارهای‬ ● ‫مشاب‏هت‬ ‫عادم‬ ‫و‬ ‫مشاب‏هت‬ ‫گیری‬‫اندازه‬ ‫های‬‫روش‬ ● ،‫نمایه‬ ‫ب‏ر‬ ‫مبتن‬ ،‫هندس‬ ‫تصویرسازی‬ ،‫پیکسل‬ ‫ب‏ر‬ ‫)مبتن‬ ‫داده‬ ‫سازی‬‫ب‏صری‬ (‫پیچیده‬ ‫های‬‫داده‬ ‫نمایش‬ ،‫مراتب‬‫سلسله‬
  • 22. :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫الگوریتم‬ ‫مقایسه‬ ۲۰‫از‬۳۲ ‫شکل‬۱۳:) ‫داده‬ ‫دانشمندان‬ ‫توسط‬ ‫شده‬ ‫استفاده‬ ‫ب‏رتر‬ ‫روش‬ ‫و‬ ‫الگوریتم‬ ‫ده‬.kdnuggets com.(
  • 23. :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫الگوریتم‬ ‫مقایسه‬ ۲۱‫از‬۳۲ ‫سایر‬ ‫ها‬‫روش‬ ‫استفاده‬ ‫متا‬ ‫از‬ ‫نظارت‬ ‫نشده‬ ‫نظارت‬ ‫شده‬ ‫میانگین‬ ‫استفاده‬ ‫ها‬‫الگوریتم‬ ‫رأی‬ ‫دهندگان‬ ‫اساس‬ ‫بر‬ ‫استفاده‬ ‫کاربری‬ ‫نوع‬ ۸۳٪ ۵۵٪ ۸۱٪ ۹۴٪ ۸/۴ ۵۹٪ ‫صنعت‬ ۸۹٪ ۴۹٪ ۸۹٪ ۹۱٪ ۹/۵ ۴/۱٪ ‫دولت/ناسودب‏ر‬ ۷۷٪ ۴۷٪ ۷۶٪ ۹۴٪ ۸/۱ ۱۶٪ ‫آموزی‬‫دانش‬ ۷۷٪ ۴۴٪ ۸۱٪ ۹۵٪ ۷/۲ ۱۲٪ ‫آکادمیک‬ ۸۱٪ ۴۸٪ ۸۲٪ ۹۴٪ ۸/۳ ‫همه‬ ‫جدول‬۴) ‫کارب‏ری‬ ‫نوع‬ ‫اساس‬ ‫ب‏ر‬ ‫ها‬‫الگوریتم‬ ‫از‬ ‫استفاده‬ :.kdnuggets com.(
  • 24. :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫الگوریتم‬ ‫مقایسه‬ ۲۲‫از‬۳۲ ‫جدول‬۵) .‫کارب‏ری‬ ‫نوع‬ ‫و‬ ‫عامیق‬ ‫یادگیری‬ +‫ب‏رتر‬ ‫الگوریتم‬ ‫ده‬ :.kdnuggets com.( ‫همه‬ ‫آموزی‬‫دانش‬ ‫آکادمیک‬ ‫دولت/ناسودبر‬ ‫صنعت‬ ‫الگوریتم‬ ۶۷٪ ۶۴٪ ۵۱٪ ۶۳٪ ۷۱٪ ‫رگرسیون‬ ۵۷٪ ۵۸٪ ۵۱٪ ۶۳٪ ۵۸٪ ‫بندی‬‫خوشه‬ ۵۵٪ ۵۷٪ ۳۸٪ ۶۳٪ ۵۹٪ ‫تصمیم‬ ۴۹٪ ۴۷٪ ۲۸٪ ۷۱٪ ۵۵٪ ‫سازی‬‫بصری‬ ۴۶٪ ۴۷٪ ۴۸٪ ۵۴٪ ۴۶٪ KNN ۴۳٪ ۴۰٪ ۴۸٪ ۵۷٪ ۴۳٪ PCA ۴۳٪ ۳۶٪ ۳۷٪ ۴۹٪ ۴۷٪ ‫ها‬‫آماری‬ ۳۸٪ ۳۶٪ ۲۹٪ ۴۰٪ ۴۰٪ ‫تصادفی‬ ‫جنگل‬ ۳۷٪ ۲۴٪ ۲۶٪ ۵۴٪ ۴۲٪ ‫زمانی‬ ‫های‬‫سری‬ ۳۶٪ ۳۸٪ ۳۳٪ ۴۰٪ ۳۶٪ ‫کاوی‬‫متن‬ ۱۹٪ ۱۹٪ ۲۴٪ ۹٪ ۱۸٪ ‫عمیق‬ ‫یادگیری‬
  • 25. :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫الگوریتم‬ ‫مقایسه‬ ۲۳‫از‬۳۲ ‫شکل‬۱۴:‫کارب‏رد‬ ‫اساس‬ ‫ب‏ر‬ ‫ها‬‫الگوریتم‬ ‫از‬ ‫استفاده‬ ‫سوگیری‬).kdnuggets com(.
  • 26. :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫روش‬ ‫انتخاب‬ ۲۴‫از‬۳۲ ● !‫کنم‬‫می‬ ‫استفاده‬ ‫را‬ ‫هستم‬ ‫مسلط‬ ‫آن‬ ‫به‬ ‫که‬ ‫روشی‬ ● ‫داده‬ ‫حجم‬ ،‫داده‬ ‫نوع‬ ،‫مساله‬ ‫هدف‬ ‫اساس‬ ‫ب‏ر‬ ‫ها‬‫الگوریتم‬ ‫ب‏ندی‬‫دسته‬ ● ‫کارب‏رد‬ ‫دامنه‬ ‫آن‬ ‫در‬ ‫شده‬ ‫انجام‬ ‫پیشین‬ ‫کارهای‬ ‫ب‏ررس‬ ‫شکل‬۱۵:.‫شرح‬ ‫ب‏دون‬
  • 27. :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫ابزارهای‬ ۲۵‫از‬۳۲ ● ‫نویس‬‫ب‏رنامه‬ ‫های‬‫زب‏ان‬)R(‫موارد‬ ‫سایر‬ ‫و‬ ‫پایتون‬ ، ● ‫کارب‏ردی‬ ‫افزارهای‬‫نرم‬،‫مطلب‬ ،‫)وکا‬IBM SPSS Modeler(‫موارد‬ ‫سایر‬ ‫و‬ ‫شکل‬۱۶:.‫کاوی‬‫داده‬ ‫آزاد‬ ‫اب‏زارهای‬ ‫ب‏رخی‬
  • 28. :‫کاوی‬‫داده‬‫واقعی‬ ‫جهان‬ ‫های‬‫مثال‬ ۲۶‫از‬۳۲ ● ‫گوگل‬ ● ‫سرطان‬ ‫ب‏ین‬‫پیش‬ ● ‫انتخاب‏ات‬ ‫نتایج‬ ‫تعیین‬ ‫راستای‬ ‫در‬ ‫اجتماعای‬ ‫های‬‫شبکه‬ ‫تحلیل‬ ● ‫مشتریان‬ ‫ب‏ندی‬‫ب‏خش‬(‫اینترنت‬ ‫خدمات‬ ‫دهنده‬‫ارائه‬ ‫یک‬ ‫)ایران‬– ● ‫ب‏دحساب‬ ‫و‬ ‫حساب‬‫خوش‬ ‫مشتریان‬ ‫شناسای‬(‫)ایران-ایرانسل‬ ● ‫دیگر‬ ‫ب‏سیار‬ ‫موارد‬ ‫و‬(‫پنهان‬ ‫کاوی‬‫داده‬ ‫)شامل‬
  • 29. :‫آر‬‫نویس‬‫برنامه‬ ‫زبان‬R ۲۷‫از‬۳۲ ● ‫نویس‬‫ب‏رنامه‬ ‫زب‏ان‬+‫ها‬‫داده‬ ‫عالم‬ ‫و‬ ‫آماری‬ ‫محاسبات‬ ‫ب‏رای‬ ‫افزاری‬‫نرم‬ ‫محیط‬ ● ‫ب‏راساس‬ ‫شده‬ ‫سازی‬‫پیاده‬‫اسکیم‬ ‫و‬ ‫اس‬ ‫های‬‫زب‏ان‬ ● ‫گنو‬ ‫همگان‬ ‫عاموم‬ ‫نامه‬‫اجازه‬ ‫تحت‬ ،‫آزاد‬ ‫افزار‬‫نرم‬ ● ‫رایگان‬ ● ‫و‬ ‫خطی‬ ‫ازی‬ ‫س‬‫)مدل‬ ‫آماری‬ ‫های‬‫تکنیک‬ ‫از‬ ‫ای‬‫ترده‬ ‫گس‬ ‫محدوده‬ ‫حاوی‬ ،‫ب‏ندی‬‫رده‬ ،‫زمان‬ ‫های‬‫سری‬ ‫تحلیل‬ ،‫آماری‬ ‫کلسیک‬ ‫های‬‫آزمون‬ ،‫غیرخطی‬ (‫موارد‬ ‫سایر‬ ‫و‬ ‫ب‏ندی‬‫خوشه‬ ● ‫نمودارها‬ ‫و‬ ‫گرافیک‬ ‫اشکال‬ ‫تولید‬ ‫در‬ ‫قدرتمند‬ ● ‫در‬R‫س‬ ،‫س‬ ‫کدهای‬ ،++‫دارند‬ ‫فراخوان‬ ‫و‬ ‫اتصال‬ ‫قاب‏لیت‬ ‫فورترن‬ ‫و‬
  • 32. :‫آر‬‫یکپارچه‬ ‫توسعه‬ ‫محیط‬R ۳۰‫از‬۳۲ ● ‫نویس‬‫ب‏رنامه‬ ‫زب‏ان‬ ‫ب‏رای‬ ‫یکپارچه‬ ‫توسعه‬ ‫محیط‬ ‫یک‬‫ی‬R ● ‫آفرو‬ ‫گنو‬ ‫همگان‬ ‫عاموم‬ ‫افزاری‬ ‫نرم‬ ‫نامه‬‫اجازه‬ ‫تحت‬ ‫و‬ ‫آزاد‬ ● ‫سرور‬ ‫و‬ ‫رومیزی‬ ‫ویرایش‬ ‫دو‬ ‫دارای‬ ● ++‫س‬ ‫زب‏ان‬ ‫ب‏ه‬ ‫شده‬ ‫نوشته‬ ● ‫گرافیک‬ ‫کارب‏ری‬ ‫راب‏ط‬ ‫طراحی‬ ‫جهت‬ ‫کیوت‬ ‫چارچوب‬ ‫از‬ ‫استفاده‬
  • 33. :‫آر‬‫با‬ ‫کاوی‬‫داده‬R ۳۱‫از‬۳۲ ● ‫اب‏تدا‬R‫سپس‬ ،‫کنید‬ ‫نصب‬Rstudio ● ‫ه‬‫ک‬ ‫های‬‫داده‬ ‫نوع‬R،‫دیتافرم‬ ،‫لیست‬ ،‫س‬‫ماتری‬ ،‫ب‏ردار‬ :‫د‬‫کن‬‫م‬ ‫پشتیبان‬ ‫ای‬‫نرده‬ ‫های‬‫کمیت‬ ● ‫سرور‬ ‫و‬ ‫رومیزی‬ ‫ویرایش‬ ‫دو‬ ‫دارای‬ ● ++‫س‬ ‫زب‏ان‬ ‫ب‏ه‬ ‫شده‬ ‫نوشته‬ ● ‫گرافیک‬ ‫کارب‏ری‬ ‫راب‏ط‬ ‫طراحی‬ ‫جهت‬ ‫کیوت‬ ‫چارچوب‬ ‫از‬ ‫استفاده‬
  • 34. :‫آر‬‫با‬ ‫کاوی‬‫داده‬R(‫افزار‬‫نرم‬ ‫در‬ ‫)ادامه‬ ۳۲‫از‬۳۲ ● ‫در‬ ‫کدزندی‬ ‫ب‏ه‬ ‫مقدمات‬ ‫نگاه‬R ● ‫در‬ ‫خافظ‬ ‫اشعار‬ ‫کلودتگ‬ ‫ترسیم‬R
  • 35. ‫مراجع‬ ‫و‬ ‫منابع‬ [۱] , ., , ., & , . (2004). , , , .Bellinger G Castro D Mills A Data information knowledge and wisdom : :// . - . / / . .URL http www systems thinking org dikw dikw htm [۲] ' ,Mouthann N Efects of big data analytic on organization s value creation Faculty of ,science and faculty of economics and business University of Amsterdam [۳] , . (2012, 4). - ? , 45.Ras P May Big data wat was de vraag Computable [۴] , . . ( . .). : . . 17,Leeuwen R V n d De opvolger van de cloud big data Sync Retrieved October 2011, :// . / - - - - - - .from http sync nl de opvolger van de cloud big data [۵] , , . , " :Hu H Wen Y Chua T S Li X Toward sable systems for big data analytics A technology ", 2014, .tutorial IEEE [۶] , " : ",Han J and Kamber M and Cerra d Data Mining Concepts and Techniques Morgan , , , , 2012.Kaufmann Waltham Massachusetts USA [۷] , " : , , , ", &Kantardzic M Data Mining Concepts Models Methods and Algorithms John Wiley , , , , , , , 2011.Sons Inc Hoboken NJ USA Second Edition
  • 36. ‫مراجع‬ ‫و‬ ‫منابع‬ [۸] , " ",Tamilselvi R and Kalaiselvi s An Overview of Data Mining Techniques and Applications ( ), 2(2), 506-509, 2013.International Journal of Science and Research IJSR [۹] , - , "Gibert K Sànchez Marrè M and Codina V Choosing the Right Data Mining : ",Technique Classifcation of Methods and Intelligent Recommendation International ,Congress on Environmental Modelling and Software Modelling for Environment’s Sake , , 2010.Ottawa Canada [۱۰] :// . . /2016/09/ - - - - .http www kdnuggets com poll algorithms used data scientists html (‫آخرین‬ ‫تتتاریخ‬‫ت‬ ‫در‬ ‫تتتازدید‬‫ب‬۱۳۹۵/۰۷/۰۷ ). [۱۱] :// . . /2015/05/ - - - - - - .http www kdnuggets com poll r rapidminer python big data spark html (‫آخرین‬ ‫تتتاریخ‬‫ت‬ ‫در‬ ‫تتتازدید‬‫ب‬۱۳۹۵/۰۷/۰۷ ). [۱۲] , : , 2012.Zahao Y “R and Data mining Examples and Case Studies” junuary