داده‌کاوی و زبان برنامه‌نویسی R

21 views

Published on

سرفصل‌ها:

نگاهی اجمالی به ضرورت طرح مبحث داده‌کاوی و تاریخچه تکامل آن
کاربردهای داده‌کاوی و بررسی مثال‌های جهان واقعی
بررسی فرایند داده‌کاوی
بررسی مدل CRISP-DM
بررسی انواع داده‌های قابل کاوش
معرفی انواع الگوهای قابل کشف
انتخاب روش داده‌کاوی مناسب براساس مسئله
نگاهی اجمالی به بحث پیش‌پردازش داده‌ها
نگاهی به الگوریتم‌های داده‌کاوی
فناوری‌های قابل استفاده در داده‌کاوی
بررسی زبان برنامه‌نویسی R، و استفاده از آن در داده‌کاوی در گام‌های مختلف داده‌کاوی

Published in: Software
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
21
On SlideShare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

داده‌کاوی و زبان برنامه‌نویسی R

  1. 1. ‫در‬ ‫شده‬ ‫ارائه‬‫در‬ ‫شده‬ ‫ارائه‬ ‫نویس‬‫برنامه‬ ‫زبان‬ ‫و‬ ‫کاوی‬‫داده‬R ‫نویس‬‫برنامه‬ ‫زبان‬ ‫و‬ ‫کاوی‬‫داده‬R :‫مقاله‬ ‫نویسندگان‬ ) ‫حصارک‬ ‫الهام‬‫ارشد‬ ‫کارشناس‬ ‫مقطع‬ ‫دانشجوی‬( ) ‫جزی‬ ‫داورپناه‬ ‫محمد‬ ‫دکتر‬‫دانشگاه‬ ‫استادیار‬( ‫فولدا‬ ‫صنعتی‬ ‫عالی‬ ‫آموزش‬ ‫موسسه‬
  2. 2. ‫در‬ ‫شده‬ ‫ارائه‬‫در‬ ‫شده‬ ‫ارائه‬ ‫نویس‬‫برنامه‬ ‫زبان‬ ‫و‬ ‫کاوی‬‫داده‬R ‫نویس‬‫برنامه‬ ‫زبان‬ ‫و‬ ‫کاوی‬‫داده‬R :‫دهنده‬‫ارائه‬ ‫حصارک‬ ‫الهام‬ . @ .Elham hesaraki gmail com
  3. 3. ۱‫از‬۳۲ ‫کارگاه‬ ‫محتوای‬ ‫مقدمه‬ ‫کاوی‬‫داده‬ R‫و‬RStudio ‫پاسخ‬ ‫و‬ ‫پرسش‬
  4. 4. ‫انسان‬ ‫ذهن‬ ‫ب‏ندی‬‫دسته‬‫)اکاف‬۱۹۸۹( •‫داده‬ •‫اطلعاات‬ •‫دانش‬ •‫ادراک‬ •‫خرد‬ •‫نویز‬ :‫مقدمه‬‫خرد‬ ‫تا‬ ‫داده‬ ‫از‬ ‫شکل‬۱‫)اکاف‬ ‫خرد‬ ‫تا‬ ‫داده‬ ‫از‬ :۱۹۸۹.( ۲‫از‬۳۲
  5. 5. ‫داده‬ ‫تولید‬ ‫رشد‬‫ب‏ه‬‫رو‬‫روند‬ •‫گیگاب‏ایت‬ ‫ب‏ه‬ ‫مگاب‏ایت‬ •‫تراب‏ایت‬ ‫ب‏ه‬ ‫گیگاب‏ایت‬ •‫پتاب‏ایت‬ ‫ب‏ه‬ ‫تراب‏ایت‬ •‫اگزاب‏ایت‬ ‫ب‏ه‬ ‫پتاب‏ایت‬ ‫شکل‬۲:‫داده‬ ‫تولید‬ ‫رشد‬‫ب‏ه‬‫رو‬ ‫روند‬‫ل‬ ‫و‬ ‫چوآ‬ ،‫ون‬ ،‫)هو‬۲۰۱۴.( :‫مقدمه‬‫ابداع‬ ‫تا‬ ‫نیاز‬ ‫از‬ ۳‫از‬۳۲
  6. 6. ‫شکل‬۳:‫اطلعاات‬ ‫فقر‬ ‫و‬ ‫داده‬ ‫از‬ ‫غن‬ ‫جهان‬. :‫مقدمه‬.... ،‫داده‬ ،‫داده‬ ۴‫از‬۳۲ •‫آورم‬ ‫دست‬‫ب‏ه‬ ‫توانم‬‫نم‬ ‫را‬ ‫نیازم‬ ‫مورد‬ ‫داده‬ •‫اند‬‫شده‬ ‫پراکنده‬ ‫شبکه‬ ‫در‬ ‫نیازم‬ ‫مورد‬ ‫های‬‫داده‬ •‫کنم‬‫نم‬ ‫درک‬ ‫را‬ ‫نیازم‬ ‫مورد‬ ‫های‬‫داده‬ •‫کنم‬ ‫استفاده‬ ‫توانم‬‫نم‬ ‫را‬ ‫کرده‬ ‫کشف‬ ‫های‬‫داده‬
  7. 7. ● ‫ی‬‫ای‬‫رشته‬‫میان‬ ‫عالم‬ ‫ک‬(‫داده‬ ‫پایگاه‬ ‫های‬‫سیستم‬ ،‫ماشین‬ ‫یادگیری‬ ،‫آمار‬ ،‫مصنوعای‬ ‫)هوش‬ •‫داده‬ ‫انبود‬ ‫حجم‬ ‫از‬ ‫دانش‬ ‫و‬ ‫جالب‬ ‫الگوهای‬ ‫کشف‬ :‫کاوی‬‫داده‬‫چیست؟‬ ‫کاوی‬‫داده‬ ۵‫از‬۳۲ ‫شکل‬۴.‫کاوی‬‫داده‬ :
  8. 8. ● ‫واحد‬ ‫فرآیند‬ ‫یک‬ ‫ب‏رای‬ ‫گوناگون‬ ‫عابارات‬ ‫از‬ ‫استفاده‬ :‫کاوی‬‫داده‬‫چیست؟‬ ‫کاوی‬‫داده‬ ۶‫از‬۳۲ ‫کنندگان‬‫استفاده‬ ‫نام‬ ‫سال‬ ‫آمار‬ ‫کارشناسان‬ ،‫داده‬ ‫لیروب‬ ‫داده‬ ‫گیری‬‫ماهی‬ ۱۹۶۰ ،‫مصنوعای‬ ‫هوش‬ ‫کارب‏ری‬ ‫جامعه‬ ‫ماشین‬ ‫یادگیری‬ ‫در‬ ‫دانش‬ ‫کشف‬ ‫داده‬ ‫های‬‫پایگاه‬ ۱۹۸۹ ،‫داده‬ ‫پایگاه‬ ‫جامعه‬ ‫کار‬‫و‬‫کسب‬ ‫کاوی‬‫داده‬ ۱۹۹۰ ‫کشف‬ ،‫اطلعاات‬ ‫هرس‬ ،‫داده‬ ‫شناس‬‫ب‏استان‬ :‫اسام‬ ‫سایر‬ ‫دانش‬ ‫استخراج‬ ،‫اطلعاات‬ ‫جدول‬۱.‫فرآیند‬ ‫یک‬ ‫ب‏رای‬ ‫گوناگون‬ ‫های‬‫نام‬ :
  9. 9. ● ‫اطلعاات‬ ‫فناوری‬ ‫طبیعی‬ ‫تکامل‬ ‫نتیجه‬ ‫کاوی‬‫داده‬ :‫کاوی‬‫داده‬‫چیست؟‬ ‫کاوی‬‫داده‬ ۷‫از‬۳۲ ‫شکل‬۵‫همکاران‬ ‫و‬ ‫)هان‬ ‫کاوی‬‫داده‬ ‫و‬ ‫اطلعاات‬ ‫فناوری‬ ‫تکامل‬ :۲۰۱۲.(
  10. 10. •‫است‬ ‫پذیر‬‫ب‏ازگشت‬ ‫و‬ ‫تکرارشونده‬ ‫ای‬‫مرحله‬ ‫هفت‬ ‫فرآیند‬ ‫یک‬ ‫کاوی‬‫داده‬ :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫فرآیند‬ ۸‫از‬۳۲ ‫شکل‬۶‫همکاران‬ ‫و‬ ‫)هان‬ ‫کاوی‬‫داده‬ ‫فرآیند‬ ‫گام‬ ‫هفت‬ :۲۰۱۲.(
  11. 11. •‫داده‬ ‫پاکسازی‬(‫ناسازگار‬ ‫های‬‫داده‬ ‫و‬ ‫نویز‬ ‫)حذف‬ •‫داده‬ ‫سازی‬‫یکپارچه‬(‫چندگانه‬ ‫داده‬ ‫مناب‏ع‬ ‫)ترکیب‬ •‫داده‬ ‫انتخاب‬(‫تحلیل‬ ‫ب‏ا‬ ‫مرتبط‬ ‫های‬‫داده‬ ‫)انتخاب‬ •‫داده‬ ‫نگاشت‬ •‫کاوی‬‫داده‬(‫دانش‬ ‫کشف‬ ‫جهت‬ ‫هوشمندانه‬ ‫های‬‫روش‬ ‫از‬ ‫)استفاده‬ •‫الگو‬ ‫ارزیاب‬(‫ب‏ودن‬ ‫جالب‬ ‫های‬‫)سنجه‬ •‫دانش‬ ‫ارائه‬ :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫فرآیند‬ ۹‫از‬۳۲ ‫پردازش‬‫پیش‬
  12. 12. ● Cross Industry Standard Process for Data Mining •‫مسائل‬ ‫حل‬ ‫در‬ ‫کاوی‬‫داده‬ ‫کارشناسان‬ ‫استفاده‬ ‫مورد‬ ‫رویکردهای‬ ‫از‬ ‫مدل‬ :‫کاوی‬‫داده‬‫فرآیند‬ ‫مدل‬-CRISP DM ۱۰‫از‬۳۲ ‫شکل‬۷:‫مدل‬-CRISP DM.
  13. 13. ● (‫ای‬‫)راب‏طه‬ ‫داده‬ ‫پایگاه‬ ‫های‬‫داده‬ •(‫تراکنش‬ ‫داده‬ ‫)پایگاه‬ ‫تراکنش‬ ‫های‬‫داده‬ •‫داده‬ ‫انبار‬ ‫های‬‫داده‬ •‫زمان‬ ،‫فضای‬ ‫های‬‫داده‬ ،‫داده‬ ‫جریان‬ ‫های‬‫داده‬ •‫ترتیب‬ ،‫متن‬ ،‫ای‬‫چندرسانه‬ ‫های‬‫داده‬ •‫ها‬‫درخت‬ ‫و‬ ‫ها‬‫گراف‬ :‫کاوی‬‫داده‬‫کاوش‬ ‫قابل‬ ‫های‬‫داده‬ ‫انواع‬ ۱۱‫از‬۳۲
  14. 14. ● ‫کلس/مفهوم‬ ‫توصیف‬(‫تمایز‬ ‫و‬ ‫سازی‬‫)مشخصه‬ •‫همبستگ‬ ‫و‬ ‫واب‏ستگ‬ ،‫مکرر‬ ‫الگوهای‬ •‫رگرسیون‬ ‫و‬ ‫ب‏ندی‬‫طبقه‬ •‫ب‏ندی‬‫خوشه‬ •‫دورافتادگ‬ ‫تحلیل‬ :‫کاوی‬‫داده‬‫کشف‬ ‫قابل‬ ‫الگوهای‬ ‫انواع‬ ۱۲‫از‬۳۲ ‫شکل‬۸:.‫الگو‬ ‫کشف‬
  15. 15. ● ‫ب‏ودن‬ ‫ب‏دیع‬ ‫و‬ ‫نو‬ •‫انسان‬ ‫ب‏رای‬ ‫ب‏ودن‬ ‫درک‬ ‫قاب‏ل‬ •‫ب‏ودن‬ ‫کارا‬ •‫قطعیت‬ ‫از‬ ‫ای‬‫درجه‬ ‫ب‏ا‬ ‫آزمون‬ ‫یا‬ ‫جدید‬ ‫های‬‫داده‬ ‫ب‏رای‬ ‫داشتن‬ ‫صحت‬ •(‫منطقی‬ ‫فرض‬‫پیش‬ ‫یک‬ ‫ب‏ر‬ ‫گذاشتن‬ ‫)صحه‬ .‫کند‬‫م‬ ‫ارائه‬ ‫دانش‬ ،‫جالب‬ ‫الگوی‬ ‫یک‬ :‫کاوی‬‫داده‬‫الگوها‬ ‫جالب‬ ‫های‬‫سنجه‬ ۱۳‫از‬۳۲
  16. 16. ● ‫هرکجا‬ ‫در‬ ‫کاوی‬‫داده‬ ،‫جا‬‫همه‬ :‫کاوی‬‫داده‬‫کاربرد‬ ‫های‬‫زمینه‬ ۱۴‫از‬۳۲ ‫شکل‬۹:.‫شرح‬ ‫ب‏دون‬
  17. 17. :‫کاوی‬‫داده‬‫کلیدی‬ ‫واژگان‬ ‫از‬ ‫برخی‬ ‫با‬ ‫آشنای‬ ۱۵‫از‬۳۲ ‫جدول‬۲:.‫کاوی‬‫داده‬ ‫در‬ ‫کلیدی‬ ‫واژگان‬ ‫ب‏رخی‬ Instances Attribute Sample Feature Example Dimention Data Point Column Objects Variable Raw Field Record Tuple
  18. 18. :‫کاوی‬‫داده‬‫ها‬‫خصیصه‬ ‫انواع‬ ۱۶‫از‬۳۲ ‫عاددی‬ ●‫ای‬‫فاصله‬ ‫عاددی‬ ‫های‬‫خصیصه‬ ●‫نسبت‬ ‫عاددی‬ ‫های‬‫خصیصه‬ ‫ترتیب‬ (‫ای‬‫)دسته‬ ‫اسم‬ ●‫اسم‬ ●(‫)ب‏ولین‬ ‫دودوی‬ ‫پیوسته‬ ‫یا‬ ‫گسسته‬ ‫جدول‬۳:.‫ها‬‫خصیصه‬ ‫انواع‬
  19. 19. :‫کاوی‬‫داده‬‫مقدمات‬ ‫آماری‬ ‫مفاهیم‬ ۱۷‫از‬۳۲ ● ‫وسط‬ ‫رنج‬ ،‫مد‬ ،‫میانه‬ ،‫میانگین‬ :‫مرکزی‬ ‫گرایش‬ ● ‫و‬ ‫واریانس‬ ، ‫چارک‬‫میان‬ ‫ج‬ ‫رن‬ ،‫چندک‬ ‫و‬ ‫چارک‬ ،‫ج‬ ‫رن‬ :‫پراکندی‬ ‫نجش‬ ‫س‬ ‫معیار‬ ‫انحراف‬ ● ‫آماری‬ ‫نمودارهای‬ ● ‫مشاب‏هت‬ ‫عادم‬ ‫و‬ ‫مشاب‏هت‬ ‫گیری‬‫اندازه‬ ‫های‬‫روش‬ ● ،‫نمایه‬ ‫ب‏ر‬ ‫مبتن‬ ،‫هندس‬ ‫تصویرسازی‬ ،‫پیکسل‬ ‫ب‏ر‬ ‫)مبتن‬ ‫داده‬ ‫سازی‬‫ب‏صری‬ (‫پیچیده‬ ‫های‬‫داده‬ ‫نمایش‬ ،‫مراتب‬‫سلسله‬
  20. 20. :‫کاوی‬‫داده‬‫مقدمات‬ ‫آماری‬ ‫مفاهیم‬ ۱۸‫از‬۳۲ ‫شکل‬۱۰:.‫مرکزی‬ ‫های‬‫گرایش‬ ‫شکل‬۱۱:.‫چندک‬ ‫و‬ ‫چارک‬
  21. 21. :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫روش‬ ۱۹‫از‬۳۲ ‫شکل‬۱۲:.‫ها‬‫الگوریتم‬ ‫ب‏ندی‬‫دسته‬
  22. 22. :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫الگوریتم‬ ‫مقایسه‬ ۲۰‫از‬۳۲ ‫شکل‬۱۳:) ‫داده‬ ‫دانشمندان‬ ‫توسط‬ ‫شده‬ ‫استفاده‬ ‫ب‏رتر‬ ‫روش‬ ‫و‬ ‫الگوریتم‬ ‫ده‬.kdnuggets com.(
  23. 23. :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫الگوریتم‬ ‫مقایسه‬ ۲۱‫از‬۳۲ ‫سایر‬ ‫ها‬‫روش‬ ‫استفاده‬ ‫متا‬ ‫از‬ ‫نظارت‬ ‫نشده‬ ‫نظارت‬ ‫شده‬ ‫میانگین‬ ‫استفاده‬ ‫ها‬‫الگوریتم‬ ‫رأی‬ ‫دهندگان‬ ‫اساس‬ ‫بر‬ ‫استفاده‬ ‫کاربری‬ ‫نوع‬ ۸۳٪ ۵۵٪ ۸۱٪ ۹۴٪ ۸/۴ ۵۹٪ ‫صنعت‬ ۸۹٪ ۴۹٪ ۸۹٪ ۹۱٪ ۹/۵ ۴/۱٪ ‫دولت/ناسودب‏ر‬ ۷۷٪ ۴۷٪ ۷۶٪ ۹۴٪ ۸/۱ ۱۶٪ ‫آموزی‬‫دانش‬ ۷۷٪ ۴۴٪ ۸۱٪ ۹۵٪ ۷/۲ ۱۲٪ ‫آکادمیک‬ ۸۱٪ ۴۸٪ ۸۲٪ ۹۴٪ ۸/۳ ‫همه‬ ‫جدول‬۴) ‫کارب‏ری‬ ‫نوع‬ ‫اساس‬ ‫ب‏ر‬ ‫ها‬‫الگوریتم‬ ‫از‬ ‫استفاده‬ :.kdnuggets com.(
  24. 24. :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫الگوریتم‬ ‫مقایسه‬ ۲۲‫از‬۳۲ ‫جدول‬۵) .‫کارب‏ری‬ ‫نوع‬ ‫و‬ ‫عامیق‬ ‫یادگیری‬ +‫ب‏رتر‬ ‫الگوریتم‬ ‫ده‬ :.kdnuggets com.( ‫همه‬ ‫آموزی‬‫دانش‬ ‫آکادمیک‬ ‫دولت/ناسودبر‬ ‫صنعت‬ ‫الگوریتم‬ ۶۷٪ ۶۴٪ ۵۱٪ ۶۳٪ ۷۱٪ ‫رگرسیون‬ ۵۷٪ ۵۸٪ ۵۱٪ ۶۳٪ ۵۸٪ ‫بندی‬‫خوشه‬ ۵۵٪ ۵۷٪ ۳۸٪ ۶۳٪ ۵۹٪ ‫تصمیم‬ ۴۹٪ ۴۷٪ ۲۸٪ ۷۱٪ ۵۵٪ ‫سازی‬‫بصری‬ ۴۶٪ ۴۷٪ ۴۸٪ ۵۴٪ ۴۶٪ KNN ۴۳٪ ۴۰٪ ۴۸٪ ۵۷٪ ۴۳٪ PCA ۴۳٪ ۳۶٪ ۳۷٪ ۴۹٪ ۴۷٪ ‫ها‬‫آماری‬ ۳۸٪ ۳۶٪ ۲۹٪ ۴۰٪ ۴۰٪ ‫تصادفی‬ ‫جنگل‬ ۳۷٪ ۲۴٪ ۲۶٪ ۵۴٪ ۴۲٪ ‫زمانی‬ ‫های‬‫سری‬ ۳۶٪ ۳۸٪ ۳۳٪ ۴۰٪ ۳۶٪ ‫کاوی‬‫متن‬ ۱۹٪ ۱۹٪ ۲۴٪ ۹٪ ۱۸٪ ‫عمیق‬ ‫یادگیری‬
  25. 25. :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫های‬‫الگوریتم‬ ‫مقایسه‬ ۲۳‫از‬۳۲ ‫شکل‬۱۴:‫کارب‏رد‬ ‫اساس‬ ‫ب‏ر‬ ‫ها‬‫الگوریتم‬ ‫از‬ ‫استفاده‬ ‫سوگیری‬).kdnuggets com(.
  26. 26. :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫روش‬ ‫انتخاب‬ ۲۴‫از‬۳۲ ● !‫کنم‬‫می‬ ‫استفاده‬ ‫را‬ ‫هستم‬ ‫مسلط‬ ‫آن‬ ‫به‬ ‫که‬ ‫روشی‬ ● ‫داده‬ ‫حجم‬ ،‫داده‬ ‫نوع‬ ،‫مساله‬ ‫هدف‬ ‫اساس‬ ‫ب‏ر‬ ‫ها‬‫الگوریتم‬ ‫ب‏ندی‬‫دسته‬ ● ‫کارب‏رد‬ ‫دامنه‬ ‫آن‬ ‫در‬ ‫شده‬ ‫انجام‬ ‫پیشین‬ ‫کارهای‬ ‫ب‏ررس‬ ‫شکل‬۱۵:.‫شرح‬ ‫ب‏دون‬
  27. 27. :‫کاوی‬‫داده‬‫کاوی‬‫داده‬ ‫ابزارهای‬ ۲۵‫از‬۳۲ ● ‫نویس‬‫ب‏رنامه‬ ‫های‬‫زب‏ان‬)R(‫موارد‬ ‫سایر‬ ‫و‬ ‫پایتون‬ ، ● ‫کارب‏ردی‬ ‫افزارهای‬‫نرم‬،‫مطلب‬ ،‫)وکا‬IBM SPSS Modeler(‫موارد‬ ‫سایر‬ ‫و‬ ‫شکل‬۱۶:.‫کاوی‬‫داده‬ ‫آزاد‬ ‫اب‏زارهای‬ ‫ب‏رخی‬
  28. 28. :‫کاوی‬‫داده‬‫واقعی‬ ‫جهان‬ ‫های‬‫مثال‬ ۲۶‫از‬۳۲ ● ‫گوگل‬ ● ‫سرطان‬ ‫ب‏ین‬‫پیش‬ ● ‫انتخاب‏ات‬ ‫نتایج‬ ‫تعیین‬ ‫راستای‬ ‫در‬ ‫اجتماعای‬ ‫های‬‫شبکه‬ ‫تحلیل‬ ● ‫مشتریان‬ ‫ب‏ندی‬‫ب‏خش‬(‫اینترنت‬ ‫خدمات‬ ‫دهنده‬‫ارائه‬ ‫یک‬ ‫)ایران‬– ● ‫ب‏دحساب‬ ‫و‬ ‫حساب‬‫خوش‬ ‫مشتریان‬ ‫شناسای‬(‫)ایران-ایرانسل‬ ● ‫دیگر‬ ‫ب‏سیار‬ ‫موارد‬ ‫و‬(‫پنهان‬ ‫کاوی‬‫داده‬ ‫)شامل‬
  29. 29. :‫آر‬‫نویس‬‫برنامه‬ ‫زبان‬R ۲۷‫از‬۳۲ ● ‫نویس‬‫ب‏رنامه‬ ‫زب‏ان‬+‫ها‬‫داده‬ ‫عالم‬ ‫و‬ ‫آماری‬ ‫محاسبات‬ ‫ب‏رای‬ ‫افزاری‬‫نرم‬ ‫محیط‬ ● ‫ب‏راساس‬ ‫شده‬ ‫سازی‬‫پیاده‬‫اسکیم‬ ‫و‬ ‫اس‬ ‫های‬‫زب‏ان‬ ● ‫گنو‬ ‫همگان‬ ‫عاموم‬ ‫نامه‬‫اجازه‬ ‫تحت‬ ،‫آزاد‬ ‫افزار‬‫نرم‬ ● ‫رایگان‬ ● ‫و‬ ‫خطی‬ ‫ازی‬ ‫س‬‫)مدل‬ ‫آماری‬ ‫های‬‫تکنیک‬ ‫از‬ ‫ای‬‫ترده‬ ‫گس‬ ‫محدوده‬ ‫حاوی‬ ،‫ب‏ندی‬‫رده‬ ،‫زمان‬ ‫های‬‫سری‬ ‫تحلیل‬ ،‫آماری‬ ‫کلسیک‬ ‫های‬‫آزمون‬ ،‫غیرخطی‬ (‫موارد‬ ‫سایر‬ ‫و‬ ‫ب‏ندی‬‫خوشه‬ ● ‫نمودارها‬ ‫و‬ ‫گرافیک‬ ‫اشکال‬ ‫تولید‬ ‫در‬ ‫قدرتمند‬ ● ‫در‬R‫س‬ ،‫س‬ ‫کدهای‬ ،++‫دارند‬ ‫فراخوان‬ ‫و‬ ‫اتصال‬ ‫قاب‏لیت‬ ‫فورترن‬ ‫و‬
  30. 30. :‫آر‬‫نویس‬‫برنامه‬ ‫زبان‬R ۲۸‫از‬۳۲ ‫شکل‬۱۷:‫سال‬ ‫ب‏رتر‬ ‫کاوی‬‫داده‬ ‫اب‏زارهای‬۲۰۱۵).kdnuggets com.(
  31. 31. :‫آر‬‫نویس‬‫برنامه‬ ‫زبان‬R ۲۹‫از‬۳۲ ‫شکل‬۱۸:)‫کاوی‬‫داده‬ ‫اب‏زارهای‬ ‫از‬ ‫استفاده‬.kdnuggets com.(
  32. 32. :‫آر‬‫یکپارچه‬ ‫توسعه‬ ‫محیط‬R ۳۰‫از‬۳۲ ● ‫نویس‬‫ب‏رنامه‬ ‫زب‏ان‬ ‫ب‏رای‬ ‫یکپارچه‬ ‫توسعه‬ ‫محیط‬ ‫یک‬‫ی‬R ● ‫آفرو‬ ‫گنو‬ ‫همگان‬ ‫عاموم‬ ‫افزاری‬ ‫نرم‬ ‫نامه‬‫اجازه‬ ‫تحت‬ ‫و‬ ‫آزاد‬ ● ‫سرور‬ ‫و‬ ‫رومیزی‬ ‫ویرایش‬ ‫دو‬ ‫دارای‬ ● ++‫س‬ ‫زب‏ان‬ ‫ب‏ه‬ ‫شده‬ ‫نوشته‬ ● ‫گرافیک‬ ‫کارب‏ری‬ ‫راب‏ط‬ ‫طراحی‬ ‫جهت‬ ‫کیوت‬ ‫چارچوب‬ ‫از‬ ‫استفاده‬
  33. 33. :‫آر‬‫با‬ ‫کاوی‬‫داده‬R ۳۱‫از‬۳۲ ● ‫اب‏تدا‬R‫سپس‬ ،‫کنید‬ ‫نصب‬Rstudio ● ‫ه‬‫ک‬ ‫های‬‫داده‬ ‫نوع‬R،‫دیتافرم‬ ،‫لیست‬ ،‫س‬‫ماتری‬ ،‫ب‏ردار‬ :‫د‬‫کن‬‫م‬ ‫پشتیبان‬ ‫ای‬‫نرده‬ ‫های‬‫کمیت‬ ● ‫سرور‬ ‫و‬ ‫رومیزی‬ ‫ویرایش‬ ‫دو‬ ‫دارای‬ ● ++‫س‬ ‫زب‏ان‬ ‫ب‏ه‬ ‫شده‬ ‫نوشته‬ ● ‫گرافیک‬ ‫کارب‏ری‬ ‫راب‏ط‬ ‫طراحی‬ ‫جهت‬ ‫کیوت‬ ‫چارچوب‬ ‫از‬ ‫استفاده‬
  34. 34. :‫آر‬‫با‬ ‫کاوی‬‫داده‬R(‫افزار‬‫نرم‬ ‫در‬ ‫)ادامه‬ ۳۲‫از‬۳۲ ● ‫در‬ ‫کدزندی‬ ‫ب‏ه‬ ‫مقدمات‬ ‫نگاه‬R ● ‫در‬ ‫خافظ‬ ‫اشعار‬ ‫کلودتگ‬ ‫ترسیم‬R
  35. 35. ‫مراجع‬ ‫و‬ ‫منابع‬ [۱] , ., , ., & , . (2004). , , , .Bellinger G Castro D Mills A Data information knowledge and wisdom : :// . - . / / . .URL http www systems thinking org dikw dikw htm [۲] ' ,Mouthann N Efects of big data analytic on organization s value creation Faculty of ,science and faculty of economics and business University of Amsterdam [۳] , . (2012, 4). - ? , 45.Ras P May Big data wat was de vraag Computable [۴] , . . ( . .). : . . 17,Leeuwen R V n d De opvolger van de cloud big data Sync Retrieved October 2011, :// . / - - - - - - .from http sync nl de opvolger van de cloud big data [۵] , , . , " :Hu H Wen Y Chua T S Li X Toward sable systems for big data analytics A technology ", 2014, .tutorial IEEE [۶] , " : ",Han J and Kamber M and Cerra d Data Mining Concepts and Techniques Morgan , , , , 2012.Kaufmann Waltham Massachusetts USA [۷] , " : , , , ", &Kantardzic M Data Mining Concepts Models Methods and Algorithms John Wiley , , , , , , , 2011.Sons Inc Hoboken NJ USA Second Edition
  36. 36. ‫مراجع‬ ‫و‬ ‫منابع‬ [۸] , " ",Tamilselvi R and Kalaiselvi s An Overview of Data Mining Techniques and Applications ( ), 2(2), 506-509, 2013.International Journal of Science and Research IJSR [۹] , - , "Gibert K Sànchez Marrè M and Codina V Choosing the Right Data Mining : ",Technique Classifcation of Methods and Intelligent Recommendation International ,Congress on Environmental Modelling and Software Modelling for Environment’s Sake , , 2010.Ottawa Canada [۱۰] :// . . /2016/09/ - - - - .http www kdnuggets com poll algorithms used data scientists html (‫آخرین‬ ‫تتتاریخ‬‫ت‬ ‫در‬ ‫تتتازدید‬‫ب‬۱۳۹۵/۰۷/۰۷ ). [۱۱] :// . . /2015/05/ - - - - - - .http www kdnuggets com poll r rapidminer python big data spark html (‫آخرین‬ ‫تتتاریخ‬‫ت‬ ‫در‬ ‫تتتازدید‬‫ب‬۱۳۹۵/۰۷/۰۷ ). [۱۲] , : , 2012.Zahao Y “R and Data mining Examples and Case Studies” junuary

×