SlideShare a Scribd company logo
1 of 85
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
Big data is mostly about taking numbers and using
those numbers to make predictions about the
future. The bigger the data set you have, the more
accurate the predictions about the future will be.
Anthony Goldbloom
Founder and CEO of Kaggle
‫الن‬ ‫اهلل‬ ‫بسم‬‫ور‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫دانشجویی‬ ‫سمینار‬
‫کار‬ ‫و‬ ‫کسب‬ ‫در‬ ‫داده‬‫عظیم‬ ‫تحلیل‬ ‫کاربردهای‬
‫جلسه‬ ‫مسئول‬:‫روحانی‬ ‫سعید‬ ‫دکتر‬‫ت‬ ‫دانشگاه‬ ‫اطالعات‬ ‫فناوری‬ ‫مدیریت‬ ‫گروه‬ ‫علمی‬ ‫هیأت‬ ‫عضو‬‫هران‬
‫امیرصادقی‬ ‫مهدی‬‫تهران‬ ‫دانشگاه‬ ‫اطالعات‬ ‫فناوری‬ ‫مدیریت‬ ‫ارشد‬ ‫کارشناسی‬ ‫دانشجوی‬
‫قلندری‬ ‫قدمی‬ ‫پروین‬‫تهران‬ ‫دانشگاه‬ ‫اطالعات‬ ‫فناوری‬ ‫مدیریت‬ ‫دکتری‬ ‫دانشجوی‬
‫آهی‬ ‫عسگری‬ ‫میثم‬‫تهران‬ ‫دانشگاه‬ ‫اطالعات‬ ‫فناوری‬ ‫مدیریت‬ ‫ارشد‬ ‫کارشناسی‬ ‫دانشجوی‬
‫وردی‬ ‫اله‬ ‫فرشته‬‫تهران‬ ‫دانشگاه‬ ‫انسانی‬ ‫منابع‬ ‫مدیریت‬ ‫ارشد‬ ‫کارشناسی‬ ‫آموخته‬ ‫دانش‬
‫صداقت‬ ‫هادی‬‫دانشگاه‬ ‫اطالعات‬ ‫فناوری‬ ‫مدیریت‬ ‫ارشد‬ ‫کارشناسی‬ ‫دانشجوی‬‫تهران‬
‫داده‬ ‫عظیم‬ ‫اهمیت‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫سنتی‬ ‫دیدگاه‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫داده‬ ‫عظیم‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫داده‬ ‫عظیم‬ ‫های‬ ‫ویژگی‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫داده‬ ‫تولید‬ ‫نرخ‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫تنوع‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫پراکندگی‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫درستی‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫اعتبار‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫پذیری‬ ‫آسیب‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫تغییرپذیری‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫سازی‬ ‫بصری‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫ارزش‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫ارزش‬ ‫استخراج‬
‫قیمتها‬ ‫کاهش‬
‫بهتر‬ ‫و‬ ‫سریعتر‬ ‫گیری‬ ‫تصمیم‬
‫جدید‬ ‫خدمات‬ ‫و‬ ‫محصوالت‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫داده‬ ‫عظیم‬ ‫کلیدی‬ ‫های‬ ‫الیه‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫صنعت‬ ‫و‬ ‫داده‬ ‫عظیم‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫بانکداری‬ ‫و‬ ‫داده‬ ‫عظیم‬
‫کاربردها‬:
‫تقلب‬ ‫کشف‬
‫مشتریان‬ ‫بندی‬ ‫تقسیم‬
‫سفارشی‬ ‫بازاریابی‬
‫ریسک‬ ‫مدیریت‬
‫نمونه‬:‫آلمان‬ ‫بانک‬ ‫دویچه‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫سرگرمی‬ ‫و‬ ‫رسانه‬ ،‫ارتباطات‬ ‫و‬ ‫داده‬ ‫عظیم‬
‫چالشها‬:
‫جمع‬،‫آوری‬‫تحلیل‬‫و‬‫بکارگیری‬‫بینش‬‫مشتریان‬
‫بهره‬‫گیری‬‫از‬‫محتوای‬‫موبایل‬‫و‬‫شبکه‬‫های‬‫اجتماعی‬
‫درک‬‫الگوهای‬real-time‫و‬‫کاربرد‬‫محتوای‬‫رسانه‬‫ها‬
‫نمونه‬:
‫مسابقات‬‫ق‬‫ه‬‫رمانی‬‫تنیس‬‫ویمبلدون‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫و‬ ‫داده‬ ‫عظیم‬‫پزشکی‬ ‫خدمات‬
‫چالشها‬:
‫درمانی‬ ‫های‬ ‫هزینه‬ ‫افزایش‬
‫ها‬ ‫داده‬ ‫بودن‬ ‫استفاده‬ ‫قابل‬ ‫غیر‬ ‫و‬ ‫دسترسی‬ ‫عدم‬ ،‫کمبود‬
‫نمونه‬:
‫پنسیلوانیا‬ ‫دانشگاه‬ ‫بیمارستان‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫و‬ ‫داده‬ ‫عظیم‬‫آموزش‬
‫چالشها‬:
‫مختلف‬ ‫منابع‬ ‫از‬ ‫ها‬ ‫داده‬ ‫ادغام‬
‫داده‬ ‫عظیم‬ ‫درباره‬ ‫ندیده‬ ‫آموزش‬ ‫ارگانهای‬ ‫و‬ ‫کارکنان‬
‫ها‬ ‫داده‬ ‫از‬ ‫نگهداری‬ ‫و‬ ‫محرمانگی‬ ‫به‬ ‫مربوط‬ ‫مسائل‬
‫نمونه‬:
‫تاسمانیا‬ ‫دانشگاه‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫و‬ ‫داده‬ ‫عظیم‬‫دولت‬
‫چالشها‬:
‫ها‬ ‫داده‬ ‫سازی‬ ‫یکپارچه‬
‫داده‬ ‫عظیم‬ ‫سازی‬ ‫همسو‬ ‫و‬ ‫همکاری‬
‫نمونه‬:
‫دوبی‬ ‫هوشمند‬ ‫شهر‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫و‬ ‫داده‬ ‫عظیم‬‫نقل‬ ‫و‬ ‫حمل‬
‫چالشها‬:
‫داده‬‫های‬‫حاصل‬‫از‬‫شبکه‬‫های‬‫اجتماعی‬‫مبتنی‬‫بر‬‫مکان‬‫و‬‫پهنای‬‫باند‬‫با‬‫سرعت‬‫باالی‬‫مخابراتی‬
‫رفتارهای‬‫سفری‬‫افراد‬‫را‬‫تحت‬‫تاثیر‬‫قرار‬‫داده‬‫است‬
‫مدلهای‬‫تقاضای‬‫حمل‬‫و‬‫نقل‬‫هنوز‬‫بر‬‫اساس‬‫درک‬‫ضعیف‬‫از‬‫ساختارهای‬‫شبکه‬‫های‬‫اجتم‬‫اعی‬
‫جدید‬‫هستند‬
‫کاربردهای‬‫دولتی‬‫عظیم‬‫داده‬:‫کنترل‬،‫ترافیک‬‫بررنامه‬‫ریزی‬،‫راهها‬‫سیستمهای‬‫حمل‬‫و‬‫نقل‬
،‫هوشمند‬‫مدیریت‬‫ازدحام‬‫و‬‫تراکم‬
‫کاربردهای‬‫بخش‬‫خصوصی‬:‫مدیریت‬،‫درآمد‬‫بهبوئ‬،‫فناوری‬‫ترابری‬‫و‬‫ایجاد‬‫مزیت‬‫رقاب‬‫تی‬
‫کاربردهای‬‫فردی‬:‫انتخاب‬‫مسیر‬‫بهینه‬‫برای‬‫صرفه‬‫جویی‬‫در‬‫وقت‬‫و‬،‫سوخت‬‫برنامه‬‫ری‬‫زی‬
‫مسافرت‬‫و‬‫غیره‬
‫نمونه‬:‫شرکت‬‫اتوبوسرانی‬‫شهر‬‫آخن‬‫آلمان‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫و‬ ‫داده‬ ‫عظیم‬‫انرژی‬
•‫چالشها‬:
‫بسیاری‬‫از‬‫تاسیسات‬‫برق‬‫و‬‫آب‬‫نیاز‬‫به‬‫تعویض‬‫دارند‬
‫کنتورهای‬‫هوشمند‬‫بخوبی‬‫عمل‬‫می‬‫کنند‬‫اما‬‫مصر‬‫ف‬
‫کنندگان‬‫نیاز‬‫به‬‫بینش‬‫بهتر‬‫وکنترل‬‫بیش‬‫تر‬‫بر‬‫مصرف‬
‫انرژی‬‫دارند‬
•‫نمونه‬:
‫شرکت‬‫برق‬‫منطقه‬‫بارسلون‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫و‬ ‫داده‬ ‫عظیم‬‫کشاورزی‬
•‫چالشها‬:
•‫میزان‬‫مصرف‬‫آب‬
•‫زمین‬‫حاصلخیز‬‫در‬‫مقابل‬‫زمینهای‬‫بایر‬
•‫پیش‬‫بینی‬‫وضعیت‬‫آب‬‫و‬‫هوایی‬
•‫نمونه‬:
•IBM‫در‬‫جورجیا‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫داده‬ ‫اهمیت‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫تاریخچه‬
1985 20072000
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫گیری‬ ‫تصمیم‬ ‫فرایند‬ ‫و‬ ‫داده‬ ‫علم‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫کار‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬ ‫عظیم‬ ‫از‬ ‫استفاده‬ ‫نحوه‬
‫محتاط‬ ‫سازمانهای‬ ‫و‬ ‫شرکتها‬
‫آگاه‬ ‫نیمه‬ ‫سازمانهای‬ ‫و‬ ‫شرکتها‬
‫آگاه‬ ‫سازمانهای‬ ‫و‬ ‫شرکتها‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫جویی‬ ‫علت‬ ‫مرگ‬
•‫مشتری‬ ‫و‬ ‫کاربر‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫هوشمندی‬‫ار‬
•‫بینش‬(Insight)
•‫توصیه‬(Recommendation)
‫داده‬ ‫عظیم‬ ‫تحلیل‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫مشتری‬ ‫تجربه‬ ‫و‬ ‫داده‬ ‫علم‬
‫رسانی‬ ‫اطالع‬ ‫در‬ ‫مشتری‬ ‫تجربه‬ ‫بهبود‬‫و‬
‫اپراتوره‬ ‫حوزه‬ ‫در‬ ‫اینترنتی‬ ‫خدمات‬ ‫ارائه‬‫ای‬
‫موبایل‬
‫بهبود‬‫از‬ ‫خرید‬ ‫در‬ ‫مشتری‬ ‫تجربه‬
‫فروشگاهها‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫مقدمه‬
‫فناوری‬ ‫مسائل‬ ‫و‬ ‫بزرگ‬ ‫تولیدی‬ ‫داغ‬ ‫موضوعات‬ ‫و‬ ‫ها‬‫روند‬ ‫ای‬ ‫دهه‬ ‫هر‬
‫دارد‬ ‫را‬ ‫خود‬ ‫خاص‬ ‫اطالعات‬.‫بحث‬ ‫که‬ ‫دارند‬ ‫وجود‬ ‫موضوع‬ ‫چندین‬ ‫امروزه‬
‫باش‬‫می‬ ‫صنعتی‬ ‫اتوماسیون‬ ‫زمینه‬ ‫در‬ ‫بسیاری‬ ‫های‬ ‫پژوهش‬ ‫اصلی‬‫ند‬:
‫یا‬ ‫اشیا‬ ‫اینترنت‬Internet of Thing
‫یا‬ ‫بزرگ‬ ‫های‬ ‫داده‬Big Data
‫یا‬ ‫ابری‬ ‫رایانش‬Cloud Computing
‫صنعت‬4.0‫یا‬Industry 4.0
‫متحول‬ ‫را‬ ‫صنعتی‬ ‫اتوماسیون‬ ‫آینده‬ ‫توانند‬ ‫می‬ ‫فناوری‬ ‫چهار‬ ‫این‬‫کنند‬.
‫تولی‬ ‫دستگاه‬ ‫بین‬ ‫ارتباط‬ ‫برقراری‬ ‫با‬ ‫ترتیب‬ ‫به‬ ‫ها‬ ‫فناوری‬ ‫این‬،‫صنعتی‬ ‫د‬
‫برروی‬ ‫گسترده‬ ‫محاسبات‬ ،‫آن‬ ‫سازی‬ ‫ذخیره‬ ‫و‬ ‫بزرگ‬ ‫های‬ ‫داده‬ ‫آوری‬ ‫جمع‬
‫د‬ ‫مخصوصا‬ ‫صنعت‬ ‫تحول‬ ‫باعث‬ ‫جدید‬ ‫صنعتی‬ ‫انقالب‬ ‫ایده‬ ‫و‬ ‫ها‬ ‫داده‬‫ر‬
‫صن‬ ‫مانیتورینگ‬ ‫های‬ ‫سیستم‬ ‫و‬ ‫ها‬ ‫داده‬ ‫مخابره‬ ،‫اتوماسیون‬ ‫حوزه‬‫در‬ ‫عتی‬
‫شد‬ ‫خواهند‬ ‫نزدیک‬ ‫آینده‬.
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫اشیا‬ ‫اینترنت‬
•‫اینترنت‬‫اشیا‬‫یا‬‫چیزنت‬( Internet of Things)‫به‬‫طور‬‫کلی‬‫اشاره‬‫دارد‬‫به‬‫بسیاری‬‫از‬‫اشیا‬‫و‬‫وسایل‬
‫محیط‬‫مان‬‫پیرامون‬‫که‬‫به‬‫شبکه‬‫اینترنت‬‫متصل‬‫شده‬‫و‬‫بتوان‬‫توسط‬‫های‬‫اپلیکیشن‬‫موجود‬‫در‬‫ت‬‫لفن‬‫های‬
‫هوشمند‬‫و‬‫تبلت‬‫کنترل‬‫و‬‫مدیریت‬‫شوند‬.
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫پارادیم‬Any
•‫هدف‬‫اینترنت‬‫در‬‫گذشته‬‫ارتباط‬‫هر‬‫شخص‬‫با‬‫شخص‬‫دیگر‬‫بود‬.‫اما‬‫اکنون‬‫هدف‬‫اینترنت‬‫اشیاء‬
‫ارتباط‬‫هر‬‫چیز‬‫با‬‫چیز‬‫دیگر‬‫است‬!!!
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫اینترنت‬ ‫به‬ ‫متصل‬ ‫اشیا‬ ‫تعداد‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫انسانها‬ ‫تعداد‬ ‫و‬ ‫متصل‬ ‫اشیا‬ ‫تعداد‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
The role of Big DataAnalytics in IoT
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫الزامات‬Big Data‫و‬Analytics‫در‬IoT
•‫اتصال‬
•‫سازی‬ ‫ذخیره‬
•‫خدمات‬ ‫کیفیت‬
•‫هنگام‬ ‫به‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬
•‫بنچمارک‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫حلهای‬ ‫راه‬ ‫بندی‬ ‫طبقه‬Big Data‫و‬Analytics‫های‬ ‫سیستم‬ ‫برای‬IoT
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫جریان‬Big Data‫در‬IoT
‫دیتا‬ ‫بیگ‬ ‫پلتفرم‬ ‫دیتا‬ ‫بیگ‬ ‫آنالیز‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫حوزه‬ ‫در‬ ‫سازمان‬ ‫یک‬ ‫شکست‬ ‫یا‬ ‫اقبال‬IoT‫تحلیل‬ ‫مدیریت‬ ‫گرو‬ ‫در‬
Big Data‫است‬.
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫های‬ ‫چالش‬ ‫و‬ ‫ها‬ ‫فرصت‬IoT‫برای‬Big Data Analytics
، ‫تکنولوژی‬ ‫عصر‬ ‫در‬‫ها‬ ‫داده‬‫حکم‬ ‫واقع‬ ‫در‬‫نفت‬‫دارند‬ ‫را‬ ‫گذشته‬ ‫صنعت‬ ‫در‬.
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫مقدمه‬
•‫که‬ ‫دیدیم‬‫عظیم‬‫داده‬‫آفرینا‬ ‫ارزش‬ ‫و‬ ‫کاربردهاا‬ ‫چه‬ ‫به‬ ‫منجر‬‫ی‬
‫میشود‬ ‫وکارها‬ ‫کسب‬ ‫برای‬ ‫هایی‬.
•‫البته‬ ‫و‬‫رویکرد‬ ‫این‬‫است‬ ‫ناپذیر‬ ‫اجتناب‬‫عظا‬ ‫زیارا‬‫داده‬ ‫یم‬
‫و‬ ‫شاده‬ ‫تبدیل‬ ‫ها‬ ‫شرکت‬ ‫برای‬ ‫دارایی‬ ‫یک‬ ‫به‬‫نادیاده‬‫گا‬‫رفتن‬
‫دارایی‬ ‫این‬‫موجب‬‫کارهاا‬ ‫و‬ ‫کسب‬ ‫شکست‬‫رقااب‬ ‫فضاای‬ ‫در‬‫تی‬
‫میشود‬.
•‫در‬ ‫لذا‬‫شاهد‬ ‫آینده‬‫هجوم‬‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫به‬‫خاواه‬‫یم‬
‫یعنی‬ ‫بود‬...
•‫پیشا‬ ‫هاای‬ ‫تحلیال‬ ‫از‬ ‫هستند‬ ‫مایل‬ ‫بسیاری‬ ‫های‬ ‫سازمان‬‫رفته‬
‫کنند‬ ‫استقبال‬ ‫بار‬ ‫اولین‬ ‫برای‬ ‫داده‬ ‫عظیم‬‫ولی‬...
•‫درباره‬‫شده‬ ‫سردرگم‬ ‫کار‬ ‫این‬ ‫انجام‬ ‫چگونگی‬‫اند‬!
•‫دنباال‬ ‫به‬ ‫قسمت‬ ‫این‬ ‫در‬ ‫ما‬‫راه‬ ‫نقشکه‬ ‫یک‬ ‫ارائه‬‫بارای‬
‫است‬ ‫و‬ ‫سازی‬ ‫پیاده‬ ‫مسیر‬ ‫در‬ ‫ها‬ ‫سازمان‬ ‫و‬ ‫ها‬ ‫شرکت‬ ‫هدایت‬‫فاده‬
‫هستیم‬ ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫از‬.
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫تاریخچه‬
•‫تحلیل‬ ‫مسئله‬‫حجیم‬ ‫های‬ ‫داده‬‫نوظهوری‬ ‫پدیده‬‫نیست‬!
•‫با‬‫طبق‬ ‫افزاری‬ ‫سخت‬ ‫و‬ ‫پردازشی‬ ‫توان‬ ‫اینکه‬‫مور‬ ‫قانون‬‫پارداز‬ ‫از‬ ‫آسانتر‬ ‫همیشه‬ ‫داده‬ ‫سازی‬ ‫ذخیره‬ ‫که‬ ‫آنجا‬ ‫از‬ ‫اما‬ ‫میشود‬ ‫برابر‬ ‫دو‬ ‫سال‬ ‫هر‬‫باوده‬ ‫آن‬ ‫ش‬
‫کند‬ ‫پردازش‬ ‫را‬ ‫ها‬ ‫داده‬ ‫حجم‬ ‫این‬ ‫بتواند‬ ‫تا‬ ‫بوده‬ ‫هایی‬ ‫راه‬ ‫دنبال‬ ‫همواره‬ ‫بشر‬ ‫لذا‬.
•‫ایجاد‬ ‫باعث‬ ‫داده‬ ‫زیاد‬ ‫حجم‬‫گلوگاه‬‫سرور‬ ‫روی‬‫میشود‬!
•‫در‬ ‫را‬ ‫نگاشت‬ ‫کاهش‬ ‫تکنیک‬ ‫بار‬ ‫اولین‬ ‫برای‬ ‫گوگل‬‫سیستم‬ ‫فایل‬ ‫گوگل‬‫خاتمه‬ ‫بزرگ‬ ‫چالش‬ ‫این‬ ‫به‬ ‫تا‬ ‫برد‬ ‫کار‬ ‫به‬‫دهد‬.
•‫اما‬ ‫نداد‬ ‫ادامه‬ ‫را‬ ‫جدید‬ ‫سیستم‬ ‫فایل‬ ‫این‬ ‫روی‬ ‫بر‬ ‫کار‬ ‫گوگل‬‫آپاچی‬‫ابداع‬ ‫را‬ ‫هدوپ‬ ‫شده‬ ‫توزیع‬ ‫سیستم‬ ‫فایل‬ ‫ایده‬ ‫همین‬ ‫از‬‫کرد‬.
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫بود‬ ‫چه‬ ‫ایده‬ ‫این‬‫هدوپ‬ ‫و‬‫چیست؟‬
•‫سارور‬ ‫چندین‬ ‫در‬ ‫را‬ ‫اطالعات‬ ‫سازی‬ ‫ذخیره‬ ‫امکان‬ ‫هدوپ‬
(‫پی‬‫سی‬)‫مای‬ ‫فاراهم‬ ‫پایین‬ ‫ای‬ ‫هزینه‬ ‫با‬‫آورد‬( .‫بسات‬‫ری‬
‫برای‬‫شده‬ ‫توزیع‬ ‫رایانش‬)
•‫کلی‬ ‫بخش‬ ‫دو‬ ‫از‬ ‫هدوپ‬ ‫تکنولوژی‬
1.‫اچ‬‫اس‬ ‫اف‬ ‫دی‬‫یا‬‫یافته‬ ‫توزیع‬ ‫فایل‬‫هدوپ‬
Hadoop Distribition File System
2.‫و‬‫با‬ ‫اطالعاات‬ ‫پردازی‬ ‫کیفیت‬ ‫با‬ ‫تکنیک‬ ‫همچنین‬‫ناام‬ ‫ه‬
‫کاهشی‬ ‫نگاشت‬MapReduce‫استفاده‬‫کند‬ ‫می‬.
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫سیستم‬ ‫فایل‬
•‫سیسااتم‬‫فایاال‬File system‫روشاای‬‫و‬ ‫ذخیااره‬ ‫باارای‬
‫دهی‬‫سازمان‬‫های‬ ‫فایل‬‫تاا‬ ‫اسات‬ ‫هایشاان‬‫داده‬ ‫و‬ ‫ای‬‫رایانه‬
‫کند‬ ‫آسان‬ ‫را‬ ‫ها‬‫آن‬ ‫به‬ ‫دسترسی‬ ‫و‬ ‫یافتن‬.
•‫سیستم‬‫گونا‬ ‫هاای‬ ‫سیساتم‬ ‫فایل‬ ‫از‬ ،‫مختلف‬ ‫های‬ ‫عامل‬‫اگونی‬
‫کنند‬ ‫می‬ ‫پشتیبانی‬.
•‫نیستند‬ ‫یکسان‬ ‫ها‬ ‫سیستم‬ ‫فایل‬ ‫ی‬ ‫همه‬‫ها‬ ‫و‬‫از‬ ‫کادام‬ ‫ر‬
‫دارناد‬ ‫هاا‬ ‫داده‬ ‫ساازماندهی‬ ‫بارای‬ ‫گوناگونی‬ ‫های‬ ‫روش‬ ،‫آنها‬.
‫بع‬ ،‫هساتند‬ ‫ساریعتر‬ ‫بقیاه‬ ‫از‬ ‫هاا‬ ‫سیستم‬ ‫فایل‬ ‫برخی‬‫نیاز‬ ‫ضای‬
‫فضاای‬ ‫از‬ ‫تعادادی‬ ،‫دارناد‬ ‫بیشاتری‬ ‫امنیتی‬ ‫های‬ ‫ویژگی‬‫زیااد‬
‫ح‬ ‫در‬ ‫کنناد‬ ‫مای‬ ‫پشاتیبانی‬ ‫اطالعات‬ ‫سازی‬ ‫ذخیره‬ ‫برای‬‫الیکاه‬
‫کوچا‬ ‫بسایار‬ ‫ساازی‬ ‫ذخیاره‬ ‫فضااهای‬ ‫باا‬ ‫فقط‬ ‫دیگر‬ ‫برخی‬‫ک‬
‫دارند‬ ‫سازگاری‬.‫ف‬ ‫برابر‬ ‫در‬ ‫ها‬ ‫سیستم‬ ‫فایل‬ ‫از‬ ‫بعضی‬‫هاای‬ ‫ایل‬
‫برخی‬ ‫حالیکه‬ ‫در‬ ،‫هستند‬ ‫مقاوم‬ ‫بسیار‬ ‫ویروسها‬ ‫و‬ ‫مخرب‬‫دیگر‬
‫دستر‬ ‫سرعت‬ ‫ی‬ ‫ارائه‬ ‫فدای‬ ‫را‬ ‫شده‬ ‫یاد‬ ‫های‬ ‫ویژگی‬ ‫سایر‬‫سای‬
‫نمایند‬ ‫می‬ ‫کاربران‬ ‫به‬ ‫بیشتر‬.
•‫ر‬ ‫از‬ ‫پشتیبانی‬ ‫برای‬ ‫سیستمی‬ ‫فایل‬ ‫ایجاد‬ ‫به‬ ‫لزوم‬‫موازی‬ ‫ایانش‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫هدوپ‬ ‫شده‬ ‫توزیع‬ ‫سیستم‬ ‫فایل‬
•‫معماری‬HDFS‫بصورت‬Master-Slave‫می‬‫باشد‬.
•‫هر‬‫کالستر‬HDFS‫شامل‬‫ناام‬ ‫باه‬ ‫گره‬ ‫یک‬NameNode‫مای‬
‫بعنوان‬ ‫که‬ ‫باشد‬Master‫کااری‬ ‫فضاای‬ ‫و‬ ‫کناد‬ ‫می‬ ‫عمل‬ ‫سیستم‬
‫به‬ ‫کاربران‬ ‫دسترسی‬ ‫و‬ ‫کند‬ ‫می‬ ‫مدیریت‬ ‫را‬ ‫فایل‬ ‫سیستم‬‫را‬ ‫هاا‬ ‫فایل‬
‫کند‬ ‫می‬ ‫گذاری‬ ‫قانون‬.
•‫در‬‫بناام‬ ‫گاره‬ ‫چندین‬ ‫گره‬ ‫این‬ ‫کنار‬DataNode‫وجاود‬‫کاه‬ ‫دارد‬
‫یک‬ ‫گره‬ ‫هر‬ ‫ازای‬ ‫به‬ ‫معموال‬DataNode‫داریم‬ ‫کالستر‬ ‫در‬.
•HDFS‫داده‬‫چنا‬ ‫باه‬ ‫هرفایل‬ ‫و‬ ‫کند‬ ‫می‬ ‫ذخیره‬ ‫فایل‬ ‫بصورت‬ ‫را‬ ‫ها‬‫د‬
‫از‬ ‫ای‬ ‫مجموعااه‬ ‫در‬ ‫هااا‬ ‫تکااه‬ ‫ایاان‬ ‫کااه‬ ‫شااود‬ ‫ماای‬ ‫تقساایم‬ ‫تکااه‬
DataNode‫ها‬‫شوند‬ ‫می‬ ‫ذخیره‬.
•NameNode‫وظیفه‬،‫باازکردن‬ ‫همچاون‬ ‫هاایی‬ ‫عملیاات‬ ‫انجام‬
‫دارد‬ ‫عهاده‬ ‫باه‬ ‫را‬ ‫مسایرها‬ ‫و‬ ‫ها‬ ‫نام‬ ‫تغییر‬ ،‫بستن‬.‫تعیا‬ ‫همچناین‬‫ین‬
‫به‬ ‫ها‬ ‫فایل‬ ‫های‬ ‫تکه‬ ‫نگاشت‬ ‫کننده‬DataNode‫ها‬‫باشد‬ ‫می‬ ‫نیز‬.
•DataNode‫ها‬‫و‬ ‫خوانادن‬ ‫هاای‬ ‫درخواسات‬ ‫به‬ ‫رسیدگی‬ ‫وظیفه‬
‫دارند‬ ‫برعهده‬ ‫را‬ ‫فایل‬ ‫سیستم‬ ‫کاربران‬ ‫از‬ ‫نوشتن‬.‫و‬ ‫همچناین‬‫ظیفاه‬
‫اتور‬‫ا‬‫دس‬ ‫اه‬‫ا‬‫ب‬ ‫ای‬ ‫داده‬ ‫اای‬‫ا‬‫ه‬ ‫االک‬‫ا‬‫ب‬ ‫اازی‬‫ا‬‫س‬ ‫ای‬‫ا‬‫کپ‬ ‫و‬ ‫اذف‬‫ا‬‫ح‬ ،‫ااخت‬‫ا‬‫س‬
NameNode‫دارند‬ ‫برعهده‬ ‫نیز‬ ‫را‬.
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫کاهشی‬ ‫نگاشت‬
•‫برناماه‬ ‫مادل‬ ‫یاک‬ ‫واقاع‬ ‫در‬ ‫کاهشی‬ ‫نگاشت‬
‫توزیا‬ ‫رایاانش‬ ‫از‬ ‫پشتیبانی‬ ‫برای‬ ‫ریزی‬‫شاده‬ ‫ع‬
‫ها‬ ‫شاده‬ ‫توزیع‬ ‫سیستم‬ ‫فایل‬ ‫در‬ ‫که‬ ‫است‬‫دوپ‬
‫میشود‬ ‫گرفته‬ ‫کار‬ ‫به‬.
•‫نگاشااات‬ ‫فرآیناااد‬ ‫دو‬ ‫از‬map‫و‬‫کااااهش‬
reduce‫تشکیل‬‫شده‬‫است‬.
•‫ابتدا‬‫را‬ ‫ورودی‬ ‫های‬ ‫داده‬ ‫مجموعه‬‫اسااس‬ ‫بار‬
namenode‫ساپس‬ ‫شده‬ ‫بندی‬ ‫خوشه‬ ‫ها‬
‫پردازش‬ ‫و‬ ‫سازی‬ ‫ذخیره‬ ‫مجزا‬ ‫سرورهای‬ ‫روی‬
‫ار‬‫ا‬‫آخ‬ ‫در‬ ‫و‬ ‫اوند‬‫ا‬‫میش‬namenode‫ای‬‫ا‬‫خروج‬
datanode‫و‬ ‫فراخاوانی‬ ‫را‬ ‫نظر‬ ‫مورد‬ ‫های‬
‫میکند‬ ‫ادغام‬.
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫فرآیند‬
•‫کار‬ ‫و‬ ‫کسب‬ ‫های‬ ‫نیازمندی‬ ‫و‬ ‫ها‬ ‫سوال‬ ‫بندی‬ ‫اولویت‬ ‫و‬ ‫تعیین‬
•‫میدانی‬ ‫تحقیقات‬(‫نیاز‬ ‫مورد‬ ‫داده‬ ‫منابع‬ ،‫مغزی‬ ‫طوفان‬ ،‫تطبیقی‬ ‫الگوی‬)
•‫تحلیل‬ ‫عملیاتی‬ ‫مرحله‬(‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫و‬ ‫سازی‬ ‫پیاده‬)
•‫کار‬ ‫و‬ ‫کسب‬ ‫بر‬ ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫تاثیر‬ ‫و‬ ‫تغییر‬ ‫مدیریت‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫عظیم‬ ‫دنیای‬ ‫انداز‬ ‫چشم‬‫داده‬
‫گفتیم‬
‫سازمان‬‫کنن‬ ‫حرکت‬ ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫سمت‬ ‫به‬ ‫باید‬ ‫ناچار‬ ‫به‬ ‫کارها‬ ‫و‬ ‫کسب‬ ‫و‬ ‫ها‬‫د‬
‫ندارند‬ ‫نیز‬ ‫را‬ ‫تحلیل‬ ‫قدیمی‬ ‫های‬ ‫روش‬ ‫و‬ ‫ابزار‬ ‫از‬ ‫استفاده‬ ‫امکان‬.
‫مختلف‬ ‫های‬ ‫معماری‬ ‫و‬ ‫ابزار‬ ‫و‬ ‫پلتفرمها‬ ‫از‬ ‫ای‬ ‫گسترده‬ ‫طیف‬ ‫وارد‬ ‫بنابراین‬‫میش‬‫وند‬.
‫چشم‬ ‫این‬‫عظیم‬ ‫دنیای‬ ‫از‬ ‫اندازی‬‫است‬ ‫داده‬‫برندهای‬ ‫و‬ ‫محصوالت‬ ‫اسامی‬ ‫با‬‫مختل‬‫ف‬.
‫شرکتها‬‫کنند‬ ‫انتخاب‬ ‫را‬ ‫محصوالت‬ ‫کدام‬ ‫و‬ ‫شوند‬ ‫وارد‬ ‫حوزه‬ ‫این‬ ‫به‬ ‫چگونه‬ ‫باید‬.
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫معماری‬(‫فرآیندها‬)
•‫داده‬ ‫سازی‬ ‫ذخیره‬(‫و‬ ‫فلینک‬ ،‫استورم‬ ،‫اسپارک‬ ،‫هدوپ‬ ‫شامل‬ ‫پردازشی‬ ‫موتور‬)...
•‫مدیریت‬‫داده‬(‫های‬ ‫داده‬ ‫پایگاه‬ ‫انواع‬ ‫شامل‬ ‫ای‬ ‫داده‬ ‫پایگاه‬ ‫موتور‬NoSQL)
•‫ها‬ ‫داده‬ ‫ورود‬ ‫و‬ ‫سازی‬ ‫یکپارچه‬ ،‫پاکسازی‬(‫و‬ ‫اسکوپ‬ ‫و‬ ‫فلوم‬)...
•‫کاوی‬ ‫داده‬(‫نایم‬ ،‫اس‬ ‫اس‬ ‫پی‬ ‫اس‬ ،‫رپیدماینر‬‫و‬)...
•‫داده‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬‫ها‬(‫و‬ ‫اسکااللب‬ ،‫ریسرچ‬ ‫الستیک‬ ،‫کافکا‬)...
•‫بصری‬‫سازی‬(‫و‬ ‫چاکارتو‬ ،‫سیلک‬ ،‫تبلئو‬)...
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
Big Data Landscape 2017
‫داده‬ ‫منابع‬
‫ابزارها‬
‫مدیریت‬ ‫راهکارهای‬
‫سازی‬ ‫ذخیره‬ ‫و‬
‫راهکارهای‬
‫تحلیلی‬
‫و‬ ‫تحویل‬ ‫راهکارهای‬
‫سازی‬ ‫بصری‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫داده‬ ‫منابع‬
•‫حسگرها‬ ‫های‬ ‫داده‬(‫و‬ ‫اشیاء‬ ‫اینترنت‬)...
•‫اجتماعی‬ ‫های‬ ‫شبکه‬ ‫های‬ ‫داده‬
•‫بایگانی‬ ‫و‬ ‫آرشیو‬ ‫های‬ ‫داده‬
•‫باز‬ ‫های‬ ‫داده‬(‫و‬ ‫سالمت‬ ، ‫انرژی‬ ،‫شهری‬)...
•‫مختلف‬ ‫صنایع‬ ‫های‬ ‫داده‬(‫ها‬ ‫و‬ ‫آب‬ ،‫هواپیمایی‬‫وا‬
‫و‬ ‫آموزش‬ ،)...
•‫کارها‬ ‫و‬ ‫کسب‬ ‫و‬ ‫بازار‬ ‫های‬ ‫داده‬
•‫هوشمند‬ ‫های‬ ‫تلفن‬ ‫های‬ ‫داده‬
•‫ها‬ ‫کننده‬ ‫کنترل‬ ‫و‬ ‫ها‬ ‫ماشین‬ ‫الگ‬ ‫های‬ ‫داده‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫ها‬ ‫داده‬ ‫پردازش‬ ‫موتور‬
•‫هدوپ‬:‫کاهشی‬ ‫نگاشت‬ ‫از‬ ‫استفاده‬
•‫اسپارک‬:‫کتابخ‬ ‫و‬ ‫پردازش‬ ‫سرعت‬‫انه‬
‫برن‬ ‫زباان‬ ، ‫تحلیلای‬ ‫بیشاتر‬ ‫های‬‫اماه‬
‫دلخواه‬ ‫نویسی‬
•‫اک‬‫ا‬‫فلین‬:‫اای‬‫ا‬‫ه‬ ‫داده‬ ‫اردازش‬‫ا‬‫پ‬ ‫ارای‬‫ا‬‫ب‬
‫باالتر‬ ‫بسیار‬ ‫سرعت‬ ، ‫حجیم‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫داده‬ ‫عظیم‬ ‫مدیریت‬ ‫ابزار‬
•‫در‬ ‫شما‬ ‫موفقیت‬ ‫برای‬ ‫ای‬ ‫داده‬ ‫پایگاه‬ ‫موتور‬ ‫انتخاب‬‫زمینه‬
‫داده‬ ‫عظیم‬ ‫سازی‬ ‫پیاده‬
•‫سیساتم‬ ‫از‬ ‫سانتی‬ ‫طور‬ ‫به‬ ‫کارها‬ ‫و‬ ‫کسب‬ ‫بیشتر‬‫مادیریت‬
‫میکنند‬ ‫استفاده‬ ‫ای‬ ‫رابطه‬ ‫های‬ ‫داده‬ ‫پایگاه‬
•‫با‬ ‫زماانبر‬ ‫و‬ ‫ای‬ ‫رابطاه‬ ‫مادل‬ ‫پیچیادگی‬ ‫دلیل‬ ‫به‬ ‫باید‬‫ودن‬
‫ای‬ ‫داده‬ ‫هاای‬ ‫پایگااه‬ ‫باه‬ ‫مهااجرت‬ ‫باه‬ ‫نیااز‬ ‫ها‬ ‫کوئری‬
‫ای‬ ‫غیررابطه‬
•‫با‬ ‫ای‬ ‫رابطاه‬ ‫ای‬ ‫داده‬ ‫های‬ ‫پایگاه‬ ‫های‬ ‫قابلیت‬ ‫بر‬ ‫عالوه‬‫ا‬
‫اازی‬‫ا‬‫س‬ ‫اره‬‫ا‬‫ذخی‬ ‫اایی‬‫ا‬‫توان‬ ، ‫ااختاریافته‬‫ا‬‫س‬ ‫اوئری‬‫ا‬‫ک‬ ‫اان‬‫ا‬‫زب‬‫و‬
‫داشته‬ ‫را‬ ‫داده‬ ‫عظیم‬ ‫متنوع‬ ‫های‬ ‫داده‬ ‫مدیریت‬‫باشند‬.
•‫نگهاداری‬ ‫مادل‬ ‫در‬ ‫ای‬ ‫رابطاه‬ ‫های‬ ‫داده‬ ‫پایگاه‬ ‫با‬ ‫تفاوت‬
‫و‬ ‫پذیری‬ ‫مقیاس‬ ،‫اسکیما‬ ،‫ها‬ ‫داده‬...
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫نواسکیوال‬ ‫داده‬ ‫پایگاه‬ ‫انواع‬
•‫های‬ ‫داده‬ ‫پایگاه‬NoSQL‫بر‬‫و‬ ‫سازی‬ ‫ذخیره‬ ‫نوع‬ ‫اساس‬
‫به‬ ‫ها‬ ‫داده‬ ‫ارتباط‬4‫شوند‬ ‫می‬ ‫تقسیم‬ ‫دسته‬:
1. Key-Value Store ‫کلید‬-‫مقدار‬
2. Column Family Store ‫ستونی‬
3. Document Store ‫سندگرا‬
4. Graph Based ‫مبتنی‬‫بر‬‫گراف‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫کلید‬ ‫داده‬ ‫پایگاه‬-‫مقدار‬
•‫های‬‫بندی‬‫اته‬‫ا‬‫دس‬ ‫از‬ ‫ات‬‫ا‬‫حال‬ ‫ترین‬‫ااده‬‫ا‬‫س‬NoSQL،‫اته‬‫ا‬‫دس‬
‫کلید‬-‫مقدار‬‫ما‬ ‫هاایی‬ ‫سیساتم‬ ‫در‬ ‫معماوال‬ ‫و‬ ‫باشد‬‫می‬‫ورد‬
‫متمای‬ ‫یکدیگر‬ ‫از‬ ‫ها‬‫داده‬ ‫که‬ ‫گیرد‬ ‫می‬ ‫قرار‬ ‫استفاده‬‫هستند‬ ‫ز‬
‫نظ‬ ‫مواردی‬ ‫به‬ ‫نسبت‬ ‫ها‬‫داده‬ ‫بودن‬ ‫دسترس‬ ‫در‬ ‫اصوال‬ ‫و‬‫یر‬
‫دارد‬ ‫بیشتری‬ ‫اهمیت‬ ‫پایائی‬.‫یا‬ ‫فقاط‬ ‫معمااری‬ ‫این‬ ‫در‬‫ک‬
‫داریم‬ ‫کلید‬(‫داده‬ ‫پایگااه‬ ‫در‬ ‫اصالی‬ ‫کلیاد‬ ‫مانند‬ ‫که‬‫هاای‬
‫کنند‬ ‫می‬ ‫عمل‬ ‫ای‬ ‫رابطه‬)‫مقادار‬ ‫کاه‬ ‫داریام‬ ‫مقدار‬ ‫یک‬ ‫و‬
‫گرداند‬ ‫می‬ ‫باز‬ ‫را‬ ‫کلید‬ ‫آن‬ ‫معادل‬.
•‫در‬ ‫در‬ ‫بااال‬ ‫سارعت‬ ‫باه‬ ‫تاوان‬ ‫می‬ ‫دسته‬ ‫این‬ ‫مزایای‬ ‫از‬
‫توسا‬ ‫قابلیات‬ ‫و‬ ‫سازی‬ ‫پیاده‬ ،‫اطالعات‬ ‫خواندن‬ ‫و‬ ‫کردن‬‫عه‬
‫کرد‬ ‫اشاره‬ ‫آسان‬ ‫پذیری‬.
•‫نمونه‬ ‫چند‬:
Aerospike , Redis , LevelDB , …
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫ستونی‬ ‫داده‬ ‫پایگاه‬
•‫کلید‬ ‫توسعه‬ ‫با‬ ‫ستونی‬ ‫داده‬ ‫های‬ ‫پایگاه‬-‫ب‬ ‫مقادارها‬‫وجاود‬
‫اند‬ ‫آمده‬.‫ک‬ ‫جفت‬ ‫یک‬ ‫بجای‬ ‫واقع‬ ‫در‬ ‫ها‬ ‫سیستم‬ ‫این‬‫لیاد‬-
‫کلیا‬ ‫جفات‬ ‫چنادین‬ ‫رکاورد‬ ‫هر‬ ‫برای‬ ‫توانند‬ ‫می‬ ،‫مقدار‬‫د‬-
‫باشند‬ ‫داشته‬ ‫مقدار‬.‫نا‬ ‫ساختار‬ ‫به‬ ‫نیازی‬ ‫نوع‬ ‫این‬ ‫در‬‫و‬ ‫داریم‬
‫م‬ ‫صفات‬ ‫تعداد‬ ‫با‬ ‫ستون‬ ‫چندین‬ ‫تواند‬ ‫می‬ ‫رکورد‬ ‫هر‬‫تفاوت‬
‫باشند‬ ‫داشته‬.
•‫وسا‬ ‫میزان‬ ‫سازی‬ ‫ذخیره‬ ‫تواند‬ ‫می‬ ‫دسته‬ ‫این‬ ‫مزایای‬ ‫از‬‫یع‬
‫باشد‬ ‫بسیار‬ ‫مقادیر‬ ‫با‬ ‫رکوردها‬ ‫از‬ ‫متفاوتی‬ ‫و‬.
•‫نمونه‬ ‫چند‬:
Hadoop/Hbase , Cassandra , Amazon
SimpleDB , …
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫سندگرا‬ ‫داده‬ ‫پایگاه‬
•‫این‬‫یع‬ ‫اول‬ ‫دساته‬ ‫مانناد‬ ‫نیاز‬ ‫ها‬ ‫داده‬ ‫پایگاه‬ ‫از‬ ‫دسته‬‫نای‬
‫کلید‬-‫با‬ ‫ولای‬ ‫باشاند‬ ‫می‬ ‫ستونی‬ ‫دوم‬ ‫دسته‬ ‫و‬ ‫مقدار‬‫ایان‬ ‫ا‬
‫م‬ ‫های‬ ‫داده‬ ‫بندی‬ ‫دسته‬ ‫سیستم‬ ‫این‬ ‫در‬ ‫که‬ ‫تفاوت‬‫با‬ ‫رتبط‬
‫باشند‬ ‫می‬ ‫سند‬ ‫فایل‬ ‫یک‬ ‫قالب‬ ‫در‬ ‫یکدیگر‬.‫مات‬ ‫از‬‫سااده‬ ‫ن‬
‫و‬ ‫عکس‬ ‫یا‬ ‫ایمیل‬ ‫یک‬ ‫تا‬ ‫گرفته‬...‫ب‬ ‫مای‬ ‫سند‬ ‫یک‬‫اشاند‬.
‫پایگا‬ ‫نوع‬ ‫این‬ ‫که‬ ‫باالیی‬ ‫بسیار‬ ‫قدرت‬ ‫وجود‬ ‫با‬ ‫اما‬‫هاای‬ ‫اه‬
‫گی‬ ‫وقت‬ ‫بسیار‬ ‫آنها‬ ‫در‬ ‫نوشتن‬ ‫و‬ ‫خواندن‬ ،‫دارند‬ ‫داده‬‫است‬ ‫ر‬.
•‫از‬‫د‬ ‫زیادی‬ ‫مقدار‬ ‫ذخیره‬ ‫به‬ ‫توان‬ ‫می‬ ‫دسته‬ ‫این‬ ‫مزایای‬‫اده‬
‫برد‬ ‫نام‬ ‫ربط‬ ‫بی‬ ‫های‬.
•‫نمونه‬ ‫چند‬:
MongoDB , Elastic Search , CouchDB ,
RavenDB , …
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫گراف‬ ‫داده‬ ‫پایگاه‬
•‫این‬‫باه‬ ‫نسابت‬ ‫متفاوتی‬ ‫کامال‬ ‫دید‬ ‫از‬ ،‫ها‬ ‫داده‬ ‫به‬ ‫دسته‬‫دساته‬
‫کند‬ ‫می‬ ‫نگاه‬ ‫قبلی‬ ‫های‬.‫ها‬ ‫باه‬ ‫گاراف‬ ‫یک‬ ‫مانند‬ ‫را‬ ‫ها‬ ‫داده‬‫م‬
‫ها‬ ‫داده‬ ‫باه‬ ‫را‬ ‫گاراف‬ ‫یا‬ ‫درخت‬ ‫یک‬ ‫ساختار‬ ‫و‬ ،‫کند‬ ‫می‬ ‫مرتبط‬‫ا‬
‫دهد‬ ‫می‬.‫در‬ ‫شادن‬ ‫در‬ ‫هنگاام‬ ‫رکوردهاا‬ ،‫داده‬ ‫پایگاه‬ ‫این‬ ‫در‬
‫می‬ ‫مرتبط‬ ‫هم‬ ‫به‬ ‫صفت‬ ‫چند‬ ‫یا‬ ‫یک‬ ‫توسط‬ ‫دیتابیس‬‫و‬ ‫شاوند‬
‫ریاضی‬ ‫عملیات‬ ‫انجام‬ ‫اینکه‬‫دساته‬ ‫از‬ ‫تار‬ ‫سااده‬ ‫بسایار‬‫هاای‬
‫است‬ ‫دیگر‬.‫ارتباطات‬ ‫که‬ ‫زمانی‬ ‫برای‬ ‫دسته‬ ‫این‬ ‫کاربرد‬‫و‬ ‫معین‬
‫باشاد‬ ‫مای‬ ،‫دارد‬ ‫وجود‬ ‫رکوردها‬ ‫میان‬ ‫مشخصی‬.‫شابک‬ ‫مانناد‬‫ه‬
‫اجتماعی‬ ‫های‬
•‫تح‬ ‫برای‬ ‫بودن‬ ‫مناسب‬ ‫به‬ ‫توان‬ ‫می‬ ‫دسته‬ ‫این‬ ‫مزایای‬ ‫از‬‫قیقاات‬
‫کرد‬ ‫اشاره‬ ‫فنی‬ ‫و‬ ‫علمی‬.
•‫نمونه‬ ‫چند‬:
•Neo4J , Sparksee , InfoGrid,AllegroGraph
, …
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫نظریه‬‫کپ‬
•‫راهنمای‬‫انتخاب‬‫پایگاده‬‫داده‬‫مناسب‬‫با‬‫نیازهای‬‫نرم‬‫افزار‬
‫می‬،‫باشد‬‫نظریه‬CAP‫است‬.
•Availability‫به‬‫کااربران‬ ‫کاه‬ ‫باشاد‬ ‫مای‬ ‫معنی‬ ‫این‬
‫داشات‬ ‫را‬ ‫خوانادن‬ ‫و‬ ‫کاردن‬ ‫در‬ ‫عملیاات‬ ‫بتوانند‬ ‫همیشه‬‫ه‬
‫ساروردیگر‬ ‫یاک‬ ‫یاا‬ ‫و‬ ‫اصلی‬ ‫سرور‬ ‫اگر‬ ‫یعنی‬ ‫باشند‬‫دچاار‬
‫اان‬‫ا‬‫همچن‬ ‫و‬ ‫اود‬‫ا‬‫نش‬ ‫اع‬‫ا‬‫قط‬ ‫ااربران‬‫ا‬‫ک‬ ‫ااط‬‫ا‬‫ارتب‬ ‫اد‬‫ا‬‫ش‬ ‫اکل‬‫ا‬‫مش‬
‫باشند‬ ‫داشته‬ ‫دسترسی‬.
•Consistency‫کاه‬ ‫هایی‬ ‫داده‬ ‫باشد‬ ‫می‬ ‫معنا‬ ‫این‬ ‫به‬
‫آنها‬ ‫تماام‬ ‫برای‬ ‫جا‬ ‫هر‬ ‫از‬ ‫کنند‬ ‫می‬ ‫مشاهده‬ ‫کاربران‬ ‫تمام‬‫ا‬
‫نس‬ ‫کاربری‬ ‫هیچ‬ ‫و‬ ‫شود‬ ‫داده‬ ‫نمایش‬ ‫یکسان‬ ‫های‬ ‫داده‬‫بت‬
‫نب‬ ‫اشاتباهی‬ ‫یا‬ ‫بیشتر‬ ،‫کمتر‬ ‫های‬ ‫داده‬ ‫دیگری‬ ‫به‬‫کاه‬ ‫یناد‬
‫هم‬ ‫اطالعات‬ ‫که‬ ‫کند‬ ‫می‬ ‫تضمین‬ ‫داده‬ ‫پایگاه‬ ‫یعنی‬‫و‬ ‫یشاه‬
‫باشد‬ ‫می‬ ‫یکسان‬ ‫جا‬ ‫همه‬.
•Partition-telorance‫کاه‬ ‫باشاد‬ ‫می‬ ‫معنا‬ ‫این‬ ‫به‬
‫با‬ ‫جغرافیاایی‬ ‫مختلف‬ ‫های‬ ‫مکان‬ ‫در‬ ‫مختلف‬ ‫های‬ ‫سرور‬‫ه‬
‫یکپارچ‬ ‫طور‬ ‫به‬ ‫سیستم‬ ‫که‬ ‫میشوند‬ ‫توزیع‬ ‫طوری‬‫هماه‬ ‫با‬ ‫ه‬
‫کند‬ ‫می‬ ‫کار‬ ‫و‬ ‫باشد‬ ‫می‬ ‫ارتباط‬ ‫در‬ ‫نودها‬.
•
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫ابزار‬-‫ها‬ ‫تکنی‬-‫های‬ ‫الگوریتم‬‫کاوی‬ ‫داده‬
•RapidMiner
•SPSS Modeler
•Oracle Data Mining
•Knime
•SAS
•Teradata
•Machine Learning
•Neural Networks
•Decision Trees
•Natural Language Processing
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫تحلیل‬ ‫نوع‬‫عظیم‬‫داده‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫ها‬ ‫داده‬ ‫تحلیل‬ ‫تجزیه‬ ‫ابزارهای‬
•Kafka
•ScalaLab
•ElasticResearch
•BigML
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫ها‬ ‫داده‬ ‫سازی‬ ‫بصری‬ ‫ابزارهای‬
•Tableau
•Silk
•ChaCartoDB
•rtio
•Beaker
•Rodeo
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫ابزار‬ ‫ماتریس‬-‫صنایع‬
Cloudera
Quantum
Informatica
Alteryx
RapidMiner
SPSS Modeler
Kafka
ElasticResearch
Tableau
Silk
‫فناوری‬ ‫مالی‬ ‫پژوهش‬ ‫سالمت‬ ‫بیزینس‬
‫سبک‬
‫زندگی‬
‫حمل‬
‫نقل‬ ‫و‬
‫بیمه‬ ‫آموزش‬ ‫انرژی‬ ‫جغرافیا‬ ‫امالک‬ ‫غذا‬ ‫رسانه‬ ‫فضا‬ ‫هوا‬ ‫گردشگری‬ ‫ورزش‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
Management & Monitoring
(Ambari)
Coordinat
ion
(ZooKeep
er)
Workflow
&
Schedulin
g (Oozie)
Scripting
(Pig)
Machine
Learning
(Mahout)
Query
(Hive)
NoSQL
Database
(HBase)
Data
Integratio
n(Sqoop/
REST/OD
BC)
Distributed Processing
(Mapreduce)
Distributed Storage
(HDFS)
‫هدوپ‬ ‫اکوسیستم‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫اسپارک‬ ‫اکوسیستم‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫متدولوژی‬
‫روش‬‫انتخاب‬ ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫فرآیند‬‫ها‬(‫ابزار‬)
‫سواالت‬ ‫اساس‬ ‫بر‬‫ها‬ ‫شاخص‬ ‫و‬ ‫کار‬ ‫و‬ ‫کسب‬ ‫ها‬ ‫دیتاست‬ ‫و‬ ‫داده‬ ‫منابع‬ 0
‫داده‬ ‫نوع‬ ‫اساس‬ ‫بر‬‫پردازشی‬ ‫موتور‬ ‫های‬ ‫ویژگی‬ ‫و‬ ‫ذخیره‬‫داده‬ ‫عظیم‬ ‫پردازش‬ ‫و‬ ‫سازی‬ 1
‫کپ‬ ‫نظریه‬ ‫اساس‬ ‫بر‬ ‫عظیم‬ ‫مدیریت‬‫داده‬ 2
‫و‬ ‫تحلیل‬ ‫نوع‬ ‫و‬ ‫آماری‬ ‫و‬ ‫ریاضی‬ ‫های‬ ‫مدل‬ ‫اساس‬ ‫بر‬
‫کار‬ ‫و‬ ‫کسب‬ ‫سواالت‬
‫کاوی‬ ‫داده‬ 3
‫اساس‬ ‫بر‬‫صنعت‬ ‫حوزه‬ ‫و‬ ‫قبل‬ ‫مرحله‬ ‫الگوهای‬ ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫تجزیه‬ 4
‫تجزیه‬ ‫اساس‬ ‫بر‬‫صنعت‬ ‫حوزه‬ ‫و‬ ‫ها‬ ‫تحلیل‬ ‫سازی‬ ‫بصری‬ 5
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
 The world is looking for big data scientists, and there just aren't enough
to go around.
(Gurjeet Singh)
Chairman of the Board of Directors, Ayasdi
 I keep saying that the hot job in the next 10 years will be statisticians,
and I’m not kidding.
(Hal Varian)
Chief Economist at Google
‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬
‫سخت‬ ‫های‬ ‫مهارت‬ ‫مهارت‬‫نرم‬ ‫های‬
‫آشنایی‬‫داده‬ ‫پایگاه‬ ‫با‬ ‫رهبری‬
‫کاوی‬ ‫داده‬ ‫تیمی‬ ‫کار‬
‫مهارت‬‫آماری‬ ‫های‬ ‫یادگیری‬
‫تصمیم‬ ‫مدلسازی‬ ‫مثبت‬ ‫نگرش‬
‫تحلیل‬‫ریسک‬ ‫ارتباطی‬ ‫های‬ ‫مهارت‬
‫سازی‬ ‫بصری‬ ‫شخصی‬ ‫بین‬ ‫های‬ ‫مهارت‬
‫بهینه‬‫سازی‬ ‫شکیبایی‬
‫متغیره‬ ‫چند‬ ‫گیری‬ ‫تصمیم‬ ‫شوق‬ ‫و‬ ‫شور‬
‫نویسی‬ ‫برنامه‬ ‫با‬ ‫داده‬ ‫دادن‬ ‫ارتباط‬‫کار‬ ‫و‬ ‫کسب‬ ‫اهداف‬
‫انتقادی‬ ‫تفکر‬
‫ارتباط‬ ‫برقراری‬‫تک‬ ‫اطالعات‬ ‫بین‬ ‫موثر‬‫نیکی‬
‫تکنیکی‬ ‫غیر‬ ‫مخاطب‬ ‫و‬
‫خالقیت‬
‫درونی‬ ‫حس‬(‫شهود‬)
‫تیزبینی‬
‫کنجکاوی‬
‫تقسیم‬‫بندی‬‫مهارت‬‫ها‬‫به‬‫دو‬‫د‬‫سته‬
‫نرم‬‫و‬‫سخت‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬
‫تقسیم‬‫بندی‬‫مهارت‬‫ها‬‫به‬‫دو‬‫د‬‫سته‬
‫نرم‬‫و‬‫سخت‬‫و‬‫ارتباط‬‫آن‬‫ها‬‫با‬
‫نیمکره‬‫های‬‫مغز‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
،‫داده‬ ‫عظیم‬ ‫تحلیلگران‬ ‫پایه‬ ‫حقوق‬ ‫میانگین‬117‫ارقام‬ ‫بین‬ ‫ما‬ ‫عدد‬ ‫این‬ ‫که‬ ‫است‬ ‫سال‬ ‫در‬ ‫دالر‬ ‫هزار‬89‫الی‬242‫باشد‬‫می‬ ‫دالر‬ ‫هزار‬
‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬
‫ت‬ ‫به‬ ،‫داده‬ ‫عظیم‬ ‫تحلیلگران‬ ‫ساالنه‬ ‫حقوق‬ ‫میانگین‬‫ها‬ ‫مهارت‬ ‫فکیک‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬
‫تحلیلگری‬ ‫با‬ ‫رابطه‬ ‫در‬ ‫موجود‬ ‫ارقام‬ ‫و‬ ‫آمار‬ ‫به‬ ‫کلی‬ ‫نگاهی‬‫داده‬ ‫عظیم‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬
‫میزان‬‫رشد‬‫تقاضا‬‫برای‬
‫استخدام‬‫تحلیلگران‬‫عظیم‬
،‫داده‬‫به‬‫تفکیک‬‫مهار‬‫ت‬‫ها‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬
‫باالترین‬‫مهارتهای‬‫مورد‬‫نیاز‬‫در‬‫تحلیلگری‬‫عظی‬‫م‬‫داده‬
‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
Coursera – Data-Driven Decision Making
EdX – Data Science Essentials
Udacity – Intro to Machine Learning
IBM – Data Science Fundamentals
California Institute of Technology – Learning from Data
Dataquest – Become a Data Scientist
KDNuggets – Data Mining Course
‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬
‫معرفی‬‫برخی‬‫منابع‬‫آنالین‬‫آموزش‬‫مهارت‬‫های‬‫تحلیلگری‬‫عظ‬‫یم‬‫داده‬
‫کار‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫تحلیلگری‬ ‫گروه‬
‫شما‬ ‫توجه‬ ‫از‬ ‫سپاس‬
@BigData_BusinessAnalytics

More Related Content

Similar to Big data and business analytics

The importance of using Big Data in software system development.pdf
The importance of using Big Data in software system development.pdfThe importance of using Big Data in software system development.pdf
The importance of using Big Data in software system development.pdfMohammad Omid Khairandish
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligenceNaghi Nasiri
 
Business intelligence01 [autosaved]
Business intelligence01 [autosaved]Business intelligence01 [autosaved]
Business intelligence01 [autosaved]Naghi Nasiri
 
داده های عظیم چگونه دنیا را تغییر خواهند داد
داده های عظیم چگونه دنیا را تغییر خواهند داد داده های عظیم چگونه دنیا را تغییر خواهند داد
داده های عظیم چگونه دنیا را تغییر خواهند داد Farzad Khandan
 
پنج توصیه‌ ثروتمندترین مرد جهان برای موفقیت در کسب و کار.…
پنج توصیه‌ ثروتمندترین مرد جهان برای موفقیت در کسب و کار.…پنج توصیه‌ ثروتمندترین مرد جهان برای موفقیت در کسب و کار.…
پنج توصیه‌ ثروتمندترین مرد جهان برای موفقیت در کسب و کار.…کسب و کار شما
 
انقلاب دیجیتال وظهور تجارت الکترونیکی
انقلاب دیجیتال وظهور تجارت الکترونیکی انقلاب دیجیتال وظهور تجارت الکترونیکی
انقلاب دیجیتال وظهور تجارت الکترونیکی Sadegh Pourzadeh
 
تاثیر کلان داده بر سامانه های تصمیم یار
تاثیر کلان داده بر سامانه های تصمیم یارتاثیر کلان داده بر سامانه های تصمیم یار
تاثیر کلان داده بر سامانه های تصمیم یارHanieh Kashfi
 
IOT-Startup-Business-Model-Canvas
IOT-Startup-Business-Model-CanvasIOT-Startup-Business-Model-Canvas
IOT-Startup-Business-Model-CanvasMahdi Nasseri
 
گذار از پارادایم نو آوری باز و بسته
گذار از پارادایم نو آوری باز و بستهگذار از پارادایم نو آوری باز و بسته
گذار از پارادایم نو آوری باز و بستهElnaz Farnood
 
ترندهای مهم استارتاپی 2018
ترندهای مهم استارتاپی 2018ترندهای مهم استارتاپی 2018
ترندهای مهم استارتاپی 2018aliaalistartup
 
What is big data and how use that
What is big data and how use thatWhat is big data and how use that
What is big data and how use thatshohreh deldari
 
هوش تجاری (Business intelligence)
هوش تجاری (Business intelligence)هوش تجاری (Business intelligence)
هوش تجاری (Business intelligence)RayBPMS
 
How to get startup ideas (karnova.ir)
How to get startup ideas (karnova.ir)How to get startup ideas (karnova.ir)
How to get startup ideas (karnova.ir)Ali Sohofi
 
Hbr 10 must reads on innovation
Hbr 10 must reads on innovationHbr 10 must reads on innovation
Hbr 10 must reads on innovationAli Ganjizadeh
 

Similar to Big data and business analytics (20)

The importance of using Big Data in software system development.pdf
The importance of using Big Data in software system development.pdfThe importance of using Big Data in software system development.pdf
The importance of using Big Data in software system development.pdf
 
Power BI
Power BIPower BI
Power BI
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
Business intelligence01 [autosaved]
Business intelligence01 [autosaved]Business intelligence01 [autosaved]
Business intelligence01 [autosaved]
 
داده های عظیم چگونه دنیا را تغییر خواهند داد
داده های عظیم چگونه دنیا را تغییر خواهند داد داده های عظیم چگونه دنیا را تغییر خواهند داد
داده های عظیم چگونه دنیا را تغییر خواهند داد
 
Internet engineering
Internet engineeringInternet engineering
Internet engineering
 
پنج توصیه‌ ثروتمندترین مرد جهان برای موفقیت در کسب و کار.…
پنج توصیه‌ ثروتمندترین مرد جهان برای موفقیت در کسب و کار.…پنج توصیه‌ ثروتمندترین مرد جهان برای موفقیت در کسب و کار.…
پنج توصیه‌ ثروتمندترین مرد جهان برای موفقیت در کسب و کار.…
 
انقلاب دیجیتال وظهور تجارت الکترونیکی
انقلاب دیجیتال وظهور تجارت الکترونیکی انقلاب دیجیتال وظهور تجارت الکترونیکی
انقلاب دیجیتال وظهور تجارت الکترونیکی
 
Mis 1
Mis 1Mis 1
Mis 1
 
تاثیر کلان داده بر سامانه های تصمیم یار
تاثیر کلان داده بر سامانه های تصمیم یارتاثیر کلان داده بر سامانه های تصمیم یار
تاثیر کلان داده بر سامانه های تصمیم یار
 
IOT-Startup-Business-Model-Canvas
IOT-Startup-Business-Model-CanvasIOT-Startup-Business-Model-Canvas
IOT-Startup-Business-Model-Canvas
 
Knowledge management
Knowledge managementKnowledge management
Knowledge management
 
گذار از پارادایم نو آوری باز و بسته
گذار از پارادایم نو آوری باز و بستهگذار از پارادایم نو آوری باز و بسته
گذار از پارادایم نو آوری باز و بسته
 
ترندهای مهم استارتاپی 2018
ترندهای مهم استارتاپی 2018ترندهای مهم استارتاپی 2018
ترندهای مهم استارتاپی 2018
 
What is big data and how use that
What is big data and how use thatWhat is big data and how use that
What is big data and how use that
 
هوش تجاری (Business intelligence)
هوش تجاری (Business intelligence)هوش تجاری (Business intelligence)
هوش تجاری (Business intelligence)
 
How to get startup ideas (karnova.ir)
How to get startup ideas (karnova.ir)How to get startup ideas (karnova.ir)
How to get startup ideas (karnova.ir)
 
Hbr 10 must reads on innovation
Hbr 10 must reads on innovationHbr 10 must reads on innovation
Hbr 10 must reads on innovation
 
BPM and Sales
BPM and Sales BPM and Sales
BPM and Sales
 
ثروت افرینان.
ثروت افرینان.ثروت افرینان.
ثروت افرینان.
 

Big data and business analytics

  • 1. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬ Big data is mostly about taking numbers and using those numbers to make predictions about the future. The bigger the data set you have, the more accurate the predictions about the future will be. Anthony Goldbloom Founder and CEO of Kaggle
  • 3. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬ ‫دانشجویی‬ ‫سمینار‬ ‫کار‬ ‫و‬ ‫کسب‬ ‫در‬ ‫داده‬‫عظیم‬ ‫تحلیل‬ ‫کاربردهای‬ ‫جلسه‬ ‫مسئول‬:‫روحانی‬ ‫سعید‬ ‫دکتر‬‫ت‬ ‫دانشگاه‬ ‫اطالعات‬ ‫فناوری‬ ‫مدیریت‬ ‫گروه‬ ‫علمی‬ ‫هیأت‬ ‫عضو‬‫هران‬ ‫امیرصادقی‬ ‫مهدی‬‫تهران‬ ‫دانشگاه‬ ‫اطالعات‬ ‫فناوری‬ ‫مدیریت‬ ‫ارشد‬ ‫کارشناسی‬ ‫دانشجوی‬ ‫قلندری‬ ‫قدمی‬ ‫پروین‬‫تهران‬ ‫دانشگاه‬ ‫اطالعات‬ ‫فناوری‬ ‫مدیریت‬ ‫دکتری‬ ‫دانشجوی‬ ‫آهی‬ ‫عسگری‬ ‫میثم‬‫تهران‬ ‫دانشگاه‬ ‫اطالعات‬ ‫فناوری‬ ‫مدیریت‬ ‫ارشد‬ ‫کارشناسی‬ ‫دانشجوی‬ ‫وردی‬ ‫اله‬ ‫فرشته‬‫تهران‬ ‫دانشگاه‬ ‫انسانی‬ ‫منابع‬ ‫مدیریت‬ ‫ارشد‬ ‫کارشناسی‬ ‫آموخته‬ ‫دانش‬ ‫صداقت‬ ‫هادی‬‫دانشگاه‬ ‫اطالعات‬ ‫فناوری‬ ‫مدیریت‬ ‫ارشد‬ ‫کارشناسی‬ ‫دانشجوی‬‫تهران‬
  • 4. ‫داده‬ ‫عظیم‬ ‫اهمیت‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 5. ‫سنتی‬ ‫دیدگاه‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 6. ‫داده‬ ‫عظیم‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 7. ‫داده‬ ‫عظیم‬ ‫های‬ ‫ویژگی‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 8. ‫داده‬ ‫تولید‬ ‫نرخ‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 9. ‫تنوع‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 10. ‫پراکندگی‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 11. ‫درستی‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 12. ‫اعتبار‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 13. ‫پذیری‬ ‫آسیب‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 14. ‫تغییرپذیری‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 15. ‫سازی‬ ‫بصری‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 16. ‫ارزش‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 17. ‫ارزش‬ ‫استخراج‬ ‫قیمتها‬ ‫کاهش‬ ‫بهتر‬ ‫و‬ ‫سریعتر‬ ‫گیری‬ ‫تصمیم‬ ‫جدید‬ ‫خدمات‬ ‫و‬ ‫محصوالت‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 18. ‫داده‬ ‫عظیم‬ ‫کلیدی‬ ‫های‬ ‫الیه‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 19. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 20. ‫صنعت‬ ‫و‬ ‫داده‬ ‫عظیم‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 21. ‫بانکداری‬ ‫و‬ ‫داده‬ ‫عظیم‬ ‫کاربردها‬: ‫تقلب‬ ‫کشف‬ ‫مشتریان‬ ‫بندی‬ ‫تقسیم‬ ‫سفارشی‬ ‫بازاریابی‬ ‫ریسک‬ ‫مدیریت‬ ‫نمونه‬:‫آلمان‬ ‫بانک‬ ‫دویچه‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 22. ‫سرگرمی‬ ‫و‬ ‫رسانه‬ ،‫ارتباطات‬ ‫و‬ ‫داده‬ ‫عظیم‬ ‫چالشها‬: ‫جمع‬،‫آوری‬‫تحلیل‬‫و‬‫بکارگیری‬‫بینش‬‫مشتریان‬ ‫بهره‬‫گیری‬‫از‬‫محتوای‬‫موبایل‬‫و‬‫شبکه‬‫های‬‫اجتماعی‬ ‫درک‬‫الگوهای‬real-time‫و‬‫کاربرد‬‫محتوای‬‫رسانه‬‫ها‬ ‫نمونه‬: ‫مسابقات‬‫ق‬‫ه‬‫رمانی‬‫تنیس‬‫ویمبلدون‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 23. ‫و‬ ‫داده‬ ‫عظیم‬‫پزشکی‬ ‫خدمات‬ ‫چالشها‬: ‫درمانی‬ ‫های‬ ‫هزینه‬ ‫افزایش‬ ‫ها‬ ‫داده‬ ‫بودن‬ ‫استفاده‬ ‫قابل‬ ‫غیر‬ ‫و‬ ‫دسترسی‬ ‫عدم‬ ،‫کمبود‬ ‫نمونه‬: ‫پنسیلوانیا‬ ‫دانشگاه‬ ‫بیمارستان‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 24. ‫و‬ ‫داده‬ ‫عظیم‬‫آموزش‬ ‫چالشها‬: ‫مختلف‬ ‫منابع‬ ‫از‬ ‫ها‬ ‫داده‬ ‫ادغام‬ ‫داده‬ ‫عظیم‬ ‫درباره‬ ‫ندیده‬ ‫آموزش‬ ‫ارگانهای‬ ‫و‬ ‫کارکنان‬ ‫ها‬ ‫داده‬ ‫از‬ ‫نگهداری‬ ‫و‬ ‫محرمانگی‬ ‫به‬ ‫مربوط‬ ‫مسائل‬ ‫نمونه‬: ‫تاسمانیا‬ ‫دانشگاه‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 25. ‫و‬ ‫داده‬ ‫عظیم‬‫دولت‬ ‫چالشها‬: ‫ها‬ ‫داده‬ ‫سازی‬ ‫یکپارچه‬ ‫داده‬ ‫عظیم‬ ‫سازی‬ ‫همسو‬ ‫و‬ ‫همکاری‬ ‫نمونه‬: ‫دوبی‬ ‫هوشمند‬ ‫شهر‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 26. ‫و‬ ‫داده‬ ‫عظیم‬‫نقل‬ ‫و‬ ‫حمل‬ ‫چالشها‬: ‫داده‬‫های‬‫حاصل‬‫از‬‫شبکه‬‫های‬‫اجتماعی‬‫مبتنی‬‫بر‬‫مکان‬‫و‬‫پهنای‬‫باند‬‫با‬‫سرعت‬‫باالی‬‫مخابراتی‬ ‫رفتارهای‬‫سفری‬‫افراد‬‫را‬‫تحت‬‫تاثیر‬‫قرار‬‫داده‬‫است‬ ‫مدلهای‬‫تقاضای‬‫حمل‬‫و‬‫نقل‬‫هنوز‬‫بر‬‫اساس‬‫درک‬‫ضعیف‬‫از‬‫ساختارهای‬‫شبکه‬‫های‬‫اجتم‬‫اعی‬ ‫جدید‬‫هستند‬ ‫کاربردهای‬‫دولتی‬‫عظیم‬‫داده‬:‫کنترل‬،‫ترافیک‬‫بررنامه‬‫ریزی‬،‫راهها‬‫سیستمهای‬‫حمل‬‫و‬‫نقل‬ ،‫هوشمند‬‫مدیریت‬‫ازدحام‬‫و‬‫تراکم‬ ‫کاربردهای‬‫بخش‬‫خصوصی‬:‫مدیریت‬،‫درآمد‬‫بهبوئ‬،‫فناوری‬‫ترابری‬‫و‬‫ایجاد‬‫مزیت‬‫رقاب‬‫تی‬ ‫کاربردهای‬‫فردی‬:‫انتخاب‬‫مسیر‬‫بهینه‬‫برای‬‫صرفه‬‫جویی‬‫در‬‫وقت‬‫و‬،‫سوخت‬‫برنامه‬‫ری‬‫زی‬ ‫مسافرت‬‫و‬‫غیره‬ ‫نمونه‬:‫شرکت‬‫اتوبوسرانی‬‫شهر‬‫آخن‬‫آلمان‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 29. ‫داده‬ ‫اهمیت‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 30. ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫تاریخچه‬ 1985 20072000 ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 31. ‫گیری‬ ‫تصمیم‬ ‫فرایند‬ ‫و‬ ‫داده‬ ‫علم‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 32. ‫کار‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬ ‫عظیم‬ ‫از‬ ‫استفاده‬ ‫نحوه‬ ‫محتاط‬ ‫سازمانهای‬ ‫و‬ ‫شرکتها‬ ‫آگاه‬ ‫نیمه‬ ‫سازمانهای‬ ‫و‬ ‫شرکتها‬ ‫آگاه‬ ‫سازمانهای‬ ‫و‬ ‫شرکتها‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 33. ‫جویی‬ ‫علت‬ ‫مرگ‬ •‫مشتری‬ ‫و‬ ‫کاربر‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫هوشمندی‬‫ار‬ •‫بینش‬(Insight) •‫توصیه‬(Recommendation) ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 34. ‫مشتری‬ ‫تجربه‬ ‫و‬ ‫داده‬ ‫علم‬ ‫رسانی‬ ‫اطالع‬ ‫در‬ ‫مشتری‬ ‫تجربه‬ ‫بهبود‬‫و‬ ‫اپراتوره‬ ‫حوزه‬ ‫در‬ ‫اینترنتی‬ ‫خدمات‬ ‫ارائه‬‫ای‬ ‫موبایل‬ ‫بهبود‬‫از‬ ‫خرید‬ ‫در‬ ‫مشتری‬ ‫تجربه‬ ‫فروشگاهها‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 35. ‫مقدمه‬ ‫فناوری‬ ‫مسائل‬ ‫و‬ ‫بزرگ‬ ‫تولیدی‬ ‫داغ‬ ‫موضوعات‬ ‫و‬ ‫ها‬‫روند‬ ‫ای‬ ‫دهه‬ ‫هر‬ ‫دارد‬ ‫را‬ ‫خود‬ ‫خاص‬ ‫اطالعات‬.‫بحث‬ ‫که‬ ‫دارند‬ ‫وجود‬ ‫موضوع‬ ‫چندین‬ ‫امروزه‬ ‫باش‬‫می‬ ‫صنعتی‬ ‫اتوماسیون‬ ‫زمینه‬ ‫در‬ ‫بسیاری‬ ‫های‬ ‫پژوهش‬ ‫اصلی‬‫ند‬: ‫یا‬ ‫اشیا‬ ‫اینترنت‬Internet of Thing ‫یا‬ ‫بزرگ‬ ‫های‬ ‫داده‬Big Data ‫یا‬ ‫ابری‬ ‫رایانش‬Cloud Computing ‫صنعت‬4.0‫یا‬Industry 4.0 ‫متحول‬ ‫را‬ ‫صنعتی‬ ‫اتوماسیون‬ ‫آینده‬ ‫توانند‬ ‫می‬ ‫فناوری‬ ‫چهار‬ ‫این‬‫کنند‬. ‫تولی‬ ‫دستگاه‬ ‫بین‬ ‫ارتباط‬ ‫برقراری‬ ‫با‬ ‫ترتیب‬ ‫به‬ ‫ها‬ ‫فناوری‬ ‫این‬،‫صنعتی‬ ‫د‬ ‫برروی‬ ‫گسترده‬ ‫محاسبات‬ ،‫آن‬ ‫سازی‬ ‫ذخیره‬ ‫و‬ ‫بزرگ‬ ‫های‬ ‫داده‬ ‫آوری‬ ‫جمع‬ ‫د‬ ‫مخصوصا‬ ‫صنعت‬ ‫تحول‬ ‫باعث‬ ‫جدید‬ ‫صنعتی‬ ‫انقالب‬ ‫ایده‬ ‫و‬ ‫ها‬ ‫داده‬‫ر‬ ‫صن‬ ‫مانیتورینگ‬ ‫های‬ ‫سیستم‬ ‫و‬ ‫ها‬ ‫داده‬ ‫مخابره‬ ،‫اتوماسیون‬ ‫حوزه‬‫در‬ ‫عتی‬ ‫شد‬ ‫خواهند‬ ‫نزدیک‬ ‫آینده‬. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 36. ‫اشیا‬ ‫اینترنت‬ •‫اینترنت‬‫اشیا‬‫یا‬‫چیزنت‬( Internet of Things)‫به‬‫طور‬‫کلی‬‫اشاره‬‫دارد‬‫به‬‫بسیاری‬‫از‬‫اشیا‬‫و‬‫وسایل‬ ‫محیط‬‫مان‬‫پیرامون‬‫که‬‫به‬‫شبکه‬‫اینترنت‬‫متصل‬‫شده‬‫و‬‫بتوان‬‫توسط‬‫های‬‫اپلیکیشن‬‫موجود‬‫در‬‫ت‬‫لفن‬‫های‬ ‫هوشمند‬‫و‬‫تبلت‬‫کنترل‬‫و‬‫مدیریت‬‫شوند‬. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 38. ‫اینترنت‬ ‫به‬ ‫متصل‬ ‫اشیا‬ ‫تعداد‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 39. ‫انسانها‬ ‫تعداد‬ ‫و‬ ‫متصل‬ ‫اشیا‬ ‫تعداد‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 40. The role of Big DataAnalytics in IoT ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 41. ‫الزامات‬Big Data‫و‬Analytics‫در‬IoT •‫اتصال‬ •‫سازی‬ ‫ذخیره‬ •‫خدمات‬ ‫کیفیت‬ •‫هنگام‬ ‫به‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬ •‫بنچمارک‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 42. ‫حلهای‬ ‫راه‬ ‫بندی‬ ‫طبقه‬Big Data‫و‬Analytics‫های‬ ‫سیستم‬ ‫برای‬IoT ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 43. ‫جریان‬Big Data‫در‬IoT ‫دیتا‬ ‫بیگ‬ ‫پلتفرم‬ ‫دیتا‬ ‫بیگ‬ ‫آنالیز‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 44. ‫حوزه‬ ‫در‬ ‫سازمان‬ ‫یک‬ ‫شکست‬ ‫یا‬ ‫اقبال‬IoT‫تحلیل‬ ‫مدیریت‬ ‫گرو‬ ‫در‬ Big Data‫است‬. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 45. ‫های‬ ‫چالش‬ ‫و‬ ‫ها‬ ‫فرصت‬IoT‫برای‬Big Data Analytics ، ‫تکنولوژی‬ ‫عصر‬ ‫در‬‫ها‬ ‫داده‬‫حکم‬ ‫واقع‬ ‫در‬‫نفت‬‫دارند‬ ‫را‬ ‫گذشته‬ ‫صنعت‬ ‫در‬. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 46. ‫مقدمه‬ •‫که‬ ‫دیدیم‬‫عظیم‬‫داده‬‫آفرینا‬ ‫ارزش‬ ‫و‬ ‫کاربردهاا‬ ‫چه‬ ‫به‬ ‫منجر‬‫ی‬ ‫میشود‬ ‫وکارها‬ ‫کسب‬ ‫برای‬ ‫هایی‬. •‫البته‬ ‫و‬‫رویکرد‬ ‫این‬‫است‬ ‫ناپذیر‬ ‫اجتناب‬‫عظا‬ ‫زیارا‬‫داده‬ ‫یم‬ ‫و‬ ‫شاده‬ ‫تبدیل‬ ‫ها‬ ‫شرکت‬ ‫برای‬ ‫دارایی‬ ‫یک‬ ‫به‬‫نادیاده‬‫گا‬‫رفتن‬ ‫دارایی‬ ‫این‬‫موجب‬‫کارهاا‬ ‫و‬ ‫کسب‬ ‫شکست‬‫رقااب‬ ‫فضاای‬ ‫در‬‫تی‬ ‫میشود‬. •‫در‬ ‫لذا‬‫شاهد‬ ‫آینده‬‫هجوم‬‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫به‬‫خاواه‬‫یم‬ ‫یعنی‬ ‫بود‬... •‫پیشا‬ ‫هاای‬ ‫تحلیال‬ ‫از‬ ‫هستند‬ ‫مایل‬ ‫بسیاری‬ ‫های‬ ‫سازمان‬‫رفته‬ ‫کنند‬ ‫استقبال‬ ‫بار‬ ‫اولین‬ ‫برای‬ ‫داده‬ ‫عظیم‬‫ولی‬... •‫درباره‬‫شده‬ ‫سردرگم‬ ‫کار‬ ‫این‬ ‫انجام‬ ‫چگونگی‬‫اند‬! •‫دنباال‬ ‫به‬ ‫قسمت‬ ‫این‬ ‫در‬ ‫ما‬‫راه‬ ‫نقشکه‬ ‫یک‬ ‫ارائه‬‫بارای‬ ‫است‬ ‫و‬ ‫سازی‬ ‫پیاده‬ ‫مسیر‬ ‫در‬ ‫ها‬ ‫سازمان‬ ‫و‬ ‫ها‬ ‫شرکت‬ ‫هدایت‬‫فاده‬ ‫هستیم‬ ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫از‬. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 47. ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫تاریخچه‬ •‫تحلیل‬ ‫مسئله‬‫حجیم‬ ‫های‬ ‫داده‬‫نوظهوری‬ ‫پدیده‬‫نیست‬! •‫با‬‫طبق‬ ‫افزاری‬ ‫سخت‬ ‫و‬ ‫پردازشی‬ ‫توان‬ ‫اینکه‬‫مور‬ ‫قانون‬‫پارداز‬ ‫از‬ ‫آسانتر‬ ‫همیشه‬ ‫داده‬ ‫سازی‬ ‫ذخیره‬ ‫که‬ ‫آنجا‬ ‫از‬ ‫اما‬ ‫میشود‬ ‫برابر‬ ‫دو‬ ‫سال‬ ‫هر‬‫باوده‬ ‫آن‬ ‫ش‬ ‫کند‬ ‫پردازش‬ ‫را‬ ‫ها‬ ‫داده‬ ‫حجم‬ ‫این‬ ‫بتواند‬ ‫تا‬ ‫بوده‬ ‫هایی‬ ‫راه‬ ‫دنبال‬ ‫همواره‬ ‫بشر‬ ‫لذا‬. •‫ایجاد‬ ‫باعث‬ ‫داده‬ ‫زیاد‬ ‫حجم‬‫گلوگاه‬‫سرور‬ ‫روی‬‫میشود‬! •‫در‬ ‫را‬ ‫نگاشت‬ ‫کاهش‬ ‫تکنیک‬ ‫بار‬ ‫اولین‬ ‫برای‬ ‫گوگل‬‫سیستم‬ ‫فایل‬ ‫گوگل‬‫خاتمه‬ ‫بزرگ‬ ‫چالش‬ ‫این‬ ‫به‬ ‫تا‬ ‫برد‬ ‫کار‬ ‫به‬‫دهد‬. •‫اما‬ ‫نداد‬ ‫ادامه‬ ‫را‬ ‫جدید‬ ‫سیستم‬ ‫فایل‬ ‫این‬ ‫روی‬ ‫بر‬ ‫کار‬ ‫گوگل‬‫آپاچی‬‫ابداع‬ ‫را‬ ‫هدوپ‬ ‫شده‬ ‫توزیع‬ ‫سیستم‬ ‫فایل‬ ‫ایده‬ ‫همین‬ ‫از‬‫کرد‬. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 48. ‫بود‬ ‫چه‬ ‫ایده‬ ‫این‬‫هدوپ‬ ‫و‬‫چیست؟‬ •‫سارور‬ ‫چندین‬ ‫در‬ ‫را‬ ‫اطالعات‬ ‫سازی‬ ‫ذخیره‬ ‫امکان‬ ‫هدوپ‬ (‫پی‬‫سی‬)‫مای‬ ‫فاراهم‬ ‫پایین‬ ‫ای‬ ‫هزینه‬ ‫با‬‫آورد‬( .‫بسات‬‫ری‬ ‫برای‬‫شده‬ ‫توزیع‬ ‫رایانش‬) •‫کلی‬ ‫بخش‬ ‫دو‬ ‫از‬ ‫هدوپ‬ ‫تکنولوژی‬ 1.‫اچ‬‫اس‬ ‫اف‬ ‫دی‬‫یا‬‫یافته‬ ‫توزیع‬ ‫فایل‬‫هدوپ‬ Hadoop Distribition File System 2.‫و‬‫با‬ ‫اطالعاات‬ ‫پردازی‬ ‫کیفیت‬ ‫با‬ ‫تکنیک‬ ‫همچنین‬‫ناام‬ ‫ه‬ ‫کاهشی‬ ‫نگاشت‬MapReduce‫استفاده‬‫کند‬ ‫می‬. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 49. ‫سیستم‬ ‫فایل‬ •‫سیسااتم‬‫فایاال‬File system‫روشاای‬‫و‬ ‫ذخیااره‬ ‫باارای‬ ‫دهی‬‫سازمان‬‫های‬ ‫فایل‬‫تاا‬ ‫اسات‬ ‫هایشاان‬‫داده‬ ‫و‬ ‫ای‬‫رایانه‬ ‫کند‬ ‫آسان‬ ‫را‬ ‫ها‬‫آن‬ ‫به‬ ‫دسترسی‬ ‫و‬ ‫یافتن‬. •‫سیستم‬‫گونا‬ ‫هاای‬ ‫سیساتم‬ ‫فایل‬ ‫از‬ ،‫مختلف‬ ‫های‬ ‫عامل‬‫اگونی‬ ‫کنند‬ ‫می‬ ‫پشتیبانی‬. •‫نیستند‬ ‫یکسان‬ ‫ها‬ ‫سیستم‬ ‫فایل‬ ‫ی‬ ‫همه‬‫ها‬ ‫و‬‫از‬ ‫کادام‬ ‫ر‬ ‫دارناد‬ ‫هاا‬ ‫داده‬ ‫ساازماندهی‬ ‫بارای‬ ‫گوناگونی‬ ‫های‬ ‫روش‬ ،‫آنها‬. ‫بع‬ ،‫هساتند‬ ‫ساریعتر‬ ‫بقیاه‬ ‫از‬ ‫هاا‬ ‫سیستم‬ ‫فایل‬ ‫برخی‬‫نیاز‬ ‫ضای‬ ‫فضاای‬ ‫از‬ ‫تعادادی‬ ،‫دارناد‬ ‫بیشاتری‬ ‫امنیتی‬ ‫های‬ ‫ویژگی‬‫زیااد‬ ‫ح‬ ‫در‬ ‫کنناد‬ ‫مای‬ ‫پشاتیبانی‬ ‫اطالعات‬ ‫سازی‬ ‫ذخیره‬ ‫برای‬‫الیکاه‬ ‫کوچا‬ ‫بسایار‬ ‫ساازی‬ ‫ذخیاره‬ ‫فضااهای‬ ‫باا‬ ‫فقط‬ ‫دیگر‬ ‫برخی‬‫ک‬ ‫دارند‬ ‫سازگاری‬.‫ف‬ ‫برابر‬ ‫در‬ ‫ها‬ ‫سیستم‬ ‫فایل‬ ‫از‬ ‫بعضی‬‫هاای‬ ‫ایل‬ ‫برخی‬ ‫حالیکه‬ ‫در‬ ،‫هستند‬ ‫مقاوم‬ ‫بسیار‬ ‫ویروسها‬ ‫و‬ ‫مخرب‬‫دیگر‬ ‫دستر‬ ‫سرعت‬ ‫ی‬ ‫ارائه‬ ‫فدای‬ ‫را‬ ‫شده‬ ‫یاد‬ ‫های‬ ‫ویژگی‬ ‫سایر‬‫سای‬ ‫نمایند‬ ‫می‬ ‫کاربران‬ ‫به‬ ‫بیشتر‬. •‫ر‬ ‫از‬ ‫پشتیبانی‬ ‫برای‬ ‫سیستمی‬ ‫فایل‬ ‫ایجاد‬ ‫به‬ ‫لزوم‬‫موازی‬ ‫ایانش‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 50. ‫هدوپ‬ ‫شده‬ ‫توزیع‬ ‫سیستم‬ ‫فایل‬ •‫معماری‬HDFS‫بصورت‬Master-Slave‫می‬‫باشد‬. •‫هر‬‫کالستر‬HDFS‫شامل‬‫ناام‬ ‫باه‬ ‫گره‬ ‫یک‬NameNode‫مای‬ ‫بعنوان‬ ‫که‬ ‫باشد‬Master‫کااری‬ ‫فضاای‬ ‫و‬ ‫کناد‬ ‫می‬ ‫عمل‬ ‫سیستم‬ ‫به‬ ‫کاربران‬ ‫دسترسی‬ ‫و‬ ‫کند‬ ‫می‬ ‫مدیریت‬ ‫را‬ ‫فایل‬ ‫سیستم‬‫را‬ ‫هاا‬ ‫فایل‬ ‫کند‬ ‫می‬ ‫گذاری‬ ‫قانون‬. •‫در‬‫بناام‬ ‫گاره‬ ‫چندین‬ ‫گره‬ ‫این‬ ‫کنار‬DataNode‫وجاود‬‫کاه‬ ‫دارد‬ ‫یک‬ ‫گره‬ ‫هر‬ ‫ازای‬ ‫به‬ ‫معموال‬DataNode‫داریم‬ ‫کالستر‬ ‫در‬. •HDFS‫داده‬‫چنا‬ ‫باه‬ ‫هرفایل‬ ‫و‬ ‫کند‬ ‫می‬ ‫ذخیره‬ ‫فایل‬ ‫بصورت‬ ‫را‬ ‫ها‬‫د‬ ‫از‬ ‫ای‬ ‫مجموعااه‬ ‫در‬ ‫هااا‬ ‫تکااه‬ ‫ایاان‬ ‫کااه‬ ‫شااود‬ ‫ماای‬ ‫تقساایم‬ ‫تکااه‬ DataNode‫ها‬‫شوند‬ ‫می‬ ‫ذخیره‬. •NameNode‫وظیفه‬،‫باازکردن‬ ‫همچاون‬ ‫هاایی‬ ‫عملیاات‬ ‫انجام‬ ‫دارد‬ ‫عهاده‬ ‫باه‬ ‫را‬ ‫مسایرها‬ ‫و‬ ‫ها‬ ‫نام‬ ‫تغییر‬ ،‫بستن‬.‫تعیا‬ ‫همچناین‬‫ین‬ ‫به‬ ‫ها‬ ‫فایل‬ ‫های‬ ‫تکه‬ ‫نگاشت‬ ‫کننده‬DataNode‫ها‬‫باشد‬ ‫می‬ ‫نیز‬. •DataNode‫ها‬‫و‬ ‫خوانادن‬ ‫هاای‬ ‫درخواسات‬ ‫به‬ ‫رسیدگی‬ ‫وظیفه‬ ‫دارند‬ ‫برعهده‬ ‫را‬ ‫فایل‬ ‫سیستم‬ ‫کاربران‬ ‫از‬ ‫نوشتن‬.‫و‬ ‫همچناین‬‫ظیفاه‬ ‫اتور‬‫ا‬‫دس‬ ‫اه‬‫ا‬‫ب‬ ‫ای‬ ‫داده‬ ‫اای‬‫ا‬‫ه‬ ‫االک‬‫ا‬‫ب‬ ‫اازی‬‫ا‬‫س‬ ‫ای‬‫ا‬‫کپ‬ ‫و‬ ‫اذف‬‫ا‬‫ح‬ ،‫ااخت‬‫ا‬‫س‬ NameNode‫دارند‬ ‫برعهده‬ ‫نیز‬ ‫را‬. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 51. ‫کاهشی‬ ‫نگاشت‬ •‫برناماه‬ ‫مادل‬ ‫یاک‬ ‫واقاع‬ ‫در‬ ‫کاهشی‬ ‫نگاشت‬ ‫توزیا‬ ‫رایاانش‬ ‫از‬ ‫پشتیبانی‬ ‫برای‬ ‫ریزی‬‫شاده‬ ‫ع‬ ‫ها‬ ‫شاده‬ ‫توزیع‬ ‫سیستم‬ ‫فایل‬ ‫در‬ ‫که‬ ‫است‬‫دوپ‬ ‫میشود‬ ‫گرفته‬ ‫کار‬ ‫به‬. •‫نگاشااات‬ ‫فرآیناااد‬ ‫دو‬ ‫از‬map‫و‬‫کااااهش‬ reduce‫تشکیل‬‫شده‬‫است‬. •‫ابتدا‬‫را‬ ‫ورودی‬ ‫های‬ ‫داده‬ ‫مجموعه‬‫اسااس‬ ‫بار‬ namenode‫ساپس‬ ‫شده‬ ‫بندی‬ ‫خوشه‬ ‫ها‬ ‫پردازش‬ ‫و‬ ‫سازی‬ ‫ذخیره‬ ‫مجزا‬ ‫سرورهای‬ ‫روی‬ ‫ار‬‫ا‬‫آخ‬ ‫در‬ ‫و‬ ‫اوند‬‫ا‬‫میش‬namenode‫ای‬‫ا‬‫خروج‬ datanode‫و‬ ‫فراخاوانی‬ ‫را‬ ‫نظر‬ ‫مورد‬ ‫های‬ ‫میکند‬ ‫ادغام‬. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 52. ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫فرآیند‬ •‫کار‬ ‫و‬ ‫کسب‬ ‫های‬ ‫نیازمندی‬ ‫و‬ ‫ها‬ ‫سوال‬ ‫بندی‬ ‫اولویت‬ ‫و‬ ‫تعیین‬ •‫میدانی‬ ‫تحقیقات‬(‫نیاز‬ ‫مورد‬ ‫داده‬ ‫منابع‬ ،‫مغزی‬ ‫طوفان‬ ،‫تطبیقی‬ ‫الگوی‬) •‫تحلیل‬ ‫عملیاتی‬ ‫مرحله‬(‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫و‬ ‫سازی‬ ‫پیاده‬) •‫کار‬ ‫و‬ ‫کسب‬ ‫بر‬ ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫تاثیر‬ ‫و‬ ‫تغییر‬ ‫مدیریت‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 53. ‫عظیم‬ ‫دنیای‬ ‫انداز‬ ‫چشم‬‫داده‬ ‫گفتیم‬ ‫سازمان‬‫کنن‬ ‫حرکت‬ ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫سمت‬ ‫به‬ ‫باید‬ ‫ناچار‬ ‫به‬ ‫کارها‬ ‫و‬ ‫کسب‬ ‫و‬ ‫ها‬‫د‬ ‫ندارند‬ ‫نیز‬ ‫را‬ ‫تحلیل‬ ‫قدیمی‬ ‫های‬ ‫روش‬ ‫و‬ ‫ابزار‬ ‫از‬ ‫استفاده‬ ‫امکان‬. ‫مختلف‬ ‫های‬ ‫معماری‬ ‫و‬ ‫ابزار‬ ‫و‬ ‫پلتفرمها‬ ‫از‬ ‫ای‬ ‫گسترده‬ ‫طیف‬ ‫وارد‬ ‫بنابراین‬‫میش‬‫وند‬. ‫چشم‬ ‫این‬‫عظیم‬ ‫دنیای‬ ‫از‬ ‫اندازی‬‫است‬ ‫داده‬‫برندهای‬ ‫و‬ ‫محصوالت‬ ‫اسامی‬ ‫با‬‫مختل‬‫ف‬. ‫شرکتها‬‫کنند‬ ‫انتخاب‬ ‫را‬ ‫محصوالت‬ ‫کدام‬ ‫و‬ ‫شوند‬ ‫وارد‬ ‫حوزه‬ ‫این‬ ‫به‬ ‫چگونه‬ ‫باید‬. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 54. ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫معماری‬(‫فرآیندها‬) •‫داده‬ ‫سازی‬ ‫ذخیره‬(‫و‬ ‫فلینک‬ ،‫استورم‬ ،‫اسپارک‬ ،‫هدوپ‬ ‫شامل‬ ‫پردازشی‬ ‫موتور‬)... •‫مدیریت‬‫داده‬(‫های‬ ‫داده‬ ‫پایگاه‬ ‫انواع‬ ‫شامل‬ ‫ای‬ ‫داده‬ ‫پایگاه‬ ‫موتور‬NoSQL) •‫ها‬ ‫داده‬ ‫ورود‬ ‫و‬ ‫سازی‬ ‫یکپارچه‬ ،‫پاکسازی‬(‫و‬ ‫اسکوپ‬ ‫و‬ ‫فلوم‬)... •‫کاوی‬ ‫داده‬(‫نایم‬ ،‫اس‬ ‫اس‬ ‫پی‬ ‫اس‬ ،‫رپیدماینر‬‫و‬)... •‫داده‬ ‫تحلیل‬ ‫و‬ ‫تجزیه‬‫ها‬(‫و‬ ‫اسکااللب‬ ،‫ریسرچ‬ ‫الستیک‬ ،‫کافکا‬)... •‫بصری‬‫سازی‬(‫و‬ ‫چاکارتو‬ ،‫سیلک‬ ،‫تبلئو‬)... ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 55. Big Data Landscape 2017 ‫داده‬ ‫منابع‬ ‫ابزارها‬ ‫مدیریت‬ ‫راهکارهای‬ ‫سازی‬ ‫ذخیره‬ ‫و‬ ‫راهکارهای‬ ‫تحلیلی‬ ‫و‬ ‫تحویل‬ ‫راهکارهای‬ ‫سازی‬ ‫بصری‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 56. ‫داده‬ ‫منابع‬ •‫حسگرها‬ ‫های‬ ‫داده‬(‫و‬ ‫اشیاء‬ ‫اینترنت‬)... •‫اجتماعی‬ ‫های‬ ‫شبکه‬ ‫های‬ ‫داده‬ •‫بایگانی‬ ‫و‬ ‫آرشیو‬ ‫های‬ ‫داده‬ •‫باز‬ ‫های‬ ‫داده‬(‫و‬ ‫سالمت‬ ، ‫انرژی‬ ،‫شهری‬)... •‫مختلف‬ ‫صنایع‬ ‫های‬ ‫داده‬(‫ها‬ ‫و‬ ‫آب‬ ،‫هواپیمایی‬‫وا‬ ‫و‬ ‫آموزش‬ ،)... •‫کارها‬ ‫و‬ ‫کسب‬ ‫و‬ ‫بازار‬ ‫های‬ ‫داده‬ •‫هوشمند‬ ‫های‬ ‫تلفن‬ ‫های‬ ‫داده‬ •‫ها‬ ‫کننده‬ ‫کنترل‬ ‫و‬ ‫ها‬ ‫ماشین‬ ‫الگ‬ ‫های‬ ‫داده‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 57. ‫ها‬ ‫داده‬ ‫پردازش‬ ‫موتور‬ •‫هدوپ‬:‫کاهشی‬ ‫نگاشت‬ ‫از‬ ‫استفاده‬ •‫اسپارک‬:‫کتابخ‬ ‫و‬ ‫پردازش‬ ‫سرعت‬‫انه‬ ‫برن‬ ‫زباان‬ ، ‫تحلیلای‬ ‫بیشاتر‬ ‫های‬‫اماه‬ ‫دلخواه‬ ‫نویسی‬ •‫اک‬‫ا‬‫فلین‬:‫اای‬‫ا‬‫ه‬ ‫داده‬ ‫اردازش‬‫ا‬‫پ‬ ‫ارای‬‫ا‬‫ب‬ ‫باالتر‬ ‫بسیار‬ ‫سرعت‬ ، ‫حجیم‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 58. ‫داده‬ ‫عظیم‬ ‫مدیریت‬ ‫ابزار‬ •‫در‬ ‫شما‬ ‫موفقیت‬ ‫برای‬ ‫ای‬ ‫داده‬ ‫پایگاه‬ ‫موتور‬ ‫انتخاب‬‫زمینه‬ ‫داده‬ ‫عظیم‬ ‫سازی‬ ‫پیاده‬ •‫سیساتم‬ ‫از‬ ‫سانتی‬ ‫طور‬ ‫به‬ ‫کارها‬ ‫و‬ ‫کسب‬ ‫بیشتر‬‫مادیریت‬ ‫میکنند‬ ‫استفاده‬ ‫ای‬ ‫رابطه‬ ‫های‬ ‫داده‬ ‫پایگاه‬ •‫با‬ ‫زماانبر‬ ‫و‬ ‫ای‬ ‫رابطاه‬ ‫مادل‬ ‫پیچیادگی‬ ‫دلیل‬ ‫به‬ ‫باید‬‫ودن‬ ‫ای‬ ‫داده‬ ‫هاای‬ ‫پایگااه‬ ‫باه‬ ‫مهااجرت‬ ‫باه‬ ‫نیااز‬ ‫ها‬ ‫کوئری‬ ‫ای‬ ‫غیررابطه‬ •‫با‬ ‫ای‬ ‫رابطاه‬ ‫ای‬ ‫داده‬ ‫های‬ ‫پایگاه‬ ‫های‬ ‫قابلیت‬ ‫بر‬ ‫عالوه‬‫ا‬ ‫اازی‬‫ا‬‫س‬ ‫اره‬‫ا‬‫ذخی‬ ‫اایی‬‫ا‬‫توان‬ ، ‫ااختاریافته‬‫ا‬‫س‬ ‫اوئری‬‫ا‬‫ک‬ ‫اان‬‫ا‬‫زب‬‫و‬ ‫داشته‬ ‫را‬ ‫داده‬ ‫عظیم‬ ‫متنوع‬ ‫های‬ ‫داده‬ ‫مدیریت‬‫باشند‬. •‫نگهاداری‬ ‫مادل‬ ‫در‬ ‫ای‬ ‫رابطاه‬ ‫های‬ ‫داده‬ ‫پایگاه‬ ‫با‬ ‫تفاوت‬ ‫و‬ ‫پذیری‬ ‫مقیاس‬ ،‫اسکیما‬ ،‫ها‬ ‫داده‬... ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 59. ‫نواسکیوال‬ ‫داده‬ ‫پایگاه‬ ‫انواع‬ •‫های‬ ‫داده‬ ‫پایگاه‬NoSQL‫بر‬‫و‬ ‫سازی‬ ‫ذخیره‬ ‫نوع‬ ‫اساس‬ ‫به‬ ‫ها‬ ‫داده‬ ‫ارتباط‬4‫شوند‬ ‫می‬ ‫تقسیم‬ ‫دسته‬: 1. Key-Value Store ‫کلید‬-‫مقدار‬ 2. Column Family Store ‫ستونی‬ 3. Document Store ‫سندگرا‬ 4. Graph Based ‫مبتنی‬‫بر‬‫گراف‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 60. ‫کلید‬ ‫داده‬ ‫پایگاه‬-‫مقدار‬ •‫های‬‫بندی‬‫اته‬‫ا‬‫دس‬ ‫از‬ ‫ات‬‫ا‬‫حال‬ ‫ترین‬‫ااده‬‫ا‬‫س‬NoSQL،‫اته‬‫ا‬‫دس‬ ‫کلید‬-‫مقدار‬‫ما‬ ‫هاایی‬ ‫سیساتم‬ ‫در‬ ‫معماوال‬ ‫و‬ ‫باشد‬‫می‬‫ورد‬ ‫متمای‬ ‫یکدیگر‬ ‫از‬ ‫ها‬‫داده‬ ‫که‬ ‫گیرد‬ ‫می‬ ‫قرار‬ ‫استفاده‬‫هستند‬ ‫ز‬ ‫نظ‬ ‫مواردی‬ ‫به‬ ‫نسبت‬ ‫ها‬‫داده‬ ‫بودن‬ ‫دسترس‬ ‫در‬ ‫اصوال‬ ‫و‬‫یر‬ ‫دارد‬ ‫بیشتری‬ ‫اهمیت‬ ‫پایائی‬.‫یا‬ ‫فقاط‬ ‫معمااری‬ ‫این‬ ‫در‬‫ک‬ ‫داریم‬ ‫کلید‬(‫داده‬ ‫پایگااه‬ ‫در‬ ‫اصالی‬ ‫کلیاد‬ ‫مانند‬ ‫که‬‫هاای‬ ‫کنند‬ ‫می‬ ‫عمل‬ ‫ای‬ ‫رابطه‬)‫مقادار‬ ‫کاه‬ ‫داریام‬ ‫مقدار‬ ‫یک‬ ‫و‬ ‫گرداند‬ ‫می‬ ‫باز‬ ‫را‬ ‫کلید‬ ‫آن‬ ‫معادل‬. •‫در‬ ‫در‬ ‫بااال‬ ‫سارعت‬ ‫باه‬ ‫تاوان‬ ‫می‬ ‫دسته‬ ‫این‬ ‫مزایای‬ ‫از‬ ‫توسا‬ ‫قابلیات‬ ‫و‬ ‫سازی‬ ‫پیاده‬ ،‫اطالعات‬ ‫خواندن‬ ‫و‬ ‫کردن‬‫عه‬ ‫کرد‬ ‫اشاره‬ ‫آسان‬ ‫پذیری‬. •‫نمونه‬ ‫چند‬: Aerospike , Redis , LevelDB , … ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 61. ‫ستونی‬ ‫داده‬ ‫پایگاه‬ •‫کلید‬ ‫توسعه‬ ‫با‬ ‫ستونی‬ ‫داده‬ ‫های‬ ‫پایگاه‬-‫ب‬ ‫مقادارها‬‫وجاود‬ ‫اند‬ ‫آمده‬.‫ک‬ ‫جفت‬ ‫یک‬ ‫بجای‬ ‫واقع‬ ‫در‬ ‫ها‬ ‫سیستم‬ ‫این‬‫لیاد‬- ‫کلیا‬ ‫جفات‬ ‫چنادین‬ ‫رکاورد‬ ‫هر‬ ‫برای‬ ‫توانند‬ ‫می‬ ،‫مقدار‬‫د‬- ‫باشند‬ ‫داشته‬ ‫مقدار‬.‫نا‬ ‫ساختار‬ ‫به‬ ‫نیازی‬ ‫نوع‬ ‫این‬ ‫در‬‫و‬ ‫داریم‬ ‫م‬ ‫صفات‬ ‫تعداد‬ ‫با‬ ‫ستون‬ ‫چندین‬ ‫تواند‬ ‫می‬ ‫رکورد‬ ‫هر‬‫تفاوت‬ ‫باشند‬ ‫داشته‬. •‫وسا‬ ‫میزان‬ ‫سازی‬ ‫ذخیره‬ ‫تواند‬ ‫می‬ ‫دسته‬ ‫این‬ ‫مزایای‬ ‫از‬‫یع‬ ‫باشد‬ ‫بسیار‬ ‫مقادیر‬ ‫با‬ ‫رکوردها‬ ‫از‬ ‫متفاوتی‬ ‫و‬. •‫نمونه‬ ‫چند‬: Hadoop/Hbase , Cassandra , Amazon SimpleDB , … ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 62. ‫سندگرا‬ ‫داده‬ ‫پایگاه‬ •‫این‬‫یع‬ ‫اول‬ ‫دساته‬ ‫مانناد‬ ‫نیاز‬ ‫ها‬ ‫داده‬ ‫پایگاه‬ ‫از‬ ‫دسته‬‫نای‬ ‫کلید‬-‫با‬ ‫ولای‬ ‫باشاند‬ ‫می‬ ‫ستونی‬ ‫دوم‬ ‫دسته‬ ‫و‬ ‫مقدار‬‫ایان‬ ‫ا‬ ‫م‬ ‫های‬ ‫داده‬ ‫بندی‬ ‫دسته‬ ‫سیستم‬ ‫این‬ ‫در‬ ‫که‬ ‫تفاوت‬‫با‬ ‫رتبط‬ ‫باشند‬ ‫می‬ ‫سند‬ ‫فایل‬ ‫یک‬ ‫قالب‬ ‫در‬ ‫یکدیگر‬.‫مات‬ ‫از‬‫سااده‬ ‫ن‬ ‫و‬ ‫عکس‬ ‫یا‬ ‫ایمیل‬ ‫یک‬ ‫تا‬ ‫گرفته‬...‫ب‬ ‫مای‬ ‫سند‬ ‫یک‬‫اشاند‬. ‫پایگا‬ ‫نوع‬ ‫این‬ ‫که‬ ‫باالیی‬ ‫بسیار‬ ‫قدرت‬ ‫وجود‬ ‫با‬ ‫اما‬‫هاای‬ ‫اه‬ ‫گی‬ ‫وقت‬ ‫بسیار‬ ‫آنها‬ ‫در‬ ‫نوشتن‬ ‫و‬ ‫خواندن‬ ،‫دارند‬ ‫داده‬‫است‬ ‫ر‬. •‫از‬‫د‬ ‫زیادی‬ ‫مقدار‬ ‫ذخیره‬ ‫به‬ ‫توان‬ ‫می‬ ‫دسته‬ ‫این‬ ‫مزایای‬‫اده‬ ‫برد‬ ‫نام‬ ‫ربط‬ ‫بی‬ ‫های‬. •‫نمونه‬ ‫چند‬: MongoDB , Elastic Search , CouchDB , RavenDB , … ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 63. ‫گراف‬ ‫داده‬ ‫پایگاه‬ •‫این‬‫باه‬ ‫نسابت‬ ‫متفاوتی‬ ‫کامال‬ ‫دید‬ ‫از‬ ،‫ها‬ ‫داده‬ ‫به‬ ‫دسته‬‫دساته‬ ‫کند‬ ‫می‬ ‫نگاه‬ ‫قبلی‬ ‫های‬.‫ها‬ ‫باه‬ ‫گاراف‬ ‫یک‬ ‫مانند‬ ‫را‬ ‫ها‬ ‫داده‬‫م‬ ‫ها‬ ‫داده‬ ‫باه‬ ‫را‬ ‫گاراف‬ ‫یا‬ ‫درخت‬ ‫یک‬ ‫ساختار‬ ‫و‬ ،‫کند‬ ‫می‬ ‫مرتبط‬‫ا‬ ‫دهد‬ ‫می‬.‫در‬ ‫شادن‬ ‫در‬ ‫هنگاام‬ ‫رکوردهاا‬ ،‫داده‬ ‫پایگاه‬ ‫این‬ ‫در‬ ‫می‬ ‫مرتبط‬ ‫هم‬ ‫به‬ ‫صفت‬ ‫چند‬ ‫یا‬ ‫یک‬ ‫توسط‬ ‫دیتابیس‬‫و‬ ‫شاوند‬ ‫ریاضی‬ ‫عملیات‬ ‫انجام‬ ‫اینکه‬‫دساته‬ ‫از‬ ‫تار‬ ‫سااده‬ ‫بسایار‬‫هاای‬ ‫است‬ ‫دیگر‬.‫ارتباطات‬ ‫که‬ ‫زمانی‬ ‫برای‬ ‫دسته‬ ‫این‬ ‫کاربرد‬‫و‬ ‫معین‬ ‫باشاد‬ ‫مای‬ ،‫دارد‬ ‫وجود‬ ‫رکوردها‬ ‫میان‬ ‫مشخصی‬.‫شابک‬ ‫مانناد‬‫ه‬ ‫اجتماعی‬ ‫های‬ •‫تح‬ ‫برای‬ ‫بودن‬ ‫مناسب‬ ‫به‬ ‫توان‬ ‫می‬ ‫دسته‬ ‫این‬ ‫مزایای‬ ‫از‬‫قیقاات‬ ‫کرد‬ ‫اشاره‬ ‫فنی‬ ‫و‬ ‫علمی‬. •‫نمونه‬ ‫چند‬: •Neo4J , Sparksee , InfoGrid,AllegroGraph , … ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 64. ‫نظریه‬‫کپ‬ •‫راهنمای‬‫انتخاب‬‫پایگاده‬‫داده‬‫مناسب‬‫با‬‫نیازهای‬‫نرم‬‫افزار‬ ‫می‬،‫باشد‬‫نظریه‬CAP‫است‬. •Availability‫به‬‫کااربران‬ ‫کاه‬ ‫باشاد‬ ‫مای‬ ‫معنی‬ ‫این‬ ‫داشات‬ ‫را‬ ‫خوانادن‬ ‫و‬ ‫کاردن‬ ‫در‬ ‫عملیاات‬ ‫بتوانند‬ ‫همیشه‬‫ه‬ ‫ساروردیگر‬ ‫یاک‬ ‫یاا‬ ‫و‬ ‫اصلی‬ ‫سرور‬ ‫اگر‬ ‫یعنی‬ ‫باشند‬‫دچاار‬ ‫اان‬‫ا‬‫همچن‬ ‫و‬ ‫اود‬‫ا‬‫نش‬ ‫اع‬‫ا‬‫قط‬ ‫ااربران‬‫ا‬‫ک‬ ‫ااط‬‫ا‬‫ارتب‬ ‫اد‬‫ا‬‫ش‬ ‫اکل‬‫ا‬‫مش‬ ‫باشند‬ ‫داشته‬ ‫دسترسی‬. •Consistency‫کاه‬ ‫هایی‬ ‫داده‬ ‫باشد‬ ‫می‬ ‫معنا‬ ‫این‬ ‫به‬ ‫آنها‬ ‫تماام‬ ‫برای‬ ‫جا‬ ‫هر‬ ‫از‬ ‫کنند‬ ‫می‬ ‫مشاهده‬ ‫کاربران‬ ‫تمام‬‫ا‬ ‫نس‬ ‫کاربری‬ ‫هیچ‬ ‫و‬ ‫شود‬ ‫داده‬ ‫نمایش‬ ‫یکسان‬ ‫های‬ ‫داده‬‫بت‬ ‫نب‬ ‫اشاتباهی‬ ‫یا‬ ‫بیشتر‬ ،‫کمتر‬ ‫های‬ ‫داده‬ ‫دیگری‬ ‫به‬‫کاه‬ ‫یناد‬ ‫هم‬ ‫اطالعات‬ ‫که‬ ‫کند‬ ‫می‬ ‫تضمین‬ ‫داده‬ ‫پایگاه‬ ‫یعنی‬‫و‬ ‫یشاه‬ ‫باشد‬ ‫می‬ ‫یکسان‬ ‫جا‬ ‫همه‬. •Partition-telorance‫کاه‬ ‫باشاد‬ ‫می‬ ‫معنا‬ ‫این‬ ‫به‬ ‫با‬ ‫جغرافیاایی‬ ‫مختلف‬ ‫های‬ ‫مکان‬ ‫در‬ ‫مختلف‬ ‫های‬ ‫سرور‬‫ه‬ ‫یکپارچ‬ ‫طور‬ ‫به‬ ‫سیستم‬ ‫که‬ ‫میشوند‬ ‫توزیع‬ ‫طوری‬‫هماه‬ ‫با‬ ‫ه‬ ‫کند‬ ‫می‬ ‫کار‬ ‫و‬ ‫باشد‬ ‫می‬ ‫ارتباط‬ ‫در‬ ‫نودها‬. • ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 65. ‫ابزار‬-‫ها‬ ‫تکنی‬-‫های‬ ‫الگوریتم‬‫کاوی‬ ‫داده‬ •RapidMiner •SPSS Modeler •Oracle Data Mining •Knime •SAS •Teradata •Machine Learning •Neural Networks •Decision Trees •Natural Language Processing ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 66. ‫تحلیل‬ ‫نوع‬‫عظیم‬‫داده‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 67. ‫ها‬ ‫داده‬ ‫تحلیل‬ ‫تجزیه‬ ‫ابزارهای‬ •Kafka •ScalaLab •ElasticResearch •BigML ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 68. ‫ها‬ ‫داده‬ ‫سازی‬ ‫بصری‬ ‫ابزارهای‬ •Tableau •Silk •ChaCartoDB •rtio •Beaker •Rodeo ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 69. ‫ابزار‬ ‫ماتریس‬-‫صنایع‬ Cloudera Quantum Informatica Alteryx RapidMiner SPSS Modeler Kafka ElasticResearch Tableau Silk ‫فناوری‬ ‫مالی‬ ‫پژوهش‬ ‫سالمت‬ ‫بیزینس‬ ‫سبک‬ ‫زندگی‬ ‫حمل‬ ‫نقل‬ ‫و‬ ‫بیمه‬ ‫آموزش‬ ‫انرژی‬ ‫جغرافیا‬ ‫امالک‬ ‫غذا‬ ‫رسانه‬ ‫فضا‬ ‫هوا‬ ‫گردشگری‬ ‫ورزش‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 70. Management & Monitoring (Ambari) Coordinat ion (ZooKeep er) Workflow & Schedulin g (Oozie) Scripting (Pig) Machine Learning (Mahout) Query (Hive) NoSQL Database (HBase) Data Integratio n(Sqoop/ REST/OD BC) Distributed Processing (Mapreduce) Distributed Storage (HDFS) ‫هدوپ‬ ‫اکوسیستم‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 71. ‫اسپارک‬ ‫اکوسیستم‬ ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 72. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 73. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 74. ‫متدولوژی‬ ‫روش‬‫انتخاب‬ ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫فرآیند‬‫ها‬(‫ابزار‬) ‫سواالت‬ ‫اساس‬ ‫بر‬‫ها‬ ‫شاخص‬ ‫و‬ ‫کار‬ ‫و‬ ‫کسب‬ ‫ها‬ ‫دیتاست‬ ‫و‬ ‫داده‬ ‫منابع‬ 0 ‫داده‬ ‫نوع‬ ‫اساس‬ ‫بر‬‫پردازشی‬ ‫موتور‬ ‫های‬ ‫ویژگی‬ ‫و‬ ‫ذخیره‬‫داده‬ ‫عظیم‬ ‫پردازش‬ ‫و‬ ‫سازی‬ 1 ‫کپ‬ ‫نظریه‬ ‫اساس‬ ‫بر‬ ‫عظیم‬ ‫مدیریت‬‫داده‬ 2 ‫و‬ ‫تحلیل‬ ‫نوع‬ ‫و‬ ‫آماری‬ ‫و‬ ‫ریاضی‬ ‫های‬ ‫مدل‬ ‫اساس‬ ‫بر‬ ‫کار‬ ‫و‬ ‫کسب‬ ‫سواالت‬ ‫کاوی‬ ‫داده‬ 3 ‫اساس‬ ‫بر‬‫صنعت‬ ‫حوزه‬ ‫و‬ ‫قبل‬ ‫مرحله‬ ‫الگوهای‬ ‫داده‬ ‫عظیم‬ ‫تحلیل‬ ‫تجزیه‬ 4 ‫تجزیه‬ ‫اساس‬ ‫بر‬‫صنعت‬ ‫حوزه‬ ‫و‬ ‫ها‬ ‫تحلیل‬ ‫سازی‬ ‫بصری‬ 5 ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬
  • 75. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬  The world is looking for big data scientists, and there just aren't enough to go around. (Gurjeet Singh) Chairman of the Board of Directors, Ayasdi  I keep saying that the hot job in the next 10 years will be statisticians, and I’m not kidding. (Hal Varian) Chief Economist at Google ‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬
  • 76. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬ ‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬
  • 77. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬ ‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬ ‫سخت‬ ‫های‬ ‫مهارت‬ ‫مهارت‬‫نرم‬ ‫های‬ ‫آشنایی‬‫داده‬ ‫پایگاه‬ ‫با‬ ‫رهبری‬ ‫کاوی‬ ‫داده‬ ‫تیمی‬ ‫کار‬ ‫مهارت‬‫آماری‬ ‫های‬ ‫یادگیری‬ ‫تصمیم‬ ‫مدلسازی‬ ‫مثبت‬ ‫نگرش‬ ‫تحلیل‬‫ریسک‬ ‫ارتباطی‬ ‫های‬ ‫مهارت‬ ‫سازی‬ ‫بصری‬ ‫شخصی‬ ‫بین‬ ‫های‬ ‫مهارت‬ ‫بهینه‬‫سازی‬ ‫شکیبایی‬ ‫متغیره‬ ‫چند‬ ‫گیری‬ ‫تصمیم‬ ‫شوق‬ ‫و‬ ‫شور‬ ‫نویسی‬ ‫برنامه‬ ‫با‬ ‫داده‬ ‫دادن‬ ‫ارتباط‬‫کار‬ ‫و‬ ‫کسب‬ ‫اهداف‬ ‫انتقادی‬ ‫تفکر‬ ‫ارتباط‬ ‫برقراری‬‫تک‬ ‫اطالعات‬ ‫بین‬ ‫موثر‬‫نیکی‬ ‫تکنیکی‬ ‫غیر‬ ‫مخاطب‬ ‫و‬ ‫خالقیت‬ ‫درونی‬ ‫حس‬(‫شهود‬) ‫تیزبینی‬ ‫کنجکاوی‬ ‫تقسیم‬‫بندی‬‫مهارت‬‫ها‬‫به‬‫دو‬‫د‬‫سته‬ ‫نرم‬‫و‬‫سخت‬
  • 78. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬ ‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬ ‫تقسیم‬‫بندی‬‫مهارت‬‫ها‬‫به‬‫دو‬‫د‬‫سته‬ ‫نرم‬‫و‬‫سخت‬‫و‬‫ارتباط‬‫آن‬‫ها‬‫با‬ ‫نیمکره‬‫های‬‫مغز‬
  • 79. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬ ،‫داده‬ ‫عظیم‬ ‫تحلیلگران‬ ‫پایه‬ ‫حقوق‬ ‫میانگین‬117‫ارقام‬ ‫بین‬ ‫ما‬ ‫عدد‬ ‫این‬ ‫که‬ ‫است‬ ‫سال‬ ‫در‬ ‫دالر‬ ‫هزار‬89‫الی‬242‫باشد‬‫می‬ ‫دالر‬ ‫هزار‬ ‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬
  • 80. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬ ‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬ ‫ت‬ ‫به‬ ،‫داده‬ ‫عظیم‬ ‫تحلیلگران‬ ‫ساالنه‬ ‫حقوق‬ ‫میانگین‬‫ها‬ ‫مهارت‬ ‫فکیک‬
  • 81. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬ ‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬ ‫تحلیلگری‬ ‫با‬ ‫رابطه‬ ‫در‬ ‫موجود‬ ‫ارقام‬ ‫و‬ ‫آمار‬ ‫به‬ ‫کلی‬ ‫نگاهی‬‫داده‬ ‫عظیم‬
  • 82. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬ ‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬ ‫میزان‬‫رشد‬‫تقاضا‬‫برای‬ ‫استخدام‬‫تحلیلگران‬‫عظیم‬ ،‫داده‬‫به‬‫تفکیک‬‫مهار‬‫ت‬‫ها‬
  • 83. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬ ‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬ ‫باالترین‬‫مهارتهای‬‫مورد‬‫نیاز‬‫در‬‫تحلیلگری‬‫عظی‬‫م‬‫داده‬
  • 84. ‫ک‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫گری‬‫تحلیل‬ ‫گروه‬‫ار‬ Coursera – Data-Driven Decision Making EdX – Data Science Essentials Udacity – Intro to Machine Learning IBM – Data Science Fundamentals California Institute of Technology – Learning from Data Dataquest – Become a Data Scientist KDNuggets – Data Mining Course ‫عظی‬ ‫های‬‫تحلیل‬ ‫با‬ ‫مرتبط‬ ‫انسانی‬ ‫های‬‫مهارت‬‫داده‬‫م‬ ‫معرفی‬‫برخی‬‫منابع‬‫آنالین‬‫آموزش‬‫مهارت‬‫های‬‫تحلیلگری‬‫عظ‬‫یم‬‫داده‬
  • 85. ‫کار‬ ‫و‬ ‫کسب‬ ‫و‬ ‫داده‬‫عظیم‬ ‫تحلیلگری‬ ‫گروه‬ ‫شما‬ ‫توجه‬ ‫از‬ ‫سپاس‬ @BigData_BusinessAnalytics

Editor's Notes

  1. عظیم داده در اصل به عنوان یک اصطلاح برای توصیف مجموعه داده هایی عظیم بکار می رفت که نمی توان آنها را با استفاده از پایگاههای داده سنتی ثبت، ذخیره، مدیریت و تجزیه و تحلیل کرد عظیم داده مرز توانایی یک شرکت درذخیره سازی، پردازش و دسترسی (SPA) به تمام داده اطلاعاتی با حجم، سرعت و تنوع بسیار زیاد عظیم داده، داده هایی بیش از ظرفیت پردازش سیستم های پایگاه داده معمولی
  2. متصدیان این رقابتها با استفاده از عظیم داده و تحلیل احساسات و تحلیلهای پیشبینانه روندهای موجود را شناسایی کرده و به مخاظبین منتقل می کنند
  3. اکثر سازمانها وقت و انرژی کافی برای درک خواسته مشتریان خود صرف نمی کنند. یعنی درک اهداف و نتایجی که مشتریان در حال کسب آنها هستند. چالش اصلی این است که چگونه سازمان شما از بینش مشتری استفاده می کند تا تمام نقاط تعامل مشتری که شامل چرخه زندگی مشتری می شود را بهبود بخشد
  4. تحلیگران و محققان توسعه فناوری، از زمان وقوع اولین انقلاب صنعتی در میانه­های قرن هجدهم تا امروز، توسعه خطوط راه آهن و بکارگیری ماشین بخار، گسترش و توسعه صنعت فولاد، استخراج نفت و توسعه صنایع وابسته و صنعت میکروالکترونیک و ارتباطات و فناوری اطلاعات را امواج بلند فناورانه می­دانند که هریک در طول مدت 50 الی 60 سال تاثیرات کلیدی بر تمامی تحولات صنعتی، اقتصادی و اجتماعی بشر داشته­اند. صنعت ارتباطات و فناوری اطلاعات از اواخر دهه 70 میلادی رشد سریع خود را آغاز کرده و پیش­بینی می­شود تا سال 2025 به این رشد ادامه دهد و از آن پس با اشباع نسبی در رشد، جای خود را به فناوری­های زیستی و همگرا به عنوان موج بلند فناورانه بعدی بدهند. اما صنعت ارتباطات، خود را به عنوان پارادایم غالب توسعه فناوری و خدمات در دهه­های اخیر، چند نقطه عطف را در مسیر حرکت و تکامل خود شاهد بوده است: ابداع و توسعه تلفن همراه، اینترنت، شبکه­های اجتماعی و خدمات مبتنی بر گوشی­های هوشمند. اکنون اینترنت اشیا به عنوان پنجمین موج در این صنعت مطرح است؛ موجی که برخی از کارشناسان و محققین فناوری آن را با اتصال همه چیز به شبکه­ها (اینترنت)، آخرین نقطه تکامل در پارادایم صنعت ارتباطات می­دانند که تا سال 2025 به اوج خود خواهد رسید و حلقه آخر از تکامل صنعت ارتباطات را به تمام شئون زندگی بشر متصل خواهد نمود Internet of Things (IoT)
  5. یده اتصال زنجیره­ای دستگاه­ها و اشیا در سطح جهانی با ظهور فناوری RFID مطرح شد. اینترنت اشیا به معنی برقراری ارتباط داخلی میان اعضای شبکه­های کوچک مختلف است، اما به دلیل عدم سازگاری، این شبکه­ها امکان ارتباط با یکدیگر را ندارند. لذا ایجاد یک استاندارد و پروتکل واحد برای برقراری سازگاری این ارتباطات، موجب شکل­گیری یک شبکه واحد جهانی به نام اینترنت اشیا خواهد شد. به مجموعه استانداردها، پروتکل­ها، دستگاه­ها و فناوری­های لازم برای برقراری ارتباط و انتقال اطلاعات بین دستگاه­های هوشمند (با یکدیگر و با انسان) در سطح جهانی اینترنت اشیا گفته می­شود. اینترنت یک شبکه­ گسترده جهانی است که کامپیوترها را بر پایه استانداردهای ارتباطی همچون TCP-IP به یکدیگر متصل کرده است، و شی (هوشمند) در این فناوری به صورت یک نهاد مجازی، دیجیتالی یا فیزیکی (هوشمند) تعریف می­شود که به طور منحصر به فرد قابل شناسایی است. اینترنت اشیا مفهومی است که در آن اشیا هوشمند با حسگرها، محرک­ها، میکروپروسسورهای کوچک، واسط­های ارتباطی و منابع انرژی مجهز شده­اند و قابلیت انجام پردازش­های متعدد و برقراری ارتباط با یکدیگر را دارند. بنابراین فناوری IoT روش­های ارتباطی مختلف (مانندRFID,Zigbee,Wi-Fi,3G/4G/5G)، دستگاه­های فشرده و حسگرها را با یکدیگر را ترکیب می­کند. هدف اصلی طراحی این شبکه، به اشتراک گذاردن اطلاعات موجود در هر شی میان سایر اشیا مرتبط با آن، در هر زمان و در هر مکان مورد نیاز است. برای اطمینان از اینکه داده­ها در هر زمان و مکان در دسترس باشند، به پردازش مقدار بسیار زیادی داده جمع آوری شده در کاربردهایی مثل نظارت محیط، پیش بینی هوا، حمل و نقل، تجارت، سلامت و بهداشت، کاربردهای نظامی، و موارد دیگر نیاز است. بنابراین استفاده از یک هسته پردازشی قدرتمند مثل ابر در کنار IoT به وضوح مشخص است و ترکیب شبکه­های حسگر بی سیم با رایانش ابری، اشتراک­گذاری و تحلیل آنی اطلاعات حسگرها را ممکن می­سازد. همچنین مساله ذخیره­سازی نیز ممکن است توسط روش­های کم هزینه رایانش ابری پاسخ داده شود که برای ایجاد امنیت و دسترسی آسان به اطلاعات، به صورت گسترده در محیط های توزیع شده و موبایل استفاده می­شود. Radio-Frequency IDentification
  6. گزارش ها نشان می دهد که انتظار می رود تعداد دستگاه های متصل به اینترنت در سال 2016از 22.9 میلیارد دلار به 50 میلیارد تا سال 2020 افزایش یابد (شکل 5). IoT تنها برمانیتورینگ رویدادهای گسسته تمرکز نمی کنند، بلکه بر استخراج اطلاعات جمع آوری شده توسط اشیاء نیز تمرکز می کنند. اکثر ابزار جمع آوری داده ها در محیط IoT دستگاه هایی هستند که دارای سنسور هستند و نیاز به پروتکل های سفارشی ، مانند پیام تله متری MQTT) )و سرویس توزیع داده (DDS) دارند. با توجه به این که این سنسورها تقریبا در تمام صنایع استفاده می شود، انتظار می رود IoT مقدار زیادی اطلاعات را تولید کند.
  7.   وقتی همه چیز به همه چیز متصل میشود، ماده بی جان هم صاحب ذهن می شود. ما داریم به سمت دنیایی میریم که همه چیز صاحب جان است و به نوعی شخصیت و اکاهی دارند و زنده اند.انتهای قضیه این است که تکنولوزی تضمین می کند که تفاوت بین انسان و جهان محو خواهد شد. پیشرفت های تکنولوژیکی و همگرایی سریع ارتباطات بی سیم، الکترونیک دیجیتال و سیستم های میکرو الکترومکانیکی (MEMS) منجر به ظهور اینترنت اشیاء شده است. طبق گزارش سیسکو، تعداد اشیاء متصل به اینترنت بیشتر از تعداد انسانها در جهان است.
  8. گسترش فناوری اطلاعات داده های بزرگ یا BIG DATA  Big Data به معنای دراختیار داشتن اطلاعات بسیار زیاد برای انجام کارهای مختلف می باشد. ده سال پیش، تولید‌کنندگان به این نتیجه رسیدند که می‌توانند و باید داده‌های تولیدی را نگهداری و ذخیره کنند، سپس، شروع به اضافه کردن سریع فضای ذخیره‌سازی با نرخ هشدار دهنده ای برای این داده های حجیم نمودند.
  9. الزامات بیگ دیتا و انالیتیک در IoT در طول سال ها افزایش یافته است و بهبود چشمگیری را در فرایندهای تصمیم گیری وعده داده است. در نتیجه، تغییر نحوه جمع آوری داده ها، ذخیره سازی و تجزیه و تحلیل آنها تغییر می کند. بیگ دیتا و انالیتیک دارای پتانسیل بالایی برای استخراج اطلاعات معنی دار از داده های تولید شده توسط سنسورهاست. الزامات کلی برای بیگ دیتا و IoT ویژگی های عملکردی و غیر عملکردی را برای تحلیل داده ها تعریف می کنند. الزامات کلیدی برای داده ها و تجزیه و تحلیل بیگ دیتا در محیط IoT در ادامه ارائه می شود که در بهبود خدمات IoT از طریق تجزیه و تحلیل نقش مهمی ایفا می کند.7.1 اتصالپارادایم IoT به تدریج منجر به اتصال هوشمند سنسور در یک محیط هوشمند می شود. یکی از الزامات کلیدی IoT، فراهم آوردن یک اتصال قابل اعتماد برای تجزیه و تحلیل بیگ دیتا جهت تسهیل ترکیب و ادغام حجم زیادی از داده های تولید شده از سنسور است. بنابراین، اشیاء متعدد در اطراف ما پتانسیل زیادی برای اتصال به زیرساخت های محاسباتی با کارایی بالا برای ارتقاء خدمات IoT دارند. علاوه بر این، با حضور فزاینده Wi-Fi و 4G-LTE دسترسی بی سیم به اینترنت، تکامل به سوی اطلاعات و شبکه های ارتباطی در حال حاضر مشهود است . با این حال، قبل از تعبیه هوش در محیط ما، یک ارتباط بدون درز بین اشیاء مختلف در شهرهای هوشمند مانند IoT، محاسبات ابری، بیگ دیتا و انالیتیک باید ایجاد شود.     7.2 ذخیره سازی رشد سریع و مداوم تعداد زیادی از اشیاء فعال شده IoT موجب ذخیره سازی مقدار گسترده ای از اطلاعات ناهمگن در یک زمان واقعی می شود. الزامات کلیدی ذخیره سازی بیگ دیتا در IoT عبارتند از جمع آوری داده های بدون ساختار بسیار زیاد و ارائه تاخیر کم برای تجزیه و تحلیل. علاوه بر این، استفاده از تکنولوژی های داده های بزرگ برای IoT می تواند ذخیره سازی و پردازش اطلاعات کارآمد را برای تولید اطلاعاتی که می تواند سرویس های مختلف شهر هوشمند را ارتقا دهد، فراهم می کند. طیف منابع داده IoT شامل داده های سنسور، تلفن های هوشمند و رسانه های اجتماعی است که از طریق روش های مختلف مدل سازی می شوند و از پروتکل ها و رابط های مختلف ارتباطی استفاده می کنند. اکثر خدمات IoT مبتنی بر پروتکل های ارتباطی M2M هستند که نیاز به مدیریت تعداد زیادی از جریان ها دارند و مستقیما از ظرفیت ذخیره سازی گسترده توزیع زیرساخت های محاسبات ابر استفاده می کنند [46].  3/7 کیفیت خدمات مدیریت منابع سنسورهای IoT و دستگاه های تلفن همراه، الزام اولیه برای کیفیت خدمات (QoS) است تا بتواند مقدار زیادی اطلاعات را تجزیه و تحلیل کند. اگر چه بسیاری از مطالعات به دنبال تطابق با الزام QoS بوده اند، چگونه معماری QoS را به IoT متحد ساخت و ادغام کرد تا از داده های بزرگ و تجزیه و تحلیل پشتیبانی کند. [47]. QoS ارائه شده توسط یک شبکه IoT باید قابل اعتماد باشد و باید انتقال داده های تلفن همراه و کارآمد از آن منابع را که داده های بزرگ تولید می شود، تضمین کند. پشتیبانی QoS در این شبکه برای داده ها و تحلیل های بزرگ بسیار مهم است. با این حال، برای ایجاد یک شبکه قابل اعتماد، بسیاری از فن آوری های شبکه های در حال ظهور باید به IoT معرفی شوند تا انتقال رویداد در زمان واقعی را بهبود بخشد و قابلیت های بزرگ پردازش داده را بهبود بخشد.   7.4 تجزیه و تحلیل بهنگام یکی از مهمترین ویژگی های IOT این است که اطلاعات مربوط به "چیزهای متصل" را بهنگام (real time)یا نزدیک به زمان واقعی ارائه میدهد.   7.5. بنچمارک داده های بزرگ و تحلیلی توجه زیادی را از دانشگاهیان و سازمان های مختلف را به خود جلب کرده است و بسیاری از سازمان ها نیز به دنبال کسب و کارهای IOT هستند. با این حال، این سازمان ها در ذخیره و تجزیه و تحلیل مقادیر وسیعی از داده ها که از طریق سنسورها در محیط IoT جمع آوری می شوند، با چالش هایی مواجه هستند. حل این مشکلات نیاز به یک درک عمیق دارد که می تواند با استفاده از بیگ دیتا و پلت فرم تجزیه و تحلیل به دست آید. بنچمارک در این زمینه نقش مهمی را ایفا می کند و سازمان ها را قادر می سازد راه حل هایی را برای قضاوت در مورد کیفیت بیگ دیتا و راه حل های آنالیتیک ارزیابی کنند. همچنین بنچمارک می تواند مقایسه ساده و مستقیمی از راه حل های مختلف را ارائه دهد.
  10.   8. طبقه بندی راه حلهای بیگ دیتا و انالیتیک برای سیستم های IoT.شکل 9، طبقه بندی موضوعی از راه حل های بیگ دیتا و انالیتیک است که برای سیستم های IoT طراحی شده است. این راه حل ها بر اساس ویژگی های زیر دسته بندی می شوند: الف) منابع بیگ دیتا؛ ب) اجزای سیستم؛ ج) تکنولوژی های امکان پذیر بیگ دیتا؛ د) ویژگی های عملکردی؛ ه) نوع تجزیه و تحلیل.8.1 منابع بیگ دیتابیگ دیتا توسط یک زیرساختی ایجاد شده است که برای اجرای کاربردهای مختلف IoT از جمله مدیریت شهر، ساخت و ساز، سیستم های حمل و نقل هوشمند (ITS)، ساختمان هوشمند و سنسورهای مانیتورینگ مورد استفاده قرا میگیرد.مدیریت شهر با استفاده از دوربین های متحرک، سنسورها و ابزارها برای ایجاد امنیت و راحتی شهروندان شهری است. با این حال، این دستگاه ها حجم زیادی از داده ها را تولید می کنند که باید در زمان واقعی مدیریت و تحلیل شوند تا بینش های مربوطه را بدست آورند. به طور مشابه، صنعت تولیدی دستگاه های IoT را مستقر کرده است که به طور مداوم مقدار زیادی اطلاعات را برای به حداکثر رساندن بهره وری و کارایی عملیات خود تولید می کند.برای به دست آوردن بینش از این داده ها، راه حل های بیگ دیتا و انالیتیک در طراحی و آزمایش محصولات جدید، بهینه سازی خدمات و بازاریابی، به حداقل رساندن نقص ها و بهبود عملکرد استفاده شده است. بیگ دیتا در محیط IoT معمولا برای جمع آوری و ذخیره داده ی سنسورهای مانیتورینگ،انالیز داده ها ، پیش بینی ها و دادن هشدار در صورت تشخیص انحرافات غیر طبیعی استفاده می شود. 8.2 اجزای سیستمراه حل های بیگ دیتا و انالیتیک معمولا شامل پنج جزء : یعنی کسب ، ذخیره ، انتقال ، پردازش و نفوذ داده ها است.کسب داده شامل جمع آوری و فیلتر کردن داده ها قبل از انتقال آنها به انبار داده است. این جزء معمولا توسط چهار ویژگی، یعنی حجم، تنوع، سرعت و ارزش مدیریت می شود. ذخیره بیگ دیتا با سیاست های موجود در ارتباط است. سیاست های نگهداری داده های مختلف شامل حفظ حریم خصوصی و نگرانی های قانونی برای شناسایی قوانین بایگانی، زمان نگهداری، فرمت های داده ها و روش های رمزنگاری است. داده های بزرگ باید به سراسر دیتاسایتهای مختلف منتقل شود تا توازن بار، تداوم کسب و کار و ...را تضمین کند.بیگ دیتا یک اصطلاح است که برای مجموعه داده های بزرگ و پیچیده استفاده می شود که نمی توان با نرم افزار سنتی انها را پردازش کرد. چالش های اصلی مربوط به پردازش داده های بزرگ مربوط به گرفتن، ذخیره سازی، تجزیه و تحلیل، جستجو، به روز رسانی، تجسم و حفظ حریم خصوصی است. اهرم یا قدرت نفوذ بیگ دیتا شامل تضمین این است که چگونه یک کسب و کار می تواند از داده های خود بهره مند شود تا درآمد خود را افزایش دهد.8.3 فناوری های توانمند ساز بیگ دیتافناوری های فعال بیگ دیتا در زمینه IoT، مربوط به ارتباطات بی سیم، تحلیل بهنگام، یادگیری ماشین و عناصر ثبت داده مانند سنسورها و سیستم های جاسازی شده است.فن آوری های ارتباطی بی سیم وسیع فراگیر که برای حمل داده های بزرگ در IoT مورد استفاده قرار می گیرند شامل IEEE 802.15.4، IEEE 802.11، IEEE 802.15.1 و IEEE 802.16 هستند.تجزیه و تحلیل بهنگام ، بیگ دیتای تولید شده توسط دستگاه های IoT را به عنوان ورودی سیستم در نظر میگیرد . بر خلاف ابزار تحلیلی سنتی، یادگیری ماشین می تواند بینش های پنهان را از داده های بزرگ مورد استفاده قرار دهد و ارزش ها را از منابع داده های بزرگ با حداقل تعامل با انسان استخراج کند. یادگیری ماشین ها به دلیل منابع مختلف داده ها و مقدار زیادی داده و انواع اطلاعات مرتبط در متن IoT مناسب است.بیگ دیتا در IoT با استفاده از چند سنسور و محرک جمع آوری می شود. این تکنولوژی سنسور نقش کلیدی در پروسهی جمع آوری و انتقال داده ها به منابع لبه ی را دارند. 8.4 عناصر کلیدیراه حل های بیگ دیتا و انالیتیک برای IoT شامل چهار عنصر کلیدی یعنی ورودی، قوانین ، دستگاه های محاسبات لبه و خروجی داده ها است.داده های خام از منابع مختلف جمع آوری شده و به سیستم های تحلیلی لبه منتقل می شوند. این سیستم ها بر اساس قوانینی است که قوانین مربوط به داده های ورودی را تعریف و اعمال می کند تا بینش را بدست آورد. دستگاه محاسبات لبه یکی دیگر از بازیکنان کلیدی در عملکرد سیستم تجزیه و تحلیل است. پردازش داده هایی که توسط دستگاه های IoT بر روی دستگاه های لبه تولید می شود می تواند مزایای متعددی از قبیل تاخیر زمانی کم، مصرف پهنای باند حداقل، یکپارچگی داده ها، امنیت و هزینه کم را به ارمغان بیاورد. این اطلاعات نیز در زمان واقعی به مصرف کننده ارائه می شود. 8.5 نوع تجزیه و تحلیلتجزیه و تحلیل را می توان به سه نوع تقسیم کرد، تجزیه و تحلیل توصیفی، تجزیه و تحلیل پیش بینی و تجزیه و تحلیل تجویزی. تجزیه و تحلیل توصیفی : «چه چیزی اتفاق افتاده است و و چه جیزی دارد اتفاق می افتد» که کمک می کند تا فرصت های کسب و کار جدید و چالش های جدید را پیدا کنید. تجزیه و تحلیل پیش بینی:"چه چیزی اتفاقی می افتد و چرا اتفاق می افتد"، با استفاده از فن آوری های مختلف، مانند تکست / وب / داده کاوی، پیش بینی شرایط و وضعیت های آینده انجام میشوود. تجزیه و تحلیل تجویزی : "چه باید بکنم و چرا باید آن را انجام دهم،" از شبیه سازی، تخصص و سیستم های پشتیبانی تصمیم گیری برای بررسی گزینه های مختلف و ارائه پیشنهادات به تصمیم گیرندگان استفاده می کند.
  11. از داده های تولید شده از دستگاه های IoT می توان در پیدا کردن روند تحقیق بالقوه و بررسی تاثیر رویدادها یا تصمیمات خاص استفاده کرد. این داده ها با استفاده از ابزارهای تحلیلی مختلف پردازش می شوند. شکل 6 روند جمع آوری داده ها، نظارت و تحلیل داده ها را نشان می دهد. اگر چه IoT فرصتهای بی سابقه ای را جهت افزایش درآمد ، کاهش هزینه ها و بهبود راندمان ایجاد کرده است ، اما جمع آوری داده های بزرگ از اطلاعات به تنهایی کافی نیست. برای استفاده از مزایای IoT، شرکت ها باید پلتفرمی را ایجاد کنند که در آن بتوانند حجم وسیعی از داده ی سنسورها را در حالتی مقیاس پذیر و مقرون به صرفه جمع آوری، مدیریت و تجزیه و تحلیل کند . در این زمینه، دستیابی به یک پلت فرم بیگ دیتا که می تواند در مصرف و خواندن منابع متنوع و تسریع روند ادغام داده کمک کند، حیاتی است. ادغام داده و تجزیه و تحلیل ، سازمان ها را قادر می سازند تا روند کسب و کار خود را متحول کنند. به طور خاص، این شرکت ها می توانند از ابزار تجزیه و تحلیل داده ها برای تبدیل حجم زیادی از داده های جمع آوری شده از حسگرها به بینشی ارزشمند استفاده کنند.
  12. اقبال یا شکست یک سازمان در حوزه IOT، درگرو مدیریت تحلیل‌های بیگ دیتا است طرفداران IOT که در ارزیابی اهمیت بیگ دیتا ، گزینه “حیاتی” را انتخاب کرده‌اند تقریباً سه برابر و دسته‌ای که گزینه” بسیار مهم” را انتخاب کرده‌اند تقریباً دو برابر میانگین پاسخ‌دهندگان‌اند. نتایج حاصل از این تحقیق همچنین نشان می‌دهد که اینترنت اشیا، دلیل اصلی طرفداران IoT برای سرمایه‌گذاری و به‌کارگیری تحلیل‌ها و معماری بیگ دیتا است.
  13. روزگاری جورج اورول نوشت آن‌که گذشته را کنترل می‌کند، آینده را کنترل خواهد کرد. دنیای مدرن و فناوری ارتباطات نشان داده‌است که در دنیای کسب و کار "آن‌هایی که به داده‌ها و اطلاعات بیشتر و بهتری دسترسی دارند آینده را کنترل خواهند کرد"؛ داشتن اطلاعات در دنیای جدید حکم سقوط سیب در روزگار نیوتون را دارد! اطلاعات به‌روز و مفید آن‌گاه که در زمان مناسب در اختیار اهل فن قرار گیرد، منجر به تولید محصولات و خدماتی می‌شود که زندگی بشر را هر روز بیش از پیش آسان و آسوده می‌کند؛ آسان و آسوده، با همه‌ی پیچیدگی‌ها و مصائب جهان امروز.
  14. فیسبوک، آمازون و والمارت بالاترین حقوق رو می دهند. از حدود 167 هزارتا تا 140 هزارتا Python (66%), Data Analysis and R (both 53%) are the three most in-demand skills for Data Scientists today. Additional skill sets required include machine learning (50%), SQL (50%) and Data Mining (49%).