More Related Content
PDF
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران PDF
تشخیص انجمن در مقیاس کلان داده PDF
PDF
دادهکاوی و زبان برنامهنویسی R PPTX
داده های جریانی streaming data PDF
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز PPTX
06 hpc library_fundamentals_of_parallelism_and_code_optimization-www.astek.ir PPTX
Similar to Data streaming & kafka
PDF
PPTX
Data Mining V.S. Busieness Inteligence PDF
آموزش پایگاه داده ها - بخش یکم PDF
آموزش ساختمان داده ها - بخش هفتم PDF
متعادل کننده بار در پایگاه داده توزیع شده PPTX
PDF
داده های عظیم چگونه دنیا را تغییر خواهند داد PPT
PDF
Big Data and select suitable tools Data streaming & kafka
- 1.
- 2.
داده جریان یاData Streaming
با مرتبط عمل یا فعالیت هرجریانی های داده
جریانی های داده:
است زمان به وابسته اطالعات برای توصیفی
کرد ذخیره بعدی هایجو و پرس به پاسخ و پردازش برای را هاآن تواننمی و شوند پردازش لحظه در باید که هاییداده
- 3.
3ویژگیدر اصلیها دادهجریان
۱)عظیم و کالن حجم(ها داده عناصر بیشمار تعداد)
•الگوریتمVFDT
۲)به ها داده ورود باالی نرخسیستم
•های الگوریتمآنالین
•بلوک های الگوریتم
۳)آن پردازش زمان در ها داده ماهیت و نوع تغییرات باالی نرخها(رانش)
- 4.
- 5.
داده جریان استخراجهای الگوریتم
سریع خیلی الگوریتمk-Means
فاز تک الگوریتمC-means
الگوریتمDENStream
الگوریتمHPStream
- 6.
- 7.
و پرس نوعو معماریجوها(Queries)درهاداده جریان
مستقل جوهای و پرسStandalone
و پرسمختار خود جوهایad-hoc
- 8.
سیستمپیامرسانی
در اصلی چالشدو دیتاها زیاد حجم به توجه با کنیم می استفاده را دیتا از زیادی حجم از وقتی ما
رو پیشداریم:
نخست چالش:کنیم آوری جمع را دیتا از زیادی حجم چگونه؟
دوم چالش:آنالیز را شده آوری جمع دیتاهای چگونه؟ کنیم
رسانی پیام سیستم
- 11.
Apache Kafkaیکانتشار پیامارسال سیستم-اشتراکمی که ،قویست صف یک وب حجم توانداز االیی
دادهنقطه به نقطه یک از را ها پیام تا سازد می قادر را شما و باشد داشته اختیار در را هامنتق دیگر یکنید ل.
- 12.
به نیازApache Kafka
ApacheKafkaیکپلتفرمیکپارچهبرایپردازشکلیهاطالعاتدرلحظه
میباشد.Apache Kafkaازارسالپیامباتاخیرکمپشتیبانیمیکندودر
صورتبروزخرابی،دستگاهتلرانسخطاراتضمینمیکند.
کافکاتواناییادارهیتعدادزیادمصرفکنندگانمتنوعراداراستوبسیارسریع
،استبهطوریکهدرثانیه۲میلیونانتشاردیتاراانجاممیدهد.کافکاتمامداده
هارابررویدیسکمنتشرمی،کندکهدرواقعبهاینمعنیاستکههمهنوشتهها
بهحافظهنهانصفحهOS (RAM)منتقلمیشوند.اینامرانتقالاطالعاتاز
حافظهنهانصفحهبهسوکتشبکهرابسیارکارآمدمیکند.
- 13.
- 14.
- 15.