SlideShare a Scribd company logo
Apache Hadoop
‫إعداد‬
/
‫ابرآم‬
‫سمير‬ ‫عماد‬
‫المعلومات‬ ‫وتقنية‬ ‫والوثائق‬ ‫المكتبات‬ ‫بقسم‬ ‫عيد‬ُ‫م‬
‫اآلداب‬ ‫كلية‬
–
‫القاهرة‬ ‫جامعة‬
•
Apache Hadoop
‫المصدر‬ ‫مفتوح‬ ‫برمجيات‬ ‫إطار‬ ‫هو‬
،
‫البيانات‬ ‫لتخزين‬ ‫مصمم‬
‫الضخمة‬
‫ومعالجتها‬
‫اإلنترنت‬ ‫بشبكة‬ ‫المتصلة‬ ‫األجهزة‬ ‫من‬ ‫كبيرة‬ ‫مجموعة‬ ‫على‬
.
•
‫يتميز‬
Hadoop
‫البيانات‬ ‫مع‬ ‫التعامل‬ ‫على‬ ‫بقدرته‬
‫الضخمة‬
(
Big
Data
)
‫بسرعة‬
‫ا‬ ‫المعلومات‬ ‫واستخراج‬ ‫البيانات‬ ‫لتحليل‬ ‫عادة‬ ‫استخدامه‬ ‫ويتم‬ ،‫عالية‬ ‫وكفاءة‬
‫لقيمة‬
‫منها‬
.
•
‫يستخدم‬
Hadoop
‫مثل‬ ‫البرمجة‬ ‫لغات‬
Java
‫و‬
Python
،‫وغيرها‬
•
‫هم‬ ‫أساسية‬ ‫مكونات‬ ‫ثالث‬ ‫من‬ ‫ويتكون‬
:
1. (HDFS)
2. Map-Reduce
3. (YARN)
• Hadoop Distributed File System
•
‫األساسي‬ ‫النظام‬ ‫يعتبر‬
‫البيانات‬ ‫لتخزين‬
‫بنية‬ ‫في‬
Hadoop
.
•
‫ويتميز‬
HDFS
‫الب‬ ‫إلى‬ ‫يصل‬ ‫كبير‬ ‫بحجم‬ ‫الملفات‬ ‫تخزين‬ ‫يدعم‬ ‫بأنه‬
‫يتابايت‬
(
1000
‫تيرابايت‬
)
‫الشبكة‬ ‫في‬ ‫أجهزة‬ ‫دة‬ِ‫ع‬ ‫على‬ ‫بتوزيعها‬ ‫ويقوم‬
.
•
Java
‫لـ‬ ‫األصلية‬ ‫اللغة‬ ‫هي‬
HDFS
.
•
‫تسمى‬ ‫صغيرة‬ ‫قطع‬ ‫إلى‬ ‫الملفات‬ ‫بتقسيم‬ ‫يقوم‬
blocks
‫ويتم‬
‫نظام‬ ‫ويسمح‬ ،‫ا‬ً‫ق‬‫ساب‬ ‫ذكرنا‬ ‫كما‬ ‫أجهزة‬ ‫عدة‬ ‫على‬ ‫توزيعها‬
HDFS
‫التخزين‬ ‫سعة‬ ‫لزيادة‬ ‫الشبكة‬ ‫إلى‬ ‫أجهزة‬ ‫بإضافة‬
‫األداء‬ ‫وتحسين‬
.
•
‫يتميز‬
HDFS
‫والتح‬ ‫البيانات‬ ‫توفير‬ ‫على‬ ‫العالية‬ ‫بقدرته‬
‫مل‬
‫بالتخزين‬ ‫يقوم‬ ‫ألنه‬ ،‫لألخطاء‬
‫كرر‬ُ‫م‬‫ال‬
‫لكل‬
block
‫دة‬ِ‫ع‬ ‫على‬
‫الشبكة‬ ‫في‬ ‫أجهزة‬
.
•
‫يقوم‬
(HDFS)
‫بعمليتين‬
:
•
‫لـ‬ ‫واحدة‬
master node
(Name Node)
‫يتم‬ ‫حيث‬ ،
‫الـ‬ ‫تخزين‬
Meta data
.
•
‫لـ‬ ‫واألخرى‬
slave nodes
(
Data Nodes
)
‫يتم‬ ‫حيث‬ ،
‫الـ‬ ‫تخزين‬
Blocks
.
•
‫برمجة‬ ‫نظام‬
‫البيانات‬ ‫لمعالجة‬
‫الضخمة‬
(Big Data)
.
•
‫بيئ‬ ‫في‬ ‫ومعالجتها‬ ‫أجهزة‬ ‫عدة‬ ‫على‬ ‫المهام‬ ‫لتوزيع‬ ‫يستخدم‬
‫ة‬
‫موزعة‬
.
•
‫ويوزع‬ ‫صغيرة‬ ‫مهام‬ ‫إلى‬ ‫الكبيرة‬ ‫المهام‬ ‫بتجزئة‬ ‫يقوم‬ ‫حيث‬
‫ها‬
‫والتحليل‬ ‫المعالجة‬ ‫عملية‬ ‫لتسريع‬ ‫أجهزة‬ ‫دة‬ِ‫ع‬ ‫على‬
.
•
‫مرحلتين‬ ‫في‬ ‫البيانات‬ ‫بمعالجة‬ ‫هذا‬ ‫العمل‬ ‫إطار‬ ‫يقوم‬
:
1
.
Map Phase
‫مفاتي‬ ‫إلى‬ ‫وفصلها‬ ‫البيانات‬ ‫تحليل‬ ‫فيها‬ ‫يتم‬
‫وقيم‬ ‫ح‬
key-value
‫القيم‬ ‫هذه‬ ‫على‬ ‫مخصصة‬ ‫عمليات‬ ‫بإجراء‬ ‫يقوم‬ ‫ثم‬ ،
.
2
.
‫مرحلة‬ ‫إلى‬ ‫العمليات‬ ‫هذه‬ ‫نتائج‬ ‫إرسال‬ ‫يتم‬
Reduce Phase
‫لمزيد‬
‫والتحليل‬ ‫المعالجة‬ ‫من‬
.
• Yet Another Resource Negotiator
•
‫عن‬ ‫مسؤول‬ ‫نظام‬ ‫هو‬
‫الموارد‬ ‫إدارة‬
(CPU, memory, disk, network and so on)
،‫الخوادم‬ ‫من‬ ‫كبيرة‬ ‫مجموعة‬ ‫في‬ ‫المهام‬ ‫وجدولة‬
‫تم‬
‫إلى‬ ‫إضافته‬
Apache Hadoop
‫اإلصدار‬ ‫في‬
2.0
•
‫يتكون‬
YARN
‫رئيسيين‬ ‫مكونين‬ ‫من‬
:
.1
Resource-Manager
:
‫الموارد‬ ‫وجدولة‬ ‫بإدارة‬ ‫يقوم‬
‫تطبيقات‬ ‫لجميع‬
Hadoop
‫المتزامنة‬
.
.2
Node-Manager
:
‫على‬ ‫المتاحة‬ ‫الموارد‬ ‫بإدارة‬ ‫يقوم‬
‫قبل‬ ‫من‬ ‫المحددة‬ ‫المهام‬ ‫ويشغل‬ ‫الفردي‬ ‫الخادم‬
Resource
Manager
.
Hadoop.pdf

More Related Content

What's hot

Hadoop Tutorial For Beginners | Apache Hadoop Tutorial For Beginners | Hadoop...
Hadoop Tutorial For Beginners | Apache Hadoop Tutorial For Beginners | Hadoop...Hadoop Tutorial For Beginners | Apache Hadoop Tutorial For Beginners | Hadoop...
Hadoop Tutorial For Beginners | Apache Hadoop Tutorial For Beginners | Hadoop...
Simplilearn
 
High Performance Computing (HPC) in cloud
High Performance Computing (HPC) in cloudHigh Performance Computing (HPC) in cloud
High Performance Computing (HPC) in cloud
Accubits Technologies
 
Hadoop introduction , Why and What is Hadoop ?
Hadoop introduction , Why and What is  Hadoop ?Hadoop introduction , Why and What is  Hadoop ?
Hadoop introduction , Why and What is Hadoop ?
sudhakara st
 
Hadoop
Hadoop Hadoop
Hadoop
ABHIJEET RAJ
 
Hadoop Tutorial For Beginners
Hadoop Tutorial For BeginnersHadoop Tutorial For Beginners
Hadoop Tutorial For Beginners
Dataflair Web Services Pvt Ltd
 
Apache PIG
Apache PIGApache PIG
Apache PIG
Prashant Gupta
 
Hadoop File system (HDFS)
Hadoop File system (HDFS)Hadoop File system (HDFS)
Hadoop File system (HDFS)
Prashant Gupta
 
Apache Hadoop Tutorial | Hadoop Tutorial For Beginners | Big Data Hadoop | Ha...
Apache Hadoop Tutorial | Hadoop Tutorial For Beginners | Big Data Hadoop | Ha...Apache Hadoop Tutorial | Hadoop Tutorial For Beginners | Big Data Hadoop | Ha...
Apache Hadoop Tutorial | Hadoop Tutorial For Beginners | Big Data Hadoop | Ha...
Edureka!
 
Cloud Computing & Big Data
Cloud Computing & Big DataCloud Computing & Big Data
Cloud Computing & Big Data
Mrinal Kumar
 
Introduction to HDFS
Introduction to HDFSIntroduction to HDFS
Introduction to HDFS
Bhavesh Padharia
 
Hadoop
HadoopHadoop
Big Data & Hadoop Tutorial
Big Data & Hadoop TutorialBig Data & Hadoop Tutorial
Big Data & Hadoop Tutorial
Edureka!
 
Big Data and Hadoop
Big Data and HadoopBig Data and Hadoop
Big Data and Hadoop
Flavio Vit
 
Hadoop and Big Data
Hadoop and Big DataHadoop and Big Data
Hadoop and Big Data
Harshdeep Kaur
 
Hadoop
HadoopHadoop
Big Data
Big DataBig Data
Big Data
Rohit Jain
 
Big data Analytics
Big data AnalyticsBig data Analytics
Big data Analytics
TUSHAR GARG
 
Presentation About Big Data (DBMS)
Presentation About Big Data (DBMS)Presentation About Big Data (DBMS)
Presentation About Big Data (DBMS)
SiamAhmed16
 
Büyük veri teknolojilerine giriş v1l
Büyük veri teknolojilerine giriş v1lBüyük veri teknolojilerine giriş v1l
Büyük veri teknolojilerine giriş v1l
Hakan Ilter
 
Introduction to Big Data & Hadoop Architecture - Module 1
Introduction to Big Data & Hadoop Architecture - Module 1Introduction to Big Data & Hadoop Architecture - Module 1
Introduction to Big Data & Hadoop Architecture - Module 1
Rohit Agrawal
 

What's hot (20)

Hadoop Tutorial For Beginners | Apache Hadoop Tutorial For Beginners | Hadoop...
Hadoop Tutorial For Beginners | Apache Hadoop Tutorial For Beginners | Hadoop...Hadoop Tutorial For Beginners | Apache Hadoop Tutorial For Beginners | Hadoop...
Hadoop Tutorial For Beginners | Apache Hadoop Tutorial For Beginners | Hadoop...
 
High Performance Computing (HPC) in cloud
High Performance Computing (HPC) in cloudHigh Performance Computing (HPC) in cloud
High Performance Computing (HPC) in cloud
 
Hadoop introduction , Why and What is Hadoop ?
Hadoop introduction , Why and What is  Hadoop ?Hadoop introduction , Why and What is  Hadoop ?
Hadoop introduction , Why and What is Hadoop ?
 
Hadoop
Hadoop Hadoop
Hadoop
 
Hadoop Tutorial For Beginners
Hadoop Tutorial For BeginnersHadoop Tutorial For Beginners
Hadoop Tutorial For Beginners
 
Apache PIG
Apache PIGApache PIG
Apache PIG
 
Hadoop File system (HDFS)
Hadoop File system (HDFS)Hadoop File system (HDFS)
Hadoop File system (HDFS)
 
Apache Hadoop Tutorial | Hadoop Tutorial For Beginners | Big Data Hadoop | Ha...
Apache Hadoop Tutorial | Hadoop Tutorial For Beginners | Big Data Hadoop | Ha...Apache Hadoop Tutorial | Hadoop Tutorial For Beginners | Big Data Hadoop | Ha...
Apache Hadoop Tutorial | Hadoop Tutorial For Beginners | Big Data Hadoop | Ha...
 
Cloud Computing & Big Data
Cloud Computing & Big DataCloud Computing & Big Data
Cloud Computing & Big Data
 
Introduction to HDFS
Introduction to HDFSIntroduction to HDFS
Introduction to HDFS
 
Hadoop
HadoopHadoop
Hadoop
 
Big Data & Hadoop Tutorial
Big Data & Hadoop TutorialBig Data & Hadoop Tutorial
Big Data & Hadoop Tutorial
 
Big Data and Hadoop
Big Data and HadoopBig Data and Hadoop
Big Data and Hadoop
 
Hadoop and Big Data
Hadoop and Big DataHadoop and Big Data
Hadoop and Big Data
 
Hadoop
HadoopHadoop
Hadoop
 
Big Data
Big DataBig Data
Big Data
 
Big data Analytics
Big data AnalyticsBig data Analytics
Big data Analytics
 
Presentation About Big Data (DBMS)
Presentation About Big Data (DBMS)Presentation About Big Data (DBMS)
Presentation About Big Data (DBMS)
 
Büyük veri teknolojilerine giriş v1l
Büyük veri teknolojilerine giriş v1lBüyük veri teknolojilerine giriş v1l
Büyük veri teknolojilerine giriş v1l
 
Introduction to Big Data & Hadoop Architecture - Module 1
Introduction to Big Data & Hadoop Architecture - Module 1Introduction to Big Data & Hadoop Architecture - Module 1
Introduction to Big Data & Hadoop Architecture - Module 1
 

Similar to Hadoop.pdf

تقسيم الهارد
تقسيم الهارد تقسيم الهارد
تقسيم الهارد
987654321987654321987654321
 
المهمة الرابعة . ريهام صبحى
المهمة الرابعة . ريهام صبحىالمهمة الرابعة . ريهام صبحى
المهمة الرابعة . ريهام صبحى
Rora Moon
 
COMPLEX_DATA.pptx
COMPLEX_DATA.pptxCOMPLEX_DATA.pptx
COMPLEX_DATA.pptx
yakot2alordea2
 
Pp.mp4
Pp.mp4Pp.mp4
Pp.mp4
Reem Mohamed
 
Oracle Database
Oracle DatabaseOracle Database
Oracle Database
Basel Issmail
 
قواعد البيانات
قواعد البياناتقواعد البيانات
قواعد البيانات
Impossible Love
 
الحوسبةالسحابية
الحوسبةالسحابيةالحوسبةالسحابية
الحوسبةالسحابيةMamoun Matar
 
خدمة NAS للتخزين المتصل بالشبكة في الإمارات العربيةالمتحدة ).docx
خدمة NAS للتخزين المتصل بالشبكة في الإمارات العربيةالمتحدة ).docxخدمة NAS للتخزين المتصل بالشبكة في الإمارات العربيةالمتحدة ).docx
خدمة NAS للتخزين المتصل بالشبكة في الإمارات العربيةالمتحدة ).docx
متبادل مجموعة
 
هاجر صابر الشاذلى ( المهمة الرابعة )
هاجر صابر الشاذلى ( المهمة الرابعة ) هاجر صابر الشاذلى ( المهمة الرابعة )
هاجر صابر الشاذلى ( المهمة الرابعة )
hagerabdo
 
ادوات تحرير الملفات ومشاركة الملفات
ادوات تحرير الملفات ومشاركة الملفاتادوات تحرير الملفات ومشاركة الملفات
ادوات تحرير الملفات ومشاركة الملفات
abdulrhmanabdulaziz3
 
Databases قواعد البيانات
Databases قواعد البيانات  Databases قواعد البيانات
Databases قواعد البيانات
Mohamed Reda
 
معرفات البيانات المترابطة والمكتبات القصة حتى الآن / ترجمة محمد عبدالحميد معوض
معرفات البيانات المترابطة والمكتبات القصة حتى الآن  / ترجمة محمد عبدالحميد معوضمعرفات البيانات المترابطة والمكتبات القصة حتى الآن  / ترجمة محمد عبدالحميد معوض
معرفات البيانات المترابطة والمكتبات القصة حتى الآن / ترجمة محمد عبدالحميد معوض
Muhammad Muawwad
 
قواعد البيانات
قواعد البياناتقواعد البيانات
قواعد البياناتMoselhy Hussein
 
Mysql 1
Mysql 1Mysql 1
Mysql 1
Mody Waleed
 
الحوسبة السحابية
الحوسبة السحابيةالحوسبة السحابية
الحوسبة السحابية
Mamoun Matar
 
Using R For Statistics
Using R For StatisticsUsing R For Statistics
عرض الحوسبة السحابية وتطبيقاتها 01
عرض الحوسبة السحابية وتطبيقاتها 01عرض الحوسبة السحابية وتطبيقاتها 01
عرض الحوسبة السحابية وتطبيقاتها 01
نوافذ حاسوبية
 
قواعد البيانات.ppt
قواعد البيانات.pptقواعد البيانات.ppt
قواعد البيانات.ppt
rzazalamin1
 
نظم قواعد البيانات
نظم قواعد البياناتنظم قواعد البيانات
نظم قواعد البيانات
Fida Kadun
 

Similar to Hadoop.pdf (20)

تقسيم الهارد
تقسيم الهارد تقسيم الهارد
تقسيم الهارد
 
المهمة الرابعة . ريهام صبحى
المهمة الرابعة . ريهام صبحىالمهمة الرابعة . ريهام صبحى
المهمة الرابعة . ريهام صبحى
 
COMPLEX_DATA.pptx
COMPLEX_DATA.pptxCOMPLEX_DATA.pptx
COMPLEX_DATA.pptx
 
Pp.mp4
Pp.mp4Pp.mp4
Pp.mp4
 
Oracle Database
Oracle DatabaseOracle Database
Oracle Database
 
قواعد البيانات
قواعد البياناتقواعد البيانات
قواعد البيانات
 
الحوسبةالسحابية
الحوسبةالسحابيةالحوسبةالسحابية
الحوسبةالسحابية
 
خدمة NAS للتخزين المتصل بالشبكة في الإمارات العربيةالمتحدة ).docx
خدمة NAS للتخزين المتصل بالشبكة في الإمارات العربيةالمتحدة ).docxخدمة NAS للتخزين المتصل بالشبكة في الإمارات العربيةالمتحدة ).docx
خدمة NAS للتخزين المتصل بالشبكة في الإمارات العربيةالمتحدة ).docx
 
هاجر صابر الشاذلى ( المهمة الرابعة )
هاجر صابر الشاذلى ( المهمة الرابعة ) هاجر صابر الشاذلى ( المهمة الرابعة )
هاجر صابر الشاذلى ( المهمة الرابعة )
 
ادوات تحرير الملفات ومشاركة الملفات
ادوات تحرير الملفات ومشاركة الملفاتادوات تحرير الملفات ومشاركة الملفات
ادوات تحرير الملفات ومشاركة الملفات
 
Databases قواعد البيانات
Databases قواعد البيانات  Databases قواعد البيانات
Databases قواعد البيانات
 
معرفات البيانات المترابطة والمكتبات القصة حتى الآن / ترجمة محمد عبدالحميد معوض
معرفات البيانات المترابطة والمكتبات القصة حتى الآن  / ترجمة محمد عبدالحميد معوضمعرفات البيانات المترابطة والمكتبات القصة حتى الآن  / ترجمة محمد عبدالحميد معوض
معرفات البيانات المترابطة والمكتبات القصة حتى الآن / ترجمة محمد عبدالحميد معوض
 
قواعد البيانات
قواعد البياناتقواعد البيانات
قواعد البيانات
 
Mysql 1
Mysql 1Mysql 1
Mysql 1
 
الحوسبة السحابية
الحوسبة السحابيةالحوسبة السحابية
الحوسبة السحابية
 
Using R For Statistics
Using R For StatisticsUsing R For Statistics
Using R For Statistics
 
عرض الحوسبة السحابية وتطبيقاتها 01
عرض الحوسبة السحابية وتطبيقاتها 01عرض الحوسبة السحابية وتطبيقاتها 01
عرض الحوسبة السحابية وتطبيقاتها 01
 
قواعد البيانات.ppt
قواعد البيانات.pptقواعد البيانات.ppt
قواعد البيانات.ppt
 
نظم قواعد البيانات
نظم قواعد البياناتنظم قواعد البيانات
نظم قواعد البيانات
 
1
11
1
 

Recently uploaded

PPT SEMINAR HASIL PRODI BAHASA DAN SASTRA ARAB RADA ISDA SARI
PPT SEMINAR HASIL PRODI BAHASA DAN SASTRA ARAB RADA ISDA SARIPPT SEMINAR HASIL PRODI BAHASA DAN SASTRA ARAB RADA ISDA SARI
PPT SEMINAR HASIL PRODI BAHASA DAN SASTRA ARAB RADA ISDA SARI
RadaIsdasari
 
مدخل الى مجال المقاربات البيداغوجية .pdf
مدخل الى مجال المقاربات البيداغوجية .pdfمدخل الى مجال المقاربات البيداغوجية .pdf
مدخل الى مجال المقاربات البيداغوجية .pdf
AhmedLansary1
 
تطبيقات الواقع المعزز في التعليم والتعلم.pdf
تطبيقات الواقع المعزز في التعليم والتعلم.pdfتطبيقات الواقع المعزز في التعليم والتعلم.pdf
تطبيقات الواقع المعزز في التعليم والتعلم.pdf
joreyaa
 
استراتيجية شبة المحسوس والمحسوس والمجرد.pptx
استراتيجية شبة المحسوس والمحسوس والمجرد.pptxاستراتيجية شبة المحسوس والمحسوس والمجرد.pptx
استراتيجية شبة المحسوس والمحسوس والمجرد.pptx
rabieazaz8
 
أهمية تعليم البرمجة للأطفال في العصر الرقمي.pdf
أهمية تعليم البرمجة للأطفال في العصر الرقمي.pdfأهمية تعليم البرمجة للأطفال في العصر الرقمي.pdf
أهمية تعليم البرمجة للأطفال في العصر الرقمي.pdf
elmadrasah8
 
عرض حول كيفية منهجية التراسل الاداري.pptx
عرض حول  كيفية منهجية التراسل الاداري.pptxعرض حول  كيفية منهجية التراسل الاداري.pptx
عرض حول كيفية منهجية التراسل الاداري.pptx
miloudaitblal001
 

Recently uploaded (6)

PPT SEMINAR HASIL PRODI BAHASA DAN SASTRA ARAB RADA ISDA SARI
PPT SEMINAR HASIL PRODI BAHASA DAN SASTRA ARAB RADA ISDA SARIPPT SEMINAR HASIL PRODI BAHASA DAN SASTRA ARAB RADA ISDA SARI
PPT SEMINAR HASIL PRODI BAHASA DAN SASTRA ARAB RADA ISDA SARI
 
مدخل الى مجال المقاربات البيداغوجية .pdf
مدخل الى مجال المقاربات البيداغوجية .pdfمدخل الى مجال المقاربات البيداغوجية .pdf
مدخل الى مجال المقاربات البيداغوجية .pdf
 
تطبيقات الواقع المعزز في التعليم والتعلم.pdf
تطبيقات الواقع المعزز في التعليم والتعلم.pdfتطبيقات الواقع المعزز في التعليم والتعلم.pdf
تطبيقات الواقع المعزز في التعليم والتعلم.pdf
 
استراتيجية شبة المحسوس والمحسوس والمجرد.pptx
استراتيجية شبة المحسوس والمحسوس والمجرد.pptxاستراتيجية شبة المحسوس والمحسوس والمجرد.pptx
استراتيجية شبة المحسوس والمحسوس والمجرد.pptx
 
أهمية تعليم البرمجة للأطفال في العصر الرقمي.pdf
أهمية تعليم البرمجة للأطفال في العصر الرقمي.pdfأهمية تعليم البرمجة للأطفال في العصر الرقمي.pdf
أهمية تعليم البرمجة للأطفال في العصر الرقمي.pdf
 
عرض حول كيفية منهجية التراسل الاداري.pptx
عرض حول  كيفية منهجية التراسل الاداري.pptxعرض حول  كيفية منهجية التراسل الاداري.pptx
عرض حول كيفية منهجية التراسل الاداري.pptx
 

Hadoop.pdf

  • 1. Apache Hadoop ‫إعداد‬ / ‫ابرآم‬ ‫سمير‬ ‫عماد‬ ‫المعلومات‬ ‫وتقنية‬ ‫والوثائق‬ ‫المكتبات‬ ‫بقسم‬ ‫عيد‬ُ‫م‬ ‫اآلداب‬ ‫كلية‬ – ‫القاهرة‬ ‫جامعة‬
  • 2. • Apache Hadoop ‫المصدر‬ ‫مفتوح‬ ‫برمجيات‬ ‫إطار‬ ‫هو‬ ، ‫البيانات‬ ‫لتخزين‬ ‫مصمم‬ ‫الضخمة‬ ‫ومعالجتها‬ ‫اإلنترنت‬ ‫بشبكة‬ ‫المتصلة‬ ‫األجهزة‬ ‫من‬ ‫كبيرة‬ ‫مجموعة‬ ‫على‬ . • ‫يتميز‬ Hadoop ‫البيانات‬ ‫مع‬ ‫التعامل‬ ‫على‬ ‫بقدرته‬ ‫الضخمة‬ ( Big Data ) ‫بسرعة‬ ‫ا‬ ‫المعلومات‬ ‫واستخراج‬ ‫البيانات‬ ‫لتحليل‬ ‫عادة‬ ‫استخدامه‬ ‫ويتم‬ ،‫عالية‬ ‫وكفاءة‬ ‫لقيمة‬ ‫منها‬ . • ‫يستخدم‬ Hadoop ‫مثل‬ ‫البرمجة‬ ‫لغات‬ Java ‫و‬ Python ،‫وغيرها‬
  • 3. • ‫هم‬ ‫أساسية‬ ‫مكونات‬ ‫ثالث‬ ‫من‬ ‫ويتكون‬ : 1. (HDFS) 2. Map-Reduce 3. (YARN)
  • 4. • Hadoop Distributed File System • ‫األساسي‬ ‫النظام‬ ‫يعتبر‬ ‫البيانات‬ ‫لتخزين‬ ‫بنية‬ ‫في‬ Hadoop . • ‫ويتميز‬ HDFS ‫الب‬ ‫إلى‬ ‫يصل‬ ‫كبير‬ ‫بحجم‬ ‫الملفات‬ ‫تخزين‬ ‫يدعم‬ ‫بأنه‬ ‫يتابايت‬ ( 1000 ‫تيرابايت‬ ) ‫الشبكة‬ ‫في‬ ‫أجهزة‬ ‫دة‬ِ‫ع‬ ‫على‬ ‫بتوزيعها‬ ‫ويقوم‬ . • Java ‫لـ‬ ‫األصلية‬ ‫اللغة‬ ‫هي‬ HDFS .
  • 5. • ‫تسمى‬ ‫صغيرة‬ ‫قطع‬ ‫إلى‬ ‫الملفات‬ ‫بتقسيم‬ ‫يقوم‬ blocks ‫ويتم‬ ‫نظام‬ ‫ويسمح‬ ،‫ا‬ً‫ق‬‫ساب‬ ‫ذكرنا‬ ‫كما‬ ‫أجهزة‬ ‫عدة‬ ‫على‬ ‫توزيعها‬ HDFS ‫التخزين‬ ‫سعة‬ ‫لزيادة‬ ‫الشبكة‬ ‫إلى‬ ‫أجهزة‬ ‫بإضافة‬ ‫األداء‬ ‫وتحسين‬ . • ‫يتميز‬ HDFS ‫والتح‬ ‫البيانات‬ ‫توفير‬ ‫على‬ ‫العالية‬ ‫بقدرته‬ ‫مل‬ ‫بالتخزين‬ ‫يقوم‬ ‫ألنه‬ ،‫لألخطاء‬ ‫كرر‬ُ‫م‬‫ال‬ ‫لكل‬ block ‫دة‬ِ‫ع‬ ‫على‬ ‫الشبكة‬ ‫في‬ ‫أجهزة‬ .
  • 6. • ‫يقوم‬ (HDFS) ‫بعمليتين‬ : • ‫لـ‬ ‫واحدة‬ master node (Name Node) ‫يتم‬ ‫حيث‬ ، ‫الـ‬ ‫تخزين‬ Meta data . • ‫لـ‬ ‫واألخرى‬ slave nodes ( Data Nodes ) ‫يتم‬ ‫حيث‬ ، ‫الـ‬ ‫تخزين‬ Blocks .
  • 7.
  • 8. • ‫برمجة‬ ‫نظام‬ ‫البيانات‬ ‫لمعالجة‬ ‫الضخمة‬ (Big Data) . • ‫بيئ‬ ‫في‬ ‫ومعالجتها‬ ‫أجهزة‬ ‫عدة‬ ‫على‬ ‫المهام‬ ‫لتوزيع‬ ‫يستخدم‬ ‫ة‬ ‫موزعة‬ . • ‫ويوزع‬ ‫صغيرة‬ ‫مهام‬ ‫إلى‬ ‫الكبيرة‬ ‫المهام‬ ‫بتجزئة‬ ‫يقوم‬ ‫حيث‬ ‫ها‬ ‫والتحليل‬ ‫المعالجة‬ ‫عملية‬ ‫لتسريع‬ ‫أجهزة‬ ‫دة‬ِ‫ع‬ ‫على‬ .
  • 9. • ‫مرحلتين‬ ‫في‬ ‫البيانات‬ ‫بمعالجة‬ ‫هذا‬ ‫العمل‬ ‫إطار‬ ‫يقوم‬ : 1 . Map Phase ‫مفاتي‬ ‫إلى‬ ‫وفصلها‬ ‫البيانات‬ ‫تحليل‬ ‫فيها‬ ‫يتم‬ ‫وقيم‬ ‫ح‬ key-value ‫القيم‬ ‫هذه‬ ‫على‬ ‫مخصصة‬ ‫عمليات‬ ‫بإجراء‬ ‫يقوم‬ ‫ثم‬ ، . 2 . ‫مرحلة‬ ‫إلى‬ ‫العمليات‬ ‫هذه‬ ‫نتائج‬ ‫إرسال‬ ‫يتم‬ Reduce Phase ‫لمزيد‬ ‫والتحليل‬ ‫المعالجة‬ ‫من‬ .
  • 10.
  • 11. • Yet Another Resource Negotiator • ‫عن‬ ‫مسؤول‬ ‫نظام‬ ‫هو‬ ‫الموارد‬ ‫إدارة‬ (CPU, memory, disk, network and so on) ،‫الخوادم‬ ‫من‬ ‫كبيرة‬ ‫مجموعة‬ ‫في‬ ‫المهام‬ ‫وجدولة‬ ‫تم‬ ‫إلى‬ ‫إضافته‬ Apache Hadoop ‫اإلصدار‬ ‫في‬ 2.0
  • 12. • ‫يتكون‬ YARN ‫رئيسيين‬ ‫مكونين‬ ‫من‬ : .1 Resource-Manager : ‫الموارد‬ ‫وجدولة‬ ‫بإدارة‬ ‫يقوم‬ ‫تطبيقات‬ ‫لجميع‬ Hadoop ‫المتزامنة‬ . .2 Node-Manager : ‫على‬ ‫المتاحة‬ ‫الموارد‬ ‫بإدارة‬ ‫يقوم‬ ‫قبل‬ ‫من‬ ‫المحددة‬ ‫المهام‬ ‫ويشغل‬ ‫الفردي‬ ‫الخادم‬ Resource Manager .