SlideShare a Scribd company logo
1 of 10
‫بخطوة‬ ‫خطوة‬ ‫البيانات‬ ‫تنقيب‬
Data mining step by step
‫اعداد‬
:
‫محمدعلي‬ ‫فائق‬ ‫مهابات‬
‫عام‬ ‫تعريف‬
‫ال‬ ‫المفيـدة‬ ‫المعلومـات‬ ‫إليجـاد‬ ‫البيانـات‬ ‫مـن‬ ‫كميات‬ ‫بين‬ ‫ما‬ ‫غربلة‬ ‫عملية‬ ‫هي‬ ‫التـي‬ ‫البيانات‬ ‫تنقيب‬ ‫عملية‬
‫القـرار‬ ‫تخـا‬
‫البيانات‬ ‫تنقيب‬
:
‫االحص‬ ‫والعمليات‬ ‫االصطناعي‬ ‫كاء‬ ‫ال‬ ‫تقنيات‬ ‫مع‬ ‫ربطها‬ ‫خالل‬ ‫من‬ ‫للبيانات‬ ‫تحليل‬ ‫عملية‬ ‫هي‬
‫في‬ ‫ائيه‬
‫البيانات‬ ‫ه‬ ‫ه‬ ‫تحليل‬
,
‫ا‬ ‫من‬ ‫كبير‬ ‫حجم‬ ‫في‬ ‫ومفيده‬ ‫معينه‬ ‫معلومات‬ ‫عن‬ ‫وبحث‬ ‫تفتيش‬ ‫عملية‬ ‫هي‬ ‫وببساطه‬
‫لبيانات‬
,
‫وطبعا‬
‫ل‬
‫واكفئ‬ ‫اكثر‬ ‫لتصبح‬ ‫االصطناعي‬ ‫كاء‬ ‫ال‬ ‫وطرق‬ ‫البيانات‬ ‫ه‬ ‫ه‬ ‫تحليل‬ ‫بين‬ ‫الربط‬ ‫عملية‬ ‫خالل‬ ‫من‬ ‫يتم‬ ‫ك‬
‫عملية‬ ‫في‬
‫تسمى‬ ‫والتي‬ ‫التفتيش‬
(
knowledge discovery from data( KDD
‫استكشاف‬ ‫خطوات‬ ‫من‬ ‫خطوه‬ ‫تعتبر‬ ‫وهي‬
‫البيانات‬ ‫قواعد‬ ‫من‬ ‫المعرفه‬
1. Data cleaning ‫(تنظيف‬to remove noise and inconsistent data ‫)المتناقضة‬
2. Data integration ‫تكامل‬ (where multiple data sources may be
3. combined)
‫والمفهومه‬ ‫والمفيده‬ ‫المهمه‬ ‫واالنساق‬ ‫االنماط‬ ‫لتحديد‬ ‫البيانات‬ ‫بها‬ ‫تمر‬ ‫والتي‬ ‫المعالجات‬ ‫من‬ ‫مراحل‬ ‫عدة‬
KDD
4. Data selection ‫(اختيار‬where data relevant ‫عالقة‬ to the analysis task are
retrieved from the database)
5. Data transformation (where data are transformed into forms
appropriate for mining by performing summary operations)
6. Data mining (process where intelligent methods are applied to data
patterns ‫البيانات‬ ‫)أنماط‬
7. Pattern evaluation ‫النمط‬ ‫تقييم‬ (to identify the truly interesting patterns
representing knowledge based on measures)
8. Knowledge presentation (where knowledge representation
techniques are used to present mined knowledge to users.
‫العاديه‬ ‫االستعالم‬ ‫عملية‬ ‫بين‬ ‫الفرق‬ ‫اوضح‬ ‫ان‬ ‫اريد‬ ‫التنقيب‬ ‫في‬ ‫يحصل‬ ‫ي‬ ‫ال‬ ‫هو‬ ‫ما‬ ‫نفهم‬ ‫لكي‬
‫البيانات‬ ‫قواعد‬ ‫في‬
Data base
Query
‫المنقبه‬ ‫البيانات‬ ‫في‬ ‫واالستعالم‬
:
-
‫النوعين‬ ‫كال‬ ‫بين‬ ‫االستعالم‬ ‫في‬ ‫الفرق‬ ‫يوضح‬ ‫ي‬ ‫وال‬ ‫التالي‬ ‫المثال‬
Data base Query vs. Data mining Query ....
‫تجاري‬ ‫سوق‬ ‫في‬ ‫معلومات‬ ‫عن‬ ‫االستعالم‬
base Data
‫العاديه‬ ‫البيانات‬ ‫قاعدة‬ ‫في‬
.1
‫بخالد‬ ‫الثاني‬ ‫اسمهم‬ ‫ينتهي‬ ‫ين‬ ‫ال‬ ‫للزبائن‬ ‫الكامله‬ ‫المعلومات‬ ‫عن‬ ‫االستعالم‬
*
.2
‫من‬ ‫اكثر‬ ‫بمبلغ‬ ‫اشتروا‬ ‫ين‬ ‫ال‬ ‫الزبائن‬ ‫عن‬ ‫االستعالم‬
1000
‫الشهر‬ ‫اخر‬ ‫في‬ ‫دينار‬
*
.3
‫الحليب‬ ‫اشتروا‬ ‫ين‬ ‫ال‬ ‫الزبائن‬ ‫اسماء‬ ‫عن‬ ‫االستعالم‬
*
mining Data
‫البيانات‬ ‫عن‬ ‫التنقيب‬
.1
‫التصنيف‬
(
classification (
‫مشاكل‬ ‫عليها‬ ‫والتي‬ ‫االئتمانيه‬ ‫البطاقات‬ ‫كل‬ ‫عن‬ ‫االستعالم‬
.
.2
‫العناقيد‬ ‫او‬ ‫التجمع‬
(
clustering (
‫مماثله‬ ‫شرائيه‬ ‫عادات‬ ‫لديهم‬ ‫ين‬ ‫ال‬ ‫الزبائن‬ ‫عن‬ ‫االستعالم‬
.
.3
‫االرتباط‬ ‫وعالقات‬ ‫قواعد‬ ‫اكتشاف‬
(
rules association (
‫مع‬ ‫تزامني‬ ‫بشكل‬ ‫شراءها‬ ‫يتم‬ ‫التي‬ ‫السلع‬ ‫عن‬ ‫االستعالم‬
‫الحليب‬
.
DATA MINING MODELS ‫المستخدمه‬ ‫التقنيات‬ ‫بعض‬
‫البيانات‬ ‫تنقيب‬ ‫في‬
1- Neural Networks
2- Genetic Algorithms
3- Agent Technology
4- Decision Trees
5- Hybrid Models
6- Statistics
‫تصنيفها‬ ‫تم‬ ‫الدم‬ ‫ضغط‬ ‫الرتفاع‬ ‫دراسة‬ ‫من‬ ‫ت‬ ‫اخ‬ ‫بيانات‬ ‫مجموعة‬ ‫يمثل‬ ‫ي‬ ‫وال‬ ‫التالي‬ ‫المثال‬
‫القرار‬ ‫شجرة‬ ‫طريقة‬ ‫بأستخدام‬
Decision Trees
‫تض‬ ‫جديدة‬ ‫مجاالت‬ ‫الى‬ ‫الدخول‬ ‫في‬ ‫مستمرة‬ ‫زالت‬ ‫وال‬ ‫وواسعة‬ ‫عديدة‬ ‫مجاالت‬ ‫الى‬ ‫البيانات‬ ‫تنقيب‬ ‫تطبيقات‬ ‫امتدت‬
‫ما‬ ‫الى‬ ‫اف‬
‫كاآلتي‬ ‫وهي‬ ‫سبق‬
:
1
-
‫المصرفية‬ ‫األعمال‬
Banking :
‫القروض‬ ‫مخاطر‬ ‫كتحليل‬
2
–
‫المالية‬
Financial :
‫االسهم‬ ‫تبادل‬ ‫في‬ ‫الغش‬ ‫كتحديد‬
3
-
‫االتصاالت‬
Telecommunications :
‫لخدماتها‬ ‫المزيف‬ ‫االستخدام‬ ‫كتحديد‬
4
-
‫التسويق‬
Marketing :
‫للزبون‬ ‫الديموغرافية‬ ‫الخصائص‬ ‫بين‬ ‫العالقة‬ ‫كايجاد‬
5
-
‫الصحة‬ ‫ورعاية‬ ‫التامين‬
Care Health and Insurance :
‫الدعاوى‬ ‫كتحليل‬
6
-
‫الطب‬
Medicine :
‫المختلفة‬ ‫لألمراض‬ ‫الناجحة‬ ‫الطبية‬ ‫العالجات‬ ‫كتحديد‬
7
-
‫النقل‬
Transportation :
‫المناف‬ ‫بين‬ ‫التوزيع‬ ‫جدول‬ ‫كتحديد‬
8
-
‫بالتجزئة‬ ‫البيع‬
Retailing :
‫الترويج‬ ‫فاعلية‬ ‫كتقدير‬
9
-
‫الزبون‬ ‫عالقات‬ ‫ادارة‬
Management Relationship Customer :
‫كل‬ ‫اقل‬ ‫النه‬ ‫بالزبون‬ ‫لالحتفاظ‬ ‫الالزم‬ ‫الفعل‬ ‫كاتخا‬
‫فة‬
‫جديد‬ ‫زبون‬ ‫كسب‬ ‫من‬
.
‫الواقعية‬ ‫االمثلة‬ ‫من‬
:
‫عل‬ ‫االدارة‬ ‫مساعدة‬ ‫لغـرض‬ ‫العراقـي‬ ‫الصناعي‬ ‫للمصرف‬ ‫القروض‬ ‫بيانات‬ ‫على‬ ‫البيانات‬ ‫تنقيب‬ ‫عملية‬ ‫اجراء‬ ‫تم‬
‫اتخا‬ ‫ى‬
‫خطرا‬ ‫يشكل‬ ‫معـه‬ ‫التعامـل‬ ‫كان‬ ‫ا‬ ‫ا‬ ‫فيما‬ ‫الزبون‬ ‫على‬ ‫الحكم‬ ‫من‬ ‫يمكنها‬ ‫ي‬ ‫ال‬ ‫القرار‬
"
‫ال‬ ‫أم‬ ‫المصرف‬ ‫على‬
.
‫تت‬ ‫لك‬ ‫وب‬
‫من‬ ‫مكن‬
‫المصرف‬ ‫يتحمله‬ ‫فيما‬ ‫السبب‬ ‫يكون‬ ‫ألنه‬ ‫به‬ ‫موثوق‬ ‫غير‬ ‫هو‬ ‫من‬ ‫واسـتبعاد‬ ‫بهم‬ ‫الموثوق‬ ‫الزبائن‬ ‫على‬ ‫التركيز‬
‫خسائر‬ ‫من‬
‫التسديد‬ ‫عدم‬ ‫بسب‬ ‫اقراضـه‬ ‫عـن‬ ‫ناجمة‬
‫المهيكلة‬ ‫االستفسـار‬ ‫لغـة‬ ‫خـادم‬ ‫يدعى‬ ‫حاسوبي‬ ‫برنامج‬ ‫استخدم‬ ‫التطبيق‬ ‫اجل‬ ‫ومن‬
SQL
‫ي‬ ‫ال‬ ‫يمكن‬ ‫تعريفـه‬
)
Structured Query Language Server 2000 ) Server 2000
‫البيانـات‬ ‫قاعدة‬ ‫ادارة‬ ‫نظام‬ ‫بانه‬
System
Management Database
‫وتحدي‬ ‫لمسح‬ ‫طرائق‬ ‫يقدم‬ ‫فهو‬ ‫المنظمة‬ ‫بيانات‬ ‫ادارة‬ ‫في‬ ‫للمساعدة‬ ‫تـصميمه‬ ‫تـم‬ ‫ي‬ ‫الـ‬
‫ث‬
‫متجددة‬ ‫بيانات‬ ‫قاعدة‬ ‫على‬ ‫الحفاظ‬ ‫خاللها‬ ‫من‬ ‫يمكن‬ ‫التي‬ ‫البيانات‬ ‫وادخال‬
‫واحد‬ ‫بمستوى‬ ‫دائمـا‬ ‫تكـون‬ ‫هنـا‬ ‫الشجرة‬ ‫ان‬ ‫عدا‬ ‫تماما‬ ‫القرار‬ ‫شجرة‬ ‫اسلوب‬ ‫بنفس‬ ‫التجمعات‬ ‫تمثيل‬ ‫يتم‬
.
‫وال‬
‫صفة‬ ‫ختيار‬
‫العقـدة‬ ‫صفات‬ ‫مجموعة‬ ‫قائمة‬ ‫من‬ ‫لك‬ ‫يكون‬ ،‫الخطر‬ ‫كصفة‬ ‫معينة‬
Set Attribute Node
‫الـشاشة‬ ‫أسفل‬ ‫وسط‬ ‫في‬
.
‫امـا‬
‫واضـحة‬ ‫غيـر‬ ‫فهـي‬ ‫العقـد‬ ‫أسـماء‬
(
1
Cluster
،
2 Cluster ……
،
‫ا‬ ‫وهك‬
)
‫التجمعات‬ ‫ه‬ ‫ه‬ ‫من‬ ‫تجمع‬ ‫لكل‬ ‫لكن‬
‫على‬ ‫الضغط‬ ‫خالل‬ ‫من‬ ‫القواعد‬ ‫ه‬ ‫ه‬ ‫رؤية‬ ‫ويمكن‬ ،‫التجمع‬ ‫داخل‬ ‫الموجودة‬ ‫القيود‬ ‫تصف‬ ‫التي‬ ‫القواعد‬ ‫مـن‬ ‫مجموعـة‬
‫العقدة‬ ‫مسار‬ ‫محتويات‬ ‫الى‬ ‫والنظر‬ ‫العقدة‬
path Node
‫الشاشة‬ ‫يمين‬ ‫اسفل‬ ‫في‬
.
‫الخطر‬ ‫لصفــة‬ ‫وباختيارنا‬
Risk
‫االول‬ ‫التجـمع‬ ‫على‬ ‫والضغط‬
1
Cluster
‫السيئة‬ ‫الحاالت‬ ‫واختيـار‬
bad
‫الشكل‬ ‫يكون‬ ،‫التجمعات‬ ‫لون‬ ‫اساسها‬ ‫على‬ ‫لتبنى‬
(
3
(
‫هو‬ ‫الغامق‬ ‫اللون‬ ‫و‬ ‫التجمع‬ ‫ا‬ ‫ه‬ ‫في‬ ‫الحاالت‬ ‫عـدد‬ ‫ان‬ ‫يتـضح‬ ‫حيث‬
39
‫منها‬ ‫حالة‬
12
‫قرض‬ ‫مخاطر‬ ‫ات‬ ‫حالة‬
‫سـيئة‬
bad
‫احتمالية‬ ‫بنسبة‬
18.31
%
‫و‬
27
‫جيدة‬ ‫قرض‬ ‫مخاطر‬ ‫ات‬ ‫حالة‬
good
‫احتماليـة‬ ‫بنـسبة‬
82.68
%

More Related Content

Similar to data mining.pptx

What are big_data_cloud_computing_analytics_internet_of_things(arabic)_4of6
What are big_data_cloud_computing_analytics_internet_of_things(arabic)_4of6What are big_data_cloud_computing_analytics_internet_of_things(arabic)_4of6
What are big_data_cloud_computing_analytics_internet_of_things(arabic)_4of6Randa Elanwar
 
تواصل_تطوير المحاضرة رقم 190 المهندس / أشرف نصير عنوان المحاضرة "إستراتيجيات...
تواصل_تطوير المحاضرة رقم 190 المهندس / أشرف نصير  عنوان المحاضرة "إستراتيجيات...تواصل_تطوير المحاضرة رقم 190 المهندس / أشرف نصير  عنوان المحاضرة "إستراتيجيات...
تواصل_تطوير المحاضرة رقم 190 المهندس / أشرف نصير عنوان المحاضرة "إستراتيجيات...Egyptian Engineers Association
 
1366136913.9485 نظم ادارة قواعد البيانات 2
1366136913.9485 نظم ادارة  قواعد البيانات 21366136913.9485 نظم ادارة  قواعد البيانات 2
1366136913.9485 نظم ادارة قواعد البيانات 2mh ED
 
محاضرتي الثانية
محاضرتي الثانيةمحاضرتي الثانية
محاضرتي الثانيةAmany Megahed
 
منهاج تحليل و تصميم نظم المعلومات
منهاج تحليل و تصميم نظم المعلوماتمنهاج تحليل و تصميم نظم المعلومات
منهاج تحليل و تصميم نظم المعلوماتDrMohammed Qassim
 
Research data workshop Afli.pptx
Research data workshop Afli.pptxResearch data workshop Afli.pptx
Research data workshop Afli.pptxmohamed Elzalabany
 
Database concepts
Database conceptsDatabase concepts
Database conceptsFataho Ali
 
مدخل إلى علم المعلومات
مدخل إلى علم المعلوماتمدخل إلى علم المعلومات
مدخل إلى علم المعلوماتKingo5
 
Databases قواعد البيانات
Databases قواعد البيانات  Databases قواعد البيانات
Databases قواعد البيانات Mohamed Reda
 
قواعد البيانات
قواعد البياناتقواعد البيانات
قواعد البياناتImpossible Love
 
تأثير نظم المعلومات على نشاط المؤسسة
تأثير نظم المعلومات على نشاط المؤسسةتأثير نظم المعلومات على نشاط المؤسسة
تأثير نظم المعلومات على نشاط المؤسسةBelghanami Wassila Nadjet
 
Worldshare - oclc | created by Asmaa saad
Worldshare - oclc  | created by Asmaa saadWorldshare - oclc  | created by Asmaa saad
Worldshare - oclc | created by Asmaa saadYOUCAN6
 
مقرر نظم المعلومات الادارية الاسبوع الأول 2021
مقرر نظم المعلومات الادارية  الاسبوع الأول 2021مقرر نظم المعلومات الادارية  الاسبوع الأول 2021
مقرر نظم المعلومات الادارية الاسبوع الأول 2021WaelBasri
 
الوحدة السابعة - قاعدة البيانات وادارتها
الوحدة السابعة - قاعدة البيانات وادارتهاالوحدة السابعة - قاعدة البيانات وادارتها
الوحدة السابعة - قاعدة البيانات وادارتهاAmin Abu Hammad
 

Similar to data mining.pptx (20)

What are big_data_cloud_computing_analytics_internet_of_things(arabic)_4of6
What are big_data_cloud_computing_analytics_internet_of_things(arabic)_4of6What are big_data_cloud_computing_analytics_internet_of_things(arabic)_4of6
What are big_data_cloud_computing_analytics_internet_of_things(arabic)_4of6
 
تواصل_تطوير المحاضرة رقم 190 المهندس / أشرف نصير عنوان المحاضرة "إستراتيجيات...
تواصل_تطوير المحاضرة رقم 190 المهندس / أشرف نصير  عنوان المحاضرة "إستراتيجيات...تواصل_تطوير المحاضرة رقم 190 المهندس / أشرف نصير  عنوان المحاضرة "إستراتيجيات...
تواصل_تطوير المحاضرة رقم 190 المهندس / أشرف نصير عنوان المحاضرة "إستراتيجيات...
 
1366136913.9485 نظم ادارة قواعد البيانات 2
1366136913.9485 نظم ادارة  قواعد البيانات 21366136913.9485 نظم ادارة  قواعد البيانات 2
1366136913.9485 نظم ادارة قواعد البيانات 2
 
محاضرتي الثانية
محاضرتي الثانيةمحاضرتي الثانية
محاضرتي الثانية
 
Data mining
Data miningData mining
Data mining
 
منهاج تحليل و تصميم نظم المعلومات
منهاج تحليل و تصميم نظم المعلوماتمنهاج تحليل و تصميم نظم المعلومات
منهاج تحليل و تصميم نظم المعلومات
 
Research data workshop Afli.pptx
Research data workshop Afli.pptxResearch data workshop Afli.pptx
Research data workshop Afli.pptx
 
projectview.ppt
projectview.pptprojectview.ppt
projectview.ppt
 
عرض قواعد البيانات 01
عرض قواعد البيانات 01عرض قواعد البيانات 01
عرض قواعد البيانات 01
 
Database concepts
Database conceptsDatabase concepts
Database concepts
 
مدخل إلى علم المعلومات
مدخل إلى علم المعلوماتمدخل إلى علم المعلومات
مدخل إلى علم المعلومات
 
Databases قواعد البيانات
Databases قواعد البيانات  Databases قواعد البيانات
Databases قواعد البيانات
 
قواعد البيانات
قواعد البياناتقواعد البيانات
قواعد البيانات
 
تأثير نظم المعلومات على نشاط المؤسسة
تأثير نظم المعلومات على نشاط المؤسسةتأثير نظم المعلومات على نشاط المؤسسة
تأثير نظم المعلومات على نشاط المؤسسة
 
Worldshare - oclc | created by Asmaa saad
Worldshare - oclc  | created by Asmaa saadWorldshare - oclc  | created by Asmaa saad
Worldshare - oclc | created by Asmaa saad
 
مقرر نظم المعلومات الادارية الاسبوع الأول 2021
مقرر نظم المعلومات الادارية  الاسبوع الأول 2021مقرر نظم المعلومات الادارية  الاسبوع الأول 2021
مقرر نظم المعلومات الادارية الاسبوع الأول 2021
 
أنواع نظم المعلومات
أنواع نظم المعلوماتأنواع نظم المعلومات
أنواع نظم المعلومات
 
البيانات الضخمه
البيانات الضخمهالبيانات الضخمه
البيانات الضخمه
 
الوحدة السابعة - قاعدة البيانات وادارتها
الوحدة السابعة - قاعدة البيانات وادارتهاالوحدة السابعة - قاعدة البيانات وادارتها
الوحدة السابعة - قاعدة البيانات وادارتها
 
6.pptx
6.pptx6.pptx
6.pptx
 

More from Garmian

الواقع المعزز.pptx
الواقع المعزز.pptxالواقع المعزز.pptx
الواقع المعزز.pptxGarmian
 
معالجة الصور لتمييز أرقام السيارات.pptx
معالجة الصور لتمييز أرقام السيارات.pptxمعالجة الصور لتمييز أرقام السيارات.pptx
معالجة الصور لتمييز أرقام السيارات.pptxGarmian
 
Artificial intelligence and environmental development.pptx
Artificial intelligence and environmental development.pptxArtificial intelligence and environmental development.pptx
Artificial intelligence and environmental development.pptxGarmian
 
search-engine1.pptx
search-engine1.pptxsearch-engine1.pptx
search-engine1.pptxGarmian
 
f17dca29bfa11b0a.pdf
f17dca29bfa11b0a.pdff17dca29bfa11b0a.pdf
f17dca29bfa11b0a.pdfGarmian
 
Bologna_Process_V13 النهائي.pdf
Bologna_Process_V13 النهائي.pdfBologna_Process_V13 النهائي.pdf
Bologna_Process_V13 النهائي.pdfGarmian
 
introduction to java.pptx
introduction to java.pptxintroduction to java.pptx
introduction to java.pptxGarmian
 
search-engine.pptx
search-engine.pptxsearch-engine.pptx
search-engine.pptxGarmian
 
Artificial intelligence and environmental development.pptx
Artificial intelligence and environmental development.pptxArtificial intelligence and environmental development.pptx
Artificial intelligence and environmental development.pptxGarmian
 
INTELLECTUAL PROPERTY AND THE PLAGIARISM.pptx
INTELLECTUAL PROPERTY AND THE PLAGIARISM.pptxINTELLECTUAL PROPERTY AND THE PLAGIARISM.pptx
INTELLECTUAL PROPERTY AND THE PLAGIARISM.pptxGarmian
 
data mining.pptx
data mining.pptxdata mining.pptx
data mining.pptxGarmian
 
الملكية الفكرية
الملكية الفكريةالملكية الفكرية
الملكية الفكريةGarmian
 
How to create limited user accounts in windows 10
How to create limited user accounts in windows 10How to create limited user accounts in windows 10
How to create limited user accounts in windows 10Garmian
 
Design interactive whiteboard
Design interactive whiteboard Design interactive whiteboard
Design interactive whiteboard Garmian
 
Introduction to windows
Introduction to windowsIntroduction to windows
Introduction to windowsGarmian
 
Google classroom
Google classroomGoogle classroom
Google classroomGarmian
 
Presentation1
Presentation1Presentation1
Presentation1Garmian
 
XOR Cipher
XOR CipherXOR Cipher
XOR CipherGarmian
 
Firewall
FirewallFirewall
FirewallGarmian
 

More from Garmian (20)

الواقع المعزز.pptx
الواقع المعزز.pptxالواقع المعزز.pptx
الواقع المعزز.pptx
 
معالجة الصور لتمييز أرقام السيارات.pptx
معالجة الصور لتمييز أرقام السيارات.pptxمعالجة الصور لتمييز أرقام السيارات.pptx
معالجة الصور لتمييز أرقام السيارات.pptx
 
Artificial intelligence and environmental development.pptx
Artificial intelligence and environmental development.pptxArtificial intelligence and environmental development.pptx
Artificial intelligence and environmental development.pptx
 
search-engine1.pptx
search-engine1.pptxsearch-engine1.pptx
search-engine1.pptx
 
f17dca29bfa11b0a.pdf
f17dca29bfa11b0a.pdff17dca29bfa11b0a.pdf
f17dca29bfa11b0a.pdf
 
Bologna_Process_V13 النهائي.pdf
Bologna_Process_V13 النهائي.pdfBologna_Process_V13 النهائي.pdf
Bologna_Process_V13 النهائي.pdf
 
introduction to java.pptx
introduction to java.pptxintroduction to java.pptx
introduction to java.pptx
 
search-engine.pptx
search-engine.pptxsearch-engine.pptx
search-engine.pptx
 
Artificial intelligence and environmental development.pptx
Artificial intelligence and environmental development.pptxArtificial intelligence and environmental development.pptx
Artificial intelligence and environmental development.pptx
 
INTELLECTUAL PROPERTY AND THE PLAGIARISM.pptx
INTELLECTUAL PROPERTY AND THE PLAGIARISM.pptxINTELLECTUAL PROPERTY AND THE PLAGIARISM.pptx
INTELLECTUAL PROPERTY AND THE PLAGIARISM.pptx
 
data mining.pptx
data mining.pptxdata mining.pptx
data mining.pptx
 
الملكية الفكرية
الملكية الفكريةالملكية الفكرية
الملكية الفكرية
 
How to create limited user accounts in windows 10
How to create limited user accounts in windows 10How to create limited user accounts in windows 10
How to create limited user accounts in windows 10
 
Design interactive whiteboard
Design interactive whiteboard Design interactive whiteboard
Design interactive whiteboard
 
Introduction to windows
Introduction to windowsIntroduction to windows
Introduction to windows
 
Google classroom
Google classroomGoogle classroom
Google classroom
 
Presentation1
Presentation1Presentation1
Presentation1
 
Excel
ExcelExcel
Excel
 
XOR Cipher
XOR CipherXOR Cipher
XOR Cipher
 
Firewall
FirewallFirewall
Firewall
 

data mining.pptx

  • 1. ‫بخطوة‬ ‫خطوة‬ ‫البيانات‬ ‫تنقيب‬ Data mining step by step ‫اعداد‬ : ‫محمدعلي‬ ‫فائق‬ ‫مهابات‬
  • 2. ‫عام‬ ‫تعريف‬ ‫ال‬ ‫المفيـدة‬ ‫المعلومـات‬ ‫إليجـاد‬ ‫البيانـات‬ ‫مـن‬ ‫كميات‬ ‫بين‬ ‫ما‬ ‫غربلة‬ ‫عملية‬ ‫هي‬ ‫التـي‬ ‫البيانات‬ ‫تنقيب‬ ‫عملية‬ ‫القـرار‬ ‫تخـا‬ ‫البيانات‬ ‫تنقيب‬ : ‫االحص‬ ‫والعمليات‬ ‫االصطناعي‬ ‫كاء‬ ‫ال‬ ‫تقنيات‬ ‫مع‬ ‫ربطها‬ ‫خالل‬ ‫من‬ ‫للبيانات‬ ‫تحليل‬ ‫عملية‬ ‫هي‬ ‫في‬ ‫ائيه‬ ‫البيانات‬ ‫ه‬ ‫ه‬ ‫تحليل‬ , ‫ا‬ ‫من‬ ‫كبير‬ ‫حجم‬ ‫في‬ ‫ومفيده‬ ‫معينه‬ ‫معلومات‬ ‫عن‬ ‫وبحث‬ ‫تفتيش‬ ‫عملية‬ ‫هي‬ ‫وببساطه‬ ‫لبيانات‬ , ‫وطبعا‬ ‫ل‬ ‫واكفئ‬ ‫اكثر‬ ‫لتصبح‬ ‫االصطناعي‬ ‫كاء‬ ‫ال‬ ‫وطرق‬ ‫البيانات‬ ‫ه‬ ‫ه‬ ‫تحليل‬ ‫بين‬ ‫الربط‬ ‫عملية‬ ‫خالل‬ ‫من‬ ‫يتم‬ ‫ك‬ ‫عملية‬ ‫في‬ ‫تسمى‬ ‫والتي‬ ‫التفتيش‬ ( knowledge discovery from data( KDD ‫استكشاف‬ ‫خطوات‬ ‫من‬ ‫خطوه‬ ‫تعتبر‬ ‫وهي‬ ‫البيانات‬ ‫قواعد‬ ‫من‬ ‫المعرفه‬
  • 3. 1. Data cleaning ‫(تنظيف‬to remove noise and inconsistent data ‫)المتناقضة‬ 2. Data integration ‫تكامل‬ (where multiple data sources may be 3. combined) ‫والمفهومه‬ ‫والمفيده‬ ‫المهمه‬ ‫واالنساق‬ ‫االنماط‬ ‫لتحديد‬ ‫البيانات‬ ‫بها‬ ‫تمر‬ ‫والتي‬ ‫المعالجات‬ ‫من‬ ‫مراحل‬ ‫عدة‬ KDD 4. Data selection ‫(اختيار‬where data relevant ‫عالقة‬ to the analysis task are retrieved from the database) 5. Data transformation (where data are transformed into forms appropriate for mining by performing summary operations) 6. Data mining (process where intelligent methods are applied to data patterns ‫البيانات‬ ‫)أنماط‬ 7. Pattern evaluation ‫النمط‬ ‫تقييم‬ (to identify the truly interesting patterns representing knowledge based on measures) 8. Knowledge presentation (where knowledge representation techniques are used to present mined knowledge to users.
  • 4. ‫العاديه‬ ‫االستعالم‬ ‫عملية‬ ‫بين‬ ‫الفرق‬ ‫اوضح‬ ‫ان‬ ‫اريد‬ ‫التنقيب‬ ‫في‬ ‫يحصل‬ ‫ي‬ ‫ال‬ ‫هو‬ ‫ما‬ ‫نفهم‬ ‫لكي‬ ‫البيانات‬ ‫قواعد‬ ‫في‬ Data base Query ‫المنقبه‬ ‫البيانات‬ ‫في‬ ‫واالستعالم‬ : - ‫النوعين‬ ‫كال‬ ‫بين‬ ‫االستعالم‬ ‫في‬ ‫الفرق‬ ‫يوضح‬ ‫ي‬ ‫وال‬ ‫التالي‬ ‫المثال‬ Data base Query vs. Data mining Query .... ‫تجاري‬ ‫سوق‬ ‫في‬ ‫معلومات‬ ‫عن‬ ‫االستعالم‬ base Data ‫العاديه‬ ‫البيانات‬ ‫قاعدة‬ ‫في‬ .1 ‫بخالد‬ ‫الثاني‬ ‫اسمهم‬ ‫ينتهي‬ ‫ين‬ ‫ال‬ ‫للزبائن‬ ‫الكامله‬ ‫المعلومات‬ ‫عن‬ ‫االستعالم‬ * .2 ‫من‬ ‫اكثر‬ ‫بمبلغ‬ ‫اشتروا‬ ‫ين‬ ‫ال‬ ‫الزبائن‬ ‫عن‬ ‫االستعالم‬ 1000 ‫الشهر‬ ‫اخر‬ ‫في‬ ‫دينار‬ * .3 ‫الحليب‬ ‫اشتروا‬ ‫ين‬ ‫ال‬ ‫الزبائن‬ ‫اسماء‬ ‫عن‬ ‫االستعالم‬ * mining Data ‫البيانات‬ ‫عن‬ ‫التنقيب‬ .1 ‫التصنيف‬ ( classification ( ‫مشاكل‬ ‫عليها‬ ‫والتي‬ ‫االئتمانيه‬ ‫البطاقات‬ ‫كل‬ ‫عن‬ ‫االستعالم‬ . .2 ‫العناقيد‬ ‫او‬ ‫التجمع‬ ( clustering ( ‫مماثله‬ ‫شرائيه‬ ‫عادات‬ ‫لديهم‬ ‫ين‬ ‫ال‬ ‫الزبائن‬ ‫عن‬ ‫االستعالم‬ . .3 ‫االرتباط‬ ‫وعالقات‬ ‫قواعد‬ ‫اكتشاف‬ ( rules association ( ‫مع‬ ‫تزامني‬ ‫بشكل‬ ‫شراءها‬ ‫يتم‬ ‫التي‬ ‫السلع‬ ‫عن‬ ‫االستعالم‬ ‫الحليب‬ .
  • 5. DATA MINING MODELS ‫المستخدمه‬ ‫التقنيات‬ ‫بعض‬ ‫البيانات‬ ‫تنقيب‬ ‫في‬ 1- Neural Networks 2- Genetic Algorithms 3- Agent Technology 4- Decision Trees 5- Hybrid Models 6- Statistics
  • 6. ‫تصنيفها‬ ‫تم‬ ‫الدم‬ ‫ضغط‬ ‫الرتفاع‬ ‫دراسة‬ ‫من‬ ‫ت‬ ‫اخ‬ ‫بيانات‬ ‫مجموعة‬ ‫يمثل‬ ‫ي‬ ‫وال‬ ‫التالي‬ ‫المثال‬ ‫القرار‬ ‫شجرة‬ ‫طريقة‬ ‫بأستخدام‬ Decision Trees
  • 7. ‫تض‬ ‫جديدة‬ ‫مجاالت‬ ‫الى‬ ‫الدخول‬ ‫في‬ ‫مستمرة‬ ‫زالت‬ ‫وال‬ ‫وواسعة‬ ‫عديدة‬ ‫مجاالت‬ ‫الى‬ ‫البيانات‬ ‫تنقيب‬ ‫تطبيقات‬ ‫امتدت‬ ‫ما‬ ‫الى‬ ‫اف‬ ‫كاآلتي‬ ‫وهي‬ ‫سبق‬ : 1 - ‫المصرفية‬ ‫األعمال‬ Banking : ‫القروض‬ ‫مخاطر‬ ‫كتحليل‬ 2 – ‫المالية‬ Financial : ‫االسهم‬ ‫تبادل‬ ‫في‬ ‫الغش‬ ‫كتحديد‬ 3 - ‫االتصاالت‬ Telecommunications : ‫لخدماتها‬ ‫المزيف‬ ‫االستخدام‬ ‫كتحديد‬ 4 - ‫التسويق‬ Marketing : ‫للزبون‬ ‫الديموغرافية‬ ‫الخصائص‬ ‫بين‬ ‫العالقة‬ ‫كايجاد‬ 5 - ‫الصحة‬ ‫ورعاية‬ ‫التامين‬ Care Health and Insurance : ‫الدعاوى‬ ‫كتحليل‬ 6 - ‫الطب‬ Medicine : ‫المختلفة‬ ‫لألمراض‬ ‫الناجحة‬ ‫الطبية‬ ‫العالجات‬ ‫كتحديد‬ 7 - ‫النقل‬ Transportation : ‫المناف‬ ‫بين‬ ‫التوزيع‬ ‫جدول‬ ‫كتحديد‬ 8 - ‫بالتجزئة‬ ‫البيع‬ Retailing : ‫الترويج‬ ‫فاعلية‬ ‫كتقدير‬ 9 - ‫الزبون‬ ‫عالقات‬ ‫ادارة‬ Management Relationship Customer : ‫كل‬ ‫اقل‬ ‫النه‬ ‫بالزبون‬ ‫لالحتفاظ‬ ‫الالزم‬ ‫الفعل‬ ‫كاتخا‬ ‫فة‬ ‫جديد‬ ‫زبون‬ ‫كسب‬ ‫من‬ .
  • 8. ‫الواقعية‬ ‫االمثلة‬ ‫من‬ : ‫عل‬ ‫االدارة‬ ‫مساعدة‬ ‫لغـرض‬ ‫العراقـي‬ ‫الصناعي‬ ‫للمصرف‬ ‫القروض‬ ‫بيانات‬ ‫على‬ ‫البيانات‬ ‫تنقيب‬ ‫عملية‬ ‫اجراء‬ ‫تم‬ ‫اتخا‬ ‫ى‬ ‫خطرا‬ ‫يشكل‬ ‫معـه‬ ‫التعامـل‬ ‫كان‬ ‫ا‬ ‫ا‬ ‫فيما‬ ‫الزبون‬ ‫على‬ ‫الحكم‬ ‫من‬ ‫يمكنها‬ ‫ي‬ ‫ال‬ ‫القرار‬ " ‫ال‬ ‫أم‬ ‫المصرف‬ ‫على‬ . ‫تت‬ ‫لك‬ ‫وب‬ ‫من‬ ‫مكن‬ ‫المصرف‬ ‫يتحمله‬ ‫فيما‬ ‫السبب‬ ‫يكون‬ ‫ألنه‬ ‫به‬ ‫موثوق‬ ‫غير‬ ‫هو‬ ‫من‬ ‫واسـتبعاد‬ ‫بهم‬ ‫الموثوق‬ ‫الزبائن‬ ‫على‬ ‫التركيز‬ ‫خسائر‬ ‫من‬ ‫التسديد‬ ‫عدم‬ ‫بسب‬ ‫اقراضـه‬ ‫عـن‬ ‫ناجمة‬ ‫المهيكلة‬ ‫االستفسـار‬ ‫لغـة‬ ‫خـادم‬ ‫يدعى‬ ‫حاسوبي‬ ‫برنامج‬ ‫استخدم‬ ‫التطبيق‬ ‫اجل‬ ‫ومن‬ SQL ‫ي‬ ‫ال‬ ‫يمكن‬ ‫تعريفـه‬ ) Structured Query Language Server 2000 ) Server 2000 ‫البيانـات‬ ‫قاعدة‬ ‫ادارة‬ ‫نظام‬ ‫بانه‬ System Management Database ‫وتحدي‬ ‫لمسح‬ ‫طرائق‬ ‫يقدم‬ ‫فهو‬ ‫المنظمة‬ ‫بيانات‬ ‫ادارة‬ ‫في‬ ‫للمساعدة‬ ‫تـصميمه‬ ‫تـم‬ ‫ي‬ ‫الـ‬ ‫ث‬ ‫متجددة‬ ‫بيانات‬ ‫قاعدة‬ ‫على‬ ‫الحفاظ‬ ‫خاللها‬ ‫من‬ ‫يمكن‬ ‫التي‬ ‫البيانات‬ ‫وادخال‬
  • 9.
  • 10. ‫واحد‬ ‫بمستوى‬ ‫دائمـا‬ ‫تكـون‬ ‫هنـا‬ ‫الشجرة‬ ‫ان‬ ‫عدا‬ ‫تماما‬ ‫القرار‬ ‫شجرة‬ ‫اسلوب‬ ‫بنفس‬ ‫التجمعات‬ ‫تمثيل‬ ‫يتم‬ . ‫وال‬ ‫صفة‬ ‫ختيار‬ ‫العقـدة‬ ‫صفات‬ ‫مجموعة‬ ‫قائمة‬ ‫من‬ ‫لك‬ ‫يكون‬ ،‫الخطر‬ ‫كصفة‬ ‫معينة‬ Set Attribute Node ‫الـشاشة‬ ‫أسفل‬ ‫وسط‬ ‫في‬ . ‫امـا‬ ‫واضـحة‬ ‫غيـر‬ ‫فهـي‬ ‫العقـد‬ ‫أسـماء‬ ( 1 Cluster ، 2 Cluster …… ، ‫ا‬ ‫وهك‬ ) ‫التجمعات‬ ‫ه‬ ‫ه‬ ‫من‬ ‫تجمع‬ ‫لكل‬ ‫لكن‬ ‫على‬ ‫الضغط‬ ‫خالل‬ ‫من‬ ‫القواعد‬ ‫ه‬ ‫ه‬ ‫رؤية‬ ‫ويمكن‬ ،‫التجمع‬ ‫داخل‬ ‫الموجودة‬ ‫القيود‬ ‫تصف‬ ‫التي‬ ‫القواعد‬ ‫مـن‬ ‫مجموعـة‬ ‫العقدة‬ ‫مسار‬ ‫محتويات‬ ‫الى‬ ‫والنظر‬ ‫العقدة‬ path Node ‫الشاشة‬ ‫يمين‬ ‫اسفل‬ ‫في‬ . ‫الخطر‬ ‫لصفــة‬ ‫وباختيارنا‬ Risk ‫االول‬ ‫التجـمع‬ ‫على‬ ‫والضغط‬ 1 Cluster ‫السيئة‬ ‫الحاالت‬ ‫واختيـار‬ bad ‫الشكل‬ ‫يكون‬ ،‫التجمعات‬ ‫لون‬ ‫اساسها‬ ‫على‬ ‫لتبنى‬ ( 3 ( ‫هو‬ ‫الغامق‬ ‫اللون‬ ‫و‬ ‫التجمع‬ ‫ا‬ ‫ه‬ ‫في‬ ‫الحاالت‬ ‫عـدد‬ ‫ان‬ ‫يتـضح‬ ‫حيث‬ 39 ‫منها‬ ‫حالة‬ 12 ‫قرض‬ ‫مخاطر‬ ‫ات‬ ‫حالة‬ ‫سـيئة‬ bad ‫احتمالية‬ ‫بنسبة‬ 18.31 % ‫و‬ 27 ‫جيدة‬ ‫قرض‬ ‫مخاطر‬ ‫ات‬ ‫حالة‬ good ‫احتماليـة‬ ‫بنـسبة‬ 82.68 %