‫التعلم النشط واستقراء قاعدة المعرفه‬       ‫د. وجدي سالم بسباس‬                                                     ‫د. م...
‫أخطئء في تصنيفها، بدل من التستعجال لتصحيح الحاله المشخصة خطأ. السبب الشائع في ظاهرة التصنيف‬   ‫الخاطئ هو ان انتقاء قواني...
‫المرحلة الثانيه )تنفيذ التنقيح والتحقق والتختبار(‬                    ‫يحدد في هذه المرحلة القانون ‪ rule‬المسئول عن الخط...
‫تبدأ عملية التأويل بتعل م هشجرة القرار، وترجع الفكره التساتسيه الى عمل كوينلن 6( ‪ (quinlan‬مستغل فكرة "‬     ‫فرق تسد " ...
‫ويسبب الغاء احد هشروط القانون، زيادة غطاء القانون، بينما يعمل اضافة هشرط للقانون على زيادة نقاوة القانون.‬      ‫يتعل م ا...
‫او اتستخدام اصطلحا ت الجدول 1‬                  ‫1‪x‬‬  ‫= ‪QA‬‬         ‫) 3 ‪x1 x 3 + x 2 (1 − x‬‬  ‫وتقع قيمة ‪ QA‬في ...
‫العمود المعنون "‪ "rules‬يشير الى متوتسط عدد القوانين في قاعدة المعرفه لعدد عشرة اختبارا ت اختير ت‬                      ...
‫على بناء قواعد معرفه من مكتبة من الحال ت المصنفة مسبقا، وتحديثها باتستمرار لتضمين حقائق جديده. ان لهذا‬                  ...
‫الرمز‬                                                                                                                   ...
‫04%‬           ‫مدمجه‬                              ‫04%‬               ‫مدمجه‬                              ‫04%‬       ...
Upcoming SlideShare
Loading in...5
×

Active learning arabic

488

Published on

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
488
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
9
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Active learning arabic

  1. 1. ‫التعلم النشط واستقراء قاعدة المعرفه‬ ‫د. وجدي سالم بسباس‬ ‫د. محمد ابوالقاسم الرتيمي‬ ‫قسم علوم الحاسوب‬ ‫قسم هندسة الحاسوب‬ ‫جامعة السابع من ابريل‬ ‫جامعة السابع من ابريل‬‫بريد الكتروني ‪act@lttnet.net‬‬ ‫بريد الكتروني ‪artemi@yahoo.com‬‬ ‫مستخلص‬ ‫تعرض هذه الورقه طرقا لتعزيز دقة انظمة التعل م التستقرائي، وتهت م بمسائل: تعل م قواعد الرثر ‪production‬‬ ‫مُ‬ ‫‪ rules‬في مهام تصنيف متعددة الفئه ‪ multi-class classification tasks‬في مجال ت مشوهشه ، والبقاء‬ ‫شّ‬‫على تعل م مستمر عند مصادفة وضع جديد عقب انتهاء مرحلة التعل م الولى، وتصنيف كائن ما ‪ object‬عندما ل‬ ‫يوجد قانون ينطبق على ذلك الكائن.‬ ‫لقد اوضحنا ان دمج نسق تقيي م الداء والتعل م يعمل على تقدي م تصنيفا ت دقيقه لفئا ت بيانا ت واقعيه. وتعرض‬‫الورقه النظام أريس ‪ ARIS‬الذي يحقق هذا التسلوب، وقد تبين ان التصنيفا ت الناتجه هي غالبا أدق من تلك التي‬ ‫توفر ت عن طريق قواعد المعرفه غير المنقحه.‬‫يعتمد قرار التصمي م الرئيسي في نظام اريس على ترتيب القوانين ‪ Rules‬طبقا لوزانها، ويت م تعل م وزن القانون‬ ‫باتستخدام نظرية باييز لحساب اوزان هشروط القانون ودمجها، ويركز هذا النموذج على تحليل قاعدة المعرفه‬ ‫ويساند عملية التنقيح بكفاءة.‬‫ان هذا النظام )أي اريس ‪ (ARIS‬ليس تفاعليا، ويعتمد على كاهشفا ت ‪ heuristics‬لتركيز عملية التنقيح على تلك‬‫التجارب التي تبدو اكثر تناغما مع فئة بيانا ت التنقيح. ويتكون الطار التصميمي لنظام ‪ ARIS‬من نموذج جدولي‬ ‫لتمثيل اوزان القانون والعلقه بين حال ت التنقيح والقوانين التي تفي )او تنطبق على( كل حاله لتركيز عملية‬ ‫التنقيح، وقد اتستخدم النظام لتنقيح قواعد معرفه صنعها ‪ ARIS‬بنفسه، وكذلك تنقيح قواعد معرفه اختلقها نظام‬ ‫‪ RIPPER‬ونظام 5.4‪ C‬في عشرة ميادين ت م اختياها.‬ ‫الكلمات المفتاحيه: الذكاء الطصطناعي، تعلم الله، تنقيح قاعدة المعرفه، التعلم النشط‬ ‫1. مقدمه:‬ ‫لقد ادى التطور في تقنية قواعد البيانا ت واتصال ت الحاتسوب الى انتاج مستودعا ت بيانا ت ضخمه وكفؤه‬ ‫في كل المجال ت، مثل معامل ت بطاقة العتماد، والصور الطبيه و عمليا ت مسح الفضاء الجوي كلها تخزن في‬ ‫قواعد بيانا ت ضخمه تتزايد باتستمرار. وتحتاج هذه البيانا ت للتحليل واهشتقاق معلوما ت ذا ت مستوى عال ويمكن‬ ‫ان تكون مجديه في اتخاذ القرارا ت وفي فه م العملية المنتجه للبيانا ت. ولنظمة من هذا النوع نحتاج الى اتساليب‬ ‫مؤتمته تمكنها من اكتساب معرفه لصنع القرارا ت.‬‫يحاول الناس فه م الطبيعه بواتسطة ايجاد تبسيط لهذه الطبيعه )يدعى نموذج(. ويمثل هذا النموذج احداث في البيئه‬ ‫والتشابها ت بين الكائنا ت . تجمع الكائنا ت المتشابهة في اصناف ‪ classes‬رث م تبنى قوانين ‪ rules‬للتنبؤ بسلوك‬ ‫كائنا ت ‪ objects‬جديده لذلك الصنف. نحاول في مجال تعل م الله ميكنة هذه العمليه وبناء توصيفا ت او اوصاف‬‫‪ descriptions‬للصنف )النموذج( باتستخدام اتستراتيجية بحث تكراريه على مكتبه من المثله. ويسمى هذا النوع‬ ‫تعل م اتستقرائي ‪ . inductive learning‬المشكله في التستنتاج التستقرائي هي ان المعرفة المنتجه اتستقرائيا‬‫) تسواء كانت مختلقه بواتسطة البشر او الل ت( هي غير مؤكده ‪ uncertain‬حيث ت م تأتسيسها بناء على عينه فقط‬ ‫من كل الحال ت الممكنه.‬ ‫هناك اتسلوبان هشائعا التستخدام. في التعل م الموجه ‪ supervised learning‬تحدد الصناف ‪ classes‬للنظام‬ ‫بصحبة امثله من كل صنف. اما في التعل م غيرالموجه ‪) unsupervised learning‬او التعل م من الملحظه‬ ‫والكتشاف( فيجب على النظام اكتشاف الصناف من تلقاء نفسه معتمدا على خصائص عامه للكائنا ت. وتقتصر‬ ‫هذه الورقه على التسلوب الول.‬ ‫وتعد مسألة تنقيح قاعدة المعرفه غير التامه )الناقصه/ غير الصحيحه( مفهوما مهما لتحسين القدره التنبؤيه لنظام‬ ‫التعل م على حال ت ل م يت م رؤيتها مسبقا. وقد ظهر ت العديد من التساليب )4،3،2،1(. احد المآخذ على هذه‬ ‫التساليب هو عدم وجود اتستراتيجيه مناتسبه لتعريض فئة الختبار بكاملها للمزيد من التحليل عندما تصادف حاله‬
  2. 2. ‫أخطئء في تصنيفها، بدل من التستعجال لتصحيح الحاله المشخصة خطأ. السبب الشائع في ظاهرة التصنيف‬ ‫الخاطئ هو ان انتقاء قوانين التستنتاج يت م بطريقه اعتباطيه )عشوائيه( وهذا راجع الى ان القوانين يت م ترتيبها‬‫حسب اولوية ظهورها او انتاجها. الفائده من ترتيب القوانين طبقا لمعيار اهمية معينه هو ان ذلك ينج م عنه تطبيق‬ ‫عدد اقل من عوامل التحويل على قاعدة المعرفه.‬ ‫تصف هذه الورقه منهجيه نظريه وتنفيذ لهذه المنهجيه في نظام تنقيح اتستقرائي يدعى أريس ‪ ،ARIS‬والذي‬‫يحقق خطوة للمام باتجاه تحسين انظمة تعل م المفاهي م اتستقرائيا. ويستخدم اريس ‪ ARIS‬عدد من التقنيا ت لتركيز‬ ‫عملية التنقيح على الجزاء الكثر اهميه في قاعدة المعرفه واصلحها.‬ ‫2. المصاعب التي تواجه النظمة الحاليه‬ ‫تلعب قاعدة المعرفه دورا مهما في امكانيا ت الحل لنظمة التعل م، وهي الوحده الكثر قوة، ولكن جرينر‬ ‫5( ‪ (Greiner‬اوضح ان بناء قاعدة معرفه كفؤه هي مسألة غاية في الصعوبه ‪ ، NP hard‬وغالبا ما تكون‬ ‫قاعدة المعرفه التي ت م بناؤها غير متناغمه ‪ inconsistent‬وغير كامله ‪ incomplete‬وقد ل تعمل بكفاءه تامه،‬ ‫بغض النظر عما اذا كانت قاعدة المعرفه هذه قد انتزعت مباهشرة من الخبراء او من خلل تحليل مكتبة من‬ ‫الحال ت. لذا، من الضروري تحديث قاعدة المعرفه للحصول على نموذج أع م ومطور واكثر تأرثيرا. وتعد‬ ‫العتبارا ت التاليه حوافز دافعه لهذا البحث:‬‫• تعاني خوارزما ت تعل م المفاهي م التستقرائيه من عيوب تضعها في هشرك ما يعرف بالقمة المحليه ‪local‬‬ ‫‪ maxima‬والتي قد تكون بعيده جدا عن الحل المثل بشكل عام‬ ‫• يمكن ان تكون انظمة التعل م التستقرائي اكثر ذكاء في حل المسائل اذا دعمت بامكانية دمج تحليل الداء‬ ‫في عملية التعل م. بالتحديد، السماح لنظام التعل م ان يستعل م عما اذا كان احتواء مثال معين في قاعدة‬ ‫المعرفه يزيد بشكل ملحوظ من قوة النظام ام ل. السبب هو ان هذه التغذيه الراجعه )العكسيه(‬ ‫‪ feedback‬تزيد من مقدرة التعل م باتجاها ت مختلفه عن طريق تعمي م ‪ generalize‬قاعدة المعرفه‬ ‫الصليه لتضمين المثله التي تقع خارج التغطيه واتستثناء المثله المضمنة بقاعدة المعرفه بالخطاء.‬ ‫ويض م ذلك تعمي م غطاء القانون وإضافة قانون جديد، وإلغاء قوانين زائده وتخصيص بعض القوانين‬ ‫العامه بشكل مفرط.‬ ‫• تلجأ النظمه الحاليه الى تعيين صنف النسحاب ‪) default class‬صنف الغالبيه( الى حالة يراد‬‫تصنيفها، اذا ل م يتوفر قانون ينطبق على قي م خصائص الحاله. وعند ازدياد عدد الحال ت لكثر من ارثنين‬ ‫يزداد احتمال الخروج بتنبؤا ت خاطئه. ومن رث م يتطلب المر تقنية بديله‬ ‫3. بنية نظام اريس ‪ARIS‬‬ ‫يعمل نظام اريس مبدئيا على انتاج قاعدة معرفه باتستخدام التستقراء على مجموعه من امثلة التدريب،‬ ‫ويواصل النظام بعد ذلك اختبار قاعدة المعرفه على مجموعه منفصله من البيانا ت لغراض التنقيح وتسمى هذه‬ ‫الفئه فئة بيانا ت التنقيح ‪ . refinement data set‬بعد هذا الختبار وفقط في حالة بروز تصنيف خاطئ لبعض‬ ‫بيانا ت التنقيح يستدعى النظام الفرعي للتنقيح. واخيرا يختبر النظام على فئة منفصلة خاصه بالختبار لتعمي م‬ ‫عملية التنقيح. يعمل نظام التنقيح على تحديد الخطاء المحتمله في قاعدة المعرفه، ويستدعي مكتبة من العوامل‬ ‫لكتشاف التنقيح الممكن بمساعدة دالة كاهشفه عامه ‪ ، global heuristic‬ويطبق افضل تنقيح، وتتكرر العمليه‬ ‫حتى تنتهي كافة التنقيحا ت الممكنه.‬ ‫يؤدي نظ م اريس بحثا في فضاء من عوامل التخصيص ‪ specialization‬والتعمي م ‪ generalization‬في‬ ‫محاولة ليجاد ادنى تنقيح او تعديل لقاعدة المعرفه. ومن حيث المفهوم توجد رثلرثة مراحل رئيسية لنظام التنقيح،‬ ‫تنفذ ارثنتان منها لكل فرضيه او صنف متوفر بقاعدة المعرفه، بينما يحافظ على ترتيب القوانين ‪ rules‬وفقا‬ ‫لوزانها‬ ‫المرحلة الولى )المركزه ‪(Localization‬‬ ‫يت م خلل هذه المرحله تحديد كافة الحال ت التي أخطئء في تصنيفها من ضمن فئة التنقيح والتي تنتمي الى‬ ‫صنف ‪ class‬معين. وتمنح كل حاله وزن ‪ weight‬من خلل القوانين التي تنطبق على الحاله، ويشير هذا الى‬ ‫التشابك عند هذه النقطه )الحاله( في فضاء الصنف )الفرضيه(. ويت م اختيار الحاله ذا ت العلى وزن من بين‬ ‫الحال ت التي أخطىء في تصنيفها، لن هذا يحدد القانون القوى من فئة القوانين الخاطئه.‬
  3. 3. ‫المرحلة الثانيه )تنفيذ التنقيح والتحقق والتختبار(‬ ‫يحدد في هذه المرحلة القانون ‪ rule‬المسئول عن الخطاء، ويت م تجربة كافة عوامل التنقيح الممكنه، أي يت م‬ ‫تخصيص القانون الخاطيء ، ويعم م قانون آخر مشابه يغطي الصنف المقصود، كما يستحدث قانون جديد .‬ ‫تجرب كافة العوامل الممكنه وتختبر قاعدة المعرفه ويحتفظ بالداء الناتج. أخيرا يت م اختيار عامل التنقيح او‬ ‫مجموعة العوامل التي تعطي افضل اداء. وتكرر العمليه حتى ل تبقى اية تحسينا ت اخرى ممكنه.‬ ‫المرحلة الثالثه )التأكد من الكمال وإزالة القوانين الزائده(‬ ‫أخيرا، تفحص قاعدة المعرفه للتأكد من تمامها . ويجب تغطية كل حاله بقانون واحد على القل. اذا كانت هناك‬ ‫حال ت غير مشموله بالقوانين المتوفره ، فيمكن اضافة قوانين جديده . إضافة الى ذلك تزال القوانين الزائده عن‬ ‫الحاجه. المكونا ت التساتسيه لنظام اريس ‪ ARIS‬هي مولد الشجره ‪ tree generator‬و مولد القوانين ‪rule‬‬ ‫شّ‬ ‫شّ‬ ‫‪ generator‬و مولد التنقيح ونموذج الحك م ‪ judgement module‬و آلية التستنتاج ‪. inference engine‬‬ ‫مولد التنقيح هو المسئول عن تطبيق كل التنقيحا ت الممكنه لعلج أي خطأ تصنيفي ويمكن ان تتغير القوانين‬‫شّ‬ ‫بواتسطة تحريرها )ويدعى التمكين ‪ (enabling‬او منعها من التحرر )ويسمى العاقه ‪ . (disabling‬يختار‬‫نموذج الحك م ‪ judgement module‬عامل التنقيح او مجموعة العوامل التي تنتج افضل تحسين على اداء قاعدة‬ ‫المعرفه مع ضرورة تصحيح الحال ت المصنفه خطأ في السابق. ويوضح الشكل ادناه بنية نظام اريس ‪. ARIS‬‬ ‫بيانا ت اختبار‬ ‫بيانا ت تنقيح‬ ‫المصنف‬ ‫شّ‬ ‫مولد القانون‬ ‫شّ‬ ‫نتيجة التنبؤ‬ ‫(آلية التستنتاج‬ ‫بيانا ت التدريب‬ ‫مولد الشجره‬ ‫قاعدة‬ ‫مرتب القوانين‬ ‫القوانين مرتبة‬ ‫بّ‬ ‫شّ‬ ‫القوانين‬ ‫مولد التنقيح‬ ‫شّ‬ ‫شّ‬ ‫قائمة القوانين المنقحه‬ ‫شّ‬ ‫قاعدة معرفه‬ ‫منقحه‬ ‫شّ‬ ‫البنيه الساسيه‬ ‫نموذج التنقيح‬ ‫الشكل 1: بنية النظام أريس‬ ‫4. استقراء قاعدة المعرفه‬ ‫ت م اتستخدام تمثيل القضايا ‪ propositional representation‬كلغة تمثيل المعرفه، ويستخدم تمثيل القضايا‬ ‫صيغ المنطق المحتويه على هشرط وقيمة الخاصيه .‪ attribute-value condition‬فمثل‬‫‪(colour=red v colour=green) & shape=circle‬‬ ‫)اللون=احمر او اللون=اخضر( و الشكل=دائره‬ ‫وتأخذ قاعدة المعرفه هشكل قوانين أرثر )او انتاج( ‪ production rule‬والتي يمكن ان تحتوي على اتستثناءا ت‬ ‫محليه للقانون مثل‬‫‪IF outlook=sunny & humidity=low THEN class=mild‬‬‫‪IF outlook=rain & windy=true THEN class=dont play‬‬ ‫‪UNLESS‬‬ ‫‪Covered_stadium=true‬‬ ‫وليت م بناء نماذج تصنيف، يعرض على اريس ‪ ARIS‬ملف يحتوي على اوصاف قيمة-خاصيه -‪attribute‬‬ ‫‪ value‬لفئة من الحال ت التي ت م تعريف اصنافها، وكل حاله هي وصف لكائن واحد. يحلل نظ م اريس بيانا ت‬ ‫التدريب ‪ training data‬ويولد فئة من قوانين الرثر في صيغة القضايا التي تصف المفاهي م ‪. concepts‬‬ ‫شّ‬
  4. 4. ‫تبدأ عملية التأويل بتعل م هشجرة القرار، وترجع الفكره التساتسيه الى عمل كوينلن 6( ‪ (quinlan‬مستغل فكرة "‬ ‫فرق تسد " واوضحت التجارب ان تحويل هشجرة القرار الى مجموعة من القوانين يؤدي الى قوانين واضحه‬ ‫شّ‬ ‫ومفهومه وذا ت تنبؤ دقيق على حال ت ل م يسبق مصادفتها. إن إعادة كتابة هشجرة في هشكل مجموعة من‬ ‫القوانين ،قانون لكل مسار بالشجره لن ينتج تراكيب ابسط لنه ببساطه يوجد قانون واحد لكل وريقه طرفيه.‬ ‫ولكن بالتفحص الجيد عن قرب في مقدمة القانون قد نتعرف على بعض الشروط التي ليست ذا ت علقه. الغاء‬ ‫شّ‬‫الشروط الزائده ينتج قانون جديد بدون التأرثير في دقة القانون الصلي، مما يجعل القانون اكثر قبول. ولفه م الفكره‬ ‫من وراء إلغاء الشروط نفرض ان القانون ‪ G‬هو‬‫‪IF A THEN class C‬‬ ‫حيث ان ‪ A‬هي اتحاد لمجموعة هشروط 3‪.……,a1,a2,a‬‬ ‫وقانون آخر اكثر عمومية ‪ G‬هو‬‫‪IF A THEN class C‬‬ ‫حيث ان ‪ A‬يتحصل عليها بالغاء هشرط واحد ‪ ai‬من الشروط ‪. A‬‬ ‫كل حاله في بيانا ت التدريب التي تشملها المقدمه القصيره ‪ A‬اما انها تنتمي او ل تنتمي الى الصنف المعني‬ ‫‪ ، C‬وانها ترضي او ل ترضى الشرط ‪ai‬‬ ‫يمكن تنظي م عدد الحال ت في كل مجموعه كما يلي:‬ ‫الصنف‬ ‫اصناف اخرى‬ ‫‪C‬‬ ‫حال ت ترضي الشرط ‪ai‬‬ ‫1‪S‬‬ ‫1‪E‬‬ ‫حال ت ل ترضي الشرط ‪ai‬‬ ‫2‪S‬‬ ‫2‪E‬‬ ‫يوجد عدد 1‪ S1+E‬حاله من الحال ت التي تغطيها ‪ A‬وهي ترضي الشرط ‪) ai‬بمعنى ان القانون ‪ G‬يشملها(‬ ‫حيث ان منها عدد 1‪ E‬يصنفها القانون ‪ G‬تصنيف غير صحيح. ويوجد عدد 2‪ S2+E‬حاله مغطاة بواتسطة القانون‬ ‫المعم م ‪ G‬ول يغطيها القانون الصلي. يوجد منها عدد 2‪ E‬ت م تضمينها بالخطأ، حيث انها تنتمي الى اصناف‬‫اخرى. وحيث ان ‪ G‬تغطي كل الحال ت التي يغطيها ‪ G‬ايضا، فإن عدد الحال ت المغطاة بواتسطة ‪ G‬هي +1‪S‬‬‫2‪ . S2+E1+E‬اتستخدم اختبار الهميه ‪ test of significance‬على الجدول اعله لتقرير ما اذا كان من الواجب‬ ‫2 ‪E1 + E‬‬‫للقانون ‪G‬‬ ‫2 ‪S1 + S‬‬ ‫الغاء الشرط ‪ .ai‬الفكره هي ان يبقى الشرط ‪ ai‬فقط عندما يكون معدل الخطأ الحقيقي‬ ‫1‪E‬‬ ‫لقانون ‪ . G‬انه من غير المرجح للقانون الذي يرتكب نسبة خطأ مقدارها‬ ‫1‪S‬‬ ‫اكبر من معدل الخطأ الحقيقي‬ ‫‪E‬‬ ‫‪E‬‬ ‫على حال ت ل م يسبق رؤيتها، لذا ت م اتستخدام مقياس‬ ‫‪N‬‬ ‫في بيانا ت التدريب ان يكون له خطأ في حدود‬ ‫‪N‬‬ ‫خطأ تقديري يدعى تقدير لبلس للخطأ ‪Laplace error estimate‬‬ ‫1+ ‪E‬‬ ‫حيث ان ‪ N‬هو عدد امثلة التدريب وان عدد ‪ E‬منها تنتمي الى اصناف غير الصنف المعني ‪ . C‬لذا‬ ‫2+ ‪N‬‬ ‫يحتفظ بالشرط ‪ ai‬فقط اذا كان الغاؤه يحدث معدل خطأ حقيقي اكبر من خطأ النسحاب. وبالطبع، يمكن الغاء‬ ‫اكثر من هشرط في القانون عند تعمي م القانون. ويعمل النظام على تطبيق اتسلوب هشره ‪ greedy approach‬في‬ ‫الغاء الشروط التي تنتج اقل معدل خطأ حقيقي للقانون المعم م.‬‫لقد ت م تطوير اتسلوب آخر لبناء القوانين، ويوجه هذا التسلوب بواتسطة دالة تقيي م كاهشفه ‪heuristic evaluation‬‬ ‫‪ function‬لتقيي م جودة القانون بتطبيق خاصيتين مهمتين وهما الكمال ‪ completeness‬والتناغ م‬ ‫‪ .consistency‬ويت م احتساب قيمة جودة الداله باتستخدام‬ ‫, ‪Quality ( rule‬‬ ‫‪α‬‬ ‫= )‬ ‫(‬‫−1‬‫+‬‫‪α‬‬ ‫+ + ‪consistencu ) completeness‬‬ ‫(‬ ‫‪α‬‬ ‫‪consistenc y ) consistency‬‬ ‫)1(‬ ‫‪# correctly covered examples‬‬ ‫= )‪consistency ( rule‬‬ ‫‪# covered examples‬‬ ‫‪# correctly covered examples‬‬ ‫= )‪completeness ( rule‬‬ ‫‪# of examples of same class as rule‬‬
  5. 5. ‫ويسبب الغاء احد هشروط القانون، زيادة غطاء القانون، بينما يعمل اضافة هشرط للقانون على زيادة نقاوة القانون.‬ ‫يتعل م اريس ‪ ARIS‬القوانين )باتستخدام هذا التسلوب( بحيث تركز بشكل اكبر على التناغ م وبشكل اقل على‬ ‫التغطيه ‪ ،coverage‬ولكن يمكن تغيير هذا بتعديل قيمة المتغير ‪ .α‬هذه دالة كاهشفه، نتجت من تجارب‬ ‫وملحظا ت مع ‪ ARIS‬في عدة مجال ت فعليه. يعمل اعتماد جودة القانون على التناغ م كطريقه لبراز بعض‬ ‫المرونه، والتكيف مع اوضاع متنوعه )مثل القوانين التي تغطي حال ت نادره او القوانين العامه جدا(. لقد ت م‬‫تثبيت قيمة المتغير ‪ α‬ليساوي 8.0 وتعظي م جودة الداله )1(. ويساعد عامل الكمال او التمام على تفضيل القوانين‬ ‫التي تغطي حال ت اكثر عندما يتساوى التناغ م كما يوضحه المثال ادناه:‬ ‫بفرض ان لدينا عدد من البيانا ت =)01 حال ت منها 5 موجبه و عدد 5 تسالبه( واذا كان لدينا قانونين:‬ ‫قانون 1: يغطي 3 حال ت كلها تنتمي الى الصنف +‬ ‫والقانون 2: يغطي 4 حال ت ، كلها تنتمي الى الصنف + فان‬ ‫وللقانون 2‬ ‫للقنون الول‬ ‫التناغ م=4÷4=1‬ ‫التناغ م=3÷3=1‬ ‫الكمال=4÷5= 8.0‬ ‫الكمال=3÷5= 6.0‬ ‫كما ترى، كل القانونين لهما القيمه) 1 ( لمعامل التناغ م بينما يختلف معامل الكمال. لذا فان اضافة عامل الكمال‬ ‫تسيكون له معنى حيث ان معامل التناغ م وحده غير كاف. بعد تعل م كافة القوانين، يشكل ‪ ARIS‬تقديرا لوزان‬ ‫تربط بكل قانون ويت م تقدير الوزن باتستخدام حال ت فئة التدريب بكاملها.‬ ‫5. احتساب وزن القانون‬ ‫يت م تقدير وزن القانون من خلل تشكيله من الوزان لخصائص القانون، ويمكن تعريف وزن القانون بانه:‬ ‫مقياس الثقه في معتقد القانون ‪ ، Rules opinion‬مبرزا اهمية الشروط للعتقاد )الفتراض او الصنف( ،‬ ‫ويسمح لنا هذا بمعايرة قوة القانون بطريقة عمليه. يصف الجدول 1 المصطلحا ت ذا ت العلقه بهذا الشأن.‬ ‫ونستخدم نظرية باييز ‪ Bayes‬لهشتقاق الوزان لكل جزئيه في القانون.‬‫تخيل فضاء عينه تقسمه الحداث 2‪ . ……,E1,E‬وافترض ان ‪ +H‬تعني حدث في الفضاء يشير الى صنف )او‬ ‫شّ‬ ‫مفهوم( معين باحتمال > 0 )+‪،P(H‬‬ ‫اذا‬ ‫) ‪P(H + E j )P(E j‬‬ ‫|‬ ‫= + ‪P(E j | H‬‬ ‫)‬ ‫= ‪,i‬‬‫..2,1‬ ‫) ‪+ E )P(E‬‬ ‫∑‬ ‫‪P(H‬‬ ‫|‬ ‫‪i‬‬ ‫‪i‬‬ ‫وكمثال بسيط ذو هشرطين وافتراضين)أو صنفين( ‪-h+,h‬‬ ‫) 1‪P ( H + | E1 ) P ( E‬‬ ‫= ) + ‪P( E I | H‬‬ ‫+‬ ‫‪P( H‬‬ ‫) 2 ‪| E1 ) P ( E1 ) + P ( H + | E 2 ) P ( E‬‬ ‫+‬ ‫‪P( H‬‬ ‫) 1‪| E1 ) P ( E‬‬ ‫=‬ ‫+‬ ‫+‬ ‫‪P( H‬‬ ‫‪| E1 ) P ( E1 ) + P ( H‬‬ ‫) 1‪|~ E1 ) P (~ E‬‬ ‫+‬ ‫‪P( H‬‬ ‫) 1‪| E1 ) P ( E‬‬ ‫=‬ ‫+‬ ‫+‬ ‫‪P( H‬‬ ‫‪| E1 ) P ( E1 ) + P ( H‬‬ ‫) 1‪|~ E1 ) P(1 −E‬‬ ‫يمكننا تعريف هذا بالمعادله 2 ادناه‬ ‫+‬ ‫‪P(E 1 | H‬‬ ‫= )‬‫∗ ‪QA‬‬‫) 1 ‪P(E‬‬ ‫)2(‬ ‫حيث ان‬ ‫+‬ ‫‪P( H‬‬ ‫) 1‪| E‬‬ ‫= ‪QA‬‬ ‫+‬ ‫+‬ ‫‪P( H‬‬ ‫‪| E1 ) P ( E1 ) + P ( H‬‬ ‫)) 1‪|~ E1 )(1 −P ( E‬‬
  6. 6. ‫او اتستخدام اصطلحا ت الجدول 1‬ ‫1‪x‬‬ ‫= ‪QA‬‬ ‫) 3 ‪x1 x 3 + x 2 (1 − x‬‬ ‫وتقع قيمة ‪ QA‬في الفتره ]0,+‪ . [INF‬اذا نظرنا الى المعادله 2 على اتساس انها صيغة تحديث للمعتقد في 1‪E‬‬ ‫فان قي م ‪ QA‬الكبر من 1 يبدو انها تزيد من 1‪ (P(E‬وبالمثل القي م الصغر من 1 تقلل من 1‪ .(P(E‬لذا يمكن‬ ‫اعتبار ‪ QA‬على اتساس نها وزن ، يحمله الدليل ‪،E‬والذي يحرك المعتقد بهذا التجاه او ذاك. تدل الوزان‬‫الموجبه على دليل داع م للصنف، وتدل الوزان السالبه على دليل عكسي يعارض الفتراض)او الصنف(. وتجمع‬ ‫الداله التاليه اوزان كل هشرط في وزن واحد للقانون‬ ‫+ ]]) 1‪w = E1 + E 2 (1 − E1 ) + E3 [1 −w E1 + E 2 (1 − E‬‬ ‫‪w‬‬ ‫‪w‬‬ ‫‪w‬‬ ‫‪w‬‬ ‫[‬ ‫‪w‬‬ ‫‪w‬‬ ‫...‬ ‫حيث ان ‪ W‬هي وزن القانون. ويحسب هذا تأرثير الختبارا ت في مقدمة القانون ،حيث ان 0=>1=<‪.W‬‬‫ولكننا مهتمين بحصر قي م وزن الدليل في الفتره ]-1,+1[. لذا فقد اتستخدمت الداله التاليه لحالة القيمه الى المدى‬ ‫المطلوب‬‫)‪W=F(QA‬‬ ‫حيث ان‬ ‫‪2QA‬‬ ‫‪where‬‬ ‫= )‪F(QA‬‬ ‫−‬‫1‬ ‫+1‬‫‪QA‬‬ ‫وتنتج هذه المعادله قيمة للوزن في المدى ]-1,+1[. الوزن للقانون هو اندماج لوزان اختباراته ، واتستخدم هذا‬ ‫الوزن كمعيار ترتيب لتنظي م القانون وللمساعده في التصنيف وايضا داعما لعملية التنقيح.‬ ‫6. المعرفه الخاطصه بالتنقيح ‪Refinement knowledge‬‬ ‫الهدف من تنقيح قاعدة المعرفه هو تقليل عدد الخطاء الموجبه ‪ false positive‬والخطاء السالبه ‪false‬‬ ‫‪ negative‬في حال ت جديده، مع تقليل عدد الخطاء الجديده الموجبه والسالبه في الحال ت المشخصه حديثا.‬ ‫وحيث أن هناك علقه بين الكمال والتناغ م عند تنقيح قاعدة المعرفه فاننا نعرف جودة قاعدة المعرفه كما يلي:‬ ‫شّ‬ ‫,‪Quality ( KB‬‬ ‫‪α‬‬ ‫+−= )‬ ‫(‬‫1‬ ‫‪α‬‬ ‫+ + ‪consistency ) completeness‬‬ ‫(‬ ‫‪α‬‬ ‫‪consistency ) consistency‬‬ ‫‪# correctly covered cases‬‬ ‫= ‪completeness‬‬ ‫‪# of all cases‬‬ ‫‪# correctly covered cases‬‬ ‫= ‪consistency‬‬ ‫‪# covered cases‬‬ ‫خلل تجاربنا، ت م تثبيت القيمه 8.0 للمتغير ‪ .α‬وهذا يحقق الهدف المنشود للتنقيح والذي يحسب جودة قاعدة‬ ‫المعرفه كتشكيله من الكمال والتناغ م.‬ ‫7. نتائج عمليه‬ ‫حاول البحث المعروض في هذه الورقه ايجاد طريقة افضل لتستغلل المعلوما ت في مجال ت بها البيانا ت‬ ‫المتاحه كبيرة الحج م وتنمو باتستمرار، مثل بيئا ت تجميع البيانا ت المؤتمته ‪.automated‬‬‫الجدول 2 يلخص تجارب توضح التحسن في دقة التصنيف بعد انتهاء عمليا ت التنقيح. العمود الول في الجدول 3‬ ‫شّ‬ ‫يصف المجال المستخدم في التجارب، وت م دمج الجدول في رثلرثة مجاميع: المجموعة الولى تلخص النتائج قبل‬ ‫وبعد التنقيح لقواعد معرفه صنعها نظام ‪ ARIS‬وت م فيها اتستخدام معياري الكمال والتناغ م، وتحتوي المجموعه‬‫الثانيه على معلوما ت قبل وبعد التنقيح على بيانا ت اختبار لقواعد معرفه طورها نظام 5.4‪ .C‬اما المجموعة الثالثه‬ ‫فتحتوي على معلوما ت قبل وبعد التنقيح على بيانا ت اختبار لقواعد معرفه اختلقها نظام ‪ .RIPPER‬وفي كل‬ ‫مجموعه ت م تقدي م المعلوما ت التاليه:‬
  7. 7. ‫العمود المعنون "‪ "rules‬يشير الى متوتسط عدد القوانين في قاعدة المعرفه لعدد عشرة اختبارا ت اختير ت‬ ‫عشوائيا في كل مجال.‬ ‫العمود "‪ "%acc‬يعطي دقة التنبؤ لقاعدة المعرفه على فئة بيانا ت معينه لعدد 01 محاول ت‬ ‫شّ‬ ‫وتشير العلما ت ) √ ( الى ان عمليا ت التنقيح نتج عنها تحسن في دقة قاعدة المعرفه.‬ ‫شّ‬ ‫شّ‬ ‫وتعد مركمة قاعدة المعرفه خاصيه هامه للتحليل، اذ يعمل كل من نظام ‪) ARIS‬نقصد انتاج القوانين باتستخدام‬ ‫خاصيتي الكمال والتناغ م( ونظام 5.4‪ C‬على انتاج قوانين من نماذج هشجرة قرار مستقراه بتحليل قاعدة بيانا ت‬ ‫مكونه من امثله، وكل النظامين ينتج قوانين زائده.تحذف هذه القوانين الزائده خلل دورة التنقيح. ومن جهة‬ ‫شّ‬ ‫اخرى ينتج نظام ‪ RIPPER‬قواعد معرفه موجزه، وهناك حاجه لضافة قوانين كنتيجة لمعلوما ت اضافيه‬ ‫وخاصة في حالة ما ل م يعمل تعمي م القوانين الحاليه في المساعدة على تغطية البيانا ت التي تت م مصادفتها.‬ ‫8. المقارنه بين ةثلةثة انظمه‬ ‫الهدف من هذا الجزء هو تحديد متى يمكن لتستراتيجية التقيي م إحداث نتائج افضل من تدريب نظام التعل م على‬ ‫كافة البيانا ت المتاحه، ويتضمن اتسلوبنا في المقارنه، التستراتيجية التاليه:‬ ‫• اتستقراء قاعدة المعرفه بواتسطة تدريب نظام التعل م على 04% من البيانا ت المتاحه رث م تنقيحها باتستخدام‬ ‫02% من البيانا ت المتوفره‬ ‫• اتستقراء قاعدة المعرفه بواتسطة تدريب النظام باتستخدام 06% من البيانا ت المتاحه‬ ‫• قارن الداء لقواعد المعرفه المنتجه وذلك باختبار التسلوبين على باقي البيانا ت )04%(.‬ ‫• الجدول 3 هو مقارنه اخرى للنظمة الثلرثه أي 5.4‪ ،ARIS ، C‬و نظام ‪ RIPPER‬على مجال ت‬ ‫اختبار منتقاه. تمت مقارنة نتائج التقيي م لقواعد معرفه مستقراه بواتسطة دمج كل من فئة بيانا ت التدريب‬ ‫وفئة بيانا ت التنقيح كفئة تدريب مدمجه، وهذا يعطي مقارنه عادله بين كل من ‪،ARIS‬و 5.4‪ ،C‬و‬ ‫‪ .RIPPER‬يبين العمود الول المجال المستخدم، ويوضح العمود الثاني اداء نظام ‪ ARIS‬على بيانا ت‬ ‫الختبار حينما يدرب على 04% من البيانا ت المتاحه. ويعطي العمود الثالث اداء نظام ‪ ARIS‬على‬ ‫نفس بيانا ت الختبار عند تدريبه على بيانا ت التدريب المدمجه )أي بيانا ت التدريب والتنقيح معا(.‬ ‫ويعطي العمود الرابع اداء قاعدة المعرفه على بيانا ت الختبار بعد التنقيح. العمود الخامس يزودنا باداء‬ ‫نظام 5.4‪ C‬على بيانا ت الختبار عند تدريبه على 04% من البيانا ت المتاحه. اما العمود السادس‬ ‫فيوضح اداء نظام 5.4‪ C‬على بيانا ت الختبار عند تدريبه على البيانا ت مدمجة. ويشير العمود السابع‬ ‫الى اداء قاعدة المعرفه المنقحة والمستقراة بواتسطة نظام 5.4‪ C‬على نفس بيانا ت الختبار. يوضح‬ ‫شّ‬ ‫العمود الثامن اداء نظام ‪ RIPPER‬على ذا ت بيانا ت الختبار عند تدريبه على 04% من البيانا ت‬ ‫المتوفره. ويعطي العمود التاتسع اداء نظام ‪ RIPPER‬على بيانا ت الختبار عند تدريبه على البيانا ت‬ ‫مدمجة. ويبرز العمود العاهشر اداء قاعدة المعرفه المنقحه والمستقراة بواتسطة ‪ RIPPER‬على نفس‬ ‫شّ‬ ‫بيانا ت الختبار.‬ ‫وتشير العلما ت ) √( الى المواضع التي انتجت فيهاعملية التدريب متبوعة بالتنقيح نتائج جيده افضل من تلك‬ ‫المتحصل عليها عن طريق التدريب على البيانا ت بأكملها.‬ ‫وتوضح التجارب الفرق الواضح في اتستقراء القوانين بين كل من نظامي 5.4‪C‬و ‪ .RIPPER‬بالتحديد، يولد‬ ‫شّ‬ ‫نظام 5.4‪ C‬العديد من القوانين والتي يؤدي بعضها الى تضارب فيما بين القوانين. ويعمل نسق التنقيح المبين‬ ‫شّ‬ ‫على الغاء مثل هذه القوانين الزائده مما يزيد من دقة قاعدة المعرفه. من ناحية اخرى ، يعمل اتسلوب ‪RIPPER‬‬ ‫شّ‬ ‫في اتستقراء القوانين على انتاج عدد اقل من القوانين، لذا فانه خلل التنقيح يؤدي نظام ‪ ARIS‬عدد اكبر من‬ ‫عمليا ت بناء القوانين ويظهر القليل من عمليا ت الغاء القوانين على قواعد المعرفه الخاصه بنظام ‪.RIPPER‬‬ ‫باختصار، تعمل آلية التنقيح على تحسين جودة وصف الصناف لكافة الخوارزميا ت في رثلرثة مجال ت طبيه‬ ‫)وهي ‪ Hepatitis‬و ‪ Hypothyroid‬و ‪( Heart‬وهي ذا ت معضل ت مثل التشويش )عدم النقاوه( و مشكلة‬ ‫الحال ت الخاصه الصغرى. وفوق ذلك ت م الحصول على تحسينا ت على عدة مجال ت اخرى عديده اتستخدم فيها‬‫نظامي 5.4‪ C‬و ‪ ARIS‬على التوالي. لذا ينصح بان تستخدم نظ م التعل م آلية تنقيح على بيانا ت اختبار والتي تكون‬ ‫منفصله عن بيانا ت التدريب المستخدمة في اتستقراء قاعدة المعرفه كما في نظام ‪ RIPPER‬و 5.4‪ C‬للحصول‬ ‫على اوصاف مفاهي م ذا ت جودة عاليه.‬ ‫9. الستنتاج‬ ‫تعرضت هذه الورقه لمسألة بناء اوصاف مفاهي م ‪ concept descriptions‬في مجال ت كبيرة الحج م،‬ ‫حتى يمكن التستفاده من كميا ت هائله من البيانا ت المتزايده باتستمرار. وت م تطوير نموذج تنقيح اتستقرائي قادر‬
  8. 8. ‫على بناء قواعد معرفه من مكتبة من الحال ت المصنفة مسبقا، وتحديثها باتستمرار لتضمين حقائق جديده. ان لهذا‬ ّ‫ش‬ .‫النموذج اهمية خاصه في المجال ت المتغيرة والمشوهشه مثل معامل ت بطاقة العتماد والصور الطبيه‬ ّ‫ش‬.(‫لقد طورنا اتسلوبا لتعل م وزن القانون معتمدا على تقدير للعلقه بين هشروط القانون وخاتمة القانون )او التستنتاج‬ .‫ورتبت القوانين طبقا لوزانها لتحديد الحال ت التي أخطيء في تصنيفها بسهولة‬ ‫01. المراجع‬[1] Aha David w., Goldstone Robert L., Concept learning and flexible weighting,Proceedings of the Fourteenth Annual Conference of the cognitive Science Society,Bloomington, 1992, pp. 534-539.[2] Benferhat Salem, Dobois Didier, Prode Heneri, Nonmonotonic reasoning,Conditional objects and possibility theory. Artificial Intelligence,1997, pp. 259-276[3] Breiman Leo, Friedman Jerome, Olshen Richard, Stone Charles, Classificationand regression trees. Wadsworth, Pacific Grove, CA, 1984.[4] Brunk Clifford. An investigation of knowledge intensive approaches to conceptlearning and theory refinement. Ph.D. thesis, University of California, 1996.[5] Greiner Russell, The complexity of theory revision, Proceedings of the FourteenthInternational Joint Conference on Artificial Intelligence, Montreal, 1995.[6] Quinlan John Ross, C4.5, Programs for machine learning, Morgan Kaufman,1993.
  9. 9. ‫الرمز‬ ‫الوصف‬ ‫‪Ei‬‬ ‫تشير الى حدث او دليل )02=<‪.(eg. Age‬‬ ‫~ ‪Ei‬‬ ‫تشير الى متم م الحدث 02>‪((Ei eg. Age‬‬ ‫+‬ ‫‪H‬‬ ‫تدل على فضاء الحال ت الموجبه للفرضيه او الصنف )‪(eg. Healthy‬‬ ‫-‬ ‫‪H‬‬ ‫تدل على فضاء الحال ت السالبه للفتراض )‪(eg. Sick‬‬ ‫‪(P(Ei‬‬ ‫تمثل التوزيع المسبق للكائنا ت او الحال ت في مدى الشرط نسبة الى العدد الكلي للمثله )02>‪.((e.g. P(Age‬‬ ‫‪(X1 = P(H|Ei‬‬ ‫‪.(Ei‬‬ ‫الجزء من الحال ت الموجبه المغطاة بالشرط ‪(i.e. True positives TP‬‬‫‪(X2 = P(H|~Ei‬‬ ‫‪ Ei‬نسبة الى متم م ‪.(Ei (i.e. False negatives FN‬‬ ‫جزء الحال ت الموجبه غير المغطاه بالشرط‬ ‫‪(X3=P(Ei‬‬ ‫جزء الحال ت التي يشملها الدليل ‪ E‬نسبة الى العدد الكلي‬ ‫الجدول 1: اطصطلحات وزن الشرط بالقانون‬ ‫نظام أريس مستخدما الكمال والتناغم‬ ‫نظام 5.4‪C‬‬ ‫نظام ‪RIPPER‬‬ ‫المجال‬ ‫قبل التنقيح‬ ‫بعد التنقيح‬ ‫قبل التنقيح‬ ‫بعد التنقيح‬ ‫قبل التنقيح‬ ‫بعد التنقيح‬ ‫# ‪rules‬‬ ‫‪% Acc‬‬ ‫‪% Acc‬‬ ‫# ‪rules‬‬ ‫# ‪rules‬‬ ‫‪% Acc‬‬ ‫‪% Acc‬‬ ‫# ‪rules‬‬ ‫# ‪rules‬‬ ‫‪% Acc‬‬ ‫‪% Acc‬‬ ‫# ‪rules‬‬ ‫بيانات نبات السوسن‬ ‫6.2‬ ‫71.39‬ ‫√‬ ‫76.59‬ ‫3‬ ‫6.4‬ ‫5.39‬ ‫5.39‬ ‫5.2‬ ‫6.2‬ ‫76.09‬ ‫√‬ ‫99.09‬ ‫1.3‬ ‫بيانات النبيذ‬ ‫1.3‬ ‫63.78‬ ‫√‬ ‫21.88‬ ‫1.4‬ ‫7.5‬ ‫27.98‬ ‫27.98‬ ‫3.4‬ ‫8.2‬ ‫52.68‬ ‫√‬ ‫46.78‬ ‫8.3‬ ‫بيانات التهاب الكبد‬ ‫3‬ ‫55.87‬ ‫√‬ ‫25.97‬ ‫5.4‬ ‫9.5‬ ‫23.08‬ ‫√‬ ‫16.18‬ ‫7.3‬ ‫3.1‬ ‫62.77‬ ‫√‬ ‫85.77‬ ‫4.3‬ ‫بيانات الغدة الدرقيه‬ ‫4.3‬ ‫98.79‬ ‫√‬ ‫2.89‬ ‫5.4‬ ‫6.7‬ ‫99.69‬ ‫√‬ ‫76.79‬ ‫1.5‬ ‫5.2‬ ‫4.89‬ ‫4.89‬ ‫6.2‬ ‫بيانات القلب‬ ‫8.62‬ ‫39.84‬ ‫√‬ ‫95.94‬ ‫2.62‬ ‫9.83‬ ‫62.94‬ ‫√‬ ‫66.05‬ ‫3.21‬ ‫9.2‬ ‫2.25‬ ‫√‬ ‫30.35‬ ‫5.9‬ ‫بيانات راية الدوله‬ ‫2.13‬ ‫93.65‬ ‫√‬ ‫2.85‬ ‫9.51‬ ‫33‬ ‫3.55‬ ‫√‬ ‫42.06‬ ‫2.41‬ ‫6.8‬ ‫98.25‬ ‫√‬ ‫66.55‬ ‫7.31‬ ‫بيانات السمعيات‬ ‫9.22‬ ‫40.34‬ ‫√‬ ‫20.94‬ ‫1.61‬ ‫2.32‬ ‫20.44‬ ‫√‬ ‫6.94‬ ‫6.21‬ ‫8.21‬ ‫65.66‬ ‫√‬ ‫40.86‬ ‫8.21‬ ‫بيانات الفطر‬ ‫7.22‬ ‫96.99‬ ‫√‬ ‫58.99‬ ‫8.9‬ ‫3.43‬ ‫74.89‬ ‫√‬ ‫5.89‬ ‫6.31‬ ‫5.7‬ ‫48.99‬ ‫68.99‬ ‫5.7‬ ‫بيانات الراشدين‬ ‫8.061‬ ‫34.17‬ ‫44.17‬ ‫1.75‬ ‫822‬ ‫26.77‬ ‫√‬ ‫16.87‬ ‫4.63‬ ‫4‬ ‫72.18‬ ‫72.18‬ ‫5.7‬ ‫بيانات اطصطناعيه‬ ‫4.91‬ ‫90.89‬ ‫√‬ ‫11.89‬ ‫3.02‬ ‫9.74‬ ‫0.29‬ ‫√‬ ‫6.39‬ ‫2.33‬ ‫6.51‬ ‫43.69‬ ‫53.69‬ ‫9.71‬ ‫الجدول رقم 2: أداء عملية التنقيح على ةثلةثة انظمة تعلم، أتخذ المتوسط لعدد 01 تجارب لكل مجال‬ ‫المجال‬ ‫‪ ARIS‬باستخدام التناغم والكمال‬ ‫نظام 5.4‪C‬‬ ‫نظام ‪RIPPER‬‬ ‫التدريب باستخدام‬ ‫التدريب على بيانات‬ ‫قاعدة معرفه منقحه‬ ‫بّ‬ ‫التدريب باستخدام‬ ‫التدريب على بيانات‬ ‫قاعدة معرفه منقحه‬ ‫بّ‬ ‫التدريب باستخدام‬ ‫التدريب على بيانات‬ ‫قاعدة معرفه منقحه‬ ‫بّ‬
  10. 10. ‫04%‬ ‫مدمجه‬ ‫04%‬ ‫مدمجه‬ ‫04%‬ ‫مدمجه‬‫بيانات نبات السوسن‬ ‫71.39‬ ‫76.39‬ ‫√‬ ‫76.59‬ ‫5.39‬ ‫0.49‬ ‫5.39‬ ‫76.09‬ ‫33.39‬ ‫99.09‬ ‫بيانات النبيذ‬ ‫63.78‬ ‫27.98‬ ‫21.88‬ ‫27.98‬ ‫0.09‬ ‫27.98‬ ‫52.68‬ ‫41.09‬ ‫46.78‬ ‫بيانات التهاب الكبد‬ ‫55.87‬ ‫93.87‬ ‫√‬ ‫25.97‬ ‫23.08‬ ‫69.77‬ ‫√‬ ‫16.18‬ ‫62.77‬ ‫49.67‬ ‫√‬ ‫85.77‬‫بيانات الغدة الدرقيه‬ ‫98.79‬ ‫41.89‬ ‫√‬ ‫2.89‬ ‫99.69‬ ‫42.79‬ ‫√‬ ‫76.79‬ ‫4.89‬ ‫02.89‬ ‫√‬ ‫4.89‬ ‫بيانات القلب‬ ‫39.84‬ ‫50.74‬ ‫95.94 √‬ ‫62.94‬ ‫91.05‬ ‫√‬ ‫66.05‬ ‫2.25‬ ‫12.25‬ ‫√‬ ‫30.35‬ ‫بيانات راية الدوله‬ ‫93.65‬ ‫46.95‬ ‫2.85‬ ‫3.55‬ ‫45.55‬ ‫√‬ ‫42.06‬ ‫98.25‬ ‫32.75‬ ‫66.55‬ ‫بيانات السمعيات‬ ‫40.34‬ ‫02.04‬ ‫20.94 √‬ ‫20.44‬ ‫21.34‬ ‫√‬ ‫21.94‬ ‫65.66‬ ‫96.07‬ ‫40.86‬ ‫بيانات الفطر‬ ‫96.99‬ ‫77.99‬ ‫√‬ ‫58.99‬ ‫74.89‬ ‫73.89‬ ‫√‬ ‫5.89‬ ‫48.99‬ ‫78.99‬ ‫68.99‬ ‫بيانات الراشدين‬ ‫34.17‬ ‫79.07‬ ‫√‬ ‫44.17‬ ‫26.77‬ ‫70.87‬ ‫√‬ ‫16.87‬ ‫72.18‬ ‫22.28‬ ‫72.18‬ ‫بيانات اطصطناعيه‬ ‫90.89‬ ‫68.89‬ ‫11.89‬ ‫0.29‬ ‫61.89‬ ‫6.69‬ ‫43.69‬ ‫35.79‬ ‫53.69‬ ‫الجدول رقم 3 :مقارنة أداء ةثلةثة انظمه‬

×