SlideShare a Scribd company logo
‫לומדות‬ ‫מערכות‬
Igor Kleiner
Lecture 7/ Part 1
‫החלטה‬ ‫עצי‬
bagging, boosting
2017
‫תזכורת‬
K-FOLD CROSS VALIDATION
•‫ב‬ ‫נעזר‬ ‫הפרמטרים‬ ‫בחירת‬ ‫לשם‬-k-fold cross validation
‫החלטה‬ ‫עצי‬
•‫בעיות‬ ‫עבור‬ ‫גם‬ ‫החלטה‬ ‫בעצי‬ ‫להשתמש‬ ‫אפשר‬‫סיווג‬‫בעיות‬ ‫עבור‬ ‫וגם‬
‫רגרסיה‬
•‫כללי‬ ‫לפרש‬ ‫קשה‬ ‫ויותר‬ ‫עץ‬ ‫של‬ ‫החלטה‬ ‫כללי‬ ‫לפרש‬ ‫כל‬ ‫כלל‬ ‫בדרך‬
‫יער‬ ‫של‬ ‫החלטה‬
•‫בודד‬ ‫החלטה‬ ‫עץ‬ ‫כלל‬ ‫בדרך‬"‫מפסיד‬"‫מתקדם‬ ‫יותר‬ ‫למידה‬ ‫לאלגוריתם‬
‫החלטה‬ ‫עצי‬
•‫בעיות‬ ‫עבור‬ ‫גם‬ ‫החלטה‬ ‫בעצי‬ ‫להשתמש‬ ‫אפשר‬‫סיווג‬‫עבור‬ ‫וגם‬
‫בעיות‬‫רגרסיה‬
•‫כללי‬ ‫לפרש‬ ‫קשה‬ ‫ויותר‬ ‫עץ‬ ‫של‬ ‫החלטה‬ ‫כללי‬ ‫לפרש‬ ‫כל‬ ‫כלל‬ ‫בדרך‬
‫יער‬ ‫של‬ ‫החלטה‬
•‫בודד‬ ‫החלטה‬ ‫עץ‬ ‫כלל‬ ‫בדרך‬"‫מפסיד‬"‫מתקדם‬ ‫יותר‬ ‫למידה‬ ‫לאלגוריתם‬
‫החלטה‬ ‫עצי‬
•‫בעיות‬ ‫עבור‬ ‫גם‬ ‫החלטה‬ ‫בעצי‬ ‫להשתמש‬ ‫אפשר‬‫סיווג‬‫בעיות‬ ‫עבור‬ ‫וגם‬
‫רגרסיה‬
•‫כללי‬ ‫לפרש‬ ‫קשה‬ ‫ויותר‬ ‫עץ‬ ‫של‬ ‫החלטה‬ ‫כללי‬ ‫לפרש‬ ‫כל‬ ‫כלל‬ ‫בדרך‬
‫יער‬ ‫של‬ ‫החלטה‬
•‫בודד‬ ‫החלטה‬ ‫עץ‬ ‫כלל‬ ‫בדרך‬"‫מפסיד‬"‫מתקדם‬ ‫יותר‬ ‫למידה‬ ‫לאלגוריתם‬
‫החלטה‬ ‫עצי‬
•‫בעיות‬ ‫עבור‬ ‫גם‬ ‫החלטה‬ ‫בעצי‬ ‫להשתמש‬ ‫אפשר‬‫סיווג‬‫בעיות‬ ‫עבור‬ ‫וגם‬
‫רגרסיה‬
•‫כללי‬ ‫לפרש‬ ‫קשה‬ ‫ויותר‬ ‫עץ‬ ‫של‬ ‫החלטה‬ ‫כללי‬ ‫לפרש‬ ‫כל‬ ‫כלל‬ ‫בדרך‬
‫יער‬ ‫של‬ ‫החלטה‬
•‫בודד‬ ‫החלטה‬ ‫עץ‬ ‫כלל‬ ‫בדרך‬"‫מפסיד‬"‫יותר‬ ‫למידה‬ ‫לאלגוריתם‬
‫מתקדם‬
‫החלטה‬ ‫עצי‬
•‫של‬ ‫כלשהי‬ ‫חלוקה‬ ‫עבור‬ ‫החלטה‬ ‫כללי‬ ‫לבנות‬ ‫אפשר‬ ‫עיקרון‬ ‫ברמת‬
‫התכונות‬ ‫מרחב‬
•‫מימדיות‬ ‫רב‬ ‫לקוביות‬ ‫בחלוקות‬ ‫משתמשים‬ ‫אבל‬
•‫ובדרך‬ ‫חמדני‬ ‫הוא‬ ‫עץ‬ ‫לבניה‬ ‫אלגוריתם‬‫כלל‬‫תוצאה‬ ‫מחזיר‬ ‫לא‬
‫אופטימלית‬
‫החלטה‬ ‫עצי‬
•‫מרחב‬ ‫של‬ ‫כלשהי‬ ‫חלוקה‬ ‫עבור‬ ‫החלטה‬ ‫כללי‬ ‫לבנות‬ ‫אפשר‬ ‫עיקרון‬ ‫ברמת‬
‫התכונות‬
•‫אבל‬‫מימדיות‬ ‫רב‬ ‫לקוביות‬ ‫בחלוקות‬ ‫משתמשים‬
•‫ובדרך‬ ‫חמדני‬ ‫הוא‬ ‫עץ‬ ‫לבניה‬ ‫אלגוריתם‬‫כלל‬‫תוצאה‬ ‫מחזיר‬ ‫לא‬
‫אופטימלית‬
‫החלטה‬ ‫עצי‬
•‫מרחב‬ ‫של‬ ‫כלשהי‬ ‫חלוקה‬ ‫עבור‬ ‫החלטה‬ ‫כללי‬ ‫לבנות‬ ‫אפשר‬ ‫עיקרון‬ ‫ברמת‬
‫התכונות‬
•‫מימדיות‬ ‫רב‬ ‫לקוביות‬ ‫בחלוקות‬ ‫משתמשים‬ ‫אבל‬
•‫תוצאה‬ ‫מחזיר‬ ‫לא‬ ‫כלל‬ ‫ובדרך‬ ‫חמדני‬ ‫הוא‬ ‫עץ‬ ‫לבניה‬ ‫אלגוריתם‬
‫אופטימלית‬
‫קצרה‬ ‫שאלה‬
‫קצרה‬ ‫שאלה‬
‫עץ‬ ‫של‬ ‫גיזום‬
•‫יתר‬ ‫בלמידת‬ ‫לתקל‬ ‫יכולים‬ ‫הסוף‬ ‫עד‬ ‫העץ‬ ‫את‬ ‫לבנות‬ ‫נמשיך‬ ‫אם‬
•‫בנתונים‬ ‫שיש‬ ‫לרעש‬ ‫עצמו‬ ‫את‬ ‫שיתאים‬ ‫מורכב‬ ‫עץ‬ ‫נקבל‬
•‫הגיזום‬ ‫בשיטת‬ ‫משמשים‬ ‫יתר‬ ‫מלמידת‬ ‫להימנע‬ ‫כדי‬(pruning)
‫החלטה‬ ‫כלל‬
•‫בעלה‬ ‫הדוגמאות‬ ‫רוב‬ ‫לפי‬ ‫החלטה‬ ‫מקבלים‬ ‫סיווג‬ ‫בעיות‬ ‫עבור‬
•‫ממוצע‬ ‫לפי‬ ‫החלטה‬ ‫מקבלים‬ ‫רגרסיה‬ ‫בעיות‬ ‫עבור‬‫בעלה‬ ‫הדוגמאות‬ ‫חציון‬
•‫מתאים‬ ‫פרמטר‬ ‫בחירה‬ ‫ידי‬ ‫על‬ ‫יותר‬ ‫טוב‬ ‫החלטה‬ ‫עץ‬ ‫לבחור‬ ‫אפשר‬
‫העץ‬ ‫את‬ ‫שבונה‬ ‫לפונקציה‬
Classification Tree example
•‫מטרה‬:‫ניתוח‬ ‫לאחר‬ ‫ָה‬‫י‬ ִ‫צ‬ַ‫פֹורמ‬ֵ‫ד‬ ‫של‬ ‫סוג‬ ‫חיזוי‬
Classification Tree example
•‫מטרה‬:‫ניתוח‬ ‫לאחר‬ ‫ָה‬‫י‬ ִ‫צ‬ַ‫פֹורמ‬ֵ‫ד‬ ‫של‬ ‫סוג‬ ‫חיזוי‬
Regression Tree Example
Regression Tree Example
Regression Tree Example
Regression Tree Example
Random Forest
•‫השיטה‬ ‫של‬ ‫רעיון‬:‫עצים‬ ‫של‬ ‫רב‬ ‫מספר‬ ‫נבנה‬
•‫טובה‬ ‫מאוד‬ ‫לא‬ ‫היא‬ ‫בודד‬ ‫עץ‬ ‫כל‬ ‫של‬ ‫איכות‬ ‫אם‬ ‫אפילו‬
•‫החלטה‬ ‫לקבל‬ ‫העצים‬ ‫לכל‬ ‫ניתן‬–"‫רוב‬ ‫חכמת‬"
Random Forest
•‫השיטה‬ ‫של‬ ‫רעיון‬:‫עצים‬ ‫של‬ ‫רב‬ ‫מספר‬ ‫נבנה‬
•‫טובה‬ ‫מאוד‬ ‫לא‬ ‫היא‬ ‫בודד‬ ‫עץ‬ ‫כל‬ ‫של‬ ‫איכות‬ ‫אם‬ ‫אפילו‬
•‫החלטה‬ ‫לקבל‬ ‫העצים‬ ‫לכל‬ ‫ניתן‬–"‫רוב‬ ‫חכמת‬"
•‫שונות‬ ‫גישות‬:
• bagging
• random forest
• bosting: adaboost, xboost, gbm, …
Bagging
Bagging Example
Random Forest
• RF provides an improvement over bagging by using set of
decorrelated trees
• For classification sets mtry= sqrt(features num)
• For regression sets mtry= (features num)/3
•‫של‬ ‫ערך‬ ‫לבחור‬ ‫אפשר‬mtry‫ב‬ ‫שימוש‬ ‫ידי‬ ‫על‬-parameters tuning
•‫כנ‬"‫פרמטר‬ ‫לגבי‬ ‫ל‬ntree
Random Forest Example
Random Forest Example
Boosting
•bagging‫דטה‬ ‫אותו‬ ‫על‬ ‫החלטה‬ ‫עצי‬ ‫של‬ ‫אוסף‬ ‫בונה‬,‫בנוי‬ ‫עץ‬ ‫כל‬ ‫כאשר‬
‫אחרים‬ ‫בעצים‬ ‫תלוי‬ ‫בלתי‬ ‫באופן‬
•boosting‫סדרתי‬ ‫באופן‬ ‫עצים‬ ‫בונה‬,‫תוצאות‬ ‫בחשבון‬ ‫לוקח‬ ‫עץ‬ ‫כל‬
‫קודמים‬ ‫עצים‬ ‫של‬ ‫עבודה‬
Boosting
•‫כלל‬ ‫בדרך‬boosting‫טובות‬ ‫תוצאות‬ ‫נותן‬
Tuning Parameters for Boosting
• number of trees
• shrinkage parameter
• number of splits
Tuning Parameters for Boosting
• number of trees B
•B‫יתר‬ ‫ללמידת‬ ‫להביא‬ ‫יכול‬ ‫גדול‬ ‫מאוד‬,‫ב‬ ‫להשתמש‬ ‫כדי‬-CV‫לבחור‬ ‫כדי‬
‫של‬ ‫ערך‬B
• shrinkage parameter
• number of splits
Tuning Parameters for Boosting
• number of trees
• shrinkage parameter
•‫קטן‬ ‫חיובי‬ ‫מספר‬0.01‫או‬0.001,‫ל‬ ‫מביא‬ ‫קטן‬ ‫מאוד‬ ‫כלל‬ ‫בדרך‬-B
‫גדול‬ ‫יותר‬
• number of splits
Tuning Parameters for Boosting
• number of trees
• shrinkage parameter
• number of splits D
•D=1‫טוב‬ ‫עובד‬ ‫כלל‬ ‫בדרך‬
Links
• Course videos: https://goo.gl/osnGa7
• Course slides:
https://www.slideshare.net/igorkleiner5
• Course Facebook group: https://goo.gl/7WzpTU
• email: igkleiner@gmail.com

More Related Content

More from Igor Kleiner

פתרון תרגיל 3
פתרון תרגיל 3פתרון תרגיל 3
פתרון תרגיל 3
Igor Kleiner
 
מבוא לתכנות מדעי: פייתון הרצאה 13
מבוא לתכנות מדעי: פייתון הרצאה 13מבוא לתכנות מדעי: פייתון הרצאה 13
מבוא לתכנות מדעי: פייתון הרצאה 13
Igor Kleiner
 
תכנות מדעי פייתון: הרצאה 12: סיבוכיות
תכנות מדעי פייתון: הרצאה 12: סיבוכיותתכנות מדעי פייתון: הרצאה 12: סיבוכיות
תכנות מדעי פייתון: הרצאה 12: סיבוכיות
Igor Kleiner
 
מבוא לתכנות מדעי: פייתון: הרצאה 11: דבגינג + תכנות דינמי
מבוא לתכנות מדעי: פייתון: הרצאה 11: דבגינג + תכנות דינמימבוא לתכנות מדעי: פייתון: הרצאה 11: דבגינג + תכנות דינמי
מבוא לתכנות מדעי: פייתון: הרצאה 11: דבגינג + תכנות דינמי
Igor Kleiner
 
תכנות מדעי: פייתון: הרצאה 10: : תחום הכרעה
תכנות מדעי: פייתון: הרצאה 10: : תחום הכרעהתכנות מדעי: פייתון: הרצאה 10: : תחום הכרעה
תכנות מדעי: פייתון: הרצאה 10: : תחום הכרעה
Igor Kleiner
 
מבוא לתכנות מדעי: פייתון: הרצאה 9: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 9: 2017מבוא לתכנות מדעי: פייתון: הרצאה 9: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 9: 2017
Igor Kleiner
 
תכנות מדעי: פייתון: הרצאה 8: 2017
תכנות מדעי: פייתון: הרצאה 8:  2017תכנות מדעי: פייתון: הרצאה 8:  2017
תכנות מדעי: פייתון: הרצאה 8: 2017
Igor Kleiner
 
תכנות מדעי: פייתון : הרצאה 7: 2017
תכנות מדעי: פייתון : הרצאה 7: 2017תכנות מדעי: פייתון : הרצאה 7: 2017
תכנות מדעי: פייתון : הרצאה 7: 2017
Igor Kleiner
 
תכנות מדעי: פייתון: הרצאה 6: קבצים, רשימות
תכנות מדעי: פייתון: הרצאה 6: קבצים, רשימותתכנות מדעי: פייתון: הרצאה 6: קבצים, רשימות
תכנות מדעי: פייתון: הרצאה 6: קבצים, רשימות
Igor Kleiner
 
מבוא לתכנות מדעי: פייתון: הרצאה 5: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 5: 2017מבוא לתכנות מדעי: פייתון: הרצאה 5: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 5: 2017
Igor Kleiner
 
מבוא לתכנות מדעי: פייתון: הרצאה 4: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 4: 2017מבוא לתכנות מדעי: פייתון: הרצאה 4: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 4: 2017
Igor Kleiner
 
מבוא לתכנות מדעי: פייתון: הרצאה 3: לולאות
מבוא לתכנות מדעי: פייתון: הרצאה 3: לולאותמבוא לתכנות מדעי: פייתון: הרצאה 3: לולאות
מבוא לתכנות מדעי: פייתון: הרצאה 3: לולאות
Igor Kleiner
 
מבוא לתכנות מדעי: פייתון: הרצאה 2: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 2: 2017מבוא לתכנות מדעי: פייתון: הרצאה 2: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 2: 2017
Igor Kleiner
 
פייתון: הרצאה 1
פייתון: הרצאה 1פייתון: הרצאה 1
פייתון: הרצאה 1
Igor Kleiner
 
למידה ממוכנת פגישה 8
למידה ממוכנת פגישה 8 למידה ממוכנת פגישה 8
למידה ממוכנת פגישה 8
Igor Kleiner
 
מערכות לומדות תרגול 3 עצים
מערכות לומדות תרגול 3 עציםמערכות לומדות תרגול 3 עצים
מערכות לומדות תרגול 3 עצים
Igor Kleiner
 
מערכות לומדות פגישה 6
מערכות לומדות פגישה 6מערכות לומדות פגישה 6
מערכות לומדות פגישה 6
Igor Kleiner
 
מערכות לומדות: תרגילי כיתה 4 ו-5
מערכות לומדות: תרגילי כיתה 4 ו-5מערכות לומדות: תרגילי כיתה 4 ו-5
מערכות לומדות: תרגילי כיתה 4 ו-5
Igor Kleiner
 
מערכות לומדות: תרגיל בית 2
מערכות לומדות: תרגיל בית 2מערכות לומדות: תרגיל בית 2
מערכות לומדות: תרגיל בית 2
Igor Kleiner
 
מערכות לומדות פגישה 4 חלק 3
מערכות לומדות פגישה 4 חלק 3מערכות לומדות פגישה 4 חלק 3
מערכות לומדות פגישה 4 חלק 3
Igor Kleiner
 

More from Igor Kleiner (20)

פתרון תרגיל 3
פתרון תרגיל 3פתרון תרגיל 3
פתרון תרגיל 3
 
מבוא לתכנות מדעי: פייתון הרצאה 13
מבוא לתכנות מדעי: פייתון הרצאה 13מבוא לתכנות מדעי: פייתון הרצאה 13
מבוא לתכנות מדעי: פייתון הרצאה 13
 
תכנות מדעי פייתון: הרצאה 12: סיבוכיות
תכנות מדעי פייתון: הרצאה 12: סיבוכיותתכנות מדעי פייתון: הרצאה 12: סיבוכיות
תכנות מדעי פייתון: הרצאה 12: סיבוכיות
 
מבוא לתכנות מדעי: פייתון: הרצאה 11: דבגינג + תכנות דינמי
מבוא לתכנות מדעי: פייתון: הרצאה 11: דבגינג + תכנות דינמימבוא לתכנות מדעי: פייתון: הרצאה 11: דבגינג + תכנות דינמי
מבוא לתכנות מדעי: פייתון: הרצאה 11: דבגינג + תכנות דינמי
 
תכנות מדעי: פייתון: הרצאה 10: : תחום הכרעה
תכנות מדעי: פייתון: הרצאה 10: : תחום הכרעהתכנות מדעי: פייתון: הרצאה 10: : תחום הכרעה
תכנות מדעי: פייתון: הרצאה 10: : תחום הכרעה
 
מבוא לתכנות מדעי: פייתון: הרצאה 9: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 9: 2017מבוא לתכנות מדעי: פייתון: הרצאה 9: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 9: 2017
 
תכנות מדעי: פייתון: הרצאה 8: 2017
תכנות מדעי: פייתון: הרצאה 8:  2017תכנות מדעי: פייתון: הרצאה 8:  2017
תכנות מדעי: פייתון: הרצאה 8: 2017
 
תכנות מדעי: פייתון : הרצאה 7: 2017
תכנות מדעי: פייתון : הרצאה 7: 2017תכנות מדעי: פייתון : הרצאה 7: 2017
תכנות מדעי: פייתון : הרצאה 7: 2017
 
תכנות מדעי: פייתון: הרצאה 6: קבצים, רשימות
תכנות מדעי: פייתון: הרצאה 6: קבצים, רשימותתכנות מדעי: פייתון: הרצאה 6: קבצים, רשימות
תכנות מדעי: פייתון: הרצאה 6: קבצים, רשימות
 
מבוא לתכנות מדעי: פייתון: הרצאה 5: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 5: 2017מבוא לתכנות מדעי: פייתון: הרצאה 5: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 5: 2017
 
מבוא לתכנות מדעי: פייתון: הרצאה 4: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 4: 2017מבוא לתכנות מדעי: פייתון: הרצאה 4: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 4: 2017
 
מבוא לתכנות מדעי: פייתון: הרצאה 3: לולאות
מבוא לתכנות מדעי: פייתון: הרצאה 3: לולאותמבוא לתכנות מדעי: פייתון: הרצאה 3: לולאות
מבוא לתכנות מדעי: פייתון: הרצאה 3: לולאות
 
מבוא לתכנות מדעי: פייתון: הרצאה 2: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 2: 2017מבוא לתכנות מדעי: פייתון: הרצאה 2: 2017
מבוא לתכנות מדעי: פייתון: הרצאה 2: 2017
 
פייתון: הרצאה 1
פייתון: הרצאה 1פייתון: הרצאה 1
פייתון: הרצאה 1
 
למידה ממוכנת פגישה 8
למידה ממוכנת פגישה 8 למידה ממוכנת פגישה 8
למידה ממוכנת פגישה 8
 
מערכות לומדות תרגול 3 עצים
מערכות לומדות תרגול 3 עציםמערכות לומדות תרגול 3 עצים
מערכות לומדות תרגול 3 עצים
 
מערכות לומדות פגישה 6
מערכות לומדות פגישה 6מערכות לומדות פגישה 6
מערכות לומדות פגישה 6
 
מערכות לומדות: תרגילי כיתה 4 ו-5
מערכות לומדות: תרגילי כיתה 4 ו-5מערכות לומדות: תרגילי כיתה 4 ו-5
מערכות לומדות: תרגילי כיתה 4 ו-5
 
מערכות לומדות: תרגיל בית 2
מערכות לומדות: תרגיל בית 2מערכות לומדות: תרגיל בית 2
מערכות לומדות: תרגיל בית 2
 
מערכות לומדות פגישה 4 חלק 3
מערכות לומדות פגישה 4 חלק 3מערכות לומדות פגישה 4 חלק 3
מערכות לומדות פגישה 4 חלק 3
 

מערכות לומדות פגישה 7-1 יער אקראי

  • 1. ‫לומדות‬ ‫מערכות‬ Igor Kleiner Lecture 7/ Part 1 ‫החלטה‬ ‫עצי‬ bagging, boosting 2017
  • 3.
  • 4.
  • 5. K-FOLD CROSS VALIDATION •‫ב‬ ‫נעזר‬ ‫הפרמטרים‬ ‫בחירת‬ ‫לשם‬-k-fold cross validation
  • 6. ‫החלטה‬ ‫עצי‬ •‫בעיות‬ ‫עבור‬ ‫גם‬ ‫החלטה‬ ‫בעצי‬ ‫להשתמש‬ ‫אפשר‬‫סיווג‬‫בעיות‬ ‫עבור‬ ‫וגם‬ ‫רגרסיה‬ •‫כללי‬ ‫לפרש‬ ‫קשה‬ ‫ויותר‬ ‫עץ‬ ‫של‬ ‫החלטה‬ ‫כללי‬ ‫לפרש‬ ‫כל‬ ‫כלל‬ ‫בדרך‬ ‫יער‬ ‫של‬ ‫החלטה‬ •‫בודד‬ ‫החלטה‬ ‫עץ‬ ‫כלל‬ ‫בדרך‬"‫מפסיד‬"‫מתקדם‬ ‫יותר‬ ‫למידה‬ ‫לאלגוריתם‬
  • 7. ‫החלטה‬ ‫עצי‬ •‫בעיות‬ ‫עבור‬ ‫גם‬ ‫החלטה‬ ‫בעצי‬ ‫להשתמש‬ ‫אפשר‬‫סיווג‬‫עבור‬ ‫וגם‬ ‫בעיות‬‫רגרסיה‬ •‫כללי‬ ‫לפרש‬ ‫קשה‬ ‫ויותר‬ ‫עץ‬ ‫של‬ ‫החלטה‬ ‫כללי‬ ‫לפרש‬ ‫כל‬ ‫כלל‬ ‫בדרך‬ ‫יער‬ ‫של‬ ‫החלטה‬ •‫בודד‬ ‫החלטה‬ ‫עץ‬ ‫כלל‬ ‫בדרך‬"‫מפסיד‬"‫מתקדם‬ ‫יותר‬ ‫למידה‬ ‫לאלגוריתם‬
  • 8. ‫החלטה‬ ‫עצי‬ •‫בעיות‬ ‫עבור‬ ‫גם‬ ‫החלטה‬ ‫בעצי‬ ‫להשתמש‬ ‫אפשר‬‫סיווג‬‫בעיות‬ ‫עבור‬ ‫וגם‬ ‫רגרסיה‬ •‫כללי‬ ‫לפרש‬ ‫קשה‬ ‫ויותר‬ ‫עץ‬ ‫של‬ ‫החלטה‬ ‫כללי‬ ‫לפרש‬ ‫כל‬ ‫כלל‬ ‫בדרך‬ ‫יער‬ ‫של‬ ‫החלטה‬ •‫בודד‬ ‫החלטה‬ ‫עץ‬ ‫כלל‬ ‫בדרך‬"‫מפסיד‬"‫מתקדם‬ ‫יותר‬ ‫למידה‬ ‫לאלגוריתם‬
  • 9. ‫החלטה‬ ‫עצי‬ •‫בעיות‬ ‫עבור‬ ‫גם‬ ‫החלטה‬ ‫בעצי‬ ‫להשתמש‬ ‫אפשר‬‫סיווג‬‫בעיות‬ ‫עבור‬ ‫וגם‬ ‫רגרסיה‬ •‫כללי‬ ‫לפרש‬ ‫קשה‬ ‫ויותר‬ ‫עץ‬ ‫של‬ ‫החלטה‬ ‫כללי‬ ‫לפרש‬ ‫כל‬ ‫כלל‬ ‫בדרך‬ ‫יער‬ ‫של‬ ‫החלטה‬ •‫בודד‬ ‫החלטה‬ ‫עץ‬ ‫כלל‬ ‫בדרך‬"‫מפסיד‬"‫יותר‬ ‫למידה‬ ‫לאלגוריתם‬ ‫מתקדם‬
  • 10. ‫החלטה‬ ‫עצי‬ •‫של‬ ‫כלשהי‬ ‫חלוקה‬ ‫עבור‬ ‫החלטה‬ ‫כללי‬ ‫לבנות‬ ‫אפשר‬ ‫עיקרון‬ ‫ברמת‬ ‫התכונות‬ ‫מרחב‬ •‫מימדיות‬ ‫רב‬ ‫לקוביות‬ ‫בחלוקות‬ ‫משתמשים‬ ‫אבל‬ •‫ובדרך‬ ‫חמדני‬ ‫הוא‬ ‫עץ‬ ‫לבניה‬ ‫אלגוריתם‬‫כלל‬‫תוצאה‬ ‫מחזיר‬ ‫לא‬ ‫אופטימלית‬
  • 11. ‫החלטה‬ ‫עצי‬ •‫מרחב‬ ‫של‬ ‫כלשהי‬ ‫חלוקה‬ ‫עבור‬ ‫החלטה‬ ‫כללי‬ ‫לבנות‬ ‫אפשר‬ ‫עיקרון‬ ‫ברמת‬ ‫התכונות‬ •‫אבל‬‫מימדיות‬ ‫רב‬ ‫לקוביות‬ ‫בחלוקות‬ ‫משתמשים‬ •‫ובדרך‬ ‫חמדני‬ ‫הוא‬ ‫עץ‬ ‫לבניה‬ ‫אלגוריתם‬‫כלל‬‫תוצאה‬ ‫מחזיר‬ ‫לא‬ ‫אופטימלית‬
  • 12. ‫החלטה‬ ‫עצי‬ •‫מרחב‬ ‫של‬ ‫כלשהי‬ ‫חלוקה‬ ‫עבור‬ ‫החלטה‬ ‫כללי‬ ‫לבנות‬ ‫אפשר‬ ‫עיקרון‬ ‫ברמת‬ ‫התכונות‬ •‫מימדיות‬ ‫רב‬ ‫לקוביות‬ ‫בחלוקות‬ ‫משתמשים‬ ‫אבל‬ •‫תוצאה‬ ‫מחזיר‬ ‫לא‬ ‫כלל‬ ‫ובדרך‬ ‫חמדני‬ ‫הוא‬ ‫עץ‬ ‫לבניה‬ ‫אלגוריתם‬ ‫אופטימלית‬
  • 15. ‫עץ‬ ‫של‬ ‫גיזום‬ •‫יתר‬ ‫בלמידת‬ ‫לתקל‬ ‫יכולים‬ ‫הסוף‬ ‫עד‬ ‫העץ‬ ‫את‬ ‫לבנות‬ ‫נמשיך‬ ‫אם‬ •‫בנתונים‬ ‫שיש‬ ‫לרעש‬ ‫עצמו‬ ‫את‬ ‫שיתאים‬ ‫מורכב‬ ‫עץ‬ ‫נקבל‬ •‫הגיזום‬ ‫בשיטת‬ ‫משמשים‬ ‫יתר‬ ‫מלמידת‬ ‫להימנע‬ ‫כדי‬(pruning)
  • 16. ‫החלטה‬ ‫כלל‬ •‫בעלה‬ ‫הדוגמאות‬ ‫רוב‬ ‫לפי‬ ‫החלטה‬ ‫מקבלים‬ ‫סיווג‬ ‫בעיות‬ ‫עבור‬ •‫ממוצע‬ ‫לפי‬ ‫החלטה‬ ‫מקבלים‬ ‫רגרסיה‬ ‫בעיות‬ ‫עבור‬‫בעלה‬ ‫הדוגמאות‬ ‫חציון‬ •‫מתאים‬ ‫פרמטר‬ ‫בחירה‬ ‫ידי‬ ‫על‬ ‫יותר‬ ‫טוב‬ ‫החלטה‬ ‫עץ‬ ‫לבחור‬ ‫אפשר‬ ‫העץ‬ ‫את‬ ‫שבונה‬ ‫לפונקציה‬
  • 17. Classification Tree example •‫מטרה‬:‫ניתוח‬ ‫לאחר‬ ‫ָה‬‫י‬ ִ‫צ‬ַ‫פֹורמ‬ֵ‫ד‬ ‫של‬ ‫סוג‬ ‫חיזוי‬
  • 18. Classification Tree example •‫מטרה‬:‫ניתוח‬ ‫לאחר‬ ‫ָה‬‫י‬ ִ‫צ‬ַ‫פֹורמ‬ֵ‫ד‬ ‫של‬ ‫סוג‬ ‫חיזוי‬
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 29.
  • 30. Random Forest •‫השיטה‬ ‫של‬ ‫רעיון‬:‫עצים‬ ‫של‬ ‫רב‬ ‫מספר‬ ‫נבנה‬ •‫טובה‬ ‫מאוד‬ ‫לא‬ ‫היא‬ ‫בודד‬ ‫עץ‬ ‫כל‬ ‫של‬ ‫איכות‬ ‫אם‬ ‫אפילו‬ •‫החלטה‬ ‫לקבל‬ ‫העצים‬ ‫לכל‬ ‫ניתן‬–"‫רוב‬ ‫חכמת‬"
  • 31. Random Forest •‫השיטה‬ ‫של‬ ‫רעיון‬:‫עצים‬ ‫של‬ ‫רב‬ ‫מספר‬ ‫נבנה‬ •‫טובה‬ ‫מאוד‬ ‫לא‬ ‫היא‬ ‫בודד‬ ‫עץ‬ ‫כל‬ ‫של‬ ‫איכות‬ ‫אם‬ ‫אפילו‬ •‫החלטה‬ ‫לקבל‬ ‫העצים‬ ‫לכל‬ ‫ניתן‬–"‫רוב‬ ‫חכמת‬" •‫שונות‬ ‫גישות‬: • bagging • random forest • bosting: adaboost, xboost, gbm, …
  • 34. Random Forest • RF provides an improvement over bagging by using set of decorrelated trees • For classification sets mtry= sqrt(features num) • For regression sets mtry= (features num)/3 •‫של‬ ‫ערך‬ ‫לבחור‬ ‫אפשר‬mtry‫ב‬ ‫שימוש‬ ‫ידי‬ ‫על‬-parameters tuning •‫כנ‬"‫פרמטר‬ ‫לגבי‬ ‫ל‬ntree
  • 37. Boosting •bagging‫דטה‬ ‫אותו‬ ‫על‬ ‫החלטה‬ ‫עצי‬ ‫של‬ ‫אוסף‬ ‫בונה‬,‫בנוי‬ ‫עץ‬ ‫כל‬ ‫כאשר‬ ‫אחרים‬ ‫בעצים‬ ‫תלוי‬ ‫בלתי‬ ‫באופן‬ •boosting‫סדרתי‬ ‫באופן‬ ‫עצים‬ ‫בונה‬,‫תוצאות‬ ‫בחשבון‬ ‫לוקח‬ ‫עץ‬ ‫כל‬ ‫קודמים‬ ‫עצים‬ ‫של‬ ‫עבודה‬
  • 39. Tuning Parameters for Boosting • number of trees • shrinkage parameter • number of splits
  • 40. Tuning Parameters for Boosting • number of trees B •B‫יתר‬ ‫ללמידת‬ ‫להביא‬ ‫יכול‬ ‫גדול‬ ‫מאוד‬,‫ב‬ ‫להשתמש‬ ‫כדי‬-CV‫לבחור‬ ‫כדי‬ ‫של‬ ‫ערך‬B • shrinkage parameter • number of splits
  • 41. Tuning Parameters for Boosting • number of trees • shrinkage parameter •‫קטן‬ ‫חיובי‬ ‫מספר‬0.01‫או‬0.001,‫ל‬ ‫מביא‬ ‫קטן‬ ‫מאוד‬ ‫כלל‬ ‫בדרך‬-B ‫גדול‬ ‫יותר‬ • number of splits
  • 42. Tuning Parameters for Boosting • number of trees • shrinkage parameter • number of splits D •D=1‫טוב‬ ‫עובד‬ ‫כלל‬ ‫בדרך‬
  • 43. Links • Course videos: https://goo.gl/osnGa7 • Course slides: https://www.slideshare.net/igorkleiner5 • Course Facebook group: https://goo.gl/7WzpTU • email: igkleiner@gmail.com