Анализ данных просто и доступно - урок 1Igor Kleiner
Курс лекций: анализ данных просто и доступно
Лекция 1
Что такое данные?
Что такое анализ данных
Мотивация: Челленджер, еАрмони, Своя игра, Моней бол
примеры работы с Оранж
Анализ корона вируса
Анализ данных просто и доступно - урок 1Igor Kleiner
Курс лекций: анализ данных просто и доступно
Лекция 1
Что такое данные?
Что такое анализ данных
Мотивация: Челленджер, еАрмони, Своя игра, Моней бол
примеры работы с Оранж
Анализ корона вируса
34. Random Forest
• RF provides an improvement over bagging by using set of
decorrelated trees
• For classification sets mtry= sqrt(features num)
• For regression sets mtry= (features num)/3
•של ערך לבחור אפשרmtryב שימוש ידי על-parameters tuning
•כנ"פרמטר לגבי לntree
39. Tuning Parameters for Boosting
• number of trees
• shrinkage parameter
• number of splits
40. Tuning Parameters for Boosting
• number of trees B
•Bיתר ללמידת להביא יכול גדול מאוד,ב להשתמש כדי-CVלבחור כדי
של ערךB
• shrinkage parameter
• number of splits
41. Tuning Parameters for Boosting
• number of trees
• shrinkage parameter
•קטן חיובי מספר0.01או0.001,ל מביא קטן מאוד כלל בדרך-B
גדול יותר
• number of splits
42. Tuning Parameters for Boosting
• number of trees
• shrinkage parameter
• number of splits D
•D=1טוב עובד כלל בדרך