Slideshare uses cookies to improve functionality and performance, and to provide you with relevant advertising. If you continue browsing the site, you agree to the use of cookies on this website. See our User Agreement and Privacy Policy.
Slideshare uses cookies to improve functionality and performance, and to provide you with relevant advertising. If you continue browsing the site, you agree to the use of cookies on this website. See our Privacy Policy and User Agreement for details.
23.05.15 Одесса. Impact Hub Odessa. Конференция AI&BigData Lab
Руденко Петр (Инженер-программист, Datarobot) Automation and optimisation of machine learning pipelines on top of Apache Spark
В компании Datarobot мы занимаемся автоматизированным построением точных предсказательных моделей. Помимо непосредственного обучения модели, важную роль во всем процессе играет препроцессинг данных (feature selection/normalization/transformation). В своем докладе я поделюсь нашим опытом использования платформы Apache Spark и в частности новыми ml API, которые предоставляют функционал для построения пайплайнов (Pipeline), поиска оптимальных значений гиперпараметров моделей (Crossvalidation).
Подробнее:
http://geekslab.co/
https://www.facebook.com/GeeksLab.co
https://www.youtube.com/user/GeeksLabVideo
Login to see the comments