Apache Mahout. Применение модели MapReduce для задач машинного обучения. <ul>Кузнецов Виталий </ul><ul>[email_address] </ul>
Apache Mahout <ul><ul><ul><ul><li>Масштабируемая библиотека алгоритмов машинного обучения, поддерживающая большие объёмы д...
Wikipedia:  A  mahout  is a person who drives an elephant. The word mahout comes from the Hindi words  mahaut  an d mahava...
Apache Hadoop <ul><li>Распределённое хранение (HDFS)
Распределённая обработка (MapReduce) </li></ul>
MapReduce
Алгоритмы <ul>Основные алгоритмы: <ul><li>Классификации (Classification)
Кластеризации (Clustering)
Рекомендации (Recomenders) </li></ul>+ <ul><li>Понижение размерности (Dimension reduction)
Эволюционные алгоритмы (Evolutionary Algorithms)
... </li></ul></ul>
Upcoming SlideShare
Loading in …5
×

Apache Mahout. Применение модели MapReduce для задач машинного обучения.

4,545 views

Published on

Published in: Technology
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
4,545
On SlideShare
0
From Embeds
0
Number of Embeds
2,113
Actions
Shares
0
Downloads
16
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Apache Mahout. Применение модели MapReduce для задач машинного обучения.

  1. 1. Apache Mahout. Применение модели MapReduce для задач машинного обучения. <ul>Кузнецов Виталий </ul><ul>[email_address] </ul>
  2. 2. Apache Mahout <ul><ul><ul><ul><li>Масштабируемая библиотека алгоритмов машинного обучения, поддерживающая большие объёмы данных
  3. 3. Wikipedia: A mahout is a person who drives an elephant. The word mahout comes from the Hindi words mahaut an d mahavat . </li></ul></ul></ul></ul>
  4. 4. Apache Hadoop <ul><li>Распределённое хранение (HDFS)
  5. 5. Распределённая обработка (MapReduce) </li></ul>
  6. 6. MapReduce
  7. 7. Алгоритмы <ul>Основные алгоритмы: <ul><li>Классификации (Classification)
  8. 8. Кластеризации (Clustering)
  9. 9. Рекомендации (Recomenders) </li></ul>+ <ul><li>Понижение размерности (Dimension reduction)
  10. 10. Эволюционные алгоритмы (Evolutionary Algorithms)
  11. 11. ... </li></ul></ul>
  12. 12. Классификация <ul>Поддерживаются: <ul><li>Логистическая регрессия
  13. 13. Байесовский классификатор
  14. 14. Случайный лес </li></ul>В разработке: <ul><li>Нейросети
  15. 15. в т.ч (Perceptron, Winnow, Restricted BoltzmannMachines)
  16. 16. Метод опорных векторов </li></ul></ul>
  17. 17. Кластеризация <ul>Поддерживаются: <ul><li>Canopy
  18. 18. K-means,Fuzzy K-means
  19. 19. Mean Shift,
  20. 20. Expectation Maximization
  21. 21. Dirichlet Process,
  22. 22. Latent Dirichlet Allocation </li></ul>В разработке: <ul><li>Hierarchical Clustering </li></ul></ul>
  23. 23. Рекомендации <ul>Поддерживаются: <ul><li>Локальные рекомендации
  24. 24. Распределённые (MapReduce) </li></ul></ul>
  25. 25. Пример задачи <ul>Классификация изменений исходного кода <li>Исходные данные: система контроля версий (svn, git, …)
  26. 26. Параметры: </li><ul><li>Добавленные/удалённые/изменённые строки кода
  27. 27. Сложность добавленного/удалённого/изменённого кода
  28. 28. Число добавленных/удалённых/изменённых классов/структур </li></ul><li>Кластеризация (к пример — K-means)
  29. 29. Экспертная оценка нескольких изменений из кластеров </li></ul>
  30. 30. Ещё о Mahout <ul>Проект верхнего уровня Apache c мая 2010 <li>Сайт проекта: http://mahout.apache.org
  31. 31. Списки рассылки: https://cwiki.apache.org/confluence/display/MAHOUT/Mailing+Lists
  32. 32. Книги (готовятся к публикации): </li><ul><li>Mahout In Action, Май 2011
  33. 33. Taming Text, Весна 2011 </li></ul><li>Используется в production: </li></ul>
  34. 34. <ul>Кузнецов Виталий email: [email_address] </ul><ul>Спасибо за внимание! Вопросы? </ul><ul>www.altlinux.ru </ul>

×