SlideShare a Scribd company logo
1 of 17
Download to read offline
Ростовское IT сообщество
Data Science Meetup
4 марта 2017
#dsmt61
Data scientology starter pack
Казаков Сергей
kazaimazai@gmail.com
Episode 1
Anaconda: https://www.continuum.io/
● Linux, macOS, Windows(!!!)
● python 2.7, 3.4, 3.5, 3.6
● conda package manager
○ conda install package-name
○ > 100 pre-built and tested scientific and
analytic Python packages
○ > 620 more packages are available:
https://repo.continuum.io/pkgs/
● Jupyter/IPython, Spyder, Visual Studio
Python data analysis whales
SciPy Ecosystem: https://www.scipy.org/
Pandas
● NumPy powered
● IO Tools (text, sql, HDF5, json, …)
● Series, Dataframe, Panel
● filter, reshape, groupby,
● aggregate, vectorized, rolling, expanding operations
● merge, join, concatenate, whatever
● plotting (matplotlib, seaborn)
● …
cheat sheet:
https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat
_Sheet.pdf
Jupyter Notebook
● Jupyter
● Jupyter Hub
● Jupyter Lab
Машинное обучение
Задачи
● Классификация
○ Бинарная
○ Многоклассовая
■ классы не пересекаются
■ классы пересекаются
● Восстановление регрессии
● Кластеризация
Все остальное
● Ранжирование
● Обнаружение аномалий
● Обучение с подкреплением
● Уменьшение размерности
● ...
“Hello, data science world!”
Scikit-learn: http://scikit-learn.org/
X, y = make_blobs(n_samples=10000, n_features=10, centers=100)
clf = RandomForestClassifier()
X_train, X_test = X[:8000], X[8000:]
y_train, y_test = y[:8000], y[8000:]
clf.fit(X_train, y_train)
print clf.score(X_test, y_test)
print cross_val_score(clf, X, y).mean()
Соревнования по машинному обучению
● данные
○ train
○ test
■ public
■ private
● метрики
● рейтинг участников
● где
○ https://www.kaggle.com/
○ http://www.image-net.org/
○ https://www.numer.ai/
● Andrew Ng
● ШАД Курс “Машинное обучение”
К.В. Воронцов
“Компьютерные науки” на Youtube
● А.Г. Дьяконов
○ https://alexanderdyakonov.wordpress.com/
○ http://www.machinelearning.ru/
Udacity Deep Learning Online Course
● CNN
● RNN
● LSTM
Let me google that for you:
● Keras
○ Theano
○ Tensorflow
● MXNet
● Torch
● Caffe
Спасибо!
Казаков Сергей kazaimazai@gmail.com
kazai.wordpress.com

More Related Content

Viewers also liked

Когда тексты —не только слова
Когда тексты —не только словаКогда тексты —не только слова
Когда тексты —не только словаYandex
 
Calabash. Автоматизированное тестирование мобильных приложений
Calabash. Автоматизированное тестирование мобильных приложенийCalabash. Автоматизированное тестирование мобильных приложений
Calabash. Автоматизированное тестирование мобильных приложенийIT61
 
Наивный байесовский классификатор. Дерево решений. Случайный лес.
Наивный байесовский классификатор. Дерево решений. Случайный лес.Наивный байесовский классификатор. Дерево решений. Случайный лес.
Наивный байесовский классификатор. Дерево решений. Случайный лес.Bitworks Software
 
Лекция №5 "Обработка текстов, Naive Bayes"
Лекция №5 "Обработка текстов, Naive Bayes" Лекция №5 "Обработка текстов, Naive Bayes"
Лекция №5 "Обработка текстов, Naive Bayes" Technosphere1
 
Нагрузочное тестирование API. Как летать, а не ползать?
Нагрузочное тестирование API. Как летать, а не ползать?Нагрузочное тестирование API. Как летать, а не ползать?
Нагрузочное тестирование API. Как летать, а не ползать?IT61
 
Nuts and Bolts of Designing a Language-Based Service Learning Course
Nuts and Bolts of Designing a Language-Based Service Learning CourseNuts and Bolts of Designing a Language-Based Service Learning Course
Nuts and Bolts of Designing a Language-Based Service Learning Coursevakunta
 
Fitri artikel unpam_pertemuan3
Fitri artikel unpam_pertemuan3Fitri artikel unpam_pertemuan3
Fitri artikel unpam_pertemuan3Ayu2602
 
Эффективный отдел техподдержки сайтов без вашего участия, Максим Мул (Рабочие...
Эффективный отдел техподдержки сайтов без вашего участия, Максим Мул (Рабочие...Эффективный отдел техподдержки сайтов без вашего участия, Максим Мул (Рабочие...
Эффективный отдел техподдержки сайтов без вашего участия, Максим Мул (Рабочие...IT61
 
Nd teknologi forum2016-fange-skilt-med-mobiltelefon
Nd teknologi forum2016-fange-skilt-med-mobiltelefonNd teknologi forum2016-fange-skilt-med-mobiltelefon
Nd teknologi forum2016-fange-skilt-med-mobiltelefonJan Kristian Jensen
 
Тренды в процессах разработки, Константин Иванов (TradingView)
Тренды в процессах разработки, Константин Иванов (TradingView)Тренды в процессах разработки, Константин Иванов (TradingView)
Тренды в процессах разработки, Константин Иванов (TradingView)IT61
 
Pre-Collegiate - Rising Seniors, Day 1
Pre-Collegiate - Rising Seniors, Day 1Pre-Collegiate - Rising Seniors, Day 1
Pre-Collegiate - Rising Seniors, Day 1Ali LaForce
 
Clase Modelo Blended Learning
Clase Modelo Blended LearningClase Modelo Blended Learning
Clase Modelo Blended LearningLili21on
 
Trabajos segunda parcial de historia del derecho
Trabajos segunda parcial de historia del derechoTrabajos segunda parcial de historia del derecho
Trabajos segunda parcial de historia del derechoDEYSITATIANAIB
 

Viewers also liked (18)

Когда тексты —не только слова
Когда тексты —не только словаКогда тексты —не только слова
Когда тексты —не только слова
 
Calabash. Автоматизированное тестирование мобильных приложений
Calabash. Автоматизированное тестирование мобильных приложенийCalabash. Автоматизированное тестирование мобильных приложений
Calabash. Автоматизированное тестирование мобильных приложений
 
Наивный байесовский классификатор. Дерево решений. Случайный лес.
Наивный байесовский классификатор. Дерево решений. Случайный лес.Наивный байесовский классификатор. Дерево решений. Случайный лес.
Наивный байесовский классификатор. Дерево решений. Случайный лес.
 
Лекция №5 "Обработка текстов, Naive Bayes"
Лекция №5 "Обработка текстов, Naive Bayes" Лекция №5 "Обработка текстов, Naive Bayes"
Лекция №5 "Обработка текстов, Naive Bayes"
 
Нагрузочное тестирование API. Как летать, а не ползать?
Нагрузочное тестирование API. Как летать, а не ползать?Нагрузочное тестирование API. Как летать, а не ползать?
Нагрузочное тестирование API. Как летать, а не ползать?
 
Teaching Beliefs
Teaching BeliefsTeaching Beliefs
Teaching Beliefs
 
Nuts and Bolts of Designing a Language-Based Service Learning Course
Nuts and Bolts of Designing a Language-Based Service Learning CourseNuts and Bolts of Designing a Language-Based Service Learning Course
Nuts and Bolts of Designing a Language-Based Service Learning Course
 
Fitri artikel unpam_pertemuan3
Fitri artikel unpam_pertemuan3Fitri artikel unpam_pertemuan3
Fitri artikel unpam_pertemuan3
 
Эффективный отдел техподдержки сайтов без вашего участия, Максим Мул (Рабочие...
Эффективный отдел техподдержки сайтов без вашего участия, Максим Мул (Рабочие...Эффективный отдел техподдержки сайтов без вашего участия, Максим Мул (Рабочие...
Эффективный отдел техподдержки сайтов без вашего участия, Максим Мул (Рабочие...
 
програми службового рівня
програми службового рівняпрограми службового рівня
програми службового рівня
 
Nd teknologi forum2016-fange-skilt-med-mobiltelefon
Nd teknologi forum2016-fange-skilt-med-mobiltelefonNd teknologi forum2016-fange-skilt-med-mobiltelefon
Nd teknologi forum2016-fange-skilt-med-mobiltelefon
 
Тренды в процессах разработки, Константин Иванов (TradingView)
Тренды в процессах разработки, Константин Иванов (TradingView)Тренды в процессах разработки, Константин Иванов (TradingView)
Тренды в процессах разработки, Константин Иванов (TradingView)
 
Resume
ResumeResume
Resume
 
landfill
landfilllandfill
landfill
 
Presença virtual
Presença virtualPresença virtual
Presença virtual
 
Pre-Collegiate - Rising Seniors, Day 1
Pre-Collegiate - Rising Seniors, Day 1Pre-Collegiate - Rising Seniors, Day 1
Pre-Collegiate - Rising Seniors, Day 1
 
Clase Modelo Blended Learning
Clase Modelo Blended LearningClase Modelo Blended Learning
Clase Modelo Blended Learning
 
Trabajos segunda parcial de historia del derecho
Trabajos segunda parcial de historia del derechoTrabajos segunda parcial de historia del derecho
Trabajos segunda parcial de historia del derecho
 

Similar to Data scientology starter pack, Сергей Казаков

Rust - GDG DevFest Siberia 2016
Rust - GDG DevFest Siberia 2016Rust - GDG DevFest Siberia 2016
Rust - GDG DevFest Siberia 2016Nikita Baksalyar
 
Введение в Python и Django
Введение в Python и DjangoВведение в Python и Django
Введение в Python и DjangoTaras Lyapun
 
Последние новости постгреса с PGCon / О.Бартунов, А.Коротков, Ф.Сигаев (Postg...
Последние новости постгреса с PGCon / О.Бартунов, А.Коротков, Ф.Сигаев (Postg...Последние новости постгреса с PGCon / О.Бартунов, А.Коротков, Ф.Сигаев (Postg...
Последние новости постгреса с PGCon / О.Бартунов, А.Коротков, Ф.Сигаев (Postg...Ontico
 
Flame graph: новый взгляд на старое профилирование
Flame graph: новый взгляд на старое профилированиеFlame graph: новый взгляд на старое профилирование
Flame graph: новый взгляд на старое профилированиеКирилл Борисов
 
GRANIT — Global Russian Advanced Network Initiative
GRANIT — Global Russian Advanced Network InitiativeGRANIT — Global Russian Advanced Network Initiative
GRANIT — Global Russian Advanced Network InitiativeARCCN
 
20111002 information retrieval raskovalov_lecture3
20111002 information retrieval raskovalov_lecture320111002 information retrieval raskovalov_lecture3
20111002 information retrieval raskovalov_lecture3Computer Science Club
 
Леонид Васильев "Python в инфраструктуре поиска"
Леонид Васильев "Python в инфраструктуре поиска"Леонид Васильев "Python в инфраструктуре поиска"
Леонид Васильев "Python в инфраструктуре поиска"Yandex
 
Rust - GDG DevFest 2016 Nizhny Novgorod
Rust - GDG DevFest 2016 Nizhny NovgorodRust - GDG DevFest 2016 Nizhny Novgorod
Rust - GDG DevFest 2016 Nizhny NovgorodNikita Baksalyar
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...Mikhail Kurnosov
 
Оценка производительности hadoop кластера.
Оценка производительности hadoop кластера.Оценка производительности hadoop кластера.
Оценка производительности hadoop кластера.Vyacheslav Murashkin
 
Руслан Гроховецкий "Как Python стал делать погоду в Яндексе"
Руслан Гроховецкий "Как Python стал делать погоду в Яндексе"Руслан Гроховецкий "Как Python стал делать погоду в Яндексе"
Руслан Гроховецкий "Как Python стал делать погоду в Яндексе"Yandex
 
Денис Противенский, Percona — Percona Server for MongoDB: обзор возможностей
Денис Противенский, Percona — Percona Server for MongoDB: обзор возможностейДенис Противенский, Percona — Percona Server for MongoDB: обзор возможностей
Денис Противенский, Percona — Percona Server for MongoDB: обзор возможностейDev_Party
 
Партицирование и миграции данных на примере PostgreSQL — Денис Иванов, 2ГИС
Партицирование и миграции данных на примере PostgreSQL — Денис Иванов, 2ГИСПартицирование и миграции данных на примере PostgreSQL — Денис Иванов, 2ГИС
Партицирование и миграции данных на примере PostgreSQL — Денис Иванов, 2ГИС2ГИС Технологии
 
Комплексное решение Linux Wizard для ОУ (1 марта 2012)
Комплексное решение Linux Wizard для ОУ (1 марта 2012)Комплексное решение Linux Wizard для ОУ (1 марта 2012)
Комплексное решение Linux Wizard для ОУ (1 марта 2012)Penguin Tux
 
SECON'2017, Тыкушин Анатолий, Болдырев Михаил, Расследование кибер-преступлений
SECON'2017, Тыкушин Анатолий, Болдырев Михаил, Расследование кибер-преступленийSECON'2017, Тыкушин Анатолий, Болдырев Михаил, Расследование кибер-преступлений
SECON'2017, Тыкушин Анатолий, Болдырев Михаил, Расследование кибер-преступленийSECON
 
Python инструменты решения типичных задач
Python  инструменты решения типичных задачPython  инструменты решения типичных задач
Python инструменты решения типичных задачPyNSK
 
Hadoop > cascading -> cascalog (very short)
Hadoop  > cascading -> cascalog (very short)Hadoop  > cascading -> cascalog (very short)
Hadoop > cascading -> cascalog (very short)Andrew Panfilov
 
Особенности работы backend для мобильных приложений или Python Django UWSGI в...
Особенности работы backend для мобильных приложений или Python Django UWSGI в...Особенности работы backend для мобильных приложений или Python Django UWSGI в...
Особенности работы backend для мобильных приложений или Python Django UWSGI в...Mail.ru Group
 
TMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: GenodeTMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: GenodeIosif Itkin
 

Similar to Data scientology starter pack, Сергей Казаков (20)

Rust - GDG DevFest Siberia 2016
Rust - GDG DevFest Siberia 2016Rust - GDG DevFest Siberia 2016
Rust - GDG DevFest Siberia 2016
 
Введение в Python и Django
Введение в Python и DjangoВведение в Python и Django
Введение в Python и Django
 
Последние новости постгреса с PGCon / О.Бартунов, А.Коротков, Ф.Сигаев (Postg...
Последние новости постгреса с PGCon / О.Бартунов, А.Коротков, Ф.Сигаев (Postg...Последние новости постгреса с PGCon / О.Бартунов, А.Коротков, Ф.Сигаев (Postg...
Последние новости постгреса с PGCon / О.Бартунов, А.Коротков, Ф.Сигаев (Postg...
 
Flame graph: новый взгляд на старое профилирование
Flame graph: новый взгляд на старое профилированиеFlame graph: новый взгляд на старое профилирование
Flame graph: новый взгляд на старое профилирование
 
GRANIT — Global Russian Advanced Network Initiative
GRANIT — Global Russian Advanced Network InitiativeGRANIT — Global Russian Advanced Network Initiative
GRANIT — Global Russian Advanced Network Initiative
 
20111002 information retrieval raskovalov_lecture3
20111002 information retrieval raskovalov_lecture320111002 information retrieval raskovalov_lecture3
20111002 information retrieval raskovalov_lecture3
 
Леонид Васильев "Python в инфраструктуре поиска"
Леонид Васильев "Python в инфраструктуре поиска"Леонид Васильев "Python в инфраструктуре поиска"
Леонид Васильев "Python в инфраструктуре поиска"
 
Rust - GDG DevFest 2016 Nizhny Novgorod
Rust - GDG DevFest 2016 Nizhny NovgorodRust - GDG DevFest 2016 Nizhny Novgorod
Rust - GDG DevFest 2016 Nizhny Novgorod
 
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
Лекция 5. Основы параллельного программирования (Speedup, Amdahl's law, Paral...
 
Оценка производительности hadoop кластера.
Оценка производительности hadoop кластера.Оценка производительности hadoop кластера.
Оценка производительности hadoop кластера.
 
Руслан Гроховецкий "Как Python стал делать погоду в Яндексе"
Руслан Гроховецкий "Как Python стал делать погоду в Яндексе"Руслан Гроховецкий "Как Python стал делать погоду в Яндексе"
Руслан Гроховецкий "Как Python стал делать погоду в Яндексе"
 
Денис Противенский, Percona — Percona Server for MongoDB: обзор возможностей
Денис Противенский, Percona — Percona Server for MongoDB: обзор возможностейДенис Противенский, Percona — Percona Server for MongoDB: обзор возможностей
Денис Противенский, Percona — Percona Server for MongoDB: обзор возможностей
 
Postgres
PostgresPostgres
Postgres
 
Партицирование и миграции данных на примере PostgreSQL — Денис Иванов, 2ГИС
Партицирование и миграции данных на примере PostgreSQL — Денис Иванов, 2ГИСПартицирование и миграции данных на примере PostgreSQL — Денис Иванов, 2ГИС
Партицирование и миграции данных на примере PostgreSQL — Денис Иванов, 2ГИС
 
Комплексное решение Linux Wizard для ОУ (1 марта 2012)
Комплексное решение Linux Wizard для ОУ (1 марта 2012)Комплексное решение Linux Wizard для ОУ (1 марта 2012)
Комплексное решение Linux Wizard для ОУ (1 марта 2012)
 
SECON'2017, Тыкушин Анатолий, Болдырев Михаил, Расследование кибер-преступлений
SECON'2017, Тыкушин Анатолий, Болдырев Михаил, Расследование кибер-преступленийSECON'2017, Тыкушин Анатолий, Болдырев Михаил, Расследование кибер-преступлений
SECON'2017, Тыкушин Анатолий, Болдырев Михаил, Расследование кибер-преступлений
 
Python инструменты решения типичных задач
Python  инструменты решения типичных задачPython  инструменты решения типичных задач
Python инструменты решения типичных задач
 
Hadoop > cascading -> cascalog (very short)
Hadoop  > cascading -> cascalog (very short)Hadoop  > cascading -> cascalog (very short)
Hadoop > cascading -> cascalog (very short)
 
Особенности работы backend для мобильных приложений или Python Django UWSGI в...
Особенности работы backend для мобильных приложений или Python Django UWSGI в...Особенности работы backend для мобильных приложений или Python Django UWSGI в...
Особенности работы backend для мобильных приложений или Python Django UWSGI в...
 
TMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: GenodeTMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: Genode
 

More from IT61

Александр Шорин - Как перестать гоняться за кандидатом и начать жить?
Александр Шорин - Как перестать гоняться за кандидатом и начать жить?Александр Шорин - Как перестать гоняться за кандидатом и начать жить?
Александр Шорин - Как перестать гоняться за кандидатом и начать жить?IT61
 
Нина Марменкова - Найти себя и нАЙТИ своих
Нина Марменкова - Найти себя и нАЙТИ своихНина Марменкова - Найти себя и нАЙТИ своих
Нина Марменкова - Найти себя и нАЙТИ своихIT61
 
Павел Седаков - Performance review: теория и практика оценки эффективности ра...
Павел Седаков - Performance review: теория и практика оценки эффективности ра...Павел Седаков - Performance review: теория и практика оценки эффективности ра...
Павел Седаков - Performance review: теория и практика оценки эффективности ра...IT61
 
Дмитрий Костюк - Необходимые инструменты и качества для роста менеджера
Дмитрий Костюк - Необходимые инструменты и качества для роста менеджераДмитрий Костюк - Необходимые инструменты и качества для роста менеджера
Дмитрий Костюк - Необходимые инструменты и качества для роста менеджераIT61
 
Константин Гуфан - Чем должны заниматься менеджеры и чем они на самом деле за...
Константин Гуфан - Чем должны заниматься менеджеры и чем они на самом деле за...Константин Гуфан - Чем должны заниматься менеджеры и чем они на самом деле за...
Константин Гуфан - Чем должны заниматься менеджеры и чем они на самом деле за...IT61
 
Ольга Стратанович - Менеджер будущего
Ольга Стратанович - Менеджер будущегоОльга Стратанович - Менеджер будущего
Ольга Стратанович - Менеджер будущегоIT61
 
Константин Гуфан - Сколько лет живет любовь к работе?
Константин Гуфан - Сколько лет живет любовь к работе?Константин Гуфан - Сколько лет живет любовь к работе?
Константин Гуфан - Сколько лет живет любовь к работе?IT61
 
Параллельное управление, Елена Сибилева (Жмек дизайн)
Параллельное управление, Елена Сибилева (Жмек дизайн)Параллельное управление, Елена Сибилева (Жмек дизайн)
Параллельное управление, Елена Сибилева (Жмек дизайн)IT61
 
Амина Прима - Ой, все! Я ухожу
Амина Прима - Ой, все! Я ухожуАмина Прима - Ой, все! Я ухожу
Амина Прима - Ой, все! Я ухожуIT61
 
Как перестать беспокоиться и начать тестировать или это волшебное слово Agile
Как перестать беспокоиться и начать тестировать или это волшебное слово AgileКак перестать беспокоиться и начать тестировать или это волшебное слово Agile
Как перестать беспокоиться и начать тестировать или это волшебное слово AgileIT61
 
Дело тестера боится: как в опытных руках могут заиграть Java и TestNg
Дело тестера боится: как в опытных руках могут заиграть Java и TestNgДело тестера боится: как в опытных руках могут заиграть Java и TestNg
Дело тестера боится: как в опытных руках могут заиграть Java и TestNgIT61
 
Стратегия тестирования - больше чем просто план
Стратегия тестирования - больше чем просто планСтратегия тестирования - больше чем просто план
Стратегия тестирования - больше чем просто планIT61
 
Основы Symfony и отличия Sf 3.x от Sf 2.x
Основы Symfony и отличия Sf 3.x от Sf 2.xОсновы Symfony и отличия Sf 3.x от Sf 2.x
Основы Symfony и отличия Sf 3.x от Sf 2.xIT61
 
Тенденции развития DDoS-атак: к чему нужно быть готовым
Тенденции развития DDoS-атак: к чему нужно быть готовымТенденции развития DDoS-атак: к чему нужно быть готовым
Тенденции развития DDoS-атак: к чему нужно быть готовымIT61
 
Отдаем страницы быстрее или как вписаться в требования Google
Отдаем страницы быстрее или как вписаться в требования GoogleОтдаем страницы быстрее или как вписаться в требования Google
Отдаем страницы быстрее или как вписаться в требования GoogleIT61
 
Автоматизированное тестирование UI в мобильных OC
Автоматизированное тестирование UI в мобильных OCАвтоматизированное тестирование UI в мобильных OC
Автоматизированное тестирование UI в мобильных OCIT61
 
Scrum глазами тестировщика или как создать стратегию для любой задачи
Scrum глазами тестировщика или как создать стратегию для любой задачиScrum глазами тестировщика или как создать стратегию для любой задачи
Scrum глазами тестировщика или как создать стратегию для любой задачиIT61
 
Организация процесса ручного тестирования
Организация процесса ручного тестированияОрганизация процесса ручного тестирования
Организация процесса ручного тестированияIT61
 
BDD подход в автоматизации UI тестов
BDD подход в автоматизации UI тестовBDD подход в автоматизации UI тестов
BDD подход в автоматизации UI тестовIT61
 
Защита веб-ресурса от DDoS-атак на примере нашего клиента - Rutracker.org
Защита веб-ресурса от DDoS-атак на примере нашего клиента - Rutracker.orgЗащита веб-ресурса от DDoS-атак на примере нашего клиента - Rutracker.org
Защита веб-ресурса от DDoS-атак на примере нашего клиента - Rutracker.orgIT61
 

More from IT61 (20)

Александр Шорин - Как перестать гоняться за кандидатом и начать жить?
Александр Шорин - Как перестать гоняться за кандидатом и начать жить?Александр Шорин - Как перестать гоняться за кандидатом и начать жить?
Александр Шорин - Как перестать гоняться за кандидатом и начать жить?
 
Нина Марменкова - Найти себя и нАЙТИ своих
Нина Марменкова - Найти себя и нАЙТИ своихНина Марменкова - Найти себя и нАЙТИ своих
Нина Марменкова - Найти себя и нАЙТИ своих
 
Павел Седаков - Performance review: теория и практика оценки эффективности ра...
Павел Седаков - Performance review: теория и практика оценки эффективности ра...Павел Седаков - Performance review: теория и практика оценки эффективности ра...
Павел Седаков - Performance review: теория и практика оценки эффективности ра...
 
Дмитрий Костюк - Необходимые инструменты и качества для роста менеджера
Дмитрий Костюк - Необходимые инструменты и качества для роста менеджераДмитрий Костюк - Необходимые инструменты и качества для роста менеджера
Дмитрий Костюк - Необходимые инструменты и качества для роста менеджера
 
Константин Гуфан - Чем должны заниматься менеджеры и чем они на самом деле за...
Константин Гуфан - Чем должны заниматься менеджеры и чем они на самом деле за...Константин Гуфан - Чем должны заниматься менеджеры и чем они на самом деле за...
Константин Гуфан - Чем должны заниматься менеджеры и чем они на самом деле за...
 
Ольга Стратанович - Менеджер будущего
Ольга Стратанович - Менеджер будущегоОльга Стратанович - Менеджер будущего
Ольга Стратанович - Менеджер будущего
 
Константин Гуфан - Сколько лет живет любовь к работе?
Константин Гуфан - Сколько лет живет любовь к работе?Константин Гуфан - Сколько лет живет любовь к работе?
Константин Гуфан - Сколько лет живет любовь к работе?
 
Параллельное управление, Елена Сибилева (Жмек дизайн)
Параллельное управление, Елена Сибилева (Жмек дизайн)Параллельное управление, Елена Сибилева (Жмек дизайн)
Параллельное управление, Елена Сибилева (Жмек дизайн)
 
Амина Прима - Ой, все! Я ухожу
Амина Прима - Ой, все! Я ухожуАмина Прима - Ой, все! Я ухожу
Амина Прима - Ой, все! Я ухожу
 
Как перестать беспокоиться и начать тестировать или это волшебное слово Agile
Как перестать беспокоиться и начать тестировать или это волшебное слово AgileКак перестать беспокоиться и начать тестировать или это волшебное слово Agile
Как перестать беспокоиться и начать тестировать или это волшебное слово Agile
 
Дело тестера боится: как в опытных руках могут заиграть Java и TestNg
Дело тестера боится: как в опытных руках могут заиграть Java и TestNgДело тестера боится: как в опытных руках могут заиграть Java и TestNg
Дело тестера боится: как в опытных руках могут заиграть Java и TestNg
 
Стратегия тестирования - больше чем просто план
Стратегия тестирования - больше чем просто планСтратегия тестирования - больше чем просто план
Стратегия тестирования - больше чем просто план
 
Основы Symfony и отличия Sf 3.x от Sf 2.x
Основы Symfony и отличия Sf 3.x от Sf 2.xОсновы Symfony и отличия Sf 3.x от Sf 2.x
Основы Symfony и отличия Sf 3.x от Sf 2.x
 
Тенденции развития DDoS-атак: к чему нужно быть готовым
Тенденции развития DDoS-атак: к чему нужно быть готовымТенденции развития DDoS-атак: к чему нужно быть готовым
Тенденции развития DDoS-атак: к чему нужно быть готовым
 
Отдаем страницы быстрее или как вписаться в требования Google
Отдаем страницы быстрее или как вписаться в требования GoogleОтдаем страницы быстрее или как вписаться в требования Google
Отдаем страницы быстрее или как вписаться в требования Google
 
Автоматизированное тестирование UI в мобильных OC
Автоматизированное тестирование UI в мобильных OCАвтоматизированное тестирование UI в мобильных OC
Автоматизированное тестирование UI в мобильных OC
 
Scrum глазами тестировщика или как создать стратегию для любой задачи
Scrum глазами тестировщика или как создать стратегию для любой задачиScrum глазами тестировщика или как создать стратегию для любой задачи
Scrum глазами тестировщика или как создать стратегию для любой задачи
 
Организация процесса ручного тестирования
Организация процесса ручного тестированияОрганизация процесса ручного тестирования
Организация процесса ручного тестирования
 
BDD подход в автоматизации UI тестов
BDD подход в автоматизации UI тестовBDD подход в автоматизации UI тестов
BDD подход в автоматизации UI тестов
 
Защита веб-ресурса от DDoS-атак на примере нашего клиента - Rutracker.org
Защита веб-ресурса от DDoS-атак на примере нашего клиента - Rutracker.orgЗащита веб-ресурса от DDoS-атак на примере нашего клиента - Rutracker.org
Защита веб-ресурса от DDoS-атак на примере нашего клиента - Rutracker.org
 

Data scientology starter pack, Сергей Казаков

  • 1. Ростовское IT сообщество Data Science Meetup 4 марта 2017 #dsmt61 Data scientology starter pack Казаков Сергей kazaimazai@gmail.com
  • 3. Anaconda: https://www.continuum.io/ ● Linux, macOS, Windows(!!!) ● python 2.7, 3.4, 3.5, 3.6 ● conda package manager ○ conda install package-name ○ > 100 pre-built and tested scientific and analytic Python packages ○ > 620 more packages are available: https://repo.continuum.io/pkgs/ ● Jupyter/IPython, Spyder, Visual Studio
  • 6. Pandas ● NumPy powered ● IO Tools (text, sql, HDF5, json, …) ● Series, Dataframe, Panel ● filter, reshape, groupby, ● aggregate, vectorized, rolling, expanding operations ● merge, join, concatenate, whatever ● plotting (matplotlib, seaborn) ● … cheat sheet: https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat _Sheet.pdf
  • 7. Jupyter Notebook ● Jupyter ● Jupyter Hub ● Jupyter Lab
  • 9.
  • 10. Задачи ● Классификация ○ Бинарная ○ Многоклассовая ■ классы не пересекаются ■ классы пересекаются ● Восстановление регрессии ● Кластеризация Все остальное ● Ранжирование ● Обнаружение аномалий ● Обучение с подкреплением ● Уменьшение размерности ● ...
  • 11. “Hello, data science world!” Scikit-learn: http://scikit-learn.org/ X, y = make_blobs(n_samples=10000, n_features=10, centers=100) clf = RandomForestClassifier() X_train, X_test = X[:8000], X[8000:] y_train, y_test = y[:8000], y[8000:] clf.fit(X_train, y_train) print clf.score(X_test, y_test) print cross_val_score(clf, X, y).mean()
  • 12. Соревнования по машинному обучению ● данные ○ train ○ test ■ public ■ private ● метрики ● рейтинг участников ● где ○ https://www.kaggle.com/ ○ http://www.image-net.org/ ○ https://www.numer.ai/
  • 13.
  • 14. ● Andrew Ng ● ШАД Курс “Машинное обучение” К.В. Воронцов “Компьютерные науки” на Youtube ● А.Г. Дьяконов ○ https://alexanderdyakonov.wordpress.com/ ○ http://www.machinelearning.ru/
  • 15.
  • 16. Udacity Deep Learning Online Course ● CNN ● RNN ● LSTM Let me google that for you: ● Keras ○ Theano ○ Tensorflow ● MXNet ● Torch ● Caffe