140,000CPH Moutering speed for LED, high effiency, low cost. If you want to build LED manufacture, please contact me through: angela_kuo@126.com or Skype ID: angela7140 to get the solutions.
140,000CPH Moutering speed for LED, high effiency, low cost. If you want to build LED manufacture, please contact me through: angela_kuo@126.com or Skype ID: angela7140 to get the solutions.
How to select your new electronics manufacturing site in HungaryBalazs Csorjan dr.
Hungary has the largest electronics manufacturing industry in Eastern Europe, it's point to investigate the country when it's about electronics site selection.
Advanced Spark and TensorFlow Meetup 08-04-2016 One Click Spark ML Pipeline D...Chris Fregly
Empowering the Data Scientist with "1-Click" Production Deployment and Canary Testing of High-Performance and Highly-Scalable Spark ML and TensorFlow Models directly from Jupyter/iPython Notebooks using Docker, Kubernetes, Netflix OSS, Microservices, and Spinnaker.
With proper tooling and metrics, Data Scientists can directly deploy, analyze, A/B test, rollback, and scale out their Spark ML and TensorFlow model into live production serving with zero friction.
We will show you the open source tools that we've built based on Docker, Kubernetes, Netflix Open Source, Microservices, Spinnaker - and even Chaos Monkey!
Speaker: Chris Fregly @ PipelineIO, formerly Databricks and Netflix
The guide for design wrapper of tensorflow to build model easily.
All the codes above are available on my github.
https://github.com/NySunShine/fusion-net
Ключевые идеи алгоритмов обучения по прецедентам и почему про них следует помнить при выборе алгоритма и его настройке, поиске оптимальных параметров. Какие подходы позволяют повысить качество модели, какие программные средства удобно использовать при проведении экспериментов и где спрятаны любимые “грабли”.
Domain-тестирование – формальное название методики тестирования, за которым скрывается банальная работа с классами эквивалентности. Впрочем, не такая уж и банальная. Даже в популярной литературе по тестированию часто упоминают только о существовании классов эквивалентности и о том, что с их граничными значениями работать очень полезно.
Мы знакомимся с основами этой методики, когда делаем первые шаги в тестировании, и больше никогда о ней не задумываемся, наивно считая, что она попала в нашу зону неосознанной компетентности и мы всегда используем ее правильно. А так ли это?
How to select your new electronics manufacturing site in HungaryBalazs Csorjan dr.
Hungary has the largest electronics manufacturing industry in Eastern Europe, it's point to investigate the country when it's about electronics site selection.
Advanced Spark and TensorFlow Meetup 08-04-2016 One Click Spark ML Pipeline D...Chris Fregly
Empowering the Data Scientist with "1-Click" Production Deployment and Canary Testing of High-Performance and Highly-Scalable Spark ML and TensorFlow Models directly from Jupyter/iPython Notebooks using Docker, Kubernetes, Netflix OSS, Microservices, and Spinnaker.
With proper tooling and metrics, Data Scientists can directly deploy, analyze, A/B test, rollback, and scale out their Spark ML and TensorFlow model into live production serving with zero friction.
We will show you the open source tools that we've built based on Docker, Kubernetes, Netflix Open Source, Microservices, Spinnaker - and even Chaos Monkey!
Speaker: Chris Fregly @ PipelineIO, formerly Databricks and Netflix
The guide for design wrapper of tensorflow to build model easily.
All the codes above are available on my github.
https://github.com/NySunShine/fusion-net
Ключевые идеи алгоритмов обучения по прецедентам и почему про них следует помнить при выборе алгоритма и его настройке, поиске оптимальных параметров. Какие подходы позволяют повысить качество модели, какие программные средства удобно использовать при проведении экспериментов и где спрятаны любимые “грабли”.
Domain-тестирование – формальное название методики тестирования, за которым скрывается банальная работа с классами эквивалентности. Впрочем, не такая уж и банальная. Даже в популярной литературе по тестированию часто упоминают только о существовании классов эквивалентности и о том, что с их граничными значениями работать очень полезно.
Мы знакомимся с основами этой методики, когда делаем первые шаги в тестировании, и больше никогда о ней не задумываемся, наивно считая, что она попала в нашу зону неосознанной компетентности и мы всегда используем ее правильно. А так ли это?
5. Классификация
• Необходимо найти такие
разделяющие поверхности,
которые бы разделяли
объекты на классы
максимально правильно
• Обучение с учителем
5
6. Дерево решений
• Бинарное решающее дерево
• Каждый внутренний узел содержит условие
• Каждый лист содержит имя класса
6
11. Метрика качества бинарной
классификации: точность (precision)
• Показывает, насколько можно
доверять классификатору
• Минимизирует число ложных
срабатываний
• Устойчива к несбалансированным
данным:
• Точность классификатора: 28,6%
• Точность константного
классификатора: 0%
y = 1 y = 0
a(x)=1 20 50
a(x)=0 5 1000
y = 1 y = 0
a(x)=1 TP FP
a(x)=0 FN TN
11
12. Метрика качества бинарной
классификации: полнота (recall)
• Показывает, сколько объектов
класса 1 найдено
• Минимизирует число ложных
пропусков
• Устойчива к несбалансированным
данным:
• Полнота классификатора: 80%
• Полнота константного
классификатора: 0%
y = 1 y = 0
a(x)=1 20 50
a(x)=0 5 1000
y = 1 y = 0
a(x)=1 TP FP
a(x)=0 FN TN
12
13. Метрика качества многоклассовой классификации:
Area Under Curve - Precision Recall Curve (AUC-
PRC)
• b(x) - вероятность
принадлежности объекта к
классу 1
• объекты отсортированы по
возрастанию вероятности
• расчет precision и recall в
каждой точке
• площадь под кривой
характеризует качество
классификатора
b(x) 0,14 0,23 0,39 0,52 0,73 0,90
y 0 1 0 0 1 1
13
14. Метрика качества многоклассовой классификации:
Area Under Curve - Receiver Operating
Characteristic (AUC-ROC)
• False Positive Rate -
специфичность
b(x) 0,14 0,23 0,39 0,52 0,73 0,90
y 0 1 0 0 1 1
• True Positive Rate -
чувствительность
14
17. Задача регрессии
• Признаки и ответы - вещественные числа
• Необходимо определить вид функции f(x) и ее
коэффициенты таким образом, чтобы она принимала
наиболее близкие значения к исходным значениям
множества Y
• Обучение с учителем
• Решение - метод наименьших квадратов
• Метрика качества - среднеквадратическое отклонение
17
23. Кластеризация
• Требуется разбить выборку
на кластеры так, чтобы
каждый кластер состоял из
близких объектов, а объекты
разных кластеров
существенно отличались
• Обучение без учителя
• Метрика качества зависит от
задачи
23
27. Технологии
• Python: Pandas, SciPy, SKLearn
• R
• Matlab/Octave
• Project Jupyter
• Microsoft Azure Machine Learning
• Google Machine Learning
27
28. Ссылки
• Machine Learning (Stanford University)
• Введение в машинное обучение (Yandex/ВШЭ)
• Машинное обучение и анализ данных (Yandex/
МФТИ)
• Kaggle
28
29. Kaggle
• платформа для проведения соревнований по машинному
обучению
• job board
• datasets
• текущие соревнования:
• SF Crime classification
• Santander Customer Classification
• Yelp Restaurant Photo Classification
29