SlideShare a Scribd company logo
1 of 34
CONFIDENTIAL
Наука о данных
Gomel FEB, 2017
и о том как научить компьютер думать
@nesterione
CONFIDENTIAL
ОБЩАЯ ИНФОРМАЦИЯ. О ЧЕМ ВЫ СКОРЕЕ ВСЕГО СЛЫШАЛИ
BIG DATA
DATA SCIENCE
ARTIFICAL INTELLIGENCE
COMPUTER VISION
DATA MINING
NEURAL NETWORKS
DEEP LEARNING
MACHINE LEARNINGSPEECH RECOGNITION
OBJECT DETECTION
FRAUD DETECTION
MACHINE TRANSLATION
MACHINE INTELLIGENCE
CONFIDENTIAL
Как делают программисты ?
CONFIDENTIAL
Что с человеком?
КОТ КОТ СОБАКА
CONFIDENTIAL
Что на изображении ?
CONFIDENTIAL
Но есть проблемка…
CONFIDENTIAL
Как правило обучение это…
CONFIDENTIAL
Зачем обучать компьютер?
Не любой задаче можно
дать жесткую
формулировку и описать
строгий алгоритм.
CONFIDENTIAL
Как же обучить компьютер?
2
1
3
Сбор данных
Обучение
Объяснение
результата
(проверка)
• Проверить, в случае недостаточной точности, повторять
первые шаги
• Построить модель,
• обучить
• Нужно собрать данные
• Изучение предметной области
• Выявление признаков (не всегда)
CONFIDENTIAL
Искусственная нейронная сеть
CONFIDENTIAL
Почему сейчас?
Накопили данные Появились нужные мощности
CONFIDENTIAL
ImageNet
CONFIDENTIAL
Доход nVidia
https://dev.by/lenta/main/pochemu-aktsii-nvidia-za-god-vyrosli-na-300
CONFIDENTIAL
ПРО ИСПОЛЬЗОВАНИЕ
CONFIDENTIAL
Вы задумывались как это работает?
Anti fraud Разделение компонент
Таргетинговая реклама
Антиспам
Рекомендательные системыПоиск
Автоматический перевод текстов
Понимание смысла текста
Банковский скоринг
Распознавание образов на изображении
Anomaly Detection
Компьютерное зрение
TTS
Распознавание речи
Отбор “хороших” фото
Амазон (рекомендации)
Поиск по изображением
Яндекс музыка
Формирование новостей
Понимание смысла поиска
Поиск похожих изображений
CONFIDENTIAL
AlphaGo
https://deepmind.com/research/alphago/
CONFIDENTIAL
Сжатие изображений
https://research.googleblog.com/2016/11/enhance-raisr-
sharp-images-with-machine.html
CONFIDENTIAL
Конструкция для удержания проводов
https://twitter.com/daniel_bilar/status/813019450551242752
CONFIDENTIAL
В учреждениях здравоохранения
http://www.forbes.com/sites/bernardmarr/2017/01/20/first-
fda-approval-for-clinical-cloud-based-deep-learning-in-
healthcare
CONFIDENTIAL
Cancer prediction
CONFIDENTIAL
Сбор статистики с дорог
CONFIDENTIAL
CERN
https://yandexdatafactory.com/
ru/company/cern/
CONFIDENTIAL
CONFIDENTIAL
Более творческие примеры;)
CONFIDENTIAL
http://hi.cs.waseda.ac.jp/~iizuka/projects/colorizati.
CONFIDENTIAL
СТИЛИЗАЦИЯ
https://github.com/jcjohnson/neural-style
CONFIDENTIAL
СТИЛИЗАЦИЯ
CONFIDENTIAL
СТИЛИЗАЦИЯ
CONFIDENTIAL
Роберт Бонд
https://blogs.nvidia.com/blog/2016/07/07/deep-learning-cats-lawn/
CONFIDENTIAL
https://cloud.google.com/blog/big-data/2016/08/how-a-japanese-cucumber-farmer-is-using-
deep-learning-and-tensorflow
CONFIDENTIAL
https://music.yandex.by/artist/4445922
CONFIDENTIAL
Tesla
Демо с автопилотом
https://www.youtube.com/watch?v=PUw_DMaQ264
CONFIDENTIAL
Рекомендую посмотреть
https://youtu.be/CddWPpqV854
https://youtu.be/rK2iA_36qEI
«Машинный интеллект: что он изменит в маркетинге и
в жизни», открытая лекция Андрея Себранта
Машинный интеллект и машинное обучение. Лекция
Андрея Себранта («Яндекс»)
https://youtu.be/S6Lk_ij60Po
Григорий Бакунов (Яндекс) - Как повысить конверсию
лендинга
https://youtu.be/rZ2VfhyUXYM
Бакунов Григорий - Как развитие искусственного
интеллекта изменит мир вокруг нас
34CONFIDENTIAL
Q&A
Нестереня Игорь
• telegram: @nesterione
• site: nesterenya.com
• mail: nesterione@gmail.com

More Related Content

Similar to Sata Science and computer thinking

Искусственный интеллект в кибербезопасности
Искусственный интеллект в кибербезопасностиИскусственный интеллект в кибербезопасности
Искусственный интеллект в кибербезопасностиAleksey Lukatskiy
 
10 заповедей IT-карьериста: от простого специалиста до высокооплачиваемого эк...
10 заповедей IT-карьериста: от простого специалиста до высокооплачиваемого эк...10 заповедей IT-карьериста: от простого специалиста до высокооплачиваемого эк...
10 заповедей IT-карьериста: от простого специалиста до высокооплачиваемого эк...SkillFactory
 
L1 Вводная лекция. Обзор основных задач Data Science (Лекция №1)
L1 Вводная лекция. Обзор основных задач Data Science (Лекция №1)L1 Вводная лекция. Обзор основных задач Data Science (Лекция №1)
L1 Вводная лекция. Обзор основных задач Data Science (Лекция №1)Technosphere1
 
Машинное обучение в электронной коммерции — практика использования и подводны...
Машинное обучение в электронной коммерции — практика использования и подводны...Машинное обучение в электронной коммерции — практика использования и подводны...
Машинное обучение в электронной коммерции — практика использования и подводны...Ontico
 
Сложность – норма жизни
Сложность – норма жизниСложность – норма жизни
Сложность – норма жизниStanislav Makarov
 
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...it-network
 
Bacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsmlBacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsmlDmitry Guzenko
 
05 net saturday vasiliy borovyak ''.net performance nontrivial bottlenecks''
05 net saturday vasiliy borovyak ''.net performance nontrivial bottlenecks''05 net saturday vasiliy borovyak ''.net performance nontrivial bottlenecks''
05 net saturday vasiliy borovyak ''.net performance nontrivial bottlenecks''DneprCiklumEvents
 
F+ presentation public
F+ presentation publicF+ presentation public
F+ presentation publicSergiy Gladkyy
 

Similar to Sata Science and computer thinking (9)

Искусственный интеллект в кибербезопасности
Искусственный интеллект в кибербезопасностиИскусственный интеллект в кибербезопасности
Искусственный интеллект в кибербезопасности
 
10 заповедей IT-карьериста: от простого специалиста до высокооплачиваемого эк...
10 заповедей IT-карьериста: от простого специалиста до высокооплачиваемого эк...10 заповедей IT-карьериста: от простого специалиста до высокооплачиваемого эк...
10 заповедей IT-карьериста: от простого специалиста до высокооплачиваемого эк...
 
L1 Вводная лекция. Обзор основных задач Data Science (Лекция №1)
L1 Вводная лекция. Обзор основных задач Data Science (Лекция №1)L1 Вводная лекция. Обзор основных задач Data Science (Лекция №1)
L1 Вводная лекция. Обзор основных задач Data Science (Лекция №1)
 
Машинное обучение в электронной коммерции — практика использования и подводны...
Машинное обучение в электронной коммерции — практика использования и подводны...Машинное обучение в электронной коммерции — практика использования и подводны...
Машинное обучение в электронной коммерции — практика использования и подводны...
 
Сложность – норма жизни
Сложность – норма жизниСложность – норма жизни
Сложность – норма жизни
 
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
 
Bacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsmlBacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsml
 
05 net saturday vasiliy borovyak ''.net performance nontrivial bottlenecks''
05 net saturday vasiliy borovyak ''.net performance nontrivial bottlenecks''05 net saturday vasiliy borovyak ''.net performance nontrivial bottlenecks''
05 net saturday vasiliy borovyak ''.net performance nontrivial bottlenecks''
 
F+ presentation public
F+ presentation publicF+ presentation public
F+ presentation public
 

Sata Science and computer thinking

Editor's Notes

  1. Шутка про компьютерные науки, и про математику
  2. Краткий диалог с аудиторией, выяснить что они знают. Сказать, что можно перебивать и задавать вопросы сразу. Поспрашивать про нейронные сити и слышали ли о науке о данных? Хорошо, тогда сразу из далека, вначале поговорим о обучении. Потом причём здесь данные.
  3. Пояснить про алгоритм. Привести пример с описанием строгой последовательности деятельности. Например мы делаем, нажимаете на сердце в инстаграмме. Отправить запрос на сервер, увеличить цифру на 1 сохранить, изменить информацию в браузере.
  4. Мы обучаем. Да мы часто тоже используем алгоритмы, например когда решаем шаблонные задачи. Например сократить дробь и прочее. Но в как мы запоминаем? Мы получаем много примеров. Не правда ли, сложно объяснить алгоритму, как определить где машина, а где нет классическим образом?
  5. Вы точно ответите что это за зверь, хотя он нарисованный и допустим вы его не видели раньше никогда. Как же вы его узнали? Вы сможете точно объяснить? Попытайтесь в виде алгоритма описать, как узнать кота на изображении?
  6. Дело в том, что мы сразу видим на изображении объекты и его характеристики. Но компьютер так не видит
  7. Как правило это наука о том как провести прямую через точки. На самом деле гиперплоскость в гиперпространстве. Это чисто математика, и все алгоритмы, позволяют оптимальным образом вычислять эти разделяющие прямые.
  8. Чтобы решить задачи, в которых мы не можем дать чёткой постановки. А таких задач полно. Классический подход, мы сводим задачу к формальной постановке, дальше решаем её. Здесь мы убираем стадию “формальной постановки”. А таких задач полно.
  9. Пояснить стадии. И рассказать про ещё одну модель. Нейронные сети.
  10. Рассказать про искусственный нейрон. Про попытку сделать чёрную коробочку, которая сама всё поймёт. Про то, что ещё в 50-е года работы велись. Про то, почему развитие их преостановилось.
  11. Оказалось чтобы нейронные сети хорошо обучить, нужно много данных (миллионы примеров), и много мощностей. Но их можно обучать параллельно. А также это стало нужно бизнесу. Человечество обычно делает прорывы в науки, когда хочет заработать либо делать военные технологии, увы. Про Image net 
  12. Рассказать о революции 2012. Пока некоторые ждали конец света… Сейчас ml везде Google, Microsoft и Apple, Amazon alexa. 
  13. New image
  14. Небольшой список задач, которые очень сложно решить классическим способом, но с машинным обучением успешно решаются. Рассказать кратко про каждый тип задачи. Почему эти задачи близкие к искусственному интеллекту. Проблема coctail party, проблемы нахождения объектов на изображении и сегментации. Разделение компонент. Пример про google home и echo (amazon). Понимание текста, примеры с поиском и переводчиком.
  15. Про победу машины над человеком в одну из сложнейших игр для машины. А теперь проходит конкурс по игре в покер. И кстати, машина побеждает.
  16. Это чем занимаюсь я
  17. Не смог удержаться. Как раз в тему моего доклада. Роботизация да, но не только физического, что важно. Теперь некоторый интеллектуальный труд заменяется машинами. Аналитика, поиск ответов, кол. центры. Не нужно понимать робота в навязанном фильмами образе. Это чаще не так, это что-то типа компьютера с нужным софтом.
  18. Пример обученной сети для раскраски изображений. Не вдаваться в подробности, только обзор.