Puzzle: система распознавания фото
и видео на базе нейронных сетей
Станислав Ашманов, Игорь Модяев
ООО «Нейросети Ашманова»
РЕЗЮМЕ ПРОЕКТА
Puzzle – система семантического распознавания объектов в фото и видео на базе нейронных
сетей
Целевые рынки:
 Информационная безопасность
 Видеонаблюдение
 Социальные сети
 Робототехнические компании
На данный момент:
 Разработан фреймворк PuzzleNN для построения глубоких нейронных сетей
 Разработаны базовые системы детекции и синтеза изображений
 Достигнута договорённость о пилотных проектах с компаниями InfoWatch и Крибрум
 Получено резидентство Сколково
 Подана заявка в Фонд Бортника на грант в размере 2 млн. руб.
Мы ищем:
 Инвестиции
 Клиентов
РЕШАЕМАЯ ПРОБЛЕМА
Проблема:
 В мире генерируется чрезвычайно много данных*, скорость их поступления
увеличивается**
 Этот массив данных необходимо анализировать (в частности, фото и видео)
 Ручной анализ данных невозможен из-за их объёма
 Алгоритмы анализа прошлого поколения способны только на простые
заключения о входных данных
Для каких отраслей эта проблема актуальна:
 Видеонаблюдение
 Информационная безопасность
 Социальные сети и др.
* 100 млн. камер в 2013 году 200 млн. в 2017 году (IMS Research)
** 90% всех мировых данных собраны за последние 2 года (SINTEF)
ПРЕДЛАГАЕМОЕ РЕШЕНИЕ
Продукт:
 Программная библиотека детекции и распознавания изображений и видео (OEM)
 Онлайн-сервис распознавания (API)
 Редактор с графическим интерфейсом (для обучения системы на стороне заказчика)
Результат внедрения:
 Расширение возможностей продукта заказчика (детекция новых видов событий в потоке
видео или в исходящей почте и др.)
 Повышение эффективности инструментов заказчика (повышение рекламной конверсии и др.)
 Автоматизация задач, сейчас выполняемых человеком (ситуационный анализ видео и др.)
СУТЬ ИННОВАЦИИ
Математическая
модель
Puzzle
 Устойчивость к искажениям данных
 Меньший объём обучающих данных
 Ситуативный анализ данных
 Способность к обобщению знаний
Архитектура
Puzzle
 Анализ как фото, так и видео
 Программная библиотека и онлайн-сервис
 Высокая скорость работы (применение GPU)
 Графическая среда обучения
АНАЛОГИ И КОНКУРЕНТЫ
Распознавание
произвольных
объектов
Программная
библиотека
Онлайн-
сервис
Ситуативный
анализ
Графическая
среда
обучения
Технологии
нейронных
сетей
Использование
GPU
Выпущен продукт
Puzzle Да Да Да Да Да Да Да Нет
VisionLabs Нет Да Да Нет Нет Да Да Да
Vocord Нет Да Нет Нет Нет Да Да Да
NTechLab Нет Нет Нет Нет Нет Да Да Нет
Синезис Нет Нет Нет Частично Да Да Да Да
Clarifai Да Нет Да Нет Нет Да Да Да
РЫНОК И БИЗНЕС-МОДЕЛЬ
Область применения продукта:
 Информационная безопасность (распознавание событий в потоке данных)
 Видеонаблюдение (автоматизация работы камер наружного наблюдения)
 Социальные сети (повышение рекламной конверсии и др. задачи)
 Робототехника
На чём зарабатывать:
 Внедрение системы распознавания в продукты клиента
 Доступ к онлайн-сервису распознавания
Комментарии:
 Рынок интеллектуального анализа изображений и видео составляет 1.8 млрд. руб. в России
на 2014 год, растёт на 10-15% в год - по данным IMS Research
 На отечественном рынке нет онлайн-сервиса распознавания фото и видео
СТАТУС ПРОЕКТА
Сделано:
 Разработан фреймворк PuzzleNN для построения глубоких нейронных сетей
 Разработаны базовые системы детекции и синтеза изображений
 Достигнута договорённость о пилотных проектах с компаниями-резидентами Сколково
InfoWatch и Крибрум
 Получено резидентство Сколково
 Подана заявка в Фонд Бортника на грант в размере 2 млн. руб.
Делается:
 НИОКР
 Готовимся к пилотным проектам
 Ищем финансирование
ПЛАН РАЗВИТИЯ
Технология
Внедрения в РФ
Кросс-платформенность
Первая версия Puzzle
Графическая система
обучения
Онлайн-сервис
Ситуативный анализ
Внедрения в РФ
Иностранные рынки
I полугодие 2016 г. II полугодие 2016 г. I полугодие 2017 г. II полугодие 2017 г.
Запуск онлайн-сервиса
Продвижение продукта
Пилотные проекты
Грант Фонда Бортника
Робоцентр Сколково
Найм лингвиста и
разработчика
Патентование в РФ
Найм сотрудников
Патентование за
рубежом
Организация
КОМАНДА ПРОЕКТА
Станислав Ашманов
CEO
Мехмат МГУ с отличием, 2014 год;
аспирант Сколтеха
Разработчик ИИ с 2004 года; специалист по
системам распознавания
 Руководство, поиск клиентов
 Архитектура системы
 Разработка
Игорь Модяев
CTO
Мехмат МГУ с отличием, 2014 год;
аспирант Вычислительного центра РАН
Специалист по вычислениям на GPU и
компьютерной графике
 Математическая модель
 Архитектура системы
 Разработка
ПОТРЕБНОСТИ НА ТЕКУЩЕЙ СТАДИИ
Нужны инвестиции для:
 Найма разработчиков и лингвистов
 Закупки серверов для онлайн-сервиса
распознавания
 Закупки 3D-оборудования
 Хозяйственных нужд
Объём – порядка нескольких млн. руб.;
возможно, удастся получить поддержку
государства.
Нужны партнёры для:
 Пилотных внедрений
Есть партнёры в сфере IT.
Интересны пилотные проекты в сферах
видеонаблюдения и робототехники.
Призовые 5 млн. руб. на 1 год развития
Зарплаты Сервера
3D-оборудование Аренда офиса
Обслуживание серверов
ЗАКЛЮЧЕНИЕ
Мы:
 Разрабатываем Puzzle – систему семантического распознавания объектов в фото и видео на
базе нейронных сетей
 Обладаем нужными компетенциями, знаниями и навыками
 Понимаем, где Puzzle востребована
 Имеем договорённости с крупными компаниями о внедрениях
Puzzle:
 Обладает новыми свойствами, которые будут коммерчески востребованы
 Основывается на разработанной нами математической модели
 Находится на передовой прогресса (использование GPU, нейронные сети и др.)
Нам нужно:
 Найти средства на развитие в 2016 году
 Найти клиентов для пилотных проектов Спасибо!

Puzzle

  • 1.
    Puzzle: система распознаванияфото и видео на базе нейронных сетей Станислав Ашманов, Игорь Модяев ООО «Нейросети Ашманова»
  • 2.
    РЕЗЮМЕ ПРОЕКТА Puzzle –система семантического распознавания объектов в фото и видео на базе нейронных сетей Целевые рынки:  Информационная безопасность  Видеонаблюдение  Социальные сети  Робототехнические компании На данный момент:  Разработан фреймворк PuzzleNN для построения глубоких нейронных сетей  Разработаны базовые системы детекции и синтеза изображений  Достигнута договорённость о пилотных проектах с компаниями InfoWatch и Крибрум  Получено резидентство Сколково  Подана заявка в Фонд Бортника на грант в размере 2 млн. руб. Мы ищем:  Инвестиции  Клиентов
  • 3.
    РЕШАЕМАЯ ПРОБЛЕМА Проблема:  Вмире генерируется чрезвычайно много данных*, скорость их поступления увеличивается**  Этот массив данных необходимо анализировать (в частности, фото и видео)  Ручной анализ данных невозможен из-за их объёма  Алгоритмы анализа прошлого поколения способны только на простые заключения о входных данных Для каких отраслей эта проблема актуальна:  Видеонаблюдение  Информационная безопасность  Социальные сети и др. * 100 млн. камер в 2013 году 200 млн. в 2017 году (IMS Research) ** 90% всех мировых данных собраны за последние 2 года (SINTEF)
  • 4.
    ПРЕДЛАГАЕМОЕ РЕШЕНИЕ Продукт:  Программнаябиблиотека детекции и распознавания изображений и видео (OEM)  Онлайн-сервис распознавания (API)  Редактор с графическим интерфейсом (для обучения системы на стороне заказчика) Результат внедрения:  Расширение возможностей продукта заказчика (детекция новых видов событий в потоке видео или в исходящей почте и др.)  Повышение эффективности инструментов заказчика (повышение рекламной конверсии и др.)  Автоматизация задач, сейчас выполняемых человеком (ситуационный анализ видео и др.)
  • 5.
    СУТЬ ИННОВАЦИИ Математическая модель Puzzle  Устойчивостьк искажениям данных  Меньший объём обучающих данных  Ситуативный анализ данных  Способность к обобщению знаний Архитектура Puzzle  Анализ как фото, так и видео  Программная библиотека и онлайн-сервис  Высокая скорость работы (применение GPU)  Графическая среда обучения
  • 6.
    АНАЛОГИ И КОНКУРЕНТЫ Распознавание произвольных объектов Программная библиотека Онлайн- сервис Ситуативный анализ Графическая среда обучения Технологии нейронных сетей Использование GPU Выпущенпродукт Puzzle Да Да Да Да Да Да Да Нет VisionLabs Нет Да Да Нет Нет Да Да Да Vocord Нет Да Нет Нет Нет Да Да Да NTechLab Нет Нет Нет Нет Нет Да Да Нет Синезис Нет Нет Нет Частично Да Да Да Да Clarifai Да Нет Да Нет Нет Да Да Да
  • 7.
    РЫНОК И БИЗНЕС-МОДЕЛЬ Областьприменения продукта:  Информационная безопасность (распознавание событий в потоке данных)  Видеонаблюдение (автоматизация работы камер наружного наблюдения)  Социальные сети (повышение рекламной конверсии и др. задачи)  Робототехника На чём зарабатывать:  Внедрение системы распознавания в продукты клиента  Доступ к онлайн-сервису распознавания Комментарии:  Рынок интеллектуального анализа изображений и видео составляет 1.8 млрд. руб. в России на 2014 год, растёт на 10-15% в год - по данным IMS Research  На отечественном рынке нет онлайн-сервиса распознавания фото и видео
  • 8.
    СТАТУС ПРОЕКТА Сделано:  Разработанфреймворк PuzzleNN для построения глубоких нейронных сетей  Разработаны базовые системы детекции и синтеза изображений  Достигнута договорённость о пилотных проектах с компаниями-резидентами Сколково InfoWatch и Крибрум  Получено резидентство Сколково  Подана заявка в Фонд Бортника на грант в размере 2 млн. руб. Делается:  НИОКР  Готовимся к пилотным проектам  Ищем финансирование
  • 9.
    ПЛАН РАЗВИТИЯ Технология Внедрения вРФ Кросс-платформенность Первая версия Puzzle Графическая система обучения Онлайн-сервис Ситуативный анализ Внедрения в РФ Иностранные рынки I полугодие 2016 г. II полугодие 2016 г. I полугодие 2017 г. II полугодие 2017 г. Запуск онлайн-сервиса Продвижение продукта Пилотные проекты Грант Фонда Бортника Робоцентр Сколково Найм лингвиста и разработчика Патентование в РФ Найм сотрудников Патентование за рубежом Организация
  • 10.
    КОМАНДА ПРОЕКТА Станислав Ашманов CEO МехматМГУ с отличием, 2014 год; аспирант Сколтеха Разработчик ИИ с 2004 года; специалист по системам распознавания  Руководство, поиск клиентов  Архитектура системы  Разработка Игорь Модяев CTO Мехмат МГУ с отличием, 2014 год; аспирант Вычислительного центра РАН Специалист по вычислениям на GPU и компьютерной графике  Математическая модель  Архитектура системы  Разработка
  • 11.
    ПОТРЕБНОСТИ НА ТЕКУЩЕЙСТАДИИ Нужны инвестиции для:  Найма разработчиков и лингвистов  Закупки серверов для онлайн-сервиса распознавания  Закупки 3D-оборудования  Хозяйственных нужд Объём – порядка нескольких млн. руб.; возможно, удастся получить поддержку государства. Нужны партнёры для:  Пилотных внедрений Есть партнёры в сфере IT. Интересны пилотные проекты в сферах видеонаблюдения и робототехники. Призовые 5 млн. руб. на 1 год развития Зарплаты Сервера 3D-оборудование Аренда офиса Обслуживание серверов
  • 12.
    ЗАКЛЮЧЕНИЕ Мы:  Разрабатываем Puzzle– систему семантического распознавания объектов в фото и видео на базе нейронных сетей  Обладаем нужными компетенциями, знаниями и навыками  Понимаем, где Puzzle востребована  Имеем договорённости с крупными компаниями о внедрениях Puzzle:  Обладает новыми свойствами, которые будут коммерчески востребованы  Основывается на разработанной нами математической модели  Находится на передовой прогресса (использование GPU, нейронные сети и др.) Нам нужно:  Найти средства на развитие в 2016 году  Найти клиентов для пилотных проектов Спасибо!