3. Решаемая проблема
Ручной анализ информации публикуемой в СМИ и
социальных медиа может потребовать
существенных трудозатрат и поэтому часто
неэффективен!
4. Задачи информационного анализа
• При анализе информации необходимо:
– Выполнять ее классификацию
– Выделять информационные объекты
– Объединять отдельные сообщения в группы в
зависимости от их контекста
– Иметь возможность быстро найти все документы
определенной тематики и посмотреть
ретроспективу развития события во времени
– Сделать предположение о возможном
дальнейшем развитии определенной ситуации
5. Рынок
• Рынок мониторинга социальных медиа
• PR агентства и департаменты компаний
• Безопасность
• Online реклама
• Наука и исследования
• Электронный документооборот
• News & Media
6. Обзор рынка и прогнозы спроса
Worldwide Business Analytics Software 2014–2018 Forecast and 2013 Vendor
Shares
7. Конкуренты
Лидеры:
• В мире:
– AlchemyAPI (IBM)
– OpenCalais (Reuters)
– Expert System
Semantic intelligence
– GATE
– NetBase Solutions, Inc.
– Google
• В России:
– ABBYY
– RCO fact extractor
Остальные
• NETagger
• Saplo (стартап)
• OpenNLP
• Stanford CoreNLP
8. Ключевая технология – Машинное обучение
Одна технология
позволит решать все
представленные ниже
задачи
Новый подход к
решению задач анализа
данных
9. Наши преимущества
• Настройка новых предметных областей без
лингвистов и программистов
• Высокое качество выделения объектов и скорость
обработки
• Удобные, интеллектуальные механизмы для
формирования корпуса обучения нейронных сетей
• Мультиязычность
• Возможности до-обучения и настройки на новые
предметные области
10. Бизнес-модель
• SaaS
• Продажа лицензий для организаций с
конфиденциальной информацией
• Сдача в аренду ПО – Amazon EC2 (Amazon
Machine Image), Microsoft Azure
• Партнерская программа для создания и
распространения решений для отдельных
предметных областей
11. Маркетинг и продажи: как будете выходить на рынок
1. Создание SaaS решения с бесплатно-ограниченным
доступом
2. Предоставление доступа к системе по подписке
3. Предоставление возможности пользователям
скачать и воспользоваться самостоятельно, на
своем оборудовании сформированными
программными модулями
4. Интеграция всех видов решения в единый
программный комплекс с общим интерфейсом
– Настройка и выделение пользовательских объектов
– Классификация и кластеризация (определение контекста
текстов) текстов
– Хранение, анализ и публикация данных в открытых
форматах (RDF СУБД)
12. Что уже есть и что будет
• Уже сделано
1. Разработан прототип и первая версия комплекса сбора и
определения контекста документов (классификация и
кластеризация)
2. Разработана технология выделения любых объектов с
использованием машинного обучения
3. Разработан прототип системы обучения новых предметных
областей (98% точности при выделении объекта типа
Персона)
• Ближайшие планы
1. Создание многопользовательской платформы
проектирования и обучения новых предметных областей
2. Внедрение решения выделения фактов («Иванов»
работает в ООО «Ромашка»)
3. Создание SaaS решения для контекстного анализа и
классификации текстовых документов
13. Наша Команда
Команда из 30+ высококвалифицированных специалистов – руководителей проектов,
лингвистов и программистов
14. Текущий статус (что сделано), план-график (что и
когда планируется
• Имеется:
– Разработана базовая технология
– Имеется действующий прототип системы
• Планируется (1 очередь)
– Разработка SaaS решения
• Web интерфейсы для настройки и обучения
систем
• Наличие необходимых API сервисов загрузки и
анализа данных
• Механизмы автоматического масштабирования
нагрузки
15. Потребности в капиталовложениях
• Дополнительное финансирование необходимо для:
– Создание портала формирования создания размеченных
корпусов для обучения лингвистических процессоров для
различных доменов.
– Создание хранилища для обработки корпусов текстов для
новых доменов (древнерусские тексты, научная литература
и т.д.)
– Создание системы распределенной обработки больших
объемов текстов для разных доменов
– Подключение системы оплаты SaaS сервиса
– Разработка механизмов распознавания и учета при анализе
полисемии (многозначность смыслов слов)
– Создание решения классификации и кластеризации текстов
в виде SaaS продукта
16. Спасибо за внимание!
ЗАО «Эвентос»
пр. Вернадского, 84 корп. 2
119606, Москва, Россия
Тел: +7 (499) 956 09 45
Факс:+7 (499) 956 07 49