2. Распознавание речи
Существующий тренд:
а) Уже активно используется в мобильных устройствах
(S Voice, Siri, Google Now)
б) Появляются и продаются успешные стартапы (Mobile Technology,
RealSpeaker)
в) Появляется всё больше научных публикаций в этой области
Существующие трудности:
а) Всё ещё низкая точность
б) Ещё более низкая точность при удалении от микрофона
в) В шумных помещениях может вообще не работать
http://microphonearrays.freehphosting.ru
2|11
3. Рынки
Прогноз развития рынка распознавания речи
2012-2016 (млн. $)
APAC
~20%
*По данным Technavio. Спасибо RealSpeaker за статистику!
Биометрия
География
Текст
2500
EMEA
Americas
~30%
2000
~50%
1727
1500
1515
1257
1000
500
1047
Направления
860
2012
0
229
523
697
321
420
2013
2014
2015
2016
http://microphonearrays.freehphosting.ru
Биометрия
~25%
Текст
~75%
3|11
4. Микрофонные массивы
Микрофонный массив — один из видов направленных
микрофонов. Состоит из множества микрофонов,
находящихся в одной плоскости. Диаграмма направленности
создаётся при помощи изменения фаз волн. (Википедия)
Обычный микрофон
120°
90°
Микрофонный массив
120°
60°
150°
60°
150°
30°
180°
90°
0°
30°
180°
Устройство
обработки
0°
Phono,
XLR,
S/PDIF ...
...
330°
210°
240°
300°
270°
330°
210°
240°
300°
270°
http://microphonearrays.freehphosting.ru
4|11
5. Микрофонные массивы
Возможности:
1. Электрическое управление лучом (без механического поворота
самой системы)
2. Автоматическое обнаружение источника звукового сигнала
3. Автоматическое сопровождение объекта лучом
4. Формирование нескольких лучей
5. Фильтрация помех, даже попадающих в луч системы
!
120°
90°
!
60°
150°
0°
330°
210°
240°
90°
30°
330°
210°
300°
http://microphonearrays.freehphosting.ru
240°
300°
270°
120°
90°
60°
150°
0°
180°
270°
!
60°
150°
30°
180°
120°
!
30°
0°
180°
330°
210°
240°
300°
270°
5|11
6. Продукт
Характеристики:
1. Диапазон частот 20..20000 Гц
2. Ширина луча - не более 20°
3. Интерфейсы:
▫ выход с микрофонного массива,
Phono Jack, моно
▫ выход с одиночного микрофона
(reference output), Phono Jack, моно
▫ цифровой выход S/PDIF
4. 41..96 кГц, 24 бит, стерео
Ожидаем повышения точности
распознавания речи на 20-30%
http://microphonearrays.freehphosting.ru
6|11
7. Команда
Леонов Даниил
Туишев Рифат
Радиоэлектронные системы, специалист
(РЛ МГТУ им. Н. Э. Баумана)
Радиоэлектронные системы, специалист
(РЛ МГТУ им. Н. Э. Баумана)
Менеджмент организаций, специалист
(ИБМ МГТУ им. Н. Э. Баумана)
исследования и разработка
развитие проекта
аналитика
маркетинг
http://microphonearrays.freehphosting.ru
7|11
8. Что готово
Техника:
1. Проведены исследования и моделирование
2. Написана основная часть софта (прошивки, приложения, тесты)
3. Идёт разработка железа
Бизнес:
1. Изучен рынок и конкуренты
2. Запущен сайт проекта
3. Идёт поиск потенциальных клиентов
http://microphonearrays.freehphosting.ru
8|11
9. Чего пока нет
1. Готового прототипа
2. Договорённостей с потенциальными клиентами
3. Патентов
4. Своей или родительской организации
http://microphonearrays.freehphosting.ru
9|11
10. Планы на ближайшее будущее
1. Найти реальных покупателей и скорректировать характеристики и
требования
2. Найти средства для завершения разработки и изготовления
прототипа ($2-4K)
3. Закончить прототип
4. Найти недостающих для дальнейшего развития членов команды
5. Найти помещение для лабораторий/офиса (технопарки, инкубаторы)
6. Найти менторов и консультантов для текущих задач
7. Полученные результаты опубликовать в научных изданиях
http://microphonearrays.freehphosting.ru
10|11
11. Конец
Спасибо за внимание!
Контакты:
Леонов Даниил Игоревич
daleonov@yandex.ru
http://microphonearrays.freehphosting.ru/
+ vk, facebook, linkedin, ...
http://microphonearrays.freehphosting.ru
11|11