Николай Бузурнюк "Автономная система распознавания русской речи"

•Download as PPTX, PDF•

2 likes•740 views

В докладе рассматривается решение задачи распознавания русской речи на большом словаре с использованием комбинированных признаков входного сигнала. Ноу-хау алгоритма является подобранный сбалансированных набор признаков входного сигнала. Важными свойствами решения являются высокая производительность, компактность и обучаемость, что позволяет использовать систему во встраиваемых устройствах. Приводится общее описание решения, а также достигнутые результаты.

Technology

Автономное распознавание русской
речи
Бузурнюк Н.С.
AINL Сколково 2014

Требования к решению
• Дикторонезависимость
• Непрерывность распознавания
• Автономность
• Ориентированость на русский язык
.ru

Исходные данные
• Задача распознавания полностью
не решена за 30 лет 
• В сегменте русского языка качество
продуктов низкое 
• Задача имеет решение 

Принципиальная схема системы
Сигнал
Нормализация
Множество
характеристик
Распознавание
Обратная связь

Нормализация сигнала
Сигнал
Суперпозиция
фильтров Нормализованный
сигнал
Оценка
Обратная связь
Ш
!?

Множество характеристик
Функция
сигнала Разложение по
множеству
функций
Множество
характеристик
Оценка
Обратная связь
풇
!?
푭 풕
Функции характеристик разнородные, не
аналитические, обладают избыточностью к
фонемному алфавиту приблизительно в 70
раз.

Распознавание
Вычисление
фонемного
вектора
правдоподобия
Поиск по
словарю
Обратная связь
П
Т
К
РИ
Ы
В
Ф
Е
Э
Т
.
푭 풕
ПРИВЕТ
А без
словаря?
ПРИВЕТ
КРЕВЕТ
Вычисление
словарного
вектора
правдоподобия
Оценка по
речевой
модели

Что получилось?
Размер приложения:
– При использовании словаря в 35 тыс. слов – 80 Мб данные, 80 Мб
оперативная память.
– При использовании словаря до тысячи слов – 10 Мб данные, 10
Мб оперативная память.
Точность распознавания (Words Error Rate)
– На геословаре (карта Москвы), около 4000 наименований улиц –
95%
– На словаре в 35 тыс. слов – 90%
Скорость распознавания (тестирование на Intel Core i5 – 3.4GHz)
– При использовании словаря до тысячи слов – 70% запаса
производительности для непрерывного распознавания
– Для словаря в 35 тыс. – 30% запаса производительности для
непрерывного распознавания

Интересно?
Задавайте вопросы!
Спасибо!
www.lingurus.ru

More from AINL Conferences

Сергей Уласень (Eugene Goostman) "Организация диалога в системе общения на ес...AINL Conferences

Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"AINL Conferences

Артём Семинихин "IBM Watson: выявление скрытых взаимосвязей"AINL Conferences

Анна Власова, Кирилл Зоркий "Как отличить в диалоге робота от человека"AINL Conferences

Антон Колонин "О создании программных агентов для "интернета вещей"AINL Conferences

Эриберто Кваджавитль "Адаптивное обучение с подкреплением для интерактивных ...AINL Conferences

Как получить статус участника проекта "Сколково"AINL Conferences

Центры коллективного пользования Технопарка "Сколково"AINL Conferences

Ирина Гуревич "Язык программирования – это не остров: выравнивание смысла сл...AINL Conferences

Игорь Андреев (Mail.ru) "Перевод с русского на русский, или о применении тех...AINL Conferences

Анатолий Старостин (ABBYY) "ABBYY InfoExtractor: технология разработки предме...AINL Conferences

Paolo Rosso "On irony detection in social media"AINL Conferences

AINL 2013: Коммерческое использование мобильных ассистентов (Егор Наумов, i-F...AINL Conferences

AINL 2013: Commercial use of mobile assistants (i-Free)AINL Conferences

Ainl 2013 toschev-talanov_практическое применение модели мышления и машинного...AINL Conferences

Ainl2013 molchanov статистические методы в машинном переводе_проблемы ростаAINL Conferences

Ainl 2013 bogatyrev_математическая и лингвистическаяAINL Conferences

Ainl 2013 shavykin nao роботы.pptAINL Conferences

Ainl2013: Huma Shah_From Eliza to Eugene: Approaching Fifty Years of Dialogue...AINL Conferences

More from AINL Conferences (19)

Сергей Уласень (Eugene Goostman) "Организация диалога в системе общения на ес...

Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"

Артём Семинихин "IBM Watson: выявление скрытых взаимосвязей"

Анна Власова, Кирилл Зоркий "Как отличить в диалоге робота от человека"

Антон Колонин "О создании программных агентов для "интернета вещей"

Эриберто Кваджавитль "Адаптивное обучение с подкреплением для интерактивных ...

Как получить статус участника проекта "Сколково"

Центры коллективного пользования Технопарка "Сколково"

Ирина Гуревич "Язык программирования – это не остров: выравнивание смысла сл...

Игорь Андреев (Mail.ru) "Перевод с русского на русский, или о применении тех...

Анатолий Старостин (ABBYY) "ABBYY InfoExtractor: технология разработки предме...

Paolo Rosso "On irony detection in social media"

AINL 2013: Коммерческое использование мобильных ассистентов (Егор Наумов, i-F...

AINL 2013: Commercial use of mobile assistants (i-Free)

Ainl 2013 toschev-talanov_практическое применение модели мышления и машинного...

Ainl2013 molchanov статистические методы в машинном переводе_проблемы роста

Ainl 2013 bogatyrev_математическая и лингвистическая

Ainl 2013 shavykin nao роботы.ppt

Ainl2013: Huma Shah_From Eliza to Eugene: Approaching Fifty Years of Dialogue...

Николай Бузурнюк "Автономная система распознавания русской речи"

1. Автономное распознавание русской речи Бузурнюк Н.С. AINL Сколково 2014

2. Требования к решению • Дикторонезависимость • Непрерывность распознавания • Автономность • Ориентированость на русский язык .ru

3. Исходные данные • Задача распознавания полностью не решена за 30 лет  • В сегменте русского языка качество продуктов низкое  • Задача имеет решение 

4. Принципиальная схема системы Сигнал Нормализация Множество характеристик Распознавание Обратная связь

5. Нормализация сигнала Сигнал Суперпозиция фильтров Нормализованный сигнал Оценка Обратная связь Ш !?

6. Множество характеристик Функция сигнала Разложение по множеству функций Множество характеристик Оценка Обратная связь 풇 !? 푭 풕 Функции характеристик разнородные, не аналитические, обладают избыточностью к фонемному алфавиту приблизительно в 70 раз.

7. Распознавание Вычисление фонемного вектора правдоподобия Поиск по словарю Обратная связь П Т К РИ Ы В Ф Е Э Т . 푭 풕 ПРИВЕТ А без словаря? ПРИВЕТ КРЕВЕТ Вычисление словарного вектора правдоподобия Оценка по речевой модели

8. Что получилось? Размер приложения: – При использовании словаря в 35 тыс. слов – 80 Мб данные, 80 Мб оперативная память. – При использовании словаря до тысячи слов – 10 Мб данные, 10 Мб оперативная память. Точность распознавания (Words Error Rate) – На геословаре (карта Москвы), около 4000 наименований улиц – 95% – На словаре в 35 тыс. слов – 90% Скорость распознавания (тестирование на Intel Core i5 – 3.4GHz) – При использовании словаря до тысячи слов – 70% запаса производительности для непрерывного распознавания – Для словаря в 35 тыс. – 30% запаса производительности для непрерывного распознавания

9. Интересно? Задавайте вопросы! Спасибо! www.lingurus.ru

Николай Бузурнюк "Автономная система распознавания русской речи"

Recommended

Recommended

More Related Content

More from AINL Conferences

More from AINL Conferences (19)

Николай Бузурнюк "Автономная система распознавания русской речи"