SlideShare a Scribd company logo
1 of 9
Автономное распознавание русской 
речи 
Бузурнюк Н.С. 
AINL Сколково 2014
Требования к решению 
• Дикторонезависимость 
• Непрерывность распознавания 
• Автономность 
• Ориентированость на русский язык 
.ru
Исходные данные 
• Задача распознавания полностью 
не решена за 30 лет  
• В сегменте русского языка качество 
продуктов низкое  
• Задача имеет решение 
Принципиальная схема системы 
Сигнал 
Нормализация 
Множество 
характеристик 
Распознавание 
Обратная связь
Нормализация сигнала 
Сигнал 
Суперпозиция 
фильтров Нормализованный 
сигнал 
Оценка 
Обратная связь 
Ш 
!?
Множество характеристик 
Функция 
сигнала Разложение по 
множеству 
функций 
Множество 
характеристик 
Оценка 
Обратная связь 
풇 
!? 
푭 풕 
Функции характеристик разнородные, не 
аналитические, обладают избыточностью к 
фонемному алфавиту приблизительно в 70 
раз.
Распознавание 
Вычисление 
фонемного 
вектора 
правдоподобия 
Поиск по 
словарю 
Обратная связь 
П 
Т 
К 
РИ 
Ы 
В 
Ф 
Е 
Э 
Т 
. 
푭 풕 
ПРИВЕТ 
А без 
словаря? 
ПРИВЕТ 
КРЕВЕТ 
Вычисление 
словарного 
вектора 
правдоподобия 
Оценка по 
речевой 
модели
Что получилось? 
Размер приложения: 
– При использовании словаря в 35 тыс. слов – 80 Мб данные, 80 Мб 
оперативная память. 
– При использовании словаря до тысячи слов – 10 Мб данные, 10 
Мб оперативная память. 
Точность распознавания (Words Error Rate) 
– На геословаре (карта Москвы), около 4000 наименований улиц – 
95% 
– На словаре в 35 тыс. слов – 90% 
Скорость распознавания (тестирование на Intel Core i5 – 3.4GHz) 
– При использовании словаря до тысячи слов – 70% запаса 
производительности для непрерывного распознавания 
– Для словаря в 35 тыс. – 30% запаса производительности для 
непрерывного распознавания
Интересно? 
Задавайте вопросы! 
Спасибо! 
www.lingurus.ru

More Related Content

More from AINL Conferences

Сергей Уласень (Eugene Goostman) "Организация диалога в системе общения на ес...
Сергей Уласень (Eugene Goostman) "Организация диалога в системе общения на ес...Сергей Уласень (Eugene Goostman) "Организация диалога в системе общения на ес...
Сергей Уласень (Eugene Goostman) "Организация диалога в системе общения на ес...AINL Conferences
 
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"AINL Conferences
 
Артём Семинихин "IBM Watson: выявление скрытых взаимосвязей"
Артём Семинихин "IBM Watson: выявление скрытых взаимосвязей"Артём Семинихин "IBM Watson: выявление скрытых взаимосвязей"
Артём Семинихин "IBM Watson: выявление скрытых взаимосвязей"AINL Conferences
 
Анна Власова, Кирилл Зоркий "Как отличить в диалоге робота от человека"
Анна Власова, Кирилл Зоркий "Как отличить в диалоге робота от человека"Анна Власова, Кирилл Зоркий "Как отличить в диалоге робота от человека"
Анна Власова, Кирилл Зоркий "Как отличить в диалоге робота от человека"AINL Conferences
 
Антон Колонин "О создании программных агентов для "интернета вещей"
Антон Колонин "О создании программных агентов для "интернета вещей"Антон Колонин "О создании программных агентов для "интернета вещей"
Антон Колонин "О создании программных агентов для "интернета вещей"AINL Conferences
 
Эриберто Кваджавитль "Адаптивное обучение с подкреплением для интерактивных ...
Эриберто Кваджавитль  "Адаптивное обучение с подкреплением для интерактивных ...Эриберто Кваджавитль  "Адаптивное обучение с подкреплением для интерактивных ...
Эриберто Кваджавитль "Адаптивное обучение с подкреплением для интерактивных ...AINL Conferences
 
Как получить статус участника проекта "Сколково"
Как получить статус участника проекта "Сколково"Как получить статус участника проекта "Сколково"
Как получить статус участника проекта "Сколково"AINL Conferences
 
Центры коллективного пользования Технопарка "Сколково"
Центры коллективного пользования Технопарка "Сколково"Центры коллективного пользования Технопарка "Сколково"
Центры коллективного пользования Технопарка "Сколково"AINL Conferences
 
Ирина Гуревич "Язык программирования – это не остров: выравнивание смысла сл...
 Ирина Гуревич "Язык программирования – это не остров: выравнивание смысла сл... Ирина Гуревич "Язык программирования – это не остров: выравнивание смысла сл...
Ирина Гуревич "Язык программирования – это не остров: выравнивание смысла сл...AINL Conferences
 
Игорь Андреев (Mail.ru) "Перевод с русского на русский, или о применении тех...
 Игорь Андреев (Mail.ru) "Перевод с русского на русский, или о применении тех... Игорь Андреев (Mail.ru) "Перевод с русского на русский, или о применении тех...
Игорь Андреев (Mail.ru) "Перевод с русского на русский, или о применении тех...AINL Conferences
 
Анатолий Старостин (ABBYY) "ABBYY InfoExtractor: технология разработки предме...
Анатолий Старостин (ABBYY) "ABBYY InfoExtractor: технология разработки предме...Анатолий Старостин (ABBYY) "ABBYY InfoExtractor: технология разработки предме...
Анатолий Старостин (ABBYY) "ABBYY InfoExtractor: технология разработки предме...AINL Conferences
 
Paolo Rosso "On irony detection in social media"
Paolo Rosso "On irony detection in social media"Paolo Rosso "On irony detection in social media"
Paolo Rosso "On irony detection in social media"AINL Conferences
 
AINL 2013: Коммерческое использование мобильных ассистентов (Егор Наумов, i-F...
AINL 2013: Коммерческое использование мобильных ассистентов (Егор Наумов, i-F...AINL 2013: Коммерческое использование мобильных ассистентов (Егор Наумов, i-F...
AINL 2013: Коммерческое использование мобильных ассистентов (Егор Наумов, i-F...AINL Conferences
 
AINL 2013: Commercial use of mobile assistants (i-Free)
AINL 2013: Commercial use of mobile assistants (i-Free)AINL 2013: Commercial use of mobile assistants (i-Free)
AINL 2013: Commercial use of mobile assistants (i-Free)AINL Conferences
 
Ainl 2013 toschev-talanov_практическое применение модели мышления и машинного...
Ainl 2013 toschev-talanov_практическое применение модели мышления и машинного...Ainl 2013 toschev-talanov_практическое применение модели мышления и машинного...
Ainl 2013 toschev-talanov_практическое применение модели мышления и машинного...AINL Conferences
 
Ainl2013 molchanov статистические методы в машинном переводе_проблемы роста
Ainl2013 molchanov статистические методы в машинном переводе_проблемы ростаAinl2013 molchanov статистические методы в машинном переводе_проблемы роста
Ainl2013 molchanov статистические методы в машинном переводе_проблемы ростаAINL Conferences
 
Ainl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическаяAinl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическаяAINL Conferences
 
Ainl 2013 shavykin nao роботы.ppt
Ainl 2013 shavykin nao роботы.pptAinl 2013 shavykin nao роботы.ppt
Ainl 2013 shavykin nao роботы.pptAINL Conferences
 
Ainl2013: Huma Shah_From Eliza to Eugene: Approaching Fifty Years of Dialogue...
Ainl2013: Huma Shah_From Eliza to Eugene: Approaching Fifty Years of Dialogue...Ainl2013: Huma Shah_From Eliza to Eugene: Approaching Fifty Years of Dialogue...
Ainl2013: Huma Shah_From Eliza to Eugene: Approaching Fifty Years of Dialogue...AINL Conferences
 

More from AINL Conferences (19)

Сергей Уласень (Eugene Goostman) "Организация диалога в системе общения на ес...
Сергей Уласень (Eugene Goostman) "Организация диалога в системе общения на ес...Сергей Уласень (Eugene Goostman) "Организация диалога в системе общения на ес...
Сергей Уласень (Eugene Goostman) "Организация диалога в системе общения на ес...
 
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"
 
Артём Семинихин "IBM Watson: выявление скрытых взаимосвязей"
Артём Семинихин "IBM Watson: выявление скрытых взаимосвязей"Артём Семинихин "IBM Watson: выявление скрытых взаимосвязей"
Артём Семинихин "IBM Watson: выявление скрытых взаимосвязей"
 
Анна Власова, Кирилл Зоркий "Как отличить в диалоге робота от человека"
Анна Власова, Кирилл Зоркий "Как отличить в диалоге робота от человека"Анна Власова, Кирилл Зоркий "Как отличить в диалоге робота от человека"
Анна Власова, Кирилл Зоркий "Как отличить в диалоге робота от человека"
 
Антон Колонин "О создании программных агентов для "интернета вещей"
Антон Колонин "О создании программных агентов для "интернета вещей"Антон Колонин "О создании программных агентов для "интернета вещей"
Антон Колонин "О создании программных агентов для "интернета вещей"
 
Эриберто Кваджавитль "Адаптивное обучение с подкреплением для интерактивных ...
Эриберто Кваджавитль  "Адаптивное обучение с подкреплением для интерактивных ...Эриберто Кваджавитль  "Адаптивное обучение с подкреплением для интерактивных ...
Эриберто Кваджавитль "Адаптивное обучение с подкреплением для интерактивных ...
 
Как получить статус участника проекта "Сколково"
Как получить статус участника проекта "Сколково"Как получить статус участника проекта "Сколково"
Как получить статус участника проекта "Сколково"
 
Центры коллективного пользования Технопарка "Сколково"
Центры коллективного пользования Технопарка "Сколково"Центры коллективного пользования Технопарка "Сколково"
Центры коллективного пользования Технопарка "Сколково"
 
Ирина Гуревич "Язык программирования – это не остров: выравнивание смысла сл...
 Ирина Гуревич "Язык программирования – это не остров: выравнивание смысла сл... Ирина Гуревич "Язык программирования – это не остров: выравнивание смысла сл...
Ирина Гуревич "Язык программирования – это не остров: выравнивание смысла сл...
 
Игорь Андреев (Mail.ru) "Перевод с русского на русский, или о применении тех...
 Игорь Андреев (Mail.ru) "Перевод с русского на русский, или о применении тех... Игорь Андреев (Mail.ru) "Перевод с русского на русский, или о применении тех...
Игорь Андреев (Mail.ru) "Перевод с русского на русский, или о применении тех...
 
Анатолий Старостин (ABBYY) "ABBYY InfoExtractor: технология разработки предме...
Анатолий Старостин (ABBYY) "ABBYY InfoExtractor: технология разработки предме...Анатолий Старостин (ABBYY) "ABBYY InfoExtractor: технология разработки предме...
Анатолий Старостин (ABBYY) "ABBYY InfoExtractor: технология разработки предме...
 
Paolo Rosso "On irony detection in social media"
Paolo Rosso "On irony detection in social media"Paolo Rosso "On irony detection in social media"
Paolo Rosso "On irony detection in social media"
 
AINL 2013: Коммерческое использование мобильных ассистентов (Егор Наумов, i-F...
AINL 2013: Коммерческое использование мобильных ассистентов (Егор Наумов, i-F...AINL 2013: Коммерческое использование мобильных ассистентов (Егор Наумов, i-F...
AINL 2013: Коммерческое использование мобильных ассистентов (Егор Наумов, i-F...
 
AINL 2013: Commercial use of mobile assistants (i-Free)
AINL 2013: Commercial use of mobile assistants (i-Free)AINL 2013: Commercial use of mobile assistants (i-Free)
AINL 2013: Commercial use of mobile assistants (i-Free)
 
Ainl 2013 toschev-talanov_практическое применение модели мышления и машинного...
Ainl 2013 toschev-talanov_практическое применение модели мышления и машинного...Ainl 2013 toschev-talanov_практическое применение модели мышления и машинного...
Ainl 2013 toschev-talanov_практическое применение модели мышления и машинного...
 
Ainl2013 molchanov статистические методы в машинном переводе_проблемы роста
Ainl2013 molchanov статистические методы в машинном переводе_проблемы ростаAinl2013 molchanov статистические методы в машинном переводе_проблемы роста
Ainl2013 molchanov статистические методы в машинном переводе_проблемы роста
 
Ainl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическаяAinl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическая
 
Ainl 2013 shavykin nao роботы.ppt
Ainl 2013 shavykin nao роботы.pptAinl 2013 shavykin nao роботы.ppt
Ainl 2013 shavykin nao роботы.ppt
 
Ainl2013: Huma Shah_From Eliza to Eugene: Approaching Fifty Years of Dialogue...
Ainl2013: Huma Shah_From Eliza to Eugene: Approaching Fifty Years of Dialogue...Ainl2013: Huma Shah_From Eliza to Eugene: Approaching Fifty Years of Dialogue...
Ainl2013: Huma Shah_From Eliza to Eugene: Approaching Fifty Years of Dialogue...
 

Николай Бузурнюк "Автономная система распознавания русской речи"

  • 1. Автономное распознавание русской речи Бузурнюк Н.С. AINL Сколково 2014
  • 2. Требования к решению • Дикторонезависимость • Непрерывность распознавания • Автономность • Ориентированость на русский язык .ru
  • 3. Исходные данные • Задача распознавания полностью не решена за 30 лет  • В сегменте русского языка качество продуктов низкое  • Задача имеет решение 
  • 4. Принципиальная схема системы Сигнал Нормализация Множество характеристик Распознавание Обратная связь
  • 5. Нормализация сигнала Сигнал Суперпозиция фильтров Нормализованный сигнал Оценка Обратная связь Ш !?
  • 6. Множество характеристик Функция сигнала Разложение по множеству функций Множество характеристик Оценка Обратная связь 풇 !? 푭 풕 Функции характеристик разнородные, не аналитические, обладают избыточностью к фонемному алфавиту приблизительно в 70 раз.
  • 7. Распознавание Вычисление фонемного вектора правдоподобия Поиск по словарю Обратная связь П Т К РИ Ы В Ф Е Э Т . 푭 풕 ПРИВЕТ А без словаря? ПРИВЕТ КРЕВЕТ Вычисление словарного вектора правдоподобия Оценка по речевой модели
  • 8. Что получилось? Размер приложения: – При использовании словаря в 35 тыс. слов – 80 Мб данные, 80 Мб оперативная память. – При использовании словаря до тысячи слов – 10 Мб данные, 10 Мб оперативная память. Точность распознавания (Words Error Rate) – На геословаре (карта Москвы), около 4000 наименований улиц – 95% – На словаре в 35 тыс. слов – 90% Скорость распознавания (тестирование на Intel Core i5 – 3.4GHz) – При использовании словаря до тысячи слов – 70% запаса производительности для непрерывного распознавания – Для словаря в 35 тыс. – 30% запаса производительности для непрерывного распознавания