SlideShare a Scribd company logo
1 of 91
Современные речевые технологии:   основные направления исследований  и применяемые подходы Илья Опарин
Acknowledgements ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Основные направления исследований ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Другие направления ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Распознавание речи ,[object Object],[object Object]
Распознавание речи ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Распознавание команд ,[object Object],[object Object],[object Object],[object Object],[object Object]
Распознавание слитной речи ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Общая схема
Акустические модели ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Первичная обработка сигнала ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
HMM
Формула Байеса
Параметры  HMM ,[object Object],[object Object],[object Object],[object Object]
GMM ,[object Object],[object Object]
Моделирование распределения для 1 кепстрального коэффициента
Конкатенация  HMM
Обучение  HMM ,[object Object],[object Object]
Нейронные сети
ANN
Модели языка ,[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object]
[object Object],[object Object]
Оценка  LM ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Правило Байеса ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Характеристики модели языка ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
N- граммный подход ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
N- граммы ,[object Object],[object Object],[object Object],[object Object],[object Object]
Sparsity Problem ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Сглаживание и откат ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Техники сглаживания ,[object Object],[object Object],[object Object],[object Object],[object Object]
Backoff ,[object Object],[object Object],[object Object],[object Object],[object Object]
N- граммы: за и против ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Усовершенствования  N- грамм ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Морфология в моделях языка ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Синтаксис в моделях языка ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Семантика в моделях языка ,[object Object],[object Object],[object Object]
Putting Language Back to Language Modelling ,[object Object],[object Object],[object Object],[object Object]
Выделение ключевых слов ,[object Object],[object Object]
Применяемые подходы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
KWS  на моделях ключевых слов
Монофонная  KWS- сеть
Трифонная  KWS- сеть
KWS  на основе  ASR –  словные латтисы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
KWS  на основе  ASR  – фонемные латтисы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Современный уровень распознавания ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Распознавание языка сообщения ,[object Object],[object Object]
Области применения ,[object Object],[object Object],[object Object]
Применяемые подходы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Фонотактический подход ,[object Object],[object Object],[object Object],[object Object]
Идентификация диктора ,[object Object],[object Object],[object Object]
Идентификация/Верификация ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Развитие идентификации ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Меры оценки качества ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Спектральные методы ,[object Object],[object Object],[object Object],[object Object],[object Object]
Distance Calculation R U R U … … … … … … … …
Статистические подходы -  GMM ,[object Object],[object Object],[object Object]
Базы данных ,[object Object],[object Object],[object Object]
Модели диктора ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Фоновая модель ,[object Object],[object Object],[object Object]
Модель диктора с использованием  UBM ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Синтез речи по тексту ,[object Object],[object Object]
Синтез речи ,[object Object],[object Object]
Области применения ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Главные проблемы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Системы синтеза речи - история ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Системы русской речи - сейчас ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Артикуляторный синтез ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Формантный синтез ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Компилятивный синтез  (Concatenative Synthesis) ,[object Object],[object Object],[object Object]
Макросинтез  (Domain-specific Synthesis) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Компилятивный синтез из единиц фиксированной длины ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Модификации сигнала ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Unit Selection ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Общая структура  TTS
Создание  TTS –  запись речевой базы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Создание  TTS –  нормализация текста ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Создание  TTS –  анализ текста
Создание  TTS –  анализ текста ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Создание  TTS –  анализ текста ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Создание  TTS -  транскриптор
Создание  TTS -  транскриптор ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Создание  TTS –  модификация звука
Unit Selection - intuition ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Target Cost ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Concatenation Cost ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Total Cost
Преимущества и недостатки  US ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
HMM -синтез ,[object Object],[object Object],[object Object],[object Object],[object Object]
Рекомендуемая литература ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
 

More Related Content

Similar to Speech technologies

Современные средства NLP в поисковых задач - Стачка 2017
Современные средства NLP в поисковых задач - Стачка 2017Современные средства NLP в поисковых задач - Стачка 2017
Современные средства NLP в поисковых задач - Стачка 2017Nikita Zhiltsov
 
лекции 3 4 тема 1
лекции 3 4 тема 1лекции 3 4 тема 1
лекции 3 4 тема 1Noobie312
 
гибридная технология перевода. юлия епифанцева. зал.4
гибридная технология перевода. юлия епифанцева. зал.4гибридная технология перевода. юлия епифанцева. зал.4
гибридная технология перевода. юлия епифанцева. зал.4rit2011
 
Презентация PROMT для РИТ
Презентация PROMT для РИТПрезентация PROMT для РИТ
Презентация PROMT для РИТQPsoft
 

Similar to Speech technologies (6)

Современные средства NLP в поисковых задач - Стачка 2017
Современные средства NLP в поисковых задач - Стачка 2017Современные средства NLP в поисковых задач - Стачка 2017
Современные средства NLP в поисковых задач - Стачка 2017
 
RussNet
RussNetRussNet
RussNet
 
лекции 3 4 тема 1
лекции 3 4 тема 1лекции 3 4 тема 1
лекции 3 4 тема 1
 
гибридная технология перевода. юлия епифанцева. зал.4
гибридная технология перевода. юлия епифанцева. зал.4гибридная технология перевода. юлия епифанцева. зал.4
гибридная технология перевода. юлия епифанцева. зал.4
 
Презентация PROMT для РИТ
Презентация PROMT для РИТПрезентация PROMT для РИТ
Презентация PROMT для РИТ
 
Программные средства выявления теминологических вариантов в текстах
Программные средства выявления теминологических вариантов в текстахПрограммные средства выявления теминологических вариантов в текстах
Программные средства выявления теминологических вариантов в текстах
 

More from NLPseminar

[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна ЛандоNLPseminar
 
клышинский
клышинскийклышинский
клышинскийNLPseminar
 
конф ии и ея гаврилова
конф ии и ея  гавриловаконф ии и ея  гаврилова
конф ии и ея гавриловаNLPseminar
 
кудрявцев V3
кудрявцев V3кудрявцев V3
кудрявцев V3NLPseminar
 
акинина осмоловская
акинина осмоловскаяакинина осмоловская
акинина осмоловскаяNLPseminar
 
потапов
потаповпотапов
потаповNLPseminar
 
molchanov(promt)
molchanov(promt)molchanov(promt)
molchanov(promt)NLPseminar
 
белканова
белкановабелканова
белкановаNLPseminar
 
гвоздикин
гвоздикингвоздикин
гвоздикинNLPseminar
 
веселов
веселоввеселов
веселовNLPseminar
 

More from NLPseminar (20)

[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
 
Events
EventsEvents
Events
 
Tomita
TomitaTomita
Tomita
 
бетин
бетинбетин
бетин
 
Andreev
AndreevAndreev
Andreev
 
клышинский
клышинскийклышинский
клышинский
 
конф ии и ея гаврилова
конф ии и ея  гавриловаконф ии и ея  гаврилова
конф ии и ея гаврилова
 
кудрявцев V3
кудрявцев V3кудрявцев V3
кудрявцев V3
 
rubashkin
rubashkinrubashkin
rubashkin
 
Vlasova
VlasovaVlasova
Vlasova
 
Ageev
AgeevAgeev
Ageev
 
Khomitsevich
Khomitsevich Khomitsevich
Khomitsevich
 
акинина осмоловская
акинина осмоловскаяакинина осмоловская
акинина осмоловская
 
Serebryakov
SerebryakovSerebryakov
Serebryakov
 
потапов
потаповпотапов
потапов
 
molchanov(promt)
molchanov(promt)molchanov(promt)
molchanov(promt)
 
белканова
белкановабелканова
белканова
 
Skatov
SkatovSkatov
Skatov
 
гвоздикин
гвоздикингвоздикин
гвоздикин
 
веселов
веселоввеселов
веселов
 

Speech technologies