SlideShare a Scribd company logo
ВИРТУАЛЬНЫЙ ПОМОЩНИК
С РАСПОЗНАВАНИЕМ И СИНТЕЗОМ РЕЧИ

               ПРОБЛЕМЫ И РЕШЕНИЯ
О КОМПАНИИ ЦРТ


                    КОМАНДА ЦРТ
                    • Более 350 человек
                    • 28 кандидатов и
                      докторов наук
                                          КАФЕДРА ЦРТ
ТЕХНОЛОГИИ                                В ИТМО
                                          •   Магистратура
•   Распознавание речи
                                          •   Аспирантура
•   Синтез речи
                                          •   Дополнительное образование
•   Голосовая биометрия
•   Запись и анализ речи

                           ПРОДАЖИ
                           • Офисы в 6 странах мира
                           • Продажи в 75 странах

                                                                           2
ЦРТ - ЛИДЕР ПО ПРОЕКТАМ СГС В РОССИИ




                                       3
РЕЧЕВЫЕ ТЕХНОЛОГИИ И ВИРТУАЛЬНЫЕ ПОМОЩНИКИ

                        Виртуальный помощник – это компьютерный персонаж,
                        предоставляющий пользователю необходимую
                        информацию через:
                         WEB

                         Мобильные устройства

                         Терминалы самообслуживания

                           40 производителей
                           5 поколений
                           2-е поколение – синтез речи
                           3-е поколение – распознавание речи




                        Виртуальный помощник сегодня – это
                        мультимодальная система, способная
                        вести с пользователем диалог в режиме
                        «speech-to-speech»


                                                                            4
КОМПОНЕНТЫ И ТРЕБОВАНИЯ




           Основной показатель эффективности виртуального
                 помощника – релевантность ответов

                        Релевантность зависит от:
                         точности распознавания речи
                         качества синтеза речи

                                                            5
КАК ПОЛУЧИТЬ КАЧЕСТВЕННЫЙ ЗВУК?


 Точность распознавания речи зависит от качества
  звука

 Множество различных микрофонов и настроек на
  компьютерах пользователей

 Необходимость подтверждать осуществление
  доступа к микрофону




 Пользователь должен нажимать на кнопку (push-
  to-talk)

 Задача двухканальной шумоочистки и режим
  hotword bargein
                                                    6
КАК ПОВЫСИТЬ ТОЧНОСТЬ РАСПОЗНАВАНИЯ РЕЧИ?


             Варианты использования модуля распознавания речи




 1.




 2.




                                                                7
КАК СДЕЛАТЬ ГРАММАТИКИ И ЯЗЫКОВЫЕ МОДЕЛИ?


                               Источники данных




     Поисковые запросы

     Записи звонков
    в контактный центр

     Текстовые запросы
    к виртуальному помощнику

     Метод “Wizard of OZ”




                                                  8
КАКИЕ СТАНДАРТЫ ИСПОЛЬЗОВАТЬ?


                                              ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ




            VoiceXML

            Speech Recognition Grammar Specification

            Semantic Interpretation for Speech Recognition

            Speech Synthesis Markup Language

            Speech Input API Specification

            Speech JavaScript API



                                                                           9
КАК ПОВЫСИТЬ КАЧЕСТВО СИНТЕЗА РЕЧИ?


                                            ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ




    Использовать голос, соответствующий персонажу

    Провести предварительную настройку на текстах из предметной
     области (специальная лексика, аббревиатуры)

    Настроить синтез основных реплик системы (паузы и интонация)

    Использовать функцию синхронизации губ (lipsync)




                                                                         10
КАК СДЕЛАТЬ ДИАЛОГ БОЛЕЕ ЕСТЕСТВЕННЫМ?


                                           ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ




   Использовать автоматический анализ эмоций

   Использовать голосовую идентификацию




                                                                        11
КОМПОНЕНТЫ ПЕРСПЕКТИВНОЙ СИСТЕМЫ


                                   ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ




                                                                12
СПАСИБО ЗА ВНИМАНИЕ!

         ВОПРОСЫ?                                 КОНТАКТЫ

                                   Санкт-Петербург
         ДОКЛАДЧИК:                Адрес: Санкт-Петербург, ул. Красуцкого, 4
                                   Телефон: (+7 812) 325-88-48

   ПЕТР МИЦОВ                      Факс: (+7 812) 327-92-97
                                   Отдел продаж: (+7 812) 325-88-48 доб.1
  Руководитель группы разработки   Эл. почта: stc-spb@speechpro.com
                                   Почтовый адрес: 196084 Санкт-Петербург а/я
   и внедрения систем голосового
                                   515 «Центр речевых технологий»
         самообслуживания
     Центр Речевых Технологий
                                   Москва
      mitsov@speechpro.com         Адрес: Москва, ул. Марксистская, д.3, стр.5,
                                   Бизнес-центр "Таганский", 3 этаж, офис 5.3.1.
                                   Телефон: (+7 495) 661-75-50
                                   Факс: (+7 495) 661-75-17
                                   Эл. почта: stc-msk@speechpro.com




                                                                             13

More Related Content

Similar to Mitsov

Голосовая Платформа
Голосовая ПлатформаГолосовая Платформа
Голосовая ПлатформаNatalia Startseva
 
Cti voice technologies scheglov
Cti voice technologies scheglovCti voice technologies scheglov
Cti voice technologies scheglovCTI_analytics
 
Cti voice technologies scheglov
Cti voice technologies scheglovCti voice technologies scheglov
Cti voice technologies scheglovYulia Sedova
 
Искусство презентации: логика и эмоции в успешном выступлении
Искусство презентации: логика и эмоции в успешном выступленииИскусство презентации: логика и эмоции в успешном выступлении
Искусство презентации: логика и эмоции в успешном выступлении
Екатерина Мартынычева
 
Как использовать речевые технологии просто, интересно и с выгодой для продаж.
Как использовать речевые технологии просто, интересно и с выгодой для продаж.Как использовать речевые технологии просто, интересно и с выгодой для продаж.
Как использовать речевые технологии просто, интересно и с выгодой для продаж.
CallTracking.ru
 
Maleev
MaleevMaleev
Maleev
NLPseminar
 
Vocal print
Vocal print Vocal print
Применение Big Data в маркетинге
Применение Big Data в маркетингеПрименение Big Data в маркетинге
Применение Big Data в маркетинге
Evgeniy Pavlovskiy
 
Создание и продвижение социальных проектов в интернете. Виктория Вирта
Создание и продвижение социальных проектов в интернете. Виктория ВиртаСоздание и продвижение социальных проектов в интернете. Виктория Вирта
Создание и продвижение социальных проектов в интернете. Виктория Виртаoprfforum
 
Мониторинг веб пространства на открытии ИКР в НН
Мониторинг веб пространства на открытии ИКР в ННМониторинг веб пространства на открытии ИКР в НН
Мониторинг веб пространства на открытии ИКР в НН
Alex Zagoumenov
 
Александр Бакеев - Интеграция в социальные медиа
Александр Бакеев - Интеграция в социальные медиаАлександр Бакеев - Интеграция в социальные медиа
Александр Бакеев - Интеграция в социальные медиа
skazo4nick
 
Аркадий Сандлер - Как экономить ресурсы и зарабатывать при помощи ботов - Чех...
Аркадий Сандлер - Как экономить ресурсы и зарабатывать при помощи ботов - Чех...Аркадий Сандлер - Как экономить ресурсы и зарабатывать при помощи ботов - Чех...
Аркадий Сандлер - Как экономить ресурсы и зарабатывать при помощи ботов - Чех...
chatbotscommunity
 
​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...
​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...
​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...
Semantist.ru
 
VoiceXML. Теория и практика проектирования голосовых приложений
VoiceXML. Теория и практика проектирования голосовых приложенийVoiceXML. Теория и практика проектирования голосовых приложений
VoiceXML. Теория и практика проектирования голосовых приложений
AlexVoron
 
Кафедра речевых информационных систем
Кафедра речевых информационных системКафедра речевых информационных систем
Кафедра речевых информационных системITMO University
 
От распознавания речи к пониманию сказанного
От распознавания речи к пониманию сказанногоОт распознавания речи к пониманию сказанного
От распознавания речи к пониманию сказанного
CoMagic
 
E-Contenta: Чек-лист для запуска персональных рекомендаций
E-Contenta: Чек-лист для запуска персональных рекомендацийE-Contenta: Чек-лист для запуска персональных рекомендаций
E-Contenta: Чек-лист для запуска персональных рекомендаций
E-Contenta
 
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"
AINL Conferences
 

Similar to Mitsov (20)

Голосовая Платформа
Голосовая ПлатформаГолосовая Платформа
Голосовая Платформа
 
Cti voice technologies scheglov
Cti voice technologies scheglovCti voice technologies scheglov
Cti voice technologies scheglov
 
Cti voice technologies scheglov
Cti voice technologies scheglovCti voice technologies scheglov
Cti voice technologies scheglov
 
Искусство презентации: логика и эмоции в успешном выступлении
Искусство презентации: логика и эмоции в успешном выступленииИскусство презентации: логика и эмоции в успешном выступлении
Искусство презентации: логика и эмоции в успешном выступлении
 
Как использовать речевые технологии просто, интересно и с выгодой для продаж.
Как использовать речевые технологии просто, интересно и с выгодой для продаж.Как использовать речевые технологии просто, интересно и с выгодой для продаж.
Как использовать речевые технологии просто, интересно и с выгодой для продаж.
 
Maleev
MaleevMaleev
Maleev
 
Vocal print
Vocal print Vocal print
Vocal print
 
ООО «ЦРТ-инновации»
ООО «ЦРТ-инновации»ООО «ЦРТ-инновации»
ООО «ЦРТ-инновации»
 
Применение Big Data в маркетинге
Применение Big Data в маркетингеПрименение Big Data в маркетинге
Применение Big Data в маркетинге
 
Создание и продвижение социальных проектов в интернете. Виктория Вирта
Создание и продвижение социальных проектов в интернете. Виктория ВиртаСоздание и продвижение социальных проектов в интернете. Виктория Вирта
Создание и продвижение социальных проектов в интернете. Виктория Вирта
 
Мониторинг веб пространства на открытии ИКР в НН
Мониторинг веб пространства на открытии ИКР в ННМониторинг веб пространства на открытии ИКР в НН
Мониторинг веб пространства на открытии ИКР в НН
 
Александр Бакеев - Интеграция в социальные медиа
Александр Бакеев - Интеграция в социальные медиаАлександр Бакеев - Интеграция в социальные медиа
Александр Бакеев - Интеграция в социальные медиа
 
Аркадий Сандлер - Как экономить ресурсы и зарабатывать при помощи ботов - Чех...
Аркадий Сандлер - Как экономить ресурсы и зарабатывать при помощи ботов - Чех...Аркадий Сандлер - Как экономить ресурсы и зарабатывать при помощи ботов - Чех...
Аркадий Сандлер - Как экономить ресурсы и зарабатывать при помощи ботов - Чех...
 
​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...
​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...
​На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...
 
VoiceXML. Теория и практика проектирования голосовых приложений
VoiceXML. Теория и практика проектирования голосовых приложенийVoiceXML. Теория и практика проектирования голосовых приложений
VoiceXML. Теория и практика проектирования голосовых приложений
 
Кафедра речевых информационных систем
Кафедра речевых информационных системКафедра речевых информационных систем
Кафедра речевых информационных систем
 
It realspeaker-12/01/12
It realspeaker-12/01/12It realspeaker-12/01/12
It realspeaker-12/01/12
 
От распознавания речи к пониманию сказанного
От распознавания речи к пониманию сказанногоОт распознавания речи к пониманию сказанного
От распознавания речи к пониманию сказанного
 
E-Contenta: Чек-лист для запуска персональных рекомендаций
E-Contenta: Чек-лист для запуска персональных рекомендацийE-Contenta: Чек-лист для запуска персональных рекомендаций
E-Contenta: Чек-лист для запуска персональных рекомендаций
 
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"
 

More from NLPseminar

[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
NLPseminar
 
Events
EventsEvents
Events
NLPseminar
 
клышинский
клышинскийклышинский
клышинский
NLPseminar
 
конф ии и ея гаврилова
конф ии и ея  гавриловаконф ии и ея  гаврилова
конф ии и ея гавриловаNLPseminar
 
кудрявцев V3
кудрявцев V3кудрявцев V3
кудрявцев V3NLPseminar
 
rubashkin
rubashkinrubashkin
rubashkin
NLPseminar
 
Vlasova
VlasovaVlasova
Vlasova
NLPseminar
 
Ageev
AgeevAgeev
Ageev
NLPseminar
 
Khomitsevich
Khomitsevich Khomitsevich
Khomitsevich
NLPseminar
 
акинина осмоловская
акинина осмоловскаяакинина осмоловская
акинина осмоловская
NLPseminar
 
Serebryakov
SerebryakovSerebryakov
Serebryakov
NLPseminar
 
потапов
потаповпотапов
потапов
NLPseminar
 
molchanov(promt)
molchanov(promt)molchanov(promt)
molchanov(promt)
NLPseminar
 
белканова
белкановабелканова
белканова
NLPseminar
 
Skatov
SkatovSkatov
Skatov
NLPseminar
 
гвоздикин
гвоздикингвоздикин
гвоздикин
NLPseminar
 
веселов
веселоввеселов
веселов
NLPseminar
 

More from NLPseminar (20)

[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
 
Events
EventsEvents
Events
 
Tomita
TomitaTomita
Tomita
 
бетин
бетинбетин
бетин
 
Andreev
AndreevAndreev
Andreev
 
клышинский
клышинскийклышинский
клышинский
 
конф ии и ея гаврилова
конф ии и ея  гавриловаконф ии и ея  гаврилова
конф ии и ея гаврилова
 
кудрявцев V3
кудрявцев V3кудрявцев V3
кудрявцев V3
 
rubashkin
rubashkinrubashkin
rubashkin
 
Vlasova
VlasovaVlasova
Vlasova
 
Ageev
AgeevAgeev
Ageev
 
Khomitsevich
Khomitsevich Khomitsevich
Khomitsevich
 
акинина осмоловская
акинина осмоловскаяакинина осмоловская
акинина осмоловская
 
Serebryakov
SerebryakovSerebryakov
Serebryakov
 
потапов
потаповпотапов
потапов
 
molchanov(promt)
molchanov(promt)molchanov(promt)
molchanov(promt)
 
белканова
белкановабелканова
белканова
 
Skatov
SkatovSkatov
Skatov
 
гвоздикин
гвоздикингвоздикин
гвоздикин
 
веселов
веселоввеселов
веселов
 

Mitsov

  • 1. ВИРТУАЛЬНЫЙ ПОМОЩНИК С РАСПОЗНАВАНИЕМ И СИНТЕЗОМ РЕЧИ ПРОБЛЕМЫ И РЕШЕНИЯ
  • 2. О КОМПАНИИ ЦРТ КОМАНДА ЦРТ • Более 350 человек • 28 кандидатов и докторов наук КАФЕДРА ЦРТ ТЕХНОЛОГИИ В ИТМО • Магистратура • Распознавание речи • Аспирантура • Синтез речи • Дополнительное образование • Голосовая биометрия • Запись и анализ речи ПРОДАЖИ • Офисы в 6 странах мира • Продажи в 75 странах 2
  • 3. ЦРТ - ЛИДЕР ПО ПРОЕКТАМ СГС В РОССИИ 3
  • 4. РЕЧЕВЫЕ ТЕХНОЛОГИИ И ВИРТУАЛЬНЫЕ ПОМОЩНИКИ Виртуальный помощник – это компьютерный персонаж, предоставляющий пользователю необходимую информацию через:  WEB  Мобильные устройства  Терминалы самообслуживания  40 производителей  5 поколений  2-е поколение – синтез речи  3-е поколение – распознавание речи Виртуальный помощник сегодня – это мультимодальная система, способная вести с пользователем диалог в режиме «speech-to-speech» 4
  • 5. КОМПОНЕНТЫ И ТРЕБОВАНИЯ Основной показатель эффективности виртуального помощника – релевантность ответов Релевантность зависит от:  точности распознавания речи  качества синтеза речи 5
  • 6. КАК ПОЛУЧИТЬ КАЧЕСТВЕННЫЙ ЗВУК?  Точность распознавания речи зависит от качества звука  Множество различных микрофонов и настроек на компьютерах пользователей  Необходимость подтверждать осуществление доступа к микрофону  Пользователь должен нажимать на кнопку (push- to-talk)  Задача двухканальной шумоочистки и режим hotword bargein 6
  • 7. КАК ПОВЫСИТЬ ТОЧНОСТЬ РАСПОЗНАВАНИЯ РЕЧИ? Варианты использования модуля распознавания речи 1. 2. 7
  • 8. КАК СДЕЛАТЬ ГРАММАТИКИ И ЯЗЫКОВЫЕ МОДЕЛИ? Источники данных  Поисковые запросы  Записи звонков в контактный центр  Текстовые запросы к виртуальному помощнику  Метод “Wizard of OZ” 8
  • 9. КАКИЕ СТАНДАРТЫ ИСПОЛЬЗОВАТЬ? ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ  VoiceXML  Speech Recognition Grammar Specification  Semantic Interpretation for Speech Recognition  Speech Synthesis Markup Language  Speech Input API Specification  Speech JavaScript API 9
  • 10. КАК ПОВЫСИТЬ КАЧЕСТВО СИНТЕЗА РЕЧИ? ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ  Использовать голос, соответствующий персонажу  Провести предварительную настройку на текстах из предметной области (специальная лексика, аббревиатуры)  Настроить синтез основных реплик системы (паузы и интонация)  Использовать функцию синхронизации губ (lipsync) 10
  • 11. КАК СДЕЛАТЬ ДИАЛОГ БОЛЕЕ ЕСТЕСТВЕННЫМ? ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ  Использовать автоматический анализ эмоций  Использовать голосовую идентификацию 11
  • 12. КОМПОНЕНТЫ ПЕРСПЕКТИВНОЙ СИСТЕМЫ ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ 12
  • 13. СПАСИБО ЗА ВНИМАНИЕ! ВОПРОСЫ? КОНТАКТЫ Санкт-Петербург ДОКЛАДЧИК: Адрес: Санкт-Петербург, ул. Красуцкого, 4 Телефон: (+7 812) 325-88-48 ПЕТР МИЦОВ Факс: (+7 812) 327-92-97 Отдел продаж: (+7 812) 325-88-48 доб.1 Руководитель группы разработки Эл. почта: stc-spb@speechpro.com Почтовый адрес: 196084 Санкт-Петербург а/я и внедрения систем голосового 515 «Центр речевых технологий» самообслуживания Центр Речевых Технологий Москва mitsov@speechpro.com Адрес: Москва, ул. Марксистская, д.3, стр.5, Бизнес-центр "Таганский", 3 этаж, офис 5.3.1. Телефон: (+7 495) 661-75-50 Факс: (+7 495) 661-75-17 Эл. почта: stc-msk@speechpro.com 13