Рассказ о том, чем занимаются в Яндексе лингвисты. Мы обсудим, как лингвистические данные и методы помогают улучшать поиск и другие сервисы, а ещё поговорим о том, при чём здесь машинное обучение, что такое поисковые расширения и как расшифровывается NERQ.
Рассказ о том, чем занимаются в Яндексе лингвисты. Мы обсудим, как лингвистические данные и методы помогают улучшать поиск и другие сервисы, а ещё поговорим о том, при чём здесь машинное обучение, что такое поисковые расширения и как расшифровывается NERQ.
VOCAL PRINT-приложение, обеспечивающее ввод данных голосом в деятельности врача. Во время осмотра врач надиктовывает «Vocalprint» текст, который будет в режиме реального времени расшифровывается (распознается речь) и автоматически переносится в состав открытого у врача протокола. Система будет полезна врачам в момент работы с пациентом или с данными исследований пациентов например: -При сонографическом исследовании, во время эндоскопического исследования,в стоматологии(когда руки врача заняты и нет возможности записывать вручную в момент манипуляции) -В исследованиях которые изобилует количественными и качественными характеристиками,и их необходимо зафиксировать(узлы,конкременты,опухоли и т.п) при описании радиологических исследований -В работе бригады скорой помощи или бригады из нескольких врачей-например,операционная.
Александр Бакеев - Интеграция в социальные медиаskazo4nick
Презентация Александра Бакеева (R.May Consulting Group) на конференции "Интернет-маркетинг: продвижение в социальных сетях", состоявшейся 22 июня 2012 г. в г. Калининграде.
Организатор конференции - медиагруппа "Западная Пресса".
Аркадий Сандлер - Как экономить ресурсы и зарабатывать при помощи ботов - Чех...chatbotscommunity
Аркадий Сандлер - Как экономить ресурсы и зарабатывать при помощи ботов - Чехов #APi x Chatbots Community: «Поговори со мной: что умеют боты и кому они нужны»
На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...Semantist.ru
• как наколдовать много клиентов на сайт
• фишка контент продвижения за 3 месяца
• какие опасности несет контент
• миф LSI
• Дзен копирайтинг будущего
• Баден-Баден vs. контент-маркетинг
• защита текста
1. Найти все запросы в поиске от потенциальных клиентов
семантика = спрос = деньги
2. Источники семантики
- парсинг сервисов
- базы запросов
- счетчики
- семантические сервисы
- похожие запросы
- подсказки
- яндекс wordstat
3. Сбор поисковых фраз из всех источников
- запросы конкурентов
- запросы из Метрики и Google Analitics
- база МОАВ
- запросы Wordstat
- подсказки ПС
- генерация запросов по матрицам
4. LSI-копирайтинг - методика написания и подачи текстового материала, повышающая его релевантность
5. 10 правил дзен текста
- сила - в правде
- смысл важнее формы
- чем проще - тем лучше
- пишите как для себя
- читайте вслух
- приводите примеры
- от простого к сложному
- пользу - вперед
- поставьте заголовок
- уважение и забота
6. Задача - портал на 500 страниц. Сделано:
- 1380 потребностей
- 500 страниц на внедрение
- 9 основных разделов сайта
- обновлен сайт, верстка, движок, функционал
- добавлена мобильная версия
- расширена региональность проекта
- комплект УТП для нескольких ниш = рост конверсии > 2 раза
7. Контент-маркетинг обеспечивает 92,23% трафика из органического поиска.
От распознавания речи к пониманию сказанногоCoMagic
Александр Белозерчик, ЦРТ, руководитель отдела развития продуктов
- Как компьютер распознает речь;
- Что значит компьютерное понимание речи и в чем это выражается;
- Почему без понимания нет качественного распознавания.
E-Contenta: Чек-лист для запуска персональных рекомендацийE-Contenta
Презентация E-Contenta на конференции World Content Market, прошедшей 28 мая в Москве.
В презентации описано:
- что такое персональные рекомендации,
- стоит ли разрабатывать их внутри компании или лучше отдать на аутсорс,
- какии требованиям должны отвечать персональные рекомендации.
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"AINL Conferences
Доклад посвящен практическим аспектам применения речевых интерфейсов на основе опыта разработки телефонных систем для контакт-центров. В докладе будут описаны основные ограничения, вызванные качеством распознавания речи, спонтанным характером речи и когнитивными способностями человека. Кроме того, будут рассмотрены основные метрики эффективности интерфейсов и лучшие практики, применяемые в их разработке. Наконец, часть доклада будет касаться того, как появление дополнительной модальности способно повысить эффективность речевых интерфейсов.
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна ЛандоNLPseminar
Диалоговые системы и чат-боты: как они устроены сейчас (правила, фреймы, шаблоны) и как машинное обучение может изменить их качество и применимость.
Видеозапись лекции: https://www.youtube.com/watch?v=-9zKXLAwm7w
VOCAL PRINT-приложение, обеспечивающее ввод данных голосом в деятельности врача. Во время осмотра врач надиктовывает «Vocalprint» текст, который будет в режиме реального времени расшифровывается (распознается речь) и автоматически переносится в состав открытого у врача протокола. Система будет полезна врачам в момент работы с пациентом или с данными исследований пациентов например: -При сонографическом исследовании, во время эндоскопического исследования,в стоматологии(когда руки врача заняты и нет возможности записывать вручную в момент манипуляции) -В исследованиях которые изобилует количественными и качественными характеристиками,и их необходимо зафиксировать(узлы,конкременты,опухоли и т.п) при описании радиологических исследований -В работе бригады скорой помощи или бригады из нескольких врачей-например,операционная.
Александр Бакеев - Интеграция в социальные медиаskazo4nick
Презентация Александра Бакеева (R.May Consulting Group) на конференции "Интернет-маркетинг: продвижение в социальных сетях", состоявшейся 22 июня 2012 г. в г. Калининграде.
Организатор конференции - медиагруппа "Западная Пресса".
Аркадий Сандлер - Как экономить ресурсы и зарабатывать при помощи ботов - Чех...chatbotscommunity
Аркадий Сандлер - Как экономить ресурсы и зарабатывать при помощи ботов - Чехов #APi x Chatbots Community: «Поговори со мной: что умеют боты и кому они нужны»
На контенте, как на дрожжах — рост трафика +625% за 3 месяца (Semantist.ru —...Semantist.ru
• как наколдовать много клиентов на сайт
• фишка контент продвижения за 3 месяца
• какие опасности несет контент
• миф LSI
• Дзен копирайтинг будущего
• Баден-Баден vs. контент-маркетинг
• защита текста
1. Найти все запросы в поиске от потенциальных клиентов
семантика = спрос = деньги
2. Источники семантики
- парсинг сервисов
- базы запросов
- счетчики
- семантические сервисы
- похожие запросы
- подсказки
- яндекс wordstat
3. Сбор поисковых фраз из всех источников
- запросы конкурентов
- запросы из Метрики и Google Analitics
- база МОАВ
- запросы Wordstat
- подсказки ПС
- генерация запросов по матрицам
4. LSI-копирайтинг - методика написания и подачи текстового материала, повышающая его релевантность
5. 10 правил дзен текста
- сила - в правде
- смысл важнее формы
- чем проще - тем лучше
- пишите как для себя
- читайте вслух
- приводите примеры
- от простого к сложному
- пользу - вперед
- поставьте заголовок
- уважение и забота
6. Задача - портал на 500 страниц. Сделано:
- 1380 потребностей
- 500 страниц на внедрение
- 9 основных разделов сайта
- обновлен сайт, верстка, движок, функционал
- добавлена мобильная версия
- расширена региональность проекта
- комплект УТП для нескольких ниш = рост конверсии > 2 раза
7. Контент-маркетинг обеспечивает 92,23% трафика из органического поиска.
От распознавания речи к пониманию сказанногоCoMagic
Александр Белозерчик, ЦРТ, руководитель отдела развития продуктов
- Как компьютер распознает речь;
- Что значит компьютерное понимание речи и в чем это выражается;
- Почему без понимания нет качественного распознавания.
E-Contenta: Чек-лист для запуска персональных рекомендацийE-Contenta
Презентация E-Contenta на конференции World Content Market, прошедшей 28 мая в Москве.
В презентации описано:
- что такое персональные рекомендации,
- стоит ли разрабатывать их внутри компании или лучше отдать на аутсорс,
- какии требованиям должны отвечать персональные рекомендации.
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"AINL Conferences
Доклад посвящен практическим аспектам применения речевых интерфейсов на основе опыта разработки телефонных систем для контакт-центров. В докладе будут описаны основные ограничения, вызванные качеством распознавания речи, спонтанным характером речи и когнитивными способностями человека. Кроме того, будут рассмотрены основные метрики эффективности интерфейсов и лучшие практики, применяемые в их разработке. Наконец, часть доклада будет касаться того, как появление дополнительной модальности способно повысить эффективность речевых интерфейсов.
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна ЛандоNLPseminar
Диалоговые системы и чат-боты: как они устроены сейчас (правила, фреймы, шаблоны) и как машинное обучение может изменить их качество и применимость.
Видеозапись лекции: https://www.youtube.com/watch?v=-9zKXLAwm7w
2. О КОМПАНИИ ЦРТ
КОМАНДА ЦРТ
• Более 350 человек
• 28 кандидатов и
докторов наук
КАФЕДРА ЦРТ
ТЕХНОЛОГИИ В ИТМО
• Магистратура
• Распознавание речи
• Аспирантура
• Синтез речи
• Дополнительное образование
• Голосовая биометрия
• Запись и анализ речи
ПРОДАЖИ
• Офисы в 6 странах мира
• Продажи в 75 странах
2
4. РЕЧЕВЫЕ ТЕХНОЛОГИИ И ВИРТУАЛЬНЫЕ ПОМОЩНИКИ
Виртуальный помощник – это компьютерный персонаж,
предоставляющий пользователю необходимую
информацию через:
WEB
Мобильные устройства
Терминалы самообслуживания
40 производителей
5 поколений
2-е поколение – синтез речи
3-е поколение – распознавание речи
Виртуальный помощник сегодня – это
мультимодальная система, способная
вести с пользователем диалог в режиме
«speech-to-speech»
4
5. КОМПОНЕНТЫ И ТРЕБОВАНИЯ
Основной показатель эффективности виртуального
помощника – релевантность ответов
Релевантность зависит от:
точности распознавания речи
качества синтеза речи
5
6. КАК ПОЛУЧИТЬ КАЧЕСТВЕННЫЙ ЗВУК?
Точность распознавания речи зависит от качества
звука
Множество различных микрофонов и настроек на
компьютерах пользователей
Необходимость подтверждать осуществление
доступа к микрофону
Пользователь должен нажимать на кнопку (push-
to-talk)
Задача двухканальной шумоочистки и режим
hotword bargein
6
7. КАК ПОВЫСИТЬ ТОЧНОСТЬ РАСПОЗНАВАНИЯ РЕЧИ?
Варианты использования модуля распознавания речи
1.
2.
7
8. КАК СДЕЛАТЬ ГРАММАТИКИ И ЯЗЫКОВЫЕ МОДЕЛИ?
Источники данных
Поисковые запросы
Записи звонков
в контактный центр
Текстовые запросы
к виртуальному помощнику
Метод “Wizard of OZ”
8
9. КАКИЕ СТАНДАРТЫ ИСПОЛЬЗОВАТЬ?
ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ
VoiceXML
Speech Recognition Grammar Specification
Semantic Interpretation for Speech Recognition
Speech Synthesis Markup Language
Speech Input API Specification
Speech JavaScript API
9
10. КАК ПОВЫСИТЬ КАЧЕСТВО СИНТЕЗА РЕЧИ?
ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ
Использовать голос, соответствующий персонажу
Провести предварительную настройку на текстах из предметной
области (специальная лексика, аббревиатуры)
Настроить синтез основных реплик системы (паузы и интонация)
Использовать функцию синхронизации губ (lipsync)
10
11. КАК СДЕЛАТЬ ДИАЛОГ БОЛЕЕ ЕСТЕСТВЕННЫМ?
ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ
Использовать автоматический анализ эмоций
Использовать голосовую идентификацию
11
13. СПАСИБО ЗА ВНИМАНИЕ!
ВОПРОСЫ? КОНТАКТЫ
Санкт-Петербург
ДОКЛАДЧИК: Адрес: Санкт-Петербург, ул. Красуцкого, 4
Телефон: (+7 812) 325-88-48
ПЕТР МИЦОВ Факс: (+7 812) 327-92-97
Отдел продаж: (+7 812) 325-88-48 доб.1
Руководитель группы разработки Эл. почта: stc-spb@speechpro.com
Почтовый адрес: 196084 Санкт-Петербург а/я
и внедрения систем голосового
515 «Центр речевых технологий»
самообслуживания
Центр Речевых Технологий
Москва
mitsov@speechpro.com Адрес: Москва, ул. Марксистская, д.3, стр.5,
Бизнес-центр "Таганский", 3 этаж, офис 5.3.1.
Телефон: (+7 495) 661-75-50
Факс: (+7 495) 661-75-17
Эл. почта: stc-msk@speechpro.com
13