SlideShare a Scribd company logo
1 of 57
Диалоговые системы и чат-боты
Как они устроены сейчас,
и что ждет их в ближайшем будущем
Татьяна Ландо
Настоящее
Ближайшее будущее:
Conversational Commerce
• Telegram
• Facebook
• Slack
Платформы для быстрого построения ботов:
• https://botogram.io/
• http://chatfuel.com/ru
• http://manychat.com/
Как вообще устроен диалог?
Порядок обмена репликами
Структура разговора
Инициатива
Общий контекст
Что должна уметь
диалоговая система?
• Определять, когда пользователь закончил
говорить и ждет ответа;
• Иметь с пользователем общий контекст,
обучаться на лету его пополнять;
• Понимать роли собеседников и порядок
реплик;
• Вовремя перехватывать и отдавать
инициативу
Единственная общепризнанная
метрика – тест Тьюринга
Единственная общепризнанная
метрика – тест Тьюринга
Как устроены чат-боты?
Классическая
архитектура чат-бота
Классическая
архитектура чат-бота
• КАК ТЫ ЖИВЕШЬ | ? | Вот, сижу в
компьютере, разговариваю с людьми…
• ТЕБЯ ДОЛГО ДЕЛАЛИ | ? | Меня - полдня, а
базу - четыре года.
• ПЛОХО | ТАК КАК | А ты не допускаешь
другой точки зрения?
• ХОЧУ | РАБОТ | Если хочешь поработать, ляг
поспи и все пройдет.
Классическая
архитектура чат-бота
• Диалог основывается на шаблонах
«стимул — реакция»
Классическая
архитектура чат-бота
Входнаяреплика heyman, lookatwhatI've foundhere ;)
Очистка lookatwhatI havefoundhere
Поискшаблона <WHAT I HAVE FOUNDHERE>
Поискшаблона
<WHAT DIDYOUFIND?>
<THAT'SNOTINTERESTING!>
Ответ That'snotinteresting!
Прошлое
Eliza (Weizenbaum, 1966)
User: I am feeling depressed.
ELIZA: How long are you feeling
depressed?
I am feeling * =>
How long are you feeling *
AIML: ALICE & Co
• AIML – XML для создания чатботов
• ALICE:
–бот с открытым кодом на основе AIML
–50 000 пар шаблон – ответ
–поддержка краткосрочной памяти
–поддержка темы диалога
–обобщенные шаблоны
Поддержка краткосрочной памяти
<category>
<pattern>YES</pattern>
<that>DO YOU LIKE READING BOOKS?</that>
<template>Which one do you like
most?</template>
</category>
Поддержка темы диалога
<topic name=”POETRY”/>
<category>
<pattern>*</pattern>
<template>Do you own any poetry
books?</template>
</category>
Обобщения шаблонов
– Меня зовут Бонд, Джеймс Бонд
– Приятно познакомиться, Бонд, Джеймс Бонд!
Обобщения шаблонов
– Меня зовут Бонд, Джеймс Бонд
– Приятно познакомиться, Бонд, Джеймс Бонд!
– Меня зовут Бонд, Джеймс Бонд
– Приятно познакомиться, Бонд!
Обобщения шаблонов
– Меня зовут Бонд, Джеймс Бонд
– Приятно познакомиться, Бонд, Джеймс Бонд!
– Меня зовут Бонд, Джеймс Бонд
– Приятно познакомиться, Бонд!
– Меня зовут Бонд, Джеймс Бонд
– Приятно познакомиться, Джеймс!
Обобщение шаблонов и NLP
• Регулярные выражения
• Контекстно-свободные грамматики
• Извлечение именованных сущностей (NER)
• Синтаксический парсинг, вот это всё
Обобщение шаблонов и NLP
<category>
<pattern>WHO IS ALBERT *</pattern>
<template>albert is a common name</template>
</category>
<category>
<pattern>WHO IS NE_PERSON *</pattern>
<template>I don't know anybody of that
name.</template>
</category>
Как устроены
диалоговые системы?
Классическая архитектура
диалоговой системы
Понимание ввода на естественном языке
Управление диалогом
Генерация ответа на естественном языке
Классическая архитектура
диалоговой системы
Понимание естественного языка
Natural Language Understanding
• Сири, разбуди меня завтра в 6 утра
• Слушай, Яндекс, поехали домой
• Окей, гугл, Сколько лет Анджелине Джоли?
• Фильм в котором два мужика едут к морю
Понимание естественного языка
Natural Language Understanding
Очистка входной
реплики
Опечатки, ошибки, символы
Сегментация Предложения
Уровень слов Морфология, извлечение
именованных сущностей
Синтаксис Синтаксические связи
Семантика Попытка связать со
значениями
Управление диалогом
• Решает, что должна сделать система
• Основана на «разговорных состояниях»
– Граф конечных состояний
– Фреймы
– План
Управление диалогом: фрейм
Покупка авиабилета
Origin: {{city}} Москва
Destination: {{city}} Париж
Date: {{date}} завтра
Time: {{time}} 10.00
Airline: {{airline_name}} Air France
Генерация ответа
• Преднаписанный текст
• Заполнение шаблонов:
– Преднаписанные тексты с пробелами
– Пробелы заполняются значениями переменных
• Генерация текста:
– Очень сложно делать хорошо
– Интегрирована в «плановое управление
диалогом»
Генерация ответа
В Москве 21 ноября 2015 года будет 4 градуса
выше нуля.
В _city_(предложный падеж) _date_ будет
_degrees_.
Date = _day_ _month_ _year_
Degrees = _number_ _градус(а|ов|-)_
(выше|ниже) нуля
Генерация естественного языка
Naturalism and decision for the majority of Arab
countries' capitalide was grounded by the Irish
language by [[John Clair]], [[An Imperial Japanese
Revolt]], associated with Guangzham's
sovereignty. His generals were the powerful ruler
of the Portugal in the [[Protestant Immineners]],
which could be said to be directly in Cantonese
Communication, which followed a ceremony and
set inspired prison, training.
Попытки автоматизации
• Марковский процесс принятия решения
• Обучение с подкреплением (Reinforcement
learning)
• Проблемы:
– Подобрать вознаграждения для MDP
– Количество состояний конечно (реплик или
действий)
Что дальше?
Машинное обучение и боты
Машинное обучение и боты
• Обучение на реальных диалогах:
– End-to-end системы
– Нейронные сети
• Обучение с подкреплением:
– Разные реакции на одинаковые реплики
– Но не понятно как их оценивать
Нейронные сети
• Обучение от последовательности к
последовательности (Sequence to sequence)
см. Ilya Sutskever, Oriol Vinyals, Quoc V.Le
• Многослойная длинная краткосрочная память
(Long Short-Term Memory, LSTM)
• Neural Conversational Model:
– Субтитры
– Логи службы поддержки
Гибриды
• Надо ли обучать нейронную сеть, чтобы
отвечать на вопросы о погоде?
• Чат-боты используются для
«общечеловеческой болтовни»
• Диалоговые системы – для применений в
конкретных предметных областях
Оценка качества
Оценка качества: зачем?
• Оценить как система выполняет цели
• Как система улучшается от версии к версии
• Сравнивать системы между собой
• Найти слабые места системы
• Делать тонкую настройку: размен факторов
Оценка качества
Нейронная сеть
Q: my name is david .
what is my name ?
R: david .
Q: is sky blue or black ?
R : blue .
Q: what do you think
about cleopatra ?
R: oh , she ’s very regal
.
Чат-бот (Cleverbot)
Q: My name is david .
what is my name ?
R: How old are you
David?
Q: Is sky blue or black ?
R: I am 200 years old.
Q: What do you think
about cleopatra ?
R: Cool is cool.
Оценка качества:
пользовательские и объективные
• Счастье пользователя:
– Вероятность повторного использования
– Простота использования, ожидаемое поведение
– Обратная связь «спасибо»
• Характеристики системы:
– Проблема 100% полноты (у чат ботов)
– Частота успешных диалогов
– Время/число реплик до выполнения цели диалога
Оценка качества: юзабилити
• «Счастье пользователей»:
– Task ease
– Perceived completion
– Expected behavior
• Вероятность повторного использования
Оценка качества: объективные
• Проблема 100% полноты (у чат ботов)
• Частота успешных диалогов
• Время/число реплик до выполнения цели
диалога
Оценка качества: WOZ
Решаем проблему, где взять эталон:
– Человек прикидывается чат-ботом (Wizard)
– Пользователь считает, что говорит с чат-ботом
– Строгие протоколы взаимодействия
– Нужно много «волшебников»
Использование
в настоящем и будущем
XiaoIce
• Jerry: XiaoIce, will it rain tomorrow?
• XiaoIce: Tomorrow the weather in Beijing will be
nice with a maximum high of 25*C. No rain to get
you soaked.
• Jerry: How about the day after tomorrow?
• XiaoIce: The day after tomorrow, the weather in
Beijing will also be fair, with a max high of 23*C.
• Jerry: What about Seattle?
• XiaoIce: Yes sir, I’ve got the answer. The day after
tomorrow, Seattle will be cloudy with a max high of
30*C. Perfect for going outside.
Google
Какими станут диалоговые системы?
• Обучающимися
• Эмоциональными
• Персональными
• Универсальными
• Аватаризированными
Терапевтические применения
Голосовые интерфейсы
Спасибо!
tatiana.lando@gmail.com

More Related Content

Viewers also liked

Интегральный подход: 5 базовых компонентов
Интегральный подход: 5 базовых компонентовИнтегральный подход: 5 базовых компонентов
Интегральный подход: 5 базовых компонентовEugene Pustoshkin
 
Доклад о Северской АЭС: выгоды и риски
Доклад о Северской АЭС: выгоды и рискиДоклад о Северской АЭС: выгоды и риски
Доклад о Северской АЭС: выгоды и рискиGreen Tomsk
 
"Тебе" Рефрейминг (версия для обучения V.1)
"Тебе" Рефрейминг   (версия для обучения V.1)"Тебе" Рефрейминг   (версия для обучения V.1)
"Тебе" Рефрейминг (версия для обучения V.1)Nickolay_Object
 
ТебеРефрейминг V2
ТебеРефрейминг V2ТебеРефрейминг V2
ТебеРефрейминг V2Nickolay_Object
 
виртуальный коллаборативный ассистент
виртуальный коллаборативный  ассистентвиртуальный коллаборативный  ассистент
виртуальный коллаборативный ассистентAnatoly Tkachev
 
депрограммирование 2 часть
депрограммирование 2 частьдепрограммирование 2 часть
депрограммирование 2 частьАндрей Бояркин
 
депрограммирование 2 часть копия
депрограммирование 2 часть   копиядепрограммирование 2 часть   копия
депрограммирование 2 часть копияАндрей Бояркин
 
субмодальная оптимизация
субмодальная оптимизация субмодальная оптимизация
субмодальная оптимизация Андрей Бояркин
 
депрограммирование 1 часть
депрограммирование 1 частьдепрограммирование 1 часть
депрограммирование 1 частьАндрей Бояркин
 
Шестишаговый рефрейминг
Шестишаговый рефреймингШестишаговый рефрейминг
Шестишаговый рефреймингNickolay_Object
 
веселов
веселоввеселов
веселовNLPseminar
 

Viewers also liked (20)

Интегральный подход: 5 базовых компонентов
Интегральный подход: 5 базовых компонентовИнтегральный подход: 5 базовых компонентов
Интегральный подход: 5 базовых компонентов
 
Интерфейс Аптайм (2)
Интерфейс Аптайм (2)Интерфейс Аптайм (2)
Интерфейс Аптайм (2)
 
Антираковые Внушения
Антираковые ВнушенияАнтираковые Внушения
Антираковые Внушения
 
Доклад о Северской АЭС: выгоды и риски
Доклад о Северской АЭС: выгоды и рискиДоклад о Северской АЭС: выгоды и риски
Доклад о Северской АЭС: выгоды и риски
 
"Тебе" Рефрейминг (версия для обучения V.1)
"Тебе" Рефрейминг   (версия для обучения V.1)"Тебе" Рефрейминг   (версия для обучения V.1)
"Тебе" Рефрейминг (версия для обучения V.1)
 
ТебеРефрейминг V2
ТебеРефрейминг V2ТебеРефрейминг V2
ТебеРефрейминг V2
 
Бухгалтерия Первого Кода
Бухгалтерия Первого КодаБухгалтерия Первого Кода
Бухгалтерия Первого Кода
 
виртуальный коллаборативный ассистент
виртуальный коллаборативный  ассистентвиртуальный коллаборативный  ассистент
виртуальный коллаборативный ассистент
 
депрограммирование 2 часть
депрограммирование 2 частьдепрограммирование 2 часть
депрограммирование 2 часть
 
депрограммирование 2 часть копия
депрограммирование 2 часть   копиядепрограммирование 2 часть   копия
депрограммирование 2 часть копия
 
Интерфейс Аптайм (3)
Интерфейс Аптайм (3)Интерфейс Аптайм (3)
Интерфейс Аптайм (3)
 
Введение в моделирование
Введение в моделированиеВведение в моделирование
Введение в моделирование
 
субмодальная оптимизация
субмодальная оптимизация субмодальная оптимизация
субмодальная оптимизация
 
депрограммирование 1 часть
депрограммирование 1 частьдепрограммирование 1 часть
депрограммирование 1 часть
 
Антиаллергия
АнтиаллергияАнтиаллергия
Антиаллергия
 
Open review 2012
Open review 2012Open review 2012
Open review 2012
 
Автодиета
АвтодиетаАвтодиета
Автодиета
 
Шестишаговый рефрейминг
Шестишаговый рефреймингШестишаговый рефрейминг
Шестишаговый рефрейминг
 
веселов
веселоввеселов
веселов
 
ресурсы логической игры_2
ресурсы логической игры_2ресурсы логической игры_2
ресурсы логической игры_2
 

Similar to [ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо

Methods for building dialog agents and the technologies we used
Methods for building dialog agents and the technologies we used Methods for building dialog agents and the technologies we used
Methods for building dialog agents and the technologies we used Grid Dynamics
 
[Skolkovo Robotics 2015 Day 2] Владимир Веселов Bot and humans "Взаимодействи...
[Skolkovo Robotics 2015 Day 2] Владимир Веселов Bot and humans "Взаимодействи...[Skolkovo Robotics 2015 Day 2] Владимир Веселов Bot and humans "Взаимодействи...
[Skolkovo Robotics 2015 Day 2] Владимир Веселов Bot and humans "Взаимодействи...Skolkovo Robotics Center
 
Alfa Future People 2016 - Как «воспитать» из плохого бота хорошего помощника
Alfa Future People 2016 - Как «воспитать» из плохого бота хорошего помощникаAlfa Future People 2016 - Как «воспитать» из плохого бота хорошего помощника
Alfa Future People 2016 - Как «воспитать» из плохого бота хорошего помощникаMicrosoft
 
как вырастить и воспитать чатбота для дела а. власова, лаборатория наносемантика
как вырастить и воспитать чатбота для дела а. власова, лаборатория наносемантикакак вырастить и воспитать чатбота для дела а. власова, лаборатория наносемантика
как вырастить и воспитать чатбота для дела а. власова, лаборатория наносемантикаSkolkovo Robotics Center
 
как вырастить и воспитать чатбота для дела
как вырастить и воспитать чатбота для делакак вырастить и воспитать чатбота для дела
как вырастить и воспитать чатбота для делаSkolkovo Robotics Center
 
Как мы админа увольняли, или тонкости организации корпоративной безопасности ...
Как мы админа увольняли, или тонкости организации корпоративной безопасности ...Как мы админа увольняли, или тонкости организации корпоративной безопасности ...
Как мы админа увольняли, или тонкости организации корпоративной безопасности ...Ontico
 
Как поддерживать и развивать пачку "похожих" проектов. Кластер или конгломера...
Как поддерживать и развивать пачку "похожих" проектов. Кластер или конгломера...Как поддерживать и развивать пачку "похожих" проектов. Кластер или конгломера...
Как поддерживать и развивать пачку "похожих" проектов. Кластер или конгломера...Ontico
 
Юрий Цыганенко, QA как услуга
Юрий Цыганенко, QA как услугаЮрий Цыганенко, QA как услуга
Юрий Цыганенко, QA как услугаSQADays_2009_Piter
 
Про качественный поиск
Про качественный поискПро качественный поиск
Про качественный поискAndrew Aksyonoff
 
"Пользователи: сигнал из космоса". CodeFest mini 2012
"Пользователи: сигнал из космоса". CodeFest mini 2012"Пользователи: сигнал из космоса". CodeFest mini 2012
"Пользователи: сигнал из космоса". CodeFest mini 2012Michael Karpov
 
Мастер-класс Сандлер наносемантикс
Мастер-класс Сандлер наносемантиксМастер-класс Сандлер наносемантикс
Мастер-класс Сандлер наносемантиксBank-Bot
 
организация мероприятий без упячки. герасимович. Itotvet 19 20 октября
организация мероприятий без упячки. герасимович. Itotvet 19 20 октябряорганизация мероприятий без упячки. герасимович. Itotvet 19 20 октября
организация мероприятий без упячки. герасимович. Itotvet 19 20 октябряit-people
 
CodeFest, июль 2012. Карпов М. — Пользователи: сигнал из космоса
CodeFest, июль 2012. Карпов М. — Пользователи: сигнал из космосаCodeFest, июль 2012. Карпов М. — Пользователи: сигнал из космоса
CodeFest, июль 2012. Карпов М. — Пользователи: сигнал из космосаCodeFest
 
Практика организации ИТ-конфереций и других мероприятий для разработчиков
Практика организации ИТ-конфереций и других мероприятий для разработчиковПрактика организации ИТ-конфереций и других мероприятий для разработчиков
Практика организации ИТ-конфереций и других мероприятий для разработчиковSQALab
 
Human computer interfaces v8
Human computer interfaces v8Human computer interfaces v8
Human computer interfaces v8Yuri Ammosov
 
разработка бизнес приложений (8)
разработка бизнес приложений (8)разработка бизнес приложений (8)
разработка бизнес приложений (8)Alexander Gornik
 
Human computer interfaces v5
Human computer interfaces v5Human computer interfaces v5
Human computer interfaces v5Yuri Ammosov
 
Алексей Трошин. Менеджер не нужен: быстрые шаблоны правильных коммуникаций
Алексей Трошин. Менеджер не нужен: быстрые шаблоны правильных коммуникацийАлексей Трошин. Менеджер не нужен: быстрые шаблоны правильных коммуникаций
Алексей Трошин. Менеджер не нужен: быстрые шаблоны правильных коммуникацийScrumTrek
 
Vlad Rybalkin and Artem (Tim) Riaboshapka “Убедить, не переубеждая: воркшоп к...
Vlad Rybalkin and Artem (Tim) Riaboshapka “Убедить, не переубеждая: воркшоп к...Vlad Rybalkin and Artem (Tim) Riaboshapka “Убедить, не переубеждая: воркшоп к...
Vlad Rybalkin and Artem (Tim) Riaboshapka “Убедить, не переубеждая: воркшоп к...Dakiry
 
«тестирование для программистов. или «есть ли жизнь без тестировщиков» ( рома...
«тестирование для программистов. или «есть ли жизнь без тестировщиков» ( рома...«тестирование для программистов. или «есть ли жизнь без тестировщиков» ( рома...
«тестирование для программистов. или «есть ли жизнь без тестировщиков» ( рома...MDDay_4
 

Similar to [ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо (20)

Methods for building dialog agents and the technologies we used
Methods for building dialog agents and the technologies we used Methods for building dialog agents and the technologies we used
Methods for building dialog agents and the technologies we used
 
[Skolkovo Robotics 2015 Day 2] Владимир Веселов Bot and humans "Взаимодействи...
[Skolkovo Robotics 2015 Day 2] Владимир Веселов Bot and humans "Взаимодействи...[Skolkovo Robotics 2015 Day 2] Владимир Веселов Bot and humans "Взаимодействи...
[Skolkovo Robotics 2015 Day 2] Владимир Веселов Bot and humans "Взаимодействи...
 
Alfa Future People 2016 - Как «воспитать» из плохого бота хорошего помощника
Alfa Future People 2016 - Как «воспитать» из плохого бота хорошего помощникаAlfa Future People 2016 - Как «воспитать» из плохого бота хорошего помощника
Alfa Future People 2016 - Как «воспитать» из плохого бота хорошего помощника
 
как вырастить и воспитать чатбота для дела а. власова, лаборатория наносемантика
как вырастить и воспитать чатбота для дела а. власова, лаборатория наносемантикакак вырастить и воспитать чатбота для дела а. власова, лаборатория наносемантика
как вырастить и воспитать чатбота для дела а. власова, лаборатория наносемантика
 
как вырастить и воспитать чатбота для дела
как вырастить и воспитать чатбота для делакак вырастить и воспитать чатбота для дела
как вырастить и воспитать чатбота для дела
 
Как мы админа увольняли, или тонкости организации корпоративной безопасности ...
Как мы админа увольняли, или тонкости организации корпоративной безопасности ...Как мы админа увольняли, или тонкости организации корпоративной безопасности ...
Как мы админа увольняли, или тонкости организации корпоративной безопасности ...
 
Как поддерживать и развивать пачку "похожих" проектов. Кластер или конгломера...
Как поддерживать и развивать пачку "похожих" проектов. Кластер или конгломера...Как поддерживать и развивать пачку "похожих" проектов. Кластер или конгломера...
Как поддерживать и развивать пачку "похожих" проектов. Кластер или конгломера...
 
Юрий Цыганенко, QA как услуга
Юрий Цыганенко, QA как услугаЮрий Цыганенко, QA как услуга
Юрий Цыганенко, QA как услуга
 
Про качественный поиск
Про качественный поискПро качественный поиск
Про качественный поиск
 
"Пользователи: сигнал из космоса". CodeFest mini 2012
"Пользователи: сигнал из космоса". CodeFest mini 2012"Пользователи: сигнал из космоса". CodeFest mini 2012
"Пользователи: сигнал из космоса". CodeFest mini 2012
 
Мастер-класс Сандлер наносемантикс
Мастер-класс Сандлер наносемантиксМастер-класс Сандлер наносемантикс
Мастер-класс Сандлер наносемантикс
 
организация мероприятий без упячки. герасимович. Itotvet 19 20 октября
организация мероприятий без упячки. герасимович. Itotvet 19 20 октябряорганизация мероприятий без упячки. герасимович. Itotvet 19 20 октября
организация мероприятий без упячки. герасимович. Itotvet 19 20 октября
 
CodeFest, июль 2012. Карпов М. — Пользователи: сигнал из космоса
CodeFest, июль 2012. Карпов М. — Пользователи: сигнал из космосаCodeFest, июль 2012. Карпов М. — Пользователи: сигнал из космоса
CodeFest, июль 2012. Карпов М. — Пользователи: сигнал из космоса
 
Практика организации ИТ-конфереций и других мероприятий для разработчиков
Практика организации ИТ-конфереций и других мероприятий для разработчиковПрактика организации ИТ-конфереций и других мероприятий для разработчиков
Практика организации ИТ-конфереций и других мероприятий для разработчиков
 
Human computer interfaces v8
Human computer interfaces v8Human computer interfaces v8
Human computer interfaces v8
 
разработка бизнес приложений (8)
разработка бизнес приложений (8)разработка бизнес приложений (8)
разработка бизнес приложений (8)
 
Human computer interfaces v5
Human computer interfaces v5Human computer interfaces v5
Human computer interfaces v5
 
Алексей Трошин. Менеджер не нужен: быстрые шаблоны правильных коммуникаций
Алексей Трошин. Менеджер не нужен: быстрые шаблоны правильных коммуникацийАлексей Трошин. Менеджер не нужен: быстрые шаблоны правильных коммуникаций
Алексей Трошин. Менеджер не нужен: быстрые шаблоны правильных коммуникаций
 
Vlad Rybalkin and Artem (Tim) Riaboshapka “Убедить, не переубеждая: воркшоп к...
Vlad Rybalkin and Artem (Tim) Riaboshapka “Убедить, не переубеждая: воркшоп к...Vlad Rybalkin and Artem (Tim) Riaboshapka “Убедить, не переубеждая: воркшоп к...
Vlad Rybalkin and Artem (Tim) Riaboshapka “Убедить, не переубеждая: воркшоп к...
 
«тестирование для программистов. или «есть ли жизнь без тестировщиков» ( рома...
«тестирование для программистов. или «есть ли жизнь без тестировщиков» ( рома...«тестирование для программистов. или «есть ли жизнь без тестировщиков» ( рома...
«тестирование для программистов. или «есть ли жизнь без тестировщиков» ( рома...
 

More from NLPseminar

клышинский
клышинскийклышинский
клышинскийNLPseminar
 
конф ии и ея гаврилова
конф ии и ея  гавриловаконф ии и ея  гаврилова
конф ии и ея гавриловаNLPseminar
 
кудрявцев V3
кудрявцев V3кудрявцев V3
кудрявцев V3NLPseminar
 
акинина осмоловская
акинина осмоловскаяакинина осмоловская
акинина осмоловскаяNLPseminar
 
потапов
потаповпотапов
потаповNLPseminar
 
molchanov(promt)
molchanov(promt)molchanov(promt)
molchanov(promt)NLPseminar
 
белканова
белкановабелканова
белкановаNLPseminar
 
гвоздикин
гвоздикингвоздикин
гвоздикинNLPseminar
 
Compreno_Starostin
Compreno_StarostinCompreno_Starostin
Compreno_StarostinNLPseminar
 

More from NLPseminar (20)

Events
EventsEvents
Events
 
Andreev
AndreevAndreev
Andreev
 
клышинский
клышинскийклышинский
клышинский
 
конф ии и ея гаврилова
конф ии и ея  гавриловаконф ии и ея  гаврилова
конф ии и ея гаврилова
 
кудрявцев V3
кудрявцев V3кудрявцев V3
кудрявцев V3
 
rubashkin
rubashkinrubashkin
rubashkin
 
Vlasova
VlasovaVlasova
Vlasova
 
Ageev
AgeevAgeev
Ageev
 
Khomitsevich
Khomitsevich Khomitsevich
Khomitsevich
 
акинина осмоловская
акинина осмоловскаяакинина осмоловская
акинина осмоловская
 
Serebryakov
SerebryakovSerebryakov
Serebryakov
 
потапов
потаповпотапов
потапов
 
molchanov(promt)
molchanov(promt)molchanov(promt)
molchanov(promt)
 
белканова
белкановабелканова
белканова
 
Skatov
SkatovSkatov
Skatov
 
гвоздикин
гвоздикингвоздикин
гвоздикин
 
Mitsov
MitsovMitsov
Mitsov
 
Maleev
MaleevMaleev
Maleev
 
Compreno_Starostin
Compreno_StarostinCompreno_Starostin
Compreno_Starostin
 
Kiseleva
KiselevaKiseleva
Kiseleva
 

[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо

Editor's Notes

  1. С одной стороны Речь – самый интуитивно понятный интерфейс, а интерфейсы всё время упрощаются. С другой стороны речь – признак мышления и как следствие является неотъемлемым атрибутом сильного ИИ. Самый понятный интерфейс – речь Сильный ИИ
  2. Примеры таких систем мы все носим в карманах (кроме любителей винтажных телефонов нокиа) Системы command -> action, Голосовое управление всем Ассистенты Siri, Google, Cortana http://www.chatterbotcollection.com/ http://www.computerworld.com/article/3018162/emerging-technology/the-dark-side-of-the-coming-chatbot-revolution.html
  3. Conversational search (question answering), Watson И про поисковики
  4. Перед тем как перейти к вопросу об устройстве собственно диалоговых систем, нужно понять как устроен диалог и какие условия должны применяться к диалоговой системе. Я не буду рассказывать про распознавание и синтез речи, считаем, что эти задачи решены уже с каким-то качеством.
  5. Пример с паузой
  6. Есть «конвенциональная» структура.
  7. За пользователем Vs Перехватывает инициативу
  8. Шутка. Впечатления у пользователя – провалилась ли диалоговая система. Нет оценки качества – только косвенная. Conversation analysis Люди обычно понимают с какой целью вступают в диалог и понимают эти цели одинаково. Успешность диалога определяется достижением этих целей и это очень важная мысль!
  9. По разным формулировкам от 30 до 70 % судей должны принять машину за человека за 5-ти минутный диалог https://www.chatbots.org/ai_zone/viewthread/227/
  10. Стратегия: шутить, грубить, перехватывать инициативу, добавлять эмоции Loebner Prize – ежегодные соревнования программ-собеседников Нарушает все принципы диалога, контекст вообще не накапливает. Бал пройден в одной из вариаций в 2014 году боту, который притворяется сыном гинеколога из Одессы 13-ти лет с морской свинкой
  11. Итак, как же пытаются реализовать модель общения сейчас
  12. Отсутствует  https://www.chatbots.org/ai_zone/viewthread/492/
  13. Шаблоны, шаблоны, шаблоны и ручные правила Классификаторы или ключевые слова, которые сводят реплику пользователя к одному из шаблонов Много ручной работы, мало толку.
  14. Отсутствует  https://www.chatbots.org/ai_zone/viewthread/492/
  15. The raw user input Removal and substitution of characters and words like smileys and contractions Searches a pattern which matches the cleaned input in the database Get the matching answer templates Select one of the answers and print it on the output device Pipeline – конвейер?
  16. Джозеф Вейценбаум (1923-2008) – программа Элиза (ELIZA), 1966
  17. Шаблоны, шаблоны, шаблоны и ручные правила Классификаторы или ключевые слова, которые сводят реплику пользователя к одному из шаблонов Много ручной работы, мало толку.
  18. Шаблоны, шаблоны, шаблоны и ручные правила Классификаторы или ключевые слова, которые сводят реплику пользователя к одному из шаблонов Много ручной работы, мало толку.
  19. Шаблоны, шаблоны, шаблоны и ручные правила Классификаторы или ключевые слова, которые сводят реплику пользователя к одному из шаблонов Много ручной работы, мало толку.
  20. Шаблоны, шаблоны, шаблоны и ручные правила Классификаторы или ключевые слова, которые сводят реплику пользователя к одному из шаблонов Много ручной работы, мало толку.
  21. Шаблоны, шаблоны, шаблоны и ручные правила Классификаторы или ключевые слова, которые сводят реплику пользователя к одному из шаблонов Много ручной работы, мало толку.
  22. Слишком много шаблонов – надо их как-то сворачивать и обобщать
  23. Итак, как же пытаются реализовать модель общения сейчас
  24. Система должна: понять, что же ей сказали принять решение как среагировать / что ответить Сформулировать ответ Random fact о речевой деятельности человека – в мозгу за это отвечают тоже разные зоны!
  25. Этот компонент важен для любой системы, которая получает на вход текст: поиск, команды, что угодно Преобразование любого речевого ввода в понятные компьютеру команды Взаимодействие с внешними ресурсами Пожалуй, единственный нормально развитый компонент
  26. Этот компонент важен для любой системы, которая получает на вход текст: поиск, команды, что угодно Преобразование любого речевого ввода в понятные компьютеру команды Взаимодействие с внешними ресурсами Пожалуй, единственный нормально развитый компонент Полный pipeline стандартный для NLU
  27. Этот компонент важен для любой системы, которая получает на вход текст: поиск, команды, что угодно Преобразование любого речевого ввода в понятные компьютеру команды Взаимодействие с внешними ресурсами Пожалуй, единственный нормально развитый компонент
  28. Должен делать всю работу Состоит из огромного количества предописанных сценариев Варианты: сценарии, шаблоны, plan-based Основана на «разговорных состояниях» Предложить вариант Ожидание ответа: да-нет Ждет ответа Дает ответ…
  29. Должен делать всю работу Состоит из огромного количества предописанных сценариев Варианты: сценарии, шаблоны, plan-based
  30. Ответ пользователю нормальным языком Работает на шаблонах, заданных заранее Но тут недавно появились нейронные сети и HMM
  31. Ответ пользователю нормальным языком Работает на шаблонах, заданных заранее Но тут недавно появились нейронные сети и HMM
  32. Ответ пользователю нормальным языком Работает на шаблонах, заданных заранее Но тут недавно появились нейронные сети и HMM
  33. В исследованиях все время рассматривают примитивные системы, в которых заполняется всего 3-4 поля. В промышленных системах могут быть сотни разных фреймов, каждый куда объемнее.
  34. Итак, как же пытаются реализовать модель общения сейчас
  35. Пользователи смешивают вопросы, запросы, и желание поболтать Реально внутри системы собраны несколько процессоров и есть «решающий компонент», который отправляет input пользователя в один из компонент. Свободный диалог – это всего лишь один из процессоров
  36. Обучение на реальных диалогах (так же можно на субтитрах ,но получается плохо) end-to-end системы, нет никакого pipeline, только данные и тренировка модели Марковские цепи: реплики диалогов как состояния Нейронные сети и deep learning Обучение с подкреплением: успешность можно измерить только на всем диалоге, а не на каждой паре реплик
  37. Обучение на реальных диалогах (так же можно на субтитрах ,но получается плохо) end-to-end системы, нет никакого pipeline, только данные и тренировка модели Марковские цепи: реплики диалогов как состояния Нейронные сети и deep learning Обучение с подкреплением: успешность можно измерить только на всем диалоге, а не на каждой паре реплик
  38. Обучение на реальных диалогах (так же можно на субтитрах ,но получается плохо) end-to-end системы, нет никакого pipeline, только данные и тренировка модели Марковские цепи: реплики диалогов как состояния Нейронные сети и deep learning Обучение с подкреплением: успешность можно измерить только на всем диалоге, а не на каждой паре реплик
  39. Система должна гибко переключаться между процессорами Можно подключать разные поиски и сервисы как процессоры Эта игрушка сделана на технологиях яндекса
  40. Итак, как же пытаются реализовать модель общения сейчас
  41. Цели зависят от разработчиков, обычно пользователи умудряются придумать другие цели Вспомните важную мысль из начала доклада: цели разные, их может быть много и система может их не понимать
  42. Удовлетворенность пользователя можно оценивать только по результату всего диалога, а не для конкретной реплики Там есть смешение сценариев Пока что оценка только покомпонентная и для свободных диалогов ее нет совсем Как оценивать наличие личности у бота и эмоциональные реакции вообще не понятно никому.
  43. Визарды должны четко следовать протоколу: использовать те же выходные фразы, что и система (ну или выбирать из того же набора данных) Единственная переменная – кто отвечает? Хорошо подходят только для модульных систем, тогда методику можно использовать покомпонентно Вообще не понятно для всех ли задач нужны диалоговые системы
  44. Итак, как же пытаются реализовать модель общения сейчас
  45. Bing/Microsoft Mini Cortana + реальные диалоги В среднем 23 реплики https://blogs.bing.com/search/2014/09/05/meet-xiaoice-cortanas-little-sister/ \ http://www.wired.com/2016/01/clive-thompson-12/
  46. Bing/Microsoft Mini Cortana + реальные диалоги В среднем 23 реплики https://blogs.bing.com/search/2014/09/05/meet-xiaoice-cortanas-little-sister/ \ http://www.wired.com/2016/01/clive-thompson-12/
  47. Включение детей в том числе с ограниченными возможностями Поддержка пожилых и слабовидящих
  48. Включение детей в том числе с ограниченными возможностями Поддержка пожилых и слабовидящих
  49. Шутка про перенаселение планеты и Скарлетт Йоханссон