SlideShare a Scribd company logo
1 of 21
Download to read offline
Влияние машинного
обучения на процесс
обслуживания пользователей
Февраль 2018
Чат-бот
Про проект
Задача:
упростить процесс взаимодействия клиента с банком.
2
добавим к "кнопочному" чат-боту NLU+DM
и получим автоответчик-консультант?
Текущий статус:
пилот на части сотрудников Банка.
MEMBER OF
THE PPF GROUP
Кнопочки
3
MEMBER OF
THE PPF GROUP
Основные этапы проекта
1. Сбор и разметка данных
генерили сами + собирали из логов собственных веб чатов
2. Обучение моделей для NLU
open source и никакого волшебства (scikit-learn,scipy)
3. Создание диалогового движка
retrieval based question-answering system,
dialog manager, slot filling
4. Интеграция с «кнопочным» чат-движком
(который уже связан с остальными системами)
AI движок = контейнер с REST сервисом
5. Основная часть разработки велась в течение 3.5х месяцев
4
MEMBER OF
THE PPF GROUP
Основные ТТХ
• 300+ распознаваемых тематик высказываний
в т. ч. определение факта наличия проблемы и её тематики
• 10+ кнопочных команд
Команда на русском языке инициирует процесс аналогично
нажатию на кнопку в чат-боте
• Slot filling
Использует механизм заполнения форм для запроса доп. данных,
если выполнение команды этого требует
• Entity recognition
Распознаёт 20+ domain-specific сущностей: карты, договора,
Ф.И.О, даты, суммы, валюты, …
• Специализация на банковском домене знаний
5
MEMBER OF
THE PPF GROUP
Что даст?
• Новый UI/UX
• Подключение к остальным чат-каналам
- формирование автоответов
- подсказки агентам КЦ
- маршрутизация на правильную скилл-группу
- аналитика и мониторинг по тематикам обращений
• Выпуск на клиентскую аудиторию позволяет
собрать новые данные
6
MEMBER OF
THE PPF GROUP
Теперь
7
MEMBER OF
THE PPF GROUP
Боль
Мало данных пригодных для обучения
• исторически накапливаемые диалоги с клиентами не совсем
подходят по смыслу (другая специфика, контекст)
• чат диалоги человек-человек требуют трудоёмкой предобработки
(связки акция-реакция) размеченных данных нет совсем
Слишком много «хайпа»
Много шума на рынке.
8
MEMBER OF
THE PPF GROUP
Боль
Надо собирать информацию так, чтобы
потом не было мучительно больно её использовать
за неимением лучшего
как минимум делайте функциональность reply-to в чат каналах:
и людям удобно и датасаентисты спасибо скажут
9
MEMBER OF
THE PPF GROUP
Статистика по темам
• 6% выполнить действие
(оформление жалобы, блокировка карты,
инициировать звонок,...)
• 5% пообщаться
(привет, пока, что ты умеешь,...)
• 5% проблемная ситуация
(банкомат не работает, "скушал" карту,...)
• 4% информация об объектах банка
(где банкомат, отделение, расписание работы,...)
• 2% курсы валют
• 2% выполнить платёж
• 22% другие запросы
10
• 16% информация о том, как
выполнить действие
(как открыть, закрыть вклад,
кредит,...)
• 15% статус оформленного
продукта
(остатки, выписки, когда платить,
какой платёж,...)
• 12% общая информация
(куда звонить, какой сайт, ...)
• 12% информация о продуктах и
условиях по ним
(какие есть кредиты, депозиты, ...)
MEMBER OF
THE PPF GROUP
Влияние искусственного интеллекта
на бизнес-процессы
Авто Help-Desk
Про проект
12
Задачи:
1. Упростить процесс решения в хелп-деск.
2. Понять проблему и найти того, кто должен её решить.
Возьмем "мозги" от чат-бота и посадим их на
обработку обращений в хелп-деске?
Текущий статус:
Опытно-промышленная эксплуатация
MEMBER OF
THE PPF GROUP
Основные этапы проекта
1. Сбор данных
- данные по своей природе уже размечены
- тысячи текстов обращений в сервис деск с реквизитами создателя,
историей маршрутизации и финальным обработчиком
2. Обучение моделей, решение специфических проблем
пропуски в данных
3. Интеграция с системой
обученный "AI" это REST сервис, фактически готовый
к упаковке в контейнер и деплою
13
MEMBER OF
THE PPF GROUP
Основные ТТХ
• Начальник отдела оперативной
технической поддержки:
«Он работает на уровне человека прошедшего
трёхмесячное обучение»
• Sensitivity 85%
• Specificity 95%
14
MEMBER OF
THE PPF GROUP
Что даст?
• Снижает необходимость формально описывать проблему -
что ускоряет как и её фиксирование в системе,
так и её решение
• Со временем позволит обрабатывать большее количество
типов обращений
• Дедушка для «Help desk bot»?
15
MEMBER OF
THE PPF GROUP
Боль и радость.
• Почему разработчики Service Management систем
до сих пор не продают такую функциональность из
коробки?
¯_(ツ)_/¯
• Относительно удачный кейс применения ML:
специфика процесса такова что разметка данных -
в основном качественная
16
MEMBER OF
THE PPF GROUP
Влияние искусственного интеллекта
на бизнес-процессы
Snail Mail classifier
17
Про проект
Задача:
Ускорить процесс анализа бумажной корреспонденции
Понять набор тематик, определить обработчика
Сформировать ответ автоматически
Поставим OCR перед NLU?
18
Текущий статус:
WIP
MEMBER OF
THE PPF GROUP
Основные этапы проекта
1. Выбор OCR
Tesseract (open source)
2. Интеграция
3. Сбор данных
- десятки тысяч сканов писем
- тексты + тематики проставленные специалистами
4. Обучение моделей
250+ тематик
19
MEMBER OF
THE PPF GROUP
Основные ТТХ
• End-to-end время 10-40 сек.
• Среднее качество распознавания печатных текстов 78%
• Качество распознавания рукописных текстов 0%
• Специализация на банковском домене знаний
• В основном тексты «юридического стиля»
• Словарь ~100К слов (ненормализованных)
20
20
MEMBER OF
THE PPF GROUP
Фичи:
• one-hot по «сырым» словам + усредненная позиция (1..2) (~50к фичей)
• SVD (300) (var explained = 0.65, max=0.043)
Письма
21
MEMBER OF
THE PPF GROUP

More Related Content

Similar to ML Projects portfolio (Home Credit)

История проекта, который никогда не падает / Андрей Шетухин
История проекта, который никогда не падает / Андрей ШетухинИстория проекта, который никогда не падает / Андрей Шетухин
История проекта, который никогда не падает / Андрей ШетухинOntico
 
AgileBaseCamp 2013 - Start Up and Get Done
AgileBaseCamp 2013 - Start Up and Get DoneAgileBaseCamp 2013 - Start Up and Get Done
AgileBaseCamp 2013 - Start Up and Get DoneMax Klymyshyn
 
Корпоративный портал Что он может дать сотрудникам и компании?
Корпоративный портал  Что он может дать сотрудникам и компании?Корпоративный портал  Что он может дать сотрудникам и компании?
Корпоративный портал Что он может дать сотрудникам и компании?HRedu.ru
 
Роботизация функций - разбор первичной финансовой документации
Роботизация функций - разбор первичной финансовой документацииРоботизация функций - разбор первичной финансовой документации
Роботизация функций - разбор первичной финансовой документацииНФП
 
10 Инструментов администрирования банковских продаж
10 Инструментов администрирования банковских продаж10 Инструментов администрирования банковских продаж
10 Инструментов администрирования банковских продажIgor Dmitriev
 
12 10 11_!shareрoint
12 10 11_!shareрoint12 10 11_!shareрoint
12 10 11_!shareрointITMsupport
 
Кейс формирование счета клиенту
Кейс формирование счета клиентуКейс формирование счета клиенту
Кейс формирование счета клиентуНФП
 
บริหารเวลา
บริหารเวลาบริหารเวลา
บริหารเวลาtoomtam
 
Илья Космодемьянский (PostgreSQL-Consulting.com), Роман Друзягин (404 Group)
Илья Космодемьянский (PostgreSQL-Consulting.com), Роман Друзягин (404 Group)Илья Космодемьянский (PostgreSQL-Consulting.com), Роман Друзягин (404 Group)
Илья Космодемьянский (PostgreSQL-Consulting.com), Роман Друзягин (404 Group)Ontico
 
Как поставить миграцию баз данных на поток Highload++ 2013
Как поставить миграцию баз данных на поток Highload++ 2013Как поставить миграцию баз данных на поток Highload++ 2013
Как поставить миграцию баз данных на поток Highload++ 2013Ilya Kosmodemiansky
 
От продуктов к услугам - Open Source и SaaS
От продуктов к услугам  - Open Source и SaaSОт продуктов к услугам  - Open Source и SaaS
От продуктов к услугам - Open Source и SaaSDmitry Altukhov
 
Когда проектов больше чем людей - процесс разработки в маленькой, но амбициоз...
Когда проектов больше чем людей - процесс разработки в маленькой, но амбициоз...Когда проектов больше чем людей - процесс разработки в маленькой, но амбициоз...
Когда проектов больше чем людей - процесс разработки в маленькой, но амбициоз...Alexander Gornik
 
DevOps-трансформация Альфа-Банка / Антон Исанин (Альфа-Банк)
DevOps-трансформация Альфа-Банка / Антон Исанин (Альфа-Банк)DevOps-трансформация Альфа-Банка / Антон Исанин (Альфа-Банк)
DevOps-трансформация Альфа-Банка / Антон Исанин (Альфа-Банк)Ontico
 
Жизнь в стиле стартап в корпоративной среде: Agile в помощь?
Жизнь в стиле стартап в корпоративной среде: Agile в помощь?Жизнь в стиле стартап в корпоративной среде: Agile в помощь?
Жизнь в стиле стартап в корпоративной среде: Agile в помощь?ScrumTrek
 
Синтетические фокусы: выход за пределы зоны аналитического комфорта
Синтетические фокусы: выход за пределы зоны аналитического комфортаСинтетические фокусы: выход за пределы зоны аналитического комфорта
Синтетические фокусы: выход за пределы зоны аналитического комфортаСобака Павлова
 
Консалтинг высоконагруженных web систем
Консалтинг высоконагруженных web системКонсалтинг высоконагруженных web систем
Консалтинг высоконагруженных web системMedia Gorod
 
Шесть важнейших качеств платформы для анализа Больших данных
Шесть важнейших качеств платформы для анализа Больших данных Шесть важнейших качеств платформы для анализа Больших данных
Шесть важнейших качеств платформы для анализа Больших данных Yuri Yashkin
 
Bank.Bot-2016. 4 magneta rus_botbank
Bank.Bot-2016. 4 magneta rus_botbankBank.Bot-2016. 4 magneta rus_botbank
Bank.Bot-2016. 4 magneta rus_botbankBankir_Ru
 
Никита_Филиппов_Magneta
Никита_Филиппов_MagnetaНикита_Филиппов_Magneta
Никита_Филиппов_MagnetaBank-Bot
 
Пишем вакансии для Job сайтов
Пишем вакансии для Job сайтовПишем вакансии для Job сайтов
Пишем вакансии для Job сайтовOlga Kotova
 

Similar to ML Projects portfolio (Home Credit) (20)

История проекта, который никогда не падает / Андрей Шетухин
История проекта, который никогда не падает / Андрей ШетухинИстория проекта, который никогда не падает / Андрей Шетухин
История проекта, который никогда не падает / Андрей Шетухин
 
AgileBaseCamp 2013 - Start Up and Get Done
AgileBaseCamp 2013 - Start Up and Get DoneAgileBaseCamp 2013 - Start Up and Get Done
AgileBaseCamp 2013 - Start Up and Get Done
 
Корпоративный портал Что он может дать сотрудникам и компании?
Корпоративный портал  Что он может дать сотрудникам и компании?Корпоративный портал  Что он может дать сотрудникам и компании?
Корпоративный портал Что он может дать сотрудникам и компании?
 
Роботизация функций - разбор первичной финансовой документации
Роботизация функций - разбор первичной финансовой документацииРоботизация функций - разбор первичной финансовой документации
Роботизация функций - разбор первичной финансовой документации
 
10 Инструментов администрирования банковских продаж
10 Инструментов администрирования банковских продаж10 Инструментов администрирования банковских продаж
10 Инструментов администрирования банковских продаж
 
12 10 11_!shareрoint
12 10 11_!shareрoint12 10 11_!shareрoint
12 10 11_!shareрoint
 
Кейс формирование счета клиенту
Кейс формирование счета клиентуКейс формирование счета клиенту
Кейс формирование счета клиенту
 
บริหารเวลา
บริหารเวลาบริหารเวลา
บริหารเวลา
 
Илья Космодемьянский (PostgreSQL-Consulting.com), Роман Друзягин (404 Group)
Илья Космодемьянский (PostgreSQL-Consulting.com), Роман Друзягин (404 Group)Илья Космодемьянский (PostgreSQL-Consulting.com), Роман Друзягин (404 Group)
Илья Космодемьянский (PostgreSQL-Consulting.com), Роман Друзягин (404 Group)
 
Как поставить миграцию баз данных на поток Highload++ 2013
Как поставить миграцию баз данных на поток Highload++ 2013Как поставить миграцию баз данных на поток Highload++ 2013
Как поставить миграцию баз данных на поток Highload++ 2013
 
От продуктов к услугам - Open Source и SaaS
От продуктов к услугам  - Open Source и SaaSОт продуктов к услугам  - Open Source и SaaS
От продуктов к услугам - Open Source и SaaS
 
Когда проектов больше чем людей - процесс разработки в маленькой, но амбициоз...
Когда проектов больше чем людей - процесс разработки в маленькой, но амбициоз...Когда проектов больше чем людей - процесс разработки в маленькой, но амбициоз...
Когда проектов больше чем людей - процесс разработки в маленькой, но амбициоз...
 
DevOps-трансформация Альфа-Банка / Антон Исанин (Альфа-Банк)
DevOps-трансформация Альфа-Банка / Антон Исанин (Альфа-Банк)DevOps-трансформация Альфа-Банка / Антон Исанин (Альфа-Банк)
DevOps-трансформация Альфа-Банка / Антон Исанин (Альфа-Банк)
 
Жизнь в стиле стартап в корпоративной среде: Agile в помощь?
Жизнь в стиле стартап в корпоративной среде: Agile в помощь?Жизнь в стиле стартап в корпоративной среде: Agile в помощь?
Жизнь в стиле стартап в корпоративной среде: Agile в помощь?
 
Синтетические фокусы: выход за пределы зоны аналитического комфорта
Синтетические фокусы: выход за пределы зоны аналитического комфортаСинтетические фокусы: выход за пределы зоны аналитического комфорта
Синтетические фокусы: выход за пределы зоны аналитического комфорта
 
Консалтинг высоконагруженных web систем
Консалтинг высоконагруженных web системКонсалтинг высоконагруженных web систем
Консалтинг высоконагруженных web систем
 
Шесть важнейших качеств платформы для анализа Больших данных
Шесть важнейших качеств платформы для анализа Больших данных Шесть важнейших качеств платформы для анализа Больших данных
Шесть важнейших качеств платформы для анализа Больших данных
 
Bank.Bot-2016. 4 magneta rus_botbank
Bank.Bot-2016. 4 magneta rus_botbankBank.Bot-2016. 4 magneta rus_botbank
Bank.Bot-2016. 4 magneta rus_botbank
 
Никита_Филиппов_Magneta
Никита_Филиппов_MagnetaНикита_Филиппов_Magneta
Никита_Филиппов_Magneta
 
Пишем вакансии для Job сайтов
Пишем вакансии для Job сайтовПишем вакансии для Job сайтов
Пишем вакансии для Job сайтов
 

ML Projects portfolio (Home Credit)

  • 1. Влияние машинного обучения на процесс обслуживания пользователей Февраль 2018 Чат-бот
  • 2. Про проект Задача: упростить процесс взаимодействия клиента с банком. 2 добавим к "кнопочному" чат-боту NLU+DM и получим автоответчик-консультант? Текущий статус: пилот на части сотрудников Банка. MEMBER OF THE PPF GROUP
  • 4. Основные этапы проекта 1. Сбор и разметка данных генерили сами + собирали из логов собственных веб чатов 2. Обучение моделей для NLU open source и никакого волшебства (scikit-learn,scipy) 3. Создание диалогового движка retrieval based question-answering system, dialog manager, slot filling 4. Интеграция с «кнопочным» чат-движком (который уже связан с остальными системами) AI движок = контейнер с REST сервисом 5. Основная часть разработки велась в течение 3.5х месяцев 4 MEMBER OF THE PPF GROUP
  • 5. Основные ТТХ • 300+ распознаваемых тематик высказываний в т. ч. определение факта наличия проблемы и её тематики • 10+ кнопочных команд Команда на русском языке инициирует процесс аналогично нажатию на кнопку в чат-боте • Slot filling Использует механизм заполнения форм для запроса доп. данных, если выполнение команды этого требует • Entity recognition Распознаёт 20+ domain-specific сущностей: карты, договора, Ф.И.О, даты, суммы, валюты, … • Специализация на банковском домене знаний 5 MEMBER OF THE PPF GROUP
  • 6. Что даст? • Новый UI/UX • Подключение к остальным чат-каналам - формирование автоответов - подсказки агентам КЦ - маршрутизация на правильную скилл-группу - аналитика и мониторинг по тематикам обращений • Выпуск на клиентскую аудиторию позволяет собрать новые данные 6 MEMBER OF THE PPF GROUP
  • 8. Боль Мало данных пригодных для обучения • исторически накапливаемые диалоги с клиентами не совсем подходят по смыслу (другая специфика, контекст) • чат диалоги человек-человек требуют трудоёмкой предобработки (связки акция-реакция) размеченных данных нет совсем Слишком много «хайпа» Много шума на рынке. 8 MEMBER OF THE PPF GROUP
  • 9. Боль Надо собирать информацию так, чтобы потом не было мучительно больно её использовать за неимением лучшего как минимум делайте функциональность reply-to в чат каналах: и людям удобно и датасаентисты спасибо скажут 9 MEMBER OF THE PPF GROUP
  • 10. Статистика по темам • 6% выполнить действие (оформление жалобы, блокировка карты, инициировать звонок,...) • 5% пообщаться (привет, пока, что ты умеешь,...) • 5% проблемная ситуация (банкомат не работает, "скушал" карту,...) • 4% информация об объектах банка (где банкомат, отделение, расписание работы,...) • 2% курсы валют • 2% выполнить платёж • 22% другие запросы 10 • 16% информация о том, как выполнить действие (как открыть, закрыть вклад, кредит,...) • 15% статус оформленного продукта (остатки, выписки, когда платить, какой платёж,...) • 12% общая информация (куда звонить, какой сайт, ...) • 12% информация о продуктах и условиях по ним (какие есть кредиты, депозиты, ...) MEMBER OF THE PPF GROUP
  • 11. Влияние искусственного интеллекта на бизнес-процессы Авто Help-Desk
  • 12. Про проект 12 Задачи: 1. Упростить процесс решения в хелп-деск. 2. Понять проблему и найти того, кто должен её решить. Возьмем "мозги" от чат-бота и посадим их на обработку обращений в хелп-деске? Текущий статус: Опытно-промышленная эксплуатация MEMBER OF THE PPF GROUP
  • 13. Основные этапы проекта 1. Сбор данных - данные по своей природе уже размечены - тысячи текстов обращений в сервис деск с реквизитами создателя, историей маршрутизации и финальным обработчиком 2. Обучение моделей, решение специфических проблем пропуски в данных 3. Интеграция с системой обученный "AI" это REST сервис, фактически готовый к упаковке в контейнер и деплою 13 MEMBER OF THE PPF GROUP
  • 14. Основные ТТХ • Начальник отдела оперативной технической поддержки: «Он работает на уровне человека прошедшего трёхмесячное обучение» • Sensitivity 85% • Specificity 95% 14 MEMBER OF THE PPF GROUP
  • 15. Что даст? • Снижает необходимость формально описывать проблему - что ускоряет как и её фиксирование в системе, так и её решение • Со временем позволит обрабатывать большее количество типов обращений • Дедушка для «Help desk bot»? 15 MEMBER OF THE PPF GROUP
  • 16. Боль и радость. • Почему разработчики Service Management систем до сих пор не продают такую функциональность из коробки? ¯_(ツ)_/¯ • Относительно удачный кейс применения ML: специфика процесса такова что разметка данных - в основном качественная 16 MEMBER OF THE PPF GROUP
  • 17. Влияние искусственного интеллекта на бизнес-процессы Snail Mail classifier 17
  • 18. Про проект Задача: Ускорить процесс анализа бумажной корреспонденции Понять набор тематик, определить обработчика Сформировать ответ автоматически Поставим OCR перед NLU? 18 Текущий статус: WIP MEMBER OF THE PPF GROUP
  • 19. Основные этапы проекта 1. Выбор OCR Tesseract (open source) 2. Интеграция 3. Сбор данных - десятки тысяч сканов писем - тексты + тематики проставленные специалистами 4. Обучение моделей 250+ тематик 19 MEMBER OF THE PPF GROUP
  • 20. Основные ТТХ • End-to-end время 10-40 сек. • Среднее качество распознавания печатных текстов 78% • Качество распознавания рукописных текстов 0% • Специализация на банковском домене знаний • В основном тексты «юридического стиля» • Словарь ~100К слов (ненормализованных) 20 20 MEMBER OF THE PPF GROUP
  • 21. Фичи: • one-hot по «сырым» словам + усредненная позиция (1..2) (~50к фичей) • SVD (300) (var explained = 0.65, max=0.043) Письма 21 MEMBER OF THE PPF GROUP