SlideShare a Scribd company logo
1 of 15
Download to read offline
УЧЕТ НЕИЗВЕСТНЫХ ПРИЗНАКОВ
НЕЙРОМОДЕЛИ
НА ПРИМЕРЕ КЕЙСА МФЦ
http://cogsys.company
Артем Артемов,
«Когнитивные системы»
ПРОБЛЕМА БЛИЗКОГО ОТВЕТА
•Нейросети пытаются найти
наиболее близкий ответ на
любой запрос –
преимущество и проблема
•Особенно актуально в
языковых моделях и
диалоговых системах
• Часто это мешает – такой
ответ может ввести
пользователя в
заблуждение
ПРОБЛЕМА БЛИЗКОГО ОТВЕТА
Когда
отвечать
«не знаю»?
ЗАДАЧА МФЦ
Разработать нейромодель для
Промобота, консультирующего
посетителей по услугам в МФЦ.
ДАННЫЕ
Датасет из 10 000 классифицированных реальных запросов посетителей МФЦ
Запрос Тип услуги
Как получить страховое пенсионное
свидетельство?
Выдача СНИЛС
Как получить добавку к пенсии за службу? Перерасчет пенсии
Что нужно для заказа паспорта? Паспорт РФ
Нужно оформить загран паспорт ребенку? Заграничный Паспорт
В основе метода лежит информационный нейробайесовый подход
(ИНП) - весовые коэффициенты интерпретируются как мера
количества информации в признаках объекта для возможности
идентификации его класса.
МЕТОДОЛОГИЧЕСКАЯ ОСНОВА
ПРОБЛЕМА
Результаты первичного тестирования:
В первой итерации - 60% правильных классификаций.
Большинство заведомо неправильных запросов классифицировались системой
как корректные.
question true_class first_sim_precedent pred_class confidenсe
Мне необходимо
получить загран.
паспорт
основное|
услуга 5.0|
загран_заход
Документы,
необходимые
для выдачи
паспорта
услуга 2.0|
паспорт_заход|
основное
0,636
Мне надо
заказать льготу на
квартиру
основное|
услуга 15.0|
субсидиижкх_заход
Мне надо
заказать
регистрацию в
квартире
услуга 1.0|
прописка_заход|
основное
0,928
ПОСТАНОВКА
Нейросеть должна не только правильно классифицировать
корректные запросы, но также отфильтровывать заведомо
неправильные. Обученная сеть на нерелевантные запросы
должна давать ответ «не знаю», а не предлагать наиболее
подходящую услугу.
Пример: на вопрос «где получить паспорт?»,
модель должна назвать номер кабинета и услугу, а
на вопрос «где получить паспорт пирата?»
ответить – «не знаю».
РЕШЕНИЕ – УЧЕТ НЕИЗВЕСТНЫХ ПРИЗНАКОВ
Теорема: В условиях ограниченных данных, равное число одинаково неизвестных
признаков объекта не могут иметь разный вес.
!" = 1 − &"
'неизвест признаки
'все признаки
∑ 45" 65
Представленная модель дисконтирования весов универсальна и, благодаря
коэффициенту &7 , может быть адаптирована для различных функции активации.
УРОВЕНЬ УВЕРЕННОСТИ
«РЕЦЕПТ» РЕШЕНИЯ ПРОБЛЕМЫ
1. Слова каждого запроса лемматизируются и сводятся к
инвариантам.
2. Преобразованный запрос разбивается на биграммы и
отдельные слова.
3. Выбираем запросы из обучающего датасета, наиболее
полно соответствующих данным по биграммам и униграммам.
4. Степень соответствия определяется по трем функциям SMI, NI
и SRI, от значений которых считается среднее
арифметическое - уровень уверенности (УУ).
ОСНОВА РЕШЕНИЯ ПРОБЛЕМЫ
Уровень уверенности - мера оценки незнания системой ответа на
заданный вопрос.
Пользователю выдается ответ, если класс ответа соответствует
приемлемому уровню уверенности
Пользователю выдается сообщение «некорректный вопрос»,
если УУ ниже 60% – высокой вероятности неправильной
классификации.
РЕЗУЛЬТАТЫ
Модель показывает 93,64% правильных классификаций с
учетом использования в тесте заведомо корректных и
некорректных запросов*.
*тестовый датасет на 50 000 запросов
Artemov, A & Bolokhov, I & Kem, D & Khasenevich, I. (2019). Neural Network-based
Object Classification by Known and Unknown Features (Based on Text Queries). http://arxiv.org/abs/1906.00800
ВЫВОДЫ
Использование УУ позволяет системе :
A. Давать ответы на корректные запросы и отфильтровывать заведомо
неверные.
B. Распознавать парафразы и синонимы.
Пример: система должна давать верный ответ на различные формулировки
вопроса «как получить паспорт», «как получить удостоверение личности» и
т.п.
C. Система оценивает свою возможность дать корректный ответ с помощью
показателя «уровень уверенности» - мера соответствия заданного запроса
найденному. При низком уровне уверенности система дает ответ «не знаю».
СПАСИБО ЗА ВНИМАНИЕ
http://cogsys.company

More Related Content

Similar to Артем Артемов. Когнитивные системы. Учет неизвестных признаков нейромодели на примере кейса МФЦ

презентация страховые 2013 - 2014
презентация страховые 2013 - 2014презентация страховые 2013 - 2014
презентация страховые 2013 - 2014
Михаил Мушкин
 
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В КОМПЕТЕНТНОСТНОЙ ОЦЕНКЕ КАДРОВ - Алексей Князев
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В КОМПЕТЕНТНОСТНОЙ ОЦЕНКЕ   КАДРОВ - Алексей КнязевИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В КОМПЕТЕНТНОСТНОЙ ОЦЕНКЕ   КАДРОВ - Алексей Князев
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В КОМПЕТЕНТНОСТНОЙ ОЦЕНКЕ КАДРОВ - Алексей Князев
rusbase
 
исследование качества телефонного обслуживания интернет магазинов
исследование качества телефонного обслуживания интернет магазиновисследование качества телефонного обслуживания интернет магазинов
исследование качества телефонного обслуживания интернет магазинов
Михаил Мушкин
 
Влияние eDetailing на уровень продаж
Влияние eDetailing на уровень продажВлияние eDetailing на уровень продаж
Влияние eDetailing на уровень продаж
QAP INT
 

Similar to Артем Артемов. Когнитивные системы. Учет неизвестных признаков нейромодели на примере кейса МФЦ (20)

Высокая производительность как синоним эффективного бизнеса
Высокая производительность как синоним эффективного бизнесаВысокая производительность как синоним эффективного бизнеса
Высокая производительность как синоним эффективного бизнеса
 
Андрей Демин (Двигус) - "Как микроконверсии помогли нам снизить стоимость лида"
Андрей Демин (Двигус) - "Как микроконверсии помогли нам снизить стоимость лида"Андрей Демин (Двигус) - "Как микроконверсии помогли нам снизить стоимость лида"
Андрей Демин (Двигус) - "Как микроконверсии помогли нам снизить стоимость лида"
 
Samsung hr academy
Samsung hr academy Samsung hr academy
Samsung hr academy
 
Как измерить счастье покупателя
Как измерить счастье покупателяКак измерить счастье покупателя
Как измерить счастье покупателя
 
презентация страховые 2013 - 2014
презентация страховые 2013 - 2014презентация страховые 2013 - 2014
презентация страховые 2013 - 2014
 
1
11
1
 
Метрики информационной безопасности
Метрики информационной безопасностиМетрики информационной безопасности
Метрики информационной безопасности
 
Дистанционное обучение
Дистанционное обучениеДистанционное обучение
Дистанционное обучение
 
Security Measurement.pdf
Security Measurement.pdfSecurity Measurement.pdf
Security Measurement.pdf
 
Machine Learning as a Service
Machine Learning as a ServiceMachine Learning as a Service
Machine Learning as a Service
 
Три кита в обслуживании телекоммуникационных систем
Три кита в обслуживании телекоммуникационных системТри кита в обслуживании телекоммуникационных систем
Три кита в обслуживании телекоммуникационных систем
 
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В КОМПЕТЕНТНОСТНОЙ ОЦЕНКЕ КАДРОВ - Алексей Князев
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В КОМПЕТЕНТНОСТНОЙ ОЦЕНКЕ   КАДРОВ - Алексей КнязевИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В КОМПЕТЕНТНОСТНОЙ ОЦЕНКЕ   КАДРОВ - Алексей Князев
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В КОМПЕТЕНТНОСТНОЙ ОЦЕНКЕ КАДРОВ - Алексей Князев
 
Все, что вы хотели знать про ИТ-сертификацию, но боялись спросить
Все, что вы хотели знать про ИТ-сертификацию, но боялись спроситьВсе, что вы хотели знать про ИТ-сертификацию, но боялись спросить
Все, что вы хотели знать про ИТ-сертификацию, но боялись спросить
 
Mitsov
MitsovMitsov
Mitsov
 
Презентация Булада Субанова с конференции «Биометрия в банке: практическое пр...
Презентация Булада Субанова с конференции «Биометрия в банке: практическое пр...Презентация Булада Субанова с конференции «Биометрия в банке: практическое пр...
Презентация Булада Субанова с конференции «Биометрия в банке: практическое пр...
 
Виктор Крылов, Современная поведенческая аналитика в большом e-commerce, Opti...
Виктор Крылов, Современная поведенческая аналитика в большом e-commerce, Opti...Виктор Крылов, Современная поведенческая аналитика в большом e-commerce, Opti...
Виктор Крылов, Современная поведенческая аналитика в большом e-commerce, Opti...
 
исследование качества телефонного обслуживания интернет магазинов
исследование качества телефонного обслуживания интернет магазиновисследование качества телефонного обслуживания интернет магазинов
исследование качества телефонного обслуживания интернет магазинов
 
Метод цвето-словесных ассоциаций
Метод цвето-словесных ассоциацийМетод цвето-словесных ассоциаций
Метод цвето-словесных ассоциаций
 
Влияние eDetailing на уровень продаж
Влияние eDetailing на уровень продажВлияние eDetailing на уровень продаж
Влияние eDetailing на уровень продаж
 
Искусство презентации: логика и эмоции в успешном выступлении
Искусство презентации: логика и эмоции в успешном выступленииИскусство презентации: логика и эмоции в успешном выступлении
Искусство презентации: логика и эмоции в успешном выступлении
 

More from Global Innovation Labs

Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Global Innovation Labs
 

More from Global Innovation Labs (20)

Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...
Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...
Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...
 
Ольга Перепелкина. NeurodataLab. Особенности машинного распознавания эмоций
Ольга Перепелкина. NeurodataLab. Особенности машинного распознавания эмоцийОльга Перепелкина. NeurodataLab. Особенности машинного распознавания эмоций
Ольга Перепелкина. NeurodataLab. Особенности машинного распознавания эмоций
 
Павел Бахтин. ВШЭ. Использование state-of-the-art эмбеддинговых моделей для а...
Павел Бахтин. ВШЭ. Использование state-of-the-art эмбеддинговых моделей для а...Павел Бахтин. ВШЭ. Использование state-of-the-art эмбеддинговых моделей для а...
Павел Бахтин. ВШЭ. Использование state-of-the-art эмбеддинговых моделей для а...
 
Александр Ерофеев. Газпромнефть. Управление качеством данных, инструмент и пр...
Александр Ерофеев. Газпромнефть. Управление качеством данных, инструмент и пр...Александр Ерофеев. Газпромнефть. Управление качеством данных, инструмент и пр...
Александр Ерофеев. Газпромнефть. Управление качеством данных, инструмент и пр...
 
Евгений Линник. БКС. GIGO — секреты очистки данных
Евгений Линник. БКС. GIGO — секреты очистки данныхЕвгений Линник. БКС. GIGO — секреты очистки данных
Евгений Линник. БКС. GIGO — секреты очистки данных
 
Егор Матешук. МаксимаТелеком. Не Spark’ом единым — полезные инструменты для с...
Егор Матешук. МаксимаТелеком. Не Spark’ом единым — полезные инструменты для с...Егор Матешук. МаксимаТелеком. Не Spark’ом единым — полезные инструменты для с...
Егор Матешук. МаксимаТелеком. Не Spark’ом единым — полезные инструменты для с...
 
Петр Ермаков. LAMODA. Автоматическая валидация контента в e-commerce
Петр Ермаков. LAMODA. Автоматическая валидация контента в e-commerceПетр Ермаков. LAMODA. Автоматическая валидация контента в e-commerce
Петр Ермаков. LAMODA. Автоматическая валидация контента в e-commerce
 
Андрей Коняев. ArenaData. Построение аналитики на ClickHouse — преимущества и...
Андрей Коняев. ArenaData. Построение аналитики на ClickHouse — преимущества и...Андрей Коняев. ArenaData. Построение аналитики на ClickHouse — преимущества и...
Андрей Коняев. ArenaData. Построение аналитики на ClickHouse — преимущества и...
 
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
 
Артемий Козырь. Сибур. Лучшие способы убить производительность аналитической ...
Артемий Козырь. Сибур. Лучшие способы убить производительность аналитической ...Артемий Козырь. Сибур. Лучшие способы убить производительность аналитической ...
Артемий Козырь. Сибур. Лучшие способы убить производительность аналитической ...
 
Александр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камни
Александр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камниАлександр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камни
Александр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камни
 
Ксения Александрова. Independent Media. Рекомендательные технологии в Digital...
Ксения Александрова. Independent Media. Рекомендательные технологии в Digital...Ксения Александрова. Independent Media. Рекомендательные технологии в Digital...
Ксения Александрова. Independent Media. Рекомендательные технологии в Digital...
 
Максим Годзи. Retentioneering. Искуственный интеллект помогает банку оптимзир...
Максим Годзи. Retentioneering. Искуственный интеллект помогает банку оптимзир...Максим Годзи. Retentioneering. Искуственный интеллект помогает банку оптимзир...
Максим Годзи. Retentioneering. Искуственный интеллект помогает банку оптимзир...
 
Екатерина Артюгина. ex MAIL.ru. Что выбирают женщины
Екатерина Артюгина. ex MAIL.ru. Что выбирают женщиныЕкатерина Артюгина. ex MAIL.ru. Что выбирают женщины
Екатерина Артюгина. ex MAIL.ru. Что выбирают женщины
 
Александр Кузнецов. Lanit Digital. Что будет если маркетологи начнут вести се...
Александр Кузнецов. Lanit Digital. Что будет если маркетологи начнут вести се...Александр Кузнецов. Lanit Digital. Что будет если маркетологи начнут вести се...
Александр Кузнецов. Lanit Digital. Что будет если маркетологи начнут вести се...
 
Андрей Анисимов. ВТБ. Построение моделей машинного обучения для увеличения пр...
Андрей Анисимов. ВТБ. Построение моделей машинного обучения для увеличения пр...Андрей Анисимов. ВТБ. Построение моделей машинного обучения для увеличения пр...
Андрей Анисимов. ВТБ. Построение моделей машинного обучения для увеличения пр...
 
Даниил Терентьев. Conventus. Как и зачем искусственный интеллект оценивает мы...
Даниил Терентьев. Conventus. Как и зачем искусственный интеллект оценивает мы...Даниил Терентьев. Conventus. Как и зачем искусственный интеллект оценивает мы...
Даниил Терентьев. Conventus. Как и зачем искусственный интеллект оценивает мы...
 
Илья Мунерман. Интрефакс Лаб. Вычисление исковой нагрузки российских компаний
 Илья Мунерман. Интрефакс Лаб. Вычисление исковой нагрузки российских компаний Илья Мунерман. Интрефакс Лаб. Вычисление исковой нагрузки российских компаний
Илья Мунерман. Интрефакс Лаб. Вычисление исковой нагрузки российских компаний
 
Павел Соболев. BSH Group (BOSCH/Siemens) . Машинное обучение для прогнозирова...
Павел Соболев. BSH Group (BOSCH/Siemens) . Машинное обучение для прогнозирова...Павел Соболев. BSH Group (BOSCH/Siemens) . Машинное обучение для прогнозирова...
Павел Соболев. BSH Group (BOSCH/Siemens) . Машинное обучение для прогнозирова...
 
Тарас Пустовой. Университет 2035. Как ИИ отвечает на вопрос «Чему пойти учить...
Тарас Пустовой. Университет 2035. Как ИИ отвечает на вопрос «Чему пойти учить...Тарас Пустовой. Университет 2035. Как ИИ отвечает на вопрос «Чему пойти учить...
Тарас Пустовой. Университет 2035. Как ИИ отвечает на вопрос «Чему пойти учить...
 

Артем Артемов. Когнитивные системы. Учет неизвестных признаков нейромодели на примере кейса МФЦ

  • 1. УЧЕТ НЕИЗВЕСТНЫХ ПРИЗНАКОВ НЕЙРОМОДЕЛИ НА ПРИМЕРЕ КЕЙСА МФЦ http://cogsys.company Артем Артемов, «Когнитивные системы»
  • 2. ПРОБЛЕМА БЛИЗКОГО ОТВЕТА •Нейросети пытаются найти наиболее близкий ответ на любой запрос – преимущество и проблема •Особенно актуально в языковых моделях и диалоговых системах • Часто это мешает – такой ответ может ввести пользователя в заблуждение
  • 4. ЗАДАЧА МФЦ Разработать нейромодель для Промобота, консультирующего посетителей по услугам в МФЦ.
  • 5. ДАННЫЕ Датасет из 10 000 классифицированных реальных запросов посетителей МФЦ Запрос Тип услуги Как получить страховое пенсионное свидетельство? Выдача СНИЛС Как получить добавку к пенсии за службу? Перерасчет пенсии Что нужно для заказа паспорта? Паспорт РФ Нужно оформить загран паспорт ребенку? Заграничный Паспорт
  • 6. В основе метода лежит информационный нейробайесовый подход (ИНП) - весовые коэффициенты интерпретируются как мера количества информации в признаках объекта для возможности идентификации его класса. МЕТОДОЛОГИЧЕСКАЯ ОСНОВА
  • 7. ПРОБЛЕМА Результаты первичного тестирования: В первой итерации - 60% правильных классификаций. Большинство заведомо неправильных запросов классифицировались системой как корректные. question true_class first_sim_precedent pred_class confidenсe Мне необходимо получить загран. паспорт основное| услуга 5.0| загран_заход Документы, необходимые для выдачи паспорта услуга 2.0| паспорт_заход| основное 0,636 Мне надо заказать льготу на квартиру основное| услуга 15.0| субсидиижкх_заход Мне надо заказать регистрацию в квартире услуга 1.0| прописка_заход| основное 0,928
  • 8. ПОСТАНОВКА Нейросеть должна не только правильно классифицировать корректные запросы, но также отфильтровывать заведомо неправильные. Обученная сеть на нерелевантные запросы должна давать ответ «не знаю», а не предлагать наиболее подходящую услугу. Пример: на вопрос «где получить паспорт?», модель должна назвать номер кабинета и услугу, а на вопрос «где получить паспорт пирата?» ответить – «не знаю».
  • 9. РЕШЕНИЕ – УЧЕТ НЕИЗВЕСТНЫХ ПРИЗНАКОВ Теорема: В условиях ограниченных данных, равное число одинаково неизвестных признаков объекта не могут иметь разный вес. !" = 1 − &" 'неизвест признаки 'все признаки ∑ 45" 65 Представленная модель дисконтирования весов универсальна и, благодаря коэффициенту &7 , может быть адаптирована для различных функции активации.
  • 11. «РЕЦЕПТ» РЕШЕНИЯ ПРОБЛЕМЫ 1. Слова каждого запроса лемматизируются и сводятся к инвариантам. 2. Преобразованный запрос разбивается на биграммы и отдельные слова. 3. Выбираем запросы из обучающего датасета, наиболее полно соответствующих данным по биграммам и униграммам. 4. Степень соответствия определяется по трем функциям SMI, NI и SRI, от значений которых считается среднее арифметическое - уровень уверенности (УУ).
  • 12. ОСНОВА РЕШЕНИЯ ПРОБЛЕМЫ Уровень уверенности - мера оценки незнания системой ответа на заданный вопрос. Пользователю выдается ответ, если класс ответа соответствует приемлемому уровню уверенности Пользователю выдается сообщение «некорректный вопрос», если УУ ниже 60% – высокой вероятности неправильной классификации.
  • 13. РЕЗУЛЬТАТЫ Модель показывает 93,64% правильных классификаций с учетом использования в тесте заведомо корректных и некорректных запросов*. *тестовый датасет на 50 000 запросов Artemov, A & Bolokhov, I & Kem, D & Khasenevich, I. (2019). Neural Network-based Object Classification by Known and Unknown Features (Based on Text Queries). http://arxiv.org/abs/1906.00800
  • 14. ВЫВОДЫ Использование УУ позволяет системе : A. Давать ответы на корректные запросы и отфильтровывать заведомо неверные. B. Распознавать парафразы и синонимы. Пример: система должна давать верный ответ на различные формулировки вопроса «как получить паспорт», «как получить удостоверение личности» и т.п. C. Система оценивает свою возможность дать корректный ответ с помощью показателя «уровень уверенности» - мера соответствия заданного запроса найденному. При низком уровне уверенности система дает ответ «не знаю».