SlideShare a Scribd company logo
1 of 34
Download to read offline
Оптимизация
бизнес-процессов и
документооборота
с использованием
NLP технологий
Бизнес-кейс:
Цифровой аудитор
Милков Максим
m.milkov@softline.com
Милков Максим
Технический директор, Lead Data Scientist
Департамента анализа данных (Softline AI)
Выпускник МФТИ, более 10 лет опыта реализации
консалтинговых проектов по анализу данных для
крупнейших российских и международных компаний
в сфере финансов, промышленности, ритейл и др.
НАПРАВЛЕНИЯ ДЕЯТЕЛЬНОСТИ
SOFTLINE AI
R&D в области
Data Science
Обучение
Data Science
Внедрение
и настройка
AI инструментов
Разработки
методик
по автоматизации
процесса анализа
данных
СОБСТВЕННЫЕ РАЗРАБОТКИ
НА ОСНОВЕ OPEN SOURCE
КОМАНДА
ЭКСПЕРТОВ
МЕЖДУНАРОДНЫЕ ВЕНДОРЫ,
ПЛАТФОРМЫ
ВЕДУЩИЕ
ВУЗЫ
2020
Нормирование цен на примере рынка
канцелярских товаров
Softline AI
Конкурс DataContest
декабрь 2020
Проблематика
По причине отсутствия определения предельных цен
на широкий перечень товаров, работ, услуг,
приобретаемых государственными организациями,
а также методических рекомендаций по расчету
нормативных цен и ответственности за их завышение,
при проверке обоснованности расчётов обнаруживается
некорректность нормативных цен, рассчитываемых
организациями, что приводит к завышению
планируемых затрат при формировании бюджета.
Задачи
создать решение для:
• формирования справедливой нормативной цены
• с использованием ИИ
• сопоставления нормативных цен, цен закупки и справедливой цены
• оценка корректности
• прогнозирования динамики нормативных цен в будущих периодах
• может быть рекомендована органам
• глубокой аналитики и мониторинга
• с использованием информационных панелей
• Проблема
• Ограниченные возможности поиска (связанные с человеком, с площадкой)
• Длительная оценка коммерческого интереса тендерной закупки
• Задача
• Разработать программный продукт для автоматизированного/оптимизированного
поиска тендерных закупок
• Выгоды
• Снижение расходов на поиск тендерных закупок
• Рост скорости обнаружения тендерных закупок, вызывающих коммерческий интерес
• Перепрофилирование сотрудников отдела мониторинга тендеров на более
трудоемкую и значимую деятельность
• Цифровизация процесса для дальнейшего улучшения и моделирования
Торговые
площадки
Электронная
площадка(и)
закупок
Озеро данных
Сырые
(html / Word
/ PDF/ …)
Ядро
(реляци-
онные
таблицы)
Аналитика
(витрины)
Информационные
панели
сервисы
(роботы / парсинг / OCR / …)
Источники
данных
ML
микро-сервисы
Сервисы
Исторические данные по закупкам и НД
на zakupki.gov.ru / agregatoreat.ru
Актуальные прайс-листы торговых площадок
• Python скрипты
• Роботы-«пауки» (загрузка)
• zakupki.gov.ru (ЕИС) – ftp:xml API:json web:html
• agregatoreat.ru (Берёзка) – web:html
• коммерческие торговые площадки – API:json
web:html
• Парсинг (извлечение, трансформация, загрузка в
реляционные таблицы)
• json/xml – десериализация
• html – разбор вёрстки страниц
• конвертирование документов из «doc» в «docx»
• поиск релевантных таблиц (нечёткий поиск ключевых слов)
• поиск необходимых столбцов в таблице (нечёткий поиск по
паттернам)
• обработка вложенных подтаблиц
• обработка значений (форматирование, разделение на
наименование и атрибуты – NER модель)
Текстовое описание товара (работы, услуги) Векторное описание товара (частотный подход,
категориальный подход, word2vec)
Обучение и валидация модели
Определение справедливой цены из
распределения и категории отклонения
• каждый товар описывается
вероятностным распределением цены
• результат применения модели
• из параметров восстановленного
распределения определяется
• рекомендуемая (справедливая) цена
• категория отклонения цен
• шкала -4 – 4
Товар: Маркеры
*упрощённый пример
Характеристика
товара:
Тип
Цена
• Метрика определения точности - средняя абсолютная ошибка
(МАЕ), интерпретируемая в контексте данной задачи,
симметричная
• Модель определения справедливой цены (исторические
очищенные данные по закупкам) - 3,41 руб.
• Модель определения цены (прайс-листы торговых онлайн-
площадок) - 6,46 руб.
• Модель прогнозирования справедливой цены (по отдельной
категории “маркеры” на 9 месяцев вперед) - 9,05 руб.
• Продуктивная версия
• ЦОД
• Базы Данных / Big Data
• Python микро-сервисы
• SOICA
• BI платформа
• «Облако»
• Прототип
• * Случайная ограниченная выборка закупок
• * Выборка нормативных документов гос. органов
• Локальное файловое хранилище
• Выгрузки табличных данных в плоские файлы
• BI платформа c поддержкой скриптов Python
Пример
визуализации
закупки с
значительным
отклонением от
справедливой цены
Гео-аналитика в
разрезе
административно-
территориального
деления
Разработан
индикатор для
составления
рейтинга
организаций по
уровню отклонений
от справедливой
цены с учётом
объёма закупок
Статистика
отклонений от
справедливой цены
по закупкам
выбранного
государственного
органа
Уровень отклонения
от справедливой
цены в разрезе
товаров с учетом
объема закупок
Сравнение цен
закупки,
рекомендованной и
предельной
Цифровой аудитор
• инструмент глубокой аналитики для
• формирования нормативных цен
• мониторинга закупок и сопоставления цен
• прогнозирования цен
• визуального и интерактивного анализа
✓ Разработана методика выявления существенных
отклонений цен
✓ индикатор рейтинга организаций и закупок
✓ Разработан прототип решения
Цифровой аудитор
✓ Осуществляется операционный мониторинг
нормативных цен и аналитика процессов
закупочной деятельности
✓ Оптимизация распределения средств бюджета
✓ Формирование рекомендаций по регулированию
процессов формирования
• Проблема: При наличии в компании большого количества
регламентов, сотрудникам становится проблематично
находить ответы на вопросы по бизнес процессам.
• Решение: Пользователь задает вопрос в произвольной форме
относительно любого из процессов, описанных в корпоративных
документах, и получает на него ответ в виде фрагмента текста.
• Документы (тех. регламенты) разбиваются на разделы и содержимое каждого
раздела сохраняется в коллекцию документов.
• Обучается и применяется модель ранжирования документов. Для заданного
вопроса отбираются N фрагментов из коллекции документов, потенциально
содержащих ответ.
• Создается и применяется модель поиска ответа. Модель анализирует вопрос и
затем, читая последовательно по словам фрагмент текста, для каждого слова
принимает решение: может ли данное слово являться ответом.
• Дополнительно определяется оценка ответа, которая позволяет ранжировать
ответы если модель находит несколько возможных вариантов.
• Пример работы
Правильный ответ:
Вопрос 1: «Где заявитель проводит испытания образцов зерна для подтверждения соответствия?
Ответы:
Уверенность
модели в ответе
Оценка модели: 100
Оценка модели: 76
Альтернативный ответ:
Softline Digital
25+ лет на рынке
Глобальное
присутствие
3000+ партнеров
Техническая и
продуктовая экспертиза
Топовые позиции в
международных рейтингах
Команда экстра-класса с глобальной
отраслевой и технической экспертизой
Взаимодополняющие
направления бизнеса
Ведущие научные и
технологические партнеры:
HSE, SkolTech и т.д.
Заказная разработка для разных
отраслей и специфических задач
Быстрая оценка
и быстрый старт цифровой
трансформации
OpenTalks.AI - Оптимизация бизнес-процессов и документооборота с использованием NLP технологий Бизнес-кейс: Цифровой аудитор
OpenTalks.AI - Оптимизация бизнес-процессов и документооборота с использованием NLP технологий Бизнес-кейс: Цифровой аудитор

More Related Content

What's hot

Опыт работы с Qlik в компании ВТБ Страхование
Опыт работы с Qlik в компании ВТБ Страхование Опыт работы с Qlik в компании ВТБ Страхование
Опыт работы с Qlik в компании ВТБ Страхование Marina Payvina
 
ГИППО QlikView конференция Минск 2014 А2 Консалтинг
ГИППО  QlikView конференция Минск 2014 А2 Консалтинг ГИППО  QlikView конференция Минск 2014 А2 Консалтинг
ГИППО QlikView конференция Минск 2014 А2 Консалтинг a2consulting
 
BIS DE
BIS DEBIS DE
BIS DEMag0s
 
Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»
Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»
Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»Marina Payvina
 
Особенности разработки требований в интеграционном проекте
Особенности разработки требований в интеграционном проектеОсобенности разработки требований в интеграционном проекте
Особенности разработки требований в интеграционном проектеSQALab
 
Интеграция данных компании
Интеграция данных компанииИнтеграция данных компании
Интеграция данных компанииDatamodel
 
Методология проведения кабинетных маркетинговых исследований (Desk research)
Методология проведения кабинетных маркетинговых исследований (Desk research)Методология проведения кабинетных маркетинговых исследований (Desk research)
Методология проведения кабинетных маркетинговых исследований (Desk research)Techart Marketing Group
 
Power BI для аналитики данных из 1С: практический опыт
Power BI для аналитики данных из 1С: практический опытPower BI для аналитики данных из 1С: практический опыт
Power BI для аналитики данных из 1С: практический опытMarina Payvina
 

What's hot (9)

Опыт работы с Qlik в компании ВТБ Страхование
Опыт работы с Qlik в компании ВТБ Страхование Опыт работы с Qlik в компании ВТБ Страхование
Опыт работы с Qlik в компании ВТБ Страхование
 
ГИППО QlikView конференция Минск 2014 А2 Консалтинг
ГИППО  QlikView конференция Минск 2014 А2 Консалтинг ГИППО  QlikView конференция Минск 2014 А2 Консалтинг
ГИППО QlikView конференция Минск 2014 А2 Консалтинг
 
BIS DE
BIS DEBIS DE
BIS DE
 
Provecta pos 2
Provecta pos 2Provecta pos 2
Provecta pos 2
 
Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»
Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»
Бизнес-завтрак «Qlik: работаем с данными 1С эффективно»
 
Особенности разработки требований в интеграционном проекте
Особенности разработки требований в интеграционном проектеОсобенности разработки требований в интеграционном проекте
Особенности разработки требований в интеграционном проекте
 
Интеграция данных компании
Интеграция данных компанииИнтеграция данных компании
Интеграция данных компании
 
Методология проведения кабинетных маркетинговых исследований (Desk research)
Методология проведения кабинетных маркетинговых исследований (Desk research)Методология проведения кабинетных маркетинговых исследований (Desk research)
Методология проведения кабинетных маркетинговых исследований (Desk research)
 
Power BI для аналитики данных из 1С: практический опыт
Power BI для аналитики данных из 1С: практический опытPower BI для аналитики данных из 1С: практический опыт
Power BI для аналитики данных из 1С: практический опыт
 

Similar to OpenTalks.AI - Оптимизация бизнес-процессов и документооборота с использованием NLP технологий Бизнес-кейс: Цифровой аудитор

Сбор и анализ данных для моделирования деятельности организации
Сбор и анализ данных для моделирования деятельности организацииСбор и анализ данных для моделирования деятельности организации
Сбор и анализ данных для моделирования деятельности организацииOlya Kollen, PhD
 
Как избежать ошибок, которые приводят к неточности маркетинговых данных
Как избежать ошибок, которые приводят к неточности маркетинговых данныхКак избежать ошибок, которые приводят к неточности маркетинговых данных
Как избежать ошибок, которые приводят к неточности маркетинговых данныхМаркетинг-аналитика с OWOX BI
 
Bios power bi о нас (RU)
Bios power bi о нас (RU)Bios power bi о нас (RU)
Bios power bi о нас (RU)Oleksandr18
 
Иванов - Прогнозная аналитика в поисковом маркетинге
Иванов - Прогнозная аналитика в поисковом маркетингеИванов - Прогнозная аналитика в поисковом маркетинге
Иванов - Прогнозная аналитика в поисковом маркетингеSEO Conference
 
Прогнозная аналитика в поисковом маркетинге SEOCONF2016
Прогнозная аналитика в поисковом маркетинге SEOCONF2016Прогнозная аналитика в поисковом маркетинге SEOCONF2016
Прогнозная аналитика в поисковом маркетинге SEOCONF2016Иванов Дмитрий
 
требования к кандидату
требования к кандидатутребования к кандидату
требования к кандидатуNatalia Zhelnova
 
Data-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииData-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииAlexander Barakov
 
Qlik view комплексное аналитическое retail решение v4,4- для сайта (без скр...
Qlik view   комплексное аналитическое retail решение v4,4- для сайта (без скр...Qlik view   комплексное аналитическое retail решение v4,4- для сайта (без скр...
Qlik view комплексное аналитическое retail решение v4,4- для сайта (без скр...Геннадий Красношлык
 
Ozon в высшей школе экономики часть 4
Ozon в высшей школе экономики часть 4Ozon в высшей школе экономики часть 4
Ozon в высшей школе экономики часть 4Roman Zykov
 
CEE-SECR'2011 Бизнес-процессы
CEE-SECR'2011 Бизнес-процессыCEE-SECR'2011 Бизнес-процессы
CEE-SECR'2011 Бизнес-процессыYury Kupriyanov
 
How to assess the company's readiness to intelligent automation of office pro...
How to assess the company's readiness to intelligent automation of office pro...How to assess the company's readiness to intelligent automation of office pro...
How to assess the company's readiness to intelligent automation of office pro...Alexandre Prozoroff
 
Бизнес-анализ: грани разумного
Бизнес-анализ: грани разумногоБизнес-анализ: грани разумного
Бизнес-анализ: грани разумногоSQALab
 
Novichkov Shamraj 20 May Sef
Novichkov Shamraj 20 May SefNovichkov Shamraj 20 May Sef
Novichkov Shamraj 20 May Sefsef2009
 
Оценка эффективности от внедрения и использования методологии и инструменталь...
Оценка эффективности от внедрения и использования методологии и инструменталь...Оценка эффективности от внедрения и использования методологии и инструменталь...
Оценка эффективности от внедрения и использования методологии и инструменталь...SQALab
 
QlikView Conference Minsk 2014 A2 Consulting
QlikView Conference Minsk 2014 A2 ConsultingQlikView Conference Minsk 2014 A2 Consulting
QlikView Conference Minsk 2014 A2 Consultinga2consulting
 
Microsoft FAST Enterprise Search Technologies Overview
Microsoft FAST Enterprise Search Technologies OverviewMicrosoft FAST Enterprise Search Technologies Overview
Microsoft FAST Enterprise Search Technologies OverviewMichael Kozloff
 
Обзор 40 SaaS-конструкторов для интернет-магазинов
Обзор 40 SaaS-конструкторов для интернет-магазиновОбзор 40 SaaS-конструкторов для интернет-магазинов
Обзор 40 SaaS-конструкторов для интернет-магазинов"Rating Runet"
 

Similar to OpenTalks.AI - Оптимизация бизнес-процессов и документооборота с использованием NLP технологий Бизнес-кейс: Цифровой аудитор (20)

Сбор и анализ данных для моделирования деятельности организации
Сбор и анализ данных для моделирования деятельности организацииСбор и анализ данных для моделирования деятельности организации
Сбор и анализ данных для моделирования деятельности организации
 
Как избежать ошибок, которые приводят к неточности маркетинговых данных
Как избежать ошибок, которые приводят к неточности маркетинговых данныхКак избежать ошибок, которые приводят к неточности маркетинговых данных
Как избежать ошибок, которые приводят к неточности маркетинговых данных
 
Bios power bi о нас (RU)
Bios power bi о нас (RU)Bios power bi о нас (RU)
Bios power bi о нас (RU)
 
Иванов - Прогнозная аналитика в поисковом маркетинге
Иванов - Прогнозная аналитика в поисковом маркетингеИванов - Прогнозная аналитика в поисковом маркетинге
Иванов - Прогнозная аналитика в поисковом маркетинге
 
Прогнозная аналитика в поисковом маркетинге SEOCONF2016
Прогнозная аналитика в поисковом маркетинге SEOCONF2016Прогнозная аналитика в поисковом маркетинге SEOCONF2016
Прогнозная аналитика в поисковом маркетинге SEOCONF2016
 
Прогнозная аналитика в поисковом маркетинге Вебинар WebPromoExperts #318
Прогнозная аналитика в поисковом маркетинге Вебинар WebPromoExperts #318Прогнозная аналитика в поисковом маркетинге Вебинар WebPromoExperts #318
Прогнозная аналитика в поисковом маркетинге Вебинар WebPromoExperts #318
 
требования к кандидату
требования к кандидатутребования к кандидату
требования к кандидату
 
Data-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииData-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной Компании
 
Qlik view комплексное аналитическое retail решение v4,4- для сайта (без скр...
Qlik view   комплексное аналитическое retail решение v4,4- для сайта (без скр...Qlik view   комплексное аналитическое retail решение v4,4- для сайта (без скр...
Qlik view комплексное аналитическое retail решение v4,4- для сайта (без скр...
 
Ozon в высшей школе экономики часть 4
Ozon в высшей школе экономики часть 4Ozon в высшей школе экономики часть 4
Ozon в высшей школе экономики часть 4
 
CEE-SECR'2011 Бизнес-процессы
CEE-SECR'2011 Бизнес-процессыCEE-SECR'2011 Бизнес-процессы
CEE-SECR'2011 Бизнес-процессы
 
How to assess the company's readiness to intelligent automation of office pro...
How to assess the company's readiness to intelligent automation of office pro...How to assess the company's readiness to intelligent automation of office pro...
How to assess the company's readiness to intelligent automation of office pro...
 
Бизнес-анализ: грани разумного
Бизнес-анализ: грани разумногоБизнес-анализ: грани разумного
Бизнес-анализ: грани разумного
 
Novichkov Shamraj 20 May Sef
Novichkov Shamraj 20 May SefNovichkov Shamraj 20 May Sef
Novichkov Shamraj 20 May Sef
 
Оценка эффективности от внедрения и использования методологии и инструменталь...
Оценка эффективности от внедрения и использования методологии и инструменталь...Оценка эффективности от внедрения и использования методологии и инструменталь...
Оценка эффективности от внедрения и использования методологии и инструменталь...
 
Как настроить систему сквозной аналитики
Как настроить систему сквозной аналитикиКак настроить систему сквозной аналитики
Как настроить систему сквозной аналитики
 
QlikView Conference Minsk 2014 A2 Consulting
QlikView Conference Minsk 2014 A2 ConsultingQlikView Conference Minsk 2014 A2 Consulting
QlikView Conference Minsk 2014 A2 Consulting
 
Microsoft FAST Enterprise Search Technologies Overview
Microsoft FAST Enterprise Search Technologies OverviewMicrosoft FAST Enterprise Search Technologies Overview
Microsoft FAST Enterprise Search Technologies Overview
 
Обзор 40 SaaS-конструкторов для интернет-магазинов
Обзор 40 SaaS-конструкторов для интернет-магазиновОбзор 40 SaaS-конструкторов для интернет-магазинов
Обзор 40 SaaS-конструкторов для интернет-магазинов
 
Сравнение инструментов для построения отчетов
Сравнение инструментов для построения отчетовСравнение инструментов для построения отчетов
Сравнение инструментов для построения отчетов
 

More from IP_Accelerator NeuroNet

OpenTalks.AI - Сергей Терехов, Тензорная машина ассоциативного вывода
OpenTalks.AI - Сергей Терехов, Тензорная машина ассоциативного выводаOpenTalks.AI - Сергей Терехов, Тензорная машина ассоциативного вывода
OpenTalks.AI - Сергей Терехов, Тензорная машина ассоциативного выводаIP_Accelerator NeuroNet
 
Коммерциализация разработок в медицине
Коммерциализация разработок в медицинеКоммерциализация разработок в медицине
Коммерциализация разработок в медицинеIP_Accelerator NeuroNet
 
Интеллектуальная собственность
Интеллектуальная собственностьИнтеллектуальная собственность
Интеллектуальная собственностьIP_Accelerator NeuroNet
 
Привлечение финансирование по конкурсу Развитие-НТИ, 02.05.17-Акселератор Ней...
Привлечение финансирование по конкурсу Развитие-НТИ, 02.05.17-Акселератор Ней...Привлечение финансирование по конкурсу Развитие-НТИ, 02.05.17-Акселератор Ней...
Привлечение финансирование по конкурсу Развитие-НТИ, 02.05.17-Акселератор Ней...IP_Accelerator NeuroNet
 
Финансирование проектов (28.04)
Финансирование проектов (28.04)Финансирование проектов (28.04)
Финансирование проектов (28.04)IP_Accelerator NeuroNet
 
Проектная математика (28.04)
Проектная математика (28.04)Проектная математика (28.04)
Проектная математика (28.04)IP_Accelerator NeuroNet
 
Стартап. Жизненный цикл (20.04)
Стартап. Жизненный цикл (20.04)Стартап. Жизненный цикл (20.04)
Стартап. Жизненный цикл (20.04)IP_Accelerator NeuroNet
 

More from IP_Accelerator NeuroNet (12)

OpenTalks.AI - Сергей Терехов, Тензорная машина ассоциативного вывода
OpenTalks.AI - Сергей Терехов, Тензорная машина ассоциативного выводаOpenTalks.AI - Сергей Терехов, Тензорная машина ассоциативного вывода
OpenTalks.AI - Сергей Терехов, Тензорная машина ассоциативного вывода
 
Коммерциализация разработок в медицине
Коммерциализация разработок в медицинеКоммерциализация разработок в медицине
Коммерциализация разработок в медицине
 
Схемы, Роспатент
Схемы, РоспатентСхемы, Роспатент
Схемы, Роспатент
 
Интеллектуальная собственность
Интеллектуальная собственностьИнтеллектуальная собственность
Интеллектуальная собственность
 
Привлечение финансирование по конкурсу Развитие-НТИ, 02.05.17-Акселератор Ней...
Привлечение финансирование по конкурсу Развитие-НТИ, 02.05.17-Акселератор Ней...Привлечение финансирование по конкурсу Развитие-НТИ, 02.05.17-Акселератор Ней...
Привлечение финансирование по конкурсу Развитие-НТИ, 02.05.17-Акселератор Ней...
 
Финансирование проектов (28.04)
Финансирование проектов (28.04)Финансирование проектов (28.04)
Финансирование проектов (28.04)
 
Проектная математика (28.04)
Проектная математика (28.04)Проектная математика (28.04)
Проектная математика (28.04)
 
Universitety 3.0 (20.04)
Universitety 3.0 (20.04)Universitety 3.0 (20.04)
Universitety 3.0 (20.04)
 
Value proposition (20.04)
Value proposition (20.04)Value proposition (20.04)
Value proposition (20.04)
 
Предприниматель (20.04)
Предприниматель (20.04)Предприниматель (20.04)
Предприниматель (20.04)
 
Бизнес-модели (20.04)
Бизнес-модели (20.04)Бизнес-модели (20.04)
Бизнес-модели (20.04)
 
Стартап. Жизненный цикл (20.04)
Стартап. Жизненный цикл (20.04)Стартап. Жизненный цикл (20.04)
Стартап. Жизненный цикл (20.04)
 

OpenTalks.AI - Оптимизация бизнес-процессов и документооборота с использованием NLP технологий Бизнес-кейс: Цифровой аудитор

  • 1. Оптимизация бизнес-процессов и документооборота с использованием NLP технологий Бизнес-кейс: Цифровой аудитор Милков Максим m.milkov@softline.com
  • 2. Милков Максим Технический директор, Lead Data Scientist Департамента анализа данных (Softline AI) Выпускник МФТИ, более 10 лет опыта реализации консалтинговых проектов по анализу данных для крупнейших российских и международных компаний в сфере финансов, промышленности, ритейл и др.
  • 3.
  • 4. НАПРАВЛЕНИЯ ДЕЯТЕЛЬНОСТИ SOFTLINE AI R&D в области Data Science Обучение Data Science Внедрение и настройка AI инструментов Разработки методик по автоматизации процесса анализа данных
  • 5. СОБСТВЕННЫЕ РАЗРАБОТКИ НА ОСНОВЕ OPEN SOURCE КОМАНДА ЭКСПЕРТОВ МЕЖДУНАРОДНЫЕ ВЕНДОРЫ, ПЛАТФОРМЫ ВЕДУЩИЕ ВУЗЫ
  • 6. 2020 Нормирование цен на примере рынка канцелярских товаров Softline AI Конкурс DataContest декабрь 2020
  • 7. Проблематика По причине отсутствия определения предельных цен на широкий перечень товаров, работ, услуг, приобретаемых государственными организациями, а также методических рекомендаций по расчету нормативных цен и ответственности за их завышение, при проверке обоснованности расчётов обнаруживается некорректность нормативных цен, рассчитываемых организациями, что приводит к завышению планируемых затрат при формировании бюджета.
  • 8. Задачи создать решение для: • формирования справедливой нормативной цены • с использованием ИИ • сопоставления нормативных цен, цен закупки и справедливой цены • оценка корректности • прогнозирования динамики нормативных цен в будущих периодах • может быть рекомендована органам • глубокой аналитики и мониторинга • с использованием информационных панелей
  • 9. • Проблема • Ограниченные возможности поиска (связанные с человеком, с площадкой) • Длительная оценка коммерческого интереса тендерной закупки • Задача • Разработать программный продукт для автоматизированного/оптимизированного поиска тендерных закупок • Выгоды • Снижение расходов на поиск тендерных закупок • Рост скорости обнаружения тендерных закупок, вызывающих коммерческий интерес • Перепрофилирование сотрудников отдела мониторинга тендеров на более трудоемкую и значимую деятельность • Цифровизация процесса для дальнейшего улучшения и моделирования
  • 10.
  • 11. Торговые площадки Электронная площадка(и) закупок Озеро данных Сырые (html / Word / PDF/ …) Ядро (реляци- онные таблицы) Аналитика (витрины) Информационные панели сервисы (роботы / парсинг / OCR / …) Источники данных ML микро-сервисы Сервисы
  • 12. Исторические данные по закупкам и НД на zakupki.gov.ru / agregatoreat.ru Актуальные прайс-листы торговых площадок
  • 13. • Python скрипты • Роботы-«пауки» (загрузка) • zakupki.gov.ru (ЕИС) – ftp:xml API:json web:html • agregatoreat.ru (Берёзка) – web:html • коммерческие торговые площадки – API:json web:html • Парсинг (извлечение, трансформация, загрузка в реляционные таблицы) • json/xml – десериализация • html – разбор вёрстки страниц
  • 14. • конвертирование документов из «doc» в «docx» • поиск релевантных таблиц (нечёткий поиск ключевых слов) • поиск необходимых столбцов в таблице (нечёткий поиск по паттернам) • обработка вложенных подтаблиц • обработка значений (форматирование, разделение на наименование и атрибуты – NER модель)
  • 15.
  • 16.
  • 17. Текстовое описание товара (работы, услуги) Векторное описание товара (частотный подход, категориальный подход, word2vec) Обучение и валидация модели Определение справедливой цены из распределения и категории отклонения
  • 18. • каждый товар описывается вероятностным распределением цены • результат применения модели • из параметров восстановленного распределения определяется • рекомендуемая (справедливая) цена • категория отклонения цен • шкала -4 – 4 Товар: Маркеры *упрощённый пример Характеристика товара: Тип Цена
  • 19. • Метрика определения точности - средняя абсолютная ошибка (МАЕ), интерпретируемая в контексте данной задачи, симметричная • Модель определения справедливой цены (исторические очищенные данные по закупкам) - 3,41 руб. • Модель определения цены (прайс-листы торговых онлайн- площадок) - 6,46 руб. • Модель прогнозирования справедливой цены (по отдельной категории “маркеры” на 9 месяцев вперед) - 9,05 руб.
  • 20. • Продуктивная версия • ЦОД • Базы Данных / Big Data • Python микро-сервисы • SOICA • BI платформа • «Облако» • Прототип • * Случайная ограниченная выборка закупок • * Выборка нормативных документов гос. органов • Локальное файловое хранилище • Выгрузки табличных данных в плоские файлы • BI платформа c поддержкой скриптов Python
  • 21.
  • 24. Разработан индикатор для составления рейтинга организаций по уровню отклонений от справедливой цены с учётом объёма закупок
  • 25. Статистика отклонений от справедливой цены по закупкам выбранного государственного органа
  • 26. Уровень отклонения от справедливой цены в разрезе товаров с учетом объема закупок
  • 28. Цифровой аудитор • инструмент глубокой аналитики для • формирования нормативных цен • мониторинга закупок и сопоставления цен • прогнозирования цен • визуального и интерактивного анализа ✓ Разработана методика выявления существенных отклонений цен ✓ индикатор рейтинга организаций и закупок ✓ Разработан прототип решения
  • 29. Цифровой аудитор ✓ Осуществляется операционный мониторинг нормативных цен и аналитика процессов закупочной деятельности ✓ Оптимизация распределения средств бюджета ✓ Формирование рекомендаций по регулированию процессов формирования
  • 30. • Проблема: При наличии в компании большого количества регламентов, сотрудникам становится проблематично находить ответы на вопросы по бизнес процессам. • Решение: Пользователь задает вопрос в произвольной форме относительно любого из процессов, описанных в корпоративных документах, и получает на него ответ в виде фрагмента текста. • Документы (тех. регламенты) разбиваются на разделы и содержимое каждого раздела сохраняется в коллекцию документов. • Обучается и применяется модель ранжирования документов. Для заданного вопроса отбираются N фрагментов из коллекции документов, потенциально содержащих ответ. • Создается и применяется модель поиска ответа. Модель анализирует вопрос и затем, читая последовательно по словам фрагмент текста, для каждого слова принимает решение: может ли данное слово являться ответом. • Дополнительно определяется оценка ответа, которая позволяет ранжировать ответы если модель находит несколько возможных вариантов.
  • 31. • Пример работы Правильный ответ: Вопрос 1: «Где заявитель проводит испытания образцов зерна для подтверждения соответствия? Ответы: Уверенность модели в ответе Оценка модели: 100 Оценка модели: 76 Альтернативный ответ:
  • 32. Softline Digital 25+ лет на рынке Глобальное присутствие 3000+ партнеров Техническая и продуктовая экспертиза Топовые позиции в международных рейтингах Команда экстра-класса с глобальной отраслевой и технической экспертизой Взаимодополняющие направления бизнеса Ведущие научные и технологические партнеры: HSE, SkolTech и т.д. Заказная разработка для разных отраслей и специфических задач Быстрая оценка и быстрый старт цифровой трансформации