SlideShare a Scribd company logo
IBM ECM
Сравнение документов 
«на просвет»
Задача

Сравнить документы клиента,
полученные от сотрудников frontсистем.


Проверить не вносил ли клиент
некорректных правок в
подписанную версию документов.
Предлагаемый процесс
• 

Сотрудник бек-офиса вносит в систему Word файл с мета информацией в удобной для
него иерархии архива.

• 

Система выносит найденную в файле мета информацию в поля документа (Стороны/
Проценты/Объемы и т. д.) – либо по идентификатору договора подгружает из основной
информационной системы.

• 

Сотрудник фронт-офиса получает бумажные документы и вносит их в систему через
модуль сканирования Datacap. Модуль сканирования:
–  Определяет тип документа (на основании заголовков или форм)
–  Распознает необходимые ключевые поля из документа и полный текст (Стороны/
Проценты/Объемы/Сроки/Номера/Фамилии и пр.)
–  Сохраняет изображение и текст документа вместе с ключевой информацией в
электронный архив в удобную для фронт-офиса иерархии.

• 

Сотрудник бэк-офиса через браузер запускает процедуры автоматической проверки:
–  Проверка комплектности (сравнение по типам документов и количеству страниц)
–  Проверка на просвет (проверка на основании изображения)
–  Проверка по тексту (сравнение оригинала с тестом от OCR системы)
–  Проверяет отчеты по результатам сравнения и подтверждает или отклоняет пакет
–  Сверка подписи клиента с эталонной.
Решение

Сотрудник БэкОфиса сохраняет оригинал в формате Word
Решение

Документ переформатируется из Word в изображение (Tiff,PDF,PNG)
Решение

Сотрудник ФронтОфиса сканирует ответ клиента в формате Tiff
Datacap производит распознавание документа и сохраняет в CM
Изображение и распознанный текст.
Решение

Модуль производит сравнение документов по двум механизмам:
- сравнение «на просвет», в результате сравнения формируется
изображение с цветовым выделением разницы
- сравнение «по тексту», в результате сравнения формируется отчет
с различиями обнаруженными по тексту.
Интерфейсы :: Архив

Документы на
проверку
Иерарихия
документов

Свойства
документа

Preview
документа
Интерфейсы :: Архив

Проверенные
документы
(100% совпадения)

Средство
просмотра
документов,
встроенное в ЭА
Интерфейсы :: Архив

На исправлении
(есть расхождения)

Разница выделена
красным цветом
Интерфейсы
Красным цветом выводятся
внесенные в документ изменения,
совпадающие символы снижают
яркость.
Интерфейсы :: Сканирование


Datacap имеет интерфейсы сканирования и
верификации, но в данном случае может работать
в «скрытом» режиме.
Интерфейсы :: Архив
•  Сравнение по тексту происходит блоками, при большом
различии (более установленного % слов или символов в
слове) система фиксирует различия всего блока.
Datacap для захвата
данных

•  Используя решение для сканирования от IBM –
Datacap можно выделить из документа:
–  Номера и даты (самого документа и ссылок, таких как
доверенности, паспорта, свидетельства и пр.
–  Участники/Стороны и их реквизиты (ОГРН и пр.)
–  Ключевые показатели (суммы, проценты, уровни и пр.)
–  Специальные объекты (подписи, печати)

•  Этот подход позволит выявить 99% «опасных»
изменений в документах, полученных от клиентов.
Сверка подписи

Решение от бизнес-партнёра компании
IBM – Parascript SignatureXpert является
апробированным промышленным
решением по программной сверке
подписей с эталонной и уже интегрирован
с IBM Datacap и IBM Content Navigator.
Интерфейсы
Бесплатное
приложение для
iPad
Работа через
браузер
планшетного
компьютера

Бесплатное
решение для iPhone
Рекомендации для
повышения качества процесса
•  Повысить качество скан-образов
•  Зафиксировать приемлемые модели (цветность/размер
пикселя)
•  Включать в документ мета-информацию
•  Включить в шаблоны («якоря») визуальные или текстовые
•  Настроить шаблоны для распознавания требуемых полей 

Это позволит существенно повысить качество сравнения и
снизить количество ложных срабатываний.
Нужно отметить...
•  Качество сканирования с фронта
скорее всего будет весьма низким.
•  Предлагаем внести изменения в
шаблоны word-документов: 
–  Реперы в колонтитулы для лучшего
позиционирования документа (например
черные квадраты)
–  Ввести четкую нумерацию пунктов
договора, для повышения качества
текстового анализа.
–  Переформатировать шаблоны договоров в
фиксированных частях.
Нужно отметить...
•  Сейчас преобразование Word –> Tiff
производится на серверной стороне
сторонними средствами. 
•  IBM может предложить своё
решение для этого – Rendition
Engine.
Положение на рынке (лидерство в отрасли)
Gartner Magic Quadrant for Enterprise Content Management 2013

Источник http://www.gartner.com/technology/reprints.do?id=1-1KPJFOM&ct=130923&st=sb
Преимущества IBM ECM
•  Уникальный международный опыт в
крупнейших мировых финансовых структурах
•  Производительность и устойчивость к нагрузкам,
подтверждённые как множеством проектов, так
и независимыми испытаниями.
•  Разумные требования к оборудованию
•  Минимальные сроки внедрения
•  Единая платформа для решения множества
задач по работе с документами
•  IBM – единственный вендор, способный
поставить все компоненты решения,
минимизируя тем самым совокупную стоимость
и интеграционные риски
Приложение для работы с документами IBM ECM – Content Navigator






Новости и примеры использования решений от команды IBM ECM




Сергей Якимчук yakimchuk@ru.ibm.com 



 +7 985 762 45 68

More Related Content

Similar to IBM ECM :: Сравнение документов "на просвет"

презентация8
презентация8презентация8
презентация8student_kai
 
Описание и архитектура TFS 2008
Описание и архитектура TFS 2008Описание и архитектура TFS 2008
Описание и архитектура TFS 2008
Александр Шамрай
 
Tfs Overview And Architecture (www.cmcons.com)
Tfs Overview And Architecture (www.cmcons.com)Tfs Overview And Architecture (www.cmcons.com)
Tfs Overview And Architecture (www.cmcons.com)
Alexander Novichkov
 
автоматическое построение оригинал макетов учебников как отч
автоматическое построение оригинал макетов учебников как отчавтоматическое построение оригинал макетов учебников как отч
автоматическое построение оригинал макетов учебников как отчanna_vereshchagina
 
IBM ECM & Discovery Strategy
IBM ECM & Discovery StrategyIBM ECM & Discovery Strategy
IBM ECM & Discovery Strategy
IBM IBM
 
Вебинар №4 «IT-инфраструктура безбумажной работы»
Вебинар №4 «IT-инфраструктура безбумажной работы»Вебинар №4 «IT-инфраструктура безбумажной работы»
Вебинар №4 «IT-инфраструктура безбумажной работы»
Docsvision
 
20160323 Пример бизнес-приложения контроля качества в розничной торговле
20160323 Пример бизнес-приложения контроля качества в розничной торговле20160323 Пример бизнес-приложения контроля качества в розничной торговле
20160323 Пример бизнес-приложения контроля качества в розничной торговле
Andrew Sovtsov
 
OpenSource_2011
OpenSource_2011OpenSource_2011
OpenSource_2011iopent
 
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
it-people
 
Строим собственную BI в MS Excel на данных из Яндекс.Метрики и Google Analitycs
Строим собственную BI в MS Excel на данных из Яндекс.Метрики и Google AnalitycsСтроим собственную BI в MS Excel на данных из Яндекс.Метрики и Google Analitycs
Строим собственную BI в MS Excel на данных из Яндекс.Метрики и Google Analitycs
Maxim Uvarov
 
метод организации репозитория исходного кода
метод организации репозитория исходного кодаметод организации репозитория исходного кода
метод организации репозитория исходного кодаSergii Shmarkatiuk
 
Anatol Filin Pragmatic Documentation 0 5
Anatol Filin Pragmatic Documentation 0 5Anatol Filin Pragmatic Documentation 0 5
Anatol Filin Pragmatic Documentation 0 5rit2010
 
Управление бизнес-процессами и электронным документооборотом с помощью решени...
Управление бизнес-процессами и электронным документооборотом с помощью решени...Управление бизнес-процессами и электронным документооборотом с помощью решени...
Управление бизнес-процессами и электронным документооборотом с помощью решени...
NAUMEN. Информационные системы управления растущим бизнесом
 
Больше чем анализ
Больше чем анализБольше чем анализ
Больше чем анализ
SQALab
 
Быстрое масштабирование систем
Быстрое масштабирование системБыстрое масштабирование систем
Быстрое масштабирование системMedia Gorod
 
Anatol filin pragmatic documentation 1_r
Anatol filin  pragmatic documentation 1_rAnatol filin  pragmatic documentation 1_r
Anatol filin pragmatic documentation 1_rrit2010
 
Trening modul2-webinar11
Trening modul2-webinar11Trening modul2-webinar11
Trening modul2-webinar11
olgaoov
 
Новые возможности LanDocs
Новые возможности LanDocsНовые возможности LanDocs
Новые возможности LanDocs
LANIT
 
DB REPLICATION
DB REPLICATIONDB REPLICATION
DB REPLICATION
soft-point
 
14-02-26 DBA 101_ как найти и устранить причины замедления работы БД
14-02-26 DBA 101_ как найти и устранить причины замедления работы БД14-02-26 DBA 101_ как найти и устранить причины замедления работы БД
14-02-26 DBA 101_ как найти и устранить причины замедления работы БД
Andrew Sovtsov
 

Similar to IBM ECM :: Сравнение документов "на просвет" (20)

презентация8
презентация8презентация8
презентация8
 
Описание и архитектура TFS 2008
Описание и архитектура TFS 2008Описание и архитектура TFS 2008
Описание и архитектура TFS 2008
 
Tfs Overview And Architecture (www.cmcons.com)
Tfs Overview And Architecture (www.cmcons.com)Tfs Overview And Architecture (www.cmcons.com)
Tfs Overview And Architecture (www.cmcons.com)
 
автоматическое построение оригинал макетов учебников как отч
автоматическое построение оригинал макетов учебников как отчавтоматическое построение оригинал макетов учебников как отч
автоматическое построение оригинал макетов учебников как отч
 
IBM ECM & Discovery Strategy
IBM ECM & Discovery StrategyIBM ECM & Discovery Strategy
IBM ECM & Discovery Strategy
 
Вебинар №4 «IT-инфраструктура безбумажной работы»
Вебинар №4 «IT-инфраструктура безбумажной работы»Вебинар №4 «IT-инфраструктура безбумажной работы»
Вебинар №4 «IT-инфраструктура безбумажной работы»
 
20160323 Пример бизнес-приложения контроля качества в розничной торговле
20160323 Пример бизнес-приложения контроля качества в розничной торговле20160323 Пример бизнес-приложения контроля качества в розничной торговле
20160323 Пример бизнес-приложения контроля качества в розничной торговле
 
OpenSource_2011
OpenSource_2011OpenSource_2011
OpenSource_2011
 
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
 
Строим собственную BI в MS Excel на данных из Яндекс.Метрики и Google Analitycs
Строим собственную BI в MS Excel на данных из Яндекс.Метрики и Google AnalitycsСтроим собственную BI в MS Excel на данных из Яндекс.Метрики и Google Analitycs
Строим собственную BI в MS Excel на данных из Яндекс.Метрики и Google Analitycs
 
метод организации репозитория исходного кода
метод организации репозитория исходного кодаметод организации репозитория исходного кода
метод организации репозитория исходного кода
 
Anatol Filin Pragmatic Documentation 0 5
Anatol Filin Pragmatic Documentation 0 5Anatol Filin Pragmatic Documentation 0 5
Anatol Filin Pragmatic Documentation 0 5
 
Управление бизнес-процессами и электронным документооборотом с помощью решени...
Управление бизнес-процессами и электронным документооборотом с помощью решени...Управление бизнес-процессами и электронным документооборотом с помощью решени...
Управление бизнес-процессами и электронным документооборотом с помощью решени...
 
Больше чем анализ
Больше чем анализБольше чем анализ
Больше чем анализ
 
Быстрое масштабирование систем
Быстрое масштабирование системБыстрое масштабирование систем
Быстрое масштабирование систем
 
Anatol filin pragmatic documentation 1_r
Anatol filin  pragmatic documentation 1_rAnatol filin  pragmatic documentation 1_r
Anatol filin pragmatic documentation 1_r
 
Trening modul2-webinar11
Trening modul2-webinar11Trening modul2-webinar11
Trening modul2-webinar11
 
Новые возможности LanDocs
Новые возможности LanDocsНовые возможности LanDocs
Новые возможности LanDocs
 
DB REPLICATION
DB REPLICATIONDB REPLICATION
DB REPLICATION
 
14-02-26 DBA 101_ как найти и устранить причины замедления работы БД
14-02-26 DBA 101_ как найти и устранить причины замедления работы БД14-02-26 DBA 101_ как найти и устранить причины замедления работы БД
14-02-26 DBA 101_ как найти и устранить причины замедления работы БД
 

More from Sergey Yakimchuk

StoredIQ - управление контентом
StoredIQ - управление контентомStoredIQ - управление контентом
StoredIQ - управление контентом
Sergey Yakimchuk
 
#несекреты документооборота с CMoD
#несекреты документооборота с CMoD#несекреты документооборота с CMoD
#несекреты документооборота с CMoD
Sergey Yakimchuk
 
StoreIQ - helicopter view на весь контент предприятия
StoreIQ - helicopter view на весь контент предприятияStoreIQ - helicopter view на весь контент предприятия
StoreIQ - helicopter view на весь контент предприятияSergey Yakimchuk
 
IBM ECM для финансовых документов
IBM ECM для финансовых документовIBM ECM для финансовых документов
IBM ECM для финансовых документовSergey Yakimchuk
 
ENTERPRISE REPORTS MANAGEMENT - IBM CMOD
ENTERPRISE REPORTS MANAGEMENT - IBM CMODENTERPRISE REPORTS MANAGEMENT - IBM CMOD
ENTERPRISE REPORTS MANAGEMENT - IBM CMOD
Sergey Yakimchuk
 
за 5 минут про IBM ECM
за 5 минут про IBM ECMза 5 минут про IBM ECM
за 5 минут про IBM ECM
Sergey Yakimchuk
 

More from Sergey Yakimchuk (6)

StoredIQ - управление контентом
StoredIQ - управление контентомStoredIQ - управление контентом
StoredIQ - управление контентом
 
#несекреты документооборота с CMoD
#несекреты документооборота с CMoD#несекреты документооборота с CMoD
#несекреты документооборота с CMoD
 
StoreIQ - helicopter view на весь контент предприятия
StoreIQ - helicopter view на весь контент предприятияStoreIQ - helicopter view на весь контент предприятия
StoreIQ - helicopter view на весь контент предприятия
 
IBM ECM для финансовых документов
IBM ECM для финансовых документовIBM ECM для финансовых документов
IBM ECM для финансовых документов
 
ENTERPRISE REPORTS MANAGEMENT - IBM CMOD
ENTERPRISE REPORTS MANAGEMENT - IBM CMODENTERPRISE REPORTS MANAGEMENT - IBM CMOD
ENTERPRISE REPORTS MANAGEMENT - IBM CMOD
 
за 5 минут про IBM ECM
за 5 минут про IBM ECMза 5 минут про IBM ECM
за 5 минут про IBM ECM
 

IBM ECM :: Сравнение документов "на просвет"

  • 2. Задача Сравнить документы клиента, полученные от сотрудников frontсистем. Проверить не вносил ли клиент некорректных правок в подписанную версию документов.
  • 3. Предлагаемый процесс •  Сотрудник бек-офиса вносит в систему Word файл с мета информацией в удобной для него иерархии архива. •  Система выносит найденную в файле мета информацию в поля документа (Стороны/ Проценты/Объемы и т. д.) – либо по идентификатору договора подгружает из основной информационной системы. •  Сотрудник фронт-офиса получает бумажные документы и вносит их в систему через модуль сканирования Datacap. Модуль сканирования: –  Определяет тип документа (на основании заголовков или форм) –  Распознает необходимые ключевые поля из документа и полный текст (Стороны/ Проценты/Объемы/Сроки/Номера/Фамилии и пр.) –  Сохраняет изображение и текст документа вместе с ключевой информацией в электронный архив в удобную для фронт-офиса иерархии. •  Сотрудник бэк-офиса через браузер запускает процедуры автоматической проверки: –  Проверка комплектности (сравнение по типам документов и количеству страниц) –  Проверка на просвет (проверка на основании изображения) –  Проверка по тексту (сравнение оригинала с тестом от OCR системы) –  Проверяет отчеты по результатам сравнения и подтверждает или отклоняет пакет –  Сверка подписи клиента с эталонной.
  • 5. Решение Документ переформатируется из Word в изображение (Tiff,PDF,PNG)
  • 6. Решение Сотрудник ФронтОфиса сканирует ответ клиента в формате Tiff Datacap производит распознавание документа и сохраняет в CM Изображение и распознанный текст.
  • 7. Решение Модуль производит сравнение документов по двум механизмам: - сравнение «на просвет», в результате сравнения формируется изображение с цветовым выделением разницы - сравнение «по тексту», в результате сравнения формируется отчет с различиями обнаруженными по тексту.
  • 8. Интерфейсы :: Архив Документы на проверку Иерарихия документов Свойства документа Preview документа
  • 9. Интерфейсы :: Архив Проверенные документы (100% совпадения) Средство просмотра документов, встроенное в ЭА
  • 10. Интерфейсы :: Архив На исправлении (есть расхождения) Разница выделена красным цветом
  • 11. Интерфейсы Красным цветом выводятся внесенные в документ изменения, совпадающие символы снижают яркость.
  • 12. Интерфейсы :: Сканирование Datacap имеет интерфейсы сканирования и верификации, но в данном случае может работать в «скрытом» режиме.
  • 13. Интерфейсы :: Архив •  Сравнение по тексту происходит блоками, при большом различии (более установленного % слов или символов в слове) система фиксирует различия всего блока.
  • 14. Datacap для захвата данных •  Используя решение для сканирования от IBM – Datacap можно выделить из документа: –  Номера и даты (самого документа и ссылок, таких как доверенности, паспорта, свидетельства и пр. –  Участники/Стороны и их реквизиты (ОГРН и пр.) –  Ключевые показатели (суммы, проценты, уровни и пр.) –  Специальные объекты (подписи, печати) •  Этот подход позволит выявить 99% «опасных» изменений в документах, полученных от клиентов.
  • 15. Сверка подписи Решение от бизнес-партнёра компании IBM – Parascript SignatureXpert является апробированным промышленным решением по программной сверке подписей с эталонной и уже интегрирован с IBM Datacap и IBM Content Navigator.
  • 17. Рекомендации для повышения качества процесса •  Повысить качество скан-образов •  Зафиксировать приемлемые модели (цветность/размер пикселя) •  Включать в документ мета-информацию •  Включить в шаблоны («якоря») визуальные или текстовые •  Настроить шаблоны для распознавания требуемых полей Это позволит существенно повысить качество сравнения и снизить количество ложных срабатываний.
  • 18. Нужно отметить... •  Качество сканирования с фронта скорее всего будет весьма низким. •  Предлагаем внести изменения в шаблоны word-документов: –  Реперы в колонтитулы для лучшего позиционирования документа (например черные квадраты) –  Ввести четкую нумерацию пунктов договора, для повышения качества текстового анализа. –  Переформатировать шаблоны договоров в фиксированных частях.
  • 19. Нужно отметить... •  Сейчас преобразование Word –> Tiff производится на серверной стороне сторонними средствами. •  IBM может предложить своё решение для этого – Rendition Engine.
  • 20. Положение на рынке (лидерство в отрасли) Gartner Magic Quadrant for Enterprise Content Management 2013 Источник http://www.gartner.com/technology/reprints.do?id=1-1KPJFOM&ct=130923&st=sb
  • 21. Преимущества IBM ECM •  Уникальный международный опыт в крупнейших мировых финансовых структурах •  Производительность и устойчивость к нагрузкам, подтверждённые как множеством проектов, так и независимыми испытаниями. •  Разумные требования к оборудованию •  Минимальные сроки внедрения •  Единая платформа для решения множества задач по работе с документами •  IBM – единственный вендор, способный поставить все компоненты решения, минимизируя тем самым совокупную стоимость и интеграционные риски
  • 22. Приложение для работы с документами IBM ECM – Content Navigator Новости и примеры использования решений от команды IBM ECM Сергей Якимчук yakimchuk@ru.ibm.com +7 985 762 45 68