Your SlideShare is downloading. ×
White Paper: Digitalización y Captura Inteligente de Documentos
White Paper: Digitalización y Captura Inteligente de Documentos
White Paper: Digitalización y Captura Inteligente de Documentos
White Paper: Digitalización y Captura Inteligente de Documentos
White Paper: Digitalización y Captura Inteligente de Documentos
White Paper: Digitalización y Captura Inteligente de Documentos
White Paper: Digitalización y Captura Inteligente de Documentos
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

White Paper: Digitalización y Captura Inteligente de Documentos

107

Published on

La digitalización de documentos en papel cada vez cobra más importancia en las empresas. El interés en convertir a documentos electrónicos muchos de los documentos de la organización, está en el …

La digitalización de documentos en papel cada vez cobra más importancia en las empresas. El interés en convertir a documentos electrónicos muchos de los documentos de la organización, está en el ahorro de costes derivados del almacenamiento, el afán de preservación de información clave y la necesidad de mantener alguna documentación accesible desde diversos puntos geográficos.

Pero, ¿es realmente la digitalización la solución para las empresas? En el siguiente whitepaper, que podéis descargar de forma totalmente gratuita, descubriréis que la digitalización en sí misma no es una solución suficiente. Necesita del respaldo de un sistema de Gestión Documental. Aún teniendo este respaldo, digitalizar documentos de forma tradicional implica mucho trabajo manual para los usuarios. Es ahí en donde aparece el proceso de captura inteligente de documentos.

Descubre cómo la captura inteligente te puede ayudar.

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
107
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. understanding documentsDigitalización y Captura Inteligentede DocumentosMayo 2013
  • 2. understanding documentsPoder mantener accesibles los documentosdesde cualquier punto del planeta y utilizar lainformación contenida en ellos se ha vueltocrítico para muchas empresas. Para ello, enprimer lugar, se requiere tener la documentaciónen formatos electrónicos. La digitalización dedocumentos es el proceso por el cual, a travésde escáneres y otro hardware, se conviertendocumentos en papel a formatos digitales.Pero la digitalización por sí sola no es degran utilidad para las empresas. Tener mileso millones de documentos en un sistema deficheros o referenciados en una base de datosno es sostenible, sobre todo porque recuperarun determinado documento se vuelve unproceso demasiado complejo. Es allí en dóndeaparecen los sistemas de gestión documentalque mantienen el control y la accesibilidad delos documentos.La captura es el proceso por el cual losdocumentos digitalizados son enviados alsistema de gestión documental o ECM.Por otro lado, aún enviando los documentosdigitalizados al sistema de gestión documentalqueda demasiado trabajo por hacer para losusuarios. Trabajo como nombrar documentosen el sistema y añadir metadatos que permitandescribir su contenido y faciliten las posterioresbúsquedas, o como guardar los documentosen una ubicación determinada según su tipoo iniciar flujos de trabajo. Este trabajo puedeser facilitado por la captura inteligente, queautomatiza algunas tareas como la extracción dedatos y el reconocimiento de tipos documentaleso clasificación de documentos.En la ilustración 1 puede verse el procesocompleto de captura inteligente de documentos.A continuación, vamos a describir esteproceso paso a paso, una vez digitalizados losdocumentos:Ilustración 1: Proceso de Captura Inteligente.1. Obtención de documentos en formatoelectrónico.Este proceso se lleva a través de la conexión delsistema con escáneres. En el caso de Athento,es posible escanear un documento desdela plataforma. También es posible capturargrandes cantidades de documentos. Esto sepuede hacer mediante dos mecanismos:
  • 3. understanding documents• Carga masiva de documentos desde laplataforma: Es posible subir varios docu-mentos a la plataforma seleccionándolosdesde un disco local (Ver la ilustración 2).Estos documentos pueden ser procesadosde forma programada o de manera inmedia-ta.Pueden ser escaneados en lotes de documentosque el sistema separará en documentosindividuales de forma automática. Otros sistemaspermiten realizar esta operación mediante laintroducción de códigos de barras por cadadocumento escaneado dentro del lote. Athentopuede leer también códigos de barras, pero dadoque este proceso es costoso para los usuarios(que tienen que generar los códigos de barras,imprimirlos y pegarlos a cada documento),Athento ofrece la posibilidad de llevar a cabo estadivisión de documentos analizando la estructurade los mismos e identificando su tipología, deforma que los usuarios no tengan que intervenir.Ilustración 2: Captura de varios documentos al mismotiempo.• Hot Folder: Es posible conectar Athento auna carpeta para que la monitorice. Es decir,para que cada vez que un documento seaañadido por el escáner Athento lo procese.Esto permite que ninguna persona tengaque ocuparse del proceso de captura.Con la captura inteligente de Athento, no esnecesario que cada documento se escaneepor separado para producir archivos únicos pordocumento.2. Mejoras de la imagenMediante las mejoras de la imagen se buscaque los documentos escaneados tengan lascaracterísticas de calidad necesarias para sualmacenamiento y procesado.Cuando escaneamos o digitalizamos documen-tos, nos encontramos con defectos de calidadcomo por ejemplo que los documentos no seencuentran en una posición correcta (no estánrectos), tienen bordes negros o blancos, etc. Al-gunas de las posibilidades que brinda Athentopara corregir estos defectos de calidad de la di-gitalización son (Ver ilustración 3):
  • 4. understanding documents3. Indexación del documentosEn la mayoría de sistemas ECM sólo el títuloy la descripción del documento son indexados.Esto quiere decir que el título y su descripciónse introducen en una base de datos para quemediante consultas a la misma, el documentopueda ser encontrado. Normalmente, laindexación del título es “full-text”, pero no asíla de la descripción. Esto significa que paraencontrar un documento por su descripción,tenemos que buscar por la descripción completadel documento tal cual se introdujo.En cambio, en el caso de la indexación full-textdel título, podemos encontrar el documentobuscando por palabras incluidas dentro deél. Athento va más allá. Gracias a su OCR,Athento indexa cada palabra del contenido deldocumento y lo guarda en una base de datospara que podamos buscar un documento por laspalabras incluidas en su contenido.• Binarización: Aplica mejoras de contraste ala imagen• Umbral dinámico: Convierte una imagen ablanco y negro.• Bordes: Recortes de bordes blancos onegros no deseados. Puede realizarse deforma manual o automática.• Inversión: Nos permite girar la posiciónde documentos como si se tratase de unaimagen espejo.• Suavización: Se refiere a la reducción deruido en la imagen, por ejemplo el ruido “sal ypimienta”, que son aquellos puntitos negrosque aparecen en ocasiones tras escanear odigitalizar una imagen.• Rotación: Se trata de re-orientar eldocumento, aplicando grados de rotaciónal mismo. La re-orientación del documentopuede hacerse de forma automática omanual.Ilustración 3: Opciones de mejora de la imagen4. Reconocimiento del documentoAthento puede ser entrenado para reconocertipos documentales. Este reconocimiento serealiza mediante la aplicación conjunta dediversas tecnologías, por ejemplo:
  • 5. understanding documents• Redes neuronales: Al sistema se leenseña una muestra de documentos dedeterminada tipología. Mediante las redesneuronales, Athento compara al estructurade los documentos capturados con aquellospertenecientes a las muestras y arroja unporcentaje de similitud.• Histograma: Al sistema se le enseña unamuestra de un documento de cierta tipologíapara que analice su estructura de color.En adelante, cualquier documento que secapture se compara con dicha estructura decolor o histograma y se arroja un porcentajede similitud.• Expresiones regulares: Athento puedebuscar la aparición de ciertos términos,palabras, frases o números asociados conuna tipología.Por ejemplo, para el sistema la aparición deun CIF y/o la palabra “Factura” es un indiciopara considerar que el tipo documental de esedocumento es una factura.Este paso es muy importante, ya que permiteque el sistema pueda guardar por sí mismolos documentos en una determinada ubicacióno iniciar un flujo de trabajo de revisión oaprobación.5. Extracción de datosIndicando la ubicación de los datos que sequieren extraer en un documento de muestra,Athento puede obtener datos del contenido dedicho documento. Por ejemplo, en la ilustración4 se muestran los datos extraídos de unademanda legal.Estos datos pueden ser validados por un usuariopara garantizar que la extracción ha sido 100%correcta.Por otro lado, la forma de indicar la ubicaciónde estos campos se hace de forma totalmenteuser friendly, diseñando de manera visual unaplantilla en el sistema.Ilustración 4: Datos extraídos de un documento de demanda
  • 6. understanding documentsEsta plantilla puede ser diseñada por cualquierpersona, sin ningún conocimiento técnicorequerido. Otros mecanismos pueden serutilizados también para la extracción de datos dedocumentos, en el caso de tipos documentalesdesestructurados.Una vez obtenidos los datos, estos sonenviados como metadatos al sistema de gestióndocumental o plataforma ECM que se prefiera.Al igual que en el caso de la separación dedocumentos, otros productos usan el método deextraer los datos previamente y codificarlos encódigosdebarrasquesepeganalosdocumentospara que el sistema pueda leerlos y hacer conellos lo que se requiera. Pero de nuevo, hayque decir que este proceso es costoso para losusuarios. Aunque algunos ERPs son capaces degenerar códigos de barras, para los documentosque provienen de fuera de la organización esteproceso de generación de código de barras ypegado sobre los documentos debe hacerse deforma manual.Procesos como la digitalización de documentosindividuales por separado, la clasificación dedocumentos, o la extracción de datos soncostosos en términos de tiempo para losempleados de las empresas que tienen querealizarlos.La captura inteligente de documentos solucionaeste problema automatizando estos procesos.Athento y su captura inteligente de documentospuede ser integrada con cualquier sistema degestión documental o platorma ECM que soporteel estándar CMIS.
  • 7. understanding documentsaskourteam@athento.comTwitter: @yerbabuenasoftwww.athento.com

×