El proceso de digitalización de los documentos

1,623 views

Published on

Módulo 5 del curso "Planificación y gestión de bibliotecas digitales"

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,623
On SlideShare
0
From Embeds
0
Number of Embeds
628
Actions
Shares
0
Downloads
23
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

El proceso de digitalización de los documentos

  1. 1. MÓDULO 2013-2014 www.dianarodriguezcursos.com 5 1
  2. 2. DIANA RODRÍGUEZ Capacitaciones y Servicios de información digital Planificación y gestión de Bibliotecas Digitales Módulo 5 (Resumen) 2013-2014 www.dianarodriguezcursos.com 2
  3. 3. EL PROCESO DE DIGITALIZACIÓN 2013-2014 www.dianarodriguezcursos.com 3
  4. 4. Cuestiones previas ¿Por qué? ¿Para qué? ¿Qué material? ¿Para quién? ¿Con qué? ¿Cómo será? 2013-2014 • Preservar los documentos impresos • Hacer los documentos más accesibles • Reutilizar los documentos • Evaluar impresos candidatos • Cantidad de páginas • Audiencia real y potencial • Recursos necesarios • Presupuestos • Proyecto único y a término • Proyecto continuo www.dianarodriguezcursos.com 4
  5. 5. ¿Qué digitalizar? Particular Evaluar si… Hay demanda Usuarios Vale la pena Fácil de escanear Es pertinente Con los objetivos de la biblioteca Está libre de derechos de autor 2013-2014 www.dianarodriguezcursos.com 5
  6. 6. No vale la pena digitalizar 2013-2014 • Obsoletos o desactualizados • Con impresión de calidad pobre • Difíciles de digitalizar • No pertinente con los objetivos de la colección • Con protección de derechos de autor • Material ”sensible” • Ya está digitalizado y se puede compartir o enlazar www.dianarodriguezcursos.com 6
  7. 7. Requerimientos Equipamiento Planos Escáneres Profesionales Depende de la cantidad de hojas Se necesitan Alimentador de hojas Computadoras Dispositivos almacenamiento Adecuada robustez Discos Memorias varias Redes 2013-2014 www.dianarodriguezcursos.com 7
  8. 8. Escaneo Reconocimiento Óptico de Caracteres Software OCR Edición de textos y Adaptado al idioma Procesador de textos Conversión de archivos Corrección ortográfica Manejo y edición de imágenes Visor de PDF 2013-2014 www.dianarodriguezcursos.com 8
  9. 9. Recursos Humanos Un gestor 2013-2014 • Coordinar el equipo y el flujo de trabajo Bibliotecarios y documentalistas • Escanear • OCR • Corrección de pruebas y diseño • Asignación de metadatos Personal administrativo • Manejo del material impreso • obtener los documentos • limpiarlos y ordenarlos • cortar las encuadernaciones y reencuadernarlos • devolverlos a su sitio original. www.dianarodriguezcursos.com 9
  10. 10. Costos y presupuestos Equipo y software Costos • Escáner, software, computadores, mobiliario de oficina Adquisición de documentos • Registro, categorización, costos de correo y transporte, tiempo del personal Documentos • Cantidad de páginas (MUY IMPORTANTE) 2013-2014 www.dianarodriguezcursos.com 10
  11. 11. Escaneo Costos • Tiempo del personal OCR, Corrección de pruebas y Diseño • Tiempo del personal, insumos de oficina Asignación de metadatos • Tiempo del personal (depende del número de documentos, la dificultad del tema y los salarios de los especialistas) 2013-2014 www.dianarodriguezcursos.com 11
  12. 12. Costos Capacitación del personal Administración y gastos generales • Administración, gastos generales, salarios del personal y de especialistas Contingencias. Imprevistos 2013-2014 www.dianarodriguezcursos.com 12
  13. 13. Cantidad de páginas Determina Costo Final Costos de Equipamiento • Tipo y Cantidad 2013-2014 Costos de Personal • Tiempo y Salario www.dianarodriguezcursos.com 13
  14. 14. PÁGINAS TAREA JORNADA TIEMPO APROX. EQUIPAM. BÁSICO NIVEL DE RRHH 1000 Escaneo ½ jornada Un mes Escáner plano, modelo económico Novatos OCR, Corrección ½ jornada de pruebas y Diseño Seis meses Una computadora adecuada Una grabadora DVD u otro dispositivo para almacenar copias de resguardo Fuente Tabla: Imark-FAO) 2013-2014 www.dianarodriguezcursos.com 14
  15. 15. PÁGINAS TAREA JORNADA TIEMPO APROX. EQUIPAM. BÁSICO NIVEL DE RRHH 5000 Escaneo ½ jornada Un mes Escáner con alimentador de hojas Novatos Intermedios OCR, Corrección ½ jornada de pruebas y Diseño Entre 8 meses y 33 meses (depende del nivel de RRHH) Varias computadoras adecuadas Varias grabadoras DVD u otros dispositivos para almacenar copias de resguardo 2013-2014 www.dianarodriguezcursos.com 15
  16. 16. PÁGINAS TAREA JORNADA TIEMPO APROX. EQUIPAM. BÁSICO NIVEL DE RRHH 10.000 Escaneo Jornada completa Dos a tres meses Escáner dúplex profesional OCR, Corrección ½ jornada de pruebas y Diseño 170 meses Intermedios Experimenta dos Varias computadoras adecuadas Varias grabadoras DVD u otros dispositivos para almacenar copias de resguardo 2013-2014 www.dianarodriguezcursos.com 16
  17. 17. Etapas de la digitalización Selección de documentos 2013-2014 Registro de documentos Escaneado www.dianarodriguezcursos.com OCR y Corrección de pruebas y Diseño Producción de la versión final 17
  18. 18. Selección 2013-2014 Volver a diapositivas 5 y 6 www.dianarodriguezcursos.com 18
  19. 19. Autor, título, edición etc Registro Datos y metadatos del documento Responsable de cada etapa Fecha de cada etapa Datos del proceso Lugar actual del documento Versiones etc 2013-2014 www.dianarodriguezcursos.com 19
  20. 20. Guardar las versiones separadas de cada archivo en diferentes subdirectorios Mantener las versiones anteriores de un archivo hasta que se haya terminado de digitalizar el documento TIPS Hacer copias de seguridad de todos los documentos en cada fase 2013-2014 Guardar las copias de seguridad en computadoras o dispositivos diferentes. www.dianarodriguezcursos.com 20
  21. 21. Escaneo Limpiar los documentos 2013-2014 Acciones Previas Verificar que todas las páginas estén presentes y en el orden correcto Si el documento está deteriorado, cambiar por una copia si existe www.dianarodriguezcursos.com 21
  22. 22. Si el documento contiene texto y gráfico 2013-2014 Escanear dos veces • una vez para escanear el texto en blanco y negro • y la otra para escanear las fotos de color Guardar texto y gráfico como archivos separados www.dianarodriguezcursos.com Se reincorporarán al documento en la etapa final 22
  23. 23. Guardar en este formato de archivo Profundidad de color Resolución Para acceso Para ver en pantalla Para impresión Para preservación y utilización Dibujo de líneas en blanco y negro Blanco y negro o escala de grises (16 grises) 72 ppp 300 ppp Si las líneas son muy finas, 600 ppp. GIF o TIFF GIF Gráfico en colores con áreas del mismo color 8 bit (256 72 ppp colores) ó 24 bit (16 millones de colores) 300 ppp Si las líneas son muy finas, 600 ppp GIF o TIFF GIF Fotografías en blanco y negro 8 bit gris (256 grises) 72 ppp 300 ppp Para fotos de alta calidad, 600 ppp. GIF o TIFF JPG o GIF Fotografías a color 24 bit (16 millones de colores) 72 ppp 300 ppp Para fotos de alta calidad, 600 ppp JPG o TIFF JPG Imágenes Escanear y guardar con esta configuración 2013-2014 www.dianarodriguezcursos.com 23
  24. 24. TABLAS PROCEDIMIENTO COMENTARIO CASO 1 Trate la tabla como texto. Escanee y haga OCR en ella. Después corrija y verifique el diseño. Esta tarea requiere tiempo y es susceptible a errores, por lo que se necesita una corrección de pruebas cuidadosa. CASO 2 Escanee las tablas y trátelas como fotos en lugar de texto. Este procedimiento es rápido, fácil y libre de errores, pero toma mucho espacio en el disco. A veces es imposible mostrar las tablas grandes en el monitor de la computadora y la reducción de su tamaño puede ocasionar que sea difícil leer las figuras. CASO 3 2013-2014 Vuelva a escribir las tablas en lugar de escanear e intentar hacerlas OCR. www.dianarodriguezcursos.com Esto lleva tiempo y puede producir errores. 24
  25. 25. = Reconocimiento Óptico de Caracteres Unicode Posible problema: IDIOMA OCR convierte una imagen escaneada en un archivo de texto Para que puede ser leído y editada por un procesador de textos Diccionario adecuado en su procesador de texto Reescribir el texto Escanear como imagen De texto para producir PDF Formato adecuado Después de escanear, guarde HTML para producir HTML Nombre que ya tenía 2013-2014 www.dianarodriguezcursos.com 25
  26. 26. Texto Tablas Diseño Gráficos Editar en procesador de texto Imágenes Corrección de pruebas Verificar y corregir Documento destinado a ser PDF Guardar como PDF Editar en el procesador de textos Documento destinado a ser HTML Guardar como texto sin formato Abrir con editor web Guardar con HTML 2013-2014 www.dianarodriguezcursos.com 26
  27. 27. Versión final 2013-2014 Agregar Metadatos Tabla de contenidos Si son HTML y PDF Hipervínculos Marcadores de navegación www.dianarodriguezcursos.com 27
  28. 28. Lee Realiza la actividad Y ahora Comparte Consulta 2013-2014 www.dianarodriguezcursos.com 28
  29. 29. DIANA RODRÍGUEZ Capacitaciones y Servicios de información digital Hasta el próximo módulo…. Diana Rodríguez www.dianarodriguezcursos.com 2013-2014 www.dianarodriguezcursos.com 29

×