Digitalización: conceptos, formatos de digitalización, equipos de captura y soportes, de Javier Mas - Presentation Transcript
DIGITALIZACIÓN AVANZADA Y CREACIÓN DE BIBLIOTECAS DIGITALES Javier Mas García DIGITALIZACIÓN: CONCEPTOS, CRITERIOS PARA LA DETERMINACIÓN DE FORMATOS DE DIGITALIZACIÓN, USO DE FICHEROS DE IMAGEN, EQUIPOS DE CAPTURA Y SOPORTES
IMAGEN DIGITAL
MAPA DE BITS
FORMATOS
RESOLUCIONES
PROFUNDIDAD DE COLOR
CONSIDERACIONES Y RECOMENDACIONES PARA LA DIGITALIZACIÓN
EQUIPOS
Digitalización de libros y documentos encuadernados
Digitalización de láminas y fotografías
Digitalización de planos
Digitalización de microformas
ALMACENAMIENTO
COSTES DE UN PROYECTO DE DIGITALIZACIÓN
Sumario
Las imágenes digitales se guardan normalmente en forma de mapa de bits o mosaico de píxeles. Cada píxel guarda la información de color de la parte de imagen que ocupa
Principal inconveniente: la ampliación. Cuando un archivo se amplia mucho, se distorsiona la imagen mostrándose el mosaico con "los píxeles" y una degradación en los colores llegando al efecto pixelación .
Detalle Visualización correcta, imagen al 100% Imagen pixelada Mapa de bits
ELEMENTOS BÁSICOS QUE DEFINEN LA IMAGEN DIGITAL
Formatos de ficheros de imagen y niveles de compresión
Resolución
Profundidad de color
Consideración sobre los formatos de mapa de bit y la resolución
Calidad máxima : Mayor resolución / menor compresión / mayor profundidad de bits = mayor peso de fichero
VENTAJAS
Mayor calidad de imagen
Posibilidad de mayor ampliación
DESVENTAJAS
Mayor peso de ficheros y ocupación en los soportes de grabación
Mayor tiempo de apertura de la imagen
Necesidad de una mayor capacidad de los equipos y software de lectura
Mayores costes de producción
Objetivo: buscar un equilibrio entre la calidad y el peso de la imagen
Mapa de bits
FORMATOS Y COMPRESIÓN DE FICHEROS.
Formatos de Imagen Formatos de imagen más comunes FORMATOS SIN COMPRIMIR . - Ficheros mas estables, - Sin pérdida de calidad - Peso de imagen alto TIFF , T agged I mage F ile F ormat RAW Imagen “ en crudo ” PSD P hoto s hop (Ps) BMP B it M a P o Bit Mapped Picture PDF P ortable D ocument F ormat FORMATOS COMPRIMIDOS . - Ficheros mas inestables y más facilmente corrompibles. - Con pérdida mayor o menor de calidad. Algunos formatos permiten la compresión sin pérdida. - Peso de imagen bajo, aptos para publicación o intercambio. JPEG The J oint P hotographers E xperts G roup GIF G raphics I nterchange F ormat PNG P ortable N etwork G raphics PDF P ortable D ocument F ormat TIFF LZW JPEG 2000 Djvu.
Formatos de Imagen Peso de ficheros sin comprimir: 39,1 Mb JPEG, comprimido 5%,calidad máxima, 13,4 Mb JPEG, comprimido 10%, calidad alta, 5 Mb JPEG, comprimido 50%, calidad media 1,4 Mb GIFF , 8 bits, 256 colores, 7,6 Mb PNG , sin pérdida, no entrelazado: 22,5 PNG , sin pérdida, entrelazado: 27,5 PDF, generado desde TIFF, compresión ZIP, sin perdida. 23,1 Mb PDF , generado desde JPEG, calidad max., 13,4 Mb PDF , generado desde JPEG, calidad media, 1,4 Mb Imagen: 20 x 27,5 cms, color RGB, 24 bits FORMATOS Y COMPRESIÓN DE FICHEROS. FORMATOS SIN COMPRIMIR . - Ficheros mas estables, - Sin pérdida de calidad - Peso de imagen alto TIFF , T agged I mage F ile F ormat RAW Imagen “ en crudo ” PSD P hoto s hop (Ps) BMP B it M a P o Bit Mapped Picture PDF P ortable D ocument F ormat FORMATOS COMPRIMIDOS . - Ficheros mas inestables y más facilmente corrompibles. - Con pérdida mayor o menor de calidad. Algunos formatos permiten la compresión sin pérdida. - Peso de imagen bajo, aptos para publicación o intercambio. JPEG The J oint P hotographers E xperts G roup GIF G raphics I nterchange F ormat PNG P ortable N etwork G raphics PDF P ortable D ocument F ormat TIFF LZW JPEG 2000 Djvu.
CONCEPTOS
Resolución de Imagen - Resolución , es la cantidad de píxeles o puntos que componen la imagen. La resolución se utiliza también para clasificar casi todos los dispositivos relacionados con las imágenes digitales ya sean escáneres, pantallas de ordenador, cámaras digitales , etc. - La calidad de resolución de una imagen expresará el número de píxeles que forman la imagen de mapa de bits - Expresión de la resolución total de una imagen : l a resolución o tamaño de una imagen digital se expresa multiplicando su anchura por la altura en pantalla. Por ejemplo la imagen de 1200 x 1200 píxeles = 1.440.000 píxeles, (expresado en Mp megapixel es igual a 1,4 Mp). Conviene tener en cuenta que 1 Megapíxels = 1.000.000 de píxeles. - La resolución de impresión : define la cantidad de píxeles que contiene una imagen y la dimensión de estos píxeles expresando de qué forma se reparten en el espacio. La resolución expresada en (ppp) o (dpi), son los píxeles por unidad de longitud, es decir, los píxeles por pulgada. (La pulgada mide 2,54 cm). Así pues, la resolución de impresión es la relación entre las dimensiones digitales (los píxeles) y las físicas; las que tendría una vez impresa sobre papel.
EJEMPLO DE CALCULO TAMAÑO DE IMPRESIÓN
Resolución de Imagen 4285 pixels 27,21 cms 5996 pixels 38,07 cms Resolución de imagen: 400 ppp Tamaño de imágenes: 5996 x 4285 (en pixels) Resolución de impresión 5996/400 = 14,99 pulgadas x 2.54 cms = 38,07 4285/400 = 10,71 pulgadas x 2.54 cms = 27,21 Tamaño de impresión: 38,07 x 27,21 cms Tamaño de impresión= Número de píxeles/ Resolución (ppp -píxeles por pulgada) Ejemplo:
PIXELACIÓN
Resolución de Imagen La ampliación excesiva de la imagen para su visualización, producía en la fotografía tradicional un efecto granulado debido a la falta de nitidez. En la fotografía digital el efecto análogo es de una imagen pixelada . Si reproducimos una imagen con baja resolución quiere decir que el píxel ocupa más espacio y deforma la imagen con el efecto de pixelación; se crean píxeles de gran tamaño aportando poca definición a la imagen. En cambio si la resolución en ppp, es más alta, existe más detalle y más definición, Imagen correcta Imagen pixelada
CONSEJOS SOBRE RESOLUCIONES DE IMAGEN ADECUADAS
Resolución de Imagen * 72 ppp para visualizar documentos en tamaño fijo de pantalla * Entre 150 y 200 ppp para consulta en pantalla . Permite cierta ampliación y la impresión en impresora; pero a veces se llega hasta los 300 ppp, para dar óptimos resultados imprimiendo con calidad fotográfica a tamaño real (a escala 1:1). Indicado para copias de uso y publicación * La resolución fotográfica para obtener un fotolito para imprenta se obtiene igualmente una resolución de imagen de 300 dpi y será este el con una resolución de 300 dpi, tamaño suficiente para generar el proceso de fotomecánica e imprenta. * 400 ppp en imágenes para ficheros de preservación. Permiten una cierta ampliación con calidad fotográfica sobre el tamaño original (p.e para ampliar un detalle de una imagen o para facilitar procesos de restauración digital)
COMO GUARDA EL COLOR EL PÍXEL: EL BIT Y EL COLOR
Profundidad de color
- La profundidad del BIT, profundidad del píxel o profundidad del color, estima los valores que puede llegar a tener cada píxel que forma la imagen. A más cantidad de bits por píxel, más colores, mayor resolución de imagen y mayor tamaño del archivo
- La profundidad del BIT se puede medir en:
1 bit/pixel BIT, blanco o negro 8 bits de color y 256 matices de color, monocromo, escala de grises 24 bits de color o colores RGB, imágenes en color. 32 bits CMYK, para impresión de las imágenes
COMO GUARDA EL COLOR EL PÍXEL: PESO DE LOS FICHEROS
Profundidad de color Imagen color RGB, 400 ppp 24 bits ; 73,6 Mb Imagen en Binario 1 bit; 3.0 Mb Imagen en escala de grises 8bits; 24,6 Mb Imagen en color CMYK, 32 bits; 98,1 Mb Imágenes sin compresión Ficheros comprimidos TIFF LZW : 700 Kb TIFF CCIT-G4: 320 Kb 1 bit JPEG calidad máxima :13,4 Mb JPEG calidad media : 4,5 Mb 8bits JPEG calidad máxima: 31 Mb JPEG calidad media: 6,96 Mb 8bits
1. Establecer los fines y objetivos que motivan el proyecto
preservación del original
impresión (artes gráficas/imprenta o impresora)
edición en soporte óptico (CD, DVD)
integración en un repositorio accesible desde Internet
OCR
copias accesibles desde el disco duro de nuestro ordenador o servidor dentro de un sistema de gestión de archivo.
2. La copia master deberá permitir obtener el resto de copias derivadas . Realizar la c aptura de imágenes con calidad suficiente para obterner copias que cubras las distintas necesidades posibles.
3. Analizar el entorno tecnológico de consulta o edición; y la capacidad de almacenamiento y transferencia de datos de los soportes físicos . Los soportes de grabación de las imágenes de preservación (muy pesadas), el entorno de consulta (internet, intranet, DVD, CD), la capacidad de proceso de las imagenes del software de consulta, la velocidad de descarga y de apertura de las imágenes en el entorno de consulta condicionarán los formatos y la resolución que se deba exigir en el proceso de digitalización, teniendo en cuenta la relación: calidad de imagen/peso de ficheros
Recomendaciones generales para la digitalización en la creación de colecciones digitales
Recomendaciones generales para la digitalización en la creación de colecciones digitales 4. Escoger formatos normalizados 5. Seguir las Indicaciones y recomendaciones de los grupos de trabajo institucionales nacionales e internacionales afines a nuestro entorno 6. Seguir los estándares dominantes en el mercado 7. Equilibrio entre las prescripciones técnicas, y el entorno tecnológico y presupuesto económico disponible.
Recomendaciones generales para la digitalización en la creación de colecciones digitales Formatos y resoluciones Cuadro - resumen
Atendiendo al tipo de material a digitalizar existen diferentes tipos de escáner con prestaciones específicas adecuadas para cada uno.
I . Escáneres de libros y documentación histórica
Luz fría.
Captura cenital o aérea.
Posibilidad de trabajar con o sin cristal superpuesto al documento
Base basculante (Bookcradle). Apto para diferentes grosores de libros o documentos.
Aptos para escanear libros de distintos tamaños. (A4 x2, A3x2, A2x2, A1x2).
Captura lineal o matricial.
Operan de forma manual consiguiendo una productividad alta (variable según marcas y modelos).
Costes generalmente bastante elevados (entre 20.000 y 90.000 €) y variables en función del tamaño de los escáneres y de las marcas.
Equipos de captura
I . Escáneres de libros y documentación histórica, A1 y A0
II . Digitalización de microformas. Microfilm / microfichas / tarjetas de apertura
La digitalización desde microfilm/microficha supone las siguientes
Ventajas:
Economía de costes, siempre y cuando se pueda trabajar en modo automático. Si implica procesos manuales (por ejemplo recorte manual de imágenes), los costes se equiparan a la digitalización directa
No se manipula nuevamente el original para su digitalización.
Permite obtener un copia digital, cuando no se dispone del material original.
Desventajas
- Reproducción de todos los defectos recogidos en el fotograma, manchas, roturas, pliegues, tintas traspasadas, sin posibilidad de corregirlos o atenuarlos.
- La microfilmación no dispone de la imediatez de visualización y control de calidad por lo que, la digitalización desde este soporte añadirá los posibles defectos derivados de este proceso intermedio, tales como:
- Reflejos
- Diferencias de iluminación y contraste dentro de la misma imágen
- Defectos de la copia utilizada, mancha, rayas, etc.
- La ausencia o repetición de imágenes se mantendrá en la copia digital.
- Letras empastadas o de trazo debil y difuso (que pueden provocar la ilegibildad del documentos).
Equipos
II . Digitalización de microformas. Ejemplo de errores arrastrados por falta de calidad de la microfilmación
Equipos Problemas - Manchas producidas por sobreexposición de luz de focos - Diferencias excesivas de contraste entre claro y oscuro que impiden hallar una exposición media adecuada para la digitalización - Exceso de luz y falta de definición en zonas claras - Exceso de oscuridad con zonas borrosas y empastadas - En documentos muy grandes, ampliación desenfocada o pixelada - Hojas delanteras rotas mezclándose imagen de varias páginas
Almacenamiento. Soportes 1. UNIDADES DE CINTA. Para ficheros de preservación y de protección de datos SDLT LTO 1 LTO 3 2. DISCO DUROS Externos, conexión USB. Para ficheros de preservación y copias de uso. 3. DVD . Solo recomendable para determinadas publicaciones, para ficheros de datos o almacenamiento de copias de imagen para uso, de poco peso, en general. En desuso para almacenamiento masivo, por su limitada capacidad de almacenamiento, inestabilidad y fragilidad. NO RECOMENDADO , en ningún caso, para copias de preservación
Costes de un proyecto de digitalización
A. LOS COSTES SON EXTREMADAMENTE VARIABLES
B. FACTORES A TENER EN CUENTA :
1. CARACTERÍSTICAS FÍSICAS DEL MATERIAL A TRATAR
Soporte físico (papel, pergamino, fotografía), tamaño del documento, encuadernación,
estado de conservación
2. RESOLUCIÓN DE ESCANEADO Y EMPLEO DE GRISES o COLOR
3. NIVEL DE INDEXACIÓN DE LA DOCUMENTACIÓN
Número de imágenes por unidad documental
4. SEGUIMIENTOS DE PROTOCOLOS DE CALIDAD Y PROCESOS DE EXTRACCIÓN
DE METADATOS TÉCNICOS DE LA DIGITALIZACIÓN
5. ESPECIFICACIONES ADICIONALES DE POSTPRODUCCIÓN.
- Formatos de imagen requeridos a entregar. Imágenes originales y copias derivadas, para preservación,
uso y publicación.
- Necesidad o no de aplicar OCR, y formatos de salida de texto
- Retoque fotográfico
- Preparación imágenes para artes gráficas
- Soportes de grabación
7. FORMACIÓN Y ESPECIALIZACIÓN DEL PERSONAL TÉCNICO
Digitalización y creación de Bibliotecas Digitales FIN GRACIAS POR LA ATENCIÓN Javier Mas García Coordinador Técnico
0 comments
Post a comment