Proyectos de digitalización y preservación de la Biblioteca Complutense

2,227 views

Published on

Presentada en la "Jornada de difusión de la Biblioteca Digital Mundial de la UNESCO" el 5 de junio de 2012 en la Biblioteca Nacional de España (BNE).

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
2,227
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
33
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Proyectos de digitalización y preservación de la Biblioteca Complutense

  1. 1. Proyectos de digitalización y preservación de la Biblioteca  Complutense Biblioteca Nacional 5 de junio de 2011 Manuela Palafox Parejo José Antonio Magán Wals Biblioteca de la Universidad Complutense de Madrid
  2. 2. ¿Qué pretenden las Colecciones  Digitales  Complutenses?• Facilitar el acceso al conocimiento• Reducir barreras a la publicación y la difusión del conocimiento garantizando los derechos de propiedad de los autores, docentes e investigadores así como de la sociedad en su conjunto.• Incrementar la difusión, uso e impacto de la investigación producida en la institución y de nuestro patrimonio.• Compromiso de preservar este capital a largo plazo.
  3. 3. La Colección Digital Complutense Fondo antiguo • 120.000 libros • 50.000 grabados Más de 20.000 tesis E-Prints Complutense : • 30.000 artículos • libros y capítulos • ponencias de congresos 80 cabeceras de prensa Portal revistas UCM •300.000 periódicos digitalizados •30.000 artículos de revistas • 82 títulos de revistas
  4. 4. La apuesta por la colaboración para la digitalización y difusión de la producción científica y el patrimonio de la UCM• Apuesta por la difusión en acceso abierto, tanto mediante el archivo en la  denominada “vía verde” como en la “vía dorada” y la publicación por parte  de la biblioteca en colaboración con otros servicios• Colaboración con instituciones y organismos oficiales para la difusión y  digitalización: Ministerio, Comunidad de Madrid, Madroño, Europeana,  Hathi Trust, Internet Text Archive...• Colaboración con instituciones privadas para la difusión y digitalización:  Google, Santander Universidades, Fundación de Ciencias de la Salud,  Editorial Extramuros, • Colaboración con editoriales y distribuidores comerciales para la  difusión: Springer, Thomson Reuters, Proquest, E‐Libro.
  5. 5. Colecciones Digitales Complutenses
  6. 6. La digitalización del patrimonio  bibliográfico
  7. 7. La digitalización y difusión del patrimonio bibliográfico: Acuerdo con  Google • En septiembre de 2006, la  Biblioteca de la UCM se suma al  proyecto Google Libros. • Digitalización de obras de  dominio público que están en  acceso abierto en Internet.  •Se puede buscar por los  metadatos descriptivos de las  obras y por el texto completo. • La Biblioteca de la UCM y Google  disponen de una copia digital. 
  8. 8. ¿Qué puede representar para el público? • Se está creando una gran biblioteca  universal de objetos digitales selectos • Parte de los fondos de algunas de las  principales bibliotecas del mundo llegarán  a los ordenadores del público en general  • Los libros serán recuperados mediante la  tecnología y el interfaz de Google • Es un motor dinamizador de proyectos  similares • Se avanza en la preservación y difusión de  los contenidos culturales • Herramienta esencial para la  democratización del conocimiento
  9. 9. ¿Qué otras grandes bibliotecas de investigación  han realizado acuerdos de colaboración con  Google?• Bibliotecas Públicas de Nueva York, Lyon • Universidades de Harvard, Princeton, Cornell, Columbia,  Oxford, California, Stanford, Michigan, Keio…• Bibliotecas Nacionales de Austria, Holanda, Italia, Baviera,  Cataluña... • Se estima que se digitalizarán más de 15 millones de libros • Ya se han digitalizado más de 11 millones de libros
  10. 10. Fechas clave del proyecto• Septiembre de 2006:  – Firma del acuerdo de colaboración • Octubre‐Diciembre 2007:  – Organización de los Equipos de selección .  – Cursos de formación a los Equipos de selección:• 2008: – Comienzan los trabajos de selección de libros en los depósitos de las  bibliotecas (enero) – Comienzan los primeros envíos de libros al Centro de Digitalización  (marzo) – Desde el otoño, miles de obras se pueden consultar libremente en Internet• Junio 2011: – 120.000 libros complutenses digitalizados
  11. 11. Datos totales Libros  Libros comprobados No digitalizados  % digitalizados 120.000 150.000 23.000 17%Manuela Palafox. Proyectos de digitalización de la Biblioteca Complutense.  Ministerio de Cultura, 10/11/2011
  12. 12. Accesos a los libros Complutenses Período de 7 días Accesos Título Autor Año Centro12.490 Diccionario etimológico de la lengua castellana (ensayo) Pedro Felipe Monlau 1856 FLL-DER12.008 Diccionario geográfico-estadístico de España y sus posesiones de ultramar Pascual Madoz 1830 VET8.637 La Ilíada Homero 1788 FOA8.275 Vida y viajes de Cristóbal Colón Washington Irving 1852 GHI7.520 Enciclopedia moderna Francisco de Paula Mellado 1851 DER7.027 Los tres reinos de la naturaleza o museo pintoresco de historia naturaleza: Georges-Luis Leclerc Buffon 1857- MED-FOA Botánica. Mineralogía 18586.468 Diccionario de la lengua castellana Real Academia Española 1852 FLL4.450 Mitología universal Juan Bautista Carrasco 1864 DER4.205 Linajes nobles de España Juan José Vilar Psayla 1867 FLL4.179 Diccionario de agricultura práctica y economía rural Agustín Esteban Collantes, Agustín Alfaro 1855 MED4.035 Anatomie descriptive Jean Cruveilhier 1837 MED3.984 Anatomia do corpo humano Bernardo Santucci 1739 FOA3.671 Diccionario universal latino-español Manuel de Valbuena 1808 FOA
  13. 13. La preservación a largo plazo y la  difusión del patrimonio bibliográfico:  Hathi Trust• En 2010 la UCM se convierte en el primer  socio no norteamericano de Hathi Trust• Es una asociación de instituciones de  investigación y bibliotecas que trabajan  para asegurar la difusión y conservación  futura del patrimonio cultural• Su fin es coordinar las estrategias de  almacenamiento compartido, lo que reduce  los costos a las bibliotecas asociadas• Proporciona un marco técnico para la  creación de herramientas y servicios 
  14. 14. Algunas instituciones miembros de Hathi Trust• Library of Congress• New York Public Library• Universidades de California, Cornell, Columbia,  Chicago, Harvard, MIT, Michigan, Princeton,  Stanford, Yale...
  15. 15. Beneficios de participar en HathiTrust• Servicios de preservación: – HathiTrust tiene un compromiso de conformidad con  los actuales estándares y procesos de revisión para la  preservación digital. Es conforme con: • Trustworthy Repositories Audit & Certification (TRAC): Criteria and Checklist (March 2007) • Open Archival Information System (OAIS) Reference  Model (2002) • Preservation Metadata Implementation Strategies (PREMIS) (2005)
  16. 16. Beneficios de participar en HathiTrust• Servicios de acceso: – Búsqueda bibliográfica y texto completo.  – Sistema de autenticación Shibboleth. Los socios pueden descargarse los libros que están en el dominio público. – Creación de colecciones: se puede hacer búsquedas de  texto completo de los libros guardados en una de  nuestras colecciones.  – Además, se pueden compartir con otros y hacerlas públicas. 
  17. 17. Beneficios de participar en HathiTrust• Disponibilidad de datos bibliográficos – HathiTrust ofrece una variedad de métodos  para  obtener los registros del repositorio en cada catálogo:  acceso a los datos bibliográficos a través del API de  HathiTrust y otros mecanismos, así como propuestas  adicionales o servicios previstos (como el acceso a  usuarios con discapacidad)• Gobernanza – La asociación a HathiTrust ofrece a las instituciones  miembros la capacidad de compartir el desarrollo de  nuevos  servicios,  a través de su participación en los  órganos de gobierno.  Reunión en octubre de 2011
  18. 18. Características de HathiTrust• El repositorio está localizado en la Universidad de Michigan, en Ann  Arbor y hay un mirror completo en la Universidad de Indianápolis, en  Indiana.• Utiliza tecnologías de código abierto (PERL, MySQL, Linux…). • Configuración de un espacio donde todos los socios podrán tener  acceso para hacer desarrollos y mejoras.• Los metadatos bibliográficos se gestionan en un Sistema de Gestión de  Bibliotecas (Aleph). • Los metadatos de preservación técnicos y estructurales están incluidos  en un fichero METS para cada objeto digital. Los metadatos de  preservación (PREMIS) se actualizan cuando las acciones se producen  en un objeto.• Formatos: TIFF, JPG2000…• URL permanente (servicio handle)
  19. 19. Políticas de acceso en HathiTrust• El acceso se establece por detección geográfica,  dirección IP, y autenticación del usuario en  conjunción con el estatus de copyright de cada  ejemplar almacenado en una base de datos de  derechos de autor.• El estatus de copyright se determina inicialmente  por la información contenida en el registro  bibliográfico. Los ejemplares publicados en USA  antes de 1923 o después de 1870 fuera de Estados  Unidos se consideran que están en el dominio  público.
  20. 20. Política de preservación en HathiTrust• Preservación del contenido. HathiTrust tiene el compromiso de preservar el contenido  intelectual y en muchos casos la apariencia exacta de los  materiales digitalizados y depositados en HathiTrust, lo  que incluye: – Representaciones digitales (imágenes) del contenido tal  como aparece en su forma original.  – Representaciones textuales del contenido a través de  las tecnologías OCR (¡cuando es posible!)
  21. 21. Política de preservación en HathiTrust• Estrategias de preservación: – Uso de formatos de preservación estándares (ficheros  TIFF ITU G4 almacenados en 600dpi, ficheros JPEG o  JPEG2000 almacenados en varias resoluciones de  200dpi a 400dpi,  texto Unicode, y ficheros XML).  – Validación rigurosa en la ingesta. – Diseño del repositorio según los estándares OAIS y  TRAC. – Comprobaciones regulares para verificar la integridad  del contenido almacenado.
  22. 22. HathiTrust Digital Library Source: Jeremy York (data as of May 1, 2011)
  23. 23. La colaboración en el ámbito euroepeo:  Europeana Libraries
  24. 24. Proyecto Europeana Libraries• Participan 19 bibliotecas de investigación de 14  países europeos: Universidad de Baviera, Oxford,  Gante, Lund, Uppsala, Trinity College, etc. La BUC  es la única biblioteca española que participa en el  proyecto.• El objetivo es incorporar a Europeana 5 millones de objectos digitales: manuscritos, películas y  textos pertenecientes al patrimonio bibliográfico y  científico de las bibliotecas participantes. • Crear una infraestructura para extender al resto de las bibliotecas de investigación de LIBER.
  25. 25. Europeana Libraries: Aportación de la  Universidad Complutense– Libros antiguos hasta 1870: Metadatos de más de 120,000 libros digitalizados por Google.– Grabados de la Colección Digital Dioscórides :  50,000.– Tesis de la UCM: 6,000.– Artículos de las revistas científicas de la UCM: 31,000– Dibujos antiguos de la Facultad de Bellas Artes (entre1752 y 1914):  287.– Fotos de la Guerra Civil española provenientes del Archivo Histórico del Partido Comunista de España: 3,200.– Archivo personal de Rubén Darío: 5,000 documentos.– Manuscritos, incunables y material cartográfico diverso
  26. 26. ¿Cómo se accede a los libros complutenses digitalizados? • Google Libros • Interfaz  de  búsqueda  de  Google  para  la  búsqueda  exclusiva  de  libros complutenses.  • Catálogo  de  la  Biblioteca  de  la  Universidad Complutense. • Portal  de  Colecciones  Digitales  Complutenses • HathiTrust Digital Library • Europeana • Biblioteca  Virtual  Miguel  de  Cervantes
  27. 27. Ejemplo de acceso de un libro antiguo: El  catálogo de la Biblioteca Complutense
  28. 28. Ejemplo de acceso: En Biblioteca Virtual  Miguel de Cervantes
  29. 29. Ejemplo de preservación y acceso: En  Internet Text Archive
  30. 30. Ejemplo de acceso: Europeana
  31. 31. Ejemplo de difusión y digitalización orientado al público general en Google
  32. 32. WebGL Bookcase
  33. 33. Ejemplo de difusión y digitalización  orientado al público académico
  34. 34. Recapitulando, ¿Qué pretenden las  Colecciones  Digitales Complutenses?• Facilitar el acceso al conocimiento• Reducir barreras a la publicación y la difusión del conocimiento garantizando los derechos de propiedad de los autores, docentes e investigadores así como de la sociedad en su conjunto.• Incrementar la difusión, uso e impacto de la investigación producida en la institución y de nuestro patrimonio.• Compromiso de preservar este capital a largo plazo.
  35. 35. Gracias por su atenciónManuela Palafox ParejoJosé Antonio Magán WalsBiblioteca de la Universidad Complutense de Madrid.

×