PADICAT, el archivo web de la Biblioteca de Catalunya. Eugènia Serra

609 views

Published on

Presentada en la Jornada Internacional sobre Archivos Web y Depósito Legal Electrónico, en la Biblioteca Nacional de España (BNE), el día 9 de julio de 2013.

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
609
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
4
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

PADICAT, el archivo web de la Biblioteca de Catalunya. Eugènia Serra

  1. 1. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 PADICAT, el archivo web de Cataluña ... y algunos apuntes sobre Depósito legal electrónico Eugènia Serra Directora Biblioteca de Catalunya eserra@bnc.cat
  2. 2. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 Información general Fundada en 1907 Más de 3.000.000 documentos Crecimiento anual de 129.000 documentos 229 puestos de lectura en 3.060 m2 Presupuesto 2013: 6,9 M€ 160 plantilla 65 km de depósito + 1 depósito cooperativo (GEPA)
  3. 3. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 Uso 2.596.180 consultas a documentos digitalizados 4.618.579 consultas al catálogo 171 sesiones de formación/visitas 3.086 personas 252.000 reproducciones (papel+digital) 142.000 documentos consultados presencialmente
  4. 4. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 Contrato-Programa 2013-2016 La Biblioteca, centro cultural de referencia del patrimonio escrito, musical, sonoro, audiovisual, gráfico y editorial. Identificación y compleción del patrimonio bibliográfico y documental de Catalunya. El patrimonio bibliográfico y documental de Catalunya accesible, al día y preservado Internacionalitzación Participación de la sociedad y agentes del patrimonio (crowdsourcing) Consolidación de un sistema de preservación digital nacional Estrategia Planes estratégicos 2004-2008, 2009-2012 y Contrato- Programa 2013-2016 → especial atención al contexto digital
  5. 5. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 A par;r de 2004 → tres líneas de actuación: Digitalización, a través de iniciativas en colaboración (a nivel catalán e internacional, de carácter selectivo y masivo). Creación del archivo web de Catalunya Impulso a los servicios virtuales A par;r del 2009 → preservación digital más allá del archivo web Lineas de actuación
  6. 6. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 Digitalización • ARCA: Archivo de Revistas Catalanas Antiguas http://www.bnc.cat/digital/arca • MDC: Memoria Digital de Catalunya http://mdc.cbuc.cat • Google Libros http://books.google.es/ • Europeana http://europeana.eu ̄ Preservación digital ̄ - PADICAT: Patrimonio Digital de Catalunya ̄ http://www.padicat.cat ̄ - COFRE: COnservamos para el Futuro Recursos Electrónicos + Depósito Legal electrónico online Acciones
  7. 7. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 Del patrimonio bibliográfico al patrimonio digital
  8. 8. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 “Son objeto de depósito legal los escritos, estampas, imágenes y composiciones musicales, producidas en territorio nacional, en ejemplares múltiples, con fines de difusión, hechos por procedimientos mecánicos o químicos. Comprenderá por tanto: Libros, sea cualquiera la índole de su contenido y la forma de impresión y estén o no destinados a la venta. Folletos, o sea escritos cuyo número de páginas sea mayor de cuatro y no exceda de 50, y con características semejantes a las señaladas en el párrafo anterior, incluyéndose en este concepto las separatas de artículos de revista que tengan la acotada extensión. Hojas impresascon fines de difusión y que no constituyan propaganda esencialmente comercial. Publicaciones periódicas(revistas y diarios).Partituras musicales. Grabados: láminas sueltas, láminas de calendario, estampas, cromos, "chrismas", anuncios artísticos. Mapas y planos. Carteles anunciadores de espectáculos, fiestas y demás actos públicos, tanto religiosos como profanos; anunciadores de artículos comerciales, siempre que lleven grabados artísticos; bandos y edictos. Postales ilustradas. Naipes. “Slides"destinadas a difusión y venta. Impresiones o grabaciones sonoras realizadas por cualquier procedimiento o sistema empleado en la actualidad o en el futuro. Producciones cinematográficas, tanto de tipo argumental como documental, y "filmlets”. Fuente: Orden de 30 de octubre de 1971, por la que se aprueba el Reglamento del Instituto Bibliográfico Hispánico La producción bibliográfica en 1971
  9. 9. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 La producción digital Internet Domain Survey, July, 2012
  10. 10. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 Libros, Folletos, Hojas impresas, Publicaciones periódicas, Grabados, Mapas y planos, Carteles, Postales, “Slides“, Impresiones o grabaciones sonoras, Producciones cinematográficas... Pàgines web: Libros digitales, Diarios en línea, Sedes web, Weblogs, Webcams, Votacions en línea, Chats, Webs corporativas, Comercio en línea, Webs personales, Artículos y ponenciass digitales, Documentación de software... La producción “bibliográfica” el 2013 +
  11. 11. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 2020? ¿Cuándo desaparecerán los periódicos de papel? Seguramente, en veinte años. Bill Gates dice que en cinco años. Steve Ballmer (Microsoft), El País 22 octubre 2006
  12. 12. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 El patrimonio digital consiste en recursos únicos que son fruto del saber o la expresión de los seres humanos. Comprende recursos de carácter cultural, educativo, científico o administrativo e información técnica, jurídica, médica y de otras clases, que se generan directamente en formato digital o se convierten a éste a partir de material analógico ya existente. Los productos “de origen digital” no existen en otro formato que el electrónico. Los objetos digitales pueden ser textos, bases de datos, imágenes fijas o en movimiento, grabaciones sonoras, material gráfico, programas informáticos o páginas Web, entre otros muchos formatos posibles dentro de un vasto repertorio de diversidad creciente. El patrimonio digital Unesco 2003
  13. 13. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 El patrimonio nacido digital es extenso y creciente
  14. 14. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 1999 2001 2003 2009 El patrimonio nacido digital es efímero
  15. 15. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 Experiencias en preservació digital pre 2005 Alemania, 1997 Australia, 1996 Áustria, 1999 Canadá, 1994 Dinamarca, 1998 EUA, 2000 Estonia, 2004 Finlandia, 1997 Francia, 2000 Grecia, 2003 Islandia, 1997 Japón, 2002 Lituania, 2002 Noruega, 2001 Nueva Zelanda, 1999 Holanda, 1995 Quebec, 2000 Reino Unido, 2004 República Checa, 2001 Suecia, 1996
  16. 16. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 Experiencias en preservación digital
  17. 17. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 PADICAT Patrimonio Digital de Catalunya acceso permanente a la Web catalana
  18. 18. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 PADICAT exhaustivo Webs dominio .CAT Webs en servidores de Catalunya Webs en lengua catalana bajo otros dominios (.ES, .ORG, .NET, .COM, .INF, ...) Webs de autoría catalana Otras webs relacionadas temáticamente con Catalunya que no corresponden a las categorías anteriores
  19. 19. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 PADICAT selectivo Selección de 2.000 instituciones representativas de la sociedad catalana Ayuntamientos y administración local Partidos políticos y sindicatos Colegios y asociaciones profesionales Sector cultural Empresas 460 convenios firmados desde 2006/09
  20. 20. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 PADICAT focalizado: elecciones 2006 • Partidos (CIU, PSC, ERC, ICV, PP + Partit Blau, Lliga antitaurina, Escons insubmisos…) • Candidatos (Montilla, Carod, Saura, Sirera…) • Fundaciones (Jordi Pujol, Rafael Campalans…) • Parlamento + Administración (eleccions2006.cat…) • Blocs personales (ciberpolítica de Joselito…) • Medios de comunicación (e-noticies.com, vilaweb…) 652 capturas de 83 webs diferentes
  21. 21. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 PADICAT focalizado: elecciones 2006
  22. 22. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 PADICAT focalizado: elecciones 2007
  23. 23. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 PADICAT Resumen de Datos Inicio: junio 2005 Hardware: 7 servidores ProLiant DL360 G4p, Robot Scalar i2000, 19 TB Software: Heritrix, NutchWax, Wera, Wayback / ARCindexer Presupuesto: 1,6M € (2006-12) Equipo de trabajo: 4 (bibliotecarios/informáticos) + dedicación puntual de técnicos de BC i CESCA
  24. 24. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 PADICAT En línea, abierto www.padicat.cat Búsqueda por texto libre, URL, categorías 58.787 webs diferentes 262.937 versiones 372 millones de ficheros 13 TB de espacio 10 monográficos
  25. 25. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 PADICAT divulgación
  26. 26. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 PADICAT en red
  27. 27. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 “ El patrimonio bibliográfico, sonoro, visual, audiovisual y digital de las culturas de España es uno de los más ricos y representativos del mundo y debe ser preservado en beneficio de las generaciones presentes y futuras.” 3. “El depósito legal comprenderá los siguientes tipos de publicaciones y recursos, o la combinación de varios de ellos formando una unidad: ñ) sitios web fijables o registrables cuyo contenido pueda variar en el tiempo y sea susceptible de ser copiado en un momento dado”. 8.2. “Se habilita a los centros de conservación, tanto de titularidad estatal como autonómica, a detectar y reproducir documentos electrónicos que hayan sido objeto de comunicación pública y los sitios web libremente accesibles a través de redes de comunicaciones que puedan resultar de interés para los fines del depósito legal, respetando en todo caso la legislación sobre protección de datos y propiedad intelectual. La nueva Ley del DL, julio de 2011
  28. 28. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 Operativo desde 2011 Obje;vo → preservar - documentos digitalizados (másters) - copia periódica de PADICAT - documentos de DL nacidos digitales Repositorio para otras instituciones catalanas Módulo de depósito de DL Módulo de consulta en la BC (documentos con derechos vigentes)
  29. 29. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 Esquema COFRE
  30. 30. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 COFRE Módulo de carga DL online
  31. 31. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 COFRE Módulo de carga DL online
  32. 32. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 COFRE Módulo de carga DL online: flujo de la aplicación 2013 → pruebas de carga de documentos desde la BC 2014 → piloto con editores
  33. 33. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 Reflexiones finales Sistemas de preservación nacional → coopera;vos (protocolo) y distribuidos → adaptables y evolu;vos Web y depósito legal nacido digital → no podemos ser exhaus;vos (aunque lo intentemos) → cambiante y creciente → imprevisible: nuevos ;pos de documentos (unidades documentales) y formatos
  34. 34. Jornada internacional sobre archivos web y depósito legal electrónico Madrid, Biblioteca Nacional de España, 9 de julio de 2013 Biblioteca de Catalunya Eugènia Serra eserra@bnc.cat ¡Gracias!

×