Archivos de Paginas Web - BL

1,586 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,586
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Archivos de Paginas Web - BL

  1. 1. British Library Aspectos generales Aquiles Alencar-Brayner (aquiles.alencarbrayner@bl.uk)
  2. 2. The British Library – The World’s Knowledge <ul><li>Varias exposiciones temáticas a cada año, además de una exposicion permanente de tesoros. </li></ul>3 áreas de deposito y servicios en Londres y un centro en Yorkshire con untotal de 2,000 funcionários. El más amplio servicio de suministro de documentos en el mundo. Envio de documentos digitalizados en del plazo de 2 horas desde su solicitud. Centro de Business y Propriedad Intelectual (IP), fomentando la iniciativa empresarial, y posibilitando la proteción del capital creativo. Servicios en linea que permiten el acceso remoto al catalogo de la BL con una variedad de programas educacionales virtuales y ediciones digitalizadas de algunos de los tesoros de la biblioteca Biblioteca nacional del Reino Unido ofrece servicios para investigacion cientifica, educacion, business, bibliotecas y publico en general. El acervo incluye más de 2m de grabaciones sonoras, 5m relatórios, tesis y ponencias, contiene la más amplia colección de patentes en el mundo. Ingreso annual (2009/10): US$ 160.6m operational US$ 20m capital Fondos extra obtenidos en 08/09: US$ 54.4m
  3. 3. BL: Objetivo y Propósitos <ul><ul><li>PROPOSITOS </li></ul></ul><ul><li>Mantener una posici ón central en la fomentación a la investigación científica . </li></ul><ul><li>Apoyo al los investigadores nacionales e internacionales. </li></ul><ul><li>Facilitar el acceso por medios digital y anal ógico a la informaci ón para todos que la necesiten en cualquier parte del mundo . </li></ul><ul><li>Compartir experiencias y servicios con otras instituciones de informaci ón. </li></ul><ul><li>Garantizar la manutenci ón y acceso a la información para las futuras generaciones . </li></ul><ul><ul><li>OBJETIVO </li></ul></ul><ul><ul><li>Promover el conocimiento, preservaci ón y valoraci ón de las diversas culturas del mundo </li></ul></ul>
  4. 4. British Library – Archivo de Páginas Web
  5. 5. Historico <ul><li>UK Web Archive: proyecto iniciado en 2003 </li></ul><ul><li>Misión: “to put in place systems that enable The British Library to become the point of first resort for anyone who wants to access a comprehensive archive of material from the UK Web domain. We will ensure that this archive will be accessible forever.” </li></ul>
  6. 6. La importancia de la preservación de nuestro patrimonio digital <ul><li>Vivimos en una “Era de Tinieblas Digital” (Terry Kuny, IFLA, 1997) o en una “época del olvido” donde la mayoria de las informaciones que circulan en el ámbito digital desaparecen sin que sean archivadas. </li></ul><ul><ul><li>La mayoria de las páginas Web tiene una vida aproximada de 2 meses </li></ul></ul><ul><ul><li>80% del contenido de las páginas Web son alterados a cada año. </li></ul></ul><ul><ul><li>Estímase que hay cerca de 6 millones de páginas Web registradas en Reino Unido – gran parte de las páginas Web que existe hoy no va a estar disponible en línea en los próximos 10 años. </li></ul></ul>
  7. 7. La importancia del archivo de páginas Web <ul><ul><li>Acceso a información en su contexto historico </li></ul></ul><ul><ul><ul><li>Identificar cambios en discursos personales y/o sistemas institucionales, partidos políticos y gobiernos. </li></ul></ul></ul><ul><ul><li>Motivos legales </li></ul></ul><ul><ul><ul><li>Acceder a un contenido de página Web que haya sido modificado por determinaciones judiciales </li></ul></ul></ul><ul><ul><li>Investigacion historico-social </li></ul></ul><ul><ul><ul><li>Seguir la evolución de los contenidos Web a partir de su función de representación social e interacción entre grupos específicos de usuarios (ej. los “nativos digitales”, “generación X”, “generación Google,” etc.) </li></ul></ul></ul>
  8. 8. Estadísticas de páginas Web en Reino Unido <ul><ul><li>Mas de 4 millones de paginas en dominio “.uk” </li></ul></ul><ul><ul><li>Mas de 2 millones de paginas en dominios “.com” , “.net” que representan 20% de las paginas Web en Reino Unido. </li></ul></ul><ul><ul><li>Tasa de crecimiento annual de 17% </li></ul></ul><ul><ul><li>30% de los registros de paginas Web no son renovados </li></ul></ul><ul><ul><li>Tamaño promedio de paginas Web en 2009: 40MB </li></ul></ul><ul><ul><li>Segun esto dato considerase que el tamaño las paginas Web en el dominio UK sea 200TB </li></ul></ul><ul><ul><li>En los ultimos seis años, el tamaño promedio de la página Web ha quintuplicado, y la inclusion de objetos externos en la paginas (videos, audio, imagenes, etc) se ha duplicado </li></ul></ul>
  9. 9. Aspectos Legales <ul><li>Ley de Depósito Legal de Bibliotecas (2003) – archivo de material digital en seis bibliotecas. Gran Bretaña es uno de los 30 países que han aprobado leyes sobre el archivo digital de material en línea. Sin embargo, la reglamentación necesaria está aún por ser implementada. La expectativa es que, cuando lo haga, el UK Web Archive se ampliará considerablemente. </li></ul><ul><li>Acceso para deposito legal esta restringido a usuarios de la biblioteca </li></ul><ul><li>Permiso de Archivo – el archivo de cada nueva pagina Web solo puede ser efectuado mediante el permiso legal del page owner o de quien detenga los derechos de propiedad intelectual de la pagina. </li></ul>
  10. 10. Limitaciones y obstaculos <ul><li>Incompatibilidad del software de coleta (harvesting) en reconocer y almacenar contenidos externos (streaming videos, scripting languages, RSS feeds, etc.) </li></ul><ul><li>Páginas están cada vez mas personalizadas (ej. cookies) – ¿ cómo almacenar su contenido? </li></ul><ul><li>Rápido cambio de tecnologías e interface </li></ul>Dec. 2003 Dec. 2006
  11. 11. Selección <ul><li>Páginas Web pueden ser archivadas por: </li></ul><ul><li>Cantidad (número límite de páginas) </li></ul><ul><li>Espacio de almacenamiento </li></ul><ul><li>Período </li></ul><ul><li>Periodicidad de coleta (anual, semestral, trimestral, etc) </li></ul><ul><li>Areas de interés </li></ul><ul><li>Formatos (ej. inclusion de páginas con video y audio) </li></ul><ul><li>Controle de calidad </li></ul>
  12. 12. Preservación y acceso <ul><li>Rápido cambio de software y tecnologías: ¿ como acceder a los contenidos en el contexto que fueron creados? Emulación de tecnologia obsoleta </li></ul><ul><li>¿C ómo comprimir archivos sin pierda de calidad? ej. Tiff -> Jpeg </li></ul><ul><li>Costos de almacenamiento </li></ul><ul><li>Restricciones de acceso – páginas con contraseña, parte de una página por motivos legales o instrucción de su autor, etc. </li></ul>
  13. 13. Creación de consorcios <ul><li>The UK Web Archiving Consortium (UKWAC) </li></ul><ul><ul><li>The British Library </li></ul></ul><ul><ul><li>The National Archives </li></ul></ul><ul><ul><li>National Library of Wales </li></ul></ul><ul><ul><li>National Library of Scotland </li></ul></ul><ul><ul><li>JISC (Joint Information Systems Committee) </li></ul></ul><ul><ul><li>The Wellcome Trust </li></ul></ul>
  14. 14. Acceso en línea <ul><li>http://www.webarchive.org.uk/ukwa/ </li></ul>
  15. 15. Apoyo y fomento para nuevas inciativas: Herramienta para Curadores Web (WCT) http://webcurator.sourceforge.net/
  16. 16. Otras iniciativas… http://www.archive.org/ http://lcweb2.loc.gov/diglib/lcwa/html/lcwa-home.html http://pandora.nla.gov.au/
  17. 17. Preguntas… [email_address]

×