Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Linked Data: un caso de uso en la BNE. Ana Manchado Mangas, Daniel Vila Suero.

2,795 views

Published on

Presentada en "FESABID, XII Jornada Española de Documentación". 26 de mayo de 2011. Málaga

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Linked Data: un caso de uso en la BNE. Ana Manchado Mangas, Daniel Vila Suero.

  1. 1. Un caso de uso en la BNEAna ManchadoDaniel Vila Suero 1
  2. 2. Índice • Origen del proyecto • Proyecto de colaboración con la UPM • Análisis y selección de las ontologías y vocabularios • Identificar alcance y fuente de datos • Desarrollo del proyecto • Tareas en curso • Posibles proyectos futuros 2XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  3. 3. Origen del proyecto • Proyecto de cooperación de la BNE y las Bibliotecas Nacionales y Regionales de las Comunidades Autónomas • Objetivo: Creación de un Sistema Nacional de Autoridades (Fichero de Autoridades compartido – “tipo VIAF”) • Principal dificultad: Multilingüismo en los nombres de persona y entidad. 3XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  4. 4. Origen del proyecto • Primeras aproximaciones: Desarrollo dentro de nuestro SIGB Desarrollo por parte de una empresa privada Proyecto Piloto Elevado presupuesto 4XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  5. 5. Proyecto de colaboración con la UPM • En Octubre de 2010 se firma un Convenio de colaboración con la UPM. • Primeras acciones: Formación / Consultoría de la persona designada por la UPM en el ámbito, organización y necesidades de la información bibliográfica. • Objetivos: Conocimiento y dominio de nuestros estándares y modelos de datos 5XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  6. 6. Análisis y selección de las ontologías y vocabularios • Estudio de otras iniciativas y proyectos de Library Linked Data otros proyectos no estaban basados en estándares de la IFLA • Selección de FRBR, FRAD e ISBD por tratarse de las ontologías proporcionadas por el trabajo realizado en la IFLA por ser más exhaustivas y más precisas se encuentran inscritas en el Open Metadata Registry 6XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  7. 7. Análisis y selección de las ontologías y vocabularios 7XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  8. 8. Identificar alcance y fuente de datos • FASE 1: Autoridades Cervantes Bibliográficos asociados • FASE 2: Autoridades asociadas Ficheros en formato ISO2709 enviados por ftp. 8XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  9. 9. Identificar alcance y fuente de datos FASE 1: Seleccionamos en nuestro catálogo de autoridades todos los registros que comienzan por Cervantes Saavedra, Miguel de (1547-1616) 550 registros de autoridad De esta forma hemos seleccionado, además del propio registro de autor, registros de Autor-título Autor-título-lengua Autor-título-subencabezamiento Autor-subencabezamiento 9XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  10. 10. Identificar alcance y fuente de datos Ejemplos: Cervantes Saavedra, Miguel de (1547-1616). Novelas ejemplares Cervantes Saavedra, Miguel de (1547-1616). Novelas ejemplares. Francés Cervantes Saavedra, Miguel de (1547-1616). Don Quijote de la Mancha-Influencia Cervantes Saavedra, Miguel de (1547-1616)-Familia 10XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  11. 11. Identificar alcance y fuente de datos FASE 1: Seleccionamos en nuestro catálogo los bibliográficos asociados a estas autoridades Aparecen en el registro bibliográfico como autor/título/materia 8.512 registros bibliográficos 1 mapa 61 grabaciones sonoras 924 grabados, dibujos o fotografías 18 manuscritos 509 monografías antiguas 6897 monografías modernas 37 partituras 4 registros electrónicos 8 publicaciones periódicas 48 vídeos 11XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  12. 12. Identificar alcance y fuente de datos FASE 1 – Ejemplo 1: .001. |abimo0000768982 .005. |a20090113 .008. |a980120s1997 esp| ||| ||spa .016. 7 |abimoBNE19980014836|2SpMaBN .017. |aM 7218-1997|bOficina Depósito Legal Madrid .020. |a84-239-4133-7 .040. |aSpMaBN|bspa|cSpMaBN|erdc .080. 0|a821.134.2-31"15" .100. 20|aCervantes Saavedra, Miguel de|d1547-1616 .245. 13|aEl ingenioso hidalgo Don Quijote de la Mancha|h[Texto impreso] |cMiguel de Cervantes Saavedra ; ilustrado por José Segrelles .260. 0 |aMadrid|bEspasa Calpe|c[1997] .300. |a2 v.|bil. col.|c32 cm .700. 11|aSegrelles, José 12XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  13. 13. Identificar alcance y fuente de datos FASE 1 – Ejemplo 2: . .001. |aa4731194 .005. |a20100713 .008. |a100419s2010 esp | |||| 000 0 spa .015. |aMON1005 .017. |aVG 287-2010|bOficina Depósito Legal Vigo .020. |a978-84-96915-67-1 .040. |aSpMaBN .080. |a821.134.2-22.09"15/16" .080. |a821.134.2 Cervantes Saavedra, Miguel de 7 Novelas ejemplares.07 .100. 1 |aVaiopoulos, Katerina .245. 10|aDe la novela a la comedia|h[Texto impreso] :|blas "Novelas ejemplares" de Cervantes en el teatro del Siglo de Oro|cKaterina Vaiopoulos .260. |aVigo, Pontevedra|bAcademia del Hispanismo|c2010 .300. |a295 p.|c21 cm .490. 0 |aBiblioteca Cátedra Miguel de Cervantes|v15 .504. |aBibliografía: p. 281-295 .600. 17|aCervantes Saavedra, Miguel de|d1547-1616|tNovelas ejemplares .650. 7|aIntertextualidad .650. 7|aComedia española|yS.XVI-XVII|xHistoria y crítica 13XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  14. 14. Identificar alcance y fuente de datos FASE 1 – Ejemplo 3: .001. |aMimo0000660591 .005. |a20090514 .008. |a900725n fra r fre .010. |zIND9100156998|zIND9100156999 .016. 7 |abimoBNE19971409228|2SpMaBN .040. |aSpMaBN|bspa|cA2 .080. 0|a86-321.2"16" .100. 1 |aCervantes Saavedra, Miguel de|d1547-1616 .240. 10|aNovelas ejemplares|lFrancés .245. 14|aLes Nouvelles exemplaires|h[Texto impreso]|cTraduction de Louis Viardot. Avec préface... et notes par Maurice Bardon... .260. 1 |aParis|b[s.n.|cS.a.|fImp. Paul Dupont] .300. |aXXVIII + 528 p. + 1 h.|c18 cm .490. 0 |aClassiques Garnier .700. 1 |aViardot, Louis|d1800-1883 .700. 1 |aBardon, Maurice. 14XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  15. 15. Identificar alcance y fuente de datos FASE 1 – Ejemplo 4: .001. |aMimo0002138672 .005. |a20071219 .008. |a061025s2005 rus| ||| ||rus .016. 7 |abimoBNE20061026593|2SpMaBN .020. |a5-02-027028-8 .245. 00|aIberica|h[Texto impreso]|b : k 400-letiiu romana servantesa "Don Kijot" .260. |aSant-Peterburg|bNauka|c2005 .300. |a293 p.|c22 cm .500. |aSelección de ponencias presentadas en las XXVIII, XXIX y XXX Lecturas Cervantinas que anualmente se celebran en la Universidad Estatal de San Petersburgo .594. |aPrecede al tít.: Rossiiskaia akademiia nauk .594. |aPort. adicional en español .600. 17|aCervantes Saavedra, Miguel de|d1547-1616|xInfluencia|2embne .650. 7|aLiteratura rusa|yS.XX|xHistoria y crítica .650. 7|aLiteratura española|yS.XVI-XVII|xHistoria y crítica .710. 2 |aRossiiskaia akademiia nauk .730. 0 |aLecturas cervantinas 15XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  16. 16. Identificar alcance y fuente de datos FASE 1 – Ejemplo 5: .001. |aa4696572 .005. |a20100406 .008. |a100305s2010 espa | |||| 000 0 spa .015. |aMON1003 .017. |aM 2148-2010|bOficina Depósito Legal Madrid .020. |a978-84-613-7663-6 .100. 1 |aBarros Campos, José .245. 10|aArganda del Rey, cuna de Miguel de Cervantes|h[Texto impreso]|cJosé Barros Campos .260. |a[Madrid]|bJ. Barros|cimp. 2010|eMadrid|fReprografía Simancas y Casanova .300. |a573 p.|bil.|c30 cm .504. |aBibliografía: p. 567-573 .600. 17|aCervantes Saavedra, Miguel de|d1547-1616|xFamilia .600. 17|aCervantes (Familia)|xGenealogía .651. 7|aArganda del Rey|xHistoria 16XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  17. 17. Identificar alcance y fuente de datos FASE 2: Seleccionamos en nuestro catálogo las autoridades relacionadas con los bibliográficos anteriores 7.351 registros de autoridad en total 17XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  18. 18. Identificar alcance y fuente de datos FASE 2 – Ejemplo 1: .001. |abimo0000768982 .005. |a20090113 .008. |a980120s1997 esp| ||| ||spa .016. 7 |abimoBNE19980014836|2SpMaBN .017. |aM 7218-1997|bOficina Depósito Legal Madrid .020. |a84-239-4133-7 .040. |aSpMaBN|bspa|cSpMaBN|erdc .080. 0|a821.134.2-31"15" .100. 20|aCervantes Saavedra, Miguel de|d1547-1616 .245. 13|aEl ingenioso hidalgo Don Quijote de la Mancha|h[Texto impreso] |cMiguel de Cervantes Saavedra ; ilustrado por José Segrelles .260. 0 |aMadrid|bEspasa Calpe|c[1997] .300. |a2 v.|bil. col.|c32 cm .700. 11|aSegrelles, José 18XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  19. 19. Identificar alcance y fuente de datos FASE 2 – Ejemplo 2: .001. |aa4731194 .005. |a20100713 .008. |a100419s2010 esp | |||| 000 0 spa .015. |aMON1005 .017. |aVG 287-2010|bOficina Depósito Legal Vigo .020. |a978-84-96915-67-1 .040. |aSpMaBN .080. |a821.134.2-22.09"15/16" .080. |a821.134.2 Cervantes Saavedra, Miguel de 7 Novelas ejemplares.07 .100. 1 |aVaiopoulos, Katerina .245. 10|aDe la novela a la comedia|h[Texto impreso] :|blas "Novelas ejemplares" de Cervantes en el teatro del Siglo de Oro|cKaterina Vaiopoulos .260. |aVigo, Pontevedra|bAcademia del Hispanismo|c2010 .300. |a295 p.|c21 cm .490. 0 |aBiblioteca Cátedra Miguel de Cervantes|v15 .504. |aBibliografía: p. 281-295 .600. 17|aCervantes Saavedra, Miguel de|d1547-1616|tNovelas ejemplares .650. 7|aIntertextualidad .650. 7|aComedia española|yS.XVI-XVII|xHistoria y crítica 19XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  20. 20. Identificar alcance y fuente de datos FASE 2 – Ejemplo 3: .001. |aMimo0000660591 .005. |a20090514 .008. |a900725n fra r fre .010. |zIND9100156998|zIND9100156999 .016. 7 |abimoBNE19971409228|2SpMaBN .040. |aSpMaBN|bspa|cA2 .080. 0|a86-321.2"16" .100. 1 |aCervantes Saavedra, Miguel de|d1547-1616 .240. 10|aNovelas ejemplares|lFrancés .245. 14|aLes Nouvelles exemplaires|h[Texto impreso]|cTraduction de Louis Viardot. Avec préface... et notes par Maurice Bardon... .260. 1 |aParis|b[s.n.|cS.a.|fImp. Paul Dupont] .300. |aXXVIII + 528 p. + 1 h.|c18 cm .490. 0 |aClassiques Garnier .700. 1 |aViardot, Louis|d1800-1883 .700. 1 |aBardon, Maurice. 20XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  21. 21. Identificar alcance y fuente de datos FASE 2 – Ejemplo 4: .001. |aMimo0002138672 .005. |a20071219 .008. |a061025s2005 rus| ||| ||rus .016. 7 |abimoBNE20061026593|2SpMaBN .020. |a5-02-027028-8 .245. 00|aIberica|h[Texto impreso]|b : k 400-letiiu romana servantesa "Don Kijot" .260. |aSant-Peterburg|bNauka|c2005 .300. |a293 p.|c22 cm .500. |aSelección de ponencias presentadas en las XXVIII, XXIX y XXX Lecturas Cervantinas que anualmente se celebran en la Universidad Estatal de San Petersburgo .594. |aPrecede al tít.: Rossiiskaia akademiia nauk .594. |aPort. adicional en español .600. 17|aCervantes Saavedra, Miguel de|d1547-1616|xInfluencia|2embne .650. 7|aLiteratura rusa|yS.XX|xHistoria y crítica .650. 7|aLiteratura española|yS.XVI-XVII|xHistoria y crítica .710. 2 |aRossiiskaia akademiia nauk .730. 0 |aLecturas cervantinas 21XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  22. 22. Identificar alcance y fuente de datos FASE 2 – Ejemplo 5: .001. |aa4696572 .005. |a20100406 .008. |a100305s2010 espa | |||| 000 0 spa .015. |aMON1003 .017. |aM 2148-2010|bOficina Depósito Legal Madrid .020. |a978-84-613-7663-6 .100. 1 |aBarros Campos, José .245. 10|aArganda del Rey, cuna de Miguel de Cervantes|h[Texto impreso]|cJosé Barros Campos .260. |a[Madrid]|bJ. Barros|cimp. 2010|eMadrid|fReprografía Simancas y Casanova .300. |a573 p.|bil.|c30 cm .504. |aBibliografía: p. 567-573 .600. 17|aCervantes Saavedra, Miguel de|d1547-1616|xFamilia .600. 17|aCervantes (Familia)|xGenealogía .651. 7|aArganda del Rey|xHistoria 22XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  23. 23. Proceso de transformación de los datos • OBJETIVOS: 1. Encontrar una metodología de transformación sistemática y repetible 2. Diseño e implementación de aplicaciones que automaticen el proceso. 3. Demostrar la aplicabilidad de los modelos de IFLA • Ciclo de vida del proceso: Iterativo e incremental • Esfuerzo conjunto para aunar los dos mundos: Bibliotecas y Web Semántica (Linked Data)XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  24. 24. Principales fases del proceso 1. Análisis de los datos: Entender la organización de los registros de autoridades y bibliográficos Desarrollo de herramientas de apoyo (informe de combinaciones de subcampos, nº de apariciones de campos…) 2. Correspondencias registros MARC21 y Modelos Proceso complejo y difícil de sistematizar MEJORA: Herramienta que permite sistematizar el proceso de generación de correspondencias (mediante Hojas de cálculo). 3. Transformación de los datos: Herramienta ad-hoc de transformación automáticaXII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  25. 25. XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  26. 26. Principales fases del proceso 4. Creación del dominio cultura.linkeddata.es 5. Publicación de los datos en RDF: Virtuoso Server Pubby 6. Enlazado con otros datasets: FASE 1: VIAF y otras Bibliotecas FASE 2: DBPEDIA, Geo, etc.XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  27. 27. Desarrollo de interfaz (en proceso) • Búsqueda y navegación del catálogo • Utilizando los datos en RDF • Basada en FRBR • Tecnologías de software libreXII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  28. 28. Algunos resultados Nº total tripletas: 344.439XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  29. 29. Tareas en curso • Expediente de adquisición del servidor para almacenar los datos del catálogo en RDF Configuración recomendada: 2 procesadores Intel Xeon E5506 Processor (2.13GHz, 4M Cache, 4.86 GT/s QPI), 800MHz Max Memory 16Gb de memoria RAM 4 Discos duros de 450Gb SAS 15000 rpm en raid 5 + controladora RAID 2 fuentes de alimentacion redundantes de 500W • Evaluación enlaces Comprobar si enlazan correctamente • Formación Curso de Linked Data incluido en el Plan de Formación de la BNE 29XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  30. 30. Posibles proyectos futuros • Transformación a RDF de todo el catálogo - actualizaciones • Catálogos colectivos multilingües de autoridades – idea original • Enlazado con Dataset de Geonames y de GeoLinkedData. •Ejemplos: Obtención de bibliografías locales: dependiendo del lugar de publicación Ubicación de mapas antiguos y otros objetos digitalizados, por medio del lugar geográfico 30XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011
  31. 31. Gracias por su atención www.bne.es http://catalogo.bne.es http://bdh.bne.es www.facebook.com/bne www.youtube.com/bibliotecaBNE http://www.flickr.com/photos/bibliotecabne www.oeg-upm.net dvila@delicias.dia.fi.upm.es 31XII Jornadas Españolas de Documentación / EBLIDA-NAPLE Conference 2011 in Cooperation with FESABID / XVI Jornadas Bibliotecarias de Andalucía Málaga 25, 26 y 27 de Mayo de 2011

×