Departamento de Proceso TécnicoDirección de Biblioteca Digital y Sistemas de                Información    Datos enlazados...
ÍndiceOrigen del proyectoFases de especificación y modeladoFase de generaciónFase de publicaciónPresente y futuro del proy...
Origen del proyecto:                Fichero de autoridades compartidoProyecto de cooperación de la BNE y las Bibliotecas N...
Origen del proyecto:               Proyecto de colaboración con la UPMA partir de los contactos que la Biblioteca Nacional...
Fase de especificación:               Identificar la fuente de datos: FASE 1Seleccionamos un subconjunto de nuestros fiche...
Fase de especificación:               Identificar la fuente de datos: FASE 2La segunda fase consistirá en la transformació...
Fase de modelado:       Análisis y selección de las ontologías y vocabulariosEstudio de otras iniciativas y proyectos de L...
Fase de modelado:Análisis y selección de las ontologías y vocabularios                                         BIBLIOTECA ...
Fase de generación:        Características propias del proyecto BNEObjetivo: migrar todo el catálogo: – Autoridades – Bibl...
Fase de generación:                 FRBR como modelo de datosFRBR es un modelo de referencia, un modelo abstracto y genera...
Fase de generación:                         VocabulariosSe han empleado vocabularios que se alinean con los estándaresde I...
BIBLIOTECA NACIONAL DE ESPAÑA
BIBLIOTECA NACIONAL DE ESPAÑA
Fase de generación:                    Proceso de conversiónSe basa en el mapeo o correspondencia entre los registros base...
Fase de generación: proceso de conversión. Identificación de                         autoridadesDesde los registros de aut...
Fase de generación: proceso de conversión. Identificación de               entidades, modo de trabajo                     ...
Fase de generación: proceso de conversión. Identificación de                          relacionesEntre los registros de aut...
Fase de generación: proceso de conversión. Anotación de las                        propiedadesPropiedades o atributos de c...
Fase de generación: proceso de conversión. Anotación de las                        propiedadesPropiedades o atributos de c...
Fase de generación: proceso de conversión. Anotación de             propiedades: modo de trabajo                          ...
Fase de generación: proceso de conversión. Problemas encontrados Subcampos para los que no existe una propiedad específica...
Fase de generación: CONCLUSIONES             Importancia de LD para las bibliotecasIntegración de nuestros datos con los d...
Fase de generación: CONCLUSIONES            Datos enlazados y datos de bibliotecasInteroperabilidad, pero esta vez no solo...
Fase de generación: CONCLUSIONES         Datos enlazados y datos de bibliotecasNuestros datos son muy “semánticos”.Nuestro...
Fase de publicaciónAdquisición de un servidor para almacenar los datos del catálogo en RDF,de acuerdo con la configuración...
Presente y futuro del proyectoFormación – Impartido el Curso de Linked Data, incluido en el Plan de Formación    de la BNE...
Ana Manchado MangasDirección de Biblioteca Digital y Sistemas de Información                ana.manchado@bne.es           ...
Upcoming SlideShare
Loading in …5
×

Datos enlazados en la Biblioteca Nacional de España. Ana Manchado Mangas, Ricardo Santos Muñoz

1,899 views

Published on

Presentada en "Cita en la BNE. Datos enlazados en la Biblioteca Nacional de España", que tuvo lugar en diciembre de 2011 en la Biblioteca Nacional de España (BNE).

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,899
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
19
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Datos enlazados en la Biblioteca Nacional de España. Ana Manchado Mangas, Ricardo Santos Muñoz

  1. 1. Departamento de Proceso TécnicoDirección de Biblioteca Digital y Sistemas de Información Datos enlazados en la Biblioteca Nacional de España. Ana Manchado Mangas – Jefe de Servicio de Proyectos Bibliográficos Ricardo Santos Muñoz – Jefe de Sección de Autoridades
  2. 2. ÍndiceOrigen del proyectoFases de especificación y modeladoFase de generaciónFase de publicaciónPresente y futuro del proyecto: explotación BIBLIOTECA NACIONAL DE ESPAÑA
  3. 3. Origen del proyecto: Fichero de autoridades compartidoProyecto de cooperación de la BNE y las Bibliotecas Nacionales yRegionales de las Comunidades AutónomasObjetivo: Creación de un Sistema Nacional de Autoridades (Fichero deAutoridades compartido – “tipo VIAF”)Principal dificultad: Multilingüismo en los nombres de persona y entidad.Primeras aproximaciones:– Desarrollo dentro de nuestro SIGB– Desarrollo por parte de una empresa privada BIBLIOTECA NACIONAL DE ESPAÑA
  4. 4. Origen del proyecto: Proyecto de colaboración con la UPMA partir de los contactos que la Biblioteca Nacional de España llevó a cabocon la Universidad Politécnica de Madrid en septiembre de 2010 parainvestigar la posibilidad de colaboración en este proyecto, se acordó unconvenio marco y un convenio específico para la realización del proyecto:“Generación de datos enlazados a partir del catálogo bibliográfico y deautoridades”Primeras acciones: conocimiento del dominio: estándares y modelos dedatos. Selección de los datos, selección de los vocabularios BIBLIOTECA NACIONAL DE ESPAÑA
  5. 5. Fase de especificación: Identificar la fuente de datos: FASE 1Seleccionamos un subconjunto de nuestros ficheros de autoridad ybibliográficos en formato MARC21Partiendo de los registros de autoridad que empiezan por CervantesSaavedra, Miguel de (1547-1616) (550 registros), navegamos a susbibliográficos relacionados (unos 8.000 registros bibliográficos)Para completar el conjunto y multiplicar las posibilidades, seleccionamosen nuestro catálogo las autoridades relacionadas con los bibliográficosanteriores ( unos 7.351 registros de autoridad en total) BIBLIOTECA NACIONAL DE ESPAÑA
  6. 6. Fase de especificación: Identificar la fuente de datos: FASE 2La segunda fase consistirá en la transformación a RDF de todo elcatálogo. Hasta ahora se ha transformado todo el catálogo de autoridades y unsubconjunto muy representativo del catálogo bibliográfico, formado por2.400.000 registros bibliográficos de los formatos – Monografías modernas: 1.947.332 – Monografías antiguas: 107.803 – Música escrita: 162.519 – Grabaciones sonoras: 172.484 BIBLIOTECA NACIONAL DE ESPAÑA
  7. 7. Fase de modelado: Análisis y selección de las ontologías y vocabulariosEstudio de otras iniciativas y proyectos de Library Linked DataSelección de FRBR, FRAD, FRSAD e ISBD » por tratarse de las ontologías proporcionadas por el trabajo realizado en la IFLA » por ser más exhaustivas y más precisas » se encuentran inscritas en el Open Metadata Registry BIBLIOTECA NACIONAL DE ESPAÑA
  8. 8. Fase de modelado:Análisis y selección de las ontologías y vocabularios BIBLIOTECA NACIONAL DE ESPAÑA
  9. 9. Fase de generación: Características propias del proyecto BNEObjetivo: migrar todo el catálogo: – Autoridades – Bibliográficos – Relaciones entre ellosModelo de datos: modelos de la familia FR.Vocabularios IFLA. BIBLIOTECA NACIONAL DE ESPAÑA
  10. 10. Fase de generación: FRBR como modelo de datosFRBR es un modelo de referencia, un modelo abstracto y general,que conceptualiza el mundo bibliográfico.Como modelo de datos describe de un modo muy ordenado ycoherente el universo bibliográfico, contenido en un catálogobibliotecario.Describe un conjunto muy rico de relaciones entre las entidades.Permite la interoperabilidad con otros modelos similares de otrosámbitos.Ha sido asumido por otros modelos: RDA BIBLIOTECA NACIONAL DE ESPAÑA
  11. 11. Fase de generación: VocabulariosSe han empleado vocabularios que se alinean con los estándaresde IFLA. Están reconocidos como estándares válidos de la websemántica por la W3C.Estos vocabularios tienen su origen en los estándares oficiales(FRBR, FRAD, FRSAD e ISBD consolidada), y recogen laspropiedades de las entidades descritas en la catalogación.Los vocabularios FRBR, FRAD recogen los atributos de Obra,Expresión, Persona, Entidad Corporativa. ( Registros deautoridad)El vocabulario ISBD recoge los atributos de manifestación. (Registro bibliográfico) BIBLIOTECA NACIONAL DE ESPAÑA
  12. 12. BIBLIOTECA NACIONAL DE ESPAÑA
  13. 13. BIBLIOTECA NACIONAL DE ESPAÑA
  14. 14. Fase de generación: Proceso de conversiónSe basa en el mapeo o correspondencia entre los registros base(MARC21) con las propiedades citadas. Consta de 3 fases:– Identificación de las entidades: Persona, Entidad Corporativa, Obra y Expresión.– Identificación de las relaciones entre entidades.– Anotación de las propiedades. BIBLIOTECA NACIONAL DE ESPAÑA
  15. 15. Fase de generación: proceso de conversión. Identificación de autoridadesDesde los registros de autoridad. Dada una etiqueta de campos y una combinación de subcampos, se determina aqué entidad FRBR se relaciona: 100 $a $d Persona (FRBR Grupo 2) 110 $a $b –> Entidad corporativa (FRBR Grupo 2) 111 $a $n $d $c Entidad corporativa (FRBR Grupo 2) 130 $a Obra (FRBR Grupo 1) 100 $a $d $t Obra (FRBR Grupo 1) 100 $a $d $t $l Expresión (FRBR Grupo 1) 150 $a $z $v Thema (FRBR Grupo 3)Cada registro bibliográfico Manifestación (FRBR Grupo 1) BIBLIOTECA NACIONAL DE ESPAÑA
  16. 16. Fase de generación: proceso de conversión. Identificación de entidades, modo de trabajo BIBLIOTECA NACIONAL DE ESPAÑA
  17. 17. Fase de generación: proceso de conversión. Identificación de relacionesEntre los registros de autoridad 100 $a $t ($a es autor de $t) Entre los registros de autoridad y los registros bibliográficos: a través delos puntos de acceso. 100 $a 240 $a $l (El registro bibliográfico es una manifestación de la expresión 100 + 240)Entre los registros bibliográficos.Es la parte más compleja, que ha de tener en cuenta más factores. BIBLIOTECA NACIONAL DE ESPAÑA
  18. 18. Fase de generación: proceso de conversión. Anotación de las propiedadesPropiedades o atributos de cada una de las entidades. Ej. Persona –>” tiene fechas” Entidad corporativa “tiene lugar asociado” Obra “tiene nombre” Expresión “tiene lengua” Manifestación “tiene lugar de publicación”Las propiedades se han anotado desde subcampos. • Registros de autoridad FRBR, FRAD, FRSAD • Registros bibliográficos ISBD BIBLIOTECA NACIONAL DE ESPAÑA
  19. 19. Fase de generación: proceso de conversión. Anotación de las propiedadesPropiedades o atributos de cada una de las entidades. Ej. Persona –>” tiene fechas” 100 $d Entidad corporativa “tiene lugar asociado” 110 $c Obra “tiene nombre” 130 $a; 100 $t Expresión “tiene lengua” 100 $l Manifestación “tiene lugar de publicación” 260 $aLas propiedades se han anotado desde subcampos. • Registros de autoridad FRBR, FRAD, FRSAD • Registros bibliográficos ISBD BIBLIOTECA NACIONAL DE ESPAÑA
  20. 20. Fase de generación: proceso de conversión. Anotación de propiedades: modo de trabajo BIBLIOTECA NACIONAL DE ESPAÑA
  21. 21. Fase de generación: proceso de conversión. Problemas encontrados Subcampos para los que no existe una propiedad específica. – 670 $b, 100 $p Subcampos para los que existe más de una propiedad posible. – 245 $b Propiedades que son difíciles de mapear – “Es un resumen (obra) de (obra)” – “Es una adaptación (obra) de (obra)” Problemas con el modelo de datos. – obra Expresión manifestación BIBLIOTECA NACIONAL DE ESPAÑA
  22. 22. Fase de generación: CONCLUSIONES Importancia de LD para las bibliotecasIntegración de nuestros datos con los de otras instituciones.Extensibilidad, mediante la agregación a nuestros datos de otrosde diferente proveniencia.Recombinación de los datos.Plataforma para el multilingüismo. BIBLIOTECA NACIONAL DE ESPAÑA
  23. 23. Fase de generación: CONCLUSIONES Datos enlazados y datos de bibliotecasInteroperabilidad, pero esta vez no solo entre bibliotecas.Reutilización, pero esta vez no solo entre bibliotecasEnlazado de datos relacionados, pero esta vez no sólo dentro denuestro catálogo.Naturaleza autodescriptiva de los datos datos sobre datosRepresentar datos y conocimiento como un conjunto de cosasinterrelacionadas.Todas las cosas tienen un identificador único BIBLIOTECA NACIONAL DE ESPAÑA
  24. 24. Fase de generación: CONCLUSIONES Datos enlazados y datos de bibliotecasNuestros datos son muy “semánticos”.Nuestros datos son bastante estructurados.Nuestros datos tienen “calidad”.Nuestros datos son “bastante” universales.Tenemos un modelo de datos. BIBLIOTECA NACIONAL DE ESPAÑA
  25. 25. Fase de publicaciónAdquisición de un servidor para almacenar los datos del catálogo en RDF,de acuerdo con la configuración recomendada Instalación del SPARQL endpoint en dicho servidor para realizar lasconsultas a los datosCreación del dominio datos.bne.es Creación de una página web o portal para diseminar y presentar losresultados. Ver http://datos.bne.es/ BIBLIOTECA NACIONAL DE ESPAÑA
  26. 26. Presente y futuro del proyectoFormación – Impartido el Curso de Linked Data, incluido en el Plan de Formación de la BNE (21 a 25 de noviembre 2011), por personal del OEGEnlaces con otros dataset: VIAF, DNB, SUDOC, LIBRIS y DBPEDIATransformación a RDF de todo el catálogo – actualizacionesRegistro de datos.bne.es en el registro CKANInclusión de datos.bne.es en la nube de Linking Open DataFase de explotación: – Enlaces con otros conjuntos de datos. – Desarrollo de aplicaciones que combinen diversos conjuntos de datos enlazados BIBLIOTECA NACIONAL DE ESPAÑA
  27. 27. Ana Manchado MangasDirección de Biblioteca Digital y Sistemas de Información ana.manchado@bne.es Ricardo Santos Muñoz Departamento de Proceso Técnico ricardo.santos@bne.es Pº de Recoletos 20 -22 28071 Madrid España T +34 915 807 800 www.bne.es BIBLIOTECA NACIONAL DE ESPAÑA

×