Este documento resume varios proyectos de colaboración entre el Instituto Geográfico Nacional de España (IGN) y el Grupo de Ontología e Ingeniería del Conocimiento (OEG) de la Universidad Politécnica de Madrid. Se describen proyectos sobre PhenomenOntology, mapeo semántico, detección de duplicados, norma ISO 19150 y conflación semántica. También se mencionan trabajos actuales sobre anotación semántica de servicios RESTful geoespaciales y publicación de datos geoespaciales enlazados
Este documento presenta SPARQL, el lenguaje de consulta para grafos RDF. Introduce SPARQL, describiendo su objetivo de recuperar información de bases de datos RDF de la Web Semántica de forma similar a como SQL lo hace para bases de datos relacionales. Explica la sintaxis básica de SPARQL, incluyendo cláusulas como SELECT, DESCRIBE, ASK y PREFIX, y resume los diferentes componentes de las especificaciones de SPARQL.
El documento describe los conceptos clave de la matriz de marco lógico, incluyendo la jerarquía de objetivos, los indicadores, las fuentes de verificación y los supuestos. Explica que la matriz establece una relación lógica entre los diferentes niveles de objetivos del proyecto, desde el fin general hasta las actividades específicas, a través del propósito, los resultados y los componentes. También enfatiza la importancia de identificar claramente los supuestos en cada nivel para administrar los riesgos del proyecto.
El documento proporciona información sobre el carbón como fuente de energía no renovable. Explica que el carbón es un combustible sólido compuesto principalmente de carbono que se utiliza comúnmente en centrales térmicas para generar energía. También describe los diferentes tipos de carbón, los métodos de extracción, y los impactos ambientales asociados con su uso. Finalmente, identifica a los principales países productores de carbón e informa sobre el uso actual del carbón en España.
Este documento trata sobre los recursos empresariales y el software ERP. Explica que los recursos empresariales incluyen recursos materiales, financieros, humanos y tecnológicos. Describe que el software ERP integra todos los aspectos de un negocio como la planificación de producción, ventas, marketing, inventario y finanzas. Señala que el ERP ayuda a las empresas a automatizar procesos, planear mejor y ejecutar basándose en los requisitos del negocio.
El documento describe las diferentes dimensiones de la relación entre la sociedad y la naturaleza, incluyendo la estructura biológica e inteligencia humana, la adaptación ecológica, los sistemas tecnológicos, ideológicos y sociales, y cómo estas dimensiones han evolucionado a través de la innovación, aculturación y desarrollo tecnológico. También analiza cómo diferentes sociedades han explotado recursos naturales a lo largo de la historia y cómo el proceso productivo, consumo y desechos han impact
Este documento resume varios proyectos de colaboración entre el Instituto Geográfico Nacional de España (IGN) y el Grupo de Ontología e Ingeniería del Conocimiento (OEG) de la Universidad Politécnica de Madrid. Se describen proyectos sobre PhenomenOntology, mapeo semántico, detección de duplicados, norma ISO 19150 y conflación semántica. También se mencionan trabajos actuales sobre anotación semántica de servicios RESTful geoespaciales y publicación de datos geoespaciales enlazados
Este documento presenta SPARQL, el lenguaje de consulta para grafos RDF. Introduce SPARQL, describiendo su objetivo de recuperar información de bases de datos RDF de la Web Semántica de forma similar a como SQL lo hace para bases de datos relacionales. Explica la sintaxis básica de SPARQL, incluyendo cláusulas como SELECT, DESCRIBE, ASK y PREFIX, y resume los diferentes componentes de las especificaciones de SPARQL.
El documento describe los conceptos clave de la matriz de marco lógico, incluyendo la jerarquía de objetivos, los indicadores, las fuentes de verificación y los supuestos. Explica que la matriz establece una relación lógica entre los diferentes niveles de objetivos del proyecto, desde el fin general hasta las actividades específicas, a través del propósito, los resultados y los componentes. También enfatiza la importancia de identificar claramente los supuestos en cada nivel para administrar los riesgos del proyecto.
El documento proporciona información sobre el carbón como fuente de energía no renovable. Explica que el carbón es un combustible sólido compuesto principalmente de carbono que se utiliza comúnmente en centrales térmicas para generar energía. También describe los diferentes tipos de carbón, los métodos de extracción, y los impactos ambientales asociados con su uso. Finalmente, identifica a los principales países productores de carbón e informa sobre el uso actual del carbón en España.
Este documento trata sobre los recursos empresariales y el software ERP. Explica que los recursos empresariales incluyen recursos materiales, financieros, humanos y tecnológicos. Describe que el software ERP integra todos los aspectos de un negocio como la planificación de producción, ventas, marketing, inventario y finanzas. Señala que el ERP ayuda a las empresas a automatizar procesos, planear mejor y ejecutar basándose en los requisitos del negocio.
El documento describe las diferentes dimensiones de la relación entre la sociedad y la naturaleza, incluyendo la estructura biológica e inteligencia humana, la adaptación ecológica, los sistemas tecnológicos, ideológicos y sociales, y cómo estas dimensiones han evolucionado a través de la innovación, aculturación y desarrollo tecnológico. También analiza cómo diferentes sociedades han explotado recursos naturales a lo largo de la historia y cómo el proceso productivo, consumo y desechos han impact
Tic como herramienta para la informática educativa. mrvamariovellojin
El documento presenta una planeación de clases para las asignaturas de Biología y Tecnología e Informática. Incluye el tema de las funciones de relación en los seres vivos, objetivos, competencias, desarrollo del tema con conceptos clave y evaluación. El desarrollo explica conceptos como estimulo, respuesta, sistemas nervioso y endocrino en humanos y plantas.
El documento describe los procesos de contratación pública en tres oraciones:
1) Los comités especiales de contratación están compuestos por miembros del área usuaria, del órgano encargado de contrataciones y al menos uno debe conocer técnicamente el objeto de la contratación.
2) Los factores de evaluación técnica para la adquisición de bienes, servicios y obras incluyen la experiencia y el cumplimiento sin penalidades en contratos anteriores del postor.
3) La función pública incluye cualquier actividad temporal
Este documento presenta un cuadro comparativo de diferentes modelos de innovación educativa, incluyendo el modelo de sistemas, el modelo ecológico, el modelo cognitivo, el modelo del profesor como traductor de la innovación, el modelo de diálogo y el modelo de investigación-acción crítica. Describe las características, el rol del profesor, las ventajas y limitaciones de cada modelo. También incluye referencias web gráficas relacionadas con los fundamentos de la innovación actual y los retos de la innovación curricular.
El documento describe los beneficios de integrar la tecnología en la educación. Explica que las TIC permiten nuevos métodos de enseñanza y aprendizaje a través de nuevos lenguajes y representaciones. También describe etapas para implementar las TIC, características de las TIC como la interactividad y multimedia, y cómo el software educativo y proyectos telemáticos pueden enriquecer la enseñanza. Finalmente, resume los beneficios de las TIC como fomentar el aprendizaje colaborativo, autoaprendizaje
El documento introduce los conceptos básicos de informática, incluyendo la definición de informática como el tratamiento automático de la información mediante ordenadores. Explica que los datos se procesan en tres fases: entrada, proceso y salida, y que los programas indican al ordenador qué acciones realizar. También describe la representación binaria de datos y caracteres usando ceros y unos, y las unidades de medida como bit, byte, kilobyte y más.
Este documento presenta un cuestionario de satisfacción para evaluar varios aspectos de un curso de apicultura, incluyendo la satisfacción con los objetivos, contenido y organización del curso; el formador; el contenido teórico y práctico; y el centro donde se impartió el curso. Los participantes deben calificar cada aspecto de 0 a 10 según su grado de satisfacción.
Diapositivas valor refeerencial cefic 12 01-2011-1cefic
Este documento describe los aspectos fundamentales del proceso de contratación pública en Perú, incluyendo la elaboración del Plan Anual de Contrataciones, el contenido del expediente de contratación, y los métodos para determinar el valor referencial. El objetivo principal es maximizar el valor del dinero público a través de contrataciones oportunas, de calidad y a precios razonables.
Este documento resume la evaluación de un curso de formación impartido por la Academia CEFEGA en Ourense. Se analizan los cuestionarios completados por los estudiantes sobre sus conocimientos previos, nivel de satisfacción e impacto del curso. Los resultados muestran que los objetivos del curso se cumplieron y los estudiantes están satisfechos con los contenidos y metodología, aunque algunos se sintieron incómodos expresando opiniones. El informe concluye con recomendaciones para mejorar aspectos como la participación de los estudiantes
La dictadura de Primo de Rivera en España duró de 1923 a 1930. Comenzó como una dictadura militar tras un golpe de estado apoyado por el rey, pero luego se convirtió en una dictadura civil. La oposición creció entre los partidos políticos, sindicatos, estudiantes y militares debido a las restricciones a las libertades y el fracaso económico. En 1930, Primo de Rivera renunció debido a la falta de apoyo y murió poco después, dando paso al retorno de la monarquía constitucional que
VIII Encuentros de Centros de Documentación de Arte Contemporáneo en Artium -...Artium Vitoria
"Datos enlazados en la Biblioteca Nacional de España: historia, estado, retos y perspectivas" por Ricardo Santos Muñoz, jefe del Servicio de Coordinación y Normalización del Departamento de Proceso de Técnico de la Biblioteca Nacional de España.
Este documento resume un curso sobre integración web semántica y casos prácticos. Explica los pasos para producir, publicar y consumir datos enlazados (Linked Data), incluyendo la selección de un conjunto de datos, su modelado, enriquecimiento y generación en RDF usando herramientas como Google Refine. También cubre la publicación de los datos a través de servicios como SPARQL Endpoint y realización de consultas sobre los datos publicados.
Tic como herramienta para la informática educativa. mrvamariovellojin
El documento presenta una planeación de clases para las asignaturas de Biología y Tecnología e Informática. Incluye el tema de las funciones de relación en los seres vivos, objetivos, competencias, desarrollo del tema con conceptos clave y evaluación. El desarrollo explica conceptos como estimulo, respuesta, sistemas nervioso y endocrino en humanos y plantas.
El documento describe los procesos de contratación pública en tres oraciones:
1) Los comités especiales de contratación están compuestos por miembros del área usuaria, del órgano encargado de contrataciones y al menos uno debe conocer técnicamente el objeto de la contratación.
2) Los factores de evaluación técnica para la adquisición de bienes, servicios y obras incluyen la experiencia y el cumplimiento sin penalidades en contratos anteriores del postor.
3) La función pública incluye cualquier actividad temporal
Este documento presenta un cuadro comparativo de diferentes modelos de innovación educativa, incluyendo el modelo de sistemas, el modelo ecológico, el modelo cognitivo, el modelo del profesor como traductor de la innovación, el modelo de diálogo y el modelo de investigación-acción crítica. Describe las características, el rol del profesor, las ventajas y limitaciones de cada modelo. También incluye referencias web gráficas relacionadas con los fundamentos de la innovación actual y los retos de la innovación curricular.
El documento describe los beneficios de integrar la tecnología en la educación. Explica que las TIC permiten nuevos métodos de enseñanza y aprendizaje a través de nuevos lenguajes y representaciones. También describe etapas para implementar las TIC, características de las TIC como la interactividad y multimedia, y cómo el software educativo y proyectos telemáticos pueden enriquecer la enseñanza. Finalmente, resume los beneficios de las TIC como fomentar el aprendizaje colaborativo, autoaprendizaje
El documento introduce los conceptos básicos de informática, incluyendo la definición de informática como el tratamiento automático de la información mediante ordenadores. Explica que los datos se procesan en tres fases: entrada, proceso y salida, y que los programas indican al ordenador qué acciones realizar. También describe la representación binaria de datos y caracteres usando ceros y unos, y las unidades de medida como bit, byte, kilobyte y más.
Este documento presenta un cuestionario de satisfacción para evaluar varios aspectos de un curso de apicultura, incluyendo la satisfacción con los objetivos, contenido y organización del curso; el formador; el contenido teórico y práctico; y el centro donde se impartió el curso. Los participantes deben calificar cada aspecto de 0 a 10 según su grado de satisfacción.
Diapositivas valor refeerencial cefic 12 01-2011-1cefic
Este documento describe los aspectos fundamentales del proceso de contratación pública en Perú, incluyendo la elaboración del Plan Anual de Contrataciones, el contenido del expediente de contratación, y los métodos para determinar el valor referencial. El objetivo principal es maximizar el valor del dinero público a través de contrataciones oportunas, de calidad y a precios razonables.
Este documento resume la evaluación de un curso de formación impartido por la Academia CEFEGA en Ourense. Se analizan los cuestionarios completados por los estudiantes sobre sus conocimientos previos, nivel de satisfacción e impacto del curso. Los resultados muestran que los objetivos del curso se cumplieron y los estudiantes están satisfechos con los contenidos y metodología, aunque algunos se sintieron incómodos expresando opiniones. El informe concluye con recomendaciones para mejorar aspectos como la participación de los estudiantes
La dictadura de Primo de Rivera en España duró de 1923 a 1930. Comenzó como una dictadura militar tras un golpe de estado apoyado por el rey, pero luego se convirtió en una dictadura civil. La oposición creció entre los partidos políticos, sindicatos, estudiantes y militares debido a las restricciones a las libertades y el fracaso económico. En 1930, Primo de Rivera renunció debido a la falta de apoyo y murió poco después, dando paso al retorno de la monarquía constitucional que
VIII Encuentros de Centros de Documentación de Arte Contemporáneo en Artium -...Artium Vitoria
"Datos enlazados en la Biblioteca Nacional de España: historia, estado, retos y perspectivas" por Ricardo Santos Muñoz, jefe del Servicio de Coordinación y Normalización del Departamento de Proceso de Técnico de la Biblioteca Nacional de España.
Este documento resume un curso sobre integración web semántica y casos prácticos. Explica los pasos para producir, publicar y consumir datos enlazados (Linked Data), incluyendo la selección de un conjunto de datos, su modelado, enriquecimiento y generación en RDF usando herramientas como Google Refine. También cubre la publicación de los datos a través de servicios como SPARQL Endpoint y realización de consultas sobre los datos publicados.
La recolección de metadatos desde la perspectiva de Europeana, de Andrés Vied...DIGIBIS
El documento resume los formatos y modelos de metadatos utilizados por Europeana para la agregación de datos digitales de bibliotecas, archivos y museos. Explica la evolución desde el formato OAI-PMH y Dublin Core a los modelos ESE y EDM, los cuales permiten la interconexión semántica de los datos a través de entidades como obras, autores, lugares y conceptos. También describe los desafíos que estos cambios constantes representan para las instituciones proveedoras de datos.
Agregación de contenidos en Europeana, de Andrés Viedma Peláez, coordinador d...DIGIBIS
El documento describe la evolución de los formatos de metadatos utilizados para agregar contenidos a Europeana, pasando de ESE a EDM. EDM introduce el concepto de linked data para relacionar los datos y entidades contextuales como obras, autores, materias y lugares. Esto permite mejorar la recuperación, organización y contextualización de la información. Sin embargo, su implementación supone un esfuerzo para las bibliotecas debido a los constantes cambios en los formatos requeridos por Europeana.
Wikidata es un banco de datos colaborativo que almacena información estructurada sobre entidades y eventos del mundo real en forma de grafo. Los datos de Wikidata son legibles tanto para humanos como para máquinas y pueden ser consultados y modificados por cualquier persona. Wikidata contiene más de 80 millones de entradas y crece rápidamente gracias a la contribución de miles de editores de todo el mundo.
BIME HackDay EXTRAYENDO LOS DATOS EN LAS ADMINISTRACIONES PÚBLICASAragón Open Data
Este documento proporciona un resumen de los datos abiertos y las APIs disponibles en las administraciones públicas de Aragón. Explica los servicios genéricos de datos abiertos, las APIs disponibles como CKAN y AragoPedia, y cómo extraer y visualizar datos en formatos como HTML, XML y JSON.
El documento describe la web semántica y sus principales componentes como XML, RDF y OWL. También discute cómo la web semántica puede mejorar la recuperación de información y describir contenido y relaciones entre contenidos. Además, presenta ejemplos de sitios web semánticos investigados como Bitext, Swootti e Ideas Afines.
Este documento presenta una plantilla para la elaboración de un trabajo académico utilizando las normas ICONTEC. En las primeras páginas incluye elementos como portada, contraportada y agradecimientos. Luego contiene secciones como objetivos, marco teórico y metodología. También incluye listas de tablas, figuras y anexos. Al final presenta referencias bibliográficas y un glosario de términos. El propósito de esta plantilla es servir de guía para la elaboración de trabajos acad
Este documento describe los metadatos y su uso para la organización del conocimiento y la gestión de recursos digitales. Explica que los metadatos son datos sobre otros datos y proveen información estructurada sobre un recurso. También describe estándares como Dublin Core, SKOS y FRBR que definen elementos y relaciones para describir recursos de manera normalizada.
Introducción a la Web de Datos
Grafos de Conocimiento
Web Semántica
Ontologías
Linked Data: Wikidata & Dbpedia
Ontología ROH: Red de Ontologías Hércules
Proceso de diseño de la ontología
Descripción de la ontología en detalle
Entidades principales explicadas en base a casos de uso
Tema 16 acceso a base de datos usando jpa por gioRobert Wolf
1) El documento describe el acceso a bases de datos usando JPA, una capa de software que reduce la tarea de conversión entre objetos y datos relacionales. 2) JPA mapea objetos a tablas mediante anotaciones y permite operaciones CRUD. 3) Se explican diferentes tipos de mapeo como uno a uno, muchos a uno, herencia y entidades.
Web semántica y linked data la web como bdAlvaro Graves
Este documento introduce los principios básicos de la Web Semántica y Linked Data. Explica conceptos como RDF, URIs, vocabularios y ontologías para describir recursos en la Web de una manera que las máquinas puedan procesar. También describe las buenas prácticas de Linked Data y ejemplos de su uso, como enlazar y compartir datos de forma abierta a través de la Web.
Integración de sistemas de información textuales y espaciales; análisis estr...Pepe
Trabajo de investigación del autor para la obtención del Diploma de Estudios Avanzados (DEA) del Programa de Doctorado de la Universidad de Granada \"Información científica: acceso, tratamiento y evaluación\".
Periodismo de datos y Linked Data: El poder de los datos enlazados para gener...Oscar Corcho
El documento describe cómo los periodistas pueden usar datos enlazados (Linked Data) para generar historias. Explica los pasos de descargar datos de portales de datos abiertos, conectarlos usando vocabularios estándar, realizar consultas SPARQL para extraer información, y visualizar los datos para contar historias a los lectores. Como ejemplo, analiza la correlación entre el número de locutorios y la población ecuatoriana o chilena en diferentes barrios de Madrid.
Este documento describe las estrategias de difusión de datos estadísticos implementadas por el Instituto Cántabro de Estadística y Análisis Sociodemográfico (ICANE) en Cantabria. Se han desarrollado APIs RESTful para acceder a los metadatos y datos estadísticos. Los datos se publican utilizando formatos como JSON, JSON-stat y RDF para facilitar su procesamiento y análisis. También se han establecido enlaces con otros conjuntos de datos para crear una solución de datos enlazados
1) El documento presenta una introducción a la Web Semántica, incluyendo sus conceptos, estándares y usos. 2) Explica la evolución de la Web desde la Web 1.0 a la Web 2.0 y diferencia estos conceptos de la Web Semántica. 3) Describe algunos de los retos de representación y recuperación de información en la Web que la Web Semántica busca resolver.
Este documento describe el callejero semántico de la ciudad de Zaragoza en España. El callejero semántico enriquece la información sobre las calles añadiendo enlaces a recursos externos como Wikipedia y la Gran Enciclopedia Aragonesa para proporcionar más contexto sobre los nombres de las calles. El callejero semántico extrae datos del callejero convencional de la ciudad y los enriquece mediante el mapeo y enlace con datos externos de la Web de Datos, proporcionando así una descripción más
El tratamiento de los objetos digitales, por Patricia Juez GarcíaDIGIBIS
Este documento resume una presentación sobre la digitalización y preservación del patrimonio bibliográfico de la Iglesia. Describe las transformaciones en las tecnologías de información y la Web, incluyendo la digitalización de fondos, el uso de metadatos y protocolos de búsqueda de datos. También cubre temas como las bibliotecas digitales, normas de catalogación como RDA, y la web semántica. Como caso de uso, presenta la creación de una biblioteca virtual sobre la Escuela de Traductores de Toledo, incluyendo la recolección,
Similar to Datos enlazados para instituciones culturales - Seminario para la Biblioteca Nacional y el Ministerio de Cultura de Colombia (20)
Multilingual vocabularies for the Web: Session on multilingual vocabularies, ...Daniel Vila Suero
In a global world, vocabularies enabled for multilingual environments are increasingly in demand. In this session, discussion will include applicable standards (and examples), with a possible outcome a charge to a small group to begin developing some best practices.
See http://wiki.dublincore.org/index.php/VocDay_workshop_in_Lisbon and http://wiki.dublincore.org/index.php/Agenda2
Data enrichment and transformation in the LOD Context: Vocabulary usage in da...Daniel Vila Suero
Short talk for the session and panel discussion: "DATA ENRICHMENT AND TRANSFORMATION IN THE LOD CONTEXT: POOR AND POPULAR VS. RICH AND LONELY—CAN'T WE ACHIEVE BOTH?" at DCMI Conference Lisbon 2013
Naming and labeling in the Multilingual Web of DataDaniel Vila Suero
This document discusses guidelines for naming and labeling ontologies in a multilingual context. It proposes using opaque URIs for ontology elements while also providing human-readable labels in multiple languages. Examples from datasets like datos.bne.es show how tools can configure label translations. While opaque URIs complicate some tasks, they allow unified identifiers. The document considers modeling label translations using vocabularies like Lemon and representing linguistic properties with ontologies like ISOcat. Overall it aims to help make the multilingual web of data more usable and accessible to international audiences.
Talk at the 2nd Linked Open Data Conference from the Cataloguing and Indexing Group in Scotland (CIGS). Taking place in Edinburgh, Scotland on 21st September 2012
Status Quo and (current) Limitations of Library Linked DataDaniel Vila Suero
Talk at the Semantic Web in Libraries Conference 2012 (SWIB2012). Cologne 28/12/2012 during the session "TOWARDS AN INTERNATIONAL LOD LIBRARY ECOLOGY".
(http://swib.org/swib12/programme.php)
The document describes an ontology engineering group and their datos.bne.es project which publishes data from the Spanish National Library as linked open data on the semantic web. The group developed MARiMbA, a tool that analyzes MARC21 library catalog records and generates RDF according to a modeled ontology. Over 3.9 million records were published at datos.bne.es and links were generated to resources from other libraries to enrich the data. The project helped expose library data in a way that improves discovery and supports new applications.
Datos enlazados para instituciones culturales - Seminario para la Biblioteca Nacional y el Ministerio de Cultura de Colombia
1. Datos enlazados para
instituciones
culturales
Daniel Vila Suero
dvila@fi.upm.es
Ontology Engineering Group, Universidad Politécnica de Madrid
Acknowledgements: OEG Members, BNE team (Elena Escolano, Marina Jimenez Piano,
Ana Manchado, Mar Hernández Agustí, Ricardo Santos and others)
Seminario para la Biblioteca Nacional de Colombia
Viernes 12 de Julio de 2013
This work is funded by the Spanish Project
TIN2010-17550 for the BabeLData project, and by BNE
3. Datos enlazados para LAM
• LAM (Library, Archives and Museums)
• Datos enlazados para bibliotecas, archivos y
museos.
• ¿Qué? Publicar los datos de estas instituciones
siguiendo los principios de Linked Data.
• ¿Cuáles son esos principios y cómo se
transladan al dominio de patrimonio cultural e
histórico?
3
4. Recordatorio: Los 4 Principios
(1) Utilizar URIs para identificar las cosas (en la Web)
(2) Utilizar HTTP URIs para que se puedan recuperar
sus descripciones (en la Web)
(3) Describir las cosas (los recursos, objetos,
entidades) usando estándares de la Web semántica
(RDF, RDFS, SPARQL)
(4) Incluir enlaces a otras HTTP URIs para facilitar el
descubrimiento de más recursos
4
5. Principios 1 y 2
(1, 2) Utilizar HTTP URIs para identificar y permitir
recuperar nuestros objetos (en la Web)
Cada objeto, recurso, activo relevante tiene su propio
identificador en la Web: HTTP URI.
Por ejemplo:
- Personas: Gabriel García Márquez
! h"p://datos.bibliotecanacional.gov.co/personas/Gabriel_García_Márquez=
- Obras: Cien años de soledad
= h"p://datos.bibliotecanacional.gov.co/obras/Cien_años_de_soledad=
5
6. Buenas prácticas HTTP URIs
• Cool URI's don't change:
- Las URIs deben ser estables, no deben cambiar en el
tiempo pues son el punto de acceso a nuestros recursos. El
dominio y los servidores deben estar manejados por nuestra
institución
- URIs bien estructuradas y predecibles:
• /personas/ID: todas las URIs que siguen este patrón
son Personas
- Omitir detalles de la tecnología utilizada, fechas, etc.:
• MAL: http://datos.bibliotecanacional.gov.co/index.php?
persona=Garcia_Marquez
- Las HTTP URIs son principalmente para ser manejadas por
las máquinas, si existe un ID único en los datos de origen
se debería utilizar. Por ejemplo el 001 de MARC 21
6
7. (Paréntesis)
• Formato compacto para las URIs CURIEs (Compact
URIs)
• Mejoran la legibilidad (en general y para esta
presentación en particular):
URI completa:
h"p://datos.bibliotecanacional.gov.co/personas/Gabriel_García_Márquez=
Prefijo: =bncPersona===h#p://datos.bibliotecanacional.gov.co/personas/!
ID: Gabriel_García_Márquez
= = =
7
8. (Paréntesis)
• Formato compacto para las URIs CURIEs (Compact
URIs)
• Mejoran la legibilidad (en general y para esta
presentación en particular):
URI completa:
h"p://datos.bibliotecanacional.gov.co/personas/Gabriel_García_Márquez=
Prefijo: =bncPersona===h#p://datos.bibliotecanacional.gov.co/personas/!
ID: Gabriel_García_Márquez
= = =
8
bncPersona:Gabriel_García_Márquez
11. Principio 3
(2) Describir las cosas (los recursos, objetos,
entidades) usando estándares de la Web semántica
(RDF, RDFS, SPARQL)
Describimos:
- Mediante tripletas RDF los atributos de nuestros
recursos.
- Utilizando clases y propiedades de
vocabularios o ontologías (FRBR, ISBD, etc)
11
15. Principio 3
15
frbr:fechaDeNacimiento
Reutilizar vocabularios estándar: FRBR, RDA, ISBD..
frbr:esCreadorDe
isbd:HtuloPropiamenteDicho
foaf:Person
Básicamente:
- Clases: Definen el tipo de recurso (Persona, obra,etc)
- Propiedades: Definen carácterísticas del recurso
(fechas, título, nombre, etc.)
16. Buenas prácticas Vocabularios
• Reutilizar vocabularios ampliamente utilizados,
estables y soportados por una comunidad
- ¿Cómo?
• Recomendación 1: Análisis de otros conjuntos de datos
del mismo dominio (Bibliotecas, Museos, etc.)
• Recomendación 2: Buscar conceptos en repositorios de
vocabularios. El más recomendable es LOV (Linked
Open Vocabularies) de la Open Knowledge Foundation
h"p://lov.okfn.org/=
16
18. Resultado de aplicar principios 1, 2 y 3
18
bncPersona:Gabriel_García_Márquez
bncObra:Cien_años_de_soledad
frbr:esCreadorDe
Grafo de URIs describiendo a Gabriel García-Márquez
"6#de#Marzo#de#1927"
frbr:fechaDeNacimiento
Frbr:lugarDeNacimiento
"Colombia"
20. Principio 4
(4) Incluir enlaces a otras HTTP URIs para facilitar el
descubrimiento de más recursos
Tiene 2 vertientes que permiten aumentar/enriquecer
las descripciones:
1- Evitar utilizar cadenas de caracteres en el
objeto de la tripleta y utilizar URIs:
Usar la URI de Colombia en DBpedia frente a utilizar la
cadena "Colombia"
2 - Incluir enlaces a la mismo recurso descrito en
otro conjunto de datos:
Enlaces a García Márquez en VIAF, BNE, etc
20
21. Vertiente 1
21
bncPersona:Gabriel_García_Márquez
"Colombia" no permite recuperar
más información acerca del lugar de
nacimiento, solo el nombre
Frbr:lugarDeNacimiento
"Colombia"
Evitar utilizar cadenas de caracteres en el
objeto de la tripleta y utilizar URIs:
23. Vertiente 2 Enlaces: sameAs
23
bncPersona:Gabriel_García_Márquez
owl:sameAs
Enlaces al mismo recurso en otros
conjuntos de datos enlazados
bne:Gabriel_García_Márquez
Ampliamos
la red de conocimiento sobre
García
Márquez en la BNC (Obras
catalogadas en la BNE,
descripciones en VIAF, etc.)
owl:sameAs
viaf:Gabriel_García_Márquez
24. Buenas prácticas Enlazado
• Enlazar con conjuntos de datos relevantes dentro
de una comunidad determinado
- ¿Cómo?
• Recomendación 1: Recursos como VIAF, BNE o
DBpedia contienen numersos enlaces a otros recursos
similares. Centrarse inicialmente en estos para
maximizar el resultado
• Recomendación 2: Buscar otros conjuntos de datos
dentro del area. En repositorios como:
h"p://datahub.io= 24
28. Ontología basada en vocabularios de IFLA
Especficación
Modelado
Generación
RDF
Publicación
Generación
de enlaces
Explotación
29. Marimba utiliza la ontología para generar RDF
BNE
Especficación
Modelado
Generación
RDF
Publicación
Generación
de enlaces
Explotación
30. Proceso de transformación
30
• How to facilitate the mapping process to library
experts?
1. Use a familiar and intuitive interface: Spreadsheets
2. Work only on what's in the database: Pre-process records
to build the spreadsheets
• 3 step-process 3 different spreadsheets
1. Classification: is it a Person? a Work? a Manifestation?
2. Annotation: name, birth date, title, language of expression
3. Relation: find relationships between entities (Person is
creator of a certain work)
31. Marimba: Proceso de mapping
100 $a
Cervantes
Saavedra,
Miguel de
100 $a frbr:Person
String(100 $a $t) frbr:isCreatorOf100 $a
Cervantes
Saavedra,
Miguel de
$t Don
Quijote de
la Mancha
String(100 $a)
100 $a $t
frbr:titleOfWork100 $t
MARC 21 DATA MARC 21 STRUCTURE RDFS/OWL
100 $a frbr:nameOfPerson
PRE-PROCESSING STEP
has subfield
has subfield
has heading
has heading
has content
has content
contained in
frbr:Work
Heading Class Object property Datatype/Annotation property
maps to
maps to
maps to
maps to
maps to
Librarians manually define the
mappings
Variation
(100$a + $t)
31
33. Marimba: Proceso de transformación a RDF y mappings
IDENTIFICACIÓN ANOTACIÓN RELACIÓN
MAPPING A MAPPING B MAPPING C
34. IDENTIFICACIÓN ANOTACIÓN RELACIÓN
MAPPING A MAPPING B MAPPING C
Mapping Identificación de Entidades:
Dada una etiqueta de campos y una combinación de subcampos,
se determina a qué entidad FRBR se relaciona.
Por ejemplo:
100 $a $d Persona (FRBR Grupo 2)
100 $a $t Obra (FRBR Grupo 1)
Marimba: Proceso de transformación a RDF y mappings
35. IDENTIFICACIÓN ANOTACIÓN RELACIÓN
MAPPING A MAPPING B MAPPING C
Mapping Anotación de Entidades:
Dada una etiqueta de campos y de subcampo, se determina qué
propiedad o atributo de la entidad se anota:
Por ejemplo:
100 $d Fecha asociada a persona
100 $t Titulo de la obra
36. IDENTIFICACIÓN ANOTACIÓN RELACIÓN
MAPPING A MAPPING B MAPPING C
Mapping Relación entre Entidades:
Dados dos tipos de entidades E1 y E2 (e.g. Persona y Obra), y
dado un identificador de subcampo que representa la variación
de subcampos entre E1 y E2 en su punto de acceso principal y
sabiendo que el valor del punto de acceso de E1 está contenido en
E2, se determina que tipo de relación existe entre E1 y E2.
Por ejemplo:
Persona-Obra $t Persona es creadora de Obra
Obra-Obra $n Obra es parte de Obra
Marimba: Proceso de transformación a RDF y mappings
37. Marimba enlaza con otros recursos:
VIAF, DNB, SUDOC, LIBRIS, DBpedia
BNE
http://datos.bne.es/resource/XX1718747
Same As
Same As
Same As
Same As
Same As
LIBRIS
http://libris.kb.se/resource/auth/45369
SUDOC
http://www.idref.fr/026774771/id
DNB
http://d-nb.info/gnd/11851993X
DBpedia
http://dbpedia.org/resource/Miguel_de_Cervantes
VIAF
http://viaf.org/viaf/17220427
Especficación
Modelado
Generación
RDF
Publicación
Generación
de enlaces
Explotación
39. Publicación
• Publicación de los datos
• Publicar los metadatos sobre el dataset con VOID y
DCAT
• Para facilitar el descubrimiento del dataset
• Registrar el conjunto de datos en DataHub
• Generar el sitemap usando sitemap4rdf
• Cargar el sitemap en Google y Sindice
Especficación
Modelado
Generación
RDF
Publicación
Generación
de enlaces
Explotación
40. Explotación
• 2 perspectivas diferentes
- Sistemas y aplicaciones:
1. SPARQL endpoint,
2. Linked Data API
- Interfaces de usuario
• Usando tecnologías abiertas Web facilitamos la
reutilización por terceros y permitimos uso de
herramientas de:
- Data analytics, interfaces/APIs enriquecidas, etc.
40
41. Explotación: Ejemplo
41
Don Quijote de la Mancha
French manifestations
(213)
Novelas Ejemplares
Spanish manifestations
(303)
Don Quijote de la Mancha
Spanish manifestations
(840)
Don Quijote de la Mancha
English manifestations
(247)
Don Quijote de la Mancha
frbr:Work
Miguel de Cervantes
Don Quijote de la Mancha
German manifestations
(49)
Entremeses
Spanish manifestations
(86)
frbr:Work frbr:isEmbodiedIn frbr:Expression
frbr:Expression frbr:IsManifestedBy frbr:Manifestation
frbr:Person frbr:isCreatorOf frbr:Work
( ) Number of resources
Using Open-source tools:
Gephi for example
http://bne.linkeddata.es/graphvis
42. Permitiendo el acceso a aplicaciones
42
Linked Data API: http://datos.bne.es/frontend/persons
43. Acceso y navegación flexible
43
Consuming Out of the box:
• Search by every field
• Access cluster of resources
• Filtering
• Paging
• Serve multiple formats: XML,
Turtle, JSON
45. 45
Interfaces de usuario
Datos enlazados abre la puerta a:
• Re-ranking resultados OPAC results
• Mejor clustering, busquedas facetadas
• Motores de recomendación
• Enriquecimiento de datos y experiencia de
usuario
46. Artículos sobre proceso en datos.bne.es
• Datos.bne.es: A library linked dataset. Semantic
Web Journal 2013 to appear:
h#p://www.seman@cAwebAjournal.net/content/datosbneesAlibraryAlinkedAdataAdataset
• Daniel Vila-Suero and Elena Escolano “Linked Data
at the Spanish National Library and the
application of IFLA RDFS models”. ScatNews,
IFLA Cataloguing news, 2011.
46