URI (Universal Resource Identifier) Similar a una URL No es “locator”, sino “identifier” “Una patente identifica un auto, pero no lo localiza” HTTP URIs Identifica funcionalmente un recurso en la Web Una URI identifica sólo una cosa
Todo se identifica con una URI URIs Mi página: http://graves.cl Yo http://alvaro.graves.cl URIs también son para predicados Ej: Angelina Jolie sabe actuar Ej: El helado sabe a chocolate CURIE: http://example.org/xyz se puede escribir como PREFIX ex: <http://example.org/> ex:xyz
Blank nodesA veces no podemos (o no queremos) identificaruniversalmente algún recurso Ej. Yo tengo un amigo que vive en Santiago Blank nodes identifica un recurso localmente (no globalmente)
Literales Valores se definen como strings Pueden ser tipados Pueden estar en un idioma apellido http://alvaro.graves.cl "Graves"
RDF per se define unasintaxis de grafo, peroprovee poca semántica (Se necesitan más vocabularios y ontologías)
RDFS (RDF Schema)Define concepto de clase (y subclase)Define concepto de propiedad (y subpropiedad)Ej.<http://alvaro.graves.cl> rdf:type foaf:Person . foaf:Person rdfs:subClassOf rdfs:Class .
Vocabularios y OntologíasVocabulario: Define un conjunto de términos paradescribir un dominioOntología: Modelo formal de una parte del mundoLa distinción es cuán expresivo es el modelo
Ejemplo: FOAFFriend-of-a-Friend (FOAF) modela relaciones socialesNamespace: http://xmlns.com/foaf/0.1/Clase: foaf:PersonPropiedades Primer nombre: foaf:firstName Apellido: foaf:lastName Conoce a: foaf:knows
Dominio y RangoSimilar a las funciones matemáticas Dominio: De qué clase “sale” esta propiedad Rango: A qué clase “llega” esta propiedad ex:Robinfoaf:knows tiene dominio y rango foaf:Person Si X foaf:knows ex:Batman foaf:knows => X rdf:type foaf:Person Si ex:Robin foaf:knows Y ex:Batman => Y rdf:type foaf:Person
OWL (Web Ontology Language)Provee restricciones lógicasSirve para expresar cosas comoUna persona tiene exactamente una madre yexactamente un padrePredicado “ex:madreDe” es inverso de “ex:tieneMadre”
Parte II: Linked Data
The novelty of the SemanticWeb is not the “semantic”but the “web” Frank Van HarmelenA little semantics goes along way Jim Hendler
Linked Data“Buenas prácticas” para la Web Semántica Identificar URIs Proveer HTTP URIs de manera de poder referenciar en la Web Proveer información útil (para humanos y máquinas) al derreferencear Enlazar a otras URIs relacionadas
Linked Data cloud (2007)
Linked Data cloud (2008)
Linked Data cloud (2009)
Linked Data cloud (2010)
Linked Data cloud (2011)
Linked Data cloudUsar y compartir miles de millones de datosdisponibles en la WebMecanismos estándar para acceder a ellosMecanismo estándar para explorar y descubrir másdatos
Triple Stores Bases de datos que soportan RDF (grafos dirigidos con etiquetas AllegroGraph Virtuoso Joseki/Fuseki 4store Muchos otros....
Lenguaje de consulta: SPARQL DIsponible en triple stores (tambien en RDBMS) SPARQL 1.1: Permite expresiones regulares sobre predicadosPREFIX ex: <http://example.org/>PREFIX foaf: <http://xmlns.com/foaf/0.1/>SELECT ?x ?apellido WHERE{?x a foaf:Person ; foaf:familyName ?apellido; foaf:name Juan; foaf:knows ex:pedro .}
Idea: ¿Y si dejamos unabase de datos abierta paraque cualquiera puedaejecutar consultas?
SPARQL endpointsDBpedia - http://dbpedia.org/sparqlData.gov - http://semantic.data.gov/sparqlData.gov.uk - http://data.gov.uk/sparqlDrugBank - http://www4.wiwiss.fu-berlin.de/drugbank/sparqlLOGD - http://logd.tw.rpi.edu/sparqlBiblioteca del Congreso de Chile - http://datos.bcn.cl/sparql
HTML+RDFa <p about="http://alvaro.graves.cl"> My name is <span property=”foaf:name”>Alvaro Graves</span>. Im a PhD student in <a rel="foaf:schoolHomepage" href="http:// www.rpi.edu">Rensselaer Polytechnic Institute</a>. </p> Tu sitio == Tu API
Beneficios de RDFaFácil de usar si existen templatesNo hay que administrar algo nuevoMejora el SEO (BestBuy, Schema.org)
....Pero yo uso una RDBMSExisten herramientas para mapear schemasrelacionales y publicar datos en RDF Triplify D2R
De RDF a Linked DataDifícil: Enlazar correctamenteUso de predicados owl:sameAs skos:broader / skos:narrower rdfs:seeAlso dcterms:related foaf:primaryTopicOf / foaf:primaryTopic
De RDF a Linked Data (2) Enlazar a URIs de múltiples datasetsPREFIX : <http://logd.tw.rpi.edu/id/us/state/>PREFIX dbpedia: <http://dbpedia.org/resources/>PREFIX cyc: <http://sw.opencyc.org/concept/>PREFIX cyc: <http://rdf.freebase.com/ns/m/>:Wyoming owl:sameAs dbpedia:Wyoming, cyc:Mx4rvViOeZwpEbGdrcN5Y29ycA, fb:0846v .
Parte III: Aplicaciones
Publicación de datoscientíficosProblemas actuales implican trabajos multi/inter/transdisciplinarios Ej. No existe un científico que estudie el Cambio Climático Si existen geólogos, biólogos, químicos, economistas, etc.¿Cómo compartir datos e información entrecomunidades tan diversas?
IBM WatsonMeta: Ganar a los mejores delmundo en Jeopardy! Jeopardy presenta una respuesta, se contesta una preguntaWatson usó tecnologíassemánticas (entre otras) paraentender las preguntas
BestBuyUno de los retail tecnológicosmás grandes en USAMeta: aumentar visibilidad deproductosUso de RDFa en las páginasde sus productos aumentó en30% el tráfico en su sitio
Vocabulario Top-down creado por Google, Yahoo! yBingPermite describir entidades en una página(restaurantes, personas, episodio de TV, etc.)Soporte de Microdata y RDFa 1.1
Búsqueda de expertiseen NASAProblema: Necesidad de ubicarexpertos en NASA 3 proyectos previos (autorreporte de expertise) fallaronUso de SemWeb para integrar datosextraídos de multiples bases dedatosSistema: 300K + 20K/añoAhorro de 38M USD en costos
Linking Open GovernmentData (LOGD)Mayo 2009: Data.gov Primer portal de datos abiertosHoy: > 400.000 datasets Calidad de datos: De todo tipoLOGD: Convertir datos aRDF y enlazar a LOD cloud http://logd.tw.rpi.edu
Datos tabulares a RDF
2 procesosConversión automática Rápida, fácil, representación de baja calidadConversión manual Curación humana, representación de alta calidad
Demos
Presupuesto + NYT
Seguridad pública
Detección de errores
ConclusionesLa Web Semántica no es el futuro Está siendo usada ahora para resolver problemas actualesFacilita la integración, exploración y compartir datosReduce barreras de entradas “SemWeb no hace más cosas, sino que las hace más fácil”