Your SlideShare is downloading. ×

SPARQL Endpoint

1,248

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,248
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
28
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. SPARQL Endpoint Alberto Trindade Tavares
  • 2. SPARQL Endpoint
    • Um Sparql Endpoint é um serviço que implementa o protocolo SPARQL.
        • SPARQL: Linguagem e protocolo para consulta de dados RDF.
    • Permite ao usuário (humano ou máquina) fazer uma consulta a uma base de dados RDF usando a linguagem SPARQL.
    • O resultado é retornado em um formato processável por máquina:
        • RDF
        • JSON
        • Etc.
  • 3.
    • Na Web de Dados, os SPARQL Endpoints são interfaces de consulta aos Datasets.
    • Fontes de dados da Linked Data usualmente fornecem um SPARQL endpoint para os seus Datasets.
      • Exemplos:
    SPARQL Endpoint Dataset URI do SPARQL Endpoint DBPedia
        • http://dbpedia.org/sparql
    BBC Programmes and Music http://lod.openlinksw.com/sparql/ DBLP Bibliography Database
        • http://www4.wiwiss.fu-berlin.de/dblp/sparql
    LinkedGeoData http://linkedgeodata.org/sparql
  • 4. Exemplo: DBPedia Resultado da consulta em formato HTML Interface fornecida para submissão de consulta SPARQL
  • 5.
    • Podemos acessar a um SPARQL Endpoint de duas maneiras:
      • Através da interface web fornecida quando se acessa a URI do endpoint por um navegador.
      • Através de bibliotecas de linguagens de programação.
        • Exemplos:
          • Jena (Java) <http://jena.sourceforge.net / >
          • ARC (PHP) <http://arc.semsol.org/>
          • SPARQL Wrapper (Python) <http://sparql-wrapper.sourceforge.net/>
          • PySPARQL (Python) <http://code.google.com/p/pysparql/>
    Acessando SPARQL Endpoints
  • 6.
    • Podemos utilizar um SPARQL Endpoint existente que fornece acesso a cópias de Datasets relevantes.
    • Exemplo:
        • OpenLink Software através do projeto Linking Open Data fornece um SPARQL Endpoint sobre os principais datasets da web de dados <http://lod.openlinksw.com/sparql>
    • Problemas com dados desatualizados e nem sempre temos todos os datasets relevantes na coleção.
    Como consultar um conjunto de Datasets
  • 7.
    • Uma outra ideia é construirmos nosso próprio repositório de dados RDF a partir de cópias de Datasets relevantes e consultar sobre esses dados
    • Entre alguns repositórios de dados RDF disponíveis, podemos utilizar o Jena TDB
        • Componente do Jena que fornece armazenamento altamente escalável de dados RDF <http://jena.hpl.hp.com/wiki/TDB>
    • Devemos criar um SPARQL Endpoint que forneça acesso ao repositório de dados, para isso podemos usar o Joseki, um servidor RDF que fornece uma interface HTTP SPARQL a repositórios TDB
        • Joseki <http://www.joseki.org/>
    Como consultar um conjunto de Datasets
  • 8.
    • Para construirmos esse repositório podemos buscar dados através de um Web Crawler que trabalhe sobre a Linked Data
        • Exemplo: LDSpider <http://ldspider.googlecode.com>
    • Deve haver a integração do crawler com o repositório de dados para armazenamento das triplas RDF buscadas da Web de Dados
    • Através de um SPARQL Endpoint podemos realizar consultas sobre os dados recuperados a partir de crawlings.
    Como consultar um conjunto de Datasets
  • 9.
    • Existem outras abordagens para fazer consultas sobre um conjunto de Datasets, tais como:
      • Processamento de Consultas Federadas
          • Consultar um mediador que distribui subconsultas a fontes relevantes e integra os seus resultados.
      • Consultas seguidas
          • Enviar consultas consecutivas sobre os datasets baseado em resultados de consultas anteriores.
    Como consultar um conjunto de Datasets

×