Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Sistemas de federação linked data

301 views

Published on

Sistemas de federação linked data

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Sistemas de federação linked data

  1. 1. Sistemas de Federação Linked Data Danusa Ribeiro drbc@cin.ufpe.br
  2. 2. 2 Apresentação baseada em...
  3. 3. 3 Como armazenar e Consumir esses dados?
  4. 4. 4 Armazenar Rdf Store Wrappers banco de dados relacional Web API
  5. 5. 5 Consumir Rdf dump SPARQL endpoint
  6. 6. 6 Consumir Rdf dump SPARQL endpoint
  7. 7. 7 Não consultar apenas 1 dataset Endpoin t Q
  8. 8. 8 Q endpoint RDF RDF RDF endpoint RDF RDF RDF endpoint Link RDF Link RDF Link RDF Link RDF
  9. 9. 9 Qual o BIG Problem? Execução de consultas complexas Consultas Estruturadas sobre múltiplas fontes Respostas das consultas como sendo a união dos múltiplos subgrafos de todos os datasets que responderam a
  10. 10. 10 Então... Como consultar?
  11. 11. 11 Abordagens de Consultas +
  12. 12. 12 Data Warehousing Consultas Federadas (Sistemas de Federação)
  13. 13. 13 Data Warehousing Os dados são coletados e armazenados em um repositório central [Chaudhuri and Dayal ,1997] Consultas são submetidas sobre o repositório central Como se aplica em Linked Data?
  14. 14. 14 Usuário Sparql Endpoin t API Repositório Central de RDF Dados RDF Dados RDF Dados RDF
  15. 15. 15 Data Warehousing RDF Dumps de datasets relevantes para a aplicação Proveniência dos Dados Melhor performance Muito tempo para recuperar os RDFs Dump Maior tempo para carregar tais dumps Dados desatualizados Vantagens desVantagens
  16. 16. 16 Consulta Federada (Sistemas de Federação) Baseada no processamento de consultas distribuídas sobre múltiplas fonte de dados Mediador: recebe as consultas, analisa, decompõe em múltiplas sub consultas e envia para o dataset capaz de responder à consulta.
  17. 17. 17 dataset Q dataset dataset Federação Sistema de Federação sobre um único Repositório Usuário API API API
  18. 18. 18 SPARQL Endpoint dataset Q dataset dataset Federação Usuário Sistema de Federação sobre SPARQL Endpoint SPARQL Endpoint SPARQL Endpoint
  19. 19. 19 SPARQL 1.0 1.1 Consulta Federada (Sistemas de Federação) Interface de Consulta Processador de Consutlas Consulta em SPARQL 1.1 Interface de Consulta Reescrita de Consultas Consulta em SPARQL 1.0 Sistema de Federação de Consultas em SPARQL 1.1 Interface de Consulta Processador de Consutlas Consulta em SPARQL 1.0 SPARQL Endpoint 1.0
  20. 20. 20 Sim... Mas porque eu preciso de um Sistema Federado mesmo?
  21. 21. 21 Fontes de Dados Linked Data do Domínio Life Sciences Find the Chemical equations and Reaction titles of reactions related to only those drugs which are approved along with average Molecular Weight
  22. 22. 22 PREFIX drugbank:<http://www4.wiwiss.fu- berlin.de/drugbank/resource/drugbank/> PREFIX drugType:<http://www4.wiwiss.fu- berlin.de/drugbank/resource/drugtype/> PREFIX kegg:<http://bio2rdf.org/keggvocabulary:> PREFIX keggImage:<http://bio2rdf.org/ns/bio2rdf#> PREFIX purl:<http://purl.org/dc/elements/1.1/> SELECT distinct ?drug ?drugtype ?compound ?molecularWeightAverage ? ReactionTitle ?ChemicalEquation WHERE { ?drug drugbank:drugType drugType:approved . ?drug drugbank:keggCompoundId ?compound . ?drug drugbank:molecularWeightAverage ?molecularWeightAverage . ?enzyme kegg:xSubstrate ?compound . ?Chemicalreaction kegg:xEnzyme ?enzyme . ?Chemicalreaction kegg:equation ?ChemicalEquation . ?Chemicalreaction keggImage:urlImage "http://www.genome.jp/Fig / reactionsmall/R05248.gif " . ?Chemicalreaction purl:title ?ReactionTitle }
  23. 23. 23 SELECT ?drugname ?indication WHERE { FROM <http://localhost/dbpedia.rdf> { ? drug a dbpedia−owl:Drug . ? drug rdfs:label ?drugname . ? drug owl:sameAs ?drugbank . } FROM <http://localhost/drugbank.rdf> { ? drugbank drugbank:indication ?indication . } } SPARQL 1.0
  24. 24. 24 SELECT ?drugname ?indication WHERE { SERVICE <http://dbpedia.org/sparql> { ? drug a dbpedia−owl:Drug . ? drug rdfs:label ?drugname . ? drug owl:sameAs ?drugbank . } SERVICE <http://www4.wiwiss.fu−berlin.de/drugbank/sparql> { ? drugbank drugbank:indication ?indication . } } SPARQL 1.1
  25. 25. 25 Dados Atualizados Não precisa de espaço adicional Consultas Ad-Hoc Consulta Transmitida via protocolos de Rede Uso do operador de Junção Dados desatualizados Técnicas de paralelismo e otimização Vantagens desVantagens Consulta Federada (Sistemas de Federação)
  26. 26. 26 CaracterísticasData Warehousing Universo de Discurso (UoD) Consulta Federada Interface Fontes Conhecidas RDF Dumps SPARQL Endpoint Acesso a dados Originais não sim rápida Baixa/médiaVelocidade de Acesso Dados Armazenados Comparação
  27. 27. 27 • [Bizer et al. 2009] BIZER C., HEATH T., BERNERS-LEE T. Linked data - the story so far. INT. J. SEMANTIC WEB INF. SYST, 2009. • [Bleiholder and Naumann, 2009] BLEIHOLDER, J AND NAUMANN, F. Data fusion. ACM COMPUT. SURV. 41, 1, ARTICLE 1, JANUARY 2009. • [Chaudhuri and Dayal ,1997] CHAUDHURI, D., DAYAL, U. An overview of data warehousing and olap technology. SIGMOD RECORD, 26(1):65-74, 1997. • [Correndo et al. 2010] CORRENDO, G., SALVADORES, M., MILLARD, I., GLASER, H AND SHADBOLT, N. SPARQL query rewriting for implementing data integration over linked data. IN PROCEEDINGS OF THE 2010 EDBT/ICDT WORKSHOPS (EDBT '10). 2010. • [Franklin et al. 2005] FRANKLIN, M., HALEVY, A., MAIER, D. From Databases to Dataspaces: A New Abstraction for Information Management. IN: SIGMOD ’05: ACM SIGMOD INTERNATIONAL CONFERENCE ON MANAGEMENT OF DATA, 2005. • [Haase et al. 2010] HAASE, P., MATH, T, AND ZILLER, M. An evaluation of approaches to federated query processing over linked data. IN PROCEEDINGS OF THE 6TH INTERNATIONAL CONFERENCE ON SEMANTIC SYSTEMS (I-SEMANTICS '10), ACM, NEW YORK, NY, USA. 2010. Referências
  28. 28. 28 • [Halevy et al. 2006] HALEVY, A., RAJARAMAN, A., ORDILLE, J.: Data integration: the teenage years. IN: VLDB’06: 32ND INTERNATIONAL CONFERENCE ON VERY LARGE DATA BASES, ACM, 2006. • [Harting and Langegger 2010] HARTIG, O AND LANGEGGER, A. A DATABASE PERSPECTIVE ON CONSUMING LINKED DATA ON THE WEB. DATENBANK-SPEKTRUM 10(2): 57-66. 2010. • [Langegger et al. 2008] LANGEGGER, A., WÖß, W., BLÖCHL, M. A Semantic Web Middleware for Virtual Data Integration on the Web. IN: PROCEEDINGS OF THE 5TH EUROPEAN SEMANTIC WEB CONFERENCE (ESWC). VOLUME 5021 OF LECTURE NOTES IN COMPUTER SCIENCE. SPRINGER VERLAG, PP. 493–507. 2008. • [Lee et al. 2010] LEE, J., PARK, J., PARK, M., CHUNG, C AND MIN, J. An intelligent query processing for distributed ontologies. J. SYST. SOFTW. 83, 1 (JANUARY 2010), 85-95. 2010. • [Lóscio, 2003] LÓSCIO, B. F. Managing the Evolution of XML-based Mediation Queries. PH.D. THESIS, FEDERAL UNIVERSITY OF PERNAMBUCO, BRAZIL, 2003. • [Schwarte et al. 2011] Schwarte, A., Haase, P., Hose, K., Schenkel, R ., Schmidt, M: FedX: A Federation Layer for Distributed Query Processing on Linked Open Data. ESWC (2) 2011: 481-486 Referências
  29. 29. 29 Obrigada!!! drbc@cin.ufpe.br

×