Reescrita de Consultas em Federações deDados Interligados usando uma Abordagem   pay-as-you-go para a Descoberta de       ...
Agenda Introdução Motivação Caracterização da Contribuição Trabalhos Relacionados Estado Atual do Trabalho Referênci...
Introdução        Workshop de Teses e Dissertações – SBBD 2012                                                       3
Introdução• Um dos principais desafios em Sistemas para  Integração de Dados são:   Reescrita de consultas           Work...
Introdução                                 Um componente fundamental para a reescrita                                 de c...
Introdução                                                  Atualizado em Setembro de 2011                                ...
Introdução• Arquiteturas de Aplicações LD   Centralizada   Navegação entre links   Federada               Workshop de T...
ObjetivosObjetivo Geral: propor uma solução para o problema de reescrita de consultasem federações de conjuntos de dados i...
Definições Preliminares• Federação de dados interligados I = {S, M, C} onde:    S = {s1,...,sn}: conjunto de conjuntos de...
Definição do ProblemaDada uma federação de dados interligados I = {S, M, C}, estamos interessados em propor uma solução pa...
Visão Geral da Abordagem                                     Consulta Q                                                   ...
Caracterização da Contribuição• Correspondências entre o esquema de mediação e os conjuntos  de dados    Pay-as-you-go   ...
Caracterização da Contribuição<owl:Class rdf:ID="Person">   <rdfs:subClassOf rdf:resource="#Legal-Agent"/>   <rdfs:subClas...
Caracterização da Contribuição<owl:Class rdf:ID="Person">   <rdfs:subClassOf rdf:resource="#Legal-Agent"/>   <rdfs:subClas...
Caracterização da Contribuição<owl:Class rdf:ID="Person">   <rdfs:subClassOf rdf:resource="#Legal-Agent"/>   <rdfs:subClas...
Um exemplo• Para ilustrar a abordagem proposta:   – Seja I = {S, M, C} uma federação de dados interligados     construída ...
Um exemplo  Classes        PropriedadesPublication Identifier, Title, Abstract  Person       Name, Biography,             ...
Um exemplo• Seja a consulta q1 : “Retorne os títulos dos artigos publicados  pelo autor Alon Y. Halevy. Além disso, recupe...
Um exemplo i. Extração dos termos da consulta      – {Title, Author, HomePage, Biography e Name}  ii. Identificação de cor...
Um exemplo                   Consulta q1                                    ResultadoPREFIX                               ...
Um exemploiv. Integração dos resultadosBiography Alon Yitzchack Halevy is a renowned Israeli-American          computer sc...
Trabalhos Relacionados• [Markis et al. 2012] SPARQL-RW: Transparent Query Access  over Mapped RDF Data Sources   – reescri...
Próximos Passos• Especificação dos processos para:   – Extração dos termos da consulta   – Geração de correspondências   –...
Contribuiçõesi.   Uma metodologia para geração incremental de     correspondências entre ontologias a partir do uso das   ...
Referências•   [Bizer et al 2009] Bizer C., Heath T., Berners-Lee T. (2009) Linked data -    the story so far. Int. J. Sem...
Referências•   [Lee et al. 2009] Lee, J., Park, J. H., Park, M. J., Chung, C. W., Min, J. K.    (2010). “An intelligent qu...
Obrigada!!!      drbc@cin.ufpe.br      AgradecimentosWorkshop de Teses e Dissertações – SBBD 2012                         ...
Upcoming SlideShare
Loading in …5
×

Reescrita de Consultas em Federações de Dados Interligados usando uma Abordagem pay-as-you-go para a Descoberta de Correspondências

381 views

Published on

Apresentado no Workshop de Teses e Dissertações em Banco de Dados no 27º Simpósio Brasileiro de Banco de Dados.
São Paulo - SP
2012

Published in: Education
  • Be the first to comment

  • Be the first to like this

Reescrita de Consultas em Federações de Dados Interligados usando uma Abordagem pay-as-you-go para a Descoberta de Correspondências

  1. 1. Reescrita de Consultas em Federações deDados Interligados usando uma Abordagem pay-as-you-go para a Descoberta de Correspondências Danusa Ribeiro drbc@cin.ufpe.br Orientadora: Bernadette Farias Lóscio bfl@cin.ufpe.br Nível: Mestrado Ano de Ingresso no programa: 2012 Época esperada de conclusão: Março de 2014 Workshop de Teses e Dissertações – SBBD 2012
  2. 2. Agenda Introdução Motivação Caracterização da Contribuição Trabalhos Relacionados Estado Atual do Trabalho Referências Workshop de Teses e Dissertações – SBBD 2012 2
  3. 3. Introdução Workshop de Teses e Dissertações – SBBD 2012 3
  4. 4. Introdução• Um dos principais desafios em Sistemas para Integração de Dados são:  Reescrita de consultas Workshop de Teses e Dissertações – SBBD 2012 4
  5. 5. Introdução Um componente fundamental para a reescrita de consultas é conjunto de mapeamentos entre o esquema de mediação e os esquemas locais Q Esquema de Mediação Q + M1 Q + M2 Q + M3 Q’ Q’’ Q’’’ A B C Workshop de Teses e Dissertações – SBBD 2012 5
  6. 6. Introdução Atualizado em Setembro de 2011 http://richard.cyganiak.de/2007/10/lod/ Workshop de Teses e Dissertações – SBBD 2012 6
  7. 7. Introdução• Arquiteturas de Aplicações LD  Centralizada  Navegação entre links  Federada Workshop de Teses e Dissertações – SBBD 2012 7
  8. 8. ObjetivosObjetivo Geral: propor uma solução para o problema de reescrita de consultasem federações de conjuntos de dados interligados (Linked Data).Objetivos Específicos:  Especificação de um processo pay-as-you-go para a geração de correspondências  Especificação de um processo para reescrita de consultas em federações de dados interligados  Desenvolvimento de um protótipo com funcionalidades para a extração de termos de uma consulta, reescrita de consulta e apresentação dos resultados Workshop de Teses e Dissertações – SBBD 2012 8
  9. 9. Definições Preliminares• Federação de dados interligados I = {S, M, C} onde:  S = {s1,...,sn}: conjunto de conjuntos de dados interligados  M: esquema de mediação  C = {c1,...,cn}: um conjunto de correspodências entre M e cada um dos conjuntos de dados Workshop de Teses e Dissertações – SBBD 2012 9
  10. 10. Definição do ProblemaDada uma federação de dados interligados I = {S, M, C}, estamos interessados em propor uma solução para o seguinte problema:dada uma consulta Q submetida em I de acordo com o esquemade mediação M, como decompor Q em uma ou mais consultas a serem executadas sobre um ou mais conjuntos de dados si considerando que nem todas as correspondências necessárias para a reescrita de Q estão disponíveis em C ? Workshop de Teses e Dissertações – SBBD 2012 10
  11. 11. Visão Geral da Abordagem Consulta Q Extração de Mediador TermosOntologia de Mediação Visualização Busca de Geração de Novas dos Resultados Correspondências Correspondência Repositório de Correspondências Geração de Integração dos Subconsultas Resultados Federação de Dados Ontologia Local I Ontologia Local II Ontologia Local N Interligados SPARQL SPARQL SPARQL Endpoint Endpoint Endpoint RDF RDF RDF Workshop de Teses e Dissertações – SBBD 2012 11
  12. 12. Caracterização da Contribuição• Correspondências entre o esquema de mediação e os conjuntos de dados  Pay-as-you-go  As correspondências necessárias para o processo de reescrita de uma consulta Q serão identificadas no momento da execução da consulta e de acordo com as propriedades que estão sendo consultados por Q Workshop de Teses e Dissertações – SBBD 2012 12
  13. 13. Caracterização da Contribuição<owl:Class rdf:ID="Person"> <rdfs:subClassOf rdf:resource="#Legal-Agent"/> <rdfs:subClassOf rdf:resource="&support;Tangible-Thing"/> <rdfs:isDefinedBy rdf:resource="&base;"/></owl:Class><owl:DatatypeProperty rdf:ID="full-name"><rdfs:domain rdf:resource="#Person"/> DBLP<rdf:Property rdf:about=“http://xmlns.com/foaf/0.1/surname”rdfs:label="Surname”> <rdfs:domain rdf:resource="http://xmlns.com/foaf/0.1/Person"/> <rdfs:range rdf:resource="http://www.w3.org/2000/01/rdf- schema#Literal"/> <rdfs:isDefinedBy rdf:resource="http://xmlns.com/foaf/0.1/"/></rdf:Property> DBpedia Workshop de Teses e Dissertações – SBBD 2012 13
  14. 14. Caracterização da Contribuição<owl:Class rdf:ID="Person"> <rdfs:subClassOf rdf:resource="#Legal-Agent"/> <rdfs:subClassOf rdf:resource="&support;Tangible-Thing"/> <rdfs:isDefinedBy rdf:resource="&base;"/></owl:Class><owl:DatatypeProperty rdf:ID="full-name"><rdfs:domain rdf:resource="#Person"/> DBLP<rdf:Property rdf:about=“http://xmlns.com/foaf/0.1/surname”rdfs:label="Surname”> <rdfs:domain rdf:resource="http://xmlns.com/foaf/0.1/Person"/> <rdfs:range rdf:resource="http://www.w3.org/2000/01/rdf- schema#Literal"/> <rdfs:isDefinedBy rdf:resource="http://xmlns.com/foaf/0.1/"/></rdf:Property> DBpedia Workshop de Teses e Dissertações – SBBD 2012 14
  15. 15. Caracterização da Contribuição<owl:Class rdf:ID="Person"> <rdfs:subClassOf rdf:resource="#Legal-Agent"/> <rdfs:subClassOf rdf:resource="&support;Tangible-Thing"/> <rdfs:isDefinedBy rdf:resource="&base;"/></owl:Class><owl:DatatypeProperty rdf:ID="full-name"><rdfs:domain rdf:resource="#Person"/> DBLP<rdf:Property rdf:about=“http://xmlns.com/foaf/0.1/surname”rdfs:label="Surname”> <rdfs:domain rdf:resource="http://xmlns.com/foaf/0.1/Person"/> <rdfs:range rdf:resource="http://www.w3.org/2000/01/rdf- schema#Literal"/> <rdfs:isDefinedBy rdf:resource="http://xmlns.com/foaf/0.1/"/></rdf:Property> DBpedia Workshop de Teses e Dissertações – SBBD 2012 15
  16. 16. Um exemplo• Para ilustrar a abordagem proposta: – Seja I = {S, M, C} uma federação de dados interligados construída sobre o domínio de dados bibliográficos, onde: S = {DBLP, ACM, DBpedia} M = {Ontologia de Mediação} C = Workshop de Teses e Dissertações – SBBD 2012 16
  17. 17. Um exemplo Classes PropriedadesPublication Identifier, Title, Abstract Person Name, Biography, HomePage, AuthorUniversity Name, Address, CountryClasses e Propriedades da Ontologia de Mediação Ontologia de Mediação Workshop de Teses e Dissertações – SBBD 2012 17
  18. 18. Um exemplo• Seja a consulta q1 : “Retorne os títulos dos artigos publicados pelo autor Alon Y. Halevy. Além disso, recupere a homepage do autor bem como uma breve apresentação sobre o mesmo” SELECT ?title, ?homepage, ?bio WHERE { ?publication Title ?title . ?publication Author ?author . ?author HomePage ?homepage . ?author Biography ?bio . ?author Name “Alon Y. Halevy” . } Workshop de Teses e Dissertações – SBBD 2012 18
  19. 19. Um exemplo i. Extração dos termos da consulta – {Title, Author, HomePage, Biography e Name} ii. Identificação de correspondênciasOntologia de Mediação ACM DBLP DBpedia Name akt:full-name akt:full-name dbpedia:name, foaf:surname, foaf:givenName Biography - - rdf:comment HomePage - - foaf:page, foaf:homepage Title akt:has-title akt:has-title - Workshop de Teses e Dissertações – SBBD 2012 19
  20. 20. Um exemplo Consulta q1 ResultadoPREFIX Binding Valueakt:<http://www.aktors.org/ontology/portal#> 1 ?title Guest EditorialPREFIX akts: 2 ?title Answering queries using views iii. Geração de subconsultas (reescrita)<http://www.aktors.org/ontology/support#> 3 ?title Queries independent of updatesSELECT DISTINCT ?title WHERE { 4 ?title Logic-based techniques in data…?publication akt:has-title ?title .?publication akt:has-author ?author . 5 ?title MiniCon: A scalable algorithm …?author akt:full-name "Alon Y. Halevy".}Limit 5 Consulta q2 ResultadoPREFIX akt: Binding Value<http://www.aktors.org/ontology/portal#> 1 ?title Equivalence, Query-Reachability …PREFIX akts: 2 ?title Constraints and Redundancy in…<http://www.aktors.org/ontology/support#> 3 ?title Exploiting Irrelevance…SELECT DISTINCT ?title WHERE { 4 ?title Queries Independent of Updates.?publication akt:has-title ?title .?publication akt:has-author ?author . 5 ?title Query Optimization by…?author akt:full-name "Alon Y. Halevy".}Limit 5 Consulta q3 ResultadoPREFIX foaf: <http://xmlns.com/foaf/0.1/> Binding ValuePREFIX dbpedia: <http://dbpedia.org/resource/> 1 ?homepage http://alonhalevy.blogspot.com/SELECT DISTINCT ?homepage, ?bio WHERE {?y dbpedia-owl:wikiPageExternalLink ?homepage .?y rdfs:comment ?bio . ?bio Alon Yitzchack Halevy is..?y rdf:type foaf:Person .?y dbpprop:name "Halevy, Alon Y."@en} Workshop de Teses e Dissertações – SBBD 2012 20
  21. 21. Um exemploiv. Integração dos resultadosBiography Alon Yitzchack Halevy is a renowned Israeli-American computer scientist and a leading researcher in the area of data integration. …HomePage http://en.wikipedia.org/wiki/Alon_Y._HalevyTitle Guest Editorial, Answering queries using views, Queries independent of updates… Workshop de Teses e Dissertações – SBBD 2012 21
  22. 22. Trabalhos Relacionados• [Markis et al. 2012] SPARQL-RW: Transparent Query Access over Mapped RDF Data Sources – reescrita de consultas SPARQL – integrar dados RDF• [Lee et al. 2010] An intelligent query processing for distributed ontologies – reescrita de consultas SPARQL – Integrar dados Linked Data Workshop de Teses e Dissertações – SBBD 2012 22
  23. 23. Próximos Passos• Especificação dos processos para: – Extração dos termos da consulta – Geração de correspondências – Geração das subconsultas (reescrita)• Caracterização dos Mapeamentos entre as Múltiplas Ontologias• Definição de um cenário para a realização de testes Workshop de Teses e Dissertações – SBBD 2012 23
  24. 24. Contribuiçõesi. Uma metodologia para geração incremental de correspondências entre ontologias a partir do uso das propriedades providas por OWL, RDF, RDFS, SKOSii. Especificação do processo de reescrita de consultas SPARQL em federações de conjuntos de dados interligadosiii. Implementação de um protótipo para validação das abordagens propostas Workshop de Teses e Dissertações – SBBD 2012 24
  25. 25. Referências• [Bizer et al 2009] Bizer C., Heath T., Berners-Lee T. (2009) Linked data - the story so far. Int. J. Semantic Web Inf. Syst, 2009.• [Franklin et al. 2005] Franklin, M., Halevy, A., Maier, D. “From Databases to Dataspaces: A New Abstraction for Information Management”. In: SIGMOD ’05: ACM SIGMOD international conference on Management of Data (2005).• [Halevy et al. 2006a] Halevy, A., Rajaraman, A., Ordille, J.: “Data integration: the teenage years”. In: VLDB’06: 32nd International Conference on Very Large Data Bases, ACM (2006).• [Herschel & Heese 2005] Herschel, S., Heese, R. “Humboldt Discoverer: A Semantic P2P index for PDMS”. In: Proc. of the International Workshop Data Integration and the Semantic Web, Porto, Portugal, 2005. Workshop de Teses e Dissertações – SBBD 2012 25
  26. 26. Referências• [Lee et al. 2009] Lee, J., Park, J. H., Park, M. J., Chung, C. W., Min, J. K. (2010). “An intelligent query processing for distributed ontologies”, Journal of Systems and Software, Volume 83, Issue 1, January 2010, Pages 85-95.• [Lóscio 2003] Lóscio, B. F. “Managing the Evolution of XML-based Mediation Queries”. Ph.D. Thesis, Federal University of Pernambuco, Brazil, 2003.• [Makris et al. 2012] Makris, K., Bikakis, N., Giodasis, N., Christodoulakis, S. (2012). “SPARQL-RW: Transparent Query Access over Mapped RDF Data Sources”. EDBT, 2012., Berlin, Germany.• [Mendes et al. 2012] Pablo N. M., Hannes, M., Bizer, C. (2012). Sieve: linked data quality assessment and fusion. In Proceedings of the 2012 Joint EDBT/ICDT Workshops (EDBT-ICDT 12), ACM, New York, NY. Workshop de Teses e Dissertações – SBBD 2012 26
  27. 27. Obrigada!!! drbc@cin.ufpe.br AgradecimentosWorkshop de Teses e Dissertações – SBBD 2012 27

×