05/11/2012                                                      GBD/UFSCPD&E em Bancos de Dados Complexos                 ...
05/11/2012Consultas por similaridade e metadados  SELECT id, Name, Age, Pic  FROM SocialWebTab  WHERE 20 <= Age < 30 AND P...
05/11/2012   Análise de informação (drill-down)                               Temporal analysis                          M...
05/11/2012              Performance comparison                                                    Bases de dados e ferrame...
05/11/2012    BDs nas Nuvens - TCCs                                            Ferramentas de Propósito Geral- TCCs●   Int...
Upcoming SlideShare
Loading in...5
×

LISA - Laboratório de Integração de Sistemas e Aplicações

283

Published on

Enormes volumes de dados têm sido coletados por uma variedade de dispositivos e sistemas de informação, tais como redes de sensores e a Web social. Muitos desses dados (como por exemplo, documentos, dados multimídia e séries temporais) são categorizados como complexos, pois sua representação não se restringe a campos numéricos ou strings curtas. Esta palestra faz uma breve descrição das pesquisas sendo realizadas pelo grupo de bancos de dados da UFSC, em cooperação com outras instituições nacionais e estrangeiras, na área de gerência e análise de grandes volumes de dados complexos, comênfase em dados semi-estruturados, imagens

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
283
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

LISA - Laboratório de Integração de Sistemas e Aplicações

  1. 1. 05/11/2012 GBD/UFSCPD&E em Bancos de Dados Complexos Objetivo: Pesquisa e desenvolvimento de soluções para problemas de gerenciamento de dados no GBD-UFSC Ênfase: Dados complexos e não-convencionais (documentos, XML, Web, espaciais, temporais, multimídia, redes, …) Corpo Docente Carina F. Dorneles Ronaldo S. Mello Carina F. Dorneles Renato Fileto Dr., UFRGS, 2002 Dra., UFRGS, 2006 Pos-doc, University of Utah, 2010 Ronaldo S. Mello BDs Web, dataspaces, BDs Web, cloud DBs, NO-SQL, dados semi-estruturados, Vânia Bogorny dados semi-estruturados similaridade Renato Fileto Vania Bogorny Dr., UNICAMP, 2003 Dra., UFRGS, 2006 Pos-doc, USP 2011-2012 Pos-doc, Hasselt Univ., 2007 Pos-doc, UFRGS, 2008 Recup. informação, semântica, contextos, DWs espaço-temporais Trajetórias de objetos móveis, BDs espaço-temporais 1 Case study: dermatology Analytical procedures vary with the equipment used to gather the image, body part, age of the patient, history, etc. • Individual: woman Prof. Renato Fileto • • Body part: tight Age: 28 years old • History: tuning booth use Profa. Vania Bogorny • Change: darkening color • Biopsy result: Early Melanoma • Body part: cheek • Change: darkening color fileto@inf.ufsc.br • Diagnose: Early Melanoma 2012 / 2A particular focus: human faces Complex data retrieval Associated conventional Complex data Objects R = { < a1 , … , ad , s1 , … , sn > } Where: • ai ∈ Di is a set of values from the domain Di (1 ≤ i ≤ d ) used to identify and describe the tuple • sj ∈ Sj is a complex data object, with associated metadata and extracted features, from a collection S (1 ≤ j ≤ n , 1 ≤ n < N = |S|) 1
  2. 2. 05/11/2012Consultas por similaridade e metadados SELECT id, Name, Age, Pic FROM SocialWebTab WHERE 20 <= Age < 30 AND Pic NEAR ( SELECT Pic FROM SocialWebTab WHERE name = “Pelé” ) STOP AFTER 10; SELECT E.diagnosis, E.Img FROM Exam E INNER JOIN Patient P ON E.idP = P.idP WHERE P.Age < 30 and Exam.bodyPart = “tight” AND E.Img NEAR D:Imagessk_11424_0.jpg BY Texture RANGE 0.0265;Fragmentos de dados Bases de dados e ferramentas CoPhIR – 110 milhões de imagens e metadados do FLICKR MIRFLICKR – milhares de imagens anotadas do FLICKR CLEF – imagens médicas e da Wikipedia anotadas Base de Telemedicina de Santa Catarina – fragmentos SISAP – bases de dados e biblioteca de índices métricos SIREN – sistema que suporta consultas por similaridade FMI-SIR – biblioteca suportando consultas por similaridade via índices métricos no Oracle Oracle Intermedia – extensões do Oracle para tratamento de dados multimídiaCooperações DW Celesc LAPIX/UFSC, LabTelemed/UFSC ICMC/USP – São Carlos – SP IC/UNICAMP – Campinas – SP UEL – Londrina – PR ISTI/CNR – Pisa – Itália 2
  3. 3. 05/11/2012 Análise de informação (drill-down) Temporal analysis Maio / 2010 Spatial temporal DBs and Análise de informação (Trace) semantic tractories Abril / 2010 Junho / 2010Feature Type: Hotel Feature Type: Feature Type: CafeGoal Types: Restaurant DayStaying, Goal Types: Goal Types: Extending SMoT for nested sites RiverScenery, ItalianCuisine, HistoricScenery, TuscanCuisine, RiverScenery, EuropeanCuisine HistoricScenery LiveMusic 3
  4. 4. 05/11/2012 Performance comparison Bases de dados e ferramentas Milan – trajetórias GPS de veículos privados Tuscany Mobility – trajetórias GSM de pessoas Rio – trajetórias GPS de veículos Florianópolis – colhendo trajetórias via GPS Stops found Weka – com extensões para tratar trajetórias Running time with Running time without Ferramentas para DWs nested regions nested regions Ferramentas para BDs geográficos Ferramentas para gerência de ontologias e anotações Cooperações ISTI/CNR – Pisa – Itália Un. Ca’ Foscari – Veneza - Itália UPRC – Atenas - Grécia Prof. Ronaldo S. Mello Univ. New Brunswick – Fredericton – Canada Profa. Carina F. Dornelles UFPE – Recife – PE UFCE – Fortaleza – CE PUC-Rio – Rio de Janeiro – RJ ronaldo@inf.ufsc.br Embrapa, Epagri, Celesc, Defesa Civil 2012 / 2 Tópicos Gerais de Pesquisa Dados na Web - TCCs● Dados na Web ● Web Forms (Deep Web) ● Atividades ➔ Interface gráfica para um sistema de busca por similaridade para – Extração, integração e consulta por similaridade a dados Web forms (WF-Sim - já implementado) relevantes em fontes de dados na Web ➔ Definição de consultas (filtros) e exibição ranqueada do resultado – Principais fontes de dados ➔ Incorporação do WF-Sim ao DeepPeep ● Web forms (“Deep web” ou BDs escondidos), Web tables, Docs XML ➔ Tornar o WF-Sim um módulo do DeepPeep● BDs nas Nuvens (BDs No-SQL) ➔ DeepPeep: máquina de busca para Web forms mais popular ● Atividades ● Web Tables – Integração, consulta por similaridade, mapeamento relacional- ➔ Descoberta (usando similaridade) e catalogação de equivalências NoSQL (mapeamentos) entre tabelas heterogêneas no mesmo domínio● Ferramentas para gerência de dados de propósito ➔ Integração de tabelas heterogêneas (em tabelas globais) geral ➔ Decomposição de consultas sobre tabelas globais ➔ Integração de resultados de consultas sobre cada Web table 4
  5. 5. 05/11/2012 BDs nas Nuvens - TCCs Ferramentas de Propósito Geral- TCCs● Integração de BDs No-SQL ● Ferramentas de apoio ao ensino de BD ➔ Descoberta (usando similaridade) de BDs No-SQL equivalentes ➔ Exemplos: ➔ Com o mesmo modelo de dados ou com modelos ➔ Simuladores de SGBDs relacionais diferentes (chave-valor, multi-coluna, documento, ...) ➔ otimização de consultas, recovery, scheduler, ... ➔ Integração de BDs No-SQL equivalentes ➔ Interfaces gráficas para aprendizado de linguagens de acesso a BDs relacionais ➔ Consulta integrada a BDs No-SQL heterogêneos ➔ SQL, álgebra relacional, ...● Mapeamento de BDs relacionais ↔ BDs No- ➔ Normalização SQL ➔ Engenharia reversa de BDs relacionais ➔ Descoberta de equivalências ➔ Definição/catalogação de mapeamentos Perguntas? 5

×