Indexação e busca baseada em metadados em um sistema P2P Híbrido

409 views

Published on

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
409
On SlideShare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
2
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Indexação e busca baseada em metadados em um sistema P2P Híbrido

  1. 1. Indexação e buscabaseada em metadadosem um sistema P2PHíbridoCentro de InformáticaUniversidade Federal dePernambucoMarco André Santos Machadomasm@cin.ufpe.br
  2. 2. Agenda● Indexação e Buscas● Metadados● Trabalhos Relacionados● Proposta● Análise Comparativa 2
  3. 3. Indexação e Buscas 3
  4. 4. Metadados● ID● Nome● Tamanho (Kb)● Path● Datas de criação, indexação, modificação● Interesses do usuário● Categoria● Conteúdo 4
  5. 5. Trabalhos Relacionados 5
  6. 6. Trabalhos Relacionados● Sixearch – Composto por muito componentes: – Crawler – Sistema para Indexação – Mecanismo de Recuperação – Sistema de aprendizado baseado em contexto● Index local, aggregated, em clustering) 6
  7. 7. Trabalhos Relacionados● Minerva – Cada peer descobre e indexa seus arquivos – Envia um conjunto de metadados baseado em termos para um index global – Possui um index local e global (2-steps) 7
  8. 8. Trabalhos Relacionados● eSearch – Indexação baseado em palavras-chave – Possui peer divididos por palavras-chave para armazenar o index – Index local e global – Local: documento X contêm os termos a, b – Global: termos a está nos documentos X, Z 8
  9. 9. Proposta● Indexação – Extrair o conteúdo (Apache Tika) – Extrair metadados – Indexar (Lucene) – Local – SearchServer● Busca – Local – Global – Distribuída 9
  10. 10. Análise ComparativaCenário 1●● Index local, global, distribuído 10
  11. 11. Análise ComparativaCenário 1●● Index local, global, distribuído 11
  12. 12. Análise Comparativa● Cenário 1 – Index local, global, distribuído – Vantagens ● A busca sempre retornará resultados ● SearhServer ON => index completo – Desvantagens ● Dupla indexação ● Maior quantidade de mensagens ● Sobrecarga do SearchServer ● Busca distribuída => Flood 12
  13. 13. Análise ComparativaCenário 2●● Index global 13
  14. 14. Análise Comparativa● Cenário 2 – Index global – Vantagens ● Única indexação ● Menor qnt. de mensagens ● SearhServer ON => index completo – Desvantagens ● Sobrecarga do SearchServer ● A busca pode NÃO retorna resultados (SearchServer => OFF) 14
  15. 15. Análise ComparativaCenário 3●● Index local / distribuído 15
  16. 16. Análise Comparativa● Cenário 3 – Index local / distribuído – Vantagens ● Única indexação ● Menor qnt. de mensagens para indexar – Desvantagens ● A busca só retorna resultados do peers online ● Não possui um index completo 16
  17. 17. Obrigado! 17

×