Apresentação Tcc
Upcoming SlideShare
Loading in...5
×
 

Apresentação Tcc

on

  • 1,508 views

Apresentação realizada na minha defesa de TCC

Apresentação realizada na minha defesa de TCC

Statistics

Views

Total Views
1,508
Views on SlideShare
1,507
Embed Views
1

Actions

Likes
1
Downloads
13
Comments
0

1 Embed 1

http://www.linkedin.com 1

Accessibility

Categories

Upload Details

Uploaded via as Apple Keynote

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • Tamanho do C na quantidade de Podas e Verifica&#xE7;&#xF5;es <br /> Aumento do Espa&#xE7;o de Busca <br />
  • <br />
  • <br />
  • <br />
  • Heur&#xED;stica -> Informa&#xE7;&#xE3;o Inerente ao Problema <br />
  • Gen&#xE9;tico n&#xE3;o caminha na linha, ao contrario de outros m&#xE9;todos. <br />
  • Paralelismo Impl&#xED;cito e Explicito <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • Representa&#xE7;&#xE3;o Binaria <br />
  • <br />
  • Torneio R&#xE1;pido e Simples, fazendo trabalho melhor que a roleta <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • Quantidade de Acessos ao Disco <br /> Quantidade de C&#xE1;lculos de Dist&#xE2;ncia <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />
  • <br />

Apresentação Tcc Apresentação Tcc Presentation Transcript

  • Algoritmos Genéticos na Otimização de Consultas por Similaridade Dann Luciano de Menezes Orientador: Ronildo Moura Dann Luciano de Menezes 1 @dannluciano
  • Agenda • Motivação • Consultas por Similaridade • Algoritmos Genéticos • Implementação • Resultados • Conclusões • Trabalhos Futuros Dann Luciano de Menezes 2 @dannluciano
  • Motivação Dann Luciano de Menezes 3 @dannluciano
  • SGBDs Atuais Dann Luciano de Menezes 4 @dannluciano
  • 1 < 2 < ... < 1000 a < b < ... < Y < Z = Dann Luciano de Menezes 5 @dannluciano
  • SGBDs Similares Dann Luciano de Menezes 6 @dannluciano
  • ≅ Dann Luciano de Menezes 7 @dannluciano
  • ≅ Dann Luciano de Menezes 8 @dannluciano
  • ≅ Dann Luciano de Menezes 9 @dannluciano
  • ≅ Dann Luciano de Menezes 10 @dannluciano
  • Consultas por Similaridade Dann Luciano de Menezes 11 @dannluciano
  • Similaridade ??? Dann Luciano de Menezes 12 @dannluciano
  • “Ninguém é igual a Ninguém”(Engenheiros do Hawaii) Dann Luciano de Menezes 13 @dannluciano
  • Todo Objeto é mais ou menos Similar a um Conjunto de Objetos para um Determinado Conjunto de Características Dann Luciano de Menezes 14 @dannluciano
  • Perguntas Relevantes Dann Luciano de Menezes 15 @dannluciano
  • Perguntas Relevantes • Como Comparar Dados Complexos? • Como Expressar Consultas Sobre Dados Complexos? • Como Indexar Dados Complexos? Dann Luciano de Menezes 16 @dannluciano
  • Domínios Métricos Como Comparar Dados Complexos? Dann Luciano de Menezes 17 @dannluciano
  • Domínio Métrico • Definido por M = (D, d( ) ) onde: • D, é conjunto de objetos • d( ), é função de distância (Dissimilaridade), onde dados x, y, z ε D d:DxD → R+, atendem: • Simetria → d(x,y) = d (y,x); • Não Negatividade → 0 ≤ d(x,y) <∞, d(x,x) = 0; • Desigualdade Triangular → d(x,y) ≤ d(x,z) + d(y,z). Dann Luciano de Menezes 18 @dannluciano
  • Operadores por Similaridade Como Expressar Consultas sobre Dados Complexos? Dann Luciano de Menezes 19 @dannluciano
  • Operadores por Similaridade • RQ(S ,R ) → Similarity Range Query q q • Consulta por Abrangência Dann Luciano de Menezes 20 @dannluciano
  • Range Query Dann Luciano de Menezes 21 @dannluciano
  • Operadores por Similaridade • k-NNQ(S ,k) → Similarity k-Nearest q Neighbor Query • Consulta aos K vizinhos mais próximos Dann Luciano de Menezes 22 @dannluciano
  • k-Nearest Neighbor Dann Luciano de Menezes 23 @dannluciano
  • Métodos de Acesso Métrico Como Indexar Dados Complexos? Dann Luciano de Menezes 24 @dannluciano
  • Métodos de Acesso Métrico • Estrutura de Indexação de Dados Complexos • M-Tree • TM-Tree • Slim-Tree Dann Luciano de Menezes 25 @dannluciano
  • Slim-Tree • Estrutura Balanceada e Dinâmica • Cresce das Folhas para Raiz • Objetos Armazenados nas Folhas • Estrutura Hierárquica • Cálculos de Distância Otimizados • Fat-factor • Slim-down Dann Luciano de Menezes 26 @dannluciano
  • Slim-Tree Dann Luciano de Menezes 27 @dannluciano
  • Consultas por Similaridade Dann Luciano de Menezes 28 @dannluciano
  • Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
  • Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
  • Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
  • Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
  • Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
  • Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
  • Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
  • Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
  • Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
  • Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
  • Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
  • Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
  • Problemas Dann Luciano de Menezes 29 @dannluciano
  • Maldição da Dimensionalidade Dann Luciano de Menezes 30 @dannluciano
  • Sobreposição de Conjuntos Dann Luciano de Menezes 31 @dannluciano
  • Dann Luciano de Menezes 32 @dannluciano
  • Algoritmos Genéticos Dann Luciano de Menezes 33 @dannluciano
  • Algoritmos Genéticos • Uma técnica de Busca extremamente eficiente no seu objetivo de varrer o espaço de soluções e encontrar soluções próximas da solução ótima. • Ramo da Computação Evolutiva • Técnica Heurística de Otimização Global Dann Luciano de Menezes 34 @dannluciano
  • Algoritmos Genéticos Dann Luciano de Menezes 35 @dannluciano
  • Algoritmos Genéticos Dann Luciano de Menezes 36 @dannluciano
  • Algoritmos Genéticos • Baseados • Seleção Natural (Darwin) • Genética • Idealizados • John Holland e David Goldberg Dann Luciano de Menezes 37 @dannluciano
  • Algoritmos Genéticos Dann Luciano de Menezes 38 @dannluciano
  • Terminologia • Cromossomo • Gene • Indivíduo • Genótipo • Fenótipo Dann Luciano de Menezes 39 @dannluciano
  • Representação da Informação • Binária • Real • Dado Abstrato Dann Luciano de Menezes 40 @dannluciano
  • Algoritmos Genéticos Dann Luciano de Menezes 41 @dannluciano
  • Algoritmos Genéticos Dann Luciano de Menezes 42 @dannluciano
  • Seleção • Método da Roleta • Método do Torneio Dann Luciano de Menezes 43 @dannluciano
  • Operadores Genéticos Dann Luciano de Menezes 44 @dannluciano
  • Operadores Genéticos • Crossover • Mutação Dann Luciano de Menezes 45 @dannluciano
  • Crossover • 1 Ponto • Multi-Pontos • 2 Pontos • 4 Pontos • n Pontos • Uniforme Dann Luciano de Menezes 46 @dannluciano
  • Dann Luciano de Menezes 47 @dannluciano
  • Mutação • Taxa de Mutação • Alta • Baixa Dann Luciano de Menezes 48 @dannluciano
  • Mutação Dann Luciano de Menezes 49 @dannluciano
  • Implementação Dann Luciano de Menezes 50 @dannluciano
  • Dann Luciano de Menezes 51 @dannluciano
  • Representação da Solução 1 2 3 1 2 1 2 1 2 S13 2 1 Dann Luciano de Menezes 52 @dannluciano
  • Infactibilidade S 1 2 3 1 2 1 2 1 2 S 2 3 Dann Luciano de Menezes 53 @dannluciano
  • Infactibilidade 1 2 3 S 1 2 1 2 1 2 S 2 3 Dann Luciano de Menezes 53 @dannluciano
  • Infactibilidade 1 2 3 S 1 2 1 2 1 2 S 2 2 Dann Luciano de Menezes 53 @dannluciano
  • Infactibilidade 1 2 3 S 1 2 1 2 1 2 S 2 1 2 Dann Luciano de Menezes 53 @dannluciano
  • Função Objetivo Minimizar dist(Obj rep, Obj query) Dann Luciano de Menezes 54 @dannluciano
  • Seleção por Torneio IndivíduoI IndivíduoII X Y Dann Luciano de Menezes 55 @dannluciano
  • Seleção por Torneio IndivíduoI IndivíduoII X Y Dann Luciano de Menezes 55 @dannluciano
  • Seleção por Torneio IndivíduoI IndivíduoII X Y Dann Luciano de Menezes 55 @dannluciano
  • Seleção por Torneio IndivíduoI IndivíduoII X Y se X > Y Dann Luciano de Menezes 55 @dannluciano
  • Seleção por Torneio IndivíduoII Y IndivíduoI X Dann Luciano de Menezes 55 @dannluciano
  • Seleção por Torneio IndivíduoI IndivíduoII X Y Dann Luciano de Menezes 55 @dannluciano
  • Seleção por Torneio IndivíduoI IndivíduoII X Y se Y >X Dann Luciano de Menezes 55 @dannluciano
  • Seleção por Torneio IndivíduoI X IndivíduoII Y Dann Luciano de Menezes 55 @dannluciano
  • Seleção por Torneio IndivíduoI IndivíduoII X Y Dann Luciano de Menezes 55 @dannluciano
  • Crossover Uniforme Dann Luciano de Menezes 56 @dannluciano
  • Mutação • Mutação Normal (Influência a População) • 5% • 20% • Mutação Drástica (Influência o Indivíduo) • 15% • 30% Dann Luciano de Menezes 57 @dannluciano
  • Critério de Parada (Média da Avaliação da População Atual - Média da Avaliação da População Anterior) < 0,0001 Dann Luciano de Menezes 58 @dannluciano
  • Elitismo Dann Luciano de Menezes 59 @dannluciano
  • Sem Elitismo Dann Luciano de Menezes 60 @dannluciano
  • Com Elitismo Dann Luciano de Menezes 61 @dannluciano
  • Algoritmo em Execução Dann Luciano de Menezes 62 @dannluciano
  • Dann Luciano de Menezes 63 @dannluciano
  • Resultados Dann Luciano de Menezes 64 @dannluciano
  • Dann Luciano de Menezes 65 @dannluciano
  • Dann Luciano de Menezes 66 @dannluciano
  • Dann Luciano de Menezes 67 @dannluciano
  • Tempo Total MédiaAcessos Média Cálculos Algoritmo (segundos) ao Disco de Distância AG mut - A Elitista 5% 1.41 412.32 51.54 AG mut - A Elitista 20% 1.4 404.96 50.62 AG mut - B Elitista 15% 1.35 402.08 50.26 AG mut - B Elitista 30% 1.38 410.96 51.37 AG mut - A não Elitista 5% 1.56 463.36 57.92 AG mut - A não Elitista 20% 1.5 450.8 56.35 AG mut - B não Elitista 15% 1.57 469.12 58.64 AG mut - B não Elitista 30% 1.57 465.68 58.21 Slim-tree RangueQuery 0.2 79.81 256.5 Dann Luciano de Menezes 68 @dannluciano
  • Conclusões Dann Luciano de Menezes 69 @dannluciano
  • Conclusões • Otimização das Consultas por Similaridade • Quantidade de Objetos Armazenados • Influência na Altura e Sobreposição • Quantidade de Cálculos de Distância • Influenciado pelo Custo da Função de Distância. Dann Luciano de Menezes 70 @dannluciano
  • Trabalhos Futuros Dann Luciano de Menezes 71 @dannluciano
  • Trabalhos Futuros • Resolver o problema utilizando outra técnica da computação bio-inspirada (SWARM ou PSO), podendo ser realizado um estudo comparativo entre as técnicas; • Realizar a suite de testes para tipos de dados mais complexos; Dann Luciano de Menezes 72 @dannluciano
  • Trabalhos Futuros • A utilização de um outro Algoritmo Genético para otimizar os parâmetros do Algoritmo Genético implementado neste trabalho. • Realizar o casamento com trabalhos desenvolvidos dentro da própria instituição de ensino (CEUT), como os trabalhados de processamento de imagens e computação musical. Dann Luciano de Menezes 73 @dannluciano
  • Trabalhos Futuros • Mesclar o Algoritmo desenvolvido com uma técnica de busca local visando encontrar a precisão dos dados retornados pela consulta por similaridade. • Implementar uma Mutação variável, fazendo com que os primeiros genes não sejam alterados da mesma maneira com que os últimos genes são. Dann Luciano de Menezes 74 @dannluciano
  • Trabalhos Futuros • Modificar a implementação do método de tratamento de infactibilidade, buscando diminuir drasticamente a quantidade de acessos ao disco. Dann Luciano de Menezes 75 @dannluciano
  • Dúvidas, Sugestões, Críticas ? Dann Luciano de Menezes 76 @dannluciano
  • Dann Luciano de Menezes dannluciano@gmail.com @dannluciano Muito Obrigado! Dann Luciano de Menezes 77 @dannluciano
  • Referências • BUENO Renato, TRAINA Agma J. M. e TRAINA JR Caetano. Algoritmos Genéticos para Consultas por Similaridade. 2005. • TRAINA JR Caetano, TRAINA Agma, SEEGER Bernhard e FALOUTSOS Christos. Slim-trees: High Performace Metric Tree Minimizing Overlap Between Nodes. 1999. • NADVORNY César Feijó. TM-tree: um Método  de Acesso para consultas por similaridade. 2005. • Ferreira Mônica Ribeiro Porto. Suporte a consultas por similaridade unárias em SQL. 2008. • CHINO Fabio Jun Takada. Visualizando a organização e o comportamento de estruturas métricas: Aplicações em consultas por similaridade. 2004. • ZUBEN Fernando J. Von. Computação Evolutiva: Uma Abordagem Pragmática. • GOLDBERG David E. Genetic Algorithms in Search, Optimization, and Machine Learning. Addison-Wesley Company Inc. 1989. • BÄCK Thomas, FOGEL David B e MICHALEWICZ Zbigniew. Evolutionary Computation 1: Basic Algorithms and Operators. Institute of Physics Publishing. 2000. • RUSSEL Stuart e NORVIG Peter. Inteligência Artificial. 2˚ Ed. Rio de Janeiro: Editora Campus. 2004. • LACERDA Estéfane e CARVALHO André. Introdução aos Algoritmos Genéticos. Capítulo 3. Dann Luciano de Menezes 78 @dannluciano