Apresentação Tcc

1,510 views

Published on

Apresentação realizada na minha defesa de TCC

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,510
On SlideShare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
16
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide








































  • Tamanho do C na quantidade de Podas e Verificações
    Aumento do Espaço de Busca



  • Heurística -> Informação Inerente ao Problema
  • Genético não caminha na linha, ao contrario de outros métodos.
  • Paralelismo Implícito e Explicito




  • Representação Binaria

  • Torneio Rápido e Simples, fazendo trabalho melhor que a roleta








































  • Quantidade de Acessos ao Disco
    Quantidade de Cálculos de Distância










  • Apresentação Tcc

    1. 1. Algoritmos Genéticos na Otimização de Consultas por Similaridade Dann Luciano de Menezes Orientador: Ronildo Moura Dann Luciano de Menezes 1 @dannluciano
    2. 2. Agenda • Motivação • Consultas por Similaridade • Algoritmos Genéticos • Implementação • Resultados • Conclusões • Trabalhos Futuros Dann Luciano de Menezes 2 @dannluciano
    3. 3. Motivação Dann Luciano de Menezes 3 @dannluciano
    4. 4. SGBDs Atuais Dann Luciano de Menezes 4 @dannluciano
    5. 5. 1 < 2 < ... < 1000 a < b < ... < Y < Z = Dann Luciano de Menezes 5 @dannluciano
    6. 6. SGBDs Similares Dann Luciano de Menezes 6 @dannluciano
    7. 7. ≅ Dann Luciano de Menezes 7 @dannluciano
    8. 8. ≅ Dann Luciano de Menezes 8 @dannluciano
    9. 9. ≅ Dann Luciano de Menezes 9 @dannluciano
    10. 10. ≅ Dann Luciano de Menezes 10 @dannluciano
    11. 11. Consultas por Similaridade Dann Luciano de Menezes 11 @dannluciano
    12. 12. Similaridade ??? Dann Luciano de Menezes 12 @dannluciano
    13. 13. “Ninguém é igual a Ninguém”(Engenheiros do Hawaii) Dann Luciano de Menezes 13 @dannluciano
    14. 14. Todo Objeto é mais ou menos Similar a um Conjunto de Objetos para um Determinado Conjunto de Características Dann Luciano de Menezes 14 @dannluciano
    15. 15. Perguntas Relevantes Dann Luciano de Menezes 15 @dannluciano
    16. 16. Perguntas Relevantes • Como Comparar Dados Complexos? • Como Expressar Consultas Sobre Dados Complexos? • Como Indexar Dados Complexos? Dann Luciano de Menezes 16 @dannluciano
    17. 17. Domínios Métricos Como Comparar Dados Complexos? Dann Luciano de Menezes 17 @dannluciano
    18. 18. Domínio Métrico • Definido por M = (D, d( ) ) onde: • D, é conjunto de objetos • d( ), é função de distância (Dissimilaridade), onde dados x, y, z ε D d:DxD → R+, atendem: • Simetria → d(x,y) = d (y,x); • Não Negatividade → 0 ≤ d(x,y) <∞, d(x,x) = 0; • Desigualdade Triangular → d(x,y) ≤ d(x,z) + d(y,z). Dann Luciano de Menezes 18 @dannluciano
    19. 19. Operadores por Similaridade Como Expressar Consultas sobre Dados Complexos? Dann Luciano de Menezes 19 @dannluciano
    20. 20. Operadores por Similaridade • RQ(S ,R ) → Similarity Range Query q q • Consulta por Abrangência Dann Luciano de Menezes 20 @dannluciano
    21. 21. Range Query Dann Luciano de Menezes 21 @dannluciano
    22. 22. Operadores por Similaridade • k-NNQ(S ,k) → Similarity k-Nearest q Neighbor Query • Consulta aos K vizinhos mais próximos Dann Luciano de Menezes 22 @dannluciano
    23. 23. k-Nearest Neighbor Dann Luciano de Menezes 23 @dannluciano
    24. 24. Métodos de Acesso Métrico Como Indexar Dados Complexos? Dann Luciano de Menezes 24 @dannluciano
    25. 25. Métodos de Acesso Métrico • Estrutura de Indexação de Dados Complexos • M-Tree • TM-Tree • Slim-Tree Dann Luciano de Menezes 25 @dannluciano
    26. 26. Slim-Tree • Estrutura Balanceada e Dinâmica • Cresce das Folhas para Raiz • Objetos Armazenados nas Folhas • Estrutura Hierárquica • Cálculos de Distância Otimizados • Fat-factor • Slim-down Dann Luciano de Menezes 26 @dannluciano
    27. 27. Slim-Tree Dann Luciano de Menezes 27 @dannluciano
    28. 28. Consultas por Similaridade Dann Luciano de Menezes 28 @dannluciano
    29. 29. Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
    30. 30. Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
    31. 31. Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
    32. 32. Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
    33. 33. Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
    34. 34. Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
    35. 35. Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
    36. 36. Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
    37. 37. Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
    38. 38. Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
    39. 39. Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
    40. 40. Consultas por Similaridade S13 Dann Luciano de Menezes 28 @dannluciano
    41. 41. Problemas Dann Luciano de Menezes 29 @dannluciano
    42. 42. Maldição da Dimensionalidade Dann Luciano de Menezes 30 @dannluciano
    43. 43. Sobreposição de Conjuntos Dann Luciano de Menezes 31 @dannluciano
    44. 44. Dann Luciano de Menezes 32 @dannluciano
    45. 45. Algoritmos Genéticos Dann Luciano de Menezes 33 @dannluciano
    46. 46. Algoritmos Genéticos • Uma técnica de Busca extremamente eficiente no seu objetivo de varrer o espaço de soluções e encontrar soluções próximas da solução ótima. • Ramo da Computação Evolutiva • Técnica Heurística de Otimização Global Dann Luciano de Menezes 34 @dannluciano
    47. 47. Algoritmos Genéticos Dann Luciano de Menezes 35 @dannluciano
    48. 48. Algoritmos Genéticos Dann Luciano de Menezes 36 @dannluciano
    49. 49. Algoritmos Genéticos • Baseados • Seleção Natural (Darwin) • Genética • Idealizados • John Holland e David Goldberg Dann Luciano de Menezes 37 @dannluciano
    50. 50. Algoritmos Genéticos Dann Luciano de Menezes 38 @dannluciano
    51. 51. Terminologia • Cromossomo • Gene • Indivíduo • Genótipo • Fenótipo Dann Luciano de Menezes 39 @dannluciano
    52. 52. Representação da Informação • Binária • Real • Dado Abstrato Dann Luciano de Menezes 40 @dannluciano
    53. 53. Algoritmos Genéticos Dann Luciano de Menezes 41 @dannluciano
    54. 54. Algoritmos Genéticos Dann Luciano de Menezes 42 @dannluciano
    55. 55. Seleção • Método da Roleta • Método do Torneio Dann Luciano de Menezes 43 @dannluciano
    56. 56. Operadores Genéticos Dann Luciano de Menezes 44 @dannluciano
    57. 57. Operadores Genéticos • Crossover • Mutação Dann Luciano de Menezes 45 @dannluciano
    58. 58. Crossover • 1 Ponto • Multi-Pontos • 2 Pontos • 4 Pontos • n Pontos • Uniforme Dann Luciano de Menezes 46 @dannluciano
    59. 59. Dann Luciano de Menezes 47 @dannluciano
    60. 60. Mutação • Taxa de Mutação • Alta • Baixa Dann Luciano de Menezes 48 @dannluciano
    61. 61. Mutação Dann Luciano de Menezes 49 @dannluciano
    62. 62. Implementação Dann Luciano de Menezes 50 @dannluciano
    63. 63. Dann Luciano de Menezes 51 @dannluciano
    64. 64. Representação da Solução 1 2 3 1 2 1 2 1 2 S13 2 1 Dann Luciano de Menezes 52 @dannluciano
    65. 65. Infactibilidade S 1 2 3 1 2 1 2 1 2 S 2 3 Dann Luciano de Menezes 53 @dannluciano
    66. 66. Infactibilidade 1 2 3 S 1 2 1 2 1 2 S 2 3 Dann Luciano de Menezes 53 @dannluciano
    67. 67. Infactibilidade 1 2 3 S 1 2 1 2 1 2 S 2 2 Dann Luciano de Menezes 53 @dannluciano
    68. 68. Infactibilidade 1 2 3 S 1 2 1 2 1 2 S 2 1 2 Dann Luciano de Menezes 53 @dannluciano
    69. 69. Função Objetivo Minimizar dist(Obj rep, Obj query) Dann Luciano de Menezes 54 @dannluciano
    70. 70. Seleção por Torneio IndivíduoI IndivíduoII X Y Dann Luciano de Menezes 55 @dannluciano
    71. 71. Seleção por Torneio IndivíduoI IndivíduoII X Y Dann Luciano de Menezes 55 @dannluciano
    72. 72. Seleção por Torneio IndivíduoI IndivíduoII X Y Dann Luciano de Menezes 55 @dannluciano
    73. 73. Seleção por Torneio IndivíduoI IndivíduoII X Y se X > Y Dann Luciano de Menezes 55 @dannluciano
    74. 74. Seleção por Torneio IndivíduoII Y IndivíduoI X Dann Luciano de Menezes 55 @dannluciano
    75. 75. Seleção por Torneio IndivíduoI IndivíduoII X Y Dann Luciano de Menezes 55 @dannluciano
    76. 76. Seleção por Torneio IndivíduoI IndivíduoII X Y se Y >X Dann Luciano de Menezes 55 @dannluciano
    77. 77. Seleção por Torneio IndivíduoI X IndivíduoII Y Dann Luciano de Menezes 55 @dannluciano
    78. 78. Seleção por Torneio IndivíduoI IndivíduoII X Y Dann Luciano de Menezes 55 @dannluciano
    79. 79. Crossover Uniforme Dann Luciano de Menezes 56 @dannluciano
    80. 80. Mutação • Mutação Normal (Influência a População) • 5% • 20% • Mutação Drástica (Influência o Indivíduo) • 15% • 30% Dann Luciano de Menezes 57 @dannluciano
    81. 81. Critério de Parada (Média da Avaliação da População Atual - Média da Avaliação da População Anterior) < 0,0001 Dann Luciano de Menezes 58 @dannluciano
    82. 82. Elitismo Dann Luciano de Menezes 59 @dannluciano
    83. 83. Sem Elitismo Dann Luciano de Menezes 60 @dannluciano
    84. 84. Com Elitismo Dann Luciano de Menezes 61 @dannluciano
    85. 85. Algoritmo em Execução Dann Luciano de Menezes 62 @dannluciano
    86. 86. Dann Luciano de Menezes 63 @dannluciano
    87. 87. Resultados Dann Luciano de Menezes 64 @dannluciano
    88. 88. Dann Luciano de Menezes 65 @dannluciano
    89. 89. Dann Luciano de Menezes 66 @dannluciano
    90. 90. Dann Luciano de Menezes 67 @dannluciano
    91. 91. Tempo Total MédiaAcessos Média Cálculos Algoritmo (segundos) ao Disco de Distância AG mut - A Elitista 5% 1.41 412.32 51.54 AG mut - A Elitista 20% 1.4 404.96 50.62 AG mut - B Elitista 15% 1.35 402.08 50.26 AG mut - B Elitista 30% 1.38 410.96 51.37 AG mut - A não Elitista 5% 1.56 463.36 57.92 AG mut - A não Elitista 20% 1.5 450.8 56.35 AG mut - B não Elitista 15% 1.57 469.12 58.64 AG mut - B não Elitista 30% 1.57 465.68 58.21 Slim-tree RangueQuery 0.2 79.81 256.5 Dann Luciano de Menezes 68 @dannluciano
    92. 92. Conclusões Dann Luciano de Menezes 69 @dannluciano
    93. 93. Conclusões • Otimização das Consultas por Similaridade • Quantidade de Objetos Armazenados • Influência na Altura e Sobreposição • Quantidade de Cálculos de Distância • Influenciado pelo Custo da Função de Distância. Dann Luciano de Menezes 70 @dannluciano
    94. 94. Trabalhos Futuros Dann Luciano de Menezes 71 @dannluciano
    95. 95. Trabalhos Futuros • Resolver o problema utilizando outra técnica da computação bio-inspirada (SWARM ou PSO), podendo ser realizado um estudo comparativo entre as técnicas; • Realizar a suite de testes para tipos de dados mais complexos; Dann Luciano de Menezes 72 @dannluciano
    96. 96. Trabalhos Futuros • A utilização de um outro Algoritmo Genético para otimizar os parâmetros do Algoritmo Genético implementado neste trabalho. • Realizar o casamento com trabalhos desenvolvidos dentro da própria instituição de ensino (CEUT), como os trabalhados de processamento de imagens e computação musical. Dann Luciano de Menezes 73 @dannluciano
    97. 97. Trabalhos Futuros • Mesclar o Algoritmo desenvolvido com uma técnica de busca local visando encontrar a precisão dos dados retornados pela consulta por similaridade. • Implementar uma Mutação variável, fazendo com que os primeiros genes não sejam alterados da mesma maneira com que os últimos genes são. Dann Luciano de Menezes 74 @dannluciano
    98. 98. Trabalhos Futuros • Modificar a implementação do método de tratamento de infactibilidade, buscando diminuir drasticamente a quantidade de acessos ao disco. Dann Luciano de Menezes 75 @dannluciano
    99. 99. Dúvidas, Sugestões, Críticas ? Dann Luciano de Menezes 76 @dannluciano
    100. 100. Dann Luciano de Menezes dannluciano@gmail.com @dannluciano Muito Obrigado! Dann Luciano de Menezes 77 @dannluciano
    101. 101. Referências • BUENO Renato, TRAINA Agma J. M. e TRAINA JR Caetano. Algoritmos Genéticos para Consultas por Similaridade. 2005. • TRAINA JR Caetano, TRAINA Agma, SEEGER Bernhard e FALOUTSOS Christos. Slim-trees: High Performace Metric Tree Minimizing Overlap Between Nodes. 1999. • NADVORNY César Feijó. TM-tree: um Método  de Acesso para consultas por similaridade. 2005. • Ferreira Mônica Ribeiro Porto. Suporte a consultas por similaridade unárias em SQL. 2008. • CHINO Fabio Jun Takada. Visualizando a organização e o comportamento de estruturas métricas: Aplicações em consultas por similaridade. 2004. • ZUBEN Fernando J. Von. Computação Evolutiva: Uma Abordagem Pragmática. • GOLDBERG David E. Genetic Algorithms in Search, Optimization, and Machine Learning. Addison-Wesley Company Inc. 1989. • BÄCK Thomas, FOGEL David B e MICHALEWICZ Zbigniew. Evolutionary Computation 1: Basic Algorithms and Operators. Institute of Physics Publishing. 2000. • RUSSEL Stuart e NORVIG Peter. Inteligência Artificial. 2˚ Ed. Rio de Janeiro: Editora Campus. 2004. • LACERDA Estéfane e CARVALHO André. Introdução aos Algoritmos Genéticos. Capítulo 3. Dann Luciano de Menezes 78 @dannluciano

    ×