TCC Bioinfomática - Genômica da Dengue

2,086 views

Published on

Aplicação de Redes Neurais Artificiais na modelagem de um classificador de formas clínicas da dengue utilizando uma abordagem genética.

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
2,086
On SlideShare
0
From Embeds
0
Number of Embeds
38
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

TCC Bioinfomática - Genômica da Dengue

  1. 1. Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos Thiego de Oliveira Orientador: Prof. Dr. Fernando Buarque Co-Orientador: Pesq. Dr. Bartolomeu Acioli
  2. 2. Roteiro <ul><li>Motivação </li></ul><ul><li>Objetivos </li></ul><ul><li>Conceitos Fundamentais </li></ul><ul><li>Metodologia </li></ul><ul><li>Contribuições </li></ul><ul><li>Conclusões </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  3. 3. Motivação Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  4. 4. Dengue Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  5. 5. Dengue: Gravidade <ul><li>Infecção viral - 4 sorotipos </li></ul><ul><li>Ciclos de epidemias </li></ul><ul><li>Demora no diagnóstico </li></ul><ul><li>Óbitos em casos graves </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  6. 6. Formas clínicas <ul><li>DC DCC FHD (DG) </li></ul><ul><li>Aspectos clínicos e alguns exames </li></ul><ul><ul><li>Impreciso devido a similaridade com outras doenças </li></ul></ul><ul><li>Não há um método de predição/classificação de formas clínicas sem ser por aspectos clínicos </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  7. 7. Objetivos <ul><li>Desenvolver um método de predição/classificação das formas clínicas da dengue com ferramentas de computação inteligente </li></ul><ul><ul><li>Tratando com dados genômicos </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  8. 8. Estado da Arte <ul><li>Lee, V.J., et al., Predictive value of simple clinical and laboratory variables for dengue hemorrhagic fever in adults - J. Clin. Virol, 2008 - Vizinho mais próximo </li></ul><ul><li>Lee, V.J., et al., Decision tree algorithm in deciding hospitalization for adult patients with dengue haemorrhagic fever in Singapore - Trop. Med. Int. Health, 2009 - Árvore de decisão </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  9. 9. Estado da Arte <ul><li>Gomes, A., et al., Classification of dengue fever patients based on gene expression data using support vector machines . 2009 - SVM </li></ul><ul><li>Braga-Neto, U., et al., Classificadores baseados em critério de informação Akaike , utilizando dados genômicos - 2009 </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  10. 10. Conceitos Fundamentais <ul><li>DNA </li></ul><ul><li>Polimorfismos </li></ul><ul><li>Metodologia </li></ul><ul><li>Redes Neurais Artificiais </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  11. 11. DNA <ul><li>Informação genética </li></ul><ul><li>Dupla fita </li></ul><ul><ul><li>Sequência de nucleotídeos </li></ul></ul><ul><ul><li>46 cromossomos </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  12. 12. Polimorfismos <ul><li>SNPs - Polimorfismos simples de nucleotídeos </li></ul><ul><ul><li>Altera a sequência genômica </li></ul></ul><ul><ul><li>Modificações funcionais </li></ul></ul><ul><ul><ul><li>molecular, proteína, ou clínica </li></ul></ul></ul><ul><li>Compreensão das respostas do homem ao vírus </li></ul><ul><li>Marcadores moleculares para outras doenças </li></ul><ul><ul><li>Em dengue: MBL2, Fator H </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  13. 13. Metodologia <ul><li>Dados </li></ul><ul><ul><li>105 pacientes dengue </li></ul></ul><ul><ul><li>99 pacientes controle </li></ul></ul><ul><li>322 Loci </li></ul><ul><ul><li>Genes de resposta imune a doenças virais e infecciosas </li></ul></ul><ul><ul><li>Genotipagem em massa: Illumina em colaboração University of Washington </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  14. 14. Tratamento dos dados <ul><li>204 pacientes x 322 loci = 65688 </li></ul><ul><li>Pré-processamento </li></ul><ul><li>Organização do banco de dados em tabelas relacionais utilizando o Filemaker Pro </li></ul><ul><li>Criação de sistema de manipulação dos dados baseado em hipóteses </li></ul><ul><li>Criação de cálculos de Odds-ratio, Teste de Fisher, Eq. de Hardy Weinberg, Teste do Qui-quadrado </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  15. 15. Problema de Classificação Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  16. 16. Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  17. 17. Resultados Prelimininares <ul><li>Resultados univariados </li></ul><ul><li>Ranking de Odds ratio >=3 </li></ul><ul><li>Eq. H-W <=0,05 </li></ul><ul><li>Teste de Fisher <=0,01 </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  18. 18. Aplicações de Redes Neurais Artificiais <ul><li>Bioinformática </li></ul><ul><ul><li>Análise das sequências de genoma e de proteínas, estudos de padrões de expressão, filogenia, etc. </li></ul></ul><ul><li>Largamente utilizado em reconhecimento de padrões e classificação </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  19. 19. Redes Neurais Artificiais <ul><li>Ferramenta de classificação supervisionada </li></ul><ul><li>Baseada no funcionamento do cérebro </li></ul><ul><ul><li>Pesos sinápticos </li></ul></ul><ul><li>Multilayer Perceptron (MLP) </li></ul><ul><ul><li>Backpropagation </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  20. 20. Redes Neurais Artificiais Saída Y é 1 se pelo menos dois da entrada for igual a 1 Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  21. 21. Redes Neurais Artificiais Redes Neurais Artificiais Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  22. 22. Metodologia II <ul><li>Exportação dos dados do banco </li></ul><ul><li>Transformação em unários </li></ul><ul><li>Normalização </li></ul><ul><li>Implementação dos algoritmos </li></ul><ul><li>Treinamento e testes </li></ul><ul><li>Análise de resultados </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  23. 23. Parametrização dos dados Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira Genotípicos XX XY YY NR XX (XY+YY) NR (XX+XY) YY NR NR - 0001 YY - 0010 XY - 0100 XX - 1000 NR - 001 XY+YY - 010 XX - 100 NR - 001 YY - 010 XX+XY - 100
  24. 24. Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  25. 25. Implementação dos algoritmos <ul><li>Utilizando do código fonte do Weka ( Open source ) </li></ul><ul><li>Desenvolvido em Java (Eclipse) </li></ul><ul><ul><li>Método de treinamento </li></ul></ul><ul><ul><li>Método de teste </li></ul></ul><ul><ul><li>Retorno das estatísticas </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  26. 26. Configuração da RNA <ul><li>Multilayer perceptron </li></ul><ul><ul><li>Apenas 1 camada escondida </li></ul></ul><ul><ul><li>Neurônios da camada escondida = (neurônios de entrada + neurônios de saída) / 2 </li></ul></ul><ul><ul><li>Camada de entrada </li></ul></ul><ul><ul><ul><li>Dados genotípicos </li></ul></ul></ul><ul><ul><ul><li>Idade, sexo, tipo de infecção </li></ul></ul></ul><ul><ul><li>Camada de saída </li></ul></ul><ul><ul><ul><li>Fenótipos </li></ul></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  27. 27. Agrupamento dos dados <ul><li>Dataset 1 - 7 </li></ul><ul><ul><li>Sem os possíveis não letais recessivos e com fisher <=0,05 </li></ul></ul><ul><li>Dataset 8 - 14 </li></ul><ul><ul><li>Odds-Ratio >=2,4 </li></ul></ul><ul><li>Dataset 15 - 21 </li></ul><ul><ul><li>Odds-Ratio >=3 e fisher <=0,01 </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  28. 28. Resultado das Execuções <ul><li>Dataset 11 obteve melhores resultados </li></ul><ul><li>Execução de testes (50 vezes) variando as entradas (hipóteses) </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  29. 29. Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  30. 30. 61 neurônios de entrada 31 neurônios na camada escondida 2 neurônios na camada de saída
  31. 31. Parâmetros da RNA <ul><li>600 ciclos de treinamento máximo </li></ul><ul><li>400 ciclos para os 25% dos dados utilizados na validação </li></ul><ul><li>Taxa de aprendizado: 0,3 </li></ul><ul><li>Momento: 0,2 </li></ul><ul><li>66% dos dados (69 instâncias) para treinamento </li></ul><ul><li>33% dos dados (36 instâncias) para teste </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  32. 32. Resultados <ul><li>Após 50 execuções (variando a semente de randomização dos dados) </li></ul><ul><ul><li>75,83% de instâncias corretamente classificadas (média) </li></ul></ul><ul><ul><li>84,47% de sensibilidade média </li></ul></ul><ul><ul><li>57,94% de especificidade média </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  33. 33. Resultado Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  34. 34. Discussão Dados clínicos Sensibilidade - 97% Especificidade - 60% Sensibilidade - 100% Especificidade - 46% Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  35. 35. Conclusões <ul><li>O SGBD facilita a análise de dados genômicos </li></ul><ul><li>O modelo de predição/classificação univariado mostra a possibilidade de estudo mais aprofundado de cada gene </li></ul><ul><li>O modelo utilizando RNA’s para predição de formas clínicas da dengue utiliza de forma original dados genômicos </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  36. 36. Perspectivas <ul><li>Utilização do modelo para desenvolvimento de assinaturas genéticas multivariadas como um diagnóstico/prognóstico diferencial das formas clínicas </li></ul><ul><li>Utilização em kits de diagnóstico desenvolvimento de novas estratégias de terapia </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  37. 37. Trabalhos futuros <ul><li>Utilização de métodos de seleção de atributos </li></ul><ul><li>Utilização de Particle Swarm Optimization ( PSO ) para manipulação e otimização dos parâmetros da RNA </li></ul><ul><li>Aumento da coorte de pacientes para um estudo mais confiável </li></ul><ul><ul><li>Otimização da classificação dos pacientes </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  38. 38. Obrigado! Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  39. 39. Referências bibliográficas Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  40. 41. Hipóteses Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  41. 42. Odds Ratio <ul><li>Razão das chances: </li></ul><ul><ul><li>É a probabilidade de um evento ocorra em um grupo relativo a chance de ocorrem em outro grupo </li></ul></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  42. 43. Equilíbrio de Hardy Weinberg <ul><li>Base da genética de populações </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  43. 44. Teste do Qui-quadrado <ul><li>Teste estatístico </li></ul><ul><li>Medida em que os valores observados desviam do valor esperado </li></ul><ul><li>Quanto maior o qui-quadrado, mais significante a relação entre a variável dependente e a variável independente </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  44. 45. Teste exato de Fisher <ul><li>Teste de significancia estatística em análise de tabelas de contingência quando as amostras são pequenas </li></ul><ul><li>Validado no R </li></ul>Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  45. 46. Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  46. 47. Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  47. 48. CC CT TT Fig. Representação gráfica dos genótipos para o promotor do CFH (SNP C-257T) por sequenciamento automático Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira
  48. 49. Multilayer Perceptron - MLP Aplicação de redes neurais artificiais na modelagem de um classificador de formas clínicas de dengue utilizando dados genômicos - Thiego de Oliveira

×