Minicurso bioinformática   enef2013 - completo
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

Minicurso bioinformática enef2013 - completo

on

  • 1,790 views

 

Statistics

Views

Total Views
1,790
Views on SlideShare
1,733
Embed Views
57

Actions

Likes
0
Downloads
84
Comments
0

5 Embeds 57

http://helbacirino.blogspot.com.br 44
http://helbacirino.blogspot.com 7
http://www.helbacirino.blogspot.com.br 3
http://helbacirino.blogspot.pt 2
http://helbacirino.blogspot.mx 1

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

CC Attribution License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Minicurso bioinformática enef2013 - completo Presentation Transcript

  • 1. XXXVI Encontro Nacional dos Estudantes de Farmácia Introdução a Bioinformática Nilson Antônio da Rocha Coimbra Laboratório de Bioinformática – UFPR Curitiba, 2013
  • 2. Diversidade da Vida
  • 3. Universalidade da Linguagem Celular ● DNA
  • 4. Universalidade da Linguagem Celular ● RNA
  • 5. Dogma Central da Biologia
  • 6. Timeline do Sequenciamento de DNA 1953
  • 7. Timeline do Sequenciamento de DNA Fev. 1977 Técnica de Maxam-Gilbert Sequenciamento por modificação química de bases específicas Maxam AM, Gilbert W (February 1977). "A new method for sequencing DNA". Proc. Natl. Acad. Sci. U.S.A. 74 (2): 560–4. doi:10.1073/pnas.74.2.560. PMID 265521.
  • 8. Timeline do Sequenciamento de DNA Dez.1977 Técnica de Sanger Sequenciamento por síntese terminada Sanger F, Nicklen S, Coulson AR (December 1977). "DNA sequencing with chain- terminating inhibitors". Proc. Natl. Acad. Sci. U.S.A. 74 (12): 5463–7.
  • 9. Timeline do Sequenciamento de DNA 197 7 200 5Técnica de Sanger: Domínio por ~30 anos
  • 10. Timeline do Sequenciamento de DNA
  • 11. Timeline do Sequenciamento de DNA 197 7 200 5Técnica de Sanger: Domínio por ~30 anos
  • 12. Timeline do Sequenciamento de DNA 197 7 200 5 Custo em 2004: US$ 0,03 / bp Genoma Bacteriano: 3.000.000 bp = US$ 90.000 Genoma Humano: 3.000.000.000 bp = US$ 90.000.000
  • 13. Timeline do Sequenciamento de DNA 200 5 NGS: Next-Generation Sequencing • Massivamente paralelas • Geram dados na ordem de 107 a 109 bp por corrida • Custo operacional de ~US$5 / Mbp
  • 14. NGS – Next Generation Sequencing Roche/454 FLX Illumina/Solexa GA ABI SOLiD ABI 3730xl Roche/454 FLX Illumina/Solexa GA ABI SOLiD Ion Torrent Método Sanger Pirosequenciame nto Sequenciamento por Síntese Sequenciamen to por Ligação Sequenciament o por semicondutor Dados/run 290 Kb ~300 Mb ~7 Gb > 15 Gb > 1Gb Tempo/run 1 hora 5 horas 3-7 dias 10 dias 4 hora e meia Tamanho ~500 - 800 pb ~200 - 500 pb ~35-100 pb ~25 - 35 pb ~200 pb Custo/run $48 $6.800 $9.300 $11.000 $ 600.00 Ion TorrentABI 3730xl
  • 15. Crescimento do Genbank http://www.ncbi.nlm.nih.gov/genbank/statistics
  • 16. Nova perspectiva Biologia: Ciência Descritiva => Ciência Analítica ● Genômica ● Transcriptômica ● Proteômica
  • 17. Bioinformática aplicada a Genômica ● Genômica é um ramo da bioquímica que estuda o genoma completo de um organismo. ● Projeto Genoma Humano? Gibson, Greg; Muse, Spencer V. A Primer of Genome Science (em inglês). 2ª ed. Sunderland, Massachusetts: Sinauer, 2004. 378 p. p. 1. ISBN 0-87893-232-1
  • 18. Montagem de Genoma
  • 19. Sequenciamento dos fragmentos x xx x x x x
  • 20. Sequenciamento dos fragmentos Cobertura: quantas vezes os dados obtidos representam o genoma? x x x x Reads
  • 21. Montagem de Genoma Linha 1 Linha 2 Linha 3 Linha 4 0 2 4 6 8 10 12 Coluna 1 Coluna 2 Coluna 3
  • 22. Montagem dos fragmentos
  • 23. Montagem de Genoma
  • 24. Finalização Genoma de referência Draft
  • 25. Montagem de Genoma
  • 26. Busca por genes e regiões reguladoras Busca de ORF's
  • 27. Busca por genes e regiões reguladoras ● Alinhamento de sequencias ● Similaridade x Homologia ● Busca em Banco de Dados Biológicos
  • 28. Montagem de Genoma
  • 29. Anotação de Sequencias
  • 30. E depois?
  • 31. E depois? ● Genômica Funcional ● Genômica Comparativa
  • 32. Genômica Funcional ● Diferente da genômica, a genômica funcional, tenta responder questões sobre a função do DNA a nível de genes, transcrição de RNA e síntese de proteínas. ● Os estudos de genômica funcional são caracterizados por abordagens que geralmente envolvem métodos high- throughput preferivelmente a metodologias mais tradicionais (gene-por-gene). Furlan, L. R.; Ferraz, A. L. J.; Bortolossi, J. C. A genômica funcional no âmbito da produção animal: estado da arte e perspectivas, Revista Brasileira de Zootecnia, v.36, p.331-341, 200
  • 33. Genômica Funcional ● Análise do perfil global da expressão gênica - Transcriptoma ● Análise sistemática das proteínas - Proteoma
  • 34. HELBA
  • 35. Helba Cirino de S. Barbosa BIOINFORMÁTICA Aplicada ao estudo de transcriptomas
  • 36. http://www.ihu.unisinos.br/noticias/noticias-anteriores/10921-adeus-genoma-oi-transcriptoma
  • 37. Definição de Bioinformática • “todo o tipo de estudo ou de ferramenta que se pode realizar e/ou produzir de forma a organizar ou obter informação biológica a partir de sequências de biomoléculas (DNA, RNA, Proteína)” (Prosdocimi, 2007)
  • 38. Paradigmas principais: 1. Tijolo; 2. Peneira; 3. Lupa.
  • 39. 1. Tijolo: • Exemplos: projeto genoma, produção de ferramentas para montar genoma e identificar genes, ferramentas de comparação de sequencias para inferir função gênica; DNA genômico reads
  • 40. 2. Peneira • Exemplo: localizar as proteínas para metabolismo de açúcares dentro do genoma
  • 41. • 150 genes ativados. (Tadra-Sfeir, 2011)
  • 42. • 186 genes reprimidos. (Tadra-Sfeir, 2011)
  • 43. 2. Peneira
  • 44. 3. Lupa • Exemplo: alguma característica biológica de um determinado organismo é explicada a partir da observação de seu conjunto de sequências gênicas ou protéicas e da comparação com sequências similares em organismos proximamente relacionados.
  • 45. • (Pedrosa et al., 2011)
  • 46. Transcriptoma • Corresponde ao conjunto de RNA de uma determinada célula. Depende do tempo e das condições à qual ela está sendo submetida;
  • 47. Tipos de RNA: tRNA http://www.medcenter.com/medscape/content.aspx?id=10938&langtype=1046
  • 48. Banco de Dados para microRNA http://www.mirbase.org/
  • 49. Bioinfo.lifl.fr/rna
  • 50. • Enquanto o genoma é apenas um, existem vários transcriptomas possíveis para uma mesma espécie.
  • 51. • As análises de genoma e transcriptoma são complementares e ambas são importantes para responder perguntas específicas.
  • 52. Antes de começar qualquer experimento: • Qual é a pergunta? Importante!
  • 53. Objetivos para sequenciamento (DNA/RNA) Exemplo Sequenciament o de novo Sequenciamento genômico Sequenciamento de >1000 genomas de influenza DNA de org. extinto Neanderthal Metagenomica Intestino humano Resequencia- mento Genomas completos Indivíduos humanos Regiões genômicas Detecção de rearranjos ou regiões associados à doenças Mutações somáticas Em câncer Transcriptoma mRNA Definir regulação da transcrição RNA-Seq RNAs não codificadores Identificar e quantificar microRNAs
  • 54. Gene Expression Methods Transcriptomics • cDNA sequencing in low scale (EST projects) • DNA microarrays • SAGE (Serial Analysis of Gene Expression) • MPSS (Massively Parallel Signature Sequencing) •cDNA sequencing in large scale (RNA-Seq) • Real Time PCR (medium scale)
  • 55. Estudos com RNA-Seq  Mapeamento do inicio da trancrição (start códon);  Detecção da fita especifica;  Caracterização de splicing alternativo;  Detecção de operons;  Perfil de RNA curto;  Genes diferencialmente expressos;  Amostras com pouco RNA.
  • 56. Splicing Revista Ciência Hoje – Vol. 29, nº 171, 2001.
  • 57. Splicing Revista Ciência Hoje – Vol. 29, nº 171, 2001.
  • 58. Genoma e Complexidade Biológica • A complexidade morfológica, fisiológica e comportamental de uma espécie não está diretamente relacionada ao tamanho do genoma ou ao número de genes. Revista Ciência Hoje – Vol. 38, nº 228, 2006.
  • 59. Paradoxo do número de genes Revista Ciência Hoje – Vol. 38, nº 228, 2006. “Um segmento de uma molécula de DNA que contêm a informação necessária para a síntese de um produto biológico funcional, seja proteína ou RNA é denominado GENE.” (Lehninger, 2011)
  • 60. “DNA-Lixo”? Revista Ciência Hoje – Vol. 38, nº 228, 2006.
  • 61. Comparação de Equipamentos para Transcriptômica
  • 62. RNA-Seq ou sequenciamento completo do transcriptoma - PubMed
  • 63. PubMed - microarray papers, year by year
  • 64. RNA-Seq
  • 65. Agora temos os dados! - Vamos precisar de um bioinformata!
  • 66. Milhões de reads sequenciados Conhecimento Biológico
  • 67. http://informaticabiomedica.org/bioinformatica/blog
  • 68. Análise estatística de expressão diferencial • Há diversos métodos disponíveis e é difícil definir qual é o melhor. • De maneira geral, deve-se ter uma métrica que compare uma amostra contra outra (ou outras), e uma probabilidade associada, que define se a diferença observada é pouco provável de ser explicada por variações ao acaso. • Como um exemplo, vamos considerar um estudo de RNA-Seq no qual cinco pacientes com câncer foram comparados com cinco controles. • Foram feitas 30 sequenciamentos, 3 réplicas para cada amostra. Deve-se realizar um teste estatístico para avaliar a expressão diferencial.
  • 69. Ferramentas • Linux; • Linha de comando e tabelas.
  • 70. IGV - Integrative Genomics Viewer
  • 71. Galaxy
  • 72. Galaxy
  • 73. CLC GENOMICS WORKBENCH
  • 74. CLC GENOMICS WORKBENCH
  • 75. ARTEMIS: Genome Browser and Annotation Tool
  • 76. ARTEMIS: Genome Browser and Annotation Tool
  • 77. ARTEMIS: Genome Browser and Annotation Tool
  • 78. ARTEMIS: Genome Browser and Annotation Tool
  • 79. ARTEMIS: Genome Browser and Annotation Tool
  • 80. Reportagem http://informaticabiomedica.org/bioinformatica/medicina-personalizada-aposta-na-cura-pelos-genes
  • 81. Considerações Finais • Uma visão unificada das ciências tem o potencial de revolucionar o conhecimento humano e trazer soluções para grandes dilemas da humanidade; • A computação desempenhará um papel essencial para garantir que esta nova forma de trabalhar ocorra nas ciências. (Dr. em Bioinformática: Leandro Carrijo Cintra)
  • 82. Referências Livros: • Bioinformatics for Dummies, 2007. • Lenhinger Princípios de Bioquímica, 5ª ed, 2011. • Curso Online Introdução a Bioinformática http://www2.bioqmed.ufrj.br/prosdocimi/FProsdocim
  • 83. Blog • helbacirino.blogspot.com  bioinformática
  • 84. Dúvidas?
  • 85. FLÁVIA DE FÁTIMA COSTA Laboratório de Bioinformática – UFPR PROTEÔMICA
  • 86. O QUE É PROTEÔMICA? • Estudo das proteínas = o produto da expressão do genoma; • Auxilia as demais áreas da Bioinformática; • Existe mais proteínas do que genes; • Etapas: extração, separação, visualização, identificação e qualificação (em determinados momentos); • Impossível proteoma completo de um organismo; • A seqüência de aminoácidos de uma proteína é especificada pela seqüência de nucleotídeos de um gene.
  • 87. Objetivo: entender como as proteínas atuam (em conjunto) para regular as atividades do organismo.
  • 88. Algoritmos É uma sequência de instruções bem definidas e não ambíguas, que são executadas por um computador.
  • 89. O código genético
  • 90. Código dos aminoácidos
  • 91. BANCO DE DADOS • As proteínas exercem sua função de acordo com sua estrutura espacial, ou seja, a função da proteína está intrinsecamente ligada a sua conformação tridimensional, à sua estrutura.
  • 92. BANCO DE DADOS • A biologia se tornou uma ciência rica em dados; • Grande quantidade de dados gerados em experimentos; • Necessidade para estocar e cruzar grandes conjuntos de dados; • Arquivar, curar, analisar e interpretar estes dados são um desafio; • Métodos convenientes para estocar, pesquisar e recuperar são necessários; • Os bancos de dados são a forma de lidar com esta sobrecarga de dados.
  • 93. UTILIDADE • Disponibilizar os dados biológicos: Aos cientistas De forma legível aos computadores – Análises (baseada em computador) – Manipular e compartilhar grandes volumes de dados – Interface para sistemas baseados em computador (algoritmos, interfaces Web) • Estocagem de dados - Formatos definidos - Estocagem e recuperação automática de dados experimental • Ligação com fontes de dados externos
  • 94. Categorias de bancos de dados biológicos • Sequências de nucleotídios • Sequências de RNA • Sequências de proteínas • Genômica (não vertebrados) • Vias metabólicas e de sinalização • Genoma humano e de outros vertebrados • Doenças e genes humanos • Dados de microarranjos e outras expressões gênicas • Fontes de proteômica • Outros bancos de dados biológicos moleculares • Organelas • Plantas • imunológicos
  • 95. Bancos de dados de seqüência de nucleotídeos
  • 96. Bancos de dados de seqüências de proteínas
  • 97. Vias metabólicas
  • 98. FASTA
  • 99. GenBank
  • 100. GenBank
  • 101. FILOGÊNIA • O DNA de qualquer espécie de ser vivo sofre mutações ao longo do tempo e que parte destas mutações se fixam; • Quando duas espécies surgem a partir de um ancestral comum elas passam a acumular mutações distintas ; • O numero de mutações acumuladas tende a ser proporcional ao tempo de divergência de duas espécies; • Deste modo a analise desta mutações permitira a inferência do processo evolutivo dos organismos comparados;
  • 102. ALINHAMENTOS • Sequências Homólogas = são sequências que compartilham um ancestral em comum.
  • 103. Exemplo de homólogos
  • 104. Alinhamento de seqüência • Tarefa de localizar regiões equivalente em duas ou mais sequências para maximizar suas similaridades; • Pode ser usado para sequências de DNA ou proteínas: -Útil em Medidas de conservação (identidade/ similaridade) -Busca de similaridade em bancos de dados -Análise filogenética -Estabelecimento de motivos conservados -Determinação de famílias de proteínas
  • 105. Alinhamento de seqüência
  • 106. Tipos de alinhamentos • Cada tipo é apropriado para resolver um problema particular: • Alinhamento local; • Alinhamento global; • Alinhamento de pares; • Alinhamento múltiplo.
  • 107. http://blast.ncbi.nlm.nih.gov/Blast.cgi
  • 108. E-value • PROBABILIDADE QUE O ALINHAMENTO ENTRE DUAS SEQUENCIAS TENHAM SIDO ALINHADAS AO ACASO.
  • 109. FARMACOGENÔMICA / FARMACOGENÉTICA • Entender a interação da constituição genética de um indivíduo com a resposta a drogas.
  • 110. FARMACOGENÔMICA / FARMACOGENÉTICA • OBJETIVO: contribuir para encerrar com tratamentos inadequados. • Vários grupos distribuídos pelo país. • Redução de despesas com vários medicamentos.
  • 111. CURSOS DE BIOINFORMÁTICA • Mestrado e Doutorado em Bioinformática da USP; • Mestrado e Doutorado em Bioinformática da UFMG; • Mestrado e Doutorado em Computação: Especialidade em Bioinformática – UFPE; • Mestrado e Doutorado em Biologia Computacional e Sistemas – FIOCRUZ – RJ; • Mestrado e Doutorado Modelagem Computacional: de Biosistemas e Bioinformática – LNCC; • Mestrado em Bioinformática - UFPR; • Bacharelado em Informática Biomédica – USP e UFPR; • Graduação em Bioinformática – Univ. Cruzeiro do Sul – SP.
  • 112. Outras Instituições - LNCC
  • 113. Outras Instituições - LNCC
  • 114. FUTURO • Prescrição de tratamentos médicos baseados nas características genéticas do indivíduo; • Estratégia muito útil para o tratamento do câncer – vide Steve Jobs; • Design sintético de medicamentos: o acumulo de informações biológicas e a modelagem matemática dos processos biológicos permitirão a descoberta de novos medicamentos utilizando procedimentos in silico.
  • 115. FUTURO • Suporte à biologia sintética: organismos serão produzidos com características genéticas sintéticas, ou seja planejadas em laboratório. • Vide experimento do Graig Venter Institute.
  • 116. CONCLUSÃO
  • 117. REFERÊNCIAS • http://www.ghente.org/temas/farmacogenomica/ , acessado em 12/08/13. • http://www.biotecnologia.com.br/revista/bio32/o ,acessado em 12/08/13. • Lesk , A. M. Introdução à Bioinformática; 2ª Edição , Editora Artmed.