Introdução à Bioinformática
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Aprendizado de Máquina

Fornece técnicas para lidar com os problemas acima
                                                     17
18
19
20
Bioquímica Computacional




                           21
Crescimento exponencial das bases de dados




22
Bioquímica Computacional




                           23
24
Bioquímica Computacional




                           25
Banco de dados
                                    de sequências



Sequência “query”




                    Alinhamento


                                   score

                         Melhoramento do alinhamento
                         até um score máximo
                                                       26
28
Super-family:
Probable common evolutionary origin - Proteins that have
low sequence identities, but with structural and
functional   features suggesting    that   a    common
evolutionary origin.
Family:
Proteins    clustered    together    into    families   are
evolutionarily related with pair-wise residue identities
between the proteins of 30% and greater. Some cases
with low identity could have similar folds and evolution.
Fold:
Major structural similarity. Similar in secondary structure
elements with same topological connections. Proteins
with same fold may not have common evolutionary
origin.
                                                              29
30
31
32
33
34
35
36
37
A Computação está para a Biologia da
mesma forma que a matemática está
           para física
                     Harold Morowitz

                                       38
Observa-se que a natureza é conservadora!




     Similaridade entre as seqüências




Transmissão de informações sobre uma
 seqüência para outras similares com
         fidelidade razoável
                                            3
●




    40
Duas seqüências são combinadas aleatoriamente



Qualidade da combinação é avaliada e pontuada



  Uma seqüência é movida em relação a outra
    e a combinação é pontuada novamente



Obtenção da melhor pontuação de alinhamento




   Método automatizado  Alinhamento entre as
             milhares de alternativas
                                                4
:




    ■




        42
:



       Identidade X Similaridade X Homologia

    ► Identidade → Presença do mesmo ácido nucléico ou
    aminoácido na mesma posição em duas seqüências alinhadas;


    ► Similaridade → Apenas quando ocorrer substituições → Dois
    aminoácidos são considerados similares se um puder           ser
    substituído por outro com propriedades químicas similares;



    ► Homologia → Relação evolutiva → Duas seqüências são
    homólogas se derivarem da mesma seqüência ancestral.

                                                                       4
44
45
46
47
48
49
50
51
52
53
54
55
Redes Neurais, Algoritmos Genéticos


BIOLOGIA                    COMPUTAÇÃO



           Bioinformática

                                         56
57
58
59
60

Introdução a bioinformatica

  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
    Aprendizado de Máquina Fornecetécnicas para lidar com os problemas acima 17
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
    Crescimento exponencial dasbases de dados 22
  • 23.
  • 24.
  • 25.
  • 26.
    Banco de dados de sequências Sequência “query” Alinhamento score Melhoramento do alinhamento até um score máximo 26
  • 28.
  • 29.
    Super-family: Probable common evolutionaryorigin - Proteins that have low sequence identities, but with structural and functional features suggesting that a common evolutionary origin. Family: Proteins clustered together into families are evolutionarily related with pair-wise residue identities between the proteins of 30% and greater. Some cases with low identity could have similar folds and evolution. Fold: Major structural similarity. Similar in secondary structure elements with same topological connections. Proteins with same fold may not have common evolutionary origin. 29
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
    A Computação estápara a Biologia da mesma forma que a matemática está para física Harold Morowitz 38
  • 39.
    Observa-se que anatureza é conservadora! Similaridade entre as seqüências Transmissão de informações sobre uma seqüência para outras similares com fidelidade razoável 3
  • 40.
    40
  • 41.
    Duas seqüências sãocombinadas aleatoriamente Qualidade da combinação é avaliada e pontuada Uma seqüência é movida em relação a outra e a combinação é pontuada novamente Obtenção da melhor pontuação de alinhamento Método automatizado  Alinhamento entre as milhares de alternativas 4
  • 42.
    : ■ 42
  • 43.
    : Identidade X Similaridade X Homologia ► Identidade → Presença do mesmo ácido nucléico ou aminoácido na mesma posição em duas seqüências alinhadas; ► Similaridade → Apenas quando ocorrer substituições → Dois aminoácidos são considerados similares se um puder ser substituído por outro com propriedades químicas similares; ► Homologia → Relação evolutiva → Duas seqüências são homólogas se derivarem da mesma seqüência ancestral. 4
  • 44.
  • 45.
  • 46.
  • 47.
  • 48.
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.
  • 54.
  • 55.
  • 56.
    Redes Neurais, AlgoritmosGenéticos BIOLOGIA COMPUTAÇÃO Bioinformática 56
  • 57.
  • 58.
  • 59.
  • 60.