Bioinfo - Grad - Aula 3
Upcoming SlideShare
Loading in...5
×
 

Bioinfo - Grad - Aula 3

on

  • 802 views

 

Statistics

Views

Total Views
802
Views on SlideShare
182
Embed Views
620

Actions

Likes
0
Downloads
4
Comments
0

3 Embeds 620

http://www.lab-bioinfo.com 590
http://ucb.lab-bioinfo.com 23
http://10.150.3.54 7

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Bioinfo - Grad - Aula 3 Bioinfo - Grad - Aula 3 Presentation Transcript

  • + Bioinformática Alinhamentos de sequências Gabriel da Rocha Fernandes Universidade Católica de Brasília gabrielf@ucb.br - fernandes.gabriel@gmail.com
  • + Arquivo de sequência - FASTA 2 >gi|197101743|ref|NP_001125556.1| myoglobin [Pongo abelii] MGLSDGEWQLVLNVWGKVEADIPSHGQEVLIRLFKGHPETLEKFDK FKHLKSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQ SHATKHKIPVKYLEFISESIIQVLQSKHPGDFGADAQGAMNKALEL FRKDMASNYKELGFQG >gi|386872|gb|AAA59595.1| myoglobin [Homo sapiens] MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDK FKHLKSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQ SHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAEGAMNKALEL FRKDMASNYKELGFQG
  • + Alinhamentos nSimples X Múltiplo n Local X Global n Heurístico X Ótimo 3 Score = 276 bits (139), Expect = 3e-78 Identities = 139/139 (100%) Strand = Plus / Plus Query: 326 aggtgtaaaaccgtttgaatgcacttattgttataaaggattcactcgaaattctgatct 385 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct: 560 aggtgtaaaaccgtttgaatgcacttattgttataaaggattcactcgaaattctgatct 619 Query: 386 tcataagcacatcgacgctgttcacaaaggtctcaagcctttcggatgtgaagtatgcca 445 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct: 620 tcataagcacatcgacgctgttcacaaaggtctcaagcctttcggatgtgaagtatgcca 679 Query: 446 gcgaaacttctctcagaaa 464 ||||||||||||||||||| Sbjct: 680 gcgaaacttctctcagaaa 698
  • + Alinhamento simples n Aquele realizado entre seqüências de DNA ou proteínas, desde que duas a duas 4 Score = 652 bits (329), Expect = 0.0 Identities = 240/240 (100%) Strand = Plus / Plus Query: 1 ctttcaagatgaacgaaccaactggtgtcgggccaacatttgctgatgcatgcgatgatg 60 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct: 136 ctttcaagatgaacgaaccaactggtgtcgggccaacatttgctgatgcatgcgatgatg 195 Query: 61 gcgaacttatcagcatttgttgtctttgtggtaaaacgttttcaagtcagagtcttctac 120 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct: 196 gcgaacttatcagcatttgttgtctttgtggtaaaacgttttcaagtcagagtcttctac 255 Query: 121 acaaacattttgaattgatgcatgaaggtacggaaatagatactgaacagtatgatctaa 180 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct: 256 acaaacattttgaattgatgcatgaaggtacggaaatagatactgaacagtatgatctaa 315 Query: 181 gtggatttgccgctatggggaatgaacaaggtcgtaaaagtaatggtgaagaagatgcaa 240 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct: 316 gtggatttgccgctatggggaatgaacaaggtcgtaaaagtaatggtgaagaagatgcaa 375
  • + Alinhamento multiplo nAquele realizado entre MAIS DE DUAS seqüências de DNA ou proteínas 5 Seq1 ------------------------------------------------------------ Seq4 -GCACGAGGACTGTGA-----ACCGAATCGGTTCAGTAAAATGTTCAATTGTGCGCTGGA Seq2 ------------------------------GTTCAGTAAAATGTTCAATTGTGCGCTGGA Seq3 GGCACGAGGGCTACGACTGTGAACGAATCGGTTCAGTAAAATGTTCAATTGTGCGCTGGA Seq1 ------------------------------------------------------------ Seq4 ATCTATTGTGTAGACTATTAACTATGGAATTTTACTTCACATTGACTAAAAAGCTGAGCA Seq2 ATCTATTGTGTAGACT-TTAACTATGGAATTTTACTTCACATTGACTAAAAAGCTGAGCA Seq3 ATCTATTGTGTAGACTATTAACTATGGAATTTTACTTCACATT-ACTAAAAAGCTGAGCA Seq1 ---------------------CTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT Seq4 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT Seq2 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT Seq3 AATATACCTGGAGCGTTCAGACTTTCAAGATGAACGAACCAACTGGTGTCGGGCCAACAT ***************************************
  • + Alinhamento global e local nGlobal: as seqs são alinhadas de ponta a ponta nLocal: pedaços das seqs é que são comparados 6
  • + Alinhamentos ótimos e heurísticos nheurística -- do dicionário Houaiss nmétodo de investigação baseado na aproximação progressiva de um dado problema nAlinhamento ótimo: produz o melhor resultado computacionalmente possível nAlinhamento heurístico: produz um resultado o mais próximo possível do resultado ótimo, mas, principalmente, produz um resultado de maneira muito veloz 7
  • + Ferramentas de alinhamento 8
  • + Elementos do alinhamento 9
  • + Matrizes de substituição 10 A C G T A 1 -2 -2 -2 C -2 1 -2 -2 G -2 -2 1 -2 T -2 -2 -2 1 A C G T A 1 -2 -1 -2 C -2 1 -2 -1 G -1 -2 1 -2 T -2 -1 -2 1
  • + Matrizes de substituição 11
  • + BLAST nBasic Local Alignment Search Tool nFerramenta de alinhamento mais utilizada no mundo nTodo pesquisador em biologia molecular já usou alguma vez (ou centenas de vezes) nDiz-se que o trabalho original onde a ferramenta foi publicada é o mais citado da história das ciências biológicas nÉ um algoritmo de alinhamento simples, heurístico e local nAlinha um seqüência de entrada contra uma base de dados desejada 12
  • + Programas do BLAST 13 Formato da Seqüência de Entrada Banco de dados Formato da seqüência que é comparado Programa BLAST adequado Nucleotídeos Nucleotídeos Nucleotídeos BLASTn Proteínas Proteínas Proteínas BLASTp Nucleotídeos Proteínas Proteínas BLASTx Proteínas Nucleotídeos Proteínas TBLASTn Nucleotídeos Nucleotídeos Proteínas TBLASTtx
  • + Alinhamento multiplo 14 conservation profile conserved residues secondary structure
  • + Filogenia a partir do alinhamento nMatriz de distância entre as proteínas alinhadas nClustal: 1 - (resíduos idênticos/resíduos alinhados) 15 - .17 - .59 .60 - .59 .59 .13 - .77 .77 .75 .75 - .81 .82 .73 .74 .80 - .87 .86 .86 .88 .93 .90 - Hbb_human Hbb_horse Hba_human Hba_horse Myg_phyca Glb5_petma Lgb2_lupla 1 2 3 4 5 6 7 1 2 3 4 5 6 7