Bioinformatica
Upcoming SlideShare
Loading in...5
×
 

Bioinformatica

on

  • 1,221 views

 

Statistics

Views

Total Views
1,221
Views on SlideShare
1,220
Embed Views
1

Actions

Likes
0
Downloads
17
Comments
0

1 Embed 1

http://huajsapata.unap.edu.pe 1

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Bioinformatica Bioinformatica Presentation Transcript

  • GRUPO #4
    Bioinformática
  • Primera Parte
    Se nos entregó una lista de secuencias y número de accesos para buscar a qué organismo pertenecían o proteína.
    Se utilizó el website de NCBI para hacer este análisis.
    Para las secuencias de amino ácidos utilizamos el Protein BLAST.
    Para las secuencias de nucleótidos utilizamos Nucleotide BLAST.
  • Secuencia 1
    Resultado
    1 caaaaattcccaatttgttttttcaaacaaacttgctcagatcctcttcttcttagggat
    61 caatcttcaaatcaattgttgttaaaataaatgggattaaagcgaccttatgatgctgaa
    121 gagatgcaaaagtgcaatgctaagcatgcaagacagcttagttacaaaaaccataaccaa
    181 tttgacgaagctattccatatcatcatgcttctatggagaagaagacaaatgttttagag
    241 gatctgattggtctctgtgagaatcctacgtggactaatgatgcaaatcacgttgacaag
    301 ggttttgaaacaaccggtttgtgtcaggaagattctcagtctggagtgacgactcagtca
    361 gatctttctcatcaatcttctggttcagatttcacctggaagccagtggaagatgtttat
    421 acttgtttgatgaatcaacctcctaggaaacaagttcttgttgggtctaatcatcaagcg
    481 gatattcccgagtttgtcaaggaagagattcttgatcagtcagaggctcgaactaaggag
    541 gacttagaagggaagctgatgagaaagtgtgtgataccaatgtctgactctgacctttgt
    601 ggaaccggtcaaggaagaaaggaatgtctttgcctagataaaggctctattagatgtgtg
    661 cggcgacatatcattgaagccagagagagtttggttgaaactattggatatgaaaggttt
    721 atggagctagggttatgtgagatgggggaggaagttgcgagtttatggacagaggaagaa
    781 gaagatctctttcacaaggttgtatactccaatcctttctcagcgggtcgtgacttctgg
    841 aagcaattaaagggaacgtttccttcaagaaccatgaaggagttggttagctactacttc
    901 aatgtcttcatcttgcggagacggggtattcagaatcggttcaaagccctagatgttaac
    961 agtgatgatgacgagtggcaagttgaatacaacatttttaacagcaccaaatctttagat
    1021 gaggaaaacaacaatggaaatcgctcctcatatgaagataacgaggaagaagaagaaacc
    1081 agcagcaatgatgatgatgaagaagaagaagaggaagacgactcatcaagtaacgatgct
    1141 cattgtgtagatacggataaggcttcaagagacggttttggtgaagaagtaaatgtggaa
    1201 gacgactcatgtatgtccttcgagttacaagactccaacttgatcttcagtcacaaccca
    1261 atcaaaaacagagagtgccacagatctggtgaagattcatattcatttgatgatcagaaa
    1321 ttcacatcagattgttggaacaagaacaacgatctactaccaacttcaaacattattgag
    1381 gagatatttggtcaagacgattggggagataaagatgataataacttgaaggagaagtaa
    1441 ataaaaagttttcttctcttctttcatggattctgcagattttttttttcttaagtgaat
    1501 tagataaagatgcagaagtttgaaagtttcatctttaggagttttgtgttggttaaggtt
    1561 gaagaagaaaggacttcctgattgatttgactctgtaaaaaatgctattcaaatccatga
    1621 acctttttttctctagttgttttagtcctcaagatctcaatgtacattattatggtataa
    1681 aa 
    Se sometió esta secuencia a nucleotide BLAST, se escogió la opción de OTHERS para buscar el organismo a la cual pertenece la secuencia y se encontró que pertenece a Arabidopsisthaliana
    Resultados
  • Secuencia 2
    Resultado
     
    MKVYFESYGCTLNKRDTLYMQAQIENTTNNLEEADVVVINSCIV
    KQPTETKILYRINQLKKMGKKIVLTGCMVSEPYLKYKELQDISLVNIYNQDRIKEAIE
    RTYKGERVLFLEKKKIYKEFARPLSKARAIIQIQEGCLWRCTYCGTKLARSMFYSYPP
    KLIKREIEEKLKQGIKIFYLTGPDTATYGKDINYSLADLLKDLIEIEGDFYIRVGMAN
    PTFFLEQIDELIDVFKSNKIFKFFHLPVQSGSNKVLKDMNRPYTIEEYKELIYKLRKH
    FPLATYVTDIIVGYPTETEEDFEQTLELVREIKFDGINISRFWRRPGTIAWNLKQLDP
    EIVTNRVKRLKEVFLQGAYERNKLWLNWEGEAIIEEKGKNNTWIAKNEMYKQIIVKGN
    YEEGQKIKVKIKKARAIDLIA
    MERDLNVTDLELVEKVKSGDRRSFSELVKRHQRSVLRMSLRFVK
    DMDTAEDVTQEAFIKAYEKLNTFEGRSSFKSWLFQIAVNTARNKLREWKRDTVDIDDV
    QLAVDAEAETTLVHTAVSDILKNEVEKLPFKQKTALVLRVYEDLSFNEIADIMECPYD
    TAKANYRHALMKLRQTFEQQAELKNWTEEVGGFFLEVNQRFAEAEG
    Se sometió a Protein BLAST y se encontró que no hay un por ciento de similaridad mayor de 45% en el banco.
    Encontramos que la secuencia tiene un 45% de similaridad a la proteína de Thermotoga marítima: Sadenosyl-methioninemethylthio- transferase.
    Resultados
  • Número de acceso
    Resultado
    NC_005014BX842648 
    Sometiendo el número encontramos que corresponde 100% a Salmonella entericasubsp. entérica serovarTyphimuriumplasmid R64
    Resultados
  • Secuencia 3
    Resultado
    1 gatgaacgctggcggcgtgcttaacacatgcaagtcgaacgatgatcccagcttgctggg
    61 ggattagtggcgaacgggtgagtaacacgtgagtaacctgcccttaactctgggataagc
    121 ctgggaaactgggtctaataccggatatgactcctcatcgcatggtggggggtggaaagc
    181 tttattgtggttttggatggactcgcggcctatcagcttgttggtgaggtaatggctcac
    241 caaggcgacgacgggtagccggcctgagagggtgaccggccacactgggactgagacacg
    301 gcccagactcctacgggaggcagcagtggggaatattgcacaatgggcgaaagcctgatg
    361 cagcgacgccgcgtgagggatgacggccttcgggttgtaaacctctttcagtagggaaga
    421 agcgaaagtgacggtacctgcagaagaagcgccggctaactacgtgccagcagccgcggt
    481 aatacgtagggcgcaagcgttatccggaattattgggcgtaaagagctcgtaggcggttt
    541 gtcgcgtctgccgtgaaagtccggggctcaactccggatctgcggtgggtacgggcagac
    601 tagagtgatgtaggggagactggaattcctggtgtagcggtgaaatgcgcagatatcagg
    661 aggaacaccgatggcgaaggcaggtctctgggcattaactgacgctgaggagcgaaagca
    721 tggggagcgaacaggattagataccctggtagtccatgccgtaaacgttgggcactaggt
    781 gtgggggacattccacgttttccgcgccgtagctaacgcattaagtgccccgcctgggga
    841 gtacggccgcaaggctaaaactcaaaggaattgacgggggcccgcacaagcggcggagca
    901 tgcggattaattcgatgcaacgcgaagaaccttaccaaggcttgacatgaaccggtaata
    961 cctggaaaacaggtgccccgcttgcggtcggtttacaggtggtgcatggttgtcgtcagc
    1021 tcgtgtcgtgagatgttgggttaagtcccgcaacgagcgcaaccctcgttctatgttgcc
    1081 agcgcgtgatggcggggactcataggagactgccggggtcaactcggaggaaggtgggga
    1141 cgacgtcaaatcatcatgccccttatgtcttgggcttcacgcatgctacaatggccggta
    1201 caaagggttgcgatactgtgaggtggagctaatcccaaaaagccggtctcagttcggatt
    1261 ggggtctgcaactcgaccccatgaagtcggagtcgctagtaatcgcagatcagcaacgct
    1321 gcggtgaatacgttcccgggccttgtacacaccgcccgtcaagtcacgaaagttggtaac
    1381 acccgaagccggtggcctaaccccttgtgggagggagctgtcgaaggtgggactggcgat
    1441 tgggactaagtcgtaacaaggta
    Se sometió esta secuencia a nucleotide BLAST, el organismo a la cual pertenece la secuencia y se encontró que pertenece a Arthrobactersp.
    Resultados
  • Secuencia 4
    Resultado
    1 aattcgatgcaacgcgaagaaccttacctgggtttgacatgcacaggacgccggcagaga
    61 tgtcggttcccttgtggcctgtgtgcaggtggtgcatggctgtcgtcagctcgtgtcgtg
    121 agatgttgggttaagtcccgcaacgagcgcaacccttgtcctatgttgccagcgggttat
    181 gccggggactcgtaggagactgccggggtcaactcggaggaaggtggggatgacgtcaag
    241 tcatcatgccccttatgtccagggcttcacacatgctacaatggccggtacaaagggctg
    301 cgatgccgtgaggtggagcgaatcctttcaaagccggtctcagttcggatcggggtctgc
    361 aactcgaccccgtgaagtcggagtcgctagtaatcgcagatcagcaacgctgcggtgaat
    421 acgttcccgggccttgtacacaccgcccgtcacgtcatgaaagtcggtaacacccgaagc
    481 cggtggcctaacccttgtggagggagccgtcgaaggtgggatcggcgattgg
    Organismo encontrado fue Mycobacteriummucogenicum
    Resultados
  • Secuencia 5
    Resultado
    MSRPRLIVALFLFFNVFVHGENKVKQSTIALALLPLLFTPVTKA RTPEMPVLENRAAQGDITAPGGARRLTADQTAALRDSLSDKPAKNIILLIGDGMGDSE ITAARNYAEGAGGFFKGIDALPLTGQYTHYALNKKTGKPDYVTDSAASATAWSTGVKT YNGALGVDIHEKDHPTILEMAKAAGLATGNVSTAELQDATPAALVAHVTSRKCYGPSA TSEKCPGNALEKGGKGSITEQLLNARADVTLGGGAKTFAETATAGEWQGKTLREQAQA RGYQLVSDAASLNSVTEANQQKPLLGLFADGNMPVRWLGPKATYHGNIDKPAVTCTPN PQRNDSVPTLAQMTDKAIELLSKNEKGFFLQVEGASIDKQDHAANPCGQIGETVDLDE AVQRALEFAKKDGNTLVIVTADHAHASQIVAPDTKAPGLTQALNTKDGAVMVMSYGNS EEDSQEHTGSQLRIAAYGPHAANVVGLTDQTDLFYTMKAALGLK
    Se encuentra que para el Protein BLAST, hay un 91% de similitud de la secuencia de una proteína de E. coli– AlkalinePhosphatase
    Resultados
  • Secuencia 6
    Resultado
    MRLAALLLAALLATPAFAVQPDEILPDPALEARARDISQGLRCL
    VCRNENIDDSNAQLARDLRLLVRERLAAGDSDAEVVEFVVDRYGEYVLLNPTTGGANL
    ILWIAGPAMLAGGLGLAALYLRRRRTAPDAASAALSDEEQARLPEILKD
    Esta secuencia pertenece a una mutación del citocromo c de Rhodobactersphaeroides
    Resultados
  • Secuencia 7
    Resultado
    YVEPPPAAFIGIDELGKWSFYRALIAEFIATLLFLYITVLTVIG YKSQSATDPCGGVGILGIAWAFGGMIFVLVYCTAGISGGHINPAVT
    Pertenece a aquaporine PIP3-like protein de Apiumgraveolens
    Resultados
  • Segunda Parte
    Ir al Map Viewer del Human Genome en NCBI y determinar lo siguiente:
    ¿Cuántoscromosomastiene un perro, una rata y Arabidopsis?
    Determine en quécromosoma(s) se encuentran los genes relacionados con lo siguiente:
    a. Anemia falciforme
    b. Parkinson
    c. Alzheimer
    d. fibrosis cística
    e. Diabetes
    f. cancer (seleccioneuno)
    UsandoGenBank
    Número de acceso: AF321136
    a. organismo del cualproviene la secuencia
    b. número de genes presentes en la secuencia
    c. funciónsugerida de alguno de el o los genes
    d. Seleccione 20 nucleótidos de cualquierregión de uno de los genes.
    e. Seleccione los amino ácidosquedesee de una de lassecuencias de proteínaspresentes.
    Usando BLAST
    Determine a quiénperteneceesasecuencia de la parte d y e
    a. Realiceunabúsquedausando la secuencia de DNA y proteínasque
    copio en 2d y 2e (arriba).
    b. ¿Cuálesfueron los tresprimeros “hits” obtenidos de cadauna?
    Ir a http://expasy.cbr.nrc.ca/tools/scnpsit1.html
    a. Seleccione la secuenciacompleta de CcmH en AF321136 y realiceunabúsqueda.
    b. Escriba el primer motif, motivo o secuenciaconservadaqueencuentre y sufunción.
  • Cromosomas
    Perro:Canis lupus familiaris
    40 cromosomas
    Rata: Rattusnorvegicus 21 cromosomas
    Thale cress: Arabidopsisthaliana
    5 cromosomas
  • Anemica falciforme
    Parkinson
    Cromosomas: 1, 2, 4, 5, 6, 8, 9, 11, 12, 17, 18, 22, X: 172 hits
    Cromosoma 11: 1 hit
    Enfermedades
  • Fibrosis cística
    Diabetes
    Cromosomas: 1, 7, 13, 19:
    241 hits
    Cromosomas no relacionados: 21, 2, Y: 259 hits
    Enfermedades
  • Alzheimer
    Cáncer de la próstata
    Cromosomas no relacionados 13,15,16,18, 11, Y: 184 hits
    Cromosomas todos excepto Y: 600 hits
    Enfermedades
  • GenBank y Número de acceso AF321136
    a. organismo del cualproviene la secuencia: Rhodobactersphaeroides
    b. número de genes presentes en la secuencia: Se encuentran 3 genes en la secuencia
    c. funciónsugerida de los genes:
    1. Gen ccmH = maduración de la proteínaCcmH.
    2. Gen ccmF = maduración de la proteínaCcmF.
    3. Gen quecodificapara la proteínaenoyl-CoA-Hydratase
    d. Seleccione 20 nucleótidos: Gen ccmH : 1 atgaggctcgcggcgcttct
    e. Seleccione los amino ácidosquedesee de una de lassecuencias de proteínaspresentes:
    Gen ccmH: MRLAALLLAALLATPAFAVQPDEILPDPALEARARDISQGLRCL VCRNENIDDSNAQLARDLRLLVRERLAAGDSDAEVVEFVVDRYGEYVLLNPTTGGANLILWIAGPAMLAGGLGLAALYLRRRRTAPDAASAALSDEEQARLPEILKD
  • Buscar la secuencia de DNA y proteínasquecopioanteriormente
    ¿Cuálesfueron los tresprimeros “hits” obtenidos de cadauna?
    Secuencia de DNA:
    29-40 EGF_1(PS00022)
    81-96 INTEGRIN_BETA(PS00243)
    138-151 INTEGRIN_BETA(PS00243)
    Secuencia de aminoácidos:
    Rhodobactersphaeroides
    Rhodobactersphaeroides 2.4.1
    RhodobactersphaeroidesKD131
    BLAST
  • Usando http://expasy.cbr.nrc.ca/tools/scnpsit1.html
    Seleccione la secuenciacompleta de CcmH en AF321136 y realiceunabúsqueda
    Escriba el primer motif, motivo o secuenciaconservadaqueencuentre y sufunción
    Resultado:
    PDOC00021: EGF-like domain signatures and profile
    Descripción:
    Secuencia de 30-40 residuos de aminoácidos de largo encontrada en la secuencia del factor de crecimento epidermal (EGF), el cual se ha encontradomayormente en proteínas de animales. EGF es un polipéptido de 50 aminoácidos con 3 puentesdisulfurointernos. Este primero se enlaza con altaafinidad a un receptor específico en la superficie de unacélula y luego induce sudimerización, la cualesesencialpara la activación de la tirosina-kinasa en el dominiocitoplasmático del receptor, iniciandoasíunaseñal de transducciónqueresulta en la síntesis de DNA y proliferacióncelular. Además ha sidoencontrado en el dominioextracelular de todaslasproteínas de la membrana o en proteínaque son secretadas.
  • The End