GRUPO #4<br />Bioinformática<br />
Primera Parte<br />Se nos entregó una lista de secuencias y número de accesos  para buscar a qué organismo pertenecían o p...
Secuencia 1<br />Resultado<br />1 caaaaattcccaatttgttttttcaaacaaacttgctcagatcctcttcttcttagggat<br />61 caatcttcaaatcaattgt...
Secuencia 2<br />Resultado<br /> <br />   		    MKVYFESYGCTLNKRDTLYMQAQIENTTNNLEEADVVVINSCIV<br />                    KQPT...
Número de acceso<br />Resultado<br />NC_005014BX842648 <br />Sometiendo el número encontramos que corresponde 100% a Salmo...
Secuencia 3<br />Resultado<br />1 gatgaacgctggcggcgtgcttaacacatgcaagtcgaacgatgatcccagcttgctggg<br />61 ggattagtggcgaacgggt...
Secuencia 4<br />Resultado<br />1 aattcgatgcaacgcgaagaaccttacctgggtttgacatgcacaggacgccggcagaga<br />61 tgtcggttcccttgtggcc...
Secuencia 5<br />Resultado<br />	MSRPRLIVALFLFFNVFVHGENKVKQSTIALALLPLLFTPVTKA                 RTPEMPVLENRAAQGDITAPGGARRLTA...
Secuencia 6<br />Resultado<br />MRLAALLLAALLATPAFAVQPDEILPDPALEARARDISQGLRCL<br />VCRNENIDDSNAQLARDLRLLVRERLAAGDSDAEVVEFVV...
Secuencia 7<br />Resultado<br />YVEPPPAAFIGIDELGKWSFYRALIAEFIATLLFLYITVLTVIG YKSQSATDPCGGVGILGIAWAFGGMIFVLVYCTAGISGGHINPAV...
Segunda Parte<br />Ir al Map Viewer del Human Genome en NCBI y determinar lo siguiente: <br />¿Cuántoscromosomastiene un p...
Cromosomas<br />Perro:Canis lupus familiaris<br />40 cromosomas<br />Rata: Rattusnorvegicus 21 cromosomas<br />Thale cress...
Anemica falciforme<br />Parkinson<br />Cromosomas: 1, 2, 4, 5, 6, 8, 9, 11, 12, 17, 18, 22, X: 172 hits<br />Cromosoma 11:...
Fibrosis cística<br />Diabetes<br />Cromosomas: 1, 7, 13, 19:<br />241 hits<br />Cromosomas no relacionados: 21, 2, Y: 259...
Alzheimer<br />Cáncer de la próstata<br />Cromosomas  no relacionados 13,15,16,18, 11, Y: 184 hits<br />Cromosomas todos e...
GenBank y Número de acceso AF321136 <br />a. organismo del cualproviene la secuencia: Rhodobactersphaeroides<br />b. númer...
Buscar la secuencia de DNA y proteínasquecopioanteriormente<br />¿Cuálesfueron los tresprimeros “hits” obtenidos de cadaun...
Usando http://expasy.cbr.nrc.ca/tools/scnpsit1.html <br />Seleccione la secuenciacompleta de CcmH en AF321136 y realiceuna...
The End <br />
Upcoming SlideShare
Loading in …5
×

Bioinformatica

1,225 views
1,129 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,225
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
21
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Bioinformatica

  1. 1. GRUPO #4<br />Bioinformática<br />
  2. 2. Primera Parte<br />Se nos entregó una lista de secuencias y número de accesos para buscar a qué organismo pertenecían o proteína. <br />Se utilizó el website de NCBI para hacer este análisis.<br />Para las secuencias de amino ácidos utilizamos el Protein BLAST.<br />Para las secuencias de nucleótidos utilizamos Nucleotide BLAST.<br />
  3. 3. Secuencia 1<br />Resultado<br />1 caaaaattcccaatttgttttttcaaacaaacttgctcagatcctcttcttcttagggat<br />61 caatcttcaaatcaattgttgttaaaataaatgggattaaagcgaccttatgatgctgaa<br />121 gagatgcaaaagtgcaatgctaagcatgcaagacagcttagttacaaaaaccataaccaa<br />181 tttgacgaagctattccatatcatcatgcttctatggagaagaagacaaatgttttagag<br />241 gatctgattggtctctgtgagaatcctacgtggactaatgatgcaaatcacgttgacaag<br />301 ggttttgaaacaaccggtttgtgtcaggaagattctcagtctggagtgacgactcagtca<br />361 gatctttctcatcaatcttctggttcagatttcacctggaagccagtggaagatgtttat<br />421 acttgtttgatgaatcaacctcctaggaaacaagttcttgttgggtctaatcatcaagcg<br />481 gatattcccgagtttgtcaaggaagagattcttgatcagtcagaggctcgaactaaggag<br />541 gacttagaagggaagctgatgagaaagtgtgtgataccaatgtctgactctgacctttgt<br />601 ggaaccggtcaaggaagaaaggaatgtctttgcctagataaaggctctattagatgtgtg<br />661 cggcgacatatcattgaagccagagagagtttggttgaaactattggatatgaaaggttt<br />721 atggagctagggttatgtgagatgggggaggaagttgcgagtttatggacagaggaagaa<br />781 gaagatctctttcacaaggttgtatactccaatcctttctcagcgggtcgtgacttctgg<br />841 aagcaattaaagggaacgtttccttcaagaaccatgaaggagttggttagctactacttc<br />901 aatgtcttcatcttgcggagacggggtattcagaatcggttcaaagccctagatgttaac<br />961 agtgatgatgacgagtggcaagttgaatacaacatttttaacagcaccaaatctttagat<br />1021 gaggaaaacaacaatggaaatcgctcctcatatgaagataacgaggaagaagaagaaacc<br />1081 agcagcaatgatgatgatgaagaagaagaagaggaagacgactcatcaagtaacgatgct<br />1141 cattgtgtagatacggataaggcttcaagagacggttttggtgaagaagtaaatgtggaa<br />1201 gacgactcatgtatgtccttcgagttacaagactccaacttgatcttcagtcacaaccca<br />1261 atcaaaaacagagagtgccacagatctggtgaagattcatattcatttgatgatcagaaa<br />1321 ttcacatcagattgttggaacaagaacaacgatctactaccaacttcaaacattattgag<br />1381 gagatatttggtcaagacgattggggagataaagatgataataacttgaaggagaagtaa<br />1441 ataaaaagttttcttctcttctttcatggattctgcagattttttttttcttaagtgaat<br />1501 tagataaagatgcagaagtttgaaagtttcatctttaggagttttgtgttggttaaggtt<br />1561 gaagaagaaaggacttcctgattgatttgactctgtaaaaaatgctattcaaatccatga<br />1621 acctttttttctctagttgttttagtcctcaagatctcaatgtacattattatggtataa<br />1681 aa <br />Se sometió esta secuencia a nucleotide BLAST, se escogió la opción de OTHERS para buscar el organismo a la cual pertenece la secuencia y se encontró que pertenece a Arabidopsisthaliana<br />Resultados<br />
  4. 4. Secuencia 2<br />Resultado<br /> <br /> MKVYFESYGCTLNKRDTLYMQAQIENTTNNLEEADVVVINSCIV<br /> KQPTETKILYRINQLKKMGKKIVLTGCMVSEPYLKYKELQDISLVNIYNQDRIKEAIE<br /> RTYKGERVLFLEKKKIYKEFARPLSKARAIIQIQEGCLWRCTYCGTKLARSMFYSYPP<br /> KLIKREIEEKLKQGIKIFYLTGPDTATYGKDINYSLADLLKDLIEIEGDFYIRVGMAN<br /> PTFFLEQIDELIDVFKSNKIFKFFHLPVQSGSNKVLKDMNRPYTIEEYKELIYKLRKH<br /> FPLATYVTDIIVGYPTETEEDFEQTLELVREIKFDGINISRFWRRPGTIAWNLKQLDP<br /> EIVTNRVKRLKEVFLQGAYERNKLWLNWEGEAIIEEKGKNNTWIAKNEMYKQIIVKGN<br /> YEEGQKIKVKIKKARAIDLIA<br /> MERDLNVTDLELVEKVKSGDRRSFSELVKRHQRSVLRMSLRFVK<br /> DMDTAEDVTQEAFIKAYEKLNTFEGRSSFKSWLFQIAVNTARNKLREWKRDTVDIDDV<br /> QLAVDAEAETTLVHTAVSDILKNEVEKLPFKQKTALVLRVYEDLSFNEIADIMECPYD<br /> TAKANYRHALMKLRQTFEQQAELKNWTEEVGGFFLEVNQRFAEAEG<br />Se sometió a Protein BLAST y se encontró que no hay un por ciento de similaridad mayor de 45% en el banco. <br />Encontramos que la secuencia tiene un 45% de similaridad a la proteína de Thermotoga marítima: Sadenosyl-methioninemethylthio- transferase.<br />Resultados<br />
  5. 5. Número de acceso<br />Resultado<br />NC_005014BX842648 <br />Sometiendo el número encontramos que corresponde 100% a Salmonella entericasubsp. entérica serovarTyphimuriumplasmid R64<br />Resultados<br />
  6. 6. Secuencia 3<br />Resultado<br />1 gatgaacgctggcggcgtgcttaacacatgcaagtcgaacgatgatcccagcttgctggg<br />61 ggattagtggcgaacgggtgagtaacacgtgagtaacctgcccttaactctgggataagc<br />121 ctgggaaactgggtctaataccggatatgactcctcatcgcatggtggggggtggaaagc<br />181 tttattgtggttttggatggactcgcggcctatcagcttgttggtgaggtaatggctcac<br />241 caaggcgacgacgggtagccggcctgagagggtgaccggccacactgggactgagacacg<br />301 gcccagactcctacgggaggcagcagtggggaatattgcacaatgggcgaaagcctgatg<br />361 cagcgacgccgcgtgagggatgacggccttcgggttgtaaacctctttcagtagggaaga<br />421 agcgaaagtgacggtacctgcagaagaagcgccggctaactacgtgccagcagccgcggt<br /> 481 aatacgtagggcgcaagcgttatccggaattattgggcgtaaagagctcgtaggcggttt<br />541 gtcgcgtctgccgtgaaagtccggggctcaactccggatctgcggtgggtacgggcagac<br />601 tagagtgatgtaggggagactggaattcctggtgtagcggtgaaatgcgcagatatcagg<br />661 aggaacaccgatggcgaaggcaggtctctgggcattaactgacgctgaggagcgaaagca<br />721 tggggagcgaacaggattagataccctggtagtccatgccgtaaacgttgggcactaggt<br />781 gtgggggacattccacgttttccgcgccgtagctaacgcattaagtgccccgcctgggga<br />841 gtacggccgcaaggctaaaactcaaaggaattgacgggggcccgcacaagcggcggagca<br />901 tgcggattaattcgatgcaacgcgaagaaccttaccaaggcttgacatgaaccggtaata<br />961 cctggaaaacaggtgccccgcttgcggtcggtttacaggtggtgcatggttgtcgtcagc<br />1021 tcgtgtcgtgagatgttgggttaagtcccgcaacgagcgcaaccctcgttctatgttgcc<br />1081 agcgcgtgatggcggggactcataggagactgccggggtcaactcggaggaaggtgggga<br />1141 cgacgtcaaatcatcatgccccttatgtcttgggcttcacgcatgctacaatggccggta<br />1201 caaagggttgcgatactgtgaggtggagctaatcccaaaaagccggtctcagttcggatt<br />1261 ggggtctgcaactcgaccccatgaagtcggagtcgctagtaatcgcagatcagcaacgct<br />1321 gcggtgaatacgttcccgggccttgtacacaccgcccgtcaagtcacgaaagttggtaac<br />1381 acccgaagccggtggcctaaccccttgtgggagggagctgtcgaaggtgggactggcgat<br />1441 tgggactaagtcgtaacaaggta<br />Se sometió esta secuencia a nucleotide BLAST, el organismo a la cual pertenece la secuencia y se encontró que pertenece a Arthrobactersp.<br />Resultados<br />
  7. 7. Secuencia 4<br />Resultado<br />1 aattcgatgcaacgcgaagaaccttacctgggtttgacatgcacaggacgccggcagaga<br />61 tgtcggttcccttgtggcctgtgtgcaggtggtgcatggctgtcgtcagctcgtgtcgtg<br />121 agatgttgggttaagtcccgcaacgagcgcaacccttgtcctatgttgccagcgggttat<br />181 gccggggactcgtaggagactgccggggtcaactcggaggaaggtggggatgacgtcaag<br />241 tcatcatgccccttatgtccagggcttcacacatgctacaatggccggtacaaagggctg<br />301 cgatgccgtgaggtggagcgaatcctttcaaagccggtctcagttcggatcggggtctgc<br />361 aactcgaccccgtgaagtcggagtcgctagtaatcgcagatcagcaacgctgcggtgaat<br />421 acgttcccgggccttgtacacaccgcccgtcacgtcatgaaagtcggtaacacccgaagc<br />481 cggtggcctaacccttgtggagggagccgtcgaaggtgggatcggcgattgg<br />Organismo encontrado fue Mycobacteriummucogenicum<br />Resultados<br />
  8. 8. Secuencia 5<br />Resultado<br /> MSRPRLIVALFLFFNVFVHGENKVKQSTIALALLPLLFTPVTKA RTPEMPVLENRAAQGDITAPGGARRLTADQTAALRDSLSDKPAKNIILLIGDGMGDSE ITAARNYAEGAGGFFKGIDALPLTGQYTHYALNKKTGKPDYVTDSAASATAWSTGVKT YNGALGVDIHEKDHPTILEMAKAAGLATGNVSTAELQDATPAALVAHVTSRKCYGPSA TSEKCPGNALEKGGKGSITEQLLNARADVTLGGGAKTFAETATAGEWQGKTLREQAQA RGYQLVSDAASLNSVTEANQQKPLLGLFADGNMPVRWLGPKATYHGNIDKPAVTCTPN PQRNDSVPTLAQMTDKAIELLSKNEKGFFLQVEGASIDKQDHAANPCGQIGETVDLDE AVQRALEFAKKDGNTLVIVTADHAHASQIVAPDTKAPGLTQALNTKDGAVMVMSYGNS EEDSQEHTGSQLRIAAYGPHAANVVGLTDQTDLFYTMKAALGLK<br />Se encuentra que para el Protein BLAST, hay un 91% de similitud de la secuencia de una proteína de E. coli– AlkalinePhosphatase<br />Resultados<br />
  9. 9. Secuencia 6<br />Resultado<br />MRLAALLLAALLATPAFAVQPDEILPDPALEARARDISQGLRCL<br />VCRNENIDDSNAQLARDLRLLVRERLAAGDSDAEVVEFVVDRYGEYVLLNPTTGGANL<br />ILWIAGPAMLAGGLGLAALYLRRRRTAPDAASAALSDEEQARLPEILKD<br />Esta secuencia pertenece a una mutación del citocromo c de Rhodobactersphaeroides<br />Resultados<br />
  10. 10. Secuencia 7<br />Resultado<br />YVEPPPAAFIGIDELGKWSFYRALIAEFIATLLFLYITVLTVIG YKSQSATDPCGGVGILGIAWAFGGMIFVLVYCTAGISGGHINPAVT<br />Pertenece a aquaporine PIP3-like protein de Apiumgraveolens<br />Resultados<br />
  11. 11. Segunda Parte<br />Ir al Map Viewer del Human Genome en NCBI y determinar lo siguiente: <br />¿Cuántoscromosomastiene un perro, una rata y Arabidopsis?<br />Determine en quécromosoma(s) se encuentran los genes relacionados con lo siguiente:<br /> a. Anemia falciforme<br /> b. Parkinson<br /> c. Alzheimer<br /> d. fibrosis cística<br /> e. Diabetes<br /> f. cancer (seleccioneuno)<br />UsandoGenBank<br />Número de acceso: AF321136<br /> a. organismo del cualproviene la secuencia<br /> b. número de genes presentes en la secuencia<br /> c. funciónsugerida de alguno de el o los genes<br /> d. Seleccione 20 nucleótidos de cualquierregión de uno de los genes. <br /> e. Seleccione los amino ácidosquedesee de una de lassecuencias de proteínaspresentes.<br />Usando BLAST <br />Determine a quiénperteneceesasecuencia de la parte d y e <br /> a. Realiceunabúsquedausando la secuencia de DNA y proteínasque<br />copio en 2d y 2e (arriba).<br /> b. ¿Cuálesfueron los tresprimeros “hits” obtenidos de cadauna?<br />Ir a http://expasy.cbr.nrc.ca/tools/scnpsit1.html <br /> a. Seleccione la secuenciacompleta de CcmH en AF321136 y realiceunabúsqueda.<br /> b. Escriba el primer motif, motivo o secuenciaconservadaqueencuentre y sufunción.<br />
  12. 12. Cromosomas<br />Perro:Canis lupus familiaris<br />40 cromosomas<br />Rata: Rattusnorvegicus 21 cromosomas<br />Thale cress: Arabidopsisthaliana<br /> 5 cromosomas<br />
  13. 13. Anemica falciforme<br />Parkinson<br />Cromosomas: 1, 2, 4, 5, 6, 8, 9, 11, 12, 17, 18, 22, X: 172 hits<br />Cromosoma 11: 1 hit<br />Enfermedades<br />
  14. 14. Fibrosis cística<br />Diabetes<br />Cromosomas: 1, 7, 13, 19:<br />241 hits<br />Cromosomas no relacionados: 21, 2, Y: 259 hits<br />Enfermedades<br />
  15. 15. Alzheimer<br />Cáncer de la próstata<br />Cromosomas no relacionados 13,15,16,18, 11, Y: 184 hits<br />Cromosomas todos excepto Y: 600 hits<br />Enfermedades<br />
  16. 16. GenBank y Número de acceso AF321136 <br />a. organismo del cualproviene la secuencia: Rhodobactersphaeroides<br />b. número de genes presentes en la secuencia: Se encuentran 3 genes en la secuencia<br />c. funciónsugerida de los genes:<br /> 1. Gen ccmH = maduración de la proteínaCcmH.<br /> 2. Gen ccmF = maduración de la proteínaCcmF.<br /> 3. Gen quecodificapara la proteínaenoyl-CoA-Hydratase<br />d. Seleccione 20 nucleótidos: Gen ccmH : 1 atgaggctcgcggcgcttct<br />e. Seleccione los amino ácidosquedesee de una de lassecuencias de proteínaspresentes:<br />Gen ccmH: MRLAALLLAALLATPAFAVQPDEILPDPALEARARDISQGLRCL VCRNENIDDSNAQLARDLRLLVRERLAAGDSDAEVVEFVVDRYGEYVLLNPTTGGANLILWIAGPAMLAGGLGLAALYLRRRRTAPDAASAALSDEEQARLPEILKD<br />
  17. 17. Buscar la secuencia de DNA y proteínasquecopioanteriormente<br />¿Cuálesfueron los tresprimeros “hits” obtenidos de cadauna?<br />Secuencia de DNA: <br />29-40 EGF_1(PS00022)<br />81-96 INTEGRIN_BETA(PS00243)<br />138-151 INTEGRIN_BETA(PS00243) <br />Secuencia de aminoácidos:<br />Rhodobactersphaeroides<br />Rhodobactersphaeroides 2.4.1<br />RhodobactersphaeroidesKD131<br /> BLAST<br />
  18. 18. Usando http://expasy.cbr.nrc.ca/tools/scnpsit1.html <br />Seleccione la secuenciacompleta de CcmH en AF321136 y realiceunabúsqueda<br />Escriba el primer motif, motivo o secuenciaconservadaqueencuentre y sufunción<br />Resultado:<br />PDOC00021: EGF-like domain signatures and profile<br />Descripción: <br />Secuencia de 30-40 residuos de aminoácidos de largo encontrada en la secuencia del factor de crecimento epidermal (EGF), el cual se ha encontradomayormente en proteínas de animales. EGF es un polipéptido de 50 aminoácidos con 3 puentesdisulfurointernos. Este primero se enlaza con altaafinidad a un receptor específico en la superficie de unacélula y luego induce sudimerización, la cualesesencialpara la activación de la tirosina-kinasa en el dominiocitoplasmático del receptor, iniciandoasíunaseñal de transducciónqueresulta en la síntesis de DNA y proliferacióncelular. Además ha sidoencontrado en el dominioextracelular de todaslasproteínas de la membrana o en proteínaque son secretadas. <br />
  19. 19. The End <br />

×