SlideShare a Scribd company logo
1 of 25
Download to read offline
Profesores:	
  
	
  Jose	
  F.	
  Sanchez	
  (Dept.	
  Gené+ca,	
  Micro.	
  y	
  Estadís+ca)	
  -­‐-­‐	
  jfsanchezherrero@ub.edu	
  
	
  Josep	
  Tarragó	
  	
  	
  (Dept.	
  Bioq	
  y	
  Biomed.	
  Molecular)	
  	
  	
  	
  	
  	
  	
  	
  -­‐-­‐	
  jtarragocelada@ub.edu	
  
	
  
Bloque	
  II	
  
Bloque	
  II	
  
Big	
  Data	
  
Ley	
  de	
  Moore:	
  
	
  
Gordon	
  Moore	
  en	
  1965	
  an+cipaba	
  
que	
  la	
  complejidad	
  de	
  los	
  circuitos	
  
integrados	
  se	
  duplicaría	
  cada	
  dos	
  
años	
  con	
  una	
  reducción	
  de	
  costo	
  
conmensurable.	
  	
  
Big	
  Data	
  
Coste	
  de	
  secuenciación	
  
Big	
  Data	
  
Data	
  stored	
  at	
  European	
  Bioinforma+cs	
  Ins++tute	
  (EBI)	
  doubles	
  size	
  every	
  year	
  
Bases	
  de	
  datos	
  
Bases	
  de	
  datos	
  
Bases	
  de	
  datos	
  
•  Es	
  necesario	
  tener	
  estructurada	
  la	
  
información	
  y	
  un	
  acceso	
  rápido	
  
•  Structure	
  Query	
  Languages	
  (SQL)	
  
– Tablas	
  de	
  la	
  base	
  de	
  datos	
  
– Filtro	
  
– Datos	
  a	
  recuperar	
  
ENSMART	
  
Estructura	
  
2.1.2	
  Cercant	
  dades	
  a	
  EnsMart	
  
ENSMART	
  
-­‐  Definir	
  la	
  base	
  de	
  dades	
  
-­‐  Ac+var	
  els	
  diferents	
  filtres	
  
-­‐  Escollir	
  els	
  Camps	
  a	
  Recuperar	
  
-­‐  Combinar	
  cerques	
  amb	
  una	
  
segona	
  DB	
  
	
  
2.1.2	
  Cercant	
  dades	
  a	
  EnsMart	
  
ENSMART	
  
2.1.2	
  Cercant	
  dades	
  a	
  EnsMart	
  
-­‐  Definir	
  la	
  base	
  de	
  dades	
  
-­‐  AcEvar	
  els	
  diferents	
  filtres	
  
-­‐  Escollir	
  els	
  Camps	
  a	
  Recuperar	
  
-­‐  Combinar	
  cerques	
  amb	
  una	
  
segona	
  DB	
  
	
  
ENSMART	
  
2.1.2	
  Cercant	
  dades	
  a	
  EnsMart	
  
-­‐  Definir	
  la	
  base	
  de	
  dades	
  
-­‐  Ac+var	
  els	
  diferents	
  filtres	
  
-­‐  Escollir	
  els	
  Camps	
  a	
  Recuperar	
  
-­‐  Combinar	
  cerques	
  amb	
  una	
  
segona	
  DB	
  
	
  
ENSMART	
  
2.1.2	
  Cercant	
  dades	
  a	
  EnsMart	
  
-­‐  Definir	
  la	
  base	
  de	
  dades	
  
-­‐  Ac+var	
  els	
  diferents	
  filtres	
  
-­‐  Escollir	
  els	
  Camps	
  a	
  Recuperar	
  
-­‐  Combinar	
  cerques	
  amb	
  una	
  
segona	
  DB	
  
	
  
2.1.3	
  Exercicis	
  amb	
  BIOMART	
  
1.  Feu	
  una	
  taula	
  amb	
  el	
  nombre	
  de	
  gens	
  que	
  codifiquen	
  per	
  proteïnes,	
  
pels	
  cromosomes	
  autosòmics	
  del	
  genoma	
  de	
  Mus	
  musculus	
  
	
  
2.1.3	
  Exercicis	
  amb	
  BIOMART	
  
1.  Feu	
  una	
  taula	
  amb	
  el	
  nombre	
  de	
  gens	
  que	
  codifiquen	
  per	
  proteïnes,	
  
pels	
  cromosomes	
  autosòmics	
  del	
  genoma	
  de	
  Mus	
  musculus	
  
	
   Cromosomes	
  
autosòmics	
  
Nº	
  de	
  gens	
  
(protein_coding)	
  
1	
   1182	
  
2	
   1835	
  
3	
   1003	
  
4	
   1328	
  
5	
   1259	
  
6	
   1115	
  
7	
   2019	
  
8	
   1038	
  
9	
   1215	
  
10	
   1015	
  
11	
   1636	
  
12	
   673	
  
13	
   854	
  
14	
   909	
  
15	
   783	
  
16	
   667	
  
17	
   1057	
  
18	
   524	
  
19	
   717	
  
TOTAL	
   22237	
  
2.1.3	
  Exercicis	
  amb	
  BIOMART	
  
2.  Hem	
  de	
  recuperar	
  les	
  seqüències	
  de	
  nucleò+ds	
  dels	
  exons	
  codificants	
  
(CDS)	
  dels	
  gens	
  localitzats	
  al	
  cromosoma	
  4	
  de	
  Drosophila	
  
melanogaster.	
  La	
  capçalera	
  de	
  les	
  seqüències	
  haurà	
  d'incloure	
  
l'iden+ficador	
  de	
  l'exó,	
  el	
  del	
  trànscrit	
  i	
  el	
  del	
  gen,	
  així	
  com	
  les	
  
coordenades	
  sobre	
  el	
  cromosoma.	
  
	
  
…	
  
2.1.3	
  Exercicis	
  amb	
  BIOMART	
  
2.  Hem	
  de	
  recuperar	
  les	
  seqüències	
  de	
  nucleò+ds	
  dels	
  exons	
  codificants	
  
(CDS)	
  dels	
  gens	
  localitzats	
  al	
  cromosoma	
  4	
  de	
  Drosophila	
  
melanogaster.	
  La	
  capçalera	
  de	
  les	
  seqüències	
  haurà	
  d'incloure	
  
l'iden+ficador	
  de	
  l'exó,	
  el	
  del	
  trànscrit	
  i	
  el	
  del	
  gen,	
  així	
  com	
  les	
  
coordenades	
  sobre	
  el	
  cromosoma.	
  
	
  
…	
  
2.1.3	
  Exercicis	
  amb	
  BIOMART	
  
3.  Buscar	
  gens	
  que	
  puguin	
  estar	
  relacionats	
  amb	
  malalEes	
  al	
  voltant	
  del	
  
gen	
  MECP2	
  (cromosoma	
  X,	
  banda	
  Xq28).	
  També	
  trobar	
  quin	
  és	
  el	
  codi	
  
ENSEMBL	
  pel	
  gen	
  MECP2.	
  
	
  
2.1.3	
  Exercicis	
  amb	
  BIOMART	
  
3.  Buscar	
  gens	
  que	
  puguin	
  estar	
  relacionats	
  amb	
  malalEes	
  al	
  voltant	
  del	
  
gen	
  MECP2	
  (cromosoma	
  X,	
  banda	
  Xq28).	
  També	
  trobar	
  quin	
  és	
  el	
  codi	
  
ENSEMBL	
  pel	
  gen	
  MECP2.	
  
	
  
…	
  
2.1.3	
  Exercicis	
  amb	
  BIOMART	
  
3.  Buscar	
  gens	
  que	
  puguin	
  estar	
  relacionats	
  amb	
  malalEes	
  al	
  voltant	
  del	
  
gen	
  MECP2	
  (cromosoma	
  X,	
  banda	
  Xq28).	
  També	
  trobar	
  quin	
  és	
  el	
  codi	
  
ENSEMBL	
  pel	
  gen	
  MECP2.	
  
	
  
2.1.3	
  Exercicis	
  amb	
  BIOMART	
  
4.  Con+nuant	
  amb	
  l'exemple	
  anterior,	
  volem	
  recuperar	
  tots	
  els	
  SNPs	
  
que	
  caiguin	
  en	
  tots	
  els	
  exons	
  de	
  totes	
  les	
  isoformes	
  d'splicing	
  per	
  
aquest	
  gen	
  (MECP2).	
  Quants	
  estan	
  suportats	
  per	
  un	
  feno+p?	
  Quins	
  
al·∙lels	
  presenten?	
  Podem	
  recuperar	
  altres	
  dades	
  relacionades	
  amb	
  
aquests	
  polimorfismes?	
  
	
  
2.1.3	
  Exercicis	
  amb	
  BIOMART	
  
4.  Con+nuant	
  amb	
  l'exemple	
  anterior,	
  volem	
  recuperar	
  tots	
  els	
  SNPs	
  
que	
  caiguin	
  en	
  tots	
  els	
  exons	
  de	
  totes	
  les	
  isoformes	
  d'splicing	
  per	
  
aquest	
  gen	
  (MECP2).	
  Quants	
  estan	
  suportats	
  per	
  un	
  feno+p?	
  Quins	
  
al·∙lels	
  presenten?	
  Podem	
  recuperar	
  altres	
  dades	
  relacionades	
  amb	
  
aquests	
  polimorfismes?	
  
	
  
2.1.3	
  Exercicis	
  amb	
  BIOMART	
  
4.  Con+nuant	
  amb	
  l'exemple	
  anterior,	
  volem	
  recuperar	
  tots	
  els	
  SNPs	
  
que	
  caiguin	
  en	
  tots	
  els	
  exons	
  de	
  totes	
  les	
  isoformes	
  d'splicing	
  per	
  
aquest	
  gen	
  (MECP2).	
  Quants	
  estan	
  suportats	
  per	
  un	
  feno+p?	
  Quins	
  
al·∙lels	
  presenten?	
  Podem	
  recuperar	
  altres	
  dades	
  relacionades	
  amb	
  
aquests	
  polimorfismes?	
  
	
  
…	
  
2.1.3	
  Exercicis	
  amb	
  BIOMART	
  
5.	
  Gens	
  ortòlegs	
  entre	
  mosques	
  i	
  abelles	
  en	
  el	
  cromosoma	
  3R	
  de	
  
Drosophila,	
  entre	
  coordenadas	
  1-­‐5000000	
  bp?	
  
	
  	
  
	
  

More Related Content

Similar to Bioinformatics Practicas UB Sesión 4 (8)

Tema11 GenèTica Molecular Ii (Replicació) 2009 10
Tema11 GenèTica Molecular Ii (Replicació) 2009 10Tema11 GenèTica Molecular Ii (Replicació) 2009 10
Tema11 GenèTica Molecular Ii (Replicació) 2009 10
 
Practica12
Practica12Practica12
Practica12
 
Adn i biotecnologia
Adn i biotecnologiaAdn i biotecnologia
Adn i biotecnologia
 
Análisis de la incidencia del esfuerzo de alta intensidad en la generación de...
Análisis de la incidencia del esfuerzo de alta intensidad en la generación de...Análisis de la incidencia del esfuerzo de alta intensidad en la generación de...
Análisis de la incidencia del esfuerzo de alta intensidad en la generación de...
 
ADN i biotecnologia 4ESO
ADN i biotecnologia 4ESOADN i biotecnologia 4ESO
ADN i biotecnologia 4ESO
 
Pizarra 1bio grup_10
Pizarra 1bio grup_10Pizarra 1bio grup_10
Pizarra 1bio grup_10
 
Ccmc tema 5-les bases de la genètica
Ccmc tema 5-les bases de la genèticaCcmc tema 5-les bases de la genètica
Ccmc tema 5-les bases de la genètica
 
Webquest la info genètica
Webquest la info genèticaWebquest la info genètica
Webquest la info genètica
 

Recently uploaded (6)

App del mes de maig ins alcarras Duolingo
App del mes de maig ins alcarras DuolingoApp del mes de maig ins alcarras Duolingo
App del mes de maig ins alcarras Duolingo
 
FESTA ESCOLA 2024 divendres, 31 de maig.pdf
FESTA ESCOLA 2024 divendres, 31 de maig.pdfFESTA ESCOLA 2024 divendres, 31 de maig.pdf
FESTA ESCOLA 2024 divendres, 31 de maig.pdf
 
Presentació_Conèixer_els_Màsters_2024.pptx
Presentació_Conèixer_els_Màsters_2024.pptxPresentació_Conèixer_els_Màsters_2024.pptx
Presentació_Conèixer_els_Màsters_2024.pptx
 
El_holocausto_aula_2023_IES_PLA_DE_NADAL.pdf
El_holocausto_aula_2023_IES_PLA_DE_NADAL.pdfEl_holocausto_aula_2023_IES_PLA_DE_NADAL.pdf
El_holocausto_aula_2023_IES_PLA_DE_NADAL.pdf
 
Educar èticament en l'era digital_ Master Educació- ANDORRA -2024 .pptx
Educar èticament en l'era digital_ Master Educació- ANDORRA -2024 .pptxEducar èticament en l'era digital_ Master Educació- ANDORRA -2024 .pptx
Educar èticament en l'era digital_ Master Educació- ANDORRA -2024 .pptx
 
ELS GÈNERES PERIODISTICS D´OPINIÓ
ELS    GÈNERES   PERIODISTICS   D´OPINIÓELS    GÈNERES   PERIODISTICS   D´OPINIÓ
ELS GÈNERES PERIODISTICS D´OPINIÓ
 

Bioinformatics Practicas UB Sesión 4

  • 1. Profesores:    Jose  F.  Sanchez  (Dept.  Gené+ca,  Micro.  y  Estadís+ca)  -­‐-­‐  jfsanchezherrero@ub.edu    Josep  Tarragó      (Dept.  Bioq  y  Biomed.  Molecular)                -­‐-­‐  jtarragocelada@ub.edu    
  • 4. Big  Data   Ley  de  Moore:     Gordon  Moore  en  1965  an+cipaba   que  la  complejidad  de  los  circuitos   integrados  se  duplicaría  cada  dos   años  con  una  reducción  de  costo   conmensurable.    
  • 5. Big  Data   Coste  de  secuenciación  
  • 6. Big  Data   Data  stored  at  European  Bioinforma+cs  Ins++tute  (EBI)  doubles  size  every  year  
  • 9. Bases  de  datos   •  Es  necesario  tener  estructurada  la   información  y  un  acceso  rápido   •  Structure  Query  Languages  (SQL)   – Tablas  de  la  base  de  datos   – Filtro   – Datos  a  recuperar  
  • 10. ENSMART   Estructura   2.1.2  Cercant  dades  a  EnsMart  
  • 11. ENSMART   -­‐  Definir  la  base  de  dades   -­‐  Ac+var  els  diferents  filtres   -­‐  Escollir  els  Camps  a  Recuperar   -­‐  Combinar  cerques  amb  una   segona  DB     2.1.2  Cercant  dades  a  EnsMart  
  • 12. ENSMART   2.1.2  Cercant  dades  a  EnsMart   -­‐  Definir  la  base  de  dades   -­‐  AcEvar  els  diferents  filtres   -­‐  Escollir  els  Camps  a  Recuperar   -­‐  Combinar  cerques  amb  una   segona  DB    
  • 13. ENSMART   2.1.2  Cercant  dades  a  EnsMart   -­‐  Definir  la  base  de  dades   -­‐  Ac+var  els  diferents  filtres   -­‐  Escollir  els  Camps  a  Recuperar   -­‐  Combinar  cerques  amb  una   segona  DB    
  • 14. ENSMART   2.1.2  Cercant  dades  a  EnsMart   -­‐  Definir  la  base  de  dades   -­‐  Ac+var  els  diferents  filtres   -­‐  Escollir  els  Camps  a  Recuperar   -­‐  Combinar  cerques  amb  una   segona  DB    
  • 15. 2.1.3  Exercicis  amb  BIOMART   1.  Feu  una  taula  amb  el  nombre  de  gens  que  codifiquen  per  proteïnes,   pels  cromosomes  autosòmics  del  genoma  de  Mus  musculus    
  • 16. 2.1.3  Exercicis  amb  BIOMART   1.  Feu  una  taula  amb  el  nombre  de  gens  que  codifiquen  per  proteïnes,   pels  cromosomes  autosòmics  del  genoma  de  Mus  musculus     Cromosomes   autosòmics   Nº  de  gens   (protein_coding)   1   1182   2   1835   3   1003   4   1328   5   1259   6   1115   7   2019   8   1038   9   1215   10   1015   11   1636   12   673   13   854   14   909   15   783   16   667   17   1057   18   524   19   717   TOTAL   22237  
  • 17. 2.1.3  Exercicis  amb  BIOMART   2.  Hem  de  recuperar  les  seqüències  de  nucleò+ds  dels  exons  codificants   (CDS)  dels  gens  localitzats  al  cromosoma  4  de  Drosophila   melanogaster.  La  capçalera  de  les  seqüències  haurà  d'incloure   l'iden+ficador  de  l'exó,  el  del  trànscrit  i  el  del  gen,  així  com  les   coordenades  sobre  el  cromosoma.     …  
  • 18. 2.1.3  Exercicis  amb  BIOMART   2.  Hem  de  recuperar  les  seqüències  de  nucleò+ds  dels  exons  codificants   (CDS)  dels  gens  localitzats  al  cromosoma  4  de  Drosophila   melanogaster.  La  capçalera  de  les  seqüències  haurà  d'incloure   l'iden+ficador  de  l'exó,  el  del  trànscrit  i  el  del  gen,  així  com  les   coordenades  sobre  el  cromosoma.     …  
  • 19. 2.1.3  Exercicis  amb  BIOMART   3.  Buscar  gens  que  puguin  estar  relacionats  amb  malalEes  al  voltant  del   gen  MECP2  (cromosoma  X,  banda  Xq28).  També  trobar  quin  és  el  codi   ENSEMBL  pel  gen  MECP2.    
  • 20. 2.1.3  Exercicis  amb  BIOMART   3.  Buscar  gens  que  puguin  estar  relacionats  amb  malalEes  al  voltant  del   gen  MECP2  (cromosoma  X,  banda  Xq28).  També  trobar  quin  és  el  codi   ENSEMBL  pel  gen  MECP2.     …  
  • 21. 2.1.3  Exercicis  amb  BIOMART   3.  Buscar  gens  que  puguin  estar  relacionats  amb  malalEes  al  voltant  del   gen  MECP2  (cromosoma  X,  banda  Xq28).  També  trobar  quin  és  el  codi   ENSEMBL  pel  gen  MECP2.    
  • 22. 2.1.3  Exercicis  amb  BIOMART   4.  Con+nuant  amb  l'exemple  anterior,  volem  recuperar  tots  els  SNPs   que  caiguin  en  tots  els  exons  de  totes  les  isoformes  d'splicing  per   aquest  gen  (MECP2).  Quants  estan  suportats  per  un  feno+p?  Quins   al·∙lels  presenten?  Podem  recuperar  altres  dades  relacionades  amb   aquests  polimorfismes?    
  • 23. 2.1.3  Exercicis  amb  BIOMART   4.  Con+nuant  amb  l'exemple  anterior,  volem  recuperar  tots  els  SNPs   que  caiguin  en  tots  els  exons  de  totes  les  isoformes  d'splicing  per   aquest  gen  (MECP2).  Quants  estan  suportats  per  un  feno+p?  Quins   al·∙lels  presenten?  Podem  recuperar  altres  dades  relacionades  amb   aquests  polimorfismes?    
  • 24. 2.1.3  Exercicis  amb  BIOMART   4.  Con+nuant  amb  l'exemple  anterior,  volem  recuperar  tots  els  SNPs   que  caiguin  en  tots  els  exons  de  totes  les  isoformes  d'splicing  per   aquest  gen  (MECP2).  Quants  estan  suportats  per  un  feno+p?  Quins   al·∙lels  presenten?  Podem  recuperar  altres  dades  relacionades  amb   aquests  polimorfismes?     …  
  • 25. 2.1.3  Exercicis  amb  BIOMART   5.  Gens  ortòlegs  entre  mosques  i  abelles  en  el  cromosoma  3R  de   Drosophila,  entre  coordenadas  1-­‐5000000  bp?