4. Big
Data
Ley
de
Moore:
Gordon
Moore
en
1965
an+cipaba
que
la
complejidad
de
los
circuitos
integrados
se
duplicaría
cada
dos
años
con
una
reducción
de
costo
conmensurable.
9. Bases
de
datos
• Es
necesario
tener
estructurada
la
información
y
un
acceso
rápido
• Structure
Query
Languages
(SQL)
– Tablas
de
la
base
de
datos
– Filtro
– Datos
a
recuperar
11. ENSMART
-‐ Definir
la
base
de
dades
-‐ Ac+var
els
diferents
filtres
-‐ Escollir
els
Camps
a
Recuperar
-‐ Combinar
cerques
amb
una
segona
DB
2.1.2
Cercant
dades
a
EnsMart
12. ENSMART
2.1.2
Cercant
dades
a
EnsMart
-‐ Definir
la
base
de
dades
-‐ AcEvar
els
diferents
filtres
-‐ Escollir
els
Camps
a
Recuperar
-‐ Combinar
cerques
amb
una
segona
DB
13. ENSMART
2.1.2
Cercant
dades
a
EnsMart
-‐ Definir
la
base
de
dades
-‐ Ac+var
els
diferents
filtres
-‐ Escollir
els
Camps
a
Recuperar
-‐ Combinar
cerques
amb
una
segona
DB
14. ENSMART
2.1.2
Cercant
dades
a
EnsMart
-‐ Definir
la
base
de
dades
-‐ Ac+var
els
diferents
filtres
-‐ Escollir
els
Camps
a
Recuperar
-‐ Combinar
cerques
amb
una
segona
DB
15. 2.1.3
Exercicis
amb
BIOMART
1. Feu
una
taula
amb
el
nombre
de
gens
que
codifiquen
per
proteïnes,
pels
cromosomes
autosòmics
del
genoma
de
Mus
musculus
16. 2.1.3
Exercicis
amb
BIOMART
1. Feu
una
taula
amb
el
nombre
de
gens
que
codifiquen
per
proteïnes,
pels
cromosomes
autosòmics
del
genoma
de
Mus
musculus
Cromosomes
autosòmics
Nº
de
gens
(protein_coding)
1
1182
2
1835
3
1003
4
1328
5
1259
6
1115
7
2019
8
1038
9
1215
10
1015
11
1636
12
673
13
854
14
909
15
783
16
667
17
1057
18
524
19
717
TOTAL
22237
17. 2.1.3
Exercicis
amb
BIOMART
2. Hem
de
recuperar
les
seqüències
de
nucleò+ds
dels
exons
codificants
(CDS)
dels
gens
localitzats
al
cromosoma
4
de
Drosophila
melanogaster.
La
capçalera
de
les
seqüències
haurà
d'incloure
l'iden+ficador
de
l'exó,
el
del
trànscrit
i
el
del
gen,
així
com
les
coordenades
sobre
el
cromosoma.
…
18. 2.1.3
Exercicis
amb
BIOMART
2. Hem
de
recuperar
les
seqüències
de
nucleò+ds
dels
exons
codificants
(CDS)
dels
gens
localitzats
al
cromosoma
4
de
Drosophila
melanogaster.
La
capçalera
de
les
seqüències
haurà
d'incloure
l'iden+ficador
de
l'exó,
el
del
trànscrit
i
el
del
gen,
així
com
les
coordenades
sobre
el
cromosoma.
…
19. 2.1.3
Exercicis
amb
BIOMART
3. Buscar
gens
que
puguin
estar
relacionats
amb
malalEes
al
voltant
del
gen
MECP2
(cromosoma
X,
banda
Xq28).
També
trobar
quin
és
el
codi
ENSEMBL
pel
gen
MECP2.
20. 2.1.3
Exercicis
amb
BIOMART
3. Buscar
gens
que
puguin
estar
relacionats
amb
malalEes
al
voltant
del
gen
MECP2
(cromosoma
X,
banda
Xq28).
També
trobar
quin
és
el
codi
ENSEMBL
pel
gen
MECP2.
…
21. 2.1.3
Exercicis
amb
BIOMART
3. Buscar
gens
que
puguin
estar
relacionats
amb
malalEes
al
voltant
del
gen
MECP2
(cromosoma
X,
banda
Xq28).
També
trobar
quin
és
el
codi
ENSEMBL
pel
gen
MECP2.
22. 2.1.3
Exercicis
amb
BIOMART
4. Con+nuant
amb
l'exemple
anterior,
volem
recuperar
tots
els
SNPs
que
caiguin
en
tots
els
exons
de
totes
les
isoformes
d'splicing
per
aquest
gen
(MECP2).
Quants
estan
suportats
per
un
feno+p?
Quins
al·∙lels
presenten?
Podem
recuperar
altres
dades
relacionades
amb
aquests
polimorfismes?
23. 2.1.3
Exercicis
amb
BIOMART
4. Con+nuant
amb
l'exemple
anterior,
volem
recuperar
tots
els
SNPs
que
caiguin
en
tots
els
exons
de
totes
les
isoformes
d'splicing
per
aquest
gen
(MECP2).
Quants
estan
suportats
per
un
feno+p?
Quins
al·∙lels
presenten?
Podem
recuperar
altres
dades
relacionades
amb
aquests
polimorfismes?
24. 2.1.3
Exercicis
amb
BIOMART
4. Con+nuant
amb
l'exemple
anterior,
volem
recuperar
tots
els
SNPs
que
caiguin
en
tots
els
exons
de
totes
les
isoformes
d'splicing
per
aquest
gen
(MECP2).
Quants
estan
suportats
per
un
feno+p?
Quins
al·∙lels
presenten?
Podem
recuperar
altres
dades
relacionades
amb
aquests
polimorfismes?
…
25. 2.1.3
Exercicis
amb
BIOMART
5.
Gens
ortòlegs
entre
mosques
i
abelles
en
el
cromosoma
3R
de
Drosophila,
entre
coordenadas
1-‐5000000
bp?