EL espacio europeo de educación superior por M. Justo Gil
Exercicio estatistica descritiva
1. PROBLEMAS E CUESTIÓNS DE ESTATÍSTICA DESCRIPTIVA
1..-- Estudiouse a distribución de albumina total circulante (en gramos) de 50 homes normais
1
comprendido entre os 20 e os 30 anos, obténdose os seguintes resultados:
Albumina
circulante 99-109 109-119 119-129 129-139 139-159
(gr.)
Nº de homes 6 11 13 12 8
a) Calcula as medidas de centralización
b) Fai unha representación gráfica axeitada
c) Determina o valor partir do cal o 80% dos homes teñen niveis de albumina superiores?
d) Se os niveis de albumina superan os 130 g é necesario introducir medicación. Que porcentaxe de
homes teñen que ser medicados?
SOLUCIÓN:
Albumina Nº de homes marca de
circulante (gr.) clase Ni xi*ni
99-109 6 104 6 624
109-119 11 114 17 1254
119-129 13 674 30 8762
129-139 12 134 42 1608
139-159 8 149 50 1192
50 13440
13440
a) MEDIA x = = 268,8
50
13 − 12
MODA Clase modal, a clase do valor que mais se repite 119 159, M o = 119 + ·10 = 124
12 − 11 + 13 − 11
MEDIANA
Clase mediana, a correspondente a frecuencia acumulada posterior a metade dos datos. 119-129
50
− 17
M e = 119 + 25 ·10 = 114,45
13
b) Por ser unha variable en datos agrupados a representación gráfica axeitada é o histograma, pero neste
caso temos que ter coidado porque a amplitude dos intervalos de clase non é igual. Polo tanto,
deberemos representar no eixo OY a altura dos rectángulos que teñen por área a frecuencia absoluta.
Albumina Nº de
circulante homes
(gr.) hi hi*10
99-109 6 0,6 6
109-119 11 1,1 11
119-129 13 1,3 13
129-139 12 1,2 12
139-159 8 0,4 4
2. 14
12
99-109
10
109-119
8 119-129
129-139
6
139-159
4
2
0
c) Pídenos o percentil 20. O método de cálculo é igual que a da mediana ou cuartis:
N * 0,2 = 50 * 0,2 = 10 polo tanto a clase do percentil 20 109-119
10 − 6
P20 = 109 + * 10 = 112,636364
11
d) Se nos dixesen superan 129 gr. tomaríamos a suma das frecuencias correspondentes aos dous últimos
intervalos de clase.
Supomos que os homes están distribuídos de forma homoxénea ao longo dos intervalos e polo tanto:
10 9
= ⇒ x = 10,8
Na clase 119-129 hai 12 individuos pola tanto: 12 x , é dicir: Porcentaxe total de
10,8 + 8
·100 = 37,6%
homes que necesitan medicación: (10,8+8)/50 50
2..-- Para cada un dos seguintes casos indica: Cales son as variables que se relacionan, cal é o colectivo de
2
individuos que se estuda, Se se trata dunha relación funcional ou dunha relación estatística. e o signo
da correlación.
i) Entre os países do mundo: índice de mortalidade infantil ? número de médicos por cada 1 000
habitantes.
ii) kW ? h consumidos en cada casa dunha cidade durante o mes de xaneiro ? custo do recibo da luz.
iii) Custo do recibo da luz ? número de persoas que viven en cada casa.
SOLUCIÓN:
Poboación Variable 1 Variable 2 Signo de ρxy
Poboación infantil Índice de mortalidade Nº de médicos por cada
EXEMPLO 1 -
mundial infantil mil habitantes
EXEMPLO 2 Casas dunha cidade Kw/hora Costo recibo da luz +
número de persoas que
Costo do recibo de la
EXEMPLO 3 Casas dunha cidade viven en cada casa. +
luz
3..-- Ordena de maior a menor as correlacións lineais das seguintes nubes de puntos
3
SOLUCIÓN:
3. Se a pendente da recta que se axusta a nube d puntos é negativa tamén o é a correlación lineal. Mais
próxima a -1 canto mellor se axusta a nube de puntos a unha recta e mais próxima a cero canto pero
sexa.
ρA< ρD< ρC< ρB
4..-- Responde ás seguintes preguntas:
4
a) calculamos a covarianza dunha certa distribución e resultou negativa. Xustifica por que podemos
afirmar que, tanto o coeficiente de correlación como as pendentes das dúas rectas de regresión, son
números negativos.
b) Os datos {a, b, c} teñen de media 3 e de desviación típica 0. Áchaos.
c) Unha mostra de 300 mozos ten de estatura media 170 cm con desviación típica de 8 cm; outra
mostra das tallas de 300 mozas ten 168 cm e 7 cm de media e desviación típica, respectivamente. Cal
das dúas mostras é menos dispersa?
d) Completa a táboa obtida no recoñecemento médico a 100 alumnos dun Centro de Bacharelato,
realizada por un dentista
N. º caries 0 1 2 3 4
n 25 20 X 15
f ... ... ... ... 0,05
SOLUCIÓN:
a) Trátase simplemente de aplicar as fórmulas correspondente
, o signo da covarianza é omesmoque o do coeficiente de correlación, xa que as
desviacións típicas, son sempre positivas
s xy s xy
2 2
sy
En canto as pendentes das rectas de regresión son: s x , e polo tanto o razoamento anterior
é válido.
b) a=b=c=3
c) Teremos que utilizar o coeficiente de variación de Pearson, xa que se trata de dúas series con
distinta media
CVmozos=170/8=21,25
CVmozas=168/7=24.
Polo tanto, é menos dispersa a serie de datos dos mozos.
d)
N. º caries 0 1 2 3 4
ni 5 20 X 15 Y
fi Z. W A.. B. 0,05
Z=25/100=0,25 Y=0,05·100=5
W=20/100=0,2 X=100-(25+20+15+5)=35, polo tanto: A=0,35
B=15/100=0,15
5..-- Nunha zona dunha cidade tomouse unha mostra para estudar o número de habitacións de que dispón
5
un piso e o de persoas que viven nel, obténdose estes datos:
a) Representa a nube de puntos.
4. b) Calcula e interpreta o coeficiente de correlación.
c) Cantos cuartos espérase que teña un piso no que viven 7 persoas?
SOLUCIÓN:
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6
b)
x y xi*yi xi^2 yi^2
2 1 2 4 1
2 2 4 4 4
3 2 6 9 4
3 3 9 9 9
4 3 12 16 9
4 4 16 16 16
4 5 20 16 25
5 4 20 25 16
5 5 25 25 25
5 6 30 25 36
37 35 144 149 145
COEFICIENTE DE CORRELACIÓN
O coeficiente de correlación indica que existe unha relación estatística entre o número de cuartos dunha
vivenda e o número de persoas que nela habitan. Ademais a recta de regresión amosase como unha boa
representación desta dependencia.
c) Pídenos que estimemos o número de habitacións (X)dunha casa coñecendo o número de persoas que
nela viven(Y).
s xy
É dicir, temos que calcular a recta de regresión de X sobre Y x=a+by con b= a = x − by
s2
y
b= =1,46 x=1,46+0,64·7=5,94
5. 6..-- Nun grupo de participantes nun concurso, analizouse conxuntamente o tempo que dedicaron á
6
preparación das probas, X (en horas) e a puntuación obtida, Y, obténdose os números da táboa
adxunta
0 < X ≤ 10 10 < X ≤ 15 15 < X ≤ 25 25 < X ≤ 30
0<Y≤5 2 2 0 0
5 < Y ≤ 15 2 5 5 0
15 < Y ≤ 30 0 1 5 7
30 < Y ≤ 50 0 0 2 5
a) Calcula a puntuación media obtida polos concursantes que dedicaron máis de 25 horas á súa
preparación.
b) Se se estableceu un premio de 100 euros/punto, canto gañaron os concursantes, máis ou menos?
SOLUCIÓN:
a) Trátase dunha variable condicionada polo valor X>25.
Os datos neste caso:
ni yi yi*ni
0<Y≤5 0 2,5 0
5 < Y ≤ 15 0 10 0
15 < Y ≤ 30 7 22,5 157,5
30 < Y ≤ 50 5 40 200
12 357,5
Puntuación media
b) Trátase de calcular a puntuación media marxinal dos concursantes e multiplícalo por 100
ni yi yi*ni
0<Y≤5 4 2,5 10
5 < Y ≤ 15 12 10 120
15 < Y ≤ 30 16 22,5 360
30 < Y ≤ 50 12 40 480
44 970
Polo tanto, a cuantía do premio medio 2204,5€
7..-- Estas tres distribucións teñen a mesma media. Cal é?
7
As súas desviacións típicas son 3,8; 1,3 e 2,9. Asocia a cada distribución un destes valores
SOLUCIÓN:
A media das tres distribucións é 7. a) 2,9 b) 1,3 c) 3,8