4. La revista Bionoticias está dirigida a lectores
interesados en el área estadísticas aplicadas a la
biología, en este caso es biometría.
El objetivo de esta revista es analizar el grado de la
relación existente entre las variables utilizando
modelos matemáticos y representaciones gráficas.
Estudiaremos dicho grado de relación entre dos
variables en lo que llamaremos análisis de correlación y
análisis de regresión.
Editorial.
1
6. Correlación lineal
En ocasiones nos puede
interesar estudiar si existe o no
algún tipo de relación entre dos
variables aleatorias. Así, por
ejemplo, podemos preguntarnos
si hay alguna relación entre las
notas de la asignatura
Estadística I y las de
Matemáticas I.
Una primera aproximación al
problema consistiría en dibujar
en el plano R2 un punto por cada
alumno: la primera coordenada
de cada punto sería su nota en
estadística, mientras que la
segunda sería su nota en
matemáticas. Así, obtendríamos
una nube de puntos la cual
podría indicarnos visualmente la
existencia o no de algún tipo de
relación (lineal, parabólica,
exponencial, etc.) entre ambas
notas.
En particular, nos
interesa cuantificar la
intensidad de la relación
lineal entre dos
variables. El parámetro
que nos da tal
cuantificación es el
coeficiente de
correlación lineal de
Pearson r, cuyo valor
oscila entre –1 y +1 :
3
8. ¡Atención!: si no hay
correlación de ningún tipo
entre dos variables, entonces
tampoco habrá correlación
lineal, por lo que r = 0. Sin
embargo, el que ocurra r = 0
sólo nos dice que no hay
correlación lineal, pero puede
que la haya de otro tipo.
El siguiente diagrama resume el análisis del coeficiente
de correlación entre dos variables:
5
9. Definición y características del
concepto de Regresión Lineal
En aquellos casos en
que el coeficiente de
regresión lineal sea
“cercano” a +1 o a –1,
tiene sentido
considerar la ecuación
de la recta que “mejor
se ajuste” a la nube de
puntos (recta de
mínimos cuadrados).
Uno de los principales
usos de dicha recta
será el de predecir o
estimar los valores de Y
que obtendríamos para
distintos valores de X.
Estos conceptos
quedarán
representados en lo que
llamamos diagrama de
dispersión
Nube de puntos y recta de
mínimos cuadrados
La ecuación de la recta de
mínimos cuadrados (en
forma punto-pendiente) es
la siguiente:
y − y = Covs(xX2 ,Y) (x − x)
6
10. Veamos con detalle estos
conceptos mediante un
ejemplo:
Veamos con detalle estos
conceptos mediante un
ejemplo:
Si queremos estudiar la
relación existente entre
ambas variables,
siguiendo con el ejemplo
anterior referente a la
relación entre las ventas
de una empresa (Vt ) y
sus gastos en publicidad
(GPt ), lo que podemos
hacer es representar
gráficamente el modelo
matemático lineal que
podemos considerar para
analizar dicha relación.
Vt =β1 +β2 ∗GPt +ut
605030 40
0
200
400
600
800
1000
1200
Y = -716,667 + 28,3333X
R-Sq = 75,3 %
estimación (ut)
error de
Regresión Plot
7
11. Una compañía desea hacer predicciones
del valor anual de sus ventas totales en
cierto país a partir de la relación de éstas y
la renta nacional. Para investigar la
relación cuenta con los siguientes datos:
X Y
189 402
190 404
208 412
227 425
239 429
252 436
257 440
274 447
293 458
308 469
316 469
X representa la renta nacional en millones de euros e Y
representa las ventas de la compañía en miles de euros en
el periodo que va desde 1990 hasta 2000 (ambos
inclusive). Calcular:
1.-La recta de regresión de Y sobre X.
2.-El coeficiente de correlación lineal e interpretarlo.
3.-Si en 2001 la renta nacional del país fue de 325 millones
de euros. ¿Cuál será la predicción para las ventas de la
compañía en este año?
8
12. La información estadística obtenida de
una muestra de tamaño 12 sobre la
relación existente entre la inversión
realizada y el rendimiento obtenido en
cientos de miles de euros para
explotaciones agrícolas, se muestra en
el siguiente cuadro:
Inversión (X) Rendimiento (Y)
11 2
14 3
16 5
15 6
16 5
18 3
20 7
21 10
14 6
20 10
19 5
11 6
1.- La recta de regresión del rendimiento respecto de la
inversión.
2.- La previsión de inversión que se obtendrá con un
rendimiento de 1 250 000 €.
9
13. CurioCiencias
Tu lengua tiene una
huella única como tus
dedos. Así que ten
cuidado y por favor no
lamas la escena del
crimen si no quieres
que te atrapen.
En la hipótesis alternativa (Ha): el
contraste también puede ser
bilateral.
10
15. http://www.unalmed.edu.co/~estadist/regressi
on/regresion.htm : Características y applet
de Regresión lineal.
http://kitchen.stat.vt.edu/~sundar/java/apple
ts/ : Applets de Java de Estadística
http://huizen.dds.nl/~berrie/ : Colección de
enlaces a applets de Java de Estadística
http://estadistica.bio.ucm.es/mod_regresion/r
egresion_applet.html : Características y
applets de regresión lineal simple
http://www.stat.wvu.edu/SRS/Modules/Applet
s/Regression/regression.html : Applet de Java
para calcular la recta de regresión
12