2. Relación entre variables.
• En la práctica es frecuente encontrar una relación
entre dos o más variables. Por ejemplo, el peso
de los hombres adultos depende en cierto grado
de su estatura, las circunferencias de los círculos
depende en cierto grado de su radio, y la presión
de una masa de gas depende de su temperatura y
volumen.
• Entonces, es mejor expresar esta relación en
forma matemática, lo cual sucede determinando
una ecuación que enlaza las variables.
3. Ajuste de curvas.
• Para hallar una ecuación que relacione variables, un primer
paso es recolectar datos que muestran los valores
correspondientes de las variables en consideración. Por
ejemplo, supóngase que y denotan la estatura y peso
de hombres adultos, respectivamente; entonces, una
muestra de individuos revelaría las estaturas , , ... , ,
asi como los pesos correspondientes , , ... , .
• El próximo paso es marcar los puntos , , ...
, sobre un sistema de coordenadas rectangulares.
El conjunto resultante se llama a veces diagrama de
dispersión. A partir del diagrama de dispersión es posible,
con frecuencia visualizar una curva suave que aproxima los
datos.
X Y
1X 2X NX
1Y 2Y NY
11,YX 22 ,YX
NN YX ,
5. Teoría de correlación.
• Si todos los valores de las variables satisfacen
una ecuación exactamente, decimos que las
variables están perfectamente correlacionadas
o que hay correlación perfecta entre ellas.
6. Correlación Lineal.
• Si e son las dos variables de cuestión, un diagrama de
dispersión muestra la localización de los puntos sobre
un sistema rectangular de coordenadas. Si todos los puntos
del diagrama de dispersión parecen estar en una recta, como
en la figura (a) y (b), la correlación se llama lineal. En tales
casos, una ecuación lineal es adecuada a efectos de regresión.
X Y
),( YX
a) Correlación Lineal
Directa (positiva).
a) Correlación Lineal
Inversa (negativa).
a) Correlación Nula.
7. Correlación Lineal.
• Si Y tiende a crecer cuando X crece, como en la figura
(a), la correlación se dice positiva, o directa.
• Si Y tiende a decrecer cuando X crece, como en la
figura (b), la correlación se dice negativa o inversa.
• Si no hay relación entre las variables, como en la figura
(c), decimos que no hay correlación entre ellas.
8. Un Ejemplo.
• Un centro comercial sabe en función de la distancia, en
kilómetros, a la que se sitúe de un núcleo de población,
acuden los clientes que figuran en la tabla.
a) Trazar el diagrama de dispersión
b) Calcular el coeficiente de correlación lineal
c) Calcular la recta de mínimos Cuadrados
No de clientes (X) 8 7 6 4 2 1
Distancia (Y) 15 19 25 23 34 40
12. Covarianza.
La definición formal de covarianza es la siguiente:
Al igual que con la desviación estándar podemos
obtener este resultado mediantes formulas cortas.
N
YYXX
s
N
i
ii
XY
1
YXXYsXY
15. Desviación Estándar.
La definición formal de la desviación estándar para la
variable X es la siguiente:
Y aquí tenemos su forma corta
De manera análoga podemos obtener el de la variable Y
N
XX
s
N
i
i
X
1
2
22
XXsX
22
YYsY
17. Coeficiente de correlación lineal.
• La forma breve del coeficiente de correlación
lineal es :
YX
XY
ss
s
r
5635.85604.2
8342.20
r
9502.0r
18. Propiedades del coeficiente de
correlación.
• El coeficiente de correlación no varía al hacerlo la escala de
medición. Es decir, si expresamos la altura en metros o en
centímetros el coeficiente de correlación no varía.
• El signo del coeficiente de correlación es el mismo que el
de la covarianza.
a) Si la covarianza es positiva, la correlación es directa.
b) Si la covarianza es negativa, la correlación es inversa.
c) Si la covarianza es nula, no existe correlación.
• El coeficiente de correlación lineal es un número real
comprendido entre -1 y 1.
11 r
19. Propiedades del coeficiente de
correlación.
• Si el coeficiente de correlación lineal toma valores
cercanos a -1 la correlación es fuerte e inversa, y será
tanto más fuerte cuanto más se aproxime a -1.
• Si el coeficiente de correlación lineal toma valores
cercanos a 1 la correlación es fuerte y directa, y será
tanto más fuerte cuanto más se aproxime a 1.
• Si el coeficiente de correlación lineal toma valores
cercanos a 0, la correlación es débil.
• Si ó , los puntos de la nube están sobre la
recta creciente o decreciente. Entre ambas variables
hay dependencia funcional.
1r 1
20. La recta de Mínimos Cuadrados.
• La recta de mínimos cuadrados que aproxima el
conjunto de puntos , ,…, tiene
por ecuación:
donde las constantes quedan fijadas al resolver
simultáneamente las ecuaciones
que se llaman ecuaciones normales para la recta de
mínimos cuadrados.
11,YX 22 ,YX NN YX ,
bmxy
XbXmXY
bNXmY
2
21. La recta de Mínimos Cuadrados.
• Las constantes y de las ecuaciones
anteriores se pueden hallar de las formulas
22
XXN
YXXYN
m
m b
22
2
XXN
XYXXY
b
22. La recta de Mínimos Cuadrados.
• También pueden obtenerse de su forma corta:
2
X
XY
s
s
m XmYb
0655.41
6667.42283.326
b
2283.3
5604.2
8342.20
2
m
27. Actividad
• En un Centro de Salud hacen el seguimiento de la
tensión arterial de sus pacientes, y los resultados
constatan que aquellos que tienen sobrepeso,
tienen una tensión arterial superior a la media.
Calcule el coeficiente de correlación de Pearson y
la recta de mínimos cuadrados para corroborar
estos resultados en una muestra de 10 pacientes.
X=Peso (Kg) 72 76 78 81 89 95 108 115 120 130
Y=Tensión
Sistólica(mm Hg)
115 121 125 130 141 150 165 170 177 178
28. Actividad
• La tabla nos muestra las
puntuaciones en Literatura (X), y
las puntuaciones en Matemática
(Y) de un grupo de alumnos de
un determinado centro
educativo.
• Trace el diagrama de dispersión,
calcule el coeficiente de
correlación, y la recta de
mínimos cuadrados.
Nº
Estudiante
X Y
1 10 30
2 30 15
3 38 37
4 40 25
5 60 35
6 65 5
7 80 20
8 90 10