1. Error estándar. Correlación no es causalidad Fórmulas correlación y
Un aspecto que debe cuidarse es la interpretación de la
correlación. A pesar de que el coeficiente de correlación
regresión lineal simple.
El modelo de regresión lineal es no determinístico, de
modo que los resultados pronosticados tienen error. sea muy cercano a uno, no podemos afirmar que “x” es G. Edgar Mata Ortiz http://licmata-math.blogspot.mx/
Una ventaja de este modelo es que podemos conocer la causa de “y”.
http://www.slideshare.net/licmata/
magnitud de dicho error. En realidad no sabemos que causa la correlación. Es licmata@hotmail.com
Su nombre completo es error estándar al calcular “y” posible que sea otra variable la que está causando que
dado “x”. tanto “x” como “y” aumenten o disminuyan conforme a
la recta de regresión. Modelos empíricos
Se calcula mediante la fórmula siguiente:
Modelos determinísticos: La variable o variables independientes
Ejemplos de correlación. predicen exactamente el valor de la variable independiente.
x y
2
d f
xy v a PV nRT
n
t m
SC y
SCx
Sy x Modelos no determinísticos: La variable independiente (x) no
n2 predice exactamente la variable dependiente (y).
Aunque es sencillo simplificarlo observando que el nu- y Consumo de combustible deun vehículo
Ejemplo1
merador es SCxy. x peso del vehículo
y Consumo de agua enuna casa
2 Ejemplo 2
SCxy x número de personas que viven en ella
SC y
SCx
Sy x
n2 Gráfico de dispersión
El error estándar nos da una medida de la desviación
Es un gráfico que utiliza las coordenadas cartesianas para
promedio de las predicciones hechas por medio de la
mostrar los valores de dos variables x, y.
ecuación de regresión respecto a los valores observados.
En este sentido, la recta de regresión puede ser conside- y Consumo de agua en una casa (metros cúbicos)
Ejemplo 2
rada una estimación de la media de los valores de “y” x = número de personas que viven en ella
para cada valor de “x”.
x y
El error estándar es una cuantificación del error al prede-
1 2.4
cir “y” para cada valor de “x”. Cuanto más grande es este Referencias bibliográficas 1 3.5
error menos podremos confiar en las predicciones del
1 5.1
modelo. The nature of mathematics. Karl J. Smith. Thomson Learning. 2 6.8
2007. 2 8.5
3 8.1
Introduction to Statistics and Data Analysis. Roxy Peck,Chris 3 7.2
Olsen,Jay L. Devore. CENGAGE Learning. 2012. 3 7.6
4 8.1
Applied Statistics and Probability for Engineers. Douglas C. 4 7.5
Montgomery,George C. Runger. 2011. 4 6.8
4 8.8
5 8.2
5 8.8
5 9
5 8.9
6 8.1
6 8.8
7 9.2
7 9.5
La educación tiene la misión de permitir, a todos sin excepción, hacer fructificar todos sus talentos y todas sus capacidades de creación. Lo que implica que cada uno pueda responsabilizarse de sí mismo y realizar su proyecto personal. Jaques Delors.
2. r de Pearson r de Pearson Coeficiente de determinación r2
El coeficiente de correlación lineal r de Pear- Las sumas de cuadrados se sustituyen para obte- El coeficiente de determinación r2 nos indica
son mide la fuerza de la correlación entre las ner r. la proporción de la variación total en y que
variables x, y. conocemos como función de x.
SCxy
EL valor de r siempre está entre –1 y +1. Si es r En ocasiones se le considera la proporción de
exactamente igual a +1 ó –1 se dice que existe
correlación perfecta, y nos encontramos ante SCx SC y la varianza en “y” explicada por la regresión.
En correlación lineal múltiple se usa como
un modelo determinístico.
indicador de bondad del ajuste del modelo.
Para calcular r comenzamos con la siguiente Interpretación del valor de r
tabla:
El valor de r indica que tan fuerte es la correla- La recta de regresión lineal
2 2 ción lineal entre las variables independiente La ecuación de esta recta es un modelo no
x y x y xy (x) y dependiente (y). Cuanto más cerca de determinístico del efecto que la variabilidad
1 1 2.4 1 5.76 2.4 uno, más fuerte es la correlación y cuanto más de la variable explicativa (x) tiene sobre la va-
2 1 3.5 1 12.25 3.5 cerca de cero, más débil. riable dependiente (y).
3 1 5.1 1 26.01 5.1 No existen reglas para decidir si 0.6 es una co- Esta ecuación responde a la pregunta “¿Qué
rrelación suficientemente fuerte. Depende de pasa si x es igual a…?”
. . .
. . .
. . .
. . .
. . .
. . .
los objetivos del experimentador.
La forma de responder a estas preguntas con-
Se recomienda hacer el análisis de correlación siste en sustituir los valores de “x” en la ecua-
y regresión completo. Para encontrar la regla ción y obtener los valores de “y”.
18 6 8.8 36 77.44 52.8 de regresión se emplean las siguientes fórmu-
las. Con dos parejas (x, y) obtenemos dos puntos
19 7 9.2 49 84.64 64.4 y, al unirlos, podemos trazar la recta de regre-
20 7 9.5 49 90.25 66.5 sión lineal.
Coeficientes de la recta de regresión lineal.
S 78 150.9 372 1206.09 641.9
Sx Sy Sx 2 Sy2 Sxy a0
x y x xy
2
a1
n xy x y
n x x
2 2
n x 2 x
2
y 0.7875 x 4.4739
Las sumatorias que se obtienen al final de ca-
da columna son las que se utilizan en las fór- y a0 a1 x x y La tabulación indica que:
mulas siguientes:
1 5.261 Si en una casa vive sólo una
2 6.049 persona, el consumo de
x
2
3 6.836 agua será de 5.261 m3; si
SC x x 2
viven dos personas serpa de
n 4 7.624
6.049 y así sucesivamente
y
2 5 8.411
hasta llegar a 7 personas
SC y y 2
6 9.199 cuando el consumo espera-
n 7 9.986 do es de 9.986 m3.
x y
SC xy xy
n
La educación tiene la misión de permitir, a todos sin excepción, hacer fructificar todos sus talentos y todas sus capacidades de creación. Lo que implica que cada uno pueda responsabilizarse de sí mismo y realizar su proyecto personal. Jaques Delors.