SlideShare a Scribd company logo
1 of 31
Download to read offline
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 1
REGRESIÓN LINEAL SIMPLE
1. El problema de la regresión lineal simple
2. Método de mínimos cuadrados
3. Coeficiente de regresión
4. Coeficiente de correlación lineal
5. El contraste de regresión
6. Inferencias acerca de los parámetros
7. Inferencias acerca de la predicción
8. Los supuestos del modelo de regresión lineal
9. Un ejemplo en donde no se cumplen los supuestos
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 2
1. El problema de la regresión lineal simple
El objetivo de un modelo de regresión es tratar de explicar la relación que existe entre una
variable dependiente (variable respuesta) Y un conjunto de variables independientes (variables
explicativas) X1,..., Xn.
En un modelo de regresión lineal simple tratamos de explicar la relación que existe entre la
variable respuesta Y y una única variable explicativa X.
Ejemplo: En la muestra de la miel vamos a ver si existe relación lineal entre la acidez libre
(AcLib) y la acidez total (AcTot). Para ver si un modelo de regresión lineal tiene sentido,
comenzamos dibujando un diagrama de dispersión.
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 3
Mediante las técnicas de regresión de una variable Y sobre una variable X, buscamos una
función que sea una buena aproximación de una nube de puntos (xi,yi), mediante una curva del
tipo:
ˆ ( )Y f X
El modelo de regresión lineal simple tiene la siguiente expresión:
,Y Xα β ε= + +
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 4
En donde  es la ordenada en el origen (el valor que toma Y cuando X vale 0),  es la pendiente
de la recta (e indica cómo cambia Y al incrementar X en una unidad) y  una variable que
incluye un conjunto grande de factores, cada uno de los cuales influye en la respuesta sólo en
pequeña magnitud, a la que llamaremos error. X e Y son variables aleatorias, por lo que no se
puede establecer una relación lineal exacta entre ellas.
α
( )tgβ ϕ=
ϕ
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 5
2. Método de mínimos cuadrados
Para hacer una estimación del modelo de regresión lineal simple, trataremos de buscar una
recta de la forma:
ˆˆ ˆY X a bXα β=+ =+
de modo que se ajuste a la nube de puntos.
Para esto utilizaremos el método de mínimos cuadrados. Este método consiste en minimizarla
suma de los cuadrados de los errores:
( )
22
1 1
ˆ
n n
i i i
i i
e y y
= =
= −∑ ∑
Es decir, la suma de los cuadrados de las diferencias entre los valores reales observados (yi) y
los valores estimados ( ˆiy ).
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 6
Con este método, las expresiones que se obtiene para a y b son las siguientes:
2
, ,XY
X
S
a y bx b
S
=− =
En donde ex y denotan las medias muestrales de X e Y (respectivamente), 2
XS es la varianza
muestral de X y XYS es la covarianza muestral entre X e Y.
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 7
Estos parámetros se calculan como:
( ) ( ) ( )( )
2 2
2 21 1 1 1 1
, , , , .
n n n n n
i i i i i i
i i i i i
X Y XY
x y x x y y x x y y
x y S S S
n n n n n
= = = = =
− − − −
= = = = =
∑ ∑ ∑ ∑ ∑
La cantidad b se denomina coeficiente de regresión de Y sobre X, lo denotamos por /Y Xb .
Ejemplo
2 2
37.998, 33.8727,
90.786, 85.459,
9.5282 9.24439.
X Y
X Y
x y
S S
S S
= =
= =
= =
: Los estadísticos descriptivos anteriores para las variables AcTot y AcLib (acidez total y
acidez libre) son los siguientes:
La recta de regresión ajustada es la siguiente:
ˆ 4.469 0.990 ,Y X= +
donde Y es la acidez total y X es la acidez libre.
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 8
Para calcular la recta de regresión de X sobre Y se hace aproximando X por ˆX , del modo
ˆX a bY= +
donde 2
, ,XY
Y
S
a x by b
S
=− =
Es totalmente incorrecto despejar X de la ecuación ˆY a bX  para calcular la recta de
regresión de X sobre Y.
Observación: La recta de regresión pasa siempre por el centro de gravedad de la nube de
puntos, es decir por el punto  ,X Y .
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 9
3. El coeficiente de regresión
El coeficiente de regresión nos da información sobre el comportamiento de la variable Y frente
a la variable X, de manera que:
a) Si / 0Y Xb = , para cualquier valor de X la variable Y es constante (es decir, no cambia).
b) Si / 0Y Xb > , esto nos indica que al aumentar el valor de X, también aumenta el valor de Y.
c) Si / 0Y Xb < , esto nos indica que al aumentar el valor de X, el valor de Y disminuye.
En el ajuste de regresión lineal de la acidez total sobre la acidez libre se obtenía el modelo:
ˆ 4.469 0.990 ,Y X= +
en donde Y es la acidez total y X es la acidez libre.
El coeficiente de regresión es / 0.990Y Xb = > 0 y esto indica que al aumentar X aumenta y.
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 10
4. El coeficiente de correlación lineal
El coeficiente de correlación lineal entre X e Y viene dado por:
,XY
X Y
S
r
S S
=
y trata de medir la dependencia lineal que existe entre las dos variables. Su cuadrado se
denomina coeficiente de determinación, r2
.
Propiedades del coeficiente de correlación:
a) No tiene dimensión, y siempre toma valores en [-1,1].
b) Si las variables son independientes, entonces r=0, pero el inverso no tiene por qué ser
cierto.
c) Si existe una relación lineal exacta entre X e Y, entonces r valdría 1 (relación directa) ó -1
(relación inversa).
d) Si r>0, esto indica una relación directa entre las variables (es decir, que si aumentamos
X, también aumenta Y).
e) Si r<0, la correlación entre las variables es inversa (si aumentamos una, la otra
disminuye).
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 11
Para nuestro ejemplo el valor de r es 0.960.
Como es positivo, esto indica que existe una relación directa entre las variables acidez total y
acidez libre. Además su valor es próximo a 1 indicando una dependencia lineal muy fuerte.
Relación entre los coeficientes de regresión y
de correlación:
/ /, .Y X
Y X X Y
X Y
S S
b r b r
S S
= =
Los dos coeficientes de regresión y el
coeficiente de correlación tienen pues el
mismo signo.
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 12
Descomposición de la variabilidad:
     
2 2 2
ˆ ˆi i i iy y y y y y
SCtot SCR SCres
     
 
  
Coeficiente de determinación (r2
):
 
 
2
2
2
ˆi
i
y y SCR
r
SCtoty y

 



El coeficiente de determinación puede interpretarse como la proporción de variabilidad de Y
que es explicada por X. Mide la proximidad de la recta ajustada a los valores observados de Y.
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 13
5. El contraste de regresión
En el contraste de regresión contrastamos la hipótesis nula de que la pendiente de la recta es
cero, es decir, que no existe relación o dependencia lineal entre las dos variables.
0
1
: 0
: 0
H
H
β
β
=
≠ ⇔
0
1
: 0
: 0
H
H
ρ
ρ
=
≠
En la tabla ANOVA del análisis de regresión el estadístico F nos permite realizar dicho contraste.
Ejemplo: En el modelo de regresión para explicar la Acidez Total en función de la Acidez Libre,
el análisis proporciona la siguiente tabla ANOVA:
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 14
ANOVA
Suma de
cuadrados gl
Media
cuadrática F Sig.
Regres 5442.731 1 5442.73 759.92 .000
Resid 458.379 64 7.162
Total 5901.110 65
Dado que la significación (P-valor) asociada al valor del estadístico F es del 0%, rechazamos la
hipótesis nula de que β, o equivalentemente el coeficiente de correlación, sea nulo. Concluimos
pues que existe una relación de tipo lineal entre X e Y.
2
rS
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 15
6. Inferencias para los parámetros del modelo
a) Contrastes de hipótesis para los parámetros

*
0 *
Contraste H :
β β
β β
 =

≠
Estadístico del contraste:
*
0 2
ˆ
que sigue bajo H una t
ˆ( )
nt
s
β β
β
−
−
=
1ˆ( ) r
x
s
s
sn
β =

*
0 *
Contraste H :
α α
α α
 =

≠
Estadístico del contraste:
*
0 2
ˆ
que sigue bajo H una t
ˆ( )
nt
s
α α
α −
−
=
2
2
ˆ( ) 1r
x
s x
s
sn
α= +
de la regresión( )
rs error típico en la
estimación lo da el SPSS
mediacuadrática delos residuos
=
=
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 16
 El contraste clave para este modelo es
0
0
Contraste H :
0
β
β
=

≠
Es decir el contraste de regresión.
 Si aceptamos la hipótesis nula concluimos que no hay evidencias de que haya una
relación lineal entre las variables y el modelo, en principio, no es apropiado. Puede
haber una relación lineal en la población pero la muestra elegida no la detecta.
 Si rechazamos la hipótesis nula concluimos que el modelo lineal es apropiado. Puede
que exista una relación NO-LINEAL pero los datos son también consistentes con un
modelo lineal.
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 17
b)Estimaciones por intervalo para los parámetros.

2
2
1ˆpara : ( t )r
n
x
s
IC
sn
α
β β −

2
2
2 2
ˆpara : ( t 1 )r
n
x
s x
IC
sn
α
α α − +
7. Inferencias acerca de la predicción
Nos puede interesar predecir el valor medio de la variable respuesta o bien el valor de la
variable respuesta para un valor x que no ha sido considerado en la muestra. El estimador
puntual es el mismo para las dos situaciones.
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 18
a) Estimación puntual del valor medio de Y para un valor X=x :
Estimador: ˆ .Y a bx= +
( )
( )
1 2
2
2
1
ˆ( ) sr
i
i
x x
s y
n x x
 
− 
= + 
− 
 
∑ error típico de la estimación de la media de Y
 Intervalo de confianza para el valor medio de la respuesta cuando X=x:
( )
( )
( )
1 2
2
2
2 2
1
ˆ t sn r
i
i
x x
y
n x x
α
−
 
− 
+ 
− 
 
∑

Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 19
b)Estimación puntual del valor de Y para un valor X=x no observado
Estimador: ˆ .Y a bx= +
( )
( )
1 2
2
2
1
ˆ( ) s 1r
i
i
x x
s y
n x x
 
− 
= + + 
− 
 
∑ error típico de la estimación de Y
 Intervalo de confianza para el valor de la respuesta para una nueva observación X=x:
( )
( )
( )
1 2
2
2
2 2
1
ˆ t s 1n r
i
i
x x
y
n x x
α
−
 
− 
+ + 
− 
 
∑

Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 20
c) Bandas de confianza
 Banda de confianza para predecir el valor medio de Y en cualquier valor de X:
 Banda de confianza para predecir Y en cualquier valor de X:
( )
( )
( )
1 2
2
1 2
2, 2 2
1
ˆ (2 ) sn r
i
i
x x
y F
n x x
α
−
 
− 
+ 
− 
 
∑

( )
( )
( )
1 2
2
1 2
2, 2 2
1
ˆ (2 ) s 1n r
i
i
x x
y F
n x x
α
−
 
− 
+ + 
− 
 
∑

Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 21
El SPSS nos dibuja las correspondientes bandas de confianza.
Recta ajustada
Banda de confianza
para valores medios
Banda de confianza
para cualquier Y
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 22
Riesgos de la extrapolación:
Los límites de confianza calculados mediante las expresiones anteriores son válidos únicamente
si el modelo es correcto. Un riesgo evidente de extrapolar el modelo fuera del rango de datos
mediante el cual se ha construido, es que la relación entre las variables deje de ser lineal.
8. Los supuestos del modelo de regresión lineal
Hasta ahora explicamos cómo aproximar el modelo de regresión lineal
,Y Xα β ε= + +
por la recta
ˆ .Y a bX= +
Para garantizar que esta aproximación es válida, se deben cumplir las siguientes condiciones:
1. Independencia: los residuos deben ser independientes entre sí.
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 23
2. Homocedasticidad (igualdad de varianzas): para cada valor de la variable X, la varianza de los
residuos ( )ˆ
i i ie Y Y= − debe ser la misma (es decir, que el ajuste es igual de preciso
independientemente de los valores que tome X).
3. Normalidad: para cada valor de la variable X, los residuos ei tienen distribución normal de
media cero.
Por lo tanto, para ver si un modelo de regresión lineal ajustado es válido, debemos comprobar
que se cumplen estas tres condiciones sobre los residuos.
Ejemplo. En el modelo de regresión ajustado para la acidez total sobre la acidez libre,
debemos comprobar la validez del mismo. Para eso veremos que se cumplen las hipótesis de
independencia, homocedasticidad y normalidad dos residuos.
 La independencia podemos comprobarla con el estadístico de Durbin-Watson. Si éste
está entre 1.5 e 2.5, entonces podemos asumir que los residuos son independientes.
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 24
Modelo R R 2
R2
corregida
Error típ. de la
estimac.
Durbin-
Watson
1 .960 .922 .921 2.6762 1.624
1 Variables predictoras: (Constante), aclib
 Para comprobar la homocedasticidad
Dibujaremos un diagrama de dispersión de las
estimaciones (valores predichos por el modelo)
tipificadas (ZPRED) frente a los residuos tipificados
(ZRESID).
de los residuos,
haremos un procedimiento gráfico.
Para garantizar que hay homocedasticidad, no se
debe mostrar ninguna pauta de asociación (ningún
patrón) en la nube de puntos.
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 25
 Para comprobar la normalidad hacemos
los gráficos de normalidad y realizamos el
contraste de normalidad
(test de Kolmogorov-Smirnov ó
test de Shapiro-Wilks)
Pruebas de normalidad
Kolmogorov-Smirnova
Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Standardized
Residual
,107 66 ,061 ,959 66 ,027
a. Corrección de la significación de Lilliefors
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 26
Algunos casos en los que no se cumplen los supuestos
i) Falta de independencia
(Autocorrelación negativa en los resíduos,
valores por encima de la media tienden a ir seguidos de
valores por debajo de ella)
ii) Falta de homocedasticidad
(La variablidad aumenta al aumentar las los valores de las
predicciones)
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 27
iii) Falta de linealidad
Transformaciones previas a la regresión:
Si después de efectuar la diagnosis del modelo vemos que no se cumplen algunas de sus
hipótesis básicas, podemos actuar de dos maneras:
 Efectuar una transformación de los datos de manera que los datos ya cumplan todas las
hipótesis del modelo.
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 28
 Buscar otro tipo de modelo de regresión que no requiera las hipótesis que se han
imcumplido, que ajuste adecuadamente a los datos y cuyas nuevas hipótesis sí sean
verificadas.
Lo más frecuente es intentar primero una transformación de los datos. Las transformaciones
más habituales son las de la familia transformaciones de Box-Cox.
Esta familia viene dada por la siguiente expresión:
Cada produce una transformación diferente, de
modo que escogiendo su valor estamos escogiendo la
transformación que más nos convenga en cada caso.
( )
1
0
( )
ln 0
y
h y y
y
λ
λ λ
λ
λ
 −
≠
= = 
 =
λ
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 29
9. Un ejemplo en el que no se cumplen los supuestos
Los supuestos que deben cumplirse para que el ajuste de un modelo de regresión lineal sea
adecuado son: independencia, igualdad de varianzas y normalidad de los residuos. Pero, ¿qué
ocurre cuando estos supuestos no se dan? ¿Cuál es el resultado que obtenemos?
Fijémonos en la gráfica siguiente (archivo datos_NS.sav). A simple vista, parecería que el ajuste
lineal es adecuado: la línea recta ajusta bastante bien la nube de puntos, y el coeficiente de
determinación es de 0.81.
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 30
Para un modelo de regresión lineal sobre estos datos, los resultados son los siguientes:
Resumen del modelo(b)
Mod. R R 2
R2
corregida Error típ. de estimac. Durbin-Watson
1 ,902 ,814 ,813 1,00916 2,096
 Los datos son incorrelados
Veamos la normalidad:
Estadística. FBA I 2011-2012
Regresión lineal simple
M. Carmen Carollo Limeres Página 31
Pruebas de normalidad
Kolmogorov-Smirnov Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Standardized
Residual
,136 200 ,000 ,776 200 ,000
a. Corrección de la significación de Lilliefors
 Vemos que los datos no son normales.
En cuanto a la igualdad de varianzas:
 Hay heterocedasticidad pues la varianza es
mayor para valores pronosticados grandes o
pequeños.

More Related Content

What's hot

Regresion simple
Regresion simpleRegresion simple
Regresion simpleluismelgar
 
Teoria De Correlacion
Teoria De CorrelacionTeoria De Correlacion
Teoria De Correlacionmallita
 
Unidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicaUnidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicamovapa
 
Analisis de regresion y correlacion lineal
Analisis de regresion y correlacion linealAnalisis de regresion y correlacion lineal
Analisis de regresion y correlacion linealmikewanda4
 
Estadistica para la investigación (sesión6)
Estadistica para la investigación (sesión6)Estadistica para la investigación (sesión6)
Estadistica para la investigación (sesión6)Zarlenin docente
 
P4 16 regresion_lineal_multiple
P4 16 regresion_lineal_multipleP4 16 regresion_lineal_multiple
P4 16 regresion_lineal_multipleEvelyn Arrey
 
5 regresion y correlacion
5 regresion y correlacion5 regresion y correlacion
5 regresion y correlacionYuliMita
 
Clase regresion simple
Clase regresion simpleClase regresion simple
Clase regresion simpleABIGAIL RUIZ
 

What's hot (20)

Regresion simple
Regresion simpleRegresion simple
Regresion simple
 
17.regresión y correlación simple
17.regresión y correlación simple17.regresión y correlación simple
17.regresión y correlación simple
 
Regresion y Correlacion
Regresion y CorrelacionRegresion y Correlacion
Regresion y Correlacion
 
Regresión correlacion 23-04
Regresión  correlacion 23-04Regresión  correlacion 23-04
Regresión correlacion 23-04
 
Introducción a la Estadística. Tema 4
Introducción a la Estadística. Tema 4Introducción a la Estadística. Tema 4
Introducción a la Estadística. Tema 4
 
Teoria De Correlacion
Teoria De CorrelacionTeoria De Correlacion
Teoria De Correlacion
 
Unidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicaUnidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monica
 
Analisis de regresion y correlacion lineal
Analisis de regresion y correlacion linealAnalisis de regresion y correlacion lineal
Analisis de regresion y correlacion lineal
 
Analisis De Regresion Y Correlacion
Analisis De Regresion Y CorrelacionAnalisis De Regresion Y Correlacion
Analisis De Regresion Y Correlacion
 
Estadistica para la investigación (sesión6)
Estadistica para la investigación (sesión6)Estadistica para la investigación (sesión6)
Estadistica para la investigación (sesión6)
 
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLEREGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE
 
P4 16 regresion_lineal_multiple
P4 16 regresion_lineal_multipleP4 16 regresion_lineal_multiple
P4 16 regresion_lineal_multiple
 
01 regresion
01 regresion01 regresion
01 regresion
 
Regresion lineal multiple
Regresion lineal multipleRegresion lineal multiple
Regresion lineal multiple
 
5 regresion y correlacion
5 regresion y correlacion5 regresion y correlacion
5 regresion y correlacion
 
18. Regresión Lineal
18. Regresión Lineal18. Regresión Lineal
18. Regresión Lineal
 
Clase regresion simple
Clase regresion simpleClase regresion simple
Clase regresion simple
 
Regresion lineal simple
Regresion lineal simpleRegresion lineal simple
Regresion lineal simple
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
5. regresión lineal multiple
5.  regresión lineal multiple5.  regresión lineal multiple
5. regresión lineal multiple
 

Similar to Mat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg

Tema 9.pdf
Tema 9.pdfTema 9.pdf
Tema 9.pdfRenanPM1
 
UNIDAD #5 REGRESIÓN Y CORRELACIÓN.ppt
UNIDAD #5 REGRESIÓN Y CORRELACIÓN.pptUNIDAD #5 REGRESIÓN Y CORRELACIÓN.ppt
UNIDAD #5 REGRESIÓN Y CORRELACIÓN.pptcodinboscultural
 
Analisis de correlacion y regresion no lineal .
Analisis de correlacion y regresion no lineal .Analisis de correlacion y regresion no lineal .
Analisis de correlacion y regresion no lineal .JosLuis355
 
Correlacion lineal 2019
Correlacion lineal 2019Correlacion lineal 2019
Correlacion lineal 2019franciscoe71
 
Regresion simple 1 estadistica
Regresion simple 1   estadisticaRegresion simple 1   estadistica
Regresion simple 1 estadisticaJhon Fredy Tchc
 
Veter. 14 ava. regresión y correlación
Veter. 14 ava. regresión y correlaciónVeter. 14 ava. regresión y correlación
Veter. 14 ava. regresión y correlaciónUniv Peruana Los Andes
 
Coeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y SpearmanCoeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y SpearmanJCMENESESV
 
Coeficiented e Correlacion Pearson y Spearman
Coeficiented e Correlacion Pearson y SpearmanCoeficiented e Correlacion Pearson y Spearman
Coeficiented e Correlacion Pearson y SpearmanJCMENESESV
 
Clases Correlacion sobre las estadisticas
Clases Correlacion sobre las estadisticasClases Correlacion sobre las estadisticas
Clases Correlacion sobre las estadisticasSindyPatriciaTanchiv
 
Regresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión linealRegresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión linealmiguelescobarrivero
 

Similar to Mat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg (20)

Clase regresion simple
Clase regresion simpleClase regresion simple
Clase regresion simple
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
Tema 9.pdf
Tema 9.pdfTema 9.pdf
Tema 9.pdf
 
UNIDAD #5 REGRESIÓN Y CORRELACIÓN.ppt
UNIDAD #5 REGRESIÓN Y CORRELACIÓN.pptUNIDAD #5 REGRESIÓN Y CORRELACIÓN.ppt
UNIDAD #5 REGRESIÓN Y CORRELACIÓN.ppt
 
4. estadística descriptiva
4.  estadística descriptiva4.  estadística descriptiva
4. estadística descriptiva
 
Regresion Y Correlacion
Regresion Y CorrelacionRegresion Y Correlacion
Regresion Y Correlacion
 
Analisis de correlacion y regresion no lineal .
Analisis de correlacion y regresion no lineal .Analisis de correlacion y regresion no lineal .
Analisis de correlacion y regresion no lineal .
 
Correlacion lineal 2019
Correlacion lineal 2019Correlacion lineal 2019
Correlacion lineal 2019
 
Correlacion
CorrelacionCorrelacion
Correlacion
 
Regresion simple 1 estadistica
Regresion simple 1   estadisticaRegresion simple 1   estadistica
Regresion simple 1 estadistica
 
Regrecion lineal simple
Regrecion lineal simpleRegrecion lineal simple
Regrecion lineal simple
 
Veter. 14 ava. regresión y correlación
Veter. 14 ava. regresión y correlaciónVeter. 14 ava. regresión y correlación
Veter. 14 ava. regresión y correlación
 
Regresion estadistica
Regresion estadisticaRegresion estadistica
Regresion estadistica
 
Regresion lineal simple
Regresion lineal simpleRegresion lineal simple
Regresion lineal simple
 
Tema 6
Tema 6Tema 6
Tema 6
 
Regresión lineal
Regresión linealRegresión lineal
Regresión lineal
 
Coeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y SpearmanCoeficiente de Correlación de Pearson y Spearman
Coeficiente de Correlación de Pearson y Spearman
 
Coeficiented e Correlacion Pearson y Spearman
Coeficiented e Correlacion Pearson y SpearmanCoeficiented e Correlacion Pearson y Spearman
Coeficiented e Correlacion Pearson y Spearman
 
Clases Correlacion sobre las estadisticas
Clases Correlacion sobre las estadisticasClases Correlacion sobre las estadisticas
Clases Correlacion sobre las estadisticas
 
Regresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión linealRegresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión lineal
 

More from Francisco Baculima Hidalgo

Memoria tecnica indice de calidad del pavimento
Memoria tecnica indice de calidad del pavimentoMemoria tecnica indice de calidad del pavimento
Memoria tecnica indice de calidad del pavimentoFrancisco Baculima Hidalgo
 
Hidráulica de Riego - Riego y productividad del cantón Celica
Hidráulica de Riego - Riego y productividad del cantón CelicaHidráulica de Riego - Riego y productividad del cantón Celica
Hidráulica de Riego - Riego y productividad del cantón CelicaFrancisco Baculima Hidalgo
 
Hidraulica de Riego - Caso de Estudio Nro 2 (Segundo Bimestre(
Hidraulica de Riego - Caso de Estudio Nro 2 (Segundo Bimestre(Hidraulica de Riego - Caso de Estudio Nro 2 (Segundo Bimestre(
Hidraulica de Riego - Caso de Estudio Nro 2 (Segundo Bimestre(Francisco Baculima Hidalgo
 
Presupuestos y control de obra (Triple Restricción)
Presupuestos y control de obra (Triple Restricción)Presupuestos y control de obra (Triple Restricción)
Presupuestos y control de obra (Triple Restricción)Francisco Baculima Hidalgo
 
Técnicas de sondeos geotécnicos-Campus de Excelencia Internacional
Técnicas de sondeos geotécnicos-Campus de Excelencia InternacionalTécnicas de sondeos geotécnicos-Campus de Excelencia Internacional
Técnicas de sondeos geotécnicos-Campus de Excelencia InternacionalFrancisco Baculima Hidalgo
 
Tarea 5 hidrologia i-francisco baculima-diciembre 2017-b2
Tarea 5 hidrologia i-francisco baculima-diciembre 2017-b2Tarea 5 hidrologia i-francisco baculima-diciembre 2017-b2
Tarea 5 hidrologia i-francisco baculima-diciembre 2017-b2Francisco Baculima Hidalgo
 

More from Francisco Baculima Hidalgo (20)

Memoria tecnica indice de calidad del pavimento
Memoria tecnica indice de calidad del pavimentoMemoria tecnica indice de calidad del pavimento
Memoria tecnica indice de calidad del pavimento
 
Hidráulica de Riego - Riego y productividad del cantón Celica
Hidráulica de Riego - Riego y productividad del cantón CelicaHidráulica de Riego - Riego y productividad del cantón Celica
Hidráulica de Riego - Riego y productividad del cantón Celica
 
Hidraulica de Riego - Caso de Estudio Nro 2 (Segundo Bimestre(
Hidraulica de Riego - Caso de Estudio Nro 2 (Segundo Bimestre(Hidraulica de Riego - Caso de Estudio Nro 2 (Segundo Bimestre(
Hidraulica de Riego - Caso de Estudio Nro 2 (Segundo Bimestre(
 
Presupuestos y control de obra (Triple Restricción)
Presupuestos y control de obra (Triple Restricción)Presupuestos y control de obra (Triple Restricción)
Presupuestos y control de obra (Triple Restricción)
 
Técnicas de sondeos geotécnicos-Campus de Excelencia Internacional
Técnicas de sondeos geotécnicos-Campus de Excelencia InternacionalTécnicas de sondeos geotécnicos-Campus de Excelencia Internacional
Técnicas de sondeos geotécnicos-Campus de Excelencia Internacional
 
Chapter5
Chapter5Chapter5
Chapter5
 
Tarea 5 hidrologia i-francisco baculima-diciembre 2017-b2
Tarea 5 hidrologia i-francisco baculima-diciembre 2017-b2Tarea 5 hidrologia i-francisco baculima-diciembre 2017-b2
Tarea 5 hidrologia i-francisco baculima-diciembre 2017-b2
 
Informe tecnico
Informe tecnicoInforme tecnico
Informe tecnico
 
Laboratorio francisco
Laboratorio francisco Laboratorio francisco
Laboratorio francisco
 
0153 b01 p04_d_estructuras_hiperestaticas
0153 b01 p04_d_estructuras_hiperestaticas0153 b01 p04_d_estructuras_hiperestaticas
0153 b01 p04_d_estructuras_hiperestaticas
 
Consultas estructuras
Consultas estructuras Consultas estructuras
Consultas estructuras
 
Tarea de concreto
Tarea de concretoTarea de concreto
Tarea de concreto
 
Trab inv #2_hr-a_18-04-20
Trab inv #2_hr-a_18-04-20Trab inv #2_hr-a_18-04-20
Trab inv #2_hr-a_18-04-20
 
Licencias creative commons
Licencias creative commonsLicencias creative commons
Licencias creative commons
 
Presentacion
PresentacionPresentacion
Presentacion
 
Tradiciones de fin de año
Tradiciones de fin de añoTradiciones de fin de año
Tradiciones de fin de año
 
Planos arquitectonicos
Planos arquitectonicosPlanos arquitectonicos
Planos arquitectonicos
 
Deber de sistema de proyección ortogonal
Deber de sistema de proyección ortogonal Deber de sistema de proyección ortogonal
Deber de sistema de proyección ortogonal
 
Efecto mariposa
Efecto mariposaEfecto mariposa
Efecto mariposa
 
Efecto mariposa
Efecto mariposaEfecto mariposa
Efecto mariposa
 

Recently uploaded

Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfJC Díaz Herrera
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdfJC Díaz Herrera
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyraestudiantes2010
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfJC Díaz Herrera
 
Partes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosPartes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosMarycarmenNuez4
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptMelina Alama Visitacion
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaRosaHurtado26
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfDodiAcuaArstica
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
Tendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdfTendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdfdanaeamadot
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirluis809799
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxLuisAngelYomonaYomon
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 

Recently uploaded (20)

Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdf
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdf
 
Partes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicosPartes y elementos de una iglesia básicos
Partes y elementos de una iglesia básicos
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitectura
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdf
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
Tendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdfTendencias en la Gestión del Talento Humano.pdf
Tendencias en la Gestión del Talento Humano.pdf
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 

Mat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg

  • 1. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 1 REGRESIÓN LINEAL SIMPLE 1. El problema de la regresión lineal simple 2. Método de mínimos cuadrados 3. Coeficiente de regresión 4. Coeficiente de correlación lineal 5. El contraste de regresión 6. Inferencias acerca de los parámetros 7. Inferencias acerca de la predicción 8. Los supuestos del modelo de regresión lineal 9. Un ejemplo en donde no se cumplen los supuestos
  • 2. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 2 1. El problema de la regresión lineal simple El objetivo de un modelo de regresión es tratar de explicar la relación que existe entre una variable dependiente (variable respuesta) Y un conjunto de variables independientes (variables explicativas) X1,..., Xn. En un modelo de regresión lineal simple tratamos de explicar la relación que existe entre la variable respuesta Y y una única variable explicativa X. Ejemplo: En la muestra de la miel vamos a ver si existe relación lineal entre la acidez libre (AcLib) y la acidez total (AcTot). Para ver si un modelo de regresión lineal tiene sentido, comenzamos dibujando un diagrama de dispersión.
  • 3. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 3 Mediante las técnicas de regresión de una variable Y sobre una variable X, buscamos una función que sea una buena aproximación de una nube de puntos (xi,yi), mediante una curva del tipo: ˆ ( )Y f X El modelo de regresión lineal simple tiene la siguiente expresión: ,Y Xα β ε= + +
  • 4. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 4 En donde  es la ordenada en el origen (el valor que toma Y cuando X vale 0),  es la pendiente de la recta (e indica cómo cambia Y al incrementar X en una unidad) y  una variable que incluye un conjunto grande de factores, cada uno de los cuales influye en la respuesta sólo en pequeña magnitud, a la que llamaremos error. X e Y son variables aleatorias, por lo que no se puede establecer una relación lineal exacta entre ellas. α ( )tgβ ϕ= ϕ
  • 5. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 5 2. Método de mínimos cuadrados Para hacer una estimación del modelo de regresión lineal simple, trataremos de buscar una recta de la forma: ˆˆ ˆY X a bXα β=+ =+ de modo que se ajuste a la nube de puntos. Para esto utilizaremos el método de mínimos cuadrados. Este método consiste en minimizarla suma de los cuadrados de los errores: ( ) 22 1 1 ˆ n n i i i i i e y y = = = −∑ ∑ Es decir, la suma de los cuadrados de las diferencias entre los valores reales observados (yi) y los valores estimados ( ˆiy ).
  • 6. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 6 Con este método, las expresiones que se obtiene para a y b son las siguientes: 2 , ,XY X S a y bx b S =− = En donde ex y denotan las medias muestrales de X e Y (respectivamente), 2 XS es la varianza muestral de X y XYS es la covarianza muestral entre X e Y.
  • 7. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 7 Estos parámetros se calculan como: ( ) ( ) ( )( ) 2 2 2 21 1 1 1 1 , , , , . n n n n n i i i i i i i i i i i X Y XY x y x x y y x x y y x y S S S n n n n n = = = = = − − − − = = = = = ∑ ∑ ∑ ∑ ∑ La cantidad b se denomina coeficiente de regresión de Y sobre X, lo denotamos por /Y Xb . Ejemplo 2 2 37.998, 33.8727, 90.786, 85.459, 9.5282 9.24439. X Y X Y x y S S S S = = = = = = : Los estadísticos descriptivos anteriores para las variables AcTot y AcLib (acidez total y acidez libre) son los siguientes: La recta de regresión ajustada es la siguiente: ˆ 4.469 0.990 ,Y X= + donde Y es la acidez total y X es la acidez libre.
  • 8. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 8 Para calcular la recta de regresión de X sobre Y se hace aproximando X por ˆX , del modo ˆX a bY= + donde 2 , ,XY Y S a x by b S =− = Es totalmente incorrecto despejar X de la ecuación ˆY a bX  para calcular la recta de regresión de X sobre Y. Observación: La recta de regresión pasa siempre por el centro de gravedad de la nube de puntos, es decir por el punto  ,X Y .
  • 9. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 9 3. El coeficiente de regresión El coeficiente de regresión nos da información sobre el comportamiento de la variable Y frente a la variable X, de manera que: a) Si / 0Y Xb = , para cualquier valor de X la variable Y es constante (es decir, no cambia). b) Si / 0Y Xb > , esto nos indica que al aumentar el valor de X, también aumenta el valor de Y. c) Si / 0Y Xb < , esto nos indica que al aumentar el valor de X, el valor de Y disminuye. En el ajuste de regresión lineal de la acidez total sobre la acidez libre se obtenía el modelo: ˆ 4.469 0.990 ,Y X= + en donde Y es la acidez total y X es la acidez libre. El coeficiente de regresión es / 0.990Y Xb = > 0 y esto indica que al aumentar X aumenta y.
  • 10. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 10 4. El coeficiente de correlación lineal El coeficiente de correlación lineal entre X e Y viene dado por: ,XY X Y S r S S = y trata de medir la dependencia lineal que existe entre las dos variables. Su cuadrado se denomina coeficiente de determinación, r2 . Propiedades del coeficiente de correlación: a) No tiene dimensión, y siempre toma valores en [-1,1]. b) Si las variables son independientes, entonces r=0, pero el inverso no tiene por qué ser cierto. c) Si existe una relación lineal exacta entre X e Y, entonces r valdría 1 (relación directa) ó -1 (relación inversa). d) Si r>0, esto indica una relación directa entre las variables (es decir, que si aumentamos X, también aumenta Y). e) Si r<0, la correlación entre las variables es inversa (si aumentamos una, la otra disminuye).
  • 11. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 11 Para nuestro ejemplo el valor de r es 0.960. Como es positivo, esto indica que existe una relación directa entre las variables acidez total y acidez libre. Además su valor es próximo a 1 indicando una dependencia lineal muy fuerte. Relación entre los coeficientes de regresión y de correlación: / /, .Y X Y X X Y X Y S S b r b r S S = = Los dos coeficientes de regresión y el coeficiente de correlación tienen pues el mismo signo.
  • 12. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 12 Descomposición de la variabilidad:       2 2 2 ˆ ˆi i i iy y y y y y SCtot SCR SCres            Coeficiente de determinación (r2 ):     2 2 2 ˆi i y y SCR r SCtoty y       El coeficiente de determinación puede interpretarse como la proporción de variabilidad de Y que es explicada por X. Mide la proximidad de la recta ajustada a los valores observados de Y.
  • 13. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 13 5. El contraste de regresión En el contraste de regresión contrastamos la hipótesis nula de que la pendiente de la recta es cero, es decir, que no existe relación o dependencia lineal entre las dos variables. 0 1 : 0 : 0 H H β β = ≠ ⇔ 0 1 : 0 : 0 H H ρ ρ = ≠ En la tabla ANOVA del análisis de regresión el estadístico F nos permite realizar dicho contraste. Ejemplo: En el modelo de regresión para explicar la Acidez Total en función de la Acidez Libre, el análisis proporciona la siguiente tabla ANOVA:
  • 14. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 14 ANOVA Suma de cuadrados gl Media cuadrática F Sig. Regres 5442.731 1 5442.73 759.92 .000 Resid 458.379 64 7.162 Total 5901.110 65 Dado que la significación (P-valor) asociada al valor del estadístico F es del 0%, rechazamos la hipótesis nula de que β, o equivalentemente el coeficiente de correlación, sea nulo. Concluimos pues que existe una relación de tipo lineal entre X e Y. 2 rS
  • 15. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 15 6. Inferencias para los parámetros del modelo a) Contrastes de hipótesis para los parámetros  * 0 * Contraste H : β β β β  =  ≠ Estadístico del contraste: * 0 2 ˆ que sigue bajo H una t ˆ( ) nt s β β β − − = 1ˆ( ) r x s s sn β =  * 0 * Contraste H : α α α α  =  ≠ Estadístico del contraste: * 0 2 ˆ que sigue bajo H una t ˆ( ) nt s α α α − − = 2 2 ˆ( ) 1r x s x s sn α= + de la regresión( ) rs error típico en la estimación lo da el SPSS mediacuadrática delos residuos = =
  • 16. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 16  El contraste clave para este modelo es 0 0 Contraste H : 0 β β =  ≠ Es decir el contraste de regresión.  Si aceptamos la hipótesis nula concluimos que no hay evidencias de que haya una relación lineal entre las variables y el modelo, en principio, no es apropiado. Puede haber una relación lineal en la población pero la muestra elegida no la detecta.  Si rechazamos la hipótesis nula concluimos que el modelo lineal es apropiado. Puede que exista una relación NO-LINEAL pero los datos son también consistentes con un modelo lineal.
  • 17. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 17 b)Estimaciones por intervalo para los parámetros.  2 2 1ˆpara : ( t )r n x s IC sn α β β −  2 2 2 2 ˆpara : ( t 1 )r n x s x IC sn α α α − + 7. Inferencias acerca de la predicción Nos puede interesar predecir el valor medio de la variable respuesta o bien el valor de la variable respuesta para un valor x que no ha sido considerado en la muestra. El estimador puntual es el mismo para las dos situaciones.
  • 18. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 18 a) Estimación puntual del valor medio de Y para un valor X=x : Estimador: ˆ .Y a bx= + ( ) ( ) 1 2 2 2 1 ˆ( ) sr i i x x s y n x x   −  = +  −    ∑ error típico de la estimación de la media de Y  Intervalo de confianza para el valor medio de la respuesta cuando X=x: ( ) ( ) ( ) 1 2 2 2 2 2 1 ˆ t sn r i i x x y n x x α −   −  +  −    ∑ 
  • 19. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 19 b)Estimación puntual del valor de Y para un valor X=x no observado Estimador: ˆ .Y a bx= + ( ) ( ) 1 2 2 2 1 ˆ( ) s 1r i i x x s y n x x   −  = + +  −    ∑ error típico de la estimación de Y  Intervalo de confianza para el valor de la respuesta para una nueva observación X=x: ( ) ( ) ( ) 1 2 2 2 2 2 1 ˆ t s 1n r i i x x y n x x α −   −  + +  −    ∑ 
  • 20. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 20 c) Bandas de confianza  Banda de confianza para predecir el valor medio de Y en cualquier valor de X:  Banda de confianza para predecir Y en cualquier valor de X: ( ) ( ) ( ) 1 2 2 1 2 2, 2 2 1 ˆ (2 ) sn r i i x x y F n x x α −   −  +  −    ∑  ( ) ( ) ( ) 1 2 2 1 2 2, 2 2 1 ˆ (2 ) s 1n r i i x x y F n x x α −   −  + +  −    ∑ 
  • 21. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 21 El SPSS nos dibuja las correspondientes bandas de confianza. Recta ajustada Banda de confianza para valores medios Banda de confianza para cualquier Y
  • 22. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 22 Riesgos de la extrapolación: Los límites de confianza calculados mediante las expresiones anteriores son válidos únicamente si el modelo es correcto. Un riesgo evidente de extrapolar el modelo fuera del rango de datos mediante el cual se ha construido, es que la relación entre las variables deje de ser lineal. 8. Los supuestos del modelo de regresión lineal Hasta ahora explicamos cómo aproximar el modelo de regresión lineal ,Y Xα β ε= + + por la recta ˆ .Y a bX= + Para garantizar que esta aproximación es válida, se deben cumplir las siguientes condiciones: 1. Independencia: los residuos deben ser independientes entre sí.
  • 23. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 23 2. Homocedasticidad (igualdad de varianzas): para cada valor de la variable X, la varianza de los residuos ( )ˆ i i ie Y Y= − debe ser la misma (es decir, que el ajuste es igual de preciso independientemente de los valores que tome X). 3. Normalidad: para cada valor de la variable X, los residuos ei tienen distribución normal de media cero. Por lo tanto, para ver si un modelo de regresión lineal ajustado es válido, debemos comprobar que se cumplen estas tres condiciones sobre los residuos. Ejemplo. En el modelo de regresión ajustado para la acidez total sobre la acidez libre, debemos comprobar la validez del mismo. Para eso veremos que se cumplen las hipótesis de independencia, homocedasticidad y normalidad dos residuos.  La independencia podemos comprobarla con el estadístico de Durbin-Watson. Si éste está entre 1.5 e 2.5, entonces podemos asumir que los residuos son independientes.
  • 24. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 24 Modelo R R 2 R2 corregida Error típ. de la estimac. Durbin- Watson 1 .960 .922 .921 2.6762 1.624 1 Variables predictoras: (Constante), aclib  Para comprobar la homocedasticidad Dibujaremos un diagrama de dispersión de las estimaciones (valores predichos por el modelo) tipificadas (ZPRED) frente a los residuos tipificados (ZRESID). de los residuos, haremos un procedimiento gráfico. Para garantizar que hay homocedasticidad, no se debe mostrar ninguna pauta de asociación (ningún patrón) en la nube de puntos.
  • 25. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 25  Para comprobar la normalidad hacemos los gráficos de normalidad y realizamos el contraste de normalidad (test de Kolmogorov-Smirnov ó test de Shapiro-Wilks) Pruebas de normalidad Kolmogorov-Smirnova Shapiro-Wilk Estadístico gl Sig. Estadístico gl Sig. Standardized Residual ,107 66 ,061 ,959 66 ,027 a. Corrección de la significación de Lilliefors
  • 26. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 26 Algunos casos en los que no se cumplen los supuestos i) Falta de independencia (Autocorrelación negativa en los resíduos, valores por encima de la media tienden a ir seguidos de valores por debajo de ella) ii) Falta de homocedasticidad (La variablidad aumenta al aumentar las los valores de las predicciones)
  • 27. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 27 iii) Falta de linealidad Transformaciones previas a la regresión: Si después de efectuar la diagnosis del modelo vemos que no se cumplen algunas de sus hipótesis básicas, podemos actuar de dos maneras:  Efectuar una transformación de los datos de manera que los datos ya cumplan todas las hipótesis del modelo.
  • 28. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 28  Buscar otro tipo de modelo de regresión que no requiera las hipótesis que se han imcumplido, que ajuste adecuadamente a los datos y cuyas nuevas hipótesis sí sean verificadas. Lo más frecuente es intentar primero una transformación de los datos. Las transformaciones más habituales son las de la familia transformaciones de Box-Cox. Esta familia viene dada por la siguiente expresión: Cada produce una transformación diferente, de modo que escogiendo su valor estamos escogiendo la transformación que más nos convenga en cada caso. ( ) 1 0 ( ) ln 0 y h y y y λ λ λ λ λ  − ≠ = =   = λ
  • 29. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 29 9. Un ejemplo en el que no se cumplen los supuestos Los supuestos que deben cumplirse para que el ajuste de un modelo de regresión lineal sea adecuado son: independencia, igualdad de varianzas y normalidad de los residuos. Pero, ¿qué ocurre cuando estos supuestos no se dan? ¿Cuál es el resultado que obtenemos? Fijémonos en la gráfica siguiente (archivo datos_NS.sav). A simple vista, parecería que el ajuste lineal es adecuado: la línea recta ajusta bastante bien la nube de puntos, y el coeficiente de determinación es de 0.81.
  • 30. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 30 Para un modelo de regresión lineal sobre estos datos, los resultados son los siguientes: Resumen del modelo(b) Mod. R R 2 R2 corregida Error típ. de estimac. Durbin-Watson 1 ,902 ,814 ,813 1,00916 2,096  Los datos son incorrelados Veamos la normalidad:
  • 31. Estadística. FBA I 2011-2012 Regresión lineal simple M. Carmen Carollo Limeres Página 31 Pruebas de normalidad Kolmogorov-Smirnov Shapiro-Wilk Estadístico gl Sig. Estadístico gl Sig. Standardized Residual ,136 200 ,000 ,776 200 ,000 a. Corrección de la significación de Lilliefors  Vemos que los datos no son normales. En cuanto a la igualdad de varianzas:  Hay heterocedasticidad pues la varianza es mayor para valores pronosticados grandes o pequeños.