19 regresion

6,447 views

Published on

1 Comment
3 Likes
Statistics
Notes
  • Muy bueno, me aclaró un montón, es justo lo que estaba buscando. Muchas gracias
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
No Downloads
Views
Total views
6,447
On SlideShare
0
From Embeds
0
Number of Embeds
10
Actions
Shares
0
Downloads
283
Comments
1
Likes
3
Embeds 0
No embeds

No notes for slide

19 regresion

  1. 1. Análisis de RegresiónCaso Easton Realty<br />
  2. 2. Precio versus Área<br />
  3. 3. Precios con tres áreas diferentes<br />
  4. 4. Modelo: Recta de los Promedios<br />El precio promedio varía con el área.<br />Podemos establecer una relación entre el precio y el área<br />
  5. 5. Análisis de Regresión<br />¿Qué es el Problema de Regresión?<br />Estimar el valor promedio de una variable en términos del valor conocido de otra variable (o valores conocidos de otras variables) <br />¿Qué es la Ecuación de regresión?<br />Es la Expresión matemática que establece la relación entre dos variables<br />¿Qué incluye el Análisis de Regresión?<br />Estimar la fuerza de la asociación entre variables<br />Determinar la relación apropiada<br />Determinar el nivel de significancia de la relación<br />Evaluar qué tan apropiada es la ecuación de regresión<br />
  6. 6. Modelo desde otra perspectiva<br />Para cada área hay un precio promedio pero también hay un conjunto de posibles valores alrededor de este promedio. <br />Esta variación es producida por otros factores<br />
  7. 7. Primer análisis: Diagramas de Dispersión<br />
  8. 8. Coeficiente de Correlación de la muestra<br />Mide la asociación entre dos variables, indicando el sentido de la asociación.<br />Tiene el mismo sentido ( es decir signo) que la pendiente del modelo<br />Puede evaluarse su significancia<br />
  9. 9. Correlación inversa perfecta (-1)<br />
  10. 10. Correlación = -0.9<br />
  11. 11. Correlación = -0.5<br />
  12. 12. Correlación = 0.02<br />
  13. 13. Correlación = 0.8<br />
  14. 14. Correlación = 0.96<br />
  15. 15. Nuestro caso: Precio vs Área<br />
  16. 16. Modelo Lineal<br />
  17. 17. Tres casos que hay que diferenciar<br />Ecuación del modelo para los promedios:<br />E(Y) = A + B X<br />Es la ecuación general, aplicable para los promedios<br />Ej. El precio promedio de una casa de 200m2<br />Ecuación del modelo para valores individuales<br />Y = A + B X + error, <br />Es aplicable para cada casa<br />Ej. El precio de una casa individual de 200m2<br />Ecuación estimada <br />Y = a + b X<br />Es la ecuación estimada a través de una muestra de observaciones (lo que producen los datos)<br />
  18. 18. Nuestra Recta: Precio vs Área<br />b= pendiente<br />a=intercepto<br />
  19. 19. Método de los Mínimos Cuadrados<br />
  20. 20. Valor estimado del precio Yest<br />EE<br />La diferencia es el error e<br />EE<br />Valor real del precio<br />Error Estándar del Estimador EE Desviación Típica de los Residuos<br />
  21. 21. Coeficiente de Determinación (r2)<br />Es el porcentaje de variación de Y explicada por el modelo<br />Indica fuerza de asociación lineal<br />Se le usa como indicador de la capacidad predictiva del modelo <br />Uso muy común pero no es lo único que debe considerarse<br />Existe una versión mejorada llamado <br /> R2-ajustado<br />
  22. 22. Supuestos del Modelo<br />La relación entre las variables es lineal<br />Las observaciones son independientes<br />La dispersión es constante en la recta<br />Normalidad: Cada distribución en cada valor de X es normal (necesaria para inferencia)<br />
  23. 23. Inferencia en regresión<br />¿Es la relación mostrada en la muestra generalizable a la población?<br />
  24. 24. Prueba de hipótesis en la regresión<br />
  25. 25. Pruebas acerca de la Pendiente<br />
  26. 26. Resultado de una Regresión Simple<br />Ecuación de regresión simple<br />El precio se incrementa en 34.9 por pie2<br />La pendiente es significativa<br />La variable área capacidad predictiva<br />La correlación es positiva igual que la pendiente<br />Error estándar del modelo de regresión<br />El área explica el 48% de la variación del precio<br />
  27. 27. Análisis de Residuales<br />Residuales versus valor estimado<br />Normalidad de los errores<br />
  28. 28. Regresión Múltiple<br />En este caso tenemos más una variable independiente o explicativa<br />
  29. 29. Regresión Múltiple<br />Estudia la relación entre <br />Una variable dependiente, y<br />Más de una variable independiente (explicativa)<br />Se utiliza:<br />Para describir la naturaleza de una relación<br />Para predecir la variables dependiente a partir del valor de las independientes<br />
  30. 30. Detalles del modelo<br />Y = A + B X1 + C X2 + D X3 +…+ error<br />Se asume relación lineal <br />Los términos A, B, C y los demás se interpretan como contribuciones marginales a la variación de Y<br />Una herramienta útil es la matriz de correlaciones<br />Idealmente X1, X2, X3 y las demás variables explicativas son independientes entre sí<br />Problema potencial es la multicolinealidad<br />
  31. 31. Ejemplo: Sueldos de graduados<br />
  32. 32. Preguntas<br />¿Cuál es el impacto de tener una maestría en el sueldo del ejecutivo?<br />¿Qué variables son explicativas de las diferencias en el sueldo?<br />Ofrezca una explicación razonable para el resultado hallado<br />
  33. 33. Sueldos: Matriz de correlación<br />Observar que Maestría no es una variable cuantitativa<br />La interpretación de la correlación tiene dificultades<br />
  34. 34. Gráfica: Sueldos Vs. Experiencia<br />
  35. 35. Gráfica: Sueldos Vs. Calificación<br />
  36. 36. Gráfica: Sueldos Vs. Maestría<br />
  37. 37. Ejemplo Sueldos: Estimación<br />Significativo?<br />
  38. 38. Otros indicadores<br />Multicolinealidad?<br />
  39. 39. Modelo final (sin variable Maestría<br />El modelo explica el 90.32% de la variación de los sueldos<br />
  40. 40. Dificultades en la Regresión<br />Multicolinealidad<br />Cuando hay mucha correlación entre las variables independientes (explicativas)<br />Autocorrelación<br />Falta de independencia de los errores<br />Los valores de Y están relacionados con valores subsecuentes en otros periodos<br />Heteroscedasticidad<br />La varianza de los errores no es constante<br />

×