• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
19 regresion
 

19 regresion

on

  • 6,946 views

 

Statistics

Views

Total Views
6,946
Views on SlideShare
6,940
Embed Views
6

Actions

Likes
3
Downloads
283
Comments
1

1 Embed 6

http://www.slideshare.net 6

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel

11 of 1 previous next

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
  • Muy bueno, me aclaró un montón, es justo lo que estaba buscando. Muchas gracias
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    19 regresion 19 regresion Presentation Transcript

    • Análisis de RegresiónCaso Easton Realty
    • Precio versus Área
    • Precios con tres áreas diferentes
    • Modelo: Recta de los Promedios
      El precio promedio varía con el área.
      Podemos establecer una relación entre el precio y el área
    • Análisis de Regresión
      ¿Qué es el Problema de Regresión?
      Estimar el valor promedio de una variable en términos del valor conocido de otra variable (o valores conocidos de otras variables)
      ¿Qué es la Ecuación de regresión?
      Es la Expresión matemática que establece la relación entre dos variables
      ¿Qué incluye el Análisis de Regresión?
      Estimar la fuerza de la asociación entre variables
      Determinar la relación apropiada
      Determinar el nivel de significancia de la relación
      Evaluar qué tan apropiada es la ecuación de regresión
    • Modelo desde otra perspectiva
      Para cada área hay un precio promedio pero también hay un conjunto de posibles valores alrededor de este promedio.
      Esta variación es producida por otros factores
    • Primer análisis: Diagramas de Dispersión
    • Coeficiente de Correlación de la muestra
      Mide la asociación entre dos variables, indicando el sentido de la asociación.
      Tiene el mismo sentido ( es decir signo) que la pendiente del modelo
      Puede evaluarse su significancia
    • Correlación inversa perfecta (-1)
    • Correlación = -0.9
    • Correlación = -0.5
    • Correlación = 0.02
    • Correlación = 0.8
    • Correlación = 0.96
    • Nuestro caso: Precio vs Área
    • Modelo Lineal
    • Tres casos que hay que diferenciar
      Ecuación del modelo para los promedios:
      E(Y) = A + B X
      Es la ecuación general, aplicable para los promedios
      Ej. El precio promedio de una casa de 200m2
      Ecuación del modelo para valores individuales
      Y = A + B X + error,
      Es aplicable para cada casa
      Ej. El precio de una casa individual de 200m2
      Ecuación estimada
      Y = a + b X
      Es la ecuación estimada a través de una muestra de observaciones (lo que producen los datos)
    • Nuestra Recta: Precio vs Área
      b= pendiente
      a=intercepto
    • Método de los Mínimos Cuadrados
    • Valor estimado del precio Yest
      EE
      La diferencia es el error e
      EE
      Valor real del precio
      Error Estándar del Estimador EE Desviación Típica de los Residuos
    • Coeficiente de Determinación (r2)
      Es el porcentaje de variación de Y explicada por el modelo
      Indica fuerza de asociación lineal
      Se le usa como indicador de la capacidad predictiva del modelo
      Uso muy común pero no es lo único que debe considerarse
      Existe una versión mejorada llamado
      R2-ajustado
    • Supuestos del Modelo
      La relación entre las variables es lineal
      Las observaciones son independientes
      La dispersión es constante en la recta
      Normalidad: Cada distribución en cada valor de X es normal (necesaria para inferencia)
    • Inferencia en regresión
      ¿Es la relación mostrada en la muestra generalizable a la población?
    • Prueba de hipótesis en la regresión
    • Pruebas acerca de la Pendiente
    • Resultado de una Regresión Simple
      Ecuación de regresión simple
      El precio se incrementa en 34.9 por pie2
      La pendiente es significativa
      La variable área capacidad predictiva
      La correlación es positiva igual que la pendiente
      Error estándar del modelo de regresión
      El área explica el 48% de la variación del precio
    • Análisis de Residuales
      Residuales versus valor estimado
      Normalidad de los errores
    • Regresión Múltiple
      En este caso tenemos más una variable independiente o explicativa
    • Regresión Múltiple
      Estudia la relación entre
      Una variable dependiente, y
      Más de una variable independiente (explicativa)
      Se utiliza:
      Para describir la naturaleza de una relación
      Para predecir la variables dependiente a partir del valor de las independientes
    • Detalles del modelo
      Y = A + B X1 + C X2 + D X3 +…+ error
      Se asume relación lineal
      Los términos A, B, C y los demás se interpretan como contribuciones marginales a la variación de Y
      Una herramienta útil es la matriz de correlaciones
      Idealmente X1, X2, X3 y las demás variables explicativas son independientes entre sí
      Problema potencial es la multicolinealidad
    • Ejemplo: Sueldos de graduados
    • Preguntas
      ¿Cuál es el impacto de tener una maestría en el sueldo del ejecutivo?
      ¿Qué variables son explicativas de las diferencias en el sueldo?
      Ofrezca una explicación razonable para el resultado hallado
    • Sueldos: Matriz de correlación
      Observar que Maestría no es una variable cuantitativa
      La interpretación de la correlación tiene dificultades
    • Gráfica: Sueldos Vs. Experiencia
    • Gráfica: Sueldos Vs. Calificación
    • Gráfica: Sueldos Vs. Maestría
    • Ejemplo Sueldos: Estimación
      Significativo?
    • Otros indicadores
      Multicolinealidad?
    • Modelo final (sin variable Maestría
      El modelo explica el 90.32% de la variación de los sueldos
    • Dificultades en la Regresión
      Multicolinealidad
      Cuando hay mucha correlación entre las variables independientes (explicativas)
      Autocorrelación
      Falta de independencia de los errores
      Los valores de Y están relacionados con valores subsecuentes en otros periodos
      Heteroscedasticidad
      La varianza de los errores no es constante