• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Regresion lineal multiple
 

Regresion lineal multiple

on

  • 19,021 views

 

Statistics

Views

Total Views
19,021
Views on SlideShare
19,021
Embed Views
0

Actions

Likes
6
Downloads
384
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Regresion lineal multiple Regresion lineal multiple Presentation Transcript

    • 1-1 Capítulo trece Análisis de regresión y correlación múltiples OBJETIVOS Al terminar este capítulo podrá: UNO Describir la relación entre dos o más variables independientes y una variable dependiente utilizando la ecuación de regresión múltiple. DOS Calcular e interpretar el error estándar múltiple de estimación y el coeficiente de determinación. TRES Interpretar una matriz de correlación. CUATRO Establecer y explicar una tabla ANOVA. © 2001 Alfaomega Grupo Editor
    • 1-1 Capítulo trece continuación Análisis de regresión y correlación múltiples OBJETIVOS Al terminar este capítulo podrá: CINCO Realizar una prueba de hipótesis para determinar si los de coeficientes de regresión son diferentes de cero. SEIS Realizar una prueba de hipótesis para cada uno de los coeficientes de regresión. © 2001 Alfaomega Grupo Editor
    • Análisis de regresión múltiple
      • Para dos variables independientes, la fórmula general de la ecuación de regresión múltiple es:
      • X 1 y X 2 son las variables independientes.
      • a es la intercepción en Y .
      • b 1 es el cambio neto en Y por cada cambio unitario en X 1 , manteniendo X 2 constante. Se denomina coeficiente de regresión parcial, coeficiente de regresión neta o bien coeficiente de regresión .
      13-3
    • Análisis de regresión múltiple
      • La ecuación general de regresión múltiple con k varibles independientes es:
      • El criterio de mínimos cuadrados se usa para el desarrollo de esta ecuación.
      • Como estimar b 1 , b 2 , etc. es muy tedioso, existen muchos programas de cómputo que pueden utilizarse para estimarlos.
      13-4
    • Error estándar múltiple de la estimación
      • El error estándar múltiple de la estimación es la medida de la eficiencia de la ecuación de regresión.
      • Está medida en las mismas unidades que la variable dependiente.
      • Es difícil determinar cuál es un valor grande y cuál es uno pequeño para el error estándar.
      13-5
    • Error estándar múltiple de la estimación
      • La fórmula es:
      • donde n es el número de observaciones y k es el número de variables independientes.
      13-6
    • Regresión y correlación múltiples (suposiciones)
      • Las variables independientes y dependientes tienen una relación lineal.
      • La variable dependiente debe ser continua y al menos con escala de intervalo.
      • La variación en ( Y - Y ’) o residuo debe ser la misma para todos los valores de Y . Cuando éste es el caso, se dice que la diferencia presenta homosedasticidad .
      • Los residuos deben tener distribución normal con media igual a 0.
      • Las observaciones sucesivas de la varible dependiente no deben estar correlacionadas.
      13-7
    • Tabla ANOVA
      • La tabla ANOVA proporciona la variación de la variable dependiente (tanto de la que está explicada por la ecuación de regresión como de la que no lo está).
      13-8
    • Matriz de correlación
      • La matriz de correlación se usa para mostrar todos los posibles coeficientes de correlación simple entre todas las variables.
        • La matriz también se útil para localizar la correlación de las variables independientes.
        • En la matriz se muestra qué tan fuerte está correlacionada la variable independiente con la variable dependiente.
      13-9
    • Prueba global
      • La prueba global se usa para investigar si todas las variables independientes tienen coeficientes significativos. Las hipótesis son:
        • H a : al menos uno de los coeficientes de regresión no es cero.
      13-10
    • Prueba global continuación
      • El estadístico de prueba es la distribución F con k (número de variables independientes) y n - (k + 1 ) grados de libertad, donde n es el tamaño de la muestra.
      13-11
    • Prueba para variables individuales
      • La prueba se usa para determinar qué variable independiente tiene coeficientes de regresión diferentes de 0.
      • Las variables que tiene coeficientes de regresión cero, suelen desaparecer del análisis.
      • El estadístico de prueba es la distribución t con n - (k + 1) grados de libertad.
      13-12
    • EJEMPLO 1
      • Un estudio de mercado para la cadena de tiendas autoservicio Super Dollar analiza la cantidad anual que gastan en comida las familias de cuatro o más miembros. Se iensa que tres variables independientes se relacionan con los gastos en comida. Esas variables son: ingreso familiar total, tamaño de la familia y si la familia tiene hijos en la universidad.
      13-13
    • EJEMPLO 1 continuación Familia Gastos en comida Ingresos ($1000) Tamaño de la familia Hijos en universidad 13-14
    • EJEMPLO 1 continuación
      • Use un software, como MINITAB o Excel, para desarrollar la matriz de correlación.
      • Del análisis proporcionado por MINITAB, escriba la ecuación de regresión:
      • ¿Qué gastos en comida estima para una familia de 4 integrantes, sin hijos en la universidad y con ingresos de $50,000?
      13-15
    • EJEMPLO 1 continuación
      • Y’=954 + 10.9(50) + 748(4) + 565 (0) = 4491.
      • Realice una prueba global de hipótesis para determinar si alguno de los coeficientes de regresión es distinto de cero.
      • H 1 : al menos una
      • H 0 se rechaza si F > 4.07
      • A partir de la salida de MINITAB, el valor del estadístico de prueba calculado es 10.94
      • Decisión: como F = 10.94 > 4.07 , H 0 se rechaza. Entonces, no todos los coeficientes de regresión son cero.
      13-16
    • EJEMPLO 1 continuación
      • Realice una prueba individual para determinar qué coeficientes son distintos de cero.
      • De la salida de MINITAB, la única variable significativa es FSIZE (tamaño de familia) al usar los valores p . Las otras variables pueden omitir del modelo.
      • Entonces,
      • Para 5% de nivel de significancia, se rechaza H 0 si el valor p < .05
      13-17
    • EJEMPLO 1 continuación
      • Como el valor p =.039 <.05, se rechaza H 0 y se concluye que . Esto es, el tamaño de la familia y cantidad gastada en comida tienen una relación significativa.
      13-18
    • Variables cualitativas y regresiones escalonadas
      • Las variables cualitativas son no numéricas y también se llaman variables ficticias .
        • Para una variable cualitativa, sólo existen dos condiciones posibles.
      • La regresión escalonada conduce a la ecuación de regresión más eficiente.
        • Sólo las variables independientes con coeficientes de regresión significativos entran en el análisis. Las variables se introducen en el orden en que hacen que R^2 aumente más rápido.
      13-19
    • Análisis de residuos
      • Un residuo (o residual) es la diferencia entre el valor real de Y y el valor pronosticado Y ’.
      • Los residuos deben tener una distribución normal aproximada. Los histogramas y los diagramas de tallo y hoja sirven para verificar estos requisitos.
      • Una gráfica de residuos y los valores de Y ’ correspondientes se usan para mostrar que no hay tendencias ni patrones en los residuos.
      13-20
    • Gráfica residual 4500 7500 6000 0 -500 500 1000 Y’ Residuos 13-21
    • Histogramas de residuos -600 -200 200 600 1000 8 7 6 5 4 3 2 1 0 Frecuencia Residuos 13-22