AD4001 s10 ss

429 views

Published on

Estadística en las organizaciones
Sesión 10
Dr. Jorge Ramírez Medina
Regresión lineal simple

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
429
On SlideShare
0
From Embeds
0
Number of Embeds
27
Actions
Shares
0
Downloads
8
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide
  • -- a dependent variable -- is generally predicted or explained by means of the other(s) -- independent variables and covariates. These are called dependence methods. Ejemplo: multiple regression and analysis of variance
  • Multiple regression analysis enables the researcher to predict the level of magnitude of a dependent variable based on the levels of more than one
    independent variable.
    Multiple discriminant analysis enables the researcher to predict group membership on the basis of two or more independent variables.
    Conjoint analysis provides a basis to estimate the utility that consumers associate with different product features or attributes.
  • http://onlinestatbook.com/stat_sim/reg_by_eye/index.html
    El truco es minimizar las desviaciones a la media => se usa……
  • => se usa…… (recordar varianza) método de mínimos cuadrados
  • Figuar 14.5 en excel
  • Figuar 14.5 en excel
  • The regression relationship is very strong since 88% of the variation in number of cars sold can be explained by the linear relationship between the number of TV ads and the number of cars sold.
  • FORGET ABOUT Anova
    CONCLUSION: THE TWO TECHNIQUES ARE VERY SIMILAR, WITH DISCRIMINANT ANALYSIS HAVING MANY POTENTIAL APPLICATIONS IN
    MARKETING
    A telecommunications provider has segmented its customer base by service usage patterns, categorizing the customers into four groups.
    If demographic data can be used to predict group membership, you can customize offers for individual prospective customers.
    Suppose information on current customers is contained in telco.sav. Use the Discriminant Analysis procedure to classify customers.
    Análisis Discriminante. You have created a discriminant model that classifies customers into one of four predefined "service usage" groups, based on demographic information from each customer.
  • AD4001 s10 ss

    1. 1. Sesión 10 Regresión lineal simple Estadística en las organizaciones CD4001 Dr. Jorge Ramírez Medina
    2. 2. Qué tipo de relación se examina? Dependencia Interdependencia Cuántas son las variables a predecir? Múltiples relaciones de Variables dependientes e independientes Varias variables dependientes en una sola relación Métrica Correlación canónica Cuál es la escala de medición de la variable dependiente? Cuál es la escala de medición de la variable dependiente? SEM Métrica Una variable dependientes en una sola relación No Métrica Cuál es la escala de medición de la variable predictora? No Métrica Análisis Multivariado de varianza (Manova) Correlación canónica con variables dummy Métrica Regresión múltiple Análisis Conjoint No Métrica Análisis discriminante múltiple Modelos de probabilidad lineal (logit Analysis)
    3. 3. Correlación canónica Y1+Y2+Y3+…+Yn = métrica, no métrica X1+X2+X3+…+Xn métrica, no métrica Manova Y1+Y2+Y3+…+Yn = métrica X1+X2+X3+…+Xn no métrica Análisis de Varianza Y1 = Relación entre los métodos de dependencia multivariados métrica X1+X2+X3+…+Xn no métrica Análisis discriminante múltiple Y1= no métrica (dicotómica) X1+X2+X3+…+Xn métrica Análisis de regresión múltiple Y1= métrica X1+X2+X3+…+Xn métrica, no métrica Análisis Cojoint Y1= métrica, no métrica X1+X2+X3+…+Xn no métrica SEM Y1 = Y2 = Ym = X11+X12+X13+…+X1n X21+X22+X23+…+X2n Xm1+Xm2+Xm3+…+Xmn
    4. 4. Modelo de regresión lineal simple • Modelo de regresión lineal simple y = β0 + β1x + ε • Ecuación de regresión lineal simple E(y) = β0 + β1x • Ecuación estimada de regresión lineal simple ^ y = b0 + b1x Dr Jorge Ramírez Medina EGADE Business School
    5. 5. Método de mínimos cuadrados Criterio de mínimos cuadrados  min ∑ (y i − y i ) 2 en donde: yi = es el valor observado de la variable dependiente para la ith observación ^ yi = es el valor estimado de la variable dependiente para la ith observación Dr Jorge Ramírez Medina EGADE Business School
    6. 6. Calculando b 1 y b 0 Pendiente de Ecuación estimada de regresión lineal simple Intercepto en y de la Ecuación estimada de regresión lineal simple Dr Jorge Ramírez Medina EGADE Business School
    7. 7. Ejemplo Restaurante i Ventas trimestrales (miles de $) 1 2 58 2 6 105 3 8 88 4 8 118 5 12 117 6 16 137 7 20 157 8 20 169 9 22 149 10 Dr Jorge Ramírez Medina EGADE Business School Población estudiantes (miles) xi 26 202
    8. 8. SCE Residual representa el error Es lo que se minimiza con el criterio de Mínimos cuadrados SCE: Suma de cuadrados debido al error. Medida de error al usar Dr Jorge Ramírez Medina EGADE Business School
    9. 9. STC Asumamos que no tenemos información de xi, entonces usaremos el promedio de las ventas. El error correspondiente es STC (Suma total de cuadrados) Dr Jorge Ramírez Medina EGADE Business School
    10. 10. SCE y STC SCE: Que tanto se agrupan las observaciones en torno a la recta STC: Que tanto se agrupan las observaciones en torno a la recta P10 Dr Jorge Ramírez Medina EGADE Business School
    11. 11. SCR SCR: Suma de cuadrados debido a la regresión P10 Dr Jorge Ramírez Medina EGADE Business School
    12. 12. ¿Qué tan bien se ajustan a los datos la ecuación de regresión? • SSE • SST • SSR ∑( y ^ i − yi ) ∑ (^y − y ) ∑( y 2 2 i i − y) 2 SST = SSR + SSE 2 2 ^ ^ 2 ∑ ( yi − y ) = ∑ ( yi − y ) + ∑ ( yi − yi ) Dr Jorge Ramírez Medina EGADE Business School
    13. 13. El Coeficiente de determinación Coefficient of Determination where: regression error Dr Jorge Ramírez Medina EGADE Business School r2 = SSR/SST SST = total sum of squares SSR = sum of squares due to SSE = sum of squares due to
    14. 14. El coeficiente de correlación • Sample Correlation Coefficient rxy = (sign of b1 ) Coefficient of Determinat ion rxy = (sign of b1 ) r 2 ˆ y = b0 + b1 x where: b1 = the slope of the estimated regression equation Dr Jorge Ramírez Medina EGADE Business School
    15. 15. Ejemplo • Sample Correlation Coefficient rxy = (sign of b1 ) r 2 ˆ y = 10 + 5 x The sign of b1 in the equation is “+”. Dr Jorge Ramírez Medina EGADE Business School rxy = + .8772 rxy = +.9366
    16. 16. Análisis de residuos • Residual for Observation i ^ ^ yi – yi • Standardized Residual for Observation i ^ yi − yi ^ syi − yi Where Dr Jorge Ramírez Medina EGADE Business School ^ syi − yi = s 1 − hi
    17. 17. Ejemplo Residuals Observation 1 2 3 4 5 Dr Jorge Ramírez Medina EGADE Business School Predicted Cars Sold 15 25 20 15 25 Residuals -1 -1 -2 2 2
    18. 18. Diferencias y similitudes ANOVA Similarities Number of dependent variables Number of independent variables Differences Nature of the dependent variables Nature of the independent variables One REGRESSION DISCRIMINANT/LOGIT Pruebas de One diferencias One Multiple Multiple Metric Pruebas de Metric asociación Categorical Categorical Metric Dr. Jorge Ramírez Medina ITESM EGADE Multiple Pruebas de hipótesis Metric
    19. 19. When ANOVA is the Correct Test
    20. 20. Asignación para la siguiente sesión Dr. Jorge Ramírez Medina EGADE Business School
    21. 21. Fin Sesión Diez

    ×