Apuntes de econometría i (primera parte) jorge salgado

18,260 views

Published on

Apuntes de Econometría I
Jorge Salgado
PUCE

Published in: Business
1 Comment
8 Likes
Statistics
Notes
No Downloads
Views
Total views
18,260
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
720
Comments
1
Likes
8
Embeds 0
No embeds

No notes for slide

Apuntes de econometría i (primera parte) jorge salgado

  1. 1. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA PRINCIPIOS ECONOMÉTRICOS: 1.- Análisis de regresión con dos variables: Supongamos una comunidad hipotética con una población total de 60 familias con sus ingresos (X) y sus gastos en consumo (Y) semanales. Cabe advertir que se analizará la propensión marginal de consumo (PMC), desarrollado por el economista John Maynard Keynes1 en el año de 1935. Condiciones: Se va a construir un marco hipotético con 10 valores fijos de X y 10 “subpoblaciones” de Y. Ingreso Familiar (X) 80 100 120 140 160 180 200 220 240 260 55 65 79 80 102 110 120 135 137 150 60 70 84 93 107 112 136 137 145 152 65 74 90 95 110 120 140 140 155 175 Consumo 70 80 94 103 116 130 144 152 165 178 Familiar (Y) 75 85 98 108 118 135 145 157 175 180 88 113 125 140 160 189 185 115 110 162 191 TOTAL 325 462 445 707 678 750 685 1043 966 1211 MEDIA CONDICIONAL 65 77 89 101 113 125 137 144 161 173 Y Consumo Semanal Curva de Regresión Poblacional X Re Ingreso Semanal gr esi ón 1 1 John Maynard Keynes (1883-1946), economista británico. Dio lugar a una nueva escuela de pensamiento económico Po Página denominada keynesianismo o “nueva ciencia económica”, estas influyeron de forma determinante en el diseño de las bl políticas económicas de muchos países desde la finalización de la II Guerra Mundial dando lugar a los sistemas de desarrollo. aci on Jorge Salgado al
  2. 2. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA -En el gráfico anterior la recta representa los valores promedio de las observaciones. -Los promedios también son conocidos como los valores esperados condicionales. -La expectativa (esperanza de Y condicionada a X) se simboliza como: E (X/Y) - E (XY), en nuestro ejemplo se trata del promedio del consumo con respecto al ingreso. -Se concluye de forma sencilla que a medida que el ingreso semanal aumenta el consumo aumenta. 1.1.-El valor esperado condicional e incondicional: Para comprender las diferencias entre las categorías, vamos a relazar una contrastación utilizando la tabla anterior.  Valor esperado Incondicional 7272 E (Y) = = 121,20 60  Valor esperado condicional 707 E (Y/X = 140) = = 101 7 Por lo tanto, el valor esperado incondicional y condicional son respuestas a diferentes preguntas.  En el caso de la media incondicional (en donde no existen condiciones) se formula la pregunta: ¿Cuál es el valor esperado del consumo de una familia? En donde, se hace alusión cualquier familia.  Por otro lado la media condicional formula la pregunta: 2 ¿Cuál es el valor esperado de consumo de una familia cuyo ingreso semanal es de Página $ 140? Jorge Salgado
  3. 3. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA 2.-Función de Regresión Poblacional: De lo presentado anteriormente se deduce que cada media condicional E (Y/Xi) es función de Xi. E (Y/Xi) = f (Xi) Esta ecuación señala que los valores esperados de la distribución de Y, están relacionados funcionalmente con X. Ahora vamos a suponer el gasto está linealmente relacionado con el ingreso. E (Y/Xi) = β1 + β2Xi En donde β1 y β2 son parámetros no conocidos, denominados coeficientes de regresión, cuya estimación es el interés del análisis de regresión. La ecuación anterior es la función de regresión lineal poblacional. Finalmente es necesario resaltar que el criterio clave que subyace en el análisis de regresión es el de función de regresión poblacional (FRP). Así, el objetivo del análisis de regresión es averiguar la forma en que el valor promedio de la variable dependiente (regresada) varía de acuerdo con el valor dado de la variable explicativa (regresora). 2.1-Significado del término lineal: La interpretación matemática del término lineal, puede ser desarrollada por medio de dos vías. a) Linealidad en las variables: Se dice que una función E (Y/Xi) = f (x) es lineal en las variables si estas aparecen elevadas a una potencia uno y no están multiplicadas ni dividas por ninguna variable. En el contexto de las matemáticas puras se dice que la incógnita es el elemento de la ecuación elevada a una potencia. b) Linealidad en los parámetros: Se dice que una función E (Y/Xi) = f (x) es lineal en los parámetros se estos aparecen elevados a una potencia y no están multiplicados ni divididos por ningún otro parámetro. Ejemplos: - Lineal en las variables. (/ ) = 1 + 2 - Lineal en los parámetros. - No lineal en las variables. (/ ) = 1 + 2 2 - Lineal en los parámetros. 1/2 - Lineal en las variables. 3 (/ ) = 1 + 2 - No lineal en los parámetros. Página Jorge Salgado
  4. 4. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA - No lineal en las variables. (/ ) = 1 + 2 −1 - Lineal en los parámetros. −1 - Lineal en las variables. (/ ) = 1 + 2 - No lineal en los parámetros. - No lineal en las variables. (/ ) = 1 + 2 - No lineal en los parámetros. 2 - Para nuestro propósito, la segunda interpretación (linealidad en los parámetros) es la que será utilizada en el desarrollo de la materia. - En una regresión lineal debemos fijarnos en los parámetros. 3.-Especificación Estocástica de la FRP: Se ha demostrado que a medida que el ingreso familiar aumenta, el gasto de consumo familiar en promedio también aumenta. Sin embargo, el gasto en consumo de una familia individual no necesariamente aumenta a medida que el nivel de ingreso es mayor.  Perturbación estocástica, variables que afectan al consumo pero no es el ingreso. Analizamos un cambio latitudinal Son considerados otros patrones de consumo a la religión, la situación geográfica entre otros. 4 X1 X2 X3 X4 X5 X6 X7 Página Jorge Salgado
  5. 5. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA -Es importante recordar que la sumatoria de las desviaciones con respecto a la media es igual a cero. En el siguiente ejemplo se examina la premisa anterior: Y1 75 U1 Y2 70 + U2 Y3 65 - E(Y/Xi) U3 Y4 60 - U4 Y5 55 U5 Así = − / , donde es una variable aleatoria que se denomina perturbación estocástica que en términos estadísticos son desviaciones con respecto a la media; que sustituye o representa a las variables omitidas o ignoradas que pueden afectar a Y por que no están incluidas en el modelo de regresión. = / + = 1 + 2 + Con el modelo anterior se puede determinar a las sesenta familias del ejercicio empírico presentado inicialmente. La ecuación plantea que el gasto de consumo de una familia está relacionado linealmente con sus ingresos más el término de perturbación estocástica que puede ser positivo (+) o negativo (-). En el siguiente gráfico se muestra a . X1 X2 X3 X4 X5 X6 X7 5 Página Jorge Salgado
  6. 6. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA 4.-Propiedades del Operador Expectativa: 1.-La expectativa de una constante es la constante. El promedio de una constante es la constante. = 2.-Cuando tenemos la expectativa / queremos decir: / ∴ = ∗ = ∗ = ∗ / + = + = + ∗ = + ∗ = + ∗ / Si tenemos el valor esperado de la ecuación anterior: = / + ( ) = / + ( ) = / + ( ) = / + = 0 Recordando que las expectativa de una constante es una constante. Por un lado, el promedio de las perturbaciones estocásticas es igual a cero porque son desviaciones con respecto a la media; pero por otro lado lo anterior implica que la recta de regresión pasa a través de las medias condicionales de Y. 6 5.-Función de Regresión Muestral: Página Jorge Salgado
  7. 7. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA Cambiando de perspectiva de valores poblacionales vayamos a considerar valores muestrales que es el problema de análisis de la regresión lineal. En el ejemplo el número de muestras que disponemos es: La combinación de las 60 familias, de donde podemos escoger uno de cada grupo. 60! 60,10 = = 7,539402757 * 10 10 muestras. 10! 50! De las cuales seleccionamos dos: Muestra 1 Muestra 2 Y X Y X 70 80 55 80 65 100 88 100 90 120 90 120 95 140 80 140 110 160 118 160 115 180 120 180 120 200 145 200 140 220 135 220 155 240 145 240 150 260 175 260 Primera Muestra FRM2 Regresión basada en la Segunda Muestra segunda muestra FRM1 Gasto en Consumo Semanal $ Regresión basada en la primera muestra En general las rectas de regresión muestral, son aproximaciones a la recta poblacional 7 Ingreso Semanal $ Página Jorge Salgado
  8. 8. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA De manera similar a la función de regresión poblacional (FRP), es posible definir a la función de regresión muestral(FRM), para representar la recta de regresión muestral. = 1 + 2 + Donde = 1 + 2 , y representa a un punto de la recta de regresión muestral. = Estimador del promedio / 1 = Estimador de la intersección 1 2 = Estimador de la pendiente 2 = Estimador de (residuos) Así un estimador es la aproximación al parámetro poblacional a partir de la información de la muestra que se tiene a la mano, = + = − Ecuación que en términos de la FRP son: = (/ ) + = − ( / ) FRM Gasto en Consumo Semanal $ FRP 8 Página Ingreso Semanal $ Jorge Salgado
  9. 9. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA MODELO DE REGRESIÓN CON DOS VARAIBLES: PROBLEMA DE ESTIMACIÓN La primera tarea consiste en estimar la función de regresión poblacional (FRP) con fundamento en la función de regresión muestral(FRM) de la manera más precisa posible. Hay dos métodos de estimación: 1) Los mínimos cuadrados ordinarios (MCO). 2) La máxima verosimilitud (MV). Se estudiará el primer método. Mínimos Cuadrados Ordinarios: Se le atribuye a Carl Friedrich Gauss2, cuyo principio es el de minimizar la sumatoria de los residuos al cuadrado. 2 2 2 = − = − 1 − 2 Considerando como incógnitas a 1 , 2 2 =2 ( − 1 − 2 ) −1 = 0 1 ( − 1 − 2 ) = 0 − 1 − 2 = 0 = 1 + 2 = Ó 2 =2 ( − 1 − 2 ) − = 0 2 9 Página 2 Carl Friedrich Gauss (1777-1855), matemático alemán conocido por sus muy diversas contribuciones a la astronomía, las matemáticas y la física, especialmente por sus estudios del electromagnetismo. En el caso econométrico cobre relevancia por su aporte de la Curva Normal. Jorge Salgado
  10. 10. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA ( − 1 − 2 )( ) = 0 − 1 − 2 2 = 0 = 1 + 2 2 = Ó Ahora multiplicando a la segunda ecuación normal por n y restando la primera ecuación multiplicada por , resolvemos el sistema de ecuaciones. Adicionalmente, tenemos que tener en consideración que 2 ≠ 2 . = 1 + 2 2 2 = 1 + 2 La resta nos da el siguiente resultado: − = 2 2 −2 2 2 2 2 − = − − 2 = 2 − 2 Remplazando, obtenemos 1 : 2 − 1 = 2 − 2 10 Se deben hacer los cálculos de los estimadores con el ejercicio de las muestras. Página Jorge Salgado
  11. 11. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA Propiedades de las desviaciones con respecto a la media: Notación: = − = − 1.- La sumatoria de las desviaciones con respecto a la media es igual a cero: = ( − ) = − = − = 0 1 = = 2.-La varianza: 2 = − 2 = 2 − 2 + 2 = 2 − 2 + 2 2 = 0 = 2 − 2 3.-La covarianza: = − = − = − =0 = Si en 2 se sustituyen los valores observados (mayúsculas) por las desviaciones con respecto a la media (minúsculas), encontramos: − 2 = 2 − 2 − 2 = 2 − 2 11 Página 2 = = 2 Jorge Salgado
  12. 12. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA 2 = = = 2 2 − 2 2 − 2 Si en la primera ecuación normal dividimos para n, encontramos: = 1 + 2 = Ó 2 = 1 + = 1 + 2 1 = − 2 Propiedades de numéricas de los operadores de los Mínimos Cuadrados Ordinarios: Son aquellas que se mantienen sin considerar la forma o la manera en que se generan los datos. 1.-Están expresados en términos de las cantidades observadas, por consiguiente pueden ser fácilmente calculados. 2.-Son estimadores puntuales, es decir proporcionan un solo valor poblacional pertinente. 3.-Una vez obtenidos los estimadores la recta de regresión muestral puede graficarse fácilmente. 12 Página Jorge Salgado
  13. 13. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA Propiedades de la recta de regresión muestral: Nota: Estos resultados son correctos cuando el modelo de regresión incluye la intersección 1 , en el caso de que sean excluidos estos resultados no se dan necesariamente. Sin embargo, hay c casos en donde encontramos: Y X i) Pasa a través de las medias muetrales de Y y X. = 1 + 2 ii) La media de () es igual a la media de Y (observada). = 1 + 2 1 = − 2 = − 2 + 2 = + 2 − = + 2 = + 2 = 0 = = 13 = Página Jorge Salgado
  14. 14. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA iii) La media de los residuos es cero: 2 2 2 = − = − 1 + 2 2 =2 − 1 + 2 −1 = 0 1 − 1 + 2 = − = 0 = 0 Nota: = 1 + 2 + − = 1 + 2 . = 2 + − = 2 − 2 + = 2 = 2 − + “Cuando se realza una regresión con respecto a la media se parte del origen”. iv) Los residuos no están correlacionados con . Con la ecuación obtenida anteriormente multiplicamos por y aplicamos la sumatoria: = 2 = 2 = 2 − 2 14 Página 2 = 2 = 2 2 Jorge Salgado
  15. 15. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA = 0 = = , ≠0 están correlacionados. Son dependientes. = , = 0 no están correlacionados. Son independientes. v) Los residuos no están correlacionados con . 2 2 2 = − = − 1 + 2 15 2 Página =2 − 1 + 2 − = 0 2 Jorge Salgado
  16. 16. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA − 1 + 2 = 0 = 0 − = 0 = , ≠0 están correlacionados. Son dependientes. = , = 0 no están correlacionados. Son independientes. Supuestos detrás de los Mínimos Cuadrados Ordinarios (MCO): Son supuestos sobre la forma como se generan los datos, los cuales fijan las propiedades estadísticas de los estimadores de los Mínimos Cuadrados Ordinarios (MCO). 16 Si el objetivo de la econometría sería estimar 1 y 2 , solamente el método de los MCO sería Página suficiente. Pero es necesario saber que cerca está 1 de 1 , 2 de 2 y además se está cerca de Jorge Salgado
  17. 17. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA (/ ), para poder hacer inferencia. Por tanto, el modelo clásico de regresión lineal plantea diez supuesto. Supuesto 1: El modelo de regresión es lineal en los parámetros. = 1 + 2 + Supuesto 2: Los valores de X son fijos en muestreo repetido, es decir se suponen no estocásticos. Valores fijos en muestro repetido hace referencia a que mediante un valor de X se pueden escoger varios valores diferentes de Y en diferente s muestras. Supuesto 3: El valor medio de las perturbaciones es igual a cero. D.P. f(u) +ui -ui FRP Xi Por un lado los valores negativos y positivos de ui se cancelan de tal manera que el efecto sobre el promedio es cero; por otro lado las ui son desviaciones con respecto a la media cuya sumatoria es igual a cero. Yi = β1 + β2 + ui Yi = E(Y/X i ) + ui E Yi = E E(Y/Xi ) + ui E Yi = E E(Y/X i ) + E ui /Xi E Y/X i = E(Y/X i ) + E ui /Xi 17 E ui /Xi = 0 Página Jorge Salgado
  18. 18. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA Supuesto 4: Homocedasticidad3 o igual varianza en las distribuciones de ui. D.P. f(u) 2 2 2 FRP: La homocedasticidad es una característica de las series de tiempo, en donde existen distribuiones varianzas y medias iguales. f(u) D.P. 2 1 2 2 2 3 FRP: 18 Así como la homocedasticidad es la característica de las series de tiempo, la heterocedasticidad es la característica de la información de corte transversal. Página 3 En griego Homo = igual y Cedasticidad = Dispersión Jorge Salgado
  19. 19. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA Nota: La varianza de una variable X: 1 1 = 2 = − 2 2 = − 2 = − = 0 2 = = 2 Supuesto 5: No existe autocorrelación entre las distribuciones de ui. El problema de la autocorrelación está presente en series de tiempo, que en términos generales se manifiesta de dos maneras: = 1 + 2 Xt + ut = −1 f (u) D.P. −1 FRP: −1 , ≠ 0 19 Página Jorge Salgado
  20. 20. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA = 1 + 2 Xt + ut = + 1 −1 f (u) D.P. 1 −1 FRP: −1 , ≠ 0 Nota: 1 Cov X, Y = n 1 = − − n 1 = − − n Cov ui , uj X i Xj 1 = − / − / n 20 Página Jorge Salgado
  21. 21. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA Supuesto 6: La varianza entre la distribución ui y Xi es cero. Las dos distribuciones no están correlacionadas. Si la función de regresión poblacional es = 1 + 2 + y si existiera correlación entre las perturbaciones de ui, y la variable Xi, la Cov(ui, Xi) ≠ 0, entonces Xi = f (ui). La influencia de cada una de las dos sobre Yi, no serían independientes y lo que se requiere es que sean separadas e individuales. , = − − = 0 , = − , = − , = − La expectativa de ui está condicionada. , = − 1 , = = 0 → = Supuesto 7: El número de observaciones n debe ser mayor que el número de variables explicativas. Este supuesto quiere asegurar los suficientes grados de libertad. “En la práctica si solo poseemos diez observaciones no debemos hacer una regresión, los grados de libertad son reducidos, por lo que la hipótesis no pasa y la inferencia poblacional estaría errada.” n - k = Grados de libertad En donde, n es el número de observaciones y k es el número de regresores. Así, lo óptimo es: ≥ El número de observaciones n debe ser mayor que el número de variables explicativas. Este supuesto quiere asegurar los suficientes grados de libertad. Supuesto 8: Variabilidad de los valores de X (Los valores de las variables explicativas tiene que tener diferentes valores). No todos los valores de X en una muestra dada deben ser iguales. Si todos los valores de X son idénticos, = y la varianza sería cero. La varianza de X debe ser un número positivo finito. Por 21 lo tanto, cuando la varianza es igual a cero no existe distribución. Página Jorge Salgado
  22. 22. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA Supuesto 9: El modelo de regresión está correctamente especificado. Una investigación econométrica empieza con la especificación de un modelo de base para explicar el fenómeno de interés. En este proceso surgen dos preguntas esenciales: A) ¿Cuáles son las variables que deben ser incluidas? Las técnicas estadísticas probabilísticas, la teoría económica usada, solventan a este cuestionamiento. B) ¿Cuál es la forma funcional del modelo? A nivel nacional aplicar un modelo puede tener múltiples dificultades, se suelen usar variables proxy. Respecto al primer cuestionamiento se debe seguir alguna teoría que explique el fenómeno económico y aún así, en la práctica el”econometrista” tiene que usar su juicio para escoger cuantas y cuales variables. Con relación al segundo cuestionamiento analizamos a la Curva de Phillips. = 1 + 2 −1 + (Hipérbole) Haríamos mal en proponer un modelo lineal, porque solo hay dos puntos en contacto con la realidad. La hipérbole por el contrario se funde con % Salarios la realidad. = 1 + 2 + % Desempleo 22 Página Jorge Salgado
  23. 23. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA Si proponemos a = 1 + 2 + , una línea recta, apenas coincidirá en dos puntos con las observaciones y será una mala propuesta. Si proponemos a = 1 + 2 −1 + , entonces es una hipérbole, coincidirá con las observaciones y será una buena propuesta. Supuesto 10: No existe multicolinealidad perfecta. Este supuesto está destinado a la regresión múltiple y se discutirá más adelante. Nota: Propiedades de ki: β2 = = = 2 2 β2 es un estimador lineal Yi, es decir un promedio ponderado de Yi en donde ki = son las ponderaciones. 2 1 2 β2 = + 2 + ⋯ + 2 1 2 2 2 1.- = 0 = = =0 2 2 2 2 2.- 2 = 2 = 2 2 2 2 2 1 = = = 2 2 2 2 2 2 3.- = = 1 2 = = =1 2 2 23 − = = = 2 2 − 2 Página Jorge Salgado
  24. 24. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA 2 − 2 − 2 − 2 = = 2 − 2 + 2 2 − 2 + 2 2 − 2 + 2 2 − 2 = =1 2 − 2 Nota: Propiedades del operador varianza: 1.-Var(a) = 0 No existe 2.-Var (aXi)=a2Var(X) 3.-Var ± = 2 () 4.- Var ± = () Cuando las variables son independientes (no correlacionadas) 5.- Var ± ± = + + 6.- Var ± ± = 2 + 2 + 2 Cuando las variables son dependientes (correlacionadas) 7.- Var ± ± = + + ± 2 , ± 2 , ± 2 , 8.- Var ± ± = 2 + 2 + 2 ± 2 , ± 2 , ± 2 , Varianza y errores estándar estimadores de MCO Si en nuestro ejemplo hipotético hay 7,54*1010 muestras quiere decir que se puede obtener 7,54*1010 regresiones o líneas rectas 1 ´ (para hacer cumplir los MCO) y 2 ´, valores con los cuales se pueden obtener dos distribuciones normales. 2 2 = 2 En donde 2 es la varianza homocedástica de las distribuciones de las perturbaciones ui y que se estima 1/2 2 = 2 de la siguiente manera: 2 2 2 2 1 = = 2 − 24 1/2 Donde n es el número de observaciones y k es el 1 = 1 número de regresores. Página Jorge Salgado
  25. 25. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA Recordando de esta manera que (n-k) son los grados de libertad, n es el número total de observaciones y k es el número de restricciones lineales (número de 1 ´ ) para una muestra(n-2). 2 Así, los son denominados suma de residuos cuadrados (SRC). Además, la raíz cuadrada de 2 es el error estándar de la regresión. Por otro lado, en una muestra dada 1 y 2 pueden estar correlacionados entre si: 1 , 2 = − 2 Varianza de : 2 = 2 = = 2 1 = = 2 2 = 2 Reemplazando: 2 2 = 2 Nota: Considerando a = 1 + 2 + 2 = 1 + 2 + 2 = 1 + 2 + = 0 y =1 2 = 2 + 2 − 2 = 2 = 2 + = 2 + =0 2 = 2 25 Se cumple de esta forma la premisa de que el promedio de las muestras es igual al valor Página poblacional. Jorge Salgado
  26. 26. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA Estimados de : = 1 + 2 + __ = 1 + 2 + Suma de cero − = 2 − 2 + − Desviaciones con respecto a la media de las perturbaciones estocásticas. − = 2 − + − = 2 + − Recordando que = 2 + 2 + = 2 + − = − + 2 − 2 = − + (2 − 2 ) 2 2 = − − (2 − 2 ) 2 = − 2 − 2 − 2 − 2 + (2 − 2 )2 2 2 ** = − 2 − 2 − 2 2 − + (2 − 2 )2 2 Con los dos primeros términos: * − = − + 2 2 − = − 2 + 2 Teniendo en cuenta: 1 = = 2 2 − = − 22 + 2 2 2 − = − 2 2 26 2 2 − = − Página Jorge Salgado
  27. 27. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA 2 2 2 − = − 2 − = 2 − 2 = ( − 1) 2 = * − − − = −2 k i ui x i ui − u xi xi = 0 = −2 k i xi u2 i Remplazando en ** 2 = ( − 1) 2 − 2 k i xi u2 + (2 − 2 )2 i 2 2 = ( − 1) 2 − 2 k i xi u2 + (2 − 2 )2 i 2 2 = ( − 1) 2 − 2 k i xi E(u2 ) + (2 − 2 )2 i 2 2 = 2 − 2 − 2 2 + 2 2 = − 2 2 Considerando: 2 = 2 2 = − 2 E σ2 2 σ2 = n−2 27 Covarianza entre y : Página 1 , 2 = 1 − 1 2 − 2 Jorge Salgado
  28. 28. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA 1 , 2 = 1 − 1 2 − 2 = 1 + 2 → 1 = −2 1 = −2 = − 2 1 = − 2 1 , 2 = − 2 − + 2 2 − 2 2 2 = − 2 − 2 = − 2 − 2 = −(2 ) 1 , 2 = −(2 ) Propiedades Estadísticas de los MCO: Son aquellas que adquieren los MCO a raíz de los supuestos del modelo clásico de regresión lineal. 1.- Son lineales con la variable dependiente: 2 = = 2 1 2 2 = 2 + 1 2 + ⋯ + 2 2 2 es lineal con la variable Y, y además es un promedio ponderado de Y, donde ki son las ponderaciones. 2.- Son insesgados: 2 = = 1 + 2 + 2 = 1 + 2 + 2 = 1 + 2 + = 0 = 1 2 = 2 + 2 = 2 + = 2 + = 2 + = 0 = 28 Página Jorge Salgado
  29. 29. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA 3.- Son eficientes, es decir tienen varianza mínima. Es el teorema de Gauss Markov: 2 = ,donde = 2 Definamos un estimador lineal alterno de 2 y veamos si es insesgado. ∗ 2 = Donde son también ponderaciones. ∗ 2 = = ∗ 2 = 1 + 2 ∗ 2 = 1 + 2 ∗ 2 = 1 + 2 ∗ Para que 2 sea insesgado: = 0 = 1 ∗ = En el caso de la varianza: = = 2 ∗ 2 = 2 2 Suponiendo que no son necesariamente iguales a . ∗ 2 = 2 − + 2 ∗ 2 = 2 − + 2 ∗ 2 = 2 − 2 + 2 − + 2 29 ∗ 2 = 2 − 2 +2 − 2 + 2 Página Tomando al término intermedio: Jorge Salgado
  30. 30. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA 2 − 2 = 2 − 2 1 = 2 2− 2 1 1 =2 2 − 2 =0 ∴ ∗ 2 = 2 − 2 + 2 ∗ 2 = 2 − 2 + 2 2 ∗ 2 2 = 2 − 2 + 2 ∗ 2 = 2 − 2 + 2 ∗ De esta manera la única manera en que las dos varianzas sean iguales es que = 30 Página Jorge Salgado
  31. 31. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA El Coeficiente de Determinación: Mide la bondad del ajuste, es decir, que tan bien se ajusta “la recta e regresión a los datos, o también mide el porcentaje de la variación total en Y explicado por el modelo de regresión. 2 = ó 2 = ó Por un lado; = + 2 2 = + 2 = 2 + 2 + 2 2 = 2 + 2 + 2 2 = 2 + 2 ∗ = ∗ + Por otro lado; = + − = − + = + 2 = + 2 = 2 + 2 + 2 = + Recordando 31 = 2 Página = 2 2 2 Jorge Salgado
  32. 32. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA 2 = 2 2 2 = 2 2 2 + 2 − = FRM 2 SEC yi2 Yi − Y r2 = = = STC yi2 Yi − Y 2 = 0 → = 2 = 1 ↔ ≠ 0 → 2 1 ↔ 0 ≤ 2 ≥ 1 Cabe advertir que el grado de ajuste debe ser multiplicado por cien. Recordando: 32 yi2 = β2 2 xi2 y 2 = Página 2 Jorge Salgado
  33. 33. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA 2 2 2 2 = 2 = 2 2 2 2 2 2 2 = 2 = 2 2 2 2 2 2 2 2 2 = 2 = 2 = 2 2 2 De la definición: SEC STC − SRC r2 = = = 1− =1− STC STC 2 Así mismo, la raíz cuadrada del coeficiente de determinación (r2) se denomina Coeficiente de Correlación (r), que mide el grado de asociación entre dos variables. xi yi Cov X, Y r= 2 = Var X Var Y xi2 yi 2 El Coeficiente de Correlación (r) puede ser positivo o negativo dependiendo del signo del numerador que no es más, que la covarianza entre las dos variables, resulta de este modo entre: −1 ≤ ≤ 0 MODELO CLÁSICO DE REGRESIÓN LINEAL NORMAL La teoría clásica de la inferencia estadística consta de dos partes, la estimación y la prueba de hipótesis. La primera se analizó en la sección anterior y la segunda se desarrolla a continuación. Distribución de probabilidades de las perturbaciones ui: Recordando que: 2 = En donde , 1 , 2 son fijas, entonces 2 , es una función lineal de ui, que es una variable aleatoria por hipótesis. Por tanto, se asume que ui sigue un = 1 + 2 + 33 distribución normal. Página 2 = 1 + 2 + Jorge Salgado
  34. 34. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA Supuesto de Normalidad: La regresión lineal clásica supone que cada distribución de las perturbaciones ui, están normalmente distribuidas con: Media: = 0 Varianza: E [ui – E (ui) ]2 = 2 = 2 Cov (ui, uj): E { [ (ui – E (ui)] [uj – E (uj ) ] } = E (ui, uj ) = 0 Propiedades de los estimadores de los Mínimos Cuadrados Ordinarios (MCO) bajo el supuesto de normalidad: 1.-Son lineales con la variable Y. 2.-Son insesgados. 3.-Son eficientes es decir tienen varianza mínima. 4.- Son consistentes a medida que el tamaño de la muestra aumenta, los estimadores convergen hacia sus verdaderos valores poblacionales. 5.- 1 al ser función lineal de ui está normalmente distribuida con: Media: 1 = 1 2 2 1 : 1 = 2 2 2 1 ~ 1 , 1 Valores que luego del proceso de estandarización dan lugar a la obtención de la distribución normal estándar. 1 − 1 1 = 2 1 1 ~(0,1) − Nota: = 2 6.- 2 ~ 2 , 2 34 2 al ser una función lineal de ui, está normalmente distribuido con: Página Media: 2 = 2 Jorge Salgado
  35. 35. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA 2 2 2 : 2 = 2 2 2 ~ 2 , 2 Estandarización: 2 − 2 2 = 2 2 2 ~(0,1) 1 2 1 2 1 2 1 2 −1 0 +1 −1 0 +1 1 = 1 2 = 2 2 7.- − 2 sigue una distribución 2 , n-2 grados de libertad. 2 8.-1 y 2 se distribuyen de manera independiente a 2 . Distribuciones relacionadas con la normal: Teorema 1: Si Z1, Z2,…, Zn son variables aleatorias que están distribuidas normalmente y de manera independiente, tales que ~( , 2 ) entonces la suma = , donde son constantes no todas nulas, está también normalmente distribuida y tiene una media y una varianza 2 2 . ~ , 2 2 Ejemplo: Con la variable peso, los seiscientos alumnos de Economía, los novecientos de Derecho y 35 los quinientos de Ciencias Humanas, se distribuyen: Página ~ 130,10 ~ 138,14 ~ 126,12 = 600 + 900 + 500 = 2000 Jorge Salgado
  36. 36. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA = 0.3 = 0.45 = 0.25 = 0.3 ∗ 130 + 0.45 ∗ 138 + 0.25 ∗ 126 = 132.6 2 = 0.2 2 10 + 0.45 2 14 + 0.25 2 12 = 3.9 ~ 132.6, 3.9 Teorema 2: Si Z1, Z2,…, Zn están normalmente distribuidas, pero no son independientes la suma = , donde son constantes y no todas igual cero, también está normalmente distribuida con una media y una varianza 2 2 + , . ~ , 2 2 + , Ejemplo: Con la variable peso, los seiscientos alumnos de Economía y los novecientos de Derecho: ~ 130,10 ~ 138,14 , = 0.8 = 600 + 900 = 1500 = 0.4 = 0.6 = 0.4 ∗ 130 + 0.6 ∗ 138 = 134.8 2 = 0.4 2 10 + 0.6 2 14 + 2 0.4 0.6 0.8 2 = 7.02 ~ 134.8, 7.02 Teorema 3: Si Z1, Z2,…, Zn son variables aleatorias que están distribuidas de manera normal e independiente de tal manera que cada ~ 0, 1 , es decir son variables estandarizadas, entonces 2 = 1 + 2 + ⋯ + sigue una distribución 2 con n grados de libertad. 2 2 2 Teorema 4: Si Z1, Z2,…, Zn son variables distribuidas independientemente y cada una sigue una distribución 2 con ki grados de libertas (g de l) entonces la suma = 1 + 2 + ⋯ + también sigue una distribución 2 con = grados de libertad. 36 Página Jorge Salgado
  37. 37. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA Teorema 5: Si Z1 es una variable normal estandarizada 1 ~ 0, 1 y otra variable Z2 sigue la distribución 2 con k grados de libertad y es independiente de Z1 entonces se define la distribución t de Student. 1 = 1/2 2 Variable normal estandarizada = 2 1/2 Teorema 6: Si Z1 y Z2 son variables 2 independientemente distribuidas con 1 2 grados de libertad respectivamente. 1/2 1 1 = 1/2 2 2 Donde encontramos a la distribución F con 1 grados de libertad del numerador y 2 grados de libertad del denominador, 1 , 2 . Teorema 7: El cuadrado de la variable t de Student, con k grados de libertad tiene una distribución F con 1 = 1 grados de libertad del numerador y 2 = grados de libertad en el denominador. 1, = 2 Relación que se aplica solamente a una regresión simple, donde se cuenta con una variable explicativa y k observaciones. 37 Página Jorge Salgado

×