Universidade
                                          de Vigo




La no normalidad de las perturbaciones

               ...
Introducción
Concepto, efectos del fallo y propiedades




                             Universidade
                     ...
Normalidad                                                  Universidade
                                                 ...
Comportamiento normal                          Universidade
                                                   de Vigo


 ...
Efectos de la no normalidad                              Universidade
                                                    ...
Causas de la no Normalidad                                     Universidade
                                              ...
Identificación de la Normalidad                                                Universidade
                              ...
Gráficos
Histograma
Gráfico de residuos
Gráfico de probabilidad


                          Universidade
                 ...
Histogramas                                             Universidade
                                                     ...
Calculo de los histogramas en
SHAZAM                                                   Universidade
                      ...
Histograma de residuos   Universidade
                           de Vigo
Grafico de residuos                                                 Universidade
                                         ...
Comportamiento de los residuos bajo
normalidad                                                                            ...
Gráficos de Probabilidad                                      Universidade
                                               ...
Método de construcción (1)
                                                          Universidade
                        ...
Método de construcción (2)
                                                              Universidade
                    ...
Calculo del grafico de normalidad        Universidade
                                           de Vigo



*Guardamos los...
Grafico de normalidad             Universidade
                                    de Vigo




                         Va...
Ejemplos de Gráficos de probabilidad
e interpretación (1)                                    Universidade
                ...
Ejemplos de Gráficos de probabilidad
e interpretación (2)                                       Universidade
             ...
Ejemplos de Gráficos de probabilidad e
interpretación (3)                                       Universidade
             ...
Ejemplos de Gráficos de probabilidad e
interpretación (4)                                              Universidade
      ...
Grafico de probabilidad                                     Universidade
                                                 ...
Grafico de probabilidad en residuos     Universidade
                                                 de Vigo




        ...
Test de hipótesis
Bondad de ajuste
Jarque-Bera




                   Universidade
                     de Vigo
Gráficos y test de hipótesis                                   Universidade
                                              ...
Test de significación                                              Universidade
                                          ...
Test de significación para contrastar
suposiciones del MRLN                                         Universidade
         ...
Modelo de contraste de normalidad                                  Universidade
                                          ...
Resultados del modelo                                       Universidade
                                                 ...
Jarque-
Test de Jarque-Bera                                         Universidade
                                         ...
Hipótesis del Test de simetría                        Universidade
                                                       ...
Estadístico y decisión del Test de
 simetría.                                                           Universidade
     ...
Test de simetría                                         Universidade
                                                    ...
Hipótesis del Test de curtósis                       Universidade
                                                       d...
Estadístico y decisión del Test de
curtósis.
curtósis.                                                                    ...
Test de curtósis                                          Universidade
                                                   ...
Jarque-
Hipótesis del Test de Jarque-Bera                               Universidade
                                     ...
Estadístico y decisión del Test de
 Jarque-
 Jarque-Bera                                                             Unive...
Test de Jarque Bera                             Universidade
                                                         de V...
Test de Bondad de ajuste                                     Universidade
                                                ...
Test de bondad de ajuste (1)                               Universidade
                                                  ...
Test de bondad de ajuste (2)                                          Universidade
                                       ...
Histograma teórico y empírico                  Universidade
                                                 de Vigo




 ...
Telas-
Telas-normalidad                         Universidade
                                           de Vigo



   COEF...
Visión gráfica del test de bondad de
   ajuste                                                                Universidade...
Tratamiento de la normalidad                             Universidade
                                                    ...
Ejemplo: Fabricación de telas                          Universidade
                                                      ...
Telas-
Telas-normalidad                        Universidade
                                          de Vigo




 COEFFIC...
Variables ficticias
Definición
Binomiales
Multinomiales
Regresión con variables
ficticias
Aplicación para solucionar   Uni...
Definición de Variables ficticias                       Universidade
                                                     ...
Variables ficticias dicotómicas                            Universidade
                                                  ...
Ejemplos                             Universidade
                                       de Vigo




 En una encuesta resp...
Variables ficticias multinomiales                         Universidade
                                                   ...
Ejemplo                                            Universidade
                                                     de Vi...
Ejemplo (2)                          Universidade
                                       de Vigo




                1 si...
Variables ficticias multinomiales (2)                    Universidade
                                                    ...
Variables ficticias multinomales (3)        Universidade
                                              de Vigo




 Por co...
Ejemplo (3)                                    Universidade
                                                 de Vigo




 ...
Variables ficticias en la regresión                        Universidade
                                                  ...
Coste de producción en dos sectores                             Universidade
                                             ...
Ejemplos de regresión con variables
dicotómicas                                              Universidade
                ...
Planteamiento de la regresión con
variables dicotómicas                                       Universidade
               ...
Regresión con variables dicotómicas                       Universidade
                                                   ...
Interpretación                                                Universidade
                                               ...
Efecto de las variables dicotómicas
en la regresión                                                 Universidade
         ...
Interpretación                                                Universidade
                                               ...
Construcción de variables ficticias
con el comando GENR                                             Universidade
         ...
Ejemplo de variables ficticias                                            Universidade
                                   ...
Trampa de las variables ficticias                            Universidade
                                                ...
Regresión en XUMA con variables
   ficticias                                                              Universidade
   ...
Efecto en la regresión en XUMA de la
variable ficticia                                                         Universidad...
Grafico de probabilidad   Universidade
                            de Vigo




Ya no hay valores
   atípicos, es
 práctica...
Ejercicio 2.4
                                                                Universidade
                               ...
Upcoming SlideShare
Loading in...5
×

Normalidad

41,922

Published on

Estudia la normalidad de un modelo de regtresion clasico

Published in: Education, Travel, Business
1 Comment
0 Likes
Statistics
Notes
  • Be the first to like this

No Downloads
Views
Total Views
41,922
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
379
Comments
1
Likes
0
Embeds 0
No embeds

No notes for slide

Normalidad

  1. 1. Universidade de Vigo La no normalidad de las perturbaciones Normalidad Curva normal Area
  2. 2. Introducción Concepto, efectos del fallo y propiedades Universidade de Vigo
  3. 3. Normalidad Universidade de Vigo Nos dice si los datos con los que trabajamos siguen leyes de distribución normales o no. Su comprobación es necesaria, para realizar los test de hipótesis exactos y los intervalos de confianza en el MRLC. El comportamiento normal se denomina así porque tiende a ponderar más los valores centrales y menos los extremos, además de ser simétrica. Caracterizada por media y varianza
  4. 4. Comportamiento normal Universidade de Vigo Simetría Curva normal Mucha ponderación en valores centrales Varianza Area Poca ponderación en valores Media externos
  5. 5. Efectos de la no normalidad Universidade de Vigo Si no se verifica la normalidad del modelo, entonces los estimadores MCO dejan de ser MV y por tanto pierden la eficiencia dentro de los estimadores insesgados, sin embargo siguen siendo ELIO. Mantienen la consistencia y la normalidad asintótica, pero también pierden la eficiencia asintótica. Los estimadores MV en general, verificarán mejores propiedades.
  6. 6. Causas de la no Normalidad Universidade de Vigo 1. Existencia de valores atípicos 2. Distribuciones no normales Formas no simétricas, no están centradas en la media: Fallo de la simetría Mayor masa probabilística en el centro que la normal Mayor masa en los extremos que la normal Fallo de la curtósis
  7. 7. Identificación de la Normalidad Universidade de Vigo - Gráficos - Histogramas - Residuos - Gráfico de probabilidad - Test de hipótesis Pretenden comprobar la distribución normal de las perturbaciones a partir de alguna regla de decisión estadística. Bondad de ajuste, compara la distribución teórica con la empírica, pero se aplica a intervalos. Jarque-Bera, que estudia la simetría y curtósis de la densidad empírica. Ejercicio 2.1
  8. 8. Gráficos Histograma Gráfico de residuos Gráfico de probabilidad Universidade de Vigo
  9. 9. Histogramas Universidade de Vigo Representa el comportamiento de la función de densidad empírica, estimada a partir del porcentaje de valores por tamaño del intervalo. Teóricamente debería aproximarse a una distribución normal por lo que la forma que debería presentar sería simétrica y sin exceso de curtósis, por ese motivo algunos programas representan el histograma superpuesto por una curva normal. Eso no ocurre en SHAZAM.
  10. 10. Calculo de los histogramas en SHAZAM Universidade de Vigo En SHAZAM se obtiene con el comando PLOT o GRAPH y la opción HISTO PLOT E/HISTO SHAZAM calcula por defecto 6 grupos para el histograma. Si se quieren indicar un número de grupos diferente se debe usar la opción GROUPS=r, siendo r el numero de grupos, siempre menso de 60 PLOT E/HISTO GROUPS=10
  11. 11. Histograma de residuos Universidade de Vigo
  12. 12. Grafico de residuos Universidade de Vigo Representan los residuos respecto a alguna variable. Para detectar la normalidad sirve cualquiera y por consiguiente, normalmente se utilizan los valores predichos. Debería encontrarse el grafico de forma simétrica y mas concentrado en los valores cercanos al 0, y algo disperso en los valores alejados. Los valores muy alejados seguramente son atípicos. En SHAZAM se hace directamente con el comando PLOT o GRAPH teniendo guardados los residuos y la variable respecto a la que se quieren representar
  13. 13. Comportamiento de los residuos bajo normalidad Universidade de Vigo 2.11 * * Valores extraños al 95% de confianza * 1.27 * Bandas al 95% de confianza * * R e * * s * i * * .42 * * d * * * u * * * * * Valores predichos * * * o * * * s .30 * ** 1.35 * 2.40 3.45 4.50 * 5.56 * * * * ** * -.42 * * ** ** * * * * ** * * * * * * -1.27 Valores mas concentrados Valores mas dispersos
  14. 14. Gráficos de Probabilidad Universidade de Vigo 2 Consiste en representar los residuos observados respecto 1 a lo que se esperaría si siguieran una ley normal. EXPECTED VALUE 0 El alejamiento de la diagonal, que seria cuando es -1 -2 -2 -1 0 1 2 3 una ley normal perfecta, R E ST U DE N indica las diferencias con la normalidad
  15. 15. Método de construcción (1) Universidade de Vigo 1. Se calculan los residuos estudentizados o estandarizados. 2. Se ordenan de menor a mayor. De esta forma cada valor corresponderá al correspondiente cuantil de orden t/T. 3. Se calcula el valor crítico que corresponde en la N(0,1) a cada cuantil de orden t/T, se corrige tomando  t −3/8  −1 at = φ    T +1/ 4 
  16. 16. Método de construcción (2) Universidade de Vigo 4. Se representan gráficamente los residuos estudentizados respecto a at. Si hay normalidad debe ser una diagonal. 5. A modo de comprobación se construye el coeficiente de correlación al cuadrado que nos da idea de la normalidad aproximada del grado de ajuste a la normalidad.
  17. 17. Calculo del grafico de normalidad Universidade de Vigo *Guardamos los residuos, el tamaño muestral y la varianza residual ?OLS Y X1 X2/RESID=E GEN1 N=$N GEN1 S2=$SIG2 *Calculamos los residuos estandarizados y los ordenamos en orden decreciente GENR ESTAND=E/SQRT(S2*(1-HT)) SORT ESTAND/ DESC *Calculamos los cuartiles corregidos, generando una variable que mide el caso GENR T=TIME(0) GENR CT=(T-3/8)/(N+1/4) *Calculamos los valores de la normal, que nos indican el residuo esperado bajo normalidad DISTRIB CT/INVERSE CRITICAL=AT GRAPH ESTAND AT
  18. 18. Grafico de normalidad Universidade de Vigo Valor atípico
  19. 19. Ejemplos de Gráficos de probabilidad e interpretación (1) Universidade de Vigo Gráfico de Probabilidad Gráfico de densidad ⇒ Asimetría por la izquierda
  20. 20. Ejemplos de Gráficos de probabilidad e interpretación (2) Universidade de Vigo Gráfico de Probab ilidad Gráfico d e D ensid ad ⇒ Asimetría a la derecha
  21. 21. Ejemplos de Gráficos de probabilidad e interpretación (3) Universidade de Vigo Gráfico dedensidad G ráf ico de Probabilid ad ⇒ Las colas de probabilidad son más quot;pesadasquot; de lo normal, curtósis baja
  22. 22. Ejemplos de Gráficos de probabilidad e interpretación (4) Universidade de Vigo G ráf i co d e P ro b ab i l i d ad GráficodeDensidad ⇒ Las colas de probabilidad son menos quot;pesadasquot; de lo normal, excesiva curtósis
  23. 23. Grafico de probabilidad Universidade de Vigo Representa los cuantiles estandarizados de la variable respecto a los cuantiles teóricos de la normal. Debería mostrar una diagonal, es decir una línea recta de pendiente 1, puesto que indica que lo empírico coincide con lo esperado, o sea, la normal.
  24. 24. Grafico de probabilidad en residuos Universidade de Vigo Valor esperado si fuera exactamente normal Ejercicio 2.2
  25. 25. Test de hipótesis Bondad de ajuste Jarque-Bera Universidade de Vigo
  26. 26. Gráficos y test de hipótesis Universidade de Vigo Los gráficos nos dan una idea de los posibles fallos, pero para contrastarlos debemos utilizar los test de hipótesis. Vamos a recordar algunas ideas de los test de hipótesis para contrastar suposiciones. Haremos uso de dos test: Paramétrico: test de Jarque-Bera No paramétrico: Test de Bondad de ajuste.
  27. 27. Test de significación Universidade de Vigo En todos los test de significación se tienen en cuenta los siguientes aspectos: 1. Definir modelo de análisis e indicar suposiciones del test 2. Definir hipótesis nula y alternativa 3. Fijar el nivel de significación 4. Estadístico de la prueba 5. Ley de distribución del estadístico 6. Regla de decisión
  28. 28. Test de significación para contrastar suposiciones del MRLN Universidade de Vigo Cuando se quieren contrastar las suposiciones del MRLN, siempre se parte del modelo, con alguna generalización, es decir se suponen validas todas las suposiciones excepto la que se quiere contrastar. En el caso de la normalidad se suponen todas menos la normalidad de las perturbaciones.
  29. 29. Modelo de contraste de normalidad Universidade de Vigo Yt ε t = yt − E ( X1t ... X kt ) = yt − ( β0 + β1 X1t + ... + β k X kt ) Donde: ε son independientes e igualmente distribuidas y no dependen de las X (Independencia, homocedasticidad y exogeneidad), β son estables y estimables (Estabilidad e identificabilidad) X no están relacionadas entre sí y vienen dadas sin error (no colinealidad y mensurabilidad)
  30. 30. Resultados del modelo Universidade de Vigo Esas suposiciones nos permiten: Estimar las perturbaciones a partir de los errores de MCO. Suponer que los residuos son aproximadamente independientes e igualmente distribuidos con leyes de media 0 y varianza constante, lo que nos permite comparar la distribución empírica con una normal teórica. Eso es el test de bondad de ajuste. Calcular el coeficiente de asimetría y curtósis de los residuos como si estos provinieran de la misma población. Eso en esencia es el test de Jarque-Bera.
  31. 31. Jarque- Test de Jarque-Bera Universidade de Vigo Contrastamos la asimetría y el exceso de curtósis, que bajo normalidad deberían de ser ambos 0. Analiza por consiguiente si la distribución falla en alguna de las características básicas de la normal, si es simétrica o si tiene diferente peso los valores centrales respecto a los extremos de la normal. Se suele hacer una comparación de cada uno de ellos independientemente y otro test conjunto.
  32. 32. Hipótesis del Test de simetría Universidade de Vigo El test de simetría se realiza para contrastar: H0: γ1=0, lo que significa simetría exacta H1: γ1≠0, lo que significa que existe asimetría Donde n ∑ε 3 i γ1 = i =1 σR 3 La consecuencia es que si existe asimetría falla la normalidad
  33. 33. Estadístico y decisión del Test de simetría. Universidade de Vigo Contrastamos si existe simetría o no El estadístico γˆ 1 t = 1 6 n sigue una ley AN(0,1) bajo la hipótesis nula, es decir cuando se supone normalidad, siendo n ∑ ei3 γˆ1 = i =1 3 SR Se rechaza si t > λ donde λα/2 es el valor crítico de la normal 1 α /2 tipificada
  34. 34. Test de simetría Universidade de Vigo Forma teórica de la Asimetría positiva normal casi nula: mediana menor que la media COEFFICIENT OF SKEWNESS = 0.2031 WITH STANDARD DEVIATION OF 0.3738 |_gen1 t1=0.2031/0.3738 |_distrib t1 NORMAL DISTRIBUTION - MEAN= 0.0000 VARIANCE= 1.0000 DATA Z PDF CDF 1-CDF T1 0.54334 0.34419 0.70655 0.29345 Forma teórica de la distribución empírica
  35. 35. Hipótesis del Test de curtósis Universidade de Vigo El test de curtósis se realiza para contrastar: H0: γ2=0, lo que significa curtósis exacta H1: γ2≠0, lo que significa que existe curtósis Donde n ∑ ε4 i γ2 = i =1 −3 σ 4 R La consecuencia es que si existe curtósis falla la normalidad
  36. 36. Estadístico y decisión del Test de curtósis. curtósis. Universidade de Vigo Contrastamos si existe exceso de curtósis o no El estadístico γˆ 2 t2 = 24 n sigue una ley AN(0,1) bajo la hipótesis nula, es decir cuando se supone normalidad, siendo n ∑e 4 i γˆ2 = i =1 4 −3 SR Se rechaza si t2 > λα / 2 donde λα/2 es el valor crítico de la normal tipificada
  37. 37. Test de curtósis Universidade de Vigo Forma teórica de la normal COEFFICIENT OF EXCESS KURTOSIS = -0.8323 WITH STANDARD DEVIATION OF 0.7326 |_gen1 t2=-0.8323/0.7326 |_distrib t2 NORMAL DISTRIBUTION - MEAN= 0.0000 VARIANCE= 1.0000 DATA Z PDF CDF 1-CDF T2 -1.1361 0.20924 0.12796 0.87204 Curtósis negativa casi nula : menos apuntamiento que Forma teórica de la la normal distribución empírica
  38. 38. Jarque- Hipótesis del Test de Jarque-Bera Universidade de Vigo El test de Jarque-Bera se realiza para contrastar: H0: γ1= γ2=0, lo que significa simetría y curtósis exactas H1: γ1≠0 ο γ2≠0 lo que significa que existe curtósis o asimetría Donde los coeficientes han sido calculados como en los test anteriores. La consecuencia es que si existe asimetría o curtósis falla la normalidad. Al contrastarlo conjuntamente exige un fallo mayor de alguna de ellas o de ambas para rechazarse.
  39. 39. Estadístico y decisión del Test de Jarque- Jarque-Bera Universidade de Vigo Contrastamos conjuntamente la asimetría y el exceso de curtósis El estadístico  γˆ12 γˆ 22  JB = t12 + t2 = T  +  2  6 24    sigue una ley asintótica ji cuadrado con 2 grados de libertad bajo la hipótesis nula, puesto que ambos estadísticos t eran normales tipificadas. Se rechaza si JB > χ 2,α donde χ2,α es el valor crítico de una chi cuadrado con 2 grados e libertad
  40. 40. Test de Jarque Bera Universidade de Vigo Forma teórica de la Asimetría negativa: Asimetría positiva normal mediana mayor que casi nula: mediana menor que la media la media JARQUE-BERA NORMALITY TEST- CHI-SQUARE(2 DF)= 1.5400 P-VALUE= 0.463 Curtósis negativa : mas apuntamiento Forma teórica de la que la normal distribución empírica
  41. 41. Test de Bondad de ajuste Universidade de Vigo Compara la distribución teórica con la empírica. Analiza las funciones de densidad, es decir hace uso de los histograma y la función de densidad gaussiana. Para ello hace uso de intervalos.
  42. 42. Test de bondad de ajuste (1) Universidade de Vigo 1. Calcular los valores observados dentro de cada subconjunto Sj, j=1,...k., que denominaremos OBSj. 2. Calcular la probabilidad teórica de que la variable tome algún valor en el subconjunto Sj suponiendo una normal con los parámetros estimados por MV. Denominamos al valor esperado ESPj, que será igual al número total de valores por la probabilidad de que un valor pertenezca a ese subconjunto
  43. 43. Test de bondad de ajuste (2) Universidade de Vigo 3. Calculamos una distancia de tipo ji cuadrado entre esos valores, que,como los observados siguen una B(n,pj), cada término es aproximadamente N(0,1), pero no son independientes, ya que existen dos tipos de relaciones, debido al número de intervalos y a las estimaciones, en total, 3 restricciones, seguirá una ji cuadrado con k-3 grados de libertad. 4. Comparar el estadístico con el valor de las tablas y se rechaza si dicho valor es mayor, porque indica que se ajusta poco a la distribución normal.
  44. 44. Histograma teórico y empírico Universidade de Vigo Diferencias positivas Función de distribución teórica Función de distribución empírica Diferencias negativas
  45. 45. Telas- Telas-normalidad Universidade de Vigo COEFFICIENT OF SKEWNESS = 0.2031 WITH STANDARD DEVIATION OF 0.3738 COEFFICIENT OF EXCESS KURTOSIS = - 0.8323 WITH STANDARD DEVIATION OF 0.7326 JARQUE-BERA NORMALITY TEST- CHI-SQUARE(2 DF)= 1.5400 P-VALUE= 0.463 GOODNESS OF FIT TEST FOR NORMALITY OF RESIDUALS - 6 GROUPS OBSERVED 0.0 8.0 10.0 15.0 7.0 0.0 EXPECTED 0.9 5.4 13.7 13.7 5.4 0.9 CHI-SQUARE = 4.5934 WITH 1 DEGREES OF FREEDOM, P-VALUE= 0.032
  46. 46. Visión gráfica del test de bondad de ajuste Universidade de Vigo Función de distribución teórica Función de distribución Valor empírica observado= 0 Estadístico X2=Suma=4,59 Valor (OBS-ESP)2/ESP= 1.11 esperado= 0,9 (OBS-ESP)2/ESP= 0.47 OBS-ESP= -0,9 (OBS-ESP)2/ESP= 2.27 (OBS-ESP)2/ESP=0.12 (OBS-ESP)2/ESP= 1.11 (OBS-ESP)2/ESP= 1
  47. 47. Tratamiento de la normalidad Universidade de Vigo 1.Si la distribución es conocida, aunque no sea normal, se aplica estimación MV. 2.Si la distribución es desconocida, se puede utilizar: a. Transformaciones buscando normalidad. b. Regresión robusta. 3.Si la no normalidad es debida a valores atípicos a. Se utilizan variables ficticias. b. Se eliminan si hay suficientes datos.
  48. 48. Ejemplo: Fabricación de telas Universidade de Vigo El coste de fabricación de algodón en una empresa de hilaturas depende de la cantidad de tejido producido y del precio de la mano de obra que trabaja subcontratada. los datos de los últimos 40 meses se recoge en la tabla siguiente. Interesa comprobar si el comportamiento de los costes de la fabricación entre unos años y otros es normal.
  49. 49. Telas- Telas-normalidad Universidade de Vigo COEFFICIENT OF SKEWNESS = 0.2031 WITH STANDARD DEVIATION OF 0.3738 COEFFICIENT OF EXCESS KURTOSIS = -0.8323 WITH STANDARD DEVIATION OF 0.7326 JARQUE-BERA NORMALITY TEST- CHI-SQUARE(2 DF)= 1.5400 P-VALUE= 0.463 Ejercicio 2.3
  50. 50. Variables ficticias Definición Binomiales Multinomiales Regresión con variables ficticias Aplicación para solucionar Universidade de Vigo la normalidad
  51. 51. Definición de Variables ficticias Universidade de Vigo Son variables que caracterizan comportamientos cualitativos de forma que indican si una determinada observación verifica o no una propiedad prefijada También se les denomina variables indicador de la propiedad o característica Generalmente se definen como variables dicotómicas, pero también pueden definirse para variables multinomiales
  52. 52. Variables ficticias dicotómicas Universidade de Vigo Supongamos que tenemos una variable cualitativa dicotómica C, es decir, que se verifica una determinada propiedad o no, que tienen una cualidad o no, etc..., por tanto únicamente puede tomar dos valores A y B. Se define la variable ficticia dicotómica como De esta forma se 1 si C = A cuantifica el efecto de IA =  la variable 0 si C = B dicotómica, vale 1 si la cualidad se verifica y 0 si no. 19/01/2009
  53. 53. Ejemplos Universidade de Vigo En una encuesta responder si o no Ser valor atípico o no serlo Saber informática o no Tener un sexo u otro Ser conductor o no Ser directivo o no .........
  54. 54. Variables ficticias multinomiales Universidade de Vigo Supongamos que tenemos una variable cualitativa multinomial C, es decir, que puede tomar mas de dos valores C1, ...., Cm Se define una variable ficticia dicotómica para cada uno de los posibles valores. 1 si Ct = c j j=1,...m I jt =  0 si Ct ≠ c j t=1,…T
  55. 55. Ejemplo Universidade de Vigo Supongamos que queremos estudiar la estacionalidad de las ventas de un producto. La variable estación toma cuatro valores: Primavera, verano, otoño e invierno. Definimos dichas opciones como: C1= Ventas de primavera C2= Ventas de verano C3= Ventas de otoño C4= Ventas de invierno Por lo tanto definiremos cuatro variables ficticias: Una hace relación a la primavera Otra al verano Otra al otoño Y la última, al invierno
  56. 56. Ejemplo (2) Universidade de Vigo 1 si ventas ∈ C 1 Prim avera =   0 si no 1 si ventas ∈ C 2 V erano =   0 si no 1 si ventas ∈ C 3 O toño =   0 si no 1 si ventas ∈ C 4 Invierno =   0 si no
  57. 57. Variables ficticias multinomiales (2) Universidade de Vigo Por consiguiente tendremos m variables ficticias, pero todas ellas van a verificar una restricción: la suma de todas las variables siempre vale 1, ya que siempre ocurre uno de los posibles casos. Por consiguiente una se puede poner en función del resto, lo que implica que bastaría definir m-1 variables
  58. 58. Variables ficticias multinomales (3) Universidade de Vigo Por consiguiente tendríamos 1 si Ct = c j j=1,...m-1 I jt =  0 si Ct ≠ c j t=1,…T
  59. 59. Ejemplo (3) Universidade de Vigo En el caso de las estaciones 1 si ventas ∈ C1 tendríamos sólo Primavera =  tres, pues el 0 si no invierno sería 1 1 si ventas ∈C2 menos la suma de Verano =  las otras tres. 0 si no 1 si ventas ∈ C3 Otoño =  0 si no Invierno= 1-Primavera-Verano-Otoño
  60. 60. Variables ficticias en la regresión Universidade de Vigo Al incluirlas en una regresión lo hacen como cualquier otra variable, con la diferencia de que el coeficiente nos mide el cambio que se produce por estar en esa categoría en vez de en otra Ejemplo considerar el coste de producir una pieza en dos sectores diferentes A y B
  61. 61. Coste de producción en dos sectores Universidade de Vigo El hecho de incluir o no la variable ficticia cambia los parámetros de la regresión Regresión para cada sector Sector A Sector B Conjunta sin dividir en sectores Vamos a intentar formalizarlo
  62. 62. Ejemplos de regresión con variables dicotómicas Universidade de Vigo El caso más habitual es cuando se responde a preguntas sobre gustos, actitudes, etc., únicamente de la forma si o no, sin respuestas intermedias. También se usa para medir efectos de cambios en el tiempo por legislaciones o efectos puntuales debidos a un sólo valor o a un conjunto de valores. Este será el caso que nos interese para resolver los problemas que se plantean con los valores atípicos, pero previamente veamos como se introducen estas variables en las ecuaciones de regresión y que efectos pueden producir.
  63. 63. Planteamiento de la regresión con variables dicotómicas Universidade de Vigo Supongamos que tenemos una variable cualquiera C que únicamente puede tomar dos valores A y B de forma que ambos son excluyentes y exhaustivos. Entones la variable ficticia se define como 1 si C = A IA =  0 si C = B
  64. 64. Regresión con variables dicotómicas Universidade de Vigo En el caso mas simple, se introduciría en el modelo de regresión como una variable cualquiera Modelo sin variable ficticia y = β0 + β1 X 1 +⋯+ βk X k + ε Modelo con variable ficticia y = β0 + β1 X 1 +⋯+ βk X k + αI A + ε Efecto de la variable ficticia
  65. 65. Interpretación Universidade de Vigo Las pendientes se interpretan igual, pero ahora sería el efecto independientemente del sector La constante β0 sería el coste fijo en el sector B La suma de β0 y α sería el coste fijo en el sector A Por tanto α mide la diferencia entre los costes fijos.
  66. 66. Efecto de las variables dicotómicas en la regresión Universidade de Vigo Partiendo del modelo sin variable ficticia se puede medir el impacto de esta sobre cada uno de los coeficientes de la regresión cuando se sospecha que cada uno de los grupos tiene una relación diferente totalmente. En ese caso se definen una serie de variables auxiliares que miden el impacto sobre la pendiente  X j si t ∈ A IX j =  j = 1...k 0 si t ∉ A Con esas variable el modelo quedaría: Efecto de la variable ficticia sobre la y = β 0 + β1 X 1 + ⋯ + β X k + pendiente de Xk +α 0 I A + α1 IX 1 + ⋯ + α k IX k + ε
  67. 67. Interpretación Universidade de Vigo Las pendientes se interpretan igual, pero ahora sería el efecto independientemente del sector La constante β0 sería el efecto fijo en el sector B La suma de β0 y α0 sería el efecto fijo en el sector A Por tanto α0 mide la diferencia entre los efectos fijos Cada una de las pendientes βj sería el impacto de Xj sobre Y en el sector B La suma de βj y αj nos mediría el impacto de Xj sobre Y en el sector A Por tanto cada uno de los αj nos mide la diferencia entre los impactos en los sectores A y B.
  68. 68. Construcción de variables ficticias con el comando GENR Universidade de Vigo Funciones lógicas: se definen mediante relaciones y en función de los operadores lógicos Relaciones: Igual →.EQ., Distinto →.NE., Mayor o igual →.GE., Mayor estricto →.GT., Menor o igual →.LE., Menor estricto →.LT. Operadores lógicos .NOT., → Negación .AND., → Intersección .OR. → unión Se colocan siempre entre paréntesis.
  69. 69. Ejemplo de variables ficticias Universidade de Vigo La utilización de variables ficticias (variables dicotómicas o variables dummy) en un modelo econométrico permite la inclusión de aspectos cualitativos en el modelo. En este caso, vamos a dividir las familias de la muestra en tres grupos, de acuerdo con su tamaño familiar: Grupo 1: familias de tamaño pequeño (de 1 a 3 componentes). Grupo 2: familias de tamaño medio (de 4 a 6 componentes). Grupo3: familias de tamaño grande (a partir de 7 componentes). Sea X3 la variable que mide el tamaño de las familias, entonces tendríamos una variable para cada grupo GENR D1=(X3.LE.3) Nos indica si una familia GENR D2=(X3.GT.3).AND.(X3.LE.6) pertenece al grupo de tamaño pequeño o no. GENR D3=(X3.GE.7)
  70. 70. Trampa de las variables ficticias Universidade de Vigo A la hora de incluir variables ficticias en el modelo debemos ser cautelosos puesto que podemos provocar un problema de multicolinealidad perfecta, es decir, podemos caer en la denominada “trampa de las variables ficticias”.
  71. 71. Regresión en XUMA con variables ficticias Universidade de Vigo |_GENR T=TIME(0) |_GENR D12=(T.EQ.12) |_OLS Y X1 X2 D12/RESID=E INFLUENCE HATDIAG=HT REQUIRED MEMORY IS PAR= 3 CURRENT PAR= 2000 OLS ESTIMATION 20 OBSERVATIONS DEPENDENT VARIABLE= Y ...NOTE..SAMPLE RANGE SET TO: 1, 20 R-SQUARE = 0.9855 R-SQUARE ADJUSTED = 0.9828 VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.30698E-01 STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.17521 SUM OF SQUARED ERRORS-SSE= 0.49117 MEAN OF DEPENDENT VARIABLE = 13.708 LOG OF THE LIKELIHOOD FUNCTION = 8.68826 VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY NAME COEFFICIENT ERROR 16 DF P-VALUE CORR. COEFFICIENT AT MEANS X1 0.48369 0.1711E-01 28.27 0.000 0.990 0.9224 0.2085 X2 0.57535E-01 0.1477E-01 3.896 0.001 0.698 0.1183 0.0285 D12 0.88083 0.1956 4.504 0.000 0.748 0.1476 0.0032 CONSTANT 10.415 0.1499 69.47 0.000 0.998 0.0000 0.7598
  72. 72. Efecto en la regresión en XUMA de la variable ficticia Universidade de Vigo RESIDUAL RSTUDENT HT COVRAT DFFITS DFFIT 1 -0.31969 -2.0908 0.0779 0.5047 -0.6077 -0.27007E-01 2 -0.10402 -0.6500 0.1960 1.4407 -0.3209 -0.25351E-01 3 0.26206 1.7350 0.1635 0.7446 0.7671 0.51219E-01 4 -0.27322E-01 -0.1673 0.1835 1.5737 -0.0793 -0.61407E-02 5 0.26840 1.7640 0.1463 0.7134 0.7302 0.45991E-01 6 -0.94858E-01 -0.5485 0.0682 1.2832 -0.1483 -0.69375E-02 7 0.17410 1.0880 0.1563 1.1323 0.4683 0.32256E-01 8 0.88418E-01 0.5119 0.0729 1.3029 0.1435 0.69511E-02 9 -0.16736 -1.0261 0.1305 1.1350 -0.3975 -0.25115E-01 10 -0.85826E-01 -0.5376 0.2066 1.5117 -0.2743 -0.22345E-01 11 0.18209 1.1141 0.1167 1.0664 0.4050 0.24063E-01 12 0.64435E-14 0.0000 1.0000********* 106.9110 19.346 13 0.10515 0.7446 0.3683 1.7725 0.5686 0.61319E-01 14 -0.23246 -1.4430 0.0974 0.8528 -0.4741 -0.25090E-01 15 -0.17150 -1.0457 0.1187 1.1085 -0.3837 -0.23095E-01 16 0.12570 0.8123 0.2365 1.4273 0.4521 0.38932E-01 17 -0.30907E-01 -0.1989 0.2605 1.7322 -0.1180 -0.10887E-01 atípico aparece El valor 18 -0.19273E-01 -0.1146 0.1353 1.4918 -0.0453 -0.30148E-02 19 -0.40684E-01 -0.2437 0.1456 ahora como muy influyente, 1.4915 -0.1006 -0.69358E-02 20 0.87971E-01 0.5228 0.1194 1.3676 pero no atípico 0.1925 0.11927E-01 SUM-OF-SQUARED PREDICTION ERRORS SSPE,PRESS,CV= 374.93 SCHMIDT(1974) SUM OF SQUARES OF STANDARDIZED PREDICTION ERRORS= 0.56862 STONE(1974) CROSS-VALIDATION= 0.36193E-01
  73. 73. Grafico de probabilidad Universidade de Vigo Ya no hay valores atípicos, es prácticamente normal
  74. 74. Ejercicio 2.4 Universidade de Vigo Curva normal Cola de probabilidad Nivel de significación Area Valor crítico Valor muestral del estadístico
  1. ¿Le ha llamado la atención una diapositiva en particular?

    Recortar diapositivas es una manera útil de recopilar información importante para consultarla más tarde.

×