Normalidad

Universidade
de Vigo

La no normalidad de las perturbaciones

Normalidad
Curva
normal

Area

Introducción
Concepto, efectos del fallo y propiedades

Universidade
de Vigo

Normalidad Universidade
de Vigo

Nos dice si los datos con los que trabajamos siguen leyes
de distribución normales o no. Su comprobación es
necesaria, para realizar los test de hipótesis exactos y los
intervalos de confianza en el MRLC.
El comportamiento normal se denomina así porque
tiende a ponderar más los valores centrales y menos los
extremos, además de ser simétrica.
Caracterizada por media y varianza

Comportamiento normal Universidade
de Vigo

Simetría
Curva
normal
Mucha
ponderación en
valores centrales
Varianza

Area

Poca ponderación
en valores Media
externos

Efectos de la no normalidad Universidade
de Vigo

Si no se verifica la normalidad del modelo, entonces los
estimadores MCO dejan de ser MV y por tanto pierden
la eficiencia dentro de los estimadores insesgados, sin
embargo siguen siendo ELIO.
Mantienen la consistencia y la normalidad asintótica,
pero también pierden la eficiencia asintótica.
Los estimadores MV en general, verificarán mejores
propiedades.

Causas de la no Normalidad Universidade
de Vigo

1. Existencia de valores atípicos
2. Distribuciones no normales
Formas no simétricas, no están centradas en la media:
Fallo de la simetría
Mayor masa probabilística en el centro que la normal
Mayor masa en los extremos que la normal
Fallo de la curtósis

Identificación de la Normalidad Universidade
de Vigo

- Gráficos
- Histogramas
- Residuos
- Gráfico de probabilidad
- Test de hipótesis
Pretenden comprobar la distribución normal de las
perturbaciones a partir de alguna regla de decisión estadística.
Bondad de ajuste, compara la distribución teórica con la empírica, pero se
aplica a intervalos.
Jarque-Bera, que estudia la simetría y curtósis de la densidad empírica.

Ejercicio 2.1

Gráficos
Histograma
Gráfico de residuos
Gráfico de probabilidad

Universidade
de Vigo

Histogramas Universidade
de Vigo

Representa el comportamiento de la función de densidad
empírica, estimada a partir del porcentaje de valores por
tamaño del intervalo.
Teóricamente debería aproximarse a una distribución
normal por lo que la forma que debería presentar sería
simétrica y sin exceso de curtósis, por ese motivo
algunos programas representan el histograma
superpuesto por una curva normal. Eso no ocurre en
SHAZAM.

Calculo de los histogramas en
SHAZAM Universidade
de Vigo

En SHAZAM se obtiene con el comando PLOT o
GRAPH y la opción HISTO
PLOT E/HISTO
SHAZAM calcula por defecto 6 grupos para el histograma. Si
se quieren indicar un número de grupos diferente se debe
usar la opción GROUPS=r, siendo r el numero de grupos,
siempre menso de 60
PLOT E/HISTO GROUPS=10

Histograma de residuos Universidade
de Vigo

Grafico de residuos Universidade
de Vigo

Representan los residuos respecto a alguna variable.
Para detectar la normalidad sirve cualquiera y por consiguiente,
normalmente se utilizan los valores predichos.
Debería encontrarse el grafico de forma simétrica y mas concentrado
en los valores cercanos al 0, y algo disperso en los valores alejados.
Los valores muy alejados seguramente son atípicos.
En SHAZAM se hace directamente con el comando PLOT o
GRAPH teniendo guardados los residuos y la variable respecto a la
que se quieren representar

Comportamiento de los residuos bajo
normalidad Universidade
de Vigo

2.11 *

*
Valores extraños al 95% de confianza

*
1.27 * Bandas al 95% de confianza
* *
R
e * *
s *
i * *
.42 * *
d *
* *
u * * * *
*
Valores predichos
* * *
o * *
*
s .30
* **
1.35 * 2.40 3.45 4.50 * 5.56
* * * *
** *
-.42 * *
** ** *
*
* * ** *
*
* *
*
*

-1.27 Valores mas
concentrados Valores mas
dispersos

Gráficos de Probabilidad Universidade
de Vigo

2
Consiste en representar los
residuos observados respecto
1
a lo que se esperaría si
siguieran una ley normal.
EXPECTED VALUE

0

El alejamiento de la
diagonal, que seria cuando es
-1

-2
-2 -1 0 1 2 3
una ley normal perfecta,
R E ST U DE N indica las diferencias con la
normalidad

Método de construcción (1)
Universidade
de Vigo

1. Se calculan los residuos estudentizados o estandarizados.
2. Se ordenan de menor a mayor. De esta forma cada valor
corresponderá al correspondiente cuantil de orden t/T.
3. Se calcula el valor crítico que corresponde en la N(0,1) a cada
cuantil de orden t/T, se corrige tomando

 t −3/8 
−1
at = φ  
 T +1/ 4 

Método de construcción (2)
Universidade
de Vigo

4. Se representan gráficamente los residuos estudentizados
respecto a at. Si hay normalidad debe ser una diagonal.
5. A modo de comprobación se construye el coeficiente de
correlación al cuadrado que nos da idea de la normalidad
aproximada del grado de ajuste a la normalidad.

Calculo del grafico de normalidad Universidade
de Vigo

*Guardamos los residuos, el tamaño muestral y
la varianza residual
?OLS Y X1 X2/RESID=E
GEN1 N=$N
GEN1 S2=$SIG2
*Calculamos los residuos estandarizados y los
ordenamos en orden decreciente
GENR ESTAND=E/SQRT(S2*(1-HT))
SORT ESTAND/ DESC
*Calculamos los cuartiles corregidos, generando
una variable que mide el caso
GENR T=TIME(0)
GENR CT=(T-3/8)/(N+1/4)
*Calculamos los valores de la normal, que nos
indican el residuo esperado bajo normalidad
DISTRIB CT/INVERSE CRITICAL=AT
GRAPH ESTAND AT

Grafico de normalidad Universidade
de Vigo

Valor
atípico

Ejemplos de Gráficos de probabilidad
e interpretación (1) Universidade
de Vigo

Gráfico de Probabilidad
Gráfico de densidad

⇒

Asimetría por la izquierda

Ejemplos de Gráficos de probabilidad
e interpretación (2) Universidade
de Vigo

Gráfico de Probab ilidad Gráfico d e D ensid ad

⇒

Asimetría a la derecha

Ejemplos de Gráficos de probabilidad e
interpretación (3) Universidade
de Vigo

Gráfico dedensidad
G ráf ico de Probabilid ad

⇒

Las colas de probabilidad son más quot;pesadasquot;
de lo normal, curtósis baja

Ejemplos de Gráficos de probabilidad e
interpretación (4) Universidade
de Vigo

G ráf i co d e P ro b ab i l i d ad GráficodeDensidad

⇒

Las colas de probabilidad son menos
quot;pesadasquot; de lo normal, excesiva curtósis

Grafico de probabilidad Universidade
de Vigo

Representa los cuantiles estandarizados de la variable
respecto a los cuantiles teóricos de la normal.
Debería mostrar una diagonal, es decir una línea recta de
pendiente 1, puesto que indica que lo empírico coincide
con lo esperado, o sea, la normal.

Grafico de probabilidad en residuos Universidade
de Vigo

Valor esperado si
fuera exactamente
normal

Ejercicio 2.2

Test de hipótesis
Bondad de ajuste
Jarque-Bera

Universidade
de Vigo

Gráficos y test de hipótesis Universidade
de Vigo

Los gráficos nos dan una idea de los posibles fallos, pero para
contrastarlos debemos utilizar los test de hipótesis.
Vamos a recordar algunas ideas de los test de hipótesis para
contrastar suposiciones.
Haremos uso de dos test:
Paramétrico: test de Jarque-Bera
No paramétrico: Test de Bondad de ajuste.

Test de significación Universidade
de Vigo

En todos los test de significación se tienen en cuenta los
siguientes aspectos:
1. Definir modelo de análisis e indicar suposiciones del test
2. Definir hipótesis nula y alternativa
3. Fijar el nivel de significación
4. Estadístico de la prueba
5. Ley de distribución del estadístico
6. Regla de decisión

Test de significación para contrastar
suposiciones del MRLN Universidade
de Vigo

Cuando se quieren contrastar las suposiciones del MRLN,
siempre se parte del modelo, con alguna generalización, es
decir se suponen validas todas las suposiciones excepto la que
se quiere contrastar.
En el caso de la normalidad se suponen todas menos la
normalidad de las perturbaciones.

Modelo de contraste de normalidad Universidade
de Vigo

Yt
ε t = yt − E ( X1t ... X kt
) = yt − ( β0 + β1 X1t + ... + β k X kt )

Donde:
ε son independientes e igualmente distribuidas y no dependen
de las X (Independencia, homocedasticidad y exogeneidad),
β son estables y estimables (Estabilidad e identificabilidad)
X no están relacionadas entre sí y vienen dadas sin error (no
colinealidad y mensurabilidad)

Resultados del modelo Universidade
de Vigo

Esas suposiciones nos permiten:
Estimar las perturbaciones a partir de los errores de MCO.
Suponer que los residuos son aproximadamente
independientes e igualmente distribuidos con leyes de media 0
y varianza constante, lo que nos permite comparar la
distribución empírica con una normal teórica. Eso es el test de
bondad de ajuste.
Calcular el coeficiente de asimetría y curtósis de los residuos
como si estos provinieran de la misma población. Eso en
esencia es el test de Jarque-Bera.

Jarque-
Test de Jarque-Bera Universidade
de Vigo

Contrastamos la asimetría y el exceso de curtósis, que bajo
normalidad deberían de ser ambos 0.
Analiza por consiguiente si la distribución falla en alguna de
las características básicas de la normal, si es simétrica o si
tiene diferente peso los valores centrales respecto a los
extremos de la normal.
Se suele hacer una comparación de cada uno de ellos
independientemente y otro test conjunto.

Hipótesis del Test de simetría Universidade
de Vigo

El test de simetría se realiza para contrastar:
H0: γ1=0, lo que significa simetría exacta
H1: γ1≠0, lo que significa que existe asimetría
Donde
n

∑ε 3
i

γ1 = i =1

σR
3

La consecuencia es que si existe asimetría falla la
normalidad

Estadístico y decisión del Test de
simetría. Universidade
de Vigo

Contrastamos si existe simetría o no
El estadístico γˆ 1
t =
1
6
n

sigue una ley AN(0,1) bajo la hipótesis nula, es decir cuando se supone
normalidad, siendo
n

∑ ei3
γˆ1 = i =1
3
SR
Se rechaza si t > λ donde λα/2 es el valor crítico de la normal
1 α /2
tipificada

Test de simetría Universidade
de Vigo

Forma teórica de la
Asimetría positiva normal
casi nula: mediana
menor que la media

COEFFICIENT OF SKEWNESS = 0.2031
WITH STANDARD DEVIATION OF 0.3738
|_gen1 t1=0.2031/0.3738
|_distrib t1
NORMAL DISTRIBUTION - MEAN= 0.0000
VARIANCE= 1.0000
DATA Z PDF CDF 1-CDF
T1 0.54334 0.34419 0.70655 0.29345

distribución empírica

Hipótesis del Test de curtósis Universidade
de Vigo

El test de curtósis se realiza para contrastar:
H0: γ2=0, lo que significa curtósis exacta
H1: γ2≠0, lo que significa que existe curtósis
Donde

n

∑ ε4 i

γ2 = i =1
−3
σ 4
R

La consecuencia es que si existe curtósis falla la
normalidad

curtósis.
curtósis. Universidade
de Vigo

Contrastamos si existe exceso de curtósis o no
El estadístico γˆ 2
t2 =
24
n
sigue una ley AN(0,1) bajo la hipótesis nula, es decir cuando se supone
normalidad, siendo n

∑e 4
i

γˆ2 = i =1
4
−3
SR

Se rechaza si t2 > λα / 2 donde λα/2 es el valor crítico de la
normal tipificada

Test de curtósis Universidade
de Vigo

normal

COEFFICIENT OF EXCESS KURTOSIS =
-0.8323 WITH STANDARD DEVIATION OF
0.7326

|_gen1 t2=-0.8323/0.7326
|_distrib t2
NORMAL DISTRIBUTION - MEAN= 0.0000
VARIANCE= 1.0000
DATA Z PDF CDF 1-CDF
T2 -1.1361 0.20924 0.12796 0.87204

Curtósis negativa casi nula
: menos apuntamiento que Forma teórica de la
la normal distribución empírica

Jarque-
Hipótesis del Test de Jarque-Bera Universidade
de Vigo

El test de Jarque-Bera se realiza para contrastar:
H0: γ1= γ2=0, lo que significa simetría y curtósis exactas
H1: γ1≠0 ο γ2≠0 lo que significa que existe curtósis o asimetría
Donde los coeficientes han sido calculados como en los test
anteriores.
La consecuencia es que si existe asimetría o curtósis falla la
normalidad.
Al contrastarlo conjuntamente exige un fallo mayor de alguna
de ellas o de ambas para rechazarse.

Jarque-
Jarque-Bera Universidade
de Vigo

Contrastamos conjuntamente la asimetría y el exceso de curtósis
El estadístico
 γˆ12 γˆ 22 
JB = t12 + t2 = T  + 
2

 6 24 
 
sigue una ley asintótica ji cuadrado con 2 grados de libertad bajo la hipótesis
nula, puesto que ambos estadísticos t eran normales tipificadas.

Se rechaza si JB > χ 2,α
donde χ2,α es el valor crítico de una chi cuadrado con 2 grados e libertad

Test de Jarque Bera Universidade
de Vigo

Asimetría negativa:
Asimetría positiva normal
mediana mayor que
casi nula: mediana
menor que la media
la media

JARQUE-BERA
NORMALITY TEST-
CHI-SQUARE(2
DF)= 1.5400
P-VALUE= 0.463

Curtósis negativa :
mas apuntamiento Forma teórica de la
que la normal distribución empírica

Test de Bondad de ajuste Universidade
de Vigo

Compara la distribución teórica con la empírica.
Analiza las funciones de densidad, es decir hace uso de los
histograma y la función de densidad gaussiana.
Para ello hace uso de intervalos.

Test de bondad de ajuste (1) Universidade
de Vigo

1. Calcular los valores observados dentro de cada
subconjunto Sj, j=1,...k., que denominaremos OBSj.
2. Calcular la probabilidad teórica de que la variable tome
algún valor en el subconjunto Sj suponiendo una normal
con los parámetros estimados por MV. Denominamos al
valor esperado ESPj, que será igual al número total de
valores por la probabilidad de que un valor pertenezca a
ese subconjunto

Test de bondad de ajuste (2) Universidade
de Vigo

3. Calculamos una distancia de tipo ji cuadrado entre esos valores,
que,como los observados siguen una B(n,pj), cada término es
aproximadamente N(0,1), pero no son independientes, ya que
existen dos tipos de relaciones, debido al número de intervalos y a
las estimaciones, en total, 3 restricciones, seguirá una ji cuadrado
con k-3 grados de libertad.
4. Comparar el estadístico con el valor de las tablas y se rechaza si
dicho valor es mayor, porque indica que se ajusta poco a la
distribución normal.

Histograma teórico y empírico Universidade
de Vigo

Diferencias
positivas Función de
distribución
teórica

Función de
distribución
empírica
Diferencias
negativas

Telas-
Telas-normalidad Universidade
de Vigo

COEFFICIENT OF SKEWNESS = 0.2031 WITH
STANDARD DEVIATION OF 0.3738
COEFFICIENT OF EXCESS KURTOSIS = -
0.8323 WITH STANDARD DEVIATION OF 0.7326
JARQUE-BERA NORMALITY TEST- CHI-SQUARE(2
DF)= 1.5400 P-VALUE= 0.463
GOODNESS OF FIT TEST FOR NORMALITY
OF RESIDUALS - 6 GROUPS
OBSERVED 0.0 8.0 10.0 15.0 7.0 0.0
EXPECTED 0.9 5.4 13.7 13.7 5.4 0.9
CHI-SQUARE = 4.5934 WITH 1 DEGREES
OF FREEDOM, P-VALUE= 0.032

Visión gráfica del test de bondad de
ajuste Universidade
de Vigo

Función de distribución
teórica
Función de distribución
Valor empírica
observado= 0

Estadístico
X2=Suma=4,59

Valor (OBS-ESP)2/ESP= 1.11
esperado= 0,9 (OBS-ESP)2/ESP= 0.47

OBS-ESP= -0,9
(OBS-ESP)2/ESP= 2.27 (OBS-ESP)2/ESP=0.12

(OBS-ESP)2/ESP= 1.11 (OBS-ESP)2/ESP= 1

Tratamiento de la normalidad Universidade
de Vigo

1.Si la distribución es conocida, aunque no sea normal, se
aplica estimación MV.
2.Si la distribución es desconocida, se puede utilizar:
a. Transformaciones buscando normalidad.
b. Regresión robusta.
3.Si la no normalidad es debida a valores atípicos
a. Se utilizan variables ficticias.
b. Se eliminan si hay suficientes datos.

Ejemplo: Fabricación de telas Universidade
de Vigo

El coste de fabricación de algodón en una empresa de
hilaturas depende de la cantidad de tejido producido y
del precio de la mano de obra que trabaja subcontratada.
los datos de los últimos 40 meses se recoge en la tabla
siguiente.
Interesa comprobar si el comportamiento de los costes
de la fabricación entre unos años y otros es normal.

Telas-
Telas-normalidad Universidade
de Vigo

COEFFICIENT OF SKEWNESS = 0.2031 WITH
STANDARD DEVIATION OF 0.3738
COEFFICIENT OF EXCESS KURTOSIS = -0.8323
WITH STANDARD DEVIATION OF 0.7326
JARQUE-BERA NORMALITY TEST- CHI-SQUARE(2
DF)= 1.5400 P-VALUE= 0.463

Ejercicio 2.3

Variables ficticias
Definición
Binomiales
Multinomiales
Regresión con variables
ficticias
Aplicación para solucionar Universidade
de Vigo
la normalidad

Definición de Variables ficticias Universidade
de Vigo

Son variables que caracterizan comportamientos
cualitativos de forma que indican si una determinada
observación verifica o no una propiedad prefijada
También se les denomina variables indicador de la
propiedad o característica
Generalmente se definen como variables dicotómicas,
pero también pueden definirse para variables
multinomiales

Variables ficticias dicotómicas Universidade
de Vigo

Supongamos que tenemos una variable cualitativa
dicotómica C, es decir, que se verifica una
determinada propiedad o no, que tienen una cualidad
o no, etc..., por tanto únicamente puede tomar dos
valores A y B.
Se define la variable ficticia dicotómica como
De esta forma se
1 si C = A cuantifica el efecto de
IA =  la variable

0 si C = B dicotómica, vale 1 si
la cualidad se verifica
y 0 si no.
19/01/2009

Ejemplos Universidade
de Vigo

En una encuesta responder si o no
Ser valor atípico o no serlo
Saber informática o no
Tener un sexo u otro
Ser conductor o no
Ser directivo o no
.........

Variables ficticias multinomiales Universidade
de Vigo

Supongamos que tenemos una variable cualitativa
multinomial C, es decir, que puede tomar mas de dos
valores C1, ...., Cm
Se define una variable ficticia dicotómica para cada uno
de los posibles valores.

1 si Ct = c j j=1,...m
I jt = 
0 si Ct ≠ c j
t=1,…T

Ejemplo Universidade
de Vigo

Supongamos que queremos estudiar la estacionalidad
de las ventas de un producto. La variable estación
toma cuatro valores: Primavera, verano, otoño e
invierno. Definimos dichas opciones como:
C1= Ventas de primavera
C2= Ventas de verano
C3= Ventas de otoño
C4= Ventas de invierno
Por lo tanto definiremos cuatro variables ficticias:
Una hace relación a la primavera
Otra al verano
Otra al otoño
Y la última, al invierno

Ejemplo (2) Universidade
de Vigo

1 si ventas ∈ C 1
Prim avera = 
 0 si no
V erano = 
 0 si no
O toño = 
 0 si no
Invierno = 
 0 si no

Variables ficticias multinomiales (2) Universidade
de Vigo

Por consiguiente tendremos m variables ficticias, pero todas
ellas van a verificar una restricción: la suma de todas las
variables siempre vale 1, ya que siempre ocurre uno de los
posibles casos.
Por consiguiente una se puede poner en función del resto, lo
que implica que bastaría definir m-1 variables

Variables ficticias multinomales (3) Universidade
de Vigo

Por consiguiente tendríamos

1 si Ct = c j j=1,...m-1
I jt = 
0 si Ct ≠ c j
t=1,…T

Ejemplo (3) Universidade
de Vigo

En el caso de las
estaciones 1 si ventas ∈ C1
tendríamos sólo
Primavera = 
tres, pues el 0 si no
invierno sería 1 1 si ventas ∈C2
menos la suma de Verano = 
las otras tres. 0 si no
1 si ventas ∈ C3
Otoño = 
0 si no
Invierno= 1-Primavera-Verano-Otoño

Variables ficticias en la regresión Universidade
de Vigo

Al incluirlas en una regresión lo hacen como cualquier otra
variable, con la diferencia de que el coeficiente nos mide el
cambio que se produce por estar en esa categoría en vez de
en otra
Ejemplo
considerar el coste de producir una pieza en dos sectores
diferentes A y B

Coste de producción en dos sectores Universidade
de Vigo

El hecho de incluir o no la variable ficticia cambia los parámetros
de la regresión
Regresión
para cada
sector
Sector A Sector B
Conjunta sin
dividir en
sectores

Vamos a intentar formalizarlo

Ejemplos de regresión con variables
dicotómicas Universidade
de Vigo

El caso más habitual es cuando se responde a preguntas sobre
gustos, actitudes, etc., únicamente de la forma si o no, sin
respuestas intermedias.
También se usa para medir efectos de cambios en el tiempo por
legislaciones o efectos puntuales debidos a un sólo valor o a un
conjunto de valores.
Este será el caso que nos interese para resolver los problemas
que se plantean con los valores atípicos, pero previamente
veamos como se introducen estas variables en las ecuaciones de
regresión y que efectos pueden producir.

Planteamiento de la regresión con
variables dicotómicas Universidade
de Vigo

Supongamos que tenemos una variable cualquiera C que
únicamente puede tomar dos valores A y B de forma que ambos
son excluyentes y exhaustivos. Entones la variable ficticia se
define como

1 si C = A
IA = 
0 si C = B

Regresión con variables dicotómicas Universidade
de Vigo

En el caso mas simple, se introduciría en el modelo de
regresión como una variable cualquiera
Modelo sin variable ficticia

y = β0 + β1 X 1 +⋯+ βk X k + ε
Modelo con variable ficticia

y = β0 + β1 X 1 +⋯+ βk X k + αI A + ε
Efecto de la variable
ficticia

Interpretación Universidade
de Vigo

Las pendientes se interpretan igual, pero ahora sería el efecto
independientemente del sector
La constante β0 sería el coste fijo en el sector B
La suma de β0 y α sería el coste fijo en el sector A
Por tanto α mide la diferencia entre los costes fijos.

Efecto de las variables dicotómicas
en la regresión Universidade
de Vigo

Partiendo del modelo sin variable ficticia se puede medir el
impacto de esta sobre cada uno de los coeficientes de la regresión
cuando se sospecha que cada uno de los grupos tiene una relación
diferente totalmente. En ese caso se definen una serie de variables
auxiliares que miden el impacto sobre la pendiente
 X j si t ∈ A
IX j =  j = 1...k
0 si t ∉ A
Con esas variable el modelo quedaría: Efecto de la variable
ficticia sobre la
y = β 0 + β1 X 1 + ⋯ + β X k + pendiente de Xk

+α 0 I A + α1 IX 1 + ⋯ + α k IX k + ε

Interpretación Universidade
de Vigo

Las pendientes se interpretan igual, pero ahora sería el efecto
independientemente del sector
La constante β0 sería el efecto fijo en el sector B
La suma de β0 y α0 sería el efecto fijo en el sector A
Por tanto α0 mide la diferencia entre los efectos fijos
Cada una de las pendientes βj sería el impacto de Xj sobre Y
en el sector B
La suma de βj y αj nos mediría el impacto de Xj sobre Y en el
sector A
Por tanto cada uno de los αj nos mide la diferencia entre los
impactos en los sectores A y B.

Construcción de variables ficticias
con el comando GENR Universidade
de Vigo

Funciones lógicas: se definen mediante relaciones y en función de
los operadores lógicos
Relaciones:
Igual →.EQ.,
Distinto →.NE.,
Mayor o igual →.GE.,
Mayor estricto →.GT.,
Menor o igual →.LE.,
Menor estricto →.LT.
Operadores lógicos
.NOT., → Negación
.AND., → Intersección
.OR. → unión
Se colocan siempre entre paréntesis.

Ejemplo de variables ficticias Universidade
de Vigo

La utilización de variables ficticias (variables dicotómicas o
variables dummy) en un modelo econométrico permite la
inclusión de aspectos cualitativos en el modelo.
En este caso, vamos a dividir las familias de la muestra en tres
grupos, de acuerdo con su tamaño familiar:
Grupo 1: familias de tamaño pequeño (de 1 a 3 componentes).
Grupo 2: familias de tamaño medio (de 4 a 6 componentes).
Grupo3: familias de tamaño grande (a partir de 7 componentes).
Sea X3 la variable que mide el tamaño de las familias,
entonces tendríamos una variable para cada grupo
GENR D1=(X3.LE.3) Nos indica si una familia
GENR D2=(X3.GT.3).AND.(X3.LE.6) pertenece al grupo de
tamaño pequeño o no.
GENR D3=(X3.GE.7)

Trampa de las variables ficticias Universidade
de Vigo

A la hora de incluir variables ficticias en el modelo debemos
ser cautelosos puesto que podemos provocar un problema de
multicolinealidad perfecta, es decir, podemos caer en la
denominada “trampa de las variables ficticias”.

Regresión en XUMA con variables
ficticias Universidade
de Vigo

|_GENR T=TIME(0)
|_GENR D12=(T.EQ.12)
|_OLS Y X1 X2 D12/RESID=E INFLUENCE HATDIAG=HT
REQUIRED MEMORY IS PAR= 3 CURRENT PAR= 2000
OLS ESTIMATION
20 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 20
R-SQUARE = 0.9855 R-SQUARE ADJUSTED = 0.9828
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.30698E-01
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.17521
SUM OF SQUARED ERRORS-SSE= 0.49117
MEAN OF DEPENDENT VARIABLE = 13.708
LOG OF THE LIKELIHOOD FUNCTION = 8.68826
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 16 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.48369 0.1711E-01 28.27 0.000 0.990 0.9224 0.2085
X2 0.57535E-01 0.1477E-01 3.896 0.001 0.698 0.1183 0.0285
D12 0.88083 0.1956 4.504 0.000 0.748 0.1476 0.0032
CONSTANT 10.415 0.1499 69.47 0.000 0.998 0.0000 0.7598

Efecto en la regresión en XUMA de la
variable ficticia Universidade
de Vigo

RESIDUAL RSTUDENT HT COVRAT DFFITS DFFIT
1 -0.31969 -2.0908 0.0779 0.5047 -0.6077 -0.27007E-01
2 -0.10402 -0.6500 0.1960 1.4407 -0.3209 -0.25351E-01
3 0.26206 1.7350 0.1635 0.7446 0.7671 0.51219E-01
4 -0.27322E-01 -0.1673 0.1835 1.5737 -0.0793 -0.61407E-02
5 0.26840 1.7640 0.1463 0.7134 0.7302 0.45991E-01
6 -0.94858E-01 -0.5485 0.0682 1.2832 -0.1483 -0.69375E-02
7 0.17410 1.0880 0.1563 1.1323 0.4683 0.32256E-01
8 0.88418E-01 0.5119 0.0729 1.3029 0.1435 0.69511E-02
9 -0.16736 -1.0261 0.1305 1.1350 -0.3975 -0.25115E-01
10 -0.85826E-01 -0.5376 0.2066 1.5117 -0.2743 -0.22345E-01
11 0.18209 1.1141 0.1167 1.0664 0.4050 0.24063E-01
12 0.64435E-14 0.0000 1.0000********* 106.9110 19.346
13 0.10515 0.7446 0.3683 1.7725 0.5686 0.61319E-01
14 -0.23246 -1.4430 0.0974 0.8528 -0.4741 -0.25090E-01
15 -0.17150 -1.0457 0.1187 1.1085 -0.3837 -0.23095E-01
16 0.12570 0.8123 0.2365 1.4273 0.4521 0.38932E-01
17 -0.30907E-01 -0.1989 0.2605 1.7322 -0.1180 -0.10887E-01 atípico aparece
El valor
18 -0.19273E-01 -0.1146 0.1353 1.4918 -0.0453 -0.30148E-02
19 -0.40684E-01 -0.2437 0.1456
ahora como muy influyente,
1.4915 -0.1006 -0.69358E-02
20 0.87971E-01 0.5228 0.1194 1.3676 pero no atípico
0.1925 0.11927E-01
SUM-OF-SQUARED PREDICTION ERRORS SSPE,PRESS,CV= 374.93
SCHMIDT(1974) SUM OF SQUARES OF STANDARDIZED PREDICTION ERRORS= 0.56862
STONE(1974) CROSS-VALIDATION= 0.36193E-01

Grafico de probabilidad Universidade
de Vigo

Ya no hay valores
atípicos, es
prácticamente
normal

Ejercicio 2.4
Universidade
de Vigo

Curva
normal

Cola de probabilidad

Nivel de significación
Area

Valor crítico
Valor muestral del estadístico

Normalidad

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Recently uploaded

Recently uploaded (20)

Normalidad