SlideShare a Scribd company logo
1 of 28
Download to read offline
Capítulo 19. MODELOS DE PROBABILIDAD

19.1. Características
En el modelo mínimo cuadrático

Yt   1   2 X 2t     k X kt   t


Las variables X pueden cuantitativas o cualitativas



La variable Y sólo puede ser cuantiativa

En la práctica, en muchas ocasiones, se tiene la necesidad de explicar la
ocurrencia de un evento. Esto se representa a través de una variable binaria
que asume el valor 1, si el evento sucede, y el valor 0, si no sucede; es
decir, produce una respuesta de sí o no, de acuerdo a la presencia de la
cualidad que se quiera medir. Este tipo de situaciones se estudian a partir
de los Modelos de Probabilidad.
La variable dependiente binaria también se denomina variable dependiente
limitada o variable indicadora. Estas variables tienen restringido su rango de
variabilidad y muchas conducen a soluciones de esquina, esto significa que
resulta óptimo elegir el 0 para un número importante de situaciones.

Ejemplo. Supongamos que se desea estudiar la participación de la
fuerza laboral de hombres adultos en función de la tasa de desempleo,
de la tasa de salarios promedio, del ingreso familiar, de la educación,
etc. Una persona o bien está en la fuerza laboral o no está. Por tanto,
la variable dependiente que es la participación en la fuerza laboral,
solamente puede adquirir dos valores: 1 si la persona está en la fuerza
laboral y 0 si no lo está.

Se considerarán los cuatro enfoques de mayor difusión


Modelo lineal de probabilidad (MPL)



Modelo Logit



Modelo Probit



Modelo Tobit
714

19.2. Modelo Lineal de Probabilidad
En la década del ´60 y principios de la siguiente, el modelo de probabilidad
lineal (MPL) se utilizó ampliamente y la estimación se realizaba a partir del
mínimo cuadrado ordinario. En estos modelos, la variable Y es indicadora de
ocurrencia o no ocurrencia de un evento.
Dado
1
Y
0

si el evento ocurre
si el evento no ocurre

El modelo se especifica

Yt  β1  β2 X 2t    β k X kt  ε t

(1)

donde,

Y es una variable cualitativa

X 2 , X 3 , X k son variables explicativas de carácter cuantitativo o cualitativo
Si E(ε i )  0 , entonces la esperanza condicional

E( Yt X i )  β1  β2 X2t    βk X kt

(2)

Debe interpretarse como la probabilidad de que ocurra el evento, dado que
ocurren las X i ; es decir,

PYi  1 Xi   E( Yt Xi )  β1  β2 X2t    βk Xkt
Modelos de este tipo, que expresan la variable binaria como una función
lineal de la o las variables independientes, se denominan Modelo de
Probabilidad Lineal puesto que la E( Yt X i ) , puede ser interpretada como la
probabilidad condicional de que el evento suceda dado X i .

Ejemplo. En un estudio en los hogares, si Y mide la posesión de una
casa -Y=1 cuando la familia posee casa y Y=0 cuando no posee- y X
el nivel de ingresos. La E Yi X i  da la probabilidad de que una familia
posea una casa dado que tiene un ingreso de cierta cantidad X i
715
Haciendo, Pi  prob(Yi )  1 -que el evento ocurra- y 1  Pi  prob(Yi )  0 que el evento no ocurra-, la distribución de probabilidad de la variable Y
(que sigue la distribución de probabilidad Bernoulli1) viene dada por:

Yi

Probabilidad

0

1  Pi

1

Pi

Total

1

ˆ
ˆ
ˆ
EYi  1 X i   β1  β2 X 2t    βk X kt
ˆ
ˆ
ˆ
EYi  0 X i   1  β1  β2 X 2t    βk X kt





(3)

Por consiguiente, por definición de esperanza matemática se obtiene

E Yi   01  Pi   1Pi   Pi
comparando con E Yi X i    1   2 X 2t     k X kt , se puede igualar

E Yi X i    1   2 X 2t     k X kt  Pi
es decir, la esperanza condicional del modelo puede ser interpretada, de
hecho, como la probabilidad condicional de Yi

Puesto que la probabilidad Pi debe encontrarse entre 0 y 1, se tiene la
restricción

0  EYi Xi   1
es decir, la esperanza
encontrarse entre 0 y 1.

condicional

(4)
o

probabilidad

condicional

debe

En aplicaciones prácticas el MPL, especificado en (1), presenta problemas
tales como,




No normalidad de los t . Al igual que la variable Y, los errores siguen
una distribución Bernoulli:
ˆ
ˆ
ˆ
ˆ
e  Yi  Yi  Yi  β1  β2 X 2t    βk X kt

1

El modelo de probabilidad Bernoulli se aplica a una variable que puede asumir solo dos valores y donde
la suma de las probabilidades de ocurrencia de cada uno de esos valores es igual a 1. El modelo binomial
es la suma de n variables Bernoulli.
Bernoulli
Binomial
p
np
Media EX 
Varianza V X 

Ya-Lu Chou (1977) pág. 152

p(1-p)

np(1-p)
716

Y
1

e
ˆ  β X  β X
ˆ
ˆ
1  β1
2 2t
k kt
ˆ  β X  β X
ˆ
ˆ
0  β1
2 2t
k kt

0

Probabilidad
Pi
1  Pi

Este problema puede obviarse si se trabaja con un alto número de
observaciones, porque se sabe que si n tiende a infinito, los
estimadores mínimoS cuadráticos tienden a estar normalmente
distribuidos.



Heterocedasticidad de ε t . En la distribución Bernoulli, la media es p y
la varianza es p(1-p); lo cual revela que la varianza es función de la
media, por lo que la varianza del error es heterocedástica.
ˆ
ˆ
ˆ
En el MLP, si P  β1  β2 X 2t    βk X kt y la varianza es P(1-P), quiere
decir que la varianza de ε es heterocedástica porque depende de los
valores de X.

Una forma de resolver el modelo es transformar (1) dividiendo ambos
miembros por

Pi 1  Pi   Wi ; es decir:

Yt
Wi



β1
Wi

 β2

X2t
Wi

   βk

X kt
Wi



εt
Wi

El término de error es homocedástico; la estimación se realiza
mediante mínimos cuadrados ponderados, lo cual significa aplicar
mínimos cuadrados ordinarios a un modelo ponderado por W.







ˆ
La posibilidad de que E Yt X se encuentre fuera del rango 0 – 1. Aquí
radica el problema real en la estimación mínimo cuadrática del MPL.
En la práctica se resuelve de la siguiente manera
ˆ
ˆ
Si Y  0 se asume que Y  0

ˆ
ˆ
Si Y  1 se asume que Y  1



2
2
Valores generalmente bajos de R . El R no es considerado como
medida de bondad de ajuste porque los valores observados de Y
serán 0 o 1; mientras que, los valores estimados abarcan todo el
recorrido de los números reales. Esto significa que:

ˆ
Yi puede ser  0
ˆ
0  Y 1
i

ˆ
Yi  1
En la práctica, se realiza una
estimación restringida o truncada:
714
ˆ
ˆ
Si Yi  1 se asume que Yi  1
ˆ
ˆ
Si Yi  0 se asume que Yi  0
2
El valor de R no puede indicar la
bondad de la estimación porque
habrá un grupo de observaciones
que asumirán un valor estimado
que no es el correcto.

Cuando la dispersión de las
observaciones
está
muy
concentrado en dos puntos, puede
2
esperarse un R cercano al 0,8. En

general, se aconseja no tener en
2
cuenta el R
como medida de
bondad de ajuste

Aldrich y Nelson sostienen que el uso del coeficiente de determinación como
estadístico resumen debe evitarse en modelos con variable dependiente
cualitativa.
Para solucionar estos problemas se presentan los modelos Logit y Probit
(Normit).
Aún salvando estos problemas el MPL no es un modelo muy atractivo
porque supone que aumenta linealmente con X, es decir el efecto marginal
o incremental de X permanece constante todo el tiempo. En realidad se
esperaría que Pi estuviera relacionado en forma no lineal con X i

Ejemplo. Si se aplica el modelo de propiedad de la vivienda y se
ˆ
encuentra que  2  0.10 significaría que a medida que X aumenta
una unidad (supongamos en miles de pesos), la probabilidad de ser
propietario de una vivienda aumenta en la misma cantidad constante
de 0.10. Esto es así para niveles de ingreso de $ 8.000; $15.000 o
$50.000. Esto no parece ser realista.
Para ingresos muy bajos una familia no poseerá una casa, pero a un
nivel de ingresos suficientemente alto, por ejemplo $a es muy
probable que ésta sí posea una casa. Cualquier aumento en el
ingreso más allá de $a tendrá un efecto pequeño sobre la
probabilidad de poseer una casa. Así a ambos extremos de la
distribución de ingresos, la probabilidad de poseer una casa no se
verá afectada, virtualmente, por un pequeño incremento en X .

En síntesis, al modelo especificado en (1) se lo denomina lineal de
probabilidad porque la probabilidad de respuesta es lineal en los parámetros
714
β. A la expresión
se la denomina probabilidad de respuesta e
indica que las probabilidades (tanto de ocurrencia como de no ocurrencia)
dependen de los valores de X.

Para solucionar estos problemas se presentan a continuación los modelos
Logit y Probit (Normit).

Ejemplo: Estudio sobre la vulnerabilidad en la ciudad de Río Cuarto
Se cuenta con información para 1549 hogares de la ciudad de Río
Cuarto con hijos nacidos durante 2005.
A partir de un estudio exploratorio (AFCM) se identificaron nueve
grupos sociales que se clasificaron en

Esta partición permitió la construcción de la
Vulnerabilidad (ALTAVUL) de la siguiente manera:

variable

Alta
715
El objetivo es identificar los fenómenos de mayor impacto en la
determinación de la alta vulnerabilidad en la ciudad de Río Cuarto.
El modelo se especifica

Donde
MAD indica la situación de la madre según su edad
1,

	

0,

	

NBI indica las necesidades básicas insatisfechas que tiene el hogar
observado
1,
0,

	

	
sin 	

EDAD edad actual de la madre
AI número de personas que aportan ingresos en el hogar
IM ingreso mensual del hogar en pesos de 2005
IPC ingreso per cápita diario del hogar en pesos de 2005
La estimación del modelo se realiza por mínimo cuadrados ordinarios,
luego se le dan valores de referencia a las variables explicativas y el
valor
indicará la probabilidad de pertenecer a un grupo
social de alta vulnerabilidad.

La estimación del ejemplo no está exenta de lo que se mencionó
.
anteriormente: no normalidad, heterocedasticidad y poca relevancia de
Frente a esto, lo que se necesita es un modelo probabilístico que tenga:
1. Probabilidad acotada al intervalo 0-1
2. Probabilidad creciente conforme aumentan los valores de X
3. Relación no lineal entre la probabilidad y X, de modo que al acercarse
a 1 o 0 lo haga a tasa decreciente.

Las funciones que tienen estas características son las distribuciones
acumulativas en forma de S. Aunque hay casos que cumplen con estos
requisitos, las más usadas son la logística y la normal, que dan lugar a los
modelos de probabilidad Logit y Probit o Normit.
716

19.3 Modelos de Probabilidad con distribución acumulativa
Estos modelos se especifican de la siguiente manera
∗

⋯

Donde ∗ es una variable latente que se define como la proyección,
capacidad o posibilidad de que el evento bajo estudio ocurra.
La variable latente no se puede observar, por lo que debe aproximarse a
través de una variable relacionada que sí se pueda observar. Esta variable
es la que indica la presencia o ausencia del evento en una población.

Ejemplo: Estudio sobre la vulnerabilidad en la ciudad de Río Cuarto
La variable observable es el individuo que presenta situación de
vulnerabilidad, la variable no observable es la posibilidad de que el
individuo esté en una situación de alta vulnerabilidad.

El método de estimación de estos modelos es el de máxima verosimilitud
(MV). La verosimilitud de la iésima observación es la probabilidad de que Y
tome el valor que se observa que toma, de modo que la verosimilitud de
cada observación depende del valor de los parámetros β y de si el evento se
presenta o no.
Si se tienen n observaciones idénticas e independientemente distribuidas
que siguen el modelo
⋯

1|

tome el valor que se
La función de verosimilitud es la probabilidad de que
observa para cada elemento de la muestra condicionado a los valores de X.
La función de verosimilitud puede escribirse como
1

0

Lo cual implica que la probabilidad de que un grupo de observaciones tome
efectivamente los valores observados de Y es igual al producto de las
probabilidades de cada observación. De modo que:
1
Con

1|

…

´

1

´
717
⋯
´

El estimador de máxima verosimilitud de β es el que maximiza el logaritmo
de la función de verosimilitud
ln
´

		ln
Que será un estimador
asintóticamente eficiente.

		ln

1

consistente,

´

1

asintóticamente

normal

y

Las condiciones de primer orden serán
1
´

´

											

´

		 1

´

´

1

´

´

0

Al ser un problema no lineal, su resolución se alcanza al aplicar métodos
iterativos y el estimador se obtiene por métodos numéricos iterativos.
En definitiva, el principio de máxima verosimilitud consiste en escoger
valores estimados de los parámetros β que maximicen la función de
verosimilitud.
Los estimadores de máxima verosimilitud son los valores por los cuales la
probabilidad de “observar la muestra que se observa” es tan grande como
sea posible.
Los modelos logit y probit difieren en la especificación del término de error
1
																					

⋯
⋯

1

Donde F es la función de distribución acumulada de
Si la distribución de

es simétrica, haciendo
⋯

																					
1
Es posible escribir
718
⋯
La forma funcional de F dependerá de la suposición en torno al término ε; si
la distribución que acumula ε es logística, se tiene el logit, mientras que, si
es normal se tiene el probit (o normit).
Los modelos logit y probit son modelos de respuesta binaria
1⁄

…

⋯

La

toma valores entre 0 y 1.

Si

es logística

Si

es logística
1
1

1

Da lugar al modelo logit cuya expresión será
⋯

⋯

1

⋯

1

Da lugar al modelo logit cuya expresión será
⋯

⋯

1

Si

⋯

1

es normal

Donde
1
√2

~

0,1

Se tiene el modelo probit, cuya expresión será
1

⋯

√2
⋯

1
√2
719

19.4 Modelo Logit
El modelo logit supone que una variable dependiente
∗

⋯
∗

Donde se tiene una variable latente
logística.
Denominando

1,

0, y

se distribuye como una

⋯
1

1⁄

1

																				 1

1

Donde X son las variables explicativas e Y las variables dicótomas; si Y=1
significa que el evento ocurre, si Y=0 el evento no ocurre.
es la probabilidad de que el evento se presente se lo conoce como
función de distribución logística acumulativa
Si

∞

Cuando

∞, la 0
→ ∞,

1

→ 0 y cuando

→

∞,

→ ∞2

no se relaciona linealmente con X por lo que se satisfacen los
requerimientos expuestos anteriormente.
Esta función se comporta diferente al modelo lineal de probabilidad
Si el evento se presenta

1
Si no se presenta
1

1

1

La razón de probabilidades a favor del evento bajo estudio es
1

1

1

1

Tomando logaritmo de la razón de probabilidades
1
2

Recuerde de que e=2.71828

ln

⋯
720
A L se lo denomina logit; si es positivo la probabilidad tiende a 1, si es
negativo tiende a 0. L se relaciona linealmente con las variables X y los
coeficientes β; mientras que, la probabilidad guarda una relación no lineal
con las variables X y los coeficientes β.
Para estimar un modelo logit, se debe especificar el modelo
⋯
Donde

1 el evento se presenta,
0 el evento no se presenta,
~ logística

La estimación da por resultado

1

ln

⋯

	 indica el cambio marginal que un cambio en X provoca en L, pero no
indica en cuanto variará la probabilidad. Esta situación se deriva de las
relaciones no lineales planteadas anteriormente y da lugar a que se deba
definir una situación de referencia (o situación promedio) para encontrar el
valor de Z.
Esto se logra haciendo que:
1. Las variables X cuantitativas adopten el valor promedio
2. Las variables X cualitativas adopten alternativamente el valor 0 y el 1
Con el valor de Z se calcula la probabilidad de la siguiente manera:

1
aplicando antilogaritmo
			 → 			

1

La incógnita es la probabilidad, que se resuelve como
Los cambios en X impactan en L en la cuantía β, como se dijo
anteriormente, y en la probabilidad de acuerdo a
1
721

Ejemplo: Propiedad de la vivienda (ejemplo desarrollado en Gujarati
(2004))
Ahora se considerará la siguiente especificación

Y t 1   2 X t   t
Y  Pi  E Y  1 X t  
donde

1
1  e (  1   2 X t )



1
ez

1  e z 1  e z

X es el ingreso

Y  1 significa que la familia es propietaria de una casa

ez
representa la probabilidad de que el evento se presente.
1 e z

Por simplicidad, se escribe la ecuación de la siguiente manera:

Pi 

1
ˆ
ˆ
; donde z i  1   2 X i
 zi
1 e

Esta última ecuación
(acumulativa).

es

la

función

de

distribución

logística

Es fácil verificar que mientras zi se encuentra dentro de un rango
de   a  , Pi se encuentra dentro de un rango de 0 a 1 y que Pi
no está linealmente relacionada con zi (es decir, con X i ),
satisfaciendo
así
los
dos
requerimientos
considerados
anteriormente. Pero se crea un problema de estimación porque Pi
no es solamente no lineal en las X sino también en los  , como
puede verse a partir de la ecuación del modelo.
Esto significaría que no se puede utilizar MCO para estimar los
parámetros. Pero, este problema es más aparente que real ya que el
modelo es intrínsecamente lineal, lo cual puede verse de la siguiente
manera.
Si el evento se presenta Pi 

1
1  e  zi

Si el evento no se presenta la probabilidad es 1  Pi 

1
1 e z
722
La razón de probabilidad a favor del evento bajo estudio se expresa
como

ez
z
Pi
 1 e  e z
1
1  Pi
1 e z
La razón de probabilidades a favor de poseer una casa se interpreta
como la probabilidad de que una familia posea una casa a la
probabilidad de que no la posea. Así si Pi  0.8 significa que las
probabilidades son 4 a 1 a favor de la familia que posee una casa.
Tomando logaritmo natural de la razón de probabilidades

 P
Li  ln i
 1 P
i



  In e zi  Z i  1   2 X t



L es denominado logit, es lineal en X y lineal en los parámetros:
Si L  0 a valores crecientes de X , se incrementa la probabilidad
de ocurrencia del evento


Si L  0 a valores crecientes de X , disminuye la probabilidad de
ocurrencia del evento



A continuación se enuncian los aspectos que caracterizan al modelo
Logit:
1. A medida que P va de 0 a 1 (cuando Z varía de   a  ) el Logit
L va de   a  . Es decir, aunque las probabilidades (por
necesidad) se encuentran entre 0 y 1, los Logit no están limitados
en esa forma.
2. Aunque L es lineal en X, las probabilidades en sí mismas no lo
son. Esta propiedad hace contraste con el MLP en donde las
probabilidades aumentan linealmente con X.
3. Utilizando el cálculo, puede demostrarse que dP dX i   i P (1  P ) ,
lo cual muestra que la tasa de cambio en la probabilidad con
respecto a X contiene no solamente a  i sino también al nivel de
probabilidad a partir del cual se mide el cambio. A propósito,
obsérvese que un cambio unitario en X i sobre P es máximo
cuando P  0.5 y mínimo cuando P está cercano a 0 o a 1.
4. La interpretación del modelo LOGIT es la siguiente:  i , la
pendiente, mide el cambio en L ocasionado por un cambio unitario
en X i . En el ejemplo, como el logaritmo de las probabilidades a
723
favor de poseer una casa cambia a medida que el ingreso cambia en
una unidad (supongamos, $1.000). El intercepto  1 es el valor del
logaritmo de las probabilidades a favor de poseer una casa si el
ingreso es cero.
5. Dado un nivel de ingreso determinado, por ejemplo $a, si
realmente se desea estimar la probabilidad misma de poseer una
casa, y no las probabilidades a favor de poseer una casa, esto puede
hacerse directamente a partir de la primera ecuación una vez de que
se disponga de las estimaciones de  1 y  2 .
6. Mientras que el MLP supone que Pi está relacionado linealmente
con X i , el modelo LOGIT supone que el logaritmo de la razón de
probabilidades está relacionado linealmente con X i .

Estimación del modelo
A fines de la estimación el modelo se especifica

 P
Li  ln i
 1 P
i



  1   2 X t   t



Para estimar el modelo, además de los valores de X i , se necesitan
los valores del logit Li pero se incurre en algunas dificultades. En el
caso del ejemplo (y en otros similares) si existe información
disponible sobre familias individuales, entonces Pi  1 si una familia
posee una casa y Pi  0 si una familia no la posee.

Pero si se

colocan estos valores directamente en el logit Li se obtiene

 1
Li  ln  si una familia posee una casa
0

0
Li  ln  si una familia no posee una casa.
 1
Ambas expresiones carecen de sentido.
Por consiguiente, si la información disponible está a nivel micro o
individual, no se puede estimar el modelo mediante la rutina del
método de mínimos cuadrados ordinarios. En esta situación se
recurre a máxima verosimilitud. Pero es posible estimar por MCO si
se tiene datos agrupados
724
Estimación con datos agrupados
La información se agrupa siguiendo algún criterio y se estima por
mínimos cuadrados ordinarios. En el ejemplo de familias propietarias
de viviendas, la información puede agruparse según el nivel de
ingresos.

1
2
3
4
5
6
7
8
9
10

X i , ingreso

N i , número de familias

ni , número de familias

(miles de $)

Obs

con ingreso X i
40
50
60
80
100
70
65
50
40
25

que poseen casa

6
8
10
13
15
20
25
30
35
40

8
12
18
28
45
36
39
33
30
20

Luego se deben seguir los siguientes pasos:
1. Para cada nivel de ingreso X i calcular la probabilidad estimada

n 

ˆ
de poseer una casa como Pi   i  ; es decir la frecuencia relativa.
N 
 i
Se puede utilizar ésta como una estimación del verdadero Pi

ˆ
correspondiente a cada X i . Si N i es relativamente grande, Pi será
una estimación razonablemente buena de Pi (de la estadística
elemental recuerde que la probabilidad de un evento es el límite de
la frecuencia relativa a medida que el tamaño de la muestra se hace
infinitamente grande).
2. Utilizando Pi estimado, se puede obtener el Logit estimado como

ˆ
 P
ˆ
Li  ln i
 1 P
ˆi



ˆ
ˆ
  1   2 X t



3. Por lo tanto, dada la información agrupada o replicada
(observaciones repetidas), se puede obtener información sobre la
variable dependiente, los Logit.
4. La interpretación se realiza de la siguiente manera:

 P
Li  ln i
 1 P
i






725
al tomar antilogaritmo a esta expresión se obtiene la razón de
probabilidades

Pero

ˆ
Pi
ˆ
1  Pi

ˆ
Pi
Pi
ˆ ˆ
 e z esto significa que
 e 1   2 X 2 t
ˆ
1  Pi
1  Pi

Al resultado de evaluar e z se le resta 1 y se lo multiplica por 100,
este resultado es el cambio porcentual a favor de la ocurrencia del
evento ante el cambio en algún regresor.
5. Si se quiere calcular la probabilidad P se debe hacer

Pi
 ez
1  Pi



Pi  e z 1  Pi  

Pi 

ez
1 e z

6. Puede demostrarse que si N i es relativamente grande y cada
observación en una clase de ingreso dado X i está distribuida en
forma independiente como una variable binomial, entonces



1



 i  N 0,

 N i Pi 1  Pi 
por consiguiente, como en el caso del MLP, el término de
perturbación es heterocedástico y habrá que utilizar MCP. En esta
situación se usará la siguiente transformación del modelo

Wi Li   1 Wi   i Wi X i  Wi  i


que se escribe como: Li   1 W i   i X i   i



ˆ
ˆ
donde W i  N i Pi 1  Pi

 es el coeficiente que pondera

L es igual a Li ponderada
i
X i es igual a X i ponderada

 i es el término de error ponderado homocedástico
7. Estímese la ecuación transformada mediante MCO. Tenga en
cuenta que en esta ecuación no hay término de intercepto
introducido explícitamente, por lo que se tendrá que usar el
procedimiento de regresión a través del origen.
726
8. Establézcanse intervalos de confianza y/o pruebas de hipótesis
dentro de lo usual para MCO, cuyos resultados serán válidos sólo
para muestras relativamente grandes.

Aunque paquetes tales como el EVIEWS estiman directamente estos
modelos, apliquemos el razonamiento anterior para comprender
algunos resultados.
La estimación por MCP sin ordenada al origen da:

Esto es,

ˆi
L  1.5932 Wi  0.0787 X i



ˆ
ˆ
El intercepto estimado es  i N i Pi 1  Pi



Como muestra esta regresión, el coeficiente de pendiente estimado
sugiere que para un incremento unitario ($1.000) en el ingreso
ponderado, el logaritmo ponderado de las probabilidades a favor de
poseer una casa aumenta en alrededor de 0.08.
Tomando antilogaritmo de 0.0787, se obtiene aproximadamente
1.0818, lo cual significa que para un incremento unitario en los
ingresos ponderados, las probabilidades ponderadas a favor de
poseer una casa aumentan en 1.0818 o alrededor de 8.18%.
¿Se puede calcular la probabilidad de poseer una casa, dado el
ingreso, a partir de la razón de probabilidades?
Este cálculo puede hacerse fácilmente. Supóngase que se desea
estimar la probabilidad de poseer una casa para el nivel de ingreso
de $20.000. Se tiene el dato observado en la Tabla 16.1 para la
727
observación 6, donde x i  20 , N i  70 y n i  36 , y la estimación
que surge de la Tabla 16.1.

ˆ
L  1,593238 w  0,078669 x i*
i

(1)

Se debe tener en cuenta que





ˆ
ˆ
w  N i Pi 1  Pi  70

36 34
 4,181592
70 70

(2)

x i*  x i w

Si x  20 entonces x i*  20  4,181592  83,63184

(3)

Reemplazando (2) y (3) en (1) L*i  0,083038
Pero L  Li w , por lo que Li 
*
i

Ahora bien, Li  ln

L*i
w

 0,019858 .

Pi
1  Pi

Tomando el antilogaritmo de Li

anti logLi   e

ln

Pi
1Pi



Pi
1  Pi

(4)

Es decir, anti logLi   e 0,019858  0,980338

(5).

Igualando (4) y (5) se obtiene

Pˆ 1  Pˆ   0.980338
i

i



ˆ
Pi  0.495036

Es decir, la probabilidad de que una familia con un ingreso de
$20.000 posea una casa es de alrededor de 0,50.

Estimación con datos individuales
Dado el modelo

Li   1   2 X 2t    k X kt   t
El modelo estimado con datos individuales por Logit será

ˆ
ˆ
ˆ
ˆ
Li   1   2 X 2t    k X kt
728
Este resultado se interpreta de la siguiente manera. En primer lugar
debe tenerse en cuenta que

ˆ
 P
Li  ln i
 1 P
ˆi







Al tomar antilogaritmo en la expresión anterior, tendremos la razón
de probabilidades:

anti logLi   e

ˆ
 P 


ln  i 
1Pi 
 ˆ



ˆ
Pi
 e z  e 1   2 X 2 t  k X kt
ˆ
1  Pi

Para encontrar la probabilidad de ocurrencia del evento dado que las
variables explicativas se comportan de una manera determinada, se
procede de la siguiente manera:

Pi
 e z  Pi  e z 1  Pi 
1  Pi
ez
Pi 
1 e z
Habitualmente, para encontrar el valor de z se le asigna a las
variables cuantitativas el valor medio; con las cualitativas se trabaja
asignando el valor 1 o el valor 0, de acuerdo a que se quiera
encontrar la probabilidad del evento cuando la cualitativa está
presente o ausente.
La tasa marginal de cambio en la probabilidad de ocurrencia del
evento ante cambios en las variables explicativas cuantitativas viene
dado por:

dP
ˆ ˆ
ˆ
  i 1  P P
dX i

19.5 Modelo Probit
Como se ha mencionado, para explicar el comportamiento de una variable
dependiente binaria es preciso usar una función de distribución acumulada
seleccionada apropiadamente.
Para el caso del modelo Logit se usó la función logística acumulativa. La
función de distribución acumulada normal también brinda utilidad a estos
efectos dando lugar a lo que se conoce como modelo Probit o Normit.
729
El modelo probit supone que una variable dependiente Y=1 si una variable
latente o indicadora ∗ viene determinada por
∗

Con

⋯

que se distribuye normal de media 0 y desvío 1.
⋯
∗

Cuanto más alto sea el valor de
ocurra el evento

, mayor será la probabilidad de que
∗

1⁄
⋯
⋯

1
√2

Es decir, la función de distribución acumulativa que permite explicar el
comportamiento de una variable dicótoma es la normal. El valor de Z se
obtiene de igual manera que en el logit, se consideran los valores
promedios de las variables cuantitativas y, alternativamente, los valores 1 o
0 en las variables cualitativas lo que permite definir una situación de
referencia.

Ejemplo: Propiedad de la vivienda (ejemplo desarrollado en Gujarati
(2004))
Supóngase que la decisión de la i–ésima familia de poseer una casa o
de no poseerla depende de un índice de conveniencia no observable
I i , que está determinado por una o varias variables explicativas, por
ejemplo, el ingreso X i , de tal manera que cuando mayor sea el valor
del índice, mayor será la probabilidad de que la familia posea
vivienda.
De esta manera:

Ii  1   2 X i
¿Cómo se relaciona el I i no observable con la decisión de poseer una
casa?
Igual que antes, sea Y  1 si la familia posee una casa e Y  0 si no
la posee.
730
Ahora bien, es razonable suponer que para cada familia hay un nivel
crítico o umbral del índice, que se puede denominar I i , tal que si

I i  I i
la familia poseerá una casa, de lo contrario no lo hará.
Si se supone que el índice y el umbral se distribuyen normales con
igual media y varianza, será posible estimar los parámetros del
modelo y obtener alguna información adicional.
Dado el supuesto de normalidad, la probabilidad de que I i sea menor
o igual que I i puede ser calculada a partir de la FDA normal
estandarizada como





Pi  Pr Y  1  Pr I i  I i  F I i  

1
2



Ii

e t

2

/2



dt 

1
2



1   2 X i



e t

2

/2

dt

donde t es una variable normal estandarizada, es decir t ~ N(0,1).
Ahora, para estimar el modelo, deberá tenerse en cuenta que:

I i  F 1 Pi   1   2 X i
Al igual que el logaritmo de la razón de probabilidades (en el modelo
Logit), la inversa de la FDA normal sirve para hacer lineal al modelo
Probit.
De esta forma el modelo
probabilidades, en este caso

a

estimar

resulta

de

conocer

las

ˆ
I i  F 1 Pi    1   2 X t   t
Luego, aplicar MCP.

Notas:


La perturbación  i , al igual que antes, es heterocedástica.
demostrar que su varianza está dada por    Pi 1  Pi  / N i f i
2

Se puede
2

donde f i 2

es la función de densidad normal estándar evaluada en F 1 Pi  . Por lo
tanto, habrá que ponderar el modelo para aplicar mco.


La variable no observable es conocida como desviación equivalente
normal o simplemente normit. Puesto que normit será negativo siempre
731
que Pi  0.5 , en la práctica se agrega el número 5 al normit y el
resultado se denomina probit.


Los dos métodos presentados son bastante similares, generalmente por
conveniencia matemática se prefiere el logit. Pero como lo sugieren
algunos autores una estimación logit de un parámetro multiplicada por
0.625 proporciona una aproximación relativamente buena de la
estimación probit del mismo parámetro.



También, se puede demostrar que  MPL  0.25  Logit , excepto para el
intercepto que es  MPL  0.25  Logit  0.5 .



Todas las aproximaciones anteriores funcionan bien cuando el valor
promedio de la probabilidad de que suceda el evento no este lejana de
0.5.



Se debe tener cuidado al interpretar el coeficiente de pendiente. En el
mpl el coeficiente de pendiente mide directamente el cambio en la
probabilidad de que ocurra un evento como resultado de un cambio
unitario en el valor del regresor. En el logit la tasa de cambio en la
probabilidad está dada por  j Pi 1  Pi  donde  j es el coeficiente del j–
ésimo regresor. En el probit, la tasa de cambio en la probabilidad es
algo complicada y está dada por  j  z i  , donde   es la función de
densidad

de

zi   1   2 X 2i

análisis.

la

variable
normal
estándar
y
donde
    k X ki o sea, el modelo de regresión utilizado en el

En síntesis, dado el modelo
⋯
Donde
~ 0,1 .

1 si el evento se presenta,

0 si el evento no se presenta y

La estimación da por resultado
∗

⋯

Calculando 	
⋯
Donde indica valor promedio de la variable si es cuantitativa y presencia o
ausencia de la variable en la observación si es cualitativa.
La probabilidad se calcula haciendo
∗
732
Encontrar
equivale a buscar el valor de Z en la tabla de la normal y
determinar su probabilidad asociada.
El efecto marginal de cambio en la probabilidad ante cambios en una
variable cuantitativa viene dado por

Donde
es la función de densidad de la distribución normal de que el
evento promedio ocurra y
el coeficiente de la variable para la cual se
analiza el cambio.

19.6 Modelo Tobit
Es una extensión del modelo Probit, desarrollado por el Nobel J. Tobin.
Continuando con el ejemplo de la vivienda, supóngase ahora que se desea
encontrar la cantidad de dinero que el consumidor gasta en comprar una
casa en relación con su ingreso (y otras variables económicas).
Ahora se tiene un problema: si un consumidor no compra una casa,
obviamente no se tiene información sobre el gasto en vivienda, se tiene tal
información solamente sobre los consumidores que efectivamente compran
casa.
Por lo tanto se tiene dos grupos de consumidores. Unos, digamos n1 sobre
quienes se posee información sobre los regresores y la variable dependiente
y otros, supongamos n 2 sobre quienes solamente se tiene información
sobre los regresores.
Cuando en una muestra la información para la variable dependiente está
disponible solamente para algunas observaciones, ésta se conoce como
muestra censurada. Por consiguiente el modelo Tobit también se conoce
como modelo de regresión censurada.
En términos matemáticos se puede expresar el modelo Tobit como

Yi   1   2 X 2i   2i ; si Y tiene datos
Yi  0 ; en los demás casos
Ante esta situación el modelo sólo se puede estimar por Máxima
Verosimilitud, ya que el término de error no cumple con la propiedad de
media nula. Esto se debe a que sólo se incluyen en la muestra las
observaciones para las cuales  2i    2 X 2i , que puede verse si se escribe el
modelo en forma de desviaciones.
733

19.7 Evaluación de los modelos de probabilidad
Independientemente de si se ha especificado y estimado un modelo logit o
un modelo probit, para evaluar un modelo de probabilidad se tiene en
cuenta:


Significatividad individual a la prueba Z, estos modelos presuponen la
existencia de gran número de datos por lo que la habitual prueba t
tiende a la prueba Z



Significatividad conjunta a través del estadístico de Wald, el que se
distribuye con una chi cuadrado con q grados de libertad (siendo q el
número de restricciones). La hipótesis nula es
:



⋯

0

Significatividad conjunta a través del estadístico de la razón de
verosimilitud (RV), el que se distribuye como una chi cuadrada con k1 grados de libertad (k es el número de parámetros)
:

⋯

0

Porcentaje de predicciones correctas, es el número de veces en que
coincide el valor observado de Y con el valor estimado, respecto del
total de observaciones.


(de Mc Fadden), se basa el logaritmo de la función de
Pseudo
verosimilitud
	

1

Donde
es el logaritmo de la función de verosimilitud para el
es el logaritmo de la función de verosimilitud
modelo estimado y
para un modelo estimado solo de término constante. El Pseudo
varía entre 0 y 1, pero generalmente no alcanza valores cercanos a 1.


Criterios de información de Akaike, Schwarz o Hanna Quinn (HQ),
estos son indicadores válidos cuando se tiene que elegir entre varios
modelos alternativos, siempre debe escogerse aquel que tenga
menor valor en estos indicadores.

Gujarati afirma que en un modelo de regresión binaria es importante que
los signos de los coeficientes coincidan con lo esperado y que sean
significativamente distintos de 0. La bondad de ajuste a través del Pseudo
tiene importancia secundaria.
734

CASOS DE ESTUDIO, PREGUNTAS Y PROBLEMAS
Caso 19.1: Vulnerabilidad social en los hogares de Río Cuarto
El objetivo del trabajo es identificar los fenómenos de mayor impacto en la
determinación de la vulnerabilidad en la ciudad de Río Cuarto
El diccionario de la Real Academia Española define vulnerable como aquel
que puede ser herido o recibir una lesión física o moral
Roberto Pizarro3, consultor de la División de Estadística y Proyecciones
Económicas de CEPAL, define la vulnerabilidad social como un estado de
inseguridad e indefensa que experimentan los individuos en sus condiciones
de vida, en el manejo de recursos y en las estrategias que utilizan para
enfrentar las consecuencias del impacto provocado por algún tipo de evento
económico social
La población estudiada consta de 1686 hogares que tienen bebés nacidos en
el año 2005. Las características cualitativas medidas en estos hogares
reúnen 527 modalidades.
Dado que la vulnerabilidad es un concepto multidimensional, se optó por
realizar un análisis factorial de correspondencia múltiple utilizando 90
variables activas con 381 modalidades asociadas y 9 variables ilustrativas
con 146 modalidades asociadas. La partición del espacio de observación y la
posterior clasificación de los hogares dio lugar a la conformación de 9
grupos, tal como puede observarse en el Gráfico.
Vulnerabilidad Social
Alta-Alta
8,84%

Baja-Baja
14,35%

Alta-Media
25,62%

Baja-Media
18,98%

Alta-Baja
5,58%
Media-Alta
8,78%

Baja-Alta
10,26%
Media-Baja
3,14%
Media-Media
4,45%

3

Pizarro, Roberto (2001). La vulnerabilidad social y sus desafíos. Una mirada desde América Latina.
Estudios Estadísticos y Prospectivos. Serie 6. CEPAL
735
Los hogares que forman los grupos de vulnerabilidad alta (segmentados en
los subgrupos Alta-Alta, Alta-Media y Alta-Baja) se caracterizan por tener
•Baja edad y bajo nivel educativo de la madre y situaciones de
maternidad en cuasi-soledad
•Alto número de hijos, aun en madres muy jóvenes, y comienzo tardío
en la atención durante el embarazo
•Hogares numerosos con alto número de menores de 15 años, bajos
ingresos con pocos aportantes por hogar, no hay aportes
jubilatorios del jefe de hogar y se observan jóvenes entre 15 y 24
años que no estudian ni trabajan.
•Presentan déficit en la infraestructura sanitaria de la vivienda, no
cuentan con gas natural, y se proveen de energía eléctrica de
manera irregular, no son propietarios, los hogares tienen
hacinamiento
•Están expuestos a riesgos por accidentes con electricidad, los bebés
carecen de identificación y no cuentan con cobertura de salud
•Los barrios Alberdi, Banda Norte y Santa Teodora es la ubicación
geográfica de estos grupos.
Además se observó que existían variables comunes a todos los grupos,
independientes del nivel de vulnerabilidad; estas eran
•Edad de la madre
•Edad de la madre al tener el primer hijo
•Existencia de baño en la vivienda
•Provisión de agua potable
•Cantidad de cuartos
•Número de integrantes del hogar
•Ingreso del hogar
•Ingreso per cápita mensual
•Personas que aportan ingresos
Ahora bien, ¿qué nivel de impacto tienen estos factores en los niveles de
vulnerabilidad de los hogares?
Para responder a esto se provee de la Tabla 16.1 que contiene:


Unidades de observación: 1549 hogares con hijos nacidos en 2005



Características observadas
Altavul: 1 pertenencia a grupo de alta vulnerabilidad
0 no pertenencia a grupo de alta vulnerabilidad
MAD: 1 madre adolescente
0 madre adulta
NBI: 1 hogar con NBI
736
0 hogar sin NBI
AI: cantidad de personas que aportan ingresos en el hogar (variable
continua)
IM: ingreso mensual del hogar (variable continua)
IPC: ingreso per cápita diario (variable continua)
Edad: edad actual de la madre (variable continua)
Se solicita


la estimación a través del Modelo Logit y el Modelo Probit



realizar comparaciones entre los resultados de ambos modelos

BIBLIOGRAFIA
□ Chou, Y.L. (1977) “Análisis Estadístico” Segunda Edición. Interamericana.
México
□

Gujarati, D. (2004) "Econometría". 4°Edición. Mc.Graw Hill. México.

□

Gujarati, D. (2010) "Econometría". 5°Edición. Mc.Graw Hill. México.

□ Maddala, G. S. “Introducción a la Econometría” 2º Edición. Prentice Hall.
México.
□ Perez Lopez, C. (2006). “Problemas Resueltos de Econometría”. Editorial
Thomson Paraninfo.
□

Schmidt, S. J. (2005) “Econometría”. Mc-Graw Hill Interamericana. México.

More Related Content

What's hot

Solucionario macroeconomía - josé de gregorio.
Solucionario macroeconomía  - josé de gregorio.Solucionario macroeconomía  - josé de gregorio.
Solucionario macroeconomía - josé de gregorio.jackn15g
 
ESTADISITICA REPORT CLASS.docx seuri kilakoi
ESTADISITICA REPORT CLASS.docx seuri kilakoiESTADISITICA REPORT CLASS.docx seuri kilakoi
ESTADISITICA REPORT CLASS.docx seuri kilakoiSEURI KILAKOI
 
Ejercicio resuelto de oligopolio: modelo de Bertrand
Ejercicio resuelto de oligopolio: modelo de BertrandEjercicio resuelto de oligopolio: modelo de Bertrand
Ejercicio resuelto de oligopolio: modelo de BertrandJuan Carlos Aguado Franco
 
Cap. 2; conceptos basicos en macro.
Cap. 2; conceptos basicos en macro.Cap. 2; conceptos basicos en macro.
Cap. 2; conceptos basicos en macro.jo56mo
 
Clase is lm a demanda agregada
Clase is lm a demanda agregadaClase is lm a demanda agregada
Clase is lm a demanda agregadaKirito Smith
 
Solucionario de econometria
Solucionario de econometriaSolucionario de econometria
Solucionario de econometriasistemasutb
 
Ejercicios resueltos regresion multiple
Ejercicios resueltos  regresion multipleEjercicios resueltos  regresion multiple
Ejercicios resueltos regresion multipleJuan Timoteo Cori
 
Ejercicios de análisis de regresión múltiple
Ejercicios de análisis de regresión múltipleEjercicios de análisis de regresión múltiple
Ejercicios de análisis de regresión múltipleAlberth ibañez Fauched
 
Distribución de bernoulli ejercicios
Distribución de bernoulli ejerciciosDistribución de bernoulli ejercicios
Distribución de bernoulli ejerciciosAurora Sanchez Caro
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesisjesepozo1992
 
Tabla distribución poisson acumulada
Tabla distribución poisson acumuladaTabla distribución poisson acumulada
Tabla distribución poisson acumuladaAvaco Unibague
 
tasa natural de desempleo y la curva phillips
tasa natural de desempleo y la curva phillipstasa natural de desempleo y la curva phillips
tasa natural de desempleo y la curva phillipsfrmarcelo
 
Ejemplos modelos econometricos
Ejemplos modelos econometricosEjemplos modelos econometricos
Ejemplos modelos econometricosSam Wilson
 
Ejercicios econometría1
Ejercicios econometría1Ejercicios econometría1
Ejercicios econometría1cesarmanosalvas
 

What's hot (20)

Solucionario macroeconomía - josé de gregorio.
Solucionario macroeconomía  - josé de gregorio.Solucionario macroeconomía  - josé de gregorio.
Solucionario macroeconomía - josé de gregorio.
 
ESTADISITICA REPORT CLASS.docx seuri kilakoi
ESTADISITICA REPORT CLASS.docx seuri kilakoiESTADISITICA REPORT CLASS.docx seuri kilakoi
ESTADISITICA REPORT CLASS.docx seuri kilakoi
 
Ejercicios Microeconomia
Ejercicios MicroeconomiaEjercicios Microeconomia
Ejercicios Microeconomia
 
Ejercicio de externalidades
Ejercicio de externalidadesEjercicio de externalidades
Ejercicio de externalidades
 
Ejercicio resuelto de oligopolio: modelo de Bertrand
Ejercicio resuelto de oligopolio: modelo de BertrandEjercicio resuelto de oligopolio: modelo de Bertrand
Ejercicio resuelto de oligopolio: modelo de Bertrand
 
Cap. 2; conceptos basicos en macro.
Cap. 2; conceptos basicos en macro.Cap. 2; conceptos basicos en macro.
Cap. 2; conceptos basicos en macro.
 
Ejercicios econometria ii
Ejercicios econometria iiEjercicios econometria ii
Ejercicios econometria ii
 
Clase is lm a demanda agregada
Clase is lm a demanda agregadaClase is lm a demanda agregada
Clase is lm a demanda agregada
 
Solucionario de econometria
Solucionario de econometriaSolucionario de econometria
Solucionario de econometria
 
Ejercicios resueltos regresion multiple
Ejercicios resueltos  regresion multipleEjercicios resueltos  regresion multiple
Ejercicios resueltos regresion multiple
 
Capítulo iv econometría var
Capítulo iv econometría varCapítulo iv econometría var
Capítulo iv econometría var
 
Ejercicios de análisis de regresión múltiple
Ejercicios de análisis de regresión múltipleEjercicios de análisis de regresión múltiple
Ejercicios de análisis de regresión múltiple
 
Distribución de bernoulli ejercicios
Distribución de bernoulli ejerciciosDistribución de bernoulli ejercicios
Distribución de bernoulli ejercicios
 
Distribución beta
Distribución betaDistribución beta
Distribución beta
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Tabla distribución poisson acumulada
Tabla distribución poisson acumuladaTabla distribución poisson acumulada
Tabla distribución poisson acumulada
 
tasa natural de desempleo y la curva phillips
tasa natural de desempleo y la curva phillipstasa natural de desempleo y la curva phillips
tasa natural de desempleo y la curva phillips
 
Ejemplos modelos econometricos
Ejemplos modelos econometricosEjemplos modelos econometricos
Ejemplos modelos econometricos
 
Distribución de poisson
Distribución de poissonDistribución de poisson
Distribución de poisson
 
Ejercicios econometría1
Ejercicios econometría1Ejercicios econometría1
Ejercicios econometría1
 

Similar to Modelo probabilidad

Similar to Modelo probabilidad (20)

Trabajo final de econometria upc
Trabajo final de econometria upcTrabajo final de econometria upc
Trabajo final de econometria upc
 
VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD. Bioestadística. LolaFFB
VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD. Bioestadística. LolaFFBVARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD. Bioestadística. LolaFFB
VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD. Bioestadística. LolaFFB
 
Notas_Probit_Logit.ppt
Notas_Probit_Logit.pptNotas_Probit_Logit.ppt
Notas_Probit_Logit.ppt
 
Conceptos Estadísticos para la Modelación Predictiva
Conceptos Estadísticos para la Modelación PredictivaConceptos Estadísticos para la Modelación Predictiva
Conceptos Estadísticos para la Modelación Predictiva
 
Estad uma 05
Estad uma 05Estad uma 05
Estad uma 05
 
Regresion Logitica (7).pptx
Regresion Logitica (7).pptxRegresion Logitica (7).pptx
Regresion Logitica (7).pptx
 
Dist prob discretas 2
Dist prob discretas 2Dist prob discretas 2
Dist prob discretas 2
 
20121109101108
2012110910110820121109101108
20121109101108
 
Distribuciones
DistribucionesDistribuciones
Distribuciones
 
estadistica descriptiva
estadistica descriptivaestadistica descriptiva
estadistica descriptiva
 
Estadisticos modelos probabilisticos 29 3-2020
Estadisticos modelos probabilisticos 29 3-2020Estadisticos modelos probabilisticos 29 3-2020
Estadisticos modelos probabilisticos 29 3-2020
 
Notas_Clase_5_Probit_Logit.ppt
Notas_Clase_5_Probit_Logit.pptNotas_Clase_5_Probit_Logit.ppt
Notas_Clase_5_Probit_Logit.ppt
 
PROBIT.ppt
PROBIT.pptPROBIT.ppt
PROBIT.ppt
 
Estadistica 6
Estadistica 6Estadistica 6
Estadistica 6
 
Modelos probabilidades
Modelos probabilidadesModelos probabilidades
Modelos probabilidades
 
T6
T6T6
T6
 
Estadística II
Estadística IIEstadística II
Estadística II
 
Hipotesis
HipotesisHipotesis
Hipotesis
 
Probabilidades est
Probabilidades estProbabilidades est
Probabilidades est
 
Evaluacion de desempeño umayor 2013
Evaluacion de desempeño umayor 2013Evaluacion de desempeño umayor 2013
Evaluacion de desempeño umayor 2013
 

Modelo probabilidad

  • 1. Capítulo 19. MODELOS DE PROBABILIDAD 19.1. Características En el modelo mínimo cuadrático Yt   1   2 X 2t     k X kt   t  Las variables X pueden cuantitativas o cualitativas  La variable Y sólo puede ser cuantiativa En la práctica, en muchas ocasiones, se tiene la necesidad de explicar la ocurrencia de un evento. Esto se representa a través de una variable binaria que asume el valor 1, si el evento sucede, y el valor 0, si no sucede; es decir, produce una respuesta de sí o no, de acuerdo a la presencia de la cualidad que se quiera medir. Este tipo de situaciones se estudian a partir de los Modelos de Probabilidad. La variable dependiente binaria también se denomina variable dependiente limitada o variable indicadora. Estas variables tienen restringido su rango de variabilidad y muchas conducen a soluciones de esquina, esto significa que resulta óptimo elegir el 0 para un número importante de situaciones. Ejemplo. Supongamos que se desea estudiar la participación de la fuerza laboral de hombres adultos en función de la tasa de desempleo, de la tasa de salarios promedio, del ingreso familiar, de la educación, etc. Una persona o bien está en la fuerza laboral o no está. Por tanto, la variable dependiente que es la participación en la fuerza laboral, solamente puede adquirir dos valores: 1 si la persona está en la fuerza laboral y 0 si no lo está. Se considerarán los cuatro enfoques de mayor difusión  Modelo lineal de probabilidad (MPL)  Modelo Logit  Modelo Probit  Modelo Tobit
  • 2. 714 19.2. Modelo Lineal de Probabilidad En la década del ´60 y principios de la siguiente, el modelo de probabilidad lineal (MPL) se utilizó ampliamente y la estimación se realizaba a partir del mínimo cuadrado ordinario. En estos modelos, la variable Y es indicadora de ocurrencia o no ocurrencia de un evento. Dado 1 Y 0 si el evento ocurre si el evento no ocurre El modelo se especifica Yt  β1  β2 X 2t    β k X kt  ε t (1) donde, Y es una variable cualitativa X 2 , X 3 , X k son variables explicativas de carácter cuantitativo o cualitativo Si E(ε i )  0 , entonces la esperanza condicional E( Yt X i )  β1  β2 X2t    βk X kt (2) Debe interpretarse como la probabilidad de que ocurra el evento, dado que ocurren las X i ; es decir, PYi  1 Xi   E( Yt Xi )  β1  β2 X2t    βk Xkt Modelos de este tipo, que expresan la variable binaria como una función lineal de la o las variables independientes, se denominan Modelo de Probabilidad Lineal puesto que la E( Yt X i ) , puede ser interpretada como la probabilidad condicional de que el evento suceda dado X i . Ejemplo. En un estudio en los hogares, si Y mide la posesión de una casa -Y=1 cuando la familia posee casa y Y=0 cuando no posee- y X el nivel de ingresos. La E Yi X i  da la probabilidad de que una familia posea una casa dado que tiene un ingreso de cierta cantidad X i
  • 3. 715 Haciendo, Pi  prob(Yi )  1 -que el evento ocurra- y 1  Pi  prob(Yi )  0 que el evento no ocurra-, la distribución de probabilidad de la variable Y (que sigue la distribución de probabilidad Bernoulli1) viene dada por: Yi Probabilidad 0 1  Pi 1 Pi Total 1 ˆ ˆ ˆ EYi  1 X i   β1  β2 X 2t    βk X kt ˆ ˆ ˆ EYi  0 X i   1  β1  β2 X 2t    βk X kt   (3) Por consiguiente, por definición de esperanza matemática se obtiene E Yi   01  Pi   1Pi   Pi comparando con E Yi X i    1   2 X 2t     k X kt , se puede igualar E Yi X i    1   2 X 2t     k X kt  Pi es decir, la esperanza condicional del modelo puede ser interpretada, de hecho, como la probabilidad condicional de Yi Puesto que la probabilidad Pi debe encontrarse entre 0 y 1, se tiene la restricción 0  EYi Xi   1 es decir, la esperanza encontrarse entre 0 y 1. condicional (4) o probabilidad condicional debe En aplicaciones prácticas el MPL, especificado en (1), presenta problemas tales como,   No normalidad de los t . Al igual que la variable Y, los errores siguen una distribución Bernoulli: ˆ ˆ ˆ ˆ e  Yi  Yi  Yi  β1  β2 X 2t    βk X kt 1 El modelo de probabilidad Bernoulli se aplica a una variable que puede asumir solo dos valores y donde la suma de las probabilidades de ocurrencia de cada uno de esos valores es igual a 1. El modelo binomial es la suma de n variables Bernoulli. Bernoulli Binomial p np Media EX  Varianza V X  Ya-Lu Chou (1977) pág. 152 p(1-p) np(1-p)
  • 4. 716 Y 1 e ˆ  β X  β X ˆ ˆ 1  β1 2 2t k kt ˆ  β X  β X ˆ ˆ 0  β1 2 2t k kt 0 Probabilidad Pi 1  Pi Este problema puede obviarse si se trabaja con un alto número de observaciones, porque se sabe que si n tiende a infinito, los estimadores mínimoS cuadráticos tienden a estar normalmente distribuidos.  Heterocedasticidad de ε t . En la distribución Bernoulli, la media es p y la varianza es p(1-p); lo cual revela que la varianza es función de la media, por lo que la varianza del error es heterocedástica. ˆ ˆ ˆ En el MLP, si P  β1  β2 X 2t    βk X kt y la varianza es P(1-P), quiere decir que la varianza de ε es heterocedástica porque depende de los valores de X. Una forma de resolver el modelo es transformar (1) dividiendo ambos miembros por Pi 1  Pi   Wi ; es decir: Yt Wi  β1 Wi  β2 X2t Wi    βk X kt Wi  εt Wi El término de error es homocedástico; la estimación se realiza mediante mínimos cuadrados ponderados, lo cual significa aplicar mínimos cuadrados ordinarios a un modelo ponderado por W.    ˆ La posibilidad de que E Yt X se encuentre fuera del rango 0 – 1. Aquí radica el problema real en la estimación mínimo cuadrática del MPL. En la práctica se resuelve de la siguiente manera ˆ ˆ Si Y  0 se asume que Y  0 ˆ ˆ Si Y  1 se asume que Y  1  2 2 Valores generalmente bajos de R . El R no es considerado como medida de bondad de ajuste porque los valores observados de Y serán 0 o 1; mientras que, los valores estimados abarcan todo el recorrido de los números reales. Esto significa que: ˆ Yi puede ser  0 ˆ 0  Y 1 i ˆ Yi  1 En la práctica, se realiza una estimación restringida o truncada:
  • 5. 714 ˆ ˆ Si Yi  1 se asume que Yi  1 ˆ ˆ Si Yi  0 se asume que Yi  0 2 El valor de R no puede indicar la bondad de la estimación porque habrá un grupo de observaciones que asumirán un valor estimado que no es el correcto. Cuando la dispersión de las observaciones está muy concentrado en dos puntos, puede 2 esperarse un R cercano al 0,8. En general, se aconseja no tener en 2 cuenta el R como medida de bondad de ajuste Aldrich y Nelson sostienen que el uso del coeficiente de determinación como estadístico resumen debe evitarse en modelos con variable dependiente cualitativa. Para solucionar estos problemas se presentan los modelos Logit y Probit (Normit). Aún salvando estos problemas el MPL no es un modelo muy atractivo porque supone que aumenta linealmente con X, es decir el efecto marginal o incremental de X permanece constante todo el tiempo. En realidad se esperaría que Pi estuviera relacionado en forma no lineal con X i Ejemplo. Si se aplica el modelo de propiedad de la vivienda y se ˆ encuentra que  2  0.10 significaría que a medida que X aumenta una unidad (supongamos en miles de pesos), la probabilidad de ser propietario de una vivienda aumenta en la misma cantidad constante de 0.10. Esto es así para niveles de ingreso de $ 8.000; $15.000 o $50.000. Esto no parece ser realista. Para ingresos muy bajos una familia no poseerá una casa, pero a un nivel de ingresos suficientemente alto, por ejemplo $a es muy probable que ésta sí posea una casa. Cualquier aumento en el ingreso más allá de $a tendrá un efecto pequeño sobre la probabilidad de poseer una casa. Así a ambos extremos de la distribución de ingresos, la probabilidad de poseer una casa no se verá afectada, virtualmente, por un pequeño incremento en X . En síntesis, al modelo especificado en (1) se lo denomina lineal de probabilidad porque la probabilidad de respuesta es lineal en los parámetros
  • 6. 714 β. A la expresión se la denomina probabilidad de respuesta e indica que las probabilidades (tanto de ocurrencia como de no ocurrencia) dependen de los valores de X. Para solucionar estos problemas se presentan a continuación los modelos Logit y Probit (Normit). Ejemplo: Estudio sobre la vulnerabilidad en la ciudad de Río Cuarto Se cuenta con información para 1549 hogares de la ciudad de Río Cuarto con hijos nacidos durante 2005. A partir de un estudio exploratorio (AFCM) se identificaron nueve grupos sociales que se clasificaron en Esta partición permitió la construcción de la Vulnerabilidad (ALTAVUL) de la siguiente manera: variable Alta
  • 7. 715 El objetivo es identificar los fenómenos de mayor impacto en la determinación de la alta vulnerabilidad en la ciudad de Río Cuarto. El modelo se especifica Donde MAD indica la situación de la madre según su edad 1, 0, NBI indica las necesidades básicas insatisfechas que tiene el hogar observado 1, 0, sin EDAD edad actual de la madre AI número de personas que aportan ingresos en el hogar IM ingreso mensual del hogar en pesos de 2005 IPC ingreso per cápita diario del hogar en pesos de 2005 La estimación del modelo se realiza por mínimo cuadrados ordinarios, luego se le dan valores de referencia a las variables explicativas y el valor indicará la probabilidad de pertenecer a un grupo social de alta vulnerabilidad. La estimación del ejemplo no está exenta de lo que se mencionó . anteriormente: no normalidad, heterocedasticidad y poca relevancia de Frente a esto, lo que se necesita es un modelo probabilístico que tenga: 1. Probabilidad acotada al intervalo 0-1 2. Probabilidad creciente conforme aumentan los valores de X 3. Relación no lineal entre la probabilidad y X, de modo que al acercarse a 1 o 0 lo haga a tasa decreciente. Las funciones que tienen estas características son las distribuciones acumulativas en forma de S. Aunque hay casos que cumplen con estos requisitos, las más usadas son la logística y la normal, que dan lugar a los modelos de probabilidad Logit y Probit o Normit.
  • 8. 716 19.3 Modelos de Probabilidad con distribución acumulativa Estos modelos se especifican de la siguiente manera ∗ ⋯ Donde ∗ es una variable latente que se define como la proyección, capacidad o posibilidad de que el evento bajo estudio ocurra. La variable latente no se puede observar, por lo que debe aproximarse a través de una variable relacionada que sí se pueda observar. Esta variable es la que indica la presencia o ausencia del evento en una población. Ejemplo: Estudio sobre la vulnerabilidad en la ciudad de Río Cuarto La variable observable es el individuo que presenta situación de vulnerabilidad, la variable no observable es la posibilidad de que el individuo esté en una situación de alta vulnerabilidad. El método de estimación de estos modelos es el de máxima verosimilitud (MV). La verosimilitud de la iésima observación es la probabilidad de que Y tome el valor que se observa que toma, de modo que la verosimilitud de cada observación depende del valor de los parámetros β y de si el evento se presenta o no. Si se tienen n observaciones idénticas e independientemente distribuidas que siguen el modelo ⋯ 1| tome el valor que se La función de verosimilitud es la probabilidad de que observa para cada elemento de la muestra condicionado a los valores de X. La función de verosimilitud puede escribirse como 1 0 Lo cual implica que la probabilidad de que un grupo de observaciones tome efectivamente los valores observados de Y es igual al producto de las probabilidades de cada observación. De modo que: 1 Con 1| … ´ 1 ´
  • 9. 717 ⋯ ´ El estimador de máxima verosimilitud de β es el que maximiza el logaritmo de la función de verosimilitud ln ´ ln Que será un estimador asintóticamente eficiente. ln 1 consistente, ´ 1 asintóticamente normal y Las condiciones de primer orden serán 1 ´ ´ ´ 1 ´ ´ 1 ´ ´ 0 Al ser un problema no lineal, su resolución se alcanza al aplicar métodos iterativos y el estimador se obtiene por métodos numéricos iterativos. En definitiva, el principio de máxima verosimilitud consiste en escoger valores estimados de los parámetros β que maximicen la función de verosimilitud. Los estimadores de máxima verosimilitud son los valores por los cuales la probabilidad de “observar la muestra que se observa” es tan grande como sea posible. Los modelos logit y probit difieren en la especificación del término de error 1 ⋯ ⋯ 1 Donde F es la función de distribución acumulada de Si la distribución de es simétrica, haciendo ⋯ 1 Es posible escribir
  • 10. 718 ⋯ La forma funcional de F dependerá de la suposición en torno al término ε; si la distribución que acumula ε es logística, se tiene el logit, mientras que, si es normal se tiene el probit (o normit). Los modelos logit y probit son modelos de respuesta binaria 1⁄ … ⋯ La toma valores entre 0 y 1. Si es logística Si es logística 1 1 1 Da lugar al modelo logit cuya expresión será ⋯ ⋯ 1 ⋯ 1 Da lugar al modelo logit cuya expresión será ⋯ ⋯ 1 Si ⋯ 1 es normal Donde 1 √2 ~ 0,1 Se tiene el modelo probit, cuya expresión será 1 ⋯ √2 ⋯ 1 √2
  • 11. 719 19.4 Modelo Logit El modelo logit supone que una variable dependiente ∗ ⋯ ∗ Donde se tiene una variable latente logística. Denominando 1, 0, y se distribuye como una ⋯ 1 1⁄ 1 1 1 Donde X son las variables explicativas e Y las variables dicótomas; si Y=1 significa que el evento ocurre, si Y=0 el evento no ocurre. es la probabilidad de que el evento se presente se lo conoce como función de distribución logística acumulativa Si ∞ Cuando ∞, la 0 → ∞, 1 → 0 y cuando → ∞, → ∞2 no se relaciona linealmente con X por lo que se satisfacen los requerimientos expuestos anteriormente. Esta función se comporta diferente al modelo lineal de probabilidad Si el evento se presenta 1 Si no se presenta 1 1 1 La razón de probabilidades a favor del evento bajo estudio es 1 1 1 1 Tomando logaritmo de la razón de probabilidades 1 2 Recuerde de que e=2.71828 ln ⋯
  • 12. 720 A L se lo denomina logit; si es positivo la probabilidad tiende a 1, si es negativo tiende a 0. L se relaciona linealmente con las variables X y los coeficientes β; mientras que, la probabilidad guarda una relación no lineal con las variables X y los coeficientes β. Para estimar un modelo logit, se debe especificar el modelo ⋯ Donde 1 el evento se presenta, 0 el evento no se presenta, ~ logística La estimación da por resultado 1 ln ⋯ indica el cambio marginal que un cambio en X provoca en L, pero no indica en cuanto variará la probabilidad. Esta situación se deriva de las relaciones no lineales planteadas anteriormente y da lugar a que se deba definir una situación de referencia (o situación promedio) para encontrar el valor de Z. Esto se logra haciendo que: 1. Las variables X cuantitativas adopten el valor promedio 2. Las variables X cualitativas adopten alternativamente el valor 0 y el 1 Con el valor de Z se calcula la probabilidad de la siguiente manera: 1 aplicando antilogaritmo → 1 La incógnita es la probabilidad, que se resuelve como Los cambios en X impactan en L en la cuantía β, como se dijo anteriormente, y en la probabilidad de acuerdo a 1
  • 13. 721 Ejemplo: Propiedad de la vivienda (ejemplo desarrollado en Gujarati (2004)) Ahora se considerará la siguiente especificación Y t 1   2 X t   t Y  Pi  E Y  1 X t   donde 1 1  e (  1   2 X t )  1 ez  1  e z 1  e z X es el ingreso Y  1 significa que la familia es propietaria de una casa ez representa la probabilidad de que el evento se presente. 1 e z Por simplicidad, se escribe la ecuación de la siguiente manera: Pi  1 ˆ ˆ ; donde z i  1   2 X i  zi 1 e Esta última ecuación (acumulativa). es la función de distribución logística Es fácil verificar que mientras zi se encuentra dentro de un rango de   a  , Pi se encuentra dentro de un rango de 0 a 1 y que Pi no está linealmente relacionada con zi (es decir, con X i ), satisfaciendo así los dos requerimientos considerados anteriormente. Pero se crea un problema de estimación porque Pi no es solamente no lineal en las X sino también en los  , como puede verse a partir de la ecuación del modelo. Esto significaría que no se puede utilizar MCO para estimar los parámetros. Pero, este problema es más aparente que real ya que el modelo es intrínsecamente lineal, lo cual puede verse de la siguiente manera. Si el evento se presenta Pi  1 1  e  zi Si el evento no se presenta la probabilidad es 1  Pi  1 1 e z
  • 14. 722 La razón de probabilidad a favor del evento bajo estudio se expresa como ez z Pi  1 e  e z 1 1  Pi 1 e z La razón de probabilidades a favor de poseer una casa se interpreta como la probabilidad de que una familia posea una casa a la probabilidad de que no la posea. Así si Pi  0.8 significa que las probabilidades son 4 a 1 a favor de la familia que posee una casa. Tomando logaritmo natural de la razón de probabilidades  P Li  ln i  1 P i     In e zi  Z i  1   2 X t   L es denominado logit, es lineal en X y lineal en los parámetros: Si L  0 a valores crecientes de X , se incrementa la probabilidad de ocurrencia del evento  Si L  0 a valores crecientes de X , disminuye la probabilidad de ocurrencia del evento  A continuación se enuncian los aspectos que caracterizan al modelo Logit: 1. A medida que P va de 0 a 1 (cuando Z varía de   a  ) el Logit L va de   a  . Es decir, aunque las probabilidades (por necesidad) se encuentran entre 0 y 1, los Logit no están limitados en esa forma. 2. Aunque L es lineal en X, las probabilidades en sí mismas no lo son. Esta propiedad hace contraste con el MLP en donde las probabilidades aumentan linealmente con X. 3. Utilizando el cálculo, puede demostrarse que dP dX i   i P (1  P ) , lo cual muestra que la tasa de cambio en la probabilidad con respecto a X contiene no solamente a  i sino también al nivel de probabilidad a partir del cual se mide el cambio. A propósito, obsérvese que un cambio unitario en X i sobre P es máximo cuando P  0.5 y mínimo cuando P está cercano a 0 o a 1. 4. La interpretación del modelo LOGIT es la siguiente:  i , la pendiente, mide el cambio en L ocasionado por un cambio unitario en X i . En el ejemplo, como el logaritmo de las probabilidades a
  • 15. 723 favor de poseer una casa cambia a medida que el ingreso cambia en una unidad (supongamos, $1.000). El intercepto  1 es el valor del logaritmo de las probabilidades a favor de poseer una casa si el ingreso es cero. 5. Dado un nivel de ingreso determinado, por ejemplo $a, si realmente se desea estimar la probabilidad misma de poseer una casa, y no las probabilidades a favor de poseer una casa, esto puede hacerse directamente a partir de la primera ecuación una vez de que se disponga de las estimaciones de  1 y  2 . 6. Mientras que el MLP supone que Pi está relacionado linealmente con X i , el modelo LOGIT supone que el logaritmo de la razón de probabilidades está relacionado linealmente con X i . Estimación del modelo A fines de la estimación el modelo se especifica  P Li  ln i  1 P i     1   2 X t   t   Para estimar el modelo, además de los valores de X i , se necesitan los valores del logit Li pero se incurre en algunas dificultades. En el caso del ejemplo (y en otros similares) si existe información disponible sobre familias individuales, entonces Pi  1 si una familia posee una casa y Pi  0 si una familia no la posee. Pero si se colocan estos valores directamente en el logit Li se obtiene  1 Li  ln  si una familia posee una casa 0 0 Li  ln  si una familia no posee una casa.  1 Ambas expresiones carecen de sentido. Por consiguiente, si la información disponible está a nivel micro o individual, no se puede estimar el modelo mediante la rutina del método de mínimos cuadrados ordinarios. En esta situación se recurre a máxima verosimilitud. Pero es posible estimar por MCO si se tiene datos agrupados
  • 16. 724 Estimación con datos agrupados La información se agrupa siguiendo algún criterio y se estima por mínimos cuadrados ordinarios. En el ejemplo de familias propietarias de viviendas, la información puede agruparse según el nivel de ingresos. 1 2 3 4 5 6 7 8 9 10 X i , ingreso N i , número de familias ni , número de familias (miles de $) Obs con ingreso X i 40 50 60 80 100 70 65 50 40 25 que poseen casa 6 8 10 13 15 20 25 30 35 40 8 12 18 28 45 36 39 33 30 20 Luego se deben seguir los siguientes pasos: 1. Para cada nivel de ingreso X i calcular la probabilidad estimada n  ˆ de poseer una casa como Pi   i  ; es decir la frecuencia relativa. N   i Se puede utilizar ésta como una estimación del verdadero Pi ˆ correspondiente a cada X i . Si N i es relativamente grande, Pi será una estimación razonablemente buena de Pi (de la estadística elemental recuerde que la probabilidad de un evento es el límite de la frecuencia relativa a medida que el tamaño de la muestra se hace infinitamente grande). 2. Utilizando Pi estimado, se puede obtener el Logit estimado como ˆ  P ˆ Li  ln i  1 P ˆi   ˆ ˆ   1   2 X t   3. Por lo tanto, dada la información agrupada o replicada (observaciones repetidas), se puede obtener información sobre la variable dependiente, los Logit. 4. La interpretación se realiza de la siguiente manera:  P Li  ln i  1 P i     
  • 17. 725 al tomar antilogaritmo a esta expresión se obtiene la razón de probabilidades Pero ˆ Pi ˆ 1  Pi ˆ Pi Pi ˆ ˆ  e z esto significa que  e 1   2 X 2 t ˆ 1  Pi 1  Pi Al resultado de evaluar e z se le resta 1 y se lo multiplica por 100, este resultado es el cambio porcentual a favor de la ocurrencia del evento ante el cambio en algún regresor. 5. Si se quiere calcular la probabilidad P se debe hacer Pi  ez 1  Pi  Pi  e z 1  Pi   Pi  ez 1 e z 6. Puede demostrarse que si N i es relativamente grande y cada observación en una clase de ingreso dado X i está distribuida en forma independiente como una variable binomial, entonces  1   i  N 0,   N i Pi 1  Pi  por consiguiente, como en el caso del MLP, el término de perturbación es heterocedástico y habrá que utilizar MCP. En esta situación se usará la siguiente transformación del modelo Wi Li   1 Wi   i Wi X i  Wi  i   que se escribe como: Li   1 W i   i X i   i  ˆ ˆ donde W i  N i Pi 1  Pi  es el coeficiente que pondera L es igual a Li ponderada i X i es igual a X i ponderada  i es el término de error ponderado homocedástico 7. Estímese la ecuación transformada mediante MCO. Tenga en cuenta que en esta ecuación no hay término de intercepto introducido explícitamente, por lo que se tendrá que usar el procedimiento de regresión a través del origen.
  • 18. 726 8. Establézcanse intervalos de confianza y/o pruebas de hipótesis dentro de lo usual para MCO, cuyos resultados serán válidos sólo para muestras relativamente grandes. Aunque paquetes tales como el EVIEWS estiman directamente estos modelos, apliquemos el razonamiento anterior para comprender algunos resultados. La estimación por MCP sin ordenada al origen da: Esto es, ˆi L  1.5932 Wi  0.0787 X i  ˆ ˆ El intercepto estimado es  i N i Pi 1  Pi  Como muestra esta regresión, el coeficiente de pendiente estimado sugiere que para un incremento unitario ($1.000) en el ingreso ponderado, el logaritmo ponderado de las probabilidades a favor de poseer una casa aumenta en alrededor de 0.08. Tomando antilogaritmo de 0.0787, se obtiene aproximadamente 1.0818, lo cual significa que para un incremento unitario en los ingresos ponderados, las probabilidades ponderadas a favor de poseer una casa aumentan en 1.0818 o alrededor de 8.18%. ¿Se puede calcular la probabilidad de poseer una casa, dado el ingreso, a partir de la razón de probabilidades? Este cálculo puede hacerse fácilmente. Supóngase que se desea estimar la probabilidad de poseer una casa para el nivel de ingreso de $20.000. Se tiene el dato observado en la Tabla 16.1 para la
  • 19. 727 observación 6, donde x i  20 , N i  70 y n i  36 , y la estimación que surge de la Tabla 16.1. ˆ L  1,593238 w  0,078669 x i* i (1) Se debe tener en cuenta que   ˆ ˆ w  N i Pi 1  Pi  70 36 34  4,181592 70 70 (2) x i*  x i w Si x  20 entonces x i*  20  4,181592  83,63184 (3) Reemplazando (2) y (3) en (1) L*i  0,083038 Pero L  Li w , por lo que Li  * i Ahora bien, Li  ln L*i w  0,019858 . Pi 1  Pi Tomando el antilogaritmo de Li anti logLi   e ln Pi 1Pi  Pi 1  Pi (4) Es decir, anti logLi   e 0,019858  0,980338 (5). Igualando (4) y (5) se obtiene Pˆ 1  Pˆ   0.980338 i i  ˆ Pi  0.495036 Es decir, la probabilidad de que una familia con un ingreso de $20.000 posea una casa es de alrededor de 0,50. Estimación con datos individuales Dado el modelo Li   1   2 X 2t    k X kt   t El modelo estimado con datos individuales por Logit será ˆ ˆ ˆ ˆ Li   1   2 X 2t    k X kt
  • 20. 728 Este resultado se interpreta de la siguiente manera. En primer lugar debe tenerse en cuenta que ˆ  P Li  ln i  1 P ˆi      Al tomar antilogaritmo en la expresión anterior, tendremos la razón de probabilidades: anti logLi   e ˆ  P    ln  i  1Pi   ˆ  ˆ Pi  e z  e 1   2 X 2 t  k X kt ˆ 1  Pi Para encontrar la probabilidad de ocurrencia del evento dado que las variables explicativas se comportan de una manera determinada, se procede de la siguiente manera: Pi  e z  Pi  e z 1  Pi  1  Pi ez Pi  1 e z Habitualmente, para encontrar el valor de z se le asigna a las variables cuantitativas el valor medio; con las cualitativas se trabaja asignando el valor 1 o el valor 0, de acuerdo a que se quiera encontrar la probabilidad del evento cuando la cualitativa está presente o ausente. La tasa marginal de cambio en la probabilidad de ocurrencia del evento ante cambios en las variables explicativas cuantitativas viene dado por: dP ˆ ˆ ˆ   i 1  P P dX i 19.5 Modelo Probit Como se ha mencionado, para explicar el comportamiento de una variable dependiente binaria es preciso usar una función de distribución acumulada seleccionada apropiadamente. Para el caso del modelo Logit se usó la función logística acumulativa. La función de distribución acumulada normal también brinda utilidad a estos efectos dando lugar a lo que se conoce como modelo Probit o Normit.
  • 21. 729 El modelo probit supone que una variable dependiente Y=1 si una variable latente o indicadora ∗ viene determinada por ∗ Con ⋯ que se distribuye normal de media 0 y desvío 1. ⋯ ∗ Cuanto más alto sea el valor de ocurra el evento , mayor será la probabilidad de que ∗ 1⁄ ⋯ ⋯ 1 √2 Es decir, la función de distribución acumulativa que permite explicar el comportamiento de una variable dicótoma es la normal. El valor de Z se obtiene de igual manera que en el logit, se consideran los valores promedios de las variables cuantitativas y, alternativamente, los valores 1 o 0 en las variables cualitativas lo que permite definir una situación de referencia. Ejemplo: Propiedad de la vivienda (ejemplo desarrollado en Gujarati (2004)) Supóngase que la decisión de la i–ésima familia de poseer una casa o de no poseerla depende de un índice de conveniencia no observable I i , que está determinado por una o varias variables explicativas, por ejemplo, el ingreso X i , de tal manera que cuando mayor sea el valor del índice, mayor será la probabilidad de que la familia posea vivienda. De esta manera: Ii  1   2 X i ¿Cómo se relaciona el I i no observable con la decisión de poseer una casa? Igual que antes, sea Y  1 si la familia posee una casa e Y  0 si no la posee.
  • 22. 730 Ahora bien, es razonable suponer que para cada familia hay un nivel crítico o umbral del índice, que se puede denominar I i , tal que si I i  I i la familia poseerá una casa, de lo contrario no lo hará. Si se supone que el índice y el umbral se distribuyen normales con igual media y varianza, será posible estimar los parámetros del modelo y obtener alguna información adicional. Dado el supuesto de normalidad, la probabilidad de que I i sea menor o igual que I i puede ser calculada a partir de la FDA normal estandarizada como   Pi  Pr Y  1  Pr I i  I i  F I i   1 2  Ii e t 2 /2  dt  1 2  1   2 X i  e t 2 /2 dt donde t es una variable normal estandarizada, es decir t ~ N(0,1). Ahora, para estimar el modelo, deberá tenerse en cuenta que: I i  F 1 Pi   1   2 X i Al igual que el logaritmo de la razón de probabilidades (en el modelo Logit), la inversa de la FDA normal sirve para hacer lineal al modelo Probit. De esta forma el modelo probabilidades, en este caso a estimar resulta de conocer las ˆ I i  F 1 Pi    1   2 X t   t Luego, aplicar MCP. Notas:  La perturbación  i , al igual que antes, es heterocedástica. demostrar que su varianza está dada por    Pi 1  Pi  / N i f i 2 Se puede 2 donde f i 2 es la función de densidad normal estándar evaluada en F 1 Pi  . Por lo tanto, habrá que ponderar el modelo para aplicar mco.  La variable no observable es conocida como desviación equivalente normal o simplemente normit. Puesto que normit será negativo siempre
  • 23. 731 que Pi  0.5 , en la práctica se agrega el número 5 al normit y el resultado se denomina probit.  Los dos métodos presentados son bastante similares, generalmente por conveniencia matemática se prefiere el logit. Pero como lo sugieren algunos autores una estimación logit de un parámetro multiplicada por 0.625 proporciona una aproximación relativamente buena de la estimación probit del mismo parámetro.  También, se puede demostrar que  MPL  0.25  Logit , excepto para el intercepto que es  MPL  0.25  Logit  0.5 .  Todas las aproximaciones anteriores funcionan bien cuando el valor promedio de la probabilidad de que suceda el evento no este lejana de 0.5.  Se debe tener cuidado al interpretar el coeficiente de pendiente. En el mpl el coeficiente de pendiente mide directamente el cambio en la probabilidad de que ocurra un evento como resultado de un cambio unitario en el valor del regresor. En el logit la tasa de cambio en la probabilidad está dada por  j Pi 1  Pi  donde  j es el coeficiente del j– ésimo regresor. En el probit, la tasa de cambio en la probabilidad es algo complicada y está dada por  j  z i  , donde   es la función de densidad de zi   1   2 X 2i análisis. la variable normal estándar y donde     k X ki o sea, el modelo de regresión utilizado en el En síntesis, dado el modelo ⋯ Donde ~ 0,1 . 1 si el evento se presenta, 0 si el evento no se presenta y La estimación da por resultado ∗ ⋯ Calculando ⋯ Donde indica valor promedio de la variable si es cuantitativa y presencia o ausencia de la variable en la observación si es cualitativa. La probabilidad se calcula haciendo ∗
  • 24. 732 Encontrar equivale a buscar el valor de Z en la tabla de la normal y determinar su probabilidad asociada. El efecto marginal de cambio en la probabilidad ante cambios en una variable cuantitativa viene dado por Donde es la función de densidad de la distribución normal de que el evento promedio ocurra y el coeficiente de la variable para la cual se analiza el cambio. 19.6 Modelo Tobit Es una extensión del modelo Probit, desarrollado por el Nobel J. Tobin. Continuando con el ejemplo de la vivienda, supóngase ahora que se desea encontrar la cantidad de dinero que el consumidor gasta en comprar una casa en relación con su ingreso (y otras variables económicas). Ahora se tiene un problema: si un consumidor no compra una casa, obviamente no se tiene información sobre el gasto en vivienda, se tiene tal información solamente sobre los consumidores que efectivamente compran casa. Por lo tanto se tiene dos grupos de consumidores. Unos, digamos n1 sobre quienes se posee información sobre los regresores y la variable dependiente y otros, supongamos n 2 sobre quienes solamente se tiene información sobre los regresores. Cuando en una muestra la información para la variable dependiente está disponible solamente para algunas observaciones, ésta se conoce como muestra censurada. Por consiguiente el modelo Tobit también se conoce como modelo de regresión censurada. En términos matemáticos se puede expresar el modelo Tobit como Yi   1   2 X 2i   2i ; si Y tiene datos Yi  0 ; en los demás casos Ante esta situación el modelo sólo se puede estimar por Máxima Verosimilitud, ya que el término de error no cumple con la propiedad de media nula. Esto se debe a que sólo se incluyen en la muestra las observaciones para las cuales  2i    2 X 2i , que puede verse si se escribe el modelo en forma de desviaciones.
  • 25. 733 19.7 Evaluación de los modelos de probabilidad Independientemente de si se ha especificado y estimado un modelo logit o un modelo probit, para evaluar un modelo de probabilidad se tiene en cuenta:  Significatividad individual a la prueba Z, estos modelos presuponen la existencia de gran número de datos por lo que la habitual prueba t tiende a la prueba Z  Significatividad conjunta a través del estadístico de Wald, el que se distribuye con una chi cuadrado con q grados de libertad (siendo q el número de restricciones). La hipótesis nula es :  ⋯ 0 Significatividad conjunta a través del estadístico de la razón de verosimilitud (RV), el que se distribuye como una chi cuadrada con k1 grados de libertad (k es el número de parámetros) : ⋯ 0 Porcentaje de predicciones correctas, es el número de veces en que coincide el valor observado de Y con el valor estimado, respecto del total de observaciones.  (de Mc Fadden), se basa el logaritmo de la función de Pseudo verosimilitud 1 Donde es el logaritmo de la función de verosimilitud para el es el logaritmo de la función de verosimilitud modelo estimado y para un modelo estimado solo de término constante. El Pseudo varía entre 0 y 1, pero generalmente no alcanza valores cercanos a 1.  Criterios de información de Akaike, Schwarz o Hanna Quinn (HQ), estos son indicadores válidos cuando se tiene que elegir entre varios modelos alternativos, siempre debe escogerse aquel que tenga menor valor en estos indicadores. Gujarati afirma que en un modelo de regresión binaria es importante que los signos de los coeficientes coincidan con lo esperado y que sean significativamente distintos de 0. La bondad de ajuste a través del Pseudo tiene importancia secundaria.
  • 26. 734 CASOS DE ESTUDIO, PREGUNTAS Y PROBLEMAS Caso 19.1: Vulnerabilidad social en los hogares de Río Cuarto El objetivo del trabajo es identificar los fenómenos de mayor impacto en la determinación de la vulnerabilidad en la ciudad de Río Cuarto El diccionario de la Real Academia Española define vulnerable como aquel que puede ser herido o recibir una lesión física o moral Roberto Pizarro3, consultor de la División de Estadística y Proyecciones Económicas de CEPAL, define la vulnerabilidad social como un estado de inseguridad e indefensa que experimentan los individuos en sus condiciones de vida, en el manejo de recursos y en las estrategias que utilizan para enfrentar las consecuencias del impacto provocado por algún tipo de evento económico social La población estudiada consta de 1686 hogares que tienen bebés nacidos en el año 2005. Las características cualitativas medidas en estos hogares reúnen 527 modalidades. Dado que la vulnerabilidad es un concepto multidimensional, se optó por realizar un análisis factorial de correspondencia múltiple utilizando 90 variables activas con 381 modalidades asociadas y 9 variables ilustrativas con 146 modalidades asociadas. La partición del espacio de observación y la posterior clasificación de los hogares dio lugar a la conformación de 9 grupos, tal como puede observarse en el Gráfico. Vulnerabilidad Social Alta-Alta 8,84% Baja-Baja 14,35% Alta-Media 25,62% Baja-Media 18,98% Alta-Baja 5,58% Media-Alta 8,78% Baja-Alta 10,26% Media-Baja 3,14% Media-Media 4,45% 3 Pizarro, Roberto (2001). La vulnerabilidad social y sus desafíos. Una mirada desde América Latina. Estudios Estadísticos y Prospectivos. Serie 6. CEPAL
  • 27. 735 Los hogares que forman los grupos de vulnerabilidad alta (segmentados en los subgrupos Alta-Alta, Alta-Media y Alta-Baja) se caracterizan por tener •Baja edad y bajo nivel educativo de la madre y situaciones de maternidad en cuasi-soledad •Alto número de hijos, aun en madres muy jóvenes, y comienzo tardío en la atención durante el embarazo •Hogares numerosos con alto número de menores de 15 años, bajos ingresos con pocos aportantes por hogar, no hay aportes jubilatorios del jefe de hogar y se observan jóvenes entre 15 y 24 años que no estudian ni trabajan. •Presentan déficit en la infraestructura sanitaria de la vivienda, no cuentan con gas natural, y se proveen de energía eléctrica de manera irregular, no son propietarios, los hogares tienen hacinamiento •Están expuestos a riesgos por accidentes con electricidad, los bebés carecen de identificación y no cuentan con cobertura de salud •Los barrios Alberdi, Banda Norte y Santa Teodora es la ubicación geográfica de estos grupos. Además se observó que existían variables comunes a todos los grupos, independientes del nivel de vulnerabilidad; estas eran •Edad de la madre •Edad de la madre al tener el primer hijo •Existencia de baño en la vivienda •Provisión de agua potable •Cantidad de cuartos •Número de integrantes del hogar •Ingreso del hogar •Ingreso per cápita mensual •Personas que aportan ingresos Ahora bien, ¿qué nivel de impacto tienen estos factores en los niveles de vulnerabilidad de los hogares? Para responder a esto se provee de la Tabla 16.1 que contiene:  Unidades de observación: 1549 hogares con hijos nacidos en 2005  Características observadas Altavul: 1 pertenencia a grupo de alta vulnerabilidad 0 no pertenencia a grupo de alta vulnerabilidad MAD: 1 madre adolescente 0 madre adulta NBI: 1 hogar con NBI
  • 28. 736 0 hogar sin NBI AI: cantidad de personas que aportan ingresos en el hogar (variable continua) IM: ingreso mensual del hogar (variable continua) IPC: ingreso per cápita diario (variable continua) Edad: edad actual de la madre (variable continua) Se solicita  la estimación a través del Modelo Logit y el Modelo Probit  realizar comparaciones entre los resultados de ambos modelos BIBLIOGRAFIA □ Chou, Y.L. (1977) “Análisis Estadístico” Segunda Edición. Interamericana. México □ Gujarati, D. (2004) "Econometría". 4°Edición. Mc.Graw Hill. México. □ Gujarati, D. (2010) "Econometría". 5°Edición. Mc.Graw Hill. México. □ Maddala, G. S. “Introducción a la Econometría” 2º Edición. Prentice Hall. México. □ Perez Lopez, C. (2006). “Problemas Resueltos de Econometría”. Editorial Thomson Paraninfo. □ Schmidt, S. J. (2005) “Econometría”. Mc-Graw Hill Interamericana. México.