5 Modelos Probit

UNIVERSIDAD PRIVADA DE TACNA
FACULTAD DE CIENCIAS EMPRESARIALES
Escuela de Economía y Microfinanzas
CURSO ECONOMETRIA II
MODELOS PROBIT
Dr. Elmer Limache Sandoval

Modelo probit
El modelo logit utiliza la función logística acumulativa, pero no es la única FDA

(Función de Distribución Acumulativa) posible. En algunas aplicaciones, la FDA
normal se ha encontrado útil.
El modelo de estimación que surge de una FDA normal se conoce comúnmente como
modelo probit, aunque algunas veces también como modelo normit.
En principio, se puede sustituir la FDA normal por la FDA logística. Pero en lugar de
seguir este camino, presentaremos el modelo probit basado en la teoría de la utilidad, o
de la perspectiva de selección racional con base en el comportamiento, según el modelo
desarrollado por McFadden.29
Para motivar el modelo probit, suponga que en el ejemplo de
propiedad de vivienda, la decisión de la i-ésima familia de tener
casa propia o de no tenerla depende de un índice de conveniencia
no observable Ii (también conocido como variable latente),
determinado por una o diversas variables explicativas, digamos,
el ingreso Xi, de manera que entre mayor sea el valor del índice Ii,
mayor será la probabilidad de que la familia posea vivienda.
Expresamos el índice Ii como
Ii = β1 + β2Xi (1)
donde Xi es el ingreso de la i-ésima familia.

¿Cómo se relaciona el índice (no observable) con la decisión real de ser
propietario de una casa?
Igual que antes, sea Y= 1 si una familia es propietaria de una casa y Y =0 si

no lo es.
Ahora bien, es razonable suponer que para cada familia hay un nivel crítico
o umbral del índice, que podemos denominar I*i , tal que si Ii excede a I*i, la
familia tendrá una casa propia, de lo contrario no lo hará. El umbral I*i, al
igual que Ii, no es observable, pero si suponemos que está distribuido
normalmente con las mismas media y varianza, es posible no sólo estimar
los parámetros del índice dado en (1), sino también obtener alguna
información sobre el propio
índice no observable. Este cálculo se muestra de la siguiente manera.
Con el supuesto de normalidad, la probabilidad de que I*i ∗ sea menor o igual que Ii
se calcula a partir de la FDA normal estándar como:
Pi = P(Y =1 | X) = P( I*i ≤ Ii ) = P(Zi ≤ β1 + β2Xi ) = F(β1 + β2Xi ) (2)
donde P(Y =1| X) significa la probabilidad de que un suceso ocurra

dado(s) el (los) valor(es) de X o la(s) variable(s) explicativa(s), y donde Zi
es la variable normal estandarizada; es decir, Z ∼ N(0, σ2). F es la FDA
normal estándar, que, escrita de manera explícita en el presente
contexto, es:
(3)
FIGURA 1: Modelo probit:
a) Dado Ii , lea Pi en la ordenada
b) Dado Pi lea Ii en la abscisa
Como P representa la probabilidad de que ocurra un suceso, en este caso la
probabilidad de tener casa propia, se mide por el área de la curva normal
estándar de −∞ a Ii, como se muestra en la figura a).
Ahora, para obtener información sobre Ii, el índice de utilidad, lo mismo que
para β1 y β2, se toma la inversa de (2) para obtener
(4)
donde F-1 es la inversa de la FDA normal. El significado de todo esto se aclara con la
figura 1 PRESENTADA en la diapositiva anterior.
En el panel a) de esta figura se obtiene (de la ordenada) la probabilidad (acumulada)

de tener casa propia dado Ii* ≤ Ii, mientras que en el panel b) se obtiene (de la abscisa)
el valor de Ii dado el valor de Pi, que es simplemente el inverso del primero.
Pero, específicamente, ¿cómo obtenemos el índice Ii al igual que las estimaciones de
β 1 y β 2?
Como en el caso del modelo logit, la respuesta depende que se cuente con datos
agrupados o desagrupados. Consideramos los dos casos de manera individual.
Estimación de probit con datos agrupados: gprobit
(Datos repetidos)
Utilizaremos los mismos datos que para glogit, los cuales se muestran en la tabla 15.4
Como
ya tenemos , la frecuencia relativa (la medida empírica de probabilidad) de
poseer una casa propia para diversos niveles de ingresos, como se muestra en la tabla
15.5, con ella obtenemos Ii de la FDA normal, como se muestra en la tabla 15.10, o en la
figura 15.5
Una vez estimado el Ii, estimar β1 y β2 es un asunto relativamente sencillo, como
mostraremos en breve. A propósito, observe que en el lenguaje del análisis probit, el
índice de utilidad no observable Ii se conoce simplemente como desviación equivalente
normal (d.e.n.) o sólo normit. Como la d.e.n. o Ii será negativa siempre que Pi < 0.5, en
la práctica se agrega el número 5 a la d.e.n. y el resultado se denomina un probit.
Continuemos con el ejemplo de propiedad de una casa. Ya presentamos los resultados

de los modelos glogit para este ejemplo. Los resultados del probit agrupado (gprobit)
de los mismos datos son los siguientes:
Con la d.e.n. ( = I ) dada en la tabla 15.10, los resultados de la regresión son los de
la tabla 15.11. Los resultados de la regresión basados en los probits ( d.e.n. + 5)
se dan en la tabla 15.12.
Interpretación de las estimaciones de probit en la tabla 15.11
¿Cómo interpretamos los resultados anteriores?

Suponga que deseamos averiguar el efecto de una unidad de cambio en X (ingreso
medido en miles de dólares) sobre la probabilidad de que Y=1; es decir, que una
familia adquiera una casa.
Para hacerlo, examine la ecuación:
Pi = P(Y = 1 | X) = P( Ii * ≤ Ii ) = P(Zi ≤ β1 + β2Xi ) = F(β1 + β2 Xi)
Deseamos tomar la derivada de esta función respecto de X (es decir, la tasa de

cambio de la probabilidad respecto del ingreso).
Resulta que su derivada es:
Pero
Ii = β1 + β2Xi
donde ƒ(β1 + β2Xi) es la función de densidad de probabilidad de la normal estandarizada
evaluada en β1 + β2Xi. Resulta evidente que esta evaluación dependerá del valor particular de
las variables X.
Tome el valor de X de la tabla 15.5, por ejemplo, X =6 (miles de dólares). Con los valores
estimados de los parámetros proporcionados en la tabla 15.11, deseamos encontrar la función
de densidad normal en ƒ[−1.0166 + 0.04846(6)] = ƒ(−0.72548). Si consulta las tablas de
distribución normal, encontrará que para Z =−0.72548, la densidad normal es casi de 0.3066.
Ahora, si multiplica ese valor por el coeficiente de pendiente estimado de 0.04846, (es decir,
0.03066x0.04846), obtiene 0.01485. Esto significa que si empieza con un nivel de ingreso de
$6 000 y el ingreso aumenta $1 000, la probabilidad de que una familia compre una casa se
incrementa alrededor de 1.4%. (Compare este resultado con el de la tabla 15.6.)
Como se ve en el análisis anterior, el cálculo de cambios en la probabilidad mediante el modelo
probit resulta un poco tedioso, en comparación con los modelos MLP y logit.
En vez de calcular los cambios en la probabilidad, suponga que deseamos encontrar las
probabilidades estimadas a partir del modelo gprobit ajustado. Esto se realiza con facilidad.
Con los datos de la tabla 15.11 y al intercalar los valores de X de la tabla 15.5, el lector puede
verificar que los valores estimados n.i.d. (hasta dos dígitos) son los siguientes:
En la actualidad, los programas estadísticos como MINITAB calculan fácilmente las

probabilidades (acumulativas) asociadas a los diversos n.i.d. Por ejemplo, la probabilidad
estimada correspondiente a un valor n.i.d. de −0.63 es igual a 0.2647, y la correspondiente
a un valor n.i.d. de 0.43 es de 0.6691.
Si comparamos estas estimaciones con los valores reales dados en la tabla 15.5,
encontrará que ambos están muy cercanos entre sí, lo cual indica que el modelo ajustado
es bastante bueno. Gráficamente, lo que acabamos de realizar ya se presentó en la figura
15.4.
la tabla 15.7, que proporciona los datos de 32 individuos respecto de sus
calificaciones finales en los exámenes de microeconomía intermedia, en relación
con las variables GPA, TUCE y PSI.
Comandos para resolver una regresión PROBIT
Analizar Regresión Probit

Frecuencia de Respuesta: Y
Total observado: TOT
Covariables: X
Transformar: Ninguna
Modelo: Activar Probit
Aceptar
Donde Y es la variable dependiente dicotómica

TOT: Es el número total de individuos para un nivel de X
X: Es la variable independiente en niveles
Vea cómo lucen los resultados probit. Observe que, como en el caso del
modelo logit para datos individuales, tendremos que utilizar un procedimiento
de cálculo no lineal basado en el método de máxima verosimilitud.
Los resultados de la regresión PROBIT calculados mediante SPSS se dan en la
tabla siguiente:
Estimaciones de parámetro

Intervalo de confianza de 95 %

Parámetro Estimación Error estándar Z Sig. Límite inferior Límite superior
PROBIT a GPA 1,626 ,694 2,343 ,019 ,266 2,986
TUCE ,052 ,084 ,617 ,537 -,113 ,216
PSI 1,426 ,595 2,397 ,017 ,260 2,593
Interceptación -7,452 2,542 -2,931 ,003 -9,995 -4,910
a. Modelo PROBIT: PROBIT(p) = Interceptación + BX
Covarianzas y correlaciones de estimaciones de

parámetro
GPA TUCE PSI

PROBIT GPA ,481 -,325 ,255
TUCE -,019 ,007 ,050
PSI ,105 ,002 ,354
Covarianzas (abajo) y correlaciones (arriba).
Pruebas de chi-cuadrado
Chi-cuadrado gla Sig.

PROBIT Prueba de bondad de ajuste de
Pearson
26,252 28 ,559
a. Las estadísticas basadas en casos individuales difieren de las estadísticas basadas en casos
agregados.
Recuentos de casilla y residuos

Número de Respuestas Respuestas Probabilida
Número GPA TUCE PSI sujetos observadas esperadas Residuo d

PROBI 1 2,920 12,000 ,000 1 0 ,019 -,019 ,019
T 2 2,890 14,000 1,000 1 0 ,273 -,273 ,273

3 2,860 17,000 ,000 1 0 ,027 -,027 ,027
4 2,760 17,000 ,000 1 0 ,019 -,019 ,019
5 3,390 17,000 1,000 1 1 ,642 ,358 ,642
6 2,740 19,000 ,000 1 0 ,022 -,022 ,022
7 2,830 19,000 ,000 1 0 ,031 -,031 ,031

8 2,390 19,000 1,000 1 1 ,124 ,876 ,124
9 2,660 20,000 ,000 1 0 ,018 -,018 ,018
10 2,630 20,000 ,000 1 0 ,016 -,016 ,016

11 4,000 21,000 ,000 1 1 ,555 ,445 ,555
12 2,870 21,000 ,000 1 0 ,045 -,045 ,045
13 3,650 21,000 1,000 1 1 ,840 ,160 ,840

14 3,100 21,000 1,000 1 0 ,540 -,540 ,540
15 2,890 22,000 ,000 1 0 ,053 -,053 ,053

16 2,060 22,000 1,000 1 0 ,062 -,062 ,062
17 3,320 23,000 ,000 1 0 ,194 -,194 ,194
18 3,570 23,000 ,000 1 0 ,323 -,323 ,323
19 3,120 23,000 1,000 1 0 ,593 -,593 ,593

20 4,000 23,000 1,000 1 1 ,952 ,048 ,952
21 3,280 24,000 ,000 1 0 ,190 -,190 ,190

22 3,540 24,000 1,000 1 1 ,834 ,166 ,834
23 2,670 24,000 1,000 1 0 ,329 -,329 ,329
24 3,030 25,000 ,000 1 0 ,109 -,109 ,109

25 3,260 25,000 ,000 1 1 ,195 ,805 ,195
26 2,750 25,000 ,000 1 0 ,046 -,046 ,046

27 3,160 25,000 1,000 1 1 ,657 ,343 ,657
28 3,530 26,000 ,000 1 0 ,356 -,356 ,356
29 3,510 26,000 1,000 1 0 ,847 -,847 ,847

30 2,830 27,000 1,000 1 1 ,489 ,511 ,489
“Cualitativamente”, de modo general, los resultados del modelo probit se pueden
comparar con los obtenidos mediante el modelo logit, pues tanto GPA como PSI son
estadísticamente significativas en lo individual.
En conjunto, todos los coeficientes son estadísticamente significativos, pues el valor

del estadístico Chi cuadrado de Pearson es 26.252, con un valor p de 0.559 que
conduce al no rechazo de la Hipótesis nula de adecuación del modelo probit. Por
razones dadas en secciones posteriores, no podemos comparar de manera directa los
coeficientes de regresión logit y probit.
Efecto marginal de un cambio unitario en el valor de una
regresora sobre los diversos modelos de regresión
En el modelo de regresión lineal, el coeficiente de la pendiente mide el cambio en el

valor promedio de la regresada, debido a una unidad de cambio en el valor de la
regresora, con las demás variables constantes.
En el MLP, el coeficiente de la pendiente mide directamente el cambio en la

probabilidad de que ocurra un evento, como resultado de una unidad de cambio en el
valor de la regresora, con un efecto constante de todas las demás variables.
En el modelo logit, el coeficiente de la pendiente de una variable indica el cambio en

el logaritmo de las posibilidades en favor de que ocurra un evento asociadas a una
unidad de cambio en esa variable, de nuevo, con todas las demás variables
constantes.
Pero como ya dijimos, para el modelo logit la tasa de cambio en la probabilidad de que
ocurra un suceso está dada por βjPi (1 − Pi), donde βj es el coeficiente (de regresión
parcial) de la j-ésima regresora. Pero al evaluar Pi, participan todas las variables
incluidas en el análisis.
En el modelo probit, como ya vimos, la tasa de cambio de la probabilidad es un
tanto complicada y está dada por βjƒ(Zi), donde f(Zi) es la función de densidad de la
variable normal estandarizada y Zi =β1 + β2X2i + · · · + βkXki; es decir, el modelo de
regresión utilizado en el análisis.
Por tanto, en los modelos probit y logit todas las regresoras intervienen en el
cálculo de los cambios en la probabilidad, en tanto que en el MLP sólo participa la
j-ésima regresora.
Esta diferencia tal vez sea la razón de la anterior popularidad del modelo MLP
TAREA: Texto base Econometría de Gujarati
(2010).
Cada integrante:
Resolver ejercicios 15.17 y 15.19

5 Modelos Probit

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

5 Modelos Probit

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD PRIVADA DE TACNA

FACULTAD DE CIENCIAS EMPRESARIALES

Escuela de Economía y Microfinanzas

Dr. Elmer Limache Sandoval

El modelo logit utiliza la función logística acumulativa, pero no es la única FDA

donde Xi es el ingreso de la i-ésima familia.

Igual que antes, sea Y= 1 si una familia es propietaria de una casa y Y =0 si

Pi = P(Y =1 | X) = P( I*i ≤ Ii ) = P(Zi ≤ β1 + β2Xi ) = F(β1 + β2Xi ) (2)

donde P(Y =1| X) significa la probabilidad de que un suceso ocurra

En el panel a) de esta figura se obtiene (de la ordenada) la probabilidad (acumulada)

Continuemos con el ejemplo de propiedad de una casa. Ya presentamos los resultados

¿Cómo interpretamos los resultados anteriores?

Para hacerlo, examine la ecuación:

Pi = P(Y = 1 | X) = P( Ii * ≤ Ii ) = P(Zi ≤ β1 + β2Xi ) = F(β1 + β2 Xi)

Deseamos tomar la derivada de esta función respecto de X (es decir, la tasa de

Resulta que su derivada es:

En la actualidad, los programas estadísticos como MINITAB calculan fácilmente las

Analizar Regresión Probit

Donde Y es la variable dependiente dicotómica

Covarianzas y correlaciones de estimaciones de

GPA TUCE PSI

Chi-cuadrado gla Sig.

Número GPA TUCE PSI sujetos observadas esperadas Residuo d

T 2 2,890 14,000 1,000 1 0 ,273 -,273 ,273

4 2,760 17,000 ,000 1 0 ,019 -,019 ,019

5 3,390 17,000 1,000 1 1 ,642 ,358 ,642

6 2,740 19,000 ,000 1 0 ,022 -,022 ,022

7 2,830 19,000 ,000 1 0 ,031 -,031 ,031

10 2,630 20,000 ,000 1 0 ,016 -,016 ,016

13 3,650 21,000 1,000 1 1 ,840 ,160 ,840

15 2,890 22,000 ,000 1 0 ,053 -,053 ,053

18 3,570 23,000 ,000 1 0 ,323 -,323 ,323

19 3,120 23,000 1,000 1 0 ,593 -,593 ,593

21 3,280 24,000 ,000 1 0 ,190 -,190 ,190

23 2,670 24,000 1,000 1 0 ,329 -,329 ,329

24 3,030 25,000 ,000 1 0 ,109 -,109 ,109

26 2,750 25,000 ,000 1 0 ,046 -,046 ,046

28 3,530 26,000 ,000 1 0 ,356 -,356 ,356

29 3,510 26,000 1,000 1 0 ,847 -,847 ,847

En conjunto, todos los coeficientes son estadísticamente significativos, pues el valor

En el modelo de regresión lineal, el coeficiente de la pendiente mide el cambio en el

En el MLP, el coeficiente de la pendiente mide directamente el cambio en la

En el modelo logit, el coeficiente de la pendiente de una variable indica el cambio en

También podría gustarte