Está en la página 1de 17

MODELOS CON VARIABLE DEPENDIENTE DISCRETA Y LIMITADA CON STATA

Carlos Giovanni Gonzlez Espitia


Email: cggonzalez@icesi.edu.co
Departamento de Economa
Universidad Icesi

Resumen
El objetivo de este documento es introducir al lector en los modelos de eleccin
discreta estimados por mxima verosimilitud y, a los modelos con variable
dependiente limitada. En primer lugar se presentan los modelos dicotmicos MLP,
Logit y probit. Posteriormente se presentan los modelos de mltiples alternativas
ordenadas y no ordenadas. Para finalmente presentar los modelos censurados y
truncados.
Palabras Clave: Econometra, software economtrico, Stata
Clasificacin JEL: C01, C87.

Stata es una marca registrada de Stata Corporation. Copyright 19962010 StataCorp LP, 4905
Lakeway Drive, College Station, TX 77845 USA. Las opiniones contenidas en este documento, los errores
u omisiones son de exclusiva responsabilidad del autor.

1 Introduccin
Los modelos de eleccin binaria corresponden a aquellos modelos de eleccin discreta en
los que el conjunto de eleccin se reduce a slo dos alternativas posibles. Dentro de los
modelos de eleccin discreta, en los que el conjunto de eleccin tiene slo dos alternativas
posibles mutuamente excluyentes, es decir cuando la variable dependiente es una variable
dummy, existen: el modelo lineal de probabilidad (MLP), el modelo Probit, y el modelo
Logit. Una posibilidad para estimar modelos con variable dependiente discreta binaria, es
usar el modelo lineal de probabilidad y estimarlo por MCO. No obstante, esta aproximacin
presenta varios problemas, que se estudiarn ms adelante. Cabe resaltar que algunos de
estos problemas tienen solucin, mientras otros no la tienen, lo que nos lleva a plantear el
uso de modelos que empleen funciones de probabilidad acumulativas, que se ajustan ms a
la realidad que se quiere estudiar. Algunos ejemplos de este tipo de modelos son el Logit,
que emplea una funcin de distribucin logstica, y el Probit, que emplea una funcin de
distribucin normal; ambos modelos se estiman por medio del mtodo de Mxima
Verosimilitud.
Los modelos de eleccin discreta presentan muchas veces algunos problemas
particulares diferentes a aquellos a los que se enfrentan los modelos clsicos de
regresin, aqu se presentarn tambin este tipo de problemas y sus posibles
soluciones.
2 Modelo lineal de probabilidad: MCO
Los modelos de probabilidad lineal se especifican de la siguiente manera:
Yi = 0 + 1 X 1i + 2 X 2i + ... + k X ki + i
i = 1, 2,..., n

1,
Yi =
0

zi 0
zi < 0

Donde Zi corresponde a una variable latente, es decir una variable que no es observable,
pero para la cual se puede inferir su valor a partir de una variable relacionada (en este caso
la variable relacionada es la variable dummy Yi). Es preciso aclarar que Zi representara, por
ejemplo, el benficio neto para el individuo de participar en el programa (Yi=1): en efecto si el
beneficio de participar es mayor que cero, el individuo toma la caracterstica relacionada
con Yi=1, y cuando el beneficio es inferior a cero aquella relacionada con Yi=0.
Este modelo expresa la variable dicotmica Yi como una funcin lineal de las variables
explicativas. Este tipo de modelos se conocen como modelos de probabilidad lineal, ya que
el valor esperado de la variable dependiente condicionada a las variables independientes,
puede ser interpretada como la probabilidad condicional de que un evento determinado
acontezca dado Xi. Suponiendo que E (i)=0 para que los estimadores sean insesgados, se
obtiene que:

E (Yi | X i ) = 0 + 1 X 1i + 2 X 2i + ... + k X ki
i = 1, 2...n

Ahora, teniendo en cuenta que Pi es la probabilidad de que el evento ocurra, es decir


cuando Yi =1, y (1-Pi) es la probabilidad de que el evento no ocurra, esto es cuando Yi =0,
entonces Yi tiene la siguiente distribucin:
1
Yi =
0

probabilidad Pi
probabilidad 1-Pi

Por lo tanto el valor esperado de la variable dependiente es igual a:

E (Yi | X i ) = (1)( Pi ) + (0)(1 Pi ) = Pi


Si se compara entonces los dos valores esperados se obtiene que:
E (Yi / X i ) = 0 + 1 X 1i + 2 X 2 i + ... + k X ki =Pi

Por lo tanto, el valor esperado del modelo inicial, puede ser interpretado como la
probabilidad condicional de Yi . Dado que la probabilidad debe estar acotada entre 0 y 1,
entonces la esperanza condicional debe tambin estar restringida entre estos valores, tal y
como sigue: 0 E (Yi / X i ) 1
No obstante, esta aproximacin tiene varios problemas, tales como la no normalidad de los
errores, la heterocedasticidad del trmino de error, los valores generalmente bajos del R2, y
la posibilidad de que los valores estimados de la variable dependiente dicotmica se salgan
del rango 0-1.
A pesar de los muchos inconvenientes que presenta el MPL, su mayor problema radica en
que supone que Pi = E (Yi = 1/ X i ) aumenta linealmente con X, es decir el efecto marginal o
incremental de X permanece constante todo el tiempo. Esto no parece ser realista, en
realidad se esperara que Pi estuviera relacionado de forma no lineal con Xi (GUJARATI
1997). Estos problemas invalidan entonces la estimacin por MCO, por lo que ser
necesario usar un mejor mtodo estadstico de estimacin.
En efecto se necesitan modelos que satisfagan las siguientes condiciones:
-

se requiere que cuando X aumenta, la probabilidad de xito aumente pero siempre


dentro del intervalo 0-1

se necesita que la relacin entre X y la probabilidad de xito no sea lineal, es decir


uno se acerca a cero a tasas cada vez ms lentas a medida que Xi se hace ms
pequeo y se acerca a uno a tasas cada vez ms lentas a medida que Xi se hace muy
grande (GUJARATI 1997).

Una opcin para lograrlo es usar funciones de distribucin acumulativa, como por ejemplo
la distribucin logstica o la normal, que dan lugar a los modelos Logit y Probit.
Para empezar se puede decir que de forma general este tipo de modelos se especifica tal y
como sigue:

P Yi = 1/ X1i , X 2i ,..., X k i = F ( 0 + 1 X1i + ... + X ki )


P (Yi = 0 / X 1i , X 2i ,..., X ki ) = 1 F ( 0 + 1 X 1i + ... + X ki )
i = 1, 2,..., n

Donde F es una funcin que toma valores entre 0 y 1 para todos los reales. Segn las
distintas definiciones de F, se tendrn distintos modelos de eleccin binaria.
3 Modelo Logit: MV
El modelo Logit es un modelo con variable dependiente binaria. Si F ( z ) =

ez
,
1 + ez

entonces estamos en presencia de un modelo Logit, cuya expresin corresponde a:


Y = F ( z ) = F ( 0 + 1 X 1 + ... + X k ) =

e 0 + 1 X1 +...+ X k
1 + e 0 + 1 X1 +...+ X k

Que de forma alternativa se podra escribir como:


P (Y = 1/ X iT ) = ( X iT )
i = 1, 2,..., n

Este modelo sigue una distribucin logstica, que permite ver que a medida que Z se
encuentra entre y - la probabilidad de que Yi tome el valor de uno se encuentra dentro
del rango 0-1, y adicionalmente dicha probabilidad no est relacionada linealmente con Xi.
Se estima por el mtodo de Mxima Verosimilitud obteniendo estimadores insesgados y
consistentes.
Stata permite estimar este tipo de modelos de la siguiente manera: el men de
herramientas se selecciona la opcin Statistics para despus elegir Binary outcomes. Una
vez hecho esto, se puede elegir bien sea el modelo Logit o el Probit, u otras opciones que
proporciona el programa.

Cuando se trabaja mediante esta opcin, a continuacin se debe ingresar la variable


dependiente acompaada de las independientes y se da Ok.
Si, en cambio, se desea trabajar mediante comandos, el comando que se debe utilizar para
la estimacin de modelos Logit es:
.logit depvar var1 var2 var3 [if] [in] [weight] [, options]
Si se realiza la estimacin de un modelo Logit, la tabla que arroja Stata es la siguiente:
Tabla 1. Resultados de la estimacin de un modelo Logit
Iteration
Iteration
Iteration
Iteration

0:
1:
2:
3:

log
log
log
log

likelihood
likelihood
likelihood
likelihood

= -20.526953
= -19.650438
=
-19.6485
=
-19.6485

Logistic regression
Log likelihood =

Number of obs
LR chi2(3)
Prob > chi2
Pseudo R2

-19.6485

Coef.

x1
x2
x3
_cons

-.0047131
.1120338
.8902547
-.8768972

Std. Err.

.0154551
.1242195
.8861582
1.103113

P>|z|

-0.30
0.90
1.00
-0.79

=
=
=
=

30
1.76
0.6244
0.0428

[95% Conf. Interval]

0.760
0.367
0.315
0.427

-.0350045
-.1314319
-.8465835
-3.038959

.0255783
.3554995
2.627093
1.285165

Como ya se sabe, los coeficientes s estimados solamente permiten contrastar los


signos esperados a priori, sin embargo las interpretaciones se deben realizar con los
efectos marginales. El comando para el clculo de estos es:
.mfx
Ahora, el resultado que muestra este commando al ser introducido en Stata es:
Tabla 2. Efectos marginales
Marginal effects after logit
y = Pr(y) (predict)
= .42971297
variable
x1
x2
x3*

dy/dx
-.001155
.027455
.2183869

Std. Err.
.00379
.0304
.21226

z
-0.30
0.90
1.03

P>|z|

95% C.I.

0.760
0.366
0.304

-.008578
-.032128
-.197634

.006268
.087038
.634408

X
51.1
5.06667
.3

(*) dy/dx is for discrete change of dummy variable from 0 to 1

4 Modelo Probit: MV
z

Otra opcin similar es el modelo Probit. En el caso de tener que: F ( z ) = ( z ) = ( )d

Donde es la funcin de densidad normal definida como:

1 2z
( z) =
e
2

Se est en presencia de un modelo Probit, cuya expresin ser:


0 + 1 X1 +...+ X k

Y=F ( z ) = F ( 0 + 1 X 1 + ... + X k ) =

1 2
e d
2

Que de forma alternativa se podra escribir como:


P (Y = 1/ X iT ) = ( X iT )
i = 1, 2,..., n

El comando en Stata para la estimacin de este tipo de modelos es:


.probit depvar var1 var2 var3 [if] [in] [weight] [, options]
Este modelo es bastante similar al Logit dado que los resultados que arroja son
bastante cercanos. De hecho, es posible demostrar que (Cameron&Trivedi):

probit  1, 6 log it
Al realizar la estimacin de un modelo Probit, la tabla que arroja Stata es la siguiente:
Tabla 3. Resultados de la estimacin de un modelo Probit
Iteration
Iteration
Iteration
Iteration

0:
1:
2:
3:

log
log
log
log

likelihood
likelihood
likelihood
likelihood

=
=
=
=

-20.526953
-19.652544
-19.652082
-19.652082

Probit regression

Number of obs
LR chi2(3)
Prob > chi2
Pseudo R2

Log likelihood = -19.652082


y

Coef.

x1
x2
x3
_cons

-.0028088
.0686759
.5431961
-.5460755

Std. Err.
.0095977
.0760005
.53932
.6843898

z
-0.29
0.90
1.01
-0.80

P>|z|
0.770
0.366
0.314
0.425

=
=
=
=

30
1.75
0.6259
0.0426

[95% Conf. Interval]


-.0216199
-.0802823
-.5138516
-1.887455

.0160023
.2176341
1.600244
.7953038

En esta tabla aparecen los coeficientes estimados, los errores estndar y los valores
respectivos de las z. A su vez, Stata proporciona la prueba de significancia global del
modelo llamado LR chi2(3) (el nmero 3 corresponde al nmero de variables
independientes) y su respectivo valor p. esto permite concluir pues sobre la
significancia global del modelo. Este test es una prueba de que todas las pendientes
son cero, anlogo a la prueba F usualmente utilizada en los modelos de regresin
lineal.
Como ya se sabe, los coeficientes s estimados solamente permiten contrastar los
signos esperados a priori, sin embargo las interpretaciones se deben realizar con los
efectos marginales. El comando para el clculo de estos es:
.mfx

Cuando se introduce este comando, Stata muestra los siguientes resultados:


Tabla 4. Efectos marginales
Marginal effects after probit
y = Pr(y) (predict)
= .42909092
variable
x1
x2
x3*

dy/dx
-.0011028
.0269638
.2135571

Std. Err.
.00377
.0298
.20838

z
-0.29
0.90
1.02

P>|z|

95% C.I.

0.770
0.366
0.305

-.008489
-.03145
-.194869

.006284
.085378
.621983

X
51.1
5.06667
.3

(*) dy/dx is for discrete change of dummy variable from 0 to 1

En la tabla se observan los efectos marginales que son ahora interpretables como
usualmente se hace. Tambin muestra los errores estndar, los valores z con su
respectivo valor p y el intervalo de confianza.
Si lo que se desea es calcular los efectos marginales sobre un valor puntual (por
ejemplo 10 o 20) se debe introducir:
.mfx, at (var1=10 var2=20 var3=30)
5 Modelos con mltiples alternativas
Los economistas continuamente hacen regresiones con variables dependientes
discretas buscando analizar principalmente las elecciones de los individuos. Para este
fin, los modelos de eleccin discreta resultan los ms apropiados cuando el objetivo
no es predecir el comportamiento medio de un agregado, sino analizar los factores
determinantes de la probabilidad de que un agente econmico individual elija un
curso de accin dentro de un conjunto, generalmente finito, de opciones posibles.
El agente econmico entonces, puede llegar a enfrentarse a ms de dos alternativas
en su proceso de eleccin, asumiendo el llamado problema multinomial, en donde
la variable dependiente toma un conjunto discreto y finito de valores o categoras. A
estos modelos se les conoce como modelos multinomiales, los cuales se constituyen
en extensiones del Logit y Probit binario en los cuales, dependiendo de si las
alternativas de la variable endgena sean excluyentes o incorporen informacin
ordinal se distinguen entre los modelos condicionales, modelos con datos ordenados y
los modelos con datos no ordenados. Los primeros se dan cuando nacen 2 o ms
decisiones de manera secuencial, los segundos surgen cuando las decisiones de los
individuos pueden ordenarse o jerarquizarse, plantendose la necesidad de que se
cumpla una primera condicin para optar por una segunda. Pero a pesar de que
muchos economistas han optado por los modelos de respuesta ordenada, no siempre
son la mejor opcin, pues muchas veces, no logran recoger adecuadamente la
naturales de un proceso de decisin en el que existen factores que actan en el mismo
sentido sobre la probabilidad de eleccin de las alternativas extremas.
Para especificar correctamente la funcin que ejemplifique mejor la toma de
decisiones de los individuos, se parte de la formulacin de supuestos sobre los

mecanismos de decisin que permitir vislumbrar parcialmente la racionalidad en el


proceso de eleccin. Un enfoque es el caso en que el individuo decide una
determinada opcin si la utilidad que le proporciona dicha alternativa supera aquella
que le proporcionara el resto de alternativas. En sntesis busca la opcin que le
proporcione la mxima utilidad alcanzable.
Pero adems de lo sealado anteriormente, en el proceso de especificacin de los
modelos de respuesta mltiple influyen elementos como: el tipo de funcin (Logstica
o Normal acumulativa), los diferentes criterios de eleccin para la variable endgena
(ordenado o no ordenado) y el tipo de variables dependientes a considerar, que
pueden ser propias del individuo o que corresponden a caractersticas especificas de
cada una de las alternativas.
Los modelos multinomiales se clasifican bsicamente en tres categoras: modelos de
respuesta ordenada, modelos de respuesta no ordenada y modelos de respuesta
condicionada.
5.1 Modelo Logit multinomial
Para especificar el modelo de respuesta no ordenada logit, se parte de un proceso de
decisin del individuo que puede representarse mediante una variable categrica 
tal que    si el individuo elige la alternativa j.
La especificacin en este caso del modelo de mltiples alternativas corresponde a la
siguiente ecuacin:
   
) +  =    
Donde:
 es una variable latente (no observada)
F( )= Es una funcin no lineal de una combinacin lineal de las caractersticas o ndice.
 = ( 
es el ndice del modelo
 es la variable aleatoria o trmino de error del modelo.
Se debe construir el regresando ya no ordenado en este caso, y los regresores, segn
correspondan a caractersticas propias del individuo y de las alternativas en s,
suponiendo por su puesto una funcin de distribucin logstica que relaciona el ndice
( 
.En este caso denotamos la funcin con la letra , as:
  ( 
) +  =    
i=1,2,3.n
Como nuestro objetivo es estimar la probabilidad de que un individuo medio, con un
conjunto determinado de caractersticas elija la alternativa J, en lugar de las J-1
restantes. Se deben especificar los valores que toma el regresando y escribir la funcin
(Forma general del modelo de respuesta no ordenada):

Donde,  representa la matriz de los regresores del modelo. Dichas variables


explicativas pueden ser de dos tipos:

Variables que contienen aspectos especficos del individuo y por tanto, su valor
ser el mismo en todas las alternativas. Este tipo de variables reciben el
nombre de caractersticas, y se las denota por  .

Variables que contienen aspectos especficos de las alternativas entre las que
se ha de elegir, y varan tanto entre individuos como entre alternativas. Este
tipo de variables reciben el nombre de atributos a las alternativas y las denota
por  .

La formulacin de un logit multinomial queda recogido entonces en la siguiente


ecuacin:

Donde; j representa el ndice asociado a cada alternativa y va desde 0 hasta (J-1).El


vector de parmetros lleva asociado el subndice correspondiente a la alternativa
concreta analizada. Las ecuaciones estimadas proporcionan un conjunto de
probabilidades para cada una de las alternativas que puede tomar un individuo i y
tenga  como caractersticas individuales.
La estimacin del modelo, as como en el Logit Binario, se hace por el mtodo de
mxima verosimilitud. El objetivo de este encontrar un estimador
que maximice la
probabilidad de que  ocurra dadas las variables independientes X.

El modelo estimado se presenta de la siguiente forma:

En el modelo Logit Multinomial existe una indeterminacin cuando se trata de estimar


el valor de los parmetros. La solucin que se utiliza es normalizar el modelo tomando
para los parmetros que acompaan a la alternativa cero el valor cero,
=0,
obteniendo las siguientes probabilidades (MEDINA, 2003):

Donde se tiene que cumplir que:

En donde: si j=1, obtenemos la formulacin del Logit Binomial tradicional. En el caso


sencillo de 3 alternativas de eleccin y una sola variable independiente en la
modelizacin, la probabilidad asociada a cada una de las alternativas posibles de
eleccin tomaran las siguientes expresiones (Adkins, 2008):

Con P0 +P1 +P2= 1


Y la matriz de diseo X ser la siguiente:

Los datos se estiman por Mxima verosimilitud, sin embargo mediante este mtodo
no podemos interpretar los coeficientes estimados de forma tradicional como se hace
por el mtodo de MCO. Explcitamente los coeficientes no indicarn el cambio en la
probabilidad. Slo representan la relacin Y y X, que segn el signo que arroje cada
uno, se sabr si es una relacin directa o inversa.
Lo que efectivamente se puede interpretar es la probabilidad de que suceda cada
una de las elecciones, la Odds-ratio que es un ratio de probabilidades que representa
el cociente entre la probabilidad de que suceda un hecho (elegir la opcin 1) frente a

la probabilidad de que no suceda un hecho (elegir opcin 0), como se observa a


continuacin:

Donde, en el caso de que el valor de la ratio Odds sea: Mayor que 1, la probabilidad (o
utilidad) del individuo i es mayor que del individuo j. Menor que 1, la probabilidad (o
utilidad) del individuo i es menor que el individuo j. E igual a 1, las probabilidades (o
utilidades) del individuo i e j son iguales o indiferentes.
Para realizar la estimacin de un modelo de variable dependiente con mltiples
alternativas se deben seguir los siguientes pasos:

El comando que se utiliza es:


.mlogit vardep var1 var2 var3
Al utilizar este comando en Stata, la salida que muestra el programa por ejemplo es:
Tabla 5. Estimacin Logit Multinomial

5.2 Modelo de respuesta condicionada


Cuando la variable dependiente del modelo es de mltiple respuesta, las alternativas
del individuo para elegir la opcin pueden no estar relacionadas entre s o pueden
estar condicionadas. Este tipo de modelos se utilizan para problemas en los que las
elecciones del individuo se realizan, al menos en parte, con base a los atributos
observables de cada alternativa.
La especificacin del modelo es:
Yij * = X ij + ij

Donde  son inobservables que afectan las decisiones de los individuos y  no tiene
trmino constante. Un ejemplo para este tipo de modelos es el tiempo que tarda en
llegar al trabajo el individuo i teniendo en cuenta el medio de transporte j que utilice.
Este es un tipo de decisin condicionada que se trabaja en este tipo de modelos.
El modelo Logit condicional se expresa as:
P(Yi = j | X i ) = p j ( X ) =

( X ij )

j = 0,1, 2...J

( X ih )

h=0

El comando en Stata para la estimacin del modelo Logit condicionado es:


.clogit vardep var1 var2 var3
5.3 Modelo de respuesta ordenada
Muchas veces los modelos de eleccin mltiple tienen en cuenta la naturaleza ordinal
de Y. La variable representa entonces una serie de respuestas ordenadas y el valor
asignado a cada alternativa no es arbitrario. Un ejemplo de esto es cuando se toma
una valoracin para un crdito, por ejemplo, en una escala acotada de 0 a 6.
La especificacin de este tipo de modelos, bien sea Logit o Probit ordenados es como
sigue:

Y* = X +
Donde X no contiene constante, contiene k parmetros y el trmino de error se
distribuye de manera normal con media cero y varianza constante igual a uno. Ahora,
se definen

1 < 2 < ... < j

como puntos de corte desconocidos, tales que:

Y = 0 ...
Yi* 1
Y = 1 ... 1 < Yi* 2

Y = j ...


Yi* > j

La distribucin condicional de Y dado X vendr dado por (Prez, 2008):


P (Y = 0 | X ) = P(Y * 1 | X ) = P ( X + 1 | X ) = (1 X )
P (Y = 1| X ) = P(1 < Y * 2 | X ) = ( 2 X ) (1 X )
....
*

P (Y = j | X ) = P(Y > j | X ) = 1 ( j X )

En este caso se trata de un Probit Ordenado, si en vez de utilizar (.) se utiliza (.)
sera entonces un Modelo Logit Ordenado.
En Stata, se deben realizar los siguientes pasos para la estimacin de este tipo de
modelos. En la barra de herramientas se selecciona el men Statistics, donde se
desprende lo siguiente:

Y, alternativamente, se puede tambin utilizar el siguiente comando:


.ologit vardep var1 var2 var3
.oprobit vardep var1 var2 var3

6 Modelos con variable dependiente limitada


Muchas veces la variable dependiente de mltiples alternativas o binaria presenta
problemas, bien sea de truncamiento o bien sea de censura. A continuacin se har un
anlisis detallado de cada uno de estos dos tipos de modelos haciendo nfasis en su
utilizacin con el software de Stata.
6.1 Modelo con variable dependiente truncada
Los modelos con variable dependiente trucada son aquellos en los que dentro de la
muestra seleccionada, no se cuenta ni con observaciones para la variable dependiente

ni para las independientes. Se trata de un caso particular del problema de la seleccin


muestral. Una forma ms clara de ver el truncamiento en una muestra es a travs del
siguiente grfico:

.01

Density
.02

.03

.04

Grfico 1. Variable dependiente truncada

40

50

60
achiv

70

80

La especificacin de este tipo de modelos es:

Y = X +u

u | X ~ N (0; 2 )

En el caso de estos modelos, no se tiene una muestra aleatoria porque la muestra


observada presenta una acotacin del tipo    o    . Debido a esto, si se desea
estimar o es necesario conocer la distribucin de  dado X:
En Stata, el comando que se implementa para la estimacin de un modelo con variable
dependiente truncada es:
.truncreg vardep var1 var2 var3

6.2 Modelo con variable dependiente censurada


Los modelos con variable dependiente censurada son tambin llamados modelo Tobit
censurado. La censura de la variable dependiente consiste en que le hace falta
informacin pues la muestra no recoge la probabilidad de que determinado suceso
ocurra, y por tanto existir un sesgo al este ser estimado mediante MCO, por lo que se
debe usa un modelo Tobit.
El sesgo en este tipo de modelos se ve reflejado en el siguiente grfico:
Para realizar el grafico el comando seria:
. histogram nombredelavariable, normal bin(10) xline(800)

.001

Density
.002

.003

.004

Grfico 2. Variable dependiente censurada

300

400

500

600

700

800

apt

Este modelo se especifica de la siguiente manera:

Y *i = [1x2i ...xki ][ 1 2 ... k ]'+ ui = xi + ui


Yi = 0
Yi = Yi*

si Y *i 0
si Y *i > 0

Yi representa dos opciones: el valor 0 y el valor de la variable Y*i.


En una primera etapa, se debe construir una variable dicotmica que toma el valor de
cero si Y*i es negativo o nulo, y uno si este valor es positivo. Esta nueva variable ser
llamada Di.
  

0 
1 

  0

  0

Las caractersticas ms relevantes hasta ahora son:

Ahora, en una segunda etapa, lo que se hace es calcular la probabilidad de que dentro
de la decisin del individuo potencial efectivamente ocurra el suceso estudiado. En
efecto, se trata de asignar un valor real positivo a la variable Yi una vez que, en la

primera etapa, se la ha asignado probabilsticamente, a travs de un modelo Probit, un


valor mayor que cero.
Las caractersticas ahora son:

La sintaxis del comando en Stata para la estimacin de un modelo Tobit es la misma


que usualmente se utiliza para la regresin lineal, excepto porque se debe especificar
si la censura est en la parte superior de la muestra (ul) o en la parte inferior (ll):
.tobit vardep var1 var2 var3, ll
.tobit vardep var1 var2 var3, ul
7 Comentarios finales
En este documento se present una breve introduccin a los modelos con variable
dependiente discreta, haciendo nfasis en los modelos MLP, Logit, probit y los
multinomiales ordenados y no ordenados. Tambin se presentaron los modelos con
variable dependiente limitada censurados, tobit y los trucncados. Todos los modelos
se presentaron y se mostro su aplicacin en Stata. Se explico la importancia de los
conceptos bsicos de las regresiones por el mtodo de mxima verosimilitud y los que
se estiman con variable dependiente limitada.
8 Bibliografa

Acock, A. C. (2006) A Gentle Introduction to Stata, Third edition. Stata Press


Adkins L.C y Carter R. (2008). Using Stata for Principles of Econometrics. Wiley.
Baum C. F. (2006) An Introduction to Modern Econometrics Using Stata. Stata
Press
Becker, Gary S. (1964) Human Capital: A theorical and empirical analysis, with
special reference to education. New York.
Blossfeld H-P., Golsch K., Rohwer G. (2007) Event History Analysis with Stata.
Cameron A.C y Trivedi P.K (2009). Microeconomtrics using Stata. Stata Press
Cleves M., Gould W., Gutierrez R., Marchenko Y. (2002) An Introduction to
Survival Analysis using Stata. Thrid edition. Stata Press

Chiswik, Barry (2003) Jacob Mincer, Experience and the distributions of


earnings. Institute for the study of labor (IZA). IDEAS
Gujarati (2010) Econometra. Mxico. Mc Graw Hill
Gould W., Pitblado J., Sribney W. (2006) Maximum likelihood Estimation with
Stata. Stata Press
Hamilton, L.C. (2009). Statistics with STATA 8. Belmont, CA: Duxbury Press
Kohler, U. y Kreuter, F. (2009). Data Analysis Using Stata. College Station, TX:
Stata Press
Long, J. S. (2009) The Workflow of Data Analysis Using Stata. Stata Press.
Mincer, J. (1974) Schooling, experience and earnings, Columbia University
Press.
Mitchell M. (2008) A visual guide to Stata Graphics. Stata Press
Murray, M. (2006) Econometrics: a modern introduction. Ed. Pearson
Prez L. Csar (2006) Problemas resueltos de econometra, Thomson.
Pollock, Ph. H. (2006) A Stata Companion to Political Analysis. Washington, CQ
Press.
Rabe-Hesketh, S. y Everitt, B. (2004). A Handbook of Statistical Analysis Using
STATA, London: Chapman & Hall/CRC Press
Newton J., Cox N. (2003) Seventy-six Stata tips
STATA CORP (2008). Users Guide, Reference Manual Release 10. Stata Press.
Wooldridge, J. (2006) Introduccin a la econometra. Un enfoque moderno. Ed.
Thomson

Algunos recursos en Internet para usuarios Stata:

http://www.ats.ucla.edu/stat/stata/

http://econpapers.hhs.se/paper/bocbocoec/531.htm

http://fmwww.bc.edu/ec/res.info.php

http://ideas.repec.org/s/boc/bocins.html

http://ideas.repec.org/s/boc/bocode.html

También podría gustarte