Está en la página 1de 43

Modelos de regresión de

respuesta cualitativa:
- Truncados
- Censurados

Modelo TOBIT
Motivación
• Habíamos indicado que en la regresión tradicional MCO, la variable dependiente o
endógena (convencionalmente denominada Y) es cuantitativa, mientras que las
variables explicativas o exógenas (convencionalmente denominadas Xi), pueden ser
cuantitativas, cualitativas (por ejemplo dicotómicas), o una mezcla de ambas.
• Sin embargo, debido a que en las ciencias sociales abundan los casos de respuesta
cualitativa, resultaba necesario comprender la naturaleza de ese proceso generador
de datos, pues se presentan interesantes retos respecto de su cálculo y estimación
• Con ese marco, desarrollamos como una variante, el caso en que la variable
dependiente (la variable Y) puede ser en sí misma de naturaleza cualitativa,
mediante los modelos:
• Logit
• Probit
Definiciones
• Sin embargo, es posible que no se observen datos de la variable dependiente Y,
así como de las variables explicativas para toda la población.
• En situaciones como esas, estaremos frente al caso de muestras censuradas o
muestras truncadas, según sea el tipo de limitación en la información disponible.
• Los modelos de selección muestral constituyen una especialmente importante
generalización de estos modelos.
• Los modelos truncados o censurados: Son modelos econométricos donde la
variable dependiente solo representa a una parte de la población (datos
disponibles para una subpoblación inferior a la población total):
• La media de la variable truncada o censurada no será la misma que la original
Definiciones
• Si la variable objeto de estudio es una medición continua que se distribuye
según una ley normal, en la que existen uno o varios puntos de
truncamiento y/o censura, no es posible utilizar los habituales modelos de
regresión lineal estimados por mínimos cuadrados ordinarios (MCO),
porque proporcionan estimaciones incorrectas del efecto y de su
variabilidad.
• Cuando la variable de interés tiene un punto de truncamiento se debe
utilizar el denominado modelo de regresión truncado.
• Si tiene un único punto de censura tiene que utilizarse el llamado modelo
de regresión censurado o modelo Tobit.
• Cuando existen varios puntos de truncamiento o censura, o cuando
coexisten al mismo tiempo censura y truncamiento, se utilizan las
respectivas generalizaciones de estos modelos

Tomado de https://www.gacetasanitaria.org/es-pdf-S0213911102716518
Definiciones
• El modelo tobit fue propuesto por Tobin en 1958 (*) y es en su honor
por lo que se denomina de este modo.
• El modelo Tobit es como una mezcla del modelo de regresión y el
modelo Probit:
• Es parcialmente Probit porque la variable endógena es binaria
• Es parcialmente un modelo de regresión lineal por la inclusión de variables
continuas

(*) Tobin J. Estimation of relationships for limited dependent variables. Econometrica 1958;26:24-36.
Definiciones
• La censura no es una característica intrínseca de la
distribución de la variable objeto de estudio, sino un
defecto de los datos de la muestra, que si no estuvieran
censurados constituirían una muestra representativa de la
población de interés no censurada.
• Un ejemplo de una variable censurada sería el tiempo de
supervivencia desde el diagnóstico de una enfermedad hasta la • La línea discontinua representa la
función de densidad de una
fecha de muerte (evento). En la práctica el estudio tendrá
distribución N(0,1)
definida una fecha de finalización (punto de censura) en la que • La línea en negrita es la función de
ocurrirá que no todos los sujetos de la muestra escogida habrán densidad de una N(0,1) censurada
muerto (algunos seguirán vivos). inferiormente en a = –1,5, donde el
• El objetivo es estudiar el tiempo de supervivencia en la población área (probabilidad) de la cola inferior
de enfermos diagnosticados de dicha enfermedad. Como no es que queda a la izquierda del punto
posible disponer en la muestra de los tiempos de supervivencia de censura se acumula en dicho
de todos los enfermos. La variable tiempo de supervivencia se punto de censura a. Así, la altura de
dice entonces que está censurada superiormente. la línea vertical en el punto de
censura representa el valor de esta
área inferior.
Tomado de https://www.gacetasanitaria.org/es-pdf-S0213911102716518
Variables censuradas
Para algunas observaciones, sólo se sabe que la variable es mayor (o menor) que
un valor

• Censura por la derecha (o superior)


𝑌∗, 𝑠𝑖 𝑌 ∗ < 𝑈
𝑌=ቊ
𝑈 , 𝑠𝑖 𝑌 ∗ ≥ 𝑈

• censura por la izquierda (o inferior)


𝑌∗ , 𝑠𝑖 𝑌 ∗ > 𝐿
𝑌=ቊ
𝐿 , 𝑠𝑖 𝑌 ∗ ≤ 𝐿

• La censura puede producirse por diversos motivos: Como resultado del proceso
de recogida de datos o por soluciones económicas en esquina
Ejemplo: cobro de comisión por administrar
un fondo de pensiones (AFP)
• Dependiente sin censura: 1% de la • Dependiente censurada:
• Comisiones de gestión de fondos de pensión:
rentabilidad • Comisión mínima 0.5%
• Fondo: capital = 1,000,000.... Bolsa de valores • Comisión máxima 2%
• Fondo genera una rentabilidad (variable)….
+10%, +20%, +1%, 0%, -1%
• Como la AFP administran el fondo… Entonces • Administración de un fondo: capital = 1,000,000....
Bolsa de valores
cobran un comisión • Fondo genera una rentabilidad (variable)…. +10%,
• 10% = 100,000…. 1% = 1,000 +20%, +1%, 0%, -1%
• 20% = 200,000…. 1% = 2,000 • Como la AFP administran el fondo… Entonces
cobran un comisión
• 1% = 10,000……… 1% = 10 • 10% = 100,000…. 2% = 20,000
• 0% = 0……… 1% = 0 • 20% = 200,000…. 2% = 20,000
• -1% = -10,000 …..1% = -100 • 1% = 10,000……..
• 0% = 0……… 0.5% = 5,000
• -1% = -10,000 …..0.5% = 5,000
Definiciones
• El truncamiento de la variable objeto de estudio,
de la cual se extraen los datos de la muestra, se
produce cuando sólo la parte de la distribución de
la variable que se encuentra por encima (o por
debajo) del denominado punto de truncamiento
contiene la información relevante que se desea • La línea discontinua muestra la
función de densidad de una
estudiar. distribución N(0,1)
• La línea continua es la función de
• Un ejemplo de variable truncada sería el valor de densidad de una N(0,1) truncada
hemoglobina cuando el interés reside en estudiar a inferiormente en el punto a = –1,5,
donde el área (probabilidad) de la
aquellos pacientes con valores inferiores a 8 g/dl en la
cola de la N(0,1) que queda a la
población. El punto de truncamiento es 8 g/dl. izquierda del punto de truncamiento
se reparte entre el conjunto de
puntos no truncados, haciendo que
la función de densidad de la N(0,1)
truncada integre la unidad.
Tomado de https://www.gacetasanitaria.org/es-pdf-S0213911102716518
Variables truncadas
La muestra excluye determinadas observaciones.

• Caso de truncamiento por la derecha (o superior)

𝑌 = 𝑌∗ , 𝑠𝑖 𝑌 ∗ < 𝑈
• Caso de truncamiento por la izquierda (o inferior)

𝑌 = 𝑌∗ , 𝑠𝑖 𝑌 ∗ > 𝐿
Formalización
• La censura/truncamiento puede considerarse como una situación en
que falta información (completa) sobre la variable dependiente
comparada con observar plenamente Y*
• Formalmente, la variable observada Y resulta de una mixtura de:
• Un proceso latente continuo Y*
• Un mecanismo de selección (censura o truncamiento), modelizado en forma
binaria

(*) Ver Wooldridge, 4ta. Edición (https://herioscarlanda.files.wordpress.com/2018/10/wooldridge-2009-introduccic3b3n-a-la-econometrc3ada-un-enfoque-moderno.pdf


Formalización
• Alternativamente, se puede representar como
𝑌𝑖∗ ; 𝑠𝑖 𝑌𝑖∗ = 𝛽0 + 𝛽1 𝑋1𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 + 𝑢𝑖 > 0 ; 𝑢𝑖 |𝑋~𝑁𝑜𝑟𝑚𝑎𝑙(0, 𝜎 2 )
𝑌𝑖 = ቊ
0 ; 𝑒𝑛 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜

• O como:
𝑌𝑖∗ ; 𝑠𝑖 𝐷𝑖 = 1
𝑌𝑖 = ቊ
0 ; 𝑠𝑖 𝐷𝑖 = 0
• Donde 𝐷𝑖 toma valor 1 si 𝐷𝑖 > 0 y cero en caso contrario

1 ; 𝑠𝑖 𝛽0 + 𝛽1 𝑋1𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 + 𝑢𝑖 > 0


𝐷𝑖 = ቊ
0 ; 𝑒𝑛 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜
(*) Ver Wooldridge, 4ta. Edición (https://herioscarlanda.files.wordpress.com/2018/10/wooldridge-2009-introduccic3b3n-a-la-econometrc3ada-un-enfoque-moderno.pdf
Formalización
𝑌 = max(0, 𝑌 ∗ )
• La variable latente 𝑌 ∗ satisface los supuestos del modelo lineal clásico; en
particular, tiene una distribución normal, homocedástica con una media
condicional lineal.
La variable observable, 𝑌 = 𝑌 ∗ , cuando 𝑌 ∗ ≥ 0
Pero 𝑌 = 0, cuando 𝑌 ∗ < 0
• Debido a que 𝑌 ∗ se distribuye normalmente, 𝑌 tiene una distribución continua a
través de valores estrictamente positivos.
• En particular, la densidad de 𝑌 dado 𝑋 es la misma que la densidad de 𝑌 ∗ dado 𝑋
para valores positivos.
• Además de ello:
∗ 𝑢 𝑋𝛽 𝑋𝛽 𝑋𝛽
𝑃 𝑌 = 0 𝑋 = 𝑃 𝑌 < 0|𝑋 = 𝑃 𝑢 < −𝑋𝛽 𝑋 = 𝑃 <− 𝑋 =Φ − = 1−Φ
𝜎 𝜎 𝜎 𝜎
(*) Ver Wooldridge, 4ta. Edición (https://herioscarlanda.files.wordpress.com/2018/10/wooldridge-2009-introduccic3b3n-a-la-econometrc3ada-un-enfoque-moderno.pdf
Formalización
• Los coeficientes de regresión devueltos por un modelo Tobit se
interpretan igual que los devueltos por un modelo de mínimos
cuadrados OLS, pero referidos a la variable latente NO censurada.
• los resultados de Tobit y MCO casi siempre son similares. Pero no se
pueden interpretar los 𝛽መ de Tobit como si fueran estimaciones de una
regresión lineal.
• los 𝛽መ miden los efectos parciales de las X sobre E 𝑌 ∗ |𝑋 , donde 𝑌 ∗ es
la variable latente.
• La variable que se quiere explicar es Y, puesto que es el resultado
observado

(*) Ver Wooldridge, 4ta. Edición (https://herioscarlanda.files.wordpress.com/2018/10/wooldridge-2009-introduccic3b3n-a-la-econometrc3ada-un-enfoque-moderno.pdf


Formalización
• Se puede estimar 𝑃 𝑌 = 0 𝑋 , lo cual permite estimar

a) La expectativa condicional (condicional a 𝑌 > 0): 𝐸 𝑌 𝑌 > 0, 𝑋


• Para los valores dados de X, el valor esperado de Y, para la subpoblación donde Y
es positivo
𝑋𝛽
𝐸 𝑌 𝑌 > 0, 𝑋 = 𝑋𝛽 + 𝜎
𝜎

• Donde para cualquier constante c,  𝑐 = ∅(𝑐)/(𝑐) es la “razón inversa de


Mills”, que es la razón entre la función de densidad de probabilidad (fdp) normal
estándar y la función de distribución acumulada (fda) normal estándar, cada una
evaluada en c

(*) Ver Wooldridge, 4ta. Edición (https://herioscarlanda.files.wordpress.com/2018/10/wooldridge-2009-introduccic3b3n-a-la-econometrc3ada-un-enfoque-moderno.pdf


Formalización
a) La expectativa condicional (condicional a 𝑌 > 0): …. continua
• Esta fórmula muestra que el valor esperado de y condicional sobre 𝑌 > 0 es igual a 𝑋𝛽
más un término estrictamente positivo, el cual es 𝜎 veces la razón inversa de Mills

𝑋ത 𝛽
evaluada en ෝ
.
𝜎
• La ecuación también muestra por qué usar MCO sólo para observaciones donde 𝑌 > 0,
no siempre estima consistentemente 𝛽
• En esencia, la razón inversa de Mills es una variable omitida y por lo general está
correlacionada con los elementos de X.

b) La expectativa no condicional:
𝑋𝛽
𝐸 𝑌𝑋 = 𝑃 𝑌>0𝑋 𝐸 𝑌 𝑌 > 0, 𝑋 =Φ 𝐸 𝑌 𝑌 > 0, 𝑋
𝜎

(*) Ver Wooldridge, 4ta. Edición (https://herioscarlanda.files.wordpress.com/2018/10/wooldridge-2009-introduccic3b3n-a-la-econometrc3ada-un-enfoque-moderno.pdf


Formalización
b) La expectativa no condicional:…. Continua

𝑋𝛽 𝑋𝛽 𝑋𝛽 𝑋𝛽
Como 𝐸 𝑌 𝑌 > 0, 𝑋 = 𝑋𝛽 + 𝜎 , así como Φ 𝜎 = 𝜎∅
𝜎 𝜎 𝜎 𝜎

𝑋𝛽 𝑋𝛽 𝑋𝛽 𝑋𝛽
𝐸 𝑌𝑋 =Φ 𝑋𝛽 + 𝜎 =Φ 𝑋𝛽 + 𝜎∅
𝜎 𝜎 𝜎 𝜎

Esta ecuación muestra que cuando Y sigue un modelo Tobit, 𝐸 𝑌 𝑋 es una función no lineal
de X y también de 𝛽

(*) Ver Wooldridge, 4ta. Edición (https://herioscarlanda.files.wordpress.com/2018/10/wooldridge-2009-introduccic3b3n-a-la-econometrc3ada-un-enfoque-moderno.pdf


Formalización
Efectos parciales
• los efectos parciales de Xj sobre 𝐸 𝑌 𝑌 > 0, 𝑋 y 𝐸 𝑌 𝑋 tienen el mismo signo que
el coeficiente 𝛽, pero la magnitud de los efectos depende de los valores de todas las
variables explicativas y parámetros incluido 𝜎.
• Para la expectativa condicional: Entonces, derivando 𝐸 𝑌 𝑌 > 0, 𝑋 = 𝑋𝛽 +
𝑋𝛽
𝜎 , y considerando la inversa de Mills se obtiene
𝜎

𝜕𝐸 𝑌 𝑌 > 0, 𝑋 𝑑 𝑋𝛽
= 𝛽𝑗 + 𝛽𝑗
𝜕𝑋𝑗 𝑑𝑐 𝜎

Lo q demuestra que el efecto parcial de xj sobre 𝐸 𝑌 𝑌 > 0, 𝑋 no está


determinado sólo por 𝛽𝑗

(*) Ver Wooldridge, 4ta. Edición (https://herioscarlanda.files.wordpress.com/2018/10/wooldridge-2009-introduccic3b3n-a-la-econometrc3ada-un-enfoque-moderno.pdf


Formalización
Efectos parciales….. continua
𝑋𝛽 𝑋𝛽
• Para la expectativa no condicional: A partir de 𝐸 𝑌 𝑋 = Φ 𝑋𝛽 + 𝜎∅
𝜎 𝜎
𝜕𝐸 𝑌 𝑋 𝑋𝛽
= 𝛽𝑗 Φ
𝜕𝑋𝑗 𝜎

Con base en esta último ecuación existen dos métodos para calcular un factor de ajuste
para obtener efectos parciales (para variables explicativas continuas).
𝑋𝛽෡ ෡
𝑋ത 𝛽
Primero: El efecto parcial al promedio, EPA, que se obtiene al evaluar Φ ෝ
que se denota Φ ෝ
.
𝜎 𝜎

𝑋𝑖 𝛽
−1 σ𝑛
Segundo: El efecto parcial promedio, EPP cuya fórmula es 𝑛 𝑖=1 Φ 𝜎ෝ

• Los factores escalares EPA y EPP siempre están entre cero y uno.
• Ambos factores (EPA y EPP) tienden a uno cuando hay pocas observaciones 𝑌𝑖 = 0.
• Si 𝑌𝑖 > 0 para toda i, los parámetros de Tobit y MCO son idénticos (entonces no tiene sentido aplicar TOBIT).

(*) Ver Wooldridge, 4ta. Edición (https://herioscarlanda.files.wordpress.com/2018/10/wooldridge-2009-introduccic3b3n-a-la-econometrc3ada-un-enfoque-moderno.pdf


Estimando un Tobit censurado
• Considerando el modelo: 𝑌𝑖 = 𝛽1 + 𝛽𝑖 𝑋𝑖 + 𝑢𝑖

• Con los datos en el workfile, en el menú de opciones


Quick/Estimate Equation
• O Escribir el comando
Censored
• En la ventana de especificación de la ecuación escribimos la
regresión
𝑌𝑖 𝛽1 𝑋1 𝑋2 … 𝑋𝑘

• Con los datos de Ray Fair la especificación sería


infiel c genero edad tiempo_matri hijos religion educacion
ocupacion valora_matri
Estimando un Tobit censurado
• A continuación, se seleccion una de las tres
distribuciones para el término de error (EViews
permite tres posibles opciones):

(Nota) la distribución de valores extremos es asimétrica

Especificación de los puntos de censura de la variable


dependiente. Hay que considerar dos casos:
(1) Puntos límite: se conocen para todos los individuos
(2) Cuando la censura es por indicador y los puntos límite se
conocen sólo para los individuos con observaciones
censuradas.
Fuente: Guía de uso Eviews
Estimando un Tobit censurado
Caso de puntos límite conocidos
- Introducir los puntos de censura izquierdo y derecho
en los campos de edición como necesarios.
- Si se deja un campo de edición en blanco, EViews
asume que no hay censura en las observaciones.
- Por ejemplo
- Datos censurados a la izquierda en “0” y sin censura a
la derecha.
- Left: 0 ; Right: [en blanco]
- Datos censurados por arriba pueden especificarse
como
- Left: [en blanco] ; Right: 20000
- Censura izquierda y derecha
- Left: 10000 ; Right: 20000

Fuente: Guía de uso Eviews


Estimando un Tobit censurado
Caso de puntos límite no conocidos
- En algunos casos, el punto de censura hipotético es
desconocido para algunos individuos (y no se
conocen para todas las observaciones).
- Esta situación se produce a menudo con datos en los
que la censura se indica con una variable ficticia cero-
uno, pero no se proporciona información adicional
sobre los posibles puntos de censura.
- EViews proporciona un método para describir la
censura de datos que se ajustan a este formato.
- Se selecciona “Zero/one censoring indicator” y se
introduce la expresión de la serie para el/los
indicador/es de censura en el/los campo/s de edición
apropiado/s.
Fuente: Guía de uso Eviews
Estimando un Tobit censurado
Caso de puntos límite no conocidos…. continúa
- Tal es el caso de la variable ficticia, las observaciones con
un indicador de censura de “1” se suponen censuradas,
mientras que las que tienen un valor de “0” se suponen
respuestas reales.
- Por ejemplo:
- Asumiendo que se tienen observaciones sobre el tiempo que
un individuo ha estado desempleado (U), pero que algunas
de estas observaciones representan el desempleo en curso
en el momento en que se toma la muestra.
- Estas últimas observaciones pueden tratarse como
censuradas a la derecha en el valor declarado.
- Si la variable RCENS es una variable ficticia que representa la
censura, puede hacer clic en el ajuste Campo es cero/un
indicador de censura y entrar:
- Left: [en blanco] ; Right: rcens
Fuente: Guía de uso Eviews
Estimando un Tobit censurado
Caso de puntos límite no conocidos…. continúa

- Por ejemplo:
- Si los datos están censurados tanto a la izquierda como a la
derecha, se utiliza indicadores binarios separados para cada
forma de censura:
- Left: lcens
- Right: rcens
Donde LCENS es también un indicador binario.

Una vez especificado el modelo, se hace clic en aceptar


y EViews estimará los parámetros del modelo utilizando
las técnicas iterativas adecuadas.

Fuente: Guía de uso Eviews


Estimando un Tobit censurado Dependent Variable: INFIEL
Method: ML - Censored Normal (TOBIT) (Newton-Raphson / Marquardt
Interpretación de los resultados steps)
Date: 11/17/21 Time: 12:11
Sample: 1 601
Included observations: 601
Si el modelo converge, EViews mostrará los Left censoring (value) at zero
Convergence achieved after 8 iterations
resultados de la estimación en la ventana de Coefficient covariance computed using observed Hessian

ecuaciones. Variable Coefficient Std. Error z-Statistic Prob.

• La primera parte de la tabla presenta la C


GENERO
7.608487
0.945787
3.905987
1.062866
1.947904
0.889847
0.0514
0.3735
EDAD -0.192698 0.080968 -2.379921 0.0173
información de cabecera habitual: información TIEMPO_MATRI 0.533190 0.146607 3.636852 0.0003
HIJOS 1.019182 1.279575 0.796500 0.4257
sobre la distribución de errores asumida, la RELIGION -1.699000 0.405483 -4.190061 0.0000
EDUCACION 0.025361 0.227667 0.111394 0.9113
muestra de estimación, los algoritmos de OCUPACION 0.212983 0.321157 0.663173 0.5072
VALORA_MATRI -2.273284 0.415407 -5.472429 0.0000
estimación y las iteraciones para la convergencia. Error Distribution
• También se proporciona información sobre la SCALE:C(10) 8.258432 0.554581 14.89131 0.0000
especificación de la censura (censura izquierda Mean dependent var 1.455907 S.D. dependent var 3.298758
y/o derecha). S.E. of regression
Sum squared resid
3.061544
5539.472
Akaike info criterion
Schwarz criterion
2.378473
2.451661
El modelo de FAIR (1978) es modelo censurado a la Log likelihood
Avg. log likelihood
-704.7311
-1.172597
Hannan-Quinn criter. 2.406961

izquierda donde la censura se especifica por valor:


Left censored obs 451 Right censored obs 0
Uncensored obs 150 Total obs 601
Fuente: Guía de uso Eviews
Estimando un Tobit censuradoDependent Variable: INFIEL
Method: ML - Censored Normal (TOBIT) (Newton-Raphson / Marquardt
Interpretación de los resultados steps)
Date: 11/17/21 Time: 12:11
Sample: 1 601
Included observations: 601
• Luego se encuentran los resultados habituales de Left censoring (value) at zero
Convergence achieved after 8 iterations
los coeficientes, incluidos los errores estándar Coefficient covariance computed using observed Hessian

asintóticos, los estadísticos z y los niveles de Variable Coefficient Std. Error z-Statistic Prob.

significación. C
GENERO
7.608487
0.945787
3.905987
1.062866
1.947904
0.889847
0.0514
0.3735

• Como en otros modelos de variable dependiente EDAD


TIEMPO_MATRI
-0.192698
0.533190
0.080968
0.146607
-2.379921
3.636852
0.0173
0.0003
HIJOS 1.019182 1.279575 0.796500 0.4257
limitada, los coeficientes estimados no tienen una RELIGION -1.699000 0.405483 -4.190061 0.0000
EDUCACION 0.025361 0.227667 0.111394 0.9113
interpretación directa como el efecto marginal del OCUPACION 0.212983 0.321157 0.663173 0.5072
VALORA_MATRI -2.273284 0.415407 -5.472429 0.0000
regresor asociado. Error Distribution
• En los modelos de regresión censurada, un cambio SCALE:C(10) 8.258432 0.554581 14.89131 0.0000
en "xij" tiene dos efectos: un efecto sobre la media Mean dependent var 1.455907 S.D. dependent var 3.298758
de "y", dado que se observa, y un efecto sobre la S.E. of regression
Sum squared resid
3.061544
5539.472
Akaike info criterion
Schwarz criterion
2.378473
2.451661
probabilidad de que "y" se observe (véase Log likelihood
Avg. log likelihood
-704.7311
-1.172597
Hannan-Quinn criter. 2.406961

McDonald y Moffitt, 1980). Left censored obs 451 Right censored obs 0
Uncensored obs 150 Total obs 601
Fuente: Guía de uso Eviews
Estimando un Tobit censurado Dependent Variable: INFIEL
Method: ML - Censored Normal (TOBIT) (Newton-Raphson / Marquardt
Interpretación de los resultados steps)
Date: 11/17/21 Time: 12:11
Sample: 1 601
Included observations: 601
• También hay coeficiente adicional denominado Left censoring (value) at zero
Convergence achieved after 8 iterations
SCALE, que es el factor de escala estimado "σ". Coefficient covariance computed using observed Hessian

• Este factor de escala puede utilizarse para Variable Coefficient Std. Error z-Statistic Prob.

estimar la desviación estándar del residuo, C


GENERO
7.608487
0.945787
3.905987
1.062866
1.947904
0.889847
0.0514
0.3735
EDAD -0.192698 0.080968 -2.379921 0.0173
utilizando la varianza conocida de la distribución TIEMPO_MATRI 0.533190 0.146607 3.636852 0.0003
HIJOS 1.019182 1.279575 0.796500 0.4257
asumida. RELIGION -1.699000 0.405483 -4.190061 0.0000
EDUCACION 0.025361 0.227667 0.111394 0.9113
OCUPACION 0.212983 0.321157 0.663173 0.5072
VALORA_MATRI -2.273284 0.415407 -5.472429 0.0000
• Los demás resultados se explican por sí mismos. Error Distribution
• Al igual que en los modelos binarios y SCALE:C(10) 8.258432 0.554581 14.89131 0.0000
ordenados anteriores, están las estadísticas de Mean dependent var 1.455907 S.D. dependent var 3.298758
resumen para la variable dependiente y las S.E. of regression
Sum squared resid
3.061544
5539.472
Akaike info criterion
Schwarz criterion
2.378473
2.451661
estadísticas basadas en la verosimilitud. Log likelihood
Avg. log likelihood
-704.7311
-1.172597
Hannan-Quinn criter. 2.406961

Left censored obs 451 Right censored obs 0


Uncensored obs 150 Total obs 601
Fuente: Guía de uso Eviews
Estimando un Tobit truncado
• Con características similares al modelo de regresión censurado, se tiene el modelo de
regresión truncado.
• En este caso se trata de unos datos que no se observan siempre que la variable
dependiente cae por debajo de un umbral o supera otro umbral.
• Este caso se da, por ejemplo:
• En estudios sobre familias de bajos ingresos que excluyen las observaciones con ingresos superiores a
un umbral
• En estudios de demanda de bienes duraderos entre los individuos que compran bienes duraderos.
• El modelo general de regresión truncada de dos límites puede escribirse como
𝑌𝑖∗ = 𝑋𝑖′ 𝛽 + 𝜎𝜖𝑖
• Donde 𝑌𝑖 sólo se observa si 𝑌𝑖∗ :
𝑐𝑖 < 𝑌𝑖∗ < 𝑐ഥ𝑖

• Si no hay truncamiento inferior, entonces 𝑐𝑖 = −∞; Si no hay truncamiento superior entonces 𝑐ഥ𝑖 = ∞
Estimando un Tobit truncado
• Considerando el modelo: 𝑌𝑖 = 𝛽1 + 𝛽𝑖 𝑋𝑖 + 𝑢𝑖

• Con los datos en el workfile, en el menú de opciones


Quick/Estimate Equation
• O Escribir el comando
Censored
• En la ventana de especificación de la ecuación escribimos la
regresión
𝑌𝑖 𝛽1 𝑋1 𝑋2 … 𝑋𝑘

• Con los datos de Ray Fair la especificación sería


infiel c genero edad tiempo_matri hijos religion educacion
ocupacion valora_matri

• Se selecciona la opción Truncated sample


Estimando un Tobit truncado
• A continuación, se seleccion una de las tres
distribuciones para el término de error (EViews
permite tres posibles opciones):

(Nota) la distribución de valores extremos es asimétrica

Especificación de los puntos de truncamiento de la


variable dependiente. Hay que considerar solo el caso:

(1) Puntos límite: se conocen para todos los individuos

Fuente: Guía de uso Eviews


Estimando un Tobit truncado
• La estimación truncada sólo está disponible para los
modelos en los que se conocen los puntos de
truncamiento.
• Especificar puntos de truncamiento por índice, emitirá
un mensaje de error indicando que esta selección no
está disponible.
• Se emitirá un mensaje de error si algún valor de la
variable dependiente está fuera de los puntos de
truncamiento.
• Se excluirá automáticamente cualquier observación que
sea exactamente igual a un punto de truncamiento.
• Así, si se especifica cero como límite inferior de truncamiento,
saldrá un mensaje de error si alguna observación es menor
que cero, y se excluirá cualquier observación en la que la
variable dependiente sea exactamente igual a cero.
Fuente: Guía de uso Eviews
Estimando un Tobit truncado
Caso de puntos límite conocidos
- Introducir los puntos de truncamiento izquierdo y
derecho en los campos de edición como necesarios.
- Si se deja un campo de edición en blanco, EViews
asume que no hay truncamiento en las
observaciones.
- Por ejemplo
- Datos truncados a la izquierda en “0” y sin
truncamiento a la derecha.
- Left: 0 ; Right: [en blanco]
- Datos truncados por arriba pueden especificarse como
- Left: [en blanco] ; Right: 20000
- Truncamiento izquierda y derecha
- Left: 10000 ; Right: 20000

Fuente: Guía de uso Eviews


Estimando un Tobit truncado
Dependent Variable: INFIEL
Method: ML - Censored Normal (TOBIT) (Newton-Raphson / Marquardt
Interpretación de los resultados steps)
Date: 11/19/21 Time: 18:35
Sample (adjusted): 452 601
Included observations: 150 after adjustments
Una vez especificado el modelo, se hace clic en Truncated sample
Left censoring (value) at zero
aceptar y EViews estimará los parámetros del modelo Convergence achieved after 10 iterations
Coefficient covariance computed using observed Hessian

utilizando las técnicas iterativas adecuadas. Variable Coefficient Std. Error z-Statistic Prob.

C 12.37287 5.178533 2.389261 0.0169


GENERO -1.336854 1.451426 -0.921063 0.3570
EDAD -0.044791 0.116125 -0.385719 0.6997
TIEMPO_MATRI 0.544174 0.217885 2.497527 0.0125
HIJOS -2.142868 1.784389 -1.200897 0.2298
RELIGION -1.423107 0.594582 -2.393459 0.0167
EDUCACION -0.316717 0.321882 -0.983953 0.3251
OCUPACION 0.621418 0.477420 1.301618 0.1930
VALORA_MATRI -1.210020 0.547810 -2.208833 0.0272

Error Distribution

SCALE:C(10) 5.379485 0.623787 8.623910 0.0000

Mean dependent var 5.833333 S.D. dependent var 4.255934


S.E. of regression 4.013126 Akaike info criterion 5.344456
Sum squared resid 2254.725 Schwarz criterion 5.545165
Log likelihood -390.8342 Hannan-Quinn criter. 5.425998
Avg. log likelihood -2.605561

Left censored obs 0 Right censored obs 0


Uncensored obs 150 Total obs 150
Fuente: Guía de uso Eviews
Dependent Variable: INFIEL
Tobit censurado y Tobit truncado Dependent Variable: INFIEL
Method: ML - Censored Normal (TOBIT) (Newton-Raphson / Marquardt Method: ML - Censored Normal (TOBIT) (Newton-Raphson / Marquardt
steps) steps)
Date: 11/17/21 Time: 12:11 Date: 11/19/21 Time: 18:35
Sample: 1 601 Sample (adjusted): 452 601
Included observations: 601 Included observations: 150 after adjustments
Left censoring (value) at zero Truncated sample
Convergence achieved after 8 iterations Left censoring (value) at zero
Coefficient covariance computed using observed Hessian Convergence achieved after 10 iterations
Coefficient covariance computed using observed Hessian
Variable Coefficient Std. Error z-Statistic Prob.
Variable Coefficient Std. Error z-Statistic Prob.
C 7.608487 3.905987 1.947904 0.0514
GENERO 0.945787 1.062866 0.889847 0.3735 C 12.37287 5.178533 2.389261 0.0169
EDAD -0.192698 0.080968 -2.379921 0.0173 GENERO -1.336854 1.451426 -0.921063 0.3570
TIEMPO_MATRI 0.533190 0.146607 3.636852 0.0003 EDAD -0.044791 0.116125 -0.385719 0.6997
HIJOS 1.019182 1.279575 0.796500 0.4257 TIEMPO_MATRI 0.544174 0.217885 2.497527 0.0125
RELIGION -1.699000 0.405483 -4.190061 0.0000 HIJOS -2.142868 1.784389 -1.200897 0.2298
EDUCACION 0.025361 0.227667 0.111394 0.9113 RELIGION -1.423107 0.594582 -2.393459 0.0167
OCUPACION 0.212983 0.321157 0.663173 0.5072 EDUCACION -0.316717 0.321882 -0.983953 0.3251
VALORA_MATRI -2.273284 0.415407 -5.472429 0.0000 OCUPACION 0.621418 0.477420 1.301618 0.1930
VALORA_MATRI -1.210020 0.547810 -2.208833 0.0272
Error Distribution
Error Distribution
SCALE:C(10) 8.258432 0.554581 14.89131 0.0000
SCALE:C(10) 5.379485 0.623787 8.623910 0.0000
Mean dependent var 1.455907 S.D. dependent var 3.298758
S.E. of regression 3.061544 Akaike info criterion 2.378473 Mean dependent var 5.833333 S.D. dependent var 4.255934
Sum squared resid 5539.472 Schwarz criterion 2.451661 S.E. of regression 4.013126 Akaike info criterion 5.344456
Log likelihood -704.7311 Hannan-Quinn criter. 2.406961 Sum squared resid 2254.725 Schwarz criterion 5.545165
Avg. log likelihood -1.172597 Log likelihood -390.8342 Hannan-Quinn criter. 5.425998
Avg. log likelihood -2.605561
Left censored obs 451 Right censored obs 0
Uncensored obs 150 Total obs 601 Left censored obs 0 Right censored obs 0
Uncensored obs 150 Total obs 150
Fuente: Guía de uso Eviews
Tobit con datos de MROZ: Trabajo mujeres
sobre horas trabajadas de 753 mujeres casadas, 428 de las cuales trabajaron por un salario fuera del hogar
durante el año (desde 12 horas hasta 4950). 325 de las mujeres NO trabajaron fuera del hogar por un salario.

• 'inlf=1 si está en la población activa, 1975 • 'huseduc: años de escolaridad del marido
• 'horas: horas trabajadas, 1975 • 'huswage: salario por hora del marido, 1975
• 'kidslt6: # niños < 6 años (Año 1: Madre-hija(o)(s), • 'faminc: ingresos familiares, 1975
primeros 3, 4, 5) • 'mtr: tipo impositivo marginal federal de la
mujer
• 'kidsge6: # niños 6-18 años • 'motheduc: años de escolaridad de la madre
• 'age: edad de la mujer en años • 'fatheduc: años de escolaridad del padre
• 'educ: años de escolaridad • 'unem: tasa de desempleo en el país de
• 'salario: salario estimado a partir de los ingresos, residencia
• 'Ciudad: =1 si vive en el SMSA
horas • 'Exper: experiencia real en el mercado laboral
• 'repwage: salario declarado en la entrevista en 1976 • 'Nwifeinc: (faminc - salario*horas)/1000
• 'hushrs: horas trabajadas por el marido, 1975
• 'husage: edad del marido
Circulo de la pobreza: Transmisión
intergeneracional de la pobreza
• Situación de embarazo
• Embarazo no planificado • Madre soltera
• Embarazo planificado
• Trabaja labores manuales
• Edad
• Madre menor de edad • Sector informal
• Madre es mayor de edad
• Salario: bajo
• Nivel educativo
• Madres tiene pocos años (primaria..) • Situación de pobreza
• Madre tiene estudios avanzados
• Situación económica
• Condición de pobreza
• Hogares no pobres
• Hija(o)s
• Pareja • Situación de pobreza
• Acompaña el embarazo
• No acompaña
• Mundo de pobreza, informalidad,
• Padres delincuencia
• Apoyan (ayudan) a la embarazada
• No apoyan (expulsan del hogar)
• Cuando crezcan y tengan hijos
Tobit con datos de MROZ: Trabajo mujeres
Estimamos un MCO
LS hours nwifeinc educ exper expersq age kidslt6 kidsge6 c

Estimamos un TOBIT
• Opción 1: En el menú de opciones: Quick/Estimate Equation o en la barra de comandos:
Censored. En el cuadro de diálogo que se abre en la ventana de especificación,
escribimos la regresión 𝑌𝑖 𝑋1 𝑋2 … 𝑋𝑘 𝛽1 . Con los datos de M. Roz sería:
hours nwifeinc educ exper expersq age kidslt6 kidsge6 c
• Opción 2: Estima un tobit censurado a la izquierda en 0. Guardar resultado como "eq1“:
tobit hours nwifeinc educ exper expersq age kidslt6 kidsge6 c
• Opción 3: Estima un tobit censurado a la izquierda en 0 y guarda directamente el
resultado con el nombre “eq1”
equation eq1.tobit hours nwifeinc educ exper expersq age kidslt6 kidsge6 c
Tobit con datos de MROZ: Trabajo mujeres
Dependent Variable: HOURS

MCO  TOBIT CENSURADO Method: ML - Censored Normal (TOBIT) (Newton-Raphson / Marquardt


steps)
Date: 11/21/21 Time: 05:55
Sample: 1 753
Dependent Variable: HOURS Included observations: 753
Method: Least Squares Left censoring (value) at zero
Date: 11/21/21 Time: 06:04 Convergence achieved after 7 iterations
Sample: 1 753 Coefficient covariance computed using observed Hessian
Included observations: 753
Variable Coefficient Std. Error z-Statistic Prob.
Variable Coefficient Std. Error t-Statistic Prob.
NWIFEINC -8.814243 4.459100 -1.976687 0.0481
EDUC 80.64561 21.58324 3.736493 0.0002
NWIFEINC -3.446636 2.544000 -1.354810 0.1759 EXPER 131.5643 17.27939 7.613943 0.0000
EDUC 28.76112 12.95459 2.220150 0.0267 EXPERSQ -1.864158 0.537662 -3.467155 0.0005
EXPER 65.67251 9.962983 6.591652 0.0000 AGE -54.40501 7.418502 -7.333693 0.0000
EXPERSQ -0.700494 0.324550 -2.158354 0.0312 KIDSLT6 -894.0217 111.8780 -7.991039 0.0000
AGE -30.51163 4.363868 -6.991878 0.0000 KIDSGE6 -16.21800 38.64139 -0.419705 0.6747
KIDSLT6 -442.0899 58.84660 -7.512581 0.0000 C 965.3053 446.4361 2.162247 0.0306
KIDSGE6 -32.77923 23.17622 -1.414347 0.1577
Error Distribution
C 1330.482 270.7846 4.913434 0.0000

R-squared 0.265624 Mean dependent var 740.5764


σ SCALE:C(9) 1122.022 41.57910 26.98523 0.0000

Adjusted R-squared 0.258724 S.D. dependent var 871.3142 Mean dependent var 740.5764 S.D. dependent var 871.3142
S.E. of regression 750.1786 Akaike info criterion 16.08907 S.E. of regression 746.7157 Akaike info criterion 10.16758
Sum squared resid 4.19E+08 Schwarz criterion 16.13819 Sum squared resid 4.15E+08 Schwarz criterion 10.22285
Log likelihood -6049.534 Hannan-Quinn criter. 16.10799 Log likelihood -3819.095 Hannan-Quinn criter. 10.18887
F-statistic 38.49534 Durbin-Watson stat 1.371237 Avg. log likelihood -5.071839
Prob(F-statistic) 0.000000
Left censored obs 325 Right censored obs 0
Uncensored obs 428 Total obs 753
Tobit con datos de MROZ: Trabajo mujeres
• El signo de los coeficientes estimados de la regresión Tobit, así como la significancia
estadística de los mismos es similar.
• Pero, las magnitudes de las estimaciones de MCO y de Tobit no son comparables. El
hecho que algunos coeficientes Tobit, como la variable “kidslt6” sean
aproximadamente el doble que el respectivo coeficiente MCO, ello no implica una
respuesta mayor de horas trabajadas.

EFECTOS MARGINALES
1) El EPA (Efecto parcial al promedio)
• Si se desea el efecto estimado, por ejemplo, de otro año de educación a partir
de los valores promedio de todas las variables explicativas, entonces se calcula
el factor escalar EPA (Efecto parcial al promedio)
𝑋ത 𝛽መ
𝐸𝑃𝐴 = ( )
𝜎ො
Tobit con datos de MROZ: Trabajo mujeres
El efecto marginal (continua….)….Procedimiento en Eviews

• Extraemos el XB ajustado en cada observación i de la muestra de


pronóstico (o solución de modelo)
eq1.fit(i) xb
• Obtenemos las medias de XB, ajustando el cuadrado de la media(exper) en
lugar de la media de expersq
xb = xb - expersq*eq1.c(4)
scalar meanxb = @mean(xb) + @mean(exper)^2*eq1.c(4)
• Usamos las medias de XB para calcular el factor el cual viene dado por la
"CDF" de la escala normal multiplicado por el sigma estimado
vector tobit_beta = eq1.@coefs
scalar sigma = tobit_beta(@rows(tobit_beta))
scalar ufactor = @cnorm(meanXB / sigma)
Tobit con datos de MROZ: Trabajo mujeres
El efecto marginal (continua….)….Procedimiento en Eviews

• Los efectos marginales medios incondicionales son los betas escalados


utilizando el factor
vector beta = @subextract(tobit_beta, 1, 1, @rows(tobit_beta)-1)
vector ueffects = beta * ufactor
Tobit con datos de MROZ: Trabajo mujeres
El efecto marginal (continua….)….Procedimiento en Eviews


𝑋𝑖 𝛽
−1 σ𝑛
promedio): 𝑛
2) El EPP (Efecto parcial 𝑖=1 Φ 𝜎ෝ
• 'Con base en los cálculos EPA, procedemos a calcular la inversa de Mills
(Mills ratio)
scalar mills = @dnorm(meanxb / sigma) / ufactor
• 'Con ello calculamos el factor de ajuste condicional y el vector de efectos
condicionales
scalar cfactor = (1 - mills*(meanxb / sigma + mills))
vector ceffects = beta * cfactor

También podría gustarte