Tarea Sem 14

TAREA SEMANA 14
Para poder realizar este ejercicio, se utilizará la base de datos “Mroz”, la cual se
encuentra en el libro de Woldridge. Dentro de esta base de datos encontramos 22
variables, cada una con 753 observaciones.
Para esta tarea se usará el programa STATA de inicio a fin, y los resultados serán
comprobados en Eviews.
Definición de variables a utilizar:
1. INLF: Variable bivariada que indica que una mujer casada participó en la
fuerza de trabajo durante 1975.
a. Inlf=1: si una mujer informa haber trabajado, fuera de la casa, por un
salario, durante 1075.
b. Inlf=8: su una mujer informa no haber trabajado durante 1975.
2. KIDSLT6: Cantidad de hijos menores a 6 años de edad.
3. KIDSGE6: Cantidad de hijos entre 6 y 18 años.
4. AGE: Edad en años.
5. EDUC: Años de educación.
6. EXPER: Años de experiencia en el mercado laboral.
7. NWIFEINC: Ingresos del esposo, expresado en miles de dólares.
(𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝐹𝑎𝑚𝑖𝑙𝑖𝑎𝑟 − 𝑠𝑎𝑙𝑎𝑟𝑖𝑜 ∗ ℎ𝑜𝑟𝑎𝑠)

𝑁𝑊𝐼𝐹𝐸𝐼𝑁𝐶 =
1000
8. EXPERSQ: El cuadrado de la experiencia.
Análisis descriptivo de las variables:

Como podemos ver, existen 753 observaciones para cada variable.
 Inlf: Esta variable es dicotómica, debido a que toma valores entre 0 y 1, en

donde, si la mujer casada participó en la fuerza laboral es 1 y de lo contrario
es 0.
 Kidslt6: La cantidad de niños menores de 6 años es una variable discreta,

el mínimo es 0, es decir que no tiene hijos menores de 6 años y un máximo
de 3 hijos menores de 6 años.
 Kidsge6: La cantidad de hijos entre 6 y 18 años es una variable discreta, en

donde se tiene como máximo la cantidad de 8 hijos. (entre 6 y 18 años)
 Age: La edad es una variable continua, en donde para nuestros datos, la

edad mínima de las mujeres es 30 años y la mayor edad es 60.
 Educ: Es una variable continua, en donde nos dice que, en nuestros datos,
como mínimo las señoras han tenido 5 años de estudios y como máximo 17
años.
 Exper: La experiencia es una variable continua medida en años, y vemos

que, en nuestra data, existen señoras (o señora) que no tienen experiencia
laboral, además la cantidad máxima de años de experiencia en el mercado
laboral es de 45 años.
 Nwifeinc: El ingreso de los esposos, para nuestra data nos dice que el
mínimo valor es negativo, es decir, que hay casos en los que el salario de
las esposas está por encima al salario de los esposos. Además, el valor
máximo es 96, en donde seguro la esposa no tiene ingresos.
Especificación del modelo:
𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + 𝛽4 𝑋4 + 𝛽5 𝑋5 + 𝛽6 𝑋6 + 𝛽7 𝑋7
Donde:
Y = INLF: Participación de mujeres casadas en la fuerza laboral
X1 = KIDSLT6: Cantidad de hijos menores a 6 años de edad.
X2 = KIDSGE6: Cantidad de hijos entre 6 y 18 años.
X3 = AGE: Edad en años.
X4 = EDUC: Años de educación.
X5 = EXPER: Años de experiencia en el mercado laboral.
X6 = NWIFEINC: Ingresos del esposo, expresado en miles de dólares.
X7 = EXPERSQ: El cuadrado de la experiencia.
ESTIMACIONES:
Modelo de regresión lineal:
Realizamos la estimación del modelo mediante el modelo de mínimos cuadrados

ordinarios, el cual nos da como resultado lo siguiente:
Al ver los resultados, analizamos los siguientes puntos:
La variable kidsge6 es no significativa estadísticamente en el modelo, es decir, la

cantidad de hijos entre 6 y 18 años, no tiene una significancia para saber si la mujer
casada participa o no en el mercado laboral.
Análisis de los coeficientes:
 Kidslt6: Tiene como coeficiente -0.2618, pero esto significa que, si una
mujer tiene 1 niño adicional menor a 6 años, la probabilidad de pertenecer
al mercado laboral se reduce a un 26.18%.
 Kidsge6: Tiene como coeficiente 0.01301, lo que significa, si una mujer
tiene 1 niño adicional entre 6 y 18 años, la probabilidad de pertenecer al
mercado laboral se aumenta en 1.3%.
 Age: Tiene como coeficiente -0.01609, lo que nos dice, si una mujer cumple
un año más de vida, la probabilidad de pertenecer al mercado laboral se
reduce en un 1.61%,
 Educ: Tiene como coeficiente 0.037, lo que nos dice que por cada año de
estudio adicional que tengan las mujeres, su probabilidad de pertenecer al
mercado laboral se incremente en un 3.7%
 Exper: Tiene de coeficiente 0.0395, es decir, que por cada año adicional de
experiencia en el mercado laboral, la probabilidad de la mujer a pertenecer
al mercado laboral se incrementa en 3.95%.
 Nwifeinc: Tiene como coeficiente -0.0034, lo que significa, que por cada
incremento de una unidad en el salario del esposo expresado en miles, la
probabilidad de la mujer a pertenecer al mercado laboral se verá reducido
en 0.34%
En este caso todos los coeficientes se encuentran en el rango de [-1, 1], pero nada
garantiza que existan casos en la que esto no se cumpla, debido a que en el modelo
lineal no existen restricciones de este tipo, la cual es necesaria cumplir, debido a que si
excede de ese rango al multiplicar por 100, y transformarse en probabilidades, excedería
del 100% lo cual no puede suceder.
Además, no podemos garantizar que los coeficientes sean el impacto para un cambio
real de la variable, debido a que la variación marginal de una regresión lineal es directo,
y con una variable dependiente dicotómica, habrá casos en las que los cambios no se
darán en una unidad, en donde el impacto no será el mismo.
Luego de eso, vemos una bondad de ajuste baja de 26.42%, donde la variable de
nuestros errores explicaría en medida a nuestra variable dependiente. Además,
presenta una probabilidad de casi 0% para la hipótesis nula de que los parámetros sean
iguales a 0, es decir, en su conjunto todas las variables son significativas en el modelo.
MODELO DE REGRESIÓN LOGIT
La regresión logit utiliza una función de distribución acumulativa (FDA) de tipo logístico.
La regresión logística se basa en la suposición de que la variable dependiente
categórica refleja una variable subyacente cualitativa. Y deduce la función de enlace a
partir de la función binominal.
 Ho: Xi = 0, los parámetros son iguales a 0.

 Hi: Xi ≠ 0, los parámetros son diferentes a 0.
Este modelo más acorde a la condición de las variables (variable dependiente binaria).
Este método de estimación ya no busca reducir los errores cuadrático, al estimar este
modelo tenemos los siguientes resultados:
En este modelo como hemos podido ver, en la parte superior no tenemos el ANOVA
que se veía en el modelo de regresión lineal, sino que ahora tenemos un modelo de
máxima verosimilitud, que a partir de las interacciones donde ya no se presenta más
cambios es el que se toma como modelo nulo para poder estimar el coeficiente de Chi2.
El valor log likelihood, es el valor usado para hallar el valor de Chi2 y el Pseudo R2
(medida de bondad de ajuste), este último es el equivalente del R^2 del modelo de
regresión lineal.
Para saber cómo se obtienen los valores del lado de la derecha de las iteraciones y su
interpretación, realizamos los siguientes cálculos:
1. Primero en STATA, hacemos la regresión LOGIT, y vemos cuánto vale cada
modelo (modelo nulo y completo).
2. Dentro de esos resultados, podemos ver que el ítem “e (11)”, el cual representa
al modelo completo y el ítem “e (11_0)” es el modelo nulo.
3. Calculamos cada valor:

a. Lr Chi2 (7):
𝐿𝑟 𝐶ℎ𝑖2(7) = 2 ∗ (𝑒(11) − 𝑒(11_0))
𝐿𝑟 𝐶ℎ𝑖2(7) = 226.216
Dentro del valor de la Chi2, vemos que se usan 7 grados de libertad, los cuales son
representados por la cantidad de las variables explicativas, además podemos analizar
su probabilidad, la cual es casi 0% para la hipótesis nula de que los parámetros de estos
co3ficientes son iguales a 0, es decir que en su conjunto las variables son significativas
en el modelo.
b. Pseudo R2:
𝑃𝑠𝑒𝑢𝑑𝑜 𝑅2 = 1 − (𝑒(11)/𝑒(11_0))
𝑃𝑠𝑒𝑢𝑑𝑜 𝑅2 = 0.21968
En un sentido similar al valor del R^2, podemos decir que las variables independientes
explican en un 21.97% a las variable dependiente. Este análisis no es muy convincente,
porque estamos en un modelo de logaritmo, para dos opciones de respuesta de nuestra
variable dependiente, ya que lo que queremos es una probabilidad relacionada a ella.
Debido a este, es mejor analizar el valor, R^2 cuenta, el cual lo hallamos de la siguiente
manera:
- Usando en STATA, el comando “estat class”, teniendo como resultado lo

siguiente:
El R^2 cuenta, es otra medida de bondad de ajuste, similar al R^2, este cuadro nos
muestra el cuadro de clasificación y verdades, y se analiza como:
 347: mujeres que sí participaron en el mercado laboral y el programa lo clasificó

de igual forma.
 207: mujeres que no pertenecían al mercado laboral y el programa lo clasificó de
igual forma.
 118: mujeres que no pertenecían al mercado laboral, el programa las predijo que
si trabajaban.
 81: mujeres que si trabajaban, el programa las clasificó como que no trabajaban.
Dicho de otra forma, 347 y 207 es el número de predicciones correctas, mientras que
118 y 81 es el número de predicciones erróneas.
Para saber el valor del R^2 cuenta, es necesario usar la siguiente fórmula:
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑟𝑒𝑑𝑖𝑐𝑐𝑖𝑜𝑛𝑒𝑠 𝑎𝑐𝑒𝑟𝑡𝑎𝑑𝑎𝑠

𝑅 2 𝐶𝑢𝑒𝑛𝑡𝑎 =
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
347 + 207
𝑅 2 𝐶𝑢𝑒𝑛𝑡𝑎 = = 0.7357
753
El valor del R^2 Cuenta es de 0.7357, es decir que el modelo tiene un porcentaje de
acierto del 73.57%. El modelo usa para acertar la sensibilidad (probabilidad de acertar
en las mujeres que trabajaban) y especificidad (probabilidad de acertar en las mujeres
que no trabajaban).
Regresando al modelo, interpretaremos los resultados que nos arroja:
Al ver los resultados analizamos los siguientes puntos:
Análisis de los signos de los coeficientes:

 Kidslt6: Tiene un coeficiente negativo, pero esto significa que, si una
mujer tiene 1 niño menor a 6 años, la probabilidad de pertenecer al
mercado laboral se ve reducida.
 Kidsge6: Tiene un coeficiente positivo, lo que significa, si una mujer
tiene 1 niño entre 6 y 18 años, la probabilidad de pertenecer al mercado
laboral se ve aumentada.
 Age: Tiene un coeficiente negativo, lo que nos dice, que los años de
una mujer reducen la probabilidad de pertenecer al mercado laboral.
 Educ: Tiene un coeficiente positivo, lo que nos dice que los año de
estudio de las mujeres aumenta su probabilidad de pertenecer al
mercado laboral.
 Exper: Tiene un coeficiente positivo, es decir, que cada año de
experiencia en el mercado laboral aumenta la probabilidad de la mujer
a pertenecer al mercado laboral.
 Nwifeinc: Tiene un coeficiente negativo, lo que significa, que el salario
del esposo expresado en miles reduce la probabilidad de la mujer a
pertenecer al mercado laboral.
Para un análisis más profundo, utilizaremos el modelo pero, ya no con los
coeficientes si con sus Odds Ratio:
Los Odds Ratio pueden ser leídos como la cantidad de veces de probabilidad de ocurrir
un evento, es decir con nuestras variables:
 Kidslt6: Una mujer con un niño menor a 6 años, tiene 4 veces más la
probabilidad de no pertenecer al mercado laboral.
 Kidsge6: Si una mujer tiene un niño entre 6 y 18 años, la probabilidad de
pertenecer al mercado laboral es 1.06 veces más que de no pertenecer al
mercado laboral
 Age: Con cada año que tiene de edad la mujer, tiene 1.09 veces más la
probabilidad de no pertenecer al mercado laboral
 Educ: Por un año más de educación de las mujeres, la probabilidad de
pertenecer al mercado laboral es 1.24 veces mayor a no pertenecer al
mercado laboral
 Exper: Por un año más de experiencia de las mujeres, la probabilidad de
pertenecer al mercado laboral es 1.22 veces mayor a no pertenecer al
mercado laboral.
 Nwifeinc: Con cada mil dólares del sueldo del esposo, la probabilidad de no
pertenecer al mercado laboral por parte de las mujeres es 1.02 veces más
que la probabilidad de pertenecer.
Para los coeficientes menores a 1, se ha realizado la operación “1/Odds Ratio”, y de

esta manera poder analizarlo.
Por último, hallamos un cuadro de probabilidades marginales para cada variable, para
ver cuál es la probabilidad por un aumento unitario en las variables:
Los resultados que hemos podido ver a continuación, pueden ser analizados, por cada
variable, dando el siguiente análisis:
 Kidslt6: Por un niño adicional que tenga menos de 6 años, la probabilidad

de una mujer que pertenezca al mercado laboral, se reduce en 25.77%
 Kidsge6: Por un hijo adicional que tenga entre 6 y 18 años, la probabilidad
de una mujer que pertenezca al mercado laboral, se incrementa en 2.07%
 Age: Por una año más de edad, la probabilidad de pertenecer al mercado
laboral se va reducir en un 1.57%
 Educ: Por un año más de estudios que tenga la mujer, la probabilidad de
pertenecer al mercado laboral se va aumentar en 3.95%
 Exper: Por un año más de experiencia que tenga la mujer, la probabilidad
de pertenecer al mercado laboral va aumentar en 3.67%.
 Nwifeinc: Por un ingreso adicional del esposo, la probabilidad de pertenecer
al mercado laboral se va reducir en 0.38%
MODELO DE REGRESIÓN PROBIT:
Para la regresión probit se utiliza una función de distribución acumulativa de distribución

normal. La regresión probit asume que la variable dependiente categórica refleja una
distribución subyacente cualitativa la cual ha sido re categorizada de modo que se
convierte en una variable binaria y deduce la función de enlace de la distribución normal
estándar acumulada.
 Ho: Xi = 0, los parámetros son iguales a 0.

 Hi: Xi ≠ 0, los parámetros son diferentes a 0.
Este modelo también ve de acorde a la condición de las variables (variable dependiente

binaria).
En este modelo al igual que en el modelo LOGIT, en la parte superior no tenemos el

ANOVA que se veía en el modelo de regresión lineal, sino que ahora tenemos un modelo
de máxima verosimilitud, que a partir de las interacciones donde ya no se presenta más
cambios es el que se toma como modelo nulo para poder estimar el coeficiente de Chi2.
El valor log likelihood, es el valor usado para hallar el valor de Chi2 y el Pseudo R2
(medida de bondad de ajuste), este último es el equivalente del R^2 del modelo de
regresión lineal.
Para saber cómo se obtienen los valores del lado de la derecha de las iteraciones y su
interpretación, realizamos los siguientes cálculos:
4. Primero en STATA, hacemos la regresión LOGIT, y vemos cuánto vale cada
modelo (modelo nulo y completo).
5. Dentro de esos resultados, podemos ver que el ítem “e (11)”, el cual representa
al modelo completo y el ítem “e (11_0)” es el modelo nulo.
6. Calculamos cada valor:
a. Lr Chi2 (7):
𝐿𝑟 𝐶ℎ𝑖2(7) = 2 ∗ (𝑒(11) − 𝑒(11_0))
𝐿𝑟 𝐶ℎ𝑖2(7) = 227.14
Dentro del valor de la Chi2, vemos que se usan 7 grados de libertad, los cuales son
representados por la cantidad de las variables explicativas, además podemos analizar
su probabilidad, la cual es casi 0% para la hipótesis nula de que los parámetros de estos
co3ficientes son iguales a 0, es decir que en su conjunto las variables son significativas
en el modelo.
b. Pseudo R2:
𝑃𝑠𝑒𝑢𝑑𝑜 𝑅2 = 1 − (𝑒(11)/𝑒(11_0))
𝑃𝑠𝑒𝑢𝑑𝑜 𝑅2 = 0.22058
En un sentido similar al valor del 𝑹𝟐 , podemos decir que las variables independientes
explican en un 22.06% a las variable dependiente. Este análisis no es muy convincente,
porque estamos en un modelo de logaritmo, para dos opciones de respuesta de nuestra
variable dependiente, ya que lo que queremos es una probabilidad relacionada a ella.
Debido a este, es mejor analizar el valor, 𝑹𝟐 cuenta, el cual lo hallamos de la siguiente

manera:
- Usando en STATA, el comando “estat class”, teniendo como resultado lo

siguiente:
El 𝑹𝟐 cuenta, es otra medida de bondad de ajuste, similar al 𝑹𝟐 , este cuadro nos muestra
el cuadro de clasificación y verdades, y se analiza como:
- 348: mujeres que sí participaron en el mercado laboral y el programa lo clasificó

de igual forma.
- 205: mujeres que no pertenecían al mercado laboral y el programa lo clasificó de
igual forma.
- 120: mujeres que no pertenecían al mercado laboral, el programa las predijo que
si trabajaban.
- 80: mujeres que si trabajaban, el programa las clasificó como que no trabajaban.
Dicho de otra forma, 348 y 205 es el número de predicciones correctas, mientras que
120 y 80 es el número de predicciones erróneas.
Para saber el valor del 𝑹𝟐 cuenta, es necesario usar la siguiente fórmula:
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑟𝑒𝑑𝑖𝑐𝑐𝑖𝑜𝑛𝑒𝑠 𝑎𝑐𝑒𝑟𝑡𝑎𝑑𝑎𝑠

𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
348 + 205
753
= 0.7344
El valor del 𝑹𝟐 Cuenta es de 0.7344, es decir que el modelo tiene un porcentaje de

acierto del 73.44%. El modelo usa para acertar la sensibilidad (probabilidad de acertar
en las mujeres que trabajaban) y especificidad (probabilidad de acertar en las mujeres
que no trabajaban).
Regresando al modelo, interpretaremos los resultados que nos arroja:
Al ver los resultados analizamos los siguientes puntos:
Análisis de los signos de los coeficientes:

 Kidslt6: Tiene un coeficiente negativo, pero esto significa que, si una
mujer tiene 1 niño menor a 6 años, la probabilidad de pertenecer al
mercado laboral se ve reducida.
 Kidsge6: Tiene un coeficiente positivo, lo que significa, si una mujer tiene
1 niño entre 6 y 18 años, la probabilidad de pertenecer al mercado laboral
se ve aumentada.
 Age: Tiene un coeficiente negativo, lo que nos dice, que los años de una
mujer reducen la probabilidad de pertenecer al mercado laboral.
 Educ: Tiene un coeficiente positivo, lo que nos dice que los año de
estudio de las mujeres aumenta su probabilidad de pertenecer al
mercado laboral.
 Exper: Tiene un coeficiente positivo, es decir, que cada año de
experiencia en el mercado laboral aumenta la probabilidad de la mujer a
 Nwifeinc: Tiene un coeficiente negativo, lo que significa, que el salario
del esposo expresado en miles reduce la probabilidad de la mujer a
Por último, hallamos un cuadro de probabilidades marginales para cada variable, para
ver cuál es la probabilidad por un aumento unitario en las variables:
Los resultados que hemos podido ver a continuación, pueden ser analizados, por cada
variable, dando el siguiente análisis:
 Kidslt6: Por un niño adicional que tenga menos de 6 años, la probabilidad

de una mujer que pertenezca al mercado laboral, se reduce en 26.11%
 Kidsge6: Por un hijo adicional que tenga entre 6 y 18 años, la probabilidad
de una mujer que pertenezca al mercado laboral, se incrementa en 1.08%
 Age: Por una año más de edad, la probabilidad de pertenecer al mercado
laboral se va reducir en un 1.58%
 Educ: Por un año más de estudios que tenga la mujer, la probabilidad de
pertenecer al mercado laboral se va aumentar en 3.93%
 Exper: Por un año más de experiencia que tenga la mujer, la probabilidad
de pertenecer al mercado laboral va aumentar en 3.71%.
 Nwifeinc: Por un ingreso adicional del esposo, la probabilidad de pertenecer
al mercado laboral se va reducir en 0.36%.
COMPARACIÓN DE LOS MODELOS:
Debido a la naturaleza de los modelos, el modelo de regresión lineal es el menos apto

para una estimación con una variable dependiente bivariante, es por ello que la
dejaremos fuera de esta comparación en primer instancia y poder comparar a los
modelos que sí tienen una bondad de ajuste mayor y muy parecidos, LOGIT Y PROBIT.
Para comenzar con el análisis, compararemos los 𝑹𝟐 Cuenta asociados a cada uno,
debido a que es su prueba de bondad de ajuste:
𝑹𝟐 – LOGIT 𝑹𝟐 – PROBIT
73.57% 73.44%
Al poder comparar ambas bondades de ajuste, que por cierto son muy similares,
podemos inferir que el modelo LOGIT, es el que más aciertos tiene para nuestras
variables, pero con una diferencia casi mínima.
Otra manera para saber cuál es el modelo que más se ajusta para nuestra regresión, es
con el índice de Akaike, el cual se realiza de la siguiente manera:
1. Se realiza la estimación del modelo (LOGIT y PROBIT)

2. Y usamos el comando “estat ic”
Luego de realizar las estimaciones y el índice de akaike, tenemos los siguientes

resultados:
LOGIT
PROBIT
La regla de decisión con respecto a este índice, es ver cual tiene el AIC y BIC más alto,
comparando ambos cuadros, podemos ver que el modelo LOGIT es mayor al modelo
PROBIT, en una cantidad menor, pero lo es. Además, esto ya lo veníamos viendo por
el 𝑹𝟐 Cuenta, en donde el LOGIT también superaba al PROBIT por una cantidad nada
grande.
MATRIZ DE COMPARACIÓN DE MODELOS:
Esta matriz resume las regresiones de los tres modelos:
En el modelo de mínimos cuadrados ordinarios, vemos que la variable kidsge6

es no significativa para el modelo, la variable nwifeinc es significativa para el
modelo a un 95% de confianza, la variable expersq (experiencia al cuadrado) es
significativa para el modelo a un 99%, mientras que todas las demás variables
son significativas a un 99.9%.
En el modelo LOGIT, tenemos una situación muy similar, debido a que la variable
kidsge6 es no significativa en el modelo al igual que la constante, la variable
nwifeinc es significativa a un 95%, la variable expersq es significativa a un 99%,
mientras que las demás variables son significativas a un 99.9%.
En el modelo PROBIT, repetimos los mismos resultados que el modelo LOGIT,
la variable kidsge6 es no significativa en el modelo al igual que la constante, la
variable nwifeinc es significativa a un 95%, la variable expersq es significativa a
un 99%, mientras que las demás variables son significativas a un 99.9%.
CONCLUSIONES:
El modelo de regresión de mínimos cuadrados ordinarios (MCO), no es el más óptimo

para poder realizar estimaciones con una variable dependiente dicotómica, debido a que
la bondad de ajuste es muy baja, esto se debe a que se intenta minimizar el cuadrado
de los residuos, pero al ser una variable dependiente que solo toma valores entre 0 y 1,
se pueden obtener resultados fuera de los límites del modelo.
El modelo PROBIT al igual que el modelo LOGIT, le dan un gran ajuste al modelo en su
conjunto y en la mayoría de sus variables, además de tener una gran cantidad de datos
acertados.
En comparación de los tres modelos, el que presenta un mejor ajuste de bondad es el

modelo LOGIT, por lo que sería el más óptimo para poder realizar estimaciones con
nuestras variables.

Tarea Sem 14

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tarea Sem 14

Cargado por

Copyright:

Formatos disponibles

TAREA SEMANA 14

Definición de variables a utilizar:

(𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝐹𝑎𝑚𝑖𝑙𝑖𝑎𝑟 − 𝑠𝑎𝑙𝑎𝑟𝑖𝑜 ∗ ℎ𝑜𝑟𝑎𝑠)

8. EXPERSQ: El cuadrado de la experiencia.

Análisis descriptivo de las variables:

 Inlf: Esta variable es dicotómica, debido a que toma valores entre 0 y 1, en

 Kidslt6: La cantidad de niños menores de 6 años es una variable discreta,

 Kidsge6: La cantidad de hijos entre 6 y 18 años es una variable discreta, en

 Age: La edad es una variable continua, en donde para nuestros datos, la

 Exper: La experiencia es una variable continua medida en años, y vemos

Especificación del modelo:

Y = INLF: Participación de mujeres casadas en la fuerza laboral

X1 = KIDSLT6: Cantidad de hijos menores a 6 años de edad.

X2 = KIDSGE6: Cantidad de hijos entre 6 y 18 años.

X3 = AGE: Edad en años.

X4 = EDUC: Años de educación.

X5 = EXPER: Años de experiencia en el mercado laboral.

X6 = NWIFEINC: Ingresos del esposo, expresado en miles de dólares.

X7 = EXPERSQ: El cuadrado de la experiencia.

Modelo de regresión lineal:

Realizamos la estimación del modelo mediante el modelo de mínimos cuadrados

Al ver los resultados, analizamos los siguientes puntos:

La variable kidsge6 es no significativa estadísticamente en el modelo, es decir, la

 Ho: Xi = 0, los parámetros son iguales a 0.

3. Calculamos cada valor:

𝐿𝑟 𝐶ℎ𝑖2(7) = 2 ∗ (𝑒(11) − 𝑒(11_0))

- Usando en STATA, el comando “estat class”, teniendo como resultado lo

 347: mujeres que sí participaron en el mercado laboral y el programa lo clasificó

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑟𝑒𝑑𝑖𝑐𝑐𝑖𝑜𝑛𝑒𝑠 𝑎𝑐𝑒𝑟𝑡𝑎𝑑𝑎𝑠

Regresando al modelo, interpretaremos los resultados que nos arroja:

Al ver los resultados analizamos los siguientes puntos:

Análisis de los signos de los coeficientes:

Para los coeficientes menores a 1, se ha realizado la operación “1/Odds Ratio”, y de

 Kidslt6: Por un niño adicional que tenga menos de 6 años, la probabilidad

Para la regresión probit se utiliza una función de distribución acumulativa de distribución

 Ho: Xi = 0, los parámetros son iguales a 0.

Este modelo también ve de acorde a la condición de las variables (variable dependiente

En este modelo al igual que en el modelo LOGIT, en la parte superior no tenemos el

𝐿𝑟 𝐶ℎ𝑖2(7) = 2 ∗ (𝑒(11) − 𝑒(11_0))

Debido a este, es mejor analizar el valor, 𝑹𝟐 cuenta, el cual lo hallamos de la siguiente

- Usando en STATA, el comando “estat class”, teniendo como resultado lo

- 348: mujeres que sí participaron en el mercado laboral y el programa lo clasificó

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑟𝑒𝑑𝑖𝑐𝑐𝑖𝑜𝑛𝑒𝑠 𝑎𝑐𝑒𝑟𝑡𝑎𝑑𝑎𝑠

El valor del 𝑹𝟐 Cuenta es de 0.7344, es decir que el modelo tiene un porcentaje de

Regresando al modelo, interpretaremos los resultados que nos arroja:

Al ver los resultados analizamos los siguientes puntos:

Análisis de los signos de los coeficientes:

 Kidslt6: Por un niño adicional que tenga menos de 6 años, la probabilidad

COMPARACIÓN DE LOS MODELOS:

Debido a la naturaleza de los modelos, el modelo de regresión lineal es el menos apto

1. Se realiza la estimación del modelo (LOGIT y PROBIT)

Luego de realizar las estimaciones y el índice de akaike, tenemos los siguientes

Esta matriz resume las regresiones de los tres modelos:

En el modelo de mínimos cuadrados ordinarios, vemos que la variable kidsge6

El modelo de regresión de mínimos cuadrados ordinarios (MCO), no es el más óptimo

En comparación de los tres modelos, el que presenta un mejor ajuste de bondad es el

También podría gustarte