Está en la página 1de 16

“Año del Bicentenario del Perú: 200 años de Independencia"

INFORME N° 5 - UNMSM

A : DR. VICTOR BENIGNO PEREZ SUAREZ

DE : PAMELA MELGAREJO GOMEZ

ASUNTO : Modelos con Variables Binaria como variable dependiente.

FECHA : Lima, 8 de Diciembre de 2021

I. ANTECEDENTES

1.1. En el anterior informe se verificó y demostró el desarrollo de los modelos ANOVA y


ANCOVA. En el cual, inicialmente se utilizó las variables dummy y para el siguiente
modelo se integró la variable independiente. Además, se comprobó los supuestos más
importantes de un modelo lineal.

1.2. El objetivo de este informe es conceptualizar y analizar el modelo lineal de probabilidad


(MLP) y aplicaciones, el modelo Logit y el modelo Probit. Lo particular de estos modelos
es que en la variable dummy se utiliza para la variable independiente y la variable binaria
para la variable dependiente. Se utilizará las herramientas estadísticas como el programa
Eviews para la estimación de los valores y el programa Mathcad para la elaboración de
los gráficos.

II. ANÁLISIS

2.1. Información proporcionada:

El cuadro 7.11 proporciona datos para el sector manufacturero de la economía griega


para el período 1961-1987. Se busca determinar si la función de producción Cobb-
Douglas se ajusta a los datos dados en la tabla. Por lo tanto, se extrae la variable
dependiente que es la producción (output), y dos variables independientes que influyen
en la producción que es el capital y el trabajo.

1
“Año del Bicentenario del Perú: 200 años de Independencia"

Datos de la tabla de Gujarati:

Base de datos:

• El número de objetos observados es igual a 27.


• El número de betas hallados es igual a 3.

Se estima el modelo mediante el uso del método de mínimos ordinarios. Por ello, para
estimar el modelo se escribe en la ventana de comandos:

Output c labor capital


Gráfico 1

2
“Año del Bicentenario del Perú: 200 años de Independencia"

2.2. Regresión con Variable Dependiente Cualitativa

Cuando una o más de las variables independientes en un modelo de regresión son


dicótomas, podemos representarlas como variables indicadoras. Sin embargo, es más
compleja la aplicación del modelo de regresión lineal cuando la variable dependiente
es dicótoma. Los modelos de elección binaria asumen que los individuos se enfrentan
con una elección entre dos alternativas y que la elección depende de características
identificables.
Supóngase, que vamos a estudiar la participación de los hombres adultos en la fuerza
laboral como función de la tasa de desempleo, la tasa promedio de salarios, el ingreso
familiar, la educación etc. En un momento determinado, una persona hace parte de la
fuerza de trabajo o no lo hace. Por lo tanto, la variable dependiente puede tomar sólo
dos valores: 1, si la persona hace parte de la fuerza de trabajo, y, 0 si no lo hace.
Existen muchos ejemplos de este tipo, con variables dependientes dicótomas. Una
familia, por ejemplo, tiene casa propia o no la tiene, ambos cónyuges están en el
trabajo o sólo uno de ellos, etc. Lo único que tienen en común estos ejemplos es que la
variable dependiente requiere una respuesta afirmativa o negativa: es decir, es
dicótoma por naturaleza.
Para ver como se manejan estos modelos que tienen una variable dependiente
dicótoma, consideremos el siguiente modelo:
𝒚𝒊 = 𝜷𝟎 + 𝜷𝟏 𝒙𝒊 + 𝜺𝒊
En tal modelo existe una variable dicotómica 𝑦𝑖 como una función lineal de las
variables explicatorias 𝑥𝑖 se denominan modelos lineales de probabilidad dado
E(𝑦𝑖 |𝑥𝑖 ), valor esperado condicional de 𝑦𝑖 dado 𝑥𝑖 puede interpretarse como la
probabilidad condicional de que el hecho ocurra, dado 𝑥𝑖 .Es decir, Pr(𝑦𝑖 = 1|𝑥𝑖 ).
Por esto, en el caso anterior, E(𝑦𝑖 |𝑥𝑖 ) nos da la probabilidad. La justificación del
nombre de modelo lineal de probabilidad para estos modelos se puede explicar de la
siguiente manera:
𝐄(𝒚𝒊 |𝒙𝒊 ) = 𝜷𝟎 + 𝜷𝟏 𝒙𝒊
Dado que 𝑦𝑖 solo puede tomar valores 1 y 0, podemos escribir la distribución de
probabilidad de “y” suponiendo que: Pi=Pr(𝑦𝑖 = 1|𝑥𝑖 ) es decir, de que el evento ocurra
dad 𝑥𝑖 y 1- Pi=Pr(𝑦𝑖 = 1|𝑥𝑖 ) es decir, de que el evento no ocurra dada 𝑥𝑖 .

3
“Año del Bicentenario del Perú: 200 años de Independencia"

La variable 𝑦𝑖 tiene la siguiente distribución:


𝒚𝒊 Probabilidad
0 1-Pi
1 Pi
1
Entonces, por la definición de esperanza matemática obtenemos:
𝐄(𝒚𝒊 |𝒙𝒊 ) = 𝟎 ∗Pr(𝒚𝒊 = 𝟎|𝒙𝒊 ) + 1* Pr(𝒚𝒊 = 𝟏|𝒙𝒊 )
𝐄(𝒚𝒊 |𝒙𝒊 ) =1* Pr(𝒚𝒊 = 𝟏|𝒙𝒊 )
𝐄(𝒚𝒊 |𝒙𝒊 ) = 𝑷𝒊
𝐄(𝒚𝒊 |𝒙𝒊 ) = 𝜷𝟎 + 𝜷𝟏 𝒙𝒊 =Pi
Esto es, la esperanza condicional del modelo puede efectivamente interpretarse como
la probabilidad condicional de yi.
2.3. Análisis de las variables
2.3.1. Variable Dummy:
Esta variable cualitativa está relacionada con la variable independiente labor, indica si
los trabajadores llevaron capacitaciones y cuando no lo hicieron. De tal forma, que se
quiere evaluar que tan eficiente fueron estas capacitaciones para los trabajadores y si
aportaron de manera satisfactoria a la producción.
Por lo tanto, la expresión general de este modelo será de la siguiente manera:

𝒀𝒊 = 𝜷𝟏 + 𝜷𝟐 𝑫𝟐𝒊
Donde:
Se sabe que 𝑌𝑖 , es la variable dependiente, es la producción(output).
Y la variable 𝐷2𝑖 , es una variable explicativa dummy, representa la variable labor.
Además:
• 𝑌𝑖 = 𝑃𝑟𝑜𝑑𝑢𝑐𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑜𝑠 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 𝑒𝑛 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑎 𝑙𝑎 𝑐𝑎𝑝𝑎𝑐𝑖𝑡𝑎𝑐𝑖ó𝑛 𝑑𝑒𝑠𝑎𝑟𝑟𝑜𝑙𝑙𝑎𝑑𝑎 .

• 𝐷1 = 1 , 𝑆𝑖 𝑠𝑒 𝑙𝑙𝑒𝑣ó 𝑙𝑎 𝑐𝑎𝑝𝑎𝑐𝑖𝑡𝑎𝑐𝑖ó𝑛.

• 𝐷0 = 0 , 𝑆𝑖 𝑛𝑜 𝑠𝑒 𝑙𝑙𝑒𝑣ó 𝑙𝑎 𝑐𝑎𝑝𝑎𝑐𝑖𝑡𝑎𝑐𝑖ó𝑛.

2.3.2 Variable binaria:


Esta variable binaria es característica de la variable dependiente. Por lo tanto, como en
el modelo de Cobb Douglas se establece que el valor de estudio es con respecto a la
variable producción, se quiere hallar que tan beneficioso fueron las capacitaciones para
los trabajadores y si se consiguió un incremento de la productividad.

4
“Año del Bicentenario del Perú: 200 años de Independencia"

La expresión general de este modelo será de la siguiente manera:


𝑽𝑩 = 𝜷𝟏 + 𝜷𝟐 𝑫𝟐𝒊
Donde:
Se sabe que 𝑌𝑖 , es la variable dependiente, es la producción(output).
Y la variable 𝐷2𝑖 , es la variable explicativa dummy que indica una característica de la
variable labor.
Además de ello, se agrega la variable binaria, que está representado como VB, explica
cualitativamente la función de producción.
Además:

• 𝑌𝑖 = 𝑃𝑟𝑜𝑑𝑢𝑐𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑜𝑠 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠 𝑒𝑛 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑎 𝑙𝑎 𝑐𝑎𝑝𝑎𝑐𝑖𝑡𝑎𝑐𝑖ó𝑛 𝑎𝑏𝑜𝑟𝑑𝑎𝑑𝑎 .

• 𝑉𝐵1 = 1, ℎ𝑢𝑏𝑜 𝑢𝑛 𝑖𝑛𝑐𝑟𝑒𝑚𝑒𝑛𝑡𝑜 𝑑𝑒 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑖𝑣𝑖𝑑𝑎𝑑.

• 𝑉𝐵0 = 0, 𝑆𝑖 𝑛𝑜 𝑒𝑠 𝑢𝑛 𝑐𝑎𝑚𝑏𝑖𝑜 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜.

De tal manera, que los valores establecidos anteriormente se distribuyen en la variable


binaria y dummy, tomando en consideración los valores de las variables en función de
cuanto rendimiento resultó, por consiguiente, se establece de la siguiente forma:

Gráfico 2

5
“Año del Bicentenario del Perú: 200 años de Independencia"

Para mayor detalle, en el gráfico 3, se indica el criterio de evaluación para decidir los
valores que tendrá la variable binaria, en que se tiene el valor de uno en caso de que la
productividad marginal sea mayor a siete y será cero si es menor a aquel valor.
Gráfico 3

2.4. Evaluación del modelo


Se explicará detalladamente cuales son los posibles modelos para utilizar para la
evaluación del modelo Cobb Douglas. Son modelos estimados por Máxima
verosimilitud debido a su no linealidad. Este método tiene ventajas estadísticas en
virtud de que sus estimaciones son consistentes, eficientes y para muestras grandes
son insesgadas y su distribución se aproxima a una normal.

2.4.1 Modelo logístico


La regresión logística no supone linealidad como en los modelos de regresión clásica,
tampoco requiere del supuesto de normalidad ni del de homocedasticidad (Garson,
2014).

6
“Año del Bicentenario del Perú: 200 años de Independencia"

Sin embargo, si requiere que las observaciones sean independientes y que las
variables explicativas estén relacionadas linealmente al logito de la variable
dependiente, tal y como se expresa esa relación en la ecuación:

Para determinar los valores de los coeficientes en un modelo logit. Generamos una
serie en la que se establece el modelo binario logit en el programa Eviews.
Gráfico 4

2.4.2. Modelo Probit (normit)

Se buscar explicar el comportamiento de la variable dependiente dicotómica, para ello,


se utiliza la función de distribución acumulativa (FDA) normal. En el análisis del modelo
de Cobb Douglas se determinó utilizar el modelo probit para un mejor desarrollo.
El probit, se especifica a través de la siguiente función de distribución acumulada
normal:
𝑧
𝑀𝑜𝑑𝑒𝑙𝑜 𝑃𝑜𝑟𝑏𝑖𝑡: 𝐹(𝑍) = 𝛹(𝑧) = ∫ 𝜓(𝑣) 𝑑𝑣
−∞
1
𝑧2
En donde 𝜓(z) es la distribución normal estándar: 𝜙(𝑉) = (2𝜋)−2 exp (− 2 )

7
“Año del Bicentenario del Perú: 200 años de Independencia"

Por lo cual, el modelo de regresión Probit quedaría especificado de la siguiente


manera:
𝑧
1 𝑧2
𝑦𝑖 = 𝜓(𝑧) + 𝜀𝑖 = ∫(2𝜋)−2 exp (− ) 𝑑𝑣 + 𝜀𝑖
2
−∞

En el caso del modelo probit se pueden sustituir las medias de las variables
Explicativas, para obtener las estimaciones de los valores Z y luego simplemente
buscar en la tabla de la normal los niveles de probabilidad que les corresponden.
Por consiguiente, hallamos los valores estadísticos estimados en el cual relacionamos
la variable dicotómica y binaria. Se puede evidenciar los valores extraídos del Eviews:
Gráfico 5

Para determinar los promedios de las variables, nos dirigimos a Views/Categorial


Descriptive Statistics for Explanatory Variables.
Gráfico 6

8
“Año del Bicentenario del Perú: 200 años de Independencia"

Con los promedios obtenidos del gráfico 6, se forma la función de factor de escala total,
que es el promedio de todos los trabajadores que han llevado o no la capacitación. Se
puede visualizar en el gráfico 7, caracterizada por ser la ecuación completa.
Se halló la “z” calculada como variable y se halla que tiene como valor -2.514579.
Gráfico 7

Luego de ello, el valor hallado lo llevamos a la distribución acumulativa de probabilidad,


como se sabe este valor estará en la parte horizontal del gráfico
Gráfico 8

9
“Año del Bicentenario del Perú: 200 años de Independencia"

El valor de probabilidad será:

El promedio total cuando no se llevó la capacitación y si se llevó la capacitación es de


0.6%, este valor irá en la parte vertical del gráfico.
Si hubo capacitación
De manera particular, se genera una nueva serie para los que llevaron la capacitación,
se establece entonces, un nuevo factor de escala, en el caso de la última variable su
valor es multiplicado por 1. Tenemos el siguiente resultado de la ecuación:
Gráfico 9

Se halló la “z” calculada como variable y se halla que tiene como valor -1.730553.
Luego de ello, el valor hallado lo llevamos a la distribución acumulativa de probabilidad,
como se sabe este valor estará en la parte horizontal del gráfico:
Gráfico 10

10
“Año del Bicentenario del Perú: 200 años de Independencia"

El valor de probabilidad será:

Se ve el 4.2% es el promedio que, si llevaron la capacitación, se ubicó en la parte


vertical del gráfico 10.
No hubo capacitación
Se genera una nueva serie cuando no se llevó la capacitación, se establece entonces,
un nuevo factor de escala, en el caso de la última variable su valor es multiplicado por
0, ya que, es el promedio final. Tenemos el siguiente resultado de la ecuación:
Gráfico 11

Se halló la “z” calculada como variable y se halla que tiene como valor -3.847424.
Después, el valor hallado lo llevamos a la distribución acumulativa de probabilidad,
como se sabe este valor estará en la parte horizontal del gráfico 12:
Gráfico 12

11
“Año del Bicentenario del Perú: 200 años de Independencia"

El valor de probabilidad será:

Se analiza que la probabilidad de éxito es poca.


De manera conjunta, se realizó la unión de los valores hallados anteriormente y se
tiene el siguiente gráfico:
Gráfico 13

Se puede evidenciar que la capacitación si fue beneficioso para la producción. Si


aumentó la producción, pero tal vez se esperaba a que sea más significativa.
Para hacer el estudio de mejor forma se trabaja con la función en forma de variable, tal
variable representativa es la labor que cuenta con un promedio de 0.0225, este dato
está en el gráfico 6, para evaluar el grado de significancia tiene que ser este valor
menor a 0.05, por tanto, sí es una variable significativa. Entonces, en lugar de su
promedio se utiliza la variable labor. Para el caso del factor de escala de una variable
representativa cuando no se lleva la capacitación está representada mediante los
valores del gráfico:
Gráfico 14

12
“Año del Bicentenario del Perú: 200 años de Independencia"

Para el caso del factor de escala de una variable representativa cuando se lleva la
capacitación está representada mediante los valores del gráfico:
Gráfico 15

Por tanto, ambas funciones la relacionamos con la variable labor y se demuestra una
grafico lineal
Gráfico 16

13
“Año del Bicentenario del Perú: 200 años de Independencia"

Para hallar la función acumulativa de distribución normal de las funciones de escala


en base a su variable mediante el Eviews,
Gráfico 17

Los valores hallados están en función a los que no llevaron la capacitación, entonces
los valores finales son:
Gráfico 18

14
“Año del Bicentenario del Perú: 200 años de Independencia"

Los valores hallados están en función a los que, si llevaron la capacitación, entonces
los valores finales son:
Gráfico 19

Graficamos los valores hallados anteriormente, vemos funciones acumulativas. Los


puntos rojos son los que, si llevaron la capacitación, y los que están pintados de azul,
son los que no llevaron la nueva capacitación.
La conclusión, se puede evidenciar que, si hubo un aprovechamiento de las
capacitaciones y una mejora en la producción, pero los resultados no eran los
esperados. La mayoría de los valores no llegaron a una alta probabilidad.

Gráfico 20

15
“Año del Bicentenario del Perú: 200 años de Independencia"

16

También podría gustarte