Está en la página 1de 4

TAREA 1 ECONOMETRÍA

Pregunta 1

a)Ver Stata

b)Ver Stata

c)Ver Stata

d) El porcentaje de hombres casados es 41,67%.El porcentaje de mujeres casadas es


42,31%.

e) El porcentaje de desempleo podemos medirlo como el número de personas desocupadas


como proporción de personas activas (desocupados + activos). Luego a partir de la tabla
obtenemos que este porcentaje es del 7,31%.

f) Regresaremos 4 diferentes ingresos (yopraj, yoprhaj, yautaj, yauthaj) para ver cuál tiene
un R^2 más alto, y haremos el análisis de la importancia de definir la ocupación para los 4.
En el caso de usar la variable Ln_ingreso=Ln(yopraj), la eliminación de aquellos que no
están empleados es una redundancia, ya que aquellos que no están empleados toman el
valor 0, es decir, no tienen ingreso (por lo que no se consideran en la regresión), lo cual es
irreal, ya que las personas, a pesar de estar desempleadas, igual tienen ingresos. Pero en
el caso de regresar con respecto al ingreso autónomo (yautaj), el definir por actividades sí
genera diferencias, ya que aquellos que están desocupados sí tienen ingresos (que es más
cercano a la realidad). Los resultados muestran que la regresión del ingreso autónomo
(yautaj) con respecto a la escolaridad tiene un Rˆ2 mayor, lo que explica mejor la relación
entre ingreso y escolaridad, por lo que sería la variable óptima a usar. Además, el ingreso
autónomo es la medida más completa de ingreso, ya que contempla todos los ingresos
posibles de la persona (Ingresos del trabajo+otros ingresos autónomos)

g) En la regresión, los coeficientes de los estimadores de la escolaridad y experiencia son


positivos y explicativos, ya que sus P>|t| son menores al alfa, que es 5% (son 0 y 2,9%
respectivamente). En tanto, la variable experienciaˆ2 no es explicativa, ya que su p-valor es
mayor al alfa de significación (es un 22,3%). Es modelo es explicativo en cuanto al test
F:Prob > F=0.

h) Para esta pregunta se usará el comando ttest, que sirve para hacer tests de
comparaciones de media. Dicho comando arrojará tres valores, que son, respectivamente,
probar si la media de los ingresos de las mujeres es mayor a la de los hombres, si las
medias son iguales y, por último, si la media de los hombres es mayor a la de las mujeres.
En el caso de asumir varianzas poblacionales iguales, el ttest arroja tres valores ( Pr(T < t) =
0.9335 Pr(|T| > |t|) = 0.1329 Pr(T > t) = 0.0665), lo que significa que no se
rechazan las hipótesis nulas (Ho: media hombres= media mujeres) ya que el p-valor es
mayor en todos los casos al alfa. Pero si no se quiere asumir varianzas poblacionales
iguales y, por lo tanto, se desea usar la fórmula de Welch, el comando apropiado es ttest
ingreso, by(sexo) welch. Bajo este comando se arrojan tres resultados ( Pr(T < t) = 0.9830
Pr(|T| > |t|) = 0.0340 Pr(T > t) = 0.0170 respectivamente), por lo que se puede
rechazar la diferencia de medias=0 y que los hombres ganen lo mismo que las mujeres a un
95% de confianza

i) El efecto de la educación de la mujer en el ingreso, medido a través de estimador de la


interacción, es de -0.0746791%, siendo significativo de acuerdo al p valor y teniendo un
intervalo de confianza de (-0.117197,-0.0321611).

j) El ingreso aumentaría un 0.012237% si las horas trabajadas aumentan en un 10%. Sin


embargo, este resultado no es significativo de acuerdo al p valor ya que P>|t| resulta
0.423>0.05,con un IdeC al 95% de (-0.0018116,0.0042589).

Pregunta 2

2) El estimador del regresor Y es: 0.9000002, siendo aproximadamente igual a 0.9. El


intervalo de confianza al 95% es (0.8999998, 0.9000005). El Rˆ2 es 1. Es significativo de
acuerdo al test student ya que P>|t| es 0 y el modelo de acuerdo al test F: Prob > F=0.

3) El estimador del regresor Y1 es: 0.893235, siendo distinto de 0.9. El intervalo de


confianza al 95% es (0.8878629, 0.8986071). El Rˆ2 es 0.9907, esto ya que se incorpora un
vector aleatorio que sigue una determinada distribución, y en donde existen errores no
sistemáticos (una fracción de 0.0093 no explicada por la regresión). Si es significativo el
modelo de acuerdo al test “F”, ya que P>|t| es 0 y P>F es igual a 0.

4) El estimador del regresor Y2 es: 0.893235. El intervalo de confianza al 95% es (0


.8878629, 0.8986071). El Rˆ2 es 0.9907. El modelo es significativo de acuerdo al test “F”à
P>|t| es 0 para el estimador del regresor Y2 pero no así para el valor de la constante, ya que
P>|t| es 0.436 y el IdeC al 95% (-75.79228, 32.72877). Esto ocurre por lo siguiente:
sabemos que en un modelo econométrico es siempre recomendable incluir un término
constante tanto para lograr un mejor ajuste en la curva de regresión estimada como para
obtener una mejor interpretación de los indicadores de ajuste como, por ejemplo, el
Rˆ2(matemáticamente, que el origen de la curva de ajuste no parta necesariamente del
punto (0,0) en los ejes de coordenadas, lo que casi siempre dará lugar a un mejor ajuste).
La inclusión de la constante en muchas ocasiones sólo es un artificio matemático para
lograr un mejor ajuste, sin que sea posible darle una interpretación económica. En este caso
el sumar 100 a la variable Y2 empeora el resultado de la regresión, desviando la estimación
del verdadero valor de la constante.

5) El estimador del regresor Y es; 0.8774486, siendo distinto de 0.9. El intervalo de


confianza al 95% es (0.8175425, 0.9373547). El Rˆ2 es 0.4529. Si es significativo el modelo
de acuerdo al test “F”à Prob > F=0.
6) El estimador de Y es: 0.9000002. El estimador de Z es: -0.2499999. El Rˆ2 de la
regresión es 1. El IdeC de Y al 95% es (0.8999998, 0.9000005), el de Z es
(-0.2500006,-0.2499992). Es significativo el modelo de acuerdo al test F: Prob > F=0. Se
obtienen estos estimadores por el hecho que aparecen explícitas las incidencias que
tendrían, a partir de un cambio en 1 en Y y Z, en C2. Que el vector Z pueda tomar
cualquiera de las 1000 observaciones que contiene no implica que el 0.25 no sea el
estimador, así mismo con Y.
Como la variable C_2 es una combinación lineal de las variables Y y Z, la regresión no
posee la variable de errores, por lo que la regresión no tiene el componente de
estocasticidad que sí posee al entrar esta variable. Es por esto que los valores de los Beta
no varían cuando se los somete a regresión (cosa que sí harán en la pregunta 2,7, donde se
somete a la variable a estocasticidad con la introducción de e_2)

7) El estimador de Y es: 0.8761759. El estimador de Z es: -0.285158. El IdeC al 95% de Y


es: (0.8160873, 0.9362644). El IdeC al 95% de Z es: (-0.4069692,-0.1633468). El Rˆ2 de la
regresión es 0.4642. Se obtienen estos valores para los estimadores porque se incorpora un
vector aleatorio que sigue una determinada distribución, y en donde existen errores no
sistemáticos (una fracción de 0.5358 no explicada por la regresión). Es significativo el
modelo de acuerdo al test.

8) Regresando ambos por separado, estamos asumiendo ortogonalidad entre Z e Y. En este


caso, llegamos a la conclusión de que estos estimadores son sesgados por el hecho de que
no son ortogonales: tanto el Rˆ2 de C3 en Y como de C3 en Z son menores que de C3 en Y
y Z (en la cual se aprecia una disminución del Rˆ2 mayor en Z que en Y).

9) La correlación entre W e Y es 0.9945, lo que significa que existe una alta


correspondencia entre ambas variables y que son explicativas ante un cambio entre ellas.
Obtenemos que el estimador de Y es 9.07e-07 y el de W 0.7499993. El modelo resulta
explicativo dado R^2=1 y por Prob > F=0 es significativo. Al analizar el valor p de Y,
P>|t|=0.603, encontramos que el estimador de este no es significativo, dado que P>|t|>0.05.
Por el contrario, el P>|t|=0 por parte de W, siendo significativo.

10) Al regresionar C4 en Y obtenemos que el estimador de Y es 0.6744265, con un Rˆ2


igual a 0.9891. Regresando C4 en W obtenemos que W es 0.7500003, con un Rˆ2 igual a 1,
por lo tanto, se podría deducir que la estimación separada en W es más completa que
aquella en Y, debido a que W está definida como una función de Y, por lo que, al regresar
C4 en W, se toma en consideración tanto ésta variable como la variable Y, pero cuando se
regresiona sólo en Y, el modelo deja fuera a W, lo que lo hace menos completo (R^2 menor)

11) Regresando C3 en Y y Z y quitando la constante, obtenemos ahora que el R^2 es igual


a 1, con el estimador de Y igual a 0.9005578 y Z igual a -0.2800526. Distinguimos que al
eliminar esta constante queda el equivalente a C2=C3=0.9Y-0.25Y.
12) Haciendo esas regresiones los resultados obtenidos demuestran que a un menor
número de observaciones la incertidumbre (medida como la desviación estándar en el
cálculo de los estimadores) aumenta, permaneciendo los otros parámetros y estimadores
relativamente parecidos a aquellos que se obtuvieron con 1000 observaciones.

También podría gustarte