Está en la página 1de 8

Métodos Cuantitativos

1. Hace dos semanas el señor Gerardo recibió un monto de dinero fruto de una herencia inesperada.
Luego de consultar con unos amigos, ha decidido invertirlo en la compra de una empresa. Su única
condición es que el retorno esperado de la misma sea de 35 mil u.m. mensualmente. Considere 𝛼 =
0.1.
a) Use sus conocimientos de pruebas de hipótesis para comprobar que la empresa 1 cumple con
la condición de Gerardo. Para ello, emplee la serie con los retornos mensuales de la empresa 1
para los últimos 3 años.

Considerando que la serie de retornos mensuales con las cuales se cuenta está expresado en miles
de u.m., tenemos que:

Si bien la condición es que el retorno esperado sea de 35 mil u.m., podemos asumir que Gerardo
también aceptaría comprar una empresa cuyo retorno esperado sea mayor (racionalidad
económica). Por lo tanto, la restricción sería que el retorno esperado sea de por lo menos 35 mil
u.m. mensualmente.
En ese sentido, las hipótesis a contrastar son H0 : r1 ≥ 35; y Ha : r1 < 35.
Donde r1 = retorno mensual esperado de la empresa 1.

La serie r1 tiene de promedio 33.9240 u.m., y de desviación estándar 3.6560 u.m.


Entonces, con 36-1=35 grados de libertad calculamos el estadístico t:

33.9240 − 35
𝑡36−1 = = −1.77
3.6560⁄
√36

Asimismo, con α = 0.1 y 35 grados de libertad, el t critico es -1.31


Como -1.77 es menor a -1.31, se rechaza la hipótesis nula.
Por lo tanto, la empresa 1 no cumple con la condición de Gerardo (con un nivel de significancia
de 0.1)

Cabe mencionar que -1.31 no está muy lejano a -1.77. En otras palabras, con valores menores de
α se podría disminuir el valor del t crítico, y se podría no rechazar la hipótesis nula; lo que llevaría
a concluir que la empersa 1 si cumple la condición de Gerardo. El nivel de significancia a partir del
cual se podría concluir esto último es desde α = 0.0431 hacia abajo.

b) ¿La empresa 2 está dentro de las opciones de inversión de Gerardo?

Las hipótesis a contrastar son H0 : r2 ≥ 35; y Ha : r2 < 35.


Donde r2 = retorno mensual esperado de la empresa 2.

La serie r2 tiene de promedio 31.7841 u.m., y de desviación estándar 2.2478 u.m.


Entonces, con 36-1=35 grados de libertad calculamos el estadístico t:
31.7841 − 35
𝑡36−1 = = −8.58
2.2478⁄
√36

Asimismo, con α = 0.1 y 35 grados de libertad, el t critico es -1.31


Como -8.58 es menor a -1.31, se rechaza la hipótesis nula.
Por lo tanto, la empresa 2 no cumple con la condición de Gerardo (con un nivel de significancia
de 0.1).

c) Uno de sus compañeros cree que la diferencia entre los retornos de ambas empresas es de 1.5
mil u.m. ¿Gerardo puede negar dicha preposición?

Es posible realizar un prueba t para evaluar la diferencia entre dos promedios, cuando las
varianzas poblacionales son distintas y desconocidas. En inglés, se conoce como test statistic for
a test of the difference between two population means (normally distributed populations, unequal
and unknown population variances)1.

Las hipótesis a contrastar son H0 : r1 – r2 = 1.5; y Ha : r1 – r2 ≠ 1.5.


La fórmula relevante para calcular el estadístico t es:
𝑟̅1 − 𝑟̅2 − 1.5 33.9240 − 31.7841 − 1.5
𝑡= 2 = = 0.8946
𝑠 𝑠2 3.65602 2.24782
(𝑛1 + 𝑛2 )1/2 ( 36 + 36 )1/2
1 2
El valor de los grados de libertad modificados, acorde al test empleado es:
𝑠2 𝑠2
(𝑛1 + 𝑛2 )2 0.2618
𝑔𝑙 = 2 1 2
2 = = 59.81 ≈ 60
𝑠 𝑠 0.0044
(𝑛1 )2 (𝑛2 )2
1 2
𝑛1 + 𝑛2

Asimismo, con α = 0.1 y 60 grados de libertad, el t critico es ±1.67


Como 0.8946 es menor a 1.67 (y mayor a -1.67), no se rechaza la hipótesis nula.
Por lo tanto, la diferencia entre los retornos mensuales de la empresa 1 con los retornos
mensuales de la empresa 2 es de 1.5 mil u.m. (con un nivel de significancia de 0.1).

Una forma alternativa de resolver este problema hubiera sido calcular una nueva serie, restando
mes a mes los retornos de la empresa 1 y la empresa 2, y probar la hipótesis nula de que esas
diferencias eran iguales a 1.5.
Al hacer rápidamente el ejercicio, se obtiene un estadístico t de -1.21, y un t crítico de -1.69. Con
lo que no se rechaza la hipótesis nula. Lo cual concuerda con el resultado obtenido líneas arriba.

2. Definiendo el salario de un CEO

1
Ver DeFusco et al. (2007), Quantitative Investment Analysis (2nd edition), p. 287
a) Defina e interprete el Error Tipo I y el Error Tipo II. Asimismo, discuta cómo el nivel de
significancia afecta las probabilidades de los Errores Tipo I y Tipo II.

Al realizar pruebas de hipótesis, podemos caer en dos tipos de errores: Error Tipo I y Error Tipo II.
El Error Tipo I, también conocido como falso positivo o error tipo alfa (α), es el error de rechazar
una hipótesis nula (H0) cuando esta es verdadera.
El Error Tipo II, también conocido como falso negativo o error tipo beta (β), es el error de no
rechazar una hipótesis nula (H0) cuando esta es falsa.
En términos de probabilidades, el nivel de significancia alfa (α) es la probabilidad de cometer el
Error Tipo I, y beta (β) es la probabilidad de cometer el Error Tipo II. Dicho de otro modo:
𝛼 = 𝑃𝑟𝑜𝑏(𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 |𝐻0 )
𝛽 = 𝑃𝑟𝑜𝑏(𝑁𝑜 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 |𝐻1 )
Si yo quisiera reducir el Error Tipo I, tendría que considerar niveles de significancia cada vez más
pequeños para probar mi hipótesis. Sin embargo, esto aumenta el número de veces en las que no
rechazo la H0, aun cuando esta es falsa. Por lo que reducir la probabilidad de caer en el Error Tipo
I implica aumentar la probabilidad de incurrir en el Error Tipo II.
En ese sentido, no es posible minimizar ambos tipos de errores al mismo tiempo. Por lo que se
suele considerar niveles de significancia bajos (0.05).

b) La Revista Forbes lanza anualmente una lista con los Chief Executive Officers mejor pagados a
nivel mundial. En 2014, David Zaslay, presidente ejecutivo de Discovery Communications
embolsó 156.1 millones de dólares, de los cuales 94.5 millones corresponden a acciones y otros
50.5 millones en opciones (Gestión, 2015). Frente a ello, usted obtiene un modelo que estima
los determinantes del salario de un CEO según la revista Forbes:
i. ¿El ROA tiene un efecto significativo en el salario? ¿El ROA tiene un efecto positivo en el
salario? Realiza la prueba con un nivel de significancia del 5%.

La variable ROA tiene un coeficiente de 0.0056, y un error estándar de 0.0033


Además: grados de libertad = 100-5 = 95

Definiendo CROA = Coeficiente de la variable ROA en el modelo que estima el salario de un CEO
según la revista Forbes.

¿El ROA tiene un efecto significativo en el salario?


Las hipótesis a contrastar son: H0 : CROA = 0; y Ha : CROA ≠ 0
0.0056−0
Calculando el p-value de la hipótesis nula: 𝑝𝑣𝑎𝑙𝑢𝑒𝑡 ( ) = 𝑝𝑣𝑎𝑙𝑢𝑒𝑡 (1.6970) = 0.0465
0.0033
Como 0.0465 es mayor a 0.05/2 = 0.025, no se rechaza la hipótesis nula.
Por lo tanto, el ROA no tiene un efecto significativo en el salario (con un nivel de significancia
de 0.05)

¿El ROA tiene un efecto positivo en el salario?


Las hipótesis a contrastar son: H0 : CROA ≤ 0; y Ha : 0.0056 > 0
Como 1.6970 es positivo (cola derecha) y 0.0465 es menor a 0.05, se rechaza la hipótesis nula.
Por lo tanto, el ROA tiene un efecto positivo en el salario (con un nivel de significancia de
0.05).

Cabe mencionar que el R2 del modelo empleado no es muy significativo (0.232). Por lo que
los resultados obtenidos no necesariamente son representativos. Sin embargo, en el marco
del modelo, los resultados son confiables.

ii. ¿Cómo probaría la siguiente prueba de hipótesis?: Los CEO mujeres y de raza blanca
obtienen un salario similar que los hombres de una “raza distinta”. Para obtener el puntaje
completo, mencionar: (i) el modelo a utilizar, (ii) la hipótesis nula, (iii) el estadístico a
utilizar, y (iv) el gráfico indicando la zona de aceptación o rechazo. Trabaje con un nivel de
significancia del 5%.

Dado que las dos nuevas variables (Raza y Sexo) no han sido incorporadas en la regresión que
explica el salario de los CEO, no es posible realizar pruebas de hipótesis sobre dicho modelo.
Toda vez que la incorporación de nuevas variables debe afectar los valores de los coeficientes
ya estimados.
En esa línea, para probar la hipótesis mencionada, debemos probar si la variable “Retorno
mensual de su tenencia de activos” es igual para las Mujeres de raza blanca, como para los
Hombres de “raza distinta” (no blancos).

Definiendo r1 = Retorno mensual de su tenencia de activos de las Mujeres de raza blanca; y


r2 = Retorno mensual de su tenencia de activos de los Hombres de “raza distinta” (no blancos)
Las hipótesis a contrastar son H0 : r1 = r2; y Ha : r1 ≠ r2

Como con la información brindada no es posible obtener la desviación estándar de la


diferencia de los retornos en los meses analizados, además de que no sería adecuado asumir
independencia entre las variables r1 y r2, no es posible utilizar la prueba t de student.
Otra prueba, que se puede utilizar es la prueba z. La cual es posible de realizar con la
información disponible. Sin embargo, esta prueba no es recomendable para muestras de
menos de 30 valores.
Para efectos de realizar el ejercicio se utilizará la prueba t, bajo el supuesto de que las
muestras son independientes2. Sin embargo, sería mejor realizar la prueba t de student, con
mayor información, de tal manera que se pueda obtener la desviación estándar de las
diferencias de las variables r1 y r2 de los meses analizados.

La fórmula relevante para calcular el estadístico t es:


𝑟̅1 − 𝑟̅2 0.580 − 1.470
𝑡= 2 = = −0.4670
𝑠 𝑠2 4.5982 4.7382
(𝑛1 + 𝑛2 )1/2 ( 12 + 12 )1/2
1 2
El valor de los grados de libertad modificados, acorde al test empleado es:

2
Ver DeFusco et al. (2007), Quantitative Investment Analysis (2nd edition), p. 287
𝑠2 𝑠2
(𝑛1 + 𝑛2 )2 13.1952
𝑔𝑙 = 2 1 2
2 = = 23.98 ≈ 24
𝑠1 2 𝑠2 2 0.5503
(𝑛 ) (𝑛 )
1 2
𝑛1 + 𝑛2
De lo cual se obtiene un pvalue de 0.3224
Como 0.3224 es mayor a 0.05/2 = 0.025, no se rechaza la hipótesis nula.
Por lo tanto los CEO mujeres y de raza blanca obtienen un salario similar que los hombres de
una “raza distinta” (con un nivel de significancia de 0.05).

Gráficamente
Con 24 grados de libertad (gl), la hipótesis nula H0 se rechaza si el estadístico t es menor a -
2.06 o mayor a 2.06.

-2.06 -0.47 2.06

Como el estadístico t es -0.47, no se encuentra en el área sombreada; por lo que no se rechaza


la H0.

3.
a) Supóngase que un propietario convierte parte de una sala de estar que ya existía en la vivienda
en un cuarto de baño. ¿Cuál es el aumento esperado en el valor de la casa?

Según el modelo, dado que las variables DORM, CTam, PTam, Edad y Pobre no cambian, y sólo se
registra un aumento de 1 en la variable Baños, el Precio debería de incrementarse en 23.4 miles
de $.

b) ¿Cuál es la pérdida de valor si un propietario deja deteriorar su vivienda hasta que las
condiciones generales la convierten en “pobre”?

Dado que las variables DORM, Baños, CTam, y PTam no cambian, el efecto proviene de las
variables Edad y Baño.
Si suponemos que el deterioro puede darse en menos de un año, el único efecto vendría de la
variable Pobre. Por lo que el Precio debería caer en 48.8 miles de $.
Si suponemos que el deterioro de la vivienda sucede en 10 años, el Precio tendría un efecto
positivo por los años transcurridos de 0.9 miles de $, y un efecto negativo por el deterioro de -
48.8 miles de $, con un efecto neto de -47.9 miles de $.

c) ¿Es el coeficiente de la variable DORM estadística y significativamente distinta de cero?

La variable Coef DORM tiene un coeficiente de 0.485, y un error estándar de 2.61


Además: grados de libertad = 220-7 = 213

Las hipótesis a contrastar son: H0 : Coef. DORM = 0; y Ha : Coef. DORM ≠ 0


0.485−0
Calculando el p-value de la hipótesis nula: 𝑝𝑣𝑎𝑙𝑢𝑒𝑡 ( 2.61
) = 𝑝𝑣𝑎𝑙𝑢𝑒𝑡 (0.0023) = 0.4991
Como 0.4991 es mayor a 0.05/2 = 0.025, no se rechaza la hipótesis nula.
Por lo tanto, el coeficiente de la variable DORM no es estadísticamente y significativamente
distinta de cero.
En consecuencia, el número de dormitorios no tiene un efecto significativo en el Precio de venta
de las viviendas

d) Por lo general, las viviendas de cinco dormitorios se venden por una cuantía mucho mayor que
las viviendas de dos dormitorios. ¿Es esto compatible con la respuesta en (c) y en general con
la regresión?

Si suponemos que las viviendas del ejemplo son idénticas, salvo por el número de dormitorios,
entonces la única diferencia es que una tiene 2 dormitorios más que la otra.
Según esto, el modelo no dice que la de 5 dormitorios debería tener un precio 0.97 miles de $
mayor que la de 2 dormitorios. Lo cual, en un mercado de viviendas promedio, no podría
considerarse una diferencia sustancial.

Asimismo, los resultados de la pregunta c) anterior nos dice que la variable DORM no tiene un
papel importante en la explicación del Precio de las viviendas.

Por lo tanto, el enunciado no es compatible con la respuesta en c) ni con la regresión.

e) Un propietario de una vivienda compra un solar adyacente de 2.000 pies cuadrados. Construya
un intervalo de confianza al 99% para la variación en el valor de su casa.

Al comprar un solar adyacente, la única variable que aumenta es PTam, en 2 mil pies cuadrados.

La variable Coef PTam tiene un coeficiente de 0.002, y un error estándar de 0.00048


Además: grados de libertad = 220-7 = 213; y los estadístico t (con 213 grados de libertad) con
0.01/2=0.005 de probabilidad son -2.60 y 2.60 (cola izquierda y cola derecha, respectivamente).

Por lo tanto, con un intervalo de confianza al 99%, el Precio aumentaría entre 2000*0.002-
2.6*2000*0.00048 y 2000*0.002+2.6*2000*0.00048. Es decir, entre 1.50 y 6.50 miles de $.
4.
a) Utilice los resultados de la regresión de la columna (1) ¿Ganan más los trabajadores con títulos
universitarios en promedio que los trabajadores con tan solo grado de secundaria? ¿Cuánto
más?

Sí. Según los resultados del modelo (1), y asumiendo que es representativo (R2), en 1998 los
trabajadores con títulos universitarios ganaban en promedio 5.46 dólares por hora más que los
trabajadores con tan solo grado de secundaria.

b) Utilice los resultados de la regresión de la columna (1) ¿Ganan los hombres más que las mujeres
en promedio? ¿Cuánto más?

Sí. Según los resultados del modelo (1), y asumiendo que es representativo (R2), en 1998 los
hombres ganaban en promedio 2.64 dólares por hora más que las mujeres.

c) Utilice los resultados de la regresión de la columna (2) ¿Es la edad un determinante importante
para los ingresos? Explique detalladamente.

Sí. Según los resultados del modelo (2), y asumiendo que es representativo (R2), en 1998 cada año
de vida más se traducía en promedio en 0.29 dólares por hora más.
Por ejemplo, una persona de 30 años ganaba 2.9 dólares por hora más, que una persona de 20
años.

Debe tenerse en cuenta que en 1998 el dinero valía más que en la actualidad (inflación). Si bien
ahora 0.29 dólares más por hora puede parecer poco, en esa época fue bastante.

d) Utilice los resultados de la regresión de la columna (2) Sally es una mujer titulada universitaria
de 29 años de edad. Betsy es una mujer titulada universitaria de 34 años de edad. Prediga los
ingresos de Sally y los de Betsy.

Según los resultados del modelo (2), y asumiendo que es representativo (R2):

$ por hora para Sally = 4.40 + 5.48 – 2.62 + 29*0.29 = 15.67


$ por hora para Betsy = 4.40 + 5.48 – 2.62 + 34*0.29 = 17.12

e) Utilice los resultados de la regresión de la columna (3) ¿Existen diferencias regionales


importantes?

Sí. Según los resultados del modelo (3), y asumiendo que es representativo (R2), en 1998 ser de
una región significaba tener un nivel de ingresos distinto.
Por ejemplo:
 Si eras del Noroeste ganabas en promedio 0.09 dólares por hora más que si fueras del
Centro-Oeste, o ganabas en promedio 0.96 dólares por hora más que si fueras del Sur, o
ganabas en promedio 0.69 dólares más que si fueras del Oeste.
 Si eras del Centro-Oeste ganabas en promedio 0.09 dólares por hora menos que si fueras
del Noroeste, o ganabas en promedio 0.87 dólares por hora más que si fueras del Sur, o
ganabas en promedio 0.60 dólares más que si fueras del Oeste.
 Si eras del Sur ganabas en promedio 0.96 dólares menos que si fueras del Noroeste, o
ganabas en promedio 0.87 dólares por hora menos que si fueras del Centro Oeste, o
ganabas en promedio 0.27 dólares menos que si fueras del Oeste.

Debe tenerse en cuenta que en 1998 el dinero valía más que en la actualidad (inflación). Si bien
ahora 0.96 dólares más por hora puede parecer poco, en esa época fue bastante.

f) Utilice los resultados de la regresión de la columna (3) ¿Por qué se ha omitido la variable
explicativa Oeste de la regresión? ¿Qué sucedería si se incluyese?

Según se observa, de la encuesta realizada, las personas eran o del Noroeste, o del Centro-Oeste,
o del Sur, o del Oeste. Una persona que era de una región no podía ser de otra.
Por lo tanto, si consideras variables binarias en tu modelo, no es necesario que abarques todas
las opciones posibles. Ya que, en este caso, si eras del Oeste, significa que no eras del Noroeste,
ni del Centro-Oeste, ni del Sur.
Es decir, no es necesario incluir la variable Oeste en la regresión, ya que caso está cubierto cuando
las demás variables regionales binarias incluidas son cero. Y su efecto (el ser del Oeste) está
recogido en el intercepto.

En caso de que se incluyese la variable binaria Oeste, el nuevo coeficiente de esta variable
recogería el efecto de ser del Oeste, y el Intercepto cambiaría (porque ya no recogería dicho
efecto).

g) Utilice los resultados de la regresión de la columna (3). Juanita es una mujer titulada
universitaria de 28 años de edad de la región Sur. Jennifer es una mujer de 28 años de edad,
titulada universitaria de la región Centro-Oeste. Calcule la diferencia esperada entre los
ingresos de Juanita y los de Jennifer.

Según los resultados del modelo (3), y asumiendo que es representativo (R2):

$ por hora para Juanita = 5.44 – 2.62 + 28*0.29 + 0*0.69 + 0*0.60 – 1*0.27 + 3.75 = 14.42
$ por hora para Jennifer = 5.44 – 2.62 + 28*0.29 + 0*0.69 + 1*0.60 – 0*0.27 + 3.75 = 15.29

Dado que la única diferencia es que juanita es del Sur, y Jennifer es del Centro-Oeste, la diferencia
promedio de sus ingresos por hora es de 0.87.
Es decir Juanita gana en promedio 0.87 dólares por hora menos que Jennifer.

También podría gustarte