Está en la página 1de 17

 

UNIDAD  1

EJEMPLO 7.1
Modelo: Comportamiento de la mortalidad infantil (MI) en relación con el PIB per cápita
(PIBPC) y el alfabetismo femenino medido por la tasa de alfabetización de las mujeres
(TAM).

Especificación del modelo:


A priori, se espera que el PIBPC y la TAM ejerza
eje rza un impacto negativo sobre la MI.
Necesitamos estimar los coeficientes de regresión (parcial) de cada regresora. Por tanto, el
modelo es:

Datos: 
Los datos necesarios se proporcionan en la tabla 6.4. Fecundidad y otros datos de 64 paises.
 ______________________
Tenga en cuenta que la MI es el número de muertes de niños menores de 5 años por cada
1 000 nacidos vivos, el PIBPC es el PIB per cápita en 1980 y la TAM se mide en porcentaje.
La muestra se realizó en 64 países.
Estimación:

Con el paquete estadístico EViews10 se obtienen los siguientes resultados:


Comando:
 

Interpretación 
−0.0056 es el coeficiente de regresión parcial del PIBPC e indica que, si se mantiene
constante la influencia de la TAM, conforme el PIBPC se incrementa, por ejemplo en un
dólar en promedio, la mortalidad infantil disminuye en 0.0056 unidades. Para interpretar
esto desde el punto de vista económico, si el PIB per cápita se incrementara 1 000 dólares,
en promedio, el número de muertes de niños menores de 5 años se reduciría a 5.6 por cada
1 000 nacimientos vivos.
El coeficiente −2.2316 señala que si la infl uencia del PIBPC se mantiene constante, el
número de muertes de niños menores de 5 años disminuiría, en promedio, 2.23 por cada 1
000 nacimientos vivos, si la tasa de alfabetización en las mujeres subiera un punto
porcentual.
El valor del intercepto de alrededor de 263, si se interpretara de una forma mecanicista,
significaría que si los valores del PIBPC y de la TAM fuesen cero, la mortalidad infantil
promedio sería de más o menos 263 muertes por cada 1 000 nacimientos vivos.
El valor de R2 de casi 0.71 significa que casi 71% de la variación en la mortalidad infantil se
explica mediante el PIBPC y la TAM.
Regresión sobre variables estandarizadas

Una variable es estandarizada o se expresa en unidades de desviación estándar si se expresa


en términos de desviación de su media y se dividió entre su desviación estándar. Para el
ejemplo de la mortalidad infantil, los resultados son los siguientes:
 

Comando:
 __________________________

Interpretación: 
En esta regresión, si se conserva constante la TAM, un incremento igual a una desviación
estándar en el PIBPC propicia, en promedio, una disminución de 0.2026 desviación estándar
en la MI.
Si se conserva al PIBPC constante, un incremento igual a una desviación estándar en la TAM,
en promedio, causará una disminución de 0.7639 de desviación estándar en la MI.
En términos relativos, el alfabetismo en las mujeres tiene un mayor impacto en la
mortalidad infantil que el PIB per cápita. Aquí se advierte la ventaja de utilizar variables
estandarizadas, pues la estandarización hace que todas las variables tengan una medida
común, en vista de que todas las variables estandarizadas tienen medias iguales a cero y
varianzas unitarias.

EJEMPLO 7.2

Considere los datos de la tabla 7.1, los cuales se refi eren al consumo de tazas de café por
día (Y) y el precio al menudeo del café (X) en Estados Unidos de 1970 a 1980. Al aplicar MCO
a los datos se obtienen los siguientes resultados de la regresión:

Los resultados tienen sentido en el contexto económico: conforme se incrementa el precio


del café, en promedio, su consumo disminuye casi media taza al día. El valor r2 de más o
menos 0.66 indica que el precio del café explica
ex plica casi 66% de la variación en el consumo del
café. El lector puede verificar con facilidad que la pendiente del coeficiente es
estadísticamente significativa. A partir de los mismos datos, el siguiente modelo de doble
logaritmo, o elasticidad constante, se estima:

(7.8.9)
Como es un modelo de doble logaritmo, el coeficiente de la pendiente proporciona un
estimado directo del coeficiente de elasticidad del precio. En el ejemplo presente, indica
 

que si el precio del café por libra se incrementa 1%, en promedio, su consumo diario
disminuye casi 0.25%. Recuerde que, en el modelo lineal (7.8.8), el coeficiente de la
pendiente sólo señala la tasa de cambio del consumo del café respecto del precio. (¿Cómo
estimará la elasticidad-precio en el modelo lineal?) El valor r2 de casi 0.74 significa que 74%
de la variación en el logaritmo de la demanda de café se explica por la variación en el
logaritmo del precio del café. Como el valor r2 (0.6628) del modelo lineal es menor que el
valor r2 de 0.7448 del modelo lineal logarítmico, se presenta la tentación de elegir este
último modelo debido al alto valor de r2. Sin embargo, por las razones expresadas, no es
posible hacerlo así. No obstante, si desea comparar ambos valores r2, puede proceder de
la siguiente manera:

1.   Obtengâ  para cada observación; es decir, encuentre el valor estimado de cada
1.
observación a partir de este modelo.
2.   Tome el antilogaritmo de esos valores
2.
3.   Calcule r2 entre dichos valores del antilogaritmo y la verdadera Yt de la manera
3.
señalada por la ecuación (3.5.14). Este valor r2 es comparable con el valor r2 del
modelo lineal (7.8.8). 2. Otra forma es suponer que todos los valo
valores
res Y son positivos,
en cuyo caso calcule los logaritmos de los valores Y, ln Y. Obtenga los valores
estimados Y, ˆ Yt, del modelo lineal (7.8.8), calcule los logaritmos de dichos valores
estimados Y (es decir, ln ˆ Yt) y calcule la r2 entre (ln Yt) y (ln ˆ Yt) como en la
ecuación (3.5.14). Este valor r2 es comparable con el valor r2 obtenido mediante
(7.8.9).
Para el ejemplo del café, en la tabla 7.2 se presentan los datos originales necesarios para
calcular las r2 comparables. A fi n de comparar el valor r2 del modelo lineal (7.8.8) con
el de (7.8.9), primero obtenemos el logaritmo de (ˆ Yt) [dado  en la columna (6) de la
tabla 7.2], luego calculamos el logaritmo de los valores reales Y [dados en la columna
(5) de la tabla] y por último calculamos
calc ulamos r2 entre estos dos conjuntos de valores mediante
la ecuación (3.5.14). El resultado es un valor r2 de 0.6779, el cual ahora se puede
comparar con el valor r2 de 0.7448 del modelo log-lineal. La diferencia entre ambos
valores r2 es aproximadamente 0.07. Por otra parte, si deseamos comparar el valor r2
del modelo log-lineal con el obtenido del modelo lineal, estimamos lnYt para cada
observación de (7.8.9) [dadas en la columna (3) de la tabla], obtenemos sus valores
antilog [dados en la columna (4) de la tabla] y por último calculamos r2 entre estos
valores antilog y los valores reales de Y observados mediante la fórmula (3.5.14). Esto
da a r2 un valor de 0.7187, el cual es un poco superior al valor obtenido del modelo
lineal (7.8.8) de 0.6628. Con cualquier método, parece que el modelo log-lineal ofrece
un ajuste ligeramente mejor.

Tabla: Datos básicos para comparar dos valores de R2


 

 ____________________________
 __________________________ __
EJEMPLO 7.3
Para ilustrar la función de producción Cobb-Douglas se obtuvieron los datos de la tabla 7.3,
referentes al sector agrícola de Taiwán durante 1958-1972. Si el modelo (7.9.2) satisface los
supuestos del modelo clásico de regresión lineal obtenemos la siguiente regresión por el
método de MCO

Estimación:

Con el paquete estadístico EViews10 se obtienen los siguientes resultados:


Función Cobb Douglas

Regresión Log-Lineal
 

Interpretación:

Se puede ver que en el sector agrícola taiwanes durante el periodo 1958 y 1972, las
elasticidades del producto con respecto al trabajo y al capital fueron 1,4988 y 0.4899
respectivamente.
Ósea manteniendo constante el capital un incremento de 1% en trabajo, en promedio, a un
incremento de cerca del 1,5% en el producto.
El periodo se caracterizó por tener rendimientos crecientes a escala.
El R cuadrado de 0.8890 significa que cerca de 89% de la variación en el producto es
explicada por el trabajo y por el capital.
EJEMPLO 7.4
Como ejemplo de regresión polinomial, considere los datos de la tabla 7.4 sobre producción
de un bien y su costo de producción total en el corto plazo. ¿Qué tipo de modelo de
regresión ajusta estos datos? Para este fin, trace primero el diagrama de dispersión, que se
muestra en la fi gura 7.2.

 __________________

De esta figura es claro que la relación entre el costo total y la producción semeja una curva
en forma de S alargada; observe cómo la curva de costo total primero aumenta poco a poco
y luego lo hace rápido, como lo establece la conocida ley de rendimientos decrecientes. Esta
forma de S de la curva de costo total se representa por el siguiente polinomio cúbico o de
tercer grado:
Yi β0 +β1Xi +β2X 2 i +β3X 3 i +ui (7.10.4) donde Y = costo total y X = producción.

Resultados empíricos. Cuando la regresión polinomial de tercer grado se ajustó a los datos
de la tabla 7.4, obtuvimos los siguientes resultados:

 _________________

(Nota: Las cifras entre paréntesis son los errores estándar estimados.) Aunque
examinaremos la significancia estadística de estos resultados en el siguiente capítulo, el

lector puede verificar que corresponden a las expectativas teóricas de (7.10.5). Como
ejercicio para el lector queda la tarea de interpretar la regresión (7.10.6).
 

UNIDAD 8:

EJEMPLO 8.1
En el capítulo 7 efectuamos la regresión de la mortalidad infantil (MI) sobre el PIB per cápita
(PIBPC) y la tasa de alfabetización de las mujeres (TAM) para una muestra de 64 países. Los
resultados de la regresión de (7.6.2) se reproducen a continuación, con información
adicional:

 _________________

En la ecuación (8.1.4) seguimos el formato que se presentó en la ecuación (5.11.1), donde


las cifras en el primer conjunto de paréntesis son los errores estándar estimados, las del
segundo conjunto son los valores t según l a hipótesis nula de que el coeficiente de la
población relevante tiene un valor de cero, y los del tercer conjunto son los valores p
estimados. También se dan los valores R2 y R2 ajustada. Ya interpretamos esta regresión en
el ejemplo 7.1. ¿Y la signifi cancia estadística de los resultados observados? Considere por
ejemplo el coeficiente del PIBPC (−0.0056). ¿Es estadísticamente signifi cativo este
coeficiente, es decir, es estadísticamente diferente de cero? Asimismo, ¿es
estadísticamente significativo el coeficiente de la TAM de −2.2316? ¿Ambos coeficientes
son estadísticamente significativos? Para responder ésta y otras preguntas relacionadas,
primero consideremos las clases de pruebas de hipótesis que se pueden encontrar en el
contexto del modelo de regresión múltiple.

Prueba de hipótesis sobre coeficientes de regresión individual.

Podemos utilizar la prueba t para demostrar una hipótesis sobre cualquier coeficiente de
regresión parcial individual. Para ilustrar el procedimiento considere la regresión sobre la
mortalidad infantil (8.1.4). Postulemos que
H0:β2 = 0 y H1:β2 0

La hipótesis nula establece que, al mantener constante X3 (la tasa de alfabetización de las
mujeres), X2 (PIBPC) no tiene influ encia (lineal) sobre Y (la mortalidad infantil).2 Para probar
la hipótesis nula se utiliza la prueba t dada en (8.1.2). Según el capítulo 5, si el valor de t
calculado excede el valor de t crítico en el nivel de signifi cancia escogido, se rechaza la
hipótesis nula; de lo contrario, no se puede rechazar. Para el ejemplo ilustrativo, con (8.1.2)
y la advertencia de que β2β2 = 0 con la hipótesis nula, tenemos t −0.0056 0.0020 − 2.8187 

Intervalo de confianza
 

En el capítulo 5 se observó una conexión muy estrecha entre las pruebas de hipótesis y la
estimación por intervalos de confianza. Para este ejemplo, el intervalo a 95% de confianza
para β2 es

ˆ β2 −tα/2ee(ˆ β2) ≤ β2 ≤ ˆ β2 +tα/2 ee(ˆ β2)

que para este ejemplo se convierte en −0.0056−2(0.0020) ≤ β2 ≤− 0.0056+2(0.0020) es


decir, −0.0096≤ β2 ≤− 0.0016  

Antes de continuar, recuerde que el procedimiento de la prueba t se basa en el supuesto


de que el término de error ui sigue una distribución normal. Aunque ui no se puede observar
de manera directa, se observa su representante, ˆ ui, es decir, los residuos. Para la regresión
sobre la mortalidad, el histograma de los residuos se muestra en la fi g ura 8.2.

 _________________________________

A partir del histograma, parece que los residuos están normalmente distribuidos. También
podemos calcular la prueba Jarque-Bera (JB) de normalidad, como se muestra en la
ecuación (5.12.1). En este caso, el valor JB es 0.5594, con un valor p de 0.76.3 Por tanto, al
parecer, el término de error en este ejemplo sigue la distribución normal. Por supuesto, se
debe tener en cuenta que la prueba JB es para muestras grandes, y que la muestra de 64
observaciones pueda no ser necesariamente grande.

Prueba de significancia general de una regresión múltiple: la prueba F 


El valor p, al obtener un valor F igual o mayor que 73.8325, es casi cero, lo cual implica el
rechazo de la hipótesis que establece que el PIBPC y la TAM, conjuntamente, no tienen
efecto sobre la mortalidad infantil. Si empleamos el nivel usual de signifi cancia de 5%, el
valor F crítico para 2 gl en el numerador y 60 gl en el denominador (sin embargo, los gl reales
son 61) es de casi 3.15, o de 4.98 más o men os, si utiliza el nivel de signifi cancia de 1%.
Obvio, el valor observado F de casi 74 excede por mucho cualquiera de estos valores críticos
F
 _______________________
 

EJEMPLO 8.2
Recuerde la función cúbica del costo total estimada en el ejemplo 7.4, sección 7.10, que se
reproduce en seguida:
 _____________________________________

donde Y es el costo total y X es la producción, y donde las cifras en paréntesis son los errores
estándar estimados. Suponga que deseamos probar la hipótesis de que los coefi cientes de
los términos X2 y X3 en la función cúbica de costo son los mismos, es decir, β3 = β4 o (β3 −
β4) = 0. En la regresión (7.10.6) aparecen todos los resultados necesarios para realizar la
prueba t a partir de (8.5.5). La mecánica es la siguiente:
 ________________________________________________
El lector puede verificar que, para 6 gl (¿por qué?), el valor t observado excede el valor t
crítico aun en el nivel de significancia de 0.002 (o 0.2%) (prueba de dos colas); el valor p es
extremadamente pequeño, 0.000006. Por tanto, podemos rechazar la hipótesis de que los
coeficientes de X2 y X3 en la función cúbica de costo son idénticos. 

EJEMPLO 8.3
A fin de ilustrar el análisis anterior, considere los datos de la tabla 8.8. El ajuste de la función
de producción Cobb-Douglas a esos datos produjo los siguientes resultados:

 ______________________________________

donde SCRNR es la SCR no restringida, pues no se pusieron restricciones al estimar (8.6.13).

Ya vimos en el capítulo 7 cómo interpretar los coeficient es de la función de producción


CobbDouglas. Como se aprecia, la elasticidad producción/trabajo es de casi 0.34 y la
elasticidad producción/capital
producción/capital vale casi 0.85. Si sumamos estos coeficientes se obtiene 1.19,
lo que sugiere que quizá la economía mexicana experimentó durante ese periodo
establecido rendimientos crecientes a escala. Por supuesto, desconocemos si 1.19 es
estadísticamente diferente de 1. Para ver si es el caso, se impone una restricción de
rendimientos constantes a escala, lo cual da la siguiente regresión:
 __________________
donde SCRR es la SCR restringida, pues impusimos la restricción de que haya rendimientos
constantes a escala.
 

Como la variable dependiente en las dos regresiones anteriores es diferente, tenemos que
utilizar la prueba F dada en (8.6.9). Se cuenta con los datos necesarios para obtener el valor
F.

 ___________________________EXCEL_______________________

Observe que en el presente caso m = 1, pues sólo se impuso una restricción y (n − k) es 17,
en vista de que se tienen 20 observaciones y tres parámetros en la regresión no restringida.
Este valor F sigue una distribución F con 1 gl en el numerador y 17 en el denominador. El
lector puede verificar con facilidad que esta F no es significativa, en un nivel de significancia
de 5%. (Véase el apéndice D, tabla D.3.) Así, la conclusión es que la economía mexicana
quizá se caracterizó por rendimientos constantes a escala en el periodo de muestra y, por
tanto, no hay daño alguno al utilizar la regresión restringida dada en (8.6.14). Como muestra
esta regresión, si la razón capital/trabajo se incrementó 1%, en promedio, la productividad
del trabajo aumentó casi 1%.

EJEMPLO 8.4
En el ejercicio 7.23, entre otras cosas, se le pidió considerar la siguiente función de demanda de
pollos:

Donde Y = consumo de pollo per cápita, lbs; X2 = ingreso real disponible per cápita, $; X3 = precio
real al menudeo del pollo por lb; X4 = precio real al menudeo del cerdo por lb, y X5 = precio real de
la carne de res por lb.

En este modelo β2, β3, β4 y β5 son las elasticidades ingreso, precio-propio, precio-cruzado (cerdo)
y precio-cruzado (carne de res). (¿Por qué?) De acuerdo con la teoría económica,

Supongase que alguien afirma que el pollo, el cerdo y la carne de res, son productos no relacionados
en el sentido de que al consumo de pollo no le afectan los precios del cerdo y de la carne de res.
 

 En resumen,

Por consiguiente la regresión restringida se transforma

La ecuación (8.7.19) es ciertamente la regresión no restringida.

Utilizando la información dada en el ejercicio 7,19, se obtiene lo siguiente:

REGRESION NO RESTRINGIDA EN EVIEWS.10


 

Donde las cifras en paréntesis son los errores estándar estimados. Nota: Los valores de R2 de

(8.6.23)
Ahora layrazón
(8.6.24) sonprobar
F para comparables, pues(8.6.21)
la hipótesis la variable
es dependiente en los dos modelos es la misma.

En este caso, el valor de m es 2, pues hay dos restricciones: β4 = 0 y β5 = 0. Los gl del denominador
(n − k) son 18, porque n = 23 y k = 5 (5 coeficientes β). Por consiguiente, la razó
razónn F es 
 

 con todos los decimales F= 1,139245

En eviews.10:
 

 
Comprobación en Excel:

Interpretación:

La anterior es una distribución F con 2 y 18 gl. En el nivel de 5% se aprecia con claridad que este

valor F no es estadísticamente significativo El valor p es 0.3472. Por consiguiente,


 

no hay razón para rechazar la hipótesis nula: la demanda de pollo no depende de los precios del
cerdo ni de la carne de res.

EJEMPLO 8.5
Consulte el ejercicio 7.16, en el cual se presenta información sobre la demanda de rosas en
el área metropolitana de Detroit de 1971-III a 1975- II. Para fines ilustrativos consideraremos
la demanda de rosas como función sólo de los precios de las rosas y de los claveles, y
dejaremos fuera, por el momento, la variable ingreso. Ahora consideremos los siguientes
modelos:

donde Y es la cantidad de rosas por docenas, X2 es el precio promedio de las rosas al


mayoreo ($/docena) y X3 es el precio promedio de los claveles al mayoreo ($/docena). Se
espera, a priori, que α2 y β2 sean negativos (¿por qué?), y que α3 y β3 sean positivos (¿por
qué?). Como se sabe, los coefi cientes de pendiente en los modelos log-lineal son
coeficientes de elasticidad. Los resultados de las regresiones son los siguientes:

Regresión lineal en eviews.10


 

 
 

En eviews.10:
Regresión Log-Lineal

Interpretación:

Como lo indican estos resultados, ambos modelos, el lineal y el log-lineal, parecen ajustarse
a la información razonablemente bien: los parámetros tienen los signos esperados y los
valores t y R2 son estadísticamente significativos.

También podría gustarte