Está en la página 1de 29

Ejercicios de Econometría

(Trabajo Final Ejercicios)

Presentado por:
Luis Hernández Caldera

Profesora
Dra. Marylú Zeledón Torres
Problema Nº 1: Análisis del demanda de Pollo
Teniendo información a mano pertinente al problema en cuanto a sus datos
cuantitativos, notaciones, etc., se procedió a realizar regresiones separadas para
de los siguientes modelos
1. ln yt   1   2 ln x2 t   3t ln x3  ut

2. ln yt  y1  y 2 ln x 2t  y 3 ln x3t  y 4 ln x 4t  u t
3. ln y  1   2 ln x 2  3 ln x 3   4 ln x5t  u t

4. ln yt  1   2 ln x2t   3 ln x3t   4 ln x4t   5 ln x5t  ut

5. ln yt  1   2 ln x2t   3 ln x3t   4 ln x6t  ut


Siendo:
Y: Consumo per cápita de pollos, en libras.
X2: Ingreso per cápita real disponible, US$
X3: Precio real al menudeo del pollo por libra US$
X4: Precio real al menudeo de cerdo por libra, US$
X5: Precio real al menudeo de carne de res por libra, US$
X6: Precio real compuesto de los sustitutos del pollo, US$ por libra. Precio
ponderado
Se pregunta:
(a) Entre las funciones de demanda que aquí se presentan, ¿Cuál podría
escogerse y por que?
Se escogería la función Nº 1 uno denotada por ln yt   1   2 ln x2 t   3t ln x3  ut que
re-escrita sería ln Yt  1   2 ln X 2 t  ln  3  ui . Esta selección se debe a varios
hechos a demostrarse:
Primero: que las variables precio de la carne de cerdo, precio de la carne de res ya
sea agregadas o por separado tiene poco o ninguna contribución al modelo inicial.

Modelo 1 Coefficientsa

Unstandardized Standardized
Coefficients Coefficients Correlations Collinearity Statistics
Model B Std. Error Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Constant) 1,997 ,119 16,836 ,000
lnX2 ,450 ,026 1,370 17,000 ,000 ,973 ,967 ,561 ,168 5,965
lnX3 -,361 ,067 -,436 -5,405 ,000 ,815 -,770 -,178 ,168 5,965
a. Dependent Variable: lnYI

Aunque la correlación entre dos variables no tiene efecto causal, puede darnos
pistas interesantes acerca del comportamiento de las variables en el modelo. Por
ejemplo, observemos que la correlación de orden cero existente entre lnYt lnX3,
tiene un valor de 0.815 sin embargo cuando eliminamos lnYt baja hasta -0.770 y

2
cuando el efecto atribuible a lnX2 se elimina de lnX3, el valor de baja hasta -0.178
de tal manera que podría concluirse que la relación entre consumo de pollo y
precio de la carne de pollo (lnYt – lnYX3) puede explicarse casi por completo
recurriendo a la variable lnX2t, ingreso per cápita. El mismo análisis puede ser
Modelo 4 Coefficientsa

Unstandardized Standardized
Coefficients Coefficients Correlations Collinearity Statistics
Model B Std. Error Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Constant) 2,107 ,160 13,210 ,000
lnX2 ,377 ,087 1,146 4,353 ,000 ,973 ,716 ,147 ,016 61,132
lnX3 -,456 ,117 -,550 -3,897 ,001 ,815 -,677 -,131 ,057 17,536
lnX4 ,116 ,106 ,235 1,096 ,288 ,924 ,250 ,037 ,025 40,673
lnX5 ,050 ,105 ,101 ,477 ,639 ,934 ,112 ,016 ,025 39,735
a. Dependent Variable: lnYI

aplicado al modelo 4 en donde las variables lnX4, lnX5, muestran baja en la


correlación y por tanto su influencia puede ser explicada en su mayoría por lnX2.
Dado que en el resto de modelos el patrón se mantiene, presentamos únicamente
los resultados del modelo 4, en donde se puede observar que los valores relativos
a los coeficientes semi parciales de correlación lnX4 y lnX5 con valores de 0.037 y
0.016, pueden ser explicados por las variables lnX2 y lnX3.
Comprendiendo que lo desarrollado hasta ahora no responde claramente la
pregunta realizada, vamos a proceder a demostrar que la adición de lnX4, lnX5 ya
sea en forma parcial o conjunta no aumentará el valor explicativo de la función
propuesta
La técnica de análisis de varianza puede utilizarse para demostrar si las variables
lnX4 y lnX5, aumentan el poder explicativo de la función propuesta, es decir, si la
incorporación de estas dos variables aumentan en gran medida la Suma de
Cuadrados Explicativa y por tanto el coeficiente de determinación. La función
entonces quedaría planteada en la siguiente
forma: ln yt   1   2 ln x2 t   3t ln x3   4 ln x4t   5 ln x5t  ut

Para evaluar la contribución incremental de lnX4 y lnX5 seguiremos la siguiente


fórmula:
( SEC nueva  SEC vieja ) /# deregresorasnuevas
F
SRC nueva gdel (  n # deparametrosenel mod elonuevo)

Donde SECnueva = Suma de cuadrados bajo el modelo nuevo (es decir, después de
agregar las regresoras nuevas), SECvieja = Suma de cuadrados bajo el viejo modelo
o modelo original y SRCnuvea =SRC Suma de Cuadrados de los Residuos bajo el
modelo nuevo, es decir, después de considerar todas las regresoras. Bajo estas
suposiciones, este valor F deberá seguir la distribución F con 1 y 22 grados de
libertad. Explicado lo anterior, procedemos a realizar nuestra prueba de hipótesis.

3
Prueba de hipótesis
1. Ho. La agregación de las variables lnX4 y lnX5 relativas al precio de la carne de
cerdo y precio de la carne de res aumentará significativamente la Suma de
Cuadrados Explicativas y por tanto deberán agregarse al modelo
ln Yt  1   2 ln X 2 t  ln  3  ui
2. H1. La agregación de las variables lnX4 y lnX5 relativas a precio de la carne de
cerdo y precio de la carne de res no aumentará significativamente la Suma de
Cuadrados Explicativas y por tanto no deberán ser agregadas al modelo
ln Yt  1   2 ln X 2 t  ln  3  ui
3. Nivel de significancia á= 0.05 con (1-á) = 95%
4. Muestra = 23 observaciones
5. El estadístico a utilizar es F = á = 0.05 y G de l con 1 y 18 grados de libertad
6. Valores críticos y regla de decisión. Los valores críticos para F considerando 1 grado
de libertad en numerador y 18 grados de libertad en el denominador. Se rechaza Ho, si F
calculado es mayor que F esperado con á = 0.05 y 1 y 18 grados de libertad; de otra
manera no se rechaza. En nuestro caso F esperado = 4.41
7. Cálculos
b
MODELO 1 ANOVA MODELO

Sum of
Model Squares df Mean Square F Sig.
1 Regression ,756 2 ,378 449,084 ,000a
Residual ,017 20 ,001
Total ,772 22
a. Predictors: (Constant), lnX3, lnX2
b. Dependent Variable: lnYI

Modelo 4 ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression ,757 4 ,189 215,872 ,000a
Residual ,016 18 ,001
Total ,772 22
a. Predictors: (Constant), lnX5, lnX3, lnX4, lnX2
b. Dependent Variable: lnYI

( SEC nueva  SECvieja ) /# deregresorasnuevas


F
SRC nueva gdel (  n  # deparametrosenel mod elonuevo)

TABLA ANOVA DE ANALISIS INCREMENTAL


Suma de G de Media
CONCEPTO
Cuadrados l Cuadrática
Suma Explicada de Cuadrados
debido a lnX2 y lnX3 0.7555 2 0.3778
Suma Explicada debido a la
adición de lnX4 y lnX5 0.0011 1 0.0011
Suma Explicada debido a
lnX2,lnX3, lnX4 y lnX5 0.7566 4 0.1891
Suma de Residuos 0.0160 18 0.0009
Total 0.7723 22
4
(0.7566  0.7555) / 1 0.0011
F   1.222
(0.7566) / 4 0.0009

8. Conforme los resultados obtenidos podemos concluir que el valor F calculado es


< que el valor F esperado.
9. Decisión. Dado que el valor F calculado = 1.222 es menos que F esperado con
alfa = 0.05 con 1 y 18 grados de libertad = 4.41 se rechaza la hipótesis nula que
supone que la agregación de las variables precio de la carne de cerdo y la precio
de la carne de res aumentarían significativamente el valor de la Suma de
Cuadrados Explicativas.
10. Considerando que la agregación de las variables precio de la carne de cerdo y
precio de la carne de res a la función ln Yt  1   2 ln X 2 t  ln  3  ui a un nivel de
significancia á = 0.05 resulto estadísticamente no significativa se rechaza la
hipótesis nula aceptándose la hipótesis alternativa que afirma que las variables
precio de la carne de cerdo y precio de la carne de res no agregan valor a la
función y por tanto no deben agregarse.
Para ratificar lo anterior, procederemos ahora a mostrar que las variables precio de
la carne de pollo, precio de la carne de cerdo y precio de la carne de res no están
correlacionadas, procedemos a realizar la siguiente prueba de hipótesis.
Prueba de Hipótesis
1. Ho. .b4=b5 = 0. La carne de pollo, carne de cerdo y carne de res, son
productos no correlacionados
2. H1. .b4 = b5 ≠ 0. La carne de cerdo, de pollo y de res son productos
relacionados
3. Tamaño de la muestra 23
3. Estadístico t
4. Nivel de significancia á = 0.05
5. Valores Críticos para tá=0.05 con 23-5 g de libertad = 2.08
6. Regla de decisión: Se rechaza Ho si t calculado > que tá=0.05 con 23-2 gdl =
2.08 de lo contrario no se rechaza.
7. Cálculos: Utilizando la fórmula.
 4  5
t
Var ( ˆ4 )  Var ( ˆ5 )  2 cov(ˆ4 , ˆ5 )

5
Coefficient Correlationsa

Model lnX5 lnX3 lnX4 lnX2


1 Correlations lnX5 1,000 -,627 ,439 -,831
lnX3 -,627 1,000 -,739 ,592
lnX4 ,439 -,739 1,000 -,778
lnX2 -,831 ,592 -,778 1,000
Covariances lnX5 ,01097 -,00767 ,00487 -,00753
lnX3 -,00767 ,01367 -,00916 ,00600
lnX4 ,00487 -,00916 ,01122 -,00714
lnX2 -,00753 ,00600 -,00714 ,00749
a. Dependent Variable: lnYI

0.1160  0.0500
t  0.5851
0.01122  0.01097  2(0.00487)

8. ¿El t calculado es mayor o menor que los valores críticos?


El resultado informa que t calculado es menor que t esperado tá=0.05 (23,5 gdl)
= 2.01
9. Decisión: Visto que t calculado = 0.5881 es < que tá=0.05 (23,5 gdl) = 2.01
por tanto se acepta Ho.
10. Dado que el estadístico t observado es menor que t crítico a un nivel de 5% de
nivel de significación para 23 y 5 grados de libertad no hay razón para rechazar la
hipótesis que sugiere que la carne de pollo, la carne de cerdo y la carne de res son
productos no relacionados.
El mismo procedimiento puede ser aplicado para demostrar que agregar la variable
lnX6 y demostrar que esa acción contribuiría a la mejora de la Suma de Cuadrados
de Explicada; o bien a un aumento del coeficiente de determinación R2 Ajustado.

6
ln y t   1   2 ln x 2 t   3 t ln x 3  u t

D b1 b2 b3
Yi= 1.9970 + 0.4500 lnX2 - 0.3610 lnX3
ee(B) 0.1190 0.0260 0.0670
t 16.8360 17.0000 -5.4050
Sig. 0.0000 0.0000 0.0000
R R AJ DW F EE
2 2

0.978 0.976 1.627 449.08 0.0290


ln y t  y 1  y 2 ln x 2 t  y 3 ln x 3 t  y 4 ln x 4 t  u t
I b1 b2 b3 b4
Yi= 2.0760 + 0.4110 lnX2t - 0.4210 lnX3t + 0.0940 lnX4t
ee(B) 0.1420 0.0470 0.0890 0.0930
t 14.5920 8.7150 -4.7150 1.0070
Sig. 0.0000 0.0000 0.0000 0.3260
R R AJ
2 2
DW F EE
0.979 0.976 1.557 299.95 0.2899
ln y   1   2 ln x 2   3 ln x 3   4 ln x 5 t  u t
I b1 b2 b3 b5
Yi= 1.9970 + 0.4510 lnX2 - 0.3610 lnX3 + 0.0000 lnX5
ee(B) 0.1240 0.0550 0.0790 0.0950
t 16.0930 8.2460 -4.5600 -0.004
Sig 0.0000 0.0000 0.0000 0.997
R R AJ DW F EE
2 2

0.978 0.975 1.627 284.42 0.2976


ln y t   1   2 ln x 2 t   3 ln x 3 t   4 ln x 4 t   5 ln x 5 t  u t

Yi= 2.1070 + 0.3770 lnX2 - 0.4560 lnX3 + 0.1160 lnX4 + 0.0500 lnX5
ee(B) 0.1600 0.0870 0.1170 0.1060 0.1050
t 13.2100 4.3530 -3.8970 1.0960 0.477
Sig. 0.0000 0.0000 0.0010 0.2880 0.639
R R AJ
2 2
DW F EE
0.980 0.975 1.563 215.87 0.2960
EE= Error de estimación

Con toda la información obtenida podemos observar que los valores de R2


Ajustado, cambiaban casi imperceptiblemente al agregársele variables lo que era
un indicador claro de que contribuían a mejorar la bondad de ajuste de la función;
obsérvese también que los coeficientes tuvieron poca variación y F disminuyó
sustancialmente a medida que se agregaban variables.
Para llegar a esta misma conclusión se pudieron haber tomado otros caminos. Por
ejemplo, se pudo utilizar el SPSS introduciendo el método stepwise, que es una
forma de seleccionar las variables en función de un valor F de entrada y salidas;
también se pudiese haber realizado otros análisis en cuanto a contribución
incremental o marginal de una variable, entre otros caminos a seguir.
b. ¿Como se interpretan los coeficientes de lnX2 y lnX3, en estos
modelos?
Los coeficientes de lnX2 y lnX3, miden la elasticidad parcial de la variable
dependiente y con respecto a cada variable lo cual ocurre siempre que se tiene un
modelo de regresión log-lineal con cualquier número de variables.
Por ejemplo, en el primer caso, â2 mide la elasticidad del ingreso que es la
variación porcentual de la cantidad demandada de un bien respecto a la variación

7
porcentual del ingreso; si la elasticidad ingreso es positiva (como nuestro caso), se
dice que son bienes normales. Si la elasticidad ingreso es menor que uno, se dice
que son bienes necesarios, si es mayor que uno se dice que son bienes de lujo o
suntuarios.
En el caso de â3 mide la elasticidad precio de la demanda o elasticidad de la
demanda que es el cambio porcentual de la cantidad demandada dividido por el
cambio porcentual del precio.
c. ¿Cual es la diferencia entre las especificaciones (2) y (4)?
La función 2 contempla la utilización de tres variables (X2, X3 y X4) mientras que
la función 4 propone la utilización de 4 variables (X2, X3, X4 y X5) este hecho
representa una variación cuantitativa como cualitativo; como hemos visto en el
desarrollo de nuestro ejercicio, algunas de esas variables contribuyen más que
otras al ajuste del modelo, sin embargo, en nuestro caso, el agregar la carne de
cerdo no ayudo mucho al ajuste y aún más al agregar la carne de res que tampoco
agrega valor al modelo al menos en nuestro análisis, solo viene a complicar las
cosas puesto que como hemos analizado ambas variables corren riesgo de sufrir
de colinealidad o fuerte correlación; formular una función con estas debilidades
nos conduciría a realizar pronósticos equivocados violando supuestos y principios
como el de la parsimonia.
d. Son el Cerdo y/o la carne de res productos que compiten con el pollo o
que lo sustituyen? ¿Cómo se sabe?
El hecho de que la carne de pollo, la carne de cerdo y la carne de res son
productos no correlacionados ha sido demostrado mediante prueba de hipótesis no
obstante se pueden agregar otras técnicas. El conocer si el cerdo y la carne de res
son productos que compiten con la carne de pollo o si le sustituyen puede
indagarse mediante el análisis de la elasticidad cruzada de la demanda es decir, el
análisis merece atención en conocer como o de que manera responden los
individuos ante cambios en los precios de de la carne de res, de pollo y de cerdo,
esto se hace a través de la técnica conocida como elasticidad precio cruzado de la
demanda.
La elasticidad cruzada es la variación porcentual de la cantidad demandada de un
bien ante la variación porcentual del precio de otro bien. El valor que toma la
elasticidad cruzada permite clasificar a los bienes. Dos bienes cualesquiera, x y z,
son sustitutos si la elasticidad cruzada es positiva y son complementarios si la
elasticidad cruzada es negativa.

8
e. Supóngase que la función 5 es la demanda correcta. Estímese los
parámetros de este modelo, obtenga los errores estándar, así como el R2
y R2 Ajustado, F. Interprete los resultados.
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients Correlations Collinearity Statistics
Model B Std. Error Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Constant) 1,995 ,120 16,577 ,000
lnX2 ,493 ,070 1,499 7,019 ,000 ,973 ,850 ,235 ,025 40,703
lnX3 -,331 ,082 -,399 -4,027 ,001 ,815 -,679 -,135 ,114 8,759
lnX6 -,087 ,133 -,165 -,654 ,521 ,941 -,148 -,022 ,018 56,504
a. Dependent Variable: lnYI

Conforme el cálculo realizado en SPSS, la función correspondiente al modelo


Yi  1.995  0.493 ln X 2 i  0.331ln X 3i  ln X 6i
solicitado es la siguiente: la cual nos
informa lo siguiente: La constante, no trasmite que si el resto de variables toman
el valor cero, habrá un consumo latente per cápita de 1.995 libras; el coeficiente
b2 representativo de la elasticidad - ingreso, informa que un aumento del ingreso
del consumidor del orden de 1 dólar aumentaría el consumo de pollo en
aproximadamente 4.93 libras per cápita; el coeficiente b3, que representa y el
precio propio de la carne de pollo, significa que un aumento en el precio de la
carne de pollo del orden de 1 centavo disminuiría el consumo de pollo en 0.33
libras per cápita; finalmente, el coeficiente b4, que mide la elasticidad de los
productos sustitutos de la carne de pollo, indica que un aumento del precio de
estos productos del orden de 1 centavo, permitiría aumentaría la demanda en 0.87
libras per cápita.

ModelO 6 Summaryb

Adjusted Std. Error of Durbin-


Model R R Square R Square the Estimate Watson
1 ,989a ,979 ,975 ,02943 1,674
a. Predictors: (Constant), lnX6, lnX3, lnX2
b. Dependent Variable: lnYI

R, el coeficiente de correlación = 0.989 nos indica que entre las variables existe un
alto grado de correlación lineal no causal; el R2 o coeficiente de determinación se
refiere a la bondad del ajuste que en caso se puede interpretar como una relación
casi perfecta lo cual permite pronosticar con bastante certeza los valores del
consumo de carne de pollo; en otras palabras R2, mide la proporción o el
porcentaje de variación total en Y que es explicada por el modelo de regresión. El
R2 Ajustado, mide lo mismo que R2, es un indicador cuya medida se hace
tomando en cuenta el ajuste del número de grados de libertad.

9
CONCLUSION GENERAL
Dada la siguiente función Yi  1.997  0.4500  0.3610 y los análisis realizados en el
presente trabajo podemos concluir que los el comportamiento que el consumo per
cápita de pollo no se ve afectada directamente por los precios de la carne de
cerdo, la de res o por los productos “sustitutos” del pollo en vista que son
productos no relacionados como se ha demostrado además, el resultado de la
función muestra que b2 es mayor que 0 y menor que 1 y que b3 tiene signo
negativo y su valor es mayor que cero y menor que uno lo cual significa lo
siguiente:
Primero, que la carne de pollo es un producto que responde muy poco a la baja de
precios; es decir aún cuando los precios sufriesen grandes cambios o aumentos,
solo se producirían cambios pequeños en la demanda y por lo tanto se concluye
que la carne de pollo es inelástica al precio;
Segundo, el signo menos únicamente refleja el tipo de relación existente entre el
precio y la cantidad demandada que es de tipo inversa lo cual significa que el
coeficiente de elasticidad precio de la demanda siempre será un precio negativo y
por tanto debe verse en términos de valor absoluto; de tal manera que en la
función propuesta no debe interpretarse como que si existe una demanda negativa
de 0.3610 debe leerse como: Una aumento del precio la carne de pollo de 1
centavo, daría lugar a una reducción en el consumo per cápita del 0.33 libras.

10
1. Ejercicio 7.9, Pág. 201
a. Utilizando el modelo de regresión Yi  1   2 X 2i   3i   4 X 4i  ui
obtenga una estimación de los coeficientes de regresión e interprete los
resultados.

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -33,460 48,783 -,686 ,507
Ingreso ,019 ,019 ,264 1,009 ,335
TXfamilia 15,522 9,465 ,425 1,640 ,129
Desemp ,813 1,911 ,111 ,425 ,679
a. Dependent Variable: PFT

Conforme con los resultados, tendríamos la siguiente función de regresión:


Yi  33.460  0.019 X 2i  15.52 X 3i  0.813 X 4 i
El intercepto, cuyo valor es de -33.430, interpretado linealmente, sería la tasa de
reserva de desempleo del grupo de las FPU; es decir, el la tasa normal de
desempleo existente en este grupo social. El coeficiente de regresión parcial del
Ingreso Familiar Promedio (IFP) = 0.019, indica que si la influencia del Tamaño
Medio de la Familia (TMF) y la Tasa de Desempleo (FD) se mantienen constante,
conforme el IFP aumente en un dólar, el porcentaje de participación de las
Familias Pobres Urbanas (FPU), aumentará en 0.019 unidades; dicho de otra
manera, si IFP aumentará en 100 dólares la tasa de participación de las FPU,
aumentará en 1.9%. El coeficiente 0.813 que mide la tasa de desempleo, señala
que si la influencia del IFP y el TMF se mantienen constante, en la medida que el
desempleo aumente (disminuya) en una unidad o sea un 1% la tasa de
participación de las FPU en la fuerza de trabajo aumentará en 0.813%.
Cuales son los signos lógicos a priori para los coeficientes de regresión?
¿Por qué?
Para beta 1 negativo, para beta 2, posito porque en la medida que el ingreso
aumenta (salario) las FPU, estarán motivadas a incrementar su participación en la
fuerza de trabajo; para b3 negativo puesto en medida en que la familia aumente
su tamaño promedio, más complejo será colocarse en el mercado de trabajo; para
b4 negativo, ya que en la medida que disminuya la tasa de desempleo, la
participación de las FPU, deberá aumentar.

11
¿Cómo se verifica la hipótesis de que la tasa global de desempleo no
tiene efecto alguno sobre la participación de la fuerza de trabajo de
familias urbanas pobres?
De hecho, los resultados en SPSS, nos indican que ninguna de las variables es
estadísticamente significativa al nivel de á = 0.05 lo cual significa que si tratamos
de contrastar la hipótesis nula de b4 = 0, tendríamos que aceptar esa hipótesis
puesto que t= 0.425 y Sig. = 0.679.

a
Coefficients

Unstandardized Standardized
Coefficients Coefficients Correlations Collinearity Statistics
Model B Std. Error Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Constant)
-33,460 48,783 -,686 ,507
Ingreso ,019 ,019 ,264 1,009 ,335 ,301 ,291 ,259 ,964 1,037
TXfamilia15,522 9,465 ,425 1,640 ,129 ,451 ,443 ,421 ,981 1,020
Desemp ,813 1,911 ,111 ,425 ,679 ,040 ,127 ,109 ,975 1,026
a.Dependent Variable: PFT

Además de la prueba t, podríamos aplicar la prueba F para medir la contribución


de esa variable a la función en general. Sin embargo, los resultados de las pruebas
SPSS, por simple inspección nos indican una serie de problemas con esta función,
por ejemplo, que el nivel de correlación entre las variables es sumamente bajo; si
observamos los coeficientes parciales de correlación observamos que todas las
variables se correlación poco con la variable independiente; esto lo podemos
confirmar a través observando el Coeficiente de determinación Ajustada cuyo valor
es de 0.078; dicho de otro modo que estas variables explican poco o nada el
comportamiento de la participación de las FPU en la fuerza de trabajo.

Model Summaryb

Adjusted Std. Error of Durbin-


Model R R Square R Square the Estimate Watson
1 ,525a ,275 ,078 18,3822 2,407
a. Predictors: (Constant), Desemp, TXfamilia, Ingreso
b. Dependent Variable: PFT

Esto puede deberse (otra hipótesis) que pude existir autocorrelación negativa
(DW=2.407) puesto que la tasa de desempleo es un ponderado de los grupos que
componen la población civil activa que representa los diferentes grupos sociales
entre ellos, negros, jóvenes y adolescentes, familias urbanas, etc.
Obsérvese que si eliminamos esta variable, el R2 Ajustado aumenta
sustantivamente pasando del 0.078 a 0.141 mejorando la explicación aunque
todavía pobremente.

12
Model Summaryb

Adjusted Std. Error of Durbin-


Model R R Square R Square the Estimate Watson
1 ,513a ,264 ,141 17,7438 2,308
a. Predictors: (Constant), TXfamilia, Ingreso
b. Dependent Variable: PFT

Para quedar todos contentos vamos a proceder a realizar la prueba de hipótesis


igualando b4=0 utilizando el método de prueba de significancia del ese coeficiente
de regresión.
1. Ho: B4 = 0. Tasa desempleo efecto 0 en la participación de FPU en la FT
2. H1. B4 ≠ 0. Tasa desempleo efecto ≠ 0 en la participación de FPU en FT
3. Nivel de Significancia = 0.05 = (1-á) 95% de probabilidad
4. Estadístico: t
5. Muestra = 15
6. Valores críticos= (n-k) = 15 – 4 = 13 grados de libertad t á/2 = +/- 2.201. n=
número de observaciones y K= número de parámetros incluyendo b1.
7. Reglas de decisión: Si bajo Ho. Se encuentra dentro del intervalo de confianza -
2.201 y +2.201, no se rechace Ho, pero si esta por fuera del intervalo rechace Ho.
8. Procedimientos de cálculos
 ˆ 4   
~
Pr t / 2   t / 2   1  
 ee( ˆ 4 ) 
0.813  0
t  0.425
1.911
9. ¿Región de rechazo o de aceptación? Es evidente que 0.425 se encuentra entre
-2.201 y +2.201 o sea dentro de la región de aceptación de la hipótesis nula
10. Decisión. A un nivel de significancia de 0.05 se encuentra que la prueba es
estadísticamente no significativa por tanto se acepta la hipótesis nula que asegura
que la tasa global de desempleo tiene efecto 0 en la participación de las FPU en la
fuerza de trabajo rechazándose la hipótesis alterna que asegura que la tasa de
desempleo tiene efecto sobre la participación de las FPU en las fuerza de trabajo.

13
¿Deberían excluirse del modelo algunas variables? ¿Por qué?

Model Summ aryb

Adju st ed Std. Error of Durbi n-


Model R R Squa re R Squ are the Estima te Watso n
1 ,525 a ,2 75 ,078 18,3 822 2,40 7
a. Predictors: (Constant), Desemp, TXfamilia, Ingreso
b. Dependent Variable: PFT
Model Summ aryb

Adju st ed Std. Error of Durbi n-


Model R R Squa re R Squ are the Estima te Watso n
1 ,513 a ,2 64 ,141 17,7 438 2,30 8
a. Predictors: (Constant), T Xfamilia, Ingreso
b. Dependent Variable: PFT
Model Summ aryb

Adju st ed Std. Error of Durbi n-


Model R R Squa re R Squ are the Estima te Watso n
1 ,301 a ,0 91 ,021 18,9 411 2,20 0
a. Predictors: (Constant), Ingreso

Model Summ aryb


b. Dependent Variable: PFT

Adju st ed Std. Error of Durbi n-


Model R R Squa re R Squ are the Estima te Watso n
1 ,451 a ,2 03 ,142 17,7 339 2,14 6
a. Predictors: (Constant), TXfamilia
b. Dependent Variable: PFT

Para responder la pregunta hemos realizado cuatro corridas en SPSS. La primera la


hicimos corriendo el modelo original puede observarse que tenemos un R2
ajustado de tan solo de 0.078; de las cuatro corridas solamente dos logran mejorar
este coeficiente; el modelo 2 (Ingreso + TX-Familia) con R2 Ajus. = 0.141 y el
modelo 4 (TX-Familia) con R2 Ajustado que también presenta el menor error de
estimación y el menor DW; de tal manera que podemos concluir que la variable
más influyente es Tamaño de la familia puesto que cuando realizamos la regresión
únicamente con Ingreso, R2 Ajustado bajo a 0.021 y el error aumento.
Podríamos concluir que deberíamos retirar las variables tasa de empleo e
ingreso promedio; no obstante creemos que no se trata de sumar o restar
aplicando lo que se conoce como elaboración de un modelo bajo el enfoque
ascendente; por una parte, por otra un modelo que explique muy poco el
comportamiento de la variable independiente parece no ser indicado.
¿Qué otras variables debería usted tener en cuenta para que se
incluyeran en el modelo?
Podemos especular con algunos supuestos tales como agregar variables dicótomas
para analizar la influencia de la raza, los años de estudio, la zona, la edad,
experiencia previa, nivel educativo, etc. sin embargo todo esto es especulativo. A
nuestro juicio el modelo adolece de mala especificación lo cual constituye la
violación de un supuesto importante. A continuación vamos a tratar de demostrar
esa violación.
Prueba Global de Significancia del Modelo
Para comprobar nuestra hipótesis, vamos a recurrir a la prueba de significancia
global en donde Ho: B2=B3=B4=0 a un nivel de significancia de 0.05, con n= 15 y
k= 4 (incluyendo a b1). A continuación desarrollamos nuestra prueba.

14
1. Ho: b2=b3=b4 = 0. Todos los coeficientes son simultáneamente = cero
2. H1: b2=b3=b4 ≠ 0. No todos los coeficientes son simultáneamente = cero
3. Estadístico: F
4. Nivel de Significancia = 0.05 = (1-á) 95% de probabilidad
5. Tamaño Muestra = 15
6. Valores críticos: Los valores críticos estarán determinados por Fá (k-1 para el
numerador y n-k para el denominador) donde k es el número de parámetros
incluyendo b1 y n= al número de observaciones siendo F esperado = 3.59
7. Reglas de decisión: Si F calculado es > F crítico =Fá (k-1, n-k), rechazar Ho; de lo
contrario, no se rechace.
8. Procedimientos de cálculos
SEC / gdel (k  1)
F
SRC /(n  k )

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 1413,160 3 471,053 1,394 ,296a
Residual 3716,977 11 337,907
Total 5130,137 14
a. Predictors: (Constant), Tasa de desempleo, Tamaño medio de la familia, Ingreso
Familiar promedio
b. Dependent Variable: % en la fuerza de trabajo Y*

F  1.3939
(1,413.16) / 3
(3,716.98) / 11

9. ¿Región de rechazo o de aceptación? Es claro que 1.3939 > 3.59.


10. Decisión. Dado que a un nivel de significancia de 0.05 F crítico es mayor que
calculado Fá (k-1, n-k), se acepta la hipótesis nula mediante la cual se propone que
todos los coeficientes son simultáneamente igual a cero encontrándola
estadísticamente no significativa y por tanto se declara que no existe relación entre
el la variable % de participación de las familias pobres urbanas, el ingreso, el
tamaño medio de la familia y la tasa de desempleo.

15
Ejercicio 8.10
Klein y Goldberger intentaron ajustar el siguiente modelo de regresión a la
economía de los Estados Unidos: Yi  1   2 X 2i   3 X 3i  X 4i  u i Donde: Y=
Consumo; X2 = Ingreso, X3 = Ingreso diferente a salarios o diferente a ingreso
agrícola y X4 = Ingresos Agrícolas. Pero, puesto que se espera que X2, X3 y X4
tengan alta colinealidad, ellos obtuvieron estimaciones para b3 y b4 utilizando
análisis de series de corte transversal de la siguiente manera b3 = 0.75 b2 y b4 =
0.625 b2. Utilizando estas estimaciones, formularon su función de consumo de la
siguiente manera: Yi  1   2 ( X 2i  0.753 X 3i  0.625 X 4i )  ui   1   2 Z i  ui donde
Donde : Z i  X 2 i  0.75 X 3i  0.625 X 4 i .
Preguntas:

a. Ajuste el modelo a los siguientes datos y obtenga de b2 a b4.


Al efectuar la regresión Yi  1   2 i  ui se obtuvo los siguientes datos:

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 23,803 6,364 3,740 ,003
Zi ,685 ,066 ,948 10,303 ,000
a. Dependent Variable: Y

Que traducidos a lenguaje econométrico sería Yi  23.803  0.685Zi . Dado que


hemos obtenido b2; podemos estimar b3 y b4 a partir de la relación postulada
entre b2 - b3 y b2 – b4; así tendríamos:
 3  0.685 * 0.75  0.5138
B 4  0.685 * 0.685  0.428
Por tanto la función quedaría así: Yi  23.803  0.685 X 2i  0.5138 X 3i  0.428 X 4i
b. ¿Cómo se interpretaría usted la variable Z? ¿Porqué?
La variable Z, es una regresión auxiliar que permite a Klein y Goldberger combinar
dos técnicas para remediar la colinealidad utilizando información de corte
transversal mediante la cual pudieron obtener una estimación de los valores de b3
y b4. Con este artificio, ellos lograron no excluir ninguna variable del modelo
original utilizando un procedimiento práctico (información a priori e información de
corte transversal) puesto que esto conduciría a un error de especificación. Dado
que en el modelo original b3=b4 lo cual se demuestra a continuación:
1. Ho.: b3=b4 o b3-b4=0
2. H1.: b3≠b4 o b3-b4≠0
3. Estadístico de prueba = t

16
4. Nivel de significancia = á=0.05
5. Tamaño de la muestra: n=14
6. Valores críticos para n-k = 14 – 4 (cuatro regresoras incluyendo constante)=
2.228
7. Regla de decisión: Si tá=0.05; para 10 gdl > t calculado, rechazar hipótesis
nula; de lo contrario no se rechace.
8. Cálculos
ˆ3  ˆ4
t
var(ˆ3 )  var(ˆ4 )  2 cov(ˆ3 , ˆ4 )

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients Correlations Collinearity Statistics
Model B Std. Error Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Constant) 19,556 6,880 2,842 ,017
X2 ,334 ,256 ,354 1,306 ,221 ,933 ,382 ,117 ,108 9,231
X3 1,525 ,614 ,580 2,485 ,032 ,946 ,618 ,222 ,147 6,825
X4 ,480 1,386 ,053 ,346 ,736 ,769 ,109 ,031 ,336 2,974
a. Dependent Variable: Y

Regresión original = Yi  19.556  0.334 X 2i  1.525 X 3i  0.480 X 4i

Coefficient Correlationsa

Model X4 X3 X2
1 Correlations X4 1,000 ,065 -,514
X3 ,065 1,000 -,824
X2 -,514 -,824 1,000
Covariances X4 1,921 ,055 -,182
X3 ,055 ,376 -,129
X2 -,182 -,129 ,066
a. Dependent Variable: Y

1.525  0.480
t  0.409
0.376  1.921  2(0.129)

9. Decisión: Es evidente que 0.409 no excede al valor crítico 2.228.


10. Dado que a un nivel de significancia de á = 0.05 con 10 grados de libertad la
prueba t calculada es menor que t esperado; se acepta la hipótesis nula de que b3
y b4 son iguales o bien que b3 – b4=0.
Dado lo anterior, es comprensible que ambos investigadores hayan tomado la
decisión de utilizar una regresión auxiliar que les permitiera no excluir ninguna
variable utilizando además información de corte transversal.

17
(d) Suponga que usted ya ha corregido la regresión y que
posteriormente desea introducir otra variable ortogonal, digamos la
variable Xk-1 en el modelo. ¿Se tienen que volver a calcular todos los
coeficientes anteriores desde b1 hasta bk? ¿Porqué sí o porqué no?
Asumiendo que Yi  1   2 ( X 2i  0.753 X 3i  0.625 X 4i )  ui   1   2 Z i  ui es el
modelo “verdadero”, adicionar otra variable implicaría volver a calcular todos los
coeficientes anteriores puesto que esa nueva “variable” explicaría en parte el
comportamiento de la variable independiente incrementando o disminuyendo el
error de estimación; debe considerarse que este recurso utilizado por los
investigadores, esta suponiendo implícitamente que b3 y b4 han sido obtenidos a
partir de una análisis puro lo que podría acarrear problemas de interpretación; por
una parte, por otra hay que considerar que la utilización de la técnica de datos
transversales tiene la restricción de que debe ser aplicada en situaciones en donde
las estimaciones de corte transversal no varían sustancialmente de un grupo a otro
por tal razón, agregar otra variable que tanta es la variación de la información
entre los grupos.

18
Ejercicio 8.19.-
La siguiente tabla proporciona datos sobre importantes, PNB e índice de precios al
consumidor (IPC) para los Estados Unidos durante el periodo 1970-1983.
Se solicita considerar el siguiente modelo:
ln importacionest  1   2 ln PNBt   3 ln IPC t  u i
(a) Calcule los parámetros de este modelo utilizando la información dada en la
tabla.
a
Coefficients

Unstandardized Standardized
Coefficients Coefficients Correlations Collinearity Statistics
Model B Std. Error Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Constant)-2,311 1,029 -2,245 ,046
LnPNB 3,230 ,751 1,941 4,299 ,001 ,981 ,792 ,210 ,012 85,039
LnCPI -1,968 ,920 -,965 -2,138 ,056 ,964 -,542 -,105 ,012 85,039
a.Dependent Variable: Lnimport

Conforme los resultados tendríamos la siguiente función.


ln importaciones  2.311  3.230 ln PNBt  1.968 ln IPCt
(b) ¿Sospecha usted que existe multicolinealidad en los datos?

Model Summaryb

Adjusted Std. Error of Durbin-


Model R R Square R Square the Estimate Watson
1 ,987a ,974 ,969 ,11875 1,314
a. Predictors: (Constant), LnCPI, LnPNB
b. Dependent Variable: Lnimport

En efecto, a priori, hay indicios de multicolinealidad:


1. Un alto coeficiente de determinación conjuntamente con ningún valor t
significativo;
2. Valores de la T (tolerancia) cercanos a cero con VIF altos lo que indica que
existe alta variación;
(c) Examine la naturaleza de la multicolinealidad utilizando el índice de
condición.

Collinearity Diagnosticsa

Condition Variance Proportions


Model Dimension Eigenvalue Index (Constant) LnPNB LnCPI
1 1 2,998 1,000 ,00 ,00 ,00
2 ,002 37,272 ,29 ,00 ,01
3 1,81E-005 406,756 ,71 1,00 ,99
a. Dependent Variable: Lnimport
19
El Índice de condición muestra un valor = 406.756 lo que nos permite clasificar la
multicolinealidad existente como severa pues excede el límite de 30 fijado.
(d) Regrese las siguientes funciones:
1. ln importaciones  A1  A2  ln PNBt
2. ln  importaciones  B1  B2 ln IPC t

3. ln  PNBt  C1  C 2 ln IPC t

Con base en estas regresiones ¿Qué puede decir usted sobre la naturaleza de la
multicolinealidad en los datos?
Caso Original = ln importacionest  1   2 ln PNBt   3 ln IPC t  u i

Model Summaryb

Adjusted Std. Error of Durbin-


Model R R Square R Square the Estimate Watson
1 ,987a ,974 ,969 ,11875 1,314
a. Predictors: (Constant), LnCPI, LnPNB
b. Dependent Variable: Lnimport

Unstandardized Standardized
Coefficients Coefficients Correlations Collinearity Statistics
Model B Std. Error Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Constant)-2,311 1,029 -2,245 ,046
LnPNB 3,230 ,751 1,941 4,299 ,001 ,981 ,792 ,210 ,012 85,039
LnCPI -1,968 ,920 -,965 -2,138 ,056 ,964 -,542 -,105 ,012 85,039
a.Dependent Variable: Lnimport

Retomando los resultados iniciales de


ln importacionest  1   2 ln PNBt   3 ln IPC t  u i , observamos que los signos no
están acorde con las expectativas a priori puesto que un aumento en el IPC,
afectaría negativamente las importaciones y un incremento en el PNB reflejaría un
aumento en las importaciones; también podemos apreciar que ningún coeficiente
parcial es significativo no obstante, también puede verificarse que la Tol tiende a
aproximarse a cero y el Factor de Inflación de la Varianza (VIF) se dispara lo cual
significa que las varianzas y las covarianzas se incrementan; sin embargo el
estadístico F = 203.161 y por tanto significativo, demuestra que cuando la
colinealidad es “alta pero no perfecta”, no son confiables las pruebas sobre las
regresoras individuales en tal caso la F global es la que demostrará que si Y, esta
relacionada con las diversas regresoras. Este hecho de que la prueba F sea
significativa pero los valores t de X2 y X3 no los sean significativos individualmente
prueba que las dos variables, están tan altamente correlacionadas que es difícil
aislar el impacto individual del PNB o del IPC sobre los niveles de importación.

20
Caso 2: ln importaciones  A1  A2  ln PNBt

Cuando se efectúa la regresión de las importaciones (Y) sobre el PNB (X2),


obtenemos los siguientes resultados:

Model Summaryb

Adjusted Std. Error of Durbin-


Model R R Square R Square the Estimate Watson
1 ,981a ,963 ,960 ,13528 ,688
a. Predictors: (Constant), LnPNB
b. Dependent Variable: Lnimport

a
Coefficients

Unstandardized Standardized
Coefficients Coefficients Correlations Collinearity Statistics
Model B Std. Error Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Constant) -,543 ,699 -,777 ,452
LnPNB 1,633 ,093 ,981 17,595 ,000 ,981 ,981 ,981 1,000 1,000
a. Dependent Variable: Lnimport

Primero, observamos que R2 Ajustado, se mantiene alto con R2 Ajustado= 0.960;


además desaparece puesto que T=1 y VIF = 1; además b2 es significativo
estadísticamente aunque la constante continua siendo no significativa pero
manteniendo el signo negativo.
Caso 3: ln  importaciones  B1  B2 ln IPC t

Model Summaryb

Adjusted Std. Error of Durbin-


Model R R Square R Square the Estimate Watson
1 ,964a ,929 ,923 ,18614 ,486
a. Predictors: (Constant), LnCPI
b. Dependent Variable: Lnimport

a
Coefficients

Unstandardized Standardized
Coefficients Coefficients Correlations Collinearity Statistics
Model B Std. Error Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Constant) 1,508 ,815 1,850 ,089
LnCPI 1,966 ,156 ,964 12,564 ,000 ,964 ,964 ,964 1,000 1,000
a. Dependent Variable: Lnimport

Ahora si realizamos la regresión de importaciones (Y) sobre X3 (IPC), obtenemos


el siguiente resultado:

21
Ahora tenemos un R2 Ajustado = 0.923 y obsérvese que b1 continua siendo
cambio de signo pero aún continua siendo no no aparecen signos de colinealidad
puesto que T=1 y VIF =1.
Caso 4: ln  PNBt  C1  C 2 ln IPC t

Finalmente, si regresamos ahora PNB (X2) sobre IPC (X3), tendremos los
siguientes resultados:

Model Summaryb

Adjusted Std. Error of Durbin-


Model R R Square R Square the Estimate Watson
1 ,994a ,988 ,987 ,04563 ,796
a. Predictors: (Constant), LnCPI
b. Dependent Variable: LnPNB

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients Correlations Collinearity Statistics
Model B Std. Error Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Constant) 1,182 ,200 5,915 ,000
LnCPI 1,218 ,038 ,994 31,756 ,000 ,994 ,994 ,994 1,000 1,000
a. Dependent Variable: LnPNB

Aunque este otro modelo, podremos valor el impacto aislado que el IPC, tiene
sobre el PNB, algo que hasta el momento no hemos podido verificar con exactitud;
observemos que el coeficiente de determinación entre X3 y X3 es alto, o sea que
una buena parte de lo que ocurre en PNB es explicado por IPC; no obstante el
signo no esta acorde ya que un aumento en el IPC, deberá incidir negativamente
en las importaciones debido a la baja en el poder adquisitivo.
Un facto no comentado hasta ahora es que todas las regresiones muestran clara
tendencia a la autocorrelación positiva ya que en caso 1 DW= 1.314; caso 2
DW=0.688; Caso 3 DW = 0.486 y Caso 5 DW=0.796.
Independientemente de lo anterior podemos concluir que la naturaleza de la
multicolinealidad, dificulta el cálculo de los coeficientes estimados con errores
pequeños.
(e) Suponiendo que existe multicolinealidad en los datos pero que b2 y
b3 son individualmente significativas al nivel de 5% y que la prueba F
también es significativa, en ese caso ¿debemos preocuparnos sobre el
problema de la multicolinealidad?
La multicolinealidad es un problema de marca mayor cuando en la forma de
multicolinealidad perfecta puesto que los coeficientes de regresión se tornan
indeterminados o sea no se puede obtener una solución única de los coeficientes
de regresión individual; sin embargo, en presencia de multicolinealidad imperfecta
no existe razón a priori para pensar que no se puedan calcular dichos coeficientes;
el único efecto de la multicolinealidad, según Christopher Achen, es que dificulta el

22
cálculo de los coeficientes estimado con errores pequeños; por tanto hay que
preocuparse cuando existe multicolinealidad muestral para lo cual se debe
agrandar la muestra o utilizar otras técnicas a fin de lidiar con el engorroso hecho
de aislar la influencia individual de las variables sobre Y.

23
9.7. En una encuesta de más de 9966 economistas en 1964 se obtuvieron
los siguientes datos:
a.- Desarrolle un modelo adecuado de regresión que explique el salario
mediano en relación con la edad.

¿¿????

b. Suponiendo que la varianza del término de perturbación es


proporcional al cuadrado de la edad, transforme los datos de tal manera
que él término de perturbación resultante sea homocedástico.
Vamos a proceder en la siguiente forma:
Primero vamos a realizar las transformaciones sugeridas
Segundo se realizará una prueba de Park para determinar si hay o no
hetereoscedasticidad partiendo de Ho = Hay homocedasticidad versus H1 = no
hay homocedasticidad. La regla de decisión será: Si â resulta estadísticamente
significativo, se rechaza Ho de lo contrario no se rechaza.
Para el primer caso simbólicamente sería: Var (ui )   2 X 22i . Los resultados son:

Model Summaryb

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 ,738a ,544 ,494 1887,394
a. Predictors: (Constant), Edad2
b. Dependent Variable: Salarios

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients Collinearity Statistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) 9102,542 1114,635 8,166 ,000
Edad2 1,267 ,386 ,738 3,279 ,010 1,000 1,000
a. Dependent Variable: Salarios

Pasos prueba de ParK:


1. Realizar regresión asumiendo homocedasticidad
2. Salvar los residuos
3. Elevar al cuadrado los residuos
4. Transformar los residuos al cuadrado a logaritmo

24
5. Transformar la edad media a logaritmo
Una vez hecho esto se procederá a correr el siguiente modelo:
ln ui2     ln Xi  vi

Los resultados son:

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -,131 4,419 -,030 ,977
lnEdad -,191 1,159 -,055 -,164 ,873
a. Dependent Variable: lnZre2

Dado que â resulta ser no significativo estadísticamente, se acepta Ho; es decir no


hay razón para pensar que existe hetereoscedasticidad.
c.- Repita (b) suponiendo que la varianza es proporcional a la edad.
¿Cuál de las transformaciones parece plausible?
Simbólicamente esta propuesta sería Var (ui )   2 X 2i los resultados para este caso
~

son:

Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 ,815a ,664 ,626 1621,985
a. Predictors: (Constant), Spropocional

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 5968,947 1568,101 3,806 ,004
Spropocional ,513 ,122 ,815 4,213 ,002
a. Dependent Variable: Salarios

Siguiendo la misma ruta y la misma hipótesis nula presentamos los resultados de la


regresión son:

25
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -5,183 10,524 -,493 ,634
lnSpropor ,451 1,124 ,133 ,401 ,698
a. Dependent Variable: lnZre2c2

Dado que â igual que en el caso anterior resulta no ser estadísticamente significativo por
tanto se acepta la hipótesis nula de existencia de homocedasticidad.

d.- Si ninguna de las transformaciones anteriores parece razonable,


suponga que el término de varianza es proporcional a la expectativa
condicional del salario mediano, condicionado a la edad dada. ¿Cómo
transformaría usted los datos para que la varianza resultante sea
homocedástica?
A nuestro juicio, conforme las pruebas de Park, no existe hetereoscedasticidad, lo
que existe es una mala especificación del modelo puesto que hacen falta variables
explicativas.

26
10.3.- Al estudiar el movimiento en la participación de los obreros de
producción en el valor agregado (es decir, la participación en la mano de
obra), Gujarati considero los siguientes modelos*.
Modelo A: Yt   0  1t  u i

Modelo B: Yt     1t   2t 2  ui

donde Y=participación de la mano de obra y t=tiempo. Con base en datos anuales


para el período 1949-1964, se obtuvieron los siguientes resultados para la industria
medica primaria:
Yt  0.4529  0.0041t R2=0.5284; d=0.8252; t=(-3.9608)

Yt  0.4786  0.0127t  0.0005t ; R2 =0.6629 d=1.82; tb2=(-3.2724); tb3=(2.7777).


Prueba de hipótesis Modelo A
1. Ho: Autocorrelación = 0
2. H1: Autocorrelación ≠ 0
3. Estadístico: Durbin – Watson modificado
4. Tamaño Muestra = 16 (1949 – 1964)
5. Nivel de Significancia = 2á = 0.01
6. Valores críticos: Los valores críticos estarán determinados para n=16 y 2
regresoras incluyendo la constante = dL= 0.737 dU=1.252 de tal manera que los
valores críticos a dos alfas serán: d < dU ó (4-d) < dU.
7. Reglas de decisión:
Si d calculado < dU ó (4 - d) < dU, rechácese Ho al nivel de 2á; estadísticamente,
hay evidencia de autocorrelación positiva o negativa.
8. Procedimientos de cálculos
Dado que “d” calculado es igual 0.8252 < que dU=1.252 rechácese Ho.
9. Dado que a un nivel de significancia de 2 á = 0.01 para 16 observaciones y 2
regresoras incluyendo la constante se constata que el d calculado en menor que
dU encontrándose significancia estadística de tal manera que a ese nivel de
significancia se rechaza la hipótesis nula aceptándose la hipótesis alternativa de
que existe correlación ya sea esta positiva o negativa.

Modelo B: Yt     1t   2t 2  ui ; se seguirían los mismos procedimientos para


un “d” = 1.82 con n= 16 observaciones y K = a 3 regresoras para valores críticos
= dL=0.636 y dU=1.446; con la siguiente regla de decisión: Si d calculado < dU ó
(4 - d) < dU, rechácese Ho al nivel de 2á; estadísticamente, hay evidencia de
autocorrelación positiva o negativa.

27
Dado que 4 – 1.82 en mayor que dU = 1.446 se acepta Ho; o se no existe razón
para pensar que existe autocorrelación positiva o negativa.
(b) ¿Qué explica la correlación serial?
Asumimos que los términos correlación serial o autocorrelación en la práctica son
sinónimos que pueden explicar tanto la correlación existente entre dos series de
tiempo o bien la correlación de una rezagada de una serie consigo misma,
rezagada por un número de unidades de tiempo; en otras palabras, el término
correlación serial o autocorrelación, explica como la correlación entre miembros de
series de observaciones ordenadas en el tiempo o en el espacio. En el contexto de
la regresión, el modelo clásico de regresión lineal supone que no existe correlación
en las perturbaciones.
(c) Cómo distinguiría usted entre la autocorrelación “pura” y el sesgo de
especificación.
En principio hay que analizar el tipo de datos que estamos manejando; si se trata
de series de tiempo es muy probable que se este en presencia de autocorrelación
pura para ello tendremos que incluir la variable tiempo - tendencia a fin de
observar la relación entre las variables analizadas; si después de hacer este tipo de
transformaciones, “d” continua siendo bajo, estaremos en presencia de un mala
especificación del modelo. Aplicando el DW sobre un modelo al que ya se le ha
tratado para corregir la autocorrelación lo que observamos no es la correlación
positiva o negativa observada en los residuos cuando se ajusta un modelo sino son
los errores de especificación. La correlación observada refleja el hecho de que hay
una o más variables pertenecientes al modelo que están incluidas en términos del
error y necesitan ser rechazadas de este ser introducidas por derecho propio.

28
Ejercicio 12.5
Suponiendo que modificamos la regresión del salario de un profesor universitario
(12.4.1) así: Yi  1   2 D2i   3 D3i   4 ( D2i , D3i )  BX i  uo

Donde:
Yi= Salario anual de un profesor universitario
Xi= Años de experiencia docente
D2= 1 si es hombre y cero en los demás casos
D3= 1 si es blanco y cero en los demás casos
(a) El término (D2iD3i) representa el efecto de interacción ¿Qué significa
esta expresión)
En este modelo el sexo y la raza son regresoras cualitativas y los años de docencia
cuantitativos. Esta implícito en este modelo la suposición de que el efecto
diferencial de la variable sexo, D2, es constante en las dos categorías de raza y el
efecto diferencial de la variable dicótoma raza, D3, también es constante en los
dos sexos. Es decir, si el salario medio es mayor para los hombres que para las
mujeres, se debe a que pertenezcan o no pertenezcan a la categoría de blanco. De
igual forma, si los no blancos tienen salarios medios menores, se debe a que son
hombres o mujeres; no obstante en muchas ocasiones un hombre no blanco tal
vez gane menor salario que un hombre de esa misma categoría. En otras palabras,
quizás hay interacción en las dos variables cualitativas D2 y D3. Por tanto, su
efecto sobre la media Y quizás no sea simplemente aditivo sino multiplicativo con
el modelo presentado Yi  1   2 D2i   3 D3i   4 ( D2i , D3i )  BX i  ui .

(b) ¿Qué significado tiene el coeficiente á4?


El coeficiente alfa 4 mide el efecto diferencial de no ser blanco.
(c) Halle E (Yi | D 2i  1, D3i  1, Xi ) e interprételo.

¿?

29

También podría gustarte