Practica 9 Resuelta

ECONOMETRÍA 09 PRÁCTICA 9 HETEROSCEDASTICIDAD
Objetivos
- Heteroscedasticidad: indicios y confirmación

- Estimación óptima en presencia de heteroscedasticidad
- Predicción en presencia de heteroscedasticidad
Ejercicio 1
Crea un fichero en SPSS con los datos correspondientes a Gastos en Hotel y Renta
de 10 familias, con el fin de estimar un modelo lineal simple que explique el gasto
en hotel en función de la renta:
Gasto 8 7 3 9 30 24 17 17 42 31
Renta 300 250 200 320 650 700 430 500 760 810
A) Estima el modelo por mínimos cuadrados ordinarios y guarda los residuos.

Indicios de heteroscedasticidad: gráficos y comentario
La aparición de residuos grandes cuando aumenta la renta se pone manifiesto tanto

en la nube de puntos (por tratarse de un modelo simple) como en los gráficos de
residuos y residuos en valor absoluto frente a la renta. Hay indicio de
heteroscedasticidad.
1
B) Confirmación: test de Goldfeld y Quandt y test de Spearman
Para el test de Goldfeld y Quandt es necesario ordenar el fichero según la variable
que da indicio de provocar heteroscedasticidad. Habrá que seleccionar casos para
obtener las sumas residuales necesarias.
Para realizar el test de Spearman habrá que crear la variable “residuos en valor
absoluto” con Transformar Calcular y utilizar Correlaciones bivariantes con la
opción Spearman.
Test de Goldfeld y Quandt
Hipótesis: homoscedasticidad (varianza común, por tanto 12 =22)
Se ha ordenado el fichero según la variable Renta y se ha asignado un número de
caso (Transformar calcular variable Todo $casenum con nombre orden_renta) a
cada fila para facilitar la selección de casos:
Regresión MCO con variable de selección: orden_renta menor o igual a 4
ANOVAb
Modelo Suma de cuadrados gl Media cuadrática F Sig.
1 Regresión 19,142 1 19,142 23,807 ,040a
Residual 1,608 2 ,804
Total 20,750 3
a. Variables predictoras: (Constante), renta
b. Variable dependiente: Gasto_hotel
Regresión MCO con variable de selección: oreden_renta mayor o igual a 7
ANOVAb
1 Regresión 26,329 1 26,329 ,370 ,605a
Residual 142,421 2 71,211
Total 168,750 3
a. Variables predictoras: (Constante), renta
b. Variable dependiente: Gasto_hotel
Dado que el SPSS no tiene implementado el test, a partir de aquí debemos operar con
calculadora y tablas: 142,421/1,608 = 88,57 valor que pertenece a una F2,2 cuyo
percentil 95 es 19. Como 88,57>19, se rechaza la hipótesis. Queda confirmada la
heteroscedasticidad ligada a la variable renta.
2
Test de Spearman:
Ho Homoscedasticidad (ausencia de correlación entre la ordenación de la variable renta
y la ordenación de los residuos en valor absoluto)
Correlaciones
renta absres
Rho de Spearman renta Coeficiente de correlación 1,000 ,927**
Sig. (bilateral) . ,000
N 10 10
absres Coeficiente de correlación ,927** 1,000
Sig. (bilateral) ,000 .
N 10 10
**. La correlación es significativa al nivel 0,01 (bilateral).
La correlación en la muestra es muy alta y positiva 0,927 (concordancia) y el p-valor del

test 0,000<0,05 por tanto se rechaza la hipótesis. Queda confirmada la
heteroscedasticidad.
C) Estimación óptima:
Obtención del exponente  de la función potencial de modo que  i = xi y
estimación óptima. Para ello:
Analizar Regresión Estimación ponderada: introducimos la variable

dependiente GASTO HOTEL, la explicativa RENTA y, en variable de ponderación:
RENTA. Mostrar ANOVA y estimaciones para la mejor potencia. Si la mejor
potencia es un extremo de su intervalo, amplía el intervalo para explorar otra
opción.
¿Cuál es en este caso el mejor exponente? Cómo es la matriz 
Descripción del modelo
Variable dependiente Gasto_hotel
Variables independientes 1 renta
Ponderación Origen renta
Valor de potencia 4,000
Modelo: MOD_1.
3
La mejor potencia es 4
Por tanto la matriz lleva en la diagonal los valores muestrales de la renta

elevados a la cuarta. Fuera de la diagonal son ceros.
Ecuación de la estimación por MCG:
Coeficientes
Coeficientes no estandarizados Coeficientes estandarizados
B Error típico Beta Error típico t Sig.
(Constante) -7,453 1,086 -6,860 ,000
renta ,053 ,004 ,977 ,076 12,841 ,000
Esta tabla nos proporciona el estimador óptimo, errores típicos, t-ratios y p-valores.
Gasto hotel^ = -7,452725+ 0,05348125 Renta
Ecuación de la estimación por MCO:

Ten en cuenta que los errores típicos, t-ratios…que aparecen son falsos
Coeficientesa
Coeficientes
Coeficientes no estandarizados tipificados
Modelo B Error típ. Beta t Sig.
1 (Constante) -7,427 3,483 -2,133 ,066
renta ,053 ,006 ,945 8,209 ,000
a. Variable dependiente: Gasto_hotel
Esta tabla nos proporciona el estimador MCO, no es el óptimo ya que se ha confirmado

la heteroscedasticidad. Dado que SPSS obtiene los errores típicos basándose en las
fórmulas derivadas del cumplimiento de las hipótesis y en este caso no se cumplen, los
errores típicos (y en consecuencia t-ratios, p-valores) de esta tabla SON FALSOS. Los
verdaderos se deberían hallar con la fórmula de la varianza verdadera del
estimador MCO cuando la matriz VarU es NO ESCALAR
Gasto hotel^ = -7,427178 + 0,0533007 Renta (esto es cierto pero no es la

estimación óptima; el resto de elementos de la anterior tabla no valen, son falsos)
D) Ampliación de resultados MCG; predicción

Para obtener unos resultados más completos que incluyan otros aspectos estudiados
anteriormente, haremos uso de la opción Regresión Lineal con variable
dependiente GASTO HOTEL, variable explicativa RENTA, incluyendo una
4
variable de ponderación mcp: la variable WEIGHT. Esta variable de ponderación se
puede crear utilizando en OPCIONES Guardar la mejor potencia como variable de
ponderación en Regresión Estimación ponderada. Sus valores son los de la matriz
 y recibe el nombre de WEIGHT (aparece una nueva columna en el fichero)
Supongamos que deseamos predecir el gasto en hotel (al 95% de confianza) para
una familia de renta 620. Necesitamos una nueva fila en fichero que incluya ese
valor de renta y que incluya el valor de la ponderación correspondiente.
Debemos introducir en la fila 11 del fichero el valor de renta 620. Además debemos
disponer del valor WEIGHT correspondiente (será 1/6204) (se puede calcular a
mano e introducir o volver a ejecutar la estimación ponderada guardando la variable
Weight). A continuación se realiza la regresión lineal con variable de ponderación
mcp la variable WEIGHT, pidiendo guardar el intervalo de pronóstico para el
individuo
Resultado del intervalo:
[14´93624 , 36´47506]
Una familia de renta 620 gastará en hotel entre 14´936 y 36´475 (predicción de
individuo al 95% de confianza)
En resumen:
Analizar Regresión Estimación ponderada con Y como dependiente, las X,s
explicativas y la variable que produce heteroscedastidad como variable de
ponderación junto con la opción Guardar, nos proporciona:
La mejor potencia
El estimador óptimo, t-ratios…
Añade al fichero la variable WEIGHT
Analizar Regresión Lineal con Y como dependiente, las X,s como explicativas y
con variable de ponderación mcp Weight, nos proporciona:
El estimador óptimo, t-ratios…

Todos los demás elementos de una regresión (predicciones, estudio de
multicolinealidad, atípicos, ….)
5
Ejercicio 2 Fichero casa en ftp://ftp.unavarra.es/pub/estadistica
Los datos corresponden a viviendas: precio (dependiente), valoración del terreno y

valoración de las mejoras (explicativas)
1) Indicios, confirmación de heteroscedasticidad. Estimación óptima.
6
El primer gráfico presenta unos residuos más dispersos en viviendas con valores
altos de tasación del terreno. En el segundo no se aprecia esa tendencia.
Utilizaremos la variable valor de tasación del terreno para los test de confirmación.
Test G-Q
Ordenamos el archivo en función de la variable tasación del terreno. Creamos una
variable que numere las viviendas en el orden de la variable tasación del terreno
(Transformar calcular variable TODO $Casenum con nombre Orden_terreno). El
archivo tiene 2440 viviendas. Prescindiremos de las 800 observaciones centrales y
realizaremos dos regresiones: una con los casos del 1 al 820 y otra con los casos
1621 hasta 2440:
ANOVAb,c
1 Regresión 1,221E11 2 6,105E10 155,343 ,000a
Residual 3,211E11 817 3,930E8
Total 4,432E11 819
a. Variables predictoras: (Constante), Valor de tasación de las mejoras, Valor de tasación del terreno
b. Variable dependiente: Precio de venta
c. Seleccionando sólo los casos para los que orden_terreno <= 820,00
7
ANOVAb,c
1 Regresión 1,314E12 2 6,571E11 391,081 ,000a
Residual 1,373E12 817 1,680E9
Total 2,687E12 819
a. Variables predictoras: (Constante), Valor de tasación de las mejoras, Valor de tasación del terreno
b. Variable dependiente: Precio de venta
c. Seleccionando sólo los casos para los que orden_terreno >= 1621,00
Estadístico 1,373E12/ 3,211E11 = 4,276 corresponde a una F de grados de libertad

817 y 817
El percentil 95 de la distribución F(500,1000) es 1,13 y el valor límite (infinito,
infinito) es 1.
Como 4,27>percentil 95 se rechaza la hipótesis. Se confirma la

heteroscedasticidad ligada a la variable valoración del terreno
8
SPEARMAN:
Correlaciones
Valor de tasación del
terreno absres
Rho de Spearman Valor de tasación del terreno Coeficiente de correlación 1,000 ,308**
Sig. (bilateral) . ,000
N 2440 2440
absres Coeficiente de correlación ,308** 1,000
Sig. (bilateral) ,000 .
N 2440 2440
**. La correlación es significativa al nivel 0,01 (bilateral).
Nótese que, a pesar de no ser una correlación alta, el hecho de ocurrir en una
muestra tan grande, es una prueba contundente de que existe correlación. Se
rechaza la hipótesis de incorrelación (homoscedasticidad). Queda confirmada la
heteroscedasticidad en relación con la variable Valoración del Terreno
Estimación óptima:
Descripción del modelo
Variable dependiente precio
Variables independientes 1 valterr
2 valmejor
Ponderación Origen valterr
Valor de potencia ,500
Modelo: MOD_1.
Esto significa que los elementos de la diagonal de  son los valores muestrales de
valoración del terreno elevados a 0.5 (es decir las raices cuadradas de los valores)
Coeficientes
Coeficientes no estandarizados Coeficientes estandarizados
B Error típico Beta Error típico t Sig.
(Constante) 645,297 1161,344 Beta t ,556 ,579
valterr 3,076 ,063 ,649 ,013 48,841 ,000
valmejor ,533 ,026 ,274 ,013 20,608 ,000
Esta tabla nos proporciona la estimación óptima (MCG)

2)¿Cuál es el precio pronosticado (predicción puntual) para una casa con unas
mejoras valoradas en 15000 y cuyo terreno vale 20000? Halla el intervalo de
predicción del precio medio para el conjunto de casas con dichas características.
El precio pronosticado para una casa con valoración del terreno = 20000 y
valoración de las mejoras = 15000 es de 70160,9 (predicción puntual). El precio
medio del conjunto de casas con esas características estaría comprendido entre
68290,57 y 72031,28 (al 95% de confianza).

Practica 9 Resuelta

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Practica 9 Resuelta

Cargado por

Copyright:

Formatos disponibles

ECONOMETRÍA 09 PRÁCTICA 9 HETEROSCEDASTICIDAD

- Heteroscedasticidad: indicios y confirmación

A) Estima el modelo por mínimos cuadrados ordinarios y guarda los residuos.

La aparición de residuos grandes cuando aumenta la renta se pone manifiesto tanto

Regresión MCO con variable de selección: orden_renta menor o igual a 4

Modelo Suma de cuadrados gl Media cuadrática F Sig.

1 Regresión 19,142 1 19,142 23,807 ,040a

Residual 1,608 2 ,804

a. Variables predictoras: (Constante), renta

b. Variable dependiente: Gasto_hotel

Regresión MCO con variable de selección: oreden_renta mayor o igual a 7

Modelo Suma de cuadrados gl Media cuadrática F Sig.

1 Regresión 26,329 1 26,329 ,370 ,605a

Residual 142,421 2 71,211

a. Variables predictoras: (Constante), renta

b. Variable dependiente: Gasto_hotel

Rho de Spearman renta Coeficiente de correlación 1,000 ,927**

Sig. (bilateral) . ,000

absres Coeficiente de correlación ,927** 1,000

Sig. (bilateral) ,000 .

**. La correlación es significativa al nivel 0,01 (bilateral).

La correlación en la muestra es muy alta y positiva 0,927 (concordancia) y el p-valor del

Analizar Regresión Estimación ponderada: introducimos la variable

Descripción del modelo

Variable dependiente Gasto_hotel

Variables independientes 1 renta

Ponderación Origen renta

Valor de potencia 4,000

Por tanto la matriz lleva en la diagonal los valores muestrales de la renta

Ecuación de la estimación por MCG:

Coeficientes no estandarizados Coeficientes estandarizados

B Error típico Beta Error típico t Sig.

(Constante) -7,453 1,086 -6,860 ,000

renta ,053 ,004 ,977 ,076 12,841 ,000

Ecuación de la estimación por MCO:

Coeficientes no estandarizados tipificados

Modelo B Error típ. Beta t Sig.

1 (Constante) -7,427 3,483 -2,133 ,066

renta ,053 ,006 ,945 8,209 ,000

a. Variable dependiente: Gasto_hotel

Esta tabla nos proporciona el estimador MCO, no es el óptimo ya que se ha confirmado

Gasto hotel^ = -7,427178 + 0,0533007 Renta (esto es cierto pero no es la

D) Ampliación de resultados MCG; predicción

El estimador óptimo, t-ratios…

Los datos corresponden a viviendas: precio (dependiente), valoración del terreno y

1) Indicios, confirmación de heteroscedasticidad. Estimación óptima.

Modelo Suma de cuadrados gl Media cuadrática F Sig.

1 Regresión 1,221E11 2 6,105E10 155,343 ,000a

Residual 3,211E11 817 3,930E8

Total 4,432E11 819

b. Variable dependiente: Precio de venta

Modelo Suma de cuadrados gl Media cuadrática F Sig.

1 Regresión 1,314E12 2 6,571E11 391,081 ,000a

Residual 1,373E12 817 1,680E9

Total 2,687E12 819

b. Variable dependiente: Precio de venta

Estadístico 1,373E12/ 3,211E11 = 4,276 corresponde a una F de grados de libertad

Como 4,27>percentil 95 se rechaza la hipótesis. Se confirma la

Valor de tasación del

Sig. (bilateral) . ,000

absres Coeficiente de correlación ,308** 1,000

Sig. (bilateral) ,000 .

**. La correlación es significativa al nivel 0,01 (bilateral).