Está en la página 1de 9

ECONOMETRÍA 09 PRÁCTICA 9 HETEROSCEDASTICIDAD

Objetivos

- Heteroscedasticidad: indicios y confirmación


- Estimación óptima en presencia de heteroscedasticidad
- Predicción en presencia de heteroscedasticidad

Ejercicio 1
Crea un fichero en SPSS con los datos correspondientes a Gastos en Hotel y Renta
de 10 familias, con el fin de estimar un modelo lineal simple que explique el gasto
en hotel en función de la renta:
Gasto 8 7 3 9 30 24 17 17 42 31
Renta 300 250 200 320 650 700 430 500 760 810

A) Estima el modelo por mínimos cuadrados ordinarios y guarda los residuos.


Indicios de heteroscedasticidad: gráficos y comentario

La aparición de residuos grandes cuando aumenta la renta se pone manifiesto tanto


en la nube de puntos (por tratarse de un modelo simple) como en los gráficos de
residuos y residuos en valor absoluto frente a la renta. Hay indicio de
heteroscedasticidad.

1
B) Confirmación: test de Goldfeld y Quandt y test de Spearman
Para el test de Goldfeld y Quandt es necesario ordenar el fichero según la variable
que da indicio de provocar heteroscedasticidad. Habrá que seleccionar casos para
obtener las sumas residuales necesarias.
Para realizar el test de Spearman habrá que crear la variable “residuos en valor
absoluto” con Transformar Calcular y utilizar Correlaciones bivariantes con la
opción Spearman.
Test de Goldfeld y Quandt
Hipótesis: homoscedasticidad (varianza común, por tanto 12 =22)
Se ha ordenado el fichero según la variable Renta y se ha asignado un número de
caso (Transformar calcular variable Todo $casenum con nombre orden_renta) a
cada fila para facilitar la selección de casos:

Regresión MCO con variable de selección: orden_renta menor o igual a 4

ANOVAb

Modelo Suma de cuadrados gl Media cuadrática F Sig.

1 Regresión 19,142 1 19,142 23,807 ,040a

Residual 1,608 2 ,804

Total 20,750 3

a. Variables predictoras: (Constante), renta

b. Variable dependiente: Gasto_hotel

Regresión MCO con variable de selección: oreden_renta mayor o igual a 7

ANOVAb

Modelo Suma de cuadrados gl Media cuadrática F Sig.

1 Regresión 26,329 1 26,329 ,370 ,605a

Residual 142,421 2 71,211

Total 168,750 3

a. Variables predictoras: (Constante), renta

b. Variable dependiente: Gasto_hotel

Dado que el SPSS no tiene implementado el test, a partir de aquí debemos operar con
calculadora y tablas: 142,421/1,608 = 88,57 valor que pertenece a una F2,2 cuyo
percentil 95 es 19. Como 88,57>19, se rechaza la hipótesis. Queda confirmada la
heteroscedasticidad ligada a la variable renta.

2
Test de Spearman:
Ho Homoscedasticidad (ausencia de correlación entre la ordenación de la variable renta
y la ordenación de los residuos en valor absoluto)

Correlaciones

renta absres

Rho de Spearman renta Coeficiente de correlación 1,000 ,927**

Sig. (bilateral) . ,000

N 10 10

absres Coeficiente de correlación ,927** 1,000

Sig. (bilateral) ,000 .

N 10 10

**. La correlación es significativa al nivel 0,01 (bilateral).

La correlación en la muestra es muy alta y positiva 0,927 (concordancia) y el p-valor del


test 0,000<0,05 por tanto se rechaza la hipótesis. Queda confirmada la
heteroscedasticidad.

C) Estimación óptima:
Obtención del exponente  de la función potencial de modo que  i = xi y
estimación óptima. Para ello:

Analizar Regresión Estimación ponderada: introducimos la variable


dependiente GASTO HOTEL, la explicativa RENTA y, en variable de ponderación:
RENTA. Mostrar ANOVA y estimaciones para la mejor potencia. Si la mejor
potencia es un extremo de su intervalo, amplía el intervalo para explorar otra
opción.
¿Cuál es en este caso el mejor exponente? Cómo es la matriz 

Descripción del modelo

Variable dependiente Gasto_hotel

Variables independientes 1 renta

Ponderación Origen renta

Valor de potencia 4,000

Modelo: MOD_1.

3
La mejor potencia es 4

Por tanto la matriz lleva en la diagonal los valores muestrales de la renta


elevados a la cuarta. Fuera de la diagonal son ceros.

Ecuación de la estimación por MCG:

Coeficientes

Coeficientes no estandarizados Coeficientes estandarizados

B Error típico Beta Error típico t Sig.

(Constante) -7,453 1,086 -6,860 ,000

renta ,053 ,004 ,977 ,076 12,841 ,000

Esta tabla nos proporciona el estimador óptimo, errores típicos, t-ratios y p-valores.
Gasto hotel^ = -7,452725+ 0,05348125 Renta

Ecuación de la estimación por MCO:


Ten en cuenta que los errores típicos, t-ratios…que aparecen son falsos

Coeficientesa

Coeficientes

Coeficientes no estandarizados tipificados

Modelo B Error típ. Beta t Sig.

1 (Constante) -7,427 3,483 -2,133 ,066

renta ,053 ,006 ,945 8,209 ,000

a. Variable dependiente: Gasto_hotel

Esta tabla nos proporciona el estimador MCO, no es el óptimo ya que se ha confirmado


la heteroscedasticidad. Dado que SPSS obtiene los errores típicos basándose en las
fórmulas derivadas del cumplimiento de las hipótesis y en este caso no se cumplen, los
errores típicos (y en consecuencia t-ratios, p-valores) de esta tabla SON FALSOS. Los
verdaderos se deberían hallar con la fórmula de la varianza verdadera del
estimador MCO cuando la matriz VarU es NO ESCALAR

Gasto hotel^ = -7,427178 + 0,0533007 Renta (esto es cierto pero no es la


estimación óptima; el resto de elementos de la anterior tabla no valen, son falsos)

D) Ampliación de resultados MCG; predicción


Para obtener unos resultados más completos que incluyan otros aspectos estudiados
anteriormente, haremos uso de la opción Regresión Lineal con variable
dependiente GASTO HOTEL, variable explicativa RENTA, incluyendo una

4
variable de ponderación mcp: la variable WEIGHT. Esta variable de ponderación se
puede crear utilizando en OPCIONES Guardar la mejor potencia como variable de
ponderación en Regresión Estimación ponderada. Sus valores son los de la matriz
 y recibe el nombre de WEIGHT (aparece una nueva columna en el fichero)

Supongamos que deseamos predecir el gasto en hotel (al 95% de confianza) para
una familia de renta 620. Necesitamos una nueva fila en fichero que incluya ese
valor de renta y que incluya el valor de la ponderación correspondiente.
Debemos introducir en la fila 11 del fichero el valor de renta 620. Además debemos
disponer del valor WEIGHT correspondiente (será 1/6204) (se puede calcular a
mano e introducir o volver a ejecutar la estimación ponderada guardando la variable
Weight). A continuación se realiza la regresión lineal con variable de ponderación
mcp la variable WEIGHT, pidiendo guardar el intervalo de pronóstico para el
individuo
Resultado del intervalo:
[14´93624 , 36´47506]
Una familia de renta 620 gastará en hotel entre 14´936 y 36´475 (predicción de
individuo al 95% de confianza)

En resumen:
Analizar Regresión Estimación ponderada con Y como dependiente, las X,s
explicativas y la variable que produce heteroscedastidad como variable de
ponderación junto con la opción Guardar, nos proporciona:

La mejor potencia
El estimador óptimo, t-ratios…
Añade al fichero la variable WEIGHT

Analizar Regresión Lineal con Y como dependiente, las X,s como explicativas y
con variable de ponderación mcp Weight, nos proporciona:

El estimador óptimo, t-ratios…


Todos los demás elementos de una regresión (predicciones, estudio de
multicolinealidad, atípicos, ….)

5
Ejercicio 2 Fichero casa en ftp://ftp.unavarra.es/pub/estadistica

Los datos corresponden a viviendas: precio (dependiente), valoración del terreno y


valoración de las mejoras (explicativas)

1) Indicios, confirmación de heteroscedasticidad. Estimación óptima.

6
El primer gráfico presenta unos residuos más dispersos en viviendas con valores
altos de tasación del terreno. En el segundo no se aprecia esa tendencia.

Utilizaremos la variable valor de tasación del terreno para los test de confirmación.

Test G-Q
Ordenamos el archivo en función de la variable tasación del terreno. Creamos una
variable que numere las viviendas en el orden de la variable tasación del terreno
(Transformar calcular variable TODO $Casenum con nombre Orden_terreno). El
archivo tiene 2440 viviendas. Prescindiremos de las 800 observaciones centrales y
realizaremos dos regresiones: una con los casos del 1 al 820 y otra con los casos
1621 hasta 2440:

ANOVAb,c

Modelo Suma de cuadrados gl Media cuadrática F Sig.

1 Regresión 1,221E11 2 6,105E10 155,343 ,000a

Residual 3,211E11 817 3,930E8

Total 4,432E11 819

a. Variables predictoras: (Constante), Valor de tasación de las mejoras, Valor de tasación del terreno

b. Variable dependiente: Precio de venta

c. Seleccionando sólo los casos para los que orden_terreno <= 820,00

7
ANOVAb,c

Modelo Suma de cuadrados gl Media cuadrática F Sig.

1 Regresión 1,314E12 2 6,571E11 391,081 ,000a

Residual 1,373E12 817 1,680E9

Total 2,687E12 819

a. Variables predictoras: (Constante), Valor de tasación de las mejoras, Valor de tasación del terreno

b. Variable dependiente: Precio de venta

c. Seleccionando sólo los casos para los que orden_terreno >= 1621,00

Estadístico 1,373E12/ 3,211E11 = 4,276 corresponde a una F de grados de libertad


817 y 817
El percentil 95 de la distribución F(500,1000) es 1,13 y el valor límite (infinito,
infinito) es 1.

Como 4,27>percentil 95 se rechaza la hipótesis. Se confirma la


heteroscedasticidad ligada a la variable valoración del terreno

8
SPEARMAN:

Correlaciones

Valor de tasación del

terreno absres

Rho de Spearman Valor de tasación del terreno Coeficiente de correlación 1,000 ,308**

Sig. (bilateral) . ,000

N 2440 2440

absres Coeficiente de correlación ,308** 1,000

Sig. (bilateral) ,000 .

N 2440 2440

**. La correlación es significativa al nivel 0,01 (bilateral).

Nótese que, a pesar de no ser una correlación alta, el hecho de ocurrir en una
muestra tan grande, es una prueba contundente de que existe correlación. Se
rechaza la hipótesis de incorrelación (homoscedasticidad). Queda confirmada la
heteroscedasticidad en relación con la variable Valoración del Terreno

Estimación óptima:
Descripción del modelo
Variable dependiente precio
Variables independientes 1 valterr
2 valmejor
Ponderación Origen valterr
Valor de potencia ,500
Modelo: MOD_1.

Esto significa que los elementos de la diagonal de  son los valores muestrales de
valoración del terreno elevados a 0.5 (es decir las raices cuadradas de los valores)
Coeficientes

Coeficientes no estandarizados Coeficientes estandarizados

B Error típico Beta Error típico t Sig.

(Constante) 645,297 1161,344 Beta t ,556 ,579

valterr 3,076 ,063 ,649 ,013 48,841 ,000

valmejor ,533 ,026 ,274 ,013 20,608 ,000

Esta tabla nos proporciona la estimación óptima (MCG)


2)¿Cuál es el precio pronosticado (predicción puntual) para una casa con unas
mejoras valoradas en 15000 y cuyo terreno vale 20000? Halla el intervalo de
predicción del precio medio para el conjunto de casas con dichas características.

El precio pronosticado para una casa con valoración del terreno = 20000 y
valoración de las mejoras = 15000 es de 70160,9 (predicción puntual). El precio
medio del conjunto de casas con esas características estaría comprendido entre
68290,57 y 72031,28 (al 95% de confianza).

También podría gustarte