Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Objetivos
Ejercicio 1
Crea un fichero en SPSS con los datos correspondientes a Gastos en Hotel y Renta
de 10 familias, con el fin de estimar un modelo lineal simple que explique el gasto
en hotel en función de la renta:
Gasto 8 7 3 9 30 24 17 17 42 31
Renta 300 250 200 320 650 700 430 500 760 810
1
B) Confirmación: test de Goldfeld y Quandt y test de Spearman
Para el test de Goldfeld y Quandt es necesario ordenar el fichero según la variable
que da indicio de provocar heteroscedasticidad. Habrá que seleccionar casos para
obtener las sumas residuales necesarias.
Para realizar el test de Spearman habrá que crear la variable “residuos en valor
absoluto” con Transformar Calcular y utilizar Correlaciones bivariantes con la
opción Spearman.
Test de Goldfeld y Quandt
Hipótesis: homoscedasticidad (varianza común, por tanto 12 =22)
Se ha ordenado el fichero según la variable Renta y se ha asignado un número de
caso (Transformar calcular variable Todo $casenum con nombre orden_renta) a
cada fila para facilitar la selección de casos:
ANOVAb
Total 20,750 3
ANOVAb
Total 168,750 3
Dado que el SPSS no tiene implementado el test, a partir de aquí debemos operar con
calculadora y tablas: 142,421/1,608 = 88,57 valor que pertenece a una F2,2 cuyo
percentil 95 es 19. Como 88,57>19, se rechaza la hipótesis. Queda confirmada la
heteroscedasticidad ligada a la variable renta.
2
Test de Spearman:
Ho Homoscedasticidad (ausencia de correlación entre la ordenación de la variable renta
y la ordenación de los residuos en valor absoluto)
Correlaciones
renta absres
N 10 10
N 10 10
C) Estimación óptima:
Obtención del exponente de la función potencial de modo que i = xi y
estimación óptima. Para ello:
Modelo: MOD_1.
3
La mejor potencia es 4
Coeficientes
Esta tabla nos proporciona el estimador óptimo, errores típicos, t-ratios y p-valores.
Gasto hotel^ = -7,452725+ 0,05348125 Renta
Coeficientesa
Coeficientes
4
variable de ponderación mcp: la variable WEIGHT. Esta variable de ponderación se
puede crear utilizando en OPCIONES Guardar la mejor potencia como variable de
ponderación en Regresión Estimación ponderada. Sus valores son los de la matriz
y recibe el nombre de WEIGHT (aparece una nueva columna en el fichero)
Supongamos que deseamos predecir el gasto en hotel (al 95% de confianza) para
una familia de renta 620. Necesitamos una nueva fila en fichero que incluya ese
valor de renta y que incluya el valor de la ponderación correspondiente.
Debemos introducir en la fila 11 del fichero el valor de renta 620. Además debemos
disponer del valor WEIGHT correspondiente (será 1/6204) (se puede calcular a
mano e introducir o volver a ejecutar la estimación ponderada guardando la variable
Weight). A continuación se realiza la regresión lineal con variable de ponderación
mcp la variable WEIGHT, pidiendo guardar el intervalo de pronóstico para el
individuo
Resultado del intervalo:
[14´93624 , 36´47506]
Una familia de renta 620 gastará en hotel entre 14´936 y 36´475 (predicción de
individuo al 95% de confianza)
En resumen:
Analizar Regresión Estimación ponderada con Y como dependiente, las X,s
explicativas y la variable que produce heteroscedastidad como variable de
ponderación junto con la opción Guardar, nos proporciona:
La mejor potencia
El estimador óptimo, t-ratios…
Añade al fichero la variable WEIGHT
Analizar Regresión Lineal con Y como dependiente, las X,s como explicativas y
con variable de ponderación mcp Weight, nos proporciona:
5
Ejercicio 2 Fichero casa en ftp://ftp.unavarra.es/pub/estadistica
6
El primer gráfico presenta unos residuos más dispersos en viviendas con valores
altos de tasación del terreno. En el segundo no se aprecia esa tendencia.
Utilizaremos la variable valor de tasación del terreno para los test de confirmación.
Test G-Q
Ordenamos el archivo en función de la variable tasación del terreno. Creamos una
variable que numere las viviendas en el orden de la variable tasación del terreno
(Transformar calcular variable TODO $Casenum con nombre Orden_terreno). El
archivo tiene 2440 viviendas. Prescindiremos de las 800 observaciones centrales y
realizaremos dos regresiones: una con los casos del 1 al 820 y otra con los casos
1621 hasta 2440:
ANOVAb,c
a. Variables predictoras: (Constante), Valor de tasación de las mejoras, Valor de tasación del terreno
c. Seleccionando sólo los casos para los que orden_terreno <= 820,00
7
ANOVAb,c
a. Variables predictoras: (Constante), Valor de tasación de las mejoras, Valor de tasación del terreno
c. Seleccionando sólo los casos para los que orden_terreno >= 1621,00
8
SPEARMAN:
Correlaciones
terreno absres
Rho de Spearman Valor de tasación del terreno Coeficiente de correlación 1,000 ,308**
N 2440 2440
N 2440 2440
Nótese que, a pesar de no ser una correlación alta, el hecho de ocurrir en una
muestra tan grande, es una prueba contundente de que existe correlación. Se
rechaza la hipótesis de incorrelación (homoscedasticidad). Queda confirmada la
heteroscedasticidad en relación con la variable Valoración del Terreno
Estimación óptima:
Descripción del modelo
Variable dependiente precio
Variables independientes 1 valterr
2 valmejor
Ponderación Origen valterr
Valor de potencia ,500
Modelo: MOD_1.
Esto significa que los elementos de la diagonal de son los valores muestrales de
valoración del terreno elevados a 0.5 (es decir las raices cuadradas de los valores)
Coeficientes
El precio pronosticado para una casa con valoración del terreno = 20000 y
valoración de las mejoras = 15000 es de 70160,9 (predicción puntual). El precio
medio del conjunto de casas con esas características estaría comprendido entre
68290,57 y 72031,28 (al 95% de confianza).