Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Practica 9 Resuelta
Practica 9 Resuelta
Objetivos:
- Detección de multicolinealidad
- Detección de variables relevantes omitidas
- Detección de observaciones atípicas
Para explicar la Esperanza de vida femenina de los distintos países se proponen las
variables siguientes: % de personas alfabetizadas, Producto interior bruto per capita,
ingesta diaria de calorías, Habitantes por Km2, Población urbana (%), Tasa de
natalidad.
Correlaciones
Product Tasa de
o natalida
Habitant interior d (por 1.
es en Personas bruto Ingesta 000
Habitante ciudade Alfabetiza per-capi diaria de habitant
s por Km2 s (%) das (%) ta calorías es)
Habitantes por Km2 1 ,223* ,031 ,201* ,067 -,153
,020 ,753 ,036 ,570 ,113
109 108 107 109 75 109
Habitantes en ciudades ,223* 1 ,650** ,605** ,692** -,629**
(%) ,020 ,000 ,000 ,000 ,000
108 108 107 108 74 108
Personas Alfabetizadas ,031 ,650** 1 ,552** ,682** -,869**
(%) ,753 ,000 ,000 ,000 ,000
En esta tabla observamos cómo correlacionan las variables tomadas dos a dos. Las
correlaciones altas (en valor absoluto) tales como –0.869 (entre personas alfabetizadas y
tasa de natalidad), -0.762 (entre ingesta de calorías y tasa de natalidad), 0.751 (entre
ingesta de calorías y producto interior bruto) sirven de advertencia: introducir todas las
variables en el modelo dará problemas de multicolinealidad. Además observamos que la
mayor parte de las correlaciones son significativamente (* al 5%) o muy
significativamente (** al 1%) distintas de cero, esto sucede con las correlaciones altas y
también con otras más débiles, debido a un tamaño muestral grande. Aunque la tabla
solo nos muestra resultados por parejas, la presencia de tanta correlación puede originar
que alguna de las variables explicativas pueda a su vez “ser explicada” por las demás
(este aspecto se comprobará más adelante).
La variable que presenta correlaciones más débiles con las demás es habitantes por
Km2 por lo que no se espera que presente problemas de multicolinealidad.
b) Estima el modelo con todas las variables propuestas (MODELO 1). ¿Los signos
son los esperados? ¿Hay variables que te sorprende que no muestren capacidad
explicativa?
Coeficientesa
Coeficientes no
estandarizados
Modelo B Error típ. t Sig.
1 (Constante) 49,594 7,667 6,468 ,000
Habitantes por
,000 ,001 -,405 ,686
Km2
Habitantes en
,123 ,032 3,862 ,000
ciudades (%)
Personas
,163 ,049 3,332 ,001
Alfabetizadas (%)
Producto interior
-9,6E-005 ,000 -,782 ,437
bruto per-capita
Ingesta diaria de
,003 ,002 1,957 ,055
calorías
Tasa de natalidad
(por 1.000 -,303 ,102 -2,955 ,004
habitantes)
a. Variable dependiente: Esperanza de vida femenina
Coeficientesa
Coeficientes no Estadísticos de
estandarizados colinealidad
Modelo B Error típ. Tolerancia FIV
1 (Constante) 49,594 7,667
Habitantes por Km2 ,000 ,001 ,927 1,079
Habitantes en ciudades
,123 ,032 ,423 2,362
(%)
Personas Alfabetizadas
,163 ,049 ,209 4,790
(%)
Producto interior bruto
-9,6E-005 ,000 ,345 2,899
per-capita
Ingesta diaria de calorías ,003 ,002 ,294 3,396
Tasa de natalidad (por 1.
-,303 ,102 ,165 6,047
000 habitantes)
a. Variable dependiente: Esperanza de vida femenina
Proporciones de la varianza
Tasa
Pers de
ona Prod natali
Habit s ucto Ingest dad
antes Alfa interi a (por
Indice Habit en betiz or diaria 1.000
de (Con antes ciuda ada bruto de habit
Autov condici stant por des s per-c calorí ante
alor ón e) Km2 (%) (%) apita as s)
1 5,225 1,000 ,00 ,00 ,00 ,00 ,00 ,00 ,00
2 ,921 2,381 ,00 ,78 ,00 ,00 ,01 ,00 ,00
3 ,674 2,784 ,00 ,16 ,00 ,00 ,15 ,00 ,01
4 ,113 6,814 ,00 ,00 ,19 ,02 ,58 ,00 ,06
5 ,051 10,119 ,00 ,01 ,72 ,11 ,02 ,01 ,05
6 ,013 19,947 ,00 ,00 ,01 ,36 ,22 ,58 ,13
7 ,003 40,425 ,99 ,04 ,07 ,51 ,00 ,41 ,75
a. Variable dependiente: Esperanza de vida femenina
Verifiquemos el valor 0,165 mediante una regresión auxiliar con variable dependiente la
tasa de natalidad y explicativas las demás explicativas:
Resumen del modelo
La primera decisión será eliminar del modelo Habitantes por Km2 ya que su falta de
significatividad (y un t-ratio muy bajo –0.4) no es debida a multicolinealidad sino a
que la variable no “explica” a la variable esperanza de vida femenina.
ANOVAb
Suma de
Modelo cuadrados gl Media cuadrática F Sig.
a. Variables predictoras: (Constante), Personas Alfabetizadas (%), Producto interior bruto per-
capita, Habitantes en ciudades (%)
Coeficien
tes
Coeficientes no tipificado Estadísticos de
estandarizados s colinealidad
Producto interior bruto ,000 ,000 ,134 2,463 ,015 ,577 1,732
per-capita
Diagnósticos de colinealidada
Proporciones de la varianza
Habitantes Producto
en interior Personas
Autovalore Índice de (Constan ciudades bruto per- Alfabetiz
Modelo Dimensión s condición te) (%) capita adas (%)
DFBETA alfabet
N Válidos 74
Perdidos 35
Media -,0000261