Está en la página 1de 5

UNIVERSIDAD

CENTRAL DEL
24-5-2018
ECUADOR

DEBER ANCOVA

INTEGRANTES:
CARLOS ARGUELLO

BRAYAN DOICELA

GIMELLY PERALVO

VANESA MONTESDEOCA

BRYAN FLORES
TRATAMIENTO DE DATOS

Para el siguiente trabajo se utilizó la base de Condicione de Vida, sexta ronda, módulo de
hogares tomando las siguientes variables:

Y= Consumo total del hogar

X1= Ingreso Total del hogar

X2= Área

Se pudo evidenciar que existían datos pedidos en las variables métricos y se procedió a
realizar la prueba de aleatoriedad en SPSS, una vez confirmado que los datos perdidos
provienen de una muestra aleatoria se realiza una imputación de datos con el MÉTODO DE
IMPUTACIÓN DE SUSTITUCIÓN POR LA MEDIANA, es un estadístico de resumen de
datos más robusto. Este método proporciona información más robusta.

GRÁFICO DE DISPERSIÓN CON DATOS ATÍPICOS


40000
30000
Ing_total

20000
10000

0 10000 20000 30000


Consumo

Ing_total Ing_total
En el gráfico de dispersión se puede evidenciar la variabilidad de los datos con presencia de
datos atípicos. Para este problema se procedió a utilizar la técnica de LA MEDIA
RECORTADA que consiste en recortar el 5% del límite inferior y superior para evitar la
distorsión de los puntos extremos y no causen un efecto al modelo.

Dando como resultado una nueva nube de puntos con una variabilidad menor y con pocos
datos atípicos que afecten al modelo.

GRÁFICO DE DISPERSIÓN
15000
10000
Consumo

5000

0 1000 2000 3000 4000 5000


Ing_total

Consumo Consumo
ANÁLISIS DE COVARIANZA (ANCOVA)

MODELO DE UN FACTOR Y UNA VARIABLE CONCOMINANTE

Consumo de los hogaresij = μ + Area + β Ingreso total del hogar + Eij

. anova Consumo c.Ing_total Area

Number of obs = 19,559 R-squared = 0.3990


Root MSE = 522.663 Adj R-squared = 0.3989

Source Partial SS df MS F Prob>F

Model 3.546e+09 2 1.773e+09 6490.61 0.0000

Ing_total 3.016e+09 1 3.016e+09 11039.34 0.0000


Area 1.301e+08 1 1.301e+08 476.36 0.0000

Residual 5.342e+09 19,556 273176.83

Total 8.888e+09 19,558 454464.45

. regress Consumo Ing_total i.Area

Source SS df MS Number of obs = 19,559


F(2, 19556) = 6490.61
Model 3.5462e+09 2 1.7731e+09 Prob > F = 0.0000
Residual 5.3422e+09 19,556 273176.834 R-squared = 0.3990
Adj R-squared = 0.3989
Total 8.8884e+09 19,558 454464.445 Root MSE = 522.66

Consumo Coef. Std. Err. t P>|t| [95% Conf. Interval]

Ing_total .5205189 .0049541 105.07 0.000 .5108084 .5302293


2.Area -170.7053 7.821338 -21.83 0.000 -186.0358 -155.3748
_cons 412.4638 8.189988 50.36 0.000 396.4107 428.5169

Consumo = 412.46+ 0.520 Ingreso total del hogar - 170.70 Área +u

La diferencia en el área que viven las personas es de -170.70 dólares. Lo que quiere decir que
las personas del área Rural consumen 170.70 dólares menos que las personas que viven en el
área Urbana.

SIGNIFICANCIA DE VARIABLES
Las variables son estadísticamente significativas porque el valor del test t de student es mayor
a 2 en términos absolutos, las probabilidades de t son menores 0.05 y en los intervalos de
confianza no está incluido el cero.

R-squared= El factor área y la variable ingreso total de hogares explican el 39,90% del
Consumo de los hogares

DIFERENCIAS DE MEDIAS, SIN EL EFECTO DE LA COVARIANTE

. table Area, c(m Consumo)

Area mean(Consumo)

1 1110.5243
2 773.03635

INTERPRETACIÓN:

Existe una diferencia de 337.49 dólares en promedio

SUPUESTO DE HOMOGENEIDAD DE PENDIENTES


15000
10000
5000

0 1000 2000 3000 4000 5000


Ing_total

Consumo Consumo
Linear prediction Linear prediction

INTERPRETACIÓN:

Se cumple el supuesto de homogeneidad de pendientes de la variable ingresos de hogares en


el área urbana y rural.

También podría gustarte