Está en la página 1de 4

Prueba de Entrada / Miguel Angel Cervantes Buleje

Pregunta 1:

Un periódico de la mañana enumera los siguientes precios de automóviles usados: la variable x1


es la antigüedad medido en años y precio de venta x2 medido en miles de dólares

X1 1 2 3 3 4 5 6 8 9 11

X2 18.95 19.00 17.95 15.54 14.00 12.95 8.94 7.49 6.00 3.99

a) Construir un gráfico de dispersión , interpretar

Diagrama de dispersión X2 = -1.6673X1 + 21.151


R² = 0.957
25

20

15
X2

10

0
0 2 4 6 8 10 12
X1

Interpretación: podemos apreciar que existe una tendencia lineal entre las observaciones así
como también una pendiente negativa.

b) Calcular los promedios y varianzas, interpretar

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
1.22158 95.70% 95.16% 93.14%

Grupos Cuenta Suma Promedio Varianza


X1 10 52 5.2 10.6222222
X2 10 124.81 12.481 30.8543656

Interpretación: El promedio de antigüedad de los automóviles es 5.2 años, mientras que su


variación con respecto a su media es de 10.62; por el lado de la variable precio obtenemos un
promedio de 12.481 y su variación con respecto a su media es igual a 30.85.
c) Calcular covarianzas y correlación, interpretar

Correlaciones

Correlación de Pearson -0.978


Valor p 0.000

Covarianzas

X1 X2
X1 10.6222
X2 -17.7102 30.8544

Interpretación: con respecto a la correlación de Pearson obtenemos -0.978, es decir tenemos


una relación lineal negativa fuerte entre las variables antigüedad y precio; con respecto a la
covarianza entre las variables antigüedad y precio vemos que es -17.71 es decir tenemos
dependencia negativa, a mayor antigüedad obtenemos menor precio.

Pregunta 2:

Los datos del fichero EdadPesoGrasas.txt corresponden a tres variables medidas en 25


individuos: edad, peso y cantidad de grasas en sangre. La variable dependiente es cantidad de
grasa y las independientes son edad y peso

a) Elaborar estadísticas de por lo menos 2 variables, interpretar

Para la variable Peso y la variable respuesta Grasas

Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


Regresión 1 10232 10232 1.74 0.200
peso 1 10232 10232 1.74 0.200
Error 23 135145 5876
Falta de ajuste 17 118180 6952 2.46 0.136
Error puro 6 16965 2828
Total 24 145377
Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
76.6543 7.04% 3.00% 0.00%
Coeficientes

EE del
Término Coef coef. Valor T Valor p FIV
Constante 199.3 85.8 2.32 0.029
peso 1.62 1.23 1.32 0.200 1.00
Ecuación de regresión

grasas = 199.3 + 1.62 peso

Interpretación: Interpretación: El modelo explica un 7.04% de la variabilidad de la variable


Grasas, según el análisis de varianza podemos decir que el peso es una variable no significativa

Para la variable Edad y la variable respuesta Grasas

Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


Regresión 1 101933 101933 53.96 0.000
edad 1 101933 101933 53.96 0.000
Error 23 43444 1889
Falta de ajuste 17 36734 2161 1.93 0.213
Error puro 6 6711 1118
Total 24 145377
Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
43.4613 70.12% 68.82% 65.39%
Coeficientes

EE del
Término Coef coef. Valor T Valor p FIV
Constante 102.6 29.6 3.46 0.002
edad 5.321 0.724 7.35 0.000 1.00
Ecuación de regresión

grasas = 102.6 + 5.321 edad

Interpretación: El modelo explica un 70.12% de la variabilidad de la variable Grasas, según el


análisis de varianza podemos decir que la edad es una variable significativa

b) Construir un modelo de regresión usando una o 2 independientes, interpretar


Para la variable Peso, Edad y la variable respuesta Grasas
Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


Regresión 2 102571 51285.4 26.36 0.000
peso 1 638 638.1 0.33 0.573
edad 1 92339 92339.1 47.46 0.000
Error 22 42806 1945.7
Falta de ajuste 21 41066 1955.5 1.12 0.644
Error puro 1 1741 1740.5
Total 24 145377
Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
44.1105 70.56% 67.88% 64.73%
Coeficientes

EE del
Término Coef coef. Valor T Valor p FIV
Constante 78.0 52.4 1.49 0.151
peso 0.417 0.729 0.57 0.573 1.06
edad 5.217 0.757 6.89 0.000 1.06
Ecuación de regresión

grasas = 78.0 + 0.417 peso + 5.217 edad

Interpretación: El modelo explica un 70.56% de la variabilidad de la variable Grasas, según el


análisis de varianza podemos decir que el peso es una variable no significativa por ende
podemos recomendar realizar una selección de variable; si tomamos los mejores subconjuntos
obtenemos el siguiente cuadro.

R- R- Cp de
Var R- cuad. cuad. Mallow
s cuad. (ajust) (pred.) s S Peso edad
1 70.1 68.8 65.4 1.3 43.46 X
1
1 7.0 3.0 0.0 48.5 76.65 X
4
2 70.6 67.9 64.7 3.0 44.11 X X
1

Donde obtenemos el menor cp de mallows y a su vez un alto valor de Rcuadrado es cuando


quitamos la variable Peso.

También podría gustarte