distancia en
kilómetros
tiempo en (y)
persona minutos(x) x-y x2 y2
1 2 100 169
10.00 13.00 3.00
2 2 225 144
15.00 12.00 7.00
3 2 100 225
10.00 15.00 5.00
4 3 144 400
12.00 20.00 2.00
5 3 225 441
15.00 21.00 6.00
6 2 169 169
13.00 13.00 6.00
7 2 225 169
15.00 13.00 8.00
8 3 400 225
20.00 15.00 5.00
9 2 100 289
10.00 17.00 7.00
10 2 144 169
12.00 13.00 5.00
11 2 196 144
14.00 12.00 6.00
12 2 225 196
15.00 14.00 9.00
13 2 144 144
12.00 12.00 4.00
14 3 400 324
20.00 18.00 8.00
15 2 144 81
12.00 9.00 1.00
16 2 225 144
15.00 12.00 7.00
17 2 100 169
10.00 13.00 3.00
18 2 64 225
8.00 15.00 3.00
19 2 121 121
11.00 11.00 2.00
20 1 100 81
10.00 9.00 9.00
suma 3551 4
259.00 277.00 536.00 ,029.00
promedio 12.95 13.85 2 177.55 201.45
6.80
1. Contesta lo siguiente:
a. Realiza el diagrama de dispersión y describe el comportamiento de ambas
variables. ¿Qué clase de relación crees que existe entre estas dos variables?
Kms. Min.
X Y XY X2 Y2
c. ¿Existe evidencia que indique que a mayor distancia es mayor el tiempo en llegar?
Prueba la significancia de la recta de regresión con un nivel de significancia α =
0.01.
¿Es significativa esta regresión? Realiza todas las etapas de una prueba de hipótesis.
Ha: i 0 ( Aquì, por lo menos hay una variable “X” que està afectando a la variable “Y” )
Fcalculada: 52.7761
Fteorica -3.07
Conclusiòn: El resultado arroja un diferencia mayor para Fcalculada, en comparación con el de
Fteorica, se rechaza totalmente “Ho”, y la respuesta final dice que hay una variable que està
afectando el precio de la casa.
Total: 19 134048.2
Establecimiento de hipótesis
H0 : β1 = ... βk = 0 (Aquì las variable independientes no afectan a la variable Y)
Fcalculada = 31.316
Ŷ = b0 + b1X0
Ŷ = 35.3096+ 0.5636X0
Se calcula Sx:
1))=√(267948.95/19)=
Se calcula Sy:
cm peso
numero
x y
genero
1 55 48
2 65 50
3 59 53
4 60 55
5 62 58
6 65 61
7 67 64
8 69 67
9 71 70
10 73 74
11 72 63
12 74 66
13 76 69
14 78 72
15 80 75
16 82 79
17 84 83
18 86 86
19 87 91
20 88 95
3. Investiga acerca de 20 casas en venta en donde las variables son Y (metros de
construcción) y X (metros de terreno), y realiza lo que se te indica:
4. Contesta lo siguiente:
a. Realiza el diagrama de dispersión y describe el comportamiento de ambas
variables
Y (metros de X (metros
casas
construcción) de terreno),
xy x^2 y^2
1 6 4 10 16 36
2 8 3 11 9 64
3 7 6 13 36 49
4 8 5 13 25 64
5 5 4 9 16 25
6 9 5 14 25 81
7 7 6 13 36 49
8 6 7 13 49 36
9 5 5 10 25 25
10 9 6 15 36 81
11 5 3 8 9 25
12 7 4 11 16 49
13 5 6 11 36 25
14 8 4 12 16 64
15 9 5 14 25 81
16 6 7 13 49 36
17 6 5 11 25 36
18 7 7 14 49 49
19 8 5 13 25 64
20 9 9 18 81 81
b. ¿Qué clase de relación crees que existe entre estas dos variables?
demuestra que una variable depende de la otra para subir o bajar su valor.
Al ser mayor la hipótesis t calculada que la t teórica concluimos que variable x1 afecta el precio de
la casa.
Al ser calculada menor que t teorica se acepta Ho y concluimos que x2 no afecta el precio de las
casas.
e. Pronostica los metros de construcción cuando los metros de terreno son de 90, 100 y 150
metros.
y90= 97.52499494
y100= 105.0488448
y150= 142.6680943
metros de metros de
terreno X construccion Y
90 97.52499494
100 105.0488448
150 142.6680943
f. Calcula el coeficiente de correlación.
7. Utiliza Excel o cualquier otro paquete estadístico como Minitab para realizar lo siguiente:
a. Estima el modelo de regresión múltiple e interpreta los coeficientes de la ecuación
de regresión lineal múltiple.
Y= -602.56+9.14+5.93-77.81
La variable “x1” valora que cuando los mts. de terreno cambian el precio ampliará a 9.14
• La variable “x2” valora que cuando los metros de construcción cambian el precio de la casa
se elevará en 5.93.
La variable “x3” valora que cuando el número de recámaras el costo cambiará en -77.81.
Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas de una
prueba de hipótesis.
Hipótesis nula:
Hipótesis alternativa:
F=52.77
t= b1 – 0
S b1
se espera que los residuos sean aproximados a una distribución mas o menos normal, por lo
que alrededor de 68% de ellos estará dentro de +- $1,16200 y cero de 95% dentro de +-
2($1,162.00) = $2,324.00
Construye un intervalo de confianza para las pendientes de la población (β1, β2 y β3).
R2 = SSR
SS Total
Es decir que las variables independientes, x1, x2, x3 ayudan a explicar a la variable
independiente el 88% de las veces.
Calcula e interpreta R2 en el contexto del problema.
R2 = 1747.164539/13480 = 0.129611612
SSE
R2adj = 1 – n – (k +1)
SS total
N-1
86.62%
Determina el Factor de Inflación de Varianza (VIF) para cada variable explicativa en el modelo.
¿Existe alguna razón para sospechar que existe multicolinealidad?
VIF = 1
1 - R2
Analiza y resuelve los siguientes ejercicios, sin olvidar incluir los procedimientos utilizados que te
llevaron a la respuesta.
Concluye con una reflexión sobre la utilización de la regresión y correlación en la vida cotidiana.
¿Qué tipo de problemas pudieras resolver con los conocimientos adquiridos en este módulo?