Documentos de Académico
Documentos de Profesional
Documentos de Cultura
: error aleatorio
MG. Fátima Medina Merino 3
• El error es una parte crítica del modelo de regresión.
• Se deben cumplir cuatro condiciones con respecto a la
distribución de .
– La distribución de probabilidad de es normal.
– La media de es cero: E() = 0.
– La desvíación estándar de es .( )
– Cov (i, j) = 0 (son independientes). Var ( i ) 2 2
• Residuo:
ei yi yˆ i yi ˆ0 ˆ1 X 1 ... ˆ p X p
n
• Minimizar: SSE ei2
i 1
MG. Fátima Medina Merino 6
La diferencia entre el valor observado y el valor
estimado correspondiente es el residuo
ei yi yˆ i
Los n residuales se pueden escribir en notación
vectorial
e y yˆ
Otras formas de escribir el vector de residuales
e y x̂
MG. Fátima Medina Merino 7
• Una gran empresa de bienes raíces desea estudiar en qué medida el
costo de calefacción de las casas pequeñas que tienen listas para su
venta, está relacionada, con la temperatura exterior mínima, pulgadas de
aislante utilizados en las paredes, número de ventanas y la antigüedad
del calefactor. Para esto toma una muestra de 20 de estas casas.
• A continuación se presentan los datos recolectados
independientes
ˆ1 4,5719
Al aumentar 1 grado a la temperatura, cuando las pulgadas de aislante,
número de ventanas y la antigüedad del calefactor permanecen
constantes, el costo de calefacción disminuye en 4,5719 dólares.
ˆ2 14,906
Al aumentar 1 pulgada de aislante, cuando la temperatura exterior
mínima, el número de ventanas y la antigüedad del calefactor
permanecen constantes, el costo de calefacción disminuye en 14,906
dólares.
MG. Fátima Medina Merino 17
Yˆ 424,74 4,5719 X 1 14,906 X 2 0,244 X 3 6,126 X 4
Y: Costo de calefacción
X1 : Temperatura exterior mínima
X2: Pulgadas de aislante
X3 : Número de ventanas
ˆ3 0,244
X4: Antigüedad del calefactor
Al aumentar 1 ventana, cuando la temperatura exterior
mínima, las pulgadas de aislante, y la antigüedad del
calefactor permanecen constantes, el costo de calefacción
aumenta en 0,244 dólares.
ˆ4 6,126
Al aumentar en 1 mes la antigüedad del calefactor, cuando la
temperatura exterior mínima, las pulgadas de aislante, el
número de ventanas y la antigüedad del calefactor
permanecen constantes, el costo de calefacción aumenta en
MG. Fátima Medina Merino 18
6,126 dólares.
2
SCE
CME
nk
La varianza del error se estima a partir de :
ˆ S CME MSE
2 2
e
MG. Fátima Medina Merino 19
Estime la varianza del error, para el ajuste del modelo de regresión
múltiple a los datos del costo de calefacción de las casas
Solución
Con los resultado del análisis de varianza
del MINITAB
1.Hipótesis
H o : 1 2 ... p (El
0 Modelo no es adecuado)
SCR k 1 CMR
Fc
SCE n k CME
Fc F( k 1,n k ;1 )
Observe que:
Cuadrados Medios = (Suma de cuadrados) / (grados de libertad)
SCT=SCE+SCR
K = Número de parámetros a estimar
SCT: Suma de cuadrados debido al total
SCR: Suma de cuadrados debido a la regresión
SCE : Suma de cuadrados
MG.residual
Fátima Medina Merino 26
Utilice los datos del ejemplo anterior y
pruebe la hipótesis global de la adecuación
del modelo ( o prueba de la significación
del modelo), use un nivel de significancia
del 0,05.
(El Modelo es
adecuado )
H o 1 2 ... p 0
H1 j 0 al menos para j
tc t1 / 2,n k
1.Hipótesis
H o : 0 0 ( 0 no es significativo en el MRLM)
H1 : 0 0 ( 0 es significativo en el MRLM)
2. El estadístico de prueba es:
ˆ0 424,74
tc 5,36
S ˆ 0
79,23
1.Hipótesis
H o : 1 0 ( 1 no es significativo en el MRLM)
H1 : 1 0 ( 1 es significativo en el MRLM)
2. El estadístico de prueba es
ˆ1 4,5719
tc 5,53
S ˆ1 0,8272
MG. Fátima Medina Merino 39
ˆ1 4,5719
tc 5,53
S ˆ1 0,8272
1.Hipótesis
Ho : 2 0 ( 2 no es significativo en el MRLM)
H1 : 2 0 ( 2 es significativo en el MRLM)
2. El estadístico de prueba es:
ˆ2 14,906
tc 2,90
S ˆ2 5,140
1.Hipótesis
H o : 3 0 ( 3 no es significativo en el MRLM)
H1 : 3 0 ( 3 es significativo en el MRLM)
2. El estadístico de prueba es
ˆ3 0,244
tc 0,05
S ˆ3 4,953
Como
t c 0,05 t (15; 0.975) 2,1314
Aceptamos Ho y concluimos que 3
No es significativo (importante) y no debo
considerarlo en elMG.MRLM estimado.
Fátima Medina Merino 48
OTRA FORMA DE TOMAR UNA DECISIÓN ES
1.Hipótesis
Ho : 4 0 ( 4 no es significativo en el MRLM)
H1 : 4 0 ( 4 es significativo en el MRLM)
2. El estadístico de prueba es:
ˆ4 6,126
tc 1,47
S ˆ4 4,175
MG. Fátima Medina Merino 50
ˆ4 6,126
tc 1,47
S ˆ4 4,175
Como
t c 1,47 t(15; 0.975) 2,1314
Aceptamos Ho y concluimos que 4
No es significativo (importante) y no debo
considerarlo en elMG.MRLM estimado.
Fátima Medina Merino 52
OTRA FORMA DE TOMAR UNA DECISIÓN ES
SCR
SCR
RR
22
SCT
SCT
SCR : Suma de cuadrados debido a la regresión
SCT : Suma de cuadrados debido al total
MG. Fátima Medina Merino 56
Este valor sirve para medir la fuerza de la relación
lineal entre las variables independientes y la
variable dependiente Y.
SCR
SCR
rryy..1212......pp
SCT
SCT
SCR : Suma de cuadrados debido a la regresión
SCT : Suma de cuadrados debido al total
MG. Fátima Medina Merino 57
Utilice los datos del ejemplo y calcule el
coeficiente de determinación y el coeficiente de
correlación múltiple.
SCR 165195
SCR 165195
R
R 22
00,,776
776
SCT
SCT 212916
212916
MG. Fátima Medina Merino 59
00,,776
22
R
R 776
rryy.12
.12 00,,776 00,,88
776 88