Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Temperatura atmosfrica
promedio diaria
( F)
40
27
40
73
64
34
9
8
23
63
65
41
21
38
58
Cantidad de aislamiento
en la parte alta de la
(pulgadas)
3
3
10
6
6
6
6
10
10
3
10
6
3
3
10
Para el caso de nuestros datos con dos variables explicatorias, el modelo de regresin
lineal mltiple se expresa como:
Yi 0 1 X 1i 2 X 2i 3 X 3i ... p X pi
en la que:
0 la interseccin con el eje Y.
Al igual que en el caso de la regresin lineal simple, cuando se analizan los datos de la
muestra, los coeficientes de regresin de la muestra (b0 , b1 y b2) se utilizan como
estimaciones de los parmetros verdaderos (0 , 1 y 2). Por consiguiente, la ecuacin
de regresin para el modelo de regresin lineal mltiple con dos variables explicatorias
sera:
Yi b0 b1 X1i b2 X 2i
Utilizando el mtodo de mnimos cuadrados, los valores de los tres coeficientes
de regresin de la muestra pueden obtenerse con un adecuado paquete de computacin.
(Vase Fig. 1). En dicha Fig. 1, observamos que los valores calculados de los
coeficientes de regresin para el problema que se est tratando son:
b0 =562.151
b1 = -5.43658
b2= -20.0123
Yi 278.9798
En consecuencia estimaramos que un promedio de 278.98 galones de petrleo para calefaccin
se utilizaran en casas con 6 pulgadas de aislamiento en la parte ms alta de la casa, cuando la temperatura
promedio fuera de 30F.
rY2.12
SSR
SST
en la que
n
i 1
i 1
i 1
SST Yi 2 nY 2
i 1
rY2.12
SSR 228,015
0.9656
SST 236,135
n 1
2
raju
1 (1 rY2.1.2...P )
n P 1
(15 1)
14
2
raju
1 (1 0.9656)
1 (1 0.9656)
1 0.04 0.96
(
15
1
)
12
En consecuencia, 96% de la variacin en el uso de petrleo para calefaccin domstica puede ser
explicada por nuestro modelo de regresin mltiple: ajustado para el nmero de variables de prediccin y
el tamao de muestra.
Y
(Petrleo para calefaccin)
Y (petrleo para
Calefaccin)
X1 (temperatura)
X2 (aislamiento)
rYY = 1.0
rY1 = -0.86974
rY2 = -0.46508
X1
X2
(Temperatura) (Aislamiento)
Residuos
Residuos
Residuos
Residuos
estandarizados
estandarizados
estandarizados
estandarizados
contra
contra
contra
contra
Yi .
X1i.
X2i.
el tiempo.
La primera grfica de residuos sirve para examinar el patrn de residuos para los
valores predichos de Y. Si los residuos estandarizados parecen variar para diferentes
niveles del valor predicho de Y, esto nos proporciona evidencia de un posible efecto
curvilneo en al menos una variable explicativa y/o de la necesidad de transformar la
variable dependiente. La segunda y tercera grficas de residuos implican a las
variables explicativas. La aparicin de patrones
en la grfica de los residuos
estandarizados contra una variable explicativa puede ser una indicacin de la
existencia de un efecto curvilneo y, por consiguiente, nos llevara a la posible
transformacin de dicha variable independiente. El cuarto tipo de grfica se utiliza
para investigar patrones en los residuos cuando los datos han sido recolectados en
orden cronolgico. Asociada con la grfica de los residuos en funcin del tiempo, la
estadstica de Durbin-Watson puede calcularse y determinarse la existencia de
correlacin positiva entre los residuos.
Las grficas de residuos se obtienen como parte de los resultados de casi todos
los paquetes estadsticos de computacin. En la siguiente Fig. se presentan las
grficas de residuos obtenidas con el paquete MINITAB para el problema del
consumo de petrleo para calefaccin. En esta figura podemos observar que parece
haber un patrn muy pequeo o no haberlo en la relacin entre los residuos
estandarizados y cualquiera de los valores predichos de Y, X1 (la temperatura) o X2
(el aislamiento en el tico). As pues, podemos llegar a la conclusin de que el
modelo de regresin lineal mltiple es apropiado para predecir el consumo de
petrleo con propsitos de calefaccin.
FIG.: Grficas de residuos para el modelo de consumo de petrleo para calefaccin, obtenidas con el
paquete MINITAB
ResiduoSt
-1
-2
3
10
ResiduoSt
ResiduoSt
Aislam
-1
-1
-2
-2
5
15
25
35
Temp
45
55
65
75
100
200
Estimado
300
400
Ahora que hemos utilizado el anlisis de residuos para asegurarnos de que el modelo de
regresin mltiple es apropiado, podemos determinar si existe una relacin significativa
entre la variable dependiente y el conjunto de variables explicativas. Puesto que se tiene
ms de una variable independiente, las hiptesis nula y alternativa pueden establecerse
de la manera siguiente:
H 0 : 1 2 0
Regresin
G.L.
P
Cuadrado medio
(Varianza)
SSR
MSR
p
F
Error
n p - 1
MSE
SSE
n p 1
MSR
MSE
F FU ( p , n p 1) ;
en cualquier otro
Coef
345.38
-20.35
StDev
74.69
10.74
R-Sq = 21.6%
T
4.62
-1.89
P
0.000
0.081
R-Sq(adj) = 15.6%
Anlisis de Varianza
Source
Regression
Residual Error
Total
DF
1
13
14
SS
51076
185059
236135
MS
51076
14235
F
3.59
P
0.081
Coef
436.44
-5.4622
S = 66.51
StDev
38.64
0.8596
R-Sq = 75.6%
T
11.30
-6.35
P
0.000
0.000
R-Sq(adj) = 73.8%
Anlisis de Varianza
Source
Regression
Residual Error
Total
DF
1
13
14
SS
178624
57511
236135
MS
178624
4424
F
40.38
P
0.000
Fuente
Regresin
X 2
X1 / X 2
Error
Total
G.L.
Suma de cuadrados
2
1
1
12
228,015
51,076
176
,
939
8,120
14
236,135
Cuadrado
medio
(Varianza)
114,007.5
51,076
176,939
MSE=676.67
261.48
176,939
F
261.48
676.67
Puesto que se tienen, respectivamente, uno y doce grados de libertad, si se selecciona un nivel de
significacin de 0.05, podemos observar que el valor crtico es de 4.75. Como el valor de F calculado es
mayor que este valor de F crtico (261.48 > 4.75), nuestra decisin sera rechazar H 0 y llegar a la
conclusin de que la adicin de la variable X1 (temperatura atmosfrica diaria promedio) mejora
significativamente el modelo de regresin mltiple que ya tiene incluida la variable X 2 (aislamiento en el
tico).
TABLA: Tabla de Anlisis de Varianza que divide la suma de cuadrados de regresin en componentes
para determinar la contribucin de la variable X 2
Fuente
Regresin
X1
X
/
X
2 1
Error
Total
G.L.
Suma de cuadrados
2
1
1
12
228,015
178,624
49
,
391
8,120
14
236,135
Cuadrado
medio
(Varianza)
114,007.5
178,624
49,391
MSE=676.67
72.99
49,391
72.99
676.67
Puesto que se tienen uno y doce grados de libertad, respectivamente, si se elige un nivel
de significacin de 0.05, observamos que el valor crtico de F es 4.75. Ya que el valor
calculado de F es mayor que este valor crtico (72.99 > 4.75), nuestra decisin es
rechazar la hiptesis nula y llegar a la conclusin de que la adicin de la variable X2
(aislamiento en el tico) mejora significativamente el modelo de regresin mltiple que
ya contiene a la variable X1 (temperatura atmosfrica diaria promedio).
F
As pues, al probar la contribucin de cada variable explicativa despus de que la otra ya ha sido
incluida en el modelo, determinamos que cada una de las dos variables independientes contribuye
mejorando significativamente el modelo. Por consiguiente, nuestro modelo de regresin mltiple debera
incluir tanto la temperatura atmosfrica diaria promedio, X1, como la cantidad de aislamiento en el tico,
X2, en la prediccin del consumo de petrleo para calefaccin.
bk
t
S bk
Donde:
bk
: coeficiente de regresin.
S bk
P
H0 : 2 0
H1 : 2 0
De la ecuacin anterior, tenemos:
b2
S bk
b2 20.012 y
de manera que:
Sb2 2.343
20.012
8.5412
2.343
bk tn P 1Sbk
Por ejemplo, si deseramos obtener una estimacin de intervalo de confianza de
95% de la pendiente de poblacin, 1 (esto es, el efecto de la temperatura diaria
promedio, X1, sobre el consumo de petrleo para calefaccin, Y, dejando constante el
efecto del aislamiento en el tico, X2), tendramos, de la ecuacin anterior:
b1 t12Sb1
Como el valor crtico de t al nivel de confianza de 95%, con 12 grados de libertad, es
2.1788, tenemos:
5.4366 (2.1788)(0.3362)
5.4366 0.732512
6.169112 1 4.704088
SSR( X 1 / X 2 )
SST SSR( X 1 yX 2 ) SSR( X 1 / X 2 )
rY22.1
SSR( X 2 / X 1 )
SST SSR( X 1 yX 2 ) SSR( X 2 / X 1 )
y tambin
en la que:
SSR(X1 / X2) = suma de cuadrados de la contribucin de la variable X1 al modelo de
regresin dado que la variable X2 ha sido incluida en el modelo.
SST = suma total de cuadrados para Y.
SSR(X1 y X2) = suma de cuadrados de regresin cuando las variables X1 y X2 estn
incluidas en el modelo de regresin mltiple.
SSR(X2 / X1) = suma de cuadrados de la contribucin de la variable X 2 al modelo de regresin
que la variable X1 ha sido incluida en el modelo.
dado
Mientras que en un modelo de regresin mltiple que contiene varias (P) variables
explicativas, tenemos:
Para nuestro problema sobre el consumo de petrleo para calefaccin podemos calcular
rY21.2
176,939
0.9561
236,135 228,015 176,939
rY22.1
49,391
0.8588
236,135 228,015 49,391
(rY21.2 ) puede interpretarse como que, para una cantidad fija (constante) de aislamiento en el tico,
95.61% de la variacin en el consumo de petrleo para calefaccin durante enero puede explicarse por la
variacin en la temperatura atmosfrica diaria promedio en dicho mes. Adems, el coeficiente de
determinacin parcial de la variable Y con X2, mientras se mantiene constante X1
(rY22.1 ) puede
interpretarse como que, para una temperatura atmosfrica diaria promedio dada (constante), 85.88% de la
variacin en el consumo de petrleo para calefaccin durante enero puede ser explicada por la variacin
en la cantidad de aislamiento.
Yi 0 1 X 1i 11 X 12i i
en la que:
0 = interseccin Y.
1 = efecto lineal en Y.
1 1 = efecto curvilneo en Y.
i = error aleatorio en Y para la observacin i.
Este modelo de regresin es parecido al modelo de regresin mltiple con dos
variables explicativas, excepto en que la segunda variable explicativa, en este caso, es
justamente el cuadrado de la primera variable.
Al igual que en el caso de la regresin lineal mltiple, cuando se analizan datos
de muestra, los coeficientes de regresin de muestra (b0 , b1 y b11 ) se utilizan como
estimaciones de los parmetros de poblacin ( 0 , 1 , 11) . En consecuencia, la ecuacin
de regresin para el modelo polinomial curvilneo con una variable explicativa (X 1) y
una variable dependiente (Y) es:
Yi b0 b1 X 1i b11 X 12i
(1)
(2)
TABLA: Ventas y precios de paquetes de rasuradoras desechables para una muestra de 15 tiendas
Ventas
142
151
163
168
176
91
100
107
Precio (ctvos.)
79
79
79
79
79
99
99
99
Ventas
115
126
77
86
95
100
106
Precio (ctvos.)
99
99
119
119
119
119
119
Ventas(Y)
180
130
80
80
90
100
110
120
Precio(X1)
Un examen ms detallado de ste nos indica que la disminucin de las ventas se nivela con un
aumento de los precios. Por consiguiente, parece que podra ser ms apropiado utilizar un modelo
curvilneo para estimar las ventas basndose en el precio, en lugar de usar un modelo lineal.
Anlisis de Regresin
La ecuacin de regresin es:
Ventas(Y) = 108 - 1.68 (X1i - media) + 0.0465 (X1i - media)sq
Predictor
Constant
(X1i - m
(X1i - m
Coef
107.800
-1.6800
0.04650
S = 12.87
StDev
5.756
0.2035
0.01762
R-Sq = 86.2%
T
18.73
-8.26
2.64
P
0.000
0.000
0.022
R-Sq(adj) = 83.9%
Anlisis de Varianza
Source
Regression
Residual Error
Total
Source
(X1i - m
(X1i - m
DF
1
1
DF
2
12
14
SS
12442.8
1987.6
14430.4
MS
6221.4
165.6
F
37.56
Seq SS
11289.6
1153.2
b0" 107.8
b1" 1.68
b11 0.0465
P
0.000
H 0 : 1 11 0
H1 : 1 y/o 11 0
La hiptesis nula puede ser probada utilizando una prueba F. Utilizando los
resultados obtenidos para nuestro problema mediante el paquete MINITAB, se tiene:
MSR
6,221.4
37.57
MSE
165.6
Si se selecciona un nivel de segnificacin de 0.05, tenemos que, para 2 y 12
grados de libertad, el valor crtico de la distribucin F es de 3.89. Por lo tanto, dado que
F 37.57 FU ( 2,12) 3.89 , podemos rechazar la hiptesis nula y llegar a la conclusin
de que existe una relacin curvilnea significativa entre las ventas y el precio de las
rasuradoras.
F
rY2.12
SSR 12,442.8
0.862
SST 14,430.4
(15 1)
n 1
2
2
r 1 (1 rY .1.2...P )
1 (1 rY .12 )
1 (1 0.862)
n P 1
(15 2 1)
1 0.161 0.839
2
aju
b11
0.0465
2.64
Sb1
0.01762
Si se selecciona un nivel de significacin de 0.05, encontramos que con doce grados de libertad,
los valores crticos son 2.1788 y +2.1788. Puesto que t = 2.64 > t12 =2.1788, nuestra decisin sera
rechazar H0 y llegar a la conclusin de que el modelo curvilneo es significativamente mejor que el
modelo lineal en la representacin de la relacin entre las ventas y los precios.
b1"
1.68
t
8.26
Sb "
0.2035
1
Las hiptesis nula y alternativa para probar la contribucin del efecto lineal al modelo
de regresin son:
H 0 : 1' 0 (La inclusin del efecto lineal no mejora el modelo de efecto curvilneo.)
H1 : 1' 0 (La inclusin del efecto lineal mejora el modelo de efecto curvilneo.)
Si se selecciona un nivel de significacin de 0.05, encontramos que con doce
grados de libertad, los valores crticos son 2.1788 y +2.1788. Puesto que t = -8.26 < t12
= -2.1788, nuestra decisin sera rechazar H0 y llegar a la conclusin de que el modelo
curvilneo que incluye al efecto lineal es significativamente mejor que el modelo que
slo incluye al efecto curvilneo.
Yi 0 1 X1i 2 X 2i i
(1)
0 interseccin con Y.
1 pendiente del ingreso con la antigedad en la planta de trabajo,
manteniendo
constante si el individuo participa o no en decisiones
presupuestales.
2 efecto de aumento de la participacin individual en decisiones
presupuestales, manteniendo constante la antigedad en la planta de trabajo.
i error aleatorio en Y correspondiente al empleado i.
Usando la muestra de 57 empleados cuya ocupacin est clasificada como tcnica de ventas, se
ajust el modelo establecido en la ecuacin (1). Los valores de los coeficientes de regresin de
muestra resultantes (b0 , b1 y b2) , de los errores estndar y de t se resumen en la siguiente tabla:
Nombre de la variable
Constante
Aos
Participacin
en
decisiones presupuestales
Coeficiente de
regresin
Error estndar
13.936
0.7314
3.850
0.1759
3.62
4.16
8.027
3.341
2.40
Observe lo siguiente:
1. Manteniendo constante el efecto de si el individuo participa en decisiones
presupuestales, se estima que cada ao adicional de antigedad en la planta
de trabajo se obtiene en promedio $731.40 en el ingreso del empleado.
2. b2 mide el efecto sobre el ingreso de haber participado en decisiones presupuestales (X 2 = 1)
en comparacin con no haber participado en tales decisiones (X 2 = 0). Por lo tanto,
manteniendo la antigedad en la planta de trabajo constante, estimamos que un empleado
que participa en decisiones presupuestales tendr, en promedio, un ingreso de $8,027.00 por
encima de alguien que no participa en dichas decisiones.
Utilizando los resultados de la tabla anterior, el modelo para estos datos puede
establecerse como: