Documentos de Académico
Documentos de Profesional
Documentos de Cultura
4a Edicin
Captulo 12
Regresin Lineal Simple
Chap 12-1
Objetivos de Aprendizaje
En este captulo, usted aprender:
Como usar el anlisis de regresin para predecir los
valores de una variable de respuesta con base en una
variable independiente (o explicativa)
El significado de los coeficientes de regresin b0 y b1
Como evaluar los supuestos de regresin y saber qu
hacer cuando alguno de los supuestos es violado
Probar hiptesis sobre la pendiente y el coeficiente de
correlacin
Estimar el valor medio de respuesta y predecir los
valores individuales de respuesta
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
Chap 12-2
Chap 12-3
Introduccin al
Anlisis de Regresin
El anlisis de Regresin se usa para:
Predecir el valor de una variable dependiente o de
respuesta, basado en el valor de al menos una
variable independiente o explicativa
Explicar el impacto que tienen los cambios de una
variable explicativa o independiente sobre la variable
de respuesta o dependiente
Chap 12-4
Chap 12-5
Relacin curvilnea
X
Y
X
Y
X
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
X
Chap 12-6
Relacin dbil
X
Y
X
Y
X
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
X
Chap 12-7
X
Y
X
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
Chap 12-8
Variable de
Respuesta
Coeficiente
poblacional
de la
pendiente
Intercepto
poblacional
con Y
Variable
explicativa
Trmino
de error
aleatorio
Yi 0 1Xi i
Componentes lineales
Componente de error
aleatorio
Chap 12-9
Yi 0 1Xi i
Valor observado
de Y para Xi
i
Valor
pronosticado
de Y para Xi
Pendiente = 1
Error aleatorio para
este valor de Xi
Intercepto =
0
Xi
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
X
Chap 12-10
Estimacin
del intercepto
de la
regresin
Estimacin de la
pendiente de
regresin
Yi b0 b1Xi
Valor de X
para la
observacin i
Chap 12-11
Chap 12-12
Clculo de la ecuacin de
Mnimos Cuadrados
Los coeficientes b0 y b1 , y otros
resultados en este captulo, pueden ser
hallados usando Excel u otro software
estadstico
Las frmulas se presentan en el texto gua
para consulta de los interesados
Chap 12-13
Chap 12-14
Chap 12-15
245
1400
312
1600
279
1700
308
1875
199
1100
219
1550
405
2350
324
2450
319
1425
255
1700
Chap 12-16
Grfico de Dispersin
500
1000
1500
2000
2500
3000
ft
Chap 12-17
Chap 12-18
Salidas de Excel
Regression Statistics
Multiple R
0.76211
R Square
0.58082
Adjusted R Square
0.52842
Standard Error
41.33032
Observations
10
ANOVA
df
SS
MS
F
11.0848
Regression
18934.9348
18934.9348
Residual
13665.5652
1708.1957
Total
32600.5000
Coefficients
Intercept
Square Feet
Standard Error
t Stat
P-value
Significance F
0.01039
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
Chap 12-19
450
Intercepto
= 98.248
400
350
300
Pendiente
= 0.10977
250
200
150
100
50
0
0
500
1000
1500
2000
2500
3000
ft
Chap 12-20
Chap 12-21
Interpretacin de la pendiente, b1
precio casa 98.24833 0.10977 (ft)
Chap 12-22
Predicciones mediante la
ecuacin de regresin
El precio pronosticado para el valor de una
casa con un tamao de 2000 ft:
Chap 12-23
450
400
350
300
250
200
No es aconsejable extrapolar
los resultados por fuera de los
valores observados de las Xs
150
100
50
0
0
500
1000
1500
2000
2500
3000
ft
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
Chap 12-24
SST
SSR
Suma de
cuadrados totales
Suma de cuadrados
de la regresin
SST ( Yi Y)2
Y)2
SSR ( Y
i
SSE
Suma de cuadrados
del error
)2
SSE ( Yi Y
i
donde:
Chap 12-25
Chap 12-26
Medidas de Variacin
(continuacin)
Y
Yi
SSE = (Yi - Yi )2
_
Y
Xi
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
_
Y
X
Chap 12-27
Coeficiente de Determinacin, r2
El coeficiente de determinacin es la porcin
del total de la variacin en la variable de
respuesta que es explicada por la variacin en
la variable independiente
Este coeficiente tambin es llamado:
r cuadrado y se denota por r2
SSR suma de cuadrados de la regresin
r
SST
suma de cuadrados totales
2
Note que:
0 r 1
Chap 12-28
Ejemplos de valores
aproximados de r2
Y
r2 = 1
r2 = 1
El 100% de la variacin en Y
es explicada por la variacin
en X
r2
=1
Chap 12-29
Ejemplos de valores
aproximados de r2
Y
0 < r2 < 1
X
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
Chap 12-30
Ejemplos de valores
aproximados de r2
r2 = 0
r2 = 0
Los valores de Y no
dependen de X. (La
variacin de Y NO es
explicada por la variacin
de X)
Chap 12-31
Salidas de Excel
SSR 18934.9348
r
0.58082
SST 32600.5000
2
Regression Statistics
Multiple R
0.76211
R Square
0.58082
Adjusted R Square
0.52842
Standard Error
41.33032
Observations
10
ANOVA
df
SS
MS
F
11.0848
Regression
18934.9348
18934.9348
Residual
13665.5652
1708.1957
Total
32600.5000
Coefficients
Intercept
Square Feet
Standard Error
t Stat
P-value
Significance F
0.01039
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
Chap 12-32
S YX
SSE
n2
(
Y
Y
)
i i
i1
n2
Donde
Chap 12-33
Salida de Excel
Regression Statistics
Multiple R
0.76211
R Square
0.58082
Adjusted R Square
0.52842
Standard Error
SYX 41.33032
41.33032
Observations
10
ANOVA
df
SS
MS
F
11.0848
Regression
18934.9348
18934.9348
Residual
13665.5652
1708.1957
Total
32600.5000
Coefficients
Intercept
Square Feet
Standard Error
t Stat
P-value
Significance F
0.01039
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
Chap 12-34
sYX pequeo
sYX grande
Chap 12-35
Supuestos de la regresin
Linealidad
La relacin fundamental entre X y Y debe ser lineal
Chap 12-36
ei Yi Y
i
Chap 12-37
No lineal
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
residuales
residuales
Lineal
Chap 12-38
Anlisis grfico de
Independencia de los errores
residuales
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
Independencia
X
residuales
residuales
No hay independencia
Chap 12-39
0
-3
-2
-1
Residuales
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
Chap 12-40
x
No hay homogeneidad
residuales
residuales
Hay homogeneidad
Chap 12-41
Residuales
251.92316
-6.923162
80
273.87671
38.12329
60
284.85348
-5.853484
40
304.06284
3.937162
218.99284
-19.99284
268.38832
-49.38832
356.20251
48.79749
-40
367.17929
-43.17929
-60
254.6674
64.33264
10
284.85348
-29.85348
Residuales
Precio casa
pronosticado
20
0
-20 0
1000
2000
3000
ft
Chap 12-42
Medicin de la Autocorrelacin:
El estadstico Durbin-Watson
Se utiliza cuando los datos son
recolectados en el tiempo para detectar si
la autocorrelacin est presente
Hay Autocorrelacin si los residuales para
un perodo de tiempo estn relacionados
con los residuales de otro perodo
Chap 12-43
Autocorrelacin
La Autocorrelacin es la correlacin de los
errores (residuales) en el tiempo
Aqu, los residuales
muestran un patrn de
compartamiento cclico,
no aleatorio. Patrones
cclicos son signo de
una autocorrelacin
positiva
Residuales
15
10
5
0
-5 0
-10
-15
Tiempo (t)
Chap 12-44
El estadstico de Durbin-Watson
El estadstico de Durbin-Watson se usa para probar si
existe autocorrelacin en los errores
H0: los errores no estan correlacionados
H1: Hay correlacin positiva en los errores
El rango posible de D es 0 D 4
n
2
(
e
e
)
i i1
i 2
2
e
i
i 1
Prueba inconclusa
dL
No rechace H0
dU
2
Chap 12-46
Hay autocorrelacin?
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
Chap 12-47
3296.18
Suma de cuadrados
Residuales
3279.98
Estadstico
Durbin-Watson
1.00494
n
(e e
i
i 2
ei
i1
)2
3296.18
1.00494
3279.98
i1
Chap 12-48
Inconclusa
dL=1.29
No rechazo H0
dU=1.45
2
Chap 12-49
S YX
Sb1
SSX
S YX
2
(X
X
)
i
donde:
Sb1
S YX
SSE
= Error estndar de la estimacin del modelo
n2
Chap 12-50
Salidas de Excel
Regression Statistics
Multiple R
0.76211
R Square
0.58082
Adjusted R Square
0.52842
Standard Error
Sb1 0.03297
41.33032
Observations
10
ANOVA
df
SS
MS
F
11.0848
Regression
18934.9348
18934.9348
Residual
13665.5652
1708.1957
Total
32600.5000
Coefficients
Intercept
Square Feet
Standard Error
t Stat
P-value
Significance F
0.01039
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
Chap 12-51
Sb1 pequo
Sb1 grande
Chap 12-52
Estadstico de Prueba
b1 1
t
Sb1
g.l. n 2
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
donde:
b1 = coeficiente de la pendiente
de regresin
1 = Valor hipottico de la
pendiente
Sb = error estndar de la
1
pendiente
Chap 12-53
ft
(x)
245
1400
312
1600
279
1700
308
1875
199
1100
219
1550
405
2350
324
2450
319
1425
255
1700
Chap 12-54
b1
Standard Error
Sb1
t Stat
P-value
98.24833
58.03348
1.69296
0.12892
0.10977
0.03297
3.32938
0.01039
b1 1 0.10977 0
t
3.32938
t
Sb1
0.03297
Chap 12-55
b1
Standard Error
Sb1
t Stat
P-value
98.24833
58.03348
1.69296
0.12892
0.10977
0.03297
3.32938
0.01039
g.l. = 10-2 = 8
a/2=.025
Rechace H0
a/2=.025
No rechace H0
-t/2
-2.3060
Rechace H
0
t/2
2.3060 3.329
Decisin:
Rechace H0
Conclusin:
Hay suficiente evidencia de
que el tamao de las casas
afecta su precio de venta
Chap 12-56
valor-p = 0.01039
H0: 1 = 0
H1: 1 0
Valor-p
Salidas de excel:
Coefficients
Intercept
Square Feet
Standard Error
t Stat
P-value
98.24833
58.03348
1.69296
0.12892
0.10977
0.03297
3.32938
0.01039
MSR
SSR
k
MSE
SSE
n k 1
Chap 12-58
Salida de excel
Regression Statistics
Multiple R
0.76211
R Square
0.58082
Adjusted R Square
0.52842
Standard Error
MSR 18934.9348
F
11.0848
MSE
1708.1957
41.33032
Observations
10
Con 1 y 8 grados de
libertad
Valor-p para
la prueba F
ANOVA
df
SS
MS
F
11.0848
Regression
18934.9348
18934.9348
Residual
13665.5652
1708.1957
Total
32600.5000
Coefficients
Intercept
Square Feet
Standard Error
t Stat
P-value
Significance F
0.01039
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
Chap 12-59
Estadstico de prueba:
H0: 1 = 0
H1: 1 0
a = .05
gl1= 1
gl2 = 8
MSR
F
11.08
MSE
Decisin:
Rechace H0 a un nivel
a = 0.05
Valor
crtico:
Fa = 5.32
Conclusin:
a = .05
No rechace H0
RechaceH0
F.05 = 5.32
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
b1 t n2Sb1
g.l. = n - 2
Coefficients
Standard Error
t Stat
P-value
98.24833
0.10977
Lower 95%
Upper 95%
58.03348
1.69296
0.12892
-35.57720
232.07386
0.03297
3.32938
0.01039
0.03374
0.18580
Chap 12-61
Intercept
Square Feet
Coefficients
Standard Error
t Stat
P-value
98.24833
0.10977
Lower 95%
Upper 95%
58.03348
1.69296
0.12892
-35.57720
232.07386
0.03297
3.32938
0.01039
0.03374
0.18580
Chap 12-62
Estadstico de prueba:
r -
1 r
n2
donde
r r 2 si b1 0
r r 2 si b1 0
Chap 12-63
a =.05 , gl = 10 - 2 = 8
r
1 r 2
n2
.762 0
1 .7622
10 2
3.329
Chap 12-64
r
1 r 2
n2
.762 0
1 .7622
10 2
3.329
Conclusin:
Hay evidencia de
una asociacin
lineal a un nivel
de significancia
del 5%
g.l. = 10-2 = 8
a/2=.025
Rechace H0
-t/2
-2.3060
a/2=.025
No rechace H0
Decisin:
Rechace H0
Rechace H0
t/2
2.3060
3.329
Chap 12-65
Y = b0+b1Xi
Intervalo de
prediccin para un
valor individual Y,
dado un Xi
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
Xi
X
Chap 12-66
1 (Xi X)2 1
(Xi X)2
hi
n
SSX
n (Xi X)2
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
Chap 12-67
Chap 12-68
t S
Y
n- 2 YX
1
(Xi X)2
317.85 37.12
2
n (Xi X)
Chap 12-69
t S
Y
n - 2 YX
1
(Xi X) 2
1
317.85 102.28
2
n (Xi X)
Chap 12-70
Active el comando de
intervalos de confianza y prediccin para X=
en la caja de dilogo correspondiente y entre el
valor de X y el nivel de confianza deseado
Chap 12-71
Valores de entrada
Y
Intervalo de confianza para Y|X=Xi
Intervalo de prediccin para YX=Xi
Business Statistics, A First Course (4e) 2006 Prentice-Hall, Inc.
Chap 12-72
Dificultades en el anlisis de
regresin
Incumplimiento de alguno de los supuestos del modelo
de regresin
Desconocimiento de cmo evaluar los supuestos
Desconocimiento de las alternativas a los modelos de
regresin por mnimos cuadrados cuando alguno de los
supuestos es violado
Utilizar un modelo de regresin sin el conocimiento del
tema
Utilizar el modelo encontrado para pronosticar valores
por fuera del rango de los valores observados
Chap 12-73
Chap 12-74
Chap 12-75
Chap 12-76
Chap 12-77