Está en la página 1de 23

PRUEBA DE FALTA DE AJUSTE

(Lack-of-fit Test)

Fortino Vela Pen


fvela@correo.xoc.uam.mx
Octubre, 2011

F. VELA

Introduccin
 Un supuesto bsico del modelo es la existencia

de una relacin lineal entre


dependiente y los regresores.

la

variable

 Dos formas de verificar esta suposicin son:


ex-ante 1.

Mediante la elaboracin del diagrama de


dispersin;

ex-post 2.

Graficar a los residuales (estandarizados)


vs el valor de la variable de respuesta
ajustada, as como vs los predictores.

F. VELA

Prueba de falta de ajuste


 Esta diseada para evaluar si una relacin

curvilineal podra ajustar mejor a los datos


que un modelo lineal.
 Para ello la SCE se descompone en dos
partes:
1.
2.

El componente de error puro; y


El componente de falta de ajuste.

 Estos dos componentes son utilizados para

construir un estadstico de prueba F particular


con el fin de contrastar la hiptesis siguiente:

F. VELA

Ho: la relacin es lineal

vs H1: la relacin no es lineal

 La prueba requiere observaciones repetidas

en al menos uno de los niveles de X.


 Las

observaciones de X e Y son
independientes y se encuentran normalmente
distribuidas.

 La distribuciones de Y tienen la misma varianza.

F. VELA

Ho: la relacin es lineal

(
SCER SCEF ) glF
=
SCEF ( glR glF )

vs H1: la relacin no es lineal


SCER=suma de cuadrados del error
del modelo reducido.
SCEF= suma de cuadrados del error
del modelo completo.
glR= grados de libertad del modelo
reducido.
glF= grados de libertad del modelo
completo.

 La regla de decisin esta dada por:


Rechazar Ho ssi

F* > Fck ,nc

donde
c= # de niveles distintos de X
p= # de variables en la ecuacin de regresin
n= # de observaciones

F. VELA

SCEF = SCPE = (Yij Y j )

j=1,2,,c (niveles de X)

SCER = SCE = (Yij Yij )

glF = (n c)
glR = (n k )

(
SCE SCPE ) ( n c)
=
SCPE (n 2) ( n c )

Observe que

SCPE = Suma de cuadrados del error puro (en ingls SSPE)

F. VELA

 Es comn encontrar la siguiente notacin:

SCER = SSEP

SCE = SSE

se define entonces
SSLF = SSE + SSEP

donde
SSLF = suma de cuadrados de falta de ajuste

observe

SSE SSPE
(
SCE SSPE ) ( n c ) ( n 2) ( n c ) MSLF
*
F =
=
=
SSE
SSPE (n 2) (n c )
MSPE
(n c)

F. VELA

Ejemplo
Una empresa dedicada a comercializar productos de
belleza utiliza los servicios de telemarketing para
promover a sus mercancas.
El gerente de la Divisin de Mercadeo de la compaa
de telemarketing esta interesado en conocer el tiempo
que utilizan sus empleados en una llamada para
realizar sus tareas.

Para ello recolecta el nmero de meses (meses)


que lleva en la compaa el operador y el nmero
de llamadas telefnicas (llamadas) realizadas al
da para 20 de sus empleados.

F. VELA

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.

| meses
llamadas |
|------------------|
|
10
18 |
|
10
19 |
|
11
22 |
|
14
23 |
|
15
25 |
|------------------|
|
17
28 |
|
18
29 |
|
20
29 |
|
20
31 |
|
21
31 |
|------------------|
|
22
33 |
|
22
32 |
|
24
31 |
|
25
32 |
|
25
32 |
|------------------|
|
25
33 |
|
25
31 |
|
28
33 |
|
29
33 |
|
30
34 |
+------------------+

F. VELA

El promedio de llamadas al da para los 20 empleados


seleccionados es de 28.95.
El gerente sospecha que pudiera haber algn tipo de
relacin entre la antigedad en el trabajo y el nmero
de llamadas, dado que el empleado puede ir
especializndose.
Se plantea entonces el siguiente modelo:

llamadas

= 1 + 2 meses + u

15

20

llamadas
25

30

35

F. VELA

10

15

20
meses

25

30

F. VELA

reg llamadas meses


Source |
SS
df
MS
-------------+-----------------------------Model | 397.445862
1 397.445862
Residual | 57.504138
18 3.19467433
-------------+-----------------------------Total |
454.95
19 23.9447368

Number of obs
F( 1,
18)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

20
124.41
0.0000
0.8736
0.8666
1.7874

-----------------------------------------------------------------------------llamadas |
Coef. Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------meses | .7435148 .0666598
11.15 0.000
.6034678
.8835619
_cons | 13.67077 1.426971
9.58 0.000
10.67281
16.66872
------------------------------------------------------------------------------

F. VELA

predict yhat
predict r, res
predict res, rstandard
list llamadas yhat r res

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.

+---------------------------------------------+
| llamadas
yhat
r
reses |
|---------------------------------------------|
|
18
21.10592
-3.105918
-1.948687 |
|
19
21.10592
-2.105918
-1.321276 |
|
22
21.84943
.1505668
.0928491 |
|
23
24.07998
-1.079978
-.6403641 |
|
25
24.82349
.1765074
.1036832 |
|---------------------------------------------|
|
28
26.31052
1.689478
.9788621 |
|
29
27.05404
1.945963
1.122372 |
|
29
28.54107
.4589332
.2634939 |
|
31
28.54107
2.458933
1.411783 |
|
31
29.28458
1.715418
.9848256 |
|---------------------------------------------|
|
33
30.0281
2.971904
1.708555 |
|
32
30.0281
1.971903
1.133653 |
|
31
31.51513
-.5151262
-.2983019 |
|
32
32.25864
-.2586411
-.1506646 |
|
32
32.25864
-.2586411
-.1506646 |
|---------------------------------------------|
|
33
32.25864
.7413589
.4318593 |
|
31
32.25864
-1.258641
-.7331886 |
|
33
34.48919
-1.489186
-.8918217 |
|
33
35.2327
-2.2327
-1.354356 |
|
34
35.97622
-1.976215
-1.216709 |
+---------------------------------------------+

-2

Standardized residuals
-1
0
1

F. VELA

20
25
30

Fitted values
35

-4

-2

Residuals
0

F. VELA

20

25

30
F itted values

35

-4

-2

Residuals
0

F. VELA

10

15

20
meses

25

30

F. VELA

PRUEBA DE FALTA DE AJUSTE

F. VELA

Construccin de F*
 Arreglo de datos

X
j=1
10
18
19

j=2
11
22

Replicas
i=1
i=2
i=3
i=3
Media 18.5 22

j=3
14
23

j=4
15
25

j=5
17
28

j=6
18
29

j=7
20
29
31

23

25

28

29

30

j=8
21
31

j=9 j=10 j=11


22 24 25
33 31 32
32
32
33
31
31 32.5 31 32

j=12 j=13 j=14


28 29 30
33 33 34

33

33

34

SCEF = SSPE = (10 18.5) 2 + (19 18.5) 2 + (22 22) 2 + ... + (34 34) 2

F. VELA

 Calculo SCEF (tambin denominado SSPE)

X
j=1
Replicas 10
i=1
0.25
i=2
0.25
i=3
i=3
Sumas 0.5

j=2
11
0

j=3
14
0

j=4
15
0

j=5
17
0

j=6
18
0

j=7
20
1
1

j=8
21
0

SCEF = SSPE = 5
SCE R = SCE = 57.504138
n = 20
c = 14
k =2

j=9 j=10 j=11 j=12 j=13 j=14


22 24 25 28 29 30
0.25 0
0
0
0
0
0.25
0
1
1
0.5
0
2
0
0
0

glF = (20 14)

glR = (202) (2014)

F. VELA

Prueba de falta de ajuste


Ho: la relacin es lineal

vs H1: la relacin no es lineal

=0.05:
F

(
57.504 5) ( 20 14) 52.504(6)
=
=
= 5.2504
5 [(20 2) ( 20 14 )]
5(12)

Rechazar Ho ssi

F > Fck ,nc

donde

F12*0, 6.05 = 4 .00

5 .2504 > 4 .00


Se rechaza H0 lo que implica que la relacin no es lineal

F. VELA

Prueba de falta de ajuste en Stata


reg llamadas meses
Source |
SS
df
MS
-------------+-----------------------------Model | 397.445862
1 397.445862
Residual | 57.504138
18 3.19467433
-------------+-----------------------------Total |
454.95
19 23.9447368

Number of obs
F( 1,
18)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

20
124.41
0.0000
0.8736
0.8666
1.7874

-----------------------------------------------------------------------------llamadas |
Coef. Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------meses | .7435148 .0666598
11.15 0.000
.6034678
.8835619
_cons | 13.67077 1.426971
9.58 0.000
10.67281
16.66872
------------------------------------------------------------------------------

findit maxr2

F. VELA

maxr2
maximum R-square
relative R-square
actual adjusted R-square
relative adjusted R-square

=
=
=
=

0.9890
0.8833
0.8666
0.8768

SSLF (df) = 52.504138 (12) MSLF = 4.3753448


SSPE (df) = 5 (6) MSPE = .83333333
F (dfn, dfd) for lack-of-fit test (MSLF/MSPE) =
prob > F =

5.2504 (12,6)
0.0264

number of covariate patterns = 14


as ratio of observations = 0.700

Se rechaza H0 lo que implica que la relacin no es lineal


(con = 0.05 y 0.10)

F. VELA

Bibliografa
Kutner, Michael H. et. al. (2005). Applied Linear
Statistical Models, 5 ed., McGraw Hill, Singapore (pp.
119-124).

También podría gustarte