Está en la página 1de 26

Type author name/s here

PRUEBA F DE BONDAD DE
AJUSTE PARA TODA LA
ECUACIÓN
Chapter heading
Análisis de regresión múltiple
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

Y   1   2 X 2  ...   k X k  u

H 0 :  2  ...   k  0
H 1 : at least one   0

Esta presentación describe dos pruebas F de bondad de ajuste en un modelo de regresión


múltiple. El primero se relaciona con la bondad del ajuste de la ecuación en su conjunto.

1
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

Y   1   2 X 2  ...   k X k  u

H 0 :  2  ...   k  0
H 1 : at least one   0

Consideraremos el caso general en el que hay k – 1 variables explicativas. Para la prueba F


de bondad de ajuste de la ecuación en su conjunto, la hipótesis nula, en palabras, es que el
modelo no tiene ningún poder explicativo en absoluto.
2
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

Y   1   2 X 2  ...   k X k  u

H 0 :  2  ...   k  0
H 1 : at least one   0

Por supuesto, esperamos rechazarlo y concluir que el modelo tiene cierto poder
explicativo.

3
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

Y   1   2 X 2  ...   k X k  u

H 0 :  2  ...   k  0
H 1 : at least one   0

El modelo no tendrá poder explicativo si resulta que Y no está relacionado con ninguna de
las variables explicativas. Matemáticamente, por lo tanto, la hipótesis nula es que todos los
coeficientes b2, ..., bk son cero.
4
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

Y   1   2 X 2  ...   k X k  u

H 0 :  2  ...   k  0
H 1 : at least one   0

La hipótesis alternativa es que al menos uno de estos b coeficientes es distinto de cero.

5
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

Y   1   2 X 2  ...   k X k  u

H 0 :  2  ...   k  0
H 1 : at least one   0

En el modelo de regresión múltiple hay una diferencia entre los roles de las pruebas F y t.
La prueba F prueba el poder explicativo del conjunto de variables, mientras que las
pruebas t prueban su poder explicativo individualmente.
6
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

Y   1   2 X 2  ...   k X k  u

H 0 :  2  ...   k  0
H 1 : at least one   0

En el modelo de regresión simple, la prueba F era equivalente a la prueba t (de dos lados)
del coeficiente de pendiente porque el "grupo" contenía en una sola variable.

7
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

Y   1   2 X 2  ...   k X k  u

H 0 :  2  ...   k  0
H 1 : at least one   0

ESS  k  1
F  k  1, n  k  
RSS  n  k 
ESS
 k  1 R 2  k  1
 TSS 
RSS
 n k  1  R 2
  n  k
TSS

La estadística F de la prueba se definió en el modelo simple. SE es la suma explicada de


cuadrados y SCR es la suma residual de cuadrados.

8
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

Y   1   2 X 2  ...   k X k  u

H 0 :  2  ...   k  0
H 1 : at least one   0

ESS  k  1
F  k  1, n  k  
RSS  n  k 
ESS
 k  1 R 2  k  1
 TSS 
RSS
 n k  1  R 2
  n  k
TSS

Se puede expresar en términos de R2 dividiendo el numerador y el denominador por ST, la


suma total de cuadrados.

9
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

Y   1   2 X 2  ...   k X k  u

H 0 :  2  ...   k  0
H 1 : at least one   0

ESS  k  1
F  k  1, n  k  
RSS  n  k 
ESS
 k  1 R 2  k  1
 TSS 
RSS
 n k  1  R 2
  n  k
TSS

ESS / TSS es la definición de R2. RSS / TSS es igual a (1 – R2).

10
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

El modelo de logro educativo se utilizará como ejemplo. Supondremos que S depende de


ASVABC, la puntuación de habilidad, y SM, y SF, el curso mas alto completado por la madre
y el padre del encuestado, respectivamente.
11
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

H 0 :  2   3   4  0, H 1 : at least one   0

La hipótesis nula para la prueba F de bondad de ajuste es que los tres coeficientes de
pendiente son iguales a cero. La hipótesis alternativa es que al menos uno de ellos es
distinto de cero.
12
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

H 0 :  2   3   4  0, H 1 : at least one   0

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------

Aquí está la salida de Stata de la regresión usando la base de datos 21.

13
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

H 0 :  2   3   4  0, H 1 : at least one   0

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------

ESS  k  1 1235 3
F  k  1, n  k   F  3,496    81.1
RSS  n  k  2519 496

En este ejemplo, k – 1, el número de variables explicativas, es igual a 3 y n – k, el número


de grados de libertad, es igual a 496.

14
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

H 0 :  2   3   4  0, H 1 : at least one   0

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------

ESS  k  1 1235 3
F  k  1, n  k   F  3,496    81.1
RSS  n  k  2519 496

El numerador del estadístico F es la suma explicada de cuadrados divididos por k – 1. En la


salida Stata, estos números se indican en la fila Modelo.

15
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

H 0 :  2   3   4  0, H 1 : at least one   0

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------

ESS  k  1 1235 3
F  k  1, n  k   F  3,496    81.1
RSS  n  k  2519 496

El denominador es la suma residual de cuadrados divididos por el número de grados de


libertad restantes.

16
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

H 0 :  2   3   4  0, H 1 : at least one   0

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------

ESS  k  1 1235 3
F  k  1, n  k   F  3,496    81.1
RSS  n  k  2519 496

Por lo tanto, el estadístico F es 81.1. Todos los paquetes de regresión serios lo calculan por
usted como parte de los diagnósticos en la salida de regresión.

17
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

H 0 :  2   3   4  0, H 1 : at least one   0

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------

1235 3
Fcrit,0.1%  3,500   5.51 F  3,496    81.1
2519 496

El valor crítico para F(3,496) no se indica en las tablas F, pero sabemos que debe estar muy
cerca de F(3 , 500), que se da. En el nivel del 0,1%, es 5.51. Por lo tanto, rechazamos
fácilmente H0 a un nivel 0.1%.
18
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

H 0 :  2   3   4  0, H 1 : at least one   0

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------

1235 3
Fcrit,0.1%  3,500   5.51 F  3,496    81.1
2519 496

Este resultado podría haberse anticipado porque tanto ASVABC como SF tienen
estadísticos t muy significativos. Así que sabíamos de antemano que tanto b2 y b4 eran
distintos de cero.
19
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

H 0 :  2   3   4  0, H 1 : at least one   0

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------

1235 3
Fcrit,0.1%  3,500   5.51 F  3,496    81.1
2519 496

Es inusual que el estadístico F no sea significativa si algunos de los estadísticos t son


significativos. En principio, aunque podría suceder. Supongamos que ha estimado una
regresión con 40 variables explicativas, y ninguna es un verdadero determinante de la
variable dependiente. 20
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

H 0 :  2   3   4  0, H 1 : at least one   0

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------

1235 3
Fcrit,0.1%  3,500   5.51 F  3,496    81.1
2519 496

Entonces el estadístico F debe ser lo suficientemente bajo para no rechazar H0 . Sin


embargo, si está realizando pruebas t en los coeficientes de pendiente al nivel del 5%, con
un 5% de probabilidad de un error de Tipo I, en promedio, cabe esperar que 2 de las 40
variables tengan coeficientes "significativos". 21
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

H 0 :  2   3   4  0, H 1 : at least one   0

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------

1235 3
Fcrit,0.1%  3,500   5.51 F  3,496    81.1
2519 496

Lo contrario puede suceder fácilmente, aunque. Supongamos que tiene un modelo de


regresión múltiple que se especifica correctamente y el R2 es alto. Usted esperaría tener un
estadístico F muy significativo.
22
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

H 0 :  2   3   4  0, H 1 : at least one   0

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------

1235 3
Fcrit,0.1%  3,500   5.51 F  3,496    81.1
2519 496

Sin embargo, si las variables explicativas están altamente correlacionadas y el modelo está
sujeto a una multicolinealidad grave, los errores estándar de los coeficientes podrían ser
tan grandes que ninguno de los estadísticos t parezca significativo.
23
PRUEBA F DE BONDAD DE AJUSTE PARA TODA LA ECUACIÓN

S   1   2 ASVABC   3 SM   4 SF  u

H 0 :  2   3   4  0, H 1 : at least one   0

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------

1235 3
Fcrit,0.1%  3,500   5.51 F  3,496    81.1
2519 496

En esta situación sabrías que tu modelo esta bien, pero usted no está en posición de
identificar las contribuciones hechas por las variables explicativas individualmente.

24
Copyright Christopher Dougherty 2016.

These slideshows may be downloaded by anyone, anywhere for personal use.


Subject to respect for copyright and, where appropriate, attribution, they may be
used as a resource for teaching an econometrics course. There is no need to
refer to the author.

The content of this slideshow comes from Section 3.5 of C. Dougherty,


Introduction to Econometrics, fifth edition 2016, Oxford University Press.
Additional (free) resources for both students and instructors may be
downloaded from the OUP Online Resource Centre
www.oxfordtextbooks.co.uk/orc/dougherty5e/.

Individuals studying econometrics on their own who feel that they might benefit
from participation in a formal course should consider the London School of
Economics summer school course
EC212 Introduction to Econometrics
http://www2.lse.ac.uk/study/summerSchools/summerSchool/Home.aspx
or the University of London International Programmes distance learning course
EC2020 Elements of Econometrics
www.londoninternational.ac.uk/lse.

2016.04.30

También podría gustarte