Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Test Conjunta
Test Conjunta
El objetivo que se pretende en este tipo de contraste del modelo, es poder dar una
medida numérica representativa de la capacidad global de todas las variables
explicativas para seguir la evolución de la variable endógena. Para ello, y como es
habitual en toda contrastación estadística, cubriremos las siguientes etapas:
En nuestro caso, tiene interés conocer una ratio que englobe la información
contenida por todos los parámetros (k) de un modelo. Para ello, y partiendo de la
notación como vector (k x 1) que hemos dado a los parámetros del modelo escrito
Contrastes de significación conjunta 2 /12
[ ][
βˆ − β ' βˆ − β
2
]
−1
/k
σ [X ' X ]
donde no hemos calculado otra cosa que la suma cuadrada de los parámetros
estandarizados (a cada uno se le ha restado su media y se le ha dividido por su
desviación típica y la suma de un vector columna transpuesto por el mismo no es
más que la suma de las componentes al cuadrado).
Conocer cuál es la función de distribución del valor medio de todos los parámetros
que intervienen en un modelo considerados de forma conjunta, como ocurre en
esta ratio, es fácilmente deducible a partir de la constancia de que los parámetros
estimados se distribuyen como una normal βˆ → N (β ; σ 2 [ X ' X ]−1 ) . Volviendo a la
ratio escrita más arriba, para poder realizar el cálculo en un modelo concreto
habrá que dar un valor estimado a la varianza de la perturbación aleatoria (σ2).
Realizando una serie de sustituciones matemáticas (que en el desarrollo se
comentan escritas entre llaves), obtendríamos la función de densidad de la ratio
antes escrito:
[
2
][
βˆ − β ' βˆ − β
/
]k =
[ ]
βˆ − β ' [ X ' X ] βˆ − β [ ] = σˆˆ 2
=
e' e
=
σˆ [X ' X ] n− k
−1
σˆ 2 k
=
[[ ] [
βˆ − β ' [ X ' X ] βˆ − β / k ]]
=
e' e
n− k
1 / σ 2
[[[ ] [
βˆ − β ' [X ' X ] βˆ − β / σ 2 / k ]] ] ∑ N (0,1) 2
→ χ k2
= 2
= = k
→ Fk , n − k
1 / σ e' e
2 /(n − k )
σ
∑ N (0,1)
n −k
2
→χ 2
n− k
Por lo que la ratio, que hemos escrito como el cociente entre dos χ2 , se distribuye
como un F k,n-k cuando se cumple la hipótesis de que las perturbaciones aleatorias
se distribuyen como una normal.
A partir de las tablas de esta distribución, podemos saber entre que valores se
sitúa una variable aleatoria de las características de la ratio que hemos construido
con un 95% de probabilidad. Si el cálculo de esta ratio en un caso concreto,
aplicando las características a los parámetros que queramos (es decir;
contrastando una hipótesis nula), deja de estar comprendido entre los valores en
los que lo estaría una F k, n-k, podremos decir que, con un 95% de probabilidades, la
condición que hemos impuesto a los parámetros es falsa.
Podemos plantear, por ejemplo, una hipótesis nula en la que sostengamos que el
valor real de todos los parámetros es igual a cero, lo que nos serviría para decir
que ninguna de las variables incluidas como explicativas en el modelo es
realmente válida para explicar la endógena. La hipótesis a aplicar a la ratio
formulada sería entonces H 0 ( β 1 = β 2 = .... = β k = 0) , que es lo mismo que decir
todo el vector de parámetros de las beta reales es igual a ceros, con lo que la ratio
anterior se podría escribir como:
PR 0 <
[ ] [ =
]
βˆ − 0 ' [X ' X ] βˆ − 0 βˆ ' [ X ' X ]βˆ
< Fkε; n − k = 1 − ε
σˆ k
2
σˆ k
2
En principio esta ratio debiera seguir comprendido entre los valores tabulados para
la F si la restricción impuesta es cierta; es decir, si aceptamos la hipótesis nula. En
el caso en el que la imposición de esta hipótesis nos determinara un valor fuera de
la F tabulada, estaríamos diciendo que dicha hipótesis no es compatible con lo
que conocemos a ciencia cierta del modelo (ya para su demostración no habíamos
hecho ninguna hipótesis adicional), luego deberíamos rechazarla. Esto sería lo
mismo que admitir la hipótesis alternativa lógica: por lo menos alguna de las
variables explicativas elegidas sí sirve para explicar el comportamiento de la
endógena con un 95% de probabilidades.
1
Cuando no existe información distinta para explicar una variable, es fácil demostrar que el mejor
valor de estimación de la misma que se puede dar sería el de su media, valor que recogería el
término independiente del modelo o constante en el caso de que el resto de las variables no
sirvieran en absoluto para definir el comportamiento de la endógena.
Contrastes de significación conjunta 4 /12
Para poder realizar esta misma ratio sobre un modelo sin término independiente,
es necesario escribir dicho modelo en lo que se conoce como desviaciones a la
media que no es si no una combinación lineal de las n ecuaciones anteriores, del
siguiente modo:
( yi − y ) = β 1 (x 1i − x 1 ) + β 2 (x 2 i − x 2 ) + β 3 (x 3 i − x 3 ) + ..... + β k (x ki − x ki ) + ui
dado que la variable x1i es un vector que sólo incluye unos para dar lugar a ese
término independiente, su media también será uno y la resta planteada en la
ecuación superior hará que el parámetro β 1 esté multiplicado por cero en esta
rescritura equivalente del modelo inicial.
El cálculo de la ratio anterior sería ahora (sin incluir ese término constante) igual a:
2
Nótese nuevamente que las fórmulas entre llaves tan sólo son “recordatorios” de las operaciones
aplicadas para obtener los resultados presentados en la demostración.
Contrastes de significación conjunta 5 /12
βˆ ' [X ' X ]βˆ ([X ' X ]−1 X ' Y )' [X ' X ]([X ' X ]−1 X ' Y )
= =
σˆ 2 (k − 1) σˆ 2 (k − 1)
y = Xβ + U
Y ' X [X ' X ]−1 X ' Y
= = M = ( I n − X [X ' X ] X ' ) =
−1
σˆ 2 (k − 1)
e' e = U ' MU
Y ' Y − e' e 2 e' e
= 2 = σˆ = =
σ (k − 1)
ˆ n −k
(Y ' Y − e ' e ) /(k − 1)
=
e ' e /(n − k )
La ratio así presentada se convierte ahora en una proporción del error cuadrático y
de la endógena que quiero explicar; es decir, una medida, en cierto modo, de la
bondad o maldad del modelo en comparación con la misma ratio calculada para
un posible modelo alternativo. Evidentemente, un modelo con iguales grados de
libertad será tanto mejor que otro alternativo en la medida en la que esta ratio de
“explicación conjunta” de todas las variables sea mayor (lo que supone, por
construcción, una menor importancia de los errores respecto a la endógena).
Qi = K iα · Lβi ·U i / α + β = 1
Wald propone otra ratio muy similar al visto hasta ahora para la determinación de
la veracidad o no de una serie de restricciones impuestas a los parámetros del
modelo original.
Siguiendo los mismo pasos que antes, propone la siguiente ratio de la suma
cuadrada de los parámetros estandarizados sujetos a la restricción impuesta:
( R β − r )' [X ' X ]( Rβ − r )
W =
σˆ 2
Lo que se distribuiría como una χ2 con “q” grados de libertad (siendo “q” el número
de restricciones exigidas al modelo).
3
En ese ejemplo, podríamos escribir matricialmente la restricción del siguiente modo:
β1
β
[1 1 ... 1] 2 − [1] = [0 ]
.
β k
R = [1 1 ... 1] con una restricción (q=1):que los “k” parámetros sumen uno.
r = [1]
Contrastes de significación conjunta 7 /12
(e r' e r − e' e) / q
W /q= → Fq , n − k
e' e /( n − k )
Nótese que esta última expresión es muy similar a la obtenida finalmente como
contraste conjunto de parámetros F-Snedecor
e' e U' U
4
Como ya se demostró e’e=U’MU, donde U → N (0; σ 2 I n ) , por lo que = M → χ n2− k
σ 2
σ σ
Contrastes de significación conjunta 8 /12
C(2)+C(3)=1
Donde:
Para obtener los resultados del test de Wald, seguiremos los pasos antes citados
(View - Coefficient Test – Wald Coefficient Restrictions.) que se encuentran en la
ventana de la salida de regresión; abriéndose entonces el cuadro de diálogo que
se observa en la figura de más abajo.
Contrastes de significación conjunta 9 /12
En este cuadro habrá que inc luir la restricción paramétrica a contrastar; en nuestro
caso: C(2)+C(3)=1 y pulsar OK; obteniéndose la siguiente salida:
Wald Test:
Equation: Untitled
Null Hypothesis: C(2)+C(3)=1
F-statistic 1.077667 Probability 0.302235
Chi-square 1.077667 Probability 0.299220
Podemos afirmar esta restricción del modelo (C(2)+C(3)=1) como cierta con un 30%
de probabilidad (a sensu contrario, sólo podríamos rechazarla con un 70% de
probabilidades que, como no llega al 95%, no es suficiente).
Contrastes de significación conjunta 10 /12
S 2yˆ
R2 =
S 2y
S y2ˆ S y2 − S e2 S e2
R2 = = =1−
S y2 S 2y S 2y
5
Partiendo de las variables en desviaciones a la media (a cada una de ellas se les habría
sustraído previamente su correspondiente media):
βˆ ' X ' ( I n − X [X ' X ]−1 X ' )U = βˆ ' X 'U − βˆ ' X ' X [ X ' X ]−1 X 'U = 0
Y ' Y − βˆ ' X ' X βˆ + βˆ ' X ' MU = =
Y ' Y − βˆ ' X ' X βˆ = Y 'Y − Yˆ ' Yˆ
S y2 = S y2ˆ + S e2 , ya que las variables estaban en desviaciones a la media, luego las resultantes
tendrían media cero5.
Contrastes de significación conjunta 11 /12
S e2 /( n − k ) Se2 ( n − 1) ( n − 1)
R2 =1− = − = 1 − (1 − R 2 )
( n − k )
1
S y /( n − 1)
2
S y (n − k )
2
(Y ' Y − e' e) /( k − 1)
Fk −1, n− k =
e' e /(n − k )
(Y ' Y / n − e' e / n ) /( k − 1) ( S y − S e ) /( k − 1)
2 2
Fk −1,n −k = =
e' e / n /( n − k ) S e2 /( n − k )
Contrastes de significación conjunta 12 /12
(( S y2 − S e2 ) / S 2y ) /( k − 1) ((1 − Se2 / S 2y ) /( k − 1)
Fk −1,n −k = =
( S e2 / S 2y ) /( n − k ) ( Se2 / S y2 ) /( n − k )
A partir de la expresión de R2 :
S e2 Se2
R2 = 1 − ⇒ = 1 − R2
S 2y Sy2
((1 − S e2 / S 2y ) /( k − 1) R 2 /( k − 1)
Fk −1,n −k = =
( S e2 / S 2y ) /(n − k ) (1 − R 2 ) /( n − k )