Está en la página 1de 5

ANNOVA

A) TABLA ANOVA

1. Suma de cuadrados del modelo (SS Model): Nos indica cuánto se ha


reducido el error al usar la regresión para calcular y en lugar de ̅:

∑ ̂ ̅) 2

2. Suma de cuadrados de residuales (SS Residual): Expresa el error cuando


usamos la línea de regresión para predecir y:

∑ ̂ )2

3. Suma de Cuadrados Totales (SCT): Expresa cual hubiera sido el error si


predecimos cada valor con la media.

∑ ̅) 2

) ) = 271802.616 + 91875.3836 = 363678


4. Grados de Libertad del modelo (MDF) = Número de variables independientes (K-1)
=3

5. Grados de libertad del error (RDF) = Número de obs.- K = 64 – 4 = 60

6. Grados de Libertad (Total): MDF + RDF = 3 + 60 = 63


ó

=Número de observaciones – 1 = 64 - 1

7. Cuadrados medios del modelo (MSM):

)
= = 90600.8721
)

8. Cuadrados medios del residual (MSR o S2):

)
= = 1531.25630
)

B) CUADRO DE INFORMACIÓN

1. Número de observaciones con las que se estimó la regresión: Puede ser inferior
al total de observaciones de la base de datos dada la existencia de missing values.

2. Estadístico F: Prueba de dependencia o significancia global.

) )
) )

Sirve para determinar si hay dependencia en el modelo a través del procedimiento de


prueba de hipótesis:
 Ho. β1 = β2= β3 = 0
 Ha. Alguno diferente de 0
 Determinamos el nivel de significancia α = 5%

FC= 90600.8721/1531.25630 = 59.17

 Si FCALCULADO>FTABULADO PARA 5% (aprox. 4), se rechaza la hipótesis nula a favor


de Ha. Existe dependencia (o significancia global) en el modelo.

 Si FCALCULADO<FTABULADO PARA 5% , no se rechaza la hipótesis nula a favor de Ha. y


por ende no hay dependencia en el modelo.

3. P-valor del estadístico F: corresponde al área bajo la distribución F que esta


después del valor del F calculado (Fc).

p-valor = Pr {FMDF,RDF > Fc } = Pr ( F3,60 > 59.17) = 0

4. R cuadrado (R2): Mide la bondad de ajuste del modelo de regresión (porcentaje de


explicación de la variable dependiente por las variables independientes)

Suma de Cuadrados del modelo (SSM)/ Suma de cuadrados Totales (SST)=


271802.616/ 363678 = 0.7474

5. R cuadrado ajustado: Al igual que el R2 Mide la bondad de ajuste del modelo de


regresión (porcentaje de explicación de la variable dependiente por las variables
independientes), pero a diferencia del anterior no necesariamente aumenta al incluir
más variables independientes. Por esta razón permite comparar modelos de regresión
múltiple en los que se incluyen variables adicionales.

= 1-(1-R2) * ( ) = 1-(1-0.7474) * ( ) = 0.7347

6. Raíz de los cuadrados medios del residual (Root MSE): Medida alternativa de bondad de ajuste, definida como la raíz de la media cuadrada de los residuales:

∑ ̂)
= √ √
C) RESULTADOS DE LA ESTIMACIÓN

1. Parámetros muéstrales ( ̂ ): Los valores estimados de los parámetros de interés,


obtenidos mediante la fórmula: (X’X)-1(X’ Y)

2. Error estándar: Mide la disparidad “promedio” entre los valores observados y los
valores estimados a través de la regresión: S2(X’X)-1 = MSR*(X’X)-1

3. Estadístico t: Prueba de relevancia o significancia individual.

= Parámetro muestral ( ̂ ) / Error estándar ( ̂ )

Sirve para determinar la significancia individual de los parámetros en el modelo a


través del procedimiento de prueba de hipótesis:

 Ho. β2= 0
 Ha. Β2 ≠ 0
 Determinamos el nivel de significancia α = 5%

tc=-0.0055112/0.0018782= -2.93

 | tCALCULADO |> tTABULADO PARA 5% (aprox 2), se rechaza la hipótesis nula a favor de
Ha. El parámetro es significativo en el modelo.
 | tCALCULADO |< tTABULADO PARA 5%; no se rechaza la hipótesis nula a favor de Ha. El
parámetro no es significativo en el modelo.

4. P-valor t: corresponde al área bajo la distribución t que esta después del valor
absoluto del t calculado |tc|:

p-valor = Pr {|tn-1| >{ |tc| } = Pr { |t63| >{ |-2.93| } = Pr { |t63| > 2.93 }

Notemos que por la simetría de la distribución t:

p − valor = Pr { |t63| > 2.93}


= 2 Pr {t63 > 2.93} = 2(1 − Pr {t63 < 2.93}

Ahora, para obtener el p-valor, debemos usar la tabla de la distribución t para


encontrar el valor que corresponde a 2 Pr {t63 > -2.93}= 2 (0.0025)= 0.005.

5. Intervalo de confianza: Prob { ̂ -C*error estándar ≤ β ≤ ̂ + C*error estándar}, dónde


C es el valor que toma el estadístico t para un nivel de significancia del 5% con
Grados de Libertad= n-K-1.

Grados de libertad: 64-3-1 = 60; Debemos mirar el valor que toma t, con 60 grados de
libertad, en una tabla de distribución. En este caso este valor es 2. Por ende el
intervalo de confianza para el primer estimador es:

{-1.768029 -2*0.2480169 ≤ β ≤ -1.768029 + 2*0.24480169}= -2.264 ≤ β ≤ -1.2719

También podría gustarte