Está en la página 1de 13

ESTADÍSTICA II

PRUEBA GLOBAL DE SIGNIFICANCIA PARA EL MODELO DE REGRESIÓN MÚLTIPLE

Prueba F de Significancia Global

H 0 : β 1=β 2=… β p=0

H 1 : Uno o más de los parámetros del modelo no son iguales a cero.

ESTADÍSTICO DE PRUEBA

CMR
F=
CME

REGLA DE RECHAZO

p-value: Rechazar la H 0 si el valor de p ≤ α

Valor crítico: Rechazar la H 0 si F ≥ F1−α (p ; n− p−1)

Donde Fα pertenece a la distribución F con p grados de libertad en el numerador y n –p- 1 grados de


libertad en el denominador.

TABLA: Análisis de Varianza (ANOVA) PARA EL MODELO DE REGRESIÓN MÚLTIPLE

FUENTE SUMA DE GRADOS DE CUADRADO F


CUADRADOS LIBERTAD MEDIO
Regresión SCR p SCR CMR
CMR= F=
p CME

Error SCE n−p−1 SCE


CME=
n− p−1
Total STC n−1

Donde:
CMR: Cuadrado medio de la regresión.
CME: Cuadrado medio del error.

ERROR ESTANDAR DE ESTIMACIÓN MÚLTIPLE


n

∑ ( y i− ^y i )2 2 SCE
S= i
n− p−1
=

SCE . Y la varianza de la estimación es: S = n−p−1
n− p−1
ESTADÍSTICA II

PRUEBA t-Student. - Si la prueba F indica que la relación de regresión múltiple es significativa, se


puede realizar una prueba t para determinar la significancia de cada uno de los parámetros. A
continuación, se presenta la prueba t de significancia para cada uno de los parámetros.

PRUEBA INDIVIDUAL DE LOS PARÁMETROS DEL MODELO

Prueba t de Significancia para cada uno de los parámetros

Para cualquier parámetro β i

H 0 : β i=0

H 1: βi≠ 0

ESTADÍSTICO DE PRUEBA

bi
T=
sb i

REGLA DE RECHAZO

Valor-p: Rechazar la H 0 si el valor de p ≤ α

Valor crítico: Rechazar la H 0 si t ≤−t 1− α o si t ≥ t 1− α


2 2

Donde t 1− α es un valor de la distribución t con n –p- 1 grados de libertad y sb es la estimación de la


i
2

desviación estándar de b i.

Ejemplos
1. El dueño de Showtime Movie Theater, Inc., desea estimar el ingreso bruto semanal en función de los
gastos en publicidad. A continuación, se presentan los datos históricos de 10 semanas.
Publicidad en
Ingreso semanal (en Publicidad en tv (en periódico (en
miles de $) miles de $) miles de $)
Y X1 X2
96 5 1.5
90 2 2
95 4 1.5
92 2.5 2.5
95 3 3.3
94 3.5 2.3
94 2.5 4.2
94 3 2.5

a) Obtener la prueba global de significancia para el modelo.


ESTADÍSTICA II

1) Formulación de Hipótesis
H 0 : β 1=β 2=0
H 1 : Uno o más de los parámetros del modelo no son iguales a cero.

2) Estadístico de Prueba

CMR
F= =¿
CME
3) Valor Crítico
EXCEL=INV.F(0.95;2;5)
F(1−α ; p ;n− p−1)=¿
4) Región crítica

F F 1−α ( p ;n− p−1), por lo tanto, la hipótesis Ho

Valor- p=0.00186524 ¿ α =0.05 , por lo tanto, se rechaza H 0

CONCLUSIÓN: Uno o más de los parámetros del modelo no son iguales a cero,
esto significa que por lo menos existe una variable independiente que se relacione
significativamente con la V.D ingreso semanal. Por lo tanto, el modelo de regresión
lineal múltiple es significativo.

b) Obtener la prueba T de significancia para cada uno de los parámetros del modelo.

 Para β 1

1) Formulación de la Hipótesis
H 0 : β 1=0

H 1: β1≠ 0

2) Estadístico de prueba

bi
T= =¿
sb
i

3) Valor crítico

t α
(1− ,n− p−1)
2

T t (1− α ,n− p−1), por lo tanto, la hipótesis Ho


2
ESTADÍSTICA II

Valor-p =0.00065323¿ α =0.05 por lo tanto, se rechaza H 0

Conclusión: el coeficiente de la publicidad en TV es β 1 ≠ 0 , esto implica que, el


ingreso semanal tiene relación significativa con la variable publicidad en tv.

 Para β 2

1) Formulación de la Hipótesis
H 0 : β 2=0

H 1: β2≠ 0

2) Estadístico de prueba

bi
T= =¿
sb
i

3) Valor crítico

t α
(1− ,n− p−1)
2

T t (1− α ,n− p−1), por lo tanto, la hipótesis Ho


2

Valor-p =0.0097608¿ α =0.05 por lo tanto, se rechaza H 0

Conclusión: El coeficiente de la publicidad en periódico es β 2 ≠ 0 , esto implica que, el


ingreso semanal tiene relación significativa con la variable publicidad en periódico.

Por lo tanto, el modelo de regresión múltiple es significativo y adecuado para estimar o


predecir.

2. Salaberry vende casas en la costa este de Estados Unidos. Una de las preguntas más frecuentes de los
compradores potenciales es: Si compramos esta casa, ¿Cuánto gastaremos en calefacción durante el
invierno?
Al departamento de investigación de Salaberry se le pidió desarrollar algunas directrices respecto de
los costos de calefacción de casas unifamiliares. Se considera que tres variables se relacionan con los
costos de calefacción:
 La temperatura externa diaria media,
 El número de pulgadas de aislamiento en el ático y
 La antigüedad en años del calentador.
Para el estudio, el departamento de investigación de Salaberry seleccionó una muestra aleatoria de 20
casas de venta reciente. Determino el costo de calefacción de cada casa en enero pasado, así como la
temperatura externa en enero en la región, el número de pulgadas de aislamiento en el ático y la edad
del calentador. La información muestral se reporta en la tabla

Costo de calefacción Temperatura externa media Aislamiento del ático Antigüedad del calentador
ESTADÍSTICA II

($) (°F) (pulgadas) (años)


250 35 3 6
360 29 4 10
165 36 7 3
43 60 6 9
92 65 5 6
200 30 5 5
355 10 6 7
290 7 10 10
230 21 9 11
120 55 2 5
73 54 12 4
205 48 5 1
400 20 5 15
320 39 4 7
72 60 8 6
272 20 5 8
94 58 7 3
190 40 8 11
235 27 9 8
139 30 7 5

a) Obtener la prueba global de significancia para el modelo.

1) Formulación de Hipótesis
H 0 : β 1=β 2=β 3=0
H 1 : Uno o más de los parámetros del modelo no son iguales a cero.

2) Estadístico de Prueba

CMR
F= =¿
CME
3) Valor Crítico
F(1−α ; p ;n− p−1)=¿
F F 1−α ( p ;n− p−1), por lo tanto, la hipótesis Ho

6.5618E-06 =0.0000065618
Valor- p =0.000 ¿ α =0.05 , por lo tanto, se rechza H 0

CONCLUSIÓN: Uno o más de los parámetros del modelo no son iguales a cero,
esto significa que por lo menos existe una variable independiente que se relacione
ESTADÍSTICA II

significativamente con la V.D costo de calefacción. Por lo tanto, el modelo de


regresión lineal múltiple es significativo.

b) Obtener la prueba T de significancia para cada uno de los parámetros del modelo.

 Para β 1

4) Formulación de la Hipótesis
H 0 : β 1=0

H 1: β1≠ 0

5) Estadístico de prueba

bi
T=
sb i

6) Valor crítico

t α =¿
(1− ,n− p−1)
2

Región crítica

T −t (1− α ,n− p−1), por lo tanto, la hipótesis Ho


2

Valor-p =α =0.05 por lo tanto, H 0

Conclusión: el coeficiente de la temperatura externa es β 1 ≠ 0 , esto implica que, el


costo de calefacción tiene relación significativa con la variable temperatura externa.

 Para β 2

4) Formulación de la Hipótesis
H 0 : β 2=0

H 1: β2≠ 0

5) Estadístico de prueba

bi
T=
sb i

6) Valor crítico
ESTADÍSTICA II

t α
(1− ,n− p−1)
2

T −t (1− α ,n− p−1), por lo tanto, la hipótesis Ho


2

Conclusión: El coeficiente del aislamiento del atico es β 2 ≠ 0 , esto implica que, el costo
de calefacción tiene relación significativa con la variable aislamiento del atico.

 Para β 3

7) Formulación de la Hipótesis
H 0 : β 3=0

H 1: β3≠ 0

8) Estadístico de prueba

bi
T= =¿
sb
i

9) Valor crítico

t α =¿
(1− ,n− p−1)
2

T t (1− α ,n− p−1), por lo tanto, la hipótesis Ho


2

Conclusión: El coeficiente de la antigüedad del calentador es β 3=0 , esto implica que,


el costo de calefacción no tiene relación significativa con la variable antigüedad del
calefactor.

Por lo tanto, el modelo de regresión múltiple es significativo y adecuado para estimar o


predecir.

3. El gerente de ventas de una compañía de refacciones para automóviles, quiere desarrollar un modelo
para predecir, en el mes de junio, las ventas anuales totales para una región. Si las ventas regionales se
pueden predecir, entonces se podrán estimar las ventas totales de la compañía. El número de
repuestos de la región que mantienen en inventario las refacciones de la compañía y el número de
automóviles registrados para cada región, desde el primero de junio, son las dos variables de
predicción que el gerente quiere investigar, se obtiene los siguientes resultados.

VENTA (millones) NÚMERO DE NÚMERO DE


Y REPUESTOS X1 AUTOMOVILES X2
(miles) registrados (miles)
ESTADÍSTICA II

52.5 2.011 24.6


26 2.850 22.1
20.2 6.50 7.9
16 4.80 12.5
30 1.694 9
46.2 2.302 11.5
35 2.214 20.5
3.5 1.25 4.1
33.1 1.840 8.9
25.2 1.233 6.1
38.2 1.699 9.5
a) Obtener la prueba global de significancia para el modelo.

b) Obtener la prueba global de significancia para el modelo.

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Regresió 2.4099142
n 2 715.217156 357.608578 4 0.15164605
Residuos 8 1187.12466 148.390583
Total 10 1902.34182

1) Formulación de Hipótesis
H 0 : β 1=β 2=0
H 1 : Uno o más de los parámetros del modelo no son iguales a cero.

2) Estadístico de Prueba

CMR
F= =2.40991424
CME
3) Valor Crítico
F 1−α ( p ;n− p−1)=¿ F
( 0.95,3 ;11−3−1 )=¿ F ( 0.95,3; 7)= ¿ 4.347¿ ¿ ¿

F< F1−α ( p ;n− p −1 ), no se rechaza Ho

Valor- p =0.1516 ¿ α =0.05 , por lo tanto, no se rechaza H 0

CONCLUSIÓN: Los parámetros del modelo son iguales a cero, esto significa que
no existe una variable independiente que afecta a la V.D venta.

c) Obtener la prueba T de significancia para cada uno de los parámetros del modelo.

Coeficientes Error típico Estadístico t Probabilidad


ESTADÍSTICA II

Intercepción 21.6272572 9.84869003 2.19595267 0.05936741


Variable X 1 -2.29867752 2.36312129 -0.97272939 0.35917709
Variable X 2 1.1211889 0.56188765 1.99539694 0.08109239

 Para β 1

1) Formulación de la Hipótesis
H 0 : β 1=0

H 1: β1≠ 0

2) Estadístico de prueba

bi
T= = -0.97272939
sb
i

3) Valor crítico

t α =± t (0.975 ,11−2−1) =± t (0.975;8 )=± 2.306


(1− ,n− p−1)
2

T > ¿ t (1− α ,n− p−1), por lo tanto, no se rechaza Ho


2

Valor-p =0.35917709 ¿ α =0.05 por lo tanto, no se rechaza H 0

Conclusión: El coeficiente del número de repuestos es β 1=0 , esto implica que no


afecta a la V.D venta.
La variable venta no tiene relación significativa con la variable número de repuestos.

 Para β 2

1) Formulación de la Hipótesis
H 0 : β 2=0

H 1: β2≠ 0

2) Estadístico de prueba

bi
T= = 1.99539694
sb
i

3) Valor crítico

t α =± t (0.975 ,11−2−1) =± t (0.975;8 )=± 2.306


(1− ,n− p−1)
2
ESTADÍSTICA II

T < ¿ t (1− α ,n− p−1), por lo tanto, no se rechaza H 0


2

Valor-p =0.08109239 ¿ α =0.05 por lo tanto, no rechaza H 0

Conclusión: el coeficiente del número de automóviles es β 2=0 , esto implica que no


afecta a la V.D venta.
La variable venta no tiene relación significativa con la variable número de automóviles.

4. Se sometió a prueba un grupo de camiones ligeros con motores que utilizan diesel como combustible
para saber si la humedad, la temperatura del aire y la presión barométrica influyen en la cantidad de
óxido nitroso que emiten (en ppm). Las emisiones se midieron en distinto momentos y en diversas
condiciones experimentales. Los datos se presentan en la tabla.
Óxido nitroso Humedad Temperatura Presión
Y X1 X2 X3
0.90 72.4 76.3 29.13
0.91 41.6 70.3 29.35
0.96 34.3 77.1 29.24
a) 0.89 35.1 68.0 29.27 Obtener la
1.00 10.7 79.0 29.78 prueba global
1.10 12.9 67.4 29.39 de significancia
1.15 8.3 66.8 29.69 para el modelo.
b) 1.03 20.1 76.9 29.48 Obtener la
0.77 72.2 77.7 29.09 prueba T de
1.07 24.0 67.7 29.60 significancia
1.07 23.2 76.8 29.38 para cada uno
0.94 47.4 86.6 29.35 de los
1.10 31.5 76.9 29.63 parámetros del
1.10 10.6 86.3 29.56 modelo.
c) 1.10 11.2 86.0 29.48 Obtener la
0.91 73.3 76.3 29.40 prueba global
0.87 75.4 77.9 29.28 de significancia
para el modelo.
0.78 96.6 78.7 29.29
ANÁLISIS DE VARIANZA
0.82 107.4 86.8 29.03
Grados de
0.95 Suma
54.9 de Promedio de los 29.37
70.9 Valor crítico
libertad cuadrados cuadrados F de F
Regresió
n 3 0.20187759 0.06729253 21.0690739 8.3827E-06
Residuos 16 0.05110241 0.0031939
Total 19 0.25298

1) Formulación de Hipótesis
H 0 : β 1=β 2=β 3=0
H 1 : Uno o más de los parámetros del modelo no son iguales a cero.
2) Estadístico de Prueba
ESTADÍSTICA II

CMR
F= =21.069
CME
3) Valor Crítico
F 1−α ( p ;n− p−1)=F (0.95 ;3 ;20−3−1)=F (0.95 ;3 ;16 )=3.239
F> F1−α ( p ;n− p −1 ), se rechaza Ho

Valor- p =0.00000838 ¿ α =0.05 , por lo tanto, se rechaza H 0

CONCLUSIÓN: Uno o más de los parámetros del modelo no son iguales a cero,
esto significa que por lo menos existe una variable independiente que se relacione
significativamente con la V.D óxido nitroso. Por lo tanto, el modelo de regresión
lineal múltiple es significativo.

d) Obtener la prueba T de significancia para cada uno de los parámetros del modelo.

Coeficientes Error típico Estadístico t Probabilidad


Intercepción -3.24212927 2.97754279 -1.08886068 0.29234479
Variable X 1 -0.00265497 0.00066013 -4.02188558 0.00098563
Variable X 2 0.00078096 0.00205773 0.37952592 0.70928739
Variable X 3 0.14522007 0.10046819 1.44543337 0.16763813

 Para β 1

1) Formulación de la Hipótesis
H 0 : β 1=0

H 1: β1≠ 0

2) Estadístico de prueba

bi
T= = -4.02188558
sb
i

3) Valor crítico

t α =± t (0.975 ,20−3−1)=¿ ±t =±2.12 ¿


(1− ,n− p−1) ( 0.975, 16 )
2

T ← t (1− α ,n− p−1), se rechaza Ho


2

Valor-p =0.00098563¿ α =0.05 por lo tanto, se rechaza H 0

Conclusión: El coeficiente de la humedad es β 1 ≠ 0 , esto implica que el óxido nitroso


tiene relación significativa con la variable humedad.
ESTADÍSTICA II

 Para β 2

1) Formulación de la Hipótesis
H 0 : β 2=0

H 1: β2≠ 0

2) Estadístico de prueba

bi
T= = 0.37952592
sbi

3) Valor crítico

t α =¿± t (0.975 ,20−3−1)=¿± t =±2.12 ¿


(1− ,n− p−1) ( 0.975, 16 )
2

T < ¿ t (1− α ,n− p−1), por lo tanto, no se rechaza H 0


2

Valor-p =0.70928739¿ α =0.05 por lo tanto, no se rechaza H 0.

Conclusión: El coeficiente de la temperatura es β 2=0, esto implica que el óxido nitroso


no tiene relación significativa con la variable temperatura.

 Para β 3

1) Formulación de la Hipótesis
H 0 : β 3=0

H 1: β3≠ 0

2) Estadístico de prueba

bi
T= =1.44543337
sb
i

3) Valor crítico

t α =¿± t (0.975 ,20−3−1)=¿± t =±2.12 ¿


(1− ,n− p−1) ( 0.975,16 )
2

T < ¿ t (1− α ,n− p−1), por lo tanto, no se rechaza H 0


2

Valor-p =0.16763813¿ α =0.05 por lo tanto, no se rechaza H 0


ESTADÍSTICA II

Conclusión: El coeficiente de la presión es β 3=0 , esto implica que el óxido nitroso no


tiene relación significativa con la variable presión.

También podría gustarte