Está en la página 1de 9

Estadística Inferencial II

Tema 1. Regresión lineal múltiple


Ejercicio 1
En la tabla 2.1 se reportan datos sobre sueldos para n=14 analistas de sistemas
aleatoriamente muestreados de una gran población de esos individuos.

Tabla 2.1 Sueldos anuales para una muestra de analistas de sistemas.

Años de
Individuo Sueldo anual Años de
educación Sexo (X3)
muestreado (Y) experiencia (X1)
superior (X2)
1 $54 900 5.5 4.0 F
2 60 500 9.0 4.0 M
3 58 900 4.0 5.0 F
4 59 000 8.0 4.0 M
5 57 500 9.5 5.0 M
6 55 500 3.0 4.0 F
7 56 000 7.0 3.0 F
8 52 700 1.5 4.5 F
9 65 000 8.5 5.0 M
10 60 000 7.5 6.0 F
11 56 000 9.5 2.0 M
12 53 600 6.0 2.0 F
13 55 000 2.5 4.0 M
14 52 500 1.5 4.5 M

a) Obtenga la ecuación de regresión múltiple para estimar el sueldo anual en el que


las tres variables independientes son incluidas en el modelo.

1. Se ingresan los datos en la hoja de trabajo, pero en la variable sexo se le


asigna los valores F=0 y M=1

Página 1|9
Estadística Inferencial II

2. En el menú Estadísticas, seleccionamos Regresión, Regresión y Ajustar


modelo de regresión.

3. En respuesta seleccionar la variable dependiente (Sueldo anual Y) y en


predictores continuos seleccionar las variables independientes (Años de
experiencia X1, Años de educación superior X2, Sexo X3).

Página 2|9
Estadística Inferencial II

4. En Opciones seleccionar el nivel de confianza para todos los intervalos al


95%. Aceptar.

5. En gráficas, seleccionar Residuos vs. ajustes, aceptar. Aceptar.

Página 3|9
Estadística Inferencial II

Resultados en Minitab

Análisis de regresión: Sueldo anual (Y) vs. Años de experiencia, Años de


educación, Sexo (X3)

Análisis de Varianza
b)
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresión 3 105309901 35103300 6.92 0.008
Años de experiencia (X1) 1 62410675 62410675 12.31 0.006
Años de educación superior (X2) 1 41074777 41074777 8.10 0.017
Sexo (X3) 1 447733 447733 0.09 0.772
Error 10 50702242 5070224
Total 13 156012143

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
2251.72 67.50% 57.75% 38.40%

Coeficientes
c)
EE del
Término Coef coef. Valor T Valor p FIV
Constante 45495 2810 16.19 0.000
Años de experiencia (X1) 802 228 3.51 0.006 1.16
Años de educación superior (X2) 1596 561 2.85 0.017 1.02
Sexo (X3) 383 1287 0.30 0.772 1.14

Ecuación de regresión a)

Sueldo anual (Y) = 45495 + 802 Años de experiencia (X1)


+ 1596 Años de educación superior (X2) + 383 Sexo (X3)

Ajustes y diagnósticos para observaciones poco comunes

Sueldo Resid
Obs anual (Y) Ajuste Resid est.
5 57500 61472 -3972 -2.08 R
9 65000 60670 4330 2.19 R

Residuo grande R

b) Pruebe la hipótesis nula de que no existe un significativo efecto de regresión, con


un nivel de significancia del 5%.

Dado que la P reportada=0.008 es menor que 0.05, la hipótesis nula (Ho: β = β =β =0) se
1 2 3

rechaza al nivel de significancia de 5%. Concluimos que si existe relación en la población


entre las tres variables independientes como grupo y la variable dependiente sueldo.

Página 4|9
Estadística Inferencial II

c) Observe con cual coeficiente de regresión parcial se asocia con la menor


estadística t (y en consecuencia el mayor valor P) y determine si la contribución
de esa variable es significativa al nivel del 5%.

La variable con la menor estadística t en valor absoluto es la variable indicadora del sexo
(X3), con t=0.30, y en referencia al método del valor P, dado que la P reportada = 0.772 es
mayor que 0.05, la hipótesis nula (H0: β =0) no puede rechazarse al nivel de significancia
3

del 5%. Por lo tanto, concluimos que el sexo no contribuye significativamente al modelo y
debería eliminarse en la ecuación de regresión múltiple.

d) Continuando con el punto c), obtenga la ecuación de regresión múltiple para el


modelo reducido, el cual se basa en el uso de años de experiencia y años de
estudios como variables independientes, pero no en la variable indicadora del
sexo.

6. Nuevamente en el menú Estadísticas, seleccionamos Regresión,


Regresión y Ajustar modelo de regresión.
7. En respuesta seleccionar la variable dependiente (Sueldo anual Y) y en
predictores continuos seleccionar las variables independientes (Años de
experiencia X1, Años de educación superior X2). La variable sexo al no
contribuir significativamente al modelo se elimina.
8. Aceptar

Página 5|9
Estadística Inferencial II

Resultados en Minitab

Análisis de regresión: Sueldo anual (Y) vs. Años de experiencia, Años


de educación e)
Análisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


Regresión 2 104862168 52431084 11.28 0.002
Años de experiencia (X1) 1 75763656 75763656 16.29 0.002
Años de educación superior (X2) 1 41580689 41580689 8.94 0.012
Error 11 51149975 4649998
Falta de ajuste 10 51129975 5112997 255.65 0.049
Error puro 1 20000 20000
Total 13 156012143

Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
2156.39 67.21% 61.25% 46.25%

Coeficientes
f)
EE del
Término Coef coef. Valor T Valor p FIV
Constante 45511 2690 16.92 0.000
Años de experiencia (X1) 826 205 4.04 0.002 1.02
Años de educación superior (X2) 1604 536 2.99 0.012 1.02

Ecuación de regresión
d)
Sueldo anual (Y) = 45511 + 826 Años de experiencia (X1)
+ 1604 Años de educación superior (X2)

Ajustes y diagnósticos para observaciones poco comunes

Sueldo Resid
Obs anual (Y) Ajuste Resid est.
5 57500 61374 -3874 -2.09 R
9 65000 60548 4452 2.31 R

Residuo grande R

e) Pruebe la hipótesis nula de que no existe efecto de regresión, con un nivel de


significancia del 5%.

Dado que la P reportada=0.002 es menor que 0.05, la hipótesis nula (Ho: β = β =0) se
1 2

rechaza al nivel de significancia de 5%, concluimos que si existe un efecto de regresión


significativo.

Página 6|9
Estadística Inferencial II

f) Observe con cual coeficiente de regresión parcial se asocia la menor estadística t


reportada (y el mayor valor P) y determine si la contribución de esa variable al
modelo de regresión múltiple es significativa al nivel de 5%.

La variable con la menor estadística t es años de estudios (X2), con t=2.99, y en referencia
al método del valor P, dado que la P reportada = 0.012 es menor que 0.05, la hipótesis
nula (H0: β2=0) se rechazarse al nivel de significancia del 5% y concluimos que esta variable
si contribuye significativamente al modelo de regresión múltiple. Por lo tanto, conservamos
en el modelo de regresión esta variable de predicción.

El hecho de que no se elimine ninguna variable en este paso del procedimiento por pasos hacia atrás
significa que las variables independientes por incluir en el modelo de regresión múltiple ya han sido
determinadas.

g) Remítase a la gráfica de residuales para el modelo de regresión múltiple


reducido. ¿Parecen cumplirse los supuestos de linealidad e igualdad de las
varianzas condicionales?

El supuesto de linealidad parece cumplirse. Respecto de la igualdad de las varianzas condicionales,


sin embargo parece que las varianzas condicionales pueden ser ligeramente mayores en grandes
valores del sueldo estimado, más allá de $60000 en la escala horizontal de la gráfica de residuales.

Página 7|9
Estadística Inferencial II

h) En referencia a la ecuación de regresión múltiple basada en el uso de dos


variables independientes, estime el sueldo anual de un individuo con 5.5 años de
experiencia y 4.0 años de estudios de educación superior.

56467.3

9. En el menú Estadísticas, seleccionamos Regresión, Regresión y Predecir.

10. Y en las columnas se escriben los valores para años de experiencia= 5.5 y
años de educación 4.0, como lo establece el inciso h.

Página 8|9
Estadística Inferencial II

Resultados en Minitab

Predicción para Sueldo anual (Y)

Valor de
Variable configuración
Años de experiencia (X1) 5.5
Años de educación superior (X2) 4

EE de
Ajuste ajuste IC de 95% IP de 95%
56467.3 584.929 (55179.9, 57754.7) (51549.6, 61385.0)

h) i) j)

i) Determine el intervalo de confianza de 95% para el sueldo anual medio de todos


los individuos de la población con 5.5 años de experiencia y 4.0 años de estudio
de educación superior.

(55179.9, 57754.7)

j) Determine el intervalo de predicción de 95% para un individuo en particular con


5.5 años de experiencia y 4.0 años de estudio de educación superior. Compare
este intervalo con el obtenido en el punto i) e interprete el significado de este
intervalo de predicción.

(51549.6, 61385.0)

Como era de esperar este intervalo es más amplio que el intervalo de confianza del punto
i). Un intervalo de predicción es un intervalo de probabilidad para el valor de un valor
individual de Y, no para una media. El intervalo de predicción indica que hay una
probabilidad de 0.95 de que un individuo con 5.5 años de experiencia y 4.0 años de
estudios de educación superior reciba un sueldo anual de entre $51548 y $61386.

Página 9|9

También podría gustarte