Está en la página 1de 6

ANÁLISIS ESTADÍSTICO

INGENIERÍA CIVIL
UNIDAD I - REGRESIÓN Y CORRELACIÓN MÚLTIPLE
PRUEBA PILOTO PARA EL SISTEMÁTICO 1

 Crear una base de datos usando el programa IBM SPSS Statistics 23 con las
variables que se indican enseguida, definiendo correctamente nombre y etiqueta.

El señor Fred G. Hire es el gerente de recursos humanos de St. Luke’s Medical


Center. Como parte de su informe anual al director del centro médico se le pide
que presente un estudio de los salarios de los empleados. Como hay más de 1000
empleados, no tiene personal suficiente para recabar la información de todos los
empleados, así es que selecciona una muestra aleatoria de 30. De cada empleado
recaba: Salario mensual; tiempo de servicio en St. Luke’s, en meses; y si el
empleado tiene un trabajo técnico o de oficina. A los que tienen un trabajo técnico
se les asigna 1, y los que tienen un trabajo de oficina, 0.

Empleado Salario mensual Tiempo de servicio Edad Trabajo


($) (meses)
1 1769 93 42 0
2 1740 104 33 0
3 1941 104 42 1
4 2367 126 57 1
5 2467 98 30 1
6 1640 99 49 1
7 1756 94 35 0
8 1706 96 46 1
9 1767 124 56 0
10 1200 73 23 1
11 1706 110 67 1
12 1985 90 36 1
13 1555 104 53 0
14 1749 81 29 0
15 2056 106 45 0
15 1729 113 55 1
17 2186 129 46 1
18 1858 97 39 1
19 1819 101 43 1
20 1350 91 35 1
21 2030 100 40 0

1
22 2550 123 59 0
23 1544 88 30 0
24 1766 117 60 1
25 1937 107 45 1
26 1691 105 32 1
27 1623 86 33 0
28 1791 131 56 1
29 2001 95 30 1
30 1874 98 47 0

1. Realice una prueba de Hipótesis Global para determinar si alguno de los


coeficientes de regresión es diferente de cero.

Plantemos la hipótesis:
H0: β1 =β2 =β3 = 0 [No hay de regresión múltiple]
H1: Al menos una de las βi es diferente de cero [i =1,2,3]

ANOVAa

Suma de Media
Modelo cuadrados gl cuadrática F Sig.

1 Regresión 776453.130 3 258817.710 3.984 .018b

Residuo 1689028.237 26 64962.624

Total 2465481.367 29

a. Variable dependiente: Salario mensual ($)


b. Predictores: (Constante), Trabajo, Edad, Tiempo de servicio (meses)

Decisión: H0 se rechaza porque p= sig. = 0,018≤α=0,05


Conclusión: Podemos afirmar con un nivel de significación de 0,05 que al menos una de las
βi es diferente de cero.

2. Desarrolle una matriz de Correlación. Realicen las pruebas de hipótesis para los
coeficientes de correlación de la variable dependiente con cada una de las
variables independientes. ¿Qué variables quedan en el modelo? Analice si hay

2
problemas de multicolinealidad, en caso que haya, resuelve este problema. ¿Qué
variables quedan en el modelo?

Correlaciones

Salario mensual Tiempo de servicio


($) (meses) Edad Trabajo

Salario mensual ($) Correlación de


1 .510** .256 .011
Pearson

Sig. (bilateral) .004 .173 .952

N 30 30 30 30
Tiempo de servicio Correlación de
.510** 1 .776** .157
(meses) Pearson
Sig. (bilateral) .004 .000 .407
N 30 30 30 30
Edad Correlación de
.256 .776** 1 .094
Pearson
Sig. (bilateral) .173 .000 .620
N 30 30 30 30
Trabajo Correlación de
.011 .157 .094 1
Pearson

Sig. (bilateral) .952 .407 .620

N 30 30 30 30

**. La correlación es significativa en el nivel 0,01 (bilateral).

1.Planteamiento de las hipótesis


H0: ρyx1 = 0 [No existe correlación entre el salario mensual ($) y Tiempo de servicio
(meses)]
H1: ρyx1 ≠ 0 [Existe correlación entre el salario mensual ($) y Tiempo de servicio (meses)]
Decisión: se rechaza H0, porque p = sig. = 0,004 ≤ α = 0,05
Conclusión: podemos afirmar con un nivel de significación de 0.05 que hay correlación
entre la variable dependiente (y) que es el salario mensual ($) y Tiempo de servicio
(meses). Por lo tanto, la variable X1, no excluimos del modelo de regresión.

2.Planteamiento de las hipótesis


H0: ρyx2 = 0 [No existe correlación entre el salario mensual ($) y la edad]
3
H1: ρyx2 ≠ 0 [Existe correlación entre el salario mensual ($) y la edad]
Decisión: No se rechaza H0, porque p = sig. = 0.173 > α = 0,05
Conclusión: No podemos afirmar con un nivel de significación de 0.05 que hay correlación
entre la variable dependiente (y) que es el salario mensual ($) y la edad. Por lo tanto, la
variable X2, excluimos y no es de utilidad en el modelo de regresión.

3.Planteamiento de las hipótesis


H0: ρyx3 = 0 [No existe correlación entre el salario mensual ($) y si el empleado trabaja
como técnico o en oficina]
H1: ρyx3 ≠ 0 [Existe correlación entre el salario mensual ($) y si el empleado trabaja como
técnico o en oficina]
Decisión: No se rechaza H0, porque p = sig. = 0.952 > α = 0,05
Conclusión: No podemos afirmar con un nivel de significación de 0.05 que hay correlación
entre la variable dependiente (y) que es el salario mensual ($) y si el empleado trabaja como
técnico o en oficina. Por lo tanto, la variable X3, excluimos y no es de utilidad en el modelo
de regresión.

Después de haber realizado las relaciones de “y” con cada una de las “x”, se observó
multicolinealidad es decir, correlación entre las variables independiente.

Al terminar las hipótesis solo nos queda una variable independiente x1: y Tiempo de
servicio (meses)
Estos valores se encuentran fuera del rango -0.7 y 0.7
que nos indica que hay problema de multicolinealidad
Rx1x2= 0,776 entre las variable x1 el tiempo de servicios (meses) y x2
la edad; pero la variable edad ya se excluyó del modelo
de regresión.

3. Realice una prueba de hipótesis para cada uno de los coeficientes de regresión de
las variables que se quedaron en el modelo. ¿Hay necesidad de eliminar otras
variables independientes?

4
Coeficientesa

Coeficientes
Coeficientes no estandarizados estandarizados

Modelo B Error estándar Beta t Sig.

1 (Constante) 761.047 346.916 2.194 .037

Tiempo de servicio (meses) 10.484 3.345 .510 3.134 .004

a. Variable dependiente: Salario mensual ($)

Hipótesis
H0: β1 = 0 [No existe relación entre el salario mensual ($) y Tiempo de servicio (meses)]
H1: β1 ≠ 0 [Existe relación entre el salario mensual ($) y Tiempo de servicio (meses)]
Decisión: Se rechaza H0, porque p = sig. = 0,004 ≤ α = 0,05
Conclusión: podemos afirmar con un nivel de significación de 0.05, que β1 es diferente de
cero. Por consiguiente, la variable X1, tiempo de servicio (meses), no excluimos siendo de
utilidad en el método de regresión.

4. Determine la ecuación de Regresión de Mínimos cuadrados, usando las variables


que entran en el modelo de regresión. Interprete los coeficientes de regresión.

Coeficientesa

Coeficientes
Coeficientes no estandarizados estandarizados

Modelo B Error estándar Beta t Sig.

1 (Constante) 761.047 346.916 2.194 .037

Tiempo de servicio (meses) 10.484 3.345 .510 3.134 .004

a. Variable dependiente: Salario mensual ($)

Y´=761.047 + 10.484x1
Donde:
Y: Salario mensual ($)
X1: Tiempo de servicio (meses)
Interpretación del coeficiente de regresión

 En promedio, por cada aumento en el mes de tiempo de servicio, el salario


mensual del trabajador aumenta en 10.484 dólares.

5
5. Determine e interprete el Coeficiente de Correlación Múltiple y el Coeficiente de
Determinación.

Resumen del modelo

R cuadrado Error estándar


Modelo R R cuadrado ajustado de la estimación
a
1 .510 .260 .233 255.316

a. Predictores: (Constante), Tiempo de servicio (meses)

R= 0.510 correlación moderadamente débil entre el salió mensual ($) de los trabajadores
y el tiempo de servicio en meses.

R2= 0.260 El 26% de la variación en el salario mensual ($) de los trabajadores se debe a la
variación entre el tiempo de servicio mensual.

También podría gustarte