Está en la página 1de 4

37) Consulte los datos Wage, donde se reporta informacin sobre los salarios anuales de una muestra de 100

trabajadores. Tambin se incluyen variables relacionadas con la industria, los aos de educacin y el gnero de cada trabajador. Determine la ecuacin de regresin con el salario anual como variable dependiente y los aos de educacin, gnero, aos de experiencia laboral, edad en aos y si el trabajador es miembro o no de un sindicato.
x1 Salarios anuales en dlares x2 Industria (1 = manufacturera, 2 = construccin, 0 = otra) x3 Ocupacin (1 = administrador, 2 = ventas, 3 = empleado de oficina,4 = servicios, 5 = profesor, 0 =otra) x4 Aos de educacin x5 Residente del sur (1 = s, 0 = no) x6 No blanco (1 = s, 0 = no) x7 Hispano (1 = s, 0 = no) x8 Mujer (1 = s, 0 = no) x9 Aos de experiencia laboral x10 Casado (1 = s, 0 = no) x11Edad en aos x12 Sindicalizado (1 = s, 0 = no)

a) Escriba la ecuacin de regresin. Haga un comentario sobre cada una de las variables. Y=-14.174+3.325x4-11.675x8+ 0.448x9 -5.355 x12 Los aos de educacin les aporta un 3.325 ms a los salarios anuales de los 100 trabajadores En el caso de gnero las mujeres disminuye su salario anual con 11.675 de total de 100 trabajadores. Los aos de experiencia aumentan al salario anual 0.448 de 100 trabajadores.

La edad en aos en este anlisis no tiene relacin con los salarios anuales de 100 trabajadores Si el trabajador es sindicalizado disminuir con 5.355 del salario anual de 100 trabajadores.

b) Determine e interprete el valor R2. R2= 0.3656 Las variables independientes (Aos de educacin, genero, experiencia, sindicalizado o no) explican, o contabilizan, 36.56% de la variacin del salario anual de 100 trabajadores. En otras palabras, 50.03% de la variacin se debe a otras fuentes, como el error aleatorio o variables no incluidas en el anlisis. c) Elabore una matriz de correlacin. Qu variables independientes tienen correlaciones fuertes o dbiles con la variable dependiente? Detecta algunos problemas con la multicolinealidad?

La matriz nos dice que la ocupacin, aos de educacin, aos de experiencia laboral, estado civil, edad en aos, y si es sindicalizado no tienen una relacin fuerte con el salario de los 100 trabajadores (no afectan tanto en el salario de los trabajadores); industria, residente del sur, color de piel, hispano, genero tienen una relacin negativa, lo que nos dice que cuando aumenten estas variables el salario anual disminuir y cuando disminuyan el salario anual aumentara. No existen problemas de multicolinealidad ya que las correlaciones entre las variables independientes es dbil y no interfieren al analizar la correlacin de la variable dependiente con cada variable independiente. d) Realice una prueba global de hiptesis en el conjunto de variables independientes. Interprete sus resultados. Es razonable continuar el anlisis o debera detenerse en este punto?

El valor P es: 7.523e-09 Nivel de significancia es: 0.05 Valor p < Valor de Significancia H0: 4= 8 = 9 =11= 12= 0 H1: No todas las i son 0.
Como los valores F son mayores que el nivel de significancia, entonces se rechaza nuestra hiptesis nula, por lo tanto no todas la son iguales a 0.

Esto significa que algunas variables independientes (genero, eduacin, experiencia etc.) tienen la capacidad de explicar la variacin en la variable dependiente (salario anual). Yo si esperaba que las variables independientes tengan un gran peso sobre el salario anual. La prueba global lo demuestra. e) Realice una prueba de hiptesis con cada una de las variables independientes. Considerara eliminar algunas de estas variables? Si es as, cules? Para la educacin H0: 4=0 H1: 4 0 Para el genero H0: 8=0 H1: 8 0 Para experiencia H0: 9=0 H1: 9 0 Edad H0: 11=0 H1: 11 0 Sindicato H0: 12=0 H1: 12 0

Observando la tabla interpretamos que todos los valores-p de cada una de las variables independientes son menores al nivel se significancia de 0.05. Por ende se rechaza la hiptesis nula y sabemos que todos los coeficientes de las variables independientes son diferentes a 0. Con esto interpretamos que todos las variables independientes afectan al salario anual. Consideramos que no se debe eliminar ninguna variable. f) Realice de nuevo el anlisis, pero ahora sin las variables independientes que no sean significativas. Elimine una variable a la vez.

Todos los coeficientes de regresin fueron significativos al ser diferentes a cero, ninguna variable independiente fue eliminada y por ende queda la misma ecuacin. Y=-14.174+3.325x4-11.675x8+ 0.448x9 -5.355 x12

g) E labore un histograma o bien un diagrama de tallo y hojas de los residuos a partir de la ecuacin de regresin final. Es razonable concluir que se cumpli la suposicin de normalidad?

Al ver la grfica nos damos cuenta que no cumple con la suposicin de normalidad. No es una distribucin normal ya que esta sesgada a la izquierda. h) Trace los residuos contra los valores ajustados a partir de la ecuacin de regresin final. Trace los residuos en el eje vertical y los valores ajustados, en el eje horizontal.

En el caso de nuestra grafica tenemos muchos datos anormales que caen muy alejados a la recta. Evaluando la linealidad de la ecuacin de regresin mltiple vemos que confirma la suposicin de linealidad. En la grafica a la izquierda se muestran los trazos residuales para el precio de las casas. Los residuos se trazan en el eje vertical y estn centrados respecto de cero. Hay residuos positivos y negativos. Los trazos de los residuos muestran una distribucin aleatoria de valores positivos y negativos a los largo de todo el rango de la variable en el eje horizontal. En nuestra grafica existe un patrn en los residuos por lo que nuestra relacin quiz no sea lineal y tal vez la ecuacin sea cuadrtica, lo que indica que se necesita el cuadrado de una de las variables.