Está en la página 1de 27

ESTADÍSTICA

MODELO DE REGRESION
DIAGRAMA DE DISPERSIÓN Y RECTA DE REGRESIÓN

PASOS
-Gráficos
- Cuadro de diálogos antiguos.
-Dispersión /Puntos

Parece que el peso aumenta con la altura. La relación es directa.

OTRA OPCION
-Analizar
- Regresión
- Estimación curvilínea
- Escoger la recta de regresión
COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON (r)

Con el diagrama de dispersión o de puntos se observa cuan relacionados están las dos
variables. R varía entre -1 y 1, mientras más se acerca a 0, la relación de ambas variables es
más débil.

- Incorrelación r=0 (No hay relación entre las variables)


- Relación directa r=0.75 (Hay una fuerte relación entre ambas variables)
- Relación inversa R=-0.2(Hay una débil relación entre ambas variables)

COVARIANZA (Sxy)

Esta nos informa si la nube de puntos es creciente (directa) o decreciente(inversa), pero no nos
muestra el grado de correlación como lo hace el coeficiente de correlación.

- Sxy > 0
- Sxy < 0
- Sxy = 0

HIPÓTESIS

Ho=Hipótesis Nula. (ningún cambio, ninguna diferencia, ningún efecto)


H1=Hipótesis alternativa. (Siempre queremos probar la alternativa y decir que rechazamos
Ho)

-hipótesis alternativa bilateral (dos colas con áreas de rechazo)


-hipótesis alternativa unilateral a la izquierda (<) o derecha (>) ( una cola con área de
rechazo)

ESTRUCTURA DE PRUEBA DE HIPÓTESIS

1. Plantear Ho y H1
2. Establecer el nivel de significancia
3. Escoger el estadístico de prueba = Cálculo del estadístico de contraste
4. Regla de decisión (Toma la decisión)
5. Conclusiones
EJERCICIO 1: HIPÓTESIS PARA LA MEDIA (VARIABLES INDEPENDIENTES)

Se tiene los montos de miles de dólares de la compra de bonos del exterior de 20 empresas del
sector minero, en las cuales 10 de dichas empresas utilizaron la bolsa de valores y las 10 no la
utilizaron.

SUPUESTOS:

- Las variables son Independientes


- Se cumple homocedasticidad
- Los grupos siguen una distribución normal.

MONTO BV
237 SI
289 SI
257 SI
228 SI
303 SI
275 SI
262 SI
304 SI
244 SI
233 SI
194 NO
240 NO
230 NO
186 NO
265 NO
222 NO
242 NO
281 NO
240 NO
212 NO
1. Planteamos hipótesis.
Ho: U1=U2: Las medias de ambos grupos son iguales
Ho: U1≠U2: Las medias de ambos grupos son diferentes.
2. Escogemos significancia
1-α=95%
Α=5% = 0.05
3. Prueba estadística (Prueba T para muestras independientes. )

PASOS T de muestras independientes


Analizar Compare medias  prueba T de muestras independientes
Variable de Prueba: Montos/ Grupo de variable: BV.  Definir grupos:
Valor 1: 1 (si) /Valor 2: 2 (no)

Estadísticas de grupo
BOLSADE Desv. Desv. Error
VALORES N Media Desviación promedio
MONTOS EN SI 10 263,20 28,479 9,006
DÓLARES NO 10 231,20 29,393 9,295

4. Toma de decisión
No importa si asumimos que las varianzas son iguales o desiguales ya que tienen el
mismo valor en ambos casos, sin embargo, si prestamos atención. P-value = 0.862 lo
que significa aceptar la Ho: σ 2 1=σ 2 2

Con la evaluación de medias, prestamos atención a la prueba T con 18 grados de


libertad p- value = 0.024 lo cual indica que rechazamos Ho y aceptamos H1: Las medias
de ambos grupos difieren en 32. Esto quiere decir que las empresas que si utilizaron la
BV tienen mas dinero en promedio que los que no utilizaron la bolsa de valores.

EJERCICIO 2: HIPÓTESIS PARA LA VARIANZA CON DATOS

Un analista de mercados bursátiles está evaluando la variabilidad medida por la desviación


estándar σ=2. Durante su análisis, él registró las mediciones 4.1,5.2 y 10.2 ¿Estos datos
confirman o desaprueban lo dicho por él? Pruebe la hipótesis apropiada y construya un
intervalo de confianza de 90% para estimar el verdadero valor de población.
Ho: σ 2=4

H1: σ 2 ≠ 4

Hallamos s2=10.57

EJERCICIO 3: TABLAS DE CONTINGENCIA

Los empleados de una compañía eligen uno de tres posibles planes de pensión. La
gerencia desea saber con α= 0.05 si la preferencia en la elección es independiente de
la clasificación del contrato (asalariados y por horas) De una muestra aleatoria de 500
empleados se obtiene la siguiente tabla de contingencia.

Tipo de Contrato Plan 1 Plan 2 Plan 3 Total


Asalariados 160 140 40 340
Por Horas 40 60 60 160
Total 200 200 100 500

1. Planteamos hipótesis.
Ho: Hay independencia de variables. La preferencia de la elección de planes es
independiente de la clasificación del contrato.
H1: Hay dependencia de variables.
2. Escogemos significancia
1-α=95%
Α=5% = 0.05
3. Prueba estadística (Prueba de ji-cuadrado- Tablas cruzadas)

El ji-cuadrado reconoce el grado de asociación entre dos variables dicotómicas o


politómicas. Para plasmar el cuadro de contingencia primero ponderamos los datos.

PASOS PARA PONDERACÓN


Datos Ponderar casos  ponderar casos mediante: Frecuencia  aceptar
Luego hacemos el análisis de las tablas cruzadas:

PASOS PARA tablas cruzadas


Analizar análisis descriptivo  Tablas cruzadas  Filas: tipo de contrato/
columna: planes  estadísticos: chi cuadrado  casillas(porcentaje columnas)
La variable independiente va en las filas
La variable de consecuencia va en las columnas.
INTERPRETACIÓN DE LA TABLA DE CONTINGENCIA USANDO LOS PORCENTAJES.
Podemos interpretar este cuadro de la siguiente manera.
El 80% de los Asalariados escogen el plan 1 en contraste con los de categoría por horas
que solo el 20% escoge el plan 1. De forma general Los planes 1 y 2 son más atractivos
para los asalariados. Mientras que el Plan 3 parece ser más interesante para los que
trabajan en la categoría por horas.

4. Toma de decisión
Si CHI-cuadrado empírico es mayor que el chi cuadrado teórico entonces rechazamos
la Ho. Por otro lado, p-value = 0.000 lo cual indica que es menos a 0.05. Entonces de
esta manera rechazamos H0: Independencia de variables.

5: Conclusión:
Las preferencias de los planes dependen de la clasificación salarial de los trabajadores
en la empresa.

EJERCICIO 4: TABLAS DE CONTINGENCIA DESDE OTRA PERSPECTIVA

¿Qué tipo de inversión se necesita en las regiones tipificadas como pobres? Determinar el tipo
de inversión necesaria por regiones. (Tomamos en cuenta

Tipos de inversión Ayacucho Huancavelic Apurímac Cajamarca


a
OI 30 60 15 15
APP 15 15 30 30
IED 30 15 15 30

1. Planteamos hipótesis.
Ho: El tipo de inversión necesaria para salir de la pobreza de las regiones estipuladas
es diferente y de acuerdo a su realidad.
H1: El tipo de inversión necesaria para salir de la pobreza de las regiones estipuladas
es semejante y de acuerdo a su realidad.
2. Escogemos significancia
1-α=95%
Α=5% = 0.05
3. Prueba estadística (Análisis de correspondencia)

PASOS PARA EL ANÁLISIS DE CORRESPONDENCIA


Analizar Reducción de dimensiones  Análisis de correspondencia  filas:
TI/Columnas: Regiones  chi cuadrado-> Puntos de fila Simétrico Normalización.
EJERCICIO 5: REGRESION LINEAL CON UNA SOLA VARIABLE

Generamos una ecuación modelo para encontrar valores en los puntos de una función lineal.

Existe causa efecto:

- Variable X: Causa, Exógena, Explicativa, Predictiva, independiente


- Variable Y: Efecto, Endógena, Explicada, Predicha, dependiente
PASOS PARA LA REGRESION
Analizar Regresión  Lineales  Variable X (independiente), Variable Y (dependiente)
 Observo en la tabla R y R2

Coeficiente de correlación de Pearson: 0.83

Coeficiente de determinación R cuadrado: 0.703 Explica que el 70% la variabilidad de la


variable Y.

R ajustado para dos variables

Calculo de ANOVA

SCR: Suma de cuadrados de la regresión

SCE: Suma de cuadrados de residuo

SCT: Suma de cuadrados totales.

CORRELACIONES

Expresa hasta que punto dos variables están relacionadas linealmente, también indica la
dirección de la relación.

Ho: B1=0, No hay correlación significativa entre variables: Existe relación


H1: B1≠0, Existe una correlación significativa entre variables: No hay relación

PASOS PARA LA CORRELACIÓN


Analizar Correlacionar  Bivariadas  Aceptar
p-value = 0.000 lo cuál indica que rechazamos la Ho.

Finalmente graficamos el diagrama de dispersión.

Por lo tanto, afirmamos que hay una relación inversa entre la variable X y Y.

EJERCICIO 5: REGRESION LINEAL MULTIPLE (VARIAS VARIABLES EXÓGENAS)

PRUEBAS DE NORMALIDAD A LA VARIABLE DEPENDIENTE

Las regresiones múltiples tienen dos fines: Exploratorio y predictivo (Predecir el


comportamiento)

Variable Endógena: Salarios

Salario = f(Edad, nivel educativo, género, TTP)

1. Observamos si el salario tiene una distribución normal y también hallamos la prueba


KS (Kolmogorov-Smirnov) para ver su normalidad.

PASOS PARA HALLAR NORAMLIDAD CON KS


Analizar Pruebas no paramétricas  cuadro de diálogos antiguos  KS de una
muestra  Lista de variable de prueba (la variable que quiero evaluar que en este
caso es el salario (Y))  Check en Normal  aceptar

Ho: Los datos analizados siguen una distribución normal.


H1: Los datos analizados NO siguen una distribución normal.

P-value = 0.00, indica que rechazamos Ho. Por lo tanto, Los datos analizados no tienen una
distribución normal. Y la variable endógena (salarios ) presenta un sesgo positivo.

2. Por la no normalidad, convertimos el salario en logaritmos.


Generando una nueva variable dependiente Lsalario.

PASOS PARA GENERAR UNA VARIABLE CON LOG.


Transformar  Calcular variable  nuevo nombre en “variable objetivo” 
Grupo de funciones “aritméticas”  Funciones y Variables especiales “Ln” 
Arrastramos la función Ln al cuadro expresión numérica  arrastramos salarios

Volvemos a calcular KS y el histograma para observar si hay normalidad.


p-value = 0.01

OTRA FORMA DE HALLAR LA DISTRIBUCIÓN NORMAL


Analizar  Estadísticos descriptivos  Explorar  Lista de dependientes
(Lsalarios)  Gráficos  Click en Gráficos de normalidad con pruebas Click en
histogramas

La prueba de Shapiro – Wilk es viable cuando usemos muestras con más de 50 datos.

Como seguimos rechazando la normalidad, finalmente, escogemos los datos que más se
asemejan a una normalidad y este el es logaritmo neperiano del salario.

¿Qué modelo deberíamos preferir?

Por lo que evaluamos el test de Levene.


VARIANZAS EN DOS O MÁS GRUPOS (TEST DE LEVENE)
Ho: La varianza de los grupos son iguales
H1: La varianza de los grupos son diferentes
TEST DE LEVENE
Analizar  Estadísticos descriptivos  Explorar  Lista de dependientes (Lsalarios)
 Factor, otra variable como el género.

Aceptamos Ho: La varianza de los grupos son iguales. Por lo tanto elegimos Lsalario como
variable endógena.
REGRESIÓN DE LA EDAD CON EL GÉNERO

Edad =f(género)

Ho: B1=0, No hay correlación significativa entre variables: Existe relación


H1: B1≠0, Existe una correlación significativa entre variables: No hay relación

 p-value es 0.913 Aceptamos la Ho: No hay correlación significativa.

REGRESIÓN DE LA EDAD CON EL GÉNERO

Nivel Educativo =f(género)

Ho: B1=0, No hay correlación significativa entre variables: Existe relación


H1: B1≠0, Existe una correlación significativa entre variables: No hay relación
 p-value es 0.00. No hay evidencia significativa para aceptar Ho. Esto indica que
si hay una cierta asociación entre ambas variables.

REGRESIÓN DEL SALARIO CON EL GÉNERO

LSALARIO =f(género)

Ho: B1=0, No hay correlación significativa entre variables: Existe relación


H1: B1≠0, Existe una correlación significativa entre variables: No hay relación
R2= COEFICIENTE DE DETERMINACIÓN/ BONDAD DE AJUSTE 7.3% de comportamiento con
respecto a los salarios, el genero tiene un 7% de variación con respecto a los salarios.

DISCRIMINACIÓN SALARIAL

Mediante el cuadro de coeficientes podemos establecer la función del salario con respecto al
género.

Lsalario = 4.734 – 0.25G+ e(error de perturbación)


0.25
e −1=0.78−1=0.22=22 %
ESTADISTICA PARA UNA MUESTRA

Vamos a evaluar su promedio, entonces vamos a partir

H0: µ=0

H1: µ≠0

Queremos probar la afirmación de que la media de la poblacion es mayor que 35 (o la


puntuación media de 38.6 es significativamente mayor que 35)

H0: µ= 35 H1: µ˃35

Analizar  Comparar medias  prueba t para una muestra  pasamos Y  opciones


VALOR DE PRUEBA 35

Prueba para una muestra


Valor de prueba = 35
95% de intervalo de confianza de
Diferencia de
t gl Sig. (bilateral) la diferencia
medias
Inferior Superior
Y 1,643 14 ,123 3,600 -1,10 8,30

COMPARAR MEDIAS

Analizar  Comparar medias  prueba t para una muestra  Abrimos la caja de dialogo y
pasamos la variable  click en opciones ingresamos el nivel de confianza  continuar y
Ok

Prueba para una muestra


Valor de prueba = 0
95% de intervalo de confianza de
Diferencia de
t gl Sig. (bilateral) la diferencia
medias
Inferior Superior
Y 17,622 14 ,000 38,600 33,90 43,30
Antes de todo, se tiene que halla el análisis exploratorio

Analizar  Estadísticos descriptivos  explorar  Abrimos la caja de dialogo y pasamos la


variable  click en gráficos check en histpgramas y grafico de normalidad con pruebas 
continuar y aceptar

Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Y ,212 15 ,068 ,881 15 ,049
a. Corrección de significación de Lilliefors

H0: la muestra a sido extraída de población normal


H1: la muestra a sido extraída de población no normal

p-value ˃alfa

0.068 ˃0.05 se acepta la H0

REGLA: P-VALUE <α, SE Rechaza la H0.

PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS

Datos apareados

Analizar  comparar medias  prueba t para muestras relacionadas  cuadro de dialogo:


Variable1: antes, Variable2: después  click en opciones: elegimos el nivel de confianza.

Estadísticas de muestras emparejadas


Desv. Desv. Error
Media N Desviación promedio
Par 1 PRECIO AA 263,20 10 28,479 9,006
PRECIO DA 231,20 10 29,393 9,295

PARA MUESTRAS INDEPENDIENTE

Analizar  comparar medias  prueba t para muestras independientes  cuadro de


dialogo: Variable1: variable de prueba: montos, Grupo de Variable: BV Definir Grupos 1.
No 2.. si continuar.

Se usa si es tipo una variable damy.


CON BASE DE DATO DEL PROFESOR
EN LA BASE DE DATOS QUE SE ENCUESTO A 500 TRABAJADORES QUE LABORAN EN SECTOR
AGROINDUSTRIAL
Vamos a predecir

Salario de 500 trabajadores empleado en el sector (s/. x dia laborado).

Edada 20-70 años

Nivel educativo: Variable categorica (ordinal) cuyos vaores son 1,2,3 y 4

Genero: variable dammy cuyos valores son 1=mujer, 0= varón

TTP: Trabajo a tiempo parcial. Variable dammy cuyos valores son:

1 = si trabajan menos de tres días a la semana

2 = si trabajan más de tres días a la semana

El salario depende de la edad

El salario depende de nivel educativo

El salario depende del género (ósea puede haber descremación)

Si hay discrinacion salarial, y en que porcentaje?

1. Visualiar la data:
L
SALARIO=F(EDAD, NIVEL EDUCATIVO, GENERO, TTP)

PARA GRAFICAR: GRAFICO*cuadro de dialogo antiguo*histogramas

QUE S UTILIZA PARA TRANSFORMAR (LOGARITO)


Transformar*calcular variable*poner LSALARIO
H0: la distribución d la población
Saphiro wb para muestras pequeñas
Cormorrov: mas de 50

Prueba de Kolmogorov-Smirnov para una muestra


SALARIOS
N 500
Parámetros normalesa,b Media 114,90
Desv. Desviación 55,156
Máximas diferencias Absoluto ,118
extremas Positivo ,118
Negativo -,093
Estadístico de prueba ,118
Sig. asintótica(bilateral) ,000c
a. La distribución de prueba es normal.
b. Se calcula a partir de datos.
c. Corrección de significación de Lilliefors.

Por lo tanto, la variable endógena será variable (lsalario)

Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
SALARIOS ,118 500 ,000 ,898 500 ,000
a. Corrección de significación de Lilliefors

Edad con genero


Las relaciones simples, nos permiten afirmar inicialmente

Resumen del modelo


R cuadrado Error estándar
Modelo R R cuadrado ajustado de la estimación
1 ,005a ,000 -,002 10,845
a. Predictores: (Constante), GENERO

ANOVAa
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 1,418 1 1,418 ,012 ,913b
Residuo 58571,532 498 117,614
Total 58572,950 499
a. Variable dependiente: EDAD
b. Predictores: (Constante), GENERO

Regresión*lineal y pasas

Educacion con genrro

Resumen del modelo


R cuadrado Error estándar
Modelo R R cuadrado ajustado de la estimación
1 ,225a ,051 ,049 1,031
a. Predictores: (Constante), GENERO

Existe una relación con la educación

ANOVAa
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 28,285 1 28,285 26,594 ,000b
Residuo 529,673 498 1,064
Total 557,958 499
a. Variable dependiente: NIVEL EDUCATIVO
b. Predictores: (Constante), GENERO

Lsalario con genero


Coeficientesa
Coeficientes
Coeficientes no estandarizados estandarizados
Modelo B Desv. Error Beta t Sig.
1 (Constante) 4,734 ,024 194,449 ,000
GENERO -,251 ,040 -,270 -6,246 ,000
a. Variable dependiente: LSALARIO

R2 vondad de ajuste es 7% de ajuste esta reacionado con el genero

ANOVAa
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 7,305 1 7,305 39,010 ,000b
Residuo 93,260 498 ,187
Total 100,566 499
a. Variable dependiente: LSALARIO
b. Predictores: (Constante), GENERO

REGRESION MULTIPLE

Analizar * Regresión* lineales*

Coeficientesa
Coeficientes no Coeficientes 95.0% intervalo de
estandarizados estandarizados confianza para B
Límite Límite
Modelo B Desv. Error Beta t Sig. inferior superior
1 (Constante) 3,053 ,055 55,168 ,000 2,944 3,161
GENERO -,041 ,025 -,044 -1,663 ,097 -,090 ,007
EDAD ,031 ,001 ,739 24,041 ,000 ,028 ,033
NIVEL ,233 ,011 ,549 21,874 ,000 ,212 ,254
EDUCATIVO
TRABAJO A -,365 ,032 -,369 - ,000 -,427 -,303
TIEMPO PARCIAL 11,576
a. Variable dependiente: LSALARIO

SI LOS trabajadores difieren en un año de edad, el empleado de mayor de edad gana en


promedio 3% mas de salario
Si difiere en un nivel educativo, el empleado con mayor nivel de educación gana en
promedio 26% mas d salario
La persona que trabaja menos de tres días a la semana, gana en promedio 31% menos de
salario.
Por lo tanro, la tabla nos muestra el efecto genero.

Que es una variable dammy? O ficticia: le vamos generar damis para ver que ocurrió en
los puntas de la imagen

Transformar Recodificar en distintas variables  cambio de nombre y agrego valores


antiguos y nuevos luego aceptar
EL EFECTO DE EDUCACCION ES CONSTANTE B5 VA SER COEFICIENTE

Coeficientesa
Coeficientes no Coeficientes 95.0% intervalo de
estandarizados estandarizados confianza para B
Límite Límite
Modelo B Desv. Error Beta t Sig. inferior superior
1 (Constante) 3,609 ,051 70,680 ,000 3,508 3,709
GENERO -,125 ,026 -,134 -4,797 ,000 -,176 -,074
EDAD ,021 ,001 ,517 19,001 ,000 ,019 ,024
DE2 ,166 ,031 ,164 5,416 ,000 ,106 ,226
DE3 ,375 ,033 ,340 11,316 ,000 ,310 ,440
DE4 ,754 ,040 ,565 18,806 ,000 ,675 ,832
a. Variable dependiente: LSALARIO

LOS EFECTOS DE SOBRE EL SALARIO SON DIFIEREN SIGNIFICATIVAMNETE

Dividimos en grupo los salarios


1. Menor qu 200
2. De 200 a 300
3. Mayor que 300
Y comparamos con niveles educativos
Analizaremos si son independientes o no.
Se tiene que recodificar el variable de grupo separado
Transformar Recodificar en distintas variables  cambio de nombre y agrego valores
antiguos y nuevos luego aceptar

Lo caul se tiene SALARIOREC


Lo mismo ocurre para EDADREC
Para nalaizar se usa lo siguiente

Analizar Estadísticos Descriptivos  tablas cruzadas

En estadísticos  clik Ch2 continuar casillas activo columnas

a. Analizar*estadísticos descriptivos*frecuencia de edadrec

Descriptivos
Error
Edadrec Estadístico estándar
Salarios menos de Media 83,17 2,909
30 95% de intervalo de confianza para la Límite inferior 77,40
media Límite 88,93
superior
Media recortada al 5% 81,08
Mediana 77,00
Varianza 871,531
Desviación estándar 29,522
Mínimo 38
Máximo 182
Rango 144
Rango intercuartil 33
Asimetría 1,233 ,238
Curtosis 1,680 ,472
30-50 Media 113,63 2,971
95% de intervalo de confianza para la Límite inferior 107,78
media Límite 119,48
superior
Media recortada al 5% 109,51
Mediana 99,00
Varianza 2798,911
Desviación estándar 52,905
Mínimo 32
Máximo 384
Rango 352
Rango intercuartil 66
Asimetría 1,400 ,137
Curtosis 2,885 ,273
más de 50 Media 160,79 6,560
95% de intervalo de confianza para la Límite inferior 147,73
media Límite 173,85
superior
Media recortada al 5% 157,13
Mediana 155,00
Varianza 3443,106
Desviación estándar 58,678
Mínimo 68
Máximo 364
Rango 296
Rango intercuartil 77
Asimetría ,950 ,269
Curtosis 1,276 ,532

Las medias puntales son: 83.165;113.63;160.787


Los intervalos de confianza son [77.39;88.93], [107.78;119.47] y [147.72;173.84], los
cuales los anchos de intervalos de los primeros estratos son casi similares, teniendo el
tercer grupo una mayor amplitud, por lo que es muy probable que el tercer grupo
presente una diferencia con respecto a las demás medias.
b. Prueba de normalidad

Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Edadrec Estadístico gl Sig. Estadístico gl Sig.
Salarios menos de 30 ,114 103 ,002 ,908 103 ,000
30-50 ,113 317 ,000 ,900 317 ,000
más de 50 ,080 80 ,200* ,944 80 ,002
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors

Se encuentra la significancia estadística (p-value<α) en los dos primeros grupos


considerando K-S y considerando shapiro-wilk los tres grupos son
significativos, lo que nos lleva a manifestar que estamos frente a distribuciones
por cada grupo normales.

c. Analizar*comparar medias*anova de un factor

Clik en post hoc*activo tukey y Bonferroni* clik en opciones y activo prueba de


homogeneidad y aceptar
ANOVA
Salarios
Suma de Media
cuadrados gl cuadrática F Sig.
Entre grupos 272695,601 2 136347,801 54,414 ,000
Dentro de grupos 1245357,399 497 2505,749
Total 1518053,000 499

Prueba de homogeneidad de varianzas


Estadístico de
Levene gl1 gl2 Sig.
Salarios Se basa en la media 15,271 2 497 ,000
Se basa en la mediana 12,188 2 497 ,000
Se basa en la mediana y con 12,188 2 447,938 ,000
gl ajustado
Se basa en la media 14,249 2 497 ,000
recortada

Comparaciones múltiples
Variable dependiente: Salarios
Intervalo de confianza al
95%
(J) Diferencia de Desv. Límite Límite
(I) Edadrec Edadrec medias (I-J) Error Sig. inferior superior
HSD menos de 30-50 -30,466 *
5,677 ,000 -43,81 -17,12
Tukey 30 más de 50 -77,622* 7,460 ,000 -95,16 -60,09
30-50 menos de 30,466* 5,677 ,000 17,12 43,81
30
más de 50 -47,157* 6,263 ,000 -61,88 -32,43
más de 50 menos de 77,622*
7,460 ,000 60,09 95,16
30
30-50 47,157* 6,263 ,000 32,43 61,88
Bonferroni menos de 30-50 -30,466* 5,677 ,000 -44,10 -16,83
30 más de 50 -77,622 *
7,460 ,000 -95,54 -59,70
30-50 menos de 30,466*
5,677 ,000 16,83 44,10
30
más de 50 -47,157* 6,263 ,000 -62,20 -32,11
más de 50 menos de 77,622* 7,460 ,000 59,70 95,54
30
30-50 47,157* 6,263 ,000 32,11 62,20
*. La diferencia de medias es significativa en el nivel 0.05.

También podría gustarte