Está en la página 1de 27

EJERCICIOS ANOVA SIMPLE (II)

2. Abre el fichero EXAM SEP07.


a.- Queremos comprobar si el nmero de horas (medido a travs de
la variable # horas) que pasan los estudiantes del Politcnico en la
Biblioteca guarda alguna relacin con su hbito de lectura (medido a
travs de la variable lectura). Ejecuta un ANOVA, utilizando un nivel
de significacin del 5 %, e interpreta el resultado que obtienes.
Variable respuesta: # horas.
Factor: hbito de lectura.
- Utilizando el ANOVA estudiaramos si existe relacin entre el
nmero de horas que pasan los estudiantes en la biblioteca del
Politcnico segn sus diferentes hbitos de lectura. Para ello se
realizar el siguiente contraste:
H 0 = todas las medias son iguales A = B = C = D
H 1 = alguna media no es igual alguna i es diferente.

- Para realizar el contraste se realizan los siguientes pasos:


Comparacin / Anlisis de la varianza / ANOVA simple.
- En variable dependiente se pondr:
lectura.

# horas y en factor:

- Para ver los resultados se consulta la Tabla ANOVA:


Tabla ANOVA para #_horas segn lectura
Anlisis de la Varianza
-----------------------------------------------------------------------------Fuente

Sumas de cuad.

Gl Cuadrado Medio Cociente-F

P-Valor

-----------------------------------------------------------------------------Entre grupos

87,2906

Intra grupos

2361,8

3
93

29,0969
25,3957

-----------------------------------------------------------------------------Total (Corr.)

2449,09

96

1,15

0,3349

- Como el p-valor obtenido ( 03349) es mayor que el nivel de


significacin
(005) se acepta H 0 ; y por lo tanto se puede decir
que la media de las horas que pasan los estudiantes del Politcnico es
similar en todos los casos independientemente del nivel de lectura de
cada uno; por lo tanto segn el ANOVA simple no existe relacin entre
el nmero de horas que pasan los estudiantes del Politcnico en la
Biblioteca y su hbito de lectura.
b.- Comprueba si se satisfacen los requisitos del ANOVA. Resultan,
entonces, fiables las conclusiones del apartado anterior?
- Los requisitos o condiciones del ANOVA son: normalidad,
homocedasticidad e independencia de los datos.
- Para estudiar estas condiciones se estudia la variable residuos,
para ello:
Botn guardar resultados / Marcar casilla residuos/Aceptar
- Aparece por lo tanto en la hoja de datos una nueva variable,
que es la de los residuos

1. Normalidad:
- El contraste que se realiza es el siguiente:
H 0 = variable residuos es normal
H 1 = variable residuos no es normal
Descripcin / Distribuciones / Ajuste de distribuciones (datos no
censurados).
En datos poner residuos.
- Para contrastar la normalidad se mira la ventana de Test de
bondad de ajuste, y los p-valor que all aparecen.
Tests de Bondad de Ajuste para RESIDUALS
Contraste Chi-cuadrado
---------------------------------------------------------------------------Lmite
Inferior

Lmite
Superior

menor o igual
-5,7058

Observada

-5,7058
-3,34551

Frecuencia
Esperada Chi-cuadrado

14
15

0,29

12,12

0,68

-1,58048

-1,58048

8,76289E-7

12,13

0,81

1,58048

11

12,13

0,10

1,58048

3,34551

3,34551

5,7058

5,7058

14

12,12

-3,34551

8,76289E-7

mayor

Frecuencia

11

12,12

0,29

12,12

0,10

12,12

0,81

14

12,12

0,29

---------------------------------------------------------------------------Chi-cuadrado = 3,37137 con 5 g.l.

P-Valor = 0,642933

Estadstico DMAS de Kolmogorov = 0,110348


Estadstico DMENOS de Kolmogorov = 0,050904
Estadstico DN global de Kolmogorov = 0,110348
P-Valor aproximado = 0,188487

- Segn ambos p-valor, tanto el de Chi-cuadrado (0642933),


como el de Kolmogorov (0188487), se acepta H 0, puesto que son
mayores que el nivel de significacin del 5%, por lo tanto segn estos
test la variable es normal.
- Tambin se estudian los p-valor obtenidos de los test de
normalidad; para verlos: Botn amarillo/Test normalidad.
Tests para la Normalidad para RESIDUALS
Estadstico chi-cuadrado de bondad de ajuste = 48,2371
P-valor = 0,000638325
Estadstico W de Shapiro-Wilks = 0,95203
P-valor = 0,00490306
Puntuacin Z para asimetra = 1,71722
P-valor = 0,0859391
Puntuacin Z para curtosis = 0,242493
P-valor = 0,808394

- Dos de los test para la normalidad rechazan H 0, puesto que


son menores que el nivel de significacin; por lo tanto al fallar uno no
se puede considerar como normal la variable residuos.
2. Homocedasticidad.
- Para realizar este contraste es necesario volver al
ANOVA, y sera el siguiente:

anlisis

H 0 = todas las varianzas son iguales A = B = C = D


H 1 = alguna varianza no es igual alguna i es diferente
Los pasos son: Botn amarillo /Contraste de la varianza
Contraste de Varianza
Contraste C de Cochran: 0,303385
Contraste de Bartlett: 1,01876

P-valor = 0,781548

P-valor = 0,642881

Contraste de Hartley: 1,65968


Test de Levene: 0,236778

P-valor = 0,870514

- Estos tres p-valor son mayores que el nivel de significacin y


por lo tanto aceptan H 0, y por lo tanto las varianzas son todas
similares. Por lo tanto se cumple la segunda condicin necesaria para
poder tomar los resultados del ANOVA como vlidos.

3. Independencia.
- Puesto que no disponemos de la fecha en la que hemos
recogido
los datos, no podemos realizar un estudio sobre su
aleatoriedad ya que no aparece reflejado el orden temporal, por lo
tanto daremos por supuesto que se cumple que se cumple esta
condicin.
- Tras comprobar s se cumplen o no las condiciones del ANOVA
se puede concluir que los resultados obtenidos no son totalmente
fiables, pues que los datos no siguen una distribucin normal, sera
necesario realizar otros estudios con otros mtodos o aumentar el
tamao de la muestra.
c.- Realiza el mismo contraste utilizando un mtodo no-paramtrico, e
interpreta el resultado que obtienes. Es fiable?
- Se utiliza el contraste de Kruskal Wallis, para ello:
Botn amarillo/ Contraste Kruskal-Wallis
- Con este contraste en lugar de compararse las medias se
contrastan las medianas:
H 0 = todas las medianas son iguales medA = medB = medC = medD
H 1 = alguna mediana no es igual alguna medi es diferente.
Contraste de Kruskal-Wallis para #_horas segn lectura
lectura

Tamao muestral

Rango Promedio

-----------------------------------------------------------1
2

25
40

26

51,68
44,2375
55,7115
40,5

-----------------------------------------------------------Estadstico = 3,44376

P-valor = 0,328126

- El p-valor obtenido es mayor que el nivel de significacin por


lo tanto se acepta la hiptesis nula, lo cual indica que las medianas
de las muestras son similares y por lo tanto no hay diferencias
significativas entre el nmero de horas que los estudiantes pasan en
la biblioteca independientemente de su hbito de lectura.

- ANOVA y Kruskal-Wallis apoyan la misma conclusin; a pesar


de que no se cumplen exactamente los tres requisitos de ANOVA, y
por ello se busca una segunda opinin con contraste de KruskalWallis, ambos apuntan en la misma direccin y por tanto tiene sentido
admitir que no hay diferencias significativas entre el nmero de horas
que alumnos con distintos hbitos de lectura pasan en la biblioteca.
3. Vuelve al fichero Selectividad.sf3.
a.- Utiliza un ANOVA, al 2% de significacin, para contrastar la
evidencia de relacin entre el Hbito de Lectura de los alumnos que
aparecen en el fichero, y la Nota que han obtenido en selectividad.
Confirma el contraste de Kruskal Wallis al conclusin que obtienes?
Variable respuesta: Nota
Factor: Hbito de lectura.
- Se realiza el siguiente contraste:
H 0 = todas las medias son iguales A = B = C = D
H 1 = alguna media no es igual alguna i es diferente.
Para ello: Comparacin/Anlisis de la varianza/ANOVA simple.
En Variable dependiente ponemos: nota selectividad
En Factor ponemos: Hbito lectura
Tabla ANOVA para Nota_Select segn Hbitos_Lect
Anlisis de la Varianza
-----------------------------------------------------------------------------Fuente
Sumas de cuad.
Gl Cuadrado Medio Cociente-F
-----------------------------------------------------------------------------Entre grupos
17,4718
2
8,73591
12,68
Intra grupos
25,4919
37
0,688971
-----------------------------------------------------------------------------Total (Corr.)
42,9637
39

P-Valor
0,0001

- El p-valor obtenido (00001) es ms pequeo que el nivel de


significacin que es 002; por lo tanto se rechaza H 0 , lo que indica
que no todas las medias son iguales y por lo tanto s existen
diferencias significativas en las notas de selectividad de los alumnos
segn el hbito de lectura que tengan, o lo que es lo mismo el hbito
de lectura de los alumnos s que influir en su nota en selectividad.

Contraste Kruskal Wallis


H 0 = todas las medianas son iguales medA = medB = medC = medD
H 1 = alguna mediana no es igual alguna medi es diferente.
Para realizarlo seguimos los siguientes pasos:
Botn amarillo/contraste de Kruskal-Wallis.
Se realiza un estudio sobre las medianas de la muestra.
Contraste de Kruskal-Wallis para Nota_Select segn Hbitos_Lect
Hbitos_Lect

Tamao muestral

Rango Promedio

-----------------------------------------------------------ALTO

12

BAJO

MEDIO

19

29,3333
8,05556
20,8158

-----------------------------------------------------------Estadstico = 17,1536

P-valor = 0,00018843

- El p-valor obtenido (000018843) es ms pequeo que el nivel


de significacin que es 002; por lo tanto se rechaza H 0 , lo que
indica que no todas las medianas son iguales y por lo tanto s existen
diferencias significativas en las notas de selectividad de los alumnos
segn el hbito de lectura que tengan, o lo que es lo mismo el hbito
de lectura de los alumnos s que influir en su nota en selectividad.
- S se confirman los resultados obtenidos con el contraste de
ANOVA simple.
b.- Valida las hiptesis del modelo, e interpreta el resultado.
- Para validar la hiptesis del modelo es necesario que la
variable notas de selectividad en cada uno de los hbitos de lectura
cumpla
tres
requisitos:
normalidad,
homocedasticidad
e
independencia.
1. Normalidad.
- Para estudiar la normalidad en la variable notas de
selectividad en cada uno de los hbitos de lectura (bajo, medio, alto,
etc.) se estudia en la variable residuos en lugar de ir miranda de

manera independiente la normalidad de las notas en cada uno de los


hbitos de lectura. Para crear esta variable seguimos los siguientes
pasos:
Botn guardar resultados / Marcar casilla residuos/Aceptar
Una vez creada esta variable estudiamos su normalidad.
Descripcin / Distribuciones / Ajuste de distribuciones (datos no
censurados).
En datos poner residuos.
Se realiza el siguiente contraste
H 0 = variable residuos es normal
H 1 = variable residuos no es normal
- Para contrastar la normalidad se mira la ventana de Test de
bondad de ajuste, y los p-valor que all aparecen.
Tests de Bondad de Ajuste para RESIDUALS
Contraste Chi-cuadrado
---------------------------------------------------------------------------Lmite
Inferior

Lmite

Frecuencia

Superior

Frecuencia

Observada

Esperada Chi-cuadrado

---------------------------------------------------------------------------menor o igual
-0,863111

-0,863111

5,71

-0,45756

-0,145537

5,71

0,29

-0,145537

0,145538

5,71

0,91

0,145538

0,45756

5,71

2,41

0,863111

-0,45756

0,45756
mayor

0,863111

5,71

0,09

5,71
6

5,71

---------------------------------------------------------------------------Chi-cuadrado = 3,74976 con 4 g.l.

P-Valor = 0,44093

Estadstico DMAS de Kolmogorov = 0,0930565


Estadstico DMENOS de Kolmogorov = 0,0849602

0,01

0,01
0,01

Estadstico DN global de Kolmogorov = 0,0930565


P-Valor aproximado = 0,879082

- Tanto el contraste de chi-cuadrado como el de Kolmogorov,


son mayores que el nivel de significacin (002) por lo tanto se
acepta H 0 , por lo tanto la variable residuos se puede considerar
normal . Para contrastar la normalidad tambin se miran los test para
la normalidad, para ello:
Botn amarillo/Test para la normalidad.
Tests para la Normalidad para RESIDUALS
Estadstico chi-cuadrado de bondad de ajuste = 17,8
P-valor = 0,216042
Estadstico W de Shapiro-Wilks = 0,970766
P-valor = 0,492216
Puntuacin Z para asimetra = 0,147654
P-valor = 0,882611
Puntuacin Z para curtosis = -0,0300783
P-valor = 0,975999

- Todos ellos aceptan H 0 puesto que los p-valor obtenidos son


mayores que
002, luego aceptan normalidad.
- Por lo tanto s se cumple la primera condicin para poder
validar el ANOVA simple.
2. Homocedasticidad.
- Para este anlisis se compara la varianza de las notas en
selectividad segn los distintos hbitos de lectura, para realizarlo es
necesario volver al anlisis de ANOVA simple, el contraste que se
realiza es el siguiente:
H 0 = todas las varianzas son iguales A = B = C = D
H 1 = alguna varianza no es igual alguna i es diferente
Los pasos son:
Botn amarillo /Contraste de la varianza
Contraste de Varianza
Contraste C de Cochran: 0,413354

P-valor = 0,677533

Contraste de Bartlett: 1,03719

P-valor = 0,522509

Contraste de Hartley: 1,84254


Test de Levene: 0,378699

P-valor = 0,687375

- Los p-valor obtenidos son mayores que el nivel de significacin


(002), por lo tanto se acepta la hiptesis nula, lo cual indica que la
varianza de las notas en selectividad segn los distintos hbitos de
lectura es similar en todos los casos. Por lo tanto tambin se cumple
la segunda condicin.
3. Independencia.
- Este anlisis no se puede realizr porque no aparece reflejado
en la hoja de datos el orden temporal en que han sido tomados y por
lo tanto no podemos mirar su aleatoriedad, por lo tanto damos por
cierta esta condicin. El contraste que habra que realizar sera el
siguiente:
H 0 = los residuos son aleatorios
H 1 = los residuos no son aleatorios.
- Por lo tanto ya que se cumplen las tres condiciones necesarias
para poder dar por vlido el anlisis de ANOVA simple, se pude decir
que los resultados obtenidos en el estudio son vlidos; lo que significa
que existen diferencias significativas en las notas de selectividad de
los alumnos segn el hbito de lectura que tengan, o lo que es lo
mismo el hbito de lectura de los alumnos si que influye en su nota
en selectividad.
c.- A partir de la tabla de ANOVA, indica qu procentaje de la
variabilidad est explicando el modelo. Crees que lo que obtienes
explica de algn modo el p-valor que has calculado en el primer
apartado?
Tabla ANOVA para Nota_Select segn Hbitos_Lect
Anlisis de la Varianza
-----------------------------------------------------------------------------Fuente

Sumas de cuad.

Gl Cuadrado Medio Cociente-F

-----------------------------------------------------------------------------Entre grupos
Intra grupos

17,4718
25,4919

2
37

8,73591

12,68

0,688971

-----------------------------------------------------------------------------Total (Corr.)

42,9637

39

0,0001

P-Valor

- Para calcular el porcentaje de variabilidad dividimos la sumas


de cuadrado de Entre grupos entre la total y multiplicamos por 100
(174718 / 429637) x 100 = 4066 %
-Al ser un porcentaje bastante alto, es lgico el resultado
obtenido en el apartado 1

d.- A partir de la tabla de ANOVA, estima el valor del error


experimental, e indica que significa.
- Mediante el error experimental se mide hasta donde pueden
llegar los residuos, es decir la diferencia entre cada dato y la media
del grupo al que pertenecen.
- Se calcula realizando la raz cuadrada del dato
MEDIO INTRA GRUPOS de la tabla ANOVA

CUADRADO

Tabla ANOVA para Nota_Select segn Hbitos_Lect


Anlisis de la Varianza
-----------------------------------------------------------------------------Fuente

Sumas de cuad.

Gl Cuadrado Medio Cociente-F

P-Valor

-----------------------------------------------------------------------------Entre grupos
Intra grupos

17,4718
25,4919

2
37

8,73591

12,68

0,0001

0,688971

-----------------------------------------------------------------------------Total (Corr.)

42,9637

39

0688971 = 083004
- Indica que las notas de selectividad pueden tener una
oscilacin de 0.83004 arriba o abajo, en relacin al hbito de lectura
al que pertenecen.
e.- Cuntos grupos homogneos establece Statgraphics?
- Para de determinar grupo homogneos realizamos los
siguientes pasos:
Botn amarillo / Contraste mltiple de rango.
Contraste Mltiple de Rango para Nota_Select segn Hbitos_Lect

------------------------------------------------------------------------------Mtodo: 95,0 porcentaje LSD


Hbitos_Lect

Frec.

Media

Grupos homogneos

-------------------------------------------------------------------------------BAJO

MEDIO
ALTO

4,8

19

X
5,98421

12

6,63333

-------------------------------------------------------------------------------Contraste

Diferencias

+/- Lmites

-------------------------------------------------------------------------------ALTO - BAJO

*1,83333

0,741617

ALTO - MEDIO

*0,649123

0,620148

BAJO - MEDIO

*-1,18421

0,680555

--------------------------------------------------------------------------------

- Los grupos homogneos son aquellos que tienen alineadas la


X, en este caso existen tres grupos homogneos que corresponden a
los distintos niveles de hbitos de lectura, seran BAJO, MEDIO y ALTO,
y por lo tanto s existen diferencias significativas entre las notas
sacadas por los alumnos en selectividad y su hbito de lectura.
f.- Estima: la nota media en selectividad correspondiente a los que
poseen un bajo hbito de lectura; el efecto de un alto hbito de
lectura.
- Para determinar la nota media en selectividad para los que
poseen un bajo hbito de lectura, seguimos estos pasos:
Botn amarillo / Tabla de medias
Tabla de Medias para Nota_Select segn Hbitos_Lect
con 95,0 intervalos LSD
-------------------------------------------------------------------------------Error Estndar
Hbitos_Lect

Frec.

Media

(s agrupada)

Lmite inf.

Lmite sup.

-------------------------------------------------------------------------------ALTO

12

6,63333

0,239613

6,29003

6,97664

BAJO

MEDIO

19

4,8
5,98421

0,276681

4,40359

5,19641

0,190425

5,71138

6,25704

-------------------------------------------------------------------------------Total

40

5,9125

- Segn la estimacin puntual realizada, aquellos estudiantes


que tienen un nivel bajo de lectura sacan una nota media en
selectividad en torno a 48.

- Para calcular el efecto de un alto hbito de lectura, miramos


en la misma tabla el intervalo obtenido en la estimacin puntual:
ALTO 697664 629003 = 0,68661
- Segn el resultado obtenido tener un hbito de lectura alto,
implica tener aproximadamente 068661 puntuacin en la nota media
obtenida en selectividad.
g.- Estima un intervalo LSD para la nota media en selectividad de
aquellos que poseen un bajo hbito de lectura.
Tabla de Medias para Nota_Select segn Hbitos_Lect
con 95,0 intervalos LSD
-------------------------------------------------------------------------------Error Estndar
Hbitos_Lect

Frec.

Media

(s agrupada)

Lmite inf.

Lmite sup.

-------------------------------------------------------------------------------ALTO

12

BAJO

MEDIO

19

6,63333
4,8
5,98421

0,239613

6,29003

6,97664

0,276681

4,40359

5,19641

0,190425

5,71138

6,25704

-------------------------------------------------------------------------------Total

40

5,9125

- El intervalo LSD, que da Statgraphics para aquellos que tienen


un bajo hbito de lectura es:
BAJO : [440359 , 519641]

- Lo que determina que segn la estimacin puntual realizada,


la nota media de aquellos estudiantes que tienen un bajo hbito de
lectura se encuentra dentro de ese intervalo.
4. Indica cmo proceder para estudiar la existencia o no
de relacin entre las siguientes variables. Explica qu
resultado obtienes en cada caso.
a.- Hbitos_de_lectura /Centro
-

Se trata de dos variables categricas o cualitativas, por lo


tanto para poder estudiar si existe relacin entre ambas
crear una tabla de contingencia y luego aplicar el
contraste chi-cuadrado; el contraste que se realizar ser el
siguiente:
H 0 = centros y hbito de lectura tienen relacin
H 1 = centros y hbito de lectura no tienen relacin

Los pasos para crear la tabla de contingencia son los


siguientes:
Descripcin/datos cualitativos/tabulacin cruzada

Sale la siguiente ventana y en ella metemos los datos:

-En variable fila CENTROS y en variable columna


Hbitos_Lectura; tambin se podra poner al revs puesto que es
independiente.

-Aparece la siguiente tabla de contingencia:


Tabla de Frecuencias para CENTRO segn Hbitos_Lect

-Luego para
ejecutar
el
contraste se har:
Botn opciones
tabulares/Contraste chi-cuadrado
Contraste de Chi-cuadrado
-----------------------------------------Chi-cuadrado

GL

P-Valor

-----------------------------------------14,06

0,0801

------------------------------------------

-El p-valor obtenido (00801), es mayor que el nivel de


significacin (0,02), por lo tanto para un nivel de confianza del 98%,
se acepta la hiptesis nula, luego las dos variables tienen no relacin,
por lo tanto existe independencia de las dos variables y por lo tanto el
CENTRO y el HBITO DE LECTURA de los estudiantes no tienen
relacin. Por otro lado al realizar el anlisis Statgraphics advierte de
que alguna celda tiene una frecuencia esperada menor que 5, por lo
tanto el resultado del contraste no es concluyente. Por otro lado a
travs de la tabla de
contingencia se puede observar que
aparentemente s hay relacin entre el centro y el hbito de lectura
de los estudiantes, puesto que:
* El p-valor obtenido es muy prximo al nivel de
significacin, y por lo tanto casi se puede aceptar la existencia de
relacin.

* Las filas de la tabla de contingencia son muy diferentes


entre s, por lo tanto muestra que puede existir relacin entre el
centro en que estudien los alumnos y su hbito de lectura.
b.- Nota-media / Sexo
-Al tratarse de una variable cualitativa y otra cuantitativa se
aplicar un anlisis ANOVA simple, en el que el factor ser la variable
sexo y la variable respuesta ser nota media; el contraste que se
realizar ser el siguiente; tambin se podran utilizar las tcnicas del
primer tema puesto que se trata de comparar dos poblaciones
(hombres y mujeres):
H 0 = todas las medias son iguales A = B
H 1 = alguna media no es igual alguna i es diferente.
- Para realizar el contraste se realizan los siguientes pasos:
Comparacin / Anlisis de la varianza / ANOVA simple.
Tabla ANOVA para Nota_media segn Sexo
Anlisis de la Varianza
-----------------------------------------------------------------------------Fuente

Sumas de cuad.

Gl Cuadrado Medio Cociente-F

P-Valor

-----------------------------------------------------------------------------Entre grupos
0,0416
Intra grupos

4,1159

4,1159

35,1819

38

0,925838

4,45

-----------------------------------------------------------------------------Total (Corr.)

39,2978

39

-El p-valor obtenido es mayor que el nivel de significacin (0


02), por lo tanto se acepta la hiptesis nula, por lo tanto se puede
decir que la nota media que sacan los estudiantes en selectividad es
similar en todos los caso independientemente del sexo; por lo tanto
segn el ANOVA simple no existe relacin entre el sexo y la nota
media obtenida.
- Para que el estudio ANOVA simple se pueda dar por vlido es
necesario que se cumplan las tres condiciones: normalidad,
homocedasticidad e independencia.
1. Normalidad.

Se estudia la normalidad de los residuos, y se realiza el siguiente


contraste:
H 0 = variable residuos es normal
H 1 = variable residuos no es normal
Tests de Bondad de Ajuste para RESIDUALS
Contraste Chi-cuadrado
---------------------------------------------------------------------------Lmite
Inferior

Lmite

Frecuencia

Superior

Frecuencia

Observada

Esperada Chi-cuadrado

---------------------------------------------------------------------------menor o igual
-1,01397

mayor

-1,01397

-0,537534

5,71
5,71

0,01
0,29

-0,537534

-0,170976

5,71

0,29

-0,170976

0,170975

5,71

1,29

0,170975

0,537533

5,71

0,01

0,537533

1,01397

1,01397

5
6

5,71
5,71

0,09
0,01

---------------------------------------------------------------------------Chi-cuadrado = 2,00021 con 4 g.l.

P-Valor = 0,73572

Estadstico DMAS de Kolmogorov = 0,086152


Estadstico DMENOS de Kolmogorov = 0,0589273
Estadstico DN global de Kolmogorov = 0,086152
P-Valor aproximado = 0,927872

-Ambos p-valor son altos y por lo tanto aceptan la hiptesis nula


por lo tanto normalidad. Tambin se miran los test para la normalidad.
Tests para la Normalidad para RESIDUALS
Estadstico chi-cuadrado de bondad de ajuste = 14,4
P-valor = 0,420356
Estadstico W de Shapiro-Wilks = 0,970004
P-valor = 0,469733

Puntuacin Z para asimetra = 0,786384


P-valor = 0,43164
Puntuacin Z para curtosis = -0,392098
P-valor = 0,694983

-Todos ellos son mayores que el nivel de significacin del 2%,


por lo tanto aceptan la hiptesis nula y como consecuencia la
normalidad de la variable.
2. Homocedasticidad.
H 0 = todas las varianzas son iguales A = B
H 1 = alguna varianza no es igual alguna i es diferente
Contraste de Varianza
Contraste C de Cochran: 0,631667
Contraste de Bartlett: 1,03683

P-valor = 0,248764

P-valor = 0,247187

Contraste de Hartley: 1,71494


Test de Levene: 0,24292

P-valor = 0,624941

-Todos los p-valor obtenidos son mayores que el nivel de


significacin por lo tanto se acepta y en consecuencia se acepta la
igualdad de varianzas.
3. Independencia.
- Puesto que no disponemos de la fecha en la que hemos
recogido
los datos, no podemos realizar un estudio sobre su
aleatoriedad ya que no aparece reflejado el orden temporal, por lo
tanto daremos por supuesto que se cumple que se cumple esta
condicin.
-Al comprobar los tres requisitos y observar que se cumple los
resultados obtenidos gracias al anlisis ANOVA simple, se dan por
vlidos, por lo tanto no existen diferencias significativas entre la nota
media obtenida en selectividad y el sexo de los alumnos.
c.- Nota_lengua / Sexo
-Igual que en el caso anterior se trata de una variable
cualitativa y otra cuantitativa, por lo tanto se aplica un anlisis
ANOVA simple, con el siguiente contraste:
H 0 = todas las medias son iguales A = B

H 1 = alguna media no es igual alguna i es diferente.


Tabla ANOVA para Nota_Lengua segn Sexo
Anlisis de la Varianza
-----------------------------------------------------------------------------Fuente

Sumas de cuad.

Gl Cuadrado Medio Cociente-F

P-Valor

-----------------------------------------------------------------------------Entre grupos

6,6589

Intra grupos

40,4411

6,6589

38

6,26

0,0168

1,06424

-----------------------------------------------------------------------------Total (Corr.)

47,1

39

- El p-valor obtenido en este caso es menor que el nivel de


significacin del 2% (002), por lo tanto se rechaza la hiptesis nula y
se acepta la hiptesis alternativa, lo que significa que no todas la
medias son iguales o lo que es lo mismo que existen diferencias
significativas entre las notas sacadas en lengua, segn sean chicos o
chicas, por lo tanto estas dos variables s tienen relacin. Para poder
dar por vlidos estos resultados es necesario comprobar las tres
condiciones
del
modelo:
normalidad,
homocedasticidad
e
independencia.
1. Normalidad.
-Se estudia la normalidad de los residuos, y se realiza el
siguiente contraste:
H 0 = variable residuos es normal
H 1 = variable residuos no es normal
Tests de Bondad de Ajuste para RESIDUALS
Contraste Chi-cuadrado
---------------------------------------------------------------------------Lmite
Inferior

Lmite

Frecuencia

Superior

Observada

Frecuencia
Esperada Chi-cuadrado

---------------------------------------------------------------------------menor o igual
-1,08712
-0,576313

-1,08712
-0,576313
-0,18331

4
16
0

5,71
5,71
5,71

0,51
18,51
5,71

-0,18331

0,18331

0,18331

0,576313

10

0,576313
mayor

1,08712

1,08712

5,71
5,71

0
10

5,71
5,71

5,71
3,21
5,71
3,21

---------------------------------------------------------------------------Chi-cuadrado = 42,6006 con 4 g.l.

P-Valor = 1,25231E-8

Etadstico DMAS de Kolmogorov = 0,215167


Estadstico DMENOS de Kolmogorov = 0,137977
Estadstico DN global de Kolmogorov = 0,215167
P-Valor aproximado = 0,0492633

Tests para la Normalidad para RESIDUALS


Estadstico chi-cuadrado de bondad de ajuste = 81,55
P-valor = 1,45808E-11
Estadstico W de Shapiro-Wilks = 0,912536
P-valor = 0,00465665
Puntuacin Z para asimetra = 0,71236
P-valor = 0,476239
Puntuacin Z para curtosis = -1,12106
P-valor = 0,262261

-El p-valor obtenido en el test chi-cuadrado y en dos de los test


para normalidad es menor que el nivel de significacin por lo tanto se
rechaza la hiptesis nula lo cual indica que no se cumple la primera
condicin que es normalidad.
-Por lo tanto no se pueden considerar los resultados del ANOVA
simple como vlidos.
-Puesto que los resultados del ANOVA no se pueden considerar
como vlidos ser necesario realizar otro tipo de anlisis como el
contraste de Kruskal Wallis, y comparar las medianas de las
variables:
H 0 = todas las medianas son iguales medA = medB
H 1 = alguna mediana no es igual alguna medi es diferente.

Contraste de Kruskal-Wallis para Nota_Lengua segn Sexo

Sexo

Tamao muestral

Rango Promedio

-----------------------------------------------------------M

19

24,5789

21

16,8095

-----------------------------------------------------------Estadstico = 4,79785

P-valor = 0,0284922

-El contraste de Kruskal Wallis, da un p-valor mayor que el


nivel de significacin (002), por lo tanto se aceptara la hiptesis
nula, es decir que las medianas son similares, lo que indica que no
existen diferencias significativas entre las notas sacadas en lengua
por lo alumnos y su sexo, por lo tanto estas dos variables no tiene
relacin al nivel de significacin fijado. Obsrvese, no obstante, que
incrementando ligeramente el nivel de significacin se concluira que
s existen diferencias significativas.

Puesto que se trata de comparar dos poblaciones y que


los requisitos de ANOVA no se cumplen y adems el p-valor obtenido
en el contraste de Kruskal-Wallis, se pueden utilizar las tcnicas del
primer tema, sobre comparacin de medias y medianas y comprobar
si la nota que sacan los estudiantes en lengua es distinta en mujeres
y hombres, los pasos que se realizaran seran los siguientes:
1.- Datos pareados? No son pareados, puesto que se trata de
distintos individuos.
2.- Las variables son normales?
Normalidad varones.
H 0 = nota_lengua (varones) es normal
H 1 = nota_lengua(varones) no es normal
Descripcin / Distribuciones / Ajuste de distribuciones (datos no
censurados)
En datos se pondra nota_lengua y en seleccin sexo= V
Tests de Bondad de Ajuste para Nota_Lengua
Contraste Chi-cuadrado

---------------------------------------------------------------------------Lmite
Inferior

Lmite

Frecuencia

Superior

Frecuencia

Observada

Esperada Chi-cuadrado

---------------------------------------------------------------------------menor o igual

4,95802

4,95802

5,40399

5,40399
5,7619

3,50

10

3,50

3,50

12,07

5,7619

3,50

3,50

6,11982

3,50

1,79

3,50

3,50

3,50

0,64

6,11982
mayor

6,56578

6,56578

---------------------------------------------------------------------------Chi-cuadrado = 25,0001 con 3 g.l.

P-Valor = 0,0000154398

Estadstico DMAS de Kolmogorov = 0,296596


Estadstico DMENOS de Kolmogorov = 0,179594
Estadstico DN global de Kolmogorov = 0,296596
P-Valor aproximado = 0,0497097

Tests para la Normalidad para Nota_Lengua


Estadstico chi-cuadrado de bondad de ajuste = 78,6667
P-valor = 9,15934E-13
Estadstico W de Shapiro-Wilks = 0,770038
P-valor = 0,000122603
Puntuacin Z para asimetra = 0,728146
P-valor = 0,466522
Puntuacin Z para curtosis = -2,15022
P-valor = 0,0315377

El test de chi-cuadrado no se puede considerar como


vlido puesto que la frecuencia esperada es menor que 5, por lo tanto
se mira el p-valor obtenido en el test de Kolmogorov y los test para
normalidad, por lo tanto para un nivel de significacin del 2% (002),
dos de los test para normalidad rechazan H 0 , ya que el p-valor
obtenido en ellos (Chi-cuadrado de bondad de ajuste y Wde ShapiroWilks) es menor que el nivel de significacin, por lo tanto la variable
nota_lengua en el caso de los varones no se puede considerar normal.
3.- Comparo las medianas.
- El contraste que se realiza es el siguiente:
H 0 = M (nota_lengua mujeres) = M (nota_lengua varones)
H 1 = M (nota_lengua mujeres) <> M (nota_lengua varones)
Comparacin / Comparacin de dos muestras / Comparacin de
dos muestras / Columna de cdigo y datos
En datos pondra nota_lengua y en cdigo muestra sexo
Botn opciones tabulares / comparacin de medianas

Comparacin de Medianas para Nota_Lengua


---------------------------------------Mediana de la muestra 1: 6,0
Mediana de la muestra 2: 6,0
Contraste W de Mann-Whitney (Wilcoxon) para comparar medianas
Hiptesis nula: mediana1 = mediana2
(1) Hiptesis alt.: mediana1 <> mediana2
Rango medio de la muestra 1: 24,5789
Rango medio de la muestra 2: 16,8095
W = 122,0

P-Valor = 0,029535

El p-valor obtenido es mayor que el nivel de significacin


del 2% (002), por lo tanto en este caso se aceptara H 0,aunque el
nivel de significacin y el p-valor sean muy similares, y por lo tanto se
acepta que la nota media de los hombres en lengua es similar a la
nota media de las mujeres en lengua, por lo tanto no existen
diferencias significativas entre la nota que consiguen los alumnos en
lengua y el sexo. De nuevo, incrementando ligeramente el nivel de
significacin, se obtendra que ambas medianas son diferentes.

5. Cmo podras contrastar si la nota media en


selectividad de las mujeres con alto hbito de lectura
est, en general, por encima de 7?
- Lo primero es comprobar si la variable nota media de las
mujeres con alto hbito de lectura es normal o no realizando el
siguiente contraste:
H 0 = variable nota selectividad, mujeres con alto hbito de lectura es
normal.
H 1 = variable nota selectividad, mujeres con alto hbito de lectura no
es normal
Para ello se realizan los siguientes pasos:
Descripcin/Distribuciones/Ajuste de distribuciones (datos no
censurados)
- En datos pongo nota selectividad y en seleccin se
pondra: Sexo=M & Hbitos_Lect = ALTO
- Miro los test de bondad e ajuste:

Tests de Bondad de Ajuste para Nota_Select


Contraste Chi-cuadrado
---------------------------------------------------------------------------Lmite
Inferior

Lmite
Superior

Frecuencia
Observada

Frecuencia
Esperada Chi-cuadrado

---------------------------------------------------------------------------menor o igual
mayor

6,68428

6,68428

3,60

0,04

5,40

0,03

---------------------------------------------------------------------------Datos insuficientes para efectuar el contraste de chi-cuadrado.


Estadstico DMAS de Kolmogorov = 0,165918
Estadstico DMENOS de Kolmogorov = 0,142853
Estadstico DN global de Kolmogorov = 0,165918
P-Valor aproximado = 0,965364

- El test de chi-cuadrado no resulta fiable, puesto que alguna de


las frecuencias esperadas es menor que 5, por lo tanto hay que
fijarse en el test de Kolmogorov; y este test para un nivel de
significacin del 5%(005), por lo tanto como el p-valor obtenido (0
965364) es mayor que el nivel de significacin se acepta H 0 y por
lo tanto la variable notas de selectividad en mujeres con un alto
nivel de lectura sigue una distribucin normal. Tambin se miran
los test de normalidad:
Tests para la Normalidad para Nota_Select
Estadstico chi-cuadrado de bondad de ajuste = 10,0
P-valor = 0,124652
Estadstico W de Shapiro-Wilks = 0,909465
P-valor = 0,307073
Puntuacin Z para asimetra = 0,70307
P-valor = 0,48201
Puntuacin Z para curtosis = -0,46046
P-valor = 0,645183

- En todos los casos el p-valor obtenido es mayor que el nivel de


significacin, por lo tanto se acepta H 0 y en conclusin la variable
es normal.
- Una vez que ya he comprobado que la variable es normal, para
comprobar si la nota esta por encima de 7, se utilizara los test no
paramtricos sobre la media y la mediana, por lo tanto tenemos tres
test a nuestra disposicin:
El contraste que se realiza es el siguiente:

H 0 = mediana = 7
Contraste sobre la medianaH = mediana > 7
1

H 0= = 7

Contraste sobre la media

H 1= > 7

Y los pasos para ejecutarlo son los siguientes:


Descripcin /Datos numricos/ Anlisis unidimensional/
En datos poner Nota_selec y en seleccin
Sexo=M&Hbitos_Lect=ALTO
Botn opciones tabulares/ Contraste de hiptesis
En la ventana de contraste de hiptesis, botn derecho, en
media poner 7 y hiptesis alternativa mayor que

Contraste de Hiptesis para Nota_Select


Media muestral = 6,9
Mediana muestral = 6,7
Contraste t
----------Hiptesis nula: media = 7,0
Alternativa: mayor que
Estadstico t = -0,352332
P-valor = 0,633155
No se rechaza la hiptesis nula para alpha = 0,05.
Contraste de los signos
----------------------Hiptesis nula: mediana = 7,0
Alternativa: mayor que
Nmero de valores inferiores a la mediana de H0: 5
Nmero de valores superiores a la mediana de H0: 4
Estadstico para
continuidad)

grandes

muestras

0,0

(aplicada

la

correccin

por

P-valor = 0,500003
No se rechaza la hiptesis nula para alpha = 0,05.
Contraste de rangos con signo
----------------------------Hiptesis nula: mediana = 7,0
Alternativa: mayor que
Rango medio de los valores inferiores a la mediana: 5,1
Rango medio de los valores superiores a la mediana: 4,875
Estadstico para grandes muestras = -0,415374 (aplicada la correccin por
continuidad)
P-valor = 0,661067
No se rechaza la hiptesis nula para alpha = 0,05.

- Los tres test de los que disponemos dan como resultado un pvalor mayor que 5% (005), por lo tanto se acepta H 0 , o lo que es
lo mismo que la nota media de las mujeres en selectividad con un
alto hbito de lectura es igual que 7, pero no mayor; por lo tanto
por lo general no se puede aceptar que la nota de las mujeres con
alto hbito de lectura este por encima de 7.

También podría gustarte