Analisis de Varianza PDF

4
Análisis de
Varianza
4. Análisis de Varianza
e.4.1. ¿Quiénes obtienen mejores resultados en Matemáticas, los estudiantes que viven en
zonas rurales, en pequeñas ciudades, en ciudades medias o en grandes ciudades?
Analicemos la pregunta, se trata de estudiar si "existen diferencias significativas en el

rendimiento en matemáticas de los estudiantes (VD) en función de su hábitat (VI)"; la variable
independiente es nominal politómica (con cuatro alternativas) y la dependiente es de
intervalo.
La hipótesis nula es:
H0:
Es decir, que las muestras obtenidas sean de la misma población. Y la alternativa (H1), que
alguna de las igualdades no se cumpla (que pertenezcan a poblaciones diferentes).
Si la variable dependiente (hábitat) tuviese dos alternativas utilizaríamos la prueba T de

Student para dos muestras, pero al tener más de dos se utilizará un Análisis de Varianza
Simple.
4.1. Análisis de Varianza Simple

El Análisis de Varianza (o ANOVA, del inglés analysis of variance) es una prueba utilizada para
contrastar la hipótesis de que varias medias son iguales. Fueron ideadas por R.A. Fisher en
1925, y son una de las pruebas más importantes de la estadística actual. Como se ha
comentado, es una extensión de la prueba T para dos muestras independientes. Sirve, por
tanto, para estudiar la incidencia de una variable nominal u ordinal (categórica) con más de las
alternativas, en una variable de intervalo o de razón (cuantitativa).
El ANOVA utiliza una estrategia bastante razonable: si los resultados de cada uno de los grupos
(en nuestro ejemplo el rendimiento en Matemáticas de los estudiantes que viven en pueblos,
ciudades pequeñas, medias o grandes) no contienen errores sistemáticos, los valores medios
respectivos no diferirán mucho los unos de los otros y su dispersión, debido a los errores
aleatorios, será comparable a la dispersión presente individualmente en cada grupo (tipo de
hábitat). Así, la prueba se basa en la estimación del estadístico F, que muestra el grado de
parecido existente entre las medias que se comparan.
Si las medias de las poblaciones son iguales, las medias de las muestras de los grupos serán
parecidas, por lo que las únicas diferencias serán las atribuidas al azar, y el valor del estimador
F será de 1. Si las medias poblacionales son diferentes, entonces el valor mayor que 1, y más
alto conforme mayor sea la diferencia.
F.J. Murillo y C. Martínez-Garrido Página 52

El estadístico F está asociado a un nivel crítico (la probabilidad de obtener valores como el
obtenido o mayores). Si éste es mayor a nuestro nivel de error asumido (que habitualmente
será del 95%, de decir de un 0,05) se rechaza la hipótesis nula, que indica la igualdad de
medias, y se acepta la alternativa.
Además de determinar que existen diferencias entre las medias, es posible que deseemos
saber qué medias difieren. Existen dos tipos de contrastes para comparar medias: a priori y
post hoc.
 Los contrastes a priori se plantean antes de ejecutar el experimento.
 Los contrastes post hoc se realizan después de haber llevado a cabo el experimento.
El Análisis de Varianza (o ANOVA) es una prueba estadística desarrollada para realizar

simultáneamente la comparación de las medias de más de dos poblaciones.
Para su uso, es necesario que las variables cumplan tres condiciones:
1. Cada conjunto de datos debe ser independiente del resto.
2. Los resultados obtenidos para cada conjunto deben seguir una distribución normal,
aunque soporta bastante bien el incumplimiento de este supuesto siempre que su
distribución sea simétrica1.
3. Las varianzas de cada conjunto de datos no deben diferir de forma significativa2.
Esta condición previa de aplicación se verificará estadísticamente mediante una de las

opciones que se encuentran dentro de la configuración del ANOVA. La configuración del
análisis se realiza en el cuadro de diálogo correspondiente.
Veámoslo:
Elije en los menús:
Analizar -> Comparar medias -> ANOVA de un factor
1
La prueba para comprobar la normalidad de distribución de una variable es la de Kolmogorov-Smirnov,
se verá en el tema 7.
2
Para verificar este supuesto, en el subcuadro de opciones está la Prueba de homogeneidad de las
varianzas, que calcula el estadístico de Levene para contrastar la igualdad de las varianzas de grupo. Si
las varianzas no son iguales, en este mismo subcuadro se encuentra la opción "Brown-Forsythe". Calcula
el estadístico de Brown-Forsythe para contrastar la igualdad de las medias de grupo.

FIGURA 4.1. CUADRO DE DIÁLOGO ANOVA DE UN FACTOR
1. Selecciona una o más variables dependientes, en este caso: Rendimiento en

Matemáticas.
2. Selecciona una sola variable como "factor" (variable independiente): en este caso
Hábitat.
Tras aceptar nos ofrece el siguiente resultado (tabla 4.1).
TABLA 4.1. RESULTADOS DEL ANOVA DE UN FACTOR
Rendimiento en Matemáticas
Suma de
cuadrados gl Media cuadrática F Sig.
Inter-grupos 52621,047 3 17540,349 54,020 ,000
Intra-grupos 2141072,744 6594 324,700
Total 2193693,791 6597
La información que nos ofrece es la siguiente:
 Suma de cuadrados: es una estimación de la desviación entre los resultados medios y

el resultado medio global, tanto dentro de los grupos, como entre los grupos.
 gl: Grados de libertad. El número de grupos a comparar, menos 1.
 Media cuadrática: Es el valor de dividir la suma de cuadrados entre los grados de

libertad.

 F: Estadístico llamado F. Es el coeficiente de dividir las medias cuadráticas y refleja el

grado de parecido existente entre las medias que se están comparando.
 Sig: Significación o nivel crítico, es la probabilidad de obtener valores F como el

obtenido o mayores bajo la hipótesis nula de la igualdad de medias. En este caso es
0,000.
La interpretación es igual que en la T de Student del tema anterior, si el nivel crítico asociado al
estadístico F es menor que 0,05 (o el α que estemos considerando) se rechaza la hipótesis y se
acepta la alterna, es decir, se concluye que, efectivamente, hay relación entre el hábitat y el
rendimiento en Matemáticas (o que los cuatro hábitat forman parte de la misma población).
Sin embargo, de lo que no tenemos información es entre qué tipo de hábitat hay diferencias,
ni el sentido de las mismas. Para ello se necesitan los contrastes a posteriori.
Contrastes post hoc
Una vez que se ha determinado que existen diferencias entre las medias, los contrastes de
comparaciones múltiples post hoc, o comparaciones a posteriori, permiten determinar entre
qué medias existen diferencias significativas.
El procedimiento es sencillo. Sólo hay que pulsar la opción "Post Hoc" del cuadro de diálogo de
ANOVA de un factor. Lo difícil quizá es elegir entre tantas opciones. En el Anexo, al final de
este tema, se presenta un cuadro resumen con las características de los diferentes
estadísticos.
FIGURA 4.2. SUBCUADRO DE DIÁLOGO ANOVA DE UN FACTOR: COMPARACIONES MÚLTIPLES POST HOC

Una posibilidad razonable es elegir el estadístico de HDS Tukey (opción Tukey) si las varianzas
son iguales y el estadístico Games-Howell si no se asumen varianzas iguales.
Los resultados para nuestro ejemplo se muestran en las tablas 4.2 y 4.3.
TABLA 4.2. RESULTADOS DEL ANOVA DE UN FACTOR CON COMPARACIONES MÚLTIPLES POST HOC
Rendimiento en Matemáticas
HSD de Tukey
(I) Habitat (pueblo, (J) Habitat (pueblo, Intervalo de confianza al 95%
ciudad pequeña, media ciudad pequeña, media Diferencia de
o grande) o grande) medias (I-J) Error típico Sig. Límite inferior Límite superior
Pueblos (menos de Ciudades pequeñas (de -3,085022* ,598434 ,000 -4,62281 -1,54723
10.009 habs.) 10.001 a 10.000 habs.)
Ciudades medias (de -6,209442* ,611973 ,000 -7,78202 -4,63686
100.001 a 500.000 habs.)
Ciudades grandes (más -8,560321* ,788173 ,000 -10,58568 -6,53496
de 500.000 habs.)
Ciudades pequeñas (de Pueblos (menos de 3,085022* ,598434 ,000 1,54723 4,62281
10.001 a 10.000 habs.) 10.009 habs.)
Ciudades medias (de -3,124419* ,551351 ,000 -4,54122 -1,70762
100.001 a 500.000 habs.)
Ciudades grandes (más -5,475298* ,742086 ,000 -7,38223 -3,56837
de 500.000 habs.)
Ciudades medias (de Pueblos (menos de 6,209442* ,611973 ,000 4,63686 7,78202
100.001 a 500.000 habs.) 10.009 habs.)
Ciudades pequeñas (de 3,124419* ,551351 ,000 1,70762 4,54122
10.001 a 10.000 habs.)
Ciudades grandes (más -2,350879* ,753047 ,010 -4,28597 -,41578
de 500.000 habs.)
Ciudades grandes (más Pueblos (menos de 8,560321* ,788173 ,000 6,53496 10,58568
de 500.000 habs.) 10.009 habs.)
Ciudades pequeñas (de 5,475298* ,742086 ,000 3,56837 7,38223
10.001 a 10.000 habs.)
Ciudades medias (de 2,350879* ,753047 ,010 ,41578 4,28597
100.001 a 500.000 habs.)
*. La diferencia de medias es significativa al nivel 0.05.
La interpretación es igualmente sencilla. En cada una de las filas compara las medias de los
grupos por pares. La interpretación, una vez más, es fijándose en el nivel crítico y compararlo
con nuestro α (normalmente 0,05). De esta forma se puede observar que hay diferencias en el
rendimiento de los estudiantes en Matemáticas entre los que viven en pueblos y en ciudades
pequeñas, entre pueblos y ciudades medias... y así entre todos los pares de grupos.
En la segunda de las tablas nos ofrece los resultados y encontramos ayuda para una mejor
interpretación.
TABLA 4.3. RESULTADOS DEL ANOVA DE UN FACTOR CON COMPARACIONES MÚLTIPLES POST HOC,
SUBCONJUNTOS HOMOGÉNEOS

HSD de Tukeya,,b
Subconjunto para alfa = 0.05
Habitat (pueblo, ciudad pequeña,
media o grande) N 1 2 3 4
Pueblos (menos de 10.009 habs.) 1515 48,28904
Ciudades pequeñas (de 10.001 a 2258 51,37406
10.000 habs.)
Ciudades medias (de 100.001 a 2027 54,49848
500.000 habs.)
Ciudades grandes (más de 798 56,84936
500.000 habs.)
Sig. 1,000 1,000 1,000 1,000
Se muestran las medias para los grupos en los subconjuntos homogéneos.
a. Usa el tamaño muestral de la media armónica = 1403,800.
b. Los tamaños de los grupos no son iguales. Se utilizará la media armónica de los tamaños de los grupos. Los niveles
de error de tipo I no están garantizados.
Se observa que existen cuatro grupos diferenciados (cuatro poblaciones), cada una de un tipo
de hábitat, indicándose la media del rendimiento de cada grupo. De esta forma, los resultados
apuntan a que los niños y niñas que viven en pueblos sacan el peor resultado (48,28), después
(con diferencias estadísticamente significativas) los que viven en ciudades pequeñas (51,37),
después los que viven el ciudades medias (54,49) y lo que mejores resultados obtienen en
rendimiento en Matemáticas son los que viven en grandes ciudades (56,84 de media). Este
resultado, obtenido a partir de datos reales, nos muestra la desigual distribución del
rendimiento en función del lugar donde vive el niño, y muestra unas preocupantes señales de
inequidad en función del hábitat.
4.2. Análisis de Varianza factorial

También es posible estudiar el efecto de varias variables y su interacción sobre una variable
dependiente cuantitativa. Así, por ejemplo, podemos estudiar el efecto que tiene el género del
estudiante sobre el rendimiento en lengua, el efecto del género del docente y la interacción
entre las dos variables sobre el rendimiento en matemáticas.
Así, puede verse el siguiente caso inventado (tabla 4.4). El rendimiento promedio de todos los
estudiantes es de 6. El de los niños es igual que el de la niñas, de 6; y sacan los mismos
resultados los estudiantes con profesores varones que con profesoras, 6. Sin embargo, se
produce un curioso efecto de interacción, dado que si el género del docente y del estudiante
coinciden los resultados serán claramente mejores que si no coinciden.
TABLA 4.4. EFECTO DE LA INTERACCIÓN ENTRE VARIABLES. RENDIMIENTO EN MATEMÁTICAS DE LOS

ESTUDIANTES EN FUNCIÓN DE SU GÉNERO Y DEL GÉNERO DE SU DOCENTE
Estudiante Estudiante
Total
varón mujer
Docente varón 7 4 6
Docente mujer 4 7 6
Total 6 6 6

Un ejemplo de esto con nuestros datos puede ser el siguiente:
e.4.2. ¿Existen diferencias significativas en el Rendimiento en Matemáticas de los estudiantes en

función de su hábitat, de sus años de preescolarización y de la interacción entre ambas
variables?
Como se observa, probaremos de forma simultánea las tres hipótesis:
1. Existen diferencias significativas en el Rendimiento en Matemáticas en función del

hábitat
2. Existen diferencias significativas en Rendimiento en Matemáticas en función de los
años de preescolarización
3. Existen diferencias significativas en el Rendimiento de los estudiantes en función de la

interacción entre ambas variables?
Para ello se realizará un Análisis de Varianza Factorial. Este estadístico se encuentra en el

cuadro de diálogo "Modelo Lineal General" y luego "Univariante" (dado que sólo tenemos una
única variable dependiente). Observemos en la figura 4.4, el cuadro de diálogo en el que
aparece.
FIGURA 4.4. CUADRO DE DIÁLOGO "UNIVARIANTE" PARA HACER UN ANÁLISIS DE VARIANZA FACTORIAL
Entonces seleccione:
 "Rendimiento en Matemáticas" como Dependiente.
 "Preescolarización" y "Hábitat" como Factores fijos.

Y pinchamos en "Aceptar".
Nos aparecen cuatro opciones:
 Efectos fijos: un factor de efectos fijos es aquel en el que contamos con todas las
alternativas en la variable. Bien sea porque están todas -por ejemplo, el hábitat- bien
porque queremos ver la diferencia entre esas alternativas. Es decir, las alternativas son
la población de alternativas de respuesta sobre los que se quiere hacer la inferencia.
 Efectos aleatorios: un factor de efectos aleatorios, por su parte, es aquel que las
alternativas seleccionadas son una muestra aleatoria de todas las alternativas posibles.
Luego haremos un ejemplo de las mismas.
 Covariables: para hacer un Análisis de Covarianza (ver apartado 4.3).
 Ponderación MCP: si tenemos alguna variable para ponderar al utilizar el Método de

Mínimos Cuadrados Ponderados (que no es el caso).
El resultado se muestra en la tabla 4.5.
TABLA 4.5. RESULTADOS DEL ANOVA FACTORIAL. PRUEBAS DE EFECTOS INTERSUJETOS
Variable dependiente:Rendimiento en Matemáticas

Suma de
Origen cuadrados tipo III gl Media cuadrática F Sig.
Modelo corregido 95166,829a 15 6344,455 19,899 ,000
Intersección 8140315,782 1 8140315,782 25531,985 ,000
Habitat 29030,841 3 9676,947 30,352 ,000
Preescol 30473,790 3 10157,930 31,860 ,000
Habitat * Preescol 4895,081 9 543,898 1,706 ,082
Error 2098526,962 6582 318,828
Total 2,023E7 6598
Total corregida 2193693,791 6597
a. R cuadrado = ,043 (R cuadrado corregida = ,041)
Los resultados nos dan respuesta a las tres hipótesis planteadas:
1. Hay diferencias en Rendimiento en Matemáticas en función del Hábitat (el nivel crítico
que aparece en la 3ª fila es 0,000<0,05), como ya habíamos visto.
2. Hay diferencias en función de la edad de escolarización en preescolar (4ª fila).
3. No hay diferencias en función de la interacción (5ª columna: 0,082>0,05).

4.3. Análisis de Covarianza

Sabiendo que el Nivel Socio-Económico de las familias influye de forma importante en el
rendimiento de los estudiantes (rxy = 0,33), y que el Hábitat está relacionado con ese nivel
socio-económico, sería posible pensar que quizá las diferencias en Rendimiento en función del
Hábitat sea debido al Nivel Socio-económico de las familias, y no al hábitat. Es decir que la
relación entre Hábitat y Rendimiento sea una relación espuria3. Para descartar (o confirmar)
esa posibilidad, tenemos el Análisis de Covarianza (ANCOVA). La pregunta es:
e.4.3. ¿Existen diferencias en el Rendimiento en Matemáticas de los estudiantes en función del

Hábitat, si controlamos el efecto del Nivel Socio-económico?
El Análisis de Covarianza (ANCOVA) es una técnica de control estadístico que permite eliminar
de la variable dependiente del ANOVA el efecto atribuible a variables no incluidas en el diseño
y, con ello, no sometidas a control.
Al igual que en el Análisis de Varianza Factorial este estadístico se encuentra en el cuadro de

diálogo "Modelo Lineal General" y luego "Univariante" (dado que sólo tenemos una única
variable dependiente), pero donde ponemos la variable de control como covariable. El cuadro
de diálogo en el que aparece se encuentra en la figura 4.5.
FIGURA 4.5. CUADRO DE DIÁLOGO "UNIVARIANTE", PARA HACER UN ANÁLISIS DE COVARIANZA
3
Estadísticamente, una relación espuria es una relación en la cual dos acontecimientos no tienen
conexión, aunque aparentemente la tienen debido a un tercer factor no considerado aún (llamado
"factor de confusión" o "variable escondida"). La relación espuria da la impresión de la existencia de un
vínculo apreciable entre dos grupos que es inválido cuando se examina objetivamente.

Entonces selecciona:
 "Rendimiento en Matemáticas" como Dependiente.
 "Hábitat" en Factores fijos.
 "N-SocEc" (Nivel Socio-económico de las familias) como covariable.
Y pinchamos en "Aceptar".
Los resultados aparecen en la tabla 4.6.
TABLA 4.6. RESULTADOS DEL ANCOVA. PRUEBAS DE EFECTOS INTERSUJETOS
Variable dependiente: Rendimiento en Matemáticas

Suma de
Origen cuadrados tipo III gl Media cuadrática F Sig.
Modelo corregido 256689,123a 4 64172,281 218,424 ,000
Intersección 1,556E7 1 1,556E7 52965,266 ,000
N_SocEc 204068,075 1 204068,075 694,588 ,000
Habitat 19724,214 3 6574,738 22,378 ,000
Error 1937004,669 6593 293,797
Total 2,023E7 6598
Total corregida 2193693,791 6597
a. R cuadrado = ,117 (R cuadrado corregida = ,116)

El resultado buscado se presenta en la cuarta fila: nos indica que existen diferencias en el
rendimiento en función del Hábitat, incluso habiendo controlado el Nivel Socio-económico de
las familias de los estudiantes (0,00<0,05).
En la fila tercera nos indica que la variable "Nivel Socio-económico", al mostrar un nivel crítico
de menos de 0,05 se encuentran relacionadas con la variable dependiente, y tiene sentido
incluirlo en el modelo. Es decir, el Hábitat y el Nivel Socio-económico son dos factores de
inequidad en el sistema educativo cuya influencia es aditiva.
4.4. Anexo. Contrastes a posteriori.
Asumiendo varianzas iguales

LSD. Utiliza pruebas T para llevar a cabo todas las comparaciones por pares entre las medias de los grupos. No se
efectúa ninguna corrección de la tasa de error para el hecho de realizar múltiples comparaciones.
Bonferroni. Utiliza las pruebas T para realizar comparaciones por pares entre las medias de los grupos, pero
controla la tasa de error global estableciendo que la tasa de error de cada prueba sea igual a la tasa de error por
experimento dividida entre el número total de contrastes. Así, se corrige el nivel crítico por el hecho de que se están
realizando múltiples comparaciones.
Sidak. Prueba de comparaciones múltiples por parejas basada en un estadístico T. La prueba de Sidak corrige el
nivel de significación para las comparaciones múltiples y da lugar a límites más estrechos que los de Bonferroni.
Scheffe. Realiza comparaciones conjuntas simultáneas por pares para todas las posibles parejas de
combinaciones de las medidas. Usa la distribución muestral F. Puede utilizarse para examinar todas las
combinaciones lineales de grupos de medias posibles, no sólo las comparaciones por parejas.
R-E-G-W F. Procedimiento múltiple por pasos (por tamaño de las distancias) de Ryan-Einot-Gabriel-Welsch que se
basa en una prueba F.
R-E-G-W Q. Procedimiento múltiple por pasos (por tamaño de las distancias) de Ryan-Einot-Gabriel-Welsch que se
basa en el rango estudentizado.
S-N-K. Realiza todas las comparaciones por parejas entre las medias utilizando la distribución del rango de
Student. Con tamaños de grupo iguales, también compara pares de medias dentro de subconjuntos homogéneos
utilizando un procedimiento por pasos. Las medias se ordenan de mayor a menor y se contrastan en primer lugar
las diferencias extremas.
Tukey. Utiliza el estadístico del rango estudentizado para realizar todas las comparaciones por pares entre los
grupos. Establece la tasa de error por experimento como la tasa de error para el conjunto de todas las
comparaciones por pares.
Tukey-b. Prueba que emplea la distribución del rango estudentizado para realizar comparaciones por pares entre
los grupos. El valor crítico es el promedio de los valores correspondientes a la diferencia honestamente significativa
de Tukey y al método de Student-Newman-Keuls.
Duncan. Realiza comparaciones por pares utilizando un orden por pasos idéntico al orden usado por la prueba de
Student-Newman-Keuls, pero establece un nivel de protección en la tasa de error para la colección de contrastes,
en lugar de usar una tasa de error para los contrastes individuales. Utiliza el estadístico del rango estudentizado.
UT2 de Hochberg. Prueba de comparaciones múltiples y de rango que utiliza el módulo máximo estudentizado. Es
similar a la prueba de la diferencia honestamente significativa de Tukey.
Gabriel. Prueba de comparación por parejas que utiliza el módulo máximo estudentizado y que es generalmente
más potente que la GT2 de Hochberg, cuando los tamaños de las casillas son desiguales. La prueba de Gabriel se
puede convertir en liberal cuando los tamaños de las casillas varían mucho.
Waller-Duncan. Prueba de comparaciones múltiples basada en un estadístico T. Utiliza la aproximación
Bayesiana.
Dunnett. Prueba de comparaciones múltiples por parejas que compara un conjunto de tratamientos respecto a una
única media de control. La última categoría es la categoría de control por defecto. Si lo deseas, puedes seleccionar
la primera categoría. Para comprobar que la media de cualquier nivel del factor (excepto la categoría de control) no
es igual a la de la categoría de control, utiliza una prueba bilateral. Para contrastar si la media en cualquier nivel del
factor es menor que la de la categoría de control, selecciona "Control". Para contrastar si la media en cualquier
nivel del factor es mayor que la de la categoría de control, selecciona "Control".
No asumiendo varianzas iguales
T2 de Tamhane. Prueba conservadora de comparación por parejas basada en la prueba T. Esta prueba es

adecuada cuando las varianzas son desiguales.

T3 de Dunnett. Prueba de comparación por parejas basada en el módulo máximo estudentizado. Esta prueba es
adecuada cuando las varianzas son desiguales.
Games-Howell. Prueba de comparación por parejas que es en ocasiones liberal. Esta prueba es adecuada cuando
las varianzas son desiguales.
C de Dunnett. Prueba de comparación por parejas basada en el rango estudentizado. Esta prueba es adecuada
cuando las varianzas son desiguales
Fuente: Manual base del SPSS.
4.5. Ejercicios
e.4.4. ¿Existen diferencias significativas en el Rendimiento en Lengua de los estudiantes en
función del Hábitat? Si es así, ¿dónde viven los estudiantes que sacan mejores y peores
resultados?
e.4.5. ¿Existen diferencias significativas en el Rendimiento en Lengua de los estudiantes en

función de su hábitat, de su género y de la interacción entre ambas variables?
e.4.6. ¿Existen diferencias en el Rendimiento en Lengua de los estudiantes en función del

Hábitat, si controlamos el efecto del Nivel Socio-económico?
e.4.7. ¿Los estudiantes matriculados en centros públicos obtienen diferente Rendimiento en

Matemáticas que los que asisten a centros privados? ¿Si controlamos el efecto del Nivel
Socio-Económico de las familias, hay diferencias?
e.4.8. ¿El entorno socio-económico donde está situado el centro influye en el Rendimiento de los
estudiantes en Matemáticas? ¿Si lo controlamos por titularidad de centro?


Analisis de Varianza PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Analisis de Varianza PDF

Cargado por

Copyright:

Formatos disponibles

4

Analicemos la pregunta, se trata de estudiar si "existen diferencias significativas en el

La hipótesis nula es:

Si la variable dependiente (hábitat) tuviese dos alternativas utilizaríamos la prueba T de

4.1. Análisis de Varianza Simple

F.J. Murillo y C. Martínez-Garrido Página 52

 Los contrastes a priori se plantean antes de ejecutar el experimento.

El Análisis de Varianza (o ANOVA) es una prueba estadística desarrollada para realizar

Para su uso, es necesario que las variables cumplan tres condiciones:

1. Cada conjunto de datos debe ser independiente del resto.

3. Las varianzas de cada conjunto de datos no deben diferir de forma significativa2.

Esta condición previa de aplicación se verificará estadísticamente mediante una de las

Elije en los menús:

Analizar -> Comparar medias -> ANOVA de un factor

F.J. Murillo y C. Martínez-Garrido Página 53

FIGURA 4.1. CUADRO DE DIÁLOGO ANOVA DE UN FACTOR

1. Selecciona una o más variables dependientes, en este caso: Rendimiento en

Tras aceptar nos ofrece el siguiente resultado (tabla 4.1).

TABLA 4.1. RESULTADOS DEL ANOVA DE UN FACTOR

La información que nos ofrece es la siguiente:

 Suma de cuadrados: es una estimación de la desviación entre los resultados medios y

 gl: Grados de libertad. El número de grupos a comparar, menos 1.

 Media cuadrática: Es el valor de dividir la suma de cuadrados entre los grados de

F.J. Murillo y C. Martínez-Garrido Página 54

 F: Estadístico llamado F. Es el coeficiente de dividir las medias cuadráticas y refleja el

 Sig: Significación o nivel crítico, es la probabilidad de obtener valores F como el

Contrastes post hoc

F.J. Murillo y C. Martínez-Garrido Página 55

F.J. Murillo y C. Martínez-Garrido Página 56

4.2. Análisis de Varianza factorial

TABLA 4.4. EFECTO DE LA INTERACCIÓN ENTRE VARIABLES. RENDIMIENTO EN MATEMÁTICAS DE LOS

F.J. Murillo y C. Martínez-Garrido Página 57

Un ejemplo de esto con nuestros datos puede ser el siguiente:

e.4.2. ¿Existen diferencias significativas en el Rendimiento en Matemáticas de los estudiantes en

Como se observa, probaremos de forma simultánea las tres hipótesis:

1. Existen diferencias significativas en el Rendimiento en Matemáticas en función del

3. Existen diferencias significativas en el Rendimiento de los estudiantes en función de la

Para ello se realizará un Análisis de Varianza Factorial. Este estadístico se encuentra en el

 "Rendimiento en Matemáticas" como Dependiente.

 "Preescolarización" y "Hábitat" como Factores fijos.

F.J. Murillo y C. Martínez-Garrido Página 58

Nos aparecen cuatro opciones:

 Covariables: para hacer un Análisis de Covarianza (ver apartado 4.3).

 Ponderación MCP: si tenemos alguna variable para ponderar al utilizar el Método de

El resultado se muestra en la tabla 4.5.

TABLA 4.5. RESULTADOS DEL ANOVA FACTORIAL. PRUEBAS DE EFECTOS INTERSUJETOS

Variable dependiente:Rendimiento en Matemáticas

Los resultados nos dan respuesta a las tres hipótesis planteadas:

F.J. Murillo y C. Martínez-Garrido Página 59

4.3. Análisis de Covarianza

e.4.3. ¿Existen diferencias en el Rendimiento en Matemáticas de los estudiantes en función del

Al igual que en el Análisis de Varianza Factorial este estadístico se encuentra en el cuadro de

FIGURA 4.5. CUADRO DE DIÁLOGO "UNIVARIANTE", PARA HACER UN ANÁLISIS DE COVARIANZA

F.J. Murillo y C. Martínez-Garrido Página 60

 "Rendimiento en Matemáticas" como Dependiente.

 "Hábitat" en Factores fijos.

 "N-SocEc" (Nivel Socio-económico de las familias) como covariable.

Los resultados aparecen en la tabla 4.6.

TABLA 4.6. RESULTADOS DEL ANCOVA. PRUEBAS DE EFECTOS INTERSUJETOS

Variable dependiente: Rendimiento en Matemáticas

F.J. Murillo y C. Martínez-Garrido Página 61

4.4. Anexo. Contrastes a posteriori.

Asumiendo varianzas iguales