Está en la página 1de 72

ANÁLISIS DE LA

VARIANCIA
R1. Dr. Fernando Niño
Daniel Wayne
Técnica mediante la cual la variación total presente en un conjunto de datos se
distribuye en varios componentes. Asociada con cada uno de estos componentes
hay una fuente específica de variación, de modo que en el análisis es posible
averiguar la magnitud de las contribuciones de cada una de estas fuentes a la
variación total.
¿Qué es Análisis de la Varianza (ANOVA)?

El Análisis de la Varianza (ANOVA) es una técnica estadística que se utiliza para


comparar la media de tres o más grupos y determinar si existen diferencias
significativas entre ellas.
Por ejemplo, para estudiar la efectividad de diferentes medicamentos para la diabetes, los científicos
diseñan y experimentan para explorar la relación entre el tipo de medicamento y el nivel de azúcar
sanguínea resultante. La población de la muestra es un conjunto de personas. Dividimos la población de
la muestra en varios grupos y cada grupo recibe un medicamento en particular durante un período de
prueba. Al final del período de prueba, se miden los niveles de azúcar sanguínea para cada uno de los
participantes individuales. Luego, para cada grupo, se calcula el nivel medio de azúcar sanguínea.
ANOVA ayuda a comparar las medias de estos grupos para averiguar si son estadísticamente diferentes
o si son similares.

El resultado de ANOVA es la 'estadística F'. Este ratio muestra la diferencia entre la varianza dentro del
grupo y la varianza entre grupos, lo que finalmente produce una cifra que permite concluir que la
hipótesis nula es respaldada o rechazada. Si hay una diferencia significativa entre los grupos, la hipótesis
nula no es compatible y la razón F será mayor.
El análisis de la Varianza se utiliza con dos fines
distintos:
1. Estimar y probar las hipótesis acerca de las varianzas de las poblaciones.

2. Estimar y probar las hipótesis acerca de las medias de las poblaciones.


En la presentación del análisis de la variancia para
los diferentes diseños se sigue el siguiente formato:

1. Modelo. El modelo consistirá de una representación simbólica de un valor


típico tomado de los datos que se están analizando.

2. Suposiciones. Se especificarán las suposiciones que fundamentan el modelo.

3. Hipótesis. Se indicarán las hipótesis que pueden probarse de acuerdo al


modelo. Se indicarán las hipótesis nula y alternativa apropiadas.

4. Cálculos. Se explicarán los cálculos aritméticos necesarios.


5. Tabla ANDEVA. Los resultados de los cálculos aritméticos se resumirá en una
tabla que permitirá una estimación rápida y conveniente de los resultados.

6. Decisión. Se tomará una decisión estadística en lo referente a si debe


rechazarse o no una hipótesis nula. Cualquier decisión administrativa o clínica
será afectada por la decisión estadística.
Utilícese un nivel de importancia de .05.

Si Ho es verdadera y se satisfacen las suposiciones de varianzas iguales y


poblaciones con distribución normal, la situación de las poblaciones se observa
como en la figura 7.2.1. Cuando Ho es verdadera, todas las medias de las
poblaciones son iguales, y las poblaciones se centran en el mismo punto (la
media común) sobre el eje horizontal. Si las poblaciones muestran distribución
normal con varianzas iguales, las distribuciones serán idénticas, de modo que al
trazar las gráficas se superponen unas con otras, y sólo una de ellas las
representa convenientemente.
Cuando Ho es falsa, puede serlo debido a que una de las medias de las
poblaciones difiere de todas las demás que son iguales entre sí. O bien puede
ocurrir que todas las medias de las poblaciones sean distintas. Estas son sólo dos
de las posibilidades cuando Ho es falsa, Hay muchas otras combinaciones
posibles de medias iguales y distintas. La figura 7.2.2. muestra la gráfica de las
poblaciones cuando satisfacen las suposiciones, pero Ho es falsa debido a que
no hay dos medias de poblaciones que sean iguales.
Supuestos de la estadística paramétrica
Es un procedimiento que utilizamos en estadistica parametrica tiene que cumplir
los requisitos de la estadística paramétrica:

● Variable de resultado (dependiente) sea cuantitativa (nivel de medición


intervalo o razón).
● Más de 30 participantes (datos).
● Distribución normal.
● Homocedasticidad (homogeneidad de varianza, que las distribuciones de las
varianzas sean similares).
ANOVA
● ANOVA (Anlysys of Variance) es un tipo de procedimiento estadístico que
permite identificar si las diferencias entre grupos son estadísticamente
significativas. (siempre lo vamos a utilizar cuando tenemos 3 o más
grupos que comparar).
● Su análisis se basa en el análisis de las varianzas, o la variabilidad del
conjunto de datos. (En la dispersión de los datos, que tanto se dispersan
los datos de la media es el principio con el que va trabajar este
procedimiento estadístico).
● Existen diferentes procedimientos basados en el ANOVA.
Tipos de ANOVA

1. ANOVA de una vía (one way ANOVA) compara tres o más


grupos independientes, teniendo una variable clasificatoria
(independiente) y una de resultado (dependiente).
2. ANOVA de medidas repetidas (ANOVA RM) teniendo una
variable clasificatoria (independiente) y una de resultado
(dependiente).
3. ANOVA factorial*, compara varios grupos, teniendo más de
una variable clasificatoria (independiente) y una de
resultado (dependiente).
4. MANOVA, compara varios grupos, teniendo una variable
clasificatoria (independiente) y varias de resultado
(dependiente).
ANOVA de una vía
● Es una prueba paramétrica.
● Se utiliza para comparar 3 o más muestras independientes (sujetos
diferentes en cada grupo).
● La variable dependiente o de resultado es cuantitativa. (Nivel de intervalo o
de razón).
● Se comparan las varianzas de los grupos. (Ver la variabilidad de las
varianzas, en cómo se van distribuyendo los datos alrededor de la media.
● Se asume independencia de las muestras.
ANOVA de una vía
Evalúa las diferencias en las respuestas de los sujetos que pertenecen a tres o
más grupos diferentes.
Principio para entender en qué consiste el análisis de
varianza. (análisis de variabilidad)

Es la media de las medias

Que tanto se dispersan los datos alrededor de la


gran media.

Cómo varían las puntuaciones de los


sujetos alrededor de la media de ese
grupo.
Elementos de Análisis de Varianza

El estadístico del análisis


de varianza.
Cálculo de Suma de Cuadrados Total
Cálculo de Suma de Cuadrados Entre
Cálculo de Suma de Cuadrados Intra
Elementos del Análisis de Varianza

F= valor de la anova
Zona de Rechazo
Para rechazar la Ho, se requiere que F
sea igual o MAYOR que el valor crítico
de las tablas.

Se ubica en columnas los grados de


libertad del numerador (gl entre) y en el fila
de los grados de libertad del denominador
(gl intra). El valor crítico corresponde al
valor en el que se cruzan numerador con
denominador.
Conclusión
Ho: No existen diferencias entre los grupos.
H1: Existen diferencias entre los grupos.
F= 12 Valor Crítico= 5.143

Dado que el valor de F (12) es mayor que el valor crítico (5.143) a una p < .05, se
rechaza la hipótesis nula y se acepta la hipótesis de investigación. Por lo tanto,
existen diferencias entre los grupos.
F(2,6) = 12, p<.05
ANOVA de una vía únicamente nos indica qué hay diferencias entre los grupos;
sin embargo ¿Todos los grupos son diferentes? es decir ¿Hay diferencias entre
todos los grupos o sólo entre algunos?
Pruebas Post hoc

Las pruebas Post hoc nos ayudan a identificar entre qué grupos se presentan las
diferencias estadísticamente a significativas. Dependiendo de las características
de nuestros datos, es el tipo de prueba post hoc que vamos a aplicar. Sin
embargo, las más usuales son Tukey y Scheffé.
Pruebas
Post hoc
Post hoc
Ejercicio (tarea)
Se desea averiguar si existen diferencias en
las puntuaciones de religiosidad a partir de la
orientación sexual.

1. Plantea la hipótesis nula y de investigación.


2. Calcula el valor de F.
3. Establece el valor crítico en tablas.
4. Compara los valores de F y crítico.
5. Realiza una interpretación y conclusión a partir de los valores
obtenidos.
ANOVA de medidas repetidas (RM)
Es una prueba paramétrica que cubre los supuestos de la estadística paramétrica
● Permite identificar si las diferencias entre tres o más grupos relacionados son
estadísticamente significativas. (Analizamos la comparación de los cambios que
hay en cada sujeto a través del tiempo).
● ANOVA de MR nos ayuda a identificar si existen diferencias entre estos tres
momentos en los que estamos midiendo los sujetos.
● Requiere menos sujetos que el diseño de una vía (que es completamente
aleatorizado).
● Permite eliminar la variación residual debida a la diferencia entre los sujetos (pues
son los mismos).
● Por lo tanto se ajusta la suma de cuadrados entre grupos, removiendo las
diferencias individuales.
ANOVA de medidas repetidas (RM)
Evalúa las diferencias en las respuestas de los sujetos que pasan por tres o más
condiciones.
En ANOVA (MR) necesitamos hacer
ajustes para eliminar la varianza de
los individuos.
Elementos del análisis de varianza MR
Cálculo de Suma de Cuadrados Entre
Cálculo de Suma de Cuadrados Intra
Cálculo de Suma de Cuadrados Entre Sujetos
Cálculo de Suma de Cuadrados del Error
Elementos del Análisis de Varianza MR
Elementos del Análisis de Varianza MR
Zona de Rechazo
Para rechazar la Ho, se requiere que F sea mayor que el valor crítico de las tablas.

Se ubica en columnas los grados de


libertad del numerador (gl entre) y en
la fila los grados de libertad del
denominador (gl error). El valor
crítico corresponde al valor en el que
se cruzan numerador con
denominador.
Conclusión

Ho: no existen diferencias entre las condiciones.


H1: existen diferencias entre las condiciones.
F= 7.777 Valor Crítico: 4.103

Dado que el valor F (7.777) es mayor que el valor crítico (4.103) a una p<.05, se
rechaza la Ho y se acepta la hipotesis de investigación, por lo tanto existen
diferencias entre las condiciones.
F(2,10) = 7.777, p<.05
Ejercicio (tarea)
Se desea averiguar si existen diferencias
en la cantidad de recuerdos que
prevalecen después de que han
transcurrido diferentes periodos de
tiempo.

1. Plantea la hipótesis nula y de investigación.


2. Calcula el valor de F.
3. Establece el valor crítico en tablas.
4. Compara los valores de F y crítico.
5. Realiza una interpretación y conclusión a partir de los valores obtenidos.
ANOVA factorial
ANOVA factorial*, compara varios grupos, teniendo más de una variable
clasificatoria (independiente) y una de resultado (dependiente).
Ejercicio
Se describe un experimento en el que la agencia de protección ambiental busca
determinar el efecto de dos métodos de tratamiento de aguas sobre la absorción
del magnesio.

Se miden los niveles de magnesio, en gramos por centímetro cúbico (cc) y se


incorporan dos niveles diferentes de tiempo al experimento. Los datos son los
siguientes: Factor B o 2

Factor A o 1

A través del ANOVA vamos a ver si la absorción del magnesio tiene que ver con el factor 1 o 2 o ambos.
3 Conclusiones que vamos a resolver
Factor A: Tiempo

Factor B: Tratamiento

HoA: No hay diferencia entre el tiempo y la absorción del magnesio.

HoB: No hay diferencia entre el tratamiento y la absorción del magnesio.

HoAB: No hay interacción entre el tiempo y el tratamiento del mismo que influya
en la absorción del magnesio.
FÓRMULAS
PRIMEROS DATOS QUE DEBEMOS DE DETERMINAR
VALORES A DETERMINAR
# total de datos

# total de muestras

#datos x fila

#datos x columna

promedio general 12 datos


SSA= suma de cuadrados para determinar el factor A

# total de datos
# muestras x grupo
#datos x fila
#datos x columna

promedio general 12 datos


SSB= suma de cuadrados para determinar el factor B

# total de datos
# muestras x grupo

#datos x fila
#datos x columna
promedio general 12 datos
SSAB= Suma de cuadrados de la interacción de A con B
SST= Suma de cuadrados del total

Factor de variación
CONCLUSIÓN
Regla de decisión para el tiempo:

5.318<56.90

Se rechaza HoA y se concluye que el tiempo si influye en la absorción del magnesio.

Regla de decisión para el tratamiento:

5.318<56.90

Se rechaza HoB y se concluye que el tratamiento si influye en la absorción del magnesio.

Regla de decisión para interacción:

5.318>0.0319

No se rechaza HoAB y se concluye que la interacción del tiempo y el tratamiento no influye


en la absorción del magnesio.
Diferencia entre la Prueba ANOVA y la Prueba t de Student
La principal diferencia entre la prueba ANOVA y la prueba t de Student es que la prueba t de
Student se utiliza para comparar las medias de dos grupos, mientras que la prueba ANOVA se
utiliza para comparar las medias de tres o más grupos.

● La prueba t de Student es una prueba estadística paramétrica que se utiliza para


comparar las medias de dos grupos independientes. Se utiliza para determinar si hay una
diferencia significativa entre las medias de dos grupos de datos. La prueba t de Student
se basa en una suposición de normalidad y varianzas iguales en ambos grupos.
● Por otro lado, la prueba ANOVA es una prueba estadística paramétrica que se utiliza para
comparar las medias de tres o más grupos independientes. Se utiliza para determinar si
hay una diferencia significativa entre las medias de tres o más grupos de datos. La prueba
ANOVA se basa en la suposición de normalidad y homogeneidad de varianzas en todos
los grupos.
Conclusión General
En conclusión, el análisis de la varianza (ANOVA) es una herramienta estadística poderosa que
se utiliza para comparar las medias de tres o más grupos de datos. Una de las principales
ventajas de realizar una prueba ANOVA es que permite determinar si hay una diferencia
significativa entre las medias de los grupos, lo que puede ser útil en diversas áreas como la
investigación clínica, la industria, el marketing y la economía.

En la investigación clínica, la prueba ANOVA se puede utilizar para comparar la efectividad de


diferentes medicamentos para la diabetes, para explorar la relación entre el tipo de medicamento y
el nivel de azúcar sanguínea resultante. La población de la muestra es un conjunto de personas.
Dividimos la población de la muestra en varios grupos y cada grupo recibe un medicamento en
particular durante un período de prueba. Al final del período de prueba, se miden los niveles de
azúcar sanguínea para cada uno de los participantes individuales. Luego, para cada grupo, se
calcula el nivel medio de azúcar sanguínea. ANOVA ayuda a comparar las medias de estos grupos
para averiguar si son estadísticamente diferentes o si son similares.
Bibliografía

● Wayne, D. (1991). BIOESTADÍSTICA Base para el Análisis de las Ciencias de la Salud.


España: Limusa Noriega.

● Guerra Dávila, T. (2014). Bioestadística. Facultad de Estudios Superiores Zaragoza,


Universidad Nacional Autónoma de México.

● Profe Abejita [Jessica Landeros]. (29/Abril/2020). Metodología de la Investigación y


Estadística para Novatos. [Video]. Recuperado de
https://www.youtube.com/@profeabejita1711/featured

También podría gustarte