Está en la página 1de 17

ANÁLISIS DE LA VARIANZA

ÍNDICE
1. Iniciemos
2. Organiza tus ideas: Conceptos clave
3. Profundiza tus conocimientos: ANOVA unidireccional
4. Fortalece tus conocimientos: Fórmulas para el cálculo de ANOVA unidireccional
5. Visualiza: ANOVA bidireccional: Diseños factoriales
6. Conclusiones/Para terminar …
INTRODUCCIÓN
¡Bienvenido al análisis de la varianza!

Aquí vamos a ver cómo probar hipótesis para más de dos poblaciones.

Al cumplir con el desarrollo de la presente unidad estarás en capacidad de:

1. Comprender el funcionamiento de la técnica ANOVA y sus posibles usos.


2. Identificar las fórmulas y los conceptos que nos permiten hacer análisis de
la varianza.

¡Acompáñame!

Organiza tus ideas: Conceptos clave


A continuación, se presentan algunos conceptos importantes en el área de la esta-
dística.

• Estadística: Es la ciencia que se encarga de recolectar, organizar, analizar e


interpretar datos.
• Estadísticas: Son números obtenidos de un conjunto o colección de datos.
• Estadística descriptiva: Es la rama de la estadística que comprende todos los
métodos y técnicas usados para organizar y describir información.
• Estadística inferencial: Es la rama de la estadística que comprende todos los
métodos y técnicas usados para hacer inferencias, estimaciones o predicciones
sobre poblaciones a partir de una muestra.
• Dato: Es una porción de información.
• Datos: Sinónimo de muestra.
• Población: Es el conjunto de todos los elementos de interés para un
investigador.
• Muestra: Es cualquier subconjunto de la población.
• Parámetro: Cualquier característica numérica de una población.
• Estadístico: Cualquier característica numérica de una muestra.
• Big Data: Término utilizado para describir conjuntos de datos tan grandes que
los tradicionales y típicos procesos de almacenamiento, gestión, búsqueda,
análisis, entre otros han convertido en un reto debido a su tamaño.
• Datos cualitativos: Información categórica.
• Datos cuantitativos: Información numérica. Se puede clasificar en continuos y
discretos.
• Datos cuantitativos discretos: Son obtenidos de un proceso de conteo. Núme-
ros naturales, enteros o racionales.
• Medida: Es un valor representativo de un conjunto de datos.
• Valor atípico (o outlier): Es una medida con un valor extremo en un conjunto
de datos. Puede indicar un error de anotación o una medida muy poco común en
la población.
• Distribución de frecuencias: Es sinónimo de tabla de frecuencias y puede ser
representada gráficamente con ayuda de histogramas.
• Evento simple: Es el evento que corresponde a un solo punto muestral y se
nota por E con un subíndice.
• Evento vacío: El evento vacío se nota por ∅ y es el evento que no tiene elemen-
tos.
• Error muestral: Es la variación natural que existe entre las muestras de una
misma población, cuando las muestras no son copias exactas de la población.
• Errores no muestrales: Son los errores que surgen al tomar una muestra.
• Sesgo muestral: Es un tipo de error no muestral y es una tendencia sistemática
inherente a un método de muestreo que da estimaciones de un parámetro. El
sesgo es negativo si las estimaciones son menores y positivo si las estimaciones
son mayores.
• Aleatorización: Proceso de selección de muestras donde la selección es impar-
cial o no está sesgada.
• Muestra aleatoria: Es una muestra elegida con procedimientos aleatorios.
• Hipótesis estadística: Es una afirmación o una declaración que se hace acerca
de una propiedad de una población.
• Fuente: Es una persona, cosa, objeto o algo que produce datos.
• Factor (o tratamiento): Variable independiente cuyo efecto en la variable de
respuestas, es de interés para el investigador.

Ya conociste los conceptos que necesitas en tu camino de aprendizaje. Continue-


mos, es hora de viajar a Profundizar tus conocimientos

Profundiza tus conocimientos: ANOVA


unidireccional
El análisis de la varianza unidireccional (o ANOVA unidireccional) es una metodolo-
gía para analizar:

• La variación que hay entre las diferentes muestras.


• La variación que existe al interior de las muestras.
• Esta variación se realiza con varianzas.

El ANOVA unidireccional permite poner a prueba hipótesis de la forma

Al menos una de las k medias poblacionales es diferente.


Los supuestos del ANOVA unidireccional son:

1. Todas las k poblaciones son normales.


2. Todas las varianzas poblacionales son iguales

El estadístico F para el ANOVA unidireccional es

Para realizar el ANOVA es necesario tener k muestras y en cada muestra tener la


media muestral, la desviación estándar muestral y el tamaño de la muestra.

Muestra 1 Muestra 2 ... Muestra k

Para simplificar los cálculos se hace el supuesto que los tamaños de todas las
muestras son iguales, es decir

Y este hecho nos permite estimar la varianza σ2 con la varianza promedio de las
varianzas muestrales al interior de las muestras.
La media de todas las k medias muestrales recibe el nombre de gran media y
está dada por

Y tiene grados de libertad dados por

La distribución del estadístico

Es la distribución F y por tanto el valor crítico para este caso es

Ejemplo [ANOVA unidireccional]

Se tienen las siguientes muestras obtenidas de poblaciones normales.


Muestra 1 Muestra 2M Muestra 3
43 52 46
46 51 46
45 52 46
44 50 46
45 51 47
43 50 47

Para los datos se tiene la siguiente información

Muestra 1M Muestra 2M Muestra 3

Luego

y
Ahora, para las hipótesis estadísticas

Como

Entonces se rechaza la hipótesis nula y se asume que las medias poblacionales


no son iguales.

Ver (Pérez et al., 2015), (Anderson et al., 2008) y (Weimer, 1993).

¡Y bien! No olvides repasar el tema de ANOVA unidireccional

¡Vamos al siguiente recurso con la temática Fórmulas para el cálculo del ANOVA
unidireccional!

Fortalece tus conocimientos: Fórmulas


para el cálculo de ANOVA unidireccional
¿Quieres saber qué son las Fórmulas para el cálculo del
ANOVA unidireccional?

¡Vamos!
Como se vio en la sección anterior se toman k muestras, donde cada
muestra proviene de una población diferente para poner a prueba las hipótesis
estadísticas.

Los datos obtenidos en las k muestras se pueden organizar de la


siguiente manera.

El número total de medidas se nota por N y se define como

Y la gran media está dada por

La suma de los cuadrados de las desviaciones respecto a la gran media recibe el


nombre suma de cuadrados para el total
Sean la suma de cuadrados entre muestras notada por SSB y definida como

Y sea la suma de cuadrados al interior de las muestras notada por SSW


y definida como

Entonces se tiene que las tres sumas de cuadrados se relacionan mediante la


ecuación

SST=SSB+SSW

Los grados de libertad para las sumas de cuadrados para SST, SSB y SSW son
respectivamente

Un cuadrado medio en general en estadística es el cociente entre la suma de


cuadrados y los grados de libertad y sirven como estimación de la varianza.

Así pues, el cuadrado medio entre muestras que representa la variación entre
las muestras es

El cuadrado medio al interior de las muestras (o cuadrado medio del error)


este dado por

El valor del estadístico de prueba F está dado por


Ejemplo

Se tienen tres muestras con los siguientes datos

Entonces se tiene que el número total de datos es


N=5+5+5=15

Las sumas de cuadrados son

Los cuadrados medios son

Luego el estadístico de prueba es


Para α=0.05 se tiene el valor crítico

Ahora suponemos que queremos poner a prueba las hipótesis

Basándonos en la información anterior


Como

Entonces no se rechaza la hipótesis nula.

¡Espera! ¿Qué es ANOVA bidireccional: ¿Diseños factoriales?

Te invito a que continuemos en el siguiente recurso donde daremos respuesta a


esta pregunta…

Visualiza: ANOVA bidireccional:


Diseños factoriales
• Un factor es una variable independiente cuyo efecto en la variable de respues-
tas, es de interés para el investigador.
• Los niveles de un factor son los valores del factor usado en el experimento.

Ejemplo [Factores y niveles de un factor]

En un estudio se mide el gasto promedio de gasolina por kilómetro para tres mar-
cas de carros

Marcas de carros= {Ford, Toyota, Renault}

En este caso la marca del automóvil es el factor y el factor tiene tres niveles que
son Ford, Toyota y Renault y la variable dependiente es el promedio de gasolina
por kilómetro.
Experimentos con dos factores

• Se tiene un experimento que tiene dos factores A y B.


• A tiene a niveles.
• B tiene b niveles.
• Existe un número total de posibles combinaciones de los niveles de A y de B
igual a ab (número total de tratamientos en el experimento).
• Este experimento recibe el nombre de experimento factorial a×b.
• Los dos factores son independientes en el sentido que uno no afecta a otro.

Ejemplo [Experimento con dos factores]


Factor B

20 15 17
30 10 14
Factor A 16 18 22
13 19 25

Este es un experimento factorial 2×3 con dos réplicas por tratamiento.

Existe una interacción entre dos factores si el efecto de uno de los factores cam-
bia para las diferentes categorías del otro factor.

• Para todo experimento factorial bidireccional que involucre los factores A y B


hay tres preguntas principales para un investigador
• ¿Hay un efecto en la variable de respuesta debido a la interacción de los fac-
tores A y B?
• ¿Hay un efecto en el tratamiento en la variable de respuesta debido al factor
A?
• ¿Hay un efecto del tratamiento en la variable de respuesta debido al factor B?

Las hipótesis estadísticas que nos ayudan a responder estas preguntas son:

1. Prueba para las interacciones de A y B


H0: Las variables A y B no interactuan para afectar la variable de respuesta. H1:
Las variables A y B interactuan para afectar la variable de respuesta.

2. Prueba para los efectos del factor A


H0: No hay diferencia entre las diferentes medias a de los diferentes niveles del
factor A H1: Al menos dos medias de niveles del factor A difierente.
3. Prueba para los efectos del factor B
H0: No hay diferencia entre las diferentes medias b de los diferentes niveles del
factor B H1: Al menos dos medias de niveles del factor B difieren.

Condiciones para usar ANOVA bidireccional

• Cada tratamiento tiene al menos dos medidas.


• Las muestras ab de n medidas son aleatorias e independientes.
• Las poblaciones de las que proceden las muestras tienen poblaciones iguales.

El ANOVA bidireccional requiere dividir


SST: Suma de cuadrados total de la variable de respuesta.
en
SSA: Suma de cuadrados del factor A.
SSB: Suma de cuadrados del factor B.
SSAB: Suma de cuadrados de la interacción entre los factores A y B
SSE: Suma de cuadrados del error

Esto es, la relación entre las sumas de cuadrados es

SST=SSA+SSB+SSAB+SSE

Fórmulas para las sumas de cuadrados en el ANOVA bidireccional


Los grados de libertad son

vT=abn-1

vA=a-1

vB=b-1

vE=ab(n-1)

vAB=(a-1)(b-1)

Los cuadrados medios son

Los estadísticos de prueba son

Donde
Ejemplo

Sean los datos


Factor B

20 15 17
30 10 14
Factor A 16 18 22
13 19 25

Aquí

a=2
b=3
n=2

Se calculan los totales

Por complejidad en los cálculos no es recomendable hacerlo a mano. En este


caso usaremos Excel para hacer los cálculos

Habilitar el complemento análisis de datos en Excel


Introducir los datos en Excel

En el complemento Análisis de datos seleccionar Análisis de varianza de dos fac-


tores con varias muestras por grupo

Seleccionar el rango de entrada


En Fila por muestra colocar el número de medidas en cada tratamiento para
nuestro caso

n=2

El alfa es el nivel de significancia que para nuestro caso es α=0.05. Selecciona-


mos rango de salida y damos aceptar y se obtiene la tabla de resumen

Se observa en la tabla que la hipótesis nula solo se rechaza en la interacción


entre A y B.

Para finalizar la temática vamos a revisar las conclusiones

Conclusiones: Para terminar


• ANOVA de un factor nos permite comparar las medias poblacionales de varias
poblaciones teniendo en cuenta dos tipos de varianzas, la varianza en cada
muestra y la varianza entre las muestras.
• ANOVA de dos factores nos permite identificar las interacciones que existen
entre dos factores que afectan a una variable de respuesta y lo hace descom-
poniendo la varianza total.

Hemos llegado al final de esta temática, recuerda realizar todas las actividades
que encuentras en la plataforma.
Nos vemos en otra oportunidad para continuar aprendiendo más

¡Hasta pronto!

También podría gustarte