Está en la página 1de 3

GUÍA METODOLÓGICA DE ESTADÍSTICA INFERENCIAL

ING. ROBERTO LINCE


ANALISIS DE VARIANZA
Para comprender el Análisis de varianza es necesario retomar lo que se entiende por Varianza,
Varianza: es el valor que expresa el grado de dispersión que presentan los datos de una variable
aleatoria, y se constituye en una medida de la diversidad de los elementos que han sido valorados en
una población.

Esto es; mide la diferencia que existe en los elementos de una población respecto del valor central,
adicionalmente, se deberá entender que, esta diferencia se debe al efecto de muchos factores de influencia
que determinan la lógica de ocurrencia de una característica en los sujetos poblacionales. Así por ejemplo,
en la estatura de las personas de una población específica, intervienen elementos como: la raza, las
condiciones ambientales, los rasgos genéticos, la alimentación, el deporte, el clima, etc. De estos factores
habrá que hacer una diferencia, la cual determina el tipo de factor a considerarse,
Factores inherentes: se considera a todos aquellos factores que son parte natural del comportamiento
de una variable o que son aquellos elementos que no se pueden manipular, (al menos no de una forma
simple) como es el caso de la estructura genética, o las condiciones ambientales para el caso de la
estatura y conforman el componente ALEATORIO de la varianza. Por otro lado,

Factores exógenos: son aquellos que de una u otra manera pueden ser manipulados y controlados
con la finalidad de influir en el comportamiento de la variable de análisis, estos conforman el
componente NO aleatorio de la varianza, para el caso del ejemplo serían la alimentación, el deporte
etc.

Dentro de esto, se entiende entonces que la variabilidad de la variable se debe a la conjugación de todos
estos factores aleatorios y exógenos, consecuentemente, el Análisis de Varianza (ANOVA) consiste en
determinar los efectos exógenos y separarlos de los aleatorios a través de procedimientos estadísticos.

Considerando que son muchos los factores que pueden afectar el comportamiento de la variable de análisis,
corresponde entonces simplificar el procedimiento y determinar los criterios para dicha descomposición.

3.1. ANOVA DE UN SOLO FACTOR


Si se considera como variable de análisis a la característica de interés y a una variable auxiliar como factor,
entonces se tiene un ANOVA de un solo factor. Es decir, existe una condición que es la que se requiere valorar
(Variable de Análisis) y una variable como elemento de influencia (Factor),
Variable de análisis: es aquella que refleja los valores de la característica o condición que se está
valorando, como es la estatura para el caso de ejemplo.

Factor: es aquella variable adicional que se define como causa o factor de influencia en el
comportamiento de la variable de análisis y se constituye en el criterio de manipulación o intervención
en el experimento. Para el ejemplo podría ser la alimentación o entrenamiento deportivo.

Tratamiento: es el nivel del factor, esto es, son los rangos o niveles de la variable auxiliar, definidos
como criterios de intervención. Para el ejemplo podrían ser diferentes tipos de dietas según niveles
nutricionales específicos para el caso de la alimentación como factor o, tipos de entrenamiento para el
caso de la actividad deportiva.

Una vez separados los componentes de la varianza, se procederá a realizar una prueba sobre la diferencia
de las varianzas, si la variación exógena es mayor que la variación aleatoria, entonces el factor influye
significativamente en la variable de análisis y corresponderá identificar el mejor nivel de influencia.
El procedimiento para llevar a cabo el ANOVA de un solo factor:

1. Definiciones.- Población, Variable de Análisis, Parámetro, Factor y Tratamientos.


2. Formular las hipótesis.- para este caso las hipótesis serán:
H0: µ1 = µ2 = µ3 … = µk
H1: al menos uno es diferente
3. Determinar la significancia y el valor crítico.- es decir, el valor de F en la tabla conforme la significancia (α), los
grados de libertad del numerador (δ1) y del denominador (δ2). Es decir el valor de Fα; δ1; δ2 =
4. Establecer la regla de decisión.- Si Fc > Fα ; se rechaza H0
𝑆2
5. Escoger el estadístico de prueba.- en este caso la prueba de diferencia de varianzas 𝐹𝑐 = 1⁄ 2
𝑆2
6. Calcular los valores.- realizar la tabla del ANOVA,
7. Tomar la decisión.- esto es, rechazar o aceptar H0 según la evidencia muestral,
8. Elaborar la conclusión general.- resolución conforme el escenario de aplicación de la prueba.

Cuadro de datos:

Tratamientos
Nivel 1 Nivel 2 Nivel 3 … Nivel i
a11 a12 a13 a1i
a21 a22 a23 a2i
a31 a32 a33 a3i
… … … … …
aj1 aj2 aj3 aji

Total 1 Total 2 Total 3 Total i


n1 n2 n3 ni TOTALij
µ1 µ2 µ3 µi
Para realizar la Tabla ANOVA se procede de la siguiente manera:

Fuente de Suma de Grados de


Cuadrado medio Calculada F
Variación cuadrados libertad
Tratamientos SSA k-1 𝑆𝑆𝐴
𝑆12 =
𝑘−1 𝑆12
𝑓𝑐 = 2
𝑆
Error SSE n-k 𝑆𝑆𝐸
𝑆2 =
𝑘(𝑛 − 1)
Total SST n-1

Donde los cálculos se obtienen por medio de las siguientes ecuaciones:

𝑘 𝑏
2
𝑇2
𝑆𝑆𝑇 = ∑ ∑ 𝑥𝑖𝑗 −
𝑛
𝑖=1 𝑗=1

𝑘
𝑇𝑖2 𝑇 2
𝑆𝑆𝐴 = ∑ −
𝑛𝑖 𝑛
𝑖

𝑆𝑆𝐸 = 𝑆𝑆𝑇 − 𝑆𝑆𝐴

En el caso de que la hipótesis nula sea rechazada, corresponde a la identificación del mejor nivel del
tratamiento, para ello se procede a determinar las diferencias estadísticas de los tratamientos a partir de la
construcción de los intervalos para la diferencia de promedios de todos los pares posibles según el número
de tratamientos:

Intervalos para la diferencia de medias de los tratamientos:

Diferencia de
Valor de tα Error de muestreo Límites
Promedios:
𝑡𝛼;𝑔𝑙
𝑔𝑙 = 𝑛1 + 𝑛2 − 2 1 1 Límite superior
𝑥̅1 − 𝑥̅2 𝑒𝑥̅1 −𝑥̅ 2 = 𝑡α/2√𝐶𝑀𝐸 ( + ) (𝑥̅1 − 𝑥̅2 ) + 𝑒𝑥̅ 1 −𝑥̅2
𝑛1 𝑛2

𝑡𝛼;𝑔𝑙
𝑔𝑙 = 𝑛1 + 𝑛3 − 2 1 1 Límite inferior
𝑥̅1 − 𝑥̅3 𝑒𝑥̅1 −𝑥̅ 3 = 𝑡α/2√𝐶𝑀𝐸 ( + ) (𝑥̅1 − 𝑥̅2 ) − 𝑒𝑥̅ 1 −𝑥̅2
𝑛1 𝑛3

También podría gustarte