Está en la página 1de 10

MODELO DE

ANOVA PARA
UN SOLO
FACTOR
Cada observación puede escribirse en la forma
+
donde mide la desviación que tiene la observación j-ésima de la i-ésima muestra, con respecto de la
media del tratamiento correspondiente. El término representa el error aleatorio. Una forma alternativa
de esta ecuación se obtiene sustituyendo , sujeta a la restricción . Por lo tanto, escribimos
+
donde μ tan sólo es la media general de todas las μ_i, es decir,
,
y se denomina el efecto del i-ésimo tratamiento.
Teorema 1:
Identificaremos los términos de la identidad de la suma de cuadrados con la siguiente notación:

Entonces, la identidad de la suma de los cuadrados se puede representar simbólicamente


con la ecuación
STC = SCT + SCE
La identidad anterior expresa cómo las variaciones entre los tratamientos y dentro de los tratamientos
contribuyen a la suma total de cuadrados. Sin embargo, podemos obtener mucha información si se investiga
el valor esperado tanto de SCT como de SCE.
•Suma de Cuadrados Total o Total Sum of Squares (STC o TSS): mide la variabilidad
total de los datos, se define como la suma de los cuadrados de las diferencias de cada
observación respecto a la media general de todas las observaciones. Los grados de
libertad de la suma de cuadrados totales es igual al número total de observaciones
menos uno (nk-1).
•Suma de cuadrados del factor o Sum of Squares due to Treatment (SCT o
SST): mide la variabilidad en los datos asociada al efecto del factor sobre la media (la
diferencia de las medias entre los diferentes niveles o grupos). Se obtiene como la
suma de los cuadrados de las desviaciones de la media de cada proveedor respecto de
la media general, ponderando cada diferencia al cuadrado por el número de
observaciones de cada grupo. Los grados de libertad correspondientes son igual al
número niveles del factor menos uno (k-1).
Suma de cuadrados residual/error o Sum of Squares of Errors (SCE o SSE): mide la
variabilidad dentro de cada nivel, es decir, la variabilidad que no es debida a variable
cualitativa o factor. Se calcula como la suma de los cuadrados de las desviaciones de
cada observación respecto a la media del nivel al que pertenece. Los grados de
libertad asignados a la suma de cuadrados residual equivale la diferencia entre los
grados de libertad totales y los grados de libertad del factor, o lo que es lo mismo k(n-
1). En estadística se emplea el termino error o residual ya que se considera que esta es
la variabilidad que muestran los datos debido a los errores de medida.
Cuadrados medios y su cálculo
Un cuadrado medio es una suma de cuadrados dividida entre sus correspondientes grados de
libertad. En el contexto del ANOVA se tiene las siguientes expresiones para el cálculo de los
cuadrados medios:
CMTr = = , CME = =

El cuadrado medio del error es una estimación insesgada de la varianza común de los grupos ).

Prueba de hipótesis y tabla ANOVA


Recordando que en el análisis de varianza el interés radica en probar la hipótesis,

Es intuitivo pensar en rechazar la hipótesis nula cuando la variabilidad entre los grupos
(tratamientos) es sustancialmente mayor que la variabilidad de las mediciones dentro de los
tratamientos. Bajo este razonamiento, la teoría estadística permite demostrar que si H0 es verdadera,
la razón f_c = CMTr/CME es un valor de una variable aleatoria que tiene una distribución F con k –
1 grados de libertad en el numerador y k(n - 1) grados de libertad en el denominador.
Cuando el valor de esta estadística de prueba es relativamente grande (variabilidad entre
tratamientos mayor que variabilidad dentro de tratamientos), hay evidencia que indica que por lo
menos uno de los promedios de los tratamientos es diferente, y el criterio indica rechazar H0 si
donde α es el correspondiente nivel de
significancia al cual se desarrolla la
prueba. De manera similar a las demás
pruebas estadísticas, el criterio es
equivalente a rechazar la hipótesis nula sí
valor – p ˂ α. Para el caso de análisis de
varianza a una vía, el valor – p se calcula
así:
Valor(p) = P(> ) P(> )

Los cálculos mostrados antes se presentan


en forma tabular en un cuadro llamado
tabla de análisis de varianza, como se
aprecia a continuación.
Durante el trabajo experimental es frecuente que se pierdan algunas observaciones: los animales de
experimentación pueden morir, las muestras tomadas se pueden dañar o contaminar, las personas
reclutadas pueden abandonar el estudio, etc.
El análisis anterior en donde los tamaños de muestra son iguales, es aún válido modificando ligeramente
las expresiones para las sumas de cuadrados. Para generalizar, se puede pensar en tamaños de muestra
diferente para cada grupo , de tal forma que el tamaño total de muestra sea N = y la disposición de las
observaciones será entonces:

Los grados de libertad quedan de la siguiente forma:


Gl(T) = N – 1, siendo N el número total de observaciones en el experimento.
Gl(Tr) = k – 1.
Gl(E) = N – k.
Ejemplo
En un experimento para determinar el efecto de la nutrición sobre los niveles de atención de alumnos de
primaria, se asignó aleatoriamente 15 estudiantes a uno de tres tratamientos: sin desayuno, desayuno
ligero y desayuno completo. Se registraron los niveles de atención (en minutos) durante un período de
lectura matutino. La tabla siguiente contiene los datos obtenidos.
Ejemplo 2

Suponga que en un experimento industrial a un ingeniero le interesa la


forma en que la absorción media de humedad del concreto varía para 5
agregados de concreto diferentes.
Las muestras se exponen a la humedad durante 48 horas y se decide que
para cada agregado deben probarse 6 muestras, lo que hace que se requiera
probar un total de 30 muestras. En la tabla se presentan los datos
registrados.

Pruebe la hipótesis de que μ1 = μ2 = ... = μ5 a un nivel de significancia de


0.05 para los datos de la tabla sobre la absorción de humedad por varios
tipos de agregados para
cemento.

También podría gustarte