Documentos de Académico
Documentos de Profesional
Documentos de Cultura
-3-
Woeber (2002) estudió este aspecto clínico al valorar el efecto del tratamiento sustitutivo
del 𝐿 − 𝑇4 sobre las concentraciones séricas de 𝑇4 y 𝑇3 libres. Estudió la relación entre las
concentraciones de 𝑇4 y 𝑇3 libres en una cohorte histórica de pacientes con tiroiditis
autoinmunitaria crónica y un grupo de individuos sanos. De los 53 pacientes con tiroiditis
caracterizada por la presencia de anticuerpos como tiroperoxidasa, 18 tuvieron
concentraciones séricas normales de TSH y no tomaron tratamiento sustitutivo con 𝐿 − 𝑇4
para hipotiroidismo y tuvieron concentraciones normales de TSH. También se estudió a 20
individuos con concentraciones séricas normales de TSH, los cuales sirvieron como grupo
testigo. Se desea utilizar los datos de este estudio para ilustrar el análisis de varianza de una
forma para decidir si los valores de la media son diferentes en los tres grupos de sujetos.
-4-
ANOVA proporciona una forma de dividir las variaciones totales en las concentraciones de 𝑇4
sérica libre de cada sujeto en dos partes. Supóngase que se toman las concentraciones de 𝑇4
libre en un sujeto dado y se les asigna el valor de X y se desea saber que tanto difiere X del
valor de la media para 𝑇4 en todos los sujetos en el estudio, abreviado como 𝑋. ധ Esta diferencia
ധ
(simbolizada como X - 𝑋) puede dividirse en dos partes: la diferencia entre X y la media del
grupo de este sujeto, 𝑋ത𝑗 , y la diferencia entre la media del grupo y la gran media, 𝑋.
ധ La fórmula
se expresaría de la siguiente manera:
ന = 𝑿−𝑿
𝑿−𝑿 ഥ 𝒋 + (𝑿
ഥ 𝒋 − 𝑿)
ന
-6-
El cuadro 2 contiene las observaciones originales para los sujetos en el estudio. El sujeto 1 en
grupo control tiene una 𝑇4 libre de 15 𝑝𝑚𝑜𝑙/𝐿. La gran medida para todos los pacientes es
14.78, de tal modo que el sujeto 1 difiere de la gran media en 15-14.79, o 0.22. Esta diferencia
puede dividirse en dos partes: la diferencia entre 15 y la media del grupo control, 13.55; y la
diferencia entre la media para el grupo bajo y la gran media.
-7-
-8-
Aunque este ejemplo no muestra con exactitud cómo funciona el ANOVA, es útil para
entender el concepto de dividir la variación en diferentes partes.
ANOVA considera la variación en todas las observaciones y las divide en: a) la variación entre
cada sujeto y la media del grupo del sujeto, y b) la variación entre la media de cada grupo y
la gran media.
Si las medias de los grupos son muy diferentes una de otra, ocurrirá una considerable
variación entre ellas y la gran media, comparada con la variación entre cada grupo. Sin
embargo, si las medias de los grupos no son muy diferentes, la variación entre ellas y la gran
media no será mayor que la variación entre los sujetos de cada grupo. Por tanto, puede
usarse la prueba F para dos varianzas para comprobar la relación de la varianza entre las
medias con la varianza entre los sujetos de cada grupo.
-9-
La hipótesis nula para la prueba de F es que las dos varianzas son iguales, si así fuera, la
variación entre las medias no es mayor que la variación entre las observaciones individuales
en cada grupo. En esta situación, no es posible concluir que las medias son diferentes unas
de otras.
Por ello, se piensa en el ANOVA como una prueba de igualdad de las medias, aunque se
estén comprobando las varianzas en el proceso. Si se rechaza la hipótesis nula, se concluye
que no todas las medias son iguales; no obstante, no se sabe cuáles no son iguales, lo que
explica el por qué de la necesidad de hacer procedimientos comparativos posteriores.
- 10 -
Puede usarse la fórmula para la varianza de las observaciones, para encontrar la varianza de
la medias de la gran media, denominado cuadrado medio entre grupos (MSA):
2
σ 𝑛𝑗 𝑋ത𝑗 − 𝑋ധ Donde nj es el número de observaciones de cada grupo
𝑀𝑆𝐴 = y j es el número de grupos.
𝑗−1
Para obtener la varianza en los grupos, se utiliza una varianza agrupada como la usada para
la prueba t para dos grupos independientes, denominado cuadrado del error medio (MSE):
Paso 2
La estadística para la prueba de igualdad de las medias en el ANOVA es la relación F,
𝑀𝑆
𝐹 = 𝑀𝑆𝐴 , con 𝑗 − 1 𝑦 σ(𝑛𝑗 − 1) grados de libertad.
𝐸
- 12 -
Paso 4
El valor de distribución F con 𝑗 − 1 = 2 grados de
libertad en el numerador y σ(𝑛𝑗 − 1) = 70 grados
de libertad para el denominador, es entre 3.15 y
3.07; la interpolación da 3.14. La decisión es
rechazar la hipótesis nula de medias iguales si el
valor observado de F es mayor de 3.14 y cae en la Figura 1. Ilustración de los valores críticos para
la distribución de F con 2 y 70 grados de libertad
zona de rechazo (Figura 1).
- 13 -
Paso 5
Primero se calcula la gran media. En vista de que ya se conocen las medias de los tres
grupos, se puede formar un promedio de estas medias para encontrar la gran media:
- 14 -
Paso 5
El término 𝑀𝑆𝐴 se encuentra con la división del numerador entre el número de grupos
menos 1 (j – 1), que es 2 en este ejemplo; de aquí que:
𝟖𝟒. 𝟑𝟑
𝑴𝑺𝑨 = = 𝟒𝟐. 𝟏𝟕
𝟐
Las varianzas individuales de los grupos se usan para calcular el estimado agrupado de 𝑀𝑆𝐸 :
- 15 -
Paso 5
Por último, la relación F: 𝑴𝑺𝑨 𝟒𝟐. 𝟏𝟕
𝑭= = = 𝟏𝟏. 𝟗𝟓
𝑴𝑺𝑬 𝟑. 𝟓𝟑
Paso 6
El valor observado de la relación F es 11.95, el cual es mayor que 3.14. Por tanto, se rechaza
la hipótesis de nulidad de las medias iguales. Se concluye que existe diferencia en las
concentraciones de 𝑇4 libre entre los sujetos del grupo control, los pacientes con
hipotiroidismo que no reciben tratamiento sustitutivo y en pacientes que sí lo reciben.
- 16 -
- 17 -
El modelo para ANOVA de una vía establece que una observación individual puede dividirse en
tres componentes relacionados con 1) la gran media, 2) el grupo al que pertenece el individuo
y 3) la propia observación individual.
Se puede escribir el modelo para ANOVA de una vía como:
𝑿𝒊𝒋 = 𝝁 + 𝜶𝒋 + 𝒆𝒊𝒋
El cuál establece que la observación iava en el grupo javo, 𝑋𝑖𝑗 , es la suma de los tres
componentes: la gran media 𝝁; el efecto relacionado con el grupo j, 𝜶𝒋 ; y un error residual, 𝒆𝒊𝒋 .
- 18 -
Desde luego que la medida de un efecto se relaciona con el tamaño de la diferencia entre la
medida de un grupo dado y la gran media. Cuando en las inferencias participan sólo niveles
específicos del factor incluido en estudio, el modelo se llama modelo de efectos fijos. Este
modelo supone que se está interesado en hacer inferencias sólo acerca de las poblaciones
que están representadas en el estudio. Si, por el contrario, las concentraciones del estudio se
ven como seleccionadas al azar de todas las posibles, entonces el modelo se llama modelo de
efectos aleatorios, en cuyo caso podrán hacerse inferencias a otros niveles del factor que no
están representados en el estudio.
- 19 -
Fórmulas definitorias
𝑿𝒊𝒋 es la observación 𝑖ava en el grupo 𝑗avo
ഥ 𝒋 es la media de todas las observaciones en el grupo 𝑗avo
𝑿
ന es la gran media de las observaciones
𝑿
- 20 -
Fórmulas computacionales
Las fórmulas computacionales se prefieren porque reducen los errores por redondeo; pueden
derivarse de las definitorias. Los símbolos para ANOVA difieren de una u otra manera de un
texto a otro; las siguientes fórmulas son similares a las usadas en muchos de los libros.
Sea N el número total de observaciones en todos los grupos, es decir, 𝑁 = σ 𝑛𝑗 .
𝟐 𝟐
(σ 𝑿𝒊𝒋) 𝟐 (σ 𝑿𝒊𝒋)
ന 𝟐= 𝑿𝒊𝒋𝟐 −
𝑺𝑺𝑻 = (𝑿𝒊𝒋 − 𝑿) ഥ 𝒋 − 𝑿)
𝑺𝑺𝑨 = (𝑿 ന 𝟐 = 𝒏𝒋 𝑿
ഥ𝒋 −
𝑵 𝑵
- 21 -
Fórmulas computacionales
Las sumas de los cuadrados se dividen entre los grados de libertad para obtener los cuadrados
medios:
𝑺𝑺𝑨
𝑴𝑺𝑨 =
𝒋−𝟏
𝑺𝑺𝑬
𝑴𝑺𝑬 =
𝑵−𝒋
3 Se eleva al cuadrado cada media (𝑋ത𝑗 ), se multiplica por el número de sujetos en ese
grupo (𝑛𝑗 ), y se suma para obtener σ 𝑛𝑗 𝑋ത𝑗2 .
- 23 -
= 𝟏𝟔𝟎𝟑𝟐. 𝟓𝟏
(σ 𝑿𝒊𝒋 )𝟐 (𝟏𝟓 + 𝟏𝟒 + ⋯ + 𝟏𝟖 + 𝟏𝟑)𝟐
=
𝑵 𝟐𝟎 + 𝟏𝟖 + 𝟑𝟓
= 𝟏𝟓𝟗𝟒𝟖. 𝟓𝟏
- 24 -
(σ 𝑿𝒊𝒋 )𝟐 (σ 𝑿𝒊𝒋 )𝟐
𝑺𝑺𝑻 = 𝑿𝟐𝒊𝒋 − ഥ 𝟐𝒊𝒋 −
𝑺𝑺𝑨 = 𝒏𝒋 𝑿
𝑵 𝑵
= 𝟑𝟑𝟎. 𝟒𝟗 = 𝟖𝟒. 𝟎𝟎
- 25 -
= 𝟐𝟒𝟔. 𝟒𝟗
𝑺𝑺𝑨 𝟖𝟒. 𝟎𝟎
𝑴𝑺𝑨 = = = 𝟒𝟐. 𝟎𝟎
𝒋−𝟏 𝟐
𝑺𝑺𝑬 𝟐𝟒𝟔. 𝟒𝟗
𝑴𝑺𝑬 = = = 𝟑. 𝟓𝟐
𝑵−𝒋 𝟕𝟎
- 26 -
𝑴𝑺𝑨 𝟒𝟐. 𝟎𝟎
𝑭= = = 𝟏𝟏. 𝟗𝟑
𝑴𝑺𝑬 𝟑. 𝟓𝟐
Fuente de
Sumas de cuadrados Grado de libertad Media del cuadrado Proporción
variación
𝑺𝑺𝑬
Error 𝑺𝑺𝑬 = 𝑺𝑺𝑻 − 𝑺𝑺𝑨 𝑁−𝑗 𝑴𝑺𝑬 =
𝑵−𝒋
(σ 𝑿𝒊𝒋 )𝟐
Total 𝑺𝑺𝑻 = 𝑿𝟐𝒊𝒋 − 𝑁−1
𝑵
- 28 -
- 29 -
3 Las observaciones son una muestra aleatoria, y son independientes; es decir, el valor de
una observación no se relaciona en forma alguna con el valor de otra. En nuestro
ejemplo, el valor de la concentración de 𝑇4 libres del sujeto no debe influir en absoluto
en el de ningún otro sujeto.
Recuérdese que los modelos de efectos fijos suponen que cada observación sea en realidad una suma,
que consta de la gran media, el efecto de ser un miembro de un grupo particular y del error (residual)
que representa cualquier variación inexplicable. En algunos estudios participan observaciones que son
proporciones, tasas o relaciones, y para estos datos no aplica la suposición de las sumas.
- 30 -
S 70 246.49 3.52
Total
72 330.49
(ajustado)
Total 73
- 32 -
- 33 -
• Es típico que los investigadores prefieran la libertad y flexibilidad que les permiten las
comparaciones de los métodos a posteriori o post hoc. Sin embargo, antes de comentar estos
tipos de comparaciones, se necesitan dos definiciones
a) Una comparación o contraste entre dos medias es la diferencia entre ellas, como sería 𝜇1 −
𝜇2 . En las comparaciones o contrastes también pueden participar más de dos medias.
b) En la segunda definición participa la distinción entre dos diferentes tipos de comparaciones o
contrastes. Dos comparaciones serán ortogonales si no usan la misma información.
- 34 -
• Cuando se planean las comparaciones, pueden efectuarse sin realizar un ANOVA. Si las
comparaciones son ortogonales, se puede usar la prueba de t para grupos independientes con el
fin de comparar dos grupos sin las siguientes modificaciones: en vez de usar la desviación
estándar agrupada (𝐷𝐸𝑃 ) en el denominador de la proporción t, se usa el cuadrado de media el
error 𝑀𝑆𝐸 .
ഥ𝒊 − 𝑿
(𝑿 ഥ 𝒋)
𝒕=
𝟐𝑴𝑺𝑬 /𝒏
• Cuando los tamaños de las muestras son simbolizados por n, la proporción t se convierte en N – j
grados de libertad, donde N es el número total de observaciones.
- 35 -
- 37 -
ഥ𝑨
𝑿 ഥ𝑩
𝑿 ഥ𝑪
𝑿
ഥ𝑨
𝑿 - 0.45 2.34
ഥ𝑩
𝑿 - 1.89
ഥ𝑪
𝑿 -
- 38 -
Procedimiento t de Bonferroni
• En el procedimiento t de Bonferroni, se multiplica 2𝑀𝑆𝐸/𝑛 por un factor relacionado con el
número de comparaciones hechas y con los grados de libertad para el cuadrado medio de error. En
este ejemplo son posibles tres comparaciones pareadas: para 𝛼 = 0.05 y asumiendo casi 60
grados de libertad, el multiplicador es 2.57 (cuadro 6).
𝟐𝑴𝑺𝑬 𝟐 × 𝟑. 𝟓𝟐
𝟐. 𝟒𝟕 × = 𝟐. 𝟒𝟕 ×
𝒏 𝟐𝟎
= 𝟐. 𝟒𝟕 × 𝟎. 𝟓𝟗
= 𝟏. 𝟒𝟕
- 39 -
Procedimiento t de Bonferroni
• Por tanto, donde el valor de MSE se obtiene de los resultados de ANOVA (cuadro 4).
• Las diferencias de los valores de la media entre los grupos 1 y 2 se comparan con 1.47. La
diferencia de la media entre los grupo 1 y 2 es sólo de 0.45, y no es diferente desde el punto de
vista estadístico. Sin embargo, las diferencias entre ambas medias de los grupos 1 y 3 y entre los
grupos 2 y 3, tienen significancia estadística: ambos (2.34 y 1.89) son superiores a 1.47. Se
concluye que los sujetos control y los pacientes que no reciben tratamiento sustitutivo tienen
concentraciones diferentes de 𝑇4 en comparación con los pacientes que reciben dicho tratamiento.
- 40 -
- 41 -
𝑴𝑺𝑬
𝑯𝑺𝑫 = 𝑴𝒖𝒍𝒕𝒊𝒑𝒍𝒊𝒄𝒂𝒅𝒐𝒓 ×
𝒏
𝟑. 𝟓𝟐
𝑯𝑺𝑫 = 𝟑. 𝟒𝟎 × = 𝟏. 𝟒𝟑
𝟐𝟎
• Se comparan diferencias del cuadro 5 con 1.43, y se declaran como significativamente diferentes si
exceden de este valor.
• Las diferencias entre los grupos 1 y 3 y los grupos 2 y 3 son mayores a 1.43.
- 43 -
Error df 2 3 4 2 3 4 2 3 4 5 6
10 3.15 3.88 4.33 1.81 2.15 2.34 2.64 2.87 3.04 3.17 3.28
20 2.95 3.58 3.96 1.73 2.03 2.19 2.42 2.61 2.75 2.85 2.93
30 2.89 3.49 3.85 1.70 1.99 2.15 2.36 2.54 2.66 2.75 2.83
60 2.83 3.40 3.74 1.67 1.95 2.10 2.30 2.47 2.58 2.66 2.73
120 2.80 3.36 3.68 1.66 1.93 2.08 2.27 2.43 2.54 2.62 2.68
- 44 -
• Los sujetos control y los pacientes que no reciben tratamiento sustitutivo tienen concentraciones
diferentes de 𝑇4 libre en comparación con los pacientes que reciben tratamiento sustitutivo; sin
embargo, no existen diferencias entre los sujetos control y los pacientes que no reciben tratamiento
sustitutivo.
• El procedimiento Tukey también puede utilizarse para formar intervalos de confianza respecto a la
diferencia de la media.
ഥ𝟏 − 𝑿
𝑿 ഥ 𝟐 ± 𝟏. 𝟒𝟑, 𝒐 𝟎. 𝟒𝟔 𝒂 𝟑𝟑𝟐
- 45 -
𝑪𝟐𝒋
𝑺= (𝒋 − 𝟏)𝑭𝜶,𝒅𝒇 𝑴𝑺𝑬
𝒏𝒋
• Donde j es el número de grupos, 𝑭𝜶,𝒅𝒇 el valor crítico de F usado en una ANOVA, 𝑴𝑺𝑬 es el error de la
𝑪𝟐𝒋
media al cuadrado y σ la suma de los coeficientes al cuadrado y 𝒏𝒋 tamaño de muestras.
𝒏𝒋
- 46 -
𝑪𝟐𝒋
𝑺= (𝒋 − 𝟏)𝑭𝜶,𝒅𝒇 𝑴𝑺𝑬
𝒏𝒋
= 𝟐 × 𝟑. 𝟏𝟒 𝟑. 𝟓𝟐 × 𝟎. 𝟏𝟎
= 𝟐. 𝟓𝟏 × 𝟎. 𝟓𝟗
= 𝟏. 𝟒𝟖
- 47 -
- 48 -
- 51 -
𝟐𝑴𝑺𝑬
𝑷𝒓𝒖𝒆𝒃𝒂 𝒅𝒆 𝑫𝒖𝒏𝒏𝒆𝒕𝒕 = 𝑴𝒖𝒍𝒕𝒊𝒑𝒍𝒊𝒄𝒂𝒅𝒐𝒓 ×
𝒏
- 52 -
- 54 -
- 55 -
- 56 -