Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Análisis de varianzas
ANOVA
En investigaciones y en trabajos analíticos se tiene datos y con mucha frecuencia se requiere
comparar varias medias experimentales
Si los datos siguen una distribución normal y se quiere comparar varias medias experimentales se
puede aplicar el análisis de varianzas ( ANOVA) para discernir si las medias experimentales son iguales
o diferentes o al menos una es diferente.
Como primer paso para la aplicación del ANOVA es verificar si los datos experimentales siguen una
distribución Normal, para ello se pueden realizar las siguientes pruebas:
Si se tiene menos de 50 datos, se puede hacer la prueba de Shapiro Wilk
Si se tiene mas de 50 datos, se puede aplicar la prueba de Kolmogórov-Smirnov (prueba K-S)
Realizar pruebas
para verificar otras
Estadística No
distribuciones
paramétrica
otras
No distribuciones
Realizar pruebas
Datos de normalidad
Datos Dos
• Shapiro Wilk
experimentales Normales Xi 0u
• Kolmogórov-
Smirnov Xi = X2
• qqPLOT Si
• Histogramas Estadística
• Chi cuadrado paramétrica Varias medias
Xi = X2 = X3
ANOVA
ANOVA
Los datos experimentales obtenidos van a ser afectados por dos fuentes de variación:
• Los errores aleatorios que siempre están presentes, este error provoca que los datos estén
dispersos unos de otros
Menos error aleatorio Más error aleatorio
• La segunda fuente de variación se debe a lo que se llama factor controlado que incluye a los
errores sistemáticos y a la variación de un factor de estudio.
El análisis de varianza ANOVA permite separar y diferencia las diferentes causas de variación
presentes en un experimento.
n1 n2 n3 n4 (Media) (varianza)
73x4
m1 m1 x1 x2 x3 x4
73x4
m2
m2 x1 x2 x3 x4 2
73x4
m3 >
m3 x1 x2 x3 x4
m4 7774
m4 x1 x2 x3 x4 4
t = m = número de muestras
=
N = número total de datos
m2
t2 m2 73 74 76 77 79 75,80 5,70 n2 = 5 gl2= 5-1-4
5 4
m3 767575
n3 = 5 gl3= 5-1-4
t3 m3 77 75 74 77 72 75,00 4,50
5 4
glE= gl1+gl2+gl3+gl4+….gln
t = m = número de muestras 75,400 = 4,55
N = número total de datos = 20 glE= 4+4+4+4 = 16
En donde:
glN = t-1 ( de la varianza del factor)
glD = N-t ( de la varianza del error)
H1: Las condiciones de almacenamiento SI afecta al los valores de fluorescencia del reactivo, por lo
tanto
Pasos 2, 3 y 4
2.- Calcular medias, varianzas, de cada muestra (Comprobar homogeniedad de varianzas e
independencia de datos; este punto queda fuera del alcance de este módulo)
3.- Calcular media de medias y varianza de medias
4.- Calcular varianza del error y varianza del factor
Variable dependiente:
Variable independiente o Factor Valores de fluorescencia
de estudio: (uinidades arbitrarias) (Media) (varianza)
Condiciones de almacenamiento
n1 n2 n3
n gl = n-1
D.- Una hora con luz brillante 100 102 104 = 102,00 = 4,00
n4 = 3 gl4= 3-1=2
glF-N = t-1
glE-D = N-t
En donde
t: número de tratamientos:
En este caso tenemos 4 condiciones de almacenamiento, es decir 4 tratamientos
glN = 4-1 = 3
N: Número total de datos
En este caso tenemos 4 tratamientos * 3 réplicas en cada uno = 12
glD = 12-4 = 8
Pasos
7.- Calcular F tabulado
glN = 4-1 = 3
glD = 12-4 = 8
Buscamos en la tabla de F de Fisher de UNA COLA
Ho: Las condiciones de almacenamiento NO afecta al los valores de fluorescencia del reactivo, por lo tanto
Tabla de la distribución de F de Fisher
UNA COLA (Se usa para el ANOVA)
Grados de
libertad del
numerador glN
Grados de
libertad del
denominador glD
Distribución de F de Fisher
Distribución de F fisher, de una cola
p(exp) = 0,42
α = 0,05 = p(teórico)
Aceptación
P teórico = 0,05 α = 0,05
ANOVA
Pasos
9.- Decisión
Como la F experimental , es menor a la F tabulado acepto Ho de las varianzas, la varianza
del factor es menor a la varianza de del error
En donde :
El numerador es una suma de cuadrados (SC )
El denominador gl = n-1
Si se divide la suma de cuadrados (SC) para un tamaño de muestra (gl =n-1), se tiene una media de
cuadrados, es decir un cuadrado medio (CM)
Es decir la varianza o cuadrado medio ( CM ) es igual a la suma de cuadrados (SC ), divido para los
grados de libertad (gl)
SC = CM*gl
CM = SC
gl SC = S^2 * gl
Pasos
10.- Realizar el resumen de la ANOVA
SC CM
Suma de cuadrados Cuadrado F F α= p
Variación gl p(exp)
SC = CM*gl Medio = (experimental) (tabulado) (teórico)
varianza
CM factor
Variación gl factor
SC factor
de
factor glF = t-1
Se calcula
gráficamente
0,05 interpolando
el valor de F
CM error experimental
Variación gl error
SC error
del
error glE=N-t
gl total
Variación SC total
----------
total
glT=N-1
Pasos
9.- Realizar el resumen de la tabla de ANOVA
gl SC CM F F
Variación α= p(teórico) p(exp)
Grados de libertad Suma de Cuadrados Cuadrado Medio (experimental) (tabulado)
Variación
de factor
= 4,066
0,05 0,42
Variación
= 3,75
del error
p(exp) p(teórico)
Variación XXXXXX
Si:
Si:
total
Ho: = = =
Ho: = = =
ANOVA
Ejemplo 2:
En una empresa fabricante de acero, se quiere mejorar la resistencia del acero, para ello se prueba 4
tratamientos (concentraciones de carbón 1%; 2%, 3% y 4%) y se mide la resistencia del acero
obtenido en N/m2. Se realizan 5 réplicas en cada concentración. Indique si existe variación o no en
la resistencia del acero. Se trabajó al 95% de confianza.
Variable Variable dependiente:
independiente o Resistencia del acero (N/m2)
Factor de estudio:
n1 n2 n3 n4 n5
% de carbón
1% 23 28 28 30 25
2% 31 29 36 35 34
3% 36 40 42 44 39
4% 44 45 40 40 46
Pasos
1. Plantear la hipótesis de medias
Para redactar la hipótesis aplicaremos la siguiente ecuación:
Ho: La VI NO afecta a la VD
H1: La VI Si afecta a la VD
En donde: VI = Variable independiente o factor de estudio= % de carbono
VD = Variable dependiente = resistencia del acero
Ho: La concentración de carbono NO afecta a la resistencia del acero, por lo tanto
1% 23 28 28 30 25 = 26,80 = 7,70
2% 31 29 36 35 34 = 33,00 = 8,50
3% 36 40 42 44 39 = 40,20 = 9,20
4% 44 45 40 40 46 = 43,00 = 8,00
= 35,750 = 8,35
glN = t-1
glD = N-t
En donde
t: número de tratamientos:
En este caso tenemos 4 concentraciones de carbono, es decir 4 tratamientos
glN = 4 -1 = 3
N: Número total de datos
En este caso tenemos 4 tratamientos *5 réplicas en cada uno = 20 total datos
glD = 20 - 4 = 16
Pasos
7.- Calcular F tabulado
glN = 4 - 1 = 3
glD = 20 - 4 = 16
Grados de
libertad del
denominador glD
Distribución de F de Fisher
Distribución de F fisher, de una cola
p
0,4
0,3
0,2
p(exp) = 0,004
ANOVA
Pasos
9.- Decisión
Como la F experimental , es mayor a la F tabulado, se acepta H1 de las varianzas, la
varianza del factor es mayor a la varianza de del error
gl SC CM F F
Variación α= p(teórico) p(exp)
Grados de libertad Suma de Cuadrados Cuadrado Medio (experimental) (tabulado)
Variación de
factor = 3,239
0,05 0,004
Variación del = 8,35
error
p(exp) p(teórico)
Si:
Variación total XXXXXX Si:
H1: ≠ ≠ ≠ H1: ≠ ≠ ≠
ANOVA
Ejemplo 3:
En un centro de investigación se realiza un estudio para comparar varios tratamientos que, al aplicarse previamente a
los frijoles crudos, reducen su tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio (NaHCO3) y
cloruro de sodio o sal común (NaCl). El primer tratamiento es el de control, que consiste en no aplicar ningún
tratamiento. El tratamiento T2 es el remojo en agua con bicarbonato de sodio, el T3 es remojar en agua con sal común y
el T4 es remojar en agua con una combinación de ambos ingredientes en proporciones iguales. La variable de respuesta
es el tiempo de cocción en minutos. Los datos se muestran en la siguiente tabla: se trabajó al 95% de confianza.
Variable independiente o Factor de Variable dependiente:
estudio: Tiempo de cocción (mm)
Concentración de NaHCO3 y Na CL n1 n2 n3 n4 n5 n6
A.- Agua 213 214 204 208 ----- ----
B.- Agua + 5g NaHCO3 76 85 74 78 82 75
C.- Agua + 5g NA Cl 57 67 55 64 61 ----
D.- Agua + 2,5g NAHCO3 + 2,5g NaCl 84 82 85 92 87 79
Pasos
1. Plantear la hipótesis de medias
Para redactar la hipótesis aplicaremos la siguiente ecuación:
Ho: La VI NO afecta a la VD
H1: La VI Si afecta a la VD
En donde: VI = Variable independiente o factor de estudio
VD = Variable dependiente
Ho: La concentración de NaHCO3 y NaCL NO afecta al tiempo de cocción, por lo tanto
108,43 = 21,05
glN = t-1
glD = N-t
En donde
t: número de tratamientos:
En este caso tenemos 4 concentraciones de carbono, es decir 4 tratamientos
glN = 4 -1 = 3
N: Número total de datos
OJO-En este caso tenemos 4 tratamientos, pero tenemos diferentes datos en cada
tratamiento se deben sumar los datos de cada tratamiento N = 4+6+5+6 = 21
glD = 21 - 4 = 17
Pasos
7.- Calcular F tabulado
glN = 4 - 1 = 3
glD = 21 - 4 = 17
Buscamos en la tabla de F de Fisher de UNA COLA
Grados de
libertad del
denominador glD
Distribución de F de Fisher
Distribución de F fisher, de una cola
p
0,4
0,3
0,2
α = 0,05 = p(teórico)
0,1
P(teórico = 0,05 0,05
α = 0,05
p(exp) = 0,000
ANOVA
Pasos
9.- Decisión
Como la F experimental , es mayor a la F tabulado, se acepta H1 de las varianzas, la
varianza del factor es mayor a la varianza de del error
gl SC CM F F
Variación α= p(teórico) p(exp)
Grados de libertad Suma de Cuadrados Cuadrado Medio (experimental) (tabulado)
Variación de
factor
p(exp) p(teórico)
Método 2: Sumatorias
ANOVA
Pasos para realizar el análisis de varianza
En donde :
El numerador es una suma de cuadrados (SC )
El denominador gl = n-1
Otra forma de escribir la ecuación de la varianza es:
En donde el numerador es una suma de cuadrados (SC) y el denominador son los grados de libertad
gl= n-1.
Si se divide la suma de cuadrados (SC) para un tamaño de muestra (gl =n-1), se tiene una media de
cuadrados, es decir un cuadrado medio (CM)
Es decir la varianza o cuadrado medio ( CM ) es igual a la suma de cuadrados (SC ), divido para los
grados de libertad (gl)
ANOVA
ECUACIONES PARA EL CALCULO DEL ANOVA
Suma de cuadrados total (SCT)
F experimental
F tabulado
ANOVA
Ejemplo 4:
En una empresa fabricante de acero, se quiere mejorar la resistencia del acero, para ello se prueba 4
tratamientos (concentraciones de carbón 1%; 2%, 3% y 4%) y se mide la resistencia del acero
obtenido en N/m2. Se realizan 5 réplicas en cada concentración. Indique si existe variación o no en
la resistencia del acero. Se trabajó al 95% de confianza.
Variable Variable dependiente:
independiente o Resistencia del acero (N/m2)
Factor de estudio:
n1 n2 n3 n4 n5
% de carbón
1% 23 28 28 30 25
2% 31 29 36 35 34
3% 36 40 42 44 39
4% 44 45 40 40 46
Pasos
1. Plantear la hipótesis de medias
Para redactar la hipótesis aplicaremos la siguiente ecuación:
Ho: La VI NO afecta a la VD
H1: La VI Si afecta a la VD
En donde: VI = Variable independiente o factor de estudio
VD = Variable dependiente
Ho: La concentración de carbono NO afecta a la resistencia del acero, por lo tanto
1% 23 28 28 30 25 ∑1 = 134,00 5
2% 31 29 36 35 34 ∑2 = 165,00 5
3% 36 40 42 44 39 ∑3 = 201,00 5
4% 44 45 40 40 46 ∑4 = 215,00 5
∑T = 715,000 N= 20
glF = t - 1 glF = 4 – 1 = 3
glE = N - t glE = 20 – 4 = 16
Grados de
libertad del
denominador glD
Distribución de F de Fisher
Distribución de F fisher, de una cola
p 0,4
0,3
0,2
α = 0,05 = p(teórico)
0,1
p(exp) = 0,004
ANOVA
Pasos 10.- Comparación de
gl SC CM F F
Variación α= p(teórico) p(exp)
Grados de libertad Suma de Cuadrados Cuadrado Medio (experimental) (tabulado)
= -
Variación
de factor
tab
= 0,05 0,004
Variación = 3,239
del error
p(exp) p(teórico)
= -
Variación Si:
XXXXXX Si:
total
H1: ≠ ≠ ≠ H1: ≠ ≠ ≠
ANOVA
Ejemplo 5:
En un centro de investigación se realiza un estudio para comparar varios tratamientos que, al aplicarse previamente a
los frijoles crudos, reducen su tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio (NaHCO3) y
cloruro de sodio o sal común (NaCl). El primer tratamiento es el de control, que consiste en no aplicar ningún
tratamiento. El tratamiento T2 es el remojo en agua con bicarbonato de sodio, el T3 es remojar en agua con sal común y
el T4 es remojar en agua con una combinación de ambos ingredientes en proporciones iguales. La variable de respuesta
es el tiempo de cocción en minutos. Los datos se muestran en la siguiente tabla: se trabajó al 95% de confianza.
Variable independiente o Factor de Variable dependiente:
estudio: Tiempo de cocción (mm)
Concentración de NaHCO3 y Na CL n1 n2 n3 n4 n5 n6
A.- Agua 213 214 204 208 ----- ----
B.- Agua + 5g NaHCO3 76 85 74 78 82 75
C.- Agua + 5g NA Cl 57 67 55 64 61 ----
D.- Agua + 2,5g NAHCO3 + 2,5g NaCl 84 82 85 92 87 79
Pasos
1. Plantear la hipótesis de medias
Para redactar la hipótesis aplicaremos la siguiente ecuación:
Ho: La VI NO afecta a la VD
H1: La VI Si afecta a la VD
En donde: VI = Variable independiente o factor de estudio
VD = Variable dependiente
Ho: La concentración de NaHCO3 y NaCL NO afecta al tiempo de cocción, por lo tanto
2122,0 21
glF = t - 1 glF = 4 – 1 = 3
glE = N - t glE = 21 – 4 = 17
Paso 6: Grado de libertad, total, del factor y el error
Número total de datos (N = 4+6+5+6 = 21)
Tratamientos (t = 4)
glT = N - 1 glF = t - 1 glE = N - t
glT = 21 – 1 = 20 glF = 4 – 1 = 3 glE = 21 – 4 = 17
ANOVA
Pasos 7.- calcular cuadrado medio del factor (CMF) y cuadrado medio del error (CME)
Grados de
libertad del
denominador glD
Distribución de F de Fisher
Distribución de F fisher, de una cola
p 0,4
0,3
0,2
0,1
α = 0,05 = p(teórico)
p(teórico) = 0,05 0,05 α = 0,05
p(exp) = 0,000
ANOVA
Pasos 10.- Comparación de
10.1.-F experimental y F tabulada 10.2.- p(experimental) con p(teórico)
α = 0,05 = p(teórico)
gl SC CM F F
Variación α= p(teórico) p(exp)
Grados de libertad Suma de Cuadrados Cuadrado Medio (experimental) (tabulado)
= -
Variación tab
de factor
0,05 0,000
= = 961,93 = 3,197
Variación
del error
= - p(exp) p(teórico)
Variación Si:
XXXXXX Si:
total
H1: ≠ ≠ ≠ H1: ≠ ≠ ≠