Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La prueba de Chi Cuadrada se utiliza para probar las diferencias entre diversas propor-
ciones, y el análisis de varianza (ANOVA, por sus iniciales en inglés) se utiliza para pro-
bar las diferencias entre diversas medias. Una suposición fundamental en la que se basa
el análisis de varianza consiste en que las diversas medias muéstrales se obtienen a par-
tir de poblaciones con distribución normal y con la misma varianza σ 2 . Sin embargo, se
ha encontrado que el procedimiento de prueba es bastante insensible a las violaciones de
la suposición de normalidad cuando las poblaciones son unimodales y los tamaños de
muestra son aproximadamente ¡guales. Como la hipótesis nula consiste en que las medias
poblacionales son iguales, la suposición de igualdad de varianzas (homogeneidad de la va-
rianza), también implica que, para propósitos prácticos, la prueba se ocupa de la hipóte-
sis de que las medias provienen de la misma población. Esto es así porque cualquier po-
blación distribuida normalmente queda definida por sus dos parámetros, la media y la va-
rianza (o desviación estándar).
Los fundamentos en los que se basa el análisis de varianza fueron desarrollados inicial-
mente por el estadístico británico Ronald A. Fisher, y la distribución F se denomina, en
su honor. El razonamiento conceptual es el siguiente:
CMA
Fgl1 ; gl2 ;α =
CME
EJEMPLO
M2 85 5.9161 5
M3 75 6.2048 5
SOLUCIÓN
1) HIPOTESIS:
H0: µ=
1 µ=
2 µ3 ó de manera equivalente H 0: α k = 0
Ha: µ1 ≠ µ2 ≠ µ3 Ha: α k ≠ 0
3) REGIÓN DE RECHAZO:
Se
gl1 = k − 1 = 3 − 1 = 2 acepta
H0
gl2 = n − k = 15 − 3 = 1
Se
0.95 acepta
Ha
0.05
F2;12;0.05 = 3.88
4) DETERMINACIÓN DE Fc :
=
XT
∑
=
X 1, 200
= 80.0
n 15
El error estándar de la media, con base en las tres medias es:
∑( X − X )
2
T
SX =
k −1
∑ (80 − 80 ) + (85 − 80 ) + ( 75 − 80 )
2 2 2
=SX = 5.0
3 −1
= n= ( 5)( 5.0
= )
2 2
CMA k SX 125.0
De la formula general:
∑( X )
2
k − Xk
Sk =
nk − 1
=S12 =
6.2048 38.5
=S 22 =
5.9161 35.0
=S32 =
6.2048 38.5
Entonces:
2
σ Combinada =
( n1 − 1) S12 + ( n2 − 1) S 22 + + ( nk − 1) S k2
n1 + n2 + + nk − k
=σ Combinada
2 (=
5 − 1)( 38.5 ) + ( 5 − 1)( 35.0 ) + ( 5 − 1)( 38.5 )
37.3
5+5+5−3
σ Combinada
2
= CME = 37.3
Entonces:
CMA 125.0
=
Fc = = 3.35
CME 37.3
5) CONCLUSION: Como Fc es menor que F2;12;0.05 (3.35<3.88), entonces se acepta
la H0, es decir, las calificaciones promedio para los tres métodos de instrucción
de la población son iguales entre si, a un nivel de significancia del 5%.
X ik =µ + α k + ξik
en donde:
K −1 Tk2 T 2
K
SCA ∑ −
Entre grupo de SCA CMA
= CMA = Fc =
tratamientos ( A )
k =1 nk n K −1 CME
Error de
muestreo ( E )
n−K = SCT − SCA
SCE CME =
SCE
n−K
n K
T2
Total ( T ) n −1 =
SCT ∑∑ X ik2 −
=i 1 =
k 1 n
EJEMPLO
A1 86 79 81 70 84 400 80
A2 90 76 88 82 89 425 85
A3 82 68 73 71 81 375 75
1,200 80
SOLUCIÓN
n1 = 5 n2 = 5 n3 = 5 n = 15
T12 = 160, 000 T22 = 180, 625 T32 = 140, 625 T 2 = 1´400, 000
T 2 1´400, 000
= = 96, 000
n 15
n K
∑ ∑X
=i 1 =k 1
2
ik = 862 + 792 + + 812 = 96, 698
n K
T2
=
SCT ∑∑
=i 1 =k 1
X 2
ik −
n
= 96, 698 − 96, 000
K
Tk2 T 2 160, 000 180, 625 140, 625
SCA =∑ k =1 nk
−
n
=
5
+
5
+
5
− 96, 000 =250
SCA 250
=
CMA = = 125
K −1 3 −1
SCE 448
=
CME = = 37.33
n − K 15 − 3
CMA 125
=
Fc = = 3.35
CME 37.33
ANVA (ANOVA)
Suma de cuadra-
Grados de Cuadrado medio Cociente
Fuente de Variación dos
libertad (gl) (CM) F
(SC)
Entre grupo de
2 250 125 3.35
tratamientos ( A )
Error de
12 448 37.33
muestreo ( E )
Total ( T ) 14 698
1) HIPOTESIS:
H0: µ=
1 µ=
2 µ3 ó de manera equivalente H 0: α k = 0
Ha: µ1 ≠ µ2 ≠ µ3 Ha: α k ≠ 0
3) REGIÓN DE RECHAZO:
gl1 = K − 1 = 3 − 1 = 2
gl2 = n − K = 15 − 3 = 1 Se
acepta
H0
Se
0.95 acepta
Ha
0.05
F2;12;0.05 = 3.88
4) DETERMINACIÓN DE Fc :
Fc = 3.35
El modelo lineal para el análisis de varianza con dos criterios de clasificación con una
observación por celda (sin replicación), es:
X jk =µ + α k + β k + ξ jk
en donde:
La Tabla presenta el resumen del análisis de varianza con dos criterios de clasificación
sin replicación. En comparación con la Tabla del análisis de varianza con un criterio de
clasificación, para un análisis de varianza con un criterio de clasificación, el único
símbolo nuevo en esta tabla es T j2 , que indica que se eleva al cuadrado el total de cada
grupo (para los bloques B).
K −1 Tk2 T 2
K
∑
Entre grupo de SCA CMA
=
SCA − CMA = FcA =
tratamientos ( A )
k =1 nk n K −1 CME
Entre grupo de
bloques ( B )
J −1 =
SCB
1 J 2 T2
∑ Tj − n
k j =1
CMB =
SCB
K −1
FcB =
CMB
CME
Error de
muestreo ( E ) ( J − 1)( K − 1) SCE = SCT − SCA − SCB CME =
SCE
( )( K − 1)
J − 1
J K
T2
Total ( T ) n −1 =
SCT ∑∑ X 2jk − n
=j 1 =
k 1
EJEMPLO
Un constructor de casas con fines especulativos, utiliza tres diseños posibles y asigna
cada casa a la supervisión de uno de cuatro supervisores de obra. Al observar una varia-
ción en la utilidad por casa, el constructor decide investigar el efecto de los factores,
“DISEÑO DE LA CASA” Y “SUPERVISOR DE OBRA”, en la utilidad por la casa. Los da-
tos (la utilidad en miles de dólares por casa) se muestran en la tabla. ¿Proporcionan los da-
tos suficiente evidencia para indicar diferencias entre las utilidades por “DISEÑO DE LA
CASA” y por “SUPERVISOR DE OBRA”, utilizando un nivel de significancia del 5%.
Supervisor
Total Promedio
Diseño
S1 S2 S3 S4 Diseño Diseño
Total
35.7 31.3 30.4 26.3 T= 123.7
Supervisor
Promedio
11.9 10.4 10.1 8.8
Supervisor
SOLUCIÓN
TRATAMIENTOS (SUPERVISORES):
n1 = 3 n2 = 3 n3 = 3 n=3 n = 12
BLOQUES (DISEÑOS):
n1 = 4 n2 = 4 n3 = 4
T 2 15,301.69
= = 1, 275.14
n 12
J K
∑ ∑X =
=j 1 =k 1
2
jk 12.82 + 9.22 + + 7.3=
2
1, 290.01
J K
T2
=
SCT ∑ ∑X
=j 1 =k 1
2
jk −= 1, 290.01 − 1, 275.14
n
= 37.45
K
Tk2 T 2 1, 274.49 979.69 924.16 691.69
SCA =∑ − = + + + − 1, 275.14 =14.87
k =1 nk n 3 3 3 3
1 J
T2 1
=
SCB
K
∑
j =1
T j
2
− = (1, 789.29 + 1,568.16 + 1, 747.24 ) − 1, 275.14
n 4
= 1.03
SCA 14.87
=
CMA = = 4.96
k −1 4 −1
SCB 1.03
=
CMB = = 0.52
J −1 3 −1
SCE 21.55
=CME = = 3.59
( J − 1)( K − 1) ( 3 − 1)( 4 − 1)
CMA 4.96
=
FcA = = 1.38
CME 3.59
CMB 0.52
=
FcB = = 0.14
CME 3.59
ANVA (ANOVA)
Entre grupo de
3 14.87 4.96 1.38
tratamientos ( A )
Entre grupo de
2 1.03 0.52 0.14
bloques ( B )
Error de
6 21.55 3.59
muestreo ( E )
Total ( T ) 11 37.45
TRATAMIENTOS (SUPERVISORES):
1) HIPOTESIS:
H0: µ=
1 µ=
2 µ=
3 µ4 ó de manera equivalente H 0: α k = 0
Ha: µ1 ≠ µ2 ≠ µ3 ≠ µ4 Ha: α k ≠ 0
3) REGIÓN DE RECHAZO:
gl1 = K − 1 = 4 − 1 = 3
gl2 = ( J − 1)( K − 1) = ( 3 − 1)( 4 − 1) = 6
Se
acepta
H0
Se
0.95 acepta
Ha
0.05
F3;6;0.05 = 4.76
4) DETERMINACIÓN DE FcA :
FcA = 1.38
BLOQUES (DISEÑOS):
1) HIPOTESIS:
H0: µ=
1 µ=
2 µ3 ó de manera equivalente H 0: β j = 0
Ha: µ1 ≠ µ2 ≠ µ3 Ha: β j ≠ 0
3) REGIÓN DE RECHAZO:
gl1 = J − 1 = 3 − 1 = 2 Se
acepta
gl2 = ( J − 1)( K − 1) = ( 3 − 1)( 4 − 1) = 6 H0
Se
0.95 acepta
Ha
0.05
F2;6;0.05 = 5.14
4) DETERMINACIÓN DE FcB :
FcB = 0.14
X jk = µ + α k + β j + ι jk + ξijk
en donde:
La Tabla, presenta el resumen para el análisis de varianza con dos criterios de clasifi-
cación con replicación. Las fórmulas que se incluyen en la tabla se basan en la suposi-
ción de que existe un número igual de observaciones en todas las celdas.
Entre grupo de
tratamientos ( A )
K −1 =
SCA
1 k 2 T2
∑ Tk − n CMA =
SCA
K −1
FcA =
CMA
CME
mJ i =1
Entre grupo de
bloques ( B )
J −1 =
SCB
1 k 2 T2
∑ Tj − n CMB =
SCB
J −1
FcB =
CMB
CME
mK k =1
( J − 1)( K − 1=
) SCI
2
Interacción entre 1 J K m T2 SCI CMI
los factores A y B ∑∑ ∑ X i − SCA − SCB −
m=i 1 =k 1 =i 1 n
CMI =
( J − 1)( K − 1)
FcI =
CME
JK ( m − 1)
SCE
Error de SCE = SCT − SCA − SCB − SCI CME =
JK ( m − 1)
muestreo ( E )
m J K
T2
Total ( T ) n −1 =SCT ∑∑∑ X 2
ijk −
n
=i 1 =j 1 =
k 1
EJEMPLO
Aumentos
Total Promedio
Localidad
S1 S2 S3 Aumento Aumento
10 -3 -10
Ciudad Pequeña (D1) -16 -2.7
4 7 -24
14 8 -4
Centros suburbanos (D2) 42 7
18 3 3
Total
46 15 -35 T= 26.0
Localidad
Promedio
11.5 3.8 -8.8
Localidad
SOLUCIÓN
TRATAMIENTOS (AUMENTOS):
m=2 n = 12
T1 = 46 T2 = 15 T3 = −35 T = 26
BLOQUES (LOCALIDADES):
T1 = −16 T2 = 42
T 2 676
= = 56.33
n 12
2
J K
m
∑∑ ∑ Xi = (10 + 4 ) + ( ( −3) + 7 ) + + ( ( −10 ) + ( −24 ) ) = 2,514
2 2 2
k 1 =i 1
=j 1 =
m J K
m J K
T2
SCT= ∑∑∑ X ijk2 −
=i 1 =j 1 =
k 1 n
= 1, 468 − 56.33= 1,411.67
1 K
T2 1
=
SCA ∑T 2
−= ( 2,116 + 225 + 1, 225 ) − 56.33
= 835.17
( 2 )( 2 )
k
mJ k =1 n
1 J
T2 1
=
SCB ∑ T =
− 2
( 256 + 1, 764 ) − 56.33
= 280.33
( 2 )( 3)
j
mK j =1 n
2
1 J K m T2 1
=
SCI ∑∑ ∑ i
m =j 1 =k 1 =i 1
X − SCA − SCB −= ( 2,514 ) − 835.17 − 280.33 − 56.33
n 2
= 85.17
SCE =SCT − SCA − SCB − SCI =1, 411.67 − 835.17 − 280.33 − 85.17 =211.00
SCA 835.17
=
CMA = = 417.58
K −1 3 −1
SCB 280.33
=
CMB = = 280.33
J −1 2 −1
SCI 85.17
=CMI = = 42.58
( J − 1)( K − 1) ( 2 − 1)( 3 − 1)
SCE 211.00
=
CME = = 35.17
JK ( m − 1) ( 2 )( 3)( 2 − 1)
CMA 417.58
=
FcA = = 11.87
CME 35.17
CMB 280.33
=
FcB = = 7.97
CME 35.17
CMI 42.58
=
FcI = = 1.21
CME 35.17
ANVA (ANOVA)
Entre grupo de
2 835.17 417.58 11.87
tratamientos ( A )
Entre grupo de
1 280.33 280.33 7.97
bloques ( B )
Interacción entre
2 85.17 42.58 1.21
los factores A y B
Error de
6 211.00 35.17
muestreo ( E )
Total ( T ) 11
TRATAMIENTOS (AUMENTOS):
1) HIPOTESIS:
H0: µ=
1 µ=
2 µ3 ó de manera equivalente H 0: α k = 0
Ha: µ1 ≠ µ2 ≠ µ3 Ha: α k ≠ 0
3) REGIÓN DE RECHAZO:
gl1 = K − 1 = 3 − 1 = 2 Se
JK ( m −=
1) ( 2 )( 3)( 2 −=
1)
acepta
=
gl 2 6 H0
Se
0.95 acepta
Ha
0.05
F2;6;0.05 = 5.14
4) DETERMINACIÓN DE FcA :
FcA = 11.87
BLOQUES (LOCALIDADES):
1) HIPOTESIS:
Ha: µ1 ≠ µ2 Ha: β j ≠ 0
3) REGIÓN DE RECHAZO:
gl1 = J − 1 = 2 − 1 = 1 Se
JK ( m −=
1) ( 2 )( 3)( 2 −=
1)
acepta
=
gl 2 6 H0
Se
0.95 acepta
Ha
0.05
F1;6;0.05 = 5.99
4) DETERMINACIÓN DE FcB :
FcB = 7.97
1) HIPOTESIS:
H0: ι jk = 0
Ha: ι jk ≠ 0
3) REGIÓN DE RECHAZO:
Se
0.95 acepta
Ha
0.05
F2;6;0.05 = 5.14
4) DETERMINACIÓN DE FcI :
FcI = 1.21