Está en la página 1de 32

4.

ANLISIS DE LA VARIANZA
Es una tcnica estadstica eficiente para comparar varias medidas muestrales:
1, 2, . . ., n.
El Anlisis de Varianza se origin en investigaciones agrcolas y, por lo tanto, su
lenguaje est cargado de trminos agrcolas como parcelas o bloques
(referencia a la tierra) y tratamientos (referencia a las poblaciones o muestras
que se diferencian en trminos de variedad de semillas, de fertilizantes o
mtodos de cultivo).
En la actualidad, los procedimientos de esta tcnica estadstica tiene una
aplicacin til, en casi todo tipo de diseo experimental.
Por lo tanto es utilizado el Anlisis de Varianza en casi todas las ciencias, por
que su aplicacin es asombrosamente til: se puede adaptar fcilmente para
suministrar, con amplios lmites, una evaluacin adecuada de los datos
obtenidos en un conjunto de experimentos que requieran diversas variables
aleatorias continuas.
Puede darnos respuestas con respecto a los datos muestrales diferentes
clasificaciones como: Anlisis de Varianza de un factor, Anlisis de Varianza de
dos factores, con una sola muestra por grupo.
4.1. Modelo de anlisis de varianza de un factor
Tenemos C poblaciones A1, A2, , Ac, cada una distribuida normalmente con
media i y todas teniendo una varianza comn 2.
Estas poblaciones a menudo se llamaban tratamientos representando, C
manera de ensear estadstica, c marcas de mquinas para producir cierto tipo
de producto.
Se supone que las c poblaciones tienen una varianza comn, puesto que existe
razn para creer que los diferentes tratamientos utilizados con el mismo
propsito pueden diferir en las tendencias centrales, pero no en la dispersin.
Adems, concebimos que estas poblaciones juntas constituyen una poblacin
mayor con media llamada media poblacional mayor que se define como:
i.
= ------C
En los dos supuestos anteriores, deseamos probar la hiptesis nula de que
todas las medidas de tratamientos son iguales:
1

1 = 2 =, .., = C.
Si Ho es verdadera, entonces aceptamos i = , sin embargo. Si Ho es falsa,
entonces esperamos que i se desve de en una cantidad i es decir:
i = i ,

i = 1, 2, , C

En donde i se llama, por razones obvias, efectos de tratamientos


Por la propiedad de la media aritmtica podemos ver as mismo que:
i = (i ) = 0
Para los argumentos anteriores podemos ver as mismo que:
1 = 2 = , . . . , = C
i = 0
Son expresiones equivalentes, ya que cuando decimos que las medias de los
tratamientos son iguales, significamos que los efectos debidos a los
tratamientos son nulos.
Ahora bien, suponemos que x ij, la j sima observacin en la i sima muestra,
estn distribuidas normalmente alrededor de , y expresamos que xij = i + eij.
Aqu, eij son desviaciones de xij a partir de i debido a las fluctuaciones
aleatorias en el muestreo aleatorio. Los e ij se llamarn trminos de error o
residuo , y se supone que son independientes y estn distribuidos normalmente
con medida cero y varianza idntica a la varianza comn, 2, para las
poblaciones del tratamiento.
Por ltimo, observando que i = + i, tenemos la siguiente forma lineal como
el modelo bsico para el experimento a un solo factor o criterio y
completamente aleatorizado.
xij = i + eij = + i + eij.
4.2. EL ANLISIS
El punto central del Anlisis de la Varianza, no importa el tipo de modelo se
halla en la participacin de la suma total de los cuadros en proporciones
significativas y distintas.
Para ver como se realiza para nuestro modelo, ordenamos primero los datos
aleatorios a partir de las muestras c, cada una con r observaciones, en forma
general como se muestra en el cuadro siguiente:
2

:
Observaciones
1
2
.
.
.
.r
Total
ni
Xi

CUADRO N 1
A1
A2
..
x11 x21
...
x12 x22
...
.
.
...
.
.
...
.
.
...
x1r
x2r
...
x1j x2j
...
n1
n2
X1. X2.

Ac
xc1
x2
.
.
.
xcr
xcj
nc
Xc

Total

Xij
N
X

Se puede calcular dos estadsticas sintticas a partir de los datos del cuadro N
1:
_
1) xi. = la media muestral de la i sima columna.
_
xi. = 1/ni xij = 1/ni (xi1 + xi2 + . + xir)
_
que es una estimacin de i. Observndose que el punto(.) en la notacin xi.
indica la media de la columna se obtiene sumando el ndice j.
_
_
2) X = la media total o mayor)
_
_
X = 1/N x ij = 1/N(x1j + x2j + . . . + xcj)
i j
j
j
j
.
que es una estimacin insesgada de y
N = n1 + n2 + . . . + nc
Se puede dividir el conjunto de las i muestras experimentales diferentes en dos
partes distintas en trminos de la suma de las desviaciones al cuadrado
alrededor de la media muestral total. Se espera que cada observacin x ij en la
muestra i se desve de la media total en una cantidad (xij x) en dos partes.
_
_
_
_
( xij X) = (xij xi. + xi. X)
El primer componente del segundo miembro de esta expresin es la desviacin
de xij y de la media muestral i.
El segundo componente del segundo miembro es la desviacin de la media
muestral i y la media total.
_

Como es obvio, (xij X) es una estimacin de (x ij ) y los dos trminos del


segundo miembro son estimaciones de eij y i respectivamente.
_
_
_
_
( xij X) = (xij xi.) + (xi. X)
_
( xij X) =
eij
+
i
Ahora bien, si elevamos al cuadrado la desviacin de X para cada observacin
en la muestra y sumamos estas desviaciones al cuadrado en todas la j
individuales de todos los grupos muestrales i entonces tendremos:
_
_
_
_
( xij X) = (xij xi.) + (xi. X)
Elevando al cuadrado y aplicando la sumatoria miembro a miembro
_
_
_
_
( xij X)2 = [(xij xi.) + (xi. X)]2
_
_
_
_
_ _ _
(xij X)2 = (xij xi.)2 + (xij X)2 + 2 (xij xi.) (xi. X)
El ltimo del segundo miembro es igual a cero, ya que el valor representado
_ _
por el trmino (xi. X) es el mismo para todas las j del grupo i y la suma de
_
(xij xi.) debe ser cero cuando se toma en todas la j de cualquier grupo i. Por
consiguiente, est expresin queda de la siguiente manera:
(xij X)2 = (xij xi.)2 + (xi. X)2
SCT
SCE
SCC
SCT = Suma de cuadrados del total
SCE = Suma de cuadrados del error
SCC = Suma de cuadrados entre columnas o muestras
Esta ecuacin se llama particin de la suma de cuadrados.
La participacin de la suma de cuadrados en dos partes distintas en trminos
intuitivos bastante fciles.
Las observaciones en cualquier muestra siempre mostrarn variabilidad.
Las diferencias entre las observaciones individuales aqu pueden provenir de
dos fuentes:
a) Las diferencias individuales que pertenecen a diferentes muestras de
tratamientos puede resultar de los diferentes tratamientos o de las
variaciones aleatorias o de ambos.
b) La suma de cuadrados entre las muestras, SCC, refleja la contribucin
tanto de los tratamientos diferentes como de la aleatoriedad, debido a la
variabilidad intermuestral.

Sin embargo, las observaciones individuales en la misma muestra del


tratamiento pueden diferir entre s slo por la variacin aleatoria, ya que
cada elemento del grupo recibe exactamente el mismo tratamiento.
La suma de los cuadrados dentro de las muestras, SCE, mide las
diferencias intermuestrales debidas solamente a la aleatoriedad.
Por lo tato, en cualquier grupo de i muestras es posible aislar los dos
tipos de variabilidad: la suma de los cuadros ente grupos que reflejan
variabilidad debido al tratamiento y a la aleatoriedad, y a la suma de
cuadrados dentro de los grupos que reflejan solamente variaciones
aleatorias.
Las sumas de cuadrados se calculan expandiendo las binominales que las
definen de la siguiente manera:
_
_
_
SCT = ( xij X)2 = (xij2 2Xxij + X2)
_
_
= xij2 2X xij + NX2
_ _
_
2
= xij 2X N X + N X2
_
_
2
2
= xij 2N X + N X2
_
2
SCT = xij NX2
_
_
_
SCE = ( xij xi.)2 = ( xij2 2 xij xi. + xi.2)
_
_
2
= ( xij 2xi. xij + ni xi. 2)
_ _
_
= ( xij 2xi.ni xi. + ni xi. 2)
_
_
2
2
= ( xij 2ni xi. + n xi. 2)
_
2
= ( xij ni xi.2)
_
2
SCE = xij - ni xi.2

_ _
_
_
2
SCC = (xi. X) = ni (xi. X) 2

_
_ _
_
2
= ni (xi. - 2 xi. X + X2)
_
_
_
_
2
= ni xi. 2X ni xi. + X2 ni
_
_
_
2
2
= ni xi. 2NX + NX2
_
_
SCC = ni xi. NX2
Como control observemos:

SCT = SCE + SCC

As mismo, SCE se puede obtener restando, es decir SCE = SCT SCC se lo


deseamos
Las frmulas precedentes para la suma de cuadrados son aplicables tanto a
tamaos de muestras iguales como desiguales.
CUADRO DE ANLISIS DE VARIANZA
FUENTE
VARIACIN
ENTRE (columnas)
DENTRO ERROR
TOTAL

SUMA DE
CUADRADOS
SCC
SCE
SCT

GRADO DE
LIBERTAD
C1
NC
N1

PROMEDIO DE
CUADRADOS
PCC = SCC/C-1
PCE = SCE/N-C

F
F = PCC/PCE

Las frmulas precedentes para la suma de cuadrados son aplicables tanto a


tamaos de muestras iguales o desiguales.
Si la hiptesis nula de que los efectos de los tratamientos son nulos es verdad,
entonces cada una de esas tres sumas de cuadrados, dividida entre un nmero
adecuado de grados de libertad, es una estimacin insesgada de la varianza
poblacional. 2.
El nmero total de grados de libertad en este modo es N 1, puesto que SCT
se calcula con un total de observaciones de N observaciones utilizando la
media muestral total como estimador de . un grado de libertad se pierde de
esta manera.
Para estimar 2 con base en SCC la variacin entre las medias de columnas el
nmero de grados de libertad es C 1, por que hay C medidas de columnas
que comparar y nuevamente se utiliza la media muestral total como estimador
de para el clculo de SCC.
El nmero de grados de libertad para estimar 2 basado en SCE es N C, ya
que SCE se obtiene a partir de todas las N observaciones con las medidas del
grupo C como estimacin de la medida poblacional.

Es interesante notar que, lo mismo que en el caso de las sumas de cuadrados,


el nmero de grados de libertad es tambin aditivo; es decir, tenemos aqu:
N C = (C 1) + (N C)
Las estimaciones para la varianza poblacional comn se llaman promedio de
los cuadrados en el Anlisis de la Varianza. Para este modelo, como se vio
anteriormente, nos interesa comparar dos promedios de los cuadrados: el
promedio de los cuadrados entre columnas PCC = SCC / (C 1) y el promedio
cuadrtico del error PCP = SCE / (N C).
Obsrvese que tanto PCC como PCE estn distribuidas como
cuadrados C 1 y N C g l, respectivamente.
Las varianzas de cada tratamiento es:
xi2 (xi)2/ n
s2 = --------------------n - 1

4.3. PRUEBA DE HIPTESIS


Para el modelo que trataremos, el par de hiptesis para la prueba de hiptesis
es:
Ho : Todas las medidas de tratamientos son iguales o i = 0
H1 : No todas las medidas de tratamiento son iguales, o no todas las i son
cero.
La prueba de hiptesis estadstica a usarse en este caso es el cociente F entre
PCC y PCE. La razn es bastante sencilla. En el supuesto de que los e ij estn
distribuidos normalmente y sean independientes con media 0 y la varianza
idntica a 2, PCE debe ser estimacin insesgada de 2,ya sea si H0es
verdadera o no, puesto que PCE mide solamente la variacin aleatoria. Por
otra parte, PCC es una estimacin insesgada de 2 si, y slo si, H0 es
verdadera. Cuando los efectos de los tratamientos no son nulos, en realidad
PCC estima la cantidad 2 + en donde es un sesgo positivo y mide los
grados de libertad de diferencias en los tratamientos. En esas circunstancias,
esperamos que FC-1, N-C = PCC/PCE = 1 o muy cerca de 1, Si H 0 es verdadera,
y esperaremos que este cociente sea significativamente mayor que 1 si H 0 es
falsa.
Por consiguiente, una vez ms, la prueba de hiptesis de F observado es de la
variedad cola superior. Cuando el valor fe F observado es o est cerca de 1, la
hiptesis nula, concluiremos que los efectos del tratamiento no son nulos.

PROBLEMA 1: IGUAL TAMAO MUESTRAL


Una compaa manufacturera ha comprado cuatro mquinas nuevas de
marcas diferentes y que desea determinar si una de ellas es ms rpida que
las otras para producirn cierto artculo. Se observan los resultados de ocho
horas de produccin aleatoriamente de cada mquina y se prestan los
resultados en el cuadro 2 siguiente:
OBSERVAC.

1
2
3
4
5
6
7
8

M1
25
30
28
36
37
32
38
31

M2
31
39
35
38
39
40
42
35

M3
24
30
27
31
32
29
25
28

M4
25
31
24
36
38
29
35
30

Probar la hiptesis con un nivel de significacin del 5% y 1%


SOLUCIN:
1. HIPTESIS
H0 : 1 = 2 = 3 = 4
H1 : No todas las cuatro i son iguales.
2. NIVEL DE SIGNIFICACIN
= 5.05; 0.01
3. ESTADSTICA DE PRUEBA
F 3,28 = PCC / PCE
Gl1 = C 1 = 4 1 = 3
Gl2 = N C = 32 4 =28

4. REGLA DE DECISIN
FE = DISTR. F. INV. (0.05; 3; 28) = 2.9467 2.95
FE = DISTR. F. INV. (0.01; 3; 28) = 4.5681 4.57
8

a) Se acepta Ho, cuando Fo 2.94

a) Se acepta Ho, cuando Fo 4.57

b) Se acepte H1, cuando Fo > 2.94

b) Se acepta H1, cuando Fo > 4.57

5. CLCULOS
OBSERVACIONES

1
2
3
4
5
6
7
8
TOTAL
ni
xi

M1
M2
25
31
30
39
28
35
36
38
37
39
32
40
38
42
31
35
257
299
8
8
32.125 37.375

M3
24
30
27
31
32
29
25
28
226
8
28.25

M4
25
31
24
36
38
29
35
30
248
8
3

TOTAL

1,030
32
32.1875

Xi2 = 252 + 302 + 282 + 362 + 372 + 322 + 382 + 312


+312 + 392 + 352 + 382 + 392 + 402 + 422 + 352
+242 + 302 + 272 + 312 + 322 + 292 + 252 + 282
+252 + 312 + 242 + 362 + 382 + 292 + 352 + 302 =
Xij2 = 625 + 900 + 784 + 1296 +1369 + 1024 + 1444 + 961
+961 + 1521 + 1225 + 1444 + 1521 + 1600 + 1764 +1225
+576 + 900 + 729 + 961 + 1024 + 841 + 625 + 784
+625 + 961 + 576 + 1296 + 1444 + 841 + 1225 + 900 = 33,972
_
_
_
_
_
ni xi.2 = n1x1.2 + n2x2.2 + n3 x3.2 + n4 x4. 2
= 8(32.125)2 + 8(37.375)2 + 8(28.25)2 + 8(31)2
= 8(1032.015625) + 8(1396.890625) + 8(798.0625) + 8(961) .
9

= 8256.125 + 11175.125 + 6384.5 + 7688


= 33503.75
_
NX2 = 32(32.1875) 2
_
NX2 = 32(1036.035156)
_
NX2 = 33,153.125
Calculando las tres sumas de cuadrados:
Suma de los cuadrados del total
_
2
SCT = xij NX2
SCT = 33,972 33.153.125 = 818.875
Suma de cuadrados del error
SCE = xij2 - ni xi.2
SCE = 33,972 33,503.75 = 468.25
Calculando los grados de libertad:
Grados de libertad del total:

= N - 1 = 32 - 1 = 31

Grados de libertad del error:

= N - C = 32 - 4 = 28

Grados de libertad de Columnas: = C - 1 = 4 - 1 = 3


Calculando los promedios de los cuadrados:
Promedio de los cuadrados entre columnas
PCC = SCC / (C-1) = 350.625 / 3 = 116.875
Promedio de los cuadrados del error
PCE = SCE / (N-C) = 468.25 / 28 = 16.72321429 16.723
Calculando la F observada
Fo = PCC / PCE = 116.875 / 16.72321429 = 6.988788041 6.99
ANLISIS DE LA VARIANZA
Origen de las

10

Suma de

Grados

Promedio de

FO

FE

variaciones
Entre Columnas
Dentro de las
Columnas
TOTAL

350.625
468.25

de
libertad
3
28

818.875

31

cuadrados

los cuadrados
116.875
16.72321429

6.989

2.9467

6. TOMA DE DECISIONES
Se rechaza Ho al nivel de significacin del 5% y 1 % por que 6.989 > 2.9467 y
6.989 > 4.5681.
Las cuatro mquinas nuevas son significativamente diferentes en sus
velocidades medias o los efectos de las mquinas son significativos.
MODELO TECNOLGICO POR MS. EXCEL
Anlisis de varianza de un factor.
1. Ingresar los datos a la computadora

2. Seleccionar la celda de salida


3. Pulsar el men Herramientas

4. Seleccionar y pulsar Anlisis de datos y se obtiene el cuadro de dilogo


Anlisis de datos

11

5. Seleccionar y pulsar Anlisis de varianza de un factor, y pulsar


Aceptar y se obtiene el cuadro de dilogo Anlisis de varianza de un
factor:

6. En rengo de entrada ingresar los datos.


Pulsar en columnas
Pulsar en Rtulos en la primera fila, si ha ingresado los rtulos del
problema.
En Alfa ingresar el error deseado
Pulsar en Rango de salida, y ingresar la celda seleccionada en el paso 2
Pulsar en un libro nuevo.

12

7. Pulsar en Aceptar y se obtiene el Anlisis de varianza de un factor.

PROBLEMA 2: TAMAO DE MUESTRA DESIGUAL


El director administrativo de una empresa industrial desea determinar si los tres
programas de capacitacin distintos tienen efectos diferentes en los niveles de
productividad de los empleados. Estos programas son los tratamientos que
puede evaluar el Anlisis de Varianza.
Se seleccionan 28 empleados y se asignan a uno de los tres programas. Al
terminar la capacitacin cada empleado responde un examen para determinar
su competencia. Se colocan 8 empleados en el primer programa, y diez en
cada uno de los otros programas. Cada uno de estos tres grupos se trata de
manera independiente como muestras separadas.
13

Los puntajes de la prueba aparecen en la tabla:


Observac.
1
2
3
4
5
6
7
8
9
10

C1
85
72
83
80
83
80
72
85

C2
80
84
81
78
82
84
80
81
82
78

C3
82
80
85
90
88
88
90
85
80
82

Con estos datos podemos concluir que las calificaciones de los empleados
son afectadas significativamente por el programa de capacitacin con una nivel
de significacin del 5% y 1%.

SOLUCIN:
1. HIPTESIS
H0 : 1 = 2 = 3
H0 : 1 2 3.
2. NIVEL DE SIGNIFICACIN
= 0.05, 0.01
3. ESTADSTICA DE PRUEBA
F 2.25 = PCC / PCE
Gl1 = C 1 = 3 1 = 2
Gl2 = N C = 28 3 =25
4.

REGLA DE DECISIN
Fc = DISTR. F. INV. (0.05; 2; 25)ENTER = 3.38519612 3.39
Fc = DISTR. F. INV. (0.01; 2; 25)ENTER = 5.56804025 3.57

14

Para 5%
a) Se acepta H0, cuando Fo 3.38519612 3.39
b) Se acepta H1, cuando Fo > 3.38519612 3.39
Para 1%
a) Se acepta H0, cuando Fo 5.56804025 5.57
b) Se acepta H0, cuando Fo > 3.38519612 3.39
5. CLCULOS
Observac.
1
2
3
4
5
6
7
8
9
10
TOTAL
ni
xi.

C1
85
72
83
80
83
80
72
85
640
8
80

C2
80
84
81
78
82
84
80
81
82
78
810
10
81

C3
82
80
85
90
88
88
90
85
80
82
850
10
85

TOTAL

2300
28
82.1428571

xij2= 852 + 722 + 832 + 802 + 832 + 802 + 722 + 852


+802 + 842 + 812 + 782 + 822 + 842 + 802 + 812 + 822 + 782
+822 + 802 + 852 + 902 + 882 + 882 + 902 + 852 + 802 + 822=
xij2 = 7225 + 5184 + 6889 + 6400 + 6889 + 6400 + 5184 + 7225
+6400 + 7056 + 6561 + 6084 + 6724 +7056 + 6400 + 6561 + 6724 + 6084
+6724 + 6400 + 7225 + 8100 + 7744 + 7744 + 8100 + 7225 + 6400 + 6724
= 189,432

15

= SUMA CUADRADOS (A2; C11) ENTER


_
_
_
_
ni xi.2 = n1x1.2 + n2x2. + n3x3.
= 8(80)2 + 10(81)2 + 10(85)2
= 8(6400) + 10(6561) + 10(7225)
= 51,200 + 65610 + 72250
= 189060
_
NX2 = 28(82.1428571) 2
= 28(6747.44898)
_
NX = 188,928.571
Calculando las tres sumas de cuadrados:
Suma de los cuadrados del total
_
SCT = xij2 NX2
SCT = 189432 - 188928.571 = 503.429
Suma de cuadrados del error
SCE = xij2 - ni xi.2
SCE = 189432 - 189060 = 372
Calculando los grados de libertad:
Grados de libertad del total:

= N - 1 = 28 - 1 = 27

Grados de libertad del error:

= N - C = 28 - 3 = 25

Grados de libertad de Columnas: = C - 1 = 3 - 1 = 2


Calculando los promedios de los cuadrados:
Promedio de los cuadrados entre columnas
PCC = SCC / (C-1) = 131.429 / 2 = 65.7145
Promedio de los cuadrados del error

16

PCE = SCE / (N-C) = 372 / 25 = 14.88


Calculando la F observada
Fo = PCC / PCE = 65.7145 / 14.88 = 4.416297043 4.42
ANLISIS DE LA VARIANZA
Origen de las
variaciones
Entre colum.
Dentro Colum
TOTAL

Suma de
cuadrados
131.428517
372
503.429

Grados
de
libertad
2
25
27

Promedio
de los
cuadrados
65.7145
14.88

F
observado

F
esperado

4.416

3.39
5.57

6. TOMA DE DECISIONES
Se rechaza Ho al nivel de significacin del 5% y 1 % por que 4.416 > 3.39 y
4.416 < 5.57.
Los tres programas capacitacin son significativamente diferentes en los
niveles de productividad de los empleados.
Modelo Tecnolgico por Ms. Excel
1. Ingresar los datos a la Computadora

2. Seleccionar la celda de salida


3. Pulsar el men Herramientas

4. Seleccionar y pulsar Anlisis de datos y se obtiene el cuadro de


dilogo Anlisis de datos
17

5. Seleccionar y pulsar Anlisis de varianza de un factor, y pulsar


Aceptar y se obtiene el cuadro de dilogo Anlisis de varianza de un
factor:

6. En rengo de entrada ingresar los datos.


Pulsar en columnas
Pulsar en Rtulos en la primera fila, si ha ingresado los rtulos del
problema.
En Alfa ingresar el error deseado
Pulsar en Rango de salida, y ingresar la celda seleccionada en el paso 2
Pulsar en un libro nuevo.

18

7. Pulsar en Aceptar y se obtiene el Anlisis de varianza de un factor.

19

4.4. MODELO DE ANLISIS DE VARIANZA DE DOS FACTORES CON UNA


SOLA MUESTRA POR GRUPO
Experimento de dos factores con una sola muestra por grupo es una expresin
que proviene de la investigacin agrcola en la que varias variables o
tratamientos se aplican a diferentes parcelas de tierra para repeticin, o
rplica, del experimento.
El objetivo principal es establecer las diferencias significativas entre los efectos
de tratamiento, como los rendimientos de cada accin o la calidad de diferentes
tratamientos. Pero la diferencia de cada accin en sus rendimientos no slo a
los tipos de obreros sino tambin a la diferencia en la calidad de los materiales.
La idea bsica aqu es comparar todos los efectos del tratamiento dentro de un
bloque de material experimental eliminando los efectos del ambiente.
EL MODELO
Tenemos C tratamientos Ai, y r bloques Bj; entonces las xij pueden considerarse
como muestras, cada una de tamao ni extradas de las poblaciones con media
ij. Por lo tanto, hay rc poblaciones que estn distribuidas normalmente con una
varianza comn 2. A continuacin definiremos una media muestral total:
11 + 12 + . + rc
1
= -------------------------------- = --- ij.
rc
rc

La desviacin ij a partir de puede entonces explicarse en forma razonable


como debida a los efectos tanto de tratamiento como de bloques. Ahora bien, si
representamos el efecto del i-simo tratamiento como i y con j el efecto del
j -simo bloque, entonces podemos suponer que
: ij = + i + j
Las muestras, xij estn distribuidas normalmente alrededor de ij. La desviacin
de cada observacin muestral a partir de su media poblacional correspondiente
es el error del muestreo aleatorio y se representa por e ij; es decir, la
observacin hecha a partir ij- sima poblacin se puede representar por:
xij = ij + eij = + i + j + eij
Los efectos del tratamiento y los del bloque son aditivos; es decir no hay efecto
conjunto entre i y j, excepto la suma de sus efectos simples.
Tambin, al igual que anteriormente, se supone que los e ij son independientes y
estn distribuidos n(0, 2)
Por ltimo, por razones de conveniencia para este modelo, tambin suponemos
que:
20

i = j = 0
EL ANLISIS
El anlisis de este modelo comienza, nuevamente, con la participacin de la
suma de cuadrados del total, en componentes significativos y no solapados.
Comenzaremos con la ayuda de una prestacin tabular de los datos muestrales
del cuadro
DATOS MUESTRALES: MODELO DE DOS FACTORES CON UNA SOLA
MUESTRA POR GRUPO
A1
A2
Ac.
s.j
n.j
x.j
B1
B2
.
.
.
Br
si.
ni.
xi.

x 11
x 12
.
.
.
X1r
s1.
n1.
x1.

x21
x 22
.
.
.
x2r
s2.
n2.
x2.

...
...
...
...
...
...
...
...
...

xc1
xc2
.
.
.
xcr
sc.
nr.
xc.

s.1
s.2
.
.
.
s.r

n.1
X1
n.2
X2
.
.
.
.
.
.
n .r
X.r
S suma total
rc = N
X = s/rc

Ai = Tratamientos, i = 1, 2, , c
Bj = Bloques,

j = 1, 2, , r

Si. = Suma de columnas; por ejemplo: s1. = x11 + x12 + + xir


xi. =

Medias de las columnas = si. / ni. ; ejemplo: x2. = s2. / n2.

s.j =

Suma de las filas; por ejemplo: s.2 = x12 + x22 + + xc2

X.j = Medias de las filas = s.j / n.j por ejemplo: x.1 = s.1 / n.1
La suma de cuadrados del total representada por SCT, al igual que
anteriormente, mide las desviaciones al cuadrado de todas las observaciones
de la media muestral total.
Se descompone ahora en tres partes independientes, como se indica en la
siguiente igualdad

SCT =
21

_
(xij X)2

SCC

SCF

SCE =

_
_
(xi. X)2
_
_
(x.j X)2
_ _ _
(xij xi. x.j + X)2

SCT = Suma de Cuadrado de Total


SCC = Suma de Cuadrado de Columnas
SCF = Suma de Cuadrados de Filas
SCE = Suma de Cuadrados de Error
En la igualdad anterior SCC mide tanto la variacin aleatoria como las
variaciones en los efectos del tratamiento, si las hay, ya que la cantidad (x i.
_
X) es una estimacin de (i ) = i.
De modo similar, la variacin entre las medidas de las filas SCF, mide tanto las
_
variaciones del error como los efectos del bloque, j, ya que (x.j X) refleja la
dispersin de las medidas de las filas de media muestral total. Por lo tanto, se
puede considerar como una estimacin de .j = .j.
Por ltimo, la suma de cuadrados del error SCE se basa en las desviaciones a
partir de una medida de casilla para los elementos tratados exactamente de la
misma forma, y, por consiguiente, la nica contribucin posible para esta suma
de cuadrados debe ser una variacin del error. De modo alternativo podemos
_ _ _
decir que la cantidad (xij x.i x.j X) mide en el trmino error eij.
Las anteriores sumas de cuadrados se calculan de la siguiente manera:
C = (1/rc) S2 = Factor de correccin
SCT = x ij2 C
SCC = si.2 C
SCF = s.j2 C
SCE = SCT (SCC + SCF)

CUADRO DEL ANLISIS DE LA VARIANZA DE DOS FACTORES CON


UNA SOLA MUESTRA POR GRUPO

22

Tabla N 3
Fuente de variacin
Tratamiento columnas
Tratamiento de filas
Error
TOTAL

SC
SCC
SCF
SCE
SCT

gl
c1
r - 1
(r-1)(c-1)
rc1

PC
PCC=SCC/C-1
PCF=SCF/r-1
PCE=SCE/(c-1)(r-1)

Fc
Fb

Demostremos que en el supuesto de que los efectos del tratamiento sean


nulos, cada una de las tres sumas de cuadrados, que comprende SCT dividida
entre un nmero adecuado de gl es una estimacin insesgada de la varianza
poblacional comn 2.
Es fcil ver que para SCC, gl = c 1; para SCF,
gl = r 1 para
SCE, gl =(c-1)(r-1). Como siempre, estos tres nmeros de gl se suman para
obtener el gl para SCT, que es rc-1, como nos muestra el cuadro N3 del
Anlisis de la varianza para este modelo.

PRUEBA DE HIPTESIS
Para este modelo, pareciera haber dos conjunto de hiptesis a ser evaluadas;
ellos son:
1. Prueba de Hiptesis del Tratamiento
H0: i = 0
H1 : No todas las i son cero
2. Prueba de hiptesis de los efectos de bloques
Ho : BJ = 0
H1 : No todas las BJ son cero
Sin embargo, en realidad nos interesa probar la hiptesis slo el primer
conjunto de hiptesis. No nos importa el problema de si los efectos de bloque
son o no nulos, ya que las medidas de bloques en los supuesto de este
modelo, son simplemente indicativas de las diferencias en los bloques de
material experimental. Esta segunda prueba de hiptesis es, sin embargo
significativa para el modelo completamente aleatorizado a dos criterios, que se
discute posteriormente.
A continuacin, cada una de las medidas maestrales del tratamiento, x i., es una
estimacin insesgada de + i. Por consiguiente, decimos que si las medias
del tratamiento son iguales, entonces i = 0. Nuevamente, observamos que
PCE es una estimacin insesgada de 2, ya sea que i = 0 no, y que PCC es
una estimacin insesgada de 2 slo si i = 0. Cuando i =0 es falsa, PCC
mide tanto las diferencias en los efectos del tratamiento como la variacin

23

aleatoria y, por consiguiente, tiende a ser mucho mayor que PCE. En estas
condiciones, debemos nuevamente aceptar H 0 s, y slo si Fc-1,(c-1)(r-1) = PCC/
PCE = 1 aproximadamente igual a 1. Se rechaza H 0 cuando el valor calculado
de F observada es significativamente mayor que 1
PROBLEMA 3: MODELO DE DOS FACTORES
Se va a efectuar un estudio de los movimientos para determinar el mejor diseo
de trabajo para ensamblar computadoras, cinco diseos se hallan en estudio.
Se selecciono cuatro ensambladores aleatoriamente de entre todos los
ensambladores de la planta y se les ensea minuciosamente a trabajar con
cinco diseos. Cada ensamblador sigue cada diseo durante un da y registra
el nmero de computadoras ensambladas. Para este problema, el modelo que
presentamos es adecuado. En este caso, los tratamientos son los efectos de
los distintos diseos de trabajo y los bloques son los ensambladores
seleccionados aleatoriamente. Probar la hiptesis de hiptesis para este
experimento al nivel de significacin del 1%
ENSAMBLADORES
1
2
3
4
5
6
7
8

D1
10
5
6
4
6
5
10
4

DISEO DE TRABAJO
D2
D3
D4
13
9
14
10
5
10
12
5
10
8
4
11
12
5
10
10
5
10
13
9
14
8
4
11

SOLUCIN
PRUEBA DE HIPTESIS
1. HIPTESIS
H0 : I = 0
H1 : No todas las i son cero
H0 : Bj = 0
H1 : No todas las Bj son cero

2. NIVEL DE SIGNIFICACIN
= 0.05

24

D5
11
6
6
5
6
6
11
5

3. ESTADSTICA DE PRUEBA
Fo 4, 28 = PCC / PCE
c = 5, r = 8
c1 = 51 = 4
r1 = 8 -1 = 7
(c - 1)(r - 1) = (5 - 1)(8 - 1) = (4)(7) = 28
4. REGLA DE DECISIN
FE= DISTR. F. INV. (0.05; 7; 28)ENTER = 2.35925768 2.36

DIBUJAR
a) se acepta Ho cuando Fo 2.36
b) se rechaza Ho cuando Fo > 2.36
5. CLCULOS
Los clculos de produccin (el nmero de computadoras ensambladas) para
experimento son como:
TABLA N 4
ENSAMBLADORES
1
2
3
4
5
6
7
8
si.
ni.
xi.

D1
10
5
6
4
6
5
10
4
50
8
6.25

DISEO DE TRABAJO
D2
D3
D4
13
9
14
10
5
10
12
5
10
8
4
11
12
5
10
10
5
10
13
9
14
8
4
11
86
46
90
8
8
8
10.75
5.75
11.25

Calculando el factor de correccin:


C = (1 / rc) S2 = 1/40(328)2 = 107584 / 40 = 2689.6
25

D5
11
6
6
5
6
6
11
5
56
8
7

s.j

n.j

x.j

57
36
39
32
39
36
57
32

5
5
5
5
5
5
5
5
328 =S
40= rc
82 = X

11.4
7.2
7.8
6.4
7.8
7.2
11.4
6.4

xij2 = 102 + 132 + 92 + 142 + 112


+52 + 102 + 52 + 102 + 62
+62 + 122 + 52 + 102 + 62
+42 + 82 + 42 + 112 + 52+
+62 + 122 + 52 + 102 + 62
+52 + 102 + 52 + 102 + 62
+102 + 132 + 92 + 142 + 112
+42 + 82 +

42 + 112 + 52=

=100 + 169 + 81 + 196 + 121


+25 + 100 +25 + 100 + 36
+36 + 144 + 25 + 100 + 36
+16 + 64 + 16 + 121 + 25
+36 + 144 + 25 + 100 + 36
+25 + 100 + 25 + 100 + 36
+100 + 169 + 81 + 196 + 121
+16

+ 64

+ 16 + 121 + 25 = 3072

Calculando la suma de cuadrados del total


SCT = xij2 C = 3072 2689.6 = 382.4
Calculando la suma de cuadrados entre filas
1/cs.J2 = (572 + 362 + 392 + 322 + 392 + 362 + 572 + 322) / 5
1/cs.J2 = (3249+1296+1521+1024+1521+1296+3249+1024) / 5
1/cs.J2 = 14180 / 5
1/cs.J2 = 2836
SCF = 1/c s.J 2 C
SCF = 2836 2689.6

26

SCF = 146.40
1/rsi.2 = (502 + 862 + 462 + 902 + 562) / 8
1/rsi.2 = (2500 + 7396 + 2116 + 8100 + 3136) / 8
1/rsi.2 = 232248 / 8
1/rsi.2 = 2906
SCC = 1/r si. 2 C
SCC = 2906 - 2689.6
SCC = 216
SCE = SCT (SCC + SCF)
SCE = 382.40 - (216 + 146.40)
SCE = 382.40 - 362.40
SCE = 20
Clculo de los grados de libertad:
Clculo del grado de libertad de las filas = r 1 = 8 1 = 7
Calculo de grados de libertad de las columnas = c - 1 = 5 - 1 = 4
Clculo de los grados de libertad de error = (c - 1)(r - 1) = (5-1)(8-1) = 28
Clculo de los grados de libertad del total = cr - 1 = 5x8 1 = 39
Calculando el promedio de los cuadrados:
Calculando el promedio de los cuadrados de las Filas
PCF = 146.40 / (8 - 1) = 146.40/7 = 20.91428571
Promedio de los cuadrados entre columnas
PCC = SCC / c - 1 = 216 / (5 - 1) = 216 / 4 = 54
Promedio de los cuadrados del error
PCE = SCE / (c - 1)(r - 1) = 20 / (5-1)(8-1) = 20 / 28 = 0.71428571428

27

Calculando la F observada
F = 54 / 0.71428571428 = 75.6

FUENTE DE
VARIACIN
Entre ensam.
Entre diseos
Error
TOTAL

SC
146.40
216.00
20.00
382.40

G. L.
7
4
28
39

PC
20.9143
54.0000
0.7143

Fo
29.2794
75.6

VALOR
CRTICO F
2.3593
2.7141

6. TOMA DE DECISIONES
Se rechaza Ho porque 75.6 > 2.35925768
Los diseos de trabajo son diferentes
Se rechaza Ho porque 29.28 > 2.3593
Los ensambladores son diferentes

POR EL MTODO TECNOLGICO CON EL PROGRAMA Ms. EXCEL


1. Ingresar los datos a la computadora

28

2. Seleccionar la celda de salida


3. Pulsar el men Herramienta

4. Seleccionar y pulsar Anlisis de datos...y se obtiene el cuadro de dilogo


Anlisis de datos

5. Seleccionar y pulsar Anlisis de varianza de dos factores con una sola


muestra por grupo.

29

6. Pulsar el botn de Aceptar del cuadro de dilogo Anlisis de datos del


paso anterior y se obtiene el cuadro de dilogo Anlisis de varianza de
dos factores con una sola muestra:

7.

En rango de entrada ingresar los datos.


Pulsar en Rtulos, si ha ingresado los rtulos del problema.
En Alfa ingresar el error deseado
Pulsar en Rango de salida, y ingresar la celda seleccionada en el paso 2
Pulsar en un libro nuevo.

8. Pulsar el botn Aceptar


30

31

ANALISIS DE LA
VARIANZA

Mag. Ing. Vctor Csar Mayhuasca Cabrera

LIMA - PER

32

También podría gustarte