Está en la página 1de 9

ANALISIS DE VARIANZA

1. INTRODUCCION
El anlisis de varianza para experimentos diseado, es una tcnica estadstica que
se aplica para comprobar si son iguales las medias de mas de dos poblaciones
independiente mediante la comparacin de varianza insesgadas de muestra de
diversas fuentes, utilizando para el efecto la prueba F.
El anova trabaja
con muestras
pequeas
por esta razn
se planifican
adecuadamente la recoleccin de datos.
La tcnica estadstica del anlisis de varianza ha encontrado aplicacin en casi toda
las disciplinas cientficas y han llegado a convertirse en un tema muy amplio.
El termino factor (cualitativo) se da a cada una de las variables independiente que
involucra el problema de anova, relacionada con una variable dependiente o
variable respuesta (cuantitativa); los valores de un factor son denominado niveles o
tratamientos en el diseo anova.
La variable dependiente x podra estar asociada a dos factores, cada elemento de
muestra contenida en todas las combinaciones de los niveles de los dos factores
es una unidad experimental.
Los modelos se clasifican segn el nmero de factores o variable independiente.
Experimento de un factor
Completamente aleatorio
Aleatorizado por bloques
Experimento de dos factores
Sin replicas
Con replicas
2. ANALISIS DE VARIANZA DE UN SOLO FACTOR DISEO COMPLETAMENTE
ALEATORIZADO.
En un diseo de experimento completamente aleatorio que se aplica para comparar
k tratamiento de un factor, los tratamientos se asignan al azar a las unidades
experimentales de la muestra, de manera que un tratamiento escogido al azar es
aplicado a una muestra, el siguiente tratamiento escogido al azar d lo que restan es
aplicado a otra muestra y as sucesivamente.

TRATAMIENTO DEL FACTOR A


2
3
4

TOTAL

TOTAL
MUESTRA
MEDIA

Suma de los datos de la muestra i


Suma total de los datos
Numero de datos de la muestra i
Numero total de datos
Media de la muestra i
Media general
MODELO DE CLASIFICACION SIMPLE

22

Modelo de efectos fijos


Este modelo es aplicable cuando se desea comparar las caractersticas dependiente
x bajo k tratamientos prefijado de inters. Las conclusiones sern validas solo para
esto k tratamientos.
Modelo de efecto aleatorio
Se emplea cuando se tiene una gran poblacin de tratamiento y por lo tanto resulta
poco practico compralos a todos. En este caso se elige al azar solo k tratamientos
de la poblacin y luego se infiere las conclusiones a toda la poblacin de
tratamientos.
HIPOTESIS DEL MODELO DE CLASIFICACION
Modelo de efectos fijos:

H 0 : U 1 U 2 ..... U K

Modelo de efecto aleatorio

H 0 : 1 2 ..... K

ESTADISTICA DE PRUEBA
Sumas cuadradas
SCT = SUMA DEL CUADRADO TOTAL

SCT X ij2

SCA = SUMA DE CUADRADO DE TRATAMIENTO

SCA

SCA = SUMA DE CUADRADO DEL ERROR

SCE = SCT - SCA

X
ni.

2
i.

X ..2
n

X ..2
n

Medias cuadrticas

MCT

SCT
n 1

MCA

SCA
k 1

MCE

SCE
nk

La estadstica de prueba

MCA
MCE

F (K 1; n k)

EJEMPLO 1
Un ingeniero va a decidir la compras de una de 4 maquinas de marcas diferentes
para su uso en una produccin especifica. Por esto. Utilizo cada maquina al azar
para procesar 5 unidades del producto registrando los tiempo por unidad, en
segundos, resultando as el experimento completamente aleatorio. Los datos
observados son los siguientes:
M1:
M2:
M3:
M4:

55
60
64
42

46
58
62
45

45
68
51
52

73
58
57
44

50
63
65
42

Con un nivel de significancia del 5% pruebe la hiptesis que las maquinas utilizan
la misma velocidad media para procesar los productos.
EJEMPLO 2

23

Cuatro profesores cada uno con un grupo de alumnos, ensean el mismo curso de
estadstica, para evaluar las calificaciones por profesor de examen final se extrajeron
al azar una muestra de calificaciones de cada grupo, resultando los siguientes datos:
P1:
P2:
P3:
P4:

12
14
13
10

11
16
12
14

09
13
08
17

17
18
11
14

12
17
12
15

Al nivel de significancia del 5% se puede concluir que existe diferencia significativas


en las calificaciones promedios obtenidas con los cuatros profesores?
3

COMPARACION MULTIPLE
Las comparaciones mltiples a posteriori que solo se aplica cuando el anova se
rechaza la hiptesis nula de igualdad global de medias, nos permite determinar que
medias difieren entre si. Existen hasta 12 mtodos de comparacin mltiple en esta
clase desarrollaremos un mtodo.
Comparacin mltiple de Bonferroni
El mtodo de prueba de pares de media de denominada bonferroni, consiste en
probar la hiptesis de la igualdad de dos medias aplicando intervalo de estimacin
de la diferencia de dos medias.
El objetivo del mtodo es conseguir m intervalos de estimacin con un nivel de
significancia, para esto desarrollamos uno de los m intervalos de estimacin de la
diferencia de pares de medias con nivel de confianza.

LI ( x i x j ) t 0 MCE (

1
1

)
ni n j

LS ( x i x j ) t 0 MCE (

1
1

)
ni n j

t0 t

2m

;n k

Si el intervalo tiene como limite inferior un nmero negativo y como limite superior un
nmero positivo entonces no existe diferencia entre dichas medias.

24

3. ANALISIS DE VARIANZA DE UN FACTOR


DISEOS POR BLOQUES
ALEATORIZADOS
En el diseo de un experimento estadstico aleatorizados por bloques, el objetivo es
comparar los efectos de k niveles de un factor en la variabilidad de la variable
dependiente x cuando se cree que existe una fuente extraa no evitable de
variabilidad adicional de r bloques es decir, se trata de determinar si existe
diferencias significativas en el valor medio de la variable dependiente bajo los k
tratamientos del factor A, pero controlando mediante bloques la fuente extraa de
variabilidad. Los bloques no son considerados como otro factor.
Los k tratamientos se asignan al azar a las unidades experimentales dentro de cada
bloque asignndose un tratamiento a una unidad experimental.

TRATAMIENTO DEL FACTOR A


BLOQUES

TOTAL DE
BLOQUES

MEDIA DE
BLOQUES

B1
B2
B3
B4
B5
B6
TOTAL
MUESTRA
MEDIA

Suma total por tratamiento


Media de cada tratamiento
Suma total por bloques
Media de cada bloque
Suma total
Media general

MODELO
El modelo de anlisis de varianza de un factor
x ij u i j ij
ecuacin lineal:

aleatorizado

por bloques es la

Media general
Efecto del i ensimo tratamiento
Efecto del j ensimo bloque
Error aleatorio

HIPOTESIS
Se quiere probar si existe diferencia significativa en el valor medio de la variable
dependiente x bajo k tratamientos del factor A, esto es se quiere probar la hiptesis
nula

H 0 : U 1 . U 2. ..... U K .
Solo si es importante comprobar que el diseo por bloques ha sido el adecuado para
la experimentacin, podemos determinar si hay diferencia significativa entre las
medias poblacionales de los r bloques

H 0 : U .1. U . 2. ..... U . K .
ESTADISTICA DE PRUEBA

25

Sumas cuadradas

X ..2
n

SCT = SUMA DEL CUADRADO TOTAL

SCT X ij2

SCA = SUMA DE CUADRADO DE TRATAMIENTO

SCA

SCB = SUMA DE CUADRADO DE BLOQUE

SCB

SCA = SUMA DE CUADRADO DEL ERROR

SCE = SCT SCA - SCB

2
i.

ri.

2
.j

X ..2
n

X ..2
n

Medias cuadrticas

MCA

SCA
k 1

MCB

SCB
r 1

MCE

SCE
( r 1)( k 1)

La estadstica de prueba

FA

MCA
MCE

F ((K 1;(r-1)(k-1))

FB

MCB
MCE

F ((r 1;(r-1)(k-1))

EJEMPLO 3
Se realizo un estudio para comparar el rendimiento de cinco variedades de arroz.
Para el experimento, se dispona de cuatro lugares de siembra de igual tamao y
fertilidad en san martn. Cada lugar fue dividido en cinco parcelas iguales y se
sembr las cinco variedades de arroz en la cinco parcelas de cada lugar, asignando
aleatoriamente una variedad a una parcelas, consiguiendo as, un diseo
experimental aleatorizado por bloques.
Se registraron los siguientes rendimientos en ciento de kilogramos:

Lugar 1:
Lugar 2:
Lugar 3:
Lugar 4:

15
8
7
13

12
7
14
7

13
7
12
6

16
12
8
6

11
12
8
10

Es valida la conclusin de que no existe diferencia significativa en los


rendimientos de las cinco variedades de arroz
Fue este diseo por bloques el adecuado para la experimentacin.

4. ANALISIS DE VARIANZA DE DOS FACTORES

26

En el anlisis de varianza con dos criterios de clasificacin los datos de la muestra


son clasificados por medio de un arreglo rectangular en el cual las columnas
representan los niveles del factor A y las filas los niveles del factor B, cada
combinacin de la fila y de la columna definen una celda en el arreglo.
El diseo de los experimentos con dos factores se clasifican segn el numero de
observaciones en la celdas. Si cada celda contiene una sola observaron de la
muestra, el modelo se denomina sin replica. En cambio si cada celda contiene dos o
mas observaciones el modelo se denomina con replicas.
La tabla ANOVA y el proceso de prueba para este modelo son exactamente los
mismo al del modelo de clasificacin de un factor aleatorizado por bloques, en vez
de bloques se tiene el segundo factor.
EJEMPLO 4
Una empresa de produccin estudia la influencia que tiene la velocidad de las
maquinas y la velocidad de los operarios en su proceso de produccin. Para esto
se diseo un experimento de dos factores sin replicas para observar el tiempo en
segundos que demoraron para procesar 5 unidades cada uno de 4 operario con
cada una de las 5 maquinas, los resultados son los siguiente:
B1
B2
B3
B4

A1
15
10
11
9

A2
18
15
17
12

A3
4
10
10
8

A4
19
15
15
16

A5
16
11
12
12

Cree usted que son significativo los promedios de los tiempo del proceso
de las cinco maquinas?
Son significativo el promedio de los tiempos de proceso de los 4
operarios?

PRACTICA DIRIGIDA

27

1. El proyecto acadmico de un ingeniero es el diseo de un experimento a fin de


determinar el rendimiento de cuatro variedades de papa si tener en cuenta la
influencia de la fertilidad de la tierra de cultivo. las 20 parcelas de igual fertilidad que
le fueron asignados los divido en 4 grupos de 5 parcelas cada una. a cada grupo de
parcelas le asigno una variedad distinta de papas escogida al azar, resultando un
diseo completamente aleatorizado. los rendimientos medido en kilogramos de la
cinco variedades por parcelas son la siguientes:
V1
55
53
60
52
53
V2
52
58
50
60
52
V3
53
55
57
51
54
V4
52
50
51
49
53
Al nivel de significancia del 5% se puede inferir que existe diferencia significativa
entre las producciones media de las 4 variedades.
2. Para comparar el tiempo empleado en realizar una tarea especifica bajo tres
procedimientos un investigador diseo un experimento seleccionando al azar tres
muestra independiente de 10 operarios cada una y asigno al azar un procedimiento
a cada muestra. Los tiempos registrado en segundo son lo siguientes:
P1
13.45 19.10 20.73 23.60 13.45 23.29 14.93 17.07
P2
22.81 20.69 24.40 26.86 22.37 19.98 20.98 24.08
P2
18.92 21.32 25.93 19.07 20.98 26.40 28.04 23.44
Existe diferencia significativa entre los promedios de tiempo?

13.65
18.35
18.47

18.79
17.22
25.42

3. Una empresa de transporte terrestre va a adquirir una de 4 marcas de neumtico


que hay en el mercado. El ingeniero de pruebas de la empresa diseo un experimento
escogiendo al azar seis neumticos de cada marca de caracterstica similares. En el
laboratorio de prueba, con una carga especfica simulada, observo la duracin de
cada neumtico hasta que se deteriore. Los datos son los siguiente:
N1
55
53
50
60
55
65
N2
63
67
55
62
70
75
N3
48
50
59
50
47
61
N4
59
68
57
66
71
73
Indica estos datos que las marcas de los neumticos producen efectos significativo
en el rendimiento?
4. Un promotor inmobiliario est considerando invertir en un centro comercial a
construir en el sector medio de una capital del interior del pas. Se evala 4
ciudades: Arequipa, Iquitos, Piura y Trujillo, en donde es muy importante el nivel de
los ingresos mensuales de familia. Los ingresos mensuales en dlares son los
siguientes:
Arequipa:
710
560
490
550
480
Iquitos:
610
560
490
550
610
Piura:
560
610
470
510
580
Trujillo:
500
400
500
550
520
Producen efectos significativos en la variabilidad de los ingresos los niveles de factor
ciudad?
5.

El decano de FACI desea estudiar el nmero de horas que los alumnos de los ciclo
5, 6, 7 y 8 utilizan los terminales de cmputos de la universidad. Una muestra de
usos por ciclo ha dado los siguientes tiempos en horas mensuales:
C5:
35
33
30
40
C6:
43
47
35
35
C7:
28
30
39
30
C8:
39
48
37
46
Existe diferencia significativa en el tiempo segn el ciclo de estudio?

28

6. Una empresa textil realiza un estudio para determinar el mejor de tres mtodos de
montaje de una prenda especfica. Con este fin diseo un experimento para
comparar los tres mtodos seleccionado cinco operarios que se supone son de
velocidad homognea para reducir la variacin debido a los operarios, asignado a
cada operario los tres mtodos por tiempos iguales, el numero de prendas
terminadas por cada operario y con cada mtodo en el tiempo fijado se da en la tabla
que sigue:
M1
M2
M3
O1
3
9
5
O2
4
8
6
O3
3
7
8
O4
5
9
7
O5
4
6
9
Existe alguna diferencia significativa entre los mtodos de montaje de la prenda?
7. La empresa agroindustrial estudia el efecto de 4 clases de fertilizantes A, B, C, D
en el rendimiento de la produccin de arroz. Para esto diseo un experimento
dividiendo el terreno de cultivo entres bloques con cuatro parcelas homogneas
cada uno, asignando aleatoriamente los fertilizantes a cada uno de los bloques para
conseguir un diseo. Los resultados fueron los siguientes:
B1
C = 39.9
A = 40.1
B = 41.4
D = 42.1

B2
D = 43.4
B = 42.9
A = 42.2
C = 42.3

B3
B = 42.7
D = 42.8
C = 41.4
A = 42.9

Proporcionan estos datos suficiente evidencia de alguna diferencia significativa en


la media de los rendimientos de los fertilizantes?
8. Para evaluar 4 sistema de administracin de archivos se diseo un experimento con
4 operadores de procesamiento de palabras a quienes se le observo el tiempo
necesario, en minutos, para aprender como usar cada uno de los sistemas de
administracin de archivos. Los tiempos observados se dan en la siguiente tabla:
sistema de administracin de archivo
MATERIA
PRIMA

B1

390

402

392

385

B2

380

403

394

386

B3

377

411

399

380

B4

370

404

400

384

Existe alguna diferencia significativa en la media del tiempo debido al


sistema de administracin de archivo?
Existe alguita diferencia significativa en la media del tiempo debido a los
operadores?

9. El decano de estudio generales de ciencias quiere saber si son los niveles de


evaluacin de los cursos y el conocimiento de los alumnos que producen la
variabilidad en las notas finales que obtiene, para esto, se diseo un experimento de

29

dos factores sin replicas, escogiendo 4 alumnos al azar del tercer nivel que cursaron
las materias de matemticas, estadstica, fsica y lenguaje observando las
calificaciones los resultado estn en la siguiente tabla:
cursos
ALUMNOS

14

13

14

16

13

18

15

19

11

16

13

18

12

15

12

16

Podemos concluir que los cursos presenta la misma dificultad?


10. Una empresa quiere saber si las perdidas en porcentajes de produccin defectuosa
producida, depende de las lneas de produccin de los tipos de materia prima de su
proveedores para esto, el ingeniero a cargo del control, diseo un experimento de
dos factores sin replicas asignando a cada una de las 4 lneas de produccin una
de las cuatros materias primas por da. Los porcentajes de produccin estn en la
siguiente tabla:
Lnea de produccin
Operadores

2,3

2,5

3,2

3,2

2,8

2,7

3,5

3,8

3,2

3,1

3,7

3,9

3,6

3,8

4,2

4,5

Son significativamente diferentes los promedios


defectuosa debido a la lnea de produccin?

de porcentajes

de produccin

30

También podría gustarte