Analisis de Varianza

ANALISIS DE VARIANZA
(EXPERIMENTO DE UN FACTOR COMPLETAMENTE ALEATORIZADO)
1. INTRODUCCION
El análisis de varianza para experimentos diseñado, es una técnica estadística que
se aplica para comprobar si son iguales las medias de mas de dos poblaciones
independiente mediante la comparación de varianza insesgadas de muestra de
diversas fuentes, utilizando para el efecto la prueba F.
El anova trabaja con muestras pequeñas por esta razón se planifican
adecuadamente la recolección de datos.
La técnica estadística del análisis de varianza ha encontrado aplicación en casi toda
las disciplinas científicas y han llegado a convertirse en un tema muy amplio.
El termino factor (cualitativo) se da a cada una de las variables independiente que
involucra el problema de anova, relacionada con una variable dependiente o
variable respuesta (cuantitativa); los valores de un factor son denominado niveles o
tratamientos en el diseño anova.
La variable dependiente x podría estar asociada a dos factores, cada elemento de
muestra contenida en todas las combinaciones de los niveles de los dos factores
es una unidad experimental.
Los modelos se clasifican según el número de factores o variable independiente.
Experimento de un factor
 Completamente aleatorio
 Aleatorizado por bloques
Experimento de dos factores

 Sin replicas
 Con replicas
2. ANALISIS DE VARIANZA DE UN SOLO FACTOR DISEÑO COMPLETAMENTE

ALEATORIZADO.
En un diseño de experimento completamente aleatorio que se aplica para comparar
k tratamiento de un factor, los tratamientos se asignan al azar a las unidades
experimentales de la muestra, de manera que un tratamiento escogido al azar es
aplicado a una muestra, el siguiente tratamiento escogido al azar d lo que restan es
aplicado a otra muestra y así sucesivamente.
TRATAMIENTO DEL FACTOR A

1 2 3 4 5 TOTAL
TOTAL
MUESTRA
MEDIA
 Suma de los datos de la muestra i

 Suma total de los datos
 Numero de datos de la muestra i
 Numero total de datos
 Media de la muestra i
 Media general
38
MODELO DE CLASIFICACION SIMPLE
Modelo de efectos fijos

Este modelo es aplicable cuando se desea comparar las características dependiente
x bajo k tratamientos prefijado de interés. Las conclusiones serán validas solo para
esto k tratamientos
Modelo de efecto aleatorio

Se emplea cuando se tiene una gran población de tratamiento y por lo tanto resulta
poco practico compáralos a todos. En este caso se elige al azar solo k tratamientos
de la población y luego se infiere las conclusiones a toda la población de
tratamientos.
HIPOTESIS DEL MODELO DE CLASIFICACION
Modelo de efectos fijos: H 0 : U 1  U 2  .....  U K
Modelo de efecto aleatorio H 0 :  1   2  .....   K
ESTADISTICA DE PRUEBA
Sumas cuadradas
X ..2
SCT = SUMA DEL CUADRADO TOTAL SCT   X  2
ij
n
SCA = SUMA DE CUADRADO DE TRATAMIENTO SCA 

X 2
i.

X ..2
ni. n
SCA = SUMA DE CUADRADO DEL ERROR SCE = SCT - SCA
Medias cuadráticas
SCT SCA SCE

MCT  MCA  MCE 
n 1 k 1 nk
La estadística de prueba
MCA
F F (K – 1; n – k)
MCE
EJEMPLO 1
Un ingeniero va a decidir la compras de una de 4 maquinas de marcas diferentes
para su uso en una producción especifica. Por esto. Utilizo cada maquina al azar
para procesar 5 unidades del producto registrando los tiempo por unidad, en
segundos, resultando así el experimento completamente aleatorio. Los datos
observados son los siguientes:
M1: 55 46 45 73 50
M2: 60 58 68 58 63
M3: 64 62 51 57 65
M4: 42 45 52 44 42
Con un nivel de significancia del 5% pruebe la hipótesis que las maquinas utilizan
la misma velocidad media para procesar los productos.
EJEMPLO 2
39
Cuatro profesores cada uno con un grupo de alumnos, enseñan el mismo curso de
estadística, para evaluar las calificaciones por profesor de examen final se extrajeron
al azar una muestra de calificaciones de cada grupo, resultando los siguientes datos:
P1: 12 11 09 17 12
P2: 14 16 13 18 17
P3: 13 12 08 11 12
P4: 10 14 17 14 15
Al nivel de significancia del 5% ¿se puede concluir que existe diferencia significativas
en las calificaciones promedios obtenidas con los cuatros profesores?
3 COMPARACION MULTIPLE
Las comparaciones múltiples a posteriori que solo se aplica cuando el anova se
rechaza la hipótesis nula de igualdad global de medias, nos permite determinar que
medias difieren entre si. Existen hasta 12 métodos de comparación múltiple en esta
clase desarrollaremos un método.
Comparación múltiple de Bonferroni

El método de prueba de pares de media de denominada bonferroni, consiste en
probar la hipótesis de la igualdad de dos medias aplicando intervalo de estimación
de la diferencia de dos medias.
El objetivo del método es conseguir m intervalos de estimación con un nivel de
significancia, para esto desarrollamos uno de los m intervalos de estimación de la
diferencia de pares de medias con nivel de confianza.
1 1
LI  ( x i  x j )  t 0 MCE (  )
ni n j
1 1
LS  ( x i  x j )  t 0 MCE (  )
ni n j
t0  t 
1 ;n  k
2m
Si el intervalo tiene como limite inferior un número negativo y como limite superior un
número positivo entonces no existe diferencia entre dichas medias.
PRACTICA DIRIGIDA
40
1. El proyecto académico de un ingeniero es el diseño de un experimento a fin de
determinar el rendimiento de cuatro variedades de papa si tener en cuenta la
influencia de la fertilidad de la tierra de cultivo. las 20 parcelas de igual fertilidad que
le fueron asignados los divido en 4 grupos de 5 parcelas cada una. a cada grupo de
parcelas le asigno una variedad distinta de papas escogida al azar, resultando un
diseño completamente aleatorizado. los rendimientos medido en kilogramos de la
cinco variedades por parcelas son la siguientes:
V1 55 53 60 52 53
V2 52 58 50 60 52
V3 53 55 57 51 54
V4 52 50 51 49 53
Al nivel de significancia del 5% ¿se puede inferir que existe diferencia significativa
entre las producciones media de las 4 variedades.
2. Para comparar el tiempo empleado en realizar una tarea especifica bajo tres
procedimientos un investigador diseño un experimento seleccionando al azar tres
muestra independiente de 10 operarios cada una y asigno al azar un procedimiento
a cada muestra. Los tiempos registrado en segundo son lo siguientes:
P1 13.45 19.10 20.73 23.60 13.45 23.29 14.93 17.07 13.65 18.79
P2 22.81 20.69 24.40 26.86 22.37 19.98 20.98 24.08 18.35 17.22
P2 18.92 21.32 25.93 19.07 20.98 26.40 28.04 23.44 18.47 25.42
¿Existe diferencia significativa entre los promedios de tiempo?
3. Una empresa de transporte terrestre va a adquirir una de 4 marcas de neumático

que hay en el mercado. El ingeniero de pruebas de la empresa diseño un experimento
escogiendo al azar seis neumáticos de cada marca de característica similares. En el
laboratorio de prueba, con una carga específica simulada, observo la duración de
cada neumático hasta que se deteriore. Los datos son los siguiente:
N1 55 53 50 60 55 65
N2 63 67 55 62 70 75
N3 48 50 59 50 47 61
N4 59 68 57 66 71 73
¿Indica estos datos que las marcas de los neumáticos producen efectos significativo
en el rendimiento?
4. Un promotor inmobiliario está considerando invertir en un centro comercial a

construir en el sector medio de una capital del interior del país. Se evalúa 4
ciudades: Arequipa, Iquitos, Piura y Trujillo, en donde es muy importante el nivel de
los ingresos mensuales de familia. Los ingresos mensuales en dólares son los
siguientes:
Arequipa: 710 560 490 550 480

Iquitos: 610 560 490 550 610
Piura: 560 610 470 510 580
Trujillo: 500 400 500 550 520
¿Producen efectos significativos en la variabilidad de los ingresos los niveles de factor

ciudad?
5. El decano de FACI desea estudiar el número de horas que los alumnos de los ciclo
5, 6, 7 y 8 utilizan los terminales de cómputos de la universidad. Una muestra de
usos por ciclo ha dado los siguientes tiempos en horas mensuales:
41
C5: 35 33 30 40
C6: 43 47 35 35
C7: 28 30 39 30
C8: 39 48 37 46
¿Existe diferencia significativa en el tiempo según el ciclo de estudio?
ANALISIS DE VARIANZA
1. ANALISIS DE VARIANZA DE UN FACTOR DISEÑOS POR BLOQUES

ALEATORIZADOS
En el diseño de un experimento estadístico aleatorizados por bloques, el objetivo es
comparar los efectos de k niveles de un factor en la variabilidad de la variable
dependiente x cuando se cree que existe una fuente extraña no evitable de
variabilidad adicional de r bloques es decir, se trata de determinar si existe
diferencias significativas en el valor medio de la variable dependiente bajo los k
tratamientos del factor A, pero controlando mediante bloques la fuente extraña de
variabilidad. Los bloques no son considerados como otro factor.
Los k tratamientos se asignan al azar a las unidades experimentales dentro de cada
bloque asignándose un tratamiento a una unidad experimental.
TRATAMIENTO DEL FACTOR A

TOTAL DE MEDIA DE
BLOQUES 1 2 3 4 5 BLOQUES BLOQUES
B1
B2
B3
B4
B5
B6
TOTAL
MUESTRA
MEDIA
 Suma total por tratamiento

 Media de cada tratamiento
 Suma total por bloques
 Media de cada bloque
 Suma total
 Media general
MODELO
El modelo de análisis de varianza de un factor aleatorizado por bloques es la
ecuación lineal: x ij  u   i   j   ij
 Media general
 Efecto del i enésimo tratamiento
 Efecto del j enésimo bloque
 Error aleatorio
HIPOTESIS
Se quiere probar si existe diferencia significativa en el valor medio de la variable
dependiente x bajo k tratamientos del factor A, esto es se quiere probar la hipótesis
nula
42
H 0 : U 1 .  U 2.  .....  U K .
Solo si es importante comprobar que el diseño por bloques ha sido el adecuado para
la experimentación, podemos determinar si hay diferencia significativa entre las
medias poblacionales de los r bloques
H 0 : U .1.  U . 2.  .....  U . K .
ESTADISTICA DE PRUEBA
Sumas cuadradas
X ..2
SCT = SUMA DEL CUADRADO TOTAL SCT   X ij2 
n
SCA = SUMA DE CUADRADO DE TRATAMIENTO SCA 

X 2
i.

X ..2
ri. n
SCB = SUMA DE CUADRADO DE BLOQUE SCB 

X 2
.j

X ..2
k n
SCA = SUMA DE CUADRADO DEL ERROR SCE = SCT – SCA - SCB
Medias cuadráticas
SCA SCB SCE

MCA  MCB  MCE 
k 1 r 1 (r  1)(k  1)
La estadística de prueba
MCA
FA  F ((K – 1;(r-1)(k-1))
MCE
MCB
FB  F ((r – 1;(r-1)(k-1))
MCE
EJEMPLO 1
Se realizo un estudio para comparar el rendimiento de cinco variedades de arroz.
Para el experimento, se disponía de cuatro lugares de siembra de igual tamaño y
fertilidad en san martín. Cada lugar fue dividido en cinco parcelas iguales y se
sembró las cinco variedades de arroz en la cinco parcelas de cada lugar, asignando
43
aleatoriamente una variedad a una parcelas, consiguiendo así, un diseño
experimental aleatorizado por bloques.
Se registraron los siguientes rendimientos en ciento de kilogramos:
Lugar 1: 15 12 13 16 11
Lugar 2: 8 7 7 12 12
Lugar 3: 7 14 12 8 8
Lugar 4: 13 7 6 6 10
 Es valida la conclusión de que no existe diferencia significativa en los

rendimientos de las cinco variedades de arroz
 Fue este diseño por bloques el adecuado para la experimentación.
4. ANALISIS DE VARIANZA DE DOS FACTORES

En el análisis de varianza con dos criterios de clasificación los datos de la muestra
son clasificados por medio de un arreglo rectangular en el cual las columnas
representan los niveles del factor A y las filas los niveles del factor B, cada
combinación de la fila y de la columna definen una celda en el arreglo.
El diseño de los experimentos con dos factores se clasifica según el número de
observaciones en las celdas. Si cada celda contiene una sola observaron de la
muestra, el modelo se denomina sin replica. En cambio si cada celda contiene dos o
más observaciones el modelo se denomina con replicas.
La tabla ANOVA y el proceso de prueba para este modelo son exactamente los
mismo al del modelo de clasificación de un factor aleatorizado por bloques, en vez
de bloques se tiene el segundo factor.
EJEMPLO 2
Una empresa de producción estudia la influencia que tiene la velocidad de las
máquinas y la velocidad de los operarios en su proceso de producción. Para esto
se diseñó un experimento de dos factores sin replicas para observar el tiempo en
segundos que demoraron para procesar 5 unidades cada uno de 4 operario con
cada una de las 5 máquinas, los resultados son los siguiente:
A1 A2 A3 A4 A5
B1 15 18 4 19 16
B2 10 15 10 15 11
B3 11 17 10 15 12
B4 9 12 8 16 12
 ¿Cree usted que son significativo los promedios de los tiempo del proceso
de las cinco maquinas?
 ¿Son significativo el promedio de los tiempos de proceso de los 4
operarios?
PRACTICA DIRIGIDA
6. Una empresa textil realiza un estudio para determinar el mejor de tres métodos de
montaje de una prenda específica. Con este fin diseño un experimento para
44
comparar los tres métodos seleccionado cinco operarios que se supone son de
velocidad homogénea para reducir la variación debido a los operarios, asignado a
cada operario los tres métodos por tiempos iguales, el número de prendas
terminadas por cada operario y con cada método en el tiempo fijado se da en la tabla
que sigue:
M1 M2 M3
O1 3 9 5
O2 4 8 6
O3 3 7 8
O4 5 9 7
O5 4 6 9
¿Existe alguna diferencia significativa entre los métodos de montaje de la prenda?
7. La empresa agroindustrial estudia el efecto de 4 clases de fertilizantes A, B, C, D

en el rendimiento de la producción de arroz. Para esto diseño un experimento
dividiendo el terreno de cultivo entre bloques con cuatro parcelas homogéneas
cada uno, asignando aleatoriamente los fertilizantes a cada uno de los bloques para
conseguir un diseño. Los resultados fueron los siguientes:
B1 B2 B3
C = 39.9 D = 43.4 B = 42.7
A = 40.1 B = 42.9 D = 42.8
B = 41.4 A = 42.2 C = 41.4
D = 42.1 C = 42.3 A = 42.9
¿Proporcionan estos datos suficiente evidencia de alguna diferencia significativa en

la media de los rendimientos de los fertilizantes?
8. Para evaluar 4 sistema de administración de archivos se diseñó un experimento con

4 operadores de procesamiento de palabras a quienes se le observo el tiempo
necesario, en minutos, para aprender cómo usar cada uno de los sistemas de
administración de archivos. Los tiempos observados se dan en la siguiente tabla:
sistema de administración de archivo

MATERIA
PRIMA 1 2 3 4
B1 390 402 392 385
B2 380 403 394 386
B3 377 411 399 380
B4 370 404 400 384
 ¿Existe alguna diferencia significativa en la media del tiempo debido al

sistema de administración de archivo?
 ¿Existe alguita diferencia significativa en la media del tiempo debido a los
operadores?
9. El decano de estudio generales de ciencias quiere saber si son los niveles de

evaluación de los cursos y el conocimiento de los alumnos que producen la
variabilidad en las notas finales que obtiene, para esto, se diseñó un experimento de
dos factores sin replicas, escogiendo 4 alumnos al azar del tercer nivel que cursaron
45
las materias de matemáticas, estadística, física y lenguaje observando las
calificaciones los resultado están en la siguiente tabla:
cursos
ALUMNOS M F L E
1 14 13 14 16
2 13 18 15 19
3 11 16 13 18
4 12 15 12 16
¿Podemos concluir que los cursos presenta la misma dificultad?
10. Una empresa quiere saber si las perdidas en porcentajes de producción defectuosa
producida, depende de las líneas de producción de los tipos de materia prima de su
proveedores para esto, el ingeniero a cargo del control, diseño un experimento de
dos factores sin replicas asignando a cada una de las 4 líneas de producción una
de las cuatros materias primas por día. Los porcentajes de producción están en la
siguiente tabla:
Línea de producción
Operadores 1 2 3 4
1 2,3 2,5 3,2 3,2
2 2,8 2,7 3,5 3,8
3 3,2 3,1 3,7 3,9
4 3,6 3,8 4,2 4,5
¿Son significativamente diferentes los promedios de porcentajes de producción

defectuosa debido a la línea de producción?
LENGUAJE DE PROGRAMACION R
I. IMPLEMENTANDO Rcmdr
 Hacer clic en Packages
 Hacer clic en Usa (1)
 Hacer clic en Rcmdr
 Escribir library (Rcmdr)
 Seleccionar el archivo de dato
 Seleccionar estadístico
 Seleccionar media - anova
46

Analisis de Varianza

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Analisis de Varianza

Cargado por

Copyright:

Formatos disponibles

ANALISIS DE VARIANZA

(EXPERIMENTO DE UN FACTOR COMPLETAMENTE ALEATORIZADO)

Experimento de dos factores

2. ANALISIS DE VARIANZA DE UN SOLO FACTOR DISEÑO COMPLETAMENTE

TRATAMIENTO DEL FACTOR A

 Suma de los datos de la muestra i

Modelo de efectos fijos

Modelo de efecto aleatorio

HIPOTESIS DEL MODELO DE CLASIFICACION

Modelo de efectos fijos: H 0 : U 1  U 2  .....  U K

Modelo de efecto aleatorio H 0 :  1   2  .....   K

SCA = SUMA DE CUADRADO DE TRATAMIENTO SCA 

SCA = SUMA DE CUADRADO DEL ERROR SCE = SCT - SCA

SCT SCA SCE

Comparación múltiple de Bonferroni

¿Existe diferencia significativa entre los promedios de tiempo?

3. Una empresa de transporte terrestre va a adquirir una de 4 marcas de neumático

4. Un promotor inmobiliario está considerando invertir en un centro comercial a

Arequipa: 710 560 490 550 480

¿Producen efectos significativos en la variabilidad de los ingresos los niveles de factor

¿Existe diferencia significativa en el tiempo según el ciclo de estudio?

1. ANALISIS DE VARIANZA DE UN FACTOR DISEÑOS POR BLOQUES

TRATAMIENTO DEL FACTOR A

 Suma total por tratamiento

SCA = SUMA DE CUADRADO DE TRATAMIENTO SCA 

SCB = SUMA DE CUADRADO DE BLOQUE SCB 

SCA = SUMA DE CUADRADO DEL ERROR SCE = SCT – SCA - SCB

SCA SCB SCE

 Es valida la conclusión de que no existe diferencia significativa en los

4. ANALISIS DE VARIANZA DE DOS FACTORES

¿Existe alguna diferencia significativa entre los métodos de montaje de la prenda?

7. La empresa agroindustrial estudia el efecto de 4 clases de fertilizantes A, B, C, D

¿Proporcionan estos datos suficiente evidencia de alguna diferencia significativa en

8. Para evaluar 4 sistema de administración de archivos se diseñó un experimento con

sistema de administración de archivo

 ¿Existe alguna diferencia significativa en la media del tiempo debido al

9. El decano de estudio generales de ciencias quiere saber si son los niveles de

¿Podemos concluir que los cursos presenta la misma dificultad?

¿Son significativamente diferentes los promedios de porcentajes de producción

También podría gustarte