Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. INTRODUCCION
El análisis de varianza para experimentos diseñado, es una técnica estadística que
se aplica para comprobar si son iguales las medias de mas de dos poblaciones
independiente mediante la comparación de varianza insesgadas de muestra de
diversas fuentes, utilizando para el efecto la prueba F.
El anova trabaja con muestras pequeñas por esta razón se planifican
adecuadamente la recolección de datos.
La técnica estadística del análisis de varianza ha encontrado aplicación en casi toda
las disciplinas científicas y han llegado a convertirse en un tema muy amplio.
El termino factor (cualitativo) se da a cada una de las variables independiente que
involucra el problema de anova, relacionada con una variable dependiente o
variable respuesta (cuantitativa); los valores de un factor son denominado niveles o
tratamientos en el diseño anova.
La variable dependiente x podría estar asociada a dos factores, cada elemento de
muestra contenida en todas las combinaciones de los niveles de los dos factores
es una unidad experimental.
Los modelos se clasifican según el número de factores o variable independiente.
Experimento de un factor
Completamente aleatorio
Aleatorizado por bloques
TOTAL
MUESTRA
MEDIA
38
MODELO DE CLASIFICACION SIMPLE
ESTADISTICA DE PRUEBA
Sumas cuadradas
X ..2
SCT = SUMA DEL CUADRADO TOTAL SCT X 2
ij
n
Medias cuadráticas
La estadística de prueba
MCA
F F (K – 1; n – k)
MCE
EJEMPLO 1
Un ingeniero va a decidir la compras de una de 4 maquinas de marcas diferentes
para su uso en una producción especifica. Por esto. Utilizo cada maquina al azar
para procesar 5 unidades del producto registrando los tiempo por unidad, en
segundos, resultando así el experimento completamente aleatorio. Los datos
observados son los siguientes:
M1: 55 46 45 73 50
M2: 60 58 68 58 63
M3: 64 62 51 57 65
M4: 42 45 52 44 42
Con un nivel de significancia del 5% pruebe la hipótesis que las maquinas utilizan
la misma velocidad media para procesar los productos.
EJEMPLO 2
39
Cuatro profesores cada uno con un grupo de alumnos, enseñan el mismo curso de
estadística, para evaluar las calificaciones por profesor de examen final se extrajeron
al azar una muestra de calificaciones de cada grupo, resultando los siguientes datos:
P1: 12 11 09 17 12
P2: 14 16 13 18 17
P3: 13 12 08 11 12
P4: 10 14 17 14 15
Al nivel de significancia del 5% ¿se puede concluir que existe diferencia significativas
en las calificaciones promedios obtenidas con los cuatros profesores?
3 COMPARACION MULTIPLE
Las comparaciones múltiples a posteriori que solo se aplica cuando el anova se
rechaza la hipótesis nula de igualdad global de medias, nos permite determinar que
medias difieren entre si. Existen hasta 12 métodos de comparación múltiple en esta
clase desarrollaremos un método.
1 1
LI ( x i x j ) t 0 MCE ( )
ni n j
1 1
LS ( x i x j ) t 0 MCE ( )
ni n j
t0 t
1 ;n k
2m
Si el intervalo tiene como limite inferior un número negativo y como limite superior un
número positivo entonces no existe diferencia entre dichas medias.
PRACTICA DIRIGIDA
40
1. El proyecto académico de un ingeniero es el diseño de un experimento a fin de
determinar el rendimiento de cuatro variedades de papa si tener en cuenta la
influencia de la fertilidad de la tierra de cultivo. las 20 parcelas de igual fertilidad que
le fueron asignados los divido en 4 grupos de 5 parcelas cada una. a cada grupo de
parcelas le asigno una variedad distinta de papas escogida al azar, resultando un
diseño completamente aleatorizado. los rendimientos medido en kilogramos de la
cinco variedades por parcelas son la siguientes:
V1 55 53 60 52 53
V2 52 58 50 60 52
V3 53 55 57 51 54
V4 52 50 51 49 53
Al nivel de significancia del 5% ¿se puede inferir que existe diferencia significativa
entre las producciones media de las 4 variedades.
2. Para comparar el tiempo empleado en realizar una tarea especifica bajo tres
procedimientos un investigador diseño un experimento seleccionando al azar tres
muestra independiente de 10 operarios cada una y asigno al azar un procedimiento
a cada muestra. Los tiempos registrado en segundo son lo siguientes:
P1 13.45 19.10 20.73 23.60 13.45 23.29 14.93 17.07 13.65 18.79
P2 22.81 20.69 24.40 26.86 22.37 19.98 20.98 24.08 18.35 17.22
P2 18.92 21.32 25.93 19.07 20.98 26.40 28.04 23.44 18.47 25.42
N1 55 53 50 60 55 65
N2 63 67 55 62 70 75
N3 48 50 59 50 47 61
N4 59 68 57 66 71 73
¿Indica estos datos que las marcas de los neumáticos producen efectos significativo
en el rendimiento?
5. El decano de FACI desea estudiar el número de horas que los alumnos de los ciclo
5, 6, 7 y 8 utilizan los terminales de cómputos de la universidad. Una muestra de
usos por ciclo ha dado los siguientes tiempos en horas mensuales:
41
C5: 35 33 30 40
C6: 43 47 35 35
C7: 28 30 39 30
C8: 39 48 37 46
ANALISIS DE VARIANZA
MODELO
El modelo de análisis de varianza de un factor aleatorizado por bloques es la
ecuación lineal: x ij u i j ij
Media general
Efecto del i enésimo tratamiento
Efecto del j enésimo bloque
Error aleatorio
HIPOTESIS
Se quiere probar si existe diferencia significativa en el valor medio de la variable
dependiente x bajo k tratamientos del factor A, esto es se quiere probar la hipótesis
nula
42
H 0 : U 1 . U 2. ..... U K .
Solo si es importante comprobar que el diseño por bloques ha sido el adecuado para
la experimentación, podemos determinar si hay diferencia significativa entre las
medias poblacionales de los r bloques
H 0 : U .1. U . 2. ..... U . K .
ESTADISTICA DE PRUEBA
Sumas cuadradas
X ..2
SCT = SUMA DEL CUADRADO TOTAL SCT X ij2
n
Medias cuadráticas
La estadística de prueba
MCA
FA F ((K – 1;(r-1)(k-1))
MCE
MCB
FB F ((r – 1;(r-1)(k-1))
MCE
EJEMPLO 1
Se realizo un estudio para comparar el rendimiento de cinco variedades de arroz.
Para el experimento, se disponía de cuatro lugares de siembra de igual tamaño y
fertilidad en san martín. Cada lugar fue dividido en cinco parcelas iguales y se
sembró las cinco variedades de arroz en la cinco parcelas de cada lugar, asignando
43
aleatoriamente una variedad a una parcelas, consiguiendo así, un diseño
experimental aleatorizado por bloques.
Se registraron los siguientes rendimientos en ciento de kilogramos:
Lugar 1: 15 12 13 16 11
Lugar 2: 8 7 7 12 12
Lugar 3: 7 14 12 8 8
Lugar 4: 13 7 6 6 10
EJEMPLO 2
Una empresa de producción estudia la influencia que tiene la velocidad de las
máquinas y la velocidad de los operarios en su proceso de producción. Para esto
se diseñó un experimento de dos factores sin replicas para observar el tiempo en
segundos que demoraron para procesar 5 unidades cada uno de 4 operario con
cada una de las 5 máquinas, los resultados son los siguiente:
A1 A2 A3 A4 A5
B1 15 18 4 19 16
B2 10 15 10 15 11
B3 11 17 10 15 12
B4 9 12 8 16 12
¿Cree usted que son significativo los promedios de los tiempo del proceso
de las cinco maquinas?
¿Son significativo el promedio de los tiempos de proceso de los 4
operarios?
PRACTICA DIRIGIDA
6. Una empresa textil realiza un estudio para determinar el mejor de tres métodos de
montaje de una prenda específica. Con este fin diseño un experimento para
44
comparar los tres métodos seleccionado cinco operarios que se supone son de
velocidad homogénea para reducir la variación debido a los operarios, asignado a
cada operario los tres métodos por tiempos iguales, el número de prendas
terminadas por cada operario y con cada método en el tiempo fijado se da en la tabla
que sigue:
M1 M2 M3
O1 3 9 5
O2 4 8 6
O3 3 7 8
O4 5 9 7
O5 4 6 9
B1 B2 B3
C = 39.9 D = 43.4 B = 42.7
A = 40.1 B = 42.9 D = 42.8
B = 41.4 A = 42.2 C = 41.4
D = 42.1 C = 42.3 A = 42.9
45
las materias de matemáticas, estadística, física y lenguaje observando las
calificaciones los resultado están en la siguiente tabla:
cursos
ALUMNOS M F L E
1 14 13 14 16
2 13 18 15 19
3 11 16 13 18
4 12 15 12 16
10. Una empresa quiere saber si las perdidas en porcentajes de producción defectuosa
producida, depende de las líneas de producción de los tipos de materia prima de su
proveedores para esto, el ingeniero a cargo del control, diseño un experimento de
dos factores sin replicas asignando a cada una de las 4 líneas de producción una
de las cuatros materias primas por día. Los porcentajes de producción están en la
siguiente tabla:
Línea de producción
Operadores 1 2 3 4
1 2,3 2,5 3,2 3,2
2 2,8 2,7 3,5 3,8
3 3,2 3,1 3,7 3,9
4 3,6 3,8 4,2 4,5
LENGUAJE DE PROGRAMACION R
I. IMPLEMENTANDO Rcmdr
Hacer clic en Packages
Hacer clic en Usa (1)
Hacer clic en Rcmdr
Escribir library (Rcmdr)
Seleccionar el archivo de dato
Seleccionar estadístico
Seleccionar media - anova
46