Está en la página 1de 9

ANALISIS DE VARIANZA

(EXPERIMENTO DE UN FACTOR COMPLETAMENTE ALEATORIZADO)

1. INTRODUCCION
El análisis de varianza para experimentos diseñado, es una técnica estadística que
se aplica para comprobar si son iguales las medias de mas de dos poblaciones
independiente mediante la comparación de varianza insesgadas de muestra de
diversas fuentes, utilizando para el efecto la prueba F.
El anova trabaja con muestras pequeñas por esta razón se planifican
adecuadamente la recolección de datos.
La técnica estadística del análisis de varianza ha encontrado aplicación en casi toda
las disciplinas científicas y han llegado a convertirse en un tema muy amplio.
El termino factor (cualitativo) se da a cada una de las variables independiente que
involucra el problema de anova, relacionada con una variable dependiente o
variable respuesta (cuantitativa); los valores de un factor son denominado niveles o
tratamientos en el diseño anova.
La variable dependiente x podría estar asociada a dos factores, cada elemento de
muestra contenida en todas las combinaciones de los niveles de los dos factores
es una unidad experimental.
Los modelos se clasifican según el número de factores o variable independiente.

Experimento de un factor
 Completamente aleatorio
 Aleatorizado por bloques

Experimento de dos factores


 Sin replicas
 Con replicas

2. ANALISIS DE VARIANZA DE UN SOLO FACTOR DISEÑO COMPLETAMENTE


ALEATORIZADO.
En un diseño de experimento completamente aleatorio que se aplica para comparar
k tratamiento de un factor, los tratamientos se asignan al azar a las unidades
experimentales de la muestra, de manera que un tratamiento escogido al azar es
aplicado a una muestra, el siguiente tratamiento escogido al azar d lo que restan es
aplicado a otra muestra y así sucesivamente.

TRATAMIENTO DEL FACTOR A


1 2 3 4 5 TOTAL

TOTAL
MUESTRA
MEDIA

 Suma de los datos de la muestra i


 Suma total de los datos
 Numero de datos de la muestra i
 Numero total de datos
 Media de la muestra i
 Media general

38
MODELO DE CLASIFICACION SIMPLE

Modelo de efectos fijos


Este modelo es aplicable cuando se desea comparar las características dependiente
x bajo k tratamientos prefijado de interés. Las conclusiones serán validas solo para
esto k tratamientos

Modelo de efecto aleatorio


Se emplea cuando se tiene una gran población de tratamiento y por lo tanto resulta
poco practico compáralos a todos. En este caso se elige al azar solo k tratamientos
de la población y luego se infiere las conclusiones a toda la población de
tratamientos.

HIPOTESIS DEL MODELO DE CLASIFICACION

Modelo de efectos fijos: H 0 : U 1  U 2  .....  U K

Modelo de efecto aleatorio H 0 :  1   2  .....   K

ESTADISTICA DE PRUEBA

Sumas cuadradas

X ..2
SCT = SUMA DEL CUADRADO TOTAL SCT   X  2
ij
n

SCA = SUMA DE CUADRADO DE TRATAMIENTO SCA 


X 2
i.

X ..2
ni. n

SCA = SUMA DE CUADRADO DEL ERROR SCE = SCT - SCA

Medias cuadráticas

SCT SCA SCE


MCT  MCA  MCE 
n 1 k 1 nk

La estadística de prueba

MCA
F F (K – 1; n – k)
MCE

EJEMPLO 1
Un ingeniero va a decidir la compras de una de 4 maquinas de marcas diferentes
para su uso en una producción especifica. Por esto. Utilizo cada maquina al azar
para procesar 5 unidades del producto registrando los tiempo por unidad, en
segundos, resultando así el experimento completamente aleatorio. Los datos
observados son los siguientes:

M1: 55 46 45 73 50
M2: 60 58 68 58 63
M3: 64 62 51 57 65
M4: 42 45 52 44 42

Con un nivel de significancia del 5% pruebe la hipótesis que las maquinas utilizan
la misma velocidad media para procesar los productos.
EJEMPLO 2

39
Cuatro profesores cada uno con un grupo de alumnos, enseñan el mismo curso de
estadística, para evaluar las calificaciones por profesor de examen final se extrajeron
al azar una muestra de calificaciones de cada grupo, resultando los siguientes datos:

P1: 12 11 09 17 12
P2: 14 16 13 18 17
P3: 13 12 08 11 12
P4: 10 14 17 14 15

Al nivel de significancia del 5% ¿se puede concluir que existe diferencia significativas
en las calificaciones promedios obtenidas con los cuatros profesores?

3 COMPARACION MULTIPLE
Las comparaciones múltiples a posteriori que solo se aplica cuando el anova se
rechaza la hipótesis nula de igualdad global de medias, nos permite determinar que
medias difieren entre si. Existen hasta 12 métodos de comparación múltiple en esta
clase desarrollaremos un método.

Comparación múltiple de Bonferroni


El método de prueba de pares de media de denominada bonferroni, consiste en
probar la hipótesis de la igualdad de dos medias aplicando intervalo de estimación
de la diferencia de dos medias.
El objetivo del método es conseguir m intervalos de estimación con un nivel de
significancia, para esto desarrollamos uno de los m intervalos de estimación de la
diferencia de pares de medias con nivel de confianza.

1 1
LI  ( x i  x j )  t 0 MCE (  )
ni n j

1 1
LS  ( x i  x j )  t 0 MCE (  )
ni n j

t0  t 
1 ;n  k
2m

Si el intervalo tiene como limite inferior un número negativo y como limite superior un
número positivo entonces no existe diferencia entre dichas medias.

PRACTICA DIRIGIDA

40
1. El proyecto académico de un ingeniero es el diseño de un experimento a fin de
determinar el rendimiento de cuatro variedades de papa si tener en cuenta la
influencia de la fertilidad de la tierra de cultivo. las 20 parcelas de igual fertilidad que
le fueron asignados los divido en 4 grupos de 5 parcelas cada una. a cada grupo de
parcelas le asigno una variedad distinta de papas escogida al azar, resultando un
diseño completamente aleatorizado. los rendimientos medido en kilogramos de la
cinco variedades por parcelas son la siguientes:

V1 55 53 60 52 53
V2 52 58 50 60 52
V3 53 55 57 51 54
V4 52 50 51 49 53

Al nivel de significancia del 5% ¿se puede inferir que existe diferencia significativa
entre las producciones media de las 4 variedades.

2. Para comparar el tiempo empleado en realizar una tarea especifica bajo tres
procedimientos un investigador diseño un experimento seleccionando al azar tres
muestra independiente de 10 operarios cada una y asigno al azar un procedimiento
a cada muestra. Los tiempos registrado en segundo son lo siguientes:

P1 13.45 19.10 20.73 23.60 13.45 23.29 14.93 17.07 13.65 18.79
P2 22.81 20.69 24.40 26.86 22.37 19.98 20.98 24.08 18.35 17.22
P2 18.92 21.32 25.93 19.07 20.98 26.40 28.04 23.44 18.47 25.42

¿Existe diferencia significativa entre los promedios de tiempo?

3. Una empresa de transporte terrestre va a adquirir una de 4 marcas de neumático


que hay en el mercado. El ingeniero de pruebas de la empresa diseño un experimento
escogiendo al azar seis neumáticos de cada marca de característica similares. En el
laboratorio de prueba, con una carga específica simulada, observo la duración de
cada neumático hasta que se deteriore. Los datos son los siguiente:

N1 55 53 50 60 55 65
N2 63 67 55 62 70 75
N3 48 50 59 50 47 61
N4 59 68 57 66 71 73

¿Indica estos datos que las marcas de los neumáticos producen efectos significativo
en el rendimiento?

4. Un promotor inmobiliario está considerando invertir en un centro comercial a


construir en el sector medio de una capital del interior del país. Se evalúa 4
ciudades: Arequipa, Iquitos, Piura y Trujillo, en donde es muy importante el nivel de
los ingresos mensuales de familia. Los ingresos mensuales en dólares son los
siguientes:

Arequipa: 710 560 490 550 480


Iquitos: 610 560 490 550 610
Piura: 560 610 470 510 580
Trujillo: 500 400 500 550 520

¿Producen efectos significativos en la variabilidad de los ingresos los niveles de factor


ciudad?

5. El decano de FACI desea estudiar el número de horas que los alumnos de los ciclo
5, 6, 7 y 8 utilizan los terminales de cómputos de la universidad. Una muestra de
usos por ciclo ha dado los siguientes tiempos en horas mensuales:

41
C5: 35 33 30 40
C6: 43 47 35 35
C7: 28 30 39 30
C8: 39 48 37 46

¿Existe diferencia significativa en el tiempo según el ciclo de estudio?

ANALISIS DE VARIANZA

1. ANALISIS DE VARIANZA DE UN FACTOR DISEÑOS POR BLOQUES


ALEATORIZADOS
En el diseño de un experimento estadístico aleatorizados por bloques, el objetivo es
comparar los efectos de k niveles de un factor en la variabilidad de la variable
dependiente x cuando se cree que existe una fuente extraña no evitable de
variabilidad adicional de r bloques es decir, se trata de determinar si existe
diferencias significativas en el valor medio de la variable dependiente bajo los k
tratamientos del factor A, pero controlando mediante bloques la fuente extraña de
variabilidad. Los bloques no son considerados como otro factor.
Los k tratamientos se asignan al azar a las unidades experimentales dentro de cada
bloque asignándose un tratamiento a una unidad experimental.

TRATAMIENTO DEL FACTOR A


TOTAL DE MEDIA DE
BLOQUES 1 2 3 4 5 BLOQUES BLOQUES
B1
B2
B3
B4
B5
B6
TOTAL
MUESTRA
MEDIA

 Suma total por tratamiento


 Media de cada tratamiento
 Suma total por bloques
 Media de cada bloque
 Suma total
 Media general

MODELO
El modelo de análisis de varianza de un factor aleatorizado por bloques es la
ecuación lineal: x ij  u   i   j   ij

 Media general
 Efecto del i enésimo tratamiento
 Efecto del j enésimo bloque
 Error aleatorio
HIPOTESIS
Se quiere probar si existe diferencia significativa en el valor medio de la variable
dependiente x bajo k tratamientos del factor A, esto es se quiere probar la hipótesis
nula

42
H 0 : U 1 .  U 2.  .....  U K .

Solo si es importante comprobar que el diseño por bloques ha sido el adecuado para
la experimentación, podemos determinar si hay diferencia significativa entre las
medias poblacionales de los r bloques

H 0 : U .1.  U . 2.  .....  U . K .

ESTADISTICA DE PRUEBA

Sumas cuadradas

X ..2
SCT = SUMA DEL CUADRADO TOTAL SCT   X ij2 
n

SCA = SUMA DE CUADRADO DE TRATAMIENTO SCA 


X 2
i.

X ..2
ri. n

SCB = SUMA DE CUADRADO DE BLOQUE SCB 


X 2
.j

X ..2
k n

SCA = SUMA DE CUADRADO DEL ERROR SCE = SCT – SCA - SCB

Medias cuadráticas

SCA SCB SCE


MCA  MCB  MCE 
k 1 r 1 (r  1)(k  1)

La estadística de prueba

MCA
FA  F ((K – 1;(r-1)(k-1))
MCE

MCB
FB  F ((r – 1;(r-1)(k-1))
MCE

EJEMPLO 1
Se realizo un estudio para comparar el rendimiento de cinco variedades de arroz.
Para el experimento, se disponía de cuatro lugares de siembra de igual tamaño y
fertilidad en san martín. Cada lugar fue dividido en cinco parcelas iguales y se
sembró las cinco variedades de arroz en la cinco parcelas de cada lugar, asignando

43
aleatoriamente una variedad a una parcelas, consiguiendo así, un diseño
experimental aleatorizado por bloques.
Se registraron los siguientes rendimientos en ciento de kilogramos:

Lugar 1: 15 12 13 16 11
Lugar 2: 8 7 7 12 12
Lugar 3: 7 14 12 8 8
Lugar 4: 13 7 6 6 10

 Es valida la conclusión de que no existe diferencia significativa en los


rendimientos de las cinco variedades de arroz
 Fue este diseño por bloques el adecuado para la experimentación.

4. ANALISIS DE VARIANZA DE DOS FACTORES


En el análisis de varianza con dos criterios de clasificación los datos de la muestra
son clasificados por medio de un arreglo rectangular en el cual las columnas
representan los niveles del factor A y las filas los niveles del factor B, cada
combinación de la fila y de la columna definen una celda en el arreglo.
El diseño de los experimentos con dos factores se clasifica según el número de
observaciones en las celdas. Si cada celda contiene una sola observaron de la
muestra, el modelo se denomina sin replica. En cambio si cada celda contiene dos o
más observaciones el modelo se denomina con replicas.
La tabla ANOVA y el proceso de prueba para este modelo son exactamente los
mismo al del modelo de clasificación de un factor aleatorizado por bloques, en vez
de bloques se tiene el segundo factor.

EJEMPLO 2
Una empresa de producción estudia la influencia que tiene la velocidad de las
máquinas y la velocidad de los operarios en su proceso de producción. Para esto
se diseñó un experimento de dos factores sin replicas para observar el tiempo en
segundos que demoraron para procesar 5 unidades cada uno de 4 operario con
cada una de las 5 máquinas, los resultados son los siguiente:

A1 A2 A3 A4 A5
B1 15 18 4 19 16
B2 10 15 10 15 11
B3 11 17 10 15 12
B4 9 12 8 16 12

 ¿Cree usted que son significativo los promedios de los tiempo del proceso
de las cinco maquinas?
 ¿Son significativo el promedio de los tiempos de proceso de los 4
operarios?

PRACTICA DIRIGIDA

6. Una empresa textil realiza un estudio para determinar el mejor de tres métodos de
montaje de una prenda específica. Con este fin diseño un experimento para

44
comparar los tres métodos seleccionado cinco operarios que se supone son de
velocidad homogénea para reducir la variación debido a los operarios, asignado a
cada operario los tres métodos por tiempos iguales, el número de prendas
terminadas por cada operario y con cada método en el tiempo fijado se da en la tabla
que sigue:

M1 M2 M3
O1 3 9 5
O2 4 8 6
O3 3 7 8
O4 5 9 7
O5 4 6 9

¿Existe alguna diferencia significativa entre los métodos de montaje de la prenda?

7. La empresa agroindustrial estudia el efecto de 4 clases de fertilizantes A, B, C, D


en el rendimiento de la producción de arroz. Para esto diseño un experimento
dividiendo el terreno de cultivo entre bloques con cuatro parcelas homogéneas
cada uno, asignando aleatoriamente los fertilizantes a cada uno de los bloques para
conseguir un diseño. Los resultados fueron los siguientes:

B1 B2 B3
C = 39.9 D = 43.4 B = 42.7
A = 40.1 B = 42.9 D = 42.8
B = 41.4 A = 42.2 C = 41.4
D = 42.1 C = 42.3 A = 42.9

¿Proporcionan estos datos suficiente evidencia de alguna diferencia significativa en


la media de los rendimientos de los fertilizantes?

8. Para evaluar 4 sistema de administración de archivos se diseñó un experimento con


4 operadores de procesamiento de palabras a quienes se le observo el tiempo
necesario, en minutos, para aprender cómo usar cada uno de los sistemas de
administración de archivos. Los tiempos observados se dan en la siguiente tabla:

sistema de administración de archivo


MATERIA
PRIMA 1 2 3 4
B1 390 402 392 385
B2 380 403 394 386
B3 377 411 399 380
B4 370 404 400 384

 ¿Existe alguna diferencia significativa en la media del tiempo debido al


sistema de administración de archivo?
 ¿Existe alguita diferencia significativa en la media del tiempo debido a los
operadores?

9. El decano de estudio generales de ciencias quiere saber si son los niveles de


evaluación de los cursos y el conocimiento de los alumnos que producen la
variabilidad en las notas finales que obtiene, para esto, se diseñó un experimento de
dos factores sin replicas, escogiendo 4 alumnos al azar del tercer nivel que cursaron

45
las materias de matemáticas, estadística, física y lenguaje observando las
calificaciones los resultado están en la siguiente tabla:

cursos
ALUMNOS M F L E
1 14 13 14 16
2 13 18 15 19
3 11 16 13 18
4 12 15 12 16

¿Podemos concluir que los cursos presenta la misma dificultad?

10. Una empresa quiere saber si las perdidas en porcentajes de producción defectuosa
producida, depende de las líneas de producción de los tipos de materia prima de su
proveedores para esto, el ingeniero a cargo del control, diseño un experimento de
dos factores sin replicas asignando a cada una de las 4 líneas de producción una
de las cuatros materias primas por día. Los porcentajes de producción están en la
siguiente tabla:

Línea de producción
Operadores 1 2 3 4
1 2,3 2,5 3,2 3,2
2 2,8 2,7 3,5 3,8
3 3,2 3,1 3,7 3,9
4 3,6 3,8 4,2 4,5

¿Son significativamente diferentes los promedios de porcentajes de producción


defectuosa debido a la línea de producción?

LENGUAJE DE PROGRAMACION R

I. IMPLEMENTANDO Rcmdr
 Hacer clic en Packages
 Hacer clic en Usa (1)
 Hacer clic en Rcmdr
 Escribir library (Rcmdr)
 Seleccionar el archivo de dato
 Seleccionar estadístico
 Seleccionar media - anova

46

También podría gustarte