Está en la página 1de 42

Ing.

Industrial Estadística Inferencial II Capítulo 3


Modelo unifactorial

Capítulo 3
DISEÑO DE EXPERIMENTOS DE UN FACTOR

TEMAS
3.1 Familia de diseños para comparar tratamientos
3.2 El modelo de efectos fijos
3.3 Diseño completamente aleatorio y ANOVA.
3.4 Comparaciones o pruebas de rangos múltiples.
3.5 Verificación de los supuestos del modelo.

COMPETENCIAS

Competencia específica: Competencias genéricas:

Aplica el análisis de varianza de un factor Capacidad de abstracción, análisis y síntesis.


para la toma de decisiones en base al Capacidad de aplicar los conocimientos en la
resultado obtenido de la experimentación práctica.
de un proceso industrial, logístico, Capacidad para identificar, plantear y
comercial o de servicios. resolver problemas

ACTIVIDADES DE APRENDIZAJE
Identificar la familia de diseños experimentales para comparar tratamientos
Explicar los elementos de los diseños completamente al azar y el análisis de varianza
Formular y describir las diversas pruebas de rangos múltiples, el método de Dunnet y la
comparación por contrastes.
Utilizar un TIC´s para el procesamiento de información asociada al modelo de un factor.
Interpretar los resultados del análisis de varianza
Recopilar datos de un caso real para desarrollar el análisis de experimentos de un factor a
través de un caso práctico
Explicar ante el grupo el resultado de su caso práctico.

72
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Introducción al Diseño de Experimentos.


Un experimento se puede definir como el proceso donde se inducen cambios en la respuesta
de salida de un sistema, implica planear los pasos a seguir para la realización del experimento;
primero se debe tener muy claro cuál es el objetivo del trabajo, cuáles son las variables que se
van a manipular, cuál es la respuesta que se espera obtener y cómo se va a medir.
Al elaborar un producto es importante plantear una estrategia experimental adecuada para
reducir el costo de producción y tener una buena calidad del producto. Además, es importante
determinar las condiciones que indiquen el punto que optimice las características del producto.
El diseño de experimentos permite anticiparse a seleccionar un modelo matemático para hacer
el análisis de los resultados, dicho análisis puede ser desde una prueba de hipótesis simple o
un análisis de correlación (temas vistos anteriormente), hasta un análisis de diseños factoriales,
los cuales iniciaremos a estudiar en esta unidad.
El diseño experimental es muy importante en ingeniería, ya que permite al investigador,
desarrollar nuevos procesos o mejorar el ya existente, además ayuda a obtener productos con
mayor confiabilidad, mejor funcionamiento en el campo, menores costos y menor tiempo de
diseño y desarrollo del producto.
Para usar un enfoque estadístico, al diseñar y analizar un experimento se requiere que todos
los participantes en él, tengan de antemano una idea clara de qué es exactamente lo que se va a
estudiar, cómo se van a recopilar los datos y, al menos, una idea cualitativa de cómo se van a
analizar. (Montgomery, 1991)
Mediante el uso de experimentos diseñados, los ingenieros pueden determinar el subconjunto
de las variables del proceso que ejerce la mayor influencia sobre su desempeño. Los
resultados de un experimento como éste pueden llevar al mejoramiento del rendimiento del
proceso, o a la reducción de la variabilidad del mismo.
El objetivo del experimentador es la optimización, es decir, determinar los niveles de las
variables críticas que producen el desempeño óptimo del proceso
Todo experimento incluye una secuencia de actividades.
1 Conjetura; la hipótesis original que motiva el experimento
2 Experimento: la prueba realizada para investigar la conjetura
Análisis: el análisis estadístico de los datos del experimento
4 Conclusión: qué se ha aprendido acerca de la conjetura original del experimento.

73
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

3.1 Familia de diseños para comparar tratamientos


Todas nuestras actividades asociadas con planear y realizar estudios de investigación tienen
implicaciones estadísticas.
Los principios estadísticos son los asociados con la recolección de aquellas observaciones que
proporcionen la mayor cantidad de información para el estudio de investigación de una
manera eficiente. Incluyen el diseño de tratamientos, el control local de la variabilidad, el
número de réplicas, la aleatorización y la eficiencia de los experimentos.
El objetivo del Diseño de experimentos es averiguar si determinados factores influyen en la
variable de interés y, si existe influencia de algún factor, cuantificarla.
La metodología de Diseño de Experimentos estudia cómo variar las condiciones habituales de
realización de un proceso empírico aumentando la probabilidad de detectar cambios
significativos en la respuesta; de esta forma se obtiene un mejor conocimiento del
comportamiento del proceso de interés, lo cual sirve para determinar las principales causas de
la variación, para encontrar las condiciones óptimas de la variable de respuesta.
Es forzoso que el investigador se asegure de que los tratamientos elegidos concuerden con la
hipótesis de investigación. Puede ser suficiente –y más sencillo- diseñar un estudio sólo para
descubrir el mejor tratamiento. (Kuehl, 2001). Por ejemplo, pueden realizarse pruebas de
hipótesis acerca de las diferencias entre las medias de dos grupos de tratamiento utilizando la
prueba estadística de distribución normal, con errores especificados tipo I y tipo II.
En ocasiones es recomendable utilizar un control al que no se da tratamiento, ya que éste
revelará las condiciones en las que se efectuó el experimento, dicha unidad o sujeto placebo se
procesa de la misma manera que las unidades en tratamiento, pero sin incluir en su protocolo el
tratamiento activo. (Kuehl, 2001).
Un modelo ampliamente utilizado es el diseño de bloques en el cual se bloquea el efecto de uno
de los factores -columnas-, que no es de interés, y se analiza únicamente el efecto del factor de
interés -renglones-.
Dentro del modelo de bloques se tiene también el modelo cuadrado latino, se le llama así porque
es un cuadrado -mismo número de tratamientos, mismo número de renglones, mismo número
de columnas- en él se representa el tratamiento por medio de letras latinas, otro factor es el
efecto en renglones, y otro factor es el efecto en columnas.
Además dentro del modelo de bloques tenemos el modelo cuadrado greco-latino, donde también
se tiene mismo número de tratamiento, representado por letra griega, mismo número de
tratamiento representado por letra latina, mismo número de tratamiento en renglón, y mismo
número de tratamiento en columnas.

Otros de los diseños más utilizados son los diseños factoriales, en los cuales se compara el
efecto de todas las posibles combinaciones entre las medias de los tratamientos, así como las
interacciones que pueda haber entre ellos.

74
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

3.2 El modelo de efectos fijos


El modelo de efectos fijos se encuentra dentro de la clasificación de experimentos de un factor; se le
llama de efectos fijos cuando el experimentador selecciona los tratamientos de acuerdo con su experiencia
y el objetivo del análisis. Si los tratamientos son seleccionados en forma aleatoria de un número mayor
de tratamientos, se le llama modelo de efectos aleatorios. Estas dos clasificaciones son parte del diseño
completamente al azar.
El modelo completamente al azar es el más simple de los que se utilizan para comparar dos o más
tratamientos, ya que solo se consideran dos fuentes de variabilidad: los tratamientos y el error aleatorio.
Se le llama completamente al azar o completamente aleatorizado porque todas las corridas experimentales
se realizan en orden aleatorio de manera que el medio ambiente en el que se usan los tratamientos sea lo
más uniforme posible.
El modelo estadístico lineal es:

i = 1, 2... a
yij     i   ij j = 1,2,...,n

donde:
yij – j-ésima observación del tratamiento i (el subíndice “j” se refiere a cada una de las observaciones)
 – es un parámetro común a todos los tratamientos denominado media global
i – efecto del i-ésimo tratamiento (el subíndice “i” se refiere a cada uno de los tratamientos)
ij – error aleatorio

El objetivo de este diseño es probar hipótesis apropiadas con respecto a los efectos del tratamiento y hacer
una estimación de ellos. Para probar la hipótesis, se supone que los errores del modelo son variables
aleatorias independientes con distribución normal.

Análisis del modelo de efectos fijos


Este modelo describe dos situaciones con respecto al efecto de los tratamientos:
1ª los tratamientos son seleccionados por el experimentador
2ª se desea probar hipótesis sobre las medias de los tratamientos y las conclusiones se aplican sólo a los
niveles del factor considerados en el análisis. Las conclusiones no pueden hacerse extensivas a
tratamientos similares que no hayan sido considerados específicamente.

75
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

En este modelo los efectos de tratamiento i se define como desviaciones con respecto a la media en
general, por esta razón  i 0. Por lo tanto, el valor medio del i-ésimo tratamiento consta de

" i     i" .
En este modelo interesa probar:

Ho: μ1 = μ2 =...= a o bien Ho:  1   2  ...   a  0


H1: μi ≠ μj al menos para una i

Es posible hablar de probar la igualdad de las medias de los tratamientos, o bien que los efectos de
tratamiento son cero.
El procedimiento para probar la igualdad en el nivel medio de “ a ” tratamientos es por medio
de una prueba de hipótesis realizada mediante un estadístico “F”. A esta prueba se le llama
ANÁLISIS DE VARIANCIA (ANOVA).

El análisis de variancia resulta de descomponer la variabilidad total de los datos en sus partes
componentes.

La suma total de cuadrados corregida es : SST   ( yij  yˆ..)2

La cual se descompone en:

a n a a n

 ( yij  y..) 
i 1 j 1
2
n ( y i .  y..)   ( yij  y i .) 2
i 1
2

i 1 j 1

SST SSt SSE

Donde:
SST – Suma de cuadrados total

76
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

SSt – Suma de cuadrados de tratamientos (variación entre tratamientos) y


SSE – Suma de cuadrados del error (variación dentro de los tratamientos)
y.. – Promedio total
y i . – Promedio de cada renglón

Por lo tanto, la variancia muestral del i-ésimo tratamiento la podemos obtener dividiendo entre n-1

a n a  n 
SSE   ( yij  y i .) 2    ( yij  y i .) 2 
i 1 j 1 i 1  j 1 
n

(y ij  y i .) 2
entonces: Si  i 1
desde i  1, 2,... a
2

n 1

El ANOVA para el modelo de un factor o unifactorial se realiza por el método de sumas de cuadrados,
utilizando las fórmulas de la tabla 3.1

Donde:
yi. – Suma total de observaciones de cada tratamiento (renglón)
n – número de repeticiones de cada tratamiento
y٠٠ – Suma del total de observaciones
N – número total de observaciones
yij – Cada una de las observaciones de todos los tratamientos

Ejemplo 3.1
En una fábrica de jugos se tienen 5 máquinas de llenado para latas de 500 ml. El Departamento de control
de calidad quiere comprobar que las 5 máquinas estén trabajando uniformemente, se toman seis muestras
de cada máquina y se analiza por medio de un ANOVA para ver si en promedio todas las máquinas sirven
la misma cantidad.
Los resultados obtenidos se pueden ver en la tabla 3.2

77
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Tabla 3.2 jugo servido en envases de 500 ml.

Muestras
Máquina
1 2 3 4 5 6
1 498 493 497 497 500 498
2 491 495 493 491 494 492
3 488 500 498 497 493 500
4 499 496 502 497 493 498
5 498 495 497 503 500 498

Codificación de observaciones. Los análisis de varianza pueden ser más precisos o ser simplificados si
se codifican los datos. La codificación de los datos consiste en restar, sumar o multiplicar una constante
a cada uno de los datos observados; si esto se hace para cada observación, el resultado de las sumas de
cuadrados no se afecta, y los análisis de varianza resultan ser equivalentes.
Los datos del ejemplo de llenado de latas de jugo se pueden codificar restándole 450 a cada valor,
quedando como se puede ver en la tabla 3.3
Tabla 3.3 Datos codificados (restando 450)

Muestras
Máquina
1 2 3 4 5 6
1 48 43 47 47 50 48
2 41 45 43 41 44 42
3 38 50 48 47 43 50
4 49 46 52 47 43 48
5 48 45 47 53 50 48

SOLUCIÓN:
Para verificar si la cantidad de jugo servida en los envases de 500 ml es la misma por cada
una de las máquinas, planteamos las hipótesis:
Ho: μ1 = μ2 = μ3 =μ4 =μ5
H1: μi ≠ μj al menos para un i
Luego se realiza un ANOVA; calculando primero las sumas de cuadrados Tabla 3.4

78
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Tabla 3.4 Suma de cuadrados del ejemplo 3.1

Muestras Suma de
Máquina renglón (Yi)
1 2 3 4 5 6
1 48 43 47 47 50 48 283
2 41 45 43 41 44 42 256
3 38 50 48 47 43 50 276
4 49 46 52 47 43 48 285
5 48 45 47 53 50 48 291
Total Y.. 1391

Sumas de cuadrados para realizar el ANOVA:

n – número de repeticiones en cada tratamiento = 6


a – número de tratamientos = 5
N – número total de observaciones = a n = (5)(6) = 30

 Yi.2 = 2832 + 2562 + 2762 + 2852 + 2912 = 387,707

 yi. 2 y..2 387,707 13912


SS t   =  = 121.8
n N 6 30

  y ij 2 = 482 + 432 + 472 +...+412 + 452 + 432 +...+ 502 + 482 = 64,851

y 2 ..
SST    yij 2  = 64,851 – 64,496.03 = 354.97
N

SSE = SST – SSt = 354.97 – 121.8 = 233.17

SSt 121.8
MS t   = 30.45
a 1 4

SS E 233.17
MS E   = 9.32
N a 25

MSt 30.45
F0   = 3.26
MS E 9.32
Al sustituir los valores en la tabla 3.5 del análisis de varianza tenemos:

79
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Tabla 3.5 ANOVA para el ejemplo 3.1


Suma de Grados de Media de
Fuente de variación cuadrados libertad cuadrados Fo

Entre tratamientos 121.8 4 30.45


Error 3.26
(Dentro de tratamientos) 233.17 25 9.32

Total 354.97 29

El valor crítico es Fα.(v1,v2) = F0.05, (4,25) = 2.75


El valor Fα.(v1,v2) puede obtenerse en Excel mediante la instrucción:
=DISTR. F. INV[0.05,(4,25)]
El valor calculado, Fo =3.26 es mayor que el valor crítico; con una probabilidad menor que 0.05, por
tanto, se acepta la hipótesis alterna.

CONCLUSIÓN:
Dado que la decisión fue aceptar la H1 nuestra conclusión es que existe una diferencia significativa en
la cantidad de jugo servida por cada máquina.

Uso de Excel para obtener el ANOVA de un modelo unifactorial


El ANOVA para el modelo unifactorial o de clasificación en un sentido se puede obtener utilizando
EXCEL, siguiendo los siguientes pasos:
1º La captura de datos se hace como se puede ver en la tabla 3.6
Tabla 3.6 Captura de datos en Excel (ejemplo 3.1)

Muestras
Máquina
1 2 3 4 5 6
1 48 43 47 47 50 48
2 41 45 43 41 44 42
3 38 50 48 47 43 50
4 49 46 52 47 43 48
5 48 45 47 53 50 48

2º Se sigue el procedimiento siguiente:


Ir a “datos”, “análisis de datos”, “análisis de varianza de un factor”, seleccionar el rango de entrada,
incluyendo la primer columna y las 30 observaciones, en este caso. Seleccionar “agrupado por filas”,
“alfa de 0.05” y seleccionar la celda donde se quiere que Excel inicie con las tablas de resultados, o

80
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

dejar en una hoja nueva si así se desea. Los resultados en Excel son los que se observan en las tablas
3.7 y 3.8

Tabla 3.7 Resultados

ANÁLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de Probabili Valor crítico
variaciones cuadrados libertad los cuadrados F dad para F
Entre grupos 121.8 4 30.45 3.2648 0.0277 2.7587
Dentro de los grupos 233.1667 25 9.3267

Total 354.966667 29

Tabla 3.8 RESUMEN


Grupos Cuenta Suma Promedio Varianza
1 6 283 47.1667 5.3667
2 6 256 42.6667 2.6667
3 6 276 46 22
4 6 285 47.5 9.1
5 6 291 48.5 7.5

Modelo unifactorial con datos desbalanceados:


Cuando el modelo es desbalanceado, es decir que no existe el mismo número de repeticiones en cada
tratamiento, la fórmula para la suma de cuadrados del tratamiento (SSt) cambian un poco, ésta queda
de la siguiente manera:

 y i .2  y..2
SSt    
 ni  N
Donde:

yi . – Suma de las observaciones de cada tratamiento


ni – número de observaciones (tamaño de la muestra) de cada tratamiento

El resto de las fórmulas para el ANOVA sigue siendo igual al usado para modelos balanceados.
El procedimiento para trabajar con Excel un modelo desbalanceado, es exactamente igual que para
trabajar con un modelo balanceado.

81
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Ejemplo 3.2 (Fuente: Newbold, Carlson & Thorne, 2010, p 693)


Un fabricante de cereales tiene que elegir entre tres colores para las cajas de cereales: rojo,
amarillo y azul. Para averiguar si el color influye en las ventas, se eligen 16 tiendas de tamaño
parecido. Se envían cajas rojas a 6 de estas tiendas, cajas amarillas a 5 y cajas azules a las 5
restantes. Después de unos días, se comprueba el número de cajas vendidas en cada tienda. La
tabla 3.9 muestra los resultados (en decenas de cajas obtenidos).

Tabla 3.9 Ventas de cajas de cereal


Color Observaciones
Rojo 43 52 59 76 61 81
Amarillo 52 37 38 64 74
Azul 61 29 38 53 79

Solución: primero se calculan las sumatorias, tabla 3.10.


Tabla 3.10 sumatorias
Color Observaciones Yi.
Rojo 43 52 59 76 61 81 372
Amarillo 52 37 38 64 74 265
Azul 61 29 38 53 79 260
Y.. = 897

Sumas de cuadrados para realizar el ANOVA:

ni – número de repeticiones en cada tratamiento = 6,5,5


a – número de tratamientos = 3
N – número total de observaciones = 16

 yi .2  y..2 3722 2652 2602 8972


SSt          340.9375
 i  N
n 6 5 5 16

  y ij 2 = 432 + 522 + 592 +...+522 + 372 + 382 +...+ 532 + 792 = 54,237

y 2 ..
SST    yij 2  = 54,237 – 50,288.06 = 3,948.9375
N

SSE = SST – SSt = 3,948.9375 – 340.9375 = 3,608

SSt 340.9375
MS t   = 170.468
a 1 2

82
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

SS E 3608
MS E   = 277.538
N a 13

MSt 170.68
F0   = 0.6149
MS E 277.538
En la tabla 3.11 se observan los valores de las sumas de cuadrados y Fo

El valor crítico es Fα.(v1,v2) = F0.05, (2,13) = 3.8


El valor calculado, Fo =0.6149 es menor que el valor crítico; con una probabilidad mayor que 0.05, por
tanto, se acepta la hipótesis nula.

CONCLUSIÓN:
Dado que la decisión fue aceptar la H0 la conclusión es que no existe una diferencia significativa en la
venta de cereal debida al color de la caja, o sea que con cualquier color que se escoja se obtendrán las
mismas ventas.

3.3 Diseño de efectos aleatorios y ANOVA


Se dice que el factor es aleatorio si el experimentador selecciona aleatoriamente los “a” niveles de la
población de niveles del factor. Se obtienen conclusiones de toda la población de niveles del factor
porque los niveles usados en el experimento fueron seleccionados al azar.
Se supone que la población de niveles del factor es infinita o lo suficientemente grande para ser
considerada infinita.
El modelo estadístico lineal es:
yij =  + i + ij
i y ij son variables aleatorias. Si i tiene una varianza 2 y es independiente de ij, la varianza de
cualquier observación es:

83
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

V (yij) = 2 + 2

Las varianzas 2 + 2 se conocen como componentes de variancia y el modelo se denomina modelo
de efectos aleatorios. Para probar las hipótesis del modelo se requiere que los { ij} sean NID(0,σ2)
“aproximadamente normal con media cero y varianza constante”, que los {i} sean NID(0, 2), y que
i y ij sean independientes. En este caso, carece de sentido probar hipótesis que se refieren a los efectos
de tratamiento individuales y en su lugar deben probarse las hipótesis:
Ho: 2 = 0 (la variancia de los tratamientos es igual a cero)
H1: 2 > 0
Todos los tratamientos son idénticos si 2 = 0; por otra parte, si 2 > 0, existe variabilidad entre los
tratamientos.
El método de análisis de variancia para la estimación de las componentes de variancia, no requiere de la
suposición de normalidad.
Usualmente, interesa calcular los componentes de variancia (2; variancia dentro de los tratamientos) y
( 2 ; variancia entre los tratamientos), para esto tenemos que:

̂ 2  MSE
y

MSt  MSE
 2 
n

Sumando estos dos valores (2 + 2) podemos estimar la variancia de cualquier observación de la
muestra y comprobar si realmente la mayor parte de la variabilidad se debe a la diferencia entre los
tratamientos.
El análisis de variancia para el modelo de efectos aleatorios es idéntico al de efectos fijos, pero las
conclusiones son diferentes, ya que se aplican a toda la población de tratamientos.
Ejemplo 3.3 (Fuente: Montgomery, 1991; p 80)
Una fábrica de textiles cuenta con un gran número de telares. Se supone que cada uno tiene la misma
producción de tela por minuto. Para investigar esta suposición, cinco telares son escogidos al azar, y se
mide la cantidad de tela producida en cinco tiempos diferentes. Los datos obtenidos se pueden ver en la
tabla 3.12

84
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Tabla 3.12 Tela producida por los telares


Telar Producción (lb/min)
1 14.0 14.1 14.2 14.0 14.1
2 13.9 13.8 13.9 14.0 14.0
3 14.1 14.2 14.1 14.0 13.9
4 13.6 13.8 14.0 13.9 13.7
5 13.8 13.6 13.9 13.8 14.0

SOLUCIÓN:
Para verificar si los telares están produciendo tela con resistencia uniforme, se plantean las
siguientes hipótesis:

H 0 :   0
2

H1 :    0
2

Se realiza un ANOVA; calculando primero las sumatorias (tabla 3.13)


Tabla 3.13 Sumatorias
Telar Producción (lb/min) Yi.
1 14.0 14.1 14.2 14.0 14.1 70.4
2 13.9 13.8 13.9 14.0 14.0 69.6
3 14.1 14.2 14.1 14.0 13.9 70.3
4 13.6 13.8 14.0 13.9 13.7 69.0
5 13.8 13.6 13.9 13.8 14.0 69.1
Y.. = 348.4

Sumas de cuadrados para realizar el ANOVA:


n – número de repeticiones en cada tratamiento = 5
a – número de tratamientos = 5
N – número total de observaciones = a n = (5)(5) = 25

 Yi.2 = 70.42 + 69.62 + 70.32 + 692 + 69.12 = 24,278.2

 yi. 2 y..2 24,278.22 348.4 2


SS t   =  = 0.3416
n N 5 25

  y ij 2 = 142 + 14.12 + 14.22 +...+13.92 + 13.82 + 14.22 +...+ 13.82 + 142 = 4,855.9

85
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

y 2 ..
SST    yij 2  = 4,855.94 – 4,855.3 = 0.6376
N

SSE = SST – SSt = 0.6376 – 0.3416 = 0.296

SSt 0.3416
MSt    0.0854
a 1 4

SS E 0.296
MS E    0.0148
N a 20

MS t 0.0854
F0    5.77
MS E 0.0148

En la tabla 3.14 se observan los resultados del ANOVA


Tabla 3.14 Resultados del ANOVA
Fuente de Suma de Grados de Media de
Fo
variación cuadrados libertad cuadrados
Entre tratamientos 0.3416 4 0.0854
Error 0.296 20 0.0148 5.77
(Dentro de tratamientos)
Total 0.6376

El valor crítico es Fα, (v1,v2) = F0.05, (4,20) = 2.866


El valor calculado, Fo =5.77 es mayor que el valor crítico, por tanto, se acepta la hipótesis alterna y se
rechaza la nula

CONCLUSIÓN:
Dado que la decisión fue aceptar la H1 nuestra conclusión es que los telares no están produciendo la
misma cantidad de tela por minuto, es decir existe diferencia significativa entre los telares de la fábrica.
Al descomponer la varianza, tenemos que

MSt  MSE
 2 
n

86
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

de donde:

0.0854  0.0148
 2   0.0141
5
Esto nos indica que la estimación de la varianza de cualquier observación de muestra es 2 + 2 = 0.0148
+ 0.0141 = 0.0289. La mayor parte de la variabilidad se atribuye al error aleatorio, por tanto, no se puede
asegurar que la diferencia en la producción de los distintos telares sea significativa.
Este ejercicio se puede resolver con Excel hasta el ANOVA solamente, ya que Excel no tiene la opción
para resolver problemas de efectos aleatorios, sin embargo, la descomposición de las varianzas se puede
realizar manualmente, ya que es lo único que cambia en el análisis de este modelo.
En las tablas 3.15 y 3.16 se observan los resultados obtenidos con Excel
Análisis de varianza de un
factor

Tabla 3.15 RESUMEN del problema 3.3


Grupos Cuenta Suma Promedio Varianza
1 5 70.4 14.08 0.007
2 5 69.6 13.92 0.007
3 5 70.3 14.06 0.013
4 5 69 13.8 0.025
5 5 69.1 13.82 0.022

87
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

3.4 Comparaciones o pruebas de rangos múltiples


Comparación entre las medias de los tratamientos
El análisis de varianza es una prueba que nos ayuda a determinar si existe diferencia significativa entre
tratamientos, a esta conclusión se llega en caso de aceptar la hipótesis alterna; pero no nos ayuda a
identificar cuál de los tratamientos es el mejor.
Existen varios métodos o pruebas para hacer comparación entre pares de medias de tratamientos, por
medio de las cuales es posible llegar a concluir cuál de los tratamientos es el mejor, entre estos métodos
tenemos: el de la mínima diferencia significativa, prueba de intervalos múltiples de Duncan, la
comparación de tratamientos con un control, por el método de Dunnett (Montgomery, 1991),
y la prueba de Tukey

Método de la mínima diferencia significativa (LSD)


(Del ingles Least Significant Difference)
Supongamos que después de haber rechazado la hipótesis nula, con base en una prueba F de análisis de
varianza, se desea probar Ho: i = j, para toda i  j. Esto puede hacerse empleando la estadística t:

Y i .  Y j.
t 0

1 1
MS E   
 ni nj 

Suponiendo una hipótesis alterna bilateral, la pareja de medias i y j se consideran diferentes si

1 1
|𝑌̅𝑖. − 𝑌̅𝑗. | > t/2, N- a MS E    donde
 ni nj 

1 1
LSD = t/2, N- a MS E   
 ni nj 
Si el diseño es balanceado (todos los tratamientos se repiten el mismo número de veces), entonces n 1 =
n2 =…= na en este caso:

2 MS E
LSD = t/2, N- a
n

Para usar el procedimiento de la LSD, simplemente se comparan las diferencias observadas


entre cada par de promedios con el valor correspondiente de la LSD.

Si Yi.  Y j. > LSD, se concluye que las medias poblacionales i y j son diferentes.

88
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Ejemplo 3.4 (Fuente: Montgomery, 1991; p 80 -datos codificados-)


Se está estudiando la resistencia a la tensión de cemento Portland. Cuatro técnicas de mezclado pueden
ser usadas económicamente. Se han recolectado los siguientes datos (tabla 3.17):

Tabla 3.17 Datos obtenidos en el ejemplo 3.4


Técnicas de
mezclado Resistencia a la tensión (lb/plg²)

1 629 500 365 390


2 700 800 475 650
3 300 400 485 550
4 100 200 100 265

Cálculos:
Primero se realiza el ANOVA, para esto se calculan las sumatorias Y.. y Yi. (tabla 3.18)

Realizando los cálculos de la misma manera que en el modelo de efectos fijos llegamos a los siguientes
resultados:
Ho: μ1 = μ2 = μ3 =μ4 H1: μi ≠ μj al menos para un i

n – número de repeticiones en cada tratamiento = 4


a – número de tratamientos = 4

N – número total de observaciones = a n = (4) (4) = 16

 Yi.2 = (1884)2 + (2625)2 + (1735)2 + (665)2 = 13 892 531

 yi. 2 y..2 13 892 531 47734281


SS t   =  = 489 740.1875
n N 4 16

  y ij 2 = 6292 + 5002 + 3652 +...+7002 + 8002 + 4752 +...+ 1002 + 2652 = 3 627 041

89
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

y 2 ..
SST    yij 2  = 3 627 041 – 2 983 392.5625 = 643 648.4375
N

SSE = SST – SSt = 643 648.4375 – 489 740.1875 = 153 908.25

SSt 489740.1875
MSt   = 163 246.7292
a 1 3

SS E 153908.25
MS E   =128 256 875
N a 12

MSt 163246.7292
F0   = 12.7281
MS E 12825.6875

El valor crítico Fc = F0.05 (3,12) = 3.49


El valor calculado F0 = 12.728 es mayor que el valor crítico, por tanto, se acepta la Hipótesis alterna y se
rechaza la Hipótesis de nulidad.

CONCLUSIÓN:
Como se acepta la H1 se concluye que si hay diferencia significativa en las técnicas de mezclado
(entre tratamientos), es decir la resistencia a la tensión del cemento Portland depende de la
técnica de mezclado que se use.
El análisis hecho hasta aquí no nos permite decir cuál de las cuatro técnicas utilizadas es la que nos
da una mayor o una menor resistencia, para esto debemos realizar una prueba por pares.

90
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Técnica de la mínima diferencia significativa (LSD).


Para demostrar la técnica LSD, se seguirá trabajando con los datos del ejemplo 3.4.
Debido a que el problema con el que se está trabajando es balanceado (todos los tratamientos tienen
el mismo número de repeticiones), se utilizará la siguiente fórmula para la prueba del método de la
LSD:

donde: MSE – es la media de cuadrados del error calculada


2MSE
LSD = t/2, N- a en el ANOVA
n

Para usar el procedimiento de la LSD, simplemente se comparan las diferencias observadas


entre cada par de promedios con el valor correspondiente de la LSD. Si Yi.  Y j. > LSD, se
concluye que las medias poblacionales i y j son diferentes.

Trabajando con un   5% t0.025, 12  2.179 tenemos:

2 MS E 2(12,825.6875)
LSD = t/2, N- a LSD = 2.179 = 174.495
n 4

LSD = 174.495

Para comparar los promedios del problema de las técnicas de mezclado tenemos:

y1. = 1 884 /4= 471 y 1. = 471

y2. = 2 625 /4= 656.25 y 2. = 656.25

y3. = 1 735 /4= 433.75 y 3. = 433.75

y4. = 665 /4= 166.25 y 4. = 166.25

 y 1. - y 2.  471 – 656.25  = 185.25

 y 1. - y 3.  471 – 433.75 = 37.25

 y 1. - y 4.  471 – 166.25 = 304.75

 y 2. - y 3.  656.25 – 433.45  = 222.5

91
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

 y 2. - y 4.  656.25 – 166.25  = 490

 y 3. - y 4.  433.75 – 166.25 = 267.5

Si la diferencia entre el par de medias es


Yi.  Y j. > LSD significativa la marcamos con un asterisco

185.25 > 174.495 *

37.25 < 174.495 No hay diferencia significativa entre este par de medias  y 1. - y 3.

304.75 > 174.495 *


222.5 > 174.495 *
490 > 174.495 *
267.5 > 174.495 *

CONCLUSIÓN:
Dado que, entre los tratamiento y1, y3 no hay diferencia significativa, la diferencia está entre los
tratamientos y2. - y4. Analizando los resultados podemos concluir que la técnica de mezclado que le da
una mayor resistencia al cemento Portland es la dos, ya que tiene una resistencia promedio de 656.25
lb/plg2 mientras que el tratamiento cuatro aunque también es diferente significativamente tiene una
resistencia promedio de 166.25 lb/plg2 .

Prueba de intervalos múltiples de Duncan


Esta prueba es un procedimiento usado ampliamente para comparar todas las parejas de medias.
Para aplicar dicha prueba en muestras del mismo tamaño, se disponen en orden ascendente los “
a ” promedios de tratamiento y se determina el error estándar (S y i.) de cada promedio usando:

MS E
S y i.=
n
A partir de la tabla de intervalos significativos de Duncan Tabla VII que se encuentra en la página
179 y 180 del Anexo se obtienen los valores de r (p, f), para p = 2,3,..., a en donde  es el nivel
de significación y f es el número de grados de libertad del error. Esto es:

92
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Rp = r (p, f) S y i. Rp – intervalos significativos

Si una diferencia observada es mayor que el intervalo mínimo significativo correspondiente, se


concluye que la pareja de medias en cuestión es significativamente diferente, esto es: si

y mayor  y menor  Rp quiere decir que existe diferencia significativa en la pareja de medias

Para evitar contradicciones, ninguna diferencia entre una pareja de medias es considerada
significativa si las dos medias se encuentran entre otras dos que no difieran significativamente.
Para hacer las comparaciones, se prueban, las diferencias observadas entre las medias, comenzando
por el valor más alto contra el más pequeño, comparando esta diferencia con el intervalo mínimo
significativo R a (no olvides que a es el número de tratamientos). Después se calcula la diferencia
entre el valor más alto y el segundo más pequeño y se compara con el intervalo significativo mínimo
Ra 1 .

Este procedimiento continúa hasta que todas las medias han sido comparadas con la media más
grande. A continuación, la diferencia entre la segunda media más grande y la más pequeña se
calcula y compara contra el intervalo mínimo significativo R a-1. Este proceso continúa hasta que
han sido consideradas las diferencias entre todos los posibles pares.
Para realizar una prueba de Intervalos múltiples de Duncan se volverán a trabajar los datos del
ejemplo 3.4, para contrastar los dos métodos.
Se partirá de la conclusión a la que se llegó en la prueba de hipótesis y únicamente se hará la
comparación de pares de medias.
Para realizar la prueba de intervalos múltiples de Duncan, primero se calcula el error estándar:

MS E 12,825.6875
S y i.= = = 56.625 S y i.= 56.625
n 4

Luego se calculan los valores Rp = r  (p, f) S y i.

En la Tabla VII (del anexo) vemos que r0.05 (2, 12) = 3.08
(Recuerda que f son los grados de libertad del error).
Por tanto

R2 = r .05 (2,12) S y i. = (3.08) (56.625) = 174.405

R3 = r .05 (3,12) S y i. = (3.23) (56.625) = 182.899

R4 = r .05 (4,12) S y i. = (3.33) (56.625) = 188.561

93
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

En seguida se acomodan los promedios en orden ascendente

y 4. = 166.25 Se Compara el mayor promedio contra el menor, luego el mayor contra el


siguiente menor, y así sucesivamente, hasta compararlo con todos los
y 3. = 433.75 promedios; se descarta el mayor y se compara el siguiente mayor, (en este
caso y1) con el menor, luego con el siguiente menor hasta completar la
y 1. = 471 comparación con todos los pares posible, y así se comparan todos contra
todos hasta terminar todas las combinaciones posibles.
y 2. = 656.25

Como se muestra a continuación:

y 2. - y 4. = 656.25 – 166.25 = 490

y 2. - y 3. = 656.25 – 433.75 = 222.5

y 2. - y 1. = 656.25 – 471 = 185.25

y 1. - y 4. = 471 – 166.25 = 304.75

y 1. - y 3. = 471 – 433.75 = 37.25

y 3. - y 4. = 433.75 – 166.25 = 267.5

Luego comparamos la diferencia de medias con el valor Rp,

│ y 2. - y 4.│= 490 > 188.5621689 (R4)*

│ y 2. - y 3.│= 222.5 > 182.8996413 (R3)*

│ y 2. - y 1.│= 185.25 > 174.4058499 (R2)*

│ y 1. - y 4.│= 304.75 > 182.8996413 (R3)*

│ y 1. - y 3.│= 37.25 < 174.4058499 (R2) No hay diferencia significativa

│ y 3. - y 4.│= 267.5 > 174.4058499 (R2)*

Se compara la primer diferencia con el valor R a , la segunda diferencia con el valor Ra 1

94
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

la tercer diferencia con Ra 2 y así sucesivamente hasta comparar la diferencia de medias con el valor
Ra (a 2) . Se descarta el valor R a y se compara el siguiente par de diferencias con el valor Ra 1 siguiendo
el mismo procedimiento hasta terminar de comparar todos los pares de medias.

Si ymayor  ymenor  Rp , existe diferencia significativa en la pareja de medias.

Marcamos con asterisco los pares de medias donde hay diferencia significativa y vemos que en el único
par donde no hay diferencia significativa es en y 1 y y 3. Por tanto podemos concluir que los
tratamientos donde hay diferencia significativa es en y2 y y4, Podemos ver que en este problema llegamos
exactamente a la misma conclusión que por el método de la LSD.

Comparación de tratamientos por medio de la prueba de Tukey

El método de Tukey, es un método de comparación por pares de medias de tratamiento.


(Gutiérrez, 2008 y Walpole, Myers & Myers, 1999). Éste método consiste en comparar las
𝑀𝑆𝐸
diferencias entre medias muestrales con el valor crítico, dado por: 𝑇∝ = 𝑞(∝, 𝑘, 𝑣)√ 𝑛
Donde:
Tα – valor crítico para la prueba de Tukey
q(α,k,v) – puntos porcentuales de la distribución de rango estudentizado, que se obtiene de la
tabla correspondiente (tabla VIII del anexo, pp 181-184)
α – nivel de significancia de la prueba
k – número de tratamientos
v – grados de libertad
MSE – media de cuadrados del error
n – número de observaciones de cada tratamiento

Si |𝑌̅𝑖 . −𝑌̅𝑗 . | > 𝑇∝ los pares de medias se consideran significativamente diferentes

Para analizar este método se trabajará con los mismos datos utilizados en las pruebas de LSD y
de Duncan (ejemplo 3.4)
Solución:

𝑀𝑆𝐸 12,825.6875
Se calcula 𝑇∝ = 𝑞(∝, 𝑘, 𝑣)√ = 𝑞(. 05,4,12)√ = 4.20(56.62) = 237.82
𝑛 4

95
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Luego comparamos la diferencia de medias con el valor Tα:

 y 1. - y 2.  471 – 656.25  = 185.25 < 237.82 No hay diferencia significativa

 y 1. - y 3.  471 – 433.75 = 37.25 < 237.82 No hay diferencia significativa

 y 1. - y 4.  471 – 166.25 = 304.75 > 237.82 *

 y 2. - y 3.  656.25 – 433.45  = 222.5 < 237.82 No hay diferencia significativa

 y 2. - y 4.  656.25 – 166.25  = 490 > 237.82 *

 y 3. - y 4.  433.75 – 166.25 = 267.5 > 237.82 *

Se observa que los tratamientos iguales son Y1 = Y2 = Y3; por tanto, podemos decir que el tratamiento
que es diferente a los demás es el 4 pero como el promedio de este tratamiento es menor a los demás no
podemos concluir que sea el mejor tratamiento, si no el peor.
En el caso de la prueba de Tukey concluimos que los tratamientos 1, 2 y 3 se consideran igual, en las
pruebas de LSD y de Duncan resultó que el tratamiento 2 también es diferente, esto se debe a que la
prueba de Tukey es menos potente que las otras dos pruebas, por tanto, no se detectan pequeñas
diferencias como significativas. El riesgo de detectar una diferencia que no existe es menor con el
método de Tukey, si la diferencia es clara hay coincidencia con todos los métodos.

Comparación de tratamientos con un control, por el método de Dunnett


Hay casos de experimentos donde se trabaja con un control, esto sucede cuando se divide la población
en dos grupos, en uno de ellos se agrega el reactivo activo y en el otro grupo no, pero los dos grupos
son tratados exactamente de la misma manera, por ejemplo: si se quiere probar un antibiótico para
cierto tipo de bacteria, se inoculan dos cultivos con la misma cantidad de bacterias, pero a uno no se le
agrega el antibiótico (control) y al otro sí, si después de cierto tiempo a una temperatura optima se
encuentra que en el cultivo con antibiótico se inhibió la bacteria (no creció) y en el cultivo sin
antibiótico se reprodujo, se puede concluir que el antibiótico es efectivo en la inhibición de dicha
bacteria.
Cuando en un experimento uno de los tratamientos es un control, al analista le interesa la
comparación de las a 1 medias de tratamiento con el control. Por tanto, sólo deben realizarse a 1
comparaciones. Un procedimiento para hacer las comparaciones fue desarrollado por Dunnett (1964).
(Montgomery, 1991)

Supongamos que el tratamiento a es el control. Se desea probar las hipótesis:

Ho:  i =  a

96
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

H1:  i ≠  a
Para i = 1,2,…, a 1 . El procedimiento de Dunnett es una modificación de la prueba t. Para cada
hipótesis se calculan las diferencias que se observan en las medias muestrales.
Yi  Y a i = 1,2,…, a 1

La hipótesis nula Ho:  i   a es rechazada con un nivel de error tipo I según α si

 1 1 
Y i  Y a > dα(a – 1, f) MS E   
 si el modelo es balanceado se puede simplificar esta fórmula de
 ni n a 
2 MS E
la siguiente manera: dα(a – 1, f)
n

en donde la constante dα(a – 1, f) se encuentra en la Tabla IX del anexo, pp 185-188, (son posibles tanto
pruebas unilaterales como bilaterales). Hay que notar que α constituye el nivel de significación
conjunto, asociado a las a – 1 pruebas.

Ejemplo 3.5
En un experimento se usan cuatro concentraciones de Nitrógeno (6, 8, 10 y 12 gr/m2) para reforzar el
crecimiento en centímetros de plantas de frijol. Se sembraron cinco metros cuadrados con una densidad
de 12 plantas por metro cuadrado para cada concentración y también se aplica un control (sin
nitrógeno). Se mide el crecimiento promedio por metro cuadrado de planta y se toman los siguientes
datos al mes de aplicado el Nitrógeno:

Tabla 3.20 Datos sobre el crecimiento en plantas


Concentración Promedio del crecimiento de plantas
gr/m^2 por metro cuadrado
6 20.4 21.9 18.9 20.7 21.3
8 23.1 25.2 25.8 24.3 24
10 24.6 26.1 28.2 27.6 25.8
12 20.7 17.4 21.6 20.4 22.2
0 17.7 18.3 20.7 17.1 18.3

Solución:
Para saber si hay diferencia significativa entre los tratamientos realizamos un ANOVA. Las hipótesis
son:
Ho: μ1 = μ2 = μ3 =μ4 =μ5 H1: μi ≠ μj al menos para un i

El resultado del ANOVA podemos verlo en la tabla 3.21

97
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Conclusión: como F0 > F α,(v1,v2), se acepta la H1. Se concluye que existe una diferencia significativa
entre los tratamientos. Por tanto, se hará una prueba de comparación por pares por el método de Dunnett
para verificar si existe diferencia significativa entre los tratamientos y el control, para esto se plantean
las siguientes hipótesis.
Ho:  i   a H1:  i   a
Las fórmulas para la prueba de Dunnett son las siguientes:

2 MS E 2 MS E 2(1.9566)
dα(a – 1, f) = d0.05(4, 20) = 2.65 = 2.344
n n 5

Comparando los pares de medias:


y 1. = 20.64
y 1. - y 5. = 20.64 - 18.42 = 2.22 < 2.34
y 2. = 24.48
y 2.- y 5. = 24.48 - 18.42 = 6.06 > 2.34
y 3. = 26.46
y 3. - y 5. = 26.46 - 18.42 = 8.04 > 2.34
y 4. = 20.46
y 4. - y 5. = 20.46 - 18.42 = 2.04 < 2.34
y 5. = 18.42

Se acepta la H1 en los tratamientos dos y tres, ya que sólo en ellos la diferencia con el control
es significativa, se concluye que las concentraciones de Nitrógeno que favorecen el crecimiento
de la planta de frijol son de 8 y 10 gr/m2

3.5 Verificación de los supuestos del modelo


Análisis residual
El análisis de variancia está fundamentado en que los datos se ajusten al modelo estadístico
lineal:
yij =  + i + ij
donde:
yij – j-ésima observación del tratamiento i
 – es un parámetro común a todos los tratamientos denominado media global
98
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

i – efecto del i-ésimo tratamiento


ij – error aleatorio

Además se hacen las suposiciones de que los errores son independientes, que están distribuidos
normalmente, y que tienen “NID(0,σ2)” (es aproximadamente normal con media cero y variancia

constante). Además en el modelo de efectos aleatorios se supone que los  i son independientes, que
tienen NID(0,σ2  i ) y que  i y ℮ij son independientes.
Los métodos para comprobar estas suposiciones se basan en los residuos (℮ij):
℮ij = y ij  yˆ ij para el modelo en un sentido ŷij  y i • por tanto:

℮ij = yij  y i •

Uno de los métodos para este análisis es graficar los residuos en papel de probabilidad normal.
Este método consiste en construir una gráfica de probabilidad normal de los residuos. Dicha gráfica es
una representación de la distribución acumulada de los residuos sobre papel de probabilidad normal cuya
escala de ordenadas es tal que la distribución normal acumulada sea una recta, para elaborar esta gráfica
es necesario acomodar los residuos en orden ascendente y calcular los valores Pk de la siguiente manera:
K  0.5
Pk  donde Pk – puntos de probabilidad acumulada para cada residuo y graficar estos valores
N
contra los residuos en una gráfica de probabilidad normal, la cual se encuentra en el anexo p 183

Ejemplo 3.6 (Fuente: Montgomery, 1991, p 80)


Tres proveedores suministran piezas en envíos de 500 unidades. Se han comprobado minuciosamente
muestras aleatorias de seis envíos de cada uno de los tres proveedores y se ha anotado el número de piezas
que no se ajustan a las normas. Las observaciones se presentan en la tabla 3.22

Tabla 3.22 Piezas que no se ajustan a las normas


Envíos
PROVEEDOR
1 2 3 4 5 6
A 28 37 34 29 31 33
B 22 27 29 20 18 30
C 33 29 39 33 37 38

Solución:

99
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Primero debe hacerse un ANOVA para verificar si hay diferencia significativa entre los tratamientos
(Provedores A, B y C), para esto se plantean las siguientes hipótesis:
Ho: μA = μB = μC H1: μi ≠ μj al menos para un i

En la tabla 3.23 observamos los resultados del ANOVA.

Como el valor P es menor que 0.05, se acepta la H1; concluimos que si hay diferencia significativa entre
los tratamientos, es decir: hay diferencia significativa entre los tres proveedores en el número de piezas
que no se ajustan a las normas.
Al realizar el análisis de varianza, se hizo la suposición de que los errores están distribuidos normalmente
y son independientes. Para verificar estas suposiciones se hace un análisis de residuos de la siguiente
manera:

100
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Análisis de residuos
Primero se calculan los residuos:

eij = yij  y i •

eA1 = 28 – 32 = - 4 Luego se acomodan los valores k en orden progresivo de 1


eA2 = 37 – 32 = 5 hasta n, los residuos de menor a mayor, y se calculan los
valores Pk
eA3 = 34 – 32 = 2
eA4 = 29 – 32 = - 3
eA5 = 31 – 32 = - 1
eA6 = 33 – 32 = 1

eB1 = 22 – 24.33 = - 2.33


eB2 = 27 – 24.33 = 2.67
eB3 = 29 – 24.33 = 4.67
eB4 = 20 – 24.33 = - 4.33
eB5 = 18 – 24.33 = - 6.33
eB6 = 30 – 24.33 = 5.67

eC1 = 33 – 34.83 = - 1.83


eC2 = 29 – 34.83 = - 5.83
eC3 = 39 – 34.83 = 4.17
eC4 = 33 – 34.83 = - 1.83
eC5 = 37 – 34.83 = 2.17
eC6 = 38 – 34.83 = 3.17

En seguida se grafican los valores de los residuos contra los valores Pk multiplicados por 100,
en una gráfica de probabilidad normal (ver anexo p 189), los valores pk aparecen en la parte
derecha de la gráfica (gráfica 3.1,).

101
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Nota: las escalas de residuos en la gráfica se darán de acuerdo a los valores residuales a graficar.
La interpretación de esta gráfica es la siguiente: si los puntos graficados se pueden ajustar a una
recta, es decir que queden por arriba y por debajo de la recta, pero cercanos a ella se puede
considerar la suposición de normalidad correcta.

CONCLUSIÓN:
No existe fuerte indicio de no normalidad, por tanto, podemos concluir que la suposición de normalidad
de los residuos es correcta.

102
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Prueba de Bartlett para igualdad de varianzas


Otro método para verificar los supuestos del modelo es la Prueba de Bartlett.
Esta prueba se aplica para la igualdad de variancias (para comprobar la suposición de que los errores son
independientes). Esta es una prueba estadística formal para la hipótesis:
H0: σ21= σ22=… σ2a
H1: lo anterior no es cierto al menos para una σ2i

La estadística de prueba es:


q
 0 2  2.3026 con V = a - 1
c
donde:
a
q  ( N  a ) log10 S p   (ni  1) log10 S i
2 2

i 1

1  (n  1)1  ( N  a)1 
a

3(a  1)  
C  1  i 
i 1 

 (n
i 1
i  1) S 2 i
S p2 
N a

y S i 2 es la variancia muestral de la i-ésima población.

El valor q es grande cuando hay una gran diferencia entre las variancias muestrales S i 2 y es
igual a cero si todas las S i 2 son iguales, por tanto

se rechaza H0 si  0    ,a 1
2 2

Para completar el análisis del problema anterior (ejemplo 3.6), y verificar la suposición de que los errores
son independientes, se realiza una prueba de Bartlett.
Cálculos:
Las variancias de cada tratamiento son:
N = 18
n=6 S12 = 11.2
a= 3
S22 = 25.1

S32 = 14.6 103


Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

 (n i  1) S 2 i
5(11.2)  5(25.1) 5(14.6)
= Sp 
i 1 2
S p2  = 16.96
N a 15
a
q  ( N  a) log 10 S p  2
 (n
i 1
i  1) log 10 S i 2

q = 15 log10 16.96 – 5(log10 11.2 + log10 25.1 + log10 14.6)

q = 0.375

1 
a  1  1 1 1 1  1 
C  1 
3(a  1)  i 1
(ni  1) 1  ( N  a) 1 

C 1       
3(2)   5 5 5 5  15 

14 1 
C  1     = 1 11 = 1.122 C = 1.122
6  5 15  90

q 0.375
 0 2  2.3026  0 2  2.3026 = 0.7695  0 2 = 0.7695
c 1.122
Las hipótesis planteadas fueron:
H0: σ21= σ22=… σ2a
H1: lo anterior no es cierto al menos para una σ2i

2 .05, 2 = 5.99 como  0    ,a 1 se acepta la H0 y concluimos que las varianzas son


2 2

iguales, es decir la suposición de que los errores son independientes se considera correcta.

104
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

USO DE SOFWERE MINITAB


Para resolver un problema con el modelo unifactorial en Minitab se capturan los datos de la
manera como se observa en la tabla 3.25. Dichos datos son los trabajados en el ejemplo 3.1

Tabla 3.25 Manera de capturar los


datos en Minitab

Después de capturados los datos, dar clic en


“Estadísticas”, “ANOVA” “Un solo factor…”,
como se observa en la figura 3.2

Figura 3.2

105
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Figura 3.3 Ventana de diálogo de Minitab


Al aparecer la ventana de la figura 3.3;
seleccionar dando doble clic en la
columna donde se encuentran los datos
de la respuesta, y seleccionar también la
columna (datos) del factor.
Al seleccionar “aceptar” aparecerán los
resultados de la figura 3.4
Si se desea se le pueden pedir los
valores de los residuos, en cuyo caso se
selecciona “almacenar residuos”; lo
mismo es para los valores ajustados o
estimados. El resultado se puede
observar en la tabla 3.26
Puede cambiarse el nivel de confianza.

Figura 3.4 Resultado del ANOVA en Minitab

106
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Tabla 3.26. Residuos y valores estimados con Minitab eij

Además, el Minitab puede proporcionar los resultaos de comparaciones por pares; se pueden
trabajar las pruebas de Tukey, Fisher y la de Dunnett, como se observa en la ventana de
diálogo de la figura 3.5

Figura 3.5. Pruebas de comparación por pares

107
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

El resultado en las pruebas de comparaciones por pares aparecen mediante intervalos, se


compara cada uno de los tratamientos con todos los demás; si dicho intervalo atraviesa por
cero se consideran las dos medias iguales, figura 3.6

Cuando el I.C.
atraviesa por
cero,
Significa que no
hay diferencia
significativa. Es
decir los 2
tratamientos son
iguales.

Figura 3.6. Resultados de la prueba de Tukey

Además Minitab nos da diferentes gráficas, se le puede pedir cualquiera de las gráficas que
aparecen en la figura 3.7
La gráfica 3.2 que aparece en seguida es la gráfica de probabilidad normal del problema
analizado (ejemplo 3.1).

108
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Figura 3.7. Opciones de gráficas con Minitab

Gráfica 3.2 Resultado de la suposición de normalidad

109
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Ejercicios de repaso
3.1- (Fuente: Gutiérrez, De la Vara, 2008, p 94). Se hace un estudio sobre la efectividad de
tres marcas de spray para matar moscas . Para ello, cada producto se aplica a un grupo de 100
moscas, y se cuenta el número de moscas muertas expresado en porcentajes Se hacen seis
réplicas y los resultados obtenidos se muestran a continuación.
Marca de Número de réplica
spray 1 2 3 4 5 6
1 72 65 67 75 62 73
2 55 59 68 70 53 50
3 64 74 61 58 51 69

a) Formule la hipótesis adecuada y el modelo estadístico


b) ¿Existe diferencia entre la efectividad promedio de los productos en spray?
c) ¿Hay algún spray mejor? Argumente su respuesta
d) De un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada
una de las marcas.

3.2 – (Fuente: Hines, Montgomery, 1997, p 448). Se determinó el tiempo de respuesta en


milisegundos para tres tipos diferentes de circuitos utilizados en una calculadora electrónica.
Los resultados se presentan a continuación:

Tipo de
Tiempo de respuesta
circuito
1 19 22 20 18 25
2 20 21 33 27 40
3 16 15 18 26 17
a) Pruebe la hipótesis de que los tres tipos de circuito tienen el mismo tiempo de respuesta
b) Emplee la prueba de intervalo múltiple de Duncan para comparar pares de medias de
tratamiento
c) Analice los residuos de los datos de este problema.

3.3- (Fuente: Lind, Marchal, & Mason, 2004, p 432) Un analista financiero desea determinar si
hay diferencia en la tasa media de rendimiento de tres tipos de acciones de servicios públicos,
de comercio al menudeo y bancarios. Se obtuvo la siguiente información muestral

110
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Tasa de rendimiento
comercio menudeo bancarios
14.3 11.5 15.5
18.1 12 12.7
17.8 11.1 18.2
17.3 11.9 14.7
19.5 11.6 18.1
13.2
a) Utilizando el nivel de significancia 0.05, ¿existe alguna diferencia entre los tres tipos
de acciones, en la tasa media de rendimiento?
b) Supóngase que se rechaza la hipótesis nula, ¡puede concluir el analista financiero que
hay diferencia entre las tasas medias de rendimiento de las acciones de servicios
públicos y las de comercio al menudeo? Explique su respuesta.

3.4 - (Fuente: Gutiérrez, De la Vara, 2008, p 95). Para estudiar la confiabilidad de ciertos
tableros electrónicos para carros, se someten a un envejecimiento acelerado durante 100 horas
a determinada temperatura, y como variable de interés se mide la intensidad de corriente que
circula entre dos puntos, cuyos valores aumentan con el deterioro. Se probaron 20 módulos
repartidos de manera equitativamente en cinco temperaturas y los resultados obtenidos fueron
los siguientes:

20°C 40°C 60°C 80°C 100°C


15 17 23 28 45
18 21 19 32 51
13 11 25 34 57
12 16 22 31 48

a) Formule la hipótesis y el modelo estadístico para el problema.


b) Realice el análisis de varianza para estos datos, a fin de estudiar si la temperatura
afecta la intensidad de corriente promedio.
c) ¿La temperatura afecta la variabilidad de las intensidades? Es decir, verifique si hay
igual varianza entre los diferentes tratamientos.

3.5 – (Fuente: Cochran, Cox, 1990, p 122)


Resuelva el siguiente ejercicio utilizando un ANOVA y realice la prueba de comparación por
pares, utilizando el método de Dunnett, ya que en este problema se utilizó un control.
Se realizó un experimento para probar el efecto que tiene el azufre en la reducción de la roña de
la papa. El objeto de las aplicaciones de azufre es aumentar la acidez del suelo, ya que esta
enfermedad no prospera en suelos muy ácidos. Además de las parcelas sin tratamiento que se
utilizaron como testigo (control), se compararon 3 dosis: 300, 600, y 1200 kg por hectárea. Se
probaron aplicaciones de estas cantidades en otoño y primavera, de tal modo que resultaron 7
tratamientos distintos. El azufre se espolvoreó a mano sobre la superficie del suelo y luego fue

111
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

incorporado con rastra de discos a una profundidad de10 cm. El factor por analizar es el “índice
de roña”.
Se obtienen los resultados examinando 100 papas al azar de cada parcela, calificando cada
papa en una escala de 0 a 100% de infección y promediando. El diseño fue hecho
completamente al azar, con 4 repeticiones de cada aplicación de azufre.

Los resultados del experimento se muestran en el siguiente cuadro

F—otoño, S—aplicación de primavera 0 – testigo


Los números 3, 6 y 12 son las cantidades de azufre en 100 kg por hectárea

No olvide que la comparación por pares se realiza después de haber comprobado que hay
diferencia significativa entre los tratamientos por medio de una prueba de hipótesis (ANOVA)

3.6- Un vendedor tiene interés en aumentar el volumen de ventas de su producto (galletas) en


un gran supermercado, para lo cual se pone de acuerdo con el gerente a fin de exhibir su
mercancía en tres distintos lugares del supermercado durante un período de 5 semanas. El
vendedor eligió en forma aleatoria 3 ubicaciones para exhibir su producto cada semana. Se
obtuvieron las siguientes cifras de ventas.

Ventas semanales
Ubicación del exhibidor
1 2 3 4 5
Próximo al departamento de carnes 32 44 37 39 23
Próximo a las cajas registradoras 45 63 44 59 34
En la sección de galletas 30 28 16 21 22
a) Realice un ANOVA y de su conclusión sobre este análisis. Utilice un nivel de significancia
del 0.05%
b) Realice un análisis de comparación por pares utilizando el método de la mínima diferencia
significativa (LSD) y mencione cuál es el mejor lugar para exhibir este producto.
c) Analice los residuos de este problema
3.7 – Se ha realizado un experimento para determinar si 4 temperaturas específicas de
horneado afectan la densidad de un cierto tipo de ladrillo. El experimento proporcionó los
siguientes datos:

112
Ing. Industrial Estadística Inferencial II Capítulo 3
Modelo unifactorial

Temperatura Densidad
100 21.8 21.9 21.7 21.6 21.7
125 21.7 21.4 21.5 21.4
150 21.9 21.8 21.8 21.6 21.5
175 21.9 21.7 21.8 21.4
a) ¿Afecta la temperatura de horneado la densidad del ladrillo?
b) Compare los valores medios usando la prueba de inérvalos múltiples de Duncan
c) Realice un análisis de residuos y la prueba de Bartlett

3.8 – (Fuente: Gutiérrez, De la Vara, 2008, p 95). Los datos que se presentan enseguida son
rendimientos en toneladas por hectárea de un pasto con tres niveles de fertilización
nitrogenada. El diseño fue completamente aleatorizado, con cinco repeticiones por
tratamiento.

Niveles de nitrógeno
1 2 3
14.823 25.151 32.605
14.676 25.401 32.46
14.72 25.131 32.256
14.5141 25.031 32.669
15.065 25.267 32.111

a) ¿Las diferencias muestrales hacen obvia la presencia de diferencias poblacionales?


b) Obtenga el análisis de varianza e interprételo
c) Analice los residuos, ¿hay algún problema?
.

113