Está en la página 1de 44
Bloques aleatorizados, cuadrados latinos y disefios relacionados 4-1 DISENO DE BLOQUES COMPLETOS ALEATORIZADOS En cualquier experimento, la variabilidad que surge de un factor perturbador puede afectar los resulta dos. En general, un factor perturbador puede definirse como un factor del diseiio que probablemente tenga un efecto sobre la respuesta, pero en el que no existe un interés especifico. En ocasiones un factor perturbador es desconocido y no controlable; es decir, se desconoce la existencia de ese factor e incluso puede tener niveles variables mientras se est4 realizando el experimento. La aleatorizacién es la técnica de disefio que se utiliza para protegerse contra estos factores perturbadores “que estén al acecho”. En otros casos, el factor perturbador es conocido pero no controlable. Si por lo menos puede observarse el valor que asume el factor perturbador en cada corrida del experimento, es posible hacer la compensacién correspondiente en el andlisis estadistico mediante el uso del andlisis de covarianza, una técnica que se revisard en el capitulo 14. Cuando la fuente de variabilidad perturbadora es conocida y controlable, pue- de usarse una técnica de disefio llamada formacién de blogues para eliminar de manera sistemdtica su efecto sobre las comparaciones estadisticas entre los tratamientos. La formacién de bloques es una técni- ca de diseiio en extremo importante que se utiliza ampliamente en la experimentaci6n industrial, y es la materia de este capitulo. Para ilustrar la idea general, suponga que quiere determinarse si cuatro puntas diferentes producen o no lecturas diferentes en una maquina para probar la dureza. Un experimento como éste podria ser parte de un estudio de la aptitud en la calibracién de los instrumentos. La maquina funciona presionando la punta en un ejemplar de prueba de metal, y por la profundidad de la depresi6n resultante puede determi- narse la dureza del ejemplar. El experimentador ha decidido obtener cuatto observaciones para cada punta. Hay un solo factor—el tipo de punta— y un disefio completamente aleatorizado de un solo factor consistirfa en asignar al azar cada una de las 4 x 4 = 16 corridas a una unidad experimental, es decir, aun ejemplar de prueba de metal, y observar qué resulta de la lectura de la dureza. Por lo tanto, se necesita- rian 16 ejemplares de prueba de metal en este experimento, uno por cada corrida del diseiio. Existe un problema potencialmente serio con un experimento por completo aleatorizado en esta si- tuaciGn de diseito. Silos ejemplares de prueba de metal difieren ligeramente en sus durezas, como podria 126 4-1 DISENO DE BLOQUES COMPLETOS ALEATORIZADOS 127 ‘Tabla 4-1. Diseio ce bloques completos aleatorizados para el ‘Ejemplar de prueba 1 2 3 4 93 94 96 100 94 93 98 99 92 94 95 97 97 96 100 102 ocurrirsi se tomaran de lingotes que se produjeron con temperaturas diferentes, las nnidades experimen- tales (los ejemplares de prueba) contribuirdn a la variabilidad observada en los datos de la dureza, Como resultado, el error experimental reflejard tanto el error aleatorio como la variabilidad entre los ejempla- res de prueba. El objetivo seria hacer el error experimental tan pequefio como fuera posible; es decir, querria elimi- narse del error experimental la variabilidad entre los ejemplares de prueba. Un disefio para lograr esto requiere que el experimentador pruebe cada punta una vez.en cada uno de los cuatro ejemplares de prue- ba. A este disefio, que se muestra en la tabla 4-1, se le lama disefio de bloques completos aleatorizados (RCBD, randomized complete block design). La respuesta observada es la durezaen la escala C de Rockwell ‘menos 40. La palabra “completos” indica que cada bloque (ejemplar de prucba) contiene todos los tratamien- tos (puntas). Al utilizar este diseiio, los bloques o ejemplares de prueba forman una unidad experimental ‘més homogénea en la cual comparar las puntas. De hecho, esta estrategia de disefio mejora la precision de las comparaciones entre las puntas al eliminar la variabilidad entre los ejemplares de prueba. Dentro de un bloque, el orden en que se prueban las cuatro puntas se determina aleatoriamente. Observe la simili- tud de este problema de disefio con el de la secci6n 2-5, donde se analiz6 la prueba pareada. El diseiio de bloques completos aleatorizados es una generalizacién de ese concepto. EIRCBD es uno de los disefios experimentales mas utilizados. Son numerosas ias situaciones en las que el RCBD es apropiado. Las unidades de equipo o maquinaria de prueba son con frecuencia diferen- tes en sus caracteristicas de operaciOn y serian un factor de tormacion de bloques tipico. Lotes de materia prima, personas y el tiempo también son fuentes de variabilidad perturbadora comunes en un experimen- to que pueden controlarse de manera sistemética mediante la formacién de bloques. La formacién de bloques también puede ser Gtil en situaciones que no incluyen necesariamente fac- tores perturbadores. Por ejemplo, suponga que un ingeniero quimico esta interesado en el efecto de la ve- locidad de alimentaci6n del catalizador sobre la viscosidad de un polimero. Sabe que hay varios factores, como la fuente de la materia prima, la temperatura, el operador y la pureza de la materia prima, que son muy dificiles de controlar en proceso en gran escala. Por lo tanto, decide probar en bloques la velocidad de alimentaci6n del catalizador, donde cada bloque consiste en alguna combinacin de estos Factores no controlables. De hecho, est utilizando los bloques para probar la robustez de su variable de proceso (la velocidad de alimentacién) para las condiciones que no puede controlar con facilidad. Para un andlisis més amplio de este punto, ver Coleman y Montgomery [27], 4-1. Anilisis estadistico del diseio de bloques completos aleatorizados Suponga que se tienen, en general, a tratamientos que van a compararse y b bloques. El disefio de bloques completos aleatorizados se muestra en la figura 4-1. Hay una observaci6n por tratamiento en cada blo- ue, y el orden en que se corren los tratamientos dentro de cada bloque se determina al azar. Debido a Pa 128 CAPITULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISENOS RELACIONADOS Bloque 1 Bloqua 2 Bloque b mn Ya oe In Ja Ys Ya ga foes fmm Yor Yea Yo Figura 4-1 El disefio de bloques completos aleatorizados. que la tinica aleatorizacién de los tratamientos se hace dentro de los bloques, con frecuencia se dice que los bloques representan una restriceién sobre Ia aleatorizacién. El modelo estadistico del RCBD puede escribirse de varias maneras. El tradicional es el modelo de los efectos: 1) i Wy war +6, t0,f) donde es la media global, 7, es el efecto del tratamiento i-ésimo, f, es el efecto del bloque j-ésimo, ye, es el término del error NID(0, 0”) usual. Se considerard inicialmente que los tratamientos y los bloques son factores fijos. Como en el modelo del disefio experimental con un solo factor del capitulo 3, el modelo de los efectos para el RCBD es un modelo sobreespecificado. En consecuencia, los efectos de los tratamien- tos y los bloques se consideran por lo general como desviaciones de la media global, por lo que da oy 3B, =0 ‘También es posible usar un modelo de las medias para el RCBD, por ejemplo F=1, 2.50 % mote fen a, 1b donde, = +1, + f,. Sin embargo, en este capitulo se usaré el modelo de los efectos de la ecuaci6n 4-1. En un experimento en el que se use el RCBD, e! interés se encuentra en probar la igualdad de las me- dias de los tratamientos. Por Io tanto, las hipétesis de interés son Hy: My = =H, #,:al menos una, # 1, Puesto que la media del tratamiento -ésimo es4; = (1/b)ES..(u +1; + 8) =H + 1) una manera equivalen- te de escribir las hip6tesis anteriores es en términos de los efectos de los tratamientos, por ejemplo Hyit,=t,==1,=0 #,:t, #0 para al menos unai Seay, el total de observaciones hechas bajo el tratamiento i,y, el total de observaciones del bloque jy el gran total de las observaciones y N = ab el niimero total de observaciones. Expresado matematicamente, 4-1 DISENO DE BLOQUES COMPLETOS ALEATORIZADOS 129) Dw 7 2) % j=1,2, (43) y & b X= ZY WAD HAD ~(4-4) wt De manera similar, 7, ¢s el promedio de las observaciones hechas bajo el tratamiento i,j, es el promedio de las observaciones del bloque j, ¥_ es el gran promedio de todas las observaciones. Es decir, Kay Ypayjla YIN @5) La suma de cuadrados total corregida puede expresarse como SY o,-9 = SE 6.-9+0,-940)- 549 (4-6) Al desarrollar el miembro del lado derecho de la ecuacién 4-6 se obtiene 5 S on-3* ad 0-3)" D D> O77. 3,49, 4255) OL- 7.) -7) Ist+3.) Jat.) Mediante procedimientos algebraicos simples, pero laboriosos, se prueba que los tres productos cruzados son cero. Por lo tanto, SDS o-97=0E 0-97 Hed 6,-7.7 xy On tat fat en representa una partici6n de la suma de cuadrados total. Al expresar simbélicamente las sumas de cuadra- dos de la ecuaci6n 4-7, se tiene SSp = SSroanieate FSSriogees $55 (4-8) Puesto que hay N observaciones, SS, tiene N ~ 1 grados de libertad. Hay a tratamientos y b bloques, de donde SSisnisissY Sains tienen a —1yb—1 grados de libertad, respectivamente. La suma de cuadra- 130 CAPITULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS ¥ DISENOS RELACIONADOS dos del error es s6lo la suma de cuadrados entre las celdas menos la suma de cuadrados de los tratamien- tosy los bloques. Hay ab celdas con ab ~ 1 grados de libertad entre ellas, de donde SS; tiene ab~1—(a~1) = (6-1) = (@—-1)(0-1) grados de libertad. Ademas, la suma de los grados de libertad del lado derecho de Ia ecuaci6n 4-8 es igual al total del lado izquierdo; por lo tanto, al establecer los supuestos de normalidad usuales para los errores, puede usarse el teorema 3-1 para demostrar que SSrrsmissa/0, SSpioed@? ¥ ‘SS,/o? son variables aleatorias ji-cuadrada con distribuciones independientes. Cada suma de cuadrados dividida por sus grados de libertad es un cuadrado medio. Puede demostrarse que el valor esperado de los cuadrados medios, si los tratamientos y los bloques son fijos, es b EMS yrssiencs = 0 + a-1 a> Bi BMS ages) = O° + ELMS, Por lo tanto, para probar Ia igualdad de las medias de los tratamientos, se usarfa el estadistico de prueba MS saieics MS, itica es la cola superior de que se distribuye como F, 1-1 Sila hip6tesis nula es verdadera. La regién la distribucion F, y Hy se rechazaria si Fy > Fy, «1, -1yer ‘También podria haber interés en comparar las medias de los bloques porque, en caso de que la dife- rencia entre estas medias no sca considerable, quizé no sea necesaria la formacién de bloques en experi- ‘mentos futuros. Por los cuadrados medios esperados, aparentemente la hip6tesis Hy, = 0 puede probarse comparando el estadistico Fy = MSpouedMSp cOn F,, 5.1, esyo-1y Sin embargo, recuerde que la aleatorizaci6n s6lo se ha aplicado a Jos tratamientos dentro de los bloques; es decir, los bloques represen- tan una restriccién sobre Ia aleatorizacién, (Qué efecto tiene esto sobre el estadistico Fy = MSq. qw/MS,? Existen diferentes puntos de vista para abordar esta cuesti6n, Por ejemplo, Box, Hunter y Hun- ter [18] sefialan que la prueba F del andlisis de varianza comin puede justificarse exclusivamente con base en la aleatorizaci6n,’ sin el uso directo del supuesto de normalidad. Agregan que en la prueba para com- parar las medias de los bloques no puede recurrirse a dicha justificacion debido a la restricci6n sobre la aleatorizaci6n; pero si los errores son NID(0, 0°), puede usarse el estadistico Fy = MSpioque/MS, para comparar las medias de los bloques. Por otra parte, Anderson y McLean (2] argumentan que la restric- ci6n sobre la aleatorizacién impide que este estadifstico sea una prueba significativa para comparar las medias de los bloques y que este cociente F es en realidad una prucba de la igualdad de las medias de los bloques mas la restriccin sobre la aleatorizaci6n (a la que laman el error de la restricci6n; ver Anderson y McLean [2] para detalles adicionales). Entonces, {qué se hace en ia practica? Debido a que con frecuencia el supuesto de normalidad es cuestionable, considerar Fy = MSyipqye//MS, como una prueba F exacta para la igualdad de las medias de los bloques no es una buena préctica general. Por esa raz6n, esta prueba F no se incluye en la tabla del anélisis de varianza, Sin embargo, como un procedimiento aproximado para investigar el efecto de la va- riable formacién de bloques, examinar el cociente MS jroqae/MS, es muy razonable. Sieste cociente es muy ‘De hecho, ia distibucin F de la teorfa normal es una aproximacibn de la distribucioa de aleatorizacida generada al calcular Fa partir de cada asignacién posible de ls respuesta alos tratamentos. 41 DISENO DE BLOQUES COMPLETOS ALEATORIZADOS 131. ‘abla 4-2 _Andlsis de varianza de un diseio de bloques completosaleatorizados Fuente de Grados de variacion Suma de cuadrados libertad Cuadrado medio fe ‘Tratamientos ‘SSrrasniemee a-1 SSrmumias, MSyrasia “al MS, Bloques SSoroguee bal SS b-1 7 Error Se (-1)0-1) SS, NOD) ‘otal SSr Net grande, implica que el factor formacién de bloques tiene un efecto considerable y que la reduccién del ruido obtenida por la formacién de bloques probablemente fue titil para mejorar la precisiGn de la com- paracién de las medias de los tratamientos. El procedimiento suele resumirse en un esquema de andlisis de varianza, como el que se muestra en la tabla 4-2. En general, los cAlculos se realizarfan con un paquete de software de estadistica. Sin embar- g0, €s posible obtener formulas de célculo manual de las sumas de cuadrados para los elementos de la ecuacién 4-7 expresdndolos en términos de los totales de los tratamientos y los bloques. Estas formulas de célculo son (49) (4-10) (4-11) SS, Considere el experimento de la prueba de la dureza de la secci6n 4-1. Hay cuatro puntasy cuatro ejempla- res de prueba de metal. Cada punta se prueba una vez en cada ejemplar, resultando un disefio de bloques completos aleatorizados. Los datos obtenidos se repiten por conveniencia en la tabla 4-3. Recuerde que clorden en que se probaron las puntas en un ejemplar particular se determiné al azar. Para simplificar los Tabla 4-3 Disetio de bloques completos aleatorizados para el cexperimento de la prueba de la dureza ‘Ejemplar de prueba (bloque) Tipo de punta 1 23 1 93 94 96 100 2 94 93 98 99 3 92 94, 97 4 97 96 10.2 LATINOS Y DISENOS RELACIONADOS 132 CAPITULO 4 BLOQUES ALEATORIZADOS, CUADRADC ‘Tabla 4-4 Datos codificados del experimento de la prueba de la dureza_ ‘Tipo de punta we 1 3 2 4 3 2 4 15 clculos, los datos originales se codifican restando 9.5 de cada observacién y multiplicando el resultado por 10. Se obtienen asflos datos de la tabla 4-4, Las sumas de cuadrados se obtienen de la siguiente manera: =D HH as om 16, SSrrnacs = aS) wn = 154,00- = 129.00 aor eo +(-2)? +15)? J- @y 2a = 38.50 Sac = 5 By y- =4 day? 4-3) +09? +18)" ]- - ar = 82.50 Sg = SSp— SSruasienos — SSprocees = 129,00~ 38.50- 82.50= 8.00 En la tabla 4-5 se presenta ef andlisis de varianza. Utilizando a = 0.05, el valor critico de F es Frass9 = 3,86. Puesto que 14.44 > 3.86, se concluye que el tipo de punta afecta la lectura de la dureza media. El va- lor P para la prueba también es muy pequefio. AdemAs, al parecer los ejemplares (bloques) difieren de manera significativa, ya que el cuadrado medio de Ios bloques es grande en relacién con el error. Es interesante observar los resultados que se habrian obtenido si no se hubiera tenido conocimiento de los disefios de bloques aleatorizados. Suponga que se usaran cuatro ejemplares, asignando al azar las puntas a cada uno de ellos, y que resultara (por casualidad) el mismo disefto que el de la tabla 4-3. El and lisis incorrecto de estos datos como un disefio completamente aleatorizado de un solo factor se presenta en la tabla 4-6, ‘Tabla 4-5 Analisis de varianza del experimento de fa prueba de la dureza Fuente de Suma de Grados de ‘Cuadrado variaci6n ____euadrados libertad ‘medio _ fh Valor P ‘Tratamientos (tipo de punta) 38.50 3 1283 1444 0.0009 Blogues (ejemplares) 82.50 3 27:50 Error 8.00 9 0.89 Total 129.00 15 41 DISENO DE BLOQUES COMPLETOS ALEATORIZADOS 133 Tabla 4-6 —Anilisisincorrecto del experimento de la prueba de la dureza como un disefio completamente aleatorizado Fuente de Sumade Gradosde — Cuadrado variacién __cuadrados__libertad_—medio Fy. Tipo de punta 3850 3 1283 1.70 . Error 90.50 2 754 Total 129.00 5 Puesto que Fyasa2 = 3.49, no puede rechazarse la hip6tesis de la igualdad de las mediciones de la dureza media de las cuatro puntas. Por Io tanto, el disefio de bloques aleatorizados reduce lo suficiente la cant dad de ruido en los datos para que las diferencias entre las cuatro puntas sean detectadas. Esto ilustra un punto muy importante. Si un experimentador no recurre a la formacién de bloques cuando deberfa ha- berlo hecho, el efecto puede ser inflar el error experimental a tal grado que las diferencias importantes entre las medias de los tratamientos sean indetectables. Muestra de salida de computadora En a figura 4-2 se muestra la salida de computadora condensada obtenida con Design-Expert para los da- tos de la prueba de la dureza del ejemplo 4-1. Recuerde que en el andlisis original de la tabla 4-5 se utiliza- ron datos codificados. (Las respuestas originales se codificaron restando 9.5 y multiplicando el resultado por 10.) El andlisis de computadora utiliz6 las respuestas originales. Por consiguiente, las sumas de cua- Grados de la figura 4-2 son iguales a las de la tabla 4-5 divididas entre 100 (observe que Design-Expert ha redondeado las sumas de cuadrados con dos cifras decimales). Los residuales se enlistan en la parte inferior de la salida de computadora. Estos se calculan como &5 = I~ Sy y, como se demostrara mas adelante, los valores ajustadus son J, i. + ¥)- J» de donde y= YI, I; FY. (4-13) En la seccién siguiente se indicara c6mo se usan los residuales en la verificacién de la adeeuacién del modelo. ¢ Comparaciones multiples Silos tratamientos en un RCBD son fijos, y el andlisis indica una diferencia significativa en las medias de Jos tratamientos, al experimentador le interesarn por lo general comparaciones miltiples para descubrit cuéles son los tratamientos cuyas medias difieren. Para ello puede utilizarse cualquiera de los procedi- mientos de comparaciones miltiples del capitulo 3 (secci6n 3-5). Simplemente se sustituye en las f6rmu- las de la seccién 3-5 el mimero de réplicas (n) en el disefio completamente aleatorizado de un solo factor con el ndimero de bloques (b). Asimismo, es necesario recordar usar el nimero de grados de libertad del error para el bloque aleatorizado [(a ~ 1)(b~ 1)] en lugar de los grados de libertad del disefio completa mente aleatorizado [a(n ~ 1)]. En la salida de Design-Expert de la figura 4-2 se ilustra el procedimiento LSD de Fisher. Observe que si se usa a = 0.05, se concluiria que 1 = 1,. Ahora bien, puesto quey,, F Block 082 3 0.27 Model 0.38 3 0.13 14.44 0.0009 significant A 038 3 013 1444 = 0.0009 Rosidual 0.080 9 88896-0083 Cor 129015 . Total Std. Dev. 0.094 R-Squared 0.8280 Mean 9.63 Adj R-Squared 0.7708 cy. o98 Pred R-Squared 0.4563 PRESS 0.28 Adeq Precision 18.635 ‘Treatment Means (Adjusted, If Necessary) Estimated Standard Mean Error TAL 9.57 0.47 202 9.60 0.87 BAZ 9.45 0.47 4A4 (9.88 0.87 Mean Standard t for Ho Treatment Difference = DF. Error Coeff=0 Prob >|t| 1vs2 0.025 1 0.087 0.7163 1vs3 0.13 1 0.087 0.0935 vs4 0.30 1 0.087 0.0015 2vs3 0.16 1 0.087 0.0510 2vs4 -0.27 1 0.087 0.0026 3vs4 0.43 1 0.087 0.0001 Diagnostics Case Statistics Standard Actual Predicted Student Cook's Outlier Order Value. —-Value-—-Residual Leverage Residual Distance 1 930 9,35 -0.050 0.438 0.707 0.056 2 940 9.38 0.025 0.438 0.354 © 0.014 3 9.60 967 -0.075 0.437 1.061 0.125 4 10.00 9.90 0.100 0.438, 1414 0.222 5 9.40 9.38 0.025 0.438 0.354 (0.014 6 9.30 940-0100 0437 1.414 0.222 7 9.80 9.70 0.100 0.437 1414 0.222 8 990 993 0.025 0.437 -0.354 0.014 9 920 9.22. -0.025 0.438 0.014 10 940 9,25 0.160 0.437 2.121 0.500 n 950 955 0.050 0.437 0.056 2 970 9.78 = 0.075 0.437 1.061 0.125 13 9.70 9.65 0.050 0.438 0.707 0.056 4 9.60 968 0.075 0.437 1.061 0.125 5 10.00 9.97 0.028 0.437 0354 © 0.014 (0.336 16 10.20 10.20 0.000 0.437 0.000 0.000 0.000 Figura 4-2 Salida de Design-Expert (condensada) para el ejemplo 4-1. 4-1 DISENO DE BLOQUES COMPLETOS ALEATORIZADOS 135 Punta Punta Punta Punte 3 12 4 1 st a ° 3 2 3 4 Dureza promecio (codcads} Figura4-3 Las mediasdel tipo de punta en elaci6n con una distribucion tesca- Jada con un factor de escalacién JMS, 7b = V08574 =047. ‘También puede usarse el procedimiento grafico del capitulo 3 (seccién 3-5.1) para comparar las me- dias del tipo de punta. En la figura 4-3 se grafican las cuatro medias del tipo de punta del ejemplo 4-1 en relaci6n con una distribucién t escalada con un factor de escalacién MS, /b = 0.8974 = 0.47. Esta gré- fica indica que las puntas 1, 2y 3 producen probablemente mediciones de la dureza promedio idénticas, pero que la punta 4 produce una dureza media mucho més alta, Esta figura confirma los resultados de la prueba LSD de Fisher incluida en la salida de Design-Expert de la figura 4-2. 41.2 Verificacién de la adecuaci6n del modelo Se ha comentado ya la importancia de verificar la adecuaci6n del modelo supuesto. En general, deberé estarse alerta a los problemas potenciales con el supuesto de normalidad, con la desigualdad de la varian- za por tratamiento o bloque, y con la interaccién bloque-tratamiento. Como en el disefio completamente aleatorizado, el andlisis residual es la herramienta principal que se utiliza en estos diagndsticos de verifi- cacién. Ena parte inferior de la salida de Design-Expert de la figura 4-2 se enlistan los residuales del dise- fio de bloques aleatorizados. Los residuales codificados se encontrarfan multiplicando estos residuales por 10. Las observaciones, los valores ajustados y los residuales de los datos codificados de la prueba de la dureza del ejemplo 4-1 son los siguient 150 050 O75 0.50 075 025 2.00 100 5.00 7.00 7.00__0.00 En la figura 4-4 se muestra la grafica de probabilidad normal y el diagrama de puntos de estos resi- duales. No hay indicios marcados de no normalidad y tampoco hay evidencia que apunte a la posible pre sencia de puntos atipicos. En la figura 4-5 se muestran las gréficas de los residualcs por tipo de punta o 136 CAPITULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS ¥ DISENOS RELACIONADOS % de probabilded normal 1 n L L L 04 “0.0378 0.028 0.0875 0.18 esiuaios Figura 44 Grifica de probabilidad normal de los residuales del ejemplo 4-1, tratamiento y por ejemplar de prueba o bloque. Estas gréficas podrfan ser, potencialmente, muy informa tivas. Sihay una dispersi6n mayor en los residuales de una punta particular, esto podria indicar que dicha punta produce lecturas de la dureza més erraticas que las otras. Una dispersiGn mayor en los residuales de un ejemplar de prueba particular podrfa indicar que la dureza del ejemplar no es uniforme. Sin embargo, enel ejemplo tratado aqui, Ia figura 4-5 no ofrece indicios de desigualdad de la varianza por tratamiento 0 por bloque. En la figura 4-6 se grafican los residuales contra los valores ajustados , . No deberé haber re- laci6n entre el tamafio de los residuales y los valores ajustados 9. En esta gréfica no se observa nada de interés extraordinario, En ocasiones la grafica de los residuales contra 9, tiene una forma curvilinea; por ejemplo, puede ha- ber tna tendencia para que ocurran residuales negativos con valores bajos de J,,residuales positivos con valores intermedios de ), y residuales negativos con valores altos de J,. Este tipo de patron sugiere la existencia de una interaccién entre los bloques y los tratamientos. Cuando se presente este patron, debe- r4 usarse una transformaci6n en un esfuerzo por eliminar 0 minimizar la interaccin. En el capitulo 5 (secci6n 5-3.7) se describe una prueba estadistica que puede utilizarse para detectar la presencia de in- teracci6n en un disefio de bloques aleatorizados. 4-13. Otros aspectos del disetio de bloques completos aleatorizados Aditividad del modelo de bloques aleatorizados EI modelo estadistico lineal que se ha usado para el disefio de bloques aleatorizados Jy = MAT, AB He, 4-1 DISENO DE BLOQUES COMPLETOS ALEATORIZADOS 137 poop Pa “er 1 2 3 4 val Two ea ee aol sot oO Pe a ee or 1 2 | veal Emr de prche ' Beco owe Figura 4-5 Grafica de los residuales por tipo de punta (trate- miento)y por ejemplar de prueba (bloque) para clejemplo 4-1. es completamente aditivo. Esto quiere decir que, por ejemplo, si el primer tratamiento hace que la res- puesta esperada se incremente cinco unidades (c, = 5) y si el primer bloque incrementa la respuesta { esperada 2 unidades (, = 2), el incremento esperado en la respuesta tanto del tratamiento 1 como del } 150 . | 1.90 oo. 0 . | = 000 agua 4.6. GrdSca dos sls conta 5 pra jempo | 138 CAPITULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISENOS RELACIONADOS bloque 1 en conjunto es B(y,:) = +1, +8, =4 + 5+ 2=4 +7. En general, el tratamiento 1 incrementa siempre la respuesta esperada 5 unidades sobre la suma de la media global y del efecto del bloque. Aun cuando este modelo aditivo simple muchas veces es titil, hay situaciones en las que resulta inade- cuado. Suponga, por ejemplo, que se estén comparando cuatro formutaciones de un producto quimico utilizando seis lotes de materia prima; los lotes de materia prima se consideran bloques. Si una impureza en el lote 2 afecta de manera adversa la formulaci6n 2, dando como resultado un rendimiento inusual- mente bajo, pero no afecta las demas formulaciones, ha ocurrido una interaccién entre las formulaciones (0 tratamientos) y los lotes (0 bloques). De manera similar, pueden ocurrir interacciones entre los trata- mientos y los bloques cuando la respuesta se mide en la escala incorrecta. Por o tanto, una relaci6n que es multiplicativa en las unidades originales, por ejemplo Elyg)= ue B; es lineal o aditiva en una escala logaritmica, ya que, por ejemplo, In A(y,)=Iny+ine, +InB, Ey) = we +0, +B; Aun cuando este tipo de interaccién puede eliminarse con una transformaci6n, no todas las interacciones pueden tratarse con tanta facilidad. Por ejemplo, una transformacién no elimina la interacei6n formula- cidn-lote que se seiial6 antes. El andlisis residual y otros procedimientos de diagndstico de verificaci6n pueden ser titiles para detectar la no aditividad. Si una interacci6n est4 presente, puede afectar seriamente el andlisis de varianza y posiblemente lo invalide. En general, la presencia de una interacci6n infla el cuadrado medio del errory puede afectar ad- versamente la comparacién de las medias de los tratamientos. En situaciones en las que ambos factores, as{ como su posible interaccién, son de interés, deben usarse disefios factoriales. Estos disefios se anali- zan en detalle en los capitulos 5 al 9. ‘Tratamientos y bloques aleatorios ‘Aun cuando el procedimiento de prueba se ha descrito considerando los tratamientos y los bloques como factores fijos, se utiliza el mismo procedimiento de andlisis silos tratamientos o los bloques (o ambos) son aleatorios. Sin embargo, hay algunas modificaciones en la interpretaci6n de los resultados. Por ejemplo, silos bloques son aleatorios, como es con mucha frecuencia el caso, se espera que las comparaciones en- tre los tratamientos sean las mismas a lo largo de la poblacién de bloques de la cual se seleccionaron alea- toriamente para realizar el experimento. Estén también las modificaciones correspondientes en los cuadrados medios esperados. Por ejemplo, silos bloques son variables aleatorias independientes con va- rianza comin, entonces E(MSyieque,) = 0° + a0, donde a7 es el componente de la varianza de los efectos de los bloques. En cualquier situaci6n, E(MSquisniis) Siempre esté libre de cualquier efecto de bloque, y elestadistico de prueba para la variabilidad entre los tratamientos siempre es Fy = MSrraanieniod MSy. En situaciones en las que los bloques son aleatorios, si esta presente una interaccidn tratamien- to-bloque, las pruebas para las medias de los tratamientos no estan afectadas por la interacci6n, La razon de ello es que los cuadrados medios esperados de los tratamientos y del error contienen ambos el efecto de la interacci6n; por consiguiente, la prueba de las diferencias en las medias de los tratamientos puede realizarse como de costumbre comparando el cuadrado medio de los tratamientos con el cuadrado medio del error. Este procedimiento no proporciona ninguna informacién acerca de la interaccién. 4-1 DISENO DE BLOQUES COMPLETOS ALEATORIZADOS 139. Elecci6n del tamafio de la muestra La elecci6n del tamaio de la muestra, o mimero de bloques que deben correrse, es una decisi6n impor- tante cuando se usa un RCBD, Al incrementar el mimero de bloques, se incrementa el ntimero de réplicas yel némero de grados de libertad del error, con lo cual se aumenta la sensibilidad del diseiio. Cualquiera de las técnicas descritas en el capitulo 3 (secci6n 3-7) para seleccionar el néimero de réplicas que deben correrse en un experimento completamente aleatorizado con un solo factor puede aplicarse de forma di- recta al RCBD. Para el caso de un factor fijo, las curvas de operacién caracteristica de la parte V del apén- dice pueden usarse con (4-14) donde haya~1 grados de libertad en el numeradory (a~1)(b~1) grados de libertad en el denominador. EJEMPLO 4-2 - Considere el problema de la prueba de la dureza del ejemplo 4-1. Suponga que quiere determinarse et ni- mero apropiado de bloques que deben correrse si el interés se encuentra en detectar una diferencia maxi- ma real en las lecturas de la dureza media de 0.4 con una alta probabilidad, y una estimacién razonable de la desviacion estandar de los errores es o = 0.1. (Estos valores se dan en las unidades originales; recuerde que el andlisis de varianza se realiz6 usando datos codificados. ) Por la ecuaci6n 3-49, el valor minimo de ©? es (escribiendo b, el néimero de bloques, en lugar de n) > _ bb? o 2a0* donde D es la diferencia maxima que quiere detectarse. Por lo tanto, (0.4)? 2(4)(0.1)? Siseusanb = 3 bloques, entonces ® = VZ0b = VEU) = 2.45, y hay (a - 1)(b-1) = 3(2) = 6 grados de li- bertad del error. La parte V del apéndice conv, 3ya = 0.05 indica que el riesgo f de este diseio es aproximadamente 0.10 (potencia = 1-f = 0.90). Sise usan b = 4 bloques, ® = V2.0b = V20(4) = 2.83, con (a ~ 1)(b~ 1) = 3(3) = 9 grados de libertad del error, y el riesgo 8 correspondiente es aproximada- mente 0.03 (potencia = 1—f = 0.97). Tres 0 cuatro bloques darén como resultado un disefio con una alta probabilidad de detectar la diferencia entre las lecturas de la dureza media consideradas importantes. Debido a que los ejemplares de prueba (bloques) son baratos y estén en disponibilidad y el costo de la prueba es bajo, el experimentador decide usar cuatro bloques. Estimaci6n de valores faltantes Cuando se usa el RCBD, en ocasiones falta una observacién en uno de los bloques. Esto puede ocurrir de- bido a descuido o error o por razones fuera del control del experimentador, tal como un dafto inevitable a una unidad experimental. Una observacién faltante introduce un nuevo problema en el andlisis debido a que los tratamientos dejan de ser ortogonales a los bloques; es decir, no ocurren todos los tratamientos en 140 CAPETULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISENOS RELACIONADOS Tabla 4-7 Disefio de bloques completos aleatorizados para el experimento de la prueba de dureza con un valor falta ‘Tipo de punta cada uno de los bloques. Existen dos enfoques generales para el problema de los valores faltantes, El pri- mero es un andlisis aproximado, en el cual la observacién faltante se estima y se lleva a cabo el andlisis de varianza usual como sila observacién estimada fuera un dato real, con los grados de libertad del error re- ducidos en 1. Este andlisis aproximado es materia de esta secci6n. El segundo es un anglisis exacto, el cual se revisa en la secci6n 4-1.4, Suponga que falta la observaci6n y, del tratamiento i en el bloque j. La observaci6n faltante se denota como x. Como una ilustraci6n, suponga que en el experimento de la prueba de dureza del ejemplo 4-1 el ejemplar de prueba 3 se rompié mientras se probaba la punta 2 que no pudo obtenerse el dato para esa punta, Los datos aparecerfan como en Ia tabla 4-7. En general, se hard que y’ represente el gran total con una observaci6n faltante, que y, represente el total del tratamiento con una observaci6n faltante, y que y’, sea el total del bloque con una observaci6n faltante. Suponga que quiere estimarse la observaci6n faltante x de tal modo que.x tenga una participa- cién minima en la suma de cuadrados del error. Puesto que SS; = 57.,2?_,(y,—J, J, +3)’, esto es equivalente a elegir x para minimizar (415) donde R incluye todos los términos en los que no interviene x. A partir de dSS,/dx=0, se obtiene ay t+ by — YE (a-1)(6=1) como la estimacién de la observaci6n faltante. Para los datos de la tabla 4-7, se encuentra que y, = 1, y', = 6y y! = 17. Porlo tanto, por la ecuacién 416, (4-16) _ AQ) +4(6)—17 FIG) Ahora puede realizarse el andlisis de varianza comin utilizando yz, = 1.22y reduciendo los grados de li § bertad del error en 1. El andlisis de varianza se muestra en la tabla 4-8. Compare los resultados de este anilisis aproximado con los resultados obtenidos para el conjunto de datos completo (tabla 4-5). 4-1 DISENO DE BLOQUES COMPLETOS ALEATORIZADOS 141 ‘Tabla 4-8 _Anilisis de varianza aproximado del ejemplo 4-1 con un valor faltante ‘Sumade Grados de ‘Cuadrado Fuente de variacién cuadrados libertad ‘medio fo Valor P Tipo de punta 39.98 3 13.33 17.12 0.0008 Fjemplares de prueba (bioques) 7953 3 2651 Error 6.22 8 078 Total 125.73 4 Si son varias las observaciones faltantes, pueden estimarse escribiendo la suma de cuadrados del error como una funcién de los valores faltantes, derivando con respecto a cada valor faltante, igualando los resultados con cero y resolviendo las ecuaciones resultantes. De manera alternativa, puede usarse la ecuacién 4-16 de manera iterativa para estimar los valores faltantes, Para ilustrar el enfoque iterativo, su- ponga que faltan dos valores. Se estima arbitrariamente el primer valor faltante y después se usa este va- or junto con los datos reales y la ecuaci6n 4-16 para estimar el segundo. Entonces puede usarse la ecuacién 4-16 para volver aestimar el primer valor faltante, y después de esto, puede volver aestimarse el segundo. Este proceso se contintia hasta que se obtiene la convergencia. En cualquier problema con valo- res faltantes, los grados de libertad del error se reducen en una unidad por cada observacién faltante. 4-14 Estimaci6n de los pardmetros del modelo y Ia prueba general de significaci6n de la regresién Si tanto los tratamientos como los bloques son fijos, los parémetros del RCBD pueden estimarse por mi- nimos cuadrados. Recuerde que el modelo estadistico lineal es 1, 2..5@ Lund yrats 4b, yf #17 Alaplicar las reglas de la secci6n 3-9,2 para encontrar las ecuaciones normales del modelo de un diseio experimental, se obtiene ap, + ap, + + a Mab + bit bh to +b + Be = y. ty bh + bt + ht hoot Bam bn + bt + B+ hte Bem te ba +b + Bt tet R=, (4-18) Bi ah +h th bon He =a Bra +t th ton +h = ya Ba ak +h th bo te + ap, = ys Observe que la suma de la segunda a la (a + 1)-€sima ecuaciones de la ecuaci6n 4-18 es la primera ecuaciéu normal, como también es el caso de las b iltimas ecuaciones. Por lo tanto, hay dos dependencias 142 CAPITULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS ¥ DISENOS RELACIONADOS lineales en las ecuaciones normales, lo cual implica que deben imponerse dos restricciones para resolver Ia ecuaci6n 4-18. Las restricciones usuales son (4-19) Alutilizar estas restricciones, las ecuaciones normales se simplifican considerablemente. De hecho, que~ dan como (420) cuya solucién es (421) Al utilizar la soluci6n de la ecuacién normal de la ecuaci6n 4-21, puede encontrarse el valor estimado o ajustado de y, como j= Art, +B, 5. +(Y, =, +),-3. Este resultado se us6 anteriormente en la ecuaci6n 4-13 para calcular los residuales de un disefio de blo- ques aleatorizados. ‘La prueba general de significacién de la regresién puede usarse para desarrollar el andlisis de varian- za del disefio de bloques completos aleatorizados. Al utilizar la solucién de las ecuaciones normales dada por la ecuacién 4-21, la reducci6n en la suma de cuadrados para ajustar el modelo completo es Ru B=. 4D 84D By, 40-3.) =99,4¥ O-I. 4D 0-H, con a + b~ 1 grados de libertad, y la suma de cuadrados del error es $5,= Dy RWB) 4-1 DISENO DE BLOQUES COMPLETOS ALEATORIZADOS 143 con (a ~ 1)(b ~ 1) grados de libertad. Compare esta tiltima ecuacién con SS, en la ecuaci6n 4-7. Para probar la hip6tesis Hg:r; = 0, el modelo reducido es Vg =H+B te, que es un andlisis de varianza de un solo factor. Por analogfa con la ecuacién 3-5, la reduccién en la suma de cuadrados para ajustar el modelo reducido es s Runp)= >, 2 rt que tiene b grados de libertad. Por lo tanto, la suma de cuadrados debida a {r,} después de ajustar zy {Bj} es R(x], B)= Rt, B)— R(t B) = R(Modelo completo)— R(Modelo reducido) aS US Ue So “2th a a 2a Sy He b ab expresiGn que se identifica como la suma de cuadrados de Ios tratamientos con a ~ 1 grados de libertad (ecnacién 4-10). La suma de cuadrados de los bloques se obtiene ajustando el modelo reducido My = RAT, Hey que también es un anlisis de un solo factor. De nueva cuenta, por analogfa con la ecuaci6n 3-5, la reduc- cién en la suma de cuadrados para ajustar este modelo es R(u,7) b con a grados de libertad. La suma de cuadrados de los bloques {f,} después de ajustar uy {1,} es R(Al ut) = Rut, B)~ (4,2) con b ~ 1 grados de libertad, la cual se habfa dado anteriormente como la ccuacién 4-11. Se han desarrollado las sumas de cuadrados de los tratamientos, de los bloques y del error en el dise- fio de bloques completos aleatorizados utilizando la prueba general de significacién de la regresin. Aun cuando la prueba general de significacién de la regresi6n no se usarfa ordinariamente para hacer el andli- sis real de los datos en un bloque completo aleatorizado, en ocasiones el procedimiento resulta itil en di- sefios de bloques alcatorizados més generales, como los que se revisan en la seccién 4-4, 144 CAPITULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISENOS RELACIONADOS Anilisis exacto del problema del valor faltante En la secci6n 4-13 se present6 un procedimiento aproximado para solucionar las observaciones faltantes enel RCBD. Este andlisis aproximado consiste en estimar el valor faltante de tal modo que se minimice el cuadrado medio del error. Puede demostrarse que el andlisis aproximado produce un cuadrado medio sesgado de los tratamientos en el sentido de que E(MSrasieuos) &S Mayor que E(MS,) sila hip6tesis nula es verdadera. Por consiguiente, se reportan demasiados resultados significativos. El problema del valor faltante puede analizarse exactamente utilizando la prueba general de significaci6n de la regresi6n. El valor faltante hace que el diseito sea no balanceado, y dado que no todos Ios tratamientos ocurren en todos los bloques, se dice que los tratamientos y los bloques no son ortogona- les. Este método de andlisis también se usa en tipos mas generales de disefios de bloques aleatorizados; el tema se analiza con mayor amplitud en la secci6n 4-4, En el problema 4-26 se le pide al lector que realice el anilisis exacto para un disefio de bloques completos aleatorizados con un valor faltante. 4-2 DISENO DE CUADRADO LATINO En la secci6n 4-1 se introdujo el disefio de bloques completos aleatorizados como un disefio para reducir el error residual de un experimento al eliminar la variabilidad debida a una variable perturbadora conoci- da y controlable. Hay otros tipos de diseiios que utilizan el principio de la formaci6n de bloques. Por ejemplo, suponga que un experimentador estudia los efectos que tienen cinco formulaciones diferentes de la carga propulsora utilizada en los sistemas de expulsiGn de la tripulaci6n de un avi6n basado en la ra- pidez de combustién. Cada formulacién se hace con un lote de materia prima que s6lo alcanza para pro- bar cinco formulaciones. Ademés, las formulaciones son preparadas por varios operadores, y puede haber diferencias sustanciales en las habilidades y experiencia de los operadores. Por lo tanto, al parecer hay dos factores perturbadores que serén “calculados en promedio” en el diseiio: los lotes de materia pri- ma y los operadores. El disefio apropiado para este problema consiste en probar cada formulaci6n exac- tamente una vez con cada uno de los cinco operadores. Al disefio resultante, ilustrado en la tabla 4-9, se le lama disefio de cuadrado latino. Observe que el disefio es un arreglo cuadrado y que las cinco formula- ciones (0 tratamientos) se denotan por las letras latinas 4, B, C, Dy E; de ahi el nombre de cuadrado lati- no, Se observa que tanto los lotes de materia prima (renglones) como los operadores (columnas) son ortogonales a los tratamientos. El disefio de cuadrado latino se usa para eliminar dos fuentes de variabilidad perturbadora; es decir, permite hacer la formaci6n de bloques sistemstica en dos direcciones. Por lo tanto, los renglones y las co- Jumnas representan en realidad das restricciones sobre la aleatorizacién. Bn general, un cuadrado latino para p factores, 0 cuadrado latino p X p, es un cuadrado con p renglones y p columnas. Cada una de las p?* ‘Tabla 4-9 _Disefio del cundrado latino para el problema de la carga propulsora Totes de inateria Operadores prima “1 2 3 3 1 A B c E 2 B c D 4 3 c D E B 4 D E A c 5 E A B D

También podría gustarte