Está en la página 1de 54
Disefio de experimentos y analisis de varianza CONTENIDO ESTADISTICA EN LA PRACTICA: BURKE MARKETING SERVICES, INC. 13.1 INTRODUCCION AL DISENO DE EXPERIMENTOS Y AL ANALISIS DE VARIANZA ‘perspectiva conceptual ANALISIS DE VARIANZA Y EL. DISENO COMPLETAMENTE ALEATORIZADO. Estimacién de la varianza poblacional entre tratamientos Estimaci6n de la varianza poblacional dentro de los ‘tatamientos CComparacin de las estinacionss de las varianzas: la prueba F ‘Tabla de ANOVA, Resultados de computadora para ‘un estudio observacional PROCEDIMIENTOS DE COMPARACION MULTIPLE LSD de Fisher ‘Tasas de error tipo DISENO DE BLOQUES ALEATORIZADO Prueba de estrés para controladores de trfico area Procedimiento ANOVA Céleulos y conclusiones ‘BURKE MARKETING SERVICES, INC* GaNeINNATE, O10 | purke Marketing Services, Inc. es una de las firmas de in- estigacion de mercados con més experiencia en ia indus- fia, Cada dia desarolla més propuestas de proyectos que alquir otra empresa del amo en el mando, Apoyada con + enologia de punta, Burke offece una amplia variedad de = poabilidades de investigacida, con lo que soluciona casi ‘rnlquier problema de marketing En ui estudio, cierta empresa solicits los servicios de __purke para evaluar nuevas versiones potenciales de un ce- real para nfs. Por razones de confidencialidad, aqut se © gombrard a la empresa como Anon Company. Los cuatro factores clave que los desarolladres de productos de Anon consderaban que podrfan mejorar el sabor del cereal eran Jos siguientes. 1, Razén entre trigo y mafz en las hojuclas de cereal, 2, Tipo de edulcorante: azicar, miel o artificial 3,_ Presencia o ausencia de troz0s con sabor @ fruta 4, Tiempo de cocci6n, largo 0 corto. ‘Burke disefié un experitento para determinar los efectos de estos cuatro factores en el sabor del cereal. Por ejemplo, ~ se clabor6 un cereal de prucha con una razéa especifica de ‘tigo y mafz, azscar como edulcorante, trozos de sabor y ‘un tiempo corto de coccién; se preparé otro cereal de prue= ‘bacon diferente proporeién de trigo y mafz, dejando igual les otros tes factores, y asf de manera sucesiva. Después, _grupos de nifios probaron el sabor de los productos y dieron, ‘su opinién acerca de cada uno. = tas autores ogradecen ol doctor Renal Tatham, de Burke Merkatng Services, por haber proporionado ee material para Eada fa prc. fo Bre pica pase de depot pr boner vaio infrmacnevaica aera de que quite los ets deun producto, OxtP/Sylvia Tores/CORBIS E] método estadistico para estudiar los datos obtenidos ‘en las pruebas de degustacién fue el andlisis de varianza, Los resultados de los andlisis mostraron lo siguiente. © La composicién de las hojuelas y el tipo de edul- ‘corante influyeron de manera importante en la eva- Tuacién del sabor. © Los trazos con sabor en realidad tuvieron un efec~ to negativo en el sabor del cereal 2 El tiempo de coccién no tuvo ninguna influencia enel sabor. Esta informacién ayuds a Anon a identificar los factores {gue llevarian al cereal con mejor sabor. El disefio de experimentos que Burke empie6 y el sub- secuente anlisis de varianza le ayudaron emitir una reco- ‘mendacién para el disefio del producto. En este capitulo se vverd cémo se realizan estos procedimientos, En el capitulo 1 se estableci6 que los estudios estadisticos se pueden clasificar como experi- rmentales u observacionales. Bn un estudio estadistico experimental se realiza un experimento para generar los datos. Este comienza con la identificacién de la variable de interés. A continua- cidn se identifican y controlan tuna o mas variables que se considera que estén relacionadas con la variable de interés, y se recogen datos de cémo influyen en ella En un estudio observacional los datos se obtienen por lo general mediante encuestas por ‘muestzeo y no por un experimento controlado, Aunque también se emplean los principios para un buen estudio, en estas investigaciones no es posible el control riguroso que se tiene en un trabajo experimental, Por ejemplo, en um estudio de la relacién entre fumar y cancer de pulmén, cl investigador no puede asignarle a os sujetos el hébito de fumar. En realidad esté restringido 41Ja simple observacién de los efectos de fumar en las personas que ya tienen este habito, y los efectos de no fumar en las personas que no Io tienen, 508 Sir Ronald Alymer Fisher (1890-1962) invent la rama de la estadisicn conocida como diseho de experimentos.Ademds de sus eportaciones ala estaditica, fue un cientifico sobresalinte en el campo de la gendica. @) Las releciones de causa y efecto pueden ser diiiles de establecer en esudios ‘abservacionales, pero son ands files de exzablecer “en estudios experimentales La aleatorieaci6n exe rocedimiento de asignar al ‘azar los tratamientos a las unidades experimentates. Antes del trabajo de Sir R A, Fisher, los ratamlentos 2 asignaban sobre bases Sistemdticas 0 subjetvas. Copitulo 13. Disefo de experimentos y andlsis de varianza En este capitulo se presentan tres tipos de disefios de experimentos: disefio completamente aleatorizado, disefio de blogues aleatotizado y experimento factorial. Para cada uno se muestra cémo usar un procedimiento estadistico conocido como andlisis de varianza (ANOVA, por su ‘acrénimo en inglés) para analizar los datos disponibles. El ANOVA también se puede usar para analizat los datos obtenidos en un estudio observacional. Por ejemplo, se verd que en un disefig de experimentos completamente aleatorizado este procedimiento también sirve para probar la igualdad de tres o més medias poblacionales cuando se obtienen los datos mediante un estudig ‘observacional, En los capftulos siguientes se veré que el ANOVA tiene gran importancia en ef andlisis de los resultados de estudios de regresién que incluyen tanto datos experimentales como observacionales, En la primera seccién se mencionan los principios bésicos de un estudio experimental ¥ se describe la forma de emplearios en un disefio completamente aleatorizado. En la segunda secei6n se muestra cémo usar el ANOVA para analizar los datos de un disefio de experimento completamente aleatorizado, Fin la iitima secci¢n se estudian procedimientos de comperacién ailkiple y otros dos disefios de experimentos ampliamente utilizados: el de bloques aleatoriza- do y el experimento factorial Introduccién al disefio de experimentos y al andalisis de varianza ‘Como ejemplo de un estudio estadistico experimental, veamos el problema que entrenta Che- mitech, Ine. Esta empresa desarroll6 un nuevo sistema de filtracién para los suministrs de aguas municipales. Los componentes del sistema se comprarén a varios proveedores y Che- mitech los ensamblaré en su planta de Columbia, Carolina del Sur. El grupo de ingeniecfain- dustrial es el encargado de determinar el mejor método de ensamble para el nuevo sistema de filuracién. Después de considerar varios métodos posibles, el grupo redujo el nimero de alter nativas a tres: el método A, el método B y el método C. Estos difieren en el orden de los pasos que establecen para atmar el sistema, Los directivos de Chemitech quieren determinar con qué metodo de ensamble se puede producir el mayor nimero de sistemas de filtracién por seman. En el experimento de Chemitech, el método de ensamble es Ia variable independiente 0 factor. Como a este factor le corresponden tres tipos de ensamble, se dice que hay tres tr tamientos asociados con este experimento; cada tratamiento corresponde a uno de los tres 1métodos. El problema de Chemitech es ejemplo de un experimento de un solo factor, Forte involucra s6lo un factor cualitativo (el método de ensamble). Los experimentos més complejos pueden consistir de multiples factores; algunos son cualitaivos y otros cuantitativos. Los tres métodos de ensamble o tratamientos constituyen las tres poblaciones de interés para el experimento de Chemitech. Una poblacién esté conformada por todos los trabyjado- res que emplean el método de ensamble A, otra por la de aquellos que utilizan el método By ‘otra més por los que emplean el método C, Observe que en cada poblacién la variable depet- diente o variable de respuesta es e! nimero de sistemas de filtraci6n ensamblado por sem, Y el principal objetivo estadfstco del experimento es determinar si el niimero medio de unidades producidas por semana es el mismo para las tres poblaciones (métodos). ‘Suponga que se selecciona una muestra aleatoria de tres sujetos de entre todos los trabaj- ores de ensamble en tas instalaciones de manufactura de Chemitech. En la terminotopi del disefio de experimentos, los tres trabajadores seleccionados aleatoriamente son las unidades experimentales. El disefio de experimentos que se usard para el problema se llama disefiocom- pletamente aleatorizado. En este tipo de disefio se requiere que cada uno de los métodos && ensamble o tratamientos sea asignado de manera aleatoria a cada una de las unidades exper mentales o trabajadores. Por ejemplo, el método A se asigna aleatoriamente al segundo tab jador, el método B al primero y el método C al tercero. El concepto de aleatorizacidn, come S° itustré en este ejemplo, es un principio importante en todos los disefios de experimentos- 13.1. Inroduccién al dseito de experimenios y ol andlisis de varionze 509 HIGURA 13.1 Disefio completamente aleatorizado para evaluar el método experimental de ensamble de Chemitech Empleados en Ia planta de Cotumbia, Carolina del Sur ‘Se selecciona una muestra aleatoria de 15 sujetos para el experimento ‘Cada uno de Ios tres métodos de ensamble s¢ asigna aleatoriamente a 5 empleados Método A. Método B my ma5 ‘Observe que el resultado de este experimento seré slo una medicién o nimero de unida- des ensambladas por cada tratamiento. Para obtener datos adicionales de cada método de en- samble se debe repetir 0 replicar el proceso experimental basico. Suponga, por ejemplo, que ‘en lugar de tomar al azar s6lo a tres trabajadores, se seleccionan 15, y luego se les asigna en forma aleatoria cada uno de los tratamientos a cinco de ellos. Como cada uno de los métodos de ensamble es asignado a cinco trabajadores, se dice que se obtienen cinco réplicas. El proce so de replicacién es otro principio importante en el disefto de experimentos. En la figura 13.1 se presenta el disefio completamente aleatorizado para el experimento de Chemitech. Recoleccién de datos ‘Una vez realizado el disefio del experimento, se provede a tecolectar y analizar los datos. En el ‘caso de Chemitech, se le explica alos trabajadores cémo emplear el método de ensamble que les ha sido asignado y empezarén a armat os sistemas de fitracién con ese método. En la tabla 13.1 se presenta el mimero de unidades ensambladas por cada empleado en una semana. También se proporciona la media muestral, Ia varianza muestral y la desviacidn esténdar muestral obteni- das con cada proceso de ensamble. Asi, la media muestral del nimero de unidades producidas con el método A es 62; con el método B es 66, y usando el método C es 52. Con base en es- tos datos, parece que B proporciona las tasas mds altas de produccién que cualquiera de los . otros métodos. El punto a considerar es si cualquiera de las tres medias muestrales observadas difiere lo suficiente como para concluir que las medias poblacioneles cortespondientes a estos tres mé- todos de ensamble son diferentes. Para escribir esto en términos estadisticos, se introduce la notacién siguiente 4; = nlimero medio de unidades producidas por semana con el método A Hz = nlimero medio de unidades producidas por semana con el método B 4; = nlimero medio de unidades producidas por semana con el método C 510 Capitulo 13. Disefio de experimentos y andliss de varianza TABLA 13.1 Niimero de unidades producidas por 15 trabajadores Method AD B c CChemitoch 38 38 4 64 @ 3 35 n 9 6 “ a a 6 @ ‘Sample mean (media maestal) oa 6 2 Semple vatiance (vavianen muestra) 215 265 310 ‘Sample standard devintion (esviacisn estindar moestral) 5244 5.148 5.568 ty Si Hyes veehacad, no ppodemos concluir que todas leas medias poblacionales son diferentes. Rechazar Hy significa que por lo menos dos medias poblacioneles tienen valores diferentes. Silos tamaos de las Imuestras son iguales, el canlisis de varianza no es sensible a divergencias del supuesto de que las pablaciones estan nommalmente distribuidas Aunque nunca se podré saber cudles son los verdaderos valores de fy, ¥ Hs, 6 utilizan Tas ‘medias muestrales para probar las hipstesis siguientes. He: My = Ha = bes Hig: no todas las medias poblacionales son iguales Como se demostraré més adelante, el andlisis de varianza (ANOVA) es el procedimiento esta- distico que se emplea para determinar si las diferencias observadas entre las tres medias mues- trales som lo sufcientemente grandes para rechazar Hp Supuestos para el andlisis de varianza ‘Los supuestos requeridos para usar el andlisis de varianza son tres. 1, En cada poblacién, la variable de respuesta est normalmente distribuida. Inpl- ) (n= Vs} (13.90) Observe que el CME esté basado en la variacién dentro de cada tratamiento; el que la hips- tesis nula sea o no verdadera no tiene ninguna influencia, Por tanto, el CME proporciona siempre una estimacién insesgada de 0? 516 En la ssccidn 11.286 resend una Introduccion la dstribucién Fy at uso de tas tablas de ta distribucin P Capitulo 13 Disefo de experimentos y andlisis de varianza Con base en los datos de la tabla 13.1 para el caso de Chemitech, obtenemos los resultados siguientes. sce = Sin, ~ Us} = G — 27.5 + G ~ 1265 + ~ Y31= 40 sce 340 _ 340 Boo 7 BB CME Comparacién de las estimaciones de las varianzas: la prueba F Si la hipétesis nula es verdadera, el CMTR y el CME proporcionan dos estimaciones insesgadas ¢ independientes de 0%. Con base en lo estudiado en el capitulo 11 sabemos que cuando se tienen poblaciones normates la distribucidn muestral del cociente de dos estimaciones indepen- dientes de o* sigue una distribucién F Por tanto, si ta hipétesis nula es verdadera y se satis ccen los supuestos del ANOVA, la distibucién muestral del CMTRICME es una distribucign F ‘con k ~ I grados de libertad en el numeradot y n'y — k grados de libertad en el denominador, En otras palabras, sila hipétesis nula es verdadera, el valor del CMTRICME parecerd que es un valor tomado de esta distribucién F. No obstante, sia hipétesis nula es falsa, el valor del CMTR/CME seré muy grande debido que el CMTR sobreestima 0°, Por tanto, siel valor de CMTRICME resulta ser demasiado grande para haber sido tomado de a distribucién F con k — 1 grados de libertad en el numerador y rnp ~ kegrados de libertad en el denominador, Hy ser4 rechazada, Como la decisién de desea tar Hy esté basada en el valor del CMTRICME, el estadistico de prueba que se usa para probar 1a igualdad de k poblaciones es el siguiente. ESTADISTICO DE PRUEBA PARA LA IGUALDAD DE k MEDIAS POBLACIONALES (18 2) Este estadistico de prueba sigue una distribucién F con k — 1 grados de libertad en el rumerador y ny ~ k grados de libertad en el denominador. ‘Ahora bien, en el experimento de Chemitech se usaré a = 0.05 como nivel de signifiat~ cia para realizar la prucba de hip6tesis. El valor del estaditico de prueba es comme _ 260 CME 28.33, 18 : Los grados de libertad en el numerador son k ~ 1 = 3 ~ 1 = 2, y los grados de libertad pat eldenominador son ny — k = 15 — 3 = 12. Como lahip6tesis nula sélo serd rechazaa si ob: tenemos un valor grande para el estadistico de prueba, el valor-pseré el drea en la cola superior de la distribucién F a la derecha del estadistico de prueba F = 9.18, En la figura 134 se present la disuibucion muestral de F = CMTR/CME, el valor del estadistico de prueba y el ea en cola superior que es el valor-p de esta prueba de hipétesis. Tn a tabla 4 del apéndice B se encuentran Tas reas siguientes en la cola superior de Indi tsibuci6n F con 2 grados de libertad en el numerador y 12 grados de libertad en el denominat Area en Ja cola superior 0.10 0.05 0.025 0.01 Valor F (gh, 281 389 5.10 6.93 F298 13.2. Andlisis de varionza y el diseFio completamente aleatorizado 37 FIGURA 13.4 Célculo del valor a pantir de 1a distribucién de muestreo de CwTR/CME, Distribuei6n de muesteo de CMTRICME ccMTveME “nctopéndice Fseexplica Como F = 9.18 es mayor que 6.93, el rea en la cola superior correspondiente a F = 9.18 es =e calslarel olor? co¥ menor que 0.01. Por tanto, el valor-p es menor que 0.01. Para obtener el valor-p exacto, que _Hlnte 0 Excel 5 0.004, se puede usar Minitab 0 Excel. Como el valor-p = a = 0.05, Hy es rechazada. La prueba proporciona evidencias suficientes para concluir que las medias de las tes poblaciones no son iguales. En otras palabras, el andlisis de varianza favorece la conclusién de que las me- dias poblacionales del nimero de unidades producidas por semana con cada uno de los tres aétodos de ensamble no son iguales. ‘Como en otros procedimientos de pruebas de hipétesis, aqui también puede emplearse el étodo del valor critico. Como a = 0.05, l valor ertico de F es aquel que deja un érea de 0.05 en la cola superior de la distribucién F con 2 y 12 grados de libertad. En las tablas de Ia disti- bucidn F se encuentra Fyqs = 3.89. Por tanto, la regla de rechazo en el caso del experimento de Chemitech es Rechazar Hy si F = 3.89 Con F = 9.18, Hy es rechazada, y concluimos que las medias de las tres poblaciones no son iguales. A continuacién se presenta un resumen del provedimiento general para probar la igual- dad de k medias poblacionales. PRUEBA DE LA IGUALDAD DE k MEDIAS POBLACIONALES. Hg: ty = be & Ha: no todas las medias poblacionales son iguales ESTADISTICO DE PRUEBA curr Oe REGLA DE RECHAZO Rechazar H, si el valor-p = @ Método del valor extico: Rechazar Hy si F = Fy donde el valor de F, esté basado en una distribucién F con k ~ 1 grados de libertad en ‘el numerador y nz ~ k grados de libertad en el denominador. 518 Copitvlo 13 Disefio de experimentos y andlisis de varionza Tabla de anova Los eéleulos anteriores se pueden presentar de manera adecuada en un instrumento conoeigy como tabla de andlisis de varianza 0 {atila de ANOVAEn la tabla 13.2 se observa la f general de una tabla ANOVA para un diseflo completamente aleatorizado; la tabla 13.3 comes ponde a la tabla ANOVA del experimento de Chemitech. La suma de los cuadrados asociadny con la fuente de variacién que se indica como “Total” se conoce como suma total de cuadrado, (STC). Observe que los resultados del experimento de Chemitech indican que STC = scTm | SCE, y que los gtados de libertad que comresponden a este resultado es la suma de los grads de libertad correspondiente a la sume de cuadrados debido a los tratamiento més la suma dg cuadrados debido al error. Cabe hacer notar que la STC dividida entre los grades de libertad np ~ 1 no es otra cosy que Ia varianza muestral general que se obtendria si se considerara la muestra de las 15 obser vvaciones como tun solo conjunto de datos. Si se toma todo el conjunto de datos como tna sola ‘muestra, la fSrmula para calcular la suma total de cuadrados, STC, es| Bl andlsis de varianza puede entenderse como wn | Drocedinien estadiico ste (y= 13.4 | Trertolaaoals 22 (18.83 saat ereiaiae ‘en componentes separados. Se puede demostrar que estos resultados observados para cl andlisis de la tabla de varianza ene caso del experimento de Cheinitech también son aplicables a otros problemas. Es decir, STC = SCTR + SCE En otras palabras, la STC se particiona en dos suimas de cuadrados: la suma de cuadradas debi- do a los tratamientos y la suma de cuadrados debido al error. Observe, ademas, que los grados de libertad que cortesponden a la STC, ny ~ 1, se pueden partir en grados de libertad cones. | pondientes a SCTR, k ~ I, yen gradas de libertad correspondientes a SCB, ny ~ k. El anlisis de variauiza se puede ver como el proceso de particiémle Ia suma total de cuadrados y ls grados de libertad en sus fuentes comespondientes: tratamientos y error. Al dividir las sumas de cuadrados entre los correspondientes grados de libertad, se obtienen las estimaciones dela I varianza, el valor de F y el valor-p empleados en la prueba de hip6tesis de igualdad entre las ‘medias poblacionaes. TABLA 13.2 Tabla ANOVA para un di 10 completamente aleatorizado Suma de Grados Cuadrado cuadrados. de libertad ‘medio F valorp sere. sere om = kot CME TABLA 13.3 Tabla de andl is de varianza para el experimento de Chemitech Fuente ‘Suma de Grados Cuadrado de variacién cuadrados delibertad ‘medio F valorp ‘Tratamientos 520 2 260.00 918 004 Bror 340 2 2833 Total 860 4 13.2. Anélisis de varianza y el disetio completamente aleatorizado 519 aqypa 13.5 Salida de Minitab para el andlisis de varianza del exporimento de Chemitech cues - ~ — corn ~ re source DF 8s Ms F » Factor 2 $20.0 260.0 9.18 + 0.004 Error L 340.0 28.3 ‘Total 14 860.0 § = 5.323 RSg= 60.478 —-R-Sqladj) = 53.888 Individual 95% CTs For Mean Based on Pooled StDev Level: uN Mean. stDev aA 5 62,000 5.244 B 5 66,000 4.148 c 5 52.000 5.568, pocled StDev = 5.323 49.0 56.0 63.0 70.0 de vari ‘Cuando se tienen muestras grandes 0 una cantidad grande de poblaciones, los célculos del ané- lisis de varianza se realizan con més facilidad mediante software para estadistca, En los apéndi- ‘ces 13.1 @ 13.3 se indican los pasos necesatios para realizar los edlculos de! andlisi de varianza ‘con Minitab, Excel y StarTools. En la figura 13.5, aplicado al experimento de Chemitech, se presenta la pantalla de resultados de Minitab. En la primera parte de la pantalla se observa el formato ya conocido de Ia tabla ANOVA. Si se compara la figura 13.5 con la tabla 13.3, vemos que la informacién disponible es 1a misma, aunque algunos encabezados son ligeramente di- ferentes. El encabezado Source se usa en la columna correspondiente a la fuente de variaci6n; Factor corresponde a la fila de tratarnientos, y las columnas de las sumas de cuadrados y los ‘grados de libertad estin intercambiados, Observe que, enseguida de la tabla ANOVA, la pantalla de la computadora proporciona los respectivos tamatios de las muestra, las medias muestrales y las desviaciones estindar. Ade- ‘més, Minitab presenta una figura con la estimacién por intervalos de 95% de conflanza para cada una de las medias poblacionales, Para obtener Ia estimacién de estos intervalos, Minitab emplea el CME como estimacién de 6. Por tanto, 1a rafz cuadrada del CME proporciona la ‘mejor estimacién de la desviacién estindar poblacional o, Bn la salida de la computadora esta estimacién de a es Pooled StDev, y su valor es 5.323. Para ilustrar cémo se calcula la estima ‘cin por intervalos se haré aqui la estimacién por intervalo de 95% de confianza para la media poblacional del método A. Con base en lo aprendido en el estudio de intervalos de confianza en el capitulo 8, sabemos que la forma general de una estimaci6n por intervalo para una media poblacional es X2hayg (19.18) donde s ¢s la estimacién de la desviacién esténdar poblacional o. Como 1a mejor estimacién de @ es la proporcionada por la Pooled StDev, se usa 5.323 en la expresién (13.15) como va- lor de s. Los grados de libertad para el valor de ¢ son 12, los grados de libertad asociados con la ssuma de los cuadrados del error. Por tanto, cOm0 foqas = 2.179, obtenemos $323 62 # 2.179. 62 = 5.19 520 Capitulo 13. Disefo de experimentos y andlisis de vorianza Asi, el imervalo de 959 de confianza para el método A va de 62 ~ 5.19 = 5681 a6) 4 5.19 = 67.19. Como en el experimento de Chemitech los tamafios muestrales son iguales, tag bien Ios intervalos de confianza para los métodos B y C se obtienen al sumar y restar 5.19 dey respectiva media muestra. En la salida de Minitab se aprecia que los anchos de los interval, de confianza son los mismos. : de k medias poblacionates: an aside of Se ha revisado el uso del andlisis de varianza para probar la igualdad de k medias poblaciong. les cuando se emplea un diseiio experimental completamente aleatorizado, Es importante not que el ANOVA también se puede utilizar para probar la igualdad de tres o mas medias poblaci. nales usando datos de un estudio observacional. Para dar un ejemplo, se consideraré el caso de National Computer Products, Inc. (NCP). cP fabrica impresoras y aparatos de fax en sus tres plantas situadas en Atlanta, Dallas y Seattle. Con el fin de medir los conocimientos de los empleados de estas tres plantas acerea de In administracién de la calidad, se toma una muestra aleatoria de seis empleados de cada planta y se les aplica un examen acerca de su conocimiento sobre la calidad, En la tabla 13.4 se pe. sentan las puntuaciones obtenidas en Jos exdmenes por los 18 sujetos. En esta tabla se indican también la media, la varianza y la desviacién estindar muestrales de cada grupo. Los gerentes de la empresa quieren usar estos datos para probar la hipétesis de que la media de las puntux ciones de los exdmenes es la misma en las tres plantas. ‘Como poblaci6n 1 se define a los empleados de la planta en Atlanta, como poblacién als | de la planta en Dallas y como poblacidn 3 los de Seattle, Sean 4; = media de las puntuaciones en los exémenes de la poblaci6n 1 #4, = media de las puntuaciones en los exémenes de la poblacién 2 | 5 = media de las puntuaciones en los exémenes de la poblacién 3 Aunque os verdadeos valores de 2 mca puedn conocer, se utr fossa 1 dos muestrales para probar las hipétesis siguientes. | Hs Hy = fla = by ‘Hg no todas las medias poblacionales son iguales Observe que la prueba de hip6tesis para el estudio observacional de NCP es exactamente igual a la que se manej6 para el experimento de Chemitech, ‘También para analizar los datos del estudio TABLA 134 Punaciones en tos exémenes de 18 empleados Planta ¥ ‘Atlanta 8s a 2 % 1 Media muestal n ” 6 Varianza muestral 34 20 2 ‘Desviacion estindar muesta 583 447 5.66 13.2. Anélisis de vorianza y el disefio completamente cleatorizado 52 neerciio Ben este ‘observacional de NCP se emplea la misma metodologia de andlisis de varianza usada para el rapido fepediré analicar —experimento de Chemitech, los datos de NePutzande "un cuando en ambos casos se utiliza la misma metodologfa del ANOVA, vale la pena ob- precedente 26°00" servas la diferencia entre el estudio estadistico observacional de NCP y la investigacién esta- foo distica experimental de Chemitech, Las personas que realizaron el estudio de NCP no tuvieron control sobre la asignacién de las plantas a cada uno de los empleados. Las plantas ya funcio- naban y cada tno de los sujetos trabajaba en una de las tres. Lo tnico que se pudo hacer en este aso fue tomar una muestra aleatoria de seis empleados de cada una de las plantas y aplicarles el examen de conocimiento sobre la calidad. Para clasificarlo como un trabajo experimental, [NPC tendria que haber tomado al azar 18 empleados y después, de manera aleatoria, asignar las plantas a cada uno, 1, La media muestral general también se calcula co- concepto de estimaciGn de 0? entre tratamientos, ‘mo media ponderada de las medias muestrales, La ecuscién (13.6) 8 s6lo una generlizacién de on . este resultado para el caso de tamatios muestrales my + mt + hy distinos My 3. Si cada muestra tiene n observaciones, my = kn; En fos problemas en que se proporcionan las me- POT anto,rtp~ k= Kn ~ 1),y Ta ecuacion (13.9) dias muestrales, para calcular la media general es 8 Puede reescribir como ans seneillo utilizar esta formule que la expresién (33) a ; Lk 2. Sitodas as metas constn den observacons, Yo-oF @- oye DBs Ja ecuacién (13.6) puede escribe como. OME = ae + Z Kn — 1) Kn = 1) k En otras palabras, si los tamefios muestrales son. iguales, ef CME es simplemente el promedio de las K variancas muestrales. Observe que éste es =nsi el mismo resultado que se usé en Ia seccién 13.1 ccuando se present6 el concepto de estimacién de Observe que este resultado es el mismoque el pre- dentro de lo tratamientos. sentado en la seccién 13.1 cuando se estudi el ih Métedos 1. Los datos siguientes se obtuvieron de un disefio completamente aleatorizado. “Tratamiento | A B c 162 142 126 iu 12 156 122 165 124 138 145 142 140 148 136 150 174 152 128 Media muestral 156 142 134 ‘Varianza muestral tea 1312 1104 4a) Calcule fa suma de cuadrados entre tratamiento. 5b) Caleule el cuadrado medio entre tratamientos 522 Capitulo 13 Disefio de experimentos y anélisis de varianza 6) Determine la suma de cuadratos debido al error. 4) Caleule et cuadrado medio debio al error. @)_Bstablezca la tabla ANOVA para este problema. f) Cona = 005, pruebe si las medias de los tres tratamientos son iguales. 2. En un diseito completamente aleatorizado, para cada uno de tos cinco niveles del factor se tusaron siete unidades experimentales. Complete la tabla ANOVA siguiente, L Fuente ‘Suma Grados Cuadrado devariacién de cuadrados de libertad ‘medio F valorp H ‘Teatamientos 300 Error Total 460 | 3. Remilase al ejericio 2, 4) {Cuétes son las hip6tesis implicadas en este problems? 2) Utilce el nivel de significancia a = 0.05, ;1a hipétesis nula del inciso a) puede ser recha zada? Explique porque. 4. En un experimento disefiado para probar los niveles de resultado de tres tratamiento diftren {es se obtavieron los resultados siguientes: STC = 400, SCTR = 150, ny ~ 19. Establezea tabla ANOVA y pruebe si hay alguna diferencia signficativa ene las medias de los resultados 7.34, y se puede rechazar la hip6tesis de que a media Poblacional obtenida con el método B sea igual a la media poblacional del método C. Ast ‘conclusin es que tanto el método A como el B dlifleren del método C. La LsD de Fisher también se usa para obtener una estimacién mediante un intervalo de confianza de la diferencia entre las medias de dos poblaciones. El procedimiento general que se emplea es el siguiente ESTIMACION POR INTERVALO DE CONFIANZA DE LA DIFERENCIA ENTRE| DOS MEDIAS. POBLACIONALES USANDO EL PROCEDIMIENTO DELA LSD DE FISHER 3-H 1sp (13.18) donde (13.19) Y fay Pertenece a la distribucién ¢ con ny ~ & grados de libertad. 13.3 Procedimientos de comparacién métiple 327 Si el intervalo de confianza hallado con la expresi6n (13.18) incluye el valor cero, no se puede rechazar la hipétesis nula de que las dos medias poblacionales sean iguales, Pero si dicho inter vvalo no incluye al valor cero, podemos concluir que sf hay diferencia entre las medias poblacio- nales. En el caso del experimento de Chemitech, recuerde que la LSD = 7.34 (que corresponde 4 fqa5 = 2.179), Por tanto, una estimacién de la diferencia entre las medias poblacionales 1 y 2 empleando un intervalo de 95% de confianza es 62 ~ 66 = 7.34 = —4 * 7.34 = —1134 1 3.34; como este intervalo incluye el cero, no se puede rechazar la hipétesis de que las dos ‘medias sean iguales. Yasas de evror tips § Bl estudio del procedimiento de la LSD de Fisher se iniei6 con la premisa de que el andlisis de -vatianza proporcionaba evidencies estadisticas para rechazar la hipétesis nula de la igualdad en- tre medias poblacionales. Se mostr6 que en tales casos se puede emplear el procedimicnto de la LSD de Fisher para determinar donde estén las diferencias. Técnicamente, a este procedimiento se le conoce como prueba restringida o protegida de la LSD debido a que sélo se usa si prime- 10 se ha encontrado un valor F significativo al aplicar el andlisis de varianza, Para ver por qué es importante esta distincién en las pruebas de comparacién miitiple es necesario explicar la Giferencia entre tasa de error tipo I por comparacién y tasa de error tipo I por experimentacion. Enel experimento de Chemitech se usa el procedimiento de la LSD de Fisher para efectuar tres pares de comparaciones. Prueba 1 Prueba2 Prueba Ag Hy = Ag hy = hs Ag Ha = Hy Hey Fy Hay Fy Ha a FM En cada caso, el nivel de significancia empleado es a = 0.05. Por tanto, en cada prueba, si la hipétesis nula es verdadera, la probabilidad de que se cometa un error tipo Tes a = 0.05; entonces, Ia probabilidad de no cometer un error tipo Tes 1 ~ 0,05 = 0.95, En el estudio de los procedimientos de comparacién miltiple, a esta probabilidad de cometer un error tipo 1 (a = 0.05) se le conoce coma de ex¥or tipi | go comparacidn , la cual indica el nivel de significancia que corresponde a una sola comparacin por pares. Considere ahora una cuestién ligeramente diferente. ;Cudl es la probabilidad de que all hacer tres comparaciones por pares se cometa un ertor tipo Ien por fo menos una de las tres pruebas? Para responder esta pregunta, observe que la probabilidad de que no se cometa un error tipo fen ninguna de las tres pruebas es (0.95) (0.95) (0.95) = 0.8574.! Por tanto, la pro- babilidad de cometer por lo menos un error tipo Tes 1 ~ 0.8574 = 0.1426, Entonces, cuando se usa el procedimiento de la LSD de Fisher para hacer los tres pares de comparaciones, la tasa de extor tipo I correspondiente a este método no es 0.05, sino 0.1426, y se le conoce comes fic evcor tips t par experieuceactén 0 general, Para evitar confusiones, la tasa de ertor tipo 1 por experimentacién se denota dg. La tasa de error tipo I por experimentacién es mayor en estudios con més poblaciones. Por ejemplo, en un problema con cinco poblaciones hay 10 pares de comparaciones. Si se prueban todas las comparaciones posibles por pares usando el procedimiento de la LSD de Fisher con ‘una tasa de error por comparacién de ct = 0.05, la tasa de error tipo I por experimentacién seré 1 = (1 ~ 0.05)!° = 0.40. En tales casos se prefiere buscar otras altemnativas que proporcionen ‘un mejor control sobre la tasa de error por experimentacién, Una altenativa para controlar Ia tasa de error general por experimentacién, conocida co- mo ajuste de Bonferroni, consiste en usar en cada prueba tasas de error por comparacién mas pequefias, Por ejemplo, si se quieren probar C comparaciones por pares y se desea que la pro- T Se spe que as res prucbr tn independents y, po ono fo probed conan de fos Wes evonts secon ‘con{osimple milipiacién de ls probobiidadesindvidles, Os hecho, ls res preabos no on independents pore ‘'CHE se ura en cade prusbo; en consacencia, ol err supueto es mayer qv el error road,

También podría gustarte