Está en la página 1de 15

Resumen del libro

Diseo y Anlisis de Experimentos


por Douglas C. Montgomery

Captulo 1
Estrategia de experimentacin
Investigadores de prcticamente todos los campos de estudio llevan a cabo experimentos,
por lo general para descubrir algo acerca de un proceso o sistema particular. En un
sentido literal, un experimento es una prueba. En una perspectiva ms formal, un
experimento puede definirse como una prueba o serie de pruebas en las que se hacen
cambios deliberados en las variables de entrada de un proceso o sistema para observar e
identificar las razones de los cambios que pudieran observarse en la respuesta de salida.
En ingeniera, la experimentacin desempea un papel importante en el diseo de
productos nuevos, el desarrollo de procesos de manufactura y el mejoramiento de
procesos. El objetivo en muchos casos sera desarrollar un proceso robusto, es decir, un
proceso que sea afectado en forma mnima por fuentes de variabilidad externas. En
cualquier experimento, los resultados y las conclusiones que puedan sacarse dependen en
gran medida de la manera en que se recabaron los datos.
Los experimentos se usan para estudiar el desempeo de procesos y sistemas. El proceso
puede por lo general visualizarse como una combinacin de mquinas, mtodos, personas
u otros recursos que transforman cierta entrada (con frecuencia un material) en una
salida que tiene una o ms respuestas observables. Algunas variables del proceso son
controlables, mientras que otras son no controlables (aunque pueden serlo para los fines
de una prueba). Los objetivos del experimento podran comprender los siguientes:
1. Determinar cules son las variables que tienen mayor influencia sobre la respuesta
y.
2. Determinar cul es el ajuste de las x que tiene mayor influencia para que y est
casi siempre cerca del valor nominal deseado.
3. Determinar cul es el ajuste de las x que tiene mayor influencia para que la
variabilidad de y sea reducida.
4. Determinar cul es el ajuste de las x que tiene mayor influencia para que los
efectos de las variables no controlables sean mnimos.
Los experimentos incluyen muchas veces varios factores. Habitualmente, uno de los
objetivos de la persona que realiza un experimento, llamada el experimentador, es
determinar la influencia que tienen estos factores sobre la respuesta de salida del sistema.

Al enfoque general para planear y llevar a cabo el experimento se le llama estrategia de


experimentacin. Los experimentos de un factor a la vez siempre son menos eficientes
que otros mtodos basados en un enfoque estadstico del diseo experimental.

El enfoque correcto para trabajar con varios factores es conducir un experimento


factorial. Se trata de una estrategia experimental en la que los factores se hacen variar en
conjunto, en lugar de uno a la vez. En los diseos factoriales se hace el uso ms eficiente
de los datos experimentales. Ninguna otra estrategia de experimentacin hace un uso tan
eficiente de los datos. Esta es una caracterstica importante y til de los diseos
factoriales.
Por fortuna, cuando se trabaja con cuatro, cinco o ms factores, por lo general no es
necesario probar todas las combinaciones posibles de los niveles de los factores. Un
experimento factorial fraccionado es una variacin del diseo factorial bsico en la que
solo se realiza un subconjunto de las corridas. Los diseos factoriales fraccionados son
muy comunes en la investigacin y el desarrollo industrial, as como en el mejoramiento
de procesos.

Algunas aplicaciones tpicas del diseo experimental


Los mtodos del diseo experimental han encontrado amplia aplicacin en diversas
disciplinas. De hecho, la experimentacin puede considerarse parte del proceso cientfico
y uno de los medios para conocer el funcionamiento de sistemas y procesos. En general, el
aprendizaje ocurre a travs de una serie de actividades en las que se hacen conjeturas
acerca de un proceso, se llevan a cabo experimentos para generar datos del proceso y
despus se usa la informacin del experimento para establecer nuevas conjeturas, lo que
lleva a nuevos experimentos, y as sucesivamente.
El diseo experimental es una herramienta de importancia fundamental en el mbito de la
ingeniera para mejorar el desempeo de un proceso de manufactura. Tambin tiene
mltiples aplicaciones en el desarrollo de procesos nuevos. La aplicacin de las tcnicas

del diseo experimental en las fases iniciales del desarrollo de un proceso puede redundar
en:
1. Mejoras en el rendimiento del proceso.
2. Variabilidad reducida y conformidad ms cercana con los requerimientos
nominales o proyectados.
3. Reduccin del tiempo de desarrollo.
4. Reduccin de los costos globales.
Los mtodos del diseo experimental desempean tambin un papel importante en las
actividades del diseo de ingeniera, donde se desarrollan productos nuevos y se hacen
mejoramientos en los productos existentes. Entre las aplicaciones del diseo experimental
en el diseo de ingeniera se encuentran:
1. La evaluacin y comparacin de configuraciones de diseos bsicos.
2. La evaluacin de materiales alternativos.
3. La seleccin de los parmetros del diseo para que el producto tenga un buen
funcionamiento en una amplia variedad de condiciones de campo, es decir, para
que el producto sea robusto.
4. La determinacin de los parmetros clave del diseo del producto que afectan el
desempeo del mismo.
EI uso del diseo experimental en estas reas puede redundar en productos cuya
fabricacin sea ms sencilla, en productos que tengan un desempeo y confiabilidad de
campo mejorados, en costos de produccin ms bajos y en tiempos ms cortos para el
diseo y desarrollo del producto.

Principios bsicos
El diseo estadstico de experimentos se refiere al proceso para planear el experimento de
tal forma que se recaben datos adecuados que puedan analizarse con mtodos
estadsticos que llevarn a conclusiones vlidas y objetivas. El enfoque estadstico del
diseo experimental es necesario si se quieren sacar conclusiones significativas de los
datos. Cuando el problema incluye datos que estn sujetos a errores experimentales, la
metodologa estadstica es el nico enfoque objetivo de anlisis. Por lo tanto, cualquier
problema experimental incluye dos aspectos: el diseo del experimento y el anlisis
estadstico de los datos. Estos dos aspectos se encuentran ntimamente relacionados
porque el mtodo de anlisis depende directamente del diseo emp1eado.
Los tres principios bsicos del diseo experimental son la realizacin de rplicas, la
aleatorizacin y la formacin de bloques. Por realizacin de rplicas se entiende la
repeticin del experimento bsico. La aleatorizacin es la piedra angular en la que se
fundamenta el uso de los mtodos estadsticos en el diseo experimental. Por
aleatorizacin se entiende que tanto la asignacin del material experimental como el
orden en que se realizarn las corridas o ensayos individuales del experimento se
determinan al azar. La formacin de bloques es una tcnica de diseo que se utiliza para

mejorar la precisin de las comparaciones que se hacen entre los factores de inters.
Muchas veces la formacin de bloques se emplea para reducir o eliminar la variabilidad
transmitida por factores perturbadores; es decir, aquellos factores que pueden influir en
la respuesta experimental pero en los que no hay un inters especfico.

Pautas generales para disear experimentos


Para aplicar el enfoque estadstico en el diseo y anlisis de un experimento, es necesario
que todos los que participan en el mismo tengan desde el principio una idea clara de qu
es exactamente lo que va a estudiarse, cmo van a colectarse los datos, y al menos una
comprensin cualitativa de la forma en que van a analizarse estos datos. Pautas generales:
1.
2.
3.
4.
5.
6.
7.

Identificacin y exposicin del problema.


Eleccin de los factores, los niveles y los rangos.
Seleccin de la variable de respuesta.
Eleccin del diseo experimental.
Realizacin del experimento.
Anlisis estadstico de los datos.
Conclusiones y recomendaciones.

A lo largo del proceso completo es importante tener presente que la experimentacin es


una parte esencial del proceso de aprendizaje, en la que se formulan hiptesis tentativas
acerca de un sistema, se realizan experimentos para investigar estas hiptesis y se
formulan nuevas hiptesis con base en los resultados, y as sucesivamente. Esto sugiere
que la experimentacin es iterativa.

Breve historia del diseo estadstico


Ha habido cuatro eras del desarrollo moderno del diseo experimental estadstico. La era
agrcola fue encabezada por el trabajo pionero de Sir Ronald A. Fisher en los aos 1920 y
principios de la dcada de 1930.
Fisher se percat de que las fallas en la forma en que se llevaba a cabo el experimento que
generaba los datos obstaculizaban con frecuencia el anlisis de los datos de los sistemas.
Mediante la interaccin con mltiples cientficos e investigadores de diversos campos,
Fisher desarroll las ideas que llevaron a los tres principios bsicos del diseo
experimental: la aleatorizacin, la realizacin de rplicas y la formacin de bloques. Fisher
incorpor de manera sistemtica el pensamiento y los principios estadsticos en el diseo
de las investigaciones experimentales, incluyendo el concepto de diseo factorial y el
anlisis de varianza.
Si bien es cierto que la aplicacin del diseo estadstico en ambientes industriales se inici
en la dcada de 1930, el catalizador de la segunda era, o era industrial, fue el desarrollo de
la metodologa de superficies de respuesta (MSR) por parte de Box y Wilson. Estos autores
se percataron y explotaron el hecho de que muchos experimentos industriales son

fundamentalmente diferentes de sus contrapartes agrcolas en dos sentidos: 1) la variable


de respuesta puede observarse por lo general (casi) de inmediato, y 2) el experimentador
puede obtener pronto informacin crucial de un pequeo grupo de corridas que puede
usarse para planear el siguiente experimento. Box denomina inmediatez y secuencialidad
a estas dos caractersticas de los experimentos industriales. En los 30 aos siguientes, la
MSR y otras tcnicas de diseo se generalizaron en las industrias qumicas y de proceso,
sobre todo en el trabajo de investigacin y desarrollo. George Box fue el lder intelectual
de este movimiento. Sin embargo, la aplicacin del diseo estadstico a nivel de plantas o
procesos de manufactura todava no estaba muy generalizada.
Algunas de las razones de ello incluyen la capacitacin inadecuada de ingenieros y otros
especialistas en procesos en los conceptos y los mtodos estadsticos bsicos, as como la
falta de recursos de computacin y software de estadstica que fueran fciles de usar para
apoyar la aplicacin de experimentos diseados estadsticamente. El inters creciente de
la industria occidental en el mejoramiento de calidad que empez a fines de la dcada de
1970 anunci la tercera era del diseo estadstico. El trabajo de Genichi Taguchi tuvo un
impacto significativo en el aumento del inters y el uso de los experimentos diseados.
Taguchi propugnaba por el uso de experimentos diseados para lo que denomin el
diseo paramtrico robusto, es decir:
1. Hacer procesos insensibles a los factores ambientales o de otra ndole que son
difciles de controlar.
2. Fabricar productos insensibles a la variacin transmitida por los componentes.
3. Encontrar los niveles de las variables del proceso que obliguen a la media a un
valor deseado mientras que al mismo tiempo se reduzca la variabilidad en tomo a
este valor.
Hubo al menos tres resultados positivos de la controversia desatada por Taguchi. Primero,
el uso de los experimentos diseados se hizo ms generalizado en las industrias con piezas
discretas. Segundo, se inici la cuarta era del diseo estadstico. Esta era ha incluido un
renovado inters general tanto por parte de investigadores corno de profesionales en
ejercicio en el diseo estadstico y el desarrollo de varios enfoques nuevos y tiles para los
problemas experimentales en el mundo industrial, incluyendo alternativas a los mtodos
tcnicos de Taguchi que permiten que sus conceptos de ingeniera se lleven a la prctica
de manera eficaz y eficiente. Tercero, la educacin formal en diseo experimental
estadstico se est haciendo parte de los programas de ingeniera en las universidades,
tanto a nivel de licenciatura como de posgrado. La integracin exitosa de una buena
prctica del diseo experimental en la ingeniera y las ciencias es un factor clave en la
competitividad industrial futura.

Uso de tcnicas estadsticas en la experimentacin


Gran parte de la investigacin en la ingeniera, las ciencias y la industria es emprica y hace
un uso extensivo de la experimentacin. Los mtodos estadsticos pueden incrementar en
gran medida la eficiencia de estos experimentos y con frecuencia pueden fortalecer las
conclusiones as obtenidas. El uso correcto de las tcnicas estadsticas en la
experimentacin requiere que el experimentador tenga presentes los puntos siguientes:
1. Uso de conocimientos no estadsticos del problema. Los experimentadores suelen
poseer amplios conocimientos de sus respectivos campos. El uso de la estadstica
no es sustituto de la reflexin sobre el problema.
2. Mantener el diseo y el anlisis tan simple como sea posible. Es necesario no
exagerar en el uso de tcnicas estadsticas complejas y sofisticadas. Los mtodos
de diseo y anlisis relativamente simples son siempre los mejores.
3. Tener presente la diferencia entre significacin prctica y significacin
estadstica. Debido justamente a que dos condiciones experimentales producen
respuestas medias que son estadsticamente diferentes, no existe ninguna
seguridad de que esta diferencia sea de la magnitud suficiente como para tener
algn valor prctico.
4. Los experimentos son generalmente iterativos. Recuerde que en la mayora de las
situaciones no es conveniente disear un experimento demasiado comprensivo al
principio de un estudios Un diseo exitoso requiere conocer los factores
importantes, los rangos en los que estos factores se harn variar, el nmero
apropiado de niveles para cada factor y los mtodos y las unidades de medicin
adecuados para cada factor y respuesta. En general, ningn experimentador est
en posicin de responder estas cuestiones al principio del experimento, sino que
las respuestas aparecen sobre la marcha.

Captulo 2
Experimentos comparativos simples
Conceptos bsicos
A cada una de las observaciones del experimento se le llamara una corrida. Observe que
las corridas individuales difieren, por lo que existen fluctuaciones, o ruido, en los
resultados. Es comn llamar a este ruido el error experimental o simplemente el error. Se
trata de un error estadstico, lo cual significa que se origina por la variacin que no est
bajo control y que generalmente es inevitable. La presencia del error o ruido implica que
la variable de respuesta, es una variable aleatoria. Una variable aleatoria puede ser
discreta o continua. Si el conjunto de todos los valores posibles de la variable aleatoria es
finito o contablemente infinito, entonces la variable aleatoria es discreta, mientras que si
el conjunto de todos los valores posibles de la variable aleatoria es un intervalo, entonces
la variable aleatoria es continua.
Es frecuente usar mtodos grficos simples como ayuda para analizar los datos de un
experimento. El diagrama de puntos, es un recurso muy til para representar un cuerpo
reducido de datos (digamos hasta unas 20 observaciones). El diagrama de puntos le
permite al experimentador ver de inmediato la localizacin o tendencia central de las
observaciones y su dispersin.

Cuando los datos son muy numerosos, es difcil distinguir las observaciones graficadas en
un diagrama de puntos, y en tal caso sera preferible un histograma. El histograma
muestra la tendencia central, la dispersin y la forma general de la distribucin de los
datos.

El diagrama de caja (o diagrama de caja y bigotes) es una manera muy til de representar
grficamente los datos. En un diagrama de caja se muestra el mnimo, el mximo, los
cuartiles inferior y superior (el percentil 25 y el percentil 75, respectivamente) y la
mediana (el percentil 50) en una caja rectangular alineada horizontal o verticalmente. La
caja se extiende del cuartil inferior al cuartil superior y se traza una lnea por la mediana
que atraviesa la caja. Se trazan dos lneas (o bigotes) que se extienden de los extremos de
la caja hasta (de manera tpica) los valores mnimo y mximo.

Los diagramas de puntos, los histogramas y los diagramas de caja son tiles para resumir
la informacin de una muestra de datos. Para describir con mayor detalle las
observaciones que podran presentarse en una muestra, se usa el concepto de
distribucin de probabilidad. La estructura de la probabilidad de una variable aleatoria,
por ejemplo y, se describe mediante su distribucin de probabilidad. Cuando y es discreta,
es comn hacer referencia a su distribucin de probabilidad, por ejemplo p(y), como la
funcin de probabilidad de y. Cuando y es continua, es comn hacer referencia a su
distribucin de probabilidad, por ejemplo f(y), como la funcin de densidad de
probabilidad de y.

La meda, , de una distribucin de probabilidad es una medida de su tendencia central o


localizacin. Matemticamente, la media se define como:

La media tambin puede expresarse en trminos del valor esperado o valor promedio a la
larga de la variable aleatoria y como en la figura, donde E denota el operador del valor
esperado:

La variabilidad o dispersin de una distribucin de probabilidad puede medirse con la


varianza, la cual se define como:

La varianza puede expresarse exclusivamente en trminos del valor esperado debido a


que:

Por ltimo, el uso de la varianza es tan frecuente que resulta conveniente definir un
operador de la varianza V tal que:

Los conceptos de valor esperado y varianza pueden ser tiles para revisar varios
resultados elementales relacionados con estos operadores. Si y es una variable aleatoria
con medida y varianza y c es una constante, entonces:

Muestras aleatorias, media muestral y varianza muestral


El objetivo de la inferencia estadstica es sacar conclusiones acerca de una poblacin
utilizando una muestra de la misma. La mayora de los mtodos incluyen el supuesto de
que se usan muestras aleatorias. Es decir, si la poblacin contiene N elementos y va a
seleccionarse una muestra de n de ellos, y si cada una de las N!/(N - n)!n! muestras
posibles tiene una probabilidad igual de ser escogida, entonces al procedimiento
empleado se le llama muestreo aleatorio.
En la inferencia estadstica se utilizan profusamente cantidades calculadas a partir de las
observaciones de la muestra. Un estadstico se define como cualquier funcin de las
observaciones de una muestra que no contiene parmetros desconocidos.
Propiedades de la media y la varianza muestrales
La media muestral es un estimador de un parmetro desconocido es un estadstico que
corresponde con dicho parmetro. Observe que un estimador puntual es una variable
aleatoria. Al valor numrico particular de un estimador, calculado a partir de los datos
muestrales, se le llama una estimacin. Un buen estimador puntual debe tener varias
propiedades. Dos de las ms importantes son las siguientes:
1. El estimador puntual deber ser insesgado. Es decir, el parmetro que se est
estimando deber ser el promedio o valor esperado a la larga de! estimador
puntual. Aun cuando la ausencia de sesgo es deseable, esta propiedad por s sola
no siempre hace que un estimador sea adecuado.
2. Un estimador insesgado deber tener la varianza mnima. Esta propiedad
establece que el estimador puntual de varianza mnima tiene una varianza que es
menor que la varianza de cualquier otro estimador del parmetro en cuestin.

En algunos experimentos comparativos simples puede conseguirse un mejoramiento


significativo de la precisin haciendo comparaciones de observaciones pareadas del
material experimental. Por ejemplo, considere una mquina para probar la dureza que
presiona una barra con una punta afilada sobre un ejemplar de prueba de metal con una
fuerza conocida. Al medir la profundidad de la depresin producida por la punta, se
determina la dureza del ejemplar de prueba. En esta mquina pueden instalarse dos pune
tas diferentes y aun cuando la precisin (la variabilidad) de las mediciones hechas con las
dos puntas parece ser la misma, se sospecha que una de las puntas produce diferentes
lecturas de la dureza que la otra.
Sera posible realizar un experimento de la siguiente manera. Podran seleccionarse al azar
varios ejemplares de prueba del metal (por ejemplo, 20). La mitad de estos ejemplares de
prueba podran probarse con la punta 1 y la otra mitad con la punta 2. La asignacin
exacta de los ejemplares a las puntas se determinara de manera aleatoria. Puesto que se
trata de un diseo completamente aleatorizado.
Al reflexionar un poco al respecto, se descubrira una seria desventaja del diseo
completamente aleatorizado en este problema. Suponga que los ejemplares de prueba
del metal se cortaron de barras diferentes que se fabricaron a temperaturas diferentes o
que no fueran exactamente homogneos en cualquier otra forma que pudiera afectar la
dureza. Esta falta de homogeneidad entre los ejemplares contribuir a la variabilidad de
las mediciones de la dureza y tender a inflar el error experimental, haciendo ms difcil
detectar una diferencia real entre las puntas.
Para protegerse de esta posibilidad, considere un diseo experimental alternativo.
Suponga que cada ejemplar de prueba tiene el tamao suficiente para que puedan
hacerse en 1 dos determinaciones de la dureza. Este diseo alternativo consistira en
dividir cada ejemplar de prueba en dos secciones, para despus asignar de manera
aleatoria una punta a una mitad de cada ejemplar de prueba y la otra punta a la otra
mitad. El orden en que se prueban las puntas en un ejemplar de prueba particular se
seleccionara al azar. Un modelo estadstico que describe los datos de este experimento
puede expresarse como:

En muchos experimentos, el inters se encuentra en las posibles diferencias en la


respuesta media de dos tratamientos. Sin embargo, en algunos experimentos es la
comparacin de la variabilidad en los datos lo que es importante. En la industria de
alimentos y bebidas, por ejemplo, es importante que la variabilidad del equipo de llenado
sea pequea para que todos los empaques estn cerca del peso neto nominal o el
volumen del contenido neto nominal. En los laboratorios qumicos, tal vez quiera
compararse la variabilidad de dos mtodos de anlisis.

Captulo 3
Experimentos con un solo factor: el anlisis de varianza
Un ingeniero de desarrollo de productos tiene inters en investigar la resistencia a la
tensin de una fibra sinttica nueva que se usar para hacer tela de camisas para
caballero. El ingeniero sabe por experiencia previa que la resistencia a la tensin se afecta
por el peso porcentual del algodn utilizado en la mezcla de materiales de la fibra.
Adems, sospecha que al aumentar el contenido de algodn se incrementar la
resistencia, al menos en un principio.
Sabe asimismo que el contenido de algodn deber variar entre 10 y 40 por ciento para
que el producto final tenga otras caractersticas de calidad que se desean (como la
capacidad de ser sometido a un tratamiento de planchado permanente). El ingeniero
decide probar ejemplares en cinco niveles del peso porcentual del algodn: 15, 20, 25, 30
y 35 por ciento.
Tambin decide probar cinco ejemplares en cada nivel del contenido de algodn. Se trata
de un ejemplo de un experimento con un solo factor con a = 5 niveles del factor y n = 5
rplicas. Las 25 corridas debern realizarse de manera aleatoria. Para ilustrar como puede
aleatorizarse el orden de las corridas, suponga que las corridas se numeran de la siguiente
manera:

Ahora se selecciona un nmero aleatorio entre 1 y 25. Suponga que este nmero es 8.
Entonces la observacin nmero 8(20% de algodn) se corre primero. Este proceso se
repetira hasta que las 25 observaciones tengan asignada una posicin en la secuencia de
prueba. Muchos paquetes de software, para ayudar a los experimentadores a seleccionar
y construir un diseo, aleatorizan el orden de las corridas utilizando nmeros aleatorios de
esta manera.
Esta secuencia de prueba aleatorizada es necesaria para evitar que los efectos de variables
perturbadoras desconocidas las cuales quiz varen fuera de control durante el
experimento contaminen los resultados. Para ilustrar esto, suponga que las 25 corridas
de prueba tuvieran que realizarse en el orden original no aleatorizado (es decir, primero
se prueban los cinco ejemplares con 15% de algodn, despus se prueban los cinco
ejemplares con 20% de algodn, etc.). Si la mquina empleada para probar la resistencia a
la tensin presenta un efecto de calentamiento tal que entre ms tiempo est
funcionando sean menores las lecturas de la resistencia a la tensin observadas, el efecto

del calentamiento contaminar potencialmente los datos de la resistencia a la tensin y


destruir la validez del experimento.
Suponga que el ingeniero corre la prueba en el orden aleatorio que se ha determinado. En
la tabla 3-1 se muestran las observaciones que obtiene para la resistencia a la tensin.
Siempre es una buena idea examinar grficamente los datos experimentales. En la figura
3-1 se muestran los diagramas de caja para la resistencia a la tensin con cada nivel del
peso porcentual de algodn, y en la figura 3-2 se ilustra un diagrama de dispersin de la
resistencia a la tensin contra el peso porcentual del algodn.

En la figura 3-2, los puntos rellenos son las observaciones individuales y los crculos huecos
son los promedios de la resistencia a la tensin observada. Ambas grficas indican que la
resistencia a la tensin se incrementa cuando el contenido de algodn se incrementa,
hasta cerca de 30% de algodn.

Despus de 30% de algodn, hay un marcado descenso de la resistencia a la tensin. No


hay evidencia slida que sugiera que la variabilidad de la resistencia a la tensin alrededor
del promedio dependa del peso porcentual del algodn. Con base en este anlisis grfico
simple, se tienen firmes sospechas de que 1) el contenido de algodn afecta la resistencia
a la tensin y 2) alrededor de 30% de algodn produce la resistencia mxima. Suponga
que se quiere ser ms objetivo en el anlisis de los datos. Especficamente, imagine que
quieren probarse las diferencias entre las resistencias a la tensin promedio con todos los
niveles a = 5 del peso porcentual del algodn.
Por lo tanto, el inters se centra en probar la igualdad de las cinco medias. Pudiera
parecer que este problema se resolvera realizando una prueba t para todos los pares de
medias posibles. Sin embargo, no es esta la mejor solucin de este problema, porque
llevarla a una distorsin considerable en el error tipo I. Por ejemplo, suponga que quiere
probarse la igualdad de las cinco medias usando comparaciones por pares. Hay 10 pares
posibles, y si la probabilidad de aceptar correctamente la hiptesis nula en cada prueba
individual es de 1 a = 0.95, la probabilidad de aceptar correctamente la hiptesis nula
en las 10 pruebas es de
= 0.60 si las pruebas son independientes. Por lo tanto, ha
ocurrido un incremento sustancial en el error tipo I.
El procedimiento correcto para probar la igualdad de varias medias es el anlisis de
varianza. Sin embargo, el anlisis de varianza tiene un rango de aplicaciones mucho ms
amplio que el problema anterior. Probablemente sea la tcnica ms til en el campo de la
inferencia estadstica. En algunos experimentos con un solo factor, puede ser diferente el
nmero de observaciones que se hacen dentro de cada tratamiento. Se dice entonces que
el diseo es no balanceado. Sigue siendo posible aplicar el anlisis de varianza, pero deben
hacerse ligeras modificaciones en las frmulas de las sumas de cuadrados.
La descomposicin de la variabilidad presente en las observaciones mediante la identidad
del anlisis de varianza es una relacin puramente algebraica. Sin embargo, el uso de la
particin para probar formalmente que no hay diferencias en las medias de los
tratamientos requiere que se satisfagan ciertos supuestos. Especficamente, estos
supuestos son que el modelo. Sin embargo, es comn que en la prctica estos supuestos
no se satisfagan exactamente. Por consiguiente, en general no es prudente confiar en el
anlisis de varianza hasta haber verificado estos supuestos. Las violaciones de los
supuestos bsicos y la adecuacin del modelo pueden investigarse con facilidad mediante
el examen de los residuales.
El examen de los residuales deber ser una parte automtica de cualquier anlisis de
varianza. Si el modelo es adecuado, los residuales debern estar sin estructura; es decir,
no debern contener patrones obvios. A travs de un estudio de los residuales, pueden
descubrirse muchos tipos de inadecuaciones del modelo y violaciones de los supuestos
subyacentes.

Despus de realizar el experimento, llevar a cabo el anlisis estadstico e investigar los


supuestos fundamentales, el experimentador est listo para sacar conclusiones prcticas
acerca del problema bajo estudio. Muchas veces esto es relativamente fcil, y ciertamente
en los experimentos sencillos que se han considerado hasta este punto, esto podra
hacerse de manera un tanto informal, tal vez mediante la inspeccin de las
representaciones grficas, como los diagramas de caja y el diagrama de dispersin. Sin
embargo, en algunos casos es necesario aplicar tcnicas ms formales.
En cualquier problema de diseo experimental, una decisin crtica es la eleccin del
tamao de la muestra; es decir, determinar el nmero de rplicas que deben correrse. En
general, si el experimentador tiene inters en detectar efectos pequeos, se necesitan
ms rplicas que cuando el experimentador se interesa en detectar efectos grandes. Aun
cuando la revisin se centra en un diseo con un solo factor, la mayora de los mtodos
pueden usarse en situaciones experimentales ms complejas.

También podría gustarte