Está en la página 1de 143

UNIVERSIDAD AUTNOMA DE YUCATN

FACULTAD DE MATEMTICAS

Diseo y Anlisis de Experimentos

QFB. J. Irene Peniche Ayora, MIA.


2

DISEO DE EXPERIMENTOS

Antecedentes Histricos.

El Diseo de Experimentos (DDE) surge principalmente de las investigaciones


agrcolas. En1812, Gauss haba propuesto la Prueba de Hiptesis.
En 1843, se estableci en Londres la Estacin Agrcola Experimental en
Rothamsted.
En 1908, Gosset propone la prueba t de Student para comparar dos medias a partir
de dos muestras pequeas.
En 1915, Ronald Aylmer Fisher demuestra rigurosamente la validez de los mtodos
de Gosset y con esto y la revisin de los principios de la herencia se presenta en
Rothamsted.
En 1919, contrataron a Ronald A. Fisher para ver lo que los nuevos mtodos
estadsticos podran hacer por la agricultura. Permaneci en Rothamsted hasta 1933.
Fisher contribuye con: distribuciones probabilsticas derivadas de la normal, el
anlisis de varianza y el diseo de bloques completos al azar.
En 1926, introduce el concepto de aleatorizacin de las unidades experimentales a
los tratamientos con lo que se justifica la validez del criterio de prueba. Publica su
artculo El Arreglo en Experimentos de Campo donde habla de la aleatorizacin, el
control local para reducir el error y la rplica para estimar la varianza del error.
En 1930 arranca la era industrial con los diseos propuestos por Box y Wilson. En
la industria los experimentos fuera de lnea requieren resultados rpidos y que los
resultados de un experimento conduzcan al planteamiento de otro que lleve a la
solucin de un problema en la lnea de produccin. Es durante los siguientes 30
aos que los diseos experimentales aplicados a la industria se utilizan y se
profundizan, modifican o proponen nuevos diseos.
En 1933, Fisher sucede a Karl Pearson como Profesor en la Universidad de
Cambridge.
Fisher es el autor de dos libros de diseo de experimentos: Statistical Methods for
Research Workers (1925) y The Design of Experiments.
En 1934 Fisher y Yates estudian los cuadros latinos.
En 1935 Fisher publica su primera versin del Diseo de Experimentos.
Cuando sale Fisher de Rothamsted contratan a Frank Yates como su sucesor y
contribuye con los diseos balanceados de bloques incompletos en 1936.
En 1937 contribuye con los diseos factoriales 2k.
En 1939 Bose y Nair completaron el trabajo de Yates con los diseos parcialmente
balanceados de bloques incompletos.
En 1945 Finney contribuye con los diseos factoriales fraccionarios. Y en 1946
Plackett y Burman introducen los diseos del mismo nombre. Rao en 1950 escribe
sobre la teora de stos.
Ya en 1950 aparece el Dr. Genichi Taguchi con sus nuevas aproximaciones del
diseo de experimentos que enfatiza su inters en la evaluacin de un gran nmero
3

de efectos principales ms que en las interacciones de los mismos. Las aportaciones


de Taguchi corresponden a la Ingeniera de la Calidad. Lo importante es la calidad
del producto, y un producto es de calidad en la medida en que sus valores
funcionales se acercan a valores objetivos. Para asegurar la calidad es necesario el
diseo que incluya la arquitectura del sistema, los valores nominales de los
parmetros y la tolerancia del sistema. Es importante encontrar el sistema ms
sencillo que funcione. Sigue entonces determinar los valores de los parmetros del
proceso y los niveles de los factores tales que optimicen la caracterstica funcional
del producto y la hagan menos sensible a factores no controlados. Algunos factores
son controlables y se fijan a voluntad del investigador y deben permanecer
constantes una vez elegidos. Y otros factores son incontrolables y sus valores
pueden cambiar de unidad a unidad, o de un tiempo a otro. Debido a que no se
pueden controlar se debe conocer su campo de variacin. Estos son los que forman
el ruido del sistema. En la metodologa de Taguchi se eligen los niveles de los
parmetros de control de modo que el producto sea robusto o insensible al ruido. No
se controla el ruido, sino que se minimiza su influencia.

Su mtodo opera con la premisa de que los datos no se ajustan perfectamente a una
distribucin normal. Recolectan datos rpida e iterativamente. Los diseos de
Taguchi se aplican en la industria de manufactura. Estos diseos conocidos como
diseos paramtricos robustos reconocen dos tipos de variables en un experimento,
aqullos que se pueden controlar y que denomina parmetros y aqullos que no se
pueden controlar y que denomina factores de ruido. Los diseos consisten en
combinar fracciones de diseos factoriales (donde los factores son los parmetros)
con los factores de ruido y se determina la mejor combinacin que produzca la
respuesta deseada y con la menor variacin. Aqulla combinacin que produzca
estas condiciones recibe el nombre de robusto. Y el inters de la metodologa de
Taguchi es encontrar aquellas condiciones de un proceso que sea poco sensible a los
cambios ambientales o de ruido. Esta metodologa an despierta controversias por
cuanto a la estrategia experimental y sus mtodos presentan problemas.
En 1951 Box y Hunter contribuyen con anlisis de diseos compuestos en la
superficie de respuesta.
En 1954 Tukey y Scheff desarrollan mtodos para comparaciones mltiples.
En 1957 Box trabaja con la metodologa de superficies de respuesta.
En 1960 se desarrollaron los diseos Box Behnken
En 1961 Box y Hunter trabajan en los diseos fraccionarios de resolucin 2k-p.
Otros que han contribuido al desarrollo del DDE son Kempthorne, Cox, Myers etc.
A partir de las controversias que se han generado con la metodologa de Taguchi y
con el amplio uso del diseo de experimentos en todo campo se inicia la cuarta era
del desarrollo del diseo de experimentos
Alrededor de 1998 Mikel Harry comenz a propagar la metodologa Seis Sigma,
integrndolo al DE en una secuencia Medicin Anlisis- Mejora- Control, cuyo
objetivo es mejorar ambos: manufactura y proceso transaccional o comercial. Hay otra
secuencia para la formulacin: Identificar- Disear- Optimizar- Verificar que se utiliza
para desarrollar nuevos productos y procesos.
4

El DE asume ahora el papel de un agente de cambio no slo en la investigacin, sino


tambin en los negocios.
El Seis Sigma se interesa en mejorar los experimentos en cuanto a cuestiones crticas de
calidad con el 6 Sigma como objetivo de su actuacin.
Se interesa en niveles de actuacin de acuerdo a las expectativas del cliente, se interesa
no solo en producir calidad sino prevenir defectos en productos como en servicios (Goh
T. N, (2001))
"A pragmatic approach to experimental design in industry" Goh T. N (Journal of
applied statistics, vol 28 No 3-4p.- 391-398.

Qu es un experimento?
Antes de plantear un experimento es importante responder a la siguiente pregunta para qu
se va a realizar o qu propsito se persigue para realizarlo?. Puede llevarse a cabo para
determinar las causas de variacin de una variable dependiente o respuesta, para encontrar
las condiciones que dan lugar a una respuesta mxima o mnima, para comparar las
respuestas que se obtienen trabajando las variables independientes a distintos valores o
niveles, o bien para obtener un modelo matemtico que permita predecir respuestas en el
futuro. En pocas palabras, los experimentos los realizan los investigadores para descubrir
algo acerca de un proceso o de un sistema en particular.

Cobb G. (1998) en su libro Introduction to Design and Analysis of Experiments recalca que
al disear un experimento es importante decidir Qu mediciones hacer? Qu condiciones
estudiar? Y Qu material experimental utilizar? Y que planear un experimento es el
resultado de la formulacin de una pregunta. Algo que se desea saber lleva a la formulacin
de una pregunta. En general cuando se plantea la pregunta, sta suele ser muy general y
difcil de responder. Lo primero que hay que hacer es convertirla en una pregunta ms
especfica que pueda responderse planteando un experimento.

Kelly Acampora est interesada en saber lo que pasa cuando los animales invernan,
especficamente desea estudiar cmo los cambios en el ambiente animal causan que el
animal comience a invernar.

Al disear un experimento se debe decidir:

Qu mediciones hacer La respuesta

Qu condiciones estudiar? Los tratamientos

Qu material experimental utilizar? Las unidades experimentales

El diseo debe comenzar con decidir las preguntas por responder, pero no debe limitarse a
una pregunta muy general como la que se plante Kelly. Hay que ser ms especfico y para
esto Kelly tuvo que enfrentarse a las siguientes preguntas:

Qu cambios en el ambiente deben estudiarse?.


5

Ella sabe que los animales invernan cuando llega esta estacin, y sabe que hay ms fro y
que el da es ms corto (fotoperodo corto).
Kelly decidi enfocarse a la segunda clase de cambio. Cambios en el fotoperodo.

Qu clase de medicin hacer con el fin de estudiar el efecto de la duracin


del da?
Una posibilidad sera medir algo como el pulso cardaco o la tasa de respiracin puesto que
son ms lentos cuando el animal est invernando. En su lugar ella decide estudiar otra
variable relacionada con el nivel de actividad nerviosa, especficamente la concentracin de
la enzima Na K ATP-asa de la bomba de sodio. Altas concentraciones indican alta actividad
nerviosa. (No est invernando).

Qu animal estudiar?
Kelly se decide por los hmsteres dorados y no los osos, por razones obvias.

Hasta aqu Kelly se decidi por tres cosas. Estudiar el efecto de la longitud del da
(tratamientos) para medir la concentracin de la enzima Na ATP-asa y usar hmsteres
dorados. Y con estas decisiones una pregunta muy general se convierte en una ms
especfica.

Cul es el efecto de cambiar la longitud del da (fotoperodo) en la concentracin de la


enzima Na+ K+ ATP-asa en hmsteres dorados?

Un experimento es una prueba o serie de pruebas en las cuales se hacen cambios sobre las
variables de entrada de un proceso de manera que se puedan observar o identificar las
razones de los cambios en la variable de salida o respuesta.

Algunos ejemplos son los siguientes:

Un investigador agrcola desea averiguar si un nuevo fertilizante que l ha sintetizado es


mejor que otros dos de amplio uso comercial. Cuenta con un terreno de tres hectreas y
decide probar los tres fertilizantes. Siembra 10 matitas en una hectrea, 10 en otra y 10 en
otra, les agrega los fertilizantes y al cabo de cierto tiempo evala el crecimiento de las
plantas midindoles la altura ganada.

Un qumico en alimentos desea probar si puede cambiar la formulacin de un embutido. El


embutido siempre lo ha elaborado incluyendo en la receta harina de trigo y desea saber si la
harina de maz y la de soya son igual de efectivas en cuanto al contenido de protenas.
Elabora 20 salchichas con cada una de las harinas y evala el contenido de protenas de
cada formulacin.

Un especialista en docencia desea evaluar cuatro mtodos de enseanza y elabora un


instrumento o examen que aplica a 80 estudiantes pero estos estudiantes proceden de
escuelas particulares y de gobierno. Cuenta con 40 estudiantes de una escuela de gobierno
6

y 40 de una escuela particular. Desea eliminar el efecto que podra ejercer la procedencia
del alumno para solamente evaluar los cuatro mtodos de enseanza.

Un Ingeniero qumico desea evaluar el contenido de anhdrido succnico, pH y tiempo de


reaccin en la modificacin por succionacin del almidn nativo de Phaseolus lunatus y
evala el porcentaje de grupos succinilos en el almidn. Prueba dos niveles de pH, dos
concentraciones de anhdrido y dos tiempos de reaccin y determina el efecto de estas
variables en el porcentaje de succinilos que tienen 16 porciones de almidn de Phaseolus
lunatus.

En todos los ejemplos distinguimos variable dependiente o respuesta (variable de salida),


variables independientes o factores y cambios a observar. En cuanto a variables respuesta se
tiene la altura de la planta, el contenido de protenas, la calificacin final y el porcentaje de
succinilos. Distinguimos tambin variables independientes o factores que son los
fertilizantes, el tipo de harina, el mtodo de enseanza y en el cuarto ejemplo se tienen
varias variables independientes o que estn bajo el control del investigador y son
concentracin de anhdrido, pH y tiempo de reaccin.
Tambin se puede distinguir que se van a observar cambios como son el crecimiento de la
planta, los aspectos nutritivos, el aprovechamiento y la succinacin del almidn. En fin se
puede notar que stos contienen los elementos que definen a un experimento.

En los siguientes ejemplos proporcione mentalmente cules son los factores, cul la
variable respuesta y proponga algunos factores no controlables y controlables que pueden
presentarse en cada experimento.

1. Respuesta de diez selecciones de batata al nemtodo agallador Molidogyne


incognita.
En este experimento se evala la respuesta de los clones de batata UCV-2, UCV-4,
UCV-7, UCV-9, UCV-10, UCV-36, Catemaco, Islea, Santa Catalina y Mariara que
crecen en envases plsticos que contenan suelo arenoso infestado con 6 huevos/cm 3 de
M. incognita. El peso de las races y de la parte area de la mayora de los clones se
redujo por la infeccin del nemtodo en comparacin con las plantas testigo. Sin
embargo UCV-2, UCV-7 y Catemaco fueron resistentes.

2. Mtodos de manejo para producir Amaranthus spp.


Se llevaron a cabo experimentos en campo para determinar el perodo de tiempo
adecuado para plantar el Amaranto. Los experimentos se condujeron en suelo arenoso,
especficamente: limo fino, suelo silceo, suelo trmico y Plinthic Paleouult. Se utiliz
el Amaranthus tricolor genotipo RRC 241. Los tratamientos consistieron en diferentes
fechas de plantado los cuales se arreglaron en un diseo de bloques completos
aleatorizados con cuatro rplicas. Las fechas de siembra fueron abril 12, mayo 12,
junio 15, julio 14, agosto 15 y septiembre 14. Cada parcela consisti de cuatro filas de
6.1 longitud espaciadas por 90 cm. Las semillas se plantaron en las seis fechas
indicadas. Los cultivos se cosecharon de 40 a 44 das despus de plantarlas y se les
midi el peso seco despus de secar la planta a 70 en un horno de aire forzado.

3. Efecto del repaso en la retencin de monoslabos.


7

Se trata de comprobar si el repaso es una variable decisiva para retener una lista de
palabras monoslabas de igual valor asociativo. Se establecen los siguientes niveles de
repaso (variable independiente A): A1 una sola presentacin de la lista, A2 dos
presentaciones de la lista con idntica tasa de presentacin, A3 Tres presentaciones de la
lista, A4 cuatro presentaciones. Despus de las correspondientes lecturas se pasa a una
prueba de retencin y se contabiliza la cantidad de palabras recordadas correctamente.

Es importante observar que la aleatorizacin o asignacin aleatoria de los


tratamientos a las unidades experimentales es una caracterstica importante en los estudios
experimentales y que los distingue de los cuasiexperimentos. La investigacin experimental
se caracteriza porque el investigador controla variables y la asignacin aleatoria, en los
estudios observacionales no existe ni control del investigador sobre las variables ni
asignacin aleatoria y en los cuasiexperimentos existe control del investigador pero no
asignacin aleatoria. En estudios observacionales puede sealarse la asociacin entre las
respuestas y los tratamientos y no se pueden hacer inferencias.

Es importante sealar que las verdaderas inferencias de causa-efecto slo pueden obtenerse
de verdaderos experimentos y no tanto de estudios observacionales. Por ejemplo, si en una
fbrica los productos que salen de una mquina comienzan a salir defectuosos, con un
estudio observacional, podra suponerse que se debe a la mquina, al operador o a las
condiciones climticas del sitio en el que se encuentra ubicada la mquina, pero si se realiza
el experimento de cambiar de mquina, probar con distintos operadores o cambiar de
ubicacin la mquina dentro de la misma fbrica, podra llegarse a descubrir la causa de
porqu el producto sale defectuoso.

En resumen, Hicks define claramente un experimento como:

Estudio en el cual ciertas variables independientes se manipulan y se determina su efecto


en una o ms variables dependientes. Los niveles de las variables independientes se
asignan al azar a las unidades experimentales en estudio.

Es importante sealar que los experimentos que se plantean con regularidad son
comparativos, es decir se interesan en comparar distintos tratamientos y muchas veces es
con el objeto de seleccionar al mejor o al que produce una respuesta dada. Sin embargo,
nuestro objetivo no debe limitarse a buscar al ganador, sino a realmente comparar los
tratamientos observando cul es el efecto de cada uno de ellos en la respuesta. Un
tratamiento puede producir el mejor rendimiento pero puede ser de muy alto costo o puede
producir el ms alto rendimiento, pero tambin el ms variable.

Diseo de experimentos
Disear un experimento consiste en PLANEARLO de tal forma que se recolecten los datos
adecuados, los cuales sern analizados por mtodos estadsticos que den como resultados
conclusiones vlidas y objetivas (Montgomery, 1995).

Se deben planear de modo que las comparaciones estn lejos de un error sistemtico, que
sean suficientemente precisos, que las conclusiones tengan un amplio rango de validez, que
8

el arreglo experimental sea tan simple como sea posible y que la incertidumbre de las
conclusiones sea calculable (Cox, 1958).

El papel de la estadstica en el diseo experimental ha sido separar las diferencias


observadas en aqullas causadas por varios factores y aqullas debidas al azar.

Los objetivos de un experimento son:


1. Caracterizar a un proceso, es decir determinar cules variables son las que influyen
ms en la respuesta. Construir un modelo matemtico que relacione la respuesta con
las variables de entrada. Esto sirve para determinar no slo cules variables influyen
sino tambin cuantificar los valores de la variable independiente que optimizan la
respuesta.
2. Optimizar. Determinar la regin en la cual los factores importantes conducen a la
mejor respuesta posible. Supongamos que estamos interesados en mejorar la
produccin de un proceso qumico y deseamos saber en qu valores determinados
de tres variables la respuesta es mxima. De manera que no slo se investigan
valores especficos de las variables, sino tambin las regiones comprendidas por
estos.
3. Disear un producto. Para la elaboracin de un producto controlar las variables a
determinados niveles y se realiza el experimento para determinar con cul
combinacin de niveles de obtiene un producto acorde con las especificaciones.
4. Determinar las tolerancias de los componentes y sistemas. Se estudia un proceso
con los niveles altos y bajos de factores crticos en la respuesta y se determina
cules componentes tienen tolerancias ms crticas.
Nota: Para una profundizacin leer el artculo Experimental Design for product and
process design and development Douglas C. Montgomery. The Statistician (1999). Vol. 48
part 2, pp. 159-177.
Y para profundizar respecto a las diferencias del DDE de Taguchi y el de Fisher leer el
artculo Methodologies for Experimental Design: A Survey, Comparison and Future
Predicions Kiang-Meng Tay and Clive Butler. Quality Engineering. 11(3) pp. 343-356.

Cobb (1998) considera que para disear un experimento y una vez que se haya definido el
problema con claridad hay que tratar de identificar las fuentes de variabilidad que pudieran
afectar en el experimento:
1. variabilidad debida a las condiciones de inters.
2. variabilidad debida al proceso de medicin.
3. variabilidad debida al material experimental y al proceso.

Un buen diseo permitir estimar la cantidad de variables debida a cada fuente.


En el experimento de Kelly, se utilizaron ocho hmsteres dorados, cuatro recibieron
fotoperiodo largo y cuatro fotoperiodo corto.
Las lecturas de la enzima fueron.

[] (mg/l) en los corazones de 8 hmsteres


Fotoperiodo largo. 1.49 1.53 1.56 1.79 x 1.59 Rango 1.49-1.79
Fotoperiodo corto 1.39 1.49 1.25 1.38 x 1.32 Rango 1.25-1.49
9

Aparentemente hay diferencia ya que los promedios difieren, y vemos que hay mucha
variabilidad 0.3 y de 0.24. Se necesita estimar cunto de la diferencia entre promedios es
debido a la longitud del da y cunto es debido a otras fuentes.
Variabilidad de las condiciones de inters- variacin del fotoperodo.
Es decir la fuente de variacin que si se quiere y se estima el efecto del fotoperiodo, para
elegir el rgano donde se medir la enzima. La concentracin de la enzima depende del
rgano que se mida. Kelly decidi estudiar dos rganos: corazn y cerebro. Se pregunt
hay diferente en el cerebro y corazn de los hmsteres? Ella sabe que en el cerebro
concentracin es mayor. La longitud del fotoperiodo afectar la concentracin de la enzima
del mismo modo en el cerebro y en el corazn. Es de esperar que debido a que tienen
distintas funciones, el cerebro y el corazn se comporten distinto cuando estn listos para
invernar. Es decir evala si existe interaccin, el efecto del fotoperodo depende del
rgano donde se mide la enzima?
Das largos vs. Das cortos.
Cerebros vs. Corazones.
La otra variabilidad es en la respuesta:
Cuando mides dos cosas bajo las mismas condiciones nunca obtienes un nmero idntico.
Nuestro experimento debe permitirnos estimar el tamao de la diferencia debido a tal
variabilidad inevitable en el proceso de medicin.
Para determinar la concentracin de la enzima, Kelly tuvo que sacrificar al hmster, separar
el tejido y usar una metodologa o secuencia de pasos para suspender la enzima en un
lquido y, como paso final, medir la concentracin de la enzima usando un
espectrofotmetro para medir la cantidad de luz absorbida por partculas suspendidas. En
cada etapa de todo el experimento habr cosas que producirn diferencias. Comenzando por
la diseccin, este es un proceso difcil, particularmente por que se desea el tejido "puro", a
la hora de leer en el equipo, an calibrndose, en cada corrida de mediciones se introducir
la variabilidad cada vez que se calibre el espectrofotmetro.

3.- Variabilidad en el material experimental.


Es inevitable, difcilmente se encuentran clones de hmster idnticos en todo, incluso en su
gentica. Algunos tendrn ms concentraciones de la ATP-asa.

En el experimento de Kelly podemos atar algunas fuentes de variabilidad.

1) En las condiciones de inters:


Longitud del da: largo vs. corto.
rgano: corazn vs. cerebro.
Al decidirse por estos dos rganos se pregunta tambin hay diferencia de la
concentracin de la enzima entre el cerebro y el corazn? Esta pregunta es muy obvia,
Kelly ya sabe que la actividad nerviosa es ms alta en el cerebro, pero puede
preguntarse La duracin del da puede afectar la concentracin de la enzima de la
misma manera en el cerebro y el corazn?

2) Proceso de medicin:
- Preparacin en suspensin de la enzima.
- Calibracin del espectrofotmetro.
10

3) En el material experimental:
Diferencias biolgicas entre hmsteres.
Diferencias de ambiente y comportamiento.

Una vez que se ha planeado la medicin, las condiciones o tratamientos y el material te


preguntas Cmo asignar los tratamientos a las unidades experimentales?

Guas para una investigacin experimental


1. Reconocimiento y planteamiento del problema. Lo primero es reconocer que se
tiene una dificultad. No es fcil darse cuenta de que un problema que requiere
experimentacin existe. Es necesario establecer claramente los objetivos del
experimento. Requiere de un equipo multidisciplinario y ya juntos obtener una lista
reducida de posibles causas.
2. Seleccionar la variable respuesta. Especificar la variable a ser medida. Elegir
aqulla en la que es ms visible el efecto o la que proporcione informacin til
acerca del proceso bajo estudio. Una variable dependiente ideal es continua, fcil y
exactamente medible y directamente relacionada con la capacidad de deteccin de
las personas. Los resultados del experimento, medidos como la variable respuesta,
son resultados de procesos aleatorios por lo que la variable respuesta es una
verdadera variable aleatoria. Es importante conocer la forma de su distribucin pues
esto generalmente dicta qu prueba estadstica puede utilizarse para el anlisis.
Tambin es importante conocer el instrumento de medicin de la variable respuesta
y la precisin del instrumento para hacer las mediciones.
3. Especificar los factores y los niveles. Especificar las variables independientes o que
estn bajo el control del investigador, as como los valores de las variables que se
van a estudiar. Los factores a ser utilizados deben se medibles (cuantitativos) o
distinguibles (cualitativos). Los primeros tienen niveles que varan por categora y
los ltimos tienen valores o niveles que corresponden a cantidades o mediciones.
Los factores o variables independientes deben ser controlables. Para elegir los
factores a estudiar puede elaborarse un diagrama de Causa-Efecto o diagrama de
Ishikawa (hueso de pescado). En este diagrama la variable dependiente se escribe a
la derecha con una flecha gruesa sealndola. Cada factor principal se identifica y
tiene una flecha ramificada sealando a la flecha gruesa principal. Los factores que
ms influyen tiene flechas pero ms delgadas que la principal. Los huesos
principales o ramificaciones principales corresponden a las mquinas, el material, el
mtodo, el hombre y el ambiente. De cada ramificacin parten otras que
corresponden a cada categora. Con este diagrama, el equipo multidisciplinario
descarta y selecciona aqullas variables independientes que pueden influir en el
cambio que se ha observado de la respuesta. El nmero de niveles de cada factor o
variable independiente debe determinarlo las necesidades del investigador. Algunas
veces los niveles de un factor son predeterminados y no se pueden cambiar, y en
otras ocasiones el nmero de niveles es opcional. Todo lo que afecta el valor de la
respuesta es un factor potencial a ser estudiado e incluye aqullos que pueden
controlarse as como los que estn fuera de control, tales como las fluctuaciones
diarias o diferencias en contenido en suelo de parcela a parcela. Los niveles de stos
11

no pueden ajustarse a valores especficos. Cada nivel representa un efecto particular


del da o de la parcela y se considera aleatorio. Es importante recalcar que para
obtener conclusiones lo ms especficas posibles, es necesario un estricto control de
aquellas variables controlables de modo que se minimicen las variaciones aleatorias,
con esto se obtendra precisin en el experimento.
4. Definicin del espacio inferencia. El investigador debe tomar decisiones en los
lmites de inferencia. Estos lmites dentro de los cuales se aplican los resultados se
llama espacio inferencia. Si el factor es fijo, es decir si se estudian determinados
niveles del factor, el espacio se limita a los niveles estudiados, y si el factor es
aleatorio, es decir se toma una muestra de niveles de una poblacin grande para
conocer la variabilidad de niveles, las conclusiones se pueden extrapolar a la
poblacin de niveles de la cual se tom la muestra.
5. Seleccin aleatoria de las unidades experimentales. La unidad experimental se
refiere al tipo de material experimental que recibe la aplicacin de los varios
factores y que es representativo del espacio inferencia deseado. Una vez que se han
seleccionado las unidades por el experimentador; debe seleccionarse aleatoriamente
un nmero suficiente de unidades. Es necesaria la seleccin aleatoria para proteger
contra cualquier sesgo en el experimento. El nmero de unidades depende del
tamao del experimento y del previo conocimiento del error estndar de las medias.
Adems del nmero de rplicas y la seleccin del orden de los ensayos
experimentales, es necesario determinar cmo ser la aleatorizacin de los
tratamientos a las unidades experimentales. La aleatorizacin permite repartir
homogneamente entre todas las unidades experimentales todas aquellas variaciones
que no pueden controlarse. Tambin deben seleccionarse aleatoriamente el orden en
el que se llevarn a cabo los ensayos para evitar tendencias que se presenten al
realizar los primeros (con muchas variaciones) y los ltimos (realizados con ms
precisin).
6. Arreglo o bosquejo del diseo. Idealmente queremos que las unidades
experimentales sean afectadas nicamente por los factores de nuestro inters. Si
existen otros presentes, deseamos minimizar su efecto con el objeto de ver
claramente el efecto de nuestros factores. Esto incluye factores desconocidos por el
experimentador y aquellos no controlados. Incluyen tambin tendencias sistemticas
en las unidades experimentales, factores que cambian con el tiempo y el espacio.
Los factores que pueden controlarse por el experimentador deben mantenerse a un
nivel fijo con el espacio inferencia limitado a ese nivel solamente. Para minimizar el
efecto de factores desconocidos hay que asignar aleatoriamente las combinaciones
de tratamiento y aleatorizar el orden o ubicacin de los tratamientos. Como
resultado de la aleatorizacin completa las estimaciones de los parmetros deben
ser insesgados y las pruebas de significancia deben ser vlidas. Desafortunadamente
a veces no es posible la completa aleatorizacin y si la variable se puede controlar a
valores fijos y se desea eliminar su efecto, se usa el control directo a travs de un
diseo de bloques y si no un control indirecto manejando a esta variable como
covariable en el anlisis de covarianza.
7. Desarrollo de un modelo matemtico. Esto se realiza antes de la ejecucin del
experimento. El modelo indica la relacin que guarda la variable respuesta con
todas las fuentes de variacin. El modelo matemtico mostrar a la variable
respuesta como una funcin de los factores que se estudian y tambin mostrar las
12

restricciones que se pueden poner a la aleatorizacin y tambin contiene el trmino


que incluye las fuentes de variacin no controlables o error. Por tanto, contiene
informacin de todos los factores y de sus niveles. Los factores se denotan con
letras griegas y sus subndices corresponden a los niveles.
8. Correr un experimento piloto. El correr un experimento con unas pocas
observaciones, permitir practicar el procedimiento experimental, identificar los
problemas que pudieran presentarse en el experimento grande, para checar la lista
de pasos a realizar y para calcular el error experimental que servir en el clculo del
tamao de muestra.
9. Evaluacin Preliminar del diseo. El investigador desarrollar una tabla con todas
las fuentes de variacin, es decir con las etiquetas de los factores, sus errores de
restriccin, sus interacciones, grados de libertad , sumas de cuadrados, cuadrados
medios esperados etc. La tabla indicar no slo los factores a probar sino los
estadsticos de prueba correspondientes. Todo esto debe considerarse antes de
obtener algn dato. As notar cules se pueden probar directamente, la cantidad de
informacin disponible para estas pruebas y las suposiciones necesarias para hacer
pruebas conservadoras. Asimismo debe ver si tiene sentido en la vida prctica.
10. Rediseando el experimento. Considerando lo anterior, se plantear un nuevo
diseo y se comparar la tabla anterior con la actual.
11. Recoleccin de los datos. Una vez que se ha determinado si el diseo es el ms
adecuado para el experimento, ste puede llevarse a cabo para finalmente obtener
los datos. Antes de realizarlo es conveniente hacer un experimento piloto para
obtener informacin de la consistencia del material experimental, para comprobar
el sistema de medicin, para tener una idea del error experimental y para revisar la
realizacin del experimento. Se requiere de un equipo organizado y muchos
observadores. El xito de la investigacin depende de la validez de todos los datos
obtenidos. Una de las mejores maneras de recolectarlos es aquella en la que el
estadstico disee una forma de entrada de datos el cual sera llenado por el
inspector y despus verificado por una persona que lleve a cabo el experimento. La
forma debe ser fcil de usar, entendible y a prueba de malas interpretaciones.
12. Analizando los resultados. El anlisis de los resultados es responsabilidad del
estadstico y debern emplearse mtodos estadsticos que garanticen la objetividad
de las conclusiones. Se servir de programas de cmputo, pero es su conocimiento
del diseo estadstico empleado el que le servir para interpretar las salidas de
cmputo. Es importante considerar que en muchos programas hay que especificar si
existe un factor aleatorio porque las pruebas estadsticas cambian si existe uno
aleatorio en el diseo. Actualmente existe la opcin de que uno elija los cocientes de
sus pruebas estadsticas, sin tener que especificar que se trata de un factor aleatorio.
13. Conclusiones. Una vez interpretados los resultados por el estadstico y con la ayuda
de un equipo multidisciplinario se establecen las conclusiones. Montgomery sugiere
realizar corridas de seguimiento o pruebas de comprobacin para validar las
conclusiones del experimento.

Ejercicio
Elige un artculo de investigacin del rea e identifica los siguientes puntos:
a) Problema
b) Hiptesis de investigacin
13

c) Objetivo del estudio


d) Los tratamientos
e) Las unidades experimentales
f) La variable respuesta
g) La aleatorizacin y el diseo experimental
h) La hiptesis estadstica y los anlisis estadsticos
i) Las conclusiones y la confiabilidad.

Reporte tcnico de una investigacin experimental


Una vez realizada la investigacin es importante la comunicacin de la misma. A
continuacin se presenta una sugerencia de los puntos que debe contener el mismo y que se
emplea en el curso como gua de los trabajos individuales.

El trabajo debe contener:


1. Ttulo del Trabajo. Que contenga el menor nmero posible de palabras y que describa
adecuadamente el contenido. Tiene que ser lo ms especfico y claro posible. Escribirlo
en una hoja separada que incluya el nombre del autor y la fecha.
2. Resumen. Un breve resumen que no ocupe ms de media cuartilla, debe informar al
lector de que se trata el reporte. No debe usarse smbolos ni nmeros y debe contener el
menor nmero de palabras tcnicas posibles. Debe escribirse en pasado, consiste en la
definicin del problema, cmo se analiza y los resultados ms importantes encontrados.
3. Introduccin. Su fin es suministrar suficientes antecedentes para que quin lo lea pueda
comprender y evaluar los resultados del estudio sin necesidad de consultar
publicaciones anteriores sobre el tema. Debe escribirse en presente y debe: a) exponer
con toda claridad la naturaleza y el alcance del problema investigado, b) revisar las
publicaciones pertinentes para orientar al lector. Es realmente una versin extendida del
resumen. Es importante que no exceda dos cuartillas. La introduccin tambin contiene
la pregunta de investigacin y el objetivo del trabajo. Formule una hiptesis o respuesta
tentativa a la pregunta de investigacin, si se tienen las bases suficientes para
proponerla, en caso contrario no la formule. Generalmente es una propuesta de la
relacin que hay entre las variables independientes y que quedan bajo su control, y la
variable dependiente.
4. Metodologa. Debe escribirse de tal modo que la investigacin sea repetible. Consiste
en describir con todo detalle a) MATERIAL Y PROCEDIMIENTO: el material y
equipo que se emple para la realizacin de la investigacin, y el procedimiento en el
laboratorio. Se redacta en tiempo pasado. Y se redacta con tal detalle paso a paso- que
cualquiera pueda entender y seguir. B) MTODO DE ANALISIS ESTADISTICO que
se utiliza y la justificacin del mtodo. C) TRATAMIENTOS, NIVELES DE LOS
FACTORES Y VARIABLE RESPUESTA: Defina con sus palabras quines son los
tratamientos, los niveles de los factores, la variable respuesta y sus unidades de
medicin. D) VARIABLES EXTRAAS: especifique las variables extraas que pueden
contribuir a variaciones en la respuesta y determine cmo minimizar su efecto. (ya sea
mantenindolas constantes, eliminndolas, etc. Y especifique cules de ellas no va a
poder controlar y quedarn dentro del error. E) UNIDADES EXPERIMENTALES:
especificar las unidades experimentales que se utilizarn en el estudio y describir sus
caractersticas con detalle. F) ESPACIO INFERENCIA: especifique el espacio
14

inferencia, es decir las unidades y los tratamientos a los que van a aplicarse las
conclusiones. Es importante que el experimento sea descrito con tal detalle que hasta las
posibles fuentes de error sean consideradas de antemano.
5. Resultados. Esta seccin nos dice lo que encontr. Expresar los resultados en forma
tabular. Utilizar grfica si es necesario. Tablas como grficas deben tener ttulos, y las
variables deben expresarse con sus unidades de medicin. Discuta todas las fuentes de
error y describa cmo podran afectar los resultados. Muestre tambin el proceso de
aleatorizacin de los tratamientos a las unidades experimentales y del orden de las
corridas experimentales.
6. Anlisis de resultados: Esta es la parte ms importante a evaluar en esta asignatura.
Presente estadsticos de resumen con su interpretacin (anlisis exploratorio de los
datos) Realice el anlisis de varianza completo desde la formulacin del modelo hasta
la potencia de la prueba. Proporcione las interpretaciones en trminos del problema.
7. Discusin y Conclusiones. Trate de presentar los principios, relaciones,
generalizaciones que indiquen los resultados; no recapitular resultados. Para hacer
generalizaciones se tiene que tener en cuenta si las unidades experimentales son
representativas de la poblacin, es decir hay que tomar en cuenta el espacio inferencia.
Seale excepciones o faltas de correlacin, delimite aspectos no resueltos. Muestre
cmo concuerdan sus resultados con los de la bibliografa consultada o con la hiptesis
que propuso, formule conclusiones lo ms claramente posible. Igualmente proporcione
ideas para un estudio futuro con el objeto de mejorar el actual.
8. Referencias. Debe incluir el listado de libros o artculos de revistas. Dentro del texto
Ud. puede emplear el sistema Harvard (Nombre, ao) y de las referencias completas en
esta seccin como se muestra a continuacin:

Chapman, M & Mahon, B (1986), Plain Figures, HMSO, London.

Fowler, H. W. (1983), Dictionary of Modern English Usage (2nd edition revised by Ernes
Gowers), Oxford University Press, Oxford and New York.

Gowers, Sir Ernest (1973), The Complete Plain Word (2nd edition revised by Sir Bruce
Fraser), Penguin Books, Harmondsworth, Middlesex.

Respecto a la presentacin el reporte debe ser atractivo a la vista; debe ser claro y legible.
Trate de usar un procesador de textos.

Paginacin. Procure numerar todas las pginas.


Secciones. Todas las secciones del programa deben marcarse con negritas. Las grficas
deben tener ttulo y nmeros. Procure despus de cada grfica que incluya su reporte
interpretar lo ms concienzudamente posible. Las escalas deben ser sensibles y deben
indicarse las unidades de cada eje.
Respecto a las tablas tambin deben numerarse, titularse, Procure que los puntos decimales
queden alineados. Las filas y columnas necesitan etiquetas.
Para la realizacin del trabajo puede emplearse el paquete estadstico Statgraphics; no caiga
en la tentacin de poner en el reporte resultados repetidos, por ejemplo la tabla de anlisis
de varianza que Ud. escribi en su procesador de textos no hay que duplicarla con la que
15

proporciona la salida de cmputo. En lugar de escribirla en el procesador puede cortar y


pegar dentro de su texto la salida del programa.
Respecto al estilo se sugiere:
1. Ser breve, usar palabras cortas.
2. Evite hablar en primera persona. Sea impersonal; se tom la tabla de nmeros
aleatorios y...
3. Evite errores de dedo al escribir y por supuesto los errores ortogrficos.
4. Trate de escribir oraciones completas, no por ser breves enve telegramas.

Definiciones y Conceptos Bsicos

Tratamiento. Es un conjunto de condiciones bajo las cuales se observa una unidad


experimental para ver su efecto. Tambin puede definirse como una combinacin de
variables independientes cuyo efecto se quiere evaluar sobre las unidades a las que se les
aplic. Ejemplos, la marca de fertilizante, la dosis de un medicamento, el mtodo de
enseanza, la temperatura de horneado, etc.
Cuando se estudia nicamente el efecto de una variable independiente definiremos
tratamientos a los valores de la variable que se estudia.. A los valores que asumen las
variables independientes se les llama niveles, pero en el caso de un factor, se les llama
tratamientos. En un experimento que consisti en evaluar distintas condiciones de
polinizacin y autopolinizacin en el nmero de yemas vacas de los pinos navideos en el
estado de Hidalgo, los tratamientos consisten en las distintas condiciones de polinizacin:
sin polinizar y sin proteccin, autopolinizados y sin proteccin, polinizacin libre y sin
proteccin, polinizacin controlada y sin proteccin, sin polinizar y con proteccin, por
mencionar algunos de los ocho tratamientos.
Cuando se estudia el efecto de ms de una variable, un tratamiento es entonces la
combinacin de los niveles de los factores. Si se estudia el efecto de la dosis de un
medicamento en las tasas de aprendizaje, si se prueban 5 dosis cada una de ellas es un
nivel de la variable DOSIS y a su vez es un tratamiento. Si se estuviese estudiando el efecto
del tipo de droga y las dosis de las drogas y se est estudiando dos tipos de droga cada una
con 5 dosis, un tratamiento o condicin de tratamiento viene definida por una combinacin
de una clase particular de droga y una dosis particular. Por lo tanto, las condiciones de
tratamiento son definidas por combinaciones de niveles de las variables independientes.
Con tales diseos es posible evaluar interacciones, es decir es posible evaluar la accin
simultnea de ambas.
En un experimento en el que se compara la tasa de crecimiento de semillas de frijol con
diferentes programas de humedad y luz, los tratamientos consisten en los distintos
programas humedad-luz.
Un experimento que consisti en evaluar distintos niveles de hidratacin (-0.60, -0.81,
-1.21, -1.72) y dos variedades de pepinos (Variedad Hatuey y variedad Japons) los
tratamientos consisten en las combinaciones de los niveles de los dos factores (Snchez,
Jorge et al, 1997)
En un experimento de punto de ebullicin del agua con diferentes concentraciones de sal,
los tratamientos son las diferentes concentraciones.
En un experimento que compara tres diferentes mtodos de enseanza, los tratamientos
consisten en los tres mtodos de enseanza.
16

En un experimento se compara la actuacin de los sujetos o unidades


experimentales en las diferentes condiciones de tratamiento e intenta atribuir diferencias en
el comportamiento a las caractersticas que son distintos a lo largo de los tratamientos.
Supuestamente lo que se pretende es comparar los tratamientos, de modo que se debe
procurar que los otros factores que pudieran afectar la respuesta pero que no son de nuestro
inters se mantengan a niveles constantes, y aquello imposible de controlar quedar dentro
de la variabilidad aleatoria del experimento y dentro del trmino de error.

La variable independiente est sujeta al control del experimentador y es


independiente de los sujetos que sirven en el experimento. A las variables independientes
tambin se les conoce como FACTORES.

Unidad experimental o parcela.


La unidad bsica de observacin o el objeto de estudio en el experimento es la unidad
experimental. Es la unidad a la cual se aplica el tratamiento y que es representativa del
espacio inferencia deseado. El investigador debe seleccionar aleatoriamente a las unidades
experimentales para evitar sesgos. Ejemplos son: un animal, 10 pollos de corral, media
hora. Las unidades observacionales son aqullas en las que se realizan las mediciones y
muchas veces las unidades experimentales son las mismas que las observacionales; cuando
distintas parcelas que contienen plantas constituyen las rplicas del diseo, y a las parcelas
se les aplica el tratamiento, las unidades experimentales son las parcelas y las
observacionales son las plantas en las que se realizan las mediciones.
Cuando se toman unidades observacionales que son parte de una unidad experimental como
rplicas, realmente lo que se tiene son pseudorrplicas; stas no son independientes como
por ejemplo tomar a cada cerdito de un corral como rplica cuando el alimento se le aplic
al corral y no a cada cerdito de modo individual. Un tipo de pseudorrplica se presenta
cuando a una misma unidad experimental se le mide varias veces a lo largo del tiempo, sus
mediciones no son independientes sino que se autocorrelacionan en el tiempo,
pseudoreplicacin temporal.
En experimentos agrcolas generalmente se usa una parcela como unidad experimental. El
tamao y localizacin de la parcela puede afectar los hbitats de crecimiento de la planta
particular bajo consideracin. Qu tipo de unidad experimental emplear? Depende de la
investigacin. Cuntas? Depende de la sensibilidad deseada de la prueba, es decir que tan
potente resulta la prueba para un tamao de muestra dado.

Factores
Son las variables que se controlan y cuyo efecto se mide, es decir, las variables
independientes. Su efecto se mide sobre las unidades experimentales.
Las variables independientes deben ser manipulables a niveles del inters del investigador.
Los niveles pueden ser: varias clases o tipos (cualitativo) o varias magnitudes o cantidades
(cuantitativos).
Tambin es de inters el rango de la variable independiente a ser incluida en el
experimento, especialmente si se trata de estudiar el efecto de un factor cuantitativo. El
rango debe ser tal que s se puedan observar cambios en la respuesta al cambiar de nivel.
Debe ser un rango completo de variacin as como condiciones intermedias para
17

proporcionar una idea de la naturaleza de la relacin de la variable respuesta y la


independiente. Si es un factor cuantitativo y se quiere saber la relacin que guardan las
variables dependiente e independiente es importante el espaciamiento entre los niveles de
un factor, para poder evaluar sus efectos lineal, cuadrtico etc. Algunos ejemplos de
factores cuantitativos son la cantidad de hidratacin, porcentaje de humedad, temperatura,
velocidad del procesador, etc.
Si el factor es cualitativo, se trata de comparar los distintos tipos o valores de la variable.
La manipulacin de factores cualitativos se puede ver como una coleccin de experimentos
pequeos dentro del contexto del gran experimento. Algunos ejemplos de factores
cualitativos son la marca de fertilizante, tipo de procesador, sexo, tipo de caldo de cultivo,
variedad de planta, etc.
Tambin es importante determinar si se trata de factores fijos o de factores aleatorios. Si
son fijos estamos interesados en esos niveles en particular del factor, as como estamos
interesados en diferencias entre medias de tratamientos, y las conclusiones solo podrn
aplicarse a esos niveles particulares solamente. Si son aleatorios estamos interesados en la
variabilidad de los niveles del factor ms que en las diferencias entre medias, las
conclusiones podrn extrapolarse a la poblacin de niveles de la que se extrajo la muestra.
Dependiendo de si el factor es fijo o aleatorio, las hiptesis sern respecto a medias o a
varianzas, y si se trata de efectos fijos se pueden proponer hiptesis para comparar medias
particulares o dado que ya se rechaz la hiptesis de igualdad de medias explorar las
posibles comparaciones entre ellas para investigar si son significativas o no. Si el factor es
aleatorio es importante estimar los componentes de varianza y su contribucin a la
variabilidad total.

Variable respuesta.
Una vez que hemos propuesto una hiptesis hay que detallar el estudio para
recolectar los datos. Se debe decidir el aspecto particular del fenmeno que observaremos y
qu mediciones se harn, qu mediciones capturan el fenmeno ms exactamente. Un
experimento que involucra una simple variable dependiente es un experimento univariado
aunque se est estudiando ms de una variable independiente. Para elegir la variable
respuesta se debe elegir aqulla que sea la ms sensible a las condiciones de tratamiento.
La medicin, esto es la asignacin de etiquetas o nmeros a los atributos de los
objetos o eventos, es un aspecto muy completo. Se supone que es deseable que los valores
de la variable dependiente tengan poca variabilidad de sujeto a sujeto (condiciones
genticas parecidas en las semillas, por ejemplo). Esto incrementar la precisin en las
estimaciones y contribuir a la potencia estadstica para cualquier tamao de muestra.
Tambin la variable dependiente se distribuye normalmente ya que muchos procedimientos
estadsticos paramtricos inferenciales suponen normalidad. Es deseable que la variable
respuesta sea cuantitativa y continua.

Variables suplementarias.
Existen otras variables independientes que pueden afectar a la respuesta pero que no son de
inters del investigador, se les llama suplementarias o Nuisance. Es necesario controlar
estas variables para incrementar la precisin con la cual se pueden estimar los efectos de la
variable independiente o para remover el sesgo de esas estimaciones. Hay dos formas de
controlarla: Directamente (experimentalmente, a travs del bloqueo), indirectamente (como
covariables) o si no se pueden controlar quedan comprendidas dentro del trmino de error.
18

Tambin estn incluidas aqullas que pueden afectar a la respuesta, que no se pueden
controlar a niveles fijos como bloques, ni mediante control indirecto (como covariable),
pero s se pueden mantener a un nico valor o nivel; las conclusiones se limitaran a esos
niveles estudiados. Por ejemplo si estamos estudiando el efecto de la dieta en el incremento
de peso de los cochinitos, y se consiguieron unidades experimentales similares (corrales
con cerditos de aproximadamente el mismo peso inicial) y se sabe que la raza puede
afectar, pueden elegirse cerditos de la misma raza y las conclusiones se limitarn a esta
raza, no podrn hacerse extrapolaciones a otras.

Rplica.
Es la repeticin del experimento bsico. Es decir una rplica contiene todas las
combinaciones de tratamiento del experimento. La rplica permite darnos una idea de que
un tratamiento es diferente a otro. Mead proporciona un ejemplo en el que son dos
productores de cierto cultivo. El agricultor A produce 24.1 y 24.2 kilogramos del cultivo y
el agricultor B produjo 21.4. Gracias a la rplica se puede uno dar cuenta de que existe
diferencia y de que sta es grande.
Para representar a una poblacin se requiere de rplicas, ya que una unidad no da idea de
cmo es la poblacin. Debido a que no todos los elementos de una poblacin son iguales,
requerimos de rplicas que nos indiquen la variabilidad de la poblacin. Mientras ms
variable es la poblacin, se requerirn ms rplicas para adecuadamente representarla. No
hay que caer en la tentacin de tratar una repeticin o una pseudorrplica como verdadera
rplica.
Es importante distinguir entre rplica y repeticin, por ejemplo si se asignan 10 plntulas a
cada tipo de fertilizante el resultado consiste en 10 mediciones independientes de la altura
final de plantas sometidas a un fertilizante, esto es son 10 rplicas. Pero si a una planta se le
lee la altura 10 veces entonces son repeticiones de una lectura, son mediciones repetidas y
no son independientes. La variacin en las mediciones repetidas refleja la variabilidad en el
proceso de medicin y la variacin entre rplicas refleja la variabilidad de las unidades
experimentales sometidas al mismo tratamiento.
Algunas veces uno est tentado a partir el campo en rplicas o parcelas ms pequeas, no
confundir. Por ejemplo suponga que se desea evaluar el efecto de ciertas dietas en el
incremento en peso del puerco. Suponga que desea comparar 4 dietas en el incremento en
peso y la unidad experimental a la que se aplic el tratamiento son los corrales, ya que al
corral completo con sus 5 puerquitos se les da la dieta como a un todo. Suponga que hay 8
corrales de modo que cada dieta se puede aplicar nicamente a dos corrales. De este modo
hay nicamente dos rplicas por tratamiento. La tentacin es usar como rplicas a los
puerquitos individuales, as tendramos 10. Esto sera incorrecto por las siguientes razones.
1) el puerquito no es la unidad experimental, sino que es el corral. De otro modo habra que
alimentar al cochinito en forma individual. 2) La variacin entre cochinitos dentro de un
corral es muy similar a la variacin en diferentes corrales con el mismo tratamiento. Y no
hay forma de evaluar la variacin dentro del corral por lo que no se puede usar para
comparar las dietas.
Las rplicas permiten al experimentador tener una estimacin del error experimental.
Esta medicin se convierte en la unidad bsica de medicin para determinar si las
diferencias observadas en los datos son estadsticamente significativas. El uso de rplicas
tambin permite:
ejercer control sobre la varianza del error, .
19

aumentar el espacio inferencia y,


mejorar la precisin del experimentoes decir, a medida que el nmero de repeticiones
aumenta, las estimaciones de las medias son ms precisas.

Error experimental.
Es una medida de la variacin existente entre las unidades experimentales tratadas en forma
similar. Es la variacin no controlada ni como variable independiente, ni como
suplementaria controlada- entre las unidades experimentales sometidas al mismo
tratamiento.
Se pueden distinguir varias fuentes de error:
1. La variabilidad inherente al material experimental al cual se aplican los
tratamientos.
2. La falta de uniformidad en la realizacin del experimento.
3. La variabilidad debida a la medicin de la variable respuesta.
4. No es posible reproducir las condiciones del tratamiento exactamente de una unidad
a otra.
5. Factores externos que puedan influir en las caractersticas medidas.

Cmo controlar el error?


a. Aumentar la magnitud del experimento, ya sea ms unidades experimentales o ms
tratamientos.
b. Refinar la tcnica experimental.
c. Usar material experimental ms homogneo.

Un investigador en problemas educativos intenta probar la efectividad de un mtodo para la


identificacin verbal de palabras escritas para ensear a nios de primer grado. A tal efecto
planific un diseo de dos grupos para comparar el nuevo mtodo de enseanza (A 1) con
uno mucho ms tradicional (A2). El investigador prob ambos mtodos en dos aulas
distintas, de modo que a un primer grupo le aplic el mtodo A1 y al otro grupo el A2. Al
trmino del curso aplic una prueba a los nios de ambos grupos para determinar su
eficiencia en la identificacin verbal de las palabras escritas.

El problema anterior tiene el inconveniente que los grupos si no son parecidos entre s,
estarn confundidos con los mtodos de enseanza. Una mejor manera de probar ambos
mtodos hubiera sido juntar a los dos grupos en uno solo y seleccionar al azar los miembros
de cada grupo, y asignar al azar los mtodos a cada grupo.

Otro ejemplo aplicado en educacin (Arnau Grass) se pretende estudiar la efectividad de


tres mtodos de enseanza sobre el aprendizaje de las matemticas. Despus de haber
aplicado los tres mtodos se pasa a cada uno de los sujetos una serie de diez problemas por
resolver. Esto constituye una medida de ejecucin para estimar la efectividad de los
mtodos de enseanza. Ahora bien. Se considera que una de las posibles variables extraas
capaz de contaminar dichos resultados es el nivel intelectual de los sujetos. Con objeto de
controlar dicha variable, mediante el diseo se aplica un diseo de bloques donde los
bloques lo constituyen grupos con distintos CI (de 94, 96, 98, 100 y 112).
20

Principios bsicos del diseo de experimentos.


Aleatorizacin.
Es la piedra angular del diseo de experimentos. Entendemos por aleatorizacin la
ubicacin o asignacin aleatoria de las unidades experimentales y el orden en el cual
ocurren los ensayos individuales.
La aleatorizacin permite minimizar las variaciones debidas a espacio, tiempo, entre
diferentes unidades experimentales de manera que aseguren que cualquier patrn de
variacin que pueda existir en el material experimental no cause error sistemtico en las
comparaciones de los tratamientos. Todas las variaciones que no se puedan controlar ni
medir y que proceden de distintas fuentes quedan incluidas en el trmino de error y la
aleatorizacin permite que esos errores se distribuyan uniformemente o imparcialmente de
manera que influyen poco en el error.
La aleatorizacin permite que se cumpla el supuesto de independencia. Por ejemplo, al
aleatorizar el orden de las corridas puede contrarrestarse el efecto que puede ejercer el
cansancio o la experiencia en la realizacin del experimento.
Nelson Lloyd (1996) proporciona algunas consideraciones importantes de la aleatorizacin
en la experimentacin:
i. Si se va a llevar a cabo una prueba estadstica en un experimento, tal como la F o la
t, es importante saber que los valores crticos de esa prueba vienen de distribuciones
que derivan de las leyes de probabilidad. Estas leyes estn basadas en la suposicin
de que el error experimental es el resultado de un proceso aleatorio. Esta suposicin
puede asegurarse aleatorizando el orden de los ensayos.
j. Generalmente se supone que los errores en un experimento son independientes uno
de otro. Pero es comn que exista correlacin entre errores cuando hay tendencias
en el tiempo y en el espacio. Cuando se emplea el estadstico t de Student se supone
que los errores son independientes. La aleatorizacin viene a rescatar aqu
rompiendo la correlacin entre los errores, de manera que uno puede proceder con
la consideracin de que se cumple la independencia.
k. Finalmente, en cualquier experimento hay siempre factores que pueden afectar el
resultado pero que no estn incluidos en el diseo porque o son muy difciles de
controlar o porque son desconocidos. Tales factores producen sesgo. Por supuesto
este sesgo es desconocido en magnitud y en signo. Al introducir la aleatorizacin en
el experimento los factores bajo estudio pueden protegerse de estos sesgos. La
aleatorizacin permite pues que estos sesgos sean parte del error experimental.
21

Bloqueo.
Es una tcnica de control estadstico y se usa para incrementar la precisin de un
experimento. Un bloque es una porcin de material experimental que es ms
homogneo que la totalidad. La tcnica de bloqueo se utiliza cuando existen variables
que afectan a la variable respuesta y que no interesa investigar; se puede controlar a
determinados valores constituyendo los bloques. A cada bloque se le asignan al azar
los tratamientos de modo que es posible averiguar su efecto sin importar esa otra
variable que se maneja como bloque reduciendo as la magnitud del error e
incrementando la precisin del experimento. En los diseos de bloques en muy
comn utilizar como factor de bloqueo, la proximidad de las parcelas: parcelas
vecinas son similares en fertilidad, tipo de suelo, etc.; las caractersticas fsicas de
las unidades experimentales:, individuos de una misma camada son ms similares
entre s que los de diferente camada.; el tiempo:, las determinaciones realizadas en un
da por ejemplo son ms similares entre s que las realizadas en distintos das; los
lotes de materia prima:, se puede realizar una rplica del experimento con un solo
lote, y abrir un nuevo frasco o lote del reactivo para realizar otra rplica del
experimento; el personal que realiza las determinaciones: cada tcnico puede realizar
una rplica del experimento y no cada tcnico un solo tratamiento pues si hay
diferencias entre tratamientos no se sabr si esta diferencia es real o a que los tcnicos
aunque realizan la misma determinacin con la misma metodologa la realizan en
forma diferente.

Diseo equilibrado o balanceado: es el diseo en el que todos los tratamientos son


asignados a un nmero igual de unidades experimentales.

Ortogonalidad
Ortogonalidad de factores: dos factores FI y FJ con I y J niveles, respectivamente, son
ortogonales si en cada nivel i de F I el nmero de observaciones de los J niveles de F J estn
en las mismas proporciones. Esta propiedad permite separar los efectos simples de los
factores en estudio.

Control local
Se refiere a las acciones que se realizan para controlar o disminuir el error experimental.
Estas acciones incluyen:

El refinamiento de la tcnica. Se refiere a que antes de correr un


experimento es necesario elegir aquel mtodo que produzca las
observaciones ms precisas y exactas. Es importante estandarizar el mtodo
y asegurarse de que los equipos estn bien calibrados, el personal tcnico
que realice el experimento est calificado para esa tarea, evitar en lo posible
variaciones ajenas al experimento. Es responsabilidad del investigador
minimizar en lo posible la variabilidad en los resultados controlando la
tcnica.
Seleccin de unidades experimentales. Si se encuentra el nmero suficiente
de unidades experimentales lo ms homogneas posible, se puede realizar
una aleatorizacin completa. Al decir que sean lo ms homogneas posibles
nos referimos por supuesto que si se trata de ratones, sean de la misma
22

especie, procedan de la misma camada, tengan un peso inicial muy similar si


se trata de evaluar el efecto de una dieta o de ciertos medicamentos. No se
trata de que las unidades sean idnticas o clones porque se limitara el
espacio inferencia y las conclusiones se limitaran a nicamente ese tipo de
unidades. Se acepta cierta variabilidad entre las unidades experimentales que
en la vida natural se presentan, y de lo que se trata es de evitar la mucha
heterogeneidad, en el ejemplo de ratones no se vale comparar el efecto de
cuatro dietas en ratones de distintas razas o distintos tamaos iniciales.
La formacin de bloques. Mediante los que se controle alguna variable
extraa y que se asegure que todos los bloques tendrn la oportunidad de
combinarse con los tratamientos.
Problemas
1. Un experimento se condujo por muchos diferentes aos en cierta seccin de la
supercarretera. Describa el espacio inferencia para este experimento. Si los
resultados del experimento se aplicaran a toda la supercarretera qu lo hara
diferente?
2. Etiquete cuatro unidades del 1 al 4. Cmo usara su tabla de nmeros aleatorios
para asignar las 4 unidades a 2 tratamientos A y B de modo que cada tratamiento se
aplique a 2 unidades?
3. Etiquete los tratamientos 1 y 2. Explique cmo usara la tabla para asignar
aleatoriamente los tratamientos a las 4 unidades.
4. Explique cmo determinara aleatoriamente el orden de un experimento de 12
unidades experimentales asignndolas a 4 tratamientos.

Ejercicio

1. Identifique los pasos de una investigacin experimental.


2. Cmo le sugerira al investigador correr su experimento? Proponga un esquema
del diseo con todo y aleatorizacin.
23

Modelo Lineal
Describe a una observacin y consta de una media y un error. Establece que para valores
fijos de una o ms variables independientes se puede expresar la variable dependiente como
una combinacin lineal de un conjunto de variables independientes.
Supongamos que (.) es una funcin lineal de la variable x.
( x ) o 1 x
donde o y 1 son parmetros desconocidos.
x est en un dominio D.
(x) es una funcin lineal de una variable real x
x es una variable no aleatoria observable.
Se supone que para cada valor de x, existe una familia de funciones de distribucin
acumulada, de tal modo que la media de la funcin correspondiente a un valor de x,
digamos xo, es o+1xo.
Las medias de las funciones de distribucin (cdf) caen en una lnea definida por:
( x) o 1 x

El objetivo es muestrear alguna cdf y con base en el muestreo inferir a la poblacin. El


muestreo se realiza as:
1) Un conjunto n de observaciones de x se observan en el dominio D y son x 1, x2,...,xn.
stas no son variables aleatorias, se pueden seleccionar a propsito o bien al azar.
2) Cada xi determina una c.d.f., cuya media es ( xi ) o 1 xi y su varianza es 2.
3) Para esta x se selecciona un valor al azar y se denota como y i (no necesariamente se
obtiene el valor esperado x)..
Por lo tanto se tiene un conjunto de n parejas de observaciones que se denotan como (yi, xi).
Se supone que:

E(yi)=o+1xi
Var (yi)=2

Pero como lo que observamos es un valor de yi de la c.d.f., y no su valor esperado, se tiene


tambin en el modelo a otra variable aleatoria que es el Error i para cada pareja (yi, xi). El
modelo se convierte en:
yi o 1 xi i
Este es el modelo probabilstico a diferencia del determinstico en el cual no hay trmino de
error y en el que se supone que todos los valores de y observados son sus valores esperados,
es decir, todos caen sobre la lnea recta.
24

Los modelos son lineales en los parmetros es decir los parmetros estn expuestos a la
potencia 1.

En resumen, el modelo describe a la observacin, consta de una media y un error, y los


parmetros del modelo estn expuestos a la potencia 1, es decir, son lineales en cuanto a
parmetros se refiere. Asimismo, puede decirse que los modelos son aditivos.

Mtodo de mnimos cuadrados


Si del modelo anterior despejamos el error:

i yi o 1 xi
Se llama error o residuo a la diferencia de ordenada de un punto muestral y la recta de
regresin correspondiente a la misma abscisa. Ntese que el error es una funcin de los
parmetros del intercepto y la pendiente. Por lo que un criterio razonable para seleccionar
estimadores para estos parmetros es elegir aquellos que minimicen la suma de cuadrados
del error. ste es el principio del Mtodo de Mnimos Cuadrados y los estimadores
resultantes reciben el nombre de estimadores mnimos cuadrados.
Este mtodo consiste en minimizar los errores, es decir, las diferencias entre los
valores observados y los de la recta de regresin ajustada, o sea se estimarn aquellos
valores o y 1 de la recta que hagan mnima la diferencia entre dicha recta y los valores
observados.
El mtodo de mnimos cuadrados establece que de todas las rectas de regresin que se
pueden ajustar al conjunto de puntos muestrales dados, la mejor es aquella que tenga la
propiedad de que la suma de los cuadrados de los errores sea mnima.

n
min i2 min ( yi o 1 xi ) 2
i 1

L ( yi o 1 xi ) 2
Para esto se aplicar la condicin necesaria conocida para que una funcin de dos variables
independientes tenga un punto extremo (mnimo en este caso), es decir se igualar a cero
las primeras derivadas parciales de la funcin, con respecto a cada una de sus variables.
25

L
0
0
L
0
1
L n
2 yi ( o 1 xi ) 1
o i 1
n
2 yi o 1 xi
i 1


2 yi n o 1 xi 0
no 1 xi yi
L n
2 yi ( o 1 xi ) ( xi )
1 I 01
2 ( xi yi o xi 1 xi2 )

2 xi yi o xi 1 xi2 0
o xi 1 xi2 xi yi

Agrupando las ecuaciones se obtiene un sistema de dos ecuaciones con dos incgnitas cuya
solucin proporciona las estimaciones de los parmetros:

n n
( 0)
n xi yi
xi yi i 1 i 1
n
1 i 1
2
n

n
x i

x
i 1
2
i
i 1

n
n
( 0)
n xi
i 1
yi
x y i i
i 1
n
1 i 1
2
n

n

x i

x
i 1
i
2
i 1

o y 1 x ( 0)

Estos valores sustituidos en la recta de regresin proporcionan la ecuacin de la recta de y


sobre x. Por medio de ella pueden estimarse o predecirse valores de y dados valores de x.
26

Teorema de Gauss Markov.

En un modelo lineal, los estimadores de mnimos cuadrados son los mejores estimadores
lineales;, entre todos los estimadores, stos son los que tienen mnima varianza.

Distribucin F de Fisher

Cuando el inters se centra en hacer inferencias respecto a dos varianzas poblacionales y lo


que se desea probar es que stas son iguales, se comparan sus varianzas muestrales a travs
de un cociente. Digamos, s21/s22. Si este cociente es igual a la unidad entonces se dira que
las varianzas son iguales, o que la diferencia entre las varianzas es tan pequea que puede
atribuirse al azar o no es lo suficientemente grande como para rechazar la hiptesis nula de
igualdad de varianzas.
Dadas s12 y s22 varianzas calculadas a partir de muestras aleatorias independientes de
tamaos n1 y n2 tomadas de poblaciones normalmente distribuidas con varianzas 12 y 22
respectivamente, la variable aleatoria:
s12 12 ( 0)
F 2 2
s2 2

sigue una distribucin F con n1-1 y n2-1 grados de libertad.


Si suponemos que las dos muestras independientes de las dos poblaciones estn
normalmente distribuidas y tienen la misma varianza podemos rescribir la ecuacin como:
s12 2 ( 0)
F 2 2
s2

( 0)

con n1-1 y n2-1 grados de libertad.


( 0)

( 0)

( 9)

Forma de la Distribucin
27

La forma de la distribucin es asimtrica con sesgo positivo. Su forma es determinada por


los parmetros n1-1 y n2-1.
Igual que para la distribucin2 mientras ms grande sean los grados de libertad de una o de
las dos varianzas ms simtrica es la curva.
La tabla de la distribucin F debido a que es definida por los parmetros n 1-1 y n2-1 y que
ambos ocupan las filas y las columnas, existe una tabla F para cada nivel de significacin.
En una tabla F, la columna izquierda indica los grados de libertad del numerador (de la
razn de varianzas) y en la primera fila estn los grados de libertad del numerador. En el
cuerpo de la tabla se encuentran los valores crticos F a la derecha de los cuales est en
nivel o probabilidad de cometer el error tipo I (Rechazar Ho dado que es verdadera).
Existen tablas para los ms empleados 0.1, 0.05, 0.025 y 0.01. El valor crtico para un
nivel de significacin especificado y 1 y 2, grados de libertad se indican como sigue:

F; 1 y 2,

Teorema de Cochran

Si Zi se distribuye NID(0, 1) para i=1,2,3,..., y,


Z
i 1
i
2
Q1 Q2 ... Qs

y Qj tienen ji grados de libertad y j=1,2,...,s, entonces las Qj se distribuyen como 2 si y


slo si:
1 2 ... s
As, si la suma de los grados de libertad de las fuentes de variacin es igual a N-1, el
nmero total de grados de libertad, significa que los cocientes SC trat/2 y SCE/2 son
variables aleatorias independientes que se distribuyen 2. Y el cociente de dos variables ji
cuadradas se distribuye F.
28

Anlisis de varianza
El anlisis de varianza es un diseo eficiente para cuando se trata de comparar en
forma simultnea ms de dos tratamientos.
Es una tcnica por medio de la cual la variacin total se divide en varias componentes,
en el caso ms sencillo en una debido a los tratamientos y otra debida a la variacin aleatoria.
Por lo tanto, la intencin del anlisis de varianza es determinar si las diferencias entre las
medias de las muestras debidas a las variables estudiadas son significativas.
Para la realizacin de un anlisis de varianza se consideran los siguientes pasos:
1.- Establecimiento de un modelo.
El modelo consiste de una representacin simblica de un valor tpico tomado de los datos que
se analizan. Por ejemplo el modelo de un anlisis de varianza de una va es el siguiente:
yi j = + i + i j
donde, yij es una observacin del experimento, de hecho es la j-sima observacin bajo el i-
simo tratamiento del experimento.
es la media global del experimento
i es el efecto del i-simo tratamiento
i j es el trmino de error; es el j-simo error bajo el i-simo tratamiento. Hay tantos errores
como observaciones.
2.- Todo modelo se fundamente en supuestos, y cuya violacin implica no trabajar con el
nivel especificado.
Un ejemplo de supuesto en el que se apoya el anlisis de varianza es la distribucin normal e
independiente de los errores.
3.- Hiptesis son los enunciados que se quieren probar. Se indican la hiptesis nula y la
hiptesis alternativa. Las conclusiones se dan en trminos de la hiptesis nula, es decir se
acepta o se rechaza la hiptesis nula de igualdad de medias.
4.- Clculos o divisin de las sumas de cuadrados. La variabilidad de un conjunto de datos es
proporcional a la suma de cuadrados de las desviaciones
n y
( - y)2 ( 0)
SC =
i

i=1 n 1

y esta cantidad se utiliza para calcular la varianza muestral.


El anlisis de varianza divide a la suma de cuadrados llamada suma de cuadrados total en
partes cada una de las cuales se atribuye a una de las variables independientes en el
experimento ms un residuo que se asocia a un error aleatorio.
4.- Una tabla de anlisis de varianza en donde se resumen los resultados de los clculos
aritmticos, que incluyen las sumas de cuadrados, los grados de libertad, los cuadrados medios
(varianzas) y la F calculada.
5.- Estimacin de los parmetros del modelo. No pueden conocerse los valores poblacionales
de los componentes del modelo, es decir, de , i; pero s se pueden estimar mediante
mtodos como el de mnimos cuadrados; esto sirve para verificar los supuestos del anlisis.
29

6.- Los intervalos de confianza para las medias de tratamientos dan una idea de la
variabilidad de las observaciones respecto a la media debido a la aleatorizacin.
7.- Verificacin de los supuestos del modelo, lo cual implica checar los supuestos de
normalidad, independencia y homogeneidad de varianza sobre los que se apoya el anlisis de
varianza.
8.- Potencia de la prueba. Determinacin del tamao n de la muestra.
30

ANLISIS DE VARIANZA DE UNA VA


"Diseo Completamente Aleatorizado"

R. Ramchun (2000) desea evaluar el efecto en la digestibilidad y crecimiento de bloques


multinutrientes como suplemento alimenticio en conejos. Los alimentos a base de cereales son
costosos para usarlos como suplementos y actualmente se utilizan bloques multinutrientes
MNB para rumiantes y se quiere probar el efecto en el crecimiento de conejos. Se emplearon
18 conejos progenie de 12 hembras conejo de 45 das de edad que se colocaron en jaulas de
50 x 30 x 30 arregladas en tres filas. El experimento consisti de tres tratamientos:
Control: Pellets comercial para conejos.
MNB15: 15 gr/da de MNB + pellets ad libitum
MNB30:30 g/da de MNB + Pellets ad libitum
Divide el estudio en dos partes y una le sirve para estudiar el efecto sobre la digestibilidad y
otra para estudiar el efecto en el crecimiento de los conejos, la primera la mide utilizando
variables como digestibilidad de materia seca y la materia orgnica, entre otras variables; y la
segunda como el peso del conejo a lo largo de un perodo de 55 das. La digestibilidad se
midi pasados 11 das del inicio del experimento.

Ejercicio

Especifique quines son las unidades experimentales, los o el factor, los niveles de los
factores, el espacio inferencia, la variable respuesta. Qu otras variables podran influir en la
respuesta? Cules se pueden controlar a un solo nivel y cules a varios niveles? Cules de
stas no pueden controlarse pero s pueden medirse para tomar en cuenta su efecto? Cules
de ellas no se pueden controlar y es inevitable que sean la causa del error? Especifique el
espacio inferencia. Sugiera cmo sera la aleatorizacin. Proponga el arreglo experimental.

En este estudio el inters se centra en la comparacin de 3 dietas y se compara la digestibilidad


de los tres tratamientos (se toman muestras del alimento y de las heces fecales y se le analizan
peso seco, materia orgnica, protena, extracto etreo, fibra, calcio, fsforo y energa). Esto
podra sugerir utilizar una prueba de hiptesis para comparar el control contra MNB15, otra
para comparar el control con MNB30, y otra para comparar MNB15 con MNB30. Si se
estipula correr una probabilidad de 0.05 por prueba, resulta que la probabilidad de cometer el
error tipo I (rechazar H0 H0 es verdadera) se infla a un valor de (0.95)3 = 0.8573 y realmente la
probabilidad de cometer este error en todas las pruebas es de 1 0.8573 = 0.1427. Es decir si
se realizan las tres comparaciones se puede cometer un 14.27 % de error. El investigador
emplea para analizar sus datos una tcnica que le permite hacer todas las comparaciones en
una sola prueba y emplea anlisis de varianza de una clasificacin.

Un ejemplo aplicado a la Educacin:


Viciana J et. Al. (2003) estudi el efecto de la retroalimentacin en alumnos de secundaria
sobre el clima ego-tarea percibido, la valoracin de las clases de educacin fsica y la
preferencia en la complejidad de las tareas de clase. La motivacin es muy importante
31

respecto al desenvolvimiento del alumno y su postura frente al deporte. Distingue dos tipos de
climas :motivacionales: aqullos entornos en los que se fomenta la competencia interpersonal,
la evaluacin pblica y la retroalimentacin normativa sobre el desempeo de las tareas
promueven la aparicin de un estado de implicacin al ego, Y los entornos que enfatizan el
proceso de aprendizaje, la participacin, el dominio de la tarea individualizado y la resolucin
de problemas tienden a fomentar la aparicin de la implicacin a la tarea. Los individuos que
implican a la tarea sern persistentes ante las dificultades, creen que la motivacin y el
esfuerzo son las cusas del xito, prefieren tareas desafiantes y la satisfaccin. La
retroalimentacin que reciben los muchachos cuando estn en su clase de educacin fsica
puede ejercer un efecto en: la percepcin clima de implicacin, en la percepcin clima de
implicacin al ego, en la valoracin de las clases de educacin fsica, en la preferencia por las
tareas fciles y en la preferencia por las tareas difciles. Para el estudio se cont con un grupo
21 estudiantes, 12 muchachos y 9 muchachas entre 14 y 16 aos. Se les dividi en tres grupos
1, 2 y control, El primero recibi retroalimentacin negativa, el segundo retroalimentacin
positiva y el ltimo, (la misma cantidad de retroalimentacin positiva y negativa). Previo a la
realizacin del experimento se realiz un anlisis de varianza de una va para comparar estos
tres grupos en cuanto a las 5 variables respuesta y se observ que no haba diferencia entre los
tres grupos por lo que se utiliz un diseo completamente aleatorizado para realizar el anlisis
una vez que se aplicaron los tres tipos de retroalimentacin a los grupos formados. Para medir
las variables respuesta se utiliz un instrumento con varios tems que correspondan a las
variables respuesta y que fueron medidas en escala Likert.
Cuando se desean comparar ms de dos poblaciones, no es adecuado aplicar pruebas t
consecutivas entre cada par pues el nivel de significancia con el que se pretende trabajar se
incrementa. Por ejemplo si se tienen 4 tratamientos o medias se tendran que realizar 6
comparaciones por parejas. Si decimos que estamos trabajando con un 95% de confianza y
corremos un 5% de probabilidad de cometer el error tipo I, en realidad estamos trabajando con
(0.95)6 de confianza y con 1-(0.95)6 de significacin. El error tipo I se ha incrementado de
0.05 a 0.2649 y esto sera el caso de que las seis comparaciones fueran independientes lo que
no siempre sucede. Como esto no siempre es cierto (independencia de las comparaciones) la
probabilidad de cometer el error tipo I es mayor que 0.05 pero no se sabe a cuanto asciende.
Por esta razn R. A. Fisher propone una prueba que considera ms de dos poblaciones y que
es el anlisis de varianza.
En el anlisis de varianza de una va se investiga un factor o variable y se averigua si
existen diferencias entre los "a" niveles del factor" o si existe efecto de tal factor sobre la
variable respuesta. El diseo recibe el nombre de completamente aleatorizado porque no se
aplica ninguna restriccin en la aleatorizacin como lo hace el bloqueo, es decir, los
tratamientos se aplican aleatoriamente a las unidades experimentales; stas tienen las mismas
probabilidades de ser asignadas a los tratamientos por lo que se espera que las unidades
experimentales sean lo ms homogneas posibles.
Efecto de los tratamientos. Los a tratamientos pueden ser seleccionados
especficamente por el experimentador. En esta situacin se desea probar la hiptesis sobre las
medias de los tratamientos y slo se aplican a los niveles del factor considerado en el anlisis.
Las conclusiones no pueden hacerse extensivas a tratamientos similares que no se hayan
considerado dentro del modelo. En este modelo se supone que las a muestras son
independientes, cada una tiene una distribucin normal y, finalmente, que las varianzas de las
a poblaciones son iguales. A este modelo se le llama de efectos fijos (Modelo I) a diferencia
del modelo (II) de efectos aleatorios en que los a tratamientos pueden ser una muestra
32

aleatoria de una poblacin mayor de tratamientos y las conclusiones se generalizan a la


poblacin. En este modelo estamos interesados en la variabilidad de los tratamientos ms que
en sus efectos medios, y se le conoce tambin como modelo de componentes de varianza.
Cuando se disean experimentos se procura tener el mismo nmero de rplicas por
tratamiento, ste es el caso balanceado.
El arreglo de datos para el caso balanceado puede esquematizarse as:
Tratamiento
----------------------------------------------------------------
1 2 ... i ... a
----------------------------------------------------------------
Y11 Y21 Yi1 Ya1
Y12 Y22 Yi2 Ya2
. . . .
. . . .
Y1j Y2j Yij Yaj
. . . .
Y1n Y2n Yin Yan
------------------------------------------------------------------
Y1. Y2. Yi. Ya.

Las filas representan las observaciones y las columnas los tratamientos o bien, los
niveles del factor.
Aqu se emple el subndice i para denotar al tratamiento y el subndice j para denotar
el nmero de la observacin. La notacin punto de Yi. -indica que se ha sumado sobre el
segundo suscrito j.
Es importante hacer notar que algunas veces se utilizan los estudios comparativos por
observacin. En estos estudios el investigador no puede asignar al azar las unidades a los
tratamientos. Por ejemplo, que se desee evaluar un fertilizante en distintos tipos de campos,
pastizales, henequn y maizales, por ejemplo. Las poblaciones de tratamiento ya estn
formadas de modo natural, lo nico sera seleccionar al azar sendas muestras de los distintos
tipos de campos y aplicarles el fertilizante. El factor sera CAMPO, y sus niveles, pastizal,
henequn y maz.

Modelo

Una observacin tpica del diseo se representa por un modelo que como ya se ha dicho se
compone de una media y un error.

La observacin procedente de un tratamiento, digamos la observacin 1 del tratamiento 1- y11-


, por ejemplo, es igual al efecto de su media ms un error que es la diferencia entre esa
observacin y el valor predicho por el modelo. Esto se expresa as:

y ij i ij
33

A este modelo se le conoce como modelo de medias. Y nos dice que el puntaje de un
tratamiento i tiene dos fuentes de variacin, el efecto de la media del i-simo tratamiento y el
trmino de error.

Si consideramos que cada media de tratamiento individual es igual a la gran media ms un


trmino llamado efecto del i-simo tratamiento:

i i

entonces el modelo de medias se convierte en:

yi j = + i+ ij i= 1, 2,...,..., a;
j= 1, 2,...,..., n

denominado modelo de efectos, en donde,


yi j es la j-sima observacin bajo el i-simo tratamiento.
es la media global o un parmetro comn a todos los tratamientos Es constante para todas
las mediciones en todas las poblaciones de tratamiento.
i es el efecto del i-simo tratamiento y se define como la diferencia entre la media del i-
simo tratamiento y la gran media. i es un parmetro que mide el grado con el cual la media
del tratamiento i difiere de la media de todas las medias, de ah que las sumas de las
desviacin respecto a su media es cero. i es constante para todas las mediciones dentro de la
poblacin i, pero es distinto de los otros tratamientos.
Es decir I se define como la diferencia de la media de tratamiento individual y la gran media
a

i i , por otro lado, i


, de este modo la suma de los desvos de las medias
i 1


individuales respecto a la gran media es cero.
i j es el componente de error aleatorio. Representa todas las fuentes no controladas de
varianza que afectan a las mediciones individuales. ste es nico para cada uno de los
elementos de la poblacin (de ah que tiene los mismos subndices) y se supone que es
independiente de los tratamientos.

los tratamientos son iguales el modelo se reduce a:

yi j = + ij

Este se conoce como modelo reducido y corresponde al modelo cuando la hiptesis nula de
igualdad de medias es cierta.

Resumen: Una observacin yij se expresa como la suma de 3 componentes: una componente
constante, para todas los tratamientos y todos los elementos. Una componente i constante
para todos los elementos dentro de la poblacin de tratamientos pero que pueden diferir de
tratamiento a tratamiento. Y un componente aleatorio que es independiente de los tratamientos
y se distribuye normalmente como media cero y varianza 2.
34

Este modelo se apoya en los siguientes supuestos.

Supuestos
Puesto que ambas fuentes de variacin y i son constantes para todas las observaciones
dentro de la i-sima poblacin, la nica fuente de variabilidad de estas mediciones es debida al
error experimental.
Se supone que las a muestras proceden de a poblaciones que se distribuyen normalmente. Se
supone tambin que son a muestras aleatorias y que por consiguiente son independientes entre
s y los elementos dentro de cada muestra tambin son independientes. Se supone que las
poblaciones de las que se extraen las muestras tienen una varianza comn o varianza
homognea.
Si los elementos se asignan al azar a las condiciones de tratamiento se tiene cierta certeza de
que los efectos del error son independientes de los tratamientos, de ah la importancia de la
aleatorizacin. Igualmente debido a la aleatorizacin se supone que los errores se distribuyen
dentro de cada poblacin normalmente distribuida con valor esperado igual a cero y varianza
2. Resumiendo,

i) Los a conjuntos de datos observados constituyen a muestras aleatorias independientes.


ii) Cada una de estas a poblaciones est normalmente distribuida con medias i y varianza
.
iii) Cada una de las a poblaciones tiene varianza comn y las i son constantes desconocidas.

iv) i = 0; esto significa que se trata de un modelo de efectos fijos. i es el efecto del i-
simo tratamiento y es igual a la diferencia i -
. La suma de los efectos de
tratamiento es cero para el caso de efectos fijos. Y esto implica que es la media de
las medias i. En el diseo de efectos fijos, dado que el inters se centra nicamente en
los a tratamientos, la suma de los desvos o efectos i es cero, en cambio en los efectos
aleatorios no suman cero debido a que slo se extrae una muestra aleatoria de a
niveles del factor de una poblacin grande de niveles del factor, de modo que no se
conoce la media global y mucho menos la suma de los desvos es cero.

Hiptesis

El propsito del anlisis consiste en probar la igualdad de medias de tratamientos.


Ho: 1 = 2 = ...=...= a = 0
H1: i j para al menos un par i, j
Otra manera de expresarlo es:
Ho: i = j, ij
En palabras, Los efectos de los tratamientos son iguales a cero.

H1: i j para al menos un par i, j


Al menos un efecto de tratamiento es diferente de cero.

Si Ho es verdadero, no existen efectos de tratamiento, es decir la media de la j-sima poblacin


es y cada observacin es resultado de la media poblacional y su error aleatorio.
35

Puede verse que el modelo bajo la hiptesis nula es el modelo reducido, y el modelo completo
es el que corresponde a la hiptesis alternativa.

Realmente lo que pretende el investigador es determinar cul de los modelos, completo o


reducido, caracteriza mejor los datos del experimento (Kuelh, 2000).

Los modelos que corresponden a los diseos experimentales pertenecen a una clase general de
modelos, modelo lineal general, en el que la respuesta est en funcin lineal de un conjunto de
parmetros: el ejemplo por excelencia es el modelo de regresin lineal, en el que las xj
corresponden a las variables independientes mtricas. Igualmente el modelo de un factor
puede expresarse como un modelo lineal general pero la variable independiente que es el
factor puede dar lugar a un conjunto de a variables ficticias (dummy) o indicadoras.
y 1 X 1 2 X 2 3 X 3
La variable ficticia indica el grupo de tratamiento al que pertenece la observacin, x tendr el
valor de 1 si pertenece a cierto grupo y de cero si no pertenece a dicho grupo. Por ejemplo
podemos definir para un experimento con tres tratamientos tres variables indicadoras que
toman los valores de 1 y 0 segn si pertenecen al i-simo grupo o no pertenecen a l.

1 del tratamiento 1
x1
0 de otro tratamiento
1 del tratamiento 2
x2
0 de otro tratamiento
1 del tratamiento 3
x3
0 de otro tratamiento

La ventaja de estos modelos es que se permite incluir a las covariables. De este modo si el
inters se centra en comparar medias de un factor y se toma en cuenta a una covariable el
modelo de medias quedara as:

yij i 1 X ij ij

el cual corresponde al anlisis de covarianza de un factor.

Ejemplo: Un ingeniero agrnomo desea evaluar el efecto de 3 fertilizantes nitrogenados en el


rendimiento del trigo (kg/Ha2). Piensa que el amonio es un fertilizante excelente an cuando se
estn usando actualmente ciamida y sus derivados. Divide su terreno en 30 parcelas. A cada 10
parcelas le aplicar un fertilizante: sulfato de amonio, ciamida, ciamida-dietanoldiamida.
Desea averiguar cul de ellos produce los mayores rendimientos
1. Responda las siguientes preguntas.
a. Cul es el objetivo del estudio?
b. Identifique al factor y sus niveles.
c. Identifique la variable respuesta.
d. Determine el espacio inferencia.
e. Proponga el arreglo del diseo. Incluya la aleatorizacin completa.
36

f. Proponga al ingeniero agrnomo cmo correr su experimento. Mencione las


variables que pueden quedar bajo el control del ingeniero y las que queden
bajo el trmino de error. Ser sensible el anlisis a los efectos de los
desinfectantes o es necesario proponer un nuevo diseo?
2. Con los resultados que se presentan a continuacin responda las siguientes preguntas.
Emplee los clculos necesarios e interprete los resultados dentro del contexto del problema.
a) existe diferencia entre los fertilizantes?
b) Si es as, entre qu parejas de medias est la diferencia?
c) Proponga intervalos de confianza para las medias y para las diferencias entre las
medias.
d) Con este nmero de observaciones qu tan potente es la prueba?

Pregunta de Investigacin:
Existen diferencias en el rendimiento promedio del trigo (kg/Ha2) con los diferentes
fertilizantes?

Hiptesis de investigacin
El fertilizante a base de amonio, particularmente el sulfato de amonio, promueve ms
exitosamente el crecimiento de las plantas que los fertilizantes de amida.

Diseo empleado
Para evaluar la hiptesis incluy al fertilizante sulfato de amonio, la ciamida y la ciamida-
dietanoldiamida. Emplea un diseo completamente aleatorizado y a cada parcela se le asign
al azar un fertilizante y se sembraron semillas de trigo y que tambin fueron seleccionadas al
azar. A cada parcela se le roci el fertilizante asignado y en el orden asignado al azar, de
manera independiente. Al cabo de 45 das se determin el rendimiento (Kg/ha 2) El
experimento se realiz en un campo situado en el cono sur del Estado, entre Oxkutzcab y
Yotholin. Las caractersticas de las parcelas de tierra son muy similares entre s, tierra roja,
muy frtil y de una porosidad idnea para el cultivo de trigo. Se control con exactitud la
frecuencia de riego, calidad del agua, hora de riego. Quedaron fuera del control del
experimentador, las condiciones climticas y la accin de animales silvestres que atraviesan el
campo y aves.

El investigador comienza por numerar todas las parcelas y de stas selecciona al azar 30, las
re etiqueta del 1 al 30, asigna al azar las parcelas a los tratamiento y aleatoriza el orden en que
llevar a cabo el experimento.

Parcela Fertilizante Orden de aplicacin


3 Sulfato de amonio 2
5 Sulfato de amonio 30
16 Ciamida 29

27 Ciamida - Dietanoldiamida 12

La primera columna corresponde al nmero de parcela, la segunda columna es el fertilizante


asignado al azar a cada una y la tercera corresponde al orden en que se aplicaron los
37

fertilizantes. Se aplican los tratamientos y pasado el tiempo previamente especificado (llegado


el tiempo de la cosecha), se recolecta y se pesa el trigo recogido en cada parcela del
experimento anotndose el rendimiento.

A continuacin se presentan los resultados, y son los rendimientos del trigo cosechados y que
se miden en kg/Ha2.

Observacin Sulfato de Amonio Ciamida Dietanoldiamida


1 100 70 80
2 103 69 84
3 104 79 81
4 103 79 84
5 102 69 83
6 102 81 82
7 104 78 82
8 103 75 80
9 105 85 87
10 105 60 89

Se propone un anlisis de varianza de una va de efectos fijos donde el factor es el tipo


de fertilizante y los niveles del factor son: Sulfato de Amonio, Ciamida y Dietanoldimida. Y la
variable respuesta, rendimiento del cultivo( kg/ha2).

Modelo
yi j = + i + ij ; i = 1, 2 y 3
j = 1,2,..., 10
donde,
yij es el j-simo rendimiento bajo el i-simo fertilizante.
es el efecto comn para todo el experimento o bien la gran media.
i es el efecto del i-simo fertilizante y,
ij es el error aleatorio presente en la j-sima observacin bajo el i-simo fertilizante.

El modelo lineal puede escribirse como uno de regresin con la variable x = fertilizante.
Debido a que son tres fertilizantes definiremos dos variables indicadoras.

X1 X2 X3
Sulfato de Amonio 1 0 0
Ciamida 0 1 0
Ciamida-Dietanoldiamida 0 0 1

El modelo sera

y 1 X 1 2 X 2 3 X 3

Si la observacin pertenece al fertilizante sulfato de amonio, entonces X 2 y X3 toman el valor


de 0 y X1 = 1,
38

Y = 1 + e

1 corresponde al 1 del tratamiento Sulfato de amonio.

Tambin podran haberse creado dos variables Dummy con los siguientes valores:

X1 X2
Sulfato de Amonio 0 0
Ciamida 1 0
Ciamida-Dietanoldiamida 0 1

Supuestos
Los errores se distribuyen normal e independientemente con media cero y varianza (ij
~NID(0,. ).
Es un anlisis de efectos fijos, por lo que: i= 0. Es decir, estamos interesados nicamente
en estos tres fertilizantes.

Hiptesis
Ho: 1= 2= 3.
En palabras, Los tres fertilizantes producen el mismo rendimiento.

H1: i j para al menos un par.


Al menos uno de los fertilizantes produce un rendimiento diferente.

Si la hiptesis nula es cierta, significa que los tres fertilizantes producen en promedio el
mismo rendimiento del trigo;, y si se rechaza la hiptesis nula significa que existen diferencias
al menos entre un par de ellos.

Divisin de la suma de cuadrados


La suma de cuadrados total se divide en dos tipos de sumas de cuadrados, la suma de
cuadrados debida a los efectos y la debida al error.
Antes de proporcionar las frmulas para el clculo de las sumas de cuadrados, a
continuacin se da una introduccin a la notacin punto que se emplea en estas frmulas:
a n
( 0)
y..= y
i=1 j=1
ij

que representa el gran total.


El punto implica la suma sobre el subndice que reemplaza, es decir y.. es la suma en todos los
niveles de a, y en todas las n rplicas.
n ( 0)
yi. = yij
j=1

es el total del i-simo tratamiento.


39

y..= y../N Gran media


y.= yi./n i-sima media del factor principal

El anlisis de varianza resulta de descomponer la variabilidad total de los datos en sus


componentes.
a n
( 0)
SCT = ( yij - y.. )2
i=1 j=1

Las frmulas de las sumas de cuadrados se obtienen a partir del modelo. En el modelo de una
va, y partiendo del conocimiento de los estimadores de los parmetros, a saber:

y..
i yi. y..
y ij yi .

Partiendo del modelo de una va y sustituyendo por sus estimadores se tiene:

y ij y.. y i. y.. y ij y i.

Pasando al lado izquierdo de la ecuacin al estimador de la gran media:

y ij y.. y i. y.. y ij y i.
Elevando al cuadrado y sumando sobre todos los trminos se tendra:

y y.. y y.. yij yi.


a n a n
2 2
ij i.
i 1 j 1 i 1 j 1

Se puede notar que el trmino de la izquierda corresponde a la suma de cuadrados total y que
la parte derecha corresponde a un binomio al cuadrado, por esto, esta suma de cuadrados se
puede expresar en trminos de sus componentes:

a n
SCT = [( y i . - y.. )2 + 2( y i . - y..)( yij - y i .) + ( yij - y i . )2 ]
i=1 j=1

se puede demostrar que el trmino intermedio es igual a cero.


40


y.. yij yi. yi. y.. y yi .
a n a n

y i. ij
i 1 j 1 i 1 j 1

y y i . yi . n i . 0
n
y
ij
j 1 n
La primera suma no tiene a j como subndice por ello puede escribirse como:

a n a

( y . - y. ) = n ( y . - y. )
2 2
i i
i=1 j=1 i=1

de aqu que,
( 0)
a an
SCT = n ( yi.- y. )+( yij - yi. ) 2

i=1 i=1 j=1


La variabilidad total medida por la suma total de cuadrados corregidas se descompone
en la suma de cuadrados de las diferencias entre los promedios de los tratamientos y el
promedio general, y en la suma de cuadrados de la diferencias entre las observaciones dentro
del tratamiento y el promedio del mismo (Montgomery, 1991). Tambin puede observarse que
la suma de cuadrados del error es la suma para todos los tratamientos- de los cuadrados dentro
de cada tratamiento. La varianza dentro de cada grupo sera:
n ( 0)

ij i
2
( y - y . )
j=1
si2
n 1
Y es una estimacin de 2 y si se supone que es homognea o es la misma para todos los
grupos de tratamiento, entonces
41

y yi .
a n
2 ( 0)
ij
i 1 j 1
s2
a(n 1)
SC E ( 0)
s2
a (n 1)

SCtotal = SCtratamientos + SCerror

Las frmulas condensadas de clculo quedan de la siguiente forma:


2 ( 0)
a n y..
SCT = yij
2
-
i=1 j=1
an
donde el trmino de la derecha es el factor de correccin. El trmino de correccin indica
que como la suma de cuadrados es una medida de variabilidad respecto a la gran media debe
restarse su contribucin a y la cual es la suma de cuadrados sin ajustar.
a
y2 ( 0)
SC trat = i. - f.c.
i=1 n

Las sumas de cuadradas tienen la propiedad de ser aditivas, por consiguiente la SC del error
puede calcularse de la siguiente manera:
a n
1 a ( 0)
SC E yij2 yi2.
i 1 j 1 n i 1

O bien,
SC error = SC total - SC tratamiento ( 0)

Las sumas de cuadrados reflejan el grado en el cual los nmeros de un conjunto varan entre
s. Cuando no hay variabilidad, o sea cuando los nmeros son parecidos, cada desviacin de la
media ser o se aproximar a cero y la suma de las desviaciones al cuadrado tambin ser
cero.

Grados de libertad
La cantidad n-1 de la frmula de varianza de una muestra recibe el nombre de grados
de libertad. El nmero de grados de libertad de una suma de cuadrados es igual al nmero de
trminos independientes de dicha suma. La SC = (yi- y) consiste en la suma de cuadrados
de los n elementos: y1- y , ..., yn- y . Estos elementos no son todos independientes ya que
(yi- y ) = 0, por lo que slo n-1 son independientes, y SC tiene n-1 g. l. Para la SC total por
ejemplo el nmero de grados de libertad es N-1, el 1 representa la contribucin de la media.
42

Los grados de libertad asociados a cada efecto:


Los grados de libertad de los tratamientos se obtienen razonando as: la suma de cuadrados
entre tratamientos se calcula de los desvos de las medias de los a tratamientos menos la gran
media y se sabe que la suma de estos desvos es cero, por lo que son a 1 grados de libertad
asociados a los tratamientos:

g. l. de los tratamientos: a-1


g. l. del error: a(n-1) = an-a = N-a
g. l. total: N-1

Cuadrados medios
Los cuadrados medios proporcionan una estimacin insesgada de la varianza. Si las
sumas de cuadrados se dividen entre sus grados de libertad correspondientes a cada fuente de
variacin, entonces se obtienen las frmulas de los cuadrados medios o estimaciones de la
varianza:
CMTrat = SCtrat/(a-1) ( 0)

CMerror = S error/(an-a) ( 0)

Los cuadrados medios esperados de los tratamientos y del error servirn para obtener los
estadsticos de prueba, que en estos diseos se trata de pruebas F o razn de varianzas.
Supuestamente bajo la hiptesis nula de que las medias de los tratamientos son iguales los
valores esperados del cuadrado medio de tratamientos y cuadrado medio de error son
estimaciones insesgadas de la varianza poblacional 2. Sin embargo el valor esperado del
cuadrado medio del error es siempre 2 an cuando la hiptesis nula sea falsa. Lo que pasa es
que el CME refleja el promedio de las varianzas de los tratamientos por separado y son
independientes de si existe o no diferencia entre las medias. En cambio el valor esperado del
cuadrado medio de tratamientos como depende de la variacin de las medias de los
tratamientos y la gran media, pues si es afectada por si la hiptesis nula es verdadera o falsa. Si
la hiptesis nula es verdadera las diferencias de las medias individuales respecto a la gran
media son muy pequeas y el valor esperado del cuadrado medio de tratamientos es 2. Si por
el contrario, las medias de tratamiento son muy grandes, la diferencia de stas respecto a la
gran media, ser grande, y el valor esperado es igual a 2 ms una cantidad que refleje esta
gran variabilidad entre tratamientos. Esto se entiende si conocemos los valores esperados de
los cuadrados medios:

Cuadrado medio de tratamientos


El cuadrado medio de tratamientos resulta de dividir la suma de cuadrados de tratamiento
entre sus respectivos grados de libertad. Cuando las a medias poblacionales son iguales, el
CM tratamientos (CMTrat) se convierte en una estimacin insesgada de la varianza comn.

Cuadrado medio del error


Obtengamos una estimacin del cuadrado medio del error, que es una estimacin insesgada de
la varianza mancomunada.
43

ni

Dentro de cada tratamiento si


y
j 1
ij y i
2

es una estimacin de la varianza dentro del i-


ni 1
simo tratamiento y si las varianzas de los a tratamientos son similares, sus estimaciones se
2

y yi con la suma de los ni-1 grados de


a ni
pueden combinar o mancomunar para dar ij
i 1 j
a
libertad de los a tratamientos, es decir con n i 1
i 1 N a grados de libertad. Dividiendo

esta suma de cuadrados del error (que son las varianzas mancomunadas) entre sus grados de
libertad se obtiene el cuadrado medio del error. (Hicks y Turner, 1999).

Teorema de Cochran:
Se puede demostrar que estos cuadrados medios siguen una distribucin . Dado que la suma
de grados de libertad de los tratamientos y del error es igual al nmero total de grados de
libertad, estos cuadrados medios siguen una distribucin . Y el teorema implica que el
cociente SCtrat/2 y el cociente SCE/2 son variables aleatorias ji-cuadrada con sus respectivos
grados de libertad. Por lo tanto si la hiptesis nula de igualdad de medias de tratamiento es
verdadera, la razn de varianzas:
Fo = SC trat/(a-1) = CM trat
SC error/(N-a) = CM error

sigue una distribucin F con a-1 y N-a grados de libertad (Montgomery, 1995). Con este
estadstico F se prueba la hiptesis:

H0: 1 = 2 = 3.

En el cociente, la varianza cuya significancia se desea probar queda en el numerador y en el


denominador debe quedar aquella varianza o cuadrado medio que sea independiente de si la
hiptesis nula es verdadera o falsa, y ste es el error, por esta razn el denominador es el
cuadrado medio del error.
Si Ho es verdadera, el valor esperado del cuadrado medio de tratamientos es igual al valor
esperado del cuadrado medio del error, pero si es falsa, es mayor que el valor esperado del
cuadrado medio del error lo que conducira a rechazar Ho.
La regin crtica es la cola superior de la distribucin F y la hiptesis anterior se rechaza si F o
> F;, a-1,N-a.

Qu significa el valor esperado? Es un promedio ponderado de las observaciones que se


esperan en el futuro y en el anlisis de varianza cada fuente de variacin, tales como el factor y
el error, tienen un valor esperado. El valor esperado del factor es:
a ( 0)
n i2
E (CM trat ) 2 i 1
a 1

Y el valor esperado del cuadrado medio del error es:


44

E (CM E ) 2 ( 0)

En palabras, esto significa que si se hiciera un nmero infinito de veces el experimento, con
los mismos niveles y el mismo nmero de rplicas, y en cada experimento se calcula el valor
del CME por ejemplo, entonces en promedio se obtendra el valor de 2. El valor esperado de
los cuadrados medios sirven finalmente para conocer qu razones F son vlidas, es decir, si se
quiere probar que una fuente de variacin es significativa, los cuadrados medios permiten
conocer que cuadrados medios constituirn el numerador y denominador de la prueba F. Se
dejar en el numerador aquella fuente de variacin que se quiere probar y como denominador
aquel cuadrado medio que contenga todos los trminos a excepcin del que se desea probar.
La utilidad de los valores esperados de los cuadrados medios, se ver cuando se trate las
pruebas F directas, conservadoras y mancomunadas en el captulo de diseos factoriales. Por
el momento nos limitaremos a obtener el valor esperado del cuadrado medio del error para
tener una nocin de cmo se obtienen.

Matemticamente se puede obtener el cuadrado medio del error como se presenta a


continuacin:
Si se sabe que,
n
yi. yij
j 1

yi.
yi. n
Entonces,
SC E 1 2

E (CM E ) E
N a
E
N a
( y ij y i.
)


45

1
E
N a
( y 2
ij 2 yij yi . yi2. )

1
E
N a
y 2y2
ij ij yi . yi2. )

1 a a

E
N a
y 2 yi . yi . n yi2. )
2
ij
i 1 i 1
1 y a

E
N a
yij2 2 yi. ni. n i 1
yi2. )

1 n yi. a

E
N a
y 2
ij 2
n
yi. n yi2. )
n i 1
1 yi. yi. a

E
N a
yij2 2n n n
n yi2. )
i 1
1 a a

E
N a
ij
y 2
2 n
i 1
y i.
2
n
i 1
yi2. )

1 a

E
N a
yij2 ni 1
yi2. )

1 yi2.
E
N a
y 2
ij n
n2
)

1 1
E
N a
y 2
ij n
n2
y 2
i. )
1 1
E
N a
y 2
ij
n
yi2. )

Sustituyendo el modelo, en la ecuacin anterior se obtiene:


i ij
1 1 2
E CM E (
2
ij )
N a
i
n
elevando al cuadrado las cantidades entre corchetes y tomando su valor esperado se
obtiene:
1 a a

E CM E N 2
n i
2
N 2
N 2
n i2 a 2 2
N a i 1 i 1

De la misma manera puede obtenerse el valor esperado del cuadrado medio de tratamientos.
a ( 0)
n i2
E (CM Trat ) 2 i 1
a 1
a 2

i
E (CM Trat ) n 2 i 1
a 1
46

donde, el segundo trmino es la varianza de las medias de los tratamientos. El CMTrat estima
una combinacin de la varianza del error y la varianza entre las medias de los tratamientos.

Si la hiptesis nula es falsa significa que i es diferente de cero y que este componente es
grande por lo que no constituye una estimacin de la varianza poblacional. Sino que es la
varianza poblacional ms los efectos de tratamientos.

Tabla de anlisis de varianza


La divisin de las desviaciones bsicas de las sumas de cuadrados se resume
generalmente en una tabla de anlisis de varianza. En la primera columna se escribe la fuente
de variacin, es decir el ttulo que dice cual suma de cuadrados se lista en cada fila, la segunda
columna contiene las sumas de cuadrados, la tercera los grados de libertad asociados a cada
fuente de variacin. Los grados de libertad son nmeros entre los que se dividen las sumas de
cuadrados para obtener los cuadrados medios. Y la siguiente columna es el valor calculado de
F.

Fuente de Sumas de Grados de Cuadrados F calc


Variacin Cuadrados (SC) libertad (G.L.) Medios (CM) (FC)
Tratamiento SC trat a-1 CMTrat Fc
Error SCE N-a CME
Totales SCT N-1

En el ejemplo,

SCT 231,616
2608 2 4893.87
30
f .c. 226,722.13
10312 7452 832 2
SC fertilizante 226,722.13 4298.87
10

SC E 231,616
10312 7452 832 2 595.00
10
SC E 4893.87 4298.87 595

Fuente de SC G.L. CM F
Variacin
Trat. 4,298.87 2 2149.33 97.53
Error 595 27 22.0370
Total 4,893.87 29

F 0.05(2,27) = 3.35
97.5327>> 3.35 por lo que se rechaza la hiptesis nula de igualdad de medias. Es decir,
existen diferencias altamente significativas entre los tres tipos de fertilizantes.
47

Las salidas de cmputo vienen con una columna adicional que corresponde al valor p, la
probabilidad de exceder el valor del estadstico de prueba bajo la hiptesis nula, de ah que
se denote Pr > F. Un valor de 0.000 es la probabilidad de que el estadstico F con los
respectivos grados de libertad del numerador y denominador sea mayor que el F C obtenido
de los clculos. En el ejemplo existe una probabilidad 0.000 de que el F de la tabla F
exceda el valor de 97.5327. Es improbable que el valor F sea mayor que el F calculado. Por
lo que existe evidencia suficiente para rechazar Ho.
Podemos tambin decir que es la probabilidad asociada al estadstico de prueba (al que
calculamos), una p ms pequea que el nivel de significancia elegido conduce al rechazo de
la hiptesis nula.

Resolvamos simultneamente un ejemplo propuesto y resuelto por Hicks y Turner (1999).


En la manufactura de ropa se utiliza una mquina de prueba para medir la resistencia a la
abrasin de diferentes fbricas. La variable dependiente da la prdida de peso del material
en gramos despus de un nmero especificado de ciclos. El problema consiste en
determinar si hay diferencia en la prdida promedio entre cuatro fbricas competentes. Las
fbricas se denotan como A, B., C y D: fbrica es una variable cualitativa y de niveles
fijos, es decir estamos interesados nicamente en estas cuatro fbricas.

A B C D
1.93 2.55 2.40 2.33
2.38 2.72 2.68 2.40
2.20 2.75 2.31 2.28
2.25 2.70 2.28 2.25

Resolviendo,
Sumas de Cuadrados

SCT 92.97
38.41 2 0.76
16
8.76 2 10.72 2 9.67 2 9.26 2
SCTrat 92.21 0.52
4
SC E 0.76 0.52 0.24

Los grados de libertad para las fuentes de variacin son:


Fbricas 4-1 = 3
Error 4(4-1) = 12
Total 16-1 = 15

Cuadrados medios:
CMfbricas = 0.52/3 = 0.17
CME = 0.24/12 = 0.02

F
48

F = CMfbricas/CME

F = 0.17/0.02= 8.53

El estadstico de prueba se compara contra el valor F que corresponde a la regin de


rechazo y que consultamos en una tabla F con el nivel de significancia especfico.

F0.05;3,12 = 3.49
F0.01;3,12 = 5.95

Como el valor del estadstico de prueba es mayor que el valor de la tabla para 0.05 y an
ms, hasta para un nivel de 0.01, significa que existe diferencia altamente significativa
entre la prdida de peso promedio de las cuatro fbricas.
-
Tabla de anlisis

Fuente de SC G.L. CM F
Variacin
Fbricas 0.52 3 0.17 8.53
Error 0.24 12 0.02
Total 0.76 15

Como el valor de F obtenido es mayor que el de la tabla se puede decir que s existe efecto
del factor fbricas, en la prdida de peso. Habra entonces que determinar entre qu medias
se encuentra la diferencia.

Ejercicio Propuesto:
(Little y Hills, 1976)
Se desean probar tres tipos diferentes de hormonas, cada una en una dosis nica, para
determinar sus efectos sobre la capacidad de aumento de peso de las ovejas. Entonces,
incluyendo el control, tenemos cuatros tratamientos. Los 16 grupos de ovejas asignados al
experimento se numeran del 1 al 16. Empleando la tabla de nmeros aleatorios se asignan
al azar los grupos 14, 13, 8 y 9 al tratamiento A, y as sucesivamente.

Tratamiento Rplicas Totales Medias


A (Control) 47 52 62 51 212 53
B 50 54 67 57 228 57
C 57 53 69 57 236 59
D 54 65 74 59 252 63

Existen diferencias en el crecimiento promedio de las ovejas que reciben los 4 tipos de
hormonas?
49

Antes de proseguir con el anlisis para averiguar entre qu par de medias radica la diferencia,
es necesario estimar los parmetros del modelo para verificar si se cumplen los supuestos. Si
stos no se cumplen y se viola de manera significativa algn supuesto, la validez de la prueba
F es cuestionable y la probabilidad de cometer el error tipo I es mayor que el que se declara,
llegando muchas veces a conclusiones falsas, de ah la importancia de no proseguir con la
comparacin de medias, sino hasta que se est seguro de la validez de la prueba F. Una vez
que se pruebe que s se cumplen, ya es posible hacer las comparaciones de medias.

Estimacin de los parmetros del modelo


Bajo el modelo I o de efectos fijos la ecuacin del modelo es:

yij = + i + ij
Los valores poblacionales no pueden conocerse a partir de una muestra; antes bien se
proporcionan estimaciones de cada uno de los componentes del modelo, esto se indica con un
circunflejo arriba del smbolo del parmetro: , .

El residuo es:
eij yij y ij
eij yij i

Se trata pues de estimar los valores de los parmetros que minimicen la suma de cuadrados:

a n
L = ( yij - - i )2
i= j=1

Una de las formas de estimarlos es mediante el mtodo de mnimos cuadrados; para


encontrar los estimadores y se deben encontrar los valores que minimicen L.
Los valores sern la solucin de a + 1 ecuaciones simultneas. Estas se originan de derivar e
igualar a cero:

L
=0
,

L
=0
,
50


a n
L ij2 ( y ij i
2

i 1 j 1


2 y ij i
y ij N n1 n2 n3 0

L
2 y ij n n1 0
n

1 j 1

L
2 y ij n n2 0
n

2 j 1

L
2 y ij n n3 0
n

3 j 1

n
yij n n 1 0
j 1
n
yij n n 2 0
j 1
n
yij n n 3 0
j 1

N + n11 + n22 + n33 = y..


n + n11 = y1.
n + n2 = y2.
n + n3 = y3.
Debido a que hay ms incgnitas que ecuaciones, el sistema tiene infinidad de soluciones.
Como las ecuaciones no son independientes (puede verse que la primera resulta de sumar las
otras tres) por lo que no hay una solucin nica. Se utiliza como otra ecuacin:
a ( 0)

= 0
i=1
i

Al resolver este sistema de ecuaciones lineales se obtienen los estimadores mnimos


cuadrados:
= y..
i = y i. - y ..
stos son los mejores estimadores lineales insesgados (BLUE)
51

Para el ejemplo:
= 2608/30 = 86.9
y 1. = 103.1
y2. = 74.5
y3. = 83.2
1 = 103.1 - 86.9 = 16.2
2 = 74.5 - 86.9 =-12.4
3 = 83.2 - 86.9 = -3.7
i = 0

Los efectos de los tratamientos nos dicen qu tanto se alejan las observaciones de la media
global.
Si se observa la magnitud de los efectos parece que el tratamiento 3 es el ms distanciado, y
si observamos el signo de los efectos los tratamientos 2 y 3 tienden a disminuir los
rendimientos mientras que el sulfato de amonio produce mayores rendimientos. Al observar
magnitud y signo se puede decir que el que menos se aleja de la gran media es el
tratamiento de dietanoldiamida y el que ms se aleja es el sulfato de amonio desvindose
positivamente respecto a la media global.

Intervalos de confianza
Proporcionan una idea de la precisin del experimento; reflejan la variabilidad debida
al proceso de muestreo aleatorizado. Asimismo proporcionan una idea de qu tratamientos son
similares y cules son diferentes. Puede observarse tambin cul es el que produce mayor o
menor respuesta. Se construyen intervalos de confianza por cada media de tratamiento.
Recurdese que el intervalo de confianza supone que para una muestra distribuida
normalmente con media y varianza 2 el intervalo de confianza para la media est dado por:

Y z1 2 n ( 0)

donde z es el valor acumulado de la distribucin normal estndar, que para un 95% de


confianza es igual a 1.96. No conocemos pero suponemos una varianza comn. Cuando el
valor de se desconoce, el valor de z se reemplaza por el valor t de Student con el nmero de
grados de libertad usados para estimar la desviacin estndar de la muestra; en cada
tratamiento equivales a n-1, pero como son a tratamientos, entonces los grados de libertad de
la t equivalen a a(n-1) que corresponden al error.

En resumen, si se supone que los errores estn normal e independientemente distribuidos con
media 0 y varianza , las yi . se distribuyen normalmente con media i y varianza
CM E ( 0)
yi. t/2,N -a
n

Para el ejemplo, los intervalos de confianza son los siguientes:


52

: [99.95, 106.0]
1
2: [71.45, 77.55]
2: [80.15, 86.25]
Esto significa que el 95% de las veces el valor medio de rendimiento con el sulfato de
amonio caer entre 99.95 y 106.05, el valor medio del rendimiento con la ciamida caer entre
71.45 y 77.55 y entre 80.15 y 86.25 para la dietanolamida.

Tambin pueden obtenerse intervalos de confianza para diferencias entre medias; se


calcula as:
2CM E ( 0)
yi - y j t (N -a),/2
n

para tamaos de muestra iguales. Y para cuando n i es diferente de nj entonces se aplica:


1 1 ( 0)
yi - y j t (N -a),/2 CM E +

ni n j

Si cualquiera de los intervalos de parejas de medias contiene al cero significa que


estadsticamente son iguales.

Verificacin de los supuestos del modelo


Los modelos estadsticos trabajan bajo ciertos supuestos. Se supone que en el modelo
completamente aleatorizado la observacin yij se distribuye normalmente con media + i y
con varianza, 2.
Para verificar los supuestos Dean y Voss (1999) sugieren seguir los siguientes pasos:
1) Checar la forma del modelo, es decir averiguar si E(Yij) = + i.
2) Checar los valores atpicos
3) Checar la independencia
4) Checar la homogeneidad
5) Checar la normalidad

Para verificar los supuestos del anlisis de varianza, no es conveniente hacerlo con los datos
crudos porque pueden estar influenciados por los factores de inters y por lo tanto no tendrn
una media comn. La verificacin se aplica a los residuos ya que stos no tienen el
inconveniente de ser afectados por los factores, ellos tienen una media comn igual a cero.
Los supuestos se checan con observaciones que sean independientes de si la hiptesis nula es
cierta o no, ya que no tiene sentido que la validez de la prueba descanse en si se rechaza o no
la hiptesis nula; los datos crudos tienen el inconveniente de que dependen de su media de
tratamiento individual y esto repercute en las diferencias entre tratamientos. Los residuos por
su parte al tener una media comn igual a cero, no dependen de si la hiptesis nula es cierta o
no, de hecho es lo que queda de la variabilidad de los datos no atribuible a los tratamientos,
por esta razn se emplean para verificar los supuestos.

Tambin pueden verificarse con los datos crudos dentro de un mismo tratamiento ya que
tienen una media comn yi., con estos datos no se podra checar que las varianzas de las a
poblaciones son homogneas, de ah que se empleen los residuos y as es posible verificar
53

todos los supuestos. Es importante recordar que los residuos son estimadores de los errores, ya
que no es posible conocer al verdadero valor poblacional de las medias de los tratamientos.

A pesar de esto, se pueden presentar, de los datos crudos, los estadsticos descriptivos
siguientes:
Resumen Estadstico para Rendimiento

Fertilizante Frecuencia Media Mediana Varianza Desviacin tpica


--------------------------------------------------------------------------------------------
1 8 103.375 103.0 1.41071 1.18773
2 10 74.5 76.5 55.1667 7.42743
3 10 83.2 82.5 8.62222 2.93636
14 1 100.0 100.0 0.0 0.0
15 1 104.0 104.0 0.0 0.0
--------------------------------------------------------------------------------------------
Total 30 86.9333 83.5 168.754 12.9905

Se puede observar que las medias y medianas son parecidas por lo que puede decirse que la
distribucin no es de asimetra muy significativa.

El residuo se define como la diferencia entre el valor observado y el valor predicho.


eij yij y ij ( 0)

En el anlisis de varianza cada observacin se describe por el modelo:

yij = + i + ij

El valor predicho para este modelo:


y ij i ( 0)

Sustituyendo por sus estimadores de mnimos cuadrados:

y ij y.. yi. y..


y ij yi .

Luego entonces, en el modelo de una va, el valor del residuo es:


eij y ij y i.

Se supone que en este modelo los errores se distribuyen normal e independientemente


con media cero y varianza .
Para obtener conclusiones vlidas se recomienda verificar los supuestos de:
normalidad, independencia y homogeneidad de varianzas (Homocedasticidad). La violacin
de uno o ms de estos supuestos puede afectar el nivel de significancia as como la
sensibilidad de la prueba F a las discrepancias respecto a la hiptesis nula.
Los valores de los residuos crudos no son precisamente los idneos para analizar los
supuestos, sino que son ms convenientes los residuos estandarizados que permitirn localizar
fcilmente los valores no usuales o atpicos.
54

eij ( 0)
d ij
CME
Estos residuos tienen media cero y varianza 1. Es decir, d ij ~N(0,1). Los residuos crudos
estimados que pertenecen a un tratamiento no son independientes entre s y no tienen la misma
varianza especialmente cuando los tamaos de muestra son desiguales, de ah que se prefiera
utilizar los residuos estandarizados.

Para el examen de los residuos se emplean las grficas de residuos que consisten en las que se
grafican los residuos estandarizados contra los niveles de alguna variable tales como: valores
predichos, niveles del factor, orden o tiempo.

Ajuste del modelo


Si la respuesta media del modelo no se ajusta adecuadamente a los datos, se dice que existe
falta de ajuste. Para verificar el ajuste del modelo, se grafican los residuos contra los
niveles de las variables independientes (tratamientos, bloques y/o covariable) En el caso del
diseo que nos ocupa, contra los niveles del factor o tratamientos. Si el modelo se ajusta
adecuadamente a los datos, entonces la grfica presenta un patrn aleatorio alrededor del
cero, si hay un predominio de residuos positivos para un tratamiento o de residuos
negativos para otro, nos indicara que hay falta de ajuste.
Residual Plot for rendim
15
10

5
residual

0
-5

-10
-15
1 2 3
fertilizante

Los residuos se distribuyen alrededor del cero y no hay ni muy positivos ni muy negativos,
puede verse que no parece haber problema de ajuste ms bien puede notarse que la
dispersin de los residuos del fertilizante ciamida es ms grande que la dispersin de los de
los otros fertilizantes. Podra interpretarse como una seal de que la igualdad de varianzas
no se cumple.

Normalidad
La forma ms simple para verificar el supuesto de normalidad consiste en hacer un
histograma de los residuos y observar si tienen una distribucin normal (simtrica y en forma
de campana , con colas sin lmites, unimodal y con un valor de curtosis de 3), sin embargo, no
es til para tamaos de muestra pequea adems de que manipulando el nmero de intervalos
de clase puede aproximarse a una distribucin normal.
Otra manera de verificar la normalidad es por medio de grficas de residuos; una de ellas es la
grfica de probabilidad normal; los residuos se grafican en forma ascendente contra su
probabilidad acumulada: si se observa una lnea recta entonces los errores se distribuyen
55

normalmente; se observan desviaciones ms grandes en los extremos de la recta por lo que hay
que prestar ms atencin a los puntos intermedios que a los extremos.
El papel de probabilidad normal est diseado de modo que la distribucin normal acumulada
se graficar como una lnea recta. Para construir la grfica se siguen los siguientes pasos:
1. Ordenar los residuos de menor a mayor.
2. Calcular las probabilidades acumuladas
Las probabilidades acumuladas se calculan con la siguiente frmula:
k 0.375
y x100
n 0.25
donde k es el rango o posicin de la observacin. Otra frmula empleada es:
k 0.5
y x100
n
Sin embargo se considera menos exacta para muestras pequeas.
3. Graficar las probabilidades acumuladas contra los residuos. Usualmente si la
distribucin es normal queda una recta. Observe los puntos centrales es decir del 33 al
67%. Las desviaciones de la lnea recta indican no normalidad.
La desventaja de las grficas de probabilidad normal es que son subjetivas y requieren
juicios basados en la experiencia. Una lnea recta indica que hay poca evidencia para rechazar
el supuesto de normalidad. (Zylstra, 1995). A continuacin se presentan una serie de grficas
de probabilidad normal.

Distribucin de colas pesada Distribucin de cola ligera


56

Distribucin sesgada a la derecha Distribucin sesgada a la izquierda

Ver ejemplos de grficas de probabilidad normal en:


http://www.oswego.edu/~srp/stats/normal_prb_plot.htm

Estas grficas permiten ver la forma de la distribucin.


Una violacin que distorsiona la forma de la distribucin es la presencia de datos atpicos o
outliers. Si se observan residuos muy distanciados, llamados residuos inusitados o
extremos, se infla la estimacin de la varianza del error e influye en la estimacin de la media
del tratamiento (Kuelh,2000). stos pueden detectarse en la grfica de residuos contra los
niveles del factor;, si se observa algn residuo positivo muy grande o uno negativo muy
pequeo, entonces se verifica si realmente son valores extremos o aberrantes mediante algunas
pruebas estadsticas (como la de Dixon, o el Criterio de Chauvenet: y si lo son, se averigua la
causa con el objeto de eliminarlo (en caso de ser error de observacin, como por ejemplo un
laboratoriazo) o bien recurrir a algn mtodo estadstico para proporcionar estimaciones de la
media y del valor, una vez eliminado. Un valor atpico puede ser debido a que no se anot bien
el resultado (laboratoriazo) en cuyo caso la solucin es eliminarlo del anlisis, o bien, s ser un
residuo real, ya sea porque los errores no siguen una distribucin normal, o porque alguna
varianza difiere o bien porque se especific un modelo incorrecto.

Una manera sencilla de analizar estos residuos es mediante los residuos estandarizados:
d ij =eij / CM E ( 0)

El 68% debe caer entre 1, alrededor del 95% entre 2, y prcticamente todos
(99.7%) deben estar entre 3. Un residuo a una distancia mayor de 3 o 4 desviaciones
estndar del origen es potencialmente un residuo distanciado.
Si se encuentra un valor atpico se realiza el anlisis con y sin el valor, si los resultados son
iguales, se deja el valor, pero si difieren en mucho, se dice que el valor atpico es de influencia.
57

Residuo estandarizado para VAR00001


1

-1

-2

-3

-4
.5 1.0 1.5 2.0 2.5 3.0 3.5

VAR00002

La grfica anterior permite detectar valores atpicos, sta es de residuos estandarizados contra
niveles del factor. Los residuos descansan entre +3 y -3, y slo uno, -3.09, se pasa ligeramente
por lo que puede considerarse que no es atpico.

Otra manera de verificar la normalidad es haciendo grficas de los residuos contra los valores
predichos y ij . La ausencia de algn patrn particular de comportamiento indica distribucin
normal de los errores.
Otra manera de checar la distribucin normal es demostrar si las medias y varianzas son
independientes. Puede demostrarse matemticamente que si tomamos muestras al azar de una
poblacin, los promedios y desviaciones estndar de las muestras sern independientes si la
poblacin tiene una distribucin normal.
Cuando la varianza es proporcional al promedio del grupo, al cuadrado del promedio del
grupo, al promedio elevado a la cuarta potencia existen transformaciones simples que harn la
varianza independiente del promedio. (Ms adelante se vern estas transformaciones).
Se utiliza el coeficiente de correlacin para probar esta independencia y a su vez normalidad.
Sin embargo Fang y Case (1996) han demostrado que con el coeficiente de correlacin, y por
consiguiente la prueba de normalidad, prueba ms bien simetra que normalidad, y no toda
distribucin simtrica corresponde a la normal.

Qu sucede si no se cumple el supuesto de normalidad?

El estadstico F es robusto a la no normalidad moderada, en especial si se trabaja con


diseos balanceados. Cuando la violacin del supuesto tiene muy poco efecto en la
distribucin del estadstico de prueba y por consiguiente en las tasas de error tipo I y II, se dice
que el estadstico es robusto respecto a la violacin de dicho supuesto. Las distribuciones
sesgadas tienen muy poco efecto sobre y en la potencia de la prueba. Si la distribucin es
simtrica pero no normal tambin la F resulta ser una prueba robusta. Si es asimtrica se
recomienda cambiar el nivel de significacin de 0.05 a 0.025 o 0.01.
Cuando se trabaja con modelos aleatorios, aunque estn balanceados, la violacin a la
normalidad s afecta en las estimaciones de los componentes de varianza.
Si los errores no se distribuyen normalmente el valor es mayor que el aparente, esto
conduce a rechazar Ho cuando realmente es verdadera, es decir se dice que hay diferencias
cuando realmente no existen (Infla el error tipo I).
58

Cuando hay outliers los niveles de confianza son ms bajos que los nominales, o dicho en
trminos de significancia, los niveles son ms altos que los nominales ( p > ).

Qu hacer en caso de presentarse cualquiera de estas violaciones a la normalidad?

Si se trata de diseos balanceados, realizar el anlisis de varianza como es costumbre. Si la


distribucin de los datos es asimtrica cambiar el nivel de 0.05 a uno menor. Si se viola mucho
el supuesto de normalidad a veces con una transformacin de los valores se corrige la no
normalidad; si no ocurre de esta manera entonces se procede a trabajar con pruebas que no
hagan supuestos acerca de la distribucin de las observaciones, es decir, pruebas de
distribucin libre o no paramtricas. Si se trata de un valor atpico eliminarlo si es incorrecto y
trabajar el anlisis de varianza como caso desbalanceado, si la observacin es real transformar
los datos ya que borrarlo mejorara el ajuste pero es peligroso porque da una idea falsa de
precisin en la estimacin o en la prediccin.
Normal Probability Plot for RESIDUALS
99.9
99
95
percentage

80
50
20
5
1
0.1
-15 -10 -5 0 5 10 15
RESIDUALS

Se observa que el supuesto de normalidad se cumple, y el residuo ms pequeo no es atpico.

Independencia
Uno de los supuestos del anlisis de varianza es el de la independencia. Se supone
que las muestras asignadas a los tratamientos proceden de poblaciones infinitas, y que son
muestras aleatorias de esta poblacin, por esta razn se espera que las observaciones sean
independientes entre s dentro de cada grupo y entre los grupos. Una de las formas para
verificar este supuesto es graficando los valores de las observaciones (o de los residuos)
contra el tiempo o contra el orden en que fueron tomadas y contra cualquier arreglo espacial
de las correspondientes unidades experimentales; cualquier tendencia (rachas altas y rachas
bajas, o rachas alternadas que indican correlacin positiva y negativa respectivamente) indica
que quiz no hubo una buena aleatorizacin y por lo tanto que existe dependencia entre las
observaciones. Otro modo de checar este supuesto es mediante el clculo de la correlacin
serial entre observaciones adyacentes. Si la correlacin es diferente de cero, se dice que existe
dependencia entre las observaciones adyacentes. Si ocurre esto los estimadores de mnimos
cuadrados de los parmetros se ven afectados al igual que el cuadrado medio del error. ste
disminuye y por consiguiente la F aumenta, y se rechazar la hiptesis nula cuando debe
aceptarse (infla el error tipo I).
Existen pruebas para verificar si los errores estn o no correlacionados como la prueba
de Durbin-Watson (Hines y Montgomery, 1972).(Consltese, Dunn,1987). La prueba de
Durbin Watson slo es aplicable para datos de series de tiempo. Una buena aleatorizacin es la
que asegura la distribucin independiente de los errores.
59

Para verificar la independencia puede llevarse a cabo una prueba de aleatoriedad que es la
prueba de rachas. Esta se puede definir como una secuencia de observaciones con el mismo
signo (+ o -).
La prueba consiste en ordenar los residuos en el orden en que se obtuvieron los datos
respectivos. Contar el nmero de corridas r o rachas de resultados positivos (n 1) y contar el
nmero de corridas de residuos negativos (n2). Si N es menor o igual a 20, rechazar la
hiptesis de aleatoriedad si r < rL o si r > rU, donde rL y rU son los valores crticos de la tabla
A30 que se anexa a estas notas. Para tamaos de muestra grandes rechace la hiptesis de
aleatoriedad si z > z/2.
r 0.5 ( 0)
z

2n1n2 ( 0)
1
n1 n2
2n1n2 ( 2n1n2 n1 n2 ) ( 0)

( n1 n2 )(n1 n2 1)

De esta manera se puede verificar si se cumple el supuesto de independencia.


Si se conduce el anlisis bajo el supuesto de independencia cuando realmente no la hay, los
verdaderos niveles de significancia pueden ser ms altos del que se haba
propuesto y la potencia ser menor de lo esperado. Si se dice que se tiene una
probabilidad de 0.05 de cometer el error tipo I, si hay dependencia temporal o
espacial, el valor de la probabilidad ser > 0.05, lo que conducira incrementar la
probabilidad de rechazar Ho dado que es verdadera. Una buena aleatorizacin es
la que evita la violacin a este supuesto. Si se observa alguna tendencia en la
grfica de residuos por ganancia en experiencia o por cansancio, dicha tendencia
lineal pude manejarse introduciendo al modelo trminos que representen el efecto
del tiempo o del espacio. Entonces el modelo se convertira de un diseo de un
factor o direccin en uno de covarianza con un solo factor, donde el tiempo es la
covariable.

Homogeneidad de varianzas
La homocedasticidad u homogeneidad de las varianzas es otro de los supuestos del
anlisis de varianza que supone que las varianzas de las a muestras tienen varianzas iguales
pues proceden de la misma poblacin infinita. La heterogeneidad de las varianzas no afecta
tanto en el modelo de efectos fijos y balanceado, pero s lo hace en el de efectos aleatorios y en
el caso desbalanceado.
Una manera de checar la homocedasticidad es mediante grficas de residuos contra los niveles
del factor, o bien de los residuos contra los valores predichos. Si las varianzas son iguales se
espera encontrar una banda.
60

Algunas violaciones a la homocedasticidad se presentan en las siguientes grficas


.

Las varianzas de los tratamientos son distintas. Si esta misma forma se presenta en una grfica
de residuos contra valores predichos, significa que la varianza est en funcin de y, es decir,
aumenta con el valor de y, o en forma inversa, disminuye con el valor de y. Otro patrn que se
puede observar es el siguiente:

Este doble megfono es evidencia de que el tratamiento 2 tiene mucha variabilidad en


contraposicin al 1 y 3.
En el ejemplo, la grfica de residuos contra valores predichos exhibe un patrn sistemtico ya
que la varianza disminuye conforme se incrementa la media (o valor predicho). Note que el
rango de variacin de los residuos del fertilizante a base de amonio duplica o quiz triplica el
rango de variacin del fertilizante a base de dietanoldiamida.
Cuando no existe una variacin sistemtica de los residuos- es decir, la varianza no aumenta o
disminuye conforme aumenta la media- es muy til la grfica de residuos contra niveles del
factor ya que permite ver cul tratamiento exhibe una mayor varianza de los residuos y cul
exhibe la menor variabilidad. En esta ltima grfica no pueden verse patrones sistemticos de
los residuos ya que no estn ordenados los tratamientos.
Residual Plot for rendim
15
10
5
residual

0
-5
-10
-15
74 79 84 89 94 99 104
predicted rendim

Existen pruebas estadsticas para checar la homogeneidad de varianzas, tal como la prueba de
Bartlett el cual es un estadstico con distribucin con a-1 grados de libertad. Para tamaos
de muestras iguales se emplea la prueba de Cochran que se usa para detectar si una varianza es
mucho mayor que las otras. Estas pruebas tienen la desventaja de que requieren gran nmero
61

de rplicas para que tengan potencia. Y la de Bartlett por ejemplo, es muy sensible a la no
normalidad.
La prueba de Cochran se restringe a situaciones donde existen tamaos de muestra
iguales, y se trata de demostrar que una varianza es mucho ms grande que las otras. El
estadstico de prueba es el siguiente:
S i
2 ( 0)
G= a

S 2
i
i=1

donde la Si del numerador es la varianza ms grande de los a grupos. Se rechaza laHo de


igualdad de varianzas si g > g a. (Tabla A-11, Walpole & Myers, 1990).

La prueba de Bartlett tambin se utiliza para probar:


Ho = j 2 i, j.
Y se puede utilizar cuando los tamaos de muestra no son iguales. El estadstico de Bartlett se
distribuye como una con a-1 g. l.
= q/c, ( 0)

donde,
q = (N - a) log S 2p - (ni - 1) log S i2 ( 0)

y,
( 0)

1 1 1 a
c = 1+ -
3(a - 1) i=1 ( ni - 1) (N - a)
a ( 0)
( n - 1) S
i=1
i
2
i

Sp=
N -a

Se rechaza Ho si o > a, a-1 .


Existen tambin estadsticos que prueban que la varianza ms pequea es
significativamente diferente del resto (Nelson, 1993).

Prueba F max

Para a grupos de igual tamao (n) se calculan las varianzas si2. Encontrar la ms grande y la
ms pequea y calcular el estadstico F max
s2 ( 0)
Fmax max 2
F ;a , n 1
s min
62

Si el estadstico es mayor que el valor Fmax de la tabla, rechazar la hiptesis nula de igualdad
de varianzas. Esta prueba tambin es conocida como de Hartley quien proporciona la
distribucin de muestreo del estadstico F max. Los parmetros para esta distribucin son el
nmero a de tratamientos y los grados de libertad para cada una de las varianzas de los
tratamientos. En la siguiente pgina se presenta una porcin de la tabla F max.
Esta prueba es rpida, y es afectada por la no normalidad, y emplea una tabla que no en
cualquier texto se presenta.
63

Fmax Distribution
Column values are the number of groups.
Row values are (n-1) in each group.
2 3 4 5 6 7 8 9 10 11 12
.05 39 87.5 142 202 266 333 403 475 550 626 704
2
.01 199 448 729 1036 1362 1705 2063 2432 2813 3204 3605
.05 15.4 27.8 39.2 50.7 62 72.9 83.5 93.9 104 114 124
3
.01 47.5 85 120 151 184 216 249 281 310 337 361
.05 9.6 15.5 20.6 25.2 29.5 33.6 37.5 41.4 44.6 48 51.4
4
.01 23.2 37 49 59 69 79 89 97 106 113 120
.05 7.15 10.8 13.7 16.3 18.7 20.8 22.9 24.7 26.5 28.2 29.9
5
.01 14.9 22 28 33 38 42 46 50 54 57 60
.05 5.82 8.38 10.4 12.1 13.7 15.0 16.3 17.5 18.6 19.7 20.7
6
.01 11.1 15.5 19.1 22 25 27 30 32 34 36 37
.05 4.99 6.94 8.44 9.7 10.8 11.8 12.7 13.5 14.3 15.1 15.8
7
.01 8.89 12.1 14.5 16.5 18.4 20 22 23 24 26 27
.05 4.43 6.0 7.18 8.12 9.03 9.8 10.5 11.1 11.7 12.2 12.7
8
.01 7.5 9.9 11.7 13.2 14.5 15.8 16.9 17.9 18.9 19.8 21
.05 4.03 5.34 6.31 7.11 7.8 8.41 8.95 9.45 9.91 10.3 10.7
9
.01 6.54 8.5 9.9 11.1 12.1 13.1 13.9 14.7 15.3 16 16.6
.05 3.72 4.85 5.67 6.34 6.92 7.42 7.87 8.28 8.66 9.01 9.34
10
.01 5.85 7.4 8.6 9.6 10.4 11.1 11.8 12.4 12.9 13.4 13.9
.05 3.28 4.16 4.79 5.3 5.72 6.09 6.42 6.72 7.0 7.25 7.48
12
.01 4.91 6.1 6.9 7.6 8.2 8.7 9.1 9.5 9.96 10.2 10.6
.05 2.86 3.54 4.01 4.37 4.68 4.95 5.19 5.4 5.59 5.77 5.93
15
.01 4.07 4.9 5.5 6.0 6.4 6.7 7.1 7.3 7.5 7.8 8.0
.05 2.46 2.95 3.29 3.54 3.76 3.94 4.1 4.24 4.37 4.49 4.59
20
.01 3.32 3.8 4.3 4.6 4.9 5.1 5.3 5.5 5.6 5.8 5.9
.05 2.07 2.4 2.61 2.78 2.91 3.02 3.12 3.21 3.29 3.36 3.39
30
.01 2.63 3.0 3.3 3.4 3.6 3.7 3.8 3.9 4.0 4.1 4.2
.05 1.67 1.85 1.96 2.04 2.11 2.17 2.22 2.26 2.30 2.33 2.36
60
.01 1.96 2.2 2.3 2.4 2.4 2.5 2.5 2.6 2.6 2.7 2.7
.05 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00
inf
.01 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00

Prueba de Levene.
La hiptesis que se prueba es que las varianzas son iguales contra la alternativa de que al
menos un par es diferente, consiste en realizar un anlisis de varianza a las observaciones a
Las que se les ha restado las respectivas medias de los tratamientos. Si la prueba F es
significativa entonces se rechaza H0 de igualdad de varianzas
64

Prueba Modificada de Levene o Levene (Med)


Esta prueba no es tan sensible a la no normalidad como lo es la de Bartlett, la F max u la de
Cochran y consiste en restar a cada valor y ij el valor de la mediana ~ y i . y con los valores
absolutos de estas diferencias se lleva a cabo un anlisis de varianza. Si la hiptesis nula se
rechaza significa que las varianzas son distintas.
65

Una regla prctica que se aplica es comparar la varianza ms grande contra la ms pequea, si
el valor de
2
s grande s 2pequea > 3, entonces se dice que las varianzas no son iguales, aunque no
necesariamente sea as.

Qu ocurre si se viola el supuesto de homocedasticidad?

Si se trata de un diseo balanceado y una de las varianzas es considerablemente mayor que las
otras, los niveles de significancia varan slo ligeramente con respecto a los verdaderos
valores. Es decir, cuando se trata de diseos balanceados la heterocedasticidad afecta
ligeramente el nivel . Pero si se trata de diseos desbalanceados, el real parece verse
incrementado sobre el nominal, especialmente si las muestras ms pequeas presentan las
varianzas mayores. Si las muestras grandes tienen las varianzas mayores la prueba F es
conservadora, es decir, los niveles de significancia son similares a los reales. Pero para casos
desbalanceados se infla la probabilidad de cometer el error tipo I, es decir, que si se eligi
trabajar con un nivel nominal de 0.05 el nivel se incrementa por ejemplo a 0.058 lo que
conducira a rechazar dado que es verdadera. Si el estadstico tiene una probabilidad de 0.049,
yo rechazo, pero realmente deba haber aceptado por que el nivel de probabilidad real es de
0.058 y no 0.05.
Si hay desigualdad de varianzas pero las grficas de residuos contra valores predichos no son
de tipo megfono, no existe alguna transformacin adecuada, en cuyo caso se puede utilizar
un mtodo de anlisis de datos diseado para cuando las varianzas no son iguales y que es la
aproximacin de Satterwaite que viene explicada en el libro de diseo de experimentos de
Dean y Voss (1999).
Cuando las varianzas no son homogneas las comparaciones mltiples y por parejas son ms
fuertemente afectadas que el anlisis de varianza.

Qu hacer si el supuesto de homogeneidad de varianzas no se cumple?

Cuando el supuesto de homocedasticidad no se cumple, las varianzas pueden


homogeneizarse mediante transformaciones de los datos originales, y dar las interpretaciones
en funcin de los datos transformados o retransformarlos a la escala original. Es importante
notar que las conclusiones se aplican a las poblaciones transformadas.
Anderson (1974) proporciona una serie de reglas bsicas para la realizacin de
transformaciones.
i) Si la prueba de homogeneidad se acepta a un nivel a 0.01, no transformar.

ii) Si la prueba de homogeneidad se rechaza a nivel a 0.001, entonces transformar.

iii) Si los resultados de la prueba de homogeneidad est entre 0.01 y 0.001, tratar de
encontrar la distribucin terica de la distribucin. Si existe una razn prctica para
transformar, hacerlo. De otra manera, se recomienda no transformar. Probar con los
programas estadsticos las diversas transformaciones y las pruebas de homogeneidad
de varianzas y seleccionar aqul que estuviera mejor en la regin de aceptacin. Es
importante que pueda ser transformado y que esta transformacin tenga sentido.
66

Otra forma de checar si son necesarias las transformaciones y averiguar cul es la ms


adecuada, es haciendo una serie de grficas de las medias de los a grupos contra sus varianzas
o desviaciones estndar; si se observa independencia entre las medias y desviaciones no es
necesaria ninguna transformacin y la distribucin que siguen los datos es normal.

Es importante recalcar que cuando se transforman los datos, los niveles de significancia y las
inferencias se aplican a la escala transformada, pero cuando se presenten las medias es
conveniente retransformarlas a la escala original que es donde tienen sentido. Igualmente los
intervalos de confianza dentro de los que descansan las medias se transforman a la escala
original, tngase en cuenta que cuando los datos se han transformado a logaritmo, al
retransformar a la escala original con antilogaritmo los valores de los intervalos de confianza
no son simtricos respecto a la media.

Las transformaciones de potencia del tipo X = Yp consisten en las siguientes transformaciones:

Potencia Yp Nombre
2 Y2 Elevacin al cuadrado
1 Y Dato crudo
Y Raz cuadrada
0 Ln(Y) Logaritmo natural
-1/2 1/Y Recproco de raz cuadrada
-1 1/y Recproco

Se puede comenzar con la raz cuadrada y progresivamente aumentando la potencia hasta


llegar al recproca.

Transformacin logartmica
Se emplea para estabilizar la varianza de Y si sta aumenta marcadamente conforme
se incrementa o dicho de otro modo cuando el cambio en la respuesta es de tipo
multiplicativo y no aditivo (ejemplo cuando trabajamos con bacterias la trasformacin
adecuada es la logartmica pues su curva de crecimiento es tipo exponencial); tambin se
emplea, para normalizar la variable dependiente si la distribucin de los residuos de Y esta
sesgada positivamente (es decir hay algunos valores muy grandes) y, para linealizar un
modelo de regresin si la relacin de Y con x sugiere un modelo con una pendiente
consistentemente en ascenso. (Modelo exponencial).

Modelo de regresin con pendiente aumentando consistentemente


67

La varianza de los residuos se incrementa al aumentar la media

Distribucin con sesgo positivo

Transformacin raz cuadrada


Se utiliza para estabilizar la varianza si sta es proporcional a la media de Y. Esto es
apropiado cuando la variable tiene una distribucin de Poisson. (Conteos). El nmero de
colonias de bacterias encontradas en las placas, o el nmero de defectos o accidentes por
unidad de tiempo siguen una distribucin de Poisson porque la probabilidad de xito es
muy pequea.
En la distribucin de Poisson la media es igual a la varianza. Al obtener la raz cuadrada de
las observaciones, esta transformacin tendr una varianza constante de 0.25 para todos los
valores de las medias. Si las muestras son grandes no es necesaria la transformacin
(Kuehl, 2001).
Transformacin recproca
Se utiliza para estabilizar la varianza si sta es proporcional a la cuarta potencia de
la media de Y, lo cual indica que hay un gigantesco incremento de la varianza arriba de
algn valor lmite de Y. Esta transformacin minimiza el efecto de valores grandes de Y.

Elevacin al cuadrado
Se usa para estabilizar la varianza si sta disminuye con la media de Y, para
normalizar la variable dependiente si la distribucin de los residuos est negativamente
sesgada y, para linealizar el modelo si la relacin original es curvilnea hacia abajo (la
pendiente disminuye consistentemente conforma la variable independiente aumenta).

Relacin curvilnea hacia abajo, la pendiente disminuye cuando aumenta X


68

La varianza aumenta con la media Y

Distribucin con sesgo negativo


Transformacin arco seno
Se emplea para estabilizar la varianza si Y es una tasa o proporcin. O de conteos de
una variable aleatoria binomial. Las observaciones de nmero de xitos en n pruebas
independientes siguen una distribucin binomial. Por ejemplo, la proporcin de artculos
defectuosos o proporcin de plantas que florecen en una seccin.

En esta distribucin la probabilidad estimada es y n y es el nmero de xitos en n


pruebas.
Media
1
Varianza
2

n
La transformacin arco seno es:
arcseno ( ) sen 1

Si n es pequeo se sustituye por (y + 3/8)/(n+3/4)


1 ( 0)
y3 2
1 8
x sen
n 3 4
es aproximadamente normal con media =sen-1 y desviacin estndar 1/2n.???
69

+---------------------------------------------+
| Potencia Transformacin Re-expresin |
|---------------------------------------------|
| 3 Cubo x 3 |
| | Corrigen asimetra negativa
| 2 Cuadrado x 2 |
| |
| 1 NINGUNA x |
| |
| 1/2 Raz cuadrada raz x |
| |
Corrigen asimetra positiva
| 0 Log log10 x |
| |
| -1/2 raz del recproco -1/(raz x) |
| |
| -1 Recproco -1 / x |
+---------------------------------------------+

Esta familia de transformaciones (escalera de Tukey) tiene importantes propiedades:

1. Preservan el orden de los valores; es decir, los valores mayores de la escala original
seguirn siendo los valores mayores en la escala transformada.

2. Modifican la distancia entre los valores. Con potencias p<1 (raz (x) o log (x) se
comprimen los datos en la parte superior de la distribucin en relacin a los valores
menores; Con potencias p>1 (como el cuadrado de x) se tiene el efecto contrario.

3. El efecto sobre la forma de la distribucin cambia sistemticamente con p. Si raz (x)


hace menos pronunciada la asimetra positiva de una distribucin, el log (x) provocar
que la distribucin resultante sea an menos asimtrica positiva (en relacin a raz (x).

Las transformaciones de potencia pueden hacer que la variable transformada tenga menos
asimetra. Por qu es eso importante?

Las distribuciones que muestran una clara asimetra son difciles de estudiar.

Los valores originales aparentemente atpicos se encontrarn ms cercanos al grueso de


los datos.

Los mtodos estadsticos suelen emplear la media aritmtica; pero la media de una
distribucin asimtrica no es un buen ndice del grueso de los datos.

Un modo muy emprico de averiguar qu tipo de transformacin es la ms adecuada


involucra encontrar una funcin de los datos h(yij) de modo que el modelo:

h( y ij ) * i* ij

cumpla con los supuestos.


70

Se supone que en este modelo transformado los errores ya cumplen con los supuestos de
normalidad, independencia y homogeneidad de varianzas.
Si la relacin entre las varianzas de los a grupos y sus medias es clara, puede encontrarse
un tipo de transformacin adecuada. Si la varianza aumenta al aumentar la media (forma de
megfono) o si la relacin es inversa, la relacin entre la varianza y la media es:
Las desviaciones estndar son proporcionales a alguna potencia de la media, como puede
verse en la siguiente ecuacin.
i2 k i ( 0)
q

i2 k i ( 0)
q

donde, k y q son constantes.


La cuestin est en encontrar el valor de q. Y para encontrarla, se obtiene los logaritmos de
ambos lados de la ecuacin.

ln s i2 ln k q ln y i. ( 0)

Si se grafican los ln de las varianzas muestrales contra sus respectivas medias muestrales se
obtiene un diagrama de dispersin cuya pendiente sera el valor aproximado de q.

Si q es distinta de 2 entonces y*ij=yij1-(q/2), si q =2 entonces y* = ln y.

Si se supone distribucin normal, entonces es realmente una aproximacin a la Poisson, as,


la varianza sera igual a la media y q =1, y la transformacin de raz cuadrada sera la
apropiada.

Salida de Cmputo. Statgraphics.


Summary Statistics for rendim
Fertilizante Cuenta Promedio
------------------------------------------------------------
1 10 103.1
2 10 74.5
3 10 83.2
------------------------------------------------------------
Total 30 86.9333

fertilizante Varianza Desviacin estndar


------------------------------------------------------------
1 2.32222 1.52388
2 55.1667 7.42743
3 8.62222 2.93636
------------------------------------------------------------
Total 168.754 12.9905

Anlisis de Varianza
-----------------------------------------------------------------------------
Fuente SC g.l. CM F P-Value
-----------------------------------------------------------------------------
Between groups 4298.87 2 2149.43 97.54 0.0000
Within groups 595.0 27 22.037
-----------------------------------------------------------------------------
Total (Corr.) 4893.87 29
71

Tabla de Medias para rendimiento por Fertilizante con LSD al 95% de confianza
--------------------------------------------------------------------------------
Stnd. error
fertilizante Cuenta Media s pooled Lmite inferior L. superior
--------------------------------------------------------------------------------
1 10 103.1 1.48449 100.946 105.254
2 10 74.5 1.48449 72.3462 76.6538
3 10 83.2 1.48449 81.0462 85.3538
--------------------------------------------------------------------------------
Total 30 86.9333

Multiple Range Tests for rendim by fertilizante


-------------------------------------------------------------------------------
Method: 95.0 percent LSD
fertilizante Cuenta Media Grupos homogneos
--------------------------------------------------------------------------------
2 10 74.5 X
3 10 83.2 X
1 10 103.1 X
--------------------------------------------------------------------------------

Contraste Diferencia +/- Lmites


--------------------------------------------------------------------------------
1-2 *28.6 4.30759
1-3 *19.9 4.30759
2-3 *-8.7 4.30759
--------------------------------------------------------------------------------
* denota una diferencia estadsticamente significativa

Varianza Check
Cochran's C test: 0.834454 P-Value = 0.0000646376
Bartlett's test: 2.13183 P-Value = 0.0000589774
Hartley's test: 23.756

Means and 95.0 Percent LSD Intervals


112

102
rendim

92

82

72
1 2 3
fertilizante
72

Box-and-Whisker Plot

fertilizante
2

60 70 80 90 100 110
rendim

Residual Plot for rendim


15

10

5
residual

0
-5

-10
-15
1 2 3
fertilizante

Residual Plot for rendim


15
10
5
residual

0
-5
-10
-15
74 79 84 89 94 99 104
predicted rendim

Residual Plot for rendim


15

10

5
residual

-5

-10

-15
0 5 10 15 20 25 30
row number

Normal Probability Plot for RESIDUALS


99.9
99
95
percentage

80
50
20
5
1
0.1
-15 -10 -5 0 5 10 15
RESIDUALS

Ejercicio: Proponer la transformacin adecuada para estos datos y realizar el anlisis con la
escala transformada. Emplee el Statgraphics.
73

Se puede observar en la grfica de residuos contra niveles del factor, que las varianzas no
son homogneas, esto se puede confirmar con la prueba de Bartlett o la de Levene. El valor
p asociado al estadstico de la prueba de Bartlett es de 0.0000589, que si aplicamos el
criterio de Anderson, es candidato a una transformacin.
La pregunta ahora es existe una transformacin adecuada para este conjunto de datos?. Ya
se ha dicho que si el patrn observado en la grfica de residuos contra valores predichos es
del tipo de megfono, entonces s existe una transformacin adecuada para ese conjunto de
datos.

Se pueden probar distintas transformaciones que incluyan: logaritmo, raz cuadrada,


elevacin al cuadrado o arco seno; la eleccin de cul sera la ms adecuada se hace
basndonos en:
1) El tipo de datos de que se trate: si son porcentajes, tasas, conteos.
2) Patrn de comportamiento de la varianza respecto a la media, es decir observando la
grfica de residuos contra el valor predicho.
3) Si la respuesta es resultado del efecto multiplicativo o aditivo de otros factores,
4) La simetra o asimetra de la distribucin
5) En regresin, la relacin que guardan la variable dependiente y la independiente.

Si observamos la grfica de residuos contra valores predichos (medias de los tratamientos,


en este caso), se puede ver que la varianza disminuye conforme se incrementa la media. Es
decir es un megfono con la parte ms angosta en el lado derecho: la elevacin al cuadrado
estabiliza la varianza cuando sta disminuye con la media y normaliza cuando la
distribucin de residuos est negativamente sesgado.

Probemos pues transformar la variable elevando al cuadrado los valores de y. A


continuacin presentamos la salida del Statgraphics.

Anlisis de la Varianza
------------------------------------------------------------------------------
Fuente Sumas de cuad. g.l.. Cuadrado Medio Cociente-F P-Valor
------------------------------------------------------------------------------
Entre grupos 1.35969E8 2 6.79846E7 134.90 0.0000
Intra grupos 1.36069E7 27 503959.0
------------------------------------------------------------------------------
74

Total (Corr.) 1.49576E8 29

Contraste de Varianza

Contraste C de Cochran: 0.773037 P-valor = 0.000875815


Contraste de Bartlett: 1.65825 P-valor = 0.0014937
Contraste de Hartley: 11.9315
Test de Levene: 6.226 P-valor = 0.00597694

Tabla de Medias para rendim^2 segn fertiliz


con 95.0 intervalos de confianza
--------------------------------------------------------------------------------
Error Estndar
fertiliz Frec. Media (s agrupada) Lmite inf. Lmite sup.
--------------------------------------------------------------------------------
1 10 10631.7 224.49 10171.1 11092.3
2 10 5599.9 224.49 5139.28 6060.52
3 10 6930.0 224.49 6469.38 7390.62
--------------------------------------------------------------------------------
Total 30 7720.53

Contraste Mltiple de Rango para rendim^2 segn fertiliz

--------------------------------------------------------------------------------
Mtodo: 95.0 porcentaje LSD
fertiliz Frec. Media Grupos homogneos
--------------------------------------------------------------------------------
2 10 5599.9 X
3 10 6930.0 X
1 10 10631.7 X
--------------------------------------------------------------------------------
Contraste Diferencias +/- Lmites
--------------------------------------------------------------------------------
1-2 *5031.8 651.411
1-3 *3701.7 651.411
2-3 *-1330.1 651.411
--------------------------------------------------------------------------------
* indica una diferencia significativa.

Se puede observar que existe efecto de los fertilizantes sobre el rendimiento 2 del trigo; o
existe diferencia entre fertilizantes cuando el rendimiento se ha transformado elevndolo al
cuadrado.

Se puede ver con las pruebas de varianzas para checar el supuesto de homocedasticidad que
aunque se rechaza la hiptesis de homocedasticidad a un nivel de 0.05, si nos apegamos al
criterio citado por Anderson, tanto la prueba de Bartlett como la de Levene, el nivel de
probabilidad se ha incrementado a un valor mayor que 0.001. Podemos hacer caso incluso a
la prueba de Bartlett ya que la normalidad se cumple como puede verse en la grfica de
probabilidad normal. El valor del residuo sospechosamente atpico: 1999 puede
estandarizarse o transformarse a un puntaje z ( o residuo estandarizado):
75

x
z

y ij i .
z
CM E
eij
z
CM E
1999
z 2.81
503959

para ver si realmente se trata de un valor atpico o no, y como puede verse queda
comprendido entre -3 y +3 como dira la regla emprica y no puede considerarse atpico; los
dems puntos de la grfica de probabilidad normal s se aproximan a una lnea recta por lo
que se cumple la normalidad y por consiguiente tambin la prueba de Bartlett es vlida para
verificar el supuesto de homogeneidad de varianzas.
Grfico de Residuos para rendim^2
residuo

(X 1000)
2

-1

-2
1 2 3

fertiliz

Grfico de Residuos para rendim^2


residuo

(X 1000)
2

-1

-2
5500 6500 7500 8500 950010500
11500
rendim^2 predicho

Grfico de Probabilidad Normal


porcentaje

99.9
99
95
80
50
20
5
1
0.1
-2 -1 0 1 2
(X 1000)
RESIDUALS2

Las pruebas de comparacin mltiple arrojan los mismos resultados, es decir existen
diferencias entre todas las medias.
76

NOTA:
Para decidir finalmente sobre una transformacin se puede realizar el anlisis con y sin
transformacin. Si las conclusiones no cambian entonces los presentamos de la manera en
que sean ms interpretables en la vida real, usualmente, la escala original.

Cuando se realiza un experimento debido a que se trabajan con muestras, es posible que si
para una muestra funcion una determinada transformacin, sta puede no ser la vlida al
realizar de nuevo el experimento con otra muestra.

En nuestro ejemplo debido a que con los dos anlisis llegamos a las mismas conclusiones
podemos dejar el anlisis con los datos originales porque son ms fcilmente interpretables,
la prueba de Levene con los datos originales no justifica una transformacin de datos y no
se tiene una idea de la distribucin terica de este tipo de datos que sugieran una
transformacin.
77

Comparaciones Mltiples
Cuando se realiza un experimento, se est interesado no slo en saber si existe un efecto
significativo del factor, sino una variedad de cuestiones que pueden resolverse utilizando
pruebas de comparacin mltiple: por ejemplo, nos puede interesar averiguar si al incrementar
la dosis de un frmaco, incrementa o no la mejora de cierto sntoma, o nos interesa comparar
distintas formulaciones presentes en el mercado contra una nueva propuesta, o bien puede
interesarnos en comparar dos dietas bajas en fibras contra tres altas en fibras. Es decir, no
limitarnos meramente a comparar parejas de medias, sino grupos de medias.

Existen dos formas principales, a priori cuando el investigador se interesa en averiguar si


existe diferencia entre tratamientos elegidos por l y el anlisis de varianza slo le sirve para
tener una estimacin del error, o bien a posteriori que puede ser averiguando si existen
diferencias entre aqullas medias sugeridas por los datos, o bien comparando todos los
posibles pares de medias una vez que se ha rechazado la hiptesis nula.

Se puede estar interesado en comparar parejas de medias y para ello no es necesario hacer
un anlisis de varianza basta con una prueba de hiptesis y la prueba t pertinente. El nivel
de significacin da cada comparacin (de cada hiptesis) es o probabilidad de cometer el
error tipo I (Rechazar Ho dado que es verdadera), o decir que las dos medias son distintas
cuando realmente son iguales. Al nivel de significancia se le llama nivel de significancia
por comparacin.

Otra forma de probar las diferencias entre parejas de medias es a travs intervalos de
confianza para diferencias de medias, recordemos que si el intervalo contiene al cero,
decimos que esas medias son iguales ya que el 95% de las veces la diferencia entre ellas
puede ser nula. El intervalo de confianza para una diferencia de medias es pues, una
alternativa a la prueba t.
La ventaja de los intervalos es que de acuerdo a los signos (+ o -) nos dice qu medias son
ms grandes o ms chicas. Asimismo el ancho del intervalo de confianza nos dir si una
prueba es conservadora y slo detecta las diferencias grandes, o sensible (potente) si detecta
las muy pequeas diferencias.

Tasas de Error

Una cuestin muy importante al realizar las comparaciones mltiples es el nivel de


significancia con el que se trabaja.
Cuando se realiza una comparacin a priori, se respeta el nivel de significancia de la prueba
individual si se cumplen los supuestos. Pero cuando se realiza ms de una prueba con el
mismo conjunto de datos, el nivel con el que se trabaja no es el que corresponde a sino que
es mucho ms grande que el nivel establecido para cada prueba.
Si se realizan comparaciones independientes de parejas de medias cada una con un nivel
(error por comparacin) la probabilidad de no cometer error en una sola prueba es 1 - , y si
se realizan m comparaciones independientes cada una con su nivel , entonces la probabilidad
de no cometer error en ninguna de las comparaciones es (1-)m. La probabilidad de cometer al
menos un error tipo 1 es 1 - (1-)m.
78

Bajo Ho, es decir cuando las medias de tratamiento son iguales, y al hacerse una familia de
comparaciones no planeadas entre parejas de medias, la probabilidad de declarar al menos un
par de tratamientos diferente la proporciona la tasa de error experimental o error del
experimento.
Bajo H0 la probabilidad de cometer el error tipo I para cualquier prueba es y la probabilidad
de concluir correctamente es (1-). Cuando se tienen k tratamientos y se realizan
k k k 1
comparaciones por parejas, existen m comparaciones posibles. Por lo que se
2 2
pueden cometer x errores tipo I (donde x = 0, 1, 2, 3, 4, 5 o 6). La probabilidad de cometer x
errores tipo I:
n! ( 0)
P x x 1 n x
x! ( n x )!

La probabilidad de no cometer el error tipo I es P(0)


n! ( 0)
P 0 x 1 n x 1 n x
x! ( n x )!

La probabilidad de cometer al menos un error tipo I en el conjunto de comparaciones es P


(x1) = 1 P (X=0)

P ( x 1) 1 1
n x

En resumen, si se est trabajando con k medias y se contrastan k-1 contrastes independientes


(ortogonales) la tasa de error para cada uno de estos contrastes es:
E = 1-(1-)k-1
k-1= m .
donde E es la probabilidad de cometer el error tipo I en el experimento completo y es la
probabilidad de cometer el error tipo I en una comparacin y k-1 es el nmero de
comparaciones independientes u ortogonales.

Esta tasa de error se incrementa con el nmero de comparaciones a hacer, m. Tambin se le


conoce como tasa de error familiar y se aplica este trmino cuando slo un subconjunto del
experimento entero se analiza, en trminos de m pruebas y el experimentador desea controlar
la tasa de error para ese subconjunto de pruebas, en este caso se refiere a la probabilidad de
cometer el error tipo I para la familia de inters.
La familia es una coleccin de inferencias para los cuales es significativo tomar en cuenta la
medicin total del error. Por ejemplo la coleccin de todas las comparaciones por parejas es
una familia, donde la medicin del error total es la probabilidad de encontrar al menos un error
tipo I. (Rafter et al, 2002).
Qu familias de comparacin se eligen para analizar? Depende del tipo de investigacin, si es
confirmatoria, en la cual se especifican un nmero finito de comparaciones antes del estudio.
O si se trata de una investigacin exploratoria donde las comparaciones se eligen una vez
observados los datos.
79

Cuando las comparaciones son independientes la tasa de error experimental o por familia es
igual a 1 (1-)m, pero si no son independientes la tasa de error es :
1 (1-)m.
Suponga que se eligi un nivel de 0.05 y son seis medias. Si las seis medias son iguales la
probabilidad de rechazar incorrectamente una o ms comparaciones ortogonales es:
E = 1-(1-0.05)5= 0.23 que es un valor cinco veces ms grande que el nivel establecido para
cada prueba. Si uno desea un nivel de 0.05 para el conjunto de los 5 contrastes, el nivel de
cada contraste debe ser: =1-(1-0.05)1/k-1
=1-(1-0.05)0.2=0.01.
La tasa de error por familia es la probabilidad de cometer al menos un error tipo I en las m
comparaciones.
Si quisiramos saber el error total que cometemos al hacer las m comparaciones bastar con
obtener la tasa de error experimental o por experimento que es igual a (m) (c.). Si por
ejemplo con tres tratamientos corremos todas las comparaciones por parejas posibles, que
seran tres, cada una con un nivel de 0.05, terminaremos con un nivel final (probabilidad de
cometer el error tipo I) de 0.15 o 15% de tasa de error experimental.

Se puede comprobar que las tres tasas de error, por comparacin, por familia y experimental
guardan la siguiente relacin:

c <FW < PE

Existen mtodos de comparacin mltiple que controlan la tasa de error experimental: el


mtodo de Bonferroni y el de Tukey. Otras pruebas como la DSM, la de Duncan y la de
Newman Keuls no controlan la tasa de error experimental. Por otro lado cuando la
comparacin es planeada se supone que se respeta el nivel con el que se trabaja y por tanto
s se controla la tasa del error experimental.

Los mtodos de comparacin mltiple que mantienen la probabilidad para el conjunto de


comparaciones que se realiza, independientemente del nmero de comparaciones, son pruebas
exactas o conservadoras y son la Scheff, la de Tukey y Contrastes. No inflan la probabilidad
del error tipo I.

Cuando se aplican comparaciones sugeridas por los datos se incluyen ms grados de


libertad que el nmero de grados de libertad de tratamientos, por lo que debe tenerse cuidado
en el procedimiento de prueba.

Los mtodos de comparacin mltiple slo nos dicen qu medias o grupos de medias son
iguales o diferentes, pero no nos dicen en qu magnitud son diferentes, de ah que algunos
procedimientos tambin ofrecen los intervalos de confianza que ya informan la magnitud de
las diferencias.

Otro concepto importante por considerar es la potencia de una prueba que es una medida de
su capacidad para identificar diferencias. Las pruebas ms potentes detectan las ms
80

pequeas diferencias entre medias. Las pruebas ms potentes tendrn los intervalos ms
pequeos o estrechos.

Las pruebas ms conservadoras son Scheff, Contrastes y Tukey (stas son exactas), le
siguen Bonferroni, y las ms sensibles o potentes son Student Newman Keuls, diferencia
significativa mnima (DSM) y Duncan. stas no se recomiendan ya que inflan la
probabilidad de cometer el error tipo I. O se pueden usar bajo ciertas condiciones que se
especificarn cuando se hable de las pruebas. Otras pruebas potentes que se han
desarrollado ltimamente y que no inflan la probabilidad del error tipo I son la de Ryan y la
de Peritz.

Cuando se eligen pruebas de comparacin es importante investigar su potencia o capacidad


para detectar diferencias entre medias o conjuntos de medias.

Algunas pruebas pueden hacerse en un solo paso, es decir sin necesidad de que la F total haya
sido rechazada. No es condicin necesaria el rechazo de esta hiptesis total para realizar la
prueba. Pero es costumbre hacerla para obtener una estimacin del CME. stas son:
Tukey
Tukey Kramer
Dunnett
Scheff
Bonferroni
idk (Shedok)
Un investigador quien debe rechazar la H o total antes de usar un Mtodo de Comparacin
Mltiple (MCM) est usando un procedimiento de dos pasos y puede perder ???un resultado
importante (Rafter, et al, 2002).
Las otras se realizan por pasos, comienzan por probarse la hiptesis total, y si se rechaza
entonces se realiza el segundo paso que es la prueba.
DSM de Fisher
Student-Newman-Keuls (SNK)
Duncan

Los MCM tambin pueden clasificarse de acuerdo al nmero de medias o combinaciones de


medias que se contrastan.
Comparaciones por parejas: Que consiste en contrastar parejas de medias, ya sea que se
k
comparen todas parejas o slo un subconjunto de ellas. Cuando se comparan todas las
2
parejas de medias la ms conveniente es la de Tukey por ser exacta o conservadora.
Todas las comparaciones: Tukey
Subconjunto de comparaciones: GT2, Dunn idk, Bonferroni.

Comparaciones de grupos de medias


81

Mtodo de Bonferroni
Este mtodo se emplea para probar diferencias planeadas (a priori) entre parejas de medias o
combinaciones lineales de medias y declara que un par de medias es diferente con un nivel
/m si:
tij t N a , / 2 m ,
Donde, m es el nmero de comparaciones por parejas a ser probadas. Puede verse que esta
prueba controla la tasa de error experimental en asignndole un valor c ms pequeo.
Tambin se usa a posteriori.
Como es una prueba que se aplica a priori no requiere rechazo de H o en la tabla de anlisis de
varianza, es ms puede realizarse antes del anlisis, pero realmente se hace despus porque del
anlisis de varianza se toma el CME.
Como puede verse el estadstico de prueba es idntico al de una prueba t para comparar
medias pero el criterio de rechazo cambia, el valor de de esta prueba es ms pequeo que el
de una prueba t .
Para cualquier par i, j declaramos que ti es diferente de tj si se satisface la ecuacin anterior. La
probabilidad de rechazar alguna de las hiptesis dado que las medias son iguales es igual a
/m. Por lo que la probabilidad de cometer el error tipo I (experimental) cuando son las
medias iguales es a lo mucho .
y y j. ( 0)
tij i.
2CM E
n

ste estadstico puede comparar todas las parejas de medias sin inflar el error tipo I
controlando el nivel de cada comparacin.
Si se trata de otro tipo de comparacin o de un contraste el estadstico de prueba es:

c y i i
tij i 1
cuando ni = nj
CM E k

n
c
i 1
2
i

y
k

c y i i
tij i 1
para casos desbalanceados
ci2
k
CM E
i 1 ni

Aplicando la prueba de Bonferroni para comparar todas las parejas de medias


Esta prueba debe usarse cuando el nmero de comparaciones excede al nmero de grados de
libertad entre tratamientos.
82

Para diseos de un factor, es mejor usar la prueba de Tukey, pero cuando no se aplica, el
mtodo de Bonferroni es la opcin. El Statgraphics tambin grafica los intervalos de confianza
de Bonferroni, que son intervalos para diferencias de medias tal que si un par de medias es
diferente, el intervalo cuantifica qu tan diferentes son.

Si se hacen todas las comparaciones pareadas la prueba de Tukey es superior al de Bonferroni


conduciendo a intervalos ms estrechos. Si no se hacen todas las comparaciones pareadas, el
procedimiento de Bonferroni es mejor. Se utiliza para casos balanceados como para
desbalanceados.

El margen de error depende del nmero de comparaciones y no del nmero de tratamientos.

Ejercicio
Aplique el mtodo de Bonferroni para comparar todos los pares de medias del ejercicio de
los fertilizantes.
103.1 74.5 28.6 28.6
t 13.62
22.04 2
10

1 1
2

4.41 2.10

103.1 83.2 19.9


t 9.48
22.04 2
10

1 1
2

2.10

83.2 74.5 8.7


t 4.14
22.04 2
10

1 1
2

2.10

Este valor se compara con t0.05 2 ( 3), 27 2.55 y debido a que todos los estadsticos de
prueba resultaron mayores que 2.55 entonces se rechazan las pruebas de las tres
comparaciones cada una con una probabilidad de 0.017 y el conjunto de las tres
comparaciones con un nivel de probabilidad de 0.05.

Los intervalos de confianza de Bonferroni en el ejemplo se obtienen con el error estndar


del contraste:
( 0)
CM E k

. . contraste ci2
n i 1

cuando los tamaos son iguales. Aplicando en el ejemplo:

. . contraste
22.04 2
10

1 1 2.10
2

1 vs 2 : 28.6 2.55( 2.10) 23.25, 33.95
1 vs 3 : 19.9 2.55( 2.10) 114 .55, 25.25
2 vs. 3 : 8.7 2.55( 2.10) 3.35, 14.05
83

Se recomienda para pruebas a priori ms que a posteriori, es muy conservadora ya que a lo


ms se corre el riesgo de cometer el error tipo I de . Es poco sensible a las diferencias
pequeas o tiene poco poder.

Dunn-idk
Es ligeramente ms potente que la de Bonferroni.
Se emplea:
'
1
2

1 1 c
1
( 0)

El intervalo es ms estrecho que el de Bonferroni.

Diferencia Significativa Mnima (D.S.M)


El mtodo de DSM es una prueba t de Student que utiliza una varianza mancomunada
del error.
Se basa en la comparacin de las diferencias entre medias contra un valor crtico llamado
DSM, diferencia significativa mnima:
2CM E ( 0)
t( /2,N -a)
n

si el valor absoluto de la diferencia entre algn par de medias es mayor que esta DSM
entonces se dice que la diferencia es significativa.

En el ejemplo,

2(22.04)
DSM 2.052 4.31
10

1 vs. 2 = 103.1-74.5 = 28.6 > DSM


1 vs. 3 = 103.1-83.2 = 19.9 > DSM
2 vs. 3 = 74.5 83.2 = 8.7 > DSM

Para expresar el resultado, es muy comn ordenar las medias de menor a mayor y subrayar
aquel par o grupo de medias que son iguales. En el ejemplo, como las tres medias son distintas
no se subraya ninguna de las tres medias.

74.5 83.2 103.1

El punto crtico en las comparaciones mltiples es el nivel de significacin , aunque


se haga pequea la probabilidad de rechazar Ho verdadera para la prueba como un todo, la
probabilidad de rechazar por lo menos una Ho verdadera cuando se prueban parejas de medias
es mayor que . Por esto la prueba DSM infla el error tipo I (probabilidad de rechazar H o dado
que Ho es verdadera), y se aplica mejor cuando se realiza a posteriori, es decir una vez que se
84

ha descubierto diferencia significativa en el anlisis de varianza, esta es una manera de


protegerse contra este error tipo I. En dos situaciones puede emplearse DSM en las que el
nivel de significancia se sostiene: cuando se aplica a priori, por ejemplo si se quiere comparar
un tratamiento con un control, y cuando se comparan las medias ordenadas- adyacentes. Y
hay dos situaciones donde el uso de DSM no es legal desde el punto de vista terico: cuando
se hacen comparaciones sugeridas por los datos, por ejemplo cuando comparamos la media
ms grande con la ms pequea y cuando se hacen todas las comparaciones posibles de
medias. En resumen, se puede aplicar correctamente si cada media se compara contra un
control porque as se plane, o bien, se ordenan las medias y se comparan las adyacentes, es
decir, la segunda ms grande contra la primera, la tercera contra la segunda, la cuarta contra la
tercera. En cualquiera de estos casos el nmero mximo de comparaciones legtimas est
limitado al nmero de grados de libertad de los tratamientos y as el nivel alfa se respeta.

En algunos casos el investigador puede desear hacer todas las comparaciones entre todos los
pares de medias, es decir a(a-1)/2 comparaciones que es mayor que a-1 comparaciones
independientes. Sea como sea cuando comparamos dos medias o cometemos el error tipo I
diciendo que las medias son iguales cuando no lo son y la tasa en la cual este error se comete o
probabilidad de cometer el error tipo I es y se llama nivel de significancia para la
comparacin y el error tipo II, que es el error de decir que son iguales cuando son diferentes y
la tasa del error la da . La probabilidad de que el procedimiento de comparacin detecte una
diferencia real cuando sta existe es la potencia de la prueba y es 1 , y se ver despus de
esta seccin. Como ya se ha dicho si se usa DSM para hacer todas las comparaciones posibles
la probabilidad de cometer el error tipo I puede no ser el nivel elegido y se infla por lo que se
recomienda usar una de las pruebas siguientes: DSM protegida, la de Tukey o diferencia
honestamente significativa y la de Student-Newman-Keuls. La DSM protegida emplea la
DSM estndar contra la cual se contrastan las comparaciones por parejas una vez que la
prueba F ha sido declarada significativa, de esta manera se protege contra el error tipo I

Suponga que se emplea correctamente la DSM, se puede observar que en la frmula se


emplea el CME pues uno de los supuestos del anlisis es que se tiene una varianza comn.

Recomendaciones:

Cuando a = 3 (hay 3 comparaciones)


DSM protegida
En caso de que a > 3 comparar nicamente las medias adyacentes que se han
ordenado de menor a mayor
Contra un control.

Una vez comparadas las parejas de medias se construyen los intervalos de confianza DSM que
se construyen sumando y restando a cada media el valor DSM/2. Cualquier par de intervalos
que no se superpongan se dice que son diferentes estadsticamente. Tambin pueden
construirse intervalos para diferencias de medias; cualquier intervalo de diferencia de medias
que contenga al cero, significa que esa pareja de medias no presentan diferencia significativa.
As, si un par de medias se declar diferente por DSM, se puede conocer entre qu valores
descansa la diferencia que result significativa.
85

Nota: A veces esta prueba conduce al no rechazo de la hiptesis que contrasta las parejas de
medias cuando la F s condujo al rechazo de Ho. La F prueba todas las comparaciones
posibles no slo por parejas sino combinaciones lineales de las medias.

Tarea
Construya los Intervalos de Confianza DSM para las medias y para las diferencias entre
medias Qu puede decir de las medias?

Cuando las comparaciones se planean antes de realizar el experimento, el nivel o


probabilidad de cometer el error tipo I es el que corresponde al elegida pues se respeta la
aleatoriedad;, en el caso contrario todava se pueden hacer comparaciones, sin embargo este
valor se altera debido a que tales decisiones no se toman al azar. El mejor caso es el primero,
es decir planear las comparaciones y asegurarnos del nivel o probabilidad de cometer el
error tipo I.
Se recomienda utilizar estos contrastes cuando su nmero no exceda a a-1 y si el nmero de
contrastes excede a este valor entonces es preferible la prueba de Bonferroni.
Uno de estos mtodos hace uso de los Contrastes.
Un contraste es una combinacin lineal de totales o medias de tratamiento que reflejan las
comparaciones que se quieren realizar.
C = c1 y.1. + c2 y2.+ ... + cj yi. ( 0)

donde ci son los pesos o coeficientes del contraste,


yi. son los totales
a ( 0)

c y .
i=1
i i

con la condicin de que ci = 0

Realmente un contraste se define como una combinacin lineal de los efectos de los a
tratamientos con tal que la suma de los coeficientes da cero.

Es decir,

a
ci i
i 1

De aqu que:

c i i ci y i. y.. ci y i. y.. ci ci y i.
86

Los contrastes simples consisten en comparaciones de parejas, en contraposicin a contrastes


complejos que involucran comparar grupos de medias o grupos de medias contra medias
simples.

Pero cuando el tamao de muestra es igual, es mejor trabajar con totales que con
promedios.

En el ejemplo de los fertilizantes, suponga que el investigador antes de iniciar su experimento


se formula estas dos preguntas:
Difiere el sulfato de amonio de la ciamida?
Difiere el sulfato de amonio y la ciamida de la dietanolamida?
Responder la primera cuestin es otra forma de decir que se quieren comparar las medias 1 y
2. Expresando lo anterior a modo de contraste:
C = y1. - y2. + 0 y3.
C = y1..-y2.
se observa que ci= 1 -1 + 0 = 0, luego entonces es un contraste.
Para responder la segunda cuestin es otro modo de decir que se desea comparar los totales
del sulfato de amonio y la ciamida contra el total del fertilizante dietanolamida, entonces el
tercer tratamiento se pondera con un factor de 2 con el objeto de balancear el contraste.
D = 1 y1. + 1 y2. - 2y3.
ci = 1 + 1 - 2 = 0
El primer paso consiste en calcular el valor de los contrastes y luego, a cada contraste se le
asocia una suma de cuadrados con 1 grado de libertad.
( 0)
a
( ci yi.. )2
i=1
SCC = a
n ci2
i=1

para diseos no balanceados:


( 0)
a
( ci yi.. )2
i=1
SCC = a

ni c i
i=1
2

Las sumas de cuadrados de los contrastes se distribuyen como con un grado de libertad.
87

Por qu 1 grado de libertad?


Un contraste tambin puede definirse como una diferencia de medias o de grupos de medias;
si son grupos de medias y se trata de una diferencia, necesariamente son dos grupos de medias,
entonces 2 -1 = 1 grado de libertad para cada contraste.
Las sumas de cuadrados entre sus respectivos grados de libertad constituyen los cuadrados
medios, por lo que el cuadrado medio de un contraste es igual a la suma de cuadrados del
contraste.
Para probar si este contraste es significativo o no, cada contraste se compara con el cuadrado
medio del error, y como el estadstico de prueba se trata de un cociente de dos variables
aleatorias distribuidas como entonces el estadstico se distribuye como una prueba F con
sus respectivos grados de libertad, es decir,
.
CM c/CMF se distribuye como F (1,N-a).

En el ejemplo:
C1 = y1. - y2.
C1 = 1031-745 = 286
D = y1. + y2. - 2y3.
= 1031 + 745 - 2(832) = 112

Las sumas de cuadrados:


SCC = (286)/10(2) = 4089.8
SCD = 112/ 10(6) = 209.067

Para averiguar si estos contrastes son significativos entonces:


FC = (4089.8/1)/22.04 = 185.5878

FD = (209.067/1)/22.04 = 9.48

Si se comparan con F0.05. (1, 27) = 4.21


Ambos contrastes son significativos, en especial el contraste C, es decir existen diferencias
entre el tratamiento 1 y el 2.

Algunos autores prefieren utilizar las medias en lugar de los totales; el utilizar medias o
totales har que difiera el valor del contraste. Si se calcula el contraste con el valor del total, el
contraste exceder del calculado con las medias, por un factor de n.

En nuestro ejemplo, el contraste C utilizando medias es igual a 28.6 y el contraste utilizando


totales es igual a (10) 28.6, es decir, 286.

La suma de cuadrados utilizando las medias sera igual a:

n contraste
2
(10)28.6 2
SC a
4089.8
2
c
i 1
2
i
88

que es la misma que se obtuvo cuando se calcularon las SC del contraste del total.

Pruebe que la suma de cuadrados del segundo contraste utilizando las medias es igual a la
suma de cuadrados del segundo contraste utilizando los totales.

La desventaja de construir muchos contrastes es que muchos de ellos sern redundantes o


estarn correlacionados.

Lo ideal es construir contrastes independientes, es decir que uno no se relacione con


otro: se puede probar cada contraste como pruebas independientes del cuadrado medio del
contraste con el cuadrado medio del error; se dice entonces que los contrastes son
ortogonales.

Contrastes Ortogonales
Un caso especial de contrastes son los contrastes ortogonales. Dos contrastes
a ( 0)
C = ci yi.
i=1

Y
a ( 0)
D = d i yi.
i=1

son ortogonales si y slo si:


a ( 0)
ci d i = 0
i=1

o en el caso desbalanceado
a

n c d = 0
i=1
i i i

El nmero de contrastes ortogonales en una prueba es igual a a-1 contrastes, es decir es


igual al nmero de grados de libertad entre tratamientos (nmero de trminos independientes).
Por lo tanto, las pruebas de contrastes ortogonales son independientes.

Por ejemplo,

C = y1. - y3.
D = 2y2. - (y1. + y3.)
89

c1 c2 c3
C 1 0 -1
D -1 2 -1
cidi -1 0 1
cidi =0

luego entonces estos contrastes son ortogonales. El trabajar con estos contrastes le proporciona
fuerza a la prueba por la caracterstica de independencia.

Las ventajas de trabajar con contrastes ortogonales son:


1.- Son independientes, es decir no estn correlacionadas las estimaciones de los diferentes
contrastes.
2.- Existen tantos contrastes como grados de libertad entre tratamientos.
3.- Las suma de cuadrados de los contrastes ortogonales es igual a la suma de cuadrados de los
tratamientos.

Los contrastes construidos anteriormente, son contrastes ortogonales. Cuando los contrastes
son ortogonales, la variabilidad expresada en la suma de cuadrados de tratamiento est
comprendida por la variabilidad expresada en contrastes ortogonales, por lo que la suma de las
sumas de cuadrados de los contrastes ortogonales es igual a la suma de cuadrados de
tratamiento; de la misma manera, la suma de los grados de libertad de los contrastes es igual a
los grados de libertad de los tratamientos, y esto nos confirma que las comparaciones
ortogonales realmente s son independientes y no nos dan informacin redundante (o
correlacionada).

En el ejemplo, pruebe que la suma de las sumas de cuadrados de los contrastes ortogonales
es igual a la suma de cuadrados de fertilizantes.

Existen en los textos tablas con los coeficientes para construir contrastes ortogonales.

Puede suceder que la F total no haya sido significativa pero algunos contrastes si lo
sean, esto resulta cuando uno o dos de los contrastes son significativos pero los otros no.
Cuando se totalizan las sumas de cuadrados de los efectos los contrastes no significativos
diluyen los significativos produciendo efectos no significativos en la tabla de anlisis de
varianza Tambin es posible tener una F total significativa pero que las comparaciones hechas
no lo sean.

Prueba de Scheff (A posteriori)


Esta prueba emplea contrastes y puede usarse tanto para comparaciones planeadas
como para despus del anlisis de varianza o no planeadas y que son sugeridas por los datos.
Cuando son muchos contrastes que se proponen a priori.
Cuando son contrastes sugeridos por los datos y los contrastes son complejos.
Generalmente se aplica a posteriori (sugeridas por los datos). Se utiliza a priori cuando el
nmero de comparaciones es grande. Puesto que el mtodo de Scheff puede emplearse para
90

un juego grande de contrastes no necesariamente ortogonales-, se requiere que la diferencia


est muy marcada para que sta pueda detectarse; por eso se dice que la prueba es
conservadora. Por esta misma razn protege contra el error tipo I ya que a lo ms se trabaja
como mximo con de nivel de significancia (en especial cuando las comparaciones se
sugieren con los datos). Es decir, el valor de alfa elegido es el nivel de significancia total.
Debido a que solo detecta las diferencias grandes entre medias puede accidentalmente no
rechazarla y declarar dos medias o grupos de medias iguales cuando realmente son diferentes.
Se puede utilizar para comparar todas las parejas de medias pero tiene intervalos de confianza
ms anchos que los de Tukey, por lo que la prueba de Scheff es ms conservadora que la de
Tukey.

La prueba consiste en:


1.- Construir los contrastes que se quieren probar
2.- Calcular el error estndar correspondiente a cada contraste.
( 0)
a 2
c
SC C = CM E
i

i=1 ni

3.- Calcular el valor de Scheff contra el cual debe compararse.


S SCH = SCC (a - 1) F ,a -1,N -a ( 0)

4.- Si el contraste C es ms grande que el nmero de Scheff correspondiente entonces el


contraste es significativo.

En el ejemplo:
Probar Ho: 2 2 = 1 + 3.
El contraste C = 2 2 - 1 - 3
y1.= 103.1
y2.= 74.5
y3.= 83.2
C = -1(103.1) + 2(74.5) -1(83.2)
C = 37.3
2.- Calcular el error estndar del contraste
2 2 2
2 + (-1) + (-1)
S C = 22.037
10

Sc = 3.6362
3.- Calcular el Nmero de Scheff:
SSCH = 3.6362 [(3-1)F2,27] = 9.4121
91

4.- Comparar el contraste contra el nmero anterior:


37.3 >> 9.4121
Entonces se rechaza Ho. Lo que significa que la suma de los efectos de los tipos de f
fertilizantes, sulfato de amonio y dietanolamida son diferentes del efecto de la ciamida.

El intervalo de confianza de Scheff se obtiene con:


( 0)
k a 2
c
i1 i i
c y a 1 F ;a 1, N a CM E
i=1 ni
i

Ntese que el margen de error depende del nmero de medias en el experimento y no del
nmero de contrastes.

Ejercicio:
Obtenga los intervalos de confianza de Scheff para el contraste anterior.

Ejercicio (Castao y Domnguez, 2001)

En un proceso industrial se usan las maltodextrinas como sustituto de grasas en la


elaboracin de galletas o en harinas preparadas. Un ingeniero bioqumico produce
maltodextrinas a partir de semillas de amaranto, tiene inters en comparar las protenas que
se obtienen de su producto con otros tres productos d maltodextrina que generan los
siguientes procedimientos; 1) comerciales, 2) almidn de maz y 3) almidn de yuca.
1) Tiene mayor contenido de protena la maltodextrina elaborada con semilla de amaranto
con referencia a las otras tres?
2) La maltodextrina producida con semilla de amaranto contiene mayor protena que la
comercial?
3) La protena contenida en la maltodextrina elaborada con semilla de amaranto es mayor
que la producida con los almidones?

Tratamiento Amaranto Comercial a. maz a. yuca


Media 34.5 30.0 34.0 27.0
varianza 3.3 9.0 7.0 7.0

La tabla de anlisis de varianza se presenta a continuacin:

Fuente de Variacin Grados de Suma de Cuadrados FC


libertad cuadrados medios
Tratamiento 3 113.06 37.69 5.74
Error 8 52.5 6.56
Total 11 165.56
92

La prueba de Scheff es la prueba ms conservadora o menos poderosa. Pero es ms


potente que la prueba de Tukey para contrastes ms complejos (cuando se trata de caso
balanceado). Se sugiere emplear para contrastes complejos y para contrastes por parejas
con distintos nmeros de rplicas.
Prueba de Rango Mltiple de Duncan

Esta es una prueba que se aplica bien a posteriori. Se aplica una vez que se ha
rechazado la hiptesis nula de igualdad de medias; no es tan conservadora como la de
Scheff; y es de las ms potentes pues detecta diferencias menores entre tratamientos.
Esta prueba consiste en:
1) Ordenar las medias en forma ascendente
2) Determinar el error estndar que corresponde a cada promedio.
CM E ( 0)
Sy =
i..
n
3) Obtener los valores r (p,f) en la tabla de Duncan, donde
p = 2,3,...,a y f son los grados de libertad del error. Estos valores r(p,f) son valores crticos
con p medias ordenadas o pasos entre medias y f grados de libertad.
4) Se calcular entonces los valores Rp = r(p,f) Syi..
5) Se comparan entonces las diferencias entre medias contra los valores Rp.

Por ejemplo, suponga que desea realizar la prueba de Duncan para comparar los
distintos tipos de fertilizante. Se proporcionan las medias :

103.1, 74.5 y 83.2 respectivamente.


1. Ordenando las medias de menor a mayor
74.5 83.2 103.1
2. Calculando el error estndar:
22.04
1.48
10
3. Calculando los valores r27,0.05 y los Rp:
Valores P=2 P=3
rp 2.908 3.058
Rp 4.316 4.54

4. Comparando:
1 y 2= 103.1-74.5= 28.6> 4.54
1 y 3= 103.1-83.2= 19.9>4.316
2 y 3= 83.2-74.5=8.7>4.316
Todas las medias son diferentes por lo que se forman 3 grupos de medias:
74.5 83.2 103.1
Para casos desbalanceados:
93

a ( 0)
r= a
1

i=1 ri

Prueba de Newman-Keuls (NK)


Es un poco ms conservadora que la prueba de Duncan, es decir, protege del error
tipo I es menos potente y ms poderosa que la de Tukey y la de Bonferroni..
Operativamente es igual que la de Duncan pero se calcula con otra tabla de valores, q (p,f)
Sy...

Kp q ( p, f ) S yi .. ( 0)

ymax ymin
q
CM E
n
La diferencia necesaria para que se declare significativa vara con el grado de separacin de
las medias que se comparan. Las medias separadas por una media requieren diferencias ms
pequeas para significancia que las medias separadas por dos medias.
Al igual que la DSM el anlisis de varianza puede conducir al rechazo de H o pero ninguna
de las comparaciones por parejas en NK resulta una diferencia significativa.
Para aplicarla es recomendable ordenarlas de menor a mayor y comparar la ms grande
contra la ms pequea, Si estas medias son diferentes entonces la ms chica se contrasta
con la siguiente ms grande hasta alcanzar alguna prueba no significativa.
Es aproximada para casos desbalanceados.

Prueba de Tukey
Es muy parecida a la prueba de Diferencia Significativa mnima. Se calcula un solo
valor crtico para comparar todos los pares de medias. La tasa de error es a lo ms , por lo
que es conservadora y controla la tasa del error experimental. Emplea un estadstico
llamado rango e, q.
CM E ( 0)
T t i t j q ( , a , f )
n

a es el nmero de tratamientos y f los grados de libertad del error. Depende del nmero de
medias y no del nmero de comparaciones que se realicen. Ntese que depende del nmero
de tratamientos y no del nmero de comparaciones como la de Bonferroni. Los intervalos
de confianza se obtienen:

CM E
yi y j q( ,a , f )
n

Ntese que el margen de error es el mismo para cada comparacin, por lo que los tamaos
de los intervalos son iguales. Esta prueba es para casos balanceados; cuando los casos son
desbalanceados recibe el nombre de Tukey Kramer
94

La prueba de Tukey tambin sirve para contrastes. Si los tamaos de muestra son iguales el
intervalo de confianza es

CM E k ci
c y i i
q ( , a , f )
n i 1 2
Nota: Se sugiere utilizar preferiblemente para comparaciones por parejas y no contrastes
ms complejos.

Prueba de Tukey-Kramer

Si la prueba de Tukey es conservadora y a lo ms se comete un error tipo I de , el nivel de


probabilidad de rechazar dado que es verdadera, en esta prueba es ligeramente menor que
.. Es decir no protege tanto como la de Tukey..
Dos medias son distintas si el valor absoluto de sus diferencias es mayor a este valor
crtico.

1 1 1
T t i t j q ( , a , f ) CME
2 n
i nj

donde q es el cuartil superior de la distribucin de rango estudentizado con parmetros a


(k) y f (N-a, N-k) grados de libertad del error.

Los intervalos de confianza se obtienen:


1 1 1
T y i y j q ( , a , f ) CME
2 n
i nj

En el ejemplo,
1) Se ordenan las medias de mayor a menor

103.1 83.2 74.5


1 3 2

2) El valor del rango estudentizado es:

q 0.05,(3,27) = 3.5

22.04
3.5 5.20
10

Cualquier diferencia absoluta mayor que 5.20 es significativa.

1 vs. 2 = 28.6 > 5.20


95

1 vs. 3 = 19.9 > 5.20


3 vs. 2 = 8.7 > 5.20

Los intervalos de confianza para comparar una pareja de medias resultan de aplicar la
siguiente frmula:

yi y j T

El intervalo de confianza para la diferencia de 1 - 2 sera:

28.6 5.20 = [23.4, 33.8]


Como este intervalo de diferencia de medias no contiene al cero, entonces estas medias no
son iguales.

Nota: Se puede observar que es ligeramente ms estrecho que el intervalo de Bonferroni.

Si los intervalos de confianza para las diferencias de medias contienen al valor cero,
significa que esa pareja de medias no son diferentes.
La prueba de Tukey garantiza que todas las comparaciones tienen una tasa de error a lo ms
de .

Es el mtodo conservador ms efectivo entre los mtodos conservadores para el


anlisis de varianza de una va, el error tipo II es el ms pequeo ( o su intervalo de
confianza es el ms estrecho) y se recomienda utilizar, a menos que el valor crtico no est
en la tabla de rangos estudentizados. Comparado con el mtodo de Bonferroni este ltimo
es ms conservador que el de Tukey, y los intervalos de confianza simultneos de Tukey
son ms estrechos. A un nivel de 0.05 los dos mtodos arrojan resultados muy similares.

La prueba de Tukey y la de Tukey-Kramer pueden generalizarse para probar contrastes de k


medias.

Prueba de Comparacin de los tratamientos (k-1) contra un control. Prueba de


Dunnett.

Se emplea para comparar los tratamientos con un control. Debido a que el control tiene
mayor importancia el nmero de rplicas del control se recomienda que sea mayor,
aproximadamente n k 1 donde n es el nmero de rplicas de los tratamientos cuando se
ni
trata de diseo balanceado o bien k 1 si se trata de caso desbalanceado.
k

Se pueden probar la hiptesis de que al menos uno de los tratamientos difiere o bien la
hiptesis de una cola para probar que la diferencia entre las medias de tratamientos y la
media del control es menor o mayor a cero.
96

H 0 : i c
H1 : i c
H1 : i c 0
H1 : i c 0

El valor crtico para una prueba bilateral es


2CM E
d ;a 1, f si el caso es balanceado, o bien
n

1 1
d ;a 1, f CM E donde nc es el nmero de rplicas del control.
ni nc

Tarea: Investigue el mtodo de comparacin de k-1 tratamientos contra el mejor


tratamiento. Prueba de Hsu.

Cul prueba emplear?


Carmer y Swanson en experimentos de simulacin de Montecarlo concluyeron que
la prueba DSM es muy eficiente para detectar diferencias si se aplica hasta despus de la
prueba F (95%) ha sido significativa. La prueba de Duncan es muy potente para detectar
diferencias reales entre medias (Montgomery, 1991). Si se desean pruebas conservadoras
porque son pruebas en las que no se quiere fallar porque se tratan de vida, enfermedad,
entonces Tukey y Bonferroni son las pruebas de eleccin, siendo la prueba de Bonferroni la
ms conservadora.

Tarea: Leer el artculo Rafter John A., Martha L. Abell and James P. Braselton. Multiple
Comparison Methods for Means. (2002). SIAM Review Vol. 44, No. 2, pp. 259-278

Potencia de la Prueba. Tamao de la muestra


El tamao de la muestra se relaciona con la probabilidad de cometer errores en la prueba de
hiptesis. En general tiene sentido pensar que si se espera que existan grandes diferencias
entre tratamientos, se requerirn pocas rplicas para detectar estas diferencias; tambin si se
espera una gran variacin dentro de cada tratamiento, se espera que se requiera un gran
nmero de rplicas. Debido a que el tamao de muestra depende en gran parte a las diferencias
que se quieran detectar y stas se relacionan con uno de los errores (el tipo II) a continuacin
se recordar en qu consiste cada error.

Tipos de errores
En la toma de decisiones, al rechazar o no rechazar la hiptesis nula, se pueden
cometer dos tipos de errores. El error tipo I se refiere a la probabilidad de rechazar H o dado
que es verdadera y el error tipo II que sea la probabilidad de no rechazar Ho dado que Ho es
falsa.
97

La probabilidad de cometer el error tipo I se denota por y la probabilidad de cometer


el error tipo II por . El primero est bajo el control del experimento; el error tipo II puede ser
relativamente grande (0.25 o ms) pues si no se rechaza Ho dado que la hiptesis es falsa el
experimento puede repetirse. No rechazar Ho dado que es falsa, equivale a pensar que las
cosas siguen como se ha pensado hasta el momento (a pensar que no cambia nada) y eso no es
tan grave como decir que las cosas han cambiado cuando realmente siguen pasando como
hasta el momento.
En cambio si Ho es verdadera y se rechaza, esto puede ser grave por lo que debe ser pequeo
(0.01 o menos). Dado que el error tipo II es la probabilidad de no rechazar la hiptesis nula
dado que existe una diferencia entre las medias est entonces relacionado con qu tanta
diferencia est presente.

Potencia de la prueba ( )
La potencia de la prueba es la probabilidad de rechazar Ho dado que es falsa.
Decisin del experimentador Ho falsa Ho verdadera
Rechazar Ho = 1-
Decisin correcta
No rechazar Ho Decisin correcta
( 1- )

Bajo Ho verdadera, el criterio de decisin FC = CMTrat/CME se distribuye como una F central


con a-1, N-a grados de libertad, y se rechaza Ho cuando FC > F

Si el investigador rechaza Ho dado que es verdadera entonces comete el error tipo I.


P (cometer error tipo I) = P ( FC > F) = .
La decisin correcta, es decir, no rechazar Ho dado que es verdadera est dado por 1-.

1-

Bajo H1 verdadera entonces el cociente FC = CMTrat/CME sigue una distribucin F no central


con a-1, N-a grados de libertad y un parmetro de descentralizacin > 0. Cuando la
hiptesis nula es falsa significa que existe diferencia entre tratamientos o los efectos de los
tratamientos son significativos, entonces el cociente se distribuye como una F no central con
un parmetro de descentralizacin relacionado directamente con la magnitud de la diferencia.
n i2
a 1

F' = CMTrat/CME
h(F') es la funcin de densidad de F'
98

a
r i
2

(a)
i 1

Ntese que bajo la Ho de que toda i = 0, entonces, = 0. Es lo que ya dijimos que bajo H o
el cociente CMTrat/CME sigue una distribucin F central.
a
r t
2


i 1

a a 2
Cuando = 0 entonces la distribucin F' se convierte a una distribucin F central.

1-

Si no se rechaza Ho dado que es falsa entonces se comete el error tipo II.

P(error tipo II)= P(FC < F') =.

La decisin correcta sera que siendo falsa la hiptesis nula, sta se rechazara, a esto se le
llama potencia de la prueba.
Estos dos tipos de errores deben minimizarse, pero como guardan una relacin inversa entre s,
no es posible. Cualquier cambio en el tamao de una regin producira un cambio opuesto en
la otra. Si movemos F central a la derecha, disminuye pero se incrementa. Lo mejor es
fijar la probabilidad de algn tipo de error y minimizar la probabilidad de cometer el otro.
Generalmente se fija la probabilidad de cometer el error tipo I, es decir ; se
determinan entonces las condiciones que minimizan la probabilidad de cometer el error tipo
II. Minimizar equivale a maximizar 1- , valor que se conoce como potencia de la
prueba y es la probabilidad de detectar una diferencia entre medias del tamao de . Si se
calcula la probabilidad de rechazar Ho dado que H1 es verdadera para todos los posibles
valores de se obtiene la funcin de potencia.
El poder de la prueba se incrementa cuando se aumenta el tamao de la muestra n.
Una curva caracterstica de operacin es una grfica de la probabilidad de cometer
el error tipo II de una prueba estadstica para un tamao de muestra particular contra un
parmetro relacionado con .
Especficamente, igualando (a) y (b)
2 2 a 2
2
2
a 2
99

a
r i2

i 1

a a 2
Especficamente se indica la probabilidad del error tipo II () contra el parmetro .
a
n i2
2 = i=1
a2
(b)

Determinacin del tamao de la muestra


Para determinar n se requiere especificar los siguientes puntos:
1) El nivel de significancia .
2) El tamao mnimo i / que se desea detectar, es decir la diferencia entre medias
para los cuales se desea rechazar Ho con seguridad o probabilidad alta. El valor i= i -
=i-1/a i.
3) La curva caracterstica de operacin proporciona la probabilidad de no rechazar H o
dado que H1 es verdadera, para distintos valores de n tal que sea aceptablemente
pequea.
En las grficas se indica contra que se relaciona con (parmetro de
descentralizacin).

Ejemplo, suponga que i = 50 y que el investigador cree que no excede de = 3.


Entonces,

Se emplea la curva para a-1 = 5 - 1 = 4 y a(n-1) = 5 (n-1) g.l. Para n=4 por ejemplo, =
1.11(4) = 4.44. Es mucho ms fcil aplicar una frmula en el que se requiere el parmetro D,
que es la cantidad por encima de la cual rechazara la hiptesis nula con un nivel de confianza
dado y que la proporciona el investigador en funcin del conocimiento que tenga del
fenmeno.

nD 2
2
2a 2

En el ejemplo, suponga que se obtuvo una estimacin de la varianza en un estudio piloto y


fue de 15, y que el valor de rendimiento a partir del cual se dira que dos fertilizantes son
diferentes es de 10 kg/ha2 y que se desea obtener una potencia de 0.9.

n(10) 2
2 1.11n
2(3)(15)
100

Para obtener el tamao de la muestra necesario para alcanzar dicha potencia, se construye
la siguiente tabla.

n 2 2
3 6 3.33 1.82 0.41 0.59
4 9 4.44 2.10 0.22 0.78
5 12 5.55 2.35 0.13 0.87
6 15 6.66 2.58 0.051 0.95

Es decir, que con un tamao de muestra de seis se obtiene una potencia de 0.95 o una
probabilidad de 1-0.95 de caer en el error tipo II, es decir, decir que dos medias son iguales
cuando realmente son diferentes.

Caso desbalanceado
Muchas veces no es posible llevar a cabo el experimento con el mismo nmero de
rplicas para cada tratamiento, ste es el caso desbalanceado. El anlisis de varianza es
semejante al del caso balanceado salvo algunas modificaciones en las frmulas que se
presentan a continuacin.
Supuestos
a

r i i =0
i=1

Sumas de cCuadrados:
Suma de cCuadrados de tratamientos:
a 2
yi.
SC trat = - f.c.
i=1 ri

Tambin tiene a - 1 grados de libertad.

Tarea: Obtenga los estimadores de los parmetros para el caso desbalanceado. (1 punto)

Intervalos de Confianza: Las grficas de intervalos de confianza tendrn diferentes


magnitudes por los distintos nmeros de rplicas.
CM E
yi. t 2
ri
Comparaciones mltiples:
Contraste
101

a
C = ci yi.
i=1

tal que,

r i ci = 0

La suma de cuadrados del contraste es:

a 2

( ci yi. )
i=1
SCc = a

r c
i=1
i i
2

Pruebas de rango mltiple


El error estndar para la media de una muestra variar de media a media y ser:
CME
s y i
ri

Diferencia Significativa Mnima

1 1
DSM = t/2,N -a CM E +
ri r j

Tarea. Resuelva el ejercicio 3-3 del libro de Montgomery.

Modelo de efectos aleatorios (modelo II)


El modelo de efectos aleatorios se emplea cuando el nmero de tratamientos es muy grande y
no es posible compararlos todos, o cuando el objetivo es conocer la cantidad de variacin que
se puede atribuir al factor (debido a la infinidad de niveles), entonces se toma una muestra
aleatoria de a niveles y se obtienen conclusiones referentes a la variacin y las inferencias se
extienden a toda la poblacin. Realmente se quiere saber qu tanto de la varianza del
experimento podra ser atribuible a verdaderas diferencias entre tratamientos y que tanto
podra ser debido al error aleatorio alrededor de estas medias.
102

Ahora estamos interesados en T y e. qu tanto de la variacin del experimento


se puede atribuir a las diferencias en las medias de tratamiento y qu tanto al error aleatorio?.
A este modelo se le conoce tambin como el de componentes de varianza.
ti y eij son variables aleatorias.
El modelo es el mismo que el de efectos fijos pero t i, se refiere a un efecto aleatorio asociado
con el i-simo tratamiento.
Los errores y los tratamientos se distribuyen normalmente con media cero y varianzas
y T respectivamente. Ambas variables son independientes por lo que:

V(yij) = + T .
Debido a que no se estn estudiando todos los tratamientos no se le aade la restriccin de que
los i suman cero.
Ejemplos: Si un cientfico est interesado en cmo trabaja un fungicida. Selecciona al azar tres
fungicidas de un grupo de fungicidas para estudiar la accin. Los modelos de efectos
aleatorios son comunes en estudios de muestreo.

La hiptesis que desea probarse es que la variabilidad de los tratamientos (o niveles del factor)
es igual a cero contra la alternativa de que es mayor que 0.

Ho: T = 0
H1: T > 0
Las sumas de cuadrados se calculan de la misma forma que para el modelo de efectos
fijos (modelo I). Pero en la tabla del anlisis de varianza se le puede agregar una columna de
los cuadrados medios esperados.
En el modelo de efectos fijos el cuadrado medio del error es un estimador de y el cuadrado
medio de tratamientos estima a ms una funcin de la suma de cuadrados de los efectos
fijos de tratamientos. Para el modelo de efectos aleatorios el CM de tratamientos estima a:
ms n . La FC = CMtrat/CME es una estimacin de
+ n T/ ,
que sigue una distribucin F solo si t = 0. Bajo este modelo Fc es el estadstico de prueba
para probar que la variacin entre tratamientos es igual a cero contra la alternativa de que es
mayor que cero.

F. de V. SC g.l. CM CM esperado
Tratam. SCtrat a-1 CMtrat +n T

Error SCE a(n-1) CME

Si Ho es verdadera, o sea si T = 0 entonces el numerador y el denominador de:

FC= CMtrat/CME = ( + n T )/ 2

ambos son estimadores insesgados de . Si H0 se rechaza el estimador del CMtrat es mayor


que el denominador.
= CME
T = (CMtrat - CME)/n
103

Por ejemplo si se desea conocer la variabilidad del contenido de cloro residual en los nodos de
la red de agua potable de una colonia de la ciudad, se toman aleatoriamente n nodos y se mide
el cloro residual de las tomas domiciliarias conectadas con ese nodo. Mediante este anlisis se
detectara si existe variabilidad entre los nodos y se obtendra la proporcin de variabilidad
debida a los nodos y la debida al error aleatorio.
En laboratorios es muy comn utilizar modelos de efectos aleatorios para conocer la
variabilidad que existe entre ellos, especficamente entre analistas, en la determinacin de un
analito. Por ejemplo, se puede mandar muestras de agua de la misma fuente a 5 o 6
laboratorios y estos realizan varias determinaciones de un analito. El inters se centra en la
variabilidad entre analistas ms que en las lecturas promedio por los 5 o 6 analistas.

Para el modelo de efectos aleatorios tambin se requiere que se cumpla el supuesto de


normalidad. Y con respecto a que la variable i se distribuye normalmente, no se verifica
debido a que el nmero de niveles que se toman al azar para el estudio son insuficientes.

Tarea. Resolver el ejercicio 3-8 del libro de Montgomery que se refiere al contenido de calcio
en lotes de materia prima.

EJERCICIOS PROPUESTOS
Un experimentador someti a 5 grupos de ratones en un laberinto. El grupo 1 tena solamente
habilidades olfativas y tctiles, el grupo 2 slo visuales y tctiles, el grupo 3 solo visuales y
olfatorias, el grupo 4, visuales, olfatorias y tctiles y el 5, visuales, olfatorias y tctiles pero se
les aplicaba un choque elctrico por error que cometieran. Los datos son ensayo y error, bajas
calificaciones indican una buena actuacin.

A1 A2 A3 A4 A5
7 5 9 6 19
8 4 11 12 6
5 4 6 8 3
9 6 8 5 12
10 3 7 11 13

a. Realice el anlisis, encuentre el valor de p para probar la diferencia entre tratamientos.


b. Qu efecto parece tener cada tratamiento en el aprendizaje?
c. Estime la varianza y la desviacin estndar de cada grupo. Comente la validez del
supuesto de homocedasticidad y su efecto en la validez del anlisis.
d. Qu transformacin podra utilizarse para hacer las varianzas ms homogneas tal
que los valores puedan ser intuitivamente significativos?
e. Haga la transformacin necesaria y el anlisis en los datos transformados. Compare los
resultados del anlisis y el supuesto de homocedasticidad.
f. Cmo interpretara los resultados? Qu tendra que retransformar a la escala original
y cmo se hara?
104

El comit de gobierno de una supercarretera est interesado en si las carreteras son ms


seguras en la actualidad. Se seleccionaron al azar 10 estados y se determinaron de los aos
del 68 al 72, las tasas de fatalidad (nmero de muertes por 100 millones de vehculos).

Ao 1968 1969 1970 1971 1972


5 5.4 4.3 5.2 5.0
4.9 3.3 5.1 7.8 5.8
5.9 4.5 4.0 3.0 6.6
5 5.5 6.0 5.0 4.1
7.2 5.0 4.4 5.8 3.8
7 7.6 4.6 4.0 4.5
4.9 7.6 4.8 4.5 3.8
6.4 6.4 6.4 4.4 4.5
6.3 5.3 5.2 4.4 5.3
7.3 7.1 4.3 3.9 3.8
yi. 59.9 57.7 49.1 48.0 47.2
Si 2 0.9788 1.9557 0.6077 1.7 0.9040

a) Use cada una de las tres pruebas da homogeneidad de varianzas Se cumple el


supuesto de normalidad?.
b) Corra el anlisis de varianza y concluya.
c) Asumiendo un 0.10 cul es la mnima diferencia en la tasa de mortalidad
anual que puede ser detectada con estos datos?

Un fabricante de tabletas desea probar que los tiempos de desintegracin de 4 tipos de tabletas
son los mismos.
A B C D
20 42 8 12 50 124 151 178
28 25 10 24 67 72 125 151
36 24 12 10 90 78 180 152
16 31 16 19 103 70 149 161
25 33 9 10 90 76 175 118

a. Realice el anlisis de varianza con un nivel de 0.05 y concluya.


b. Se cumplen los supuestos de normalidad y de homogeneidad?
c. Sugiera la transformacin ms adecuada. Transforme con raz cuadrada y averige si se
remueve la heterogeneidad. Corra la prueba de Bartlett con los datos transformados.
d. Tpicamente una transformacin que ayuda a corregir la heterogeneidad corrige la no
normalidad. Corra la prueba de Shapiro Wilks a los datos transformados, y emplee la grfica
necesaria para checar la normalidad con los datos trasformados. Interprete los resultados.
105

Diseos con restriccin en la aleatorizacin

Existen diseos en los que no es posible la aleatorizacin completa porque no se


cuenta con suficientes unidades experimentales homogneas que permitan esta
aleatorizacin completa de los tratamientos a las unidades experimentales. En lugar de
aleatorizar completamente, las unidades experimentales homogneas se agrupan en lo que
llamamos bloques, y se realiza una aleatorizacin de tratamientos dentro de cada bloque., es
decir una aleatorizacin por separado para cada bloque.
Algunas veces estas aleatorizaciones separadas ocurren naturalmente en factores
como parcelas, das, etc., y se usan para hacer el experimento ms rpido y fcil de correr.
La idea de bloques inicia con R.A. Fisher. Fisher consider acertadamente que
entre los factores de variabilidad aleatoria ajenos a los tratamientos sobresala por su
importancia la falta de uniformidad del suelo. Considerando que grupos de parcelas vecinas
tienden a la uniformidad en su fertilidad, y que difieren de parcelas que se encuentran a
cierta distancia y que tambin son homogneas entre ellas, introdujo en los diseos la idea
de formar grupos o bloques de unidades experimentales (parcelas) homogneas dentro de
cada grupo o bloque e ide un modelo que pudiera eliminar del error la variacin entre los
bloques.
Fisher propuso que se hiciera de modo que todos los tratamientos aparecieran una vez en
cada bloque, para asegurar que todos los tratamientos tuvieran la oportunidad de demostrar
su efecto en las varias condiciones del suelo que constituyen los bloques o grupos, de ah el
nombre de diseo de bloques completos al azar (dentro de cada bloque se aplican todos los
tratamientos).

Los bloques sirven para eliminar parte de los factores de variacin aleatoria, que de otro
modo incrementaran el error experimental.

La variabilidad restante que no se puede controlar y que no se puede remover del campo
pero que en cambio se puede aleatorizar queda dentro del trmino de error y es la debida a
la falta de uniformidad entre las unidades del mismo bloque y a la falta de uniformidad en
la realizacin del experimento.
As pues, si dentro del bloque hay ms variacin que entre los bloques, no valdr la
pena bloquear. Y la sensibilidad del experimento disminuira pues al tener un gran trmino
de error la prueba F para probar diferencias entre medias de tratamientos se hace menos
sensible a las diferencias.
Al planear un experimento en bloques debe buscarse que los bloques absorban la
mayor heterogeneidad del suelo, y que los bloques sean lo ms homogneos dentro de s.
En resumen las razones para bloquear son:
1) Nmero insuficiente de unidades experimentales homogneas para correr un
experimento completamente aleatorizado.
2) Remover una fuente de variacin del error para hacer al diseo ms sensible a las
diferencias entre tratamientos.

Algunos ejemplos en los cuales es ideal aplicar este diseo son:


1) En agricultura las diferencias en fertilidad del suelo, o bien el talud o pendiente del
suelo puede hacer que las parcelas de un lado del campo difieran de las parcelas del
lado opuesto o sitios intermedios.
106

2) En experimentos de cultivos perennes como los rboles frutales, las unidades


experimentales ubicadas en ciertas partes del terreno difieran a los de otras partes del
terreno.
3) En experimentos con plantas en macetas de invernadero o laboratorios donde se aplican
diferentes tratamientos a diferentes macetas sern tiles bloques de macetas
similarmente situadas en el invernadero, aqullas cercanas a la puerta, o a las ventanas,
es decir aqullas situadas similarmente geogrficamente.
4) Cuando las unidades experimentales son animales, los bloques pueden formarse con
base en su similitud gentica, dejando como bloques por ejemplo, los animales
pertenecientes a una misma camada, o agrupar a los animales por grupos de edad o
peso.
5) En estudios mdicos donde las unidades experimentales son personas, se pueden
formar grupos por edades, sexo, clase social, historia clnica, raza, etc.
6) En industrias hay solamente tiempo para correr una rplica del experimento por da. En
tal experimento uno podra bloquear en tiempo y el nmero de das en que se lleva a
cabo el experimento es el nmero de bloques (Lorenzen y Anderson, 1993).
Los bloques deben ser lo ms homogneos en su interior y diferir lo ms posible entre ellos.
Dentro de cada bloque se aleatorizan todos los tratamientos, y los tratamientos son
asignados aleatoriamente a las unidades experimentales dentro de cada bloque por lo que
cada bloque representa una sola rplica. No debe existir interaccin entre el factor y el
bloque pues no se sabra si las diferencias se deben al factor o al bloque.

Antes de introducirnos al modelo, supuestos etc., se ver un concepto que algunos autores
consideran importante y que justifican el por qu no es de inters o adecuado probar el
efecto diferencial de los bloques, y es el de error de restriccin. Estas ideas se toman de la
bibliografa de Anderson y de Lorenzen & Anderson.

Suponga que se prueban tres temperaturas: 30,40 y 50C y cuatro colores: azul (az), rojo
(r), amarillo (am) y verde (v), en la nitidez de una imagen. Se corren dos rplicas (1 y 2).
De modo que se tiene un experimento de dimensin 3 x 4 x 2 = 24 combinaciones
(Temp/Color/rplica).
Una aleatorizacin completa sera:

(30C-az-1 50C-v-2 40C-am-1 30C-v-2 30C-az-2


hasta completar 24 combinaciones (temp/color/rplica.).

Esto tiene el inconveniente de que el cambio constante de temperatura y el tiempo que tarda
un horno en alcanzar las temperaturas echara a perder el horno o sera muy tardado el
experimento.
El investigador decide que debe elegir al azar una temperatura y que se pinten 8 paneles de
las 8 posibles combinaciones color/rplica. Por ejemplo elige al azar entre las tres
temperaturas y sale 30C. Se ajusta el horno a esta temperatura y se aleatorizan color y
rplica, como se muestra a continuacin:

30C: v-1 az-1 az-2 r-2 v-2 am-2 am-1 r-1


107

Una vez corridas estas 8 combinaciones, elige al azar de entre las dos temperaturas
restantes y corre las mismas 8 combinaciones color/rplica, pero en orden aleatorio.
Se puede observar que no hubo aleatorizacin completa sino que se ha restringido a
cada temperatura, es decir ha habido una aleatorizacin por temperatura o para cada bloque.
Se sabe que el error de restriccin est asociado a la temperatura, decimos que hay
una restriccin en la aleatorizacin asociado con el factor temperatura. Y esta restriccin se
dice que est confundida con el bloque.
Tambin decimos que el experimento se corre en bloques donde los bloques estn
asociados con la temperatura, o bien, decimos que el experimento est bloqueado en
temperatura, o que la temperatura es un factor de bloqueo.

Ahora considere que slo hay una pistola de aire para pintar y da mucho trabajo
limpiarla y mezclar un nuevo color. Tiene sentido limpiar la pistola y mezclar un nuevo
color mientras la temperatura del horno est cambiando.
Uno podra elegir una combinacin temp/color y pintar y hornear ambas repeticiones antes
de elegir la segunda combinacin. No hay necesidad de fijar individualmente cada
temperatura o fijar un color, ms bien ambos cambiaron al mismo tiempo.
Las combinaciones se elegirn al azar, una cada vez, y con esta combinacin se corrern en
orden aleatorio las dos rplicas.
De las 12 combinaciones:
30az 30v 30am 30r
40az 40v 40am 40r
50az 50v 50am 50r
Se elige al azar una combinacin, por ejemplo 40r. Se controla la temperatura del horno a
40C y la pistola se llena con pintura roja. Se elige al azar que rplica se realizar primero.
Hay una restriccin en la aleatorizacin asociado con cada combinacin temp/pintura. El
trmino de bloqueo es Temp/pintura.
Una restriccin en la aleatorizacin puede asociarse con cualquier trmino del
modelo. Tal restriccin implica que un nivel del trmino (o una combinacin como
temp/pintura) es fijado y todas las combinaciones que contiene ese nivel son aleatorizados
antes de elegir al azar el otro nivel.

Qu implicacin tiene este error de restriccin en el modelo y en las pruebas estadsticas?

El error de restriccin asociado con el trmino de bloqueo se le aade al modelo


inmediatamente despus del trmino de bloqueo y con una letra griega. En un diseo de
bloques completos al azar el modelo quedara as:

y ij i j l ( j ) ij
donde el trmino despus del efecto del bloque es el error de restriccin dentro del j-simo
bloque y completamente confundido con el bloque j. l debe ser igual a 1 pues es el error de
restriccin nico asociado al bloque j. El error de restriccin mide la variabilidad de las
mediciones realizadas dentro del mismo bloque, o error del bloque. Si hay tres bloques por
ejemplo hay 3 restricciones, una para cada bloque. Como l =1 pues no tiene grados de
libertad (1-1=0), ni suma de cuadrados ni cuadrado medio.
108

l =1, este representa las caractersticas aleatorias del bloque (la aleatorizacin dentro del
bloque). Este valor no se puede estimar pues est confundido con los bloques, ni tiene suma
de cuadrados ni grados de libertad. Sin embargo, al observar los E(CM) se puede observar
que para probar diferencias entre bloques no puede emplearse el error aleatorio como
denominador de la FC, como puede verse a continuacin: (suponiendo los bloques
aleatorios)
b ti
2

E (CM Trat ) 2

a 1
E (CM Bloques ) a 2B a 2
2

E (CM l ( j ) ) 2 a 2
E (CME ) 2
Esto tiene sentido pues para probar CM Tratse contrasta con el efecto aleatorio.
Igualmente para probar si los bloques son significativos se probara contra su error. Lo
interesante en este diseo no es contrastar los distintos bloques, sino ms bien los niveles
del factor, y el bloqueo se utiliza para incrementar la precisin del experimento.
Si se probara los bloques contra el error y es significativo no se sabe si existen diferencias
entre bloques o el error de restriccin es significativo o ambos son significativos, porque
ambos estn confundidos. Se dice que esta F es conservativa porque se prueban
simultneamente bloque y error de restriccin.
Si es no significativa ambos son no significativos.
Puesto que no se puede obtener informacin de los bloques es sabio disear el
experimento de modo que se utilice como factor de bloqueo el que tenga poca importancia
o inters.

Modelo
y ij i j l ( j ) ij
donde,
es la gran media, y es constante para todas las observaciones.
i es el efecto del i-simo tratamiento.
j es el efecto del j-simo bloque
l(j) es el error de restriccin dentro del j-simo bloque y completamente confundido con el
bloque j. Ll debe ser igual a 1 pues es el error de restriccin nico asociado al bloque j. Si
hay tres bloques por ejemplo hay 3 restricciones, una para cada bloque. Como l =1 pues no
tiene grados de libertad (1-1=0), ni suma de cuadrados ni cuadrado medio.

Supuestos
a

= 0
i=1
i
109

=0
j=1
j

ij ~ N(0, )
2

No existe interaccin entre los bloques y tratamientos. El modelo de bloques es aditivo, sta es
otra forma de decir que no hay interaccin de con , que en palabras significa que el efecto
de los tratamientos no depende del bloque: se supone que el efecto que tiene el bloque sobre la
respuesta es independiente del efecto que tiene el tratamiento sobre esta respuesta.

Hiptesis
El inters en este diseo se centra en el factor y no en los bloques; stos slo sirven
para incrementar la sensibilidad de la prueba.
Ho: i = j ij
H1: i j para al menos una i y una j.

Sumas de Cuadrados
Los clculos son iguales al modelo de dos factores sin interaccin.
a b 2
y..
SCTotal yij 2
i 1 J 1 N

a 2 2
yi. y ..
SC TRAT = -
i=1 b N

2 2
b y. j
y
SC BLOQ = - ..
j=1 a N

La Suma de cuadrados del error se obtiene por diferencia.

Tabla de anlisis de varianza

Fuente de SC G.L. CM FC
Variacin
Tratam. SCtrat a-1 SCtrat/(a-1) CMtrat/CME
Bloques SCB b-1 SCB/(b-1)
110

Error SCE (a-1)(b- SCE/(a-1)(b-


1) 1)
Total SC total N-1

Ventajas y desventajas del bloqueo:


1) Permite eliminar o controlar la variabilidad sistemtica de algn factor extrao.
2) Fcil de organizar.
3) El anlisis no es demasiado sensible a datos faltantes.
La desventaja es que puede existir interaccin entre tratamientos y bloques y no podra
medirse si la interaccin tiene sentido. Si los bloques son muy grandes quiz pierdan la
homogeneidad dentro de ellos. Si el experimento es grande, se pierden grados de libertad
del error (lo cual es equivalente a disminuir el tamao de la muestra).

Ganancia en precisin

La eficiencia relativa mide la efectividad de un diseo respecto a otro, particularmente se


evala la precisin de un diseo que se utiliz para un anlisis respecto a otro diseo ms
sencillo que no se utiliz.
Ya sabemos que la varianza es una buena medida para conocer la precisin de un mtodo. La
varianza de la media de un tratamiento

2
2y y el objetivo es disminuir esta varianza; esto puede ser incrementando el nmero de
r
rplicas o bien disminuyendo la 2 mediante el control por bloqueo.
Si se quieren comparar en cuanto a precisin- dos modelos, se usan sus respectivas varianzas
de las medias de un tratamiento.
21
2 y1
r1
22
2 y2
r2

Si el primer diseo tiene una varianza igual a 1 y el segundo una varianza de doble del
primero, es decir:

12 1
22 2
22 2 12

De este modo
1
2y
1
r1
2
2y
2
r2
111

Estas varianzas de las medias son iguales si r2 =2r1, si el segundo diseo tiene el doble de
rplicas que el primero. El diseo 1 es ms eficiente que el diseo 2, porque requiere la mitad
de rplicas para tener la misma precisin en la estimacin de las medias de tratamiento.
El diseo 2 es menos eficiente que el primero porque requiere el doble de rplicas para tener la
misma precisin en las medias de tratamiento.
Debido a que slo se tiene la estimacin de la varianza en el diseo de bloques y no se cuenta
con la estimacin de la varianza en el diseo completamente aleatorizado, sta tiene que
estimarse a partir de los datos de la tabla de anlisis de varianza del diseo de bloques.
Fisher calcul una cantidad que llam informacin y que implica una correccin por grados de
libertad para la estimacin de 2:

( f 1) 1
I
( f 3) s 2

donde f son los grados de libertad del error y s2 es la estimacin de la varianza. Si se conociera
2 entonces la cantidad de informacin sera I = 1/ 2, pero como no se conoce y se estima, se
ajusta esta eficiencia con los grados de libertad. Si s2 disminuye, la cantidad de informacin se
incrementa.
La eficiencia relativa de dos diseos se define como la razn de la informacin de los dos
diseos.
( f1 1) 1
I1
( f1 3) s12

I2
f 2 1 1
f 2 3 s22
I1 f1 1 f 2 3 s22
R
I 2 f1 3 f 2 1 s12

Se puede estimar la eficiencia del bloqueo con respecto al diseo completamente


aleatorizado.

(g.l.EB + 1)(g.l.EC + 3) 2 c
R= x
(g.l.EB + 3)(g.l.EC + 1) 2 b

Este estadstico significa el nmero de rplicas necesarias para que el diseo


completamente aleatorizado pueda ser utilizado en lugar de un diseo de bloques,
manteniendo la misma sensibilidad en ambos diseos.
g.l. EB son los grados de libertad del error de bloques
g. l. EC grados de libertad del error del completamente aleatorizado
c varianza del completamente al azar
b varianza de bloques.
Como no se sabe el CME para el diseo completamente al azar se emplea la siguiente
frmula:
112

(b - 1) CM B + b(a - 1) CM EB
=
2

ab - 1

Un R = 1 significa que la informacin de los dos diseos es la misma y cada diseo requiere el
mismo nmero de rplicas para tener la misma varianza en las medias de tratamientos. R > 1
significa que el diseo de bloques es ms eficiente que el completamente aleatorizado. Un R =
2 significa que el diseo completamente aleatorizado requiere 2 veces el nmero de rplicas
que el diseo de bloques para tener la misma varianza en la media del tratamiento. (Kuehl,
2000).
Ejemplo:
Se midieron las concentraciones de nitrgeno de nitratos que percolaban de un
campo forestal con lodo de plantas de tratamientos. Los excesos de nitrgeno se convierten
a nitratos una forma que lixivia al agua subterrnea. Se quiere comparar las concentraciones
de nitratos en mezclas de lodos con tierra al 25, 50 y 75 %. Los tratamientos se aplicaron en
distintos das (bloques) debido a que no se poda correr el experimento completo con todo y
rplicas en un slo da. El experimento se realiz durante 10 das, y los tratamientos se
asignaron al azar a las distintas parcelas del terreno: adems, en cada da se realizaron todos
los tratamientos:

La aleatorizacin de los tratamientos a las unidades experimentales se presenta a


continuacin:

da: 1 2 3 4 5 6 7 8 9 10
A B C C A B A C B B
C A B B B C C B A A
B C A A C A B A C C

Bloque (da) Tratamiento


A B C
1 1.5 4.5 3.4
2 1.3 4.2 3.2
3 2.0 4.0 3.1
4 2.0 4.0 3.0
5 2.0 4.0 3.1
6 1.9 4.2 3.8
7 3.0 4.1 3.7
8 3.0 3.9 3.1
9 2.5 3.1 3.0
10 2.9 4.0 3.1

Modelo
y ij i j ij
donde,
113

es la gran media y es comn a todas las observaciones


i es el efecto de la i-sima mezcla lodo-suelo.
j es el efecto del j-simo da
ij es el componente de error aleatorio

Sumas de Cuadrados

SCT 319.74
94.6 2 21.43
30

SC mezcla

22.12 40 2 32.5 2
298.31 16.16
10

SC das

9.4 2 8.7 2 ... 10 2
298.31 1.45
3
SC E 21.43 16.16 1.45 3.82

Tabla de Anlisis de Varianza

Fuente de SC G.L. CM FC p
Variacin
Mezcla 16.16 2 8.08 38.08 0.0000
Da 1.45 9
Error 3.82 18 0.21
Total 21.43 29

La FC que se obtuvo del bloque (da) slo proporciona una idea de si el bloqueo tuvo
sentido. Como result no significativo, el modelo completamente aleatorizado hubiera sido
ms eficiente ya que el nmero de grados de libertad del error sera mayor. Al trabajar con
el modelo de bloques se han sacrificado b-1 grados de libertad y la prueba se ha hecho
menos sensible innecesariamente.

Para el problema la ganancia en precisin sera:

(9)(0.1616) 10(2)(0.2121)
c 0.19
29
19(30) 0.19
R 0.89
21(28) 0.212
Se necesitan 0.89 veces repetir el diseo completamente aleatorizado para obtener la
misma sensibilidad que el de bloques. Aqu puede confirmarse que no era necesario el
bloqueo para analizar los datos del problema. Lo que se perdi fue sensibilidad en el
modelo.

Los tratamientos no necesariamente corresponden a los niveles de un factor, sino que


tambin pueden ser combinaciones de niveles de tratamientos de un diseo factorial. Un
ejemplo lo proporciona Dean y Voss y se presenta a continuacin.
114

Ejercicio (tomado del libro Design and Analysis of Experiments. Angela Dean and Daniel
Voss)
Este experimento se report en Noviembre de 1953 en la Journal of Applied Statistics por
Robert Peaje.
En una etapa intermedia del proceso de hilado de algodn, una hebra de algodn result
ms gruesa que el hilo final producido. La hebra se entreteje justo antes de enrollarla en la
bobina. El entretejido se realiza por medio de una gua rotatoria llamada volante. El
propsito del experimento es investigar la forma en la cual distintos grados de entretejido
(medidos en vueltas por pulgada) afecta la tasa de ruptura de la hebra, y comparar el
volante ordinario contra un nuevo volante.
Los factores son: Tipo de volante y grado de enrollamiento, el primero con dos niveles:
ordinario y nuevo, y el segundo factor con 4 niveles: 1.63, 1.69, 1.78 y 1.90. De modo que
pueden definirse 8 tratamientos de los cuales dos se eliminaron por no ejercer ningn efecto
en la variable respuesta:
12. Ordinario-1.69
14. Ordinario-1.78
15. Ordinario-1.90
21. Nuevo-1.63
22. Nuevo-1.69
23 Nuevo-1.78
Se pens que para llevar a cabo una corrida completa y para llenar la bobina se requera de
1 da. Por lo que se pens que los das seran considerados como bloques. Se corri el
experimento como una diseo de bloques completos aleatorizados. Y se presentan a
continuacin los resultados.

Tratamiento Da
1 2 3 4 5 6
12 6.0 9.7 7.4 11.5 17.9 11.9
13 6.4 8.3 7.9 8.8 10.1 11.5
14 2.3 3.3 7.3 10.6 7.9 5.5
21 3.3 6.4 4.1 6.9 6.0 7.4
22 3.7 6.4 8.3 3.3 7.8 5.9
23 4.2 4.6 5.0 4.1 5.5 3.2

Pruebe si existen diferencias entre tratamientos.


115

Estimacin de los parmetros del modelo


y..
i yi. y..
j y. j y..
y ij yi . y. j y..
ij yij yi . y. j y..

Comparaciones Mltiples

Si los tratamientos son fijos, el inters tambin es conocer si existen diferencias entre
medias de tratamientos, para lo cual se emplean las pruebas de comparacin mltiple. Las
frmulas varan en que en lugar de colocar el nmero de rplicas de un diseo completamente
aleatorizado simbolizado por n o r, ahora es reemplazado por la letra b. Tambin el nmero de
grados de libertad del error de bloqueo el cual es N a b + 1.

Igualmente la potencia de la prueba se aplicara para determinar si el nmero de bloques


manejados en el experimento es el adecuado.

Ejercicio
a) Probar que 1 + 3 = 22
b) Aplicar la prueba de DHS de Tukey y la prueba de rango mltiple de Duncan.

a)
Ho: 1 + 3 = 22

Construimos el contraste que llamaremos C.

C = 22.1 + 32.5 2(40) = -25.4

Ahora calculamos la suma de cuadrados del contraste.

SC C
25.4 2

10 12 12 (2) 2 10.75
que tiene 1 grado de libertad, por lo que el CM tiene el mismo valor.

FC=10.75/0.21= 50.67 que al compararse con el valor F0.05;1,18 = 4.41, se observa que se rechaza
la hiptesis nula, es decir, existe diferencia estadsticamente significativa entre el contenido de
nitratos en los lixiviados de las mezclas 1 y 3 con el de la mezcla 2.

b) Prueba de Tukey.
1) 4 3.25 2.21
2) q0.05(3,18) = 3.61
2
3) S i. 0.21 0.21
10
116

1
4) t (3.61)(0.21) 0.53
1.4142
Cualquier diferencia mayor a 0.53 es estadsticamente significativa.
5)
1 vs. 2 : 4 2.21 = 1.79 > 0.53 **
2 vs 3: 4 - 3.25 = 0.75 > 0.53 **
1 vs. 3: 3.25 - 2.21 = 1.04 > 0.53 **

Esta prueba que es conservativa nos est indicando que todas las mezclas arrojan distintas
cantidades de nitratos en los lixiviados. Y debido a que la 1 es la que arroja menos nitratos,
sera la de eleccin por su poder menos contaminante.

c) Prueba de rango mltiple de Duncan.


1) 2.21 3.25 4.0
CM E 0.21
2) S y 0.15
i.
b 10
3)
p
2 3
r 2.97 3.12
Rp 0.4327 0.4546

4) 2 vs 1: 4 2.21 = 1.79 > 0.4546 **


2 vs 3: 4 3.25 = 0.75 > 0.4327 **
1 vs. 3 = 3.25 2.21 = 1.04 **
Con esta prueba que es muy sensible se detectan las diferencias entre las medias; ntese que
los valores crticos contra los que se comparan las diferencias de medias son ms pequeas
que el valor estudentizado que se emple en la prueba de Tukey, lo que nos dice que la prueba
de Duncan es ms sensible. En este problema se puede observar que s existen diferencias y
que stas son tan significativas que an con la prueba conservadora de Tukey fueron
detectadas.

Tarea. Consultar el libro de Bioestadstica. Diseos de Bloques completos al azar con ms de


una observacin por tratamiento por bloque.

Ejercicios
1. Obtenga E(CMTrat) y E(CMB).
2. Obtenga por mnimos cuadrados los estimadores de los parmetros. Suponga que
ambos, factor y bloque son fijos.
3. Resolver los ejercicios 5-1, 5-2, y 5-5 del libro de Montgomery.
117

Estimacin de datos faltantes


Cuando realizamos un experimento, algunas veces se pierde alguna observacin ya sea por
dao a la unidad experimental o por falta de cuidado. En un diseo de bloques completos esto
introduce un problema de no ortogonalidad de los tratamientos a los bloques, es decir, no
todos los tratamientos estn en todos los bloques.
Este dato puede estimarse por el mtodo aproximado de Yates o bien puede realizarse el
anlisis de varianza con el mtodo exacto.

Mtodo aproximado de Yates


Cuando hay una observacin faltante este dato es fcil de estimar algebraicamente de
modo que el residuo para el valor perdido sea cero. La suma de cuadrados del error se expresa
como una funcin cuadrtica del valor perdido x y los valores observados. El valor de x se
estima de modo que se minimice la suma de cuadrados del error. Si el anlisis de varianza se
realiza, los clculos se hacen con el nuevo valor estimado de x pero teniendo cuidado de
restarle un grado de libertad a la SCE y a la SCT por dato estimado.
Suponga las observaciones yij.
Denote por x la parcela faltante
es el gran total con la observacin faltante
Es el total del i-simo tratamiento que contiene a la parcela faltante
es el total del j-simo bloque que contiene a la parcela faltante.

SC E yij yi. y. j y..


2

2 2
1 a 1 b
yij
b a
1
y y y
2
2

ij
b i 1
ij a j 1
ij
ab
j 1 i 1

yi. 2 1 y. j 2 1 y.. 2
a b
1
yij2
b i 1 a j 1 ab

L SC E xij2
y ij ' x
2


y .j ' x
2


y '.. x 2 R
b a ab
L 2 y 'i. x 2 y '. j x 2 y '.. x
2 xij 0
x b a ab
ay 'i. by '. j y '..
x
( a 1)(b 1)

Mtodo Exacto
Consiste en realizar el anlisis de varianza utilizando el procedimiento de la regresin general
que consiste en calcular la reduccin en la suma de cuadrados total al ajustar el modelo cuando
todos los parmetros estn incluidos, y la reduccin en la suma de cuadrados cuando el
modelo est restringido por Ho, es decir cuandoi = 0. La diferencia entre ambas reducciones
en las sumas de cuadrados es la suma de cuadrados de tratamiento con la que se conduce Ho.
La metodologa consiste en:
1. Obtener las ecuaciones normales para el modelo completo.
118

2. Determinar la reduccin en la suma de cuadrados al ajustar los datos al modelo


(completo).
3. Determinar el nmero de grados de libertad asociados a esta suma de cuadrados.
4. La variabilidad no explicada es la suma de cuadrados del error SC E, se obtiene por
diferencia.
5. Para encontrar la SC tratamiento, se considera el modelo reducido, es decir bajo Ho.
6. Se obtiene el sistema de ecuaciones normales para este modelo.
7. Obtener la reduccin en la suma de cuadrados al ajustar los datos al modelo reducido.
8. Encontrar el nmero de grados de libertad asociados a esta suma de cuadrados.
9. Completar la tabla de anlisis de varianza.
Suponga por ejemplo que se tiene el siguiente diseo de bloques:

Bloques 1 2 Totales
Tratamientos
1 Y11 Y12 Y1.
2 Y21 X Y 2.
3 Y31 Y32 Y 3.

Para obtener el sistema de ecuaciones normales emplee el algoritmo propuesto por D.


Montgomery y que a continuacin se describe:
1) Obtener una ecuacin normal por cada parmetro.
2) El miembro derecho de cada ecuacin normal es la suma de todas las observaciones
que corresponden a cada parmetro.
3) El miembro izquierdo de cada ecuacin es la suma de todos los parmetros del
modelo, cada parmetro multiplicado por el nmero de veces que aparece en el total
del lado derecho de la ecuacin.
4) En el ejemplo,
: 5 2 1 2 2 3 3 2 2 y..
1 : 2 2 1 1 2 2 y1.
2 : 2 1 y2.
3 : 2 2 3 1 2 y3.
1 : 3 1 2 2 31 y.1
2 : 2 1 3 2 2 y. j
Puede observarse que hay dos dependencias lineales, la suma de las tres dan la primera
ecuacin y la suma de las dos ltimas tambin dan la primera ecuacin.
Aadiendo las restricciones al modelo
r 0
i 1

Sb 0 j

La solucin a este sistema de ecuaciones es:


=y../5
1=1/4(y11)+(7/20)y21 -1/5y21 -1/5y31-3/20y32
2=-2/5y11 + 4/5y21 2/5y31
3=-1/10y11 7/10y12 2/5y21 +4/5y31 + 3/10 y32
1=1/5y11-1/5y12+1/5y31-1/5y32
119

2=-3/10y11 +3/10 y12 3/10y31 +3/10y32

Cuando ajustamos un modelo explicamos algo de la variabilidad de los datos, es decir


reducimos la variabilidad total no explicada por alguna cantidad.
5. Determinar la reduccin en la suma de cuadrados para el modelo completo. Esta
reduccin es siempre igual a la suma de los parmetros estimados por mnimos
cuadrados (estos valores estimados sirven para calcular la reduccin en la suma de
cuadrados del modelo completo) cada uno multiplicado por el lado derecho de su
ecuacin normal, es decir por su total.
R ( ,, ) y.. i 1 i yi. j y. j

y.. y.. yi. y..) yi. y. j y..) y. j


a b

i 1 j 1
2 2
y2
y. j y.. j y. j ..
a b
y y
yi. yi.
.. ..

ab i 1 ab j 1 ab
yi2. y.2j y2
b

a
..
ab
El nmero de grados de libertad asociados a R es igual al nmero de ecuaciones
linealmente independientes, es decir, 6-2=4. O bien, a+b-1=3+2-1=4
6. La SCE se obtiene por diferencia y es la parte de la variacin total no explicada por el
modelo.
SC E yij2 R ( , , )
yi2. y.2j y2
y 2
ij ..
b a ab
con N-a-b+1 grados de libertad o bien 5-3-2+1=1
Este CME se emplear como denominador para probar Ho: i=j

Para el modelo reducido, que es el que resulta cuando Ho es verdadera o dicho en palabras,
no hay efecto de los tratamientos:

yij j ij
se procede de la misma manera que con el modelo completo.
El sistema de ecuaciones normales sera:
: 5 31 2 2 y..
1 : 3 31 y.1
2 : 2 2 2 y.2
con 3-1 grados de libertad, es decir 2 debido a la dependencia lineal.
Estos valores estimados sirven para calcular la reduccin en la suma de cuadrados del
modelo reducido.
b

Imponiendo la restriccin: sb j 0 la solucin al sistema de ecuaciones sera:


j 1
120

1
y..
5
1 y..
1 y1.
3 5
1 y..
2 y2.
2 5
La suma de cuadrados explicada en el modelo reducido sera:
R ( , ) y.. 1 y .1 2 y .2
y ..2
y . j y.. y . j
b

ab
y ..2 b
y2
y . j y . j ..
ab ab
b y .2j

a
con b grados de libertad.
La suma de cuadrados debida a i despus de introducir a y es:

R ( / , ) R ( , , ) R ( , )
y i2. y .2j y2 b y2
..
.j

b a ab a
y i2. y2
..
b ab
con a 1 grados de libertad. Esta frmula corresponde a la suma de cuadrados de
tratamiento con a-1 grados de libertad.

Para obtener la suma de cuadrados de los bloques tendramos que trabajar con otro modelo
reducido:
yij i ij
a

y 2
i.

R( ,)
b
con a grados de libertad.
SC bloques despus de ajustar el modelo reducido con y sera:

R ( / , ) R ( , , ) R ( , )
a

yi2.
2
y. j y..2 y 2
i.

b

a

ab

b
y.2j y..2
a

ab
con a+b-1-a = b-1 grados de libertad.
De este modo la tabla de anlisis de varianza sera:
121

Fuente de Variacin SC g.l. CM F


Modelo Completo
T, SCcompl. 4-1=3
Error SCE 1 CME
Modelo Reducido
R(,) SCRed 1 CMB
R(t/,) SCc-SCred 2 CMTrat CMTrat/CME

En resumen, con el mtodo exacto no se estima el valor, ms bien se realiza el anlisis


de varianza con el mtodo de la regresin tomando en cuenta a la observacin perdida.
Realmente por causas experimentales no deben perderse datos pues eso habla del poco
control y cuidado que se ha tenido al realizar el experimento. Si la prdida fue inevitable no
importa estimar el dato por el mtodo aproximado de Yates, pero si se pierden ms datos
queda en entredicho el que realiza el experimento. Si se pierde ms de un dato, por ejemplo
dos, se sugiere un dato, se estima el otro dato; con este dato se estima el que al principio se
haba sugerido y as sucesivamente hasta que converjan. Si se pierde ms de dos datos, se
recomienda emplear el mtodo exacto.

Ejercicio Propuesto.
1. El siguiente es un diseo de bloques completos aleatorizados.
Bloque a b c d e F
I 16 22 16 y1 18 8
II 28 27 17 20 23 23
III 16 25 16 16 19 16
IV 28 y2 19 18 24 25
Si el y1 fuera la media del bloque o la media del tratamiento, estime y1 y y2.
Inserte los valores estimados y efecte el anlisis de varianza prestando atencin a los
grados de libertad del error y totales.
122

Cuadro latino.

En el diseo de bloques completos al azar se aleatorizan los tratamientos en cada


bloque de manera que en cada bloque se aplica una sola vez cada tratamiento. La
aleatorizacin est restringida por los bloques. Existen otros experimentos en los cuales se
quiere investigar el efecto de un solo factor y se requiere eliminar el efecto de otras dos
variables; es entonces que se aplican los cuadros latinos. El cuadro latino tiene las
siguientes caractersticas:
1) Es un cuadro, tiene igual nmero de columnas y de filas.
2) Igualmente existe el mismo nmero de filas, columnas y tratamientos.
3) En cada fila y la columna slo se presentan los tratamientos una sola vez.
Los cuadros latinos ms comunes son los de 4 y 8 tratamientos con una sola unidad
experimental por tratamiento en cada fila y columna. Cada hilera o columna constituye una
repeticin completa de los tratamientos. El nmero total de unidades experimentales es
igual a t (es un cuadrado perfecto). Se supone que incrementa la eficiencia respecto a un
diseo de bloques completos al azar.
Se requiere que no exista interaccin entre F, C y T. La desventaja del cuadrado
latino es que el nmero de unidades experimentales requerido para establecer un
experimento se incrementa notablemente a medida que aumenta el nmero de tratamientos
en ensaye. Adems se requiere que el nmero de tratamientos debe ser igual al nmero de
rplicas (filas y columnas). El error se incrementa conforme se incrementa el tamao del
cuadro latino. Los cuadros latinos pequeos tienen pocos grados de libertad para el error .
Yy no se pueden evaluar las interacciones entre filas , columnas y tratamientos.
El cuadro latino tiene la siguiente forma:
A B C D
B C D A
C D A B
D A B C

Un cuadro latino como el anterior en el que la primera fila y columna estn en orden
alfabtico recibe el nombre de cuadro latino estndar.
Un cuadro latino estndar cclico es el que tiene los tratamientos de la primera fila y
primera columna en orden alfabtico y si las letras de cada fila se pueden obtener de las
previas corriendo la primera letra de una fila a la ltima posicin de la siguiente fila y
desplazando todas las dems letras de dicha fila.

Aleatorizacin

Existe un glosario de cuadros latinos estndar de varias dimensiones de hasta 12 x 12 en el


libro de Diseos Experimentales de Cochran o en el libro de Diseos de Experimentos de
R.A. Fisher. Para la aleatorizacin elija un cuadro latino estndar aleatoriamente. Para
cuadrados latinos de 3 4 o 5, permutar todas las hileras excepto la primero y despus
permutar todas las columnas.
Ejemplo, suponga que eligi el cuadro latino de 4 x 4 siguiente:
A B C D
B C D A
123

C D A B
D A B C
Con una tabla de nmeros aleatorios elija dos secuencias de nmeros, la primera del 2 al 4
(para permutar las tres filas) y una secuencia de 4 nmeros (para permutar las cuatro
columnas).
Suponga que las series fueron: (2,4, 3) y (3,1,4,2)
Cmo quedara el cuadro?

A B C D C A D B
B C D A D B A C
D A B C ------- B D C A
C D A B A C B D

Tambin puede elegirse al azar un cuadro latino estndar y se aleatorizan todas las filas y
las columnas.

Cuntos cuadros latinos pueden existir?


A partir de el nico cuadro latino estndar 3 x 3 se pueden formar 32=12 cuadros latinos,
incluyendo al estndar.
Existen 4 cuadros latinos de 4 x 4 y a partir de cada uno se pueden formar 43=144
cuadros latinos incluyendo al estndar. Debido a que son 4 c. l. estndar entonces habr un
total de 576 cuadros latinos de 4 x 4, 4 de los cuales son estndar.
Para cuadros latinos de 5 x 5, existen 56 cuadros latinos estndar. Y a partir de cada uno se
pueden formar 54= 2880 x 56= 161,280.

Ejemplo:
Un ingeniero qumico elabora una salsa casera y piensa que la viscosidad de su producto no
es de la consistencia adecuada. Cree que la concentracin de harina y agua determina su
viscosidad, otros factores que tambin afectan la viscosidad son controlados a niveles fijos.
Desea probar 4 mezclas agua:harina, y son las mezclas 1:1 (1 parte de agua, 1 parte de
harina), 1:2, 1:3 y 1:4. Debido a que la elaboracin es tequiosa emplea a 4 qumicos para
que cada uno elabore la salsa con las cuatro mezclas. A su vez no se cuenta con 1 batidora
sino que tiene 4 batidoras para la elaboracin de las salsas. Las 4 batidoras trabajarn con
las 4 mezclas a fin de que todas las salsas tengan la misma oportunidad de ser batidas por
las 4 batidoras. Debido a que desea eliminar el efecto que pudiera ejercer el qumico o la
batidora en la variabilidad de los datos propone un diseo de cuadrado latino con dos
restricciones en la aleatorizacin: qumico y batidora.
Cul sera el modelo, hiptesis y supuestos?
Con los resultados que se presentan abajo construya su tabla de anlisis de varianza y
concluya.
Batidoras
C 10 D 14 A7 B8
B7 C 18 D 11 A8
A5 B 10 C 11 D9
D 10 A 10 B 12 C 14
124

A. Mezcla 1:1
B. Mezcla 1:2
C. Mezcla 1:3
D. Mezcla 1:4

Las filas son los qumicos y las columnas las batidoras.

C 10 D 14 A 7 B 8
B 7 C 18 D 11 A 8
A 5 B 10 C 11 D 9
D 10 A 10 B 12 C 14

Modelo

yijk = + i + j + k + eijk,
i= 1,2,...,p,
j= 1,2,...,p,
k= 1,2,...,p
donde,
es la media total para los p tratamientos usando todas las p combinaciones de 2 factores.
i es la parte de la media debida a la i-sima fila.
j es la parte de la media que se atribuye al j-simo tratamiento
k es la parte debida a la k-sima columna.

Supuestos:
1) las p2 poblaciones estn normalmente distribuidas
2) Tienen varianzas iguales
3) No existe interaccin
4) Existe independencia de errores.

Sumas de Cuadrados
p p P 2
y ...
SC total = yijk -
2

i=1 j=1 k=1 N

p
y 2. j. y 2...
SC Trat = -
j=1 p N
125

p 2
yi..
SC rengln = - f.c.
i=1 p

p 2
y ..k
SC column = - f.c.
k=1 p

SCerror = SC total - SC trat - SC rengln - SC columna.

Grados de libertad y cuadrados medios

Los grados de libertad asociados a cada fuente de variacin corresponden a p-1. Y


los cuadrados medios el resultado de dividir las sumas de cuadrados entre los grados de
libertad.
g.l. del error = (p-2)(p-1)
g.l. totales = p-1.

Tabla de anlisis de varianza

Las sumas de cuadrados, grados de libertad y cuadrados medios quedan resumidos en la


tabla de anlisis de varianza que se presenta a continuacin.

Fuente de SC G.L. CM FC
Variacin
Tratam. SC trat p-1 SC trat/(p-1) CMtrat/CME
Rengln SC rengln p-1 SC reng/(p-1)
Columna SC columna p-1 SC col/(p-1)
Error SCE (p-2)(p-1) SCE/(p-2) (p-1)
Total p-1

Resolviendo el ejemplo:
126

SCT 1834
164 2
153.0
16
39 2 44 2 35 2 46 2
SC quim 1681 18.5
4
30 2 37 2 532 44 2
SC mezcla 1681 72.5
4
32 2 52 2 412 39 2
SCbatidora 1681 51.5
4
SC E 153 18.5 72.5 51.5 10.5
Fuente de SC G.L. CM FC
Variacin
Tratam. 72.5 3 24.17 13.81
Rengln 18.5 3 6.17
Columna 51.5 3 17.17
Error 10.5 6 1.75
Total 153 15
F0.05;3,6=4.76
Como Fc es mayor que el valor de la tabla, entonces rechazamos Ho, es decir, existen
diferencias entre las mezclas..

Estimacin de los parmetros del modelo

y...
i yi.. y...
j y. j . y...
k y..k y...

La desventaja de los cuadros latinos es que como existen 2 fuentes de bloqueo el


nmero de grados de libertad se reduce. Los cuadrados latinos de grandes dimensiones son
muy difciles de aplicar pues es raro que se presenten las dos fuentes de bloqueo en un
nmero grande e igual de niveles, e iguales al nmero de tratamientos. Otra desventaja es
que requiere un nmero grande de unidades experimentales, particularmente si p > 10. Si se
tiene un cuadro latino de p tratamientos se requieren p2 unidades experimentales, por lo que
si se tienen 10 tratamientos se requieren 100 unidades experimentales. Los cuadrados
latinos pequeos tienen la desventaja de que son pocos los grados de libertad del error , por
ejemplo, para un cuadrado latino de 3 x 3 son 2 grados de libertad, para uno de 4 x 4 son 6
grados de libertad, para uno de 5 x 5 son 12 grados de libertad. Sin embargo es lgico que
cuadros latinos de estas dimensiones sean ms aplicables. Los cuadros latinos ms
utilizados estn en el rango de 4 p 10. Para incrementar los grados de libertad del error
se pueden repetir los cuadros .
Los cuadros latinos se pueden duplicar de tres maneras:
127

i) Repetir el cuadro, los mismos renglones y las mismas columnas


ii) Los mismos renglones o las mismas columnas, pero no ambos.
iii) Repetir el cuadro con diferentes renglones y diferentes columnas.
Cuando se replican los cuadros latinos la aleatorizacin de cada cuadrado se realiza por
separado

Vanse las frmulas de clculo para los tres casos en el libro de Montgomery.

Cmo estimara un dato faltante empleando el mtodo aproximado de Yates?

Ejercicio Propuesto (tomado del libro Introduction to Experimental Statistics. C.C. Li.)
El siguiente es un cuadro latino en el que L y P son las dos fuentes de bloqueo, y a, b, c, d,
y e son los tratamientos. Encuentre los valores de los residuos y compruebe que suman cero
para L, para P y para cada tratamiento.

E C A D B Total
20 9 15 36 22 102
C B D E A
14 24 37 23 18 116
A 3 C B D
13 17 10 17 29 86
D A B C E
33 16 21 16 22 108
B D E A C
19 27 14 15 13 88
Totales
99 93 97 107 104 500

Potencia de la prueba, comparaciones mltiples y eficiencia del cuadrado latino. Vase en


Applied Linear Statistical Models Setter, Kutner, Nachtsheim y Wasserman (1996). P.
1219.

Eficiencia relativa del bloque por columna.


Si slo se utiliza el criterio de bloque de los renglones con un diseo de bloques completos
al azar la estimacin del CME es

CM columnas ( p 1)CM E
B2
p

R
glEL 1 glEB 3 * B2
glEL 3 glEB 1 L2
Y para determinar la eficiencia del bloqueo de las columnas para el bloque con diseo de
bloques completamente aleatorizado el estimador del error del diseo de bloques sera:
128

CM filas ( p 1)CM E
B2
p
Y la eficiencia se obtiene:

R
glEL 1 glEB 3 * B2
glEL 3 glEB 1 L2
A continuacin se presenta un conjunto de ejemplos numricos que el alumno resolver
aplicando las frmulas propuestas por el libro de Montgomery.
Diferentes filas y mismas columnas.
A 7.0 B 8.0 C 9.0
B 4.0 C 5.0 A 6.0
C 6.0 A 3.0 B 4.0

C 8.0 B 4.0 A 7.0


B 6.0 A 3.0 C 6.0
A. 5.0 C 8.0 B 7.0
129
130

Diseos conmutativos
Son diseos en los cuales a los sujetos se les da un nmero de tratamientos en una
secuencia de tiempo con el objeto de evaluar la diferencia entre tratamientos. Por
consiguiente se requiere la mitad de sujetos que los necesarios para una comparacin de los
tratamientos con distintos grupos de individuos. Cada sujeto sirve como su propio control.
Este tipo de diseo es un diseo de bloqueo en el cual cada unidad experimental o sujeto es
un bloque. Este diseo es muy til cuando hay una considerable variacin entre unidades
experimentales. Si hay demasiada diferencia entre las unidades las comparaciones de los
factores pueden ser confundidos por los efectos de grupos de unidades experimentales que
reciben los mismos tratamientos. Como cada sujeto recibe los diferentes tratamientos se
debe tener la seguridad que no hay efecto residual de los tratamientos con el objeto de
poder evaluar el siguiente tratamiento.
Se utiliza generalmente para comparar tratamientos de enfermedades crnicas no agudas ya
que en stas ltimas puede suceder que los individuos sanen al cabo o durante el primer
perodo de tratamiento.
Debido a su larga duracin puede que algunos individuos abandonen el experimento.
Tambin debido a que reciben varios tratamientos la aparicin de efectos secundarios
muchas veces obligan al paciente a abandonar el estudio. Si algn paciente abandona el
estudio al comenzar el segundo perodo se pierde la informacin de ese paciente.
Para que un diseo conmutativo se aplique correctamente se deben cumplir los siguientes
supuestos:
Existe una gran variacin incontrolable entre las unidades experimentales.
Los perodos de tiempo son de suficiente duracin para que se manifiesten los
efectos de los factores.
No hay efecto residual de un perodo al siguiente. Estos efectos tambin reciben el
nombre de efectos acarreados y se deben a: el efecto de un tratamiento perdura
tiempo despus de su aplicacin, o tambin la condicin del enfermo puede cambiar
durante el primer perodo.
Los efectos de los factores, si hay, no cambian en el tiempo, es decir no hay
interaccin del tiempo y los factores.
La enfermedad debe tener una intensidad constante durante todos los perodos de
tiempo.
Cuando se estudia el efecto de pocos factores, se utilizan secuencias de cuadros latinos
como diseos conmutativos. El ms comn es aqul en el cual se estudian dos tratamientos
en dos perodos con un perodo de limpieza o descanso entre ambos. A estos diseos se les
conoce como AB/BA, es decir la mitad de los sujetos reciben la secuencia A B y la otra
mitad BA, y despus del perodo de lavado la primera mitad recibe BA y la otra AB.
El ms comn es uno en el cual la mitad de los pacientes o individuos reciben un
tratamiento activo y en ocasin subsecuente un tratamiento imaginario o placebo, mientras
que el resto de los pacientes reciben primero el placebo y en una ocasin subsecuente el
tratamiento activo. Cuando se supone que no hay efectos acarreados recibe el nombre de
enfoque clsico y es el que se trata en esta seccin. Se puede considerar como series de
cuadros latinos de 2 x 2. En este diseo hay p tratamientos y p perodos de tiempo y hay np
unidades experimentales y np2 observaciones. Por ejemplo, suponga 20 sujetos que reciben
el tratamiento A y el placebo B, 10 sujetos primero reciben A y despus B y la otra mitad a
la inversa.
131

Es recomendable que al inicio del experimento exista un perodo de estabilizacin o de


adaptacin para premonitorear los signos y sntomas relevantes de la enfermedad.

Perodos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 A B B A B AA B A B B A B A A B B A A B
2 B AA B A B B A B A A B A B B A A B B A

Son 10 rplicas de cuadros latinos 2 x 2.


Filas 2
Columnas 2

Ejemplo:
Son mediciones de flujo pico expiratorio (PEF) que es una medida de la funcin pulmonar,
en 14 nios de edades de 7 a 14 con asma moderada a severa, se estudi aplicando un
diseo conmutativo (o crossover) de 2 perodos de tiempo y 2 tratamientos que compara los
efectos de una dosis simple inhalada de 200g de salbutamol, que es un broncodilatador
bien conocido y 12 g de formoterol, un broncodilatador reciente. Los nios se
aleatorizaron a uno de dos grupos de secuencia. En un grupo se aplicaba la siguiente
secuencia: dosis formoterol en la maana, observado por 8 horas en la clnica, fueron a casa
donde sus padres tomaron mediciones de PEF despus de 10, 11 y 12 horas de tratamiento.
En una ocasin subsecuente despus del lavado (washout) de al menos un da se
presentaron en la clnica y se les administr el salbutamol.

Secuencia Perodo 1 Washout Perodo 2


For/Sal Formoterol No tratamiento Salbutamol
Sal/For Salbutamol No tratamiento Formoterol

1 2 3 4 5 6 7
Perodo 1 310 A 370 B 310 B 310 A 380 B 370 A 410 A
Perodo 2 270 B 380 A 400 A 260 B 410 A 300 B 390 B

8 9 10 11 12 13 14
Perodo 1 280 B 290 B 250 A 380 A 260 B 90 B 330 A
Perodo 2 310 A 320 A 210 B 350 B 340 A 220 A 360 B

Que tambin pudo haberse presentado de la siguiente manera:


1 4 6 7 10 11 14
Formoterol 310 310 370 410 250 380 330
Salbutamol 270 260 300 390 210 350 360
132

2 3 5 8 9 12 13
Salbutamo 380 310 380 280 290 260 90
l
Formoterol 380 400 410 310 320 340 220

El modelo para este diseo sera:


yijk Pi ( i ) S j ( j ) Fk ijk
donde,
Pi es el efecto del i-simo perodo
Sj el efecto del j-simo sujeto
Tk el efecto del k-simo medicamento

Hay p tratamientos, np unidades experimentales y p perodos. Son n cuadros latinos p x p, y


estn anidados para formar un rectngulo de p x np.
Cada unidad recibe cada tratamiento en un perodo.
En cada perodo, cada tratamiento se usa en n unidades.

Note que aparecen dos letras griegas que corresponden a los errores de restriccin de las dos
fuentes de bloqueo que son el perodo de tiempo y los sujetos.
SC P
yi2..

GT 2
np np 2

SC S
y 2
. j.
f .c
p
y..2k
SCT f .c
np

SC P
yi2..

GT 2
14 28

SC S
y.2j.
f .c
2
y2
SCT ..k f .c
14
de modo que la tabla de Anlisis de varianza quedara as:

Fuente de variacin Grados de libertad


Sujetos (Columnas) np-1
Perodos (filas) p-1
Tratamiento p-1
Error np2-(n+2)p+2
Total np2-1
133

En nuestro ejemplo n = 7 y p = 2. np = 14 y np2 = 28

Tabla de anlisis de varianza


Fuente de SC G.L. CM FC
Variacin
Sujetos 1153.43 13
Perodo 11.57 1
Tratamiento 137.28 1 137.29 19.12
Error 86.14 12 7.18
Totales 1388.43 27
F 0.05;1,12= 4.74
F 0.01;1,12=9.33, por lo que s existe una diferencia altamente significativa entre los dos
tratamientos.

Cmo sera un diseo conmutativo en el que se prueben 3 tratamientos?


Se emplearan secuencias de cuadros latinos de 3 x 3 y un esquema podra ser el siguiente:
Sujeto 1 2 3 4 5 6 7 8 9
Perodo
Inicio A C B A B C C B A
Intermedio B A A C C A B A C
Final C B C B A B A C B

Ejercicio:
Una industria farmacutica desea probar dos drogas. Dispone de 12 personas. Se eligieron 6
personas al azar para recibir la droga 1 primero. Las otras 6 recibieron la droga 2 Despus
de un perodo suficiente de limpieza (washout), las 6 quienes recibieron la droga 1,
recibieron ahora la droga 2 y las 6 que primero recibieron la droga 2 recibieron ahora la
droga 1.

Orden 1: Droga 2, Droga 1


D2 51.9 35.1 38.6 36.1 34.6 39.7
D1 58.5 60.4 50.4 58.7 64.8 54.9

Orden 2: Droga 1, Droga 2


D1 50.8 41.1 39.1 35.7 33.7 31.2
D2 62.2 51.4 50.7 51.1 51.4 45.1

Determine si hay diferencia entre las drogas.

CUADRO GRECOLATINO

Este es un diseo en el que se manejan 3 restricciones en la aleatorizacin y se denota por


letras griegas , , etc. Existen tres fuentes de bloqueo cuyos efectos no se quieren estimar. El
arreglo se presenta a continuacin:
134

Columnas
I II III IV
1 A B C D
Filas 2 B A D C
3 C D A B
4 D C B A

Un ejemplo propuesto por Wu y Hamada (2000) puede ser que deseemos comparar tres
aditivos de gasolina probndolos en tres autos con tres automovilistas en tres das. Los aditivos
son los tratamientos asignados con las letra latina A, B y C. Los carros, automovilistas y das
son los factores de bloqueo asignados a las filas, columnas y letras griegas.

Modelo

yijkl = + i + j + k + l + ijkl

Este tipo de diseo no se usa con frecuencia ya que rara vez las unidades experimentales
pueden balancearse en los tres tratamientos, (Cochran, 1965). Si en el ejemplo citado en la
seccin de bloques completos (ejemplo de lodos de fosa sptica y nitratos en el agua) se cree
que la posicin en la que se coloque el lodo puede incrementar el error y se piensa que existen
diferencias entre las posiciones, se puede adicionar como una tercera fuente de bloqueo y
analizarlo mediante un cuadro grecolatino.

Los cuadros son ortogonales, ninguna letra griega aparece ms de una vez con cada
letra latina. Cada letra griega se presenta slo una vez en cada rengln y en cada columna.
La suma de cuadrados debida a la letra griega puede calcularse sumando los totales o
promedios de cada letra griega.
La ventaja principal de utilizar un cuadro grecolatino es que se permite controlar 3 fuentes de
variacin. Pero sus desventajas es que el nmero de unidades experimentales requeridas
aumenta muy rpidamente el aumentar el nmero de tratamientos a comparar. Si los cuadros
son pequeos el nmero de grados de libertad del error es pequeo, si se pierden datos se
complica el anlisis y es muy difcil un balance entre tres agrupaciones.
Si el cuadro es pequeo los grados del error son muy pequeos:
Si p = 3, los g.l. del error = 0
p = 4, g.l. error = 3.
Para cuadros grecolatinos grandes se requieren muchas unidades experimentales. Por ejemplo
si p = 12 se requieren 144 unidades experimentales.

Ejemplo:
Una medida compuesta de la calidad de la pantalla se tomaron en pantallas que usaron cuatro
concentraciones de laca, cuatro tiempos, cuatro concentraciones del acriloide (A, B, C y D) y
cuatro concentraciones de acetona (. , y ).
135

Concentracin de laca
Tiempos 0.5 1 1.5 2
30 C = 16 B = 12 D = 17 A = 11
20 B = 15 C = 14 A =15 D = 14
10 A = 12 D = 6 B = 14 C = 13
5 D = 9 A = 9 C = 8 B = 8

Realice el anlisis completo de estos datos.

Se conduce un experimento para comparar cuatro aditivos de gasolina y se prueban en cuatro


coches con cuatro conductores en un perodo de cuatro das. Slo cuatro corridas se pueden
llevar a cabo cada da. La respuesta es la cantidad de emisin del automvil.
Los tratamientos son: aditivos A, B, C y D
Los conductores son las filas, los das las columnas y las letras griegas los automviles.

Obtener la tabla de Anlisis de varianza aplicando las siguientes frmulas de sumas de


cuadrados
136

Bloques incompletos balanceados

Este diseo se emplea cuando no se pueden aplicar todos los tratamientos dentro de cada
bloque. Es decir, no todos los tratamientos estn en todos los bloques. A estos tambin se
les conoce como diseos de bloques incompletos aleatorizados. Cuando todos los
tratamientos son igual de importantes, los tratamientos usados dentro de cada bloque deben
seleccionarse de modo balanceado o sea que cualquier par de tratamientos se presenten
juntos el mismo nmero de veces.
El nmero de tratamientos es a y el nmero de tratamientos dentro de cada bloque es k (k <
a).
Se puede construir un diseo de bloques incompletos balanceados tomando las
a
combinaciones bloques y asignando una combinacin diferente de tratamiento a cada
k
bloque.
Por ejemplo, si a = 5 y se cuenta con 5 bloques sera un diseo de bloques completos.
Si se trata de 5 tratamientos y 4 se pueden aplicar dentro de cada bloque, entonces existen
5!/4!1!=5 bloques con cuatro tratamientos cada uno.
Tambin 5!/3!2!=10 bloques con tres tratamientos cada uno.

En un diseo de bloques incompletos balanceados existen a tratamientos, b bloques, k


tratamientos por bloque y cada tratamiento ocurre r veces.

N= ar =bk

El valor es el nmero de veces que cualquier par de tratamientos Ai, Aj aparecen juntos.
Por ejemplo en el siguiente diseo:

B1 B2 B3 B4 B5 B6 B7
A1 X X X X
A2 X X X X
A3 X X X X
A4 X X X X
A5 X X X X
A6 X X X X
A7 X X X X

Puede observarse que los tratamientos 1 y 2 aparecen juntos en los bloques 1 y 3. Los
tratamientos 1 y 3 en los bloques 1 y 2; los tratamientos 1 y 4 en los bloques 2 y 6, es decir
el valor de es igual a 2. Tambin puede observarse que el nmero de veces que aparece
cada tratamiento, o bien r, es igual a 4.

Con k niveles de A pareados con cada nivel de B el nivel Ai estar apareado con k-1 otros
niveles de A dentro de cada nivel de B con el que est apareado.
Si Ai est apareado con r diferentes niveles de B, entonces el nmero de veces que parece Ai
combinado con otros niveles de A es r(k-1).
137

Por otro lado, debido a que cada nivel de A est pareado con cada otro nivel de A veces,
el nmero de veces que Ai est apareado con cada uno de los otros (a-1) niveles de A debe
ser (a-1) por lo tanto es cierto que:
r(k-1=(a-1) y

En este ejemplo a = 7, b =7, r =4 y k = 4 de modo que


r (k 1) 4(3)
2
a 1 6
El parmetro debe ser un entero.
Las caractersticas de un diseo de bloques incompletos balanceados pueden enumerarse:
1. El nmero de tratamientos excede al tamao del bloque
2. Cada tratamiento se repite igualmente.
3. Cada par de tratamientos ocurre en exactamente bloques
4. Se tiene la misma precisin para todas las medias y para todas las comparaciones de
medias.

Para que sea un diseo de bloques incompletos balanceados debe cubrir tres condiciones:
1) ar = bk
2) r(k-1) = (a-1)
3) b a

En el libro Statistical Design and Analysis of Experiments with applications to Engineering


and Science (1989) de Robert L. Mason, Richard F. Gunst and James L. Hess, se presentan
listados los diseos de bloques incompletes balanceados.

Si se trata de un diseo en el que quieren compararse siete tratamientos y se tienen 7


bloques pero slo se pueden probar 4 tratamientos por bloque y cada tratamiento ocurre 4
veces, vemos que se trata del diseo nmero 13.

La aleatorizacin de un diseo de bloques incompletos consiste en seleccionar un diseo


con los valores elegidos de los parmetros.

En el ejemplo, se trata del diseo 13 que se describe a continuacin:

Diseo 13.
a=7 k=4 r=4 b=7 =2

Bloque
(1) 3 5 6 7
(2) 1 4 6 7
(3) 1 2 5 7
(4) 1 2 3 6
(5) 2 3 4 7
(6) 1 3 4 5
(7) 2 4 5 6
138

Una vez seleccionado el diseo, entonces se aleatorizan los tratamientos a las unidades
experimentales de cada bloque: es decir en dos urnas colocar los tratamientos y en la otra
las unidades experimentales de ese bloque. Hacer una aleatorizacin diferente por bloque.

Suponga que se quiere comparar 5 tratamientos pero los bloques solo pueden soportar 4
tratamientos.
5
a) Se pueden formar 5 bloques
4

b) Asigne cada uno de las k diferentes combinaciones de tratamientos a los bloques:

1234
1235
1245
1345
2345

c) El nmero de rplicas es:

a 1 4
4 rplicas
k 1 3

d) es el nmero de veces que aparece cada par de tratamientos en los bloques

a 2 5 2
3
k 2 4 2

Ejemplo: Un ingeniero estudia las caractersticas de 5 tipos de aditivos de gasolina, para


esto observa el kilometraje obtenido al utilizar cada uno de los aditivos. En la prueba de
carretera se utilizan autos como bloques pero a causa de limitaciones en el tiempo se usa el
diseo de bloques incompletos balanceados.
En este ejemplo a son los aditivos =5, b son los automviles = 5, r es el nmero de veces
que aparece cada aditivo o nmero de niveles de B apareados con cada nivel Ai y es igual a
4, y k es el nmero de tratamientos por bloque o nmero de niveles de A apareados con
cada bloque Bj. = 4.
4(3)
3
4

Consultando el apndice se observa que se trata del diseo 5.

Diseo 5
139

(1) 1 2 3 4
(2) 1 2 3 5
(3) 1 2 4 5
(4) 1 3 4 5
(5) 2 3 4 5

Automviles
1 2 3 4 5 Yi.
1 17 14 13 12 56
2 14 14 13 10 51
3 12 13 12 9 46
4 13 11 11 12 47
5 11 12 10 8 41
y.j 50 54 48 50 39 241

Los diseos de bloques incompletos balanceados son balanceados en el sentido de que cada
nivel del factor ocurre en exactamente r bloques y cada par de tratamientos ocurren juntos
exactamente veces.

El modelo es el mismo que el de bloques completos aleatorizados.

Hiptesis
Ho: i = j ij
H1: i j para al menos una i y una j

Supuestos
a

=0i
i=1
n

=0
j=1
j

ij _ N(0, 2 )
Sumas de Cuadrados
140

a b
SCT y ij2 fc
i 1 j 1
a
k Qi2
i 1
SCTratadj
a
1 b
Qi y i . nij y. j
k j 1
b y .2j
SC Bloque fc
j 1 k
Se puede observar que hay un ajuste en la suma de cuadrados de los tratamientos porque cada
tratamiento es representado en un juego diferente de r bloques. Por lo tanto las diferencias
entre totales no ajustados son afectados tambin por las diferencias entre bloques.
En las frmulas anteriores los Qi son los totales ajustados para cada tratamiento; nij es 1 0 ;,
1 si el tratamiento aparece en el bloque y 0 si el tratamiento no aparece en el bloque y
1 b
nij y. j es el promedio de los totales de los bloques en los que se aplica el tratamiento i.
k j 1
La suma de los Qi = 0

En el ejemplo:
SCT=2981-(241)2/20=76.95

50 2 54 2 48 2 50 2 39 2
SC Auto 2904.5 31.2
4
1
Q1 56 54 48 50 39 8.25
4
1
Q2 51 50 54 50 39 2.75
4
1
Q3 46 50 48 50 39 0.75
4
1
Q4 47 50 54 48 50 3.5
4
1
Q5 41 50 54 48 39 6.75
4

SC Adivadj

4 8.25 2 2.75 2 ( 0.75) 2 ( 3.5) 2 ( 6.75) 2
35.73

3(5)
SC E 76.95 31.20 35.73 10.02

Grados de Libertad
Aditivos: a-1 5-1 = 4
Autos: b-1 5-1 = 4
Error: Dif. 11
Total N-1 19
141

De modo que la tabla de anlisis de varianza quedara as:


Fuente de SC G.L. CM Fc
Variacin
Aditivos 35.733 4 8.93 9.8
Autos 31.2 4 7.8
Error 10.02 11 0.91
Total 76.95 19
F0.05;4,11=3.36
Decisin: Como 9.8 es mayor que3.36 se rechaza Ho lo que en trminos del problema significa
que s hay diferencia entre aditivos.

Estimacin de Parmetros
Eliminando las comparaciones entre bloques sobre los efectos de tratamiento
y..
kQi
i
a

En el ejemplo se puede comprobar que:


1=2.2
2=0.73
3=-0.2
4=-0.93
5=-1.8

Comparaciones Mltiples
Si deseamos probar las siguientes hiptesis:
Ho : 1 2 0
Ho : 3( 1 2 ) 2( 3 4 5 )
Ho: Efecto lineal de 3,4 y 5
Ho: Efecto cuadrtico de 3,4 y5

Los contrastes seran:

C1: 1(8.25)-1(2.75)=5.5
C2: 3(8.25+2.75)-2(-0.75-3.5-6.75)=-6
C3:-1(-0.75)+0(-3.5)+1(-6.75)=-6
C4:-1(-0.75)+2(-3.5)+1(-6.75)=-13

Las sumas de cuadrados de los contrastes se calcularan as:


142

2
a
k c Q i i

SCCi a

a ci2

de este modo las sumas de cuadrados de los contrastes seran:

SCc1=4.03
SCc2=26.89
SCc3=4.8
SC4c4=7.51

Para ver si son o no significativos los contrastes, cada suma de cuadrados tiene 1 grado de
libertad, se comparara contra el CME.

Y se tiene que F1=4.43


F2=29.52
F3=5.27
F4=8.24
Comparando contra una F decon 1 y 11 grados de libertad 4.84. No hay diferencia entre los
aditivos 1 y 2. Pero todos los dems contrastes s son significativos.

Si se quisiera aplicar la prueba de Duncan el error estndar para los efectos de tratamientos
ajustados es:
kCM E
S
a
Y lo que se comparara son los efectos de los tratamientos ms que las medias. Para la DSM :

2kCM E
S
a

Prueba de Scheff
El contraste que se quiere probar es:

k
c
i i
a
ci Qi

El error estndar de cada contraste se calcula por la frmula:

a
k
SCC c
I 1
2
i
a
CM E

Y el valor de Scheff

S SCH SCc (a 1) F ;a 1,bk b a 1


143

El error estndar de las medias ajustadas que tambin puede utilizarse en las comparaciones
mltiples como en los intervalos de confianza y lo que se compara son las medias ajustadas
ajust i :

k (a 1) 1
CME
a
2
N
Tarea: Aplique la prueba de Duncan en el ejemplo anterior.

Ejercicios Sugeridos:
1. Cmo quedara el anlisis si aparte de que es un diseo incompleto se pierde algn dato, en
el ejemplo la observacin del aditivo 3 y auto 3?
2. Leer Recuperacin de la informacin interbloque.
3. Se utiliz un diseo de bloques incompletos balanceados para estudiar la ganancia en
peso en 3 vacas con cuatro diferentes raciones. Las raciones se dieron en 4 semanas. Los
datos se presentan a continuacin. Considere las semanas como los bloques y las raciones
son los tratamientos.

Semanas A B C D
1 2 - 20 7
2 - 32 14 3
3 4 13 31 -
4 0 23 - 11

a) Calcule el valor de
b) Realice el anlisis de varianza con los totales de los tratamientos ajustados y
los totales de los bloques ajustados, establezca sus conclusiones.
c) Construya contrastes ortogonales y compare los totales de tratamiento
ajustados
d) Realice la prueba de Duncan.
Este ejemplo se obtuvo del sitio www.stat.psu/~prem/Lec6.html.

También podría gustarte