Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD DE MATEMTICAS
DISEO DE EXPERIMENTOS
Antecedentes Histricos.
Su mtodo opera con la premisa de que los datos no se ajustan perfectamente a una
distribucin normal. Recolectan datos rpida e iterativamente. Los diseos de
Taguchi se aplican en la industria de manufactura. Estos diseos conocidos como
diseos paramtricos robustos reconocen dos tipos de variables en un experimento,
aqullos que se pueden controlar y que denomina parmetros y aqullos que no se
pueden controlar y que denomina factores de ruido. Los diseos consisten en
combinar fracciones de diseos factoriales (donde los factores son los parmetros)
con los factores de ruido y se determina la mejor combinacin que produzca la
respuesta deseada y con la menor variacin. Aqulla combinacin que produzca
estas condiciones recibe el nombre de robusto. Y el inters de la metodologa de
Taguchi es encontrar aquellas condiciones de un proceso que sea poco sensible a los
cambios ambientales o de ruido. Esta metodologa an despierta controversias por
cuanto a la estrategia experimental y sus mtodos presentan problemas.
En 1951 Box y Hunter contribuyen con anlisis de diseos compuestos en la
superficie de respuesta.
En 1954 Tukey y Scheff desarrollan mtodos para comparaciones mltiples.
En 1957 Box trabaja con la metodologa de superficies de respuesta.
En 1960 se desarrollaron los diseos Box Behnken
En 1961 Box y Hunter trabajan en los diseos fraccionarios de resolucin 2k-p.
Otros que han contribuido al desarrollo del DDE son Kempthorne, Cox, Myers etc.
A partir de las controversias que se han generado con la metodologa de Taguchi y
con el amplio uso del diseo de experimentos en todo campo se inicia la cuarta era
del desarrollo del diseo de experimentos
Alrededor de 1998 Mikel Harry comenz a propagar la metodologa Seis Sigma,
integrndolo al DE en una secuencia Medicin Anlisis- Mejora- Control, cuyo
objetivo es mejorar ambos: manufactura y proceso transaccional o comercial. Hay otra
secuencia para la formulacin: Identificar- Disear- Optimizar- Verificar que se utiliza
para desarrollar nuevos productos y procesos.
4
Qu es un experimento?
Antes de plantear un experimento es importante responder a la siguiente pregunta para qu
se va a realizar o qu propsito se persigue para realizarlo?. Puede llevarse a cabo para
determinar las causas de variacin de una variable dependiente o respuesta, para encontrar
las condiciones que dan lugar a una respuesta mxima o mnima, para comparar las
respuestas que se obtienen trabajando las variables independientes a distintos valores o
niveles, o bien para obtener un modelo matemtico que permita predecir respuestas en el
futuro. En pocas palabras, los experimentos los realizan los investigadores para descubrir
algo acerca de un proceso o de un sistema en particular.
Cobb G. (1998) en su libro Introduction to Design and Analysis of Experiments recalca que
al disear un experimento es importante decidir Qu mediciones hacer? Qu condiciones
estudiar? Y Qu material experimental utilizar? Y que planear un experimento es el
resultado de la formulacin de una pregunta. Algo que se desea saber lleva a la formulacin
de una pregunta. En general cuando se plantea la pregunta, sta suele ser muy general y
difcil de responder. Lo primero que hay que hacer es convertirla en una pregunta ms
especfica que pueda responderse planteando un experimento.
Kelly Acampora est interesada en saber lo que pasa cuando los animales invernan,
especficamente desea estudiar cmo los cambios en el ambiente animal causan que el
animal comience a invernar.
El diseo debe comenzar con decidir las preguntas por responder, pero no debe limitarse a
una pregunta muy general como la que se plante Kelly. Hay que ser ms especfico y para
esto Kelly tuvo que enfrentarse a las siguientes preguntas:
Ella sabe que los animales invernan cuando llega esta estacin, y sabe que hay ms fro y
que el da es ms corto (fotoperodo corto).
Kelly decidi enfocarse a la segunda clase de cambio. Cambios en el fotoperodo.
Qu animal estudiar?
Kelly se decide por los hmsteres dorados y no los osos, por razones obvias.
Hasta aqu Kelly se decidi por tres cosas. Estudiar el efecto de la longitud del da
(tratamientos) para medir la concentracin de la enzima Na ATP-asa y usar hmsteres
dorados. Y con estas decisiones una pregunta muy general se convierte en una ms
especfica.
Un experimento es una prueba o serie de pruebas en las cuales se hacen cambios sobre las
variables de entrada de un proceso de manera que se puedan observar o identificar las
razones de los cambios en la variable de salida o respuesta.
y 40 de una escuela particular. Desea eliminar el efecto que podra ejercer la procedencia
del alumno para solamente evaluar los cuatro mtodos de enseanza.
En los siguientes ejemplos proporcione mentalmente cules son los factores, cul la
variable respuesta y proponga algunos factores no controlables y controlables que pueden
presentarse en cada experimento.
Se trata de comprobar si el repaso es una variable decisiva para retener una lista de
palabras monoslabas de igual valor asociativo. Se establecen los siguientes niveles de
repaso (variable independiente A): A1 una sola presentacin de la lista, A2 dos
presentaciones de la lista con idntica tasa de presentacin, A3 Tres presentaciones de la
lista, A4 cuatro presentaciones. Despus de las correspondientes lecturas se pasa a una
prueba de retencin y se contabiliza la cantidad de palabras recordadas correctamente.
Es importante sealar que las verdaderas inferencias de causa-efecto slo pueden obtenerse
de verdaderos experimentos y no tanto de estudios observacionales. Por ejemplo, si en una
fbrica los productos que salen de una mquina comienzan a salir defectuosos, con un
estudio observacional, podra suponerse que se debe a la mquina, al operador o a las
condiciones climticas del sitio en el que se encuentra ubicada la mquina, pero si se realiza
el experimento de cambiar de mquina, probar con distintos operadores o cambiar de
ubicacin la mquina dentro de la misma fbrica, podra llegarse a descubrir la causa de
porqu el producto sale defectuoso.
Es importante sealar que los experimentos que se plantean con regularidad son
comparativos, es decir se interesan en comparar distintos tratamientos y muchas veces es
con el objeto de seleccionar al mejor o al que produce una respuesta dada. Sin embargo,
nuestro objetivo no debe limitarse a buscar al ganador, sino a realmente comparar los
tratamientos observando cul es el efecto de cada uno de ellos en la respuesta. Un
tratamiento puede producir el mejor rendimiento pero puede ser de muy alto costo o puede
producir el ms alto rendimiento, pero tambin el ms variable.
Diseo de experimentos
Disear un experimento consiste en PLANEARLO de tal forma que se recolecten los datos
adecuados, los cuales sern analizados por mtodos estadsticos que den como resultados
conclusiones vlidas y objetivas (Montgomery, 1995).
Se deben planear de modo que las comparaciones estn lejos de un error sistemtico, que
sean suficientemente precisos, que las conclusiones tengan un amplio rango de validez, que
8
el arreglo experimental sea tan simple como sea posible y que la incertidumbre de las
conclusiones sea calculable (Cox, 1958).
Cobb (1998) considera que para disear un experimento y una vez que se haya definido el
problema con claridad hay que tratar de identificar las fuentes de variabilidad que pudieran
afectar en el experimento:
1. variabilidad debida a las condiciones de inters.
2. variabilidad debida al proceso de medicin.
3. variabilidad debida al material experimental y al proceso.
Aparentemente hay diferencia ya que los promedios difieren, y vemos que hay mucha
variabilidad 0.3 y de 0.24. Se necesita estimar cunto de la diferencia entre promedios es
debido a la longitud del da y cunto es debido a otras fuentes.
Variabilidad de las condiciones de inters- variacin del fotoperodo.
Es decir la fuente de variacin que si se quiere y se estima el efecto del fotoperiodo, para
elegir el rgano donde se medir la enzima. La concentracin de la enzima depende del
rgano que se mida. Kelly decidi estudiar dos rganos: corazn y cerebro. Se pregunt
hay diferente en el cerebro y corazn de los hmsteres? Ella sabe que en el cerebro
concentracin es mayor. La longitud del fotoperiodo afectar la concentracin de la enzima
del mismo modo en el cerebro y en el corazn. Es de esperar que debido a que tienen
distintas funciones, el cerebro y el corazn se comporten distinto cuando estn listos para
invernar. Es decir evala si existe interaccin, el efecto del fotoperodo depende del
rgano donde se mide la enzima?
Das largos vs. Das cortos.
Cerebros vs. Corazones.
La otra variabilidad es en la respuesta:
Cuando mides dos cosas bajo las mismas condiciones nunca obtienes un nmero idntico.
Nuestro experimento debe permitirnos estimar el tamao de la diferencia debido a tal
variabilidad inevitable en el proceso de medicin.
Para determinar la concentracin de la enzima, Kelly tuvo que sacrificar al hmster, separar
el tejido y usar una metodologa o secuencia de pasos para suspender la enzima en un
lquido y, como paso final, medir la concentracin de la enzima usando un
espectrofotmetro para medir la cantidad de luz absorbida por partculas suspendidas. En
cada etapa de todo el experimento habr cosas que producirn diferencias. Comenzando por
la diseccin, este es un proceso difcil, particularmente por que se desea el tejido "puro", a
la hora de leer en el equipo, an calibrndose, en cada corrida de mediciones se introducir
la variabilidad cada vez que se calibre el espectrofotmetro.
2) Proceso de medicin:
- Preparacin en suspensin de la enzima.
- Calibracin del espectrofotmetro.
10
3) En el material experimental:
Diferencias biolgicas entre hmsteres.
Diferencias de ambiente y comportamiento.
Ejercicio
Elige un artculo de investigacin del rea e identifica los siguientes puntos:
a) Problema
b) Hiptesis de investigacin
13
inferencia, es decir las unidades y los tratamientos a los que van a aplicarse las
conclusiones. Es importante que el experimento sea descrito con tal detalle que hasta las
posibles fuentes de error sean consideradas de antemano.
5. Resultados. Esta seccin nos dice lo que encontr. Expresar los resultados en forma
tabular. Utilizar grfica si es necesario. Tablas como grficas deben tener ttulos, y las
variables deben expresarse con sus unidades de medicin. Discuta todas las fuentes de
error y describa cmo podran afectar los resultados. Muestre tambin el proceso de
aleatorizacin de los tratamientos a las unidades experimentales y del orden de las
corridas experimentales.
6. Anlisis de resultados: Esta es la parte ms importante a evaluar en esta asignatura.
Presente estadsticos de resumen con su interpretacin (anlisis exploratorio de los
datos) Realice el anlisis de varianza completo desde la formulacin del modelo hasta
la potencia de la prueba. Proporcione las interpretaciones en trminos del problema.
7. Discusin y Conclusiones. Trate de presentar los principios, relaciones,
generalizaciones que indiquen los resultados; no recapitular resultados. Para hacer
generalizaciones se tiene que tener en cuenta si las unidades experimentales son
representativas de la poblacin, es decir hay que tomar en cuenta el espacio inferencia.
Seale excepciones o faltas de correlacin, delimite aspectos no resueltos. Muestre
cmo concuerdan sus resultados con los de la bibliografa consultada o con la hiptesis
que propuso, formule conclusiones lo ms claramente posible. Igualmente proporcione
ideas para un estudio futuro con el objeto de mejorar el actual.
8. Referencias. Debe incluir el listado de libros o artculos de revistas. Dentro del texto
Ud. puede emplear el sistema Harvard (Nombre, ao) y de las referencias completas en
esta seccin como se muestra a continuacin:
Fowler, H. W. (1983), Dictionary of Modern English Usage (2nd edition revised by Ernes
Gowers), Oxford University Press, Oxford and New York.
Gowers, Sir Ernest (1973), The Complete Plain Word (2nd edition revised by Sir Bruce
Fraser), Penguin Books, Harmondsworth, Middlesex.
Respecto a la presentacin el reporte debe ser atractivo a la vista; debe ser claro y legible.
Trate de usar un procesador de textos.
Factores
Son las variables que se controlan y cuyo efecto se mide, es decir, las variables
independientes. Su efecto se mide sobre las unidades experimentales.
Las variables independientes deben ser manipulables a niveles del inters del investigador.
Los niveles pueden ser: varias clases o tipos (cualitativo) o varias magnitudes o cantidades
(cuantitativos).
Tambin es de inters el rango de la variable independiente a ser incluida en el
experimento, especialmente si se trata de estudiar el efecto de un factor cuantitativo. El
rango debe ser tal que s se puedan observar cambios en la respuesta al cambiar de nivel.
Debe ser un rango completo de variacin as como condiciones intermedias para
17
Variable respuesta.
Una vez que hemos propuesto una hiptesis hay que detallar el estudio para
recolectar los datos. Se debe decidir el aspecto particular del fenmeno que observaremos y
qu mediciones se harn, qu mediciones capturan el fenmeno ms exactamente. Un
experimento que involucra una simple variable dependiente es un experimento univariado
aunque se est estudiando ms de una variable independiente. Para elegir la variable
respuesta se debe elegir aqulla que sea la ms sensible a las condiciones de tratamiento.
La medicin, esto es la asignacin de etiquetas o nmeros a los atributos de los
objetos o eventos, es un aspecto muy completo. Se supone que es deseable que los valores
de la variable dependiente tengan poca variabilidad de sujeto a sujeto (condiciones
genticas parecidas en las semillas, por ejemplo). Esto incrementar la precisin en las
estimaciones y contribuir a la potencia estadstica para cualquier tamao de muestra.
Tambin la variable dependiente se distribuye normalmente ya que muchos procedimientos
estadsticos paramtricos inferenciales suponen normalidad. Es deseable que la variable
respuesta sea cuantitativa y continua.
Variables suplementarias.
Existen otras variables independientes que pueden afectar a la respuesta pero que no son de
inters del investigador, se les llama suplementarias o Nuisance. Es necesario controlar
estas variables para incrementar la precisin con la cual se pueden estimar los efectos de la
variable independiente o para remover el sesgo de esas estimaciones. Hay dos formas de
controlarla: Directamente (experimentalmente, a travs del bloqueo), indirectamente (como
covariables) o si no se pueden controlar quedan comprendidas dentro del trmino de error.
18
Tambin estn incluidas aqullas que pueden afectar a la respuesta, que no se pueden
controlar a niveles fijos como bloques, ni mediante control indirecto (como covariable),
pero s se pueden mantener a un nico valor o nivel; las conclusiones se limitaran a esos
niveles estudiados. Por ejemplo si estamos estudiando el efecto de la dieta en el incremento
de peso de los cochinitos, y se consiguieron unidades experimentales similares (corrales
con cerditos de aproximadamente el mismo peso inicial) y se sabe que la raza puede
afectar, pueden elegirse cerditos de la misma raza y las conclusiones se limitarn a esta
raza, no podrn hacerse extrapolaciones a otras.
Rplica.
Es la repeticin del experimento bsico. Es decir una rplica contiene todas las
combinaciones de tratamiento del experimento. La rplica permite darnos una idea de que
un tratamiento es diferente a otro. Mead proporciona un ejemplo en el que son dos
productores de cierto cultivo. El agricultor A produce 24.1 y 24.2 kilogramos del cultivo y
el agricultor B produjo 21.4. Gracias a la rplica se puede uno dar cuenta de que existe
diferencia y de que sta es grande.
Para representar a una poblacin se requiere de rplicas, ya que una unidad no da idea de
cmo es la poblacin. Debido a que no todos los elementos de una poblacin son iguales,
requerimos de rplicas que nos indiquen la variabilidad de la poblacin. Mientras ms
variable es la poblacin, se requerirn ms rplicas para adecuadamente representarla. No
hay que caer en la tentacin de tratar una repeticin o una pseudorrplica como verdadera
rplica.
Es importante distinguir entre rplica y repeticin, por ejemplo si se asignan 10 plntulas a
cada tipo de fertilizante el resultado consiste en 10 mediciones independientes de la altura
final de plantas sometidas a un fertilizante, esto es son 10 rplicas. Pero si a una planta se le
lee la altura 10 veces entonces son repeticiones de una lectura, son mediciones repetidas y
no son independientes. La variacin en las mediciones repetidas refleja la variabilidad en el
proceso de medicin y la variacin entre rplicas refleja la variabilidad de las unidades
experimentales sometidas al mismo tratamiento.
Algunas veces uno est tentado a partir el campo en rplicas o parcelas ms pequeas, no
confundir. Por ejemplo suponga que se desea evaluar el efecto de ciertas dietas en el
incremento en peso del puerco. Suponga que desea comparar 4 dietas en el incremento en
peso y la unidad experimental a la que se aplic el tratamiento son los corrales, ya que al
corral completo con sus 5 puerquitos se les da la dieta como a un todo. Suponga que hay 8
corrales de modo que cada dieta se puede aplicar nicamente a dos corrales. De este modo
hay nicamente dos rplicas por tratamiento. La tentacin es usar como rplicas a los
puerquitos individuales, as tendramos 10. Esto sera incorrecto por las siguientes razones.
1) el puerquito no es la unidad experimental, sino que es el corral. De otro modo habra que
alimentar al cochinito en forma individual. 2) La variacin entre cochinitos dentro de un
corral es muy similar a la variacin en diferentes corrales con el mismo tratamiento. Y no
hay forma de evaluar la variacin dentro del corral por lo que no se puede usar para
comparar las dietas.
Las rplicas permiten al experimentador tener una estimacin del error experimental.
Esta medicin se convierte en la unidad bsica de medicin para determinar si las
diferencias observadas en los datos son estadsticamente significativas. El uso de rplicas
tambin permite:
ejercer control sobre la varianza del error, .
19
Error experimental.
Es una medida de la variacin existente entre las unidades experimentales tratadas en forma
similar. Es la variacin no controlada ni como variable independiente, ni como
suplementaria controlada- entre las unidades experimentales sometidas al mismo
tratamiento.
Se pueden distinguir varias fuentes de error:
1. La variabilidad inherente al material experimental al cual se aplican los
tratamientos.
2. La falta de uniformidad en la realizacin del experimento.
3. La variabilidad debida a la medicin de la variable respuesta.
4. No es posible reproducir las condiciones del tratamiento exactamente de una unidad
a otra.
5. Factores externos que puedan influir en las caractersticas medidas.
El problema anterior tiene el inconveniente que los grupos si no son parecidos entre s,
estarn confundidos con los mtodos de enseanza. Una mejor manera de probar ambos
mtodos hubiera sido juntar a los dos grupos en uno solo y seleccionar al azar los miembros
de cada grupo, y asignar al azar los mtodos a cada grupo.
Bloqueo.
Es una tcnica de control estadstico y se usa para incrementar la precisin de un
experimento. Un bloque es una porcin de material experimental que es ms
homogneo que la totalidad. La tcnica de bloqueo se utiliza cuando existen variables
que afectan a la variable respuesta y que no interesa investigar; se puede controlar a
determinados valores constituyendo los bloques. A cada bloque se le asignan al azar
los tratamientos de modo que es posible averiguar su efecto sin importar esa otra
variable que se maneja como bloque reduciendo as la magnitud del error e
incrementando la precisin del experimento. En los diseos de bloques en muy
comn utilizar como factor de bloqueo, la proximidad de las parcelas: parcelas
vecinas son similares en fertilidad, tipo de suelo, etc.; las caractersticas fsicas de
las unidades experimentales:, individuos de una misma camada son ms similares
entre s que los de diferente camada.; el tiempo:, las determinaciones realizadas en un
da por ejemplo son ms similares entre s que las realizadas en distintos das; los
lotes de materia prima:, se puede realizar una rplica del experimento con un solo
lote, y abrir un nuevo frasco o lote del reactivo para realizar otra rplica del
experimento; el personal que realiza las determinaciones: cada tcnico puede realizar
una rplica del experimento y no cada tcnico un solo tratamiento pues si hay
diferencias entre tratamientos no se sabr si esta diferencia es real o a que los tcnicos
aunque realizan la misma determinacin con la misma metodologa la realizan en
forma diferente.
Ortogonalidad
Ortogonalidad de factores: dos factores FI y FJ con I y J niveles, respectivamente, son
ortogonales si en cada nivel i de F I el nmero de observaciones de los J niveles de F J estn
en las mismas proporciones. Esta propiedad permite separar los efectos simples de los
factores en estudio.
Control local
Se refiere a las acciones que se realizan para controlar o disminuir el error experimental.
Estas acciones incluyen:
Ejercicio
Modelo Lineal
Describe a una observacin y consta de una media y un error. Establece que para valores
fijos de una o ms variables independientes se puede expresar la variable dependiente como
una combinacin lineal de un conjunto de variables independientes.
Supongamos que (.) es una funcin lineal de la variable x.
( x ) o 1 x
donde o y 1 son parmetros desconocidos.
x est en un dominio D.
(x) es una funcin lineal de una variable real x
x es una variable no aleatoria observable.
Se supone que para cada valor de x, existe una familia de funciones de distribucin
acumulada, de tal modo que la media de la funcin correspondiente a un valor de x,
digamos xo, es o+1xo.
Las medias de las funciones de distribucin (cdf) caen en una lnea definida por:
( x) o 1 x
E(yi)=o+1xi
Var (yi)=2
Los modelos son lineales en los parmetros es decir los parmetros estn expuestos a la
potencia 1.
i yi o 1 xi
Se llama error o residuo a la diferencia de ordenada de un punto muestral y la recta de
regresin correspondiente a la misma abscisa. Ntese que el error es una funcin de los
parmetros del intercepto y la pendiente. Por lo que un criterio razonable para seleccionar
estimadores para estos parmetros es elegir aquellos que minimicen la suma de cuadrados
del error. ste es el principio del Mtodo de Mnimos Cuadrados y los estimadores
resultantes reciben el nombre de estimadores mnimos cuadrados.
Este mtodo consiste en minimizar los errores, es decir, las diferencias entre los
valores observados y los de la recta de regresin ajustada, o sea se estimarn aquellos
valores o y 1 de la recta que hagan mnima la diferencia entre dicha recta y los valores
observados.
El mtodo de mnimos cuadrados establece que de todas las rectas de regresin que se
pueden ajustar al conjunto de puntos muestrales dados, la mejor es aquella que tenga la
propiedad de que la suma de los cuadrados de los errores sea mnima.
n
min i2 min ( yi o 1 xi ) 2
i 1
L ( yi o 1 xi ) 2
Para esto se aplicar la condicin necesaria conocida para que una funcin de dos variables
independientes tenga un punto extremo (mnimo en este caso), es decir se igualar a cero
las primeras derivadas parciales de la funcin, con respecto a cada una de sus variables.
25
L
0
0
L
0
1
L n
2 yi ( o 1 xi ) 1
o i 1
n
2 yi o 1 xi
i 1
2 yi n o 1 xi 0
no 1 xi yi
L n
2 yi ( o 1 xi ) ( xi )
1 I 01
2 ( xi yi o xi 1 xi2 )
2 xi yi o xi 1 xi2 0
o xi 1 xi2 xi yi
Agrupando las ecuaciones se obtiene un sistema de dos ecuaciones con dos incgnitas cuya
solucin proporciona las estimaciones de los parmetros:
n n
( 0)
n xi yi
xi yi i 1 i 1
n
1 i 1
2
n
n
x i
x
i 1
2
i
i 1
n
n
( 0)
n xi
i 1
yi
x y i i
i 1
n
1 i 1
2
n
n
x i
x
i 1
i
2
i 1
o y 1 x ( 0)
En un modelo lineal, los estimadores de mnimos cuadrados son los mejores estimadores
lineales;, entre todos los estimadores, stos son los que tienen mnima varianza.
Distribucin F de Fisher
( 0)
( 0)
( 9)
Forma de la Distribucin
27
F; 1 y 2,
Teorema de Cochran
Z
i 1
i
2
Q1 Q2 ... Qs
Anlisis de varianza
El anlisis de varianza es un diseo eficiente para cuando se trata de comparar en
forma simultnea ms de dos tratamientos.
Es una tcnica por medio de la cual la variacin total se divide en varias componentes,
en el caso ms sencillo en una debido a los tratamientos y otra debida a la variacin aleatoria.
Por lo tanto, la intencin del anlisis de varianza es determinar si las diferencias entre las
medias de las muestras debidas a las variables estudiadas son significativas.
Para la realizacin de un anlisis de varianza se consideran los siguientes pasos:
1.- Establecimiento de un modelo.
El modelo consiste de una representacin simblica de un valor tpico tomado de los datos que
se analizan. Por ejemplo el modelo de un anlisis de varianza de una va es el siguiente:
yi j = + i + i j
donde, yij es una observacin del experimento, de hecho es la j-sima observacin bajo el i-
simo tratamiento del experimento.
es la media global del experimento
i es el efecto del i-simo tratamiento
i j es el trmino de error; es el j-simo error bajo el i-simo tratamiento. Hay tantos errores
como observaciones.
2.- Todo modelo se fundamente en supuestos, y cuya violacin implica no trabajar con el
nivel especificado.
Un ejemplo de supuesto en el que se apoya el anlisis de varianza es la distribucin normal e
independiente de los errores.
3.- Hiptesis son los enunciados que se quieren probar. Se indican la hiptesis nula y la
hiptesis alternativa. Las conclusiones se dan en trminos de la hiptesis nula, es decir se
acepta o se rechaza la hiptesis nula de igualdad de medias.
4.- Clculos o divisin de las sumas de cuadrados. La variabilidad de un conjunto de datos es
proporcional a la suma de cuadrados de las desviaciones
n y
( - y)2 ( 0)
SC =
i
i=1 n 1
6.- Los intervalos de confianza para las medias de tratamientos dan una idea de la
variabilidad de las observaciones respecto a la media debido a la aleatorizacin.
7.- Verificacin de los supuestos del modelo, lo cual implica checar los supuestos de
normalidad, independencia y homogeneidad de varianza sobre los que se apoya el anlisis de
varianza.
8.- Potencia de la prueba. Determinacin del tamao n de la muestra.
30
Ejercicio
Especifique quines son las unidades experimentales, los o el factor, los niveles de los
factores, el espacio inferencia, la variable respuesta. Qu otras variables podran influir en la
respuesta? Cules se pueden controlar a un solo nivel y cules a varios niveles? Cules de
stas no pueden controlarse pero s pueden medirse para tomar en cuenta su efecto? Cules
de ellas no se pueden controlar y es inevitable que sean la causa del error? Especifique el
espacio inferencia. Sugiera cmo sera la aleatorizacin. Proponga el arreglo experimental.
respecto al desenvolvimiento del alumno y su postura frente al deporte. Distingue dos tipos de
climas :motivacionales: aqullos entornos en los que se fomenta la competencia interpersonal,
la evaluacin pblica y la retroalimentacin normativa sobre el desempeo de las tareas
promueven la aparicin de un estado de implicacin al ego, Y los entornos que enfatizan el
proceso de aprendizaje, la participacin, el dominio de la tarea individualizado y la resolucin
de problemas tienden a fomentar la aparicin de la implicacin a la tarea. Los individuos que
implican a la tarea sern persistentes ante las dificultades, creen que la motivacin y el
esfuerzo son las cusas del xito, prefieren tareas desafiantes y la satisfaccin. La
retroalimentacin que reciben los muchachos cuando estn en su clase de educacin fsica
puede ejercer un efecto en: la percepcin clima de implicacin, en la percepcin clima de
implicacin al ego, en la valoracin de las clases de educacin fsica, en la preferencia por las
tareas fciles y en la preferencia por las tareas difciles. Para el estudio se cont con un grupo
21 estudiantes, 12 muchachos y 9 muchachas entre 14 y 16 aos. Se les dividi en tres grupos
1, 2 y control, El primero recibi retroalimentacin negativa, el segundo retroalimentacin
positiva y el ltimo, (la misma cantidad de retroalimentacin positiva y negativa). Previo a la
realizacin del experimento se realiz un anlisis de varianza de una va para comparar estos
tres grupos en cuanto a las 5 variables respuesta y se observ que no haba diferencia entre los
tres grupos por lo que se utiliz un diseo completamente aleatorizado para realizar el anlisis
una vez que se aplicaron los tres tipos de retroalimentacin a los grupos formados. Para medir
las variables respuesta se utiliz un instrumento con varios tems que correspondan a las
variables respuesta y que fueron medidas en escala Likert.
Cuando se desean comparar ms de dos poblaciones, no es adecuado aplicar pruebas t
consecutivas entre cada par pues el nivel de significancia con el que se pretende trabajar se
incrementa. Por ejemplo si se tienen 4 tratamientos o medias se tendran que realizar 6
comparaciones por parejas. Si decimos que estamos trabajando con un 95% de confianza y
corremos un 5% de probabilidad de cometer el error tipo I, en realidad estamos trabajando con
(0.95)6 de confianza y con 1-(0.95)6 de significacin. El error tipo I se ha incrementado de
0.05 a 0.2649 y esto sera el caso de que las seis comparaciones fueran independientes lo que
no siempre sucede. Como esto no siempre es cierto (independencia de las comparaciones) la
probabilidad de cometer el error tipo I es mayor que 0.05 pero no se sabe a cuanto asciende.
Por esta razn R. A. Fisher propone una prueba que considera ms de dos poblaciones y que
es el anlisis de varianza.
En el anlisis de varianza de una va se investiga un factor o variable y se averigua si
existen diferencias entre los "a" niveles del factor" o si existe efecto de tal factor sobre la
variable respuesta. El diseo recibe el nombre de completamente aleatorizado porque no se
aplica ninguna restriccin en la aleatorizacin como lo hace el bloqueo, es decir, los
tratamientos se aplican aleatoriamente a las unidades experimentales; stas tienen las mismas
probabilidades de ser asignadas a los tratamientos por lo que se espera que las unidades
experimentales sean lo ms homogneas posibles.
Efecto de los tratamientos. Los a tratamientos pueden ser seleccionados
especficamente por el experimentador. En esta situacin se desea probar la hiptesis sobre las
medias de los tratamientos y slo se aplican a los niveles del factor considerado en el anlisis.
Las conclusiones no pueden hacerse extensivas a tratamientos similares que no se hayan
considerado dentro del modelo. En este modelo se supone que las a muestras son
independientes, cada una tiene una distribucin normal y, finalmente, que las varianzas de las
a poblaciones son iguales. A este modelo se le llama de efectos fijos (Modelo I) a diferencia
del modelo (II) de efectos aleatorios en que los a tratamientos pueden ser una muestra
32
Las filas representan las observaciones y las columnas los tratamientos o bien, los
niveles del factor.
Aqu se emple el subndice i para denotar al tratamiento y el subndice j para denotar
el nmero de la observacin. La notacin punto de Yi. -indica que se ha sumado sobre el
segundo suscrito j.
Es importante hacer notar que algunas veces se utilizan los estudios comparativos por
observacin. En estos estudios el investigador no puede asignar al azar las unidades a los
tratamientos. Por ejemplo, que se desee evaluar un fertilizante en distintos tipos de campos,
pastizales, henequn y maizales, por ejemplo. Las poblaciones de tratamiento ya estn
formadas de modo natural, lo nico sera seleccionar al azar sendas muestras de los distintos
tipos de campos y aplicarles el fertilizante. El factor sera CAMPO, y sus niveles, pastizal,
henequn y maz.
Modelo
Una observacin tpica del diseo se representa por un modelo que como ya se ha dicho se
compone de una media y un error.
y ij i ij
33
A este modelo se le conoce como modelo de medias. Y nos dice que el puntaje de un
tratamiento i tiene dos fuentes de variacin, el efecto de la media del i-simo tratamiento y el
trmino de error.
i i
yi j = + i+ ij i= 1, 2,...,..., a;
j= 1, 2,...,..., n
individuales respecto a la gran media es cero.
i j es el componente de error aleatorio. Representa todas las fuentes no controladas de
varianza que afectan a las mediciones individuales. ste es nico para cada uno de los
elementos de la poblacin (de ah que tiene los mismos subndices) y se supone que es
independiente de los tratamientos.
yi j = + ij
Este se conoce como modelo reducido y corresponde al modelo cuando la hiptesis nula de
igualdad de medias es cierta.
Resumen: Una observacin yij se expresa como la suma de 3 componentes: una componente
constante, para todas los tratamientos y todos los elementos. Una componente i constante
para todos los elementos dentro de la poblacin de tratamientos pero que pueden diferir de
tratamiento a tratamiento. Y un componente aleatorio que es independiente de los tratamientos
y se distribuye normalmente como media cero y varianza 2.
34
Supuestos
Puesto que ambas fuentes de variacin y i son constantes para todas las observaciones
dentro de la i-sima poblacin, la nica fuente de variabilidad de estas mediciones es debida al
error experimental.
Se supone que las a muestras proceden de a poblaciones que se distribuyen normalmente. Se
supone tambin que son a muestras aleatorias y que por consiguiente son independientes entre
s y los elementos dentro de cada muestra tambin son independientes. Se supone que las
poblaciones de las que se extraen las muestras tienen una varianza comn o varianza
homognea.
Si los elementos se asignan al azar a las condiciones de tratamiento se tiene cierta certeza de
que los efectos del error son independientes de los tratamientos, de ah la importancia de la
aleatorizacin. Igualmente debido a la aleatorizacin se supone que los errores se distribuyen
dentro de cada poblacin normalmente distribuida con valor esperado igual a cero y varianza
2. Resumiendo,
iv) i = 0; esto significa que se trata de un modelo de efectos fijos. i es el efecto del i-
simo tratamiento y es igual a la diferencia i -
. La suma de los efectos de
tratamiento es cero para el caso de efectos fijos. Y esto implica que es la media de
las medias i. En el diseo de efectos fijos, dado que el inters se centra nicamente en
los a tratamientos, la suma de los desvos o efectos i es cero, en cambio en los efectos
aleatorios no suman cero debido a que slo se extrae una muestra aleatoria de a
niveles del factor de una poblacin grande de niveles del factor, de modo que no se
conoce la media global y mucho menos la suma de los desvos es cero.
Hiptesis
Puede verse que el modelo bajo la hiptesis nula es el modelo reducido, y el modelo completo
es el que corresponde a la hiptesis alternativa.
Los modelos que corresponden a los diseos experimentales pertenecen a una clase general de
modelos, modelo lineal general, en el que la respuesta est en funcin lineal de un conjunto de
parmetros: el ejemplo por excelencia es el modelo de regresin lineal, en el que las xj
corresponden a las variables independientes mtricas. Igualmente el modelo de un factor
puede expresarse como un modelo lineal general pero la variable independiente que es el
factor puede dar lugar a un conjunto de a variables ficticias (dummy) o indicadoras.
y 1 X 1 2 X 2 3 X 3
La variable ficticia indica el grupo de tratamiento al que pertenece la observacin, x tendr el
valor de 1 si pertenece a cierto grupo y de cero si no pertenece a dicho grupo. Por ejemplo
podemos definir para un experimento con tres tratamientos tres variables indicadoras que
toman los valores de 1 y 0 segn si pertenecen al i-simo grupo o no pertenecen a l.
1 del tratamiento 1
x1
0 de otro tratamiento
1 del tratamiento 2
x2
0 de otro tratamiento
1 del tratamiento 3
x3
0 de otro tratamiento
La ventaja de estos modelos es que se permite incluir a las covariables. De este modo si el
inters se centra en comparar medias de un factor y se toma en cuenta a una covariable el
modelo de medias quedara as:
yij i 1 X ij ij
Pregunta de Investigacin:
Existen diferencias en el rendimiento promedio del trigo (kg/Ha2) con los diferentes
fertilizantes?
Hiptesis de investigacin
El fertilizante a base de amonio, particularmente el sulfato de amonio, promueve ms
exitosamente el crecimiento de las plantas que los fertilizantes de amida.
Diseo empleado
Para evaluar la hiptesis incluy al fertilizante sulfato de amonio, la ciamida y la ciamida-
dietanoldiamida. Emplea un diseo completamente aleatorizado y a cada parcela se le asign
al azar un fertilizante y se sembraron semillas de trigo y que tambin fueron seleccionadas al
azar. A cada parcela se le roci el fertilizante asignado y en el orden asignado al azar, de
manera independiente. Al cabo de 45 das se determin el rendimiento (Kg/ha 2) El
experimento se realiz en un campo situado en el cono sur del Estado, entre Oxkutzcab y
Yotholin. Las caractersticas de las parcelas de tierra son muy similares entre s, tierra roja,
muy frtil y de una porosidad idnea para el cultivo de trigo. Se control con exactitud la
frecuencia de riego, calidad del agua, hora de riego. Quedaron fuera del control del
experimentador, las condiciones climticas y la accin de animales silvestres que atraviesan el
campo y aves.
El investigador comienza por numerar todas las parcelas y de stas selecciona al azar 30, las
re etiqueta del 1 al 30, asigna al azar las parcelas a los tratamiento y aleatoriza el orden en que
llevar a cabo el experimento.
A continuacin se presentan los resultados, y son los rendimientos del trigo cosechados y que
se miden en kg/Ha2.
Modelo
yi j = + i + ij ; i = 1, 2 y 3
j = 1,2,..., 10
donde,
yij es el j-simo rendimiento bajo el i-simo fertilizante.
es el efecto comn para todo el experimento o bien la gran media.
i es el efecto del i-simo fertilizante y,
ij es el error aleatorio presente en la j-sima observacin bajo el i-simo fertilizante.
El modelo lineal puede escribirse como uno de regresin con la variable x = fertilizante.
Debido a que son tres fertilizantes definiremos dos variables indicadoras.
X1 X2 X3
Sulfato de Amonio 1 0 0
Ciamida 0 1 0
Ciamida-Dietanoldiamida 0 0 1
El modelo sera
y 1 X 1 2 X 2 3 X 3
Y = 1 + e
Tambin podran haberse creado dos variables Dummy con los siguientes valores:
X1 X2
Sulfato de Amonio 0 0
Ciamida 1 0
Ciamida-Dietanoldiamida 0 1
Supuestos
Los errores se distribuyen normal e independientemente con media cero y varianza (ij
~NID(0,. ).
Es un anlisis de efectos fijos, por lo que: i= 0. Es decir, estamos interesados nicamente
en estos tres fertilizantes.
Hiptesis
Ho: 1= 2= 3.
En palabras, Los tres fertilizantes producen el mismo rendimiento.
Si la hiptesis nula es cierta, significa que los tres fertilizantes producen en promedio el
mismo rendimiento del trigo;, y si se rechaza la hiptesis nula significa que existen diferencias
al menos entre un par de ellos.
Las frmulas de las sumas de cuadrados se obtienen a partir del modelo. En el modelo de una
va, y partiendo del conocimiento de los estimadores de los parmetros, a saber:
y..
i yi. y..
y ij yi .
y ij y.. y i. y.. y ij y i.
y ij y.. y i. y.. y ij y i.
Elevando al cuadrado y sumando sobre todos los trminos se tendra:
Se puede notar que el trmino de la izquierda corresponde a la suma de cuadrados total y que
la parte derecha corresponde a un binomio al cuadrado, por esto, esta suma de cuadrados se
puede expresar en trminos de sus componentes:
a n
SCT = [( y i . - y.. )2 + 2( y i . - y..)( yij - y i .) + ( yij - y i . )2 ]
i=1 j=1
y.. yij yi. yi. y.. y yi .
a n a n
y i. ij
i 1 j 1 i 1 j 1
y y i . yi . n i . 0
n
y
ij
j 1 n
La primera suma no tiene a j como subndice por ello puede escribirse como:
a n a
( y . - y. ) = n ( y . - y. )
2 2
i i
i=1 j=1 i=1
de aqu que,
( 0)
a an
SCT = n ( yi.- y. )+( yij - yi. ) 2
ij i
2
( y - y . )
j=1
si2
n 1
Y es una estimacin de 2 y si se supone que es homognea o es la misma para todos los
grupos de tratamiento, entonces
41
y yi .
a n
2 ( 0)
ij
i 1 j 1
s2
a(n 1)
SC E ( 0)
s2
a (n 1)
Las sumas de cuadradas tienen la propiedad de ser aditivas, por consiguiente la SC del error
puede calcularse de la siguiente manera:
a n
1 a ( 0)
SC E yij2 yi2.
i 1 j 1 n i 1
O bien,
SC error = SC total - SC tratamiento ( 0)
Las sumas de cuadrados reflejan el grado en el cual los nmeros de un conjunto varan entre
s. Cuando no hay variabilidad, o sea cuando los nmeros son parecidos, cada desviacin de la
media ser o se aproximar a cero y la suma de las desviaciones al cuadrado tambin ser
cero.
Grados de libertad
La cantidad n-1 de la frmula de varianza de una muestra recibe el nombre de grados
de libertad. El nmero de grados de libertad de una suma de cuadrados es igual al nmero de
trminos independientes de dicha suma. La SC = (yi- y) consiste en la suma de cuadrados
de los n elementos: y1- y , ..., yn- y . Estos elementos no son todos independientes ya que
(yi- y ) = 0, por lo que slo n-1 son independientes, y SC tiene n-1 g. l. Para la SC total por
ejemplo el nmero de grados de libertad es N-1, el 1 representa la contribucin de la media.
42
Cuadrados medios
Los cuadrados medios proporcionan una estimacin insesgada de la varianza. Si las
sumas de cuadrados se dividen entre sus grados de libertad correspondientes a cada fuente de
variacin, entonces se obtienen las frmulas de los cuadrados medios o estimaciones de la
varianza:
CMTrat = SCtrat/(a-1) ( 0)
CMerror = S error/(an-a) ( 0)
Los cuadrados medios esperados de los tratamientos y del error servirn para obtener los
estadsticos de prueba, que en estos diseos se trata de pruebas F o razn de varianzas.
Supuestamente bajo la hiptesis nula de que las medias de los tratamientos son iguales los
valores esperados del cuadrado medio de tratamientos y cuadrado medio de error son
estimaciones insesgadas de la varianza poblacional 2. Sin embargo el valor esperado del
cuadrado medio del error es siempre 2 an cuando la hiptesis nula sea falsa. Lo que pasa es
que el CME refleja el promedio de las varianzas de los tratamientos por separado y son
independientes de si existe o no diferencia entre las medias. En cambio el valor esperado del
cuadrado medio de tratamientos como depende de la variacin de las medias de los
tratamientos y la gran media, pues si es afectada por si la hiptesis nula es verdadera o falsa. Si
la hiptesis nula es verdadera las diferencias de las medias individuales respecto a la gran
media son muy pequeas y el valor esperado del cuadrado medio de tratamientos es 2. Si por
el contrario, las medias de tratamiento son muy grandes, la diferencia de stas respecto a la
gran media, ser grande, y el valor esperado es igual a 2 ms una cantidad que refleje esta
gran variabilidad entre tratamientos. Esto se entiende si conocemos los valores esperados de
los cuadrados medios:
ni
esta suma de cuadrados del error (que son las varianzas mancomunadas) entre sus grados de
libertad se obtiene el cuadrado medio del error. (Hicks y Turner, 1999).
Teorema de Cochran:
Se puede demostrar que estos cuadrados medios siguen una distribucin . Dado que la suma
de grados de libertad de los tratamientos y del error es igual al nmero total de grados de
libertad, estos cuadrados medios siguen una distribucin . Y el teorema implica que el
cociente SCtrat/2 y el cociente SCE/2 son variables aleatorias ji-cuadrada con sus respectivos
grados de libertad. Por lo tanto si la hiptesis nula de igualdad de medias de tratamiento es
verdadera, la razn de varianzas:
Fo = SC trat/(a-1) = CM trat
SC error/(N-a) = CM error
sigue una distribucin F con a-1 y N-a grados de libertad (Montgomery, 1995). Con este
estadstico F se prueba la hiptesis:
H0: 1 = 2 = 3.
E (CM E ) 2 ( 0)
En palabras, esto significa que si se hiciera un nmero infinito de veces el experimento, con
los mismos niveles y el mismo nmero de rplicas, y en cada experimento se calcula el valor
del CME por ejemplo, entonces en promedio se obtendra el valor de 2. El valor esperado de
los cuadrados medios sirven finalmente para conocer qu razones F son vlidas, es decir, si se
quiere probar que una fuente de variacin es significativa, los cuadrados medios permiten
conocer que cuadrados medios constituirn el numerador y denominador de la prueba F. Se
dejar en el numerador aquella fuente de variacin que se quiere probar y como denominador
aquel cuadrado medio que contenga todos los trminos a excepcin del que se desea probar.
La utilidad de los valores esperados de los cuadrados medios, se ver cuando se trate las
pruebas F directas, conservadoras y mancomunadas en el captulo de diseos factoriales. Por
el momento nos limitaremos a obtener el valor esperado del cuadrado medio del error para
tener una nocin de cmo se obtienen.
1
E
N a
( y 2
ij 2 yij yi . yi2. )
1
E
N a
y 2y2
ij ij yi . yi2. )
1 a a
E
N a
y 2 yi . yi . n yi2. )
2
ij
i 1 i 1
1 y a
E
N a
yij2 2 yi. ni. n i 1
yi2. )
1 n yi. a
E
N a
y 2
ij 2
n
yi. n yi2. )
n i 1
1 yi. yi. a
E
N a
yij2 2n n n
n yi2. )
i 1
1 a a
E
N a
ij
y 2
2 n
i 1
y i.
2
n
i 1
yi2. )
1 a
E
N a
yij2 ni 1
yi2. )
1 yi2.
E
N a
y 2
ij n
n2
)
1 1
E
N a
y 2
ij n
n2
y 2
i. )
1 1
E
N a
y 2
ij
n
yi2. )
De la misma manera puede obtenerse el valor esperado del cuadrado medio de tratamientos.
a ( 0)
n i2
E (CM Trat ) 2 i 1
a 1
a 2
i
E (CM Trat ) n 2 i 1
a 1
46
donde, el segundo trmino es la varianza de las medias de los tratamientos. El CMTrat estima
una combinacin de la varianza del error y la varianza entre las medias de los tratamientos.
Si la hiptesis nula es falsa significa que i es diferente de cero y que este componente es
grande por lo que no constituye una estimacin de la varianza poblacional. Sino que es la
varianza poblacional ms los efectos de tratamientos.
En el ejemplo,
SCT 231,616
2608 2 4893.87
30
f .c. 226,722.13
10312 7452 832 2
SC fertilizante 226,722.13 4298.87
10
SC E 231,616
10312 7452 832 2 595.00
10
SC E 4893.87 4298.87 595
Fuente de SC G.L. CM F
Variacin
Trat. 4,298.87 2 2149.33 97.53
Error 595 27 22.0370
Total 4,893.87 29
F 0.05(2,27) = 3.35
97.5327>> 3.35 por lo que se rechaza la hiptesis nula de igualdad de medias. Es decir,
existen diferencias altamente significativas entre los tres tipos de fertilizantes.
47
Las salidas de cmputo vienen con una columna adicional que corresponde al valor p, la
probabilidad de exceder el valor del estadstico de prueba bajo la hiptesis nula, de ah que
se denote Pr > F. Un valor de 0.000 es la probabilidad de que el estadstico F con los
respectivos grados de libertad del numerador y denominador sea mayor que el F C obtenido
de los clculos. En el ejemplo existe una probabilidad 0.000 de que el F de la tabla F
exceda el valor de 97.5327. Es improbable que el valor F sea mayor que el F calculado. Por
lo que existe evidencia suficiente para rechazar Ho.
Podemos tambin decir que es la probabilidad asociada al estadstico de prueba (al que
calculamos), una p ms pequea que el nivel de significancia elegido conduce al rechazo de
la hiptesis nula.
A B C D
1.93 2.55 2.40 2.33
2.38 2.72 2.68 2.40
2.20 2.75 2.31 2.28
2.25 2.70 2.28 2.25
Resolviendo,
Sumas de Cuadrados
SCT 92.97
38.41 2 0.76
16
8.76 2 10.72 2 9.67 2 9.26 2
SCTrat 92.21 0.52
4
SC E 0.76 0.52 0.24
Cuadrados medios:
CMfbricas = 0.52/3 = 0.17
CME = 0.24/12 = 0.02
F
48
F = CMfbricas/CME
F = 0.17/0.02= 8.53
F0.05;3,12 = 3.49
F0.01;3,12 = 5.95
Como el valor del estadstico de prueba es mayor que el valor de la tabla para 0.05 y an
ms, hasta para un nivel de 0.01, significa que existe diferencia altamente significativa
entre la prdida de peso promedio de las cuatro fbricas.
-
Tabla de anlisis
Fuente de SC G.L. CM F
Variacin
Fbricas 0.52 3 0.17 8.53
Error 0.24 12 0.02
Total 0.76 15
Como el valor de F obtenido es mayor que el de la tabla se puede decir que s existe efecto
del factor fbricas, en la prdida de peso. Habra entonces que determinar entre qu medias
se encuentra la diferencia.
Ejercicio Propuesto:
(Little y Hills, 1976)
Se desean probar tres tipos diferentes de hormonas, cada una en una dosis nica, para
determinar sus efectos sobre la capacidad de aumento de peso de las ovejas. Entonces,
incluyendo el control, tenemos cuatros tratamientos. Los 16 grupos de ovejas asignados al
experimento se numeran del 1 al 16. Empleando la tabla de nmeros aleatorios se asignan
al azar los grupos 14, 13, 8 y 9 al tratamiento A, y as sucesivamente.
Existen diferencias en el crecimiento promedio de las ovejas que reciben los 4 tipos de
hormonas?
49
Antes de proseguir con el anlisis para averiguar entre qu par de medias radica la diferencia,
es necesario estimar los parmetros del modelo para verificar si se cumplen los supuestos. Si
stos no se cumplen y se viola de manera significativa algn supuesto, la validez de la prueba
F es cuestionable y la probabilidad de cometer el error tipo I es mayor que el que se declara,
llegando muchas veces a conclusiones falsas, de ah la importancia de no proseguir con la
comparacin de medias, sino hasta que se est seguro de la validez de la prueba F. Una vez
que se pruebe que s se cumplen, ya es posible hacer las comparaciones de medias.
yij = + i + ij
Los valores poblacionales no pueden conocerse a partir de una muestra; antes bien se
proporcionan estimaciones de cada uno de los componentes del modelo, esto se indica con un
circunflejo arriba del smbolo del parmetro: , .
El residuo es:
eij yij y ij
eij yij i
Se trata pues de estimar los valores de los parmetros que minimicen la suma de cuadrados:
a n
L = ( yij - - i )2
i= j=1
L
=0
,
L
=0
,
50
a n
L ij2 ( y ij i
2
i 1 j 1
2 y ij i
y ij N n1 n2 n3 0
L
2 y ij n n1 0
n
1 j 1
L
2 y ij n n2 0
n
2 j 1
L
2 y ij n n3 0
n
3 j 1
n
yij n n 1 0
j 1
n
yij n n 2 0
j 1
n
yij n n 3 0
j 1
= 0
i=1
i
Para el ejemplo:
= 2608/30 = 86.9
y 1. = 103.1
y2. = 74.5
y3. = 83.2
1 = 103.1 - 86.9 = 16.2
2 = 74.5 - 86.9 =-12.4
3 = 83.2 - 86.9 = -3.7
i = 0
Los efectos de los tratamientos nos dicen qu tanto se alejan las observaciones de la media
global.
Si se observa la magnitud de los efectos parece que el tratamiento 3 es el ms distanciado, y
si observamos el signo de los efectos los tratamientos 2 y 3 tienden a disminuir los
rendimientos mientras que el sulfato de amonio produce mayores rendimientos. Al observar
magnitud y signo se puede decir que el que menos se aleja de la gran media es el
tratamiento de dietanoldiamida y el que ms se aleja es el sulfato de amonio desvindose
positivamente respecto a la media global.
Intervalos de confianza
Proporcionan una idea de la precisin del experimento; reflejan la variabilidad debida
al proceso de muestreo aleatorizado. Asimismo proporcionan una idea de qu tratamientos son
similares y cules son diferentes. Puede observarse tambin cul es el que produce mayor o
menor respuesta. Se construyen intervalos de confianza por cada media de tratamiento.
Recurdese que el intervalo de confianza supone que para una muestra distribuida
normalmente con media y varianza 2 el intervalo de confianza para la media est dado por:
Y z1 2 n ( 0)
En resumen, si se supone que los errores estn normal e independientemente distribuidos con
media 0 y varianza , las yi . se distribuyen normalmente con media i y varianza
CM E ( 0)
yi. t/2,N -a
n
: [99.95, 106.0]
1
2: [71.45, 77.55]
2: [80.15, 86.25]
Esto significa que el 95% de las veces el valor medio de rendimiento con el sulfato de
amonio caer entre 99.95 y 106.05, el valor medio del rendimiento con la ciamida caer entre
71.45 y 77.55 y entre 80.15 y 86.25 para la dietanolamida.
Para verificar los supuestos del anlisis de varianza, no es conveniente hacerlo con los datos
crudos porque pueden estar influenciados por los factores de inters y por lo tanto no tendrn
una media comn. La verificacin se aplica a los residuos ya que stos no tienen el
inconveniente de ser afectados por los factores, ellos tienen una media comn igual a cero.
Los supuestos se checan con observaciones que sean independientes de si la hiptesis nula es
cierta o no, ya que no tiene sentido que la validez de la prueba descanse en si se rechaza o no
la hiptesis nula; los datos crudos tienen el inconveniente de que dependen de su media de
tratamiento individual y esto repercute en las diferencias entre tratamientos. Los residuos por
su parte al tener una media comn igual a cero, no dependen de si la hiptesis nula es cierta o
no, de hecho es lo que queda de la variabilidad de los datos no atribuible a los tratamientos,
por esta razn se emplean para verificar los supuestos.
Tambin pueden verificarse con los datos crudos dentro de un mismo tratamiento ya que
tienen una media comn yi., con estos datos no se podra checar que las varianzas de las a
poblaciones son homogneas, de ah que se empleen los residuos y as es posible verificar
53
todos los supuestos. Es importante recordar que los residuos son estimadores de los errores, ya
que no es posible conocer al verdadero valor poblacional de las medias de los tratamientos.
A pesar de esto, se pueden presentar, de los datos crudos, los estadsticos descriptivos
siguientes:
Resumen Estadstico para Rendimiento
Se puede observar que las medias y medianas son parecidas por lo que puede decirse que la
distribucin no es de asimetra muy significativa.
yij = + i + ij
eij ( 0)
d ij
CME
Estos residuos tienen media cero y varianza 1. Es decir, d ij ~N(0,1). Los residuos crudos
estimados que pertenecen a un tratamiento no son independientes entre s y no tienen la misma
varianza especialmente cuando los tamaos de muestra son desiguales, de ah que se prefiera
utilizar los residuos estandarizados.
Para el examen de los residuos se emplean las grficas de residuos que consisten en las que se
grafican los residuos estandarizados contra los niveles de alguna variable tales como: valores
predichos, niveles del factor, orden o tiempo.
5
residual
0
-5
-10
-15
1 2 3
fertilizante
Los residuos se distribuyen alrededor del cero y no hay ni muy positivos ni muy negativos,
puede verse que no parece haber problema de ajuste ms bien puede notarse que la
dispersin de los residuos del fertilizante ciamida es ms grande que la dispersin de los de
los otros fertilizantes. Podra interpretarse como una seal de que la igualdad de varianzas
no se cumple.
Normalidad
La forma ms simple para verificar el supuesto de normalidad consiste en hacer un
histograma de los residuos y observar si tienen una distribucin normal (simtrica y en forma
de campana , con colas sin lmites, unimodal y con un valor de curtosis de 3), sin embargo, no
es til para tamaos de muestra pequea adems de que manipulando el nmero de intervalos
de clase puede aproximarse a una distribucin normal.
Otra manera de verificar la normalidad es por medio de grficas de residuos; una de ellas es la
grfica de probabilidad normal; los residuos se grafican en forma ascendente contra su
probabilidad acumulada: si se observa una lnea recta entonces los errores se distribuyen
55
normalmente; se observan desviaciones ms grandes en los extremos de la recta por lo que hay
que prestar ms atencin a los puntos intermedios que a los extremos.
El papel de probabilidad normal est diseado de modo que la distribucin normal acumulada
se graficar como una lnea recta. Para construir la grfica se siguen los siguientes pasos:
1. Ordenar los residuos de menor a mayor.
2. Calcular las probabilidades acumuladas
Las probabilidades acumuladas se calculan con la siguiente frmula:
k 0.375
y x100
n 0.25
donde k es el rango o posicin de la observacin. Otra frmula empleada es:
k 0.5
y x100
n
Sin embargo se considera menos exacta para muestras pequeas.
3. Graficar las probabilidades acumuladas contra los residuos. Usualmente si la
distribucin es normal queda una recta. Observe los puntos centrales es decir del 33 al
67%. Las desviaciones de la lnea recta indican no normalidad.
La desventaja de las grficas de probabilidad normal es que son subjetivas y requieren
juicios basados en la experiencia. Una lnea recta indica que hay poca evidencia para rechazar
el supuesto de normalidad. (Zylstra, 1995). A continuacin se presentan una serie de grficas
de probabilidad normal.
Una manera sencilla de analizar estos residuos es mediante los residuos estandarizados:
d ij =eij / CM E ( 0)
El 68% debe caer entre 1, alrededor del 95% entre 2, y prcticamente todos
(99.7%) deben estar entre 3. Un residuo a una distancia mayor de 3 o 4 desviaciones
estndar del origen es potencialmente un residuo distanciado.
Si se encuentra un valor atpico se realiza el anlisis con y sin el valor, si los resultados son
iguales, se deja el valor, pero si difieren en mucho, se dice que el valor atpico es de influencia.
57
-1
-2
-3
-4
.5 1.0 1.5 2.0 2.5 3.0 3.5
VAR00002
La grfica anterior permite detectar valores atpicos, sta es de residuos estandarizados contra
niveles del factor. Los residuos descansan entre +3 y -3, y slo uno, -3.09, se pasa ligeramente
por lo que puede considerarse que no es atpico.
Otra manera de verificar la normalidad es haciendo grficas de los residuos contra los valores
predichos y ij . La ausencia de algn patrn particular de comportamiento indica distribucin
normal de los errores.
Otra manera de checar la distribucin normal es demostrar si las medias y varianzas son
independientes. Puede demostrarse matemticamente que si tomamos muestras al azar de una
poblacin, los promedios y desviaciones estndar de las muestras sern independientes si la
poblacin tiene una distribucin normal.
Cuando la varianza es proporcional al promedio del grupo, al cuadrado del promedio del
grupo, al promedio elevado a la cuarta potencia existen transformaciones simples que harn la
varianza independiente del promedio. (Ms adelante se vern estas transformaciones).
Se utiliza el coeficiente de correlacin para probar esta independencia y a su vez normalidad.
Sin embargo Fang y Case (1996) han demostrado que con el coeficiente de correlacin, y por
consiguiente la prueba de normalidad, prueba ms bien simetra que normalidad, y no toda
distribucin simtrica corresponde a la normal.
Cuando hay outliers los niveles de confianza son ms bajos que los nominales, o dicho en
trminos de significancia, los niveles son ms altos que los nominales ( p > ).
80
50
20
5
1
0.1
-15 -10 -5 0 5 10 15
RESIDUALS
Independencia
Uno de los supuestos del anlisis de varianza es el de la independencia. Se supone
que las muestras asignadas a los tratamientos proceden de poblaciones infinitas, y que son
muestras aleatorias de esta poblacin, por esta razn se espera que las observaciones sean
independientes entre s dentro de cada grupo y entre los grupos. Una de las formas para
verificar este supuesto es graficando los valores de las observaciones (o de los residuos)
contra el tiempo o contra el orden en que fueron tomadas y contra cualquier arreglo espacial
de las correspondientes unidades experimentales; cualquier tendencia (rachas altas y rachas
bajas, o rachas alternadas que indican correlacin positiva y negativa respectivamente) indica
que quiz no hubo una buena aleatorizacin y por lo tanto que existe dependencia entre las
observaciones. Otro modo de checar este supuesto es mediante el clculo de la correlacin
serial entre observaciones adyacentes. Si la correlacin es diferente de cero, se dice que existe
dependencia entre las observaciones adyacentes. Si ocurre esto los estimadores de mnimos
cuadrados de los parmetros se ven afectados al igual que el cuadrado medio del error. ste
disminuye y por consiguiente la F aumenta, y se rechazar la hiptesis nula cuando debe
aceptarse (infla el error tipo I).
Existen pruebas para verificar si los errores estn o no correlacionados como la prueba
de Durbin-Watson (Hines y Montgomery, 1972).(Consltese, Dunn,1987). La prueba de
Durbin Watson slo es aplicable para datos de series de tiempo. Una buena aleatorizacin es la
que asegura la distribucin independiente de los errores.
59
Para verificar la independencia puede llevarse a cabo una prueba de aleatoriedad que es la
prueba de rachas. Esta se puede definir como una secuencia de observaciones con el mismo
signo (+ o -).
La prueba consiste en ordenar los residuos en el orden en que se obtuvieron los datos
respectivos. Contar el nmero de corridas r o rachas de resultados positivos (n 1) y contar el
nmero de corridas de residuos negativos (n2). Si N es menor o igual a 20, rechazar la
hiptesis de aleatoriedad si r < rL o si r > rU, donde rL y rU son los valores crticos de la tabla
A30 que se anexa a estas notas. Para tamaos de muestra grandes rechace la hiptesis de
aleatoriedad si z > z/2.
r 0.5 ( 0)
z
2n1n2 ( 0)
1
n1 n2
2n1n2 ( 2n1n2 n1 n2 ) ( 0)
( n1 n2 )(n1 n2 1)
Homogeneidad de varianzas
La homocedasticidad u homogeneidad de las varianzas es otro de los supuestos del
anlisis de varianza que supone que las varianzas de las a muestras tienen varianzas iguales
pues proceden de la misma poblacin infinita. La heterogeneidad de las varianzas no afecta
tanto en el modelo de efectos fijos y balanceado, pero s lo hace en el de efectos aleatorios y en
el caso desbalanceado.
Una manera de checar la homocedasticidad es mediante grficas de residuos contra los niveles
del factor, o bien de los residuos contra los valores predichos. Si las varianzas son iguales se
espera encontrar una banda.
60
Las varianzas de los tratamientos son distintas. Si esta misma forma se presenta en una grfica
de residuos contra valores predichos, significa que la varianza est en funcin de y, es decir,
aumenta con el valor de y, o en forma inversa, disminuye con el valor de y. Otro patrn que se
puede observar es el siguiente:
0
-5
-10
-15
74 79 84 89 94 99 104
predicted rendim
Existen pruebas estadsticas para checar la homogeneidad de varianzas, tal como la prueba de
Bartlett el cual es un estadstico con distribucin con a-1 grados de libertad. Para tamaos
de muestras iguales se emplea la prueba de Cochran que se usa para detectar si una varianza es
mucho mayor que las otras. Estas pruebas tienen la desventaja de que requieren gran nmero
61
de rplicas para que tengan potencia. Y la de Bartlett por ejemplo, es muy sensible a la no
normalidad.
La prueba de Cochran se restringe a situaciones donde existen tamaos de muestra
iguales, y se trata de demostrar que una varianza es mucho ms grande que las otras. El
estadstico de prueba es el siguiente:
S i
2 ( 0)
G= a
S 2
i
i=1
donde,
q = (N - a) log S 2p - (ni - 1) log S i2 ( 0)
y,
( 0)
1 1 1 a
c = 1+ -
3(a - 1) i=1 ( ni - 1) (N - a)
a ( 0)
( n - 1) S
i=1
i
2
i
Sp=
N -a
Prueba F max
Para a grupos de igual tamao (n) se calculan las varianzas si2. Encontrar la ms grande y la
ms pequea y calcular el estadstico F max
s2 ( 0)
Fmax max 2
F ;a , n 1
s min
62
Si el estadstico es mayor que el valor Fmax de la tabla, rechazar la hiptesis nula de igualdad
de varianzas. Esta prueba tambin es conocida como de Hartley quien proporciona la
distribucin de muestreo del estadstico F max. Los parmetros para esta distribucin son el
nmero a de tratamientos y los grados de libertad para cada una de las varianzas de los
tratamientos. En la siguiente pgina se presenta una porcin de la tabla F max.
Esta prueba es rpida, y es afectada por la no normalidad, y emplea una tabla que no en
cualquier texto se presenta.
63
Fmax Distribution
Column values are the number of groups.
Row values are (n-1) in each group.
2 3 4 5 6 7 8 9 10 11 12
.05 39 87.5 142 202 266 333 403 475 550 626 704
2
.01 199 448 729 1036 1362 1705 2063 2432 2813 3204 3605
.05 15.4 27.8 39.2 50.7 62 72.9 83.5 93.9 104 114 124
3
.01 47.5 85 120 151 184 216 249 281 310 337 361
.05 9.6 15.5 20.6 25.2 29.5 33.6 37.5 41.4 44.6 48 51.4
4
.01 23.2 37 49 59 69 79 89 97 106 113 120
.05 7.15 10.8 13.7 16.3 18.7 20.8 22.9 24.7 26.5 28.2 29.9
5
.01 14.9 22 28 33 38 42 46 50 54 57 60
.05 5.82 8.38 10.4 12.1 13.7 15.0 16.3 17.5 18.6 19.7 20.7
6
.01 11.1 15.5 19.1 22 25 27 30 32 34 36 37
.05 4.99 6.94 8.44 9.7 10.8 11.8 12.7 13.5 14.3 15.1 15.8
7
.01 8.89 12.1 14.5 16.5 18.4 20 22 23 24 26 27
.05 4.43 6.0 7.18 8.12 9.03 9.8 10.5 11.1 11.7 12.2 12.7
8
.01 7.5 9.9 11.7 13.2 14.5 15.8 16.9 17.9 18.9 19.8 21
.05 4.03 5.34 6.31 7.11 7.8 8.41 8.95 9.45 9.91 10.3 10.7
9
.01 6.54 8.5 9.9 11.1 12.1 13.1 13.9 14.7 15.3 16 16.6
.05 3.72 4.85 5.67 6.34 6.92 7.42 7.87 8.28 8.66 9.01 9.34
10
.01 5.85 7.4 8.6 9.6 10.4 11.1 11.8 12.4 12.9 13.4 13.9
.05 3.28 4.16 4.79 5.3 5.72 6.09 6.42 6.72 7.0 7.25 7.48
12
.01 4.91 6.1 6.9 7.6 8.2 8.7 9.1 9.5 9.96 10.2 10.6
.05 2.86 3.54 4.01 4.37 4.68 4.95 5.19 5.4 5.59 5.77 5.93
15
.01 4.07 4.9 5.5 6.0 6.4 6.7 7.1 7.3 7.5 7.8 8.0
.05 2.46 2.95 3.29 3.54 3.76 3.94 4.1 4.24 4.37 4.49 4.59
20
.01 3.32 3.8 4.3 4.6 4.9 5.1 5.3 5.5 5.6 5.8 5.9
.05 2.07 2.4 2.61 2.78 2.91 3.02 3.12 3.21 3.29 3.36 3.39
30
.01 2.63 3.0 3.3 3.4 3.6 3.7 3.8 3.9 4.0 4.1 4.2
.05 1.67 1.85 1.96 2.04 2.11 2.17 2.22 2.26 2.30 2.33 2.36
60
.01 1.96 2.2 2.3 2.4 2.4 2.5 2.5 2.6 2.6 2.7 2.7
.05 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00
inf
.01 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00
Prueba de Levene.
La hiptesis que se prueba es que las varianzas son iguales contra la alternativa de que al
menos un par es diferente, consiste en realizar un anlisis de varianza a las observaciones a
Las que se les ha restado las respectivas medias de los tratamientos. Si la prueba F es
significativa entonces se rechaza H0 de igualdad de varianzas
64
Una regla prctica que se aplica es comparar la varianza ms grande contra la ms pequea, si
el valor de
2
s grande s 2pequea > 3, entonces se dice que las varianzas no son iguales, aunque no
necesariamente sea as.
Si se trata de un diseo balanceado y una de las varianzas es considerablemente mayor que las
otras, los niveles de significancia varan slo ligeramente con respecto a los verdaderos
valores. Es decir, cuando se trata de diseos balanceados la heterocedasticidad afecta
ligeramente el nivel . Pero si se trata de diseos desbalanceados, el real parece verse
incrementado sobre el nominal, especialmente si las muestras ms pequeas presentan las
varianzas mayores. Si las muestras grandes tienen las varianzas mayores la prueba F es
conservadora, es decir, los niveles de significancia son similares a los reales. Pero para casos
desbalanceados se infla la probabilidad de cometer el error tipo I, es decir, que si se eligi
trabajar con un nivel nominal de 0.05 el nivel se incrementa por ejemplo a 0.058 lo que
conducira a rechazar dado que es verdadera. Si el estadstico tiene una probabilidad de 0.049,
yo rechazo, pero realmente deba haber aceptado por que el nivel de probabilidad real es de
0.058 y no 0.05.
Si hay desigualdad de varianzas pero las grficas de residuos contra valores predichos no son
de tipo megfono, no existe alguna transformacin adecuada, en cuyo caso se puede utilizar
un mtodo de anlisis de datos diseado para cuando las varianzas no son iguales y que es la
aproximacin de Satterwaite que viene explicada en el libro de diseo de experimentos de
Dean y Voss (1999).
Cuando las varianzas no son homogneas las comparaciones mltiples y por parejas son ms
fuertemente afectadas que el anlisis de varianza.
iii) Si los resultados de la prueba de homogeneidad est entre 0.01 y 0.001, tratar de
encontrar la distribucin terica de la distribucin. Si existe una razn prctica para
transformar, hacerlo. De otra manera, se recomienda no transformar. Probar con los
programas estadsticos las diversas transformaciones y las pruebas de homogeneidad
de varianzas y seleccionar aqul que estuviera mejor en la regin de aceptacin. Es
importante que pueda ser transformado y que esta transformacin tenga sentido.
66
Es importante recalcar que cuando se transforman los datos, los niveles de significancia y las
inferencias se aplican a la escala transformada, pero cuando se presenten las medias es
conveniente retransformarlas a la escala original que es donde tienen sentido. Igualmente los
intervalos de confianza dentro de los que descansan las medias se transforman a la escala
original, tngase en cuenta que cuando los datos se han transformado a logaritmo, al
retransformar a la escala original con antilogaritmo los valores de los intervalos de confianza
no son simtricos respecto a la media.
Potencia Yp Nombre
2 Y2 Elevacin al cuadrado
1 Y Dato crudo
Y Raz cuadrada
0 Ln(Y) Logaritmo natural
-1/2 1/Y Recproco de raz cuadrada
-1 1/y Recproco
Transformacin logartmica
Se emplea para estabilizar la varianza de Y si sta aumenta marcadamente conforme
se incrementa o dicho de otro modo cuando el cambio en la respuesta es de tipo
multiplicativo y no aditivo (ejemplo cuando trabajamos con bacterias la trasformacin
adecuada es la logartmica pues su curva de crecimiento es tipo exponencial); tambin se
emplea, para normalizar la variable dependiente si la distribucin de los residuos de Y esta
sesgada positivamente (es decir hay algunos valores muy grandes) y, para linealizar un
modelo de regresin si la relacin de Y con x sugiere un modelo con una pendiente
consistentemente en ascenso. (Modelo exponencial).
Elevacin al cuadrado
Se usa para estabilizar la varianza si sta disminuye con la media de Y, para
normalizar la variable dependiente si la distribucin de los residuos est negativamente
sesgada y, para linealizar el modelo si la relacin original es curvilnea hacia abajo (la
pendiente disminuye consistentemente conforma la variable independiente aumenta).
n
La transformacin arco seno es:
arcseno ( ) sen 1
+---------------------------------------------+
| Potencia Transformacin Re-expresin |
|---------------------------------------------|
| 3 Cubo x 3 |
| | Corrigen asimetra negativa
| 2 Cuadrado x 2 |
| |
| 1 NINGUNA x |
| |
| 1/2 Raz cuadrada raz x |
| |
Corrigen asimetra positiva
| 0 Log log10 x |
| |
| -1/2 raz del recproco -1/(raz x) |
| |
| -1 Recproco -1 / x |
+---------------------------------------------+
1. Preservan el orden de los valores; es decir, los valores mayores de la escala original
seguirn siendo los valores mayores en la escala transformada.
2. Modifican la distancia entre los valores. Con potencias p<1 (raz (x) o log (x) se
comprimen los datos en la parte superior de la distribucin en relacin a los valores
menores; Con potencias p>1 (como el cuadrado de x) se tiene el efecto contrario.
Las transformaciones de potencia pueden hacer que la variable transformada tenga menos
asimetra. Por qu es eso importante?
Las distribuciones que muestran una clara asimetra son difciles de estudiar.
Los mtodos estadsticos suelen emplear la media aritmtica; pero la media de una
distribucin asimtrica no es un buen ndice del grueso de los datos.
h( y ij ) * i* ij
Se supone que en este modelo transformado los errores ya cumplen con los supuestos de
normalidad, independencia y homogeneidad de varianzas.
Si la relacin entre las varianzas de los a grupos y sus medias es clara, puede encontrarse
un tipo de transformacin adecuada. Si la varianza aumenta al aumentar la media (forma de
megfono) o si la relacin es inversa, la relacin entre la varianza y la media es:
Las desviaciones estndar son proporcionales a alguna potencia de la media, como puede
verse en la siguiente ecuacin.
i2 k i ( 0)
q
i2 k i ( 0)
q
Si se grafican los ln de las varianzas muestrales contra sus respectivas medias muestrales se
obtiene un diagrama de dispersin cuya pendiente sera el valor aproximado de q.
Anlisis de Varianza
-----------------------------------------------------------------------------
Fuente SC g.l. CM F P-Value
-----------------------------------------------------------------------------
Between groups 4298.87 2 2149.43 97.54 0.0000
Within groups 595.0 27 22.037
-----------------------------------------------------------------------------
Total (Corr.) 4893.87 29
71
Tabla de Medias para rendimiento por Fertilizante con LSD al 95% de confianza
--------------------------------------------------------------------------------
Stnd. error
fertilizante Cuenta Media s pooled Lmite inferior L. superior
--------------------------------------------------------------------------------
1 10 103.1 1.48449 100.946 105.254
2 10 74.5 1.48449 72.3462 76.6538
3 10 83.2 1.48449 81.0462 85.3538
--------------------------------------------------------------------------------
Total 30 86.9333
Varianza Check
Cochran's C test: 0.834454 P-Value = 0.0000646376
Bartlett's test: 2.13183 P-Value = 0.0000589774
Hartley's test: 23.756
102
rendim
92
82
72
1 2 3
fertilizante
72
Box-and-Whisker Plot
fertilizante
2
60 70 80 90 100 110
rendim
10
5
residual
0
-5
-10
-15
1 2 3
fertilizante
0
-5
-10
-15
74 79 84 89 94 99 104
predicted rendim
10
5
residual
-5
-10
-15
0 5 10 15 20 25 30
row number
80
50
20
5
1
0.1
-15 -10 -5 0 5 10 15
RESIDUALS
Ejercicio: Proponer la transformacin adecuada para estos datos y realizar el anlisis con la
escala transformada. Emplee el Statgraphics.
73
Se puede observar en la grfica de residuos contra niveles del factor, que las varianzas no
son homogneas, esto se puede confirmar con la prueba de Bartlett o la de Levene. El valor
p asociado al estadstico de la prueba de Bartlett es de 0.0000589, que si aplicamos el
criterio de Anderson, es candidato a una transformacin.
La pregunta ahora es existe una transformacin adecuada para este conjunto de datos?. Ya
se ha dicho que si el patrn observado en la grfica de residuos contra valores predichos es
del tipo de megfono, entonces s existe una transformacin adecuada para ese conjunto de
datos.
Anlisis de la Varianza
------------------------------------------------------------------------------
Fuente Sumas de cuad. g.l.. Cuadrado Medio Cociente-F P-Valor
------------------------------------------------------------------------------
Entre grupos 1.35969E8 2 6.79846E7 134.90 0.0000
Intra grupos 1.36069E7 27 503959.0
------------------------------------------------------------------------------
74
Contraste de Varianza
--------------------------------------------------------------------------------
Mtodo: 95.0 porcentaje LSD
fertiliz Frec. Media Grupos homogneos
--------------------------------------------------------------------------------
2 10 5599.9 X
3 10 6930.0 X
1 10 10631.7 X
--------------------------------------------------------------------------------
Contraste Diferencias +/- Lmites
--------------------------------------------------------------------------------
1-2 *5031.8 651.411
1-3 *3701.7 651.411
2-3 *-1330.1 651.411
--------------------------------------------------------------------------------
* indica una diferencia significativa.
Se puede observar que existe efecto de los fertilizantes sobre el rendimiento 2 del trigo; o
existe diferencia entre fertilizantes cuando el rendimiento se ha transformado elevndolo al
cuadrado.
Se puede ver con las pruebas de varianzas para checar el supuesto de homocedasticidad que
aunque se rechaza la hiptesis de homocedasticidad a un nivel de 0.05, si nos apegamos al
criterio citado por Anderson, tanto la prueba de Bartlett como la de Levene, el nivel de
probabilidad se ha incrementado a un valor mayor que 0.001. Podemos hacer caso incluso a
la prueba de Bartlett ya que la normalidad se cumple como puede verse en la grfica de
probabilidad normal. El valor del residuo sospechosamente atpico: 1999 puede
estandarizarse o transformarse a un puntaje z ( o residuo estandarizado):
75
x
z
y ij i .
z
CM E
eij
z
CM E
1999
z 2.81
503959
para ver si realmente se trata de un valor atpico o no, y como puede verse queda
comprendido entre -3 y +3 como dira la regla emprica y no puede considerarse atpico; los
dems puntos de la grfica de probabilidad normal s se aproximan a una lnea recta por lo
que se cumple la normalidad y por consiguiente tambin la prueba de Bartlett es vlida para
verificar el supuesto de homogeneidad de varianzas.
Grfico de Residuos para rendim^2
residuo
(X 1000)
2
-1
-2
1 2 3
fertiliz
(X 1000)
2
-1
-2
5500 6500 7500 8500 950010500
11500
rendim^2 predicho
99.9
99
95
80
50
20
5
1
0.1
-2 -1 0 1 2
(X 1000)
RESIDUALS2
Las pruebas de comparacin mltiple arrojan los mismos resultados, es decir existen
diferencias entre todas las medias.
76
NOTA:
Para decidir finalmente sobre una transformacin se puede realizar el anlisis con y sin
transformacin. Si las conclusiones no cambian entonces los presentamos de la manera en
que sean ms interpretables en la vida real, usualmente, la escala original.
Cuando se realiza un experimento debido a que se trabajan con muestras, es posible que si
para una muestra funcion una determinada transformacin, sta puede no ser la vlida al
realizar de nuevo el experimento con otra muestra.
En nuestro ejemplo debido a que con los dos anlisis llegamos a las mismas conclusiones
podemos dejar el anlisis con los datos originales porque son ms fcilmente interpretables,
la prueba de Levene con los datos originales no justifica una transformacin de datos y no
se tiene una idea de la distribucin terica de este tipo de datos que sugieran una
transformacin.
77
Comparaciones Mltiples
Cuando se realiza un experimento, se est interesado no slo en saber si existe un efecto
significativo del factor, sino una variedad de cuestiones que pueden resolverse utilizando
pruebas de comparacin mltiple: por ejemplo, nos puede interesar averiguar si al incrementar
la dosis de un frmaco, incrementa o no la mejora de cierto sntoma, o nos interesa comparar
distintas formulaciones presentes en el mercado contra una nueva propuesta, o bien puede
interesarnos en comparar dos dietas bajas en fibras contra tres altas en fibras. Es decir, no
limitarnos meramente a comparar parejas de medias, sino grupos de medias.
Se puede estar interesado en comparar parejas de medias y para ello no es necesario hacer
un anlisis de varianza basta con una prueba de hiptesis y la prueba t pertinente. El nivel
de significacin da cada comparacin (de cada hiptesis) es o probabilidad de cometer el
error tipo I (Rechazar Ho dado que es verdadera), o decir que las dos medias son distintas
cuando realmente son iguales. Al nivel de significancia se le llama nivel de significancia
por comparacin.
Otra forma de probar las diferencias entre parejas de medias es a travs intervalos de
confianza para diferencias de medias, recordemos que si el intervalo contiene al cero,
decimos que esas medias son iguales ya que el 95% de las veces la diferencia entre ellas
puede ser nula. El intervalo de confianza para una diferencia de medias es pues, una
alternativa a la prueba t.
La ventaja de los intervalos es que de acuerdo a los signos (+ o -) nos dice qu medias son
ms grandes o ms chicas. Asimismo el ancho del intervalo de confianza nos dir si una
prueba es conservadora y slo detecta las diferencias grandes, o sensible (potente) si detecta
las muy pequeas diferencias.
Tasas de Error
Bajo Ho, es decir cuando las medias de tratamiento son iguales, y al hacerse una familia de
comparaciones no planeadas entre parejas de medias, la probabilidad de declarar al menos un
par de tratamientos diferente la proporciona la tasa de error experimental o error del
experimento.
Bajo H0 la probabilidad de cometer el error tipo I para cualquier prueba es y la probabilidad
de concluir correctamente es (1-). Cuando se tienen k tratamientos y se realizan
k k k 1
comparaciones por parejas, existen m comparaciones posibles. Por lo que se
2 2
pueden cometer x errores tipo I (donde x = 0, 1, 2, 3, 4, 5 o 6). La probabilidad de cometer x
errores tipo I:
n! ( 0)
P x x 1 n x
x! ( n x )!
P ( x 1) 1 1
n x
Cuando las comparaciones son independientes la tasa de error experimental o por familia es
igual a 1 (1-)m, pero si no son independientes la tasa de error es :
1 (1-)m.
Suponga que se eligi un nivel de 0.05 y son seis medias. Si las seis medias son iguales la
probabilidad de rechazar incorrectamente una o ms comparaciones ortogonales es:
E = 1-(1-0.05)5= 0.23 que es un valor cinco veces ms grande que el nivel establecido para
cada prueba. Si uno desea un nivel de 0.05 para el conjunto de los 5 contrastes, el nivel de
cada contraste debe ser: =1-(1-0.05)1/k-1
=1-(1-0.05)0.2=0.01.
La tasa de error por familia es la probabilidad de cometer al menos un error tipo I en las m
comparaciones.
Si quisiramos saber el error total que cometemos al hacer las m comparaciones bastar con
obtener la tasa de error experimental o por experimento que es igual a (m) (c.). Si por
ejemplo con tres tratamientos corremos todas las comparaciones por parejas posibles, que
seran tres, cada una con un nivel de 0.05, terminaremos con un nivel final (probabilidad de
cometer el error tipo I) de 0.15 o 15% de tasa de error experimental.
Se puede comprobar que las tres tasas de error, por comparacin, por familia y experimental
guardan la siguiente relacin:
c <FW < PE
Los mtodos de comparacin mltiple slo nos dicen qu medias o grupos de medias son
iguales o diferentes, pero no nos dicen en qu magnitud son diferentes, de ah que algunos
procedimientos tambin ofrecen los intervalos de confianza que ya informan la magnitud de
las diferencias.
Otro concepto importante por considerar es la potencia de una prueba que es una medida de
su capacidad para identificar diferencias. Las pruebas ms potentes detectan las ms
80
pequeas diferencias entre medias. Las pruebas ms potentes tendrn los intervalos ms
pequeos o estrechos.
Las pruebas ms conservadoras son Scheff, Contrastes y Tukey (stas son exactas), le
siguen Bonferroni, y las ms sensibles o potentes son Student Newman Keuls, diferencia
significativa mnima (DSM) y Duncan. stas no se recomiendan ya que inflan la
probabilidad de cometer el error tipo I. O se pueden usar bajo ciertas condiciones que se
especificarn cuando se hable de las pruebas. Otras pruebas potentes que se han
desarrollado ltimamente y que no inflan la probabilidad del error tipo I son la de Ryan y la
de Peritz.
Algunas pruebas pueden hacerse en un solo paso, es decir sin necesidad de que la F total haya
sido rechazada. No es condicin necesaria el rechazo de esta hiptesis total para realizar la
prueba. Pero es costumbre hacerla para obtener una estimacin del CME. stas son:
Tukey
Tukey Kramer
Dunnett
Scheff
Bonferroni
idk (Shedok)
Un investigador quien debe rechazar la H o total antes de usar un Mtodo de Comparacin
Mltiple (MCM) est usando un procedimiento de dos pasos y puede perder ???un resultado
importante (Rafter, et al, 2002).
Las otras se realizan por pasos, comienzan por probarse la hiptesis total, y si se rechaza
entonces se realiza el segundo paso que es la prueba.
DSM de Fisher
Student-Newman-Keuls (SNK)
Duncan
Mtodo de Bonferroni
Este mtodo se emplea para probar diferencias planeadas (a priori) entre parejas de medias o
combinaciones lineales de medias y declara que un par de medias es diferente con un nivel
/m si:
tij t N a , / 2 m ,
Donde, m es el nmero de comparaciones por parejas a ser probadas. Puede verse que esta
prueba controla la tasa de error experimental en asignndole un valor c ms pequeo.
Tambin se usa a posteriori.
Como es una prueba que se aplica a priori no requiere rechazo de H o en la tabla de anlisis de
varianza, es ms puede realizarse antes del anlisis, pero realmente se hace despus porque del
anlisis de varianza se toma el CME.
Como puede verse el estadstico de prueba es idntico al de una prueba t para comparar
medias pero el criterio de rechazo cambia, el valor de de esta prueba es ms pequeo que el
de una prueba t .
Para cualquier par i, j declaramos que ti es diferente de tj si se satisface la ecuacin anterior. La
probabilidad de rechazar alguna de las hiptesis dado que las medias son iguales es igual a
/m. Por lo que la probabilidad de cometer el error tipo I (experimental) cuando son las
medias iguales es a lo mucho .
y y j. ( 0)
tij i.
2CM E
n
ste estadstico puede comparar todas las parejas de medias sin inflar el error tipo I
controlando el nivel de cada comparacin.
Si se trata de otro tipo de comparacin o de un contraste el estadstico de prueba es:
c y i i
tij i 1
cuando ni = nj
CM E k
n
c
i 1
2
i
y
k
c y i i
tij i 1
para casos desbalanceados
ci2
k
CM E
i 1 ni
Para diseos de un factor, es mejor usar la prueba de Tukey, pero cuando no se aplica, el
mtodo de Bonferroni es la opcin. El Statgraphics tambin grafica los intervalos de confianza
de Bonferroni, que son intervalos para diferencias de medias tal que si un par de medias es
diferente, el intervalo cuantifica qu tan diferentes son.
Ejercicio
Aplique el mtodo de Bonferroni para comparar todos los pares de medias del ejercicio de
los fertilizantes.
103.1 74.5 28.6 28.6
t 13.62
22.04 2
10
1 1
2
4.41 2.10
Este valor se compara con t0.05 2 ( 3), 27 2.55 y debido a que todos los estadsticos de
prueba resultaron mayores que 2.55 entonces se rechazan las pruebas de las tres
comparaciones cada una con una probabilidad de 0.017 y el conjunto de las tres
comparaciones con un nivel de probabilidad de 0.05.
. . contraste
22.04 2
10
1 1 2.10
2
1 vs 2 : 28.6 2.55( 2.10) 23.25, 33.95
1 vs 3 : 19.9 2.55( 2.10) 114 .55, 25.25
2 vs. 3 : 8.7 2.55( 2.10) 3.35, 14.05
83
Dunn-idk
Es ligeramente ms potente que la de Bonferroni.
Se emplea:
'
1
2
1 1 c
1
( 0)
si el valor absoluto de la diferencia entre algn par de medias es mayor que esta DSM
entonces se dice que la diferencia es significativa.
En el ejemplo,
2(22.04)
DSM 2.052 4.31
10
Para expresar el resultado, es muy comn ordenar las medias de menor a mayor y subrayar
aquel par o grupo de medias que son iguales. En el ejemplo, como las tres medias son distintas
no se subraya ninguna de las tres medias.
En algunos casos el investigador puede desear hacer todas las comparaciones entre todos los
pares de medias, es decir a(a-1)/2 comparaciones que es mayor que a-1 comparaciones
independientes. Sea como sea cuando comparamos dos medias o cometemos el error tipo I
diciendo que las medias son iguales cuando no lo son y la tasa en la cual este error se comete o
probabilidad de cometer el error tipo I es y se llama nivel de significancia para la
comparacin y el error tipo II, que es el error de decir que son iguales cuando son diferentes y
la tasa del error la da . La probabilidad de que el procedimiento de comparacin detecte una
diferencia real cuando sta existe es la potencia de la prueba y es 1 , y se ver despus de
esta seccin. Como ya se ha dicho si se usa DSM para hacer todas las comparaciones posibles
la probabilidad de cometer el error tipo I puede no ser el nivel elegido y se infla por lo que se
recomienda usar una de las pruebas siguientes: DSM protegida, la de Tukey o diferencia
honestamente significativa y la de Student-Newman-Keuls. La DSM protegida emplea la
DSM estndar contra la cual se contrastan las comparaciones por parejas una vez que la
prueba F ha sido declarada significativa, de esta manera se protege contra el error tipo I
Recomendaciones:
Una vez comparadas las parejas de medias se construyen los intervalos de confianza DSM que
se construyen sumando y restando a cada media el valor DSM/2. Cualquier par de intervalos
que no se superpongan se dice que son diferentes estadsticamente. Tambin pueden
construirse intervalos para diferencias de medias; cualquier intervalo de diferencia de medias
que contenga al cero, significa que esa pareja de medias no presentan diferencia significativa.
As, si un par de medias se declar diferente por DSM, se puede conocer entre qu valores
descansa la diferencia que result significativa.
85
Nota: A veces esta prueba conduce al no rechazo de la hiptesis que contrasta las parejas de
medias cuando la F s condujo al rechazo de Ho. La F prueba todas las comparaciones
posibles no slo por parejas sino combinaciones lineales de las medias.
Tarea
Construya los Intervalos de Confianza DSM para las medias y para las diferencias entre
medias Qu puede decir de las medias?
c y .
i=1
i i
Realmente un contraste se define como una combinacin lineal de los efectos de los a
tratamientos con tal que la suma de los coeficientes da cero.
Es decir,
a
ci i
i 1
De aqu que:
c i i ci y i. y.. ci y i. y.. ci ci y i.
86
Pero cuando el tamao de muestra es igual, es mejor trabajar con totales que con
promedios.
ni c i
i=1
2
Las sumas de cuadrados de los contrastes se distribuyen como con un grado de libertad.
87
En el ejemplo:
C1 = y1. - y2.
C1 = 1031-745 = 286
D = y1. + y2. - 2y3.
= 1031 + 745 - 2(832) = 112
FD = (209.067/1)/22.04 = 9.48
Algunos autores prefieren utilizar las medias en lugar de los totales; el utilizar medias o
totales har que difiera el valor del contraste. Si se calcula el contraste con el valor del total, el
contraste exceder del calculado con las medias, por un factor de n.
n contraste
2
(10)28.6 2
SC a
4089.8
2
c
i 1
2
i
88
que es la misma que se obtuvo cuando se calcularon las SC del contraste del total.
Pruebe que la suma de cuadrados del segundo contraste utilizando las medias es igual a la
suma de cuadrados del segundo contraste utilizando los totales.
Contrastes Ortogonales
Un caso especial de contrastes son los contrastes ortogonales. Dos contrastes
a ( 0)
C = ci yi.
i=1
Y
a ( 0)
D = d i yi.
i=1
o en el caso desbalanceado
a
n c d = 0
i=1
i i i
Por ejemplo,
C = y1. - y3.
D = 2y2. - (y1. + y3.)
89
c1 c2 c3
C 1 0 -1
D -1 2 -1
cidi -1 0 1
cidi =0
luego entonces estos contrastes son ortogonales. El trabajar con estos contrastes le proporciona
fuerza a la prueba por la caracterstica de independencia.
Los contrastes construidos anteriormente, son contrastes ortogonales. Cuando los contrastes
son ortogonales, la variabilidad expresada en la suma de cuadrados de tratamiento est
comprendida por la variabilidad expresada en contrastes ortogonales, por lo que la suma de las
sumas de cuadrados de los contrastes ortogonales es igual a la suma de cuadrados de
tratamiento; de la misma manera, la suma de los grados de libertad de los contrastes es igual a
los grados de libertad de los tratamientos, y esto nos confirma que las comparaciones
ortogonales realmente s son independientes y no nos dan informacin redundante (o
correlacionada).
En el ejemplo, pruebe que la suma de las sumas de cuadrados de los contrastes ortogonales
es igual a la suma de cuadrados de fertilizantes.
Existen en los textos tablas con los coeficientes para construir contrastes ortogonales.
Puede suceder que la F total no haya sido significativa pero algunos contrastes si lo
sean, esto resulta cuando uno o dos de los contrastes son significativos pero los otros no.
Cuando se totalizan las sumas de cuadrados de los efectos los contrastes no significativos
diluyen los significativos produciendo efectos no significativos en la tabla de anlisis de
varianza Tambin es posible tener una F total significativa pero que las comparaciones hechas
no lo sean.
i=1 ni
En el ejemplo:
Probar Ho: 2 2 = 1 + 3.
El contraste C = 2 2 - 1 - 3
y1.= 103.1
y2.= 74.5
y3.= 83.2
C = -1(103.1) + 2(74.5) -1(83.2)
C = 37.3
2.- Calcular el error estndar del contraste
2 2 2
2 + (-1) + (-1)
S C = 22.037
10
Sc = 3.6362
3.- Calcular el Nmero de Scheff:
SSCH = 3.6362 [(3-1)F2,27] = 9.4121
91
Ntese que el margen de error depende del nmero de medias en el experimento y no del
nmero de contrastes.
Ejercicio:
Obtenga los intervalos de confianza de Scheff para el contraste anterior.
Esta es una prueba que se aplica bien a posteriori. Se aplica una vez que se ha
rechazado la hiptesis nula de igualdad de medias; no es tan conservadora como la de
Scheff; y es de las ms potentes pues detecta diferencias menores entre tratamientos.
Esta prueba consiste en:
1) Ordenar las medias en forma ascendente
2) Determinar el error estndar que corresponde a cada promedio.
CM E ( 0)
Sy =
i..
n
3) Obtener los valores r (p,f) en la tabla de Duncan, donde
p = 2,3,...,a y f son los grados de libertad del error. Estos valores r(p,f) son valores crticos
con p medias ordenadas o pasos entre medias y f grados de libertad.
4) Se calcular entonces los valores Rp = r(p,f) Syi..
5) Se comparan entonces las diferencias entre medias contra los valores Rp.
Por ejemplo, suponga que desea realizar la prueba de Duncan para comparar los
distintos tipos de fertilizante. Se proporcionan las medias :
4. Comparando:
1 y 2= 103.1-74.5= 28.6> 4.54
1 y 3= 103.1-83.2= 19.9>4.316
2 y 3= 83.2-74.5=8.7>4.316
Todas las medias son diferentes por lo que se forman 3 grupos de medias:
74.5 83.2 103.1
Para casos desbalanceados:
93
a ( 0)
r= a
1
i=1 ri
Kp q ( p, f ) S yi .. ( 0)
ymax ymin
q
CM E
n
La diferencia necesaria para que se declare significativa vara con el grado de separacin de
las medias que se comparan. Las medias separadas por una media requieren diferencias ms
pequeas para significancia que las medias separadas por dos medias.
Al igual que la DSM el anlisis de varianza puede conducir al rechazo de H o pero ninguna
de las comparaciones por parejas en NK resulta una diferencia significativa.
Para aplicarla es recomendable ordenarlas de menor a mayor y comparar la ms grande
contra la ms pequea, Si estas medias son diferentes entonces la ms chica se contrasta
con la siguiente ms grande hasta alcanzar alguna prueba no significativa.
Es aproximada para casos desbalanceados.
Prueba de Tukey
Es muy parecida a la prueba de Diferencia Significativa mnima. Se calcula un solo
valor crtico para comparar todos los pares de medias. La tasa de error es a lo ms , por lo
que es conservadora y controla la tasa del error experimental. Emplea un estadstico
llamado rango e, q.
CM E ( 0)
T t i t j q ( , a , f )
n
a es el nmero de tratamientos y f los grados de libertad del error. Depende del nmero de
medias y no del nmero de comparaciones que se realicen. Ntese que depende del nmero
de tratamientos y no del nmero de comparaciones como la de Bonferroni. Los intervalos
de confianza se obtienen:
CM E
yi y j q( ,a , f )
n
Ntese que el margen de error es el mismo para cada comparacin, por lo que los tamaos
de los intervalos son iguales. Esta prueba es para casos balanceados; cuando los casos son
desbalanceados recibe el nombre de Tukey Kramer
94
La prueba de Tukey tambin sirve para contrastes. Si los tamaos de muestra son iguales el
intervalo de confianza es
CM E k ci
c y i i
q ( , a , f )
n i 1 2
Nota: Se sugiere utilizar preferiblemente para comparaciones por parejas y no contrastes
ms complejos.
Prueba de Tukey-Kramer
1 1 1
T t i t j q ( , a , f ) CME
2 n
i nj
En el ejemplo,
1) Se ordenan las medias de mayor a menor
q 0.05,(3,27) = 3.5
22.04
3.5 5.20
10
Los intervalos de confianza para comparar una pareja de medias resultan de aplicar la
siguiente frmula:
yi y j T
Si los intervalos de confianza para las diferencias de medias contienen al valor cero,
significa que esa pareja de medias no son diferentes.
La prueba de Tukey garantiza que todas las comparaciones tienen una tasa de error a lo ms
de .
Se emplea para comparar los tratamientos con un control. Debido a que el control tiene
mayor importancia el nmero de rplicas del control se recomienda que sea mayor,
aproximadamente n k 1 donde n es el nmero de rplicas de los tratamientos cuando se
ni
trata de diseo balanceado o bien k 1 si se trata de caso desbalanceado.
k
Se pueden probar la hiptesis de que al menos uno de los tratamientos difiere o bien la
hiptesis de una cola para probar que la diferencia entre las medias de tratamientos y la
media del control es menor o mayor a cero.
96
H 0 : i c
H1 : i c
H1 : i c 0
H1 : i c 0
1 1
d ;a 1, f CM E donde nc es el nmero de rplicas del control.
ni nc
Tarea: Leer el artculo Rafter John A., Martha L. Abell and James P. Braselton. Multiple
Comparison Methods for Means. (2002). SIAM Review Vol. 44, No. 2, pp. 259-278
Tipos de errores
En la toma de decisiones, al rechazar o no rechazar la hiptesis nula, se pueden
cometer dos tipos de errores. El error tipo I se refiere a la probabilidad de rechazar H o dado
que es verdadera y el error tipo II que sea la probabilidad de no rechazar Ho dado que Ho es
falsa.
97
Potencia de la prueba ( )
La potencia de la prueba es la probabilidad de rechazar Ho dado que es falsa.
Decisin del experimentador Ho falsa Ho verdadera
Rechazar Ho = 1-
Decisin correcta
No rechazar Ho Decisin correcta
( 1- )
1-
F' = CMTrat/CME
h(F') es la funcin de densidad de F'
98
a
r i
2
(a)
i 1
Ntese que bajo la Ho de que toda i = 0, entonces, = 0. Es lo que ya dijimos que bajo H o
el cociente CMTrat/CME sigue una distribucin F central.
a
r t
2
i 1
a a 2
Cuando = 0 entonces la distribucin F' se convierte a una distribucin F central.
1-
La decisin correcta sera que siendo falsa la hiptesis nula, sta se rechazara, a esto se le
llama potencia de la prueba.
Estos dos tipos de errores deben minimizarse, pero como guardan una relacin inversa entre s,
no es posible. Cualquier cambio en el tamao de una regin producira un cambio opuesto en
la otra. Si movemos F central a la derecha, disminuye pero se incrementa. Lo mejor es
fijar la probabilidad de algn tipo de error y minimizar la probabilidad de cometer el otro.
Generalmente se fija la probabilidad de cometer el error tipo I, es decir ; se
determinan entonces las condiciones que minimizan la probabilidad de cometer el error tipo
II. Minimizar equivale a maximizar 1- , valor que se conoce como potencia de la
prueba y es la probabilidad de detectar una diferencia entre medias del tamao de . Si se
calcula la probabilidad de rechazar Ho dado que H1 es verdadera para todos los posibles
valores de se obtiene la funcin de potencia.
El poder de la prueba se incrementa cuando se aumenta el tamao de la muestra n.
Una curva caracterstica de operacin es una grfica de la probabilidad de cometer
el error tipo II de una prueba estadstica para un tamao de muestra particular contra un
parmetro relacionado con .
Especficamente, igualando (a) y (b)
2 2 a 2
2
2
a 2
99
a
r i2
i 1
a a 2
Especficamente se indica la probabilidad del error tipo II () contra el parmetro .
a
n i2
2 = i=1
a2
(b)
Se emplea la curva para a-1 = 5 - 1 = 4 y a(n-1) = 5 (n-1) g.l. Para n=4 por ejemplo, =
1.11(4) = 4.44. Es mucho ms fcil aplicar una frmula en el que se requiere el parmetro D,
que es la cantidad por encima de la cual rechazara la hiptesis nula con un nivel de confianza
dado y que la proporciona el investigador en funcin del conocimiento que tenga del
fenmeno.
nD 2
2
2a 2
n(10) 2
2 1.11n
2(3)(15)
100
Para obtener el tamao de la muestra necesario para alcanzar dicha potencia, se construye
la siguiente tabla.
n 2 2
3 6 3.33 1.82 0.41 0.59
4 9 4.44 2.10 0.22 0.78
5 12 5.55 2.35 0.13 0.87
6 15 6.66 2.58 0.051 0.95
Es decir, que con un tamao de muestra de seis se obtiene una potencia de 0.95 o una
probabilidad de 1-0.95 de caer en el error tipo II, es decir, decir que dos medias son iguales
cuando realmente son diferentes.
Caso desbalanceado
Muchas veces no es posible llevar a cabo el experimento con el mismo nmero de
rplicas para cada tratamiento, ste es el caso desbalanceado. El anlisis de varianza es
semejante al del caso balanceado salvo algunas modificaciones en las frmulas que se
presentan a continuacin.
Supuestos
a
r i i =0
i=1
Sumas de cCuadrados:
Suma de cCuadrados de tratamientos:
a 2
yi.
SC trat = - f.c.
i=1 ri
Tarea: Obtenga los estimadores de los parmetros para el caso desbalanceado. (1 punto)
a
C = ci yi.
i=1
tal que,
r i ci = 0
a 2
( ci yi. )
i=1
SCc = a
r c
i=1
i i
2
1 1
DSM = t/2,N -a CM E +
ri r j
V(yij) = + T .
Debido a que no se estn estudiando todos los tratamientos no se le aade la restriccin de que
los i suman cero.
Ejemplos: Si un cientfico est interesado en cmo trabaja un fungicida. Selecciona al azar tres
fungicidas de un grupo de fungicidas para estudiar la accin. Los modelos de efectos
aleatorios son comunes en estudios de muestreo.
La hiptesis que desea probarse es que la variabilidad de los tratamientos (o niveles del factor)
es igual a cero contra la alternativa de que es mayor que 0.
Ho: T = 0
H1: T > 0
Las sumas de cuadrados se calculan de la misma forma que para el modelo de efectos
fijos (modelo I). Pero en la tabla del anlisis de varianza se le puede agregar una columna de
los cuadrados medios esperados.
En el modelo de efectos fijos el cuadrado medio del error es un estimador de y el cuadrado
medio de tratamientos estima a ms una funcin de la suma de cuadrados de los efectos
fijos de tratamientos. Para el modelo de efectos aleatorios el CM de tratamientos estima a:
ms n . La FC = CMtrat/CME es una estimacin de
+ n T/ ,
que sigue una distribucin F solo si t = 0. Bajo este modelo Fc es el estadstico de prueba
para probar que la variacin entre tratamientos es igual a cero contra la alternativa de que es
mayor que cero.
F. de V. SC g.l. CM CM esperado
Tratam. SCtrat a-1 CMtrat +n T
FC= CMtrat/CME = ( + n T )/ 2
Por ejemplo si se desea conocer la variabilidad del contenido de cloro residual en los nodos de
la red de agua potable de una colonia de la ciudad, se toman aleatoriamente n nodos y se mide
el cloro residual de las tomas domiciliarias conectadas con ese nodo. Mediante este anlisis se
detectara si existe variabilidad entre los nodos y se obtendra la proporcin de variabilidad
debida a los nodos y la debida al error aleatorio.
En laboratorios es muy comn utilizar modelos de efectos aleatorios para conocer la
variabilidad que existe entre ellos, especficamente entre analistas, en la determinacin de un
analito. Por ejemplo, se puede mandar muestras de agua de la misma fuente a 5 o 6
laboratorios y estos realizan varias determinaciones de un analito. El inters se centra en la
variabilidad entre analistas ms que en las lecturas promedio por los 5 o 6 analistas.
Tarea. Resolver el ejercicio 3-8 del libro de Montgomery que se refiere al contenido de calcio
en lotes de materia prima.
EJERCICIOS PROPUESTOS
Un experimentador someti a 5 grupos de ratones en un laberinto. El grupo 1 tena solamente
habilidades olfativas y tctiles, el grupo 2 slo visuales y tctiles, el grupo 3 solo visuales y
olfatorias, el grupo 4, visuales, olfatorias y tctiles y el 5, visuales, olfatorias y tctiles pero se
les aplicaba un choque elctrico por error que cometieran. Los datos son ensayo y error, bajas
calificaciones indican una buena actuacin.
A1 A2 A3 A4 A5
7 5 9 6 19
8 4 11 12 6
5 4 6 8 3
9 6 8 5 12
10 3 7 11 13
Un fabricante de tabletas desea probar que los tiempos de desintegracin de 4 tipos de tabletas
son los mismos.
A B C D
20 42 8 12 50 124 151 178
28 25 10 24 67 72 125 151
36 24 12 10 90 78 180 152
16 31 16 19 103 70 149 161
25 33 9 10 90 76 175 118
Los bloques sirven para eliminar parte de los factores de variacin aleatoria, que de otro
modo incrementaran el error experimental.
La variabilidad restante que no se puede controlar y que no se puede remover del campo
pero que en cambio se puede aleatorizar queda dentro del trmino de error y es la debida a
la falta de uniformidad entre las unidades del mismo bloque y a la falta de uniformidad en
la realizacin del experimento.
As pues, si dentro del bloque hay ms variacin que entre los bloques, no valdr la
pena bloquear. Y la sensibilidad del experimento disminuira pues al tener un gran trmino
de error la prueba F para probar diferencias entre medias de tratamientos se hace menos
sensible a las diferencias.
Al planear un experimento en bloques debe buscarse que los bloques absorban la
mayor heterogeneidad del suelo, y que los bloques sean lo ms homogneos dentro de s.
En resumen las razones para bloquear son:
1) Nmero insuficiente de unidades experimentales homogneas para correr un
experimento completamente aleatorizado.
2) Remover una fuente de variacin del error para hacer al diseo ms sensible a las
diferencias entre tratamientos.
Antes de introducirnos al modelo, supuestos etc., se ver un concepto que algunos autores
consideran importante y que justifican el por qu no es de inters o adecuado probar el
efecto diferencial de los bloques, y es el de error de restriccin. Estas ideas se toman de la
bibliografa de Anderson y de Lorenzen & Anderson.
Suponga que se prueban tres temperaturas: 30,40 y 50C y cuatro colores: azul (az), rojo
(r), amarillo (am) y verde (v), en la nitidez de una imagen. Se corren dos rplicas (1 y 2).
De modo que se tiene un experimento de dimensin 3 x 4 x 2 = 24 combinaciones
(Temp/Color/rplica).
Una aleatorizacin completa sera:
Esto tiene el inconveniente de que el cambio constante de temperatura y el tiempo que tarda
un horno en alcanzar las temperaturas echara a perder el horno o sera muy tardado el
experimento.
El investigador decide que debe elegir al azar una temperatura y que se pinten 8 paneles de
las 8 posibles combinaciones color/rplica. Por ejemplo elige al azar entre las tres
temperaturas y sale 30C. Se ajusta el horno a esta temperatura y se aleatorizan color y
rplica, como se muestra a continuacin:
Una vez corridas estas 8 combinaciones, elige al azar de entre las dos temperaturas
restantes y corre las mismas 8 combinaciones color/rplica, pero en orden aleatorio.
Se puede observar que no hubo aleatorizacin completa sino que se ha restringido a
cada temperatura, es decir ha habido una aleatorizacin por temperatura o para cada bloque.
Se sabe que el error de restriccin est asociado a la temperatura, decimos que hay
una restriccin en la aleatorizacin asociado con el factor temperatura. Y esta restriccin se
dice que est confundida con el bloque.
Tambin decimos que el experimento se corre en bloques donde los bloques estn
asociados con la temperatura, o bien, decimos que el experimento est bloqueado en
temperatura, o que la temperatura es un factor de bloqueo.
Ahora considere que slo hay una pistola de aire para pintar y da mucho trabajo
limpiarla y mezclar un nuevo color. Tiene sentido limpiar la pistola y mezclar un nuevo
color mientras la temperatura del horno est cambiando.
Uno podra elegir una combinacin temp/color y pintar y hornear ambas repeticiones antes
de elegir la segunda combinacin. No hay necesidad de fijar individualmente cada
temperatura o fijar un color, ms bien ambos cambiaron al mismo tiempo.
Las combinaciones se elegirn al azar, una cada vez, y con esta combinacin se corrern en
orden aleatorio las dos rplicas.
De las 12 combinaciones:
30az 30v 30am 30r
40az 40v 40am 40r
50az 50v 50am 50r
Se elige al azar una combinacin, por ejemplo 40r. Se controla la temperatura del horno a
40C y la pistola se llena con pintura roja. Se elige al azar que rplica se realizar primero.
Hay una restriccin en la aleatorizacin asociado con cada combinacin temp/pintura. El
trmino de bloqueo es Temp/pintura.
Una restriccin en la aleatorizacin puede asociarse con cualquier trmino del
modelo. Tal restriccin implica que un nivel del trmino (o una combinacin como
temp/pintura) es fijado y todas las combinaciones que contiene ese nivel son aleatorizados
antes de elegir al azar el otro nivel.
y ij i j l ( j ) ij
donde el trmino despus del efecto del bloque es el error de restriccin dentro del j-simo
bloque y completamente confundido con el bloque j. l debe ser igual a 1 pues es el error de
restriccin nico asociado al bloque j. El error de restriccin mide la variabilidad de las
mediciones realizadas dentro del mismo bloque, o error del bloque. Si hay tres bloques por
ejemplo hay 3 restricciones, una para cada bloque. Como l =1 pues no tiene grados de
libertad (1-1=0), ni suma de cuadrados ni cuadrado medio.
108
l =1, este representa las caractersticas aleatorias del bloque (la aleatorizacin dentro del
bloque). Este valor no se puede estimar pues est confundido con los bloques, ni tiene suma
de cuadrados ni grados de libertad. Sin embargo, al observar los E(CM) se puede observar
que para probar diferencias entre bloques no puede emplearse el error aleatorio como
denominador de la FC, como puede verse a continuacin: (suponiendo los bloques
aleatorios)
b ti
2
E (CM Trat ) 2
a 1
E (CM Bloques ) a 2B a 2
2
E (CM l ( j ) ) 2 a 2
E (CME ) 2
Esto tiene sentido pues para probar CM Tratse contrasta con el efecto aleatorio.
Igualmente para probar si los bloques son significativos se probara contra su error. Lo
interesante en este diseo no es contrastar los distintos bloques, sino ms bien los niveles
del factor, y el bloqueo se utiliza para incrementar la precisin del experimento.
Si se probara los bloques contra el error y es significativo no se sabe si existen diferencias
entre bloques o el error de restriccin es significativo o ambos son significativos, porque
ambos estn confundidos. Se dice que esta F es conservativa porque se prueban
simultneamente bloque y error de restriccin.
Si es no significativa ambos son no significativos.
Puesto que no se puede obtener informacin de los bloques es sabio disear el
experimento de modo que se utilice como factor de bloqueo el que tenga poca importancia
o inters.
Modelo
y ij i j l ( j ) ij
donde,
es la gran media, y es constante para todas las observaciones.
i es el efecto del i-simo tratamiento.
j es el efecto del j-simo bloque
l(j) es el error de restriccin dentro del j-simo bloque y completamente confundido con el
bloque j. Ll debe ser igual a 1 pues es el error de restriccin nico asociado al bloque j. Si
hay tres bloques por ejemplo hay 3 restricciones, una para cada bloque. Como l =1 pues no
tiene grados de libertad (1-1=0), ni suma de cuadrados ni cuadrado medio.
Supuestos
a
= 0
i=1
i
109
=0
j=1
j
ij ~ N(0, )
2
No existe interaccin entre los bloques y tratamientos. El modelo de bloques es aditivo, sta es
otra forma de decir que no hay interaccin de con , que en palabras significa que el efecto
de los tratamientos no depende del bloque: se supone que el efecto que tiene el bloque sobre la
respuesta es independiente del efecto que tiene el tratamiento sobre esta respuesta.
Hiptesis
El inters en este diseo se centra en el factor y no en los bloques; stos slo sirven
para incrementar la sensibilidad de la prueba.
Ho: i = j ij
H1: i j para al menos una i y una j.
Sumas de Cuadrados
Los clculos son iguales al modelo de dos factores sin interaccin.
a b 2
y..
SCTotal yij 2
i 1 J 1 N
a 2 2
yi. y ..
SC TRAT = -
i=1 b N
2 2
b y. j
y
SC BLOQ = - ..
j=1 a N
Fuente de SC G.L. CM FC
Variacin
Tratam. SCtrat a-1 SCtrat/(a-1) CMtrat/CME
Bloques SCB b-1 SCB/(b-1)
110
Ganancia en precisin
2
2y y el objetivo es disminuir esta varianza; esto puede ser incrementando el nmero de
r
rplicas o bien disminuyendo la 2 mediante el control por bloqueo.
Si se quieren comparar en cuanto a precisin- dos modelos, se usan sus respectivas varianzas
de las medias de un tratamiento.
21
2 y1
r1
22
2 y2
r2
Si el primer diseo tiene una varianza igual a 1 y el segundo una varianza de doble del
primero, es decir:
12 1
22 2
22 2 12
De este modo
1
2y
1
r1
2
2y
2
r2
111
Estas varianzas de las medias son iguales si r2 =2r1, si el segundo diseo tiene el doble de
rplicas que el primero. El diseo 1 es ms eficiente que el diseo 2, porque requiere la mitad
de rplicas para tener la misma precisin en la estimacin de las medias de tratamiento.
El diseo 2 es menos eficiente que el primero porque requiere el doble de rplicas para tener la
misma precisin en las medias de tratamiento.
Debido a que slo se tiene la estimacin de la varianza en el diseo de bloques y no se cuenta
con la estimacin de la varianza en el diseo completamente aleatorizado, sta tiene que
estimarse a partir de los datos de la tabla de anlisis de varianza del diseo de bloques.
Fisher calcul una cantidad que llam informacin y que implica una correccin por grados de
libertad para la estimacin de 2:
( f 1) 1
I
( f 3) s 2
donde f son los grados de libertad del error y s2 es la estimacin de la varianza. Si se conociera
2 entonces la cantidad de informacin sera I = 1/ 2, pero como no se conoce y se estima, se
ajusta esta eficiencia con los grados de libertad. Si s2 disminuye, la cantidad de informacin se
incrementa.
La eficiencia relativa de dos diseos se define como la razn de la informacin de los dos
diseos.
( f1 1) 1
I1
( f1 3) s12
I2
f 2 1 1
f 2 3 s22
I1 f1 1 f 2 3 s22
R
I 2 f1 3 f 2 1 s12
(g.l.EB + 1)(g.l.EC + 3) 2 c
R= x
(g.l.EB + 3)(g.l.EC + 1) 2 b
(b - 1) CM B + b(a - 1) CM EB
=
2
ab - 1
Un R = 1 significa que la informacin de los dos diseos es la misma y cada diseo requiere el
mismo nmero de rplicas para tener la misma varianza en las medias de tratamientos. R > 1
significa que el diseo de bloques es ms eficiente que el completamente aleatorizado. Un R =
2 significa que el diseo completamente aleatorizado requiere 2 veces el nmero de rplicas
que el diseo de bloques para tener la misma varianza en la media del tratamiento. (Kuehl,
2000).
Ejemplo:
Se midieron las concentraciones de nitrgeno de nitratos que percolaban de un
campo forestal con lodo de plantas de tratamientos. Los excesos de nitrgeno se convierten
a nitratos una forma que lixivia al agua subterrnea. Se quiere comparar las concentraciones
de nitratos en mezclas de lodos con tierra al 25, 50 y 75 %. Los tratamientos se aplicaron en
distintos das (bloques) debido a que no se poda correr el experimento completo con todo y
rplicas en un slo da. El experimento se realiz durante 10 das, y los tratamientos se
asignaron al azar a las distintas parcelas del terreno: adems, en cada da se realizaron todos
los tratamientos:
da: 1 2 3 4 5 6 7 8 9 10
A B C C A B A C B B
C A B B B C C B A A
B C A A C A B A C C
Modelo
y ij i j ij
donde,
113
Sumas de Cuadrados
SCT 319.74
94.6 2 21.43
30
SC mezcla
22.12 40 2 32.5 2
298.31 16.16
10
SC das
9.4 2 8.7 2 ... 10 2
298.31 1.45
3
SC E 21.43 16.16 1.45 3.82
Fuente de SC G.L. CM FC p
Variacin
Mezcla 16.16 2 8.08 38.08 0.0000
Da 1.45 9
Error 3.82 18 0.21
Total 21.43 29
La FC que se obtuvo del bloque (da) slo proporciona una idea de si el bloqueo tuvo
sentido. Como result no significativo, el modelo completamente aleatorizado hubiera sido
ms eficiente ya que el nmero de grados de libertad del error sera mayor. Al trabajar con
el modelo de bloques se han sacrificado b-1 grados de libertad y la prueba se ha hecho
menos sensible innecesariamente.
(9)(0.1616) 10(2)(0.2121)
c 0.19
29
19(30) 0.19
R 0.89
21(28) 0.212
Se necesitan 0.89 veces repetir el diseo completamente aleatorizado para obtener la
misma sensibilidad que el de bloques. Aqu puede confirmarse que no era necesario el
bloqueo para analizar los datos del problema. Lo que se perdi fue sensibilidad en el
modelo.
Ejercicio (tomado del libro Design and Analysis of Experiments. Angela Dean and Daniel
Voss)
Este experimento se report en Noviembre de 1953 en la Journal of Applied Statistics por
Robert Peaje.
En una etapa intermedia del proceso de hilado de algodn, una hebra de algodn result
ms gruesa que el hilo final producido. La hebra se entreteje justo antes de enrollarla en la
bobina. El entretejido se realiza por medio de una gua rotatoria llamada volante. El
propsito del experimento es investigar la forma en la cual distintos grados de entretejido
(medidos en vueltas por pulgada) afecta la tasa de ruptura de la hebra, y comparar el
volante ordinario contra un nuevo volante.
Los factores son: Tipo de volante y grado de enrollamiento, el primero con dos niveles:
ordinario y nuevo, y el segundo factor con 4 niveles: 1.63, 1.69, 1.78 y 1.90. De modo que
pueden definirse 8 tratamientos de los cuales dos se eliminaron por no ejercer ningn efecto
en la variable respuesta:
12. Ordinario-1.69
14. Ordinario-1.78
15. Ordinario-1.90
21. Nuevo-1.63
22. Nuevo-1.69
23 Nuevo-1.78
Se pens que para llevar a cabo una corrida completa y para llenar la bobina se requera de
1 da. Por lo que se pens que los das seran considerados como bloques. Se corri el
experimento como una diseo de bloques completos aleatorizados. Y se presentan a
continuacin los resultados.
Tratamiento Da
1 2 3 4 5 6
12 6.0 9.7 7.4 11.5 17.9 11.9
13 6.4 8.3 7.9 8.8 10.1 11.5
14 2.3 3.3 7.3 10.6 7.9 5.5
21 3.3 6.4 4.1 6.9 6.0 7.4
22 3.7 6.4 8.3 3.3 7.8 5.9
23 4.2 4.6 5.0 4.1 5.5 3.2
Comparaciones Mltiples
Si los tratamientos son fijos, el inters tambin es conocer si existen diferencias entre
medias de tratamientos, para lo cual se emplean las pruebas de comparacin mltiple. Las
frmulas varan en que en lugar de colocar el nmero de rplicas de un diseo completamente
aleatorizado simbolizado por n o r, ahora es reemplazado por la letra b. Tambin el nmero de
grados de libertad del error de bloqueo el cual es N a b + 1.
Ejercicio
a) Probar que 1 + 3 = 22
b) Aplicar la prueba de DHS de Tukey y la prueba de rango mltiple de Duncan.
a)
Ho: 1 + 3 = 22
SC C
25.4 2
10 12 12 (2) 2 10.75
que tiene 1 grado de libertad, por lo que el CM tiene el mismo valor.
FC=10.75/0.21= 50.67 que al compararse con el valor F0.05;1,18 = 4.41, se observa que se rechaza
la hiptesis nula, es decir, existe diferencia estadsticamente significativa entre el contenido de
nitratos en los lixiviados de las mezclas 1 y 3 con el de la mezcla 2.
b) Prueba de Tukey.
1) 4 3.25 2.21
2) q0.05(3,18) = 3.61
2
3) S i. 0.21 0.21
10
116
1
4) t (3.61)(0.21) 0.53
1.4142
Cualquier diferencia mayor a 0.53 es estadsticamente significativa.
5)
1 vs. 2 : 4 2.21 = 1.79 > 0.53 **
2 vs 3: 4 - 3.25 = 0.75 > 0.53 **
1 vs. 3: 3.25 - 2.21 = 1.04 > 0.53 **
Esta prueba que es conservativa nos est indicando que todas las mezclas arrojan distintas
cantidades de nitratos en los lixiviados. Y debido a que la 1 es la que arroja menos nitratos,
sera la de eleccin por su poder menos contaminante.
Ejercicios
1. Obtenga E(CMTrat) y E(CMB).
2. Obtenga por mnimos cuadrados los estimadores de los parmetros. Suponga que
ambos, factor y bloque son fijos.
3. Resolver los ejercicios 5-1, 5-2, y 5-5 del libro de Montgomery.
117
2 2
1 a 1 b
yij
b a
1
y y y
2
2
ij
b i 1
ij a j 1
ij
ab
j 1 i 1
yi. 2 1 y. j 2 1 y.. 2
a b
1
yij2
b i 1 a j 1 ab
L SC E xij2
y ij ' x
2
y .j ' x
2
y '.. x 2 R
b a ab
L 2 y 'i. x 2 y '. j x 2 y '.. x
2 xij 0
x b a ab
ay 'i. by '. j y '..
x
( a 1)(b 1)
Mtodo Exacto
Consiste en realizar el anlisis de varianza utilizando el procedimiento de la regresin general
que consiste en calcular la reduccin en la suma de cuadrados total al ajustar el modelo cuando
todos los parmetros estn incluidos, y la reduccin en la suma de cuadrados cuando el
modelo est restringido por Ho, es decir cuandoi = 0. La diferencia entre ambas reducciones
en las sumas de cuadrados es la suma de cuadrados de tratamiento con la que se conduce Ho.
La metodologa consiste en:
1. Obtener las ecuaciones normales para el modelo completo.
118
Bloques 1 2 Totales
Tratamientos
1 Y11 Y12 Y1.
2 Y21 X Y 2.
3 Y31 Y32 Y 3.
Sb 0 j
i 1 j 1
2 2
y2
y. j y.. j y. j ..
a b
y y
yi. yi.
.. ..
ab i 1 ab j 1 ab
yi2. y.2j y2
b
a
..
ab
El nmero de grados de libertad asociados a R es igual al nmero de ecuaciones
linealmente independientes, es decir, 6-2=4. O bien, a+b-1=3+2-1=4
6. La SCE se obtiene por diferencia y es la parte de la variacin total no explicada por el
modelo.
SC E yij2 R ( , , )
yi2. y.2j y2
y 2
ij ..
b a ab
con N-a-b+1 grados de libertad o bien 5-3-2+1=1
Este CME se emplear como denominador para probar Ho: i=j
Para el modelo reducido, que es el que resulta cuando Ho es verdadera o dicho en palabras,
no hay efecto de los tratamientos:
yij j ij
se procede de la misma manera que con el modelo completo.
El sistema de ecuaciones normales sera:
: 5 31 2 2 y..
1 : 3 31 y.1
2 : 2 2 2 y.2
con 3-1 grados de libertad, es decir 2 debido a la dependencia lineal.
Estos valores estimados sirven para calcular la reduccin en la suma de cuadrados del
modelo reducido.
b
1
y..
5
1 y..
1 y1.
3 5
1 y..
2 y2.
2 5
La suma de cuadrados explicada en el modelo reducido sera:
R ( , ) y.. 1 y .1 2 y .2
y ..2
y . j y.. y . j
b
ab
y ..2 b
y2
y . j y . j ..
ab ab
b y .2j
a
con b grados de libertad.
La suma de cuadrados debida a i despus de introducir a y es:
R ( / , ) R ( , , ) R ( , )
y i2. y .2j y2 b y2
..
.j
b a ab a
y i2. y2
..
b ab
con a 1 grados de libertad. Esta frmula corresponde a la suma de cuadrados de
tratamiento con a-1 grados de libertad.
Para obtener la suma de cuadrados de los bloques tendramos que trabajar con otro modelo
reducido:
yij i ij
a
y 2
i.
R( ,)
b
con a grados de libertad.
SC bloques despus de ajustar el modelo reducido con y sera:
R ( / , ) R ( , , ) R ( , )
a
yi2.
2
y. j y..2 y 2
i.
b
a
ab
b
y.2j y..2
a
ab
con a+b-1-a = b-1 grados de libertad.
De este modo la tabla de anlisis de varianza sera:
121
Ejercicio Propuesto.
1. El siguiente es un diseo de bloques completos aleatorizados.
Bloque a b c d e F
I 16 22 16 y1 18 8
II 28 27 17 20 23 23
III 16 25 16 16 19 16
IV 28 y2 19 18 24 25
Si el y1 fuera la media del bloque o la media del tratamiento, estime y1 y y2.
Inserte los valores estimados y efecte el anlisis de varianza prestando atencin a los
grados de libertad del error y totales.
122
Cuadro latino.
Un cuadro latino como el anterior en el que la primera fila y columna estn en orden
alfabtico recibe el nombre de cuadro latino estndar.
Un cuadro latino estndar cclico es el que tiene los tratamientos de la primera fila y
primera columna en orden alfabtico y si las letras de cada fila se pueden obtener de las
previas corriendo la primera letra de una fila a la ltima posicin de la siguiente fila y
desplazando todas las dems letras de dicha fila.
Aleatorizacin
C D A B
D A B C
Con una tabla de nmeros aleatorios elija dos secuencias de nmeros, la primera del 2 al 4
(para permutar las tres filas) y una secuencia de 4 nmeros (para permutar las cuatro
columnas).
Suponga que las series fueron: (2,4, 3) y (3,1,4,2)
Cmo quedara el cuadro?
A B C D C A D B
B C D A D B A C
D A B C ------- B D C A
C D A B A C B D
Tambin puede elegirse al azar un cuadro latino estndar y se aleatorizan todas las filas y
las columnas.
Ejemplo:
Un ingeniero qumico elabora una salsa casera y piensa que la viscosidad de su producto no
es de la consistencia adecuada. Cree que la concentracin de harina y agua determina su
viscosidad, otros factores que tambin afectan la viscosidad son controlados a niveles fijos.
Desea probar 4 mezclas agua:harina, y son las mezclas 1:1 (1 parte de agua, 1 parte de
harina), 1:2, 1:3 y 1:4. Debido a que la elaboracin es tequiosa emplea a 4 qumicos para
que cada uno elabore la salsa con las cuatro mezclas. A su vez no se cuenta con 1 batidora
sino que tiene 4 batidoras para la elaboracin de las salsas. Las 4 batidoras trabajarn con
las 4 mezclas a fin de que todas las salsas tengan la misma oportunidad de ser batidas por
las 4 batidoras. Debido a que desea eliminar el efecto que pudiera ejercer el qumico o la
batidora en la variabilidad de los datos propone un diseo de cuadrado latino con dos
restricciones en la aleatorizacin: qumico y batidora.
Cul sera el modelo, hiptesis y supuestos?
Con los resultados que se presentan abajo construya su tabla de anlisis de varianza y
concluya.
Batidoras
C 10 D 14 A7 B8
B7 C 18 D 11 A8
A5 B 10 C 11 D9
D 10 A 10 B 12 C 14
124
A. Mezcla 1:1
B. Mezcla 1:2
C. Mezcla 1:3
D. Mezcla 1:4
C 10 D 14 A 7 B 8
B 7 C 18 D 11 A 8
A 5 B 10 C 11 D 9
D 10 A 10 B 12 C 14
Modelo
yijk = + i + j + k + eijk,
i= 1,2,...,p,
j= 1,2,...,p,
k= 1,2,...,p
donde,
es la media total para los p tratamientos usando todas las p combinaciones de 2 factores.
i es la parte de la media debida a la i-sima fila.
j es la parte de la media que se atribuye al j-simo tratamiento
k es la parte debida a la k-sima columna.
Supuestos:
1) las p2 poblaciones estn normalmente distribuidas
2) Tienen varianzas iguales
3) No existe interaccin
4) Existe independencia de errores.
Sumas de Cuadrados
p p P 2
y ...
SC total = yijk -
2
p
y 2. j. y 2...
SC Trat = -
j=1 p N
125
p 2
yi..
SC rengln = - f.c.
i=1 p
p 2
y ..k
SC column = - f.c.
k=1 p
Fuente de SC G.L. CM FC
Variacin
Tratam. SC trat p-1 SC trat/(p-1) CMtrat/CME
Rengln SC rengln p-1 SC reng/(p-1)
Columna SC columna p-1 SC col/(p-1)
Error SCE (p-2)(p-1) SCE/(p-2) (p-1)
Total p-1
Resolviendo el ejemplo:
126
SCT 1834
164 2
153.0
16
39 2 44 2 35 2 46 2
SC quim 1681 18.5
4
30 2 37 2 532 44 2
SC mezcla 1681 72.5
4
32 2 52 2 412 39 2
SCbatidora 1681 51.5
4
SC E 153 18.5 72.5 51.5 10.5
Fuente de SC G.L. CM FC
Variacin
Tratam. 72.5 3 24.17 13.81
Rengln 18.5 3 6.17
Columna 51.5 3 17.17
Error 10.5 6 1.75
Total 153 15
F0.05;3,6=4.76
Como Fc es mayor que el valor de la tabla, entonces rechazamos Ho, es decir, existen
diferencias entre las mezclas..
y...
i yi.. y...
j y. j . y...
k y..k y...
Vanse las frmulas de clculo para los tres casos en el libro de Montgomery.
Ejercicio Propuesto (tomado del libro Introduction to Experimental Statistics. C.C. Li.)
El siguiente es un cuadro latino en el que L y P son las dos fuentes de bloqueo, y a, b, c, d,
y e son los tratamientos. Encuentre los valores de los residuos y compruebe que suman cero
para L, para P y para cada tratamiento.
E C A D B Total
20 9 15 36 22 102
C B D E A
14 24 37 23 18 116
A 3 C B D
13 17 10 17 29 86
D A B C E
33 16 21 16 22 108
B D E A C
19 27 14 15 13 88
Totales
99 93 97 107 104 500
CM columnas ( p 1)CM E
B2
p
R
glEL 1 glEB 3 * B2
glEL 3 glEB 1 L2
Y para determinar la eficiencia del bloqueo de las columnas para el bloque con diseo de
bloques completamente aleatorizado el estimador del error del diseo de bloques sera:
128
CM filas ( p 1)CM E
B2
p
Y la eficiencia se obtiene:
R
glEL 1 glEB 3 * B2
glEL 3 glEB 1 L2
A continuacin se presenta un conjunto de ejemplos numricos que el alumno resolver
aplicando las frmulas propuestas por el libro de Montgomery.
Diferentes filas y mismas columnas.
A 7.0 B 8.0 C 9.0
B 4.0 C 5.0 A 6.0
C 6.0 A 3.0 B 4.0
Diseos conmutativos
Son diseos en los cuales a los sujetos se les da un nmero de tratamientos en una
secuencia de tiempo con el objeto de evaluar la diferencia entre tratamientos. Por
consiguiente se requiere la mitad de sujetos que los necesarios para una comparacin de los
tratamientos con distintos grupos de individuos. Cada sujeto sirve como su propio control.
Este tipo de diseo es un diseo de bloqueo en el cual cada unidad experimental o sujeto es
un bloque. Este diseo es muy til cuando hay una considerable variacin entre unidades
experimentales. Si hay demasiada diferencia entre las unidades las comparaciones de los
factores pueden ser confundidos por los efectos de grupos de unidades experimentales que
reciben los mismos tratamientos. Como cada sujeto recibe los diferentes tratamientos se
debe tener la seguridad que no hay efecto residual de los tratamientos con el objeto de
poder evaluar el siguiente tratamiento.
Se utiliza generalmente para comparar tratamientos de enfermedades crnicas no agudas ya
que en stas ltimas puede suceder que los individuos sanen al cabo o durante el primer
perodo de tratamiento.
Debido a su larga duracin puede que algunos individuos abandonen el experimento.
Tambin debido a que reciben varios tratamientos la aparicin de efectos secundarios
muchas veces obligan al paciente a abandonar el estudio. Si algn paciente abandona el
estudio al comenzar el segundo perodo se pierde la informacin de ese paciente.
Para que un diseo conmutativo se aplique correctamente se deben cumplir los siguientes
supuestos:
Existe una gran variacin incontrolable entre las unidades experimentales.
Los perodos de tiempo son de suficiente duracin para que se manifiesten los
efectos de los factores.
No hay efecto residual de un perodo al siguiente. Estos efectos tambin reciben el
nombre de efectos acarreados y se deben a: el efecto de un tratamiento perdura
tiempo despus de su aplicacin, o tambin la condicin del enfermo puede cambiar
durante el primer perodo.
Los efectos de los factores, si hay, no cambian en el tiempo, es decir no hay
interaccin del tiempo y los factores.
La enfermedad debe tener una intensidad constante durante todos los perodos de
tiempo.
Cuando se estudia el efecto de pocos factores, se utilizan secuencias de cuadros latinos
como diseos conmutativos. El ms comn es aqul en el cual se estudian dos tratamientos
en dos perodos con un perodo de limpieza o descanso entre ambos. A estos diseos se les
conoce como AB/BA, es decir la mitad de los sujetos reciben la secuencia A B y la otra
mitad BA, y despus del perodo de lavado la primera mitad recibe BA y la otra AB.
El ms comn es uno en el cual la mitad de los pacientes o individuos reciben un
tratamiento activo y en ocasin subsecuente un tratamiento imaginario o placebo, mientras
que el resto de los pacientes reciben primero el placebo y en una ocasin subsecuente el
tratamiento activo. Cuando se supone que no hay efectos acarreados recibe el nombre de
enfoque clsico y es el que se trata en esta seccin. Se puede considerar como series de
cuadros latinos de 2 x 2. En este diseo hay p tratamientos y p perodos de tiempo y hay np
unidades experimentales y np2 observaciones. Por ejemplo, suponga 20 sujetos que reciben
el tratamiento A y el placebo B, 10 sujetos primero reciben A y despus B y la otra mitad a
la inversa.
131
Perodos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 A B B A B AA B A B B A B A A B B A A B
2 B AA B A B B A B A A B A B B A A B B A
Ejemplo:
Son mediciones de flujo pico expiratorio (PEF) que es una medida de la funcin pulmonar,
en 14 nios de edades de 7 a 14 con asma moderada a severa, se estudi aplicando un
diseo conmutativo (o crossover) de 2 perodos de tiempo y 2 tratamientos que compara los
efectos de una dosis simple inhalada de 200g de salbutamol, que es un broncodilatador
bien conocido y 12 g de formoterol, un broncodilatador reciente. Los nios se
aleatorizaron a uno de dos grupos de secuencia. En un grupo se aplicaba la siguiente
secuencia: dosis formoterol en la maana, observado por 8 horas en la clnica, fueron a casa
donde sus padres tomaron mediciones de PEF despus de 10, 11 y 12 horas de tratamiento.
En una ocasin subsecuente despus del lavado (washout) de al menos un da se
presentaron en la clnica y se les administr el salbutamol.
1 2 3 4 5 6 7
Perodo 1 310 A 370 B 310 B 310 A 380 B 370 A 410 A
Perodo 2 270 B 380 A 400 A 260 B 410 A 300 B 390 B
8 9 10 11 12 13 14
Perodo 1 280 B 290 B 250 A 380 A 260 B 90 B 330 A
Perodo 2 310 A 320 A 210 B 350 B 340 A 220 A 360 B
2 3 5 8 9 12 13
Salbutamo 380 310 380 280 290 260 90
l
Formoterol 380 400 410 310 320 340 220
Note que aparecen dos letras griegas que corresponden a los errores de restriccin de las dos
fuentes de bloqueo que son el perodo de tiempo y los sujetos.
SC P
yi2..
GT 2
np np 2
SC S
y 2
. j.
f .c
p
y..2k
SCT f .c
np
SC P
yi2..
GT 2
14 28
SC S
y.2j.
f .c
2
y2
SCT ..k f .c
14
de modo que la tabla de Anlisis de varianza quedara as:
Ejercicio:
Una industria farmacutica desea probar dos drogas. Dispone de 12 personas. Se eligieron 6
personas al azar para recibir la droga 1 primero. Las otras 6 recibieron la droga 2 Despus
de un perodo suficiente de limpieza (washout), las 6 quienes recibieron la droga 1,
recibieron ahora la droga 2 y las 6 que primero recibieron la droga 2 recibieron ahora la
droga 1.
CUADRO GRECOLATINO
Columnas
I II III IV
1 A B C D
Filas 2 B A D C
3 C D A B
4 D C B A
Un ejemplo propuesto por Wu y Hamada (2000) puede ser que deseemos comparar tres
aditivos de gasolina probndolos en tres autos con tres automovilistas en tres das. Los aditivos
son los tratamientos asignados con las letra latina A, B y C. Los carros, automovilistas y das
son los factores de bloqueo asignados a las filas, columnas y letras griegas.
Modelo
yijkl = + i + j + k + l + ijkl
Este tipo de diseo no se usa con frecuencia ya que rara vez las unidades experimentales
pueden balancearse en los tres tratamientos, (Cochran, 1965). Si en el ejemplo citado en la
seccin de bloques completos (ejemplo de lodos de fosa sptica y nitratos en el agua) se cree
que la posicin en la que se coloque el lodo puede incrementar el error y se piensa que existen
diferencias entre las posiciones, se puede adicionar como una tercera fuente de bloqueo y
analizarlo mediante un cuadro grecolatino.
Los cuadros son ortogonales, ninguna letra griega aparece ms de una vez con cada
letra latina. Cada letra griega se presenta slo una vez en cada rengln y en cada columna.
La suma de cuadrados debida a la letra griega puede calcularse sumando los totales o
promedios de cada letra griega.
La ventaja principal de utilizar un cuadro grecolatino es que se permite controlar 3 fuentes de
variacin. Pero sus desventajas es que el nmero de unidades experimentales requeridas
aumenta muy rpidamente el aumentar el nmero de tratamientos a comparar. Si los cuadros
son pequeos el nmero de grados de libertad del error es pequeo, si se pierden datos se
complica el anlisis y es muy difcil un balance entre tres agrupaciones.
Si el cuadro es pequeo los grados del error son muy pequeos:
Si p = 3, los g.l. del error = 0
p = 4, g.l. error = 3.
Para cuadros grecolatinos grandes se requieren muchas unidades experimentales. Por ejemplo
si p = 12 se requieren 144 unidades experimentales.
Ejemplo:
Una medida compuesta de la calidad de la pantalla se tomaron en pantallas que usaron cuatro
concentraciones de laca, cuatro tiempos, cuatro concentraciones del acriloide (A, B, C y D) y
cuatro concentraciones de acetona (. , y ).
135
Concentracin de laca
Tiempos 0.5 1 1.5 2
30 C = 16 B = 12 D = 17 A = 11
20 B = 15 C = 14 A =15 D = 14
10 A = 12 D = 6 B = 14 C = 13
5 D = 9 A = 9 C = 8 B = 8
Este diseo se emplea cuando no se pueden aplicar todos los tratamientos dentro de cada
bloque. Es decir, no todos los tratamientos estn en todos los bloques. A estos tambin se
les conoce como diseos de bloques incompletos aleatorizados. Cuando todos los
tratamientos son igual de importantes, los tratamientos usados dentro de cada bloque deben
seleccionarse de modo balanceado o sea que cualquier par de tratamientos se presenten
juntos el mismo nmero de veces.
El nmero de tratamientos es a y el nmero de tratamientos dentro de cada bloque es k (k <
a).
Se puede construir un diseo de bloques incompletos balanceados tomando las
a
combinaciones bloques y asignando una combinacin diferente de tratamiento a cada
k
bloque.
Por ejemplo, si a = 5 y se cuenta con 5 bloques sera un diseo de bloques completos.
Si se trata de 5 tratamientos y 4 se pueden aplicar dentro de cada bloque, entonces existen
5!/4!1!=5 bloques con cuatro tratamientos cada uno.
Tambin 5!/3!2!=10 bloques con tres tratamientos cada uno.
N= ar =bk
El valor es el nmero de veces que cualquier par de tratamientos Ai, Aj aparecen juntos.
Por ejemplo en el siguiente diseo:
B1 B2 B3 B4 B5 B6 B7
A1 X X X X
A2 X X X X
A3 X X X X
A4 X X X X
A5 X X X X
A6 X X X X
A7 X X X X
Puede observarse que los tratamientos 1 y 2 aparecen juntos en los bloques 1 y 3. Los
tratamientos 1 y 3 en los bloques 1 y 2; los tratamientos 1 y 4 en los bloques 2 y 6, es decir
el valor de es igual a 2. Tambin puede observarse que el nmero de veces que aparece
cada tratamiento, o bien r, es igual a 4.
Con k niveles de A pareados con cada nivel de B el nivel Ai estar apareado con k-1 otros
niveles de A dentro de cada nivel de B con el que est apareado.
Si Ai est apareado con r diferentes niveles de B, entonces el nmero de veces que parece Ai
combinado con otros niveles de A es r(k-1).
137
Por otro lado, debido a que cada nivel de A est pareado con cada otro nivel de A veces,
el nmero de veces que Ai est apareado con cada uno de los otros (a-1) niveles de A debe
ser (a-1) por lo tanto es cierto que:
r(k-1=(a-1) y
Para que sea un diseo de bloques incompletos balanceados debe cubrir tres condiciones:
1) ar = bk
2) r(k-1) = (a-1)
3) b a
Diseo 13.
a=7 k=4 r=4 b=7 =2
Bloque
(1) 3 5 6 7
(2) 1 4 6 7
(3) 1 2 5 7
(4) 1 2 3 6
(5) 2 3 4 7
(6) 1 3 4 5
(7) 2 4 5 6
138
Una vez seleccionado el diseo, entonces se aleatorizan los tratamientos a las unidades
experimentales de cada bloque: es decir en dos urnas colocar los tratamientos y en la otra
las unidades experimentales de ese bloque. Hacer una aleatorizacin diferente por bloque.
Suponga que se quiere comparar 5 tratamientos pero los bloques solo pueden soportar 4
tratamientos.
5
a) Se pueden formar 5 bloques
4
1234
1235
1245
1345
2345
a 1 4
4 rplicas
k 1 3
a 2 5 2
3
k 2 4 2
Diseo 5
139
(1) 1 2 3 4
(2) 1 2 3 5
(3) 1 2 4 5
(4) 1 3 4 5
(5) 2 3 4 5
Automviles
1 2 3 4 5 Yi.
1 17 14 13 12 56
2 14 14 13 10 51
3 12 13 12 9 46
4 13 11 11 12 47
5 11 12 10 8 41
y.j 50 54 48 50 39 241
Los diseos de bloques incompletos balanceados son balanceados en el sentido de que cada
nivel del factor ocurre en exactamente r bloques y cada par de tratamientos ocurren juntos
exactamente veces.
Hiptesis
Ho: i = j ij
H1: i j para al menos una i y una j
Supuestos
a
=0i
i=1
n
=0
j=1
j
ij _ N(0, 2 )
Sumas de Cuadrados
140
a b
SCT y ij2 fc
i 1 j 1
a
k Qi2
i 1
SCTratadj
a
1 b
Qi y i . nij y. j
k j 1
b y .2j
SC Bloque fc
j 1 k
Se puede observar que hay un ajuste en la suma de cuadrados de los tratamientos porque cada
tratamiento es representado en un juego diferente de r bloques. Por lo tanto las diferencias
entre totales no ajustados son afectados tambin por las diferencias entre bloques.
En las frmulas anteriores los Qi son los totales ajustados para cada tratamiento; nij es 1 0 ;,
1 si el tratamiento aparece en el bloque y 0 si el tratamiento no aparece en el bloque y
1 b
nij y. j es el promedio de los totales de los bloques en los que se aplica el tratamiento i.
k j 1
La suma de los Qi = 0
En el ejemplo:
SCT=2981-(241)2/20=76.95
50 2 54 2 48 2 50 2 39 2
SC Auto 2904.5 31.2
4
1
Q1 56 54 48 50 39 8.25
4
1
Q2 51 50 54 50 39 2.75
4
1
Q3 46 50 48 50 39 0.75
4
1
Q4 47 50 54 48 50 3.5
4
1
Q5 41 50 54 48 39 6.75
4
SC Adivadj
4 8.25 2 2.75 2 ( 0.75) 2 ( 3.5) 2 ( 6.75) 2
35.73
3(5)
SC E 76.95 31.20 35.73 10.02
Grados de Libertad
Aditivos: a-1 5-1 = 4
Autos: b-1 5-1 = 4
Error: Dif. 11
Total N-1 19
141
Estimacin de Parmetros
Eliminando las comparaciones entre bloques sobre los efectos de tratamiento
y..
kQi
i
a
Comparaciones Mltiples
Si deseamos probar las siguientes hiptesis:
Ho : 1 2 0
Ho : 3( 1 2 ) 2( 3 4 5 )
Ho: Efecto lineal de 3,4 y 5
Ho: Efecto cuadrtico de 3,4 y5
C1: 1(8.25)-1(2.75)=5.5
C2: 3(8.25+2.75)-2(-0.75-3.5-6.75)=-6
C3:-1(-0.75)+0(-3.5)+1(-6.75)=-6
C4:-1(-0.75)+2(-3.5)+1(-6.75)=-13
2
a
k c Q i i
SCCi a
a ci2
SCc1=4.03
SCc2=26.89
SCc3=4.8
SC4c4=7.51
Para ver si son o no significativos los contrastes, cada suma de cuadrados tiene 1 grado de
libertad, se comparara contra el CME.
Si se quisiera aplicar la prueba de Duncan el error estndar para los efectos de tratamientos
ajustados es:
kCM E
S
a
Y lo que se comparara son los efectos de los tratamientos ms que las medias. Para la DSM :
2kCM E
S
a
Prueba de Scheff
El contraste que se quiere probar es:
k
c
i i
a
ci Qi
a
k
SCC c
I 1
2
i
a
CM E
Y el valor de Scheff
El error estndar de las medias ajustadas que tambin puede utilizarse en las comparaciones
mltiples como en los intervalos de confianza y lo que se compara son las medias ajustadas
ajust i :
k (a 1) 1
CME
a
2
N
Tarea: Aplique la prueba de Duncan en el ejemplo anterior.
Ejercicios Sugeridos:
1. Cmo quedara el anlisis si aparte de que es un diseo incompleto se pierde algn dato, en
el ejemplo la observacin del aditivo 3 y auto 3?
2. Leer Recuperacin de la informacin interbloque.
3. Se utiliz un diseo de bloques incompletos balanceados para estudiar la ganancia en
peso en 3 vacas con cuatro diferentes raciones. Las raciones se dieron en 4 semanas. Los
datos se presentan a continuacin. Considere las semanas como los bloques y las raciones
son los tratamientos.
Semanas A B C D
1 2 - 20 7
2 - 32 14 3
3 4 13 31 -
4 0 23 - 11
a) Calcule el valor de
b) Realice el anlisis de varianza con los totales de los tratamientos ajustados y
los totales de los bloques ajustados, establezca sus conclusiones.
c) Construya contrastes ortogonales y compare los totales de tratamiento
ajustados
d) Realice la prueba de Duncan.
Este ejemplo se obtuvo del sitio www.stat.psu/~prem/Lec6.html.