Está en la página 1de 6

CAPITULO 3

Experimentos con un solo factor: el anlisis de la varianza.



El anlisis de varianza:
Suponga que tiene a tratamientos o niveles de diferentes de un solo factor que quieren
compararse. La respuesta observada a cada uno de los a tratamientos es una variable aleatoria.
Habr, en general, n observaciones bajo el tratamiento i-simo
Se encontrar til describir las observaciones de un experimento con un modelo. Una manera
puede ser la siguiente: (Modelo de los efectos)


{


}
Donde

es la observacin ij-sima, es la media del nivel del factor o tratamiento i-simo y
es un componente del error aleatorio que incorpora todas las dems fuentes de variabilidad del
experimento incluyendo las mediciones y la variabilidad que surge de factores no controlados. De
esta ecuacin surge el modelo de las medidas:


Entonces:


{


}
En esta forma del modelo es un parmetro comn a todos los tratamientos al que se llama la
medida global, y es un parmetro nico del tratamiento i-simo al que se llama el efecto del
tratamiento i-simo.
Tanto el modelo de las medidas como el modelo de los efectos son modelos estadsticos lineales.
Es deca la variable de respuesta

es una funcin lineal de los parmetros del modelo. Al
modelo de las medidas se le llama tambin el modelo de anlisis de varianza simple o de un solo
factor porque nicamente se investiga un factor. Por lo tanto el diseo experimental es un diseo
completamente aleatorizado, los objetivos sern probar las hiptesis apropiadas acerca de las
medidas de los tratamientos y estimarlas. Para probarlas se supone que los errores del modelo
son variables aleatorias que siguen una distribucin normal e independiente con media cero y
varianza
2
.
Modelo con efectos fijos: las conclusiones no puede extenderse a tratamiento similares que no
fueron considerados explcitamente. Tambin se podra querer estimar el parmetro del modelo
(


.
Modelo con efectos aleatorios o modelo de los componentes de la varianza: De manera
alternativa los a tratamientos podran ser una muestra aleatoria de una poblacin ms grande
de tratamientos. Ms bien se prueban hiptesis acerca de la variabilidad de las y se intenta
estimar es variable y aleatoria y su conocimiento es totalmente intil.
ANALISIS DEL MODELO CON EFECTOS FIJOS.


Es decir: los efectos del tratamiento o factor pueden considerarse como desviaciones de la media
global. Se habla de probar la igualdad de las medias de los tratamientos o de probar que lo
efectos de los tratamientos (Los/as ) son cero. El procedimiento apropiado para probar la
igualdad de las medias de los a tratamientos es el anlisis de la varianza.
El nombre de anlisis de varianza se deriva de la particin de la variabilidad total en sus partes
componentes. La suma de cuadrados total corregida:


La varianza muestral del tratamiento i-simo:




De manera similar, sino hubiera diferencias entre las medidas de los a tratamientos podra
usarse la variacin de los promedios de los tratamientos y el gran promedio para estimar




Es una estimacin de

si las medidas de los tratamientos son iguales.


Anlisis Estadstico
Puesto que se ha supuesto que los errores siguen una distribucin normal, con media 0 y
varianza

, las observaciones y

tienen una distribucin normal e independiente con media
Y varianza

. Por la tanto

es una suma de cuadrados de variables aleatorias con una
distribucin normal; por consiguiente puede demostrarse que

tiene una distribucin ji-


cuadrada con N-1 grados de libertad. Adems puede demostrarse que

es una variable con N-a


grados.
Pruebas de aleatorizacin y anlisis de varianza.
En el desarrollo de anlisis de varianza con la prueba F, se ha utilizado el supuesto de los errores
en aleatorios son variables aleatorias que siguen una distribucin normal e independiente.
Tambin es posible justificar la prueba F como la aproximacin de una prueba de aleatorizacin.
Suponga:

Tratamiento 1 Tratamiento 2
Y
11
Y
21

Y
12
Y
22

Y
13
Y
23

Y
14
Y
24

Y
15
Y
25


Podra utilizarse el anlisis de varianza con la prueba F. De manera alternativa podra recurrirse a
un enfoque diferente. Supongamos que se consideran todas las formas posibles de asignar los 10
nmeros de la muestra anterior a los dos tratamientos. Hay 10!/5!5!=225 arreglos posibles de las
10 observaciones a los cuales se le calcula el valor estadstico F. A la distribucin de estos valores
F se le llama distribucin de aleatorizacin
Intervalos de confianza simultneos:
Si hay un inters en r de estos intervalos de confianza de 100(1-a) por ciento, la probabilidad de
que los r intervalos sean correctos simultneamente es al menos 1-ra. A la probabilidad de ra se
le llama con frecuencia ndice de error en el modo del experimento o coeficiente de confianza
global. El nmero de intervalos r no tiene que ser muy grande antes de que el conjunto de
intervalos de confianza se vuelva relativamente falto de informacin. Un enfoque para asegurarse
de que el nivel de confianza simultaneo no sea demasiado pequeo es sustituir a/2 con a/2r en el
intervalo de confianza uno a la vez. A este mtodo se la llama como el mtodo de Bonferroni, y le
permite al experimentador construir un conjunto de r intervalos de confianza simultneos para las
medidas de los tratamientos a las diferencias en las medidas de los tratamientos para los que el
nivel de confianza global es de al menos 11(a-1)%.
Datos no balanceados:
En algunos experimentos con un solo factor, puede ser diferente el nmero de observaciones que
se hacen dentro de cada tratamiento. Se dice entonces que el diseo no es balanceado. Siempre
sigue siendo posible el anlisis de varianza previamente descrito
Verificacin de la adecuacin del modelo:
La descomposicin de la variabilidad presente en las observaciones mediante la identidad del
anlisis de varianza es una relacin puramente algebraica. Sin embargo el uso de la particin para
probar formalmente que no hay diferencias en las medidas de los tratamientos requiere que se
satisfagan ciertos supuestos. Especficamente hablando:



Describe de manera adecuada las observaciones y que los errores siguen una distribucin normal
e independiente con media cero y varianza
2
contante pero desconocido. Si estos supuestos se
satisfacen el procedimiento de anlisis de varianza es una prueba exacta de la hiptesis de que no
hay diferencias. Sin embargo es comn que en la prctica estos supuestos no se satisfagan, por
consiguiente no es prudente confiar en el anlisis de varianza hasta haber verificado estos
supuestos. Las violaciones pueden investigarse con facilidad mediante el examen de los residuales.
El anlisis de los residuales deber ser una parte automtica del anlisis de varianza. Si el modelo
es el adecuado, los residuales debern estar sin estructura, es decir no debern tener patrones
obvios.
El supuesto de la normalidad:
Podra hacerse graficando un histograma de residuales. Esta grafica deber aparecer como una
muestra de una distribucin normal con centro en cero. Cuando se trabaja con muestras
pequeas, suelen ocurrir fluctuaciones significativas, por lo que la aparicin de una desviacin
moderada de la normalidad no implica necesariamente una violacin seria de los supuestos. Las
desviaciones marcadas de la normalidad son potencialmente serias y requieren anlisis adicional.
La desviaciones moderadas de la normalidad no son motivo de gran preocupacin en el anlisis de
la varianza de efectos fijos. Las desviaciones de la normalidad hacen por lo general que tanto el
verdadero nivel de significacin como la verdadera potencia difieran ligeramente de los valores
anunciados. El modelo de los efectos aleatorios, afecta de forma ms severa por la no normalidad.
Interpretacin prctica de los resultados:
Esto podra hacerse de manera un tanto informal, tal vez mediante la inspeccin de las
representaciones graficas como los diagramas de caja y el dispersin.
Un modelo de regresin:
Los factores que intervienen en un experimento pueden ser cualitativos y cuantitativos. Un factor
cuantitativo es aquel cuyos niveles pueden asociarse con puntos en una escala numrica. Los
factores cualitativos por otra parte son aquellos cuyos niveles no pueden ordenarse por magnitud.
En lo que se refiere al diseo inicial y anlisis del experimento, ambos tipos de factores se tratan
de manera idntica. El experimentador est interesado en encontrar las diferencias, es caso de
que existan. Si cualitativo no tiene caso considerar la respuesta de una corrida subsecuente en un
nivel intermedio del factor. Si es cuantitativo uno tiene inters por lo general en el rango completo
de los valores usados. Al enfoque general para ajustar modelos empricos se le llama Anlisis de
regresin.
Contraste:
En general un contraste es una combinacin lineal de parmetros de la forma:


Donde los constantes de los contrastes suman 0. La prueba de hiptesis incluye contrastes
pueden hacerse de dos maneras bsicas. En el primer mtodo se utiliza la prueba t, el contraste de
inters se escribe en trminos de los totales de los tratamientos. En el segundo enfoque se utiliza
la prueba F, el cuadrado de una variable aleatoria t con v grados de libertad es una variable
aleatoria F con una grado de libertad en el numerado y v grados de libertad en el denominador. En
lugar de una Ho de un contraste, es ms til construir un intervalo de confianza.

Contraste estandarizado:
Cuando se muestra inters en ms de un contraste, con frecuencia es til evaluarlos en la misma
escala. Una forma de hacer esto es estandarizando el contraste para que su varianza sea
2
.
Determinacin del tamao de una muestra:
Si el experimentador tiene inters en detectar efecto pequeos, se necesitan ms replicas que
cuando se interesa en efectos grandes.
1. Curvas de operacin caracterstica: es una grfica de la probabilidad del error tipo II
de una prueba estadstica para un tamao de la muestra en particular contra un
parmetro que refleja la medida en que la hiptesis nula es falsa. Se pueden usar estas
curvas como guas en la seleccin de nmero de rplicas para que el diseo sea
sensible a diferencias potenciales importantes en los tratamientos. Se considera la
probabilidad de error tipo II de modelo con efectos fijos para el caso en que se usa el
mismo tamao de las muestras en cada tratamiento.
2. Especificacin de un incremento de la desviacin estndar: es til en ocasiones para
elegir el tamao de la muestra. Si la medida de los tratamientos no difieren, la
desviacin estndar de una observacin elegida al hacer es . Sin embargo las medidas
difieren la desviacin estndar de una observacin elegida al azar es


3. Mtodo para estimar el intervalo de confianza: se supone que el investigador quiere
expresar los resultados finales en termino de confianza y que est dispuesto a
especificar por anticipado cual es el ancho que desea para estos intervalos de
confianza. Un enunciado de confianza simultneo p conjunto pueden construirse con
respecto a contraste ms generales en las medias de los tratamientos.
Identificacin de efectos de dispersin:
Se acostumbra a referirse a estos como efectos de localizacin. En alguno problemas el inters se
centra en descubrir si los diferentes niveles del factor afectan la variabilidad, es decir, el inters
est en descubrir efectos de dispersin potenciales.
El enfoque de regresin para el anlisis de varianza:
Llamada la prueba general de significacin de la regresin, el procedimiento consiste en esencia
en encontrar la reduccin de en la suma de cuadrados total para ajustar el modelo con todos los
parmetros incluidos y la reduccin de en la suma de cuadrados cuando el modelo restringe la
hiptesis nula.
1. Estimacin de mnimos cuadrados de los parmetros del modelo: A las ecuaciones
utilizadas se les llama ecuaciones normales de mnimos cuadrados. Estas ecuaciones
pueden llegar a tener mucha dificultad, pues los efectos de los tratamientos se han
definido de la media global. Por lo que parece razonable aplicar la restriccin. Puesto
que el inters se encuentra generalmente en las diferencias entre los efectos de los
tratamientos y no es sus valores reales, no produce preocupacin alguna que
1
no
pueda estimarse de manera nica. Cualquier funcin de los parmetros del modelo
que sea una combinacin lineal del miembro del lado izquierdo de las ecuaciones
normales puede estimarse de manera nica. A las funciones que se estiman de
manera nica independientemente de la restriccin que se use se les llama funciones
estimables.
2. Prueba general para el anlisis de la varianza: una parte fundamental de este modelo
es escribir las ecuaciones normales del modelo. Estas funciones siempre podrn
obtenerse formando la funcin de mnimos cuadrados y derivndola con respecto a
cada parmetro desconocido. Sin embargo hay un mtodo ms sencillo, las siguientes
reglas permiten escribir directamente las ecuaciones normales de cualquier diseo
experimental:
a. Regla 1: Hay una ecuacin normal para cada parmetro del modelo que va a
estimarse
b. Regla 2: El miembro derecho de cualquier ecuacin normal es solo la suma de
todas las observaciones que contiene el parmetro asociado con esa ecuacin
normal particular.
c. Regla 3: El miembro izquierdo de cualquier ecuacin normal es la suma de los
parmetros del modelo, donde cada parmetro esta multiplicado por el
nmero de veces que aparece en el total del miembro derecho y no los
verdaderos valores de los parmetros.
Al ajustar un modelo a los datos se explica parte de la variabilidad; es decir, la variabilidad mp
explicada se reduce en cierta cantidad. La reduccin de la variabilidad no explicada es siempre la
suma de las estimaciones de los parmetros. Cada una de ellas multiplicada por el segundo
miembro de la ecuacin norma que corresponde al parmetro especifico.

También podría gustarte