Estadistica Inferencial

NDICE
PG.
Unidad II.- Diseo de experimentos de un factor ................................................................................. 2

2.1.- Estrategia de experimentacin .................................................................................................. 2
2.1.- Objetivos de un diseo de experimento .................................................................................... 2
2.3.- Experimento con un solo factor completamente aleatorizado ............................................... 3
2.3.1.- Trminos utilizados para una mejor comprensin de la unidad. ................................... 3
2.3.2.- El anlisis de varianza (ANDEVA o ANOVA) ...................................................................... 4
2.3.4.- El modelo estadstico lineal ................................................................................................. 7
2.3.5.- Diseo experimental completamente aleatorizado .......................................................... 8
2.3.6.- El modelo de efectos fijos .................................................................................................. 12
2.3.7.- El modelo de efectos aleatorios ........................................................................................ 16
2.3.8.- La suma total de cuadrados ............................................................................................... 17
2.3.9.- La tabla de ANDEVA ........................................................................................................... 18
2.3.10.- El diseo desbalanceado ................................................................................................. 19
2.3.11.-
............................................. 19
2.3.12.- Intervalo d/confianza p/la diferencia d/medias d/2 tratamientos ............................ 19

2.3.13.- Anlisis de residuales y verificacin del modelo. .......................................................... 19
2.4.- Pruebas sobre medias de tratamientos individuales ............................................................. 20
2.4.1.- Comparacin grfica de medias ........................................................................................ 20
2.4.2.- Mtodo de la diferencia significativa mnima de Fisher ................................................. 20
2.4.3.- Otros mtodos para pruebas sobre la diferencia d/medias d/2 tratamientos ............. 20
2.5.- Determinacin del tamao de la muestra en experimentos con un solo factor .................. 20
UNIDAD II.- DISEO DE EXPERIMENTOS DE UN FACTOR

Competencias especficas a desarrollar:
Aplicar el Anlisis de Varianza con el objeto de procesar la informacin y tomar una
decisin en base a los resultados obtenidos.
Interpretar los resultados de los experimentos, para elegir la mejor opcin.
2.1.- Estrategia de experimentacin

El diseo experimental utiliza tcnicas como la regresin mltiple, la superficie de respuesta, el
diseo de parmetros y varias extensiones del anlisis de varianza, as como los anlisis grficos y
las comparaciones mltiples. Disear un experimento significa planear un experimento de modo
que rena la informacin pertinente al problema bajo investigacin. El D.E. es la secuencia
completa de pasos tomados con antelacin, para asegurar que los datos se obtendrn
apropiadamente de modo que permitan un anlisis objetivo que conduzca a deducciones vlidas
con respecto al problema bajo estudio.
2.1.- Objetivos de un diseo de experimento

1. Proporcionar la mxima cantidad de informacin pertinente al problema bajo investigacin.
2. El diseo, plan o programa debe ser tan simple como sea posible.
3. Proporcionar mtodos que permitan obtener la mayor cantidad de informacin vlida acerca de
una investigacin, teniendo en cuenta el factor costo y el uso adecuado del material disponible
mediante mtodos que permitan disminuir el error experimental.
Etapas de un diseo de experimentos.
1.
2.
3.
4.
5.
6.
7.
8.
9.
Enunciado o planteamiento del problema.

Formulacin de hiptesis.
Proposicin de la tcnica experimental y el diseo.
Examen de sucesos posibles y referencias en que se basan las razones para la indagacin
que asegure que el experimento proporcionar la informacin requerida y en la extensin
adecuada.
Consideracin de los posibles resultados desde el punto de vista de los procedimientos
estadsticos que se aplicarn, para asegurar que se satisfagan las condiciones necesarias y
sean vlidos estos procedimientos.
Ejecucin del experimento.
Aplicacin de las tcnicas estadsticas a los resultados experimentales.
Extraccin de conclusiones con medidas de la confiabilidad de las estimaciones generadas.
Valoracin de la investigacin completa y contrastacin con otras investigaciones del
mismo problema o similares.
2
2.3.- Experimento con un solo factor completamente aleatorizado

Muchas comparaciones, como las antes mencionadas, se hacen con base en el diseo
completamente al azar (DCA), que es el ms simple de todos los diseos que se utilizan para
comparar dos o ms tratamientos, dado que slo consideran dos fuentes de variabilidad: los
tratamientos y el error aleatorio.
Este diseo se llama completamente al azar porque todas las corridas experimentales se realizan
en orden aleatorio completo. De esta manera, si durante el estudio se hacen en total N pruebas,
stas se corren al azar, de manera que los posibles efectos ambientales y temporales se vayan
repartiendo equitativamente entre los tratamientos.
2.3.1.- Trminos utilizados para una mejor comprensin de la unidad.

Unidad experimental: son los objetos, individuos, intervalos de espacio o tiempo sobre los que se
experimenta.
Variable de inters o respuesta: es la variable que se desea estudiar y controlar su variabilidad.
Factor: son las variables independientes que pueden influir en la variabilidad de la variable de
inters.
Niveles: cada uno de los resultados de un factor. Segn sean elegidos por el experimentador o
elegidos al azar de una amplia poblacin se denominan factores de efectos fijos o factores de
efectos aleatorios.
Tratamiento: es una combinacin especfica de los niveles de los factores en estudio.
Observacin experimental: es cada medicin de la variable respuesta.
Tamao del Experimento: es el nmero total de observaciones recogidas en el diseo.
Diseo Equilibrado o Balanceado: es aquel en el que todos los tratamientos son asignados a un
nmero igual de unidades experimentales.
Agrupamiento. Colocacin de un conjunto de unidades experimentales homogneo en grupos, de
modo que los diferentes grupos puedan sujetarse a distintos tratamientos.
Bloqueo. Distribucin de las unidades experimentales en bloques, de manera que las unidades
dentro de un bloque sean relativamente homogneas, de esta manera, la mayor parte de la
variacin predecible entre las unidades queda confundida con el efecto de los bloques.
Confusin. Cuando los efectos de dos o ms factores no se pueden separar.
3
2.3.2.- El anlisis de varianza (ANDEVA o ANOVA)

La tcnica del Anlisis de la Varianza (ANDEVA) es una de las tcnicas ms utilizadas en los anlisis
de los datos de los diseos experimentales. Se utiliza cuando queremos contrastar ms de dos
medias, por lo que puede verse como una extensin de la prueba t para diferencias de dos medias.
El ANDEVA usado para analizar experimentos, es un mtodo muy flexible que permite construir
modelos estadsticos para el anlisis de los datos experimentales. Bsicamente es un
procedimiento que permite dividir la varianza de la variable dependiente, generalmente variable
continua, en dos o ms componentes, cada uno de los cuales puede ser atribuido a una fuente
(variable o factor) identificable y la otra al error experimental. Las variables independientes son
generalmente nominales, son los Factores en estudio y hacen grupos o tratamientos.
Los modelos que permite construir el ANDEVA pueden ser reducidos al cociente entre dos
varianzas, el numerador es la varianza del modelo como los tratamientos, bloques, etc. y el
denominador es la varianza de los errores. Por ejemplo en un caso de Andeva unifactorial anova
one way el valor F calculado es
El ANDEVA est basado en ciertos supuestos, unos ms posibles que otros Es evidente que cuantos
ms factores introduzcamos se espera que quede menos cantidad de variacin residual (error) por
explicar. Pero siempre quedar alguna variacin residual.
Suposiciones del Anlisis de Varianza
En cada ocasin que se realice un anlisis de varianza (ANDEVA), rutinariamente deben
examinarse los datos para determinar si estos indican alguna desviacin de los supuestos que rigen
dicho anlisis. Por lo tanto, es recomendable realizar un anlisis de las suposiciones en las que se
basa el ANDEVA junto con el anlisis mismo. Slo despus de hacer este anlisis de suposiciones y
que stas se cumplan razonablemente, se puede expresar con cierta confianza la validez de los
resultados estadsticos.
Las suposiciones en las que se basa el ANDEVA son las siguientes:
Los errores de los datos son normales.
Varianzas son homogneas.
Independencia de medias y varianzas
Aditividad del modelo
Normalidad de los errores: Es relativamente fcil hacer pruebas de normalidad de los errores
con programas estadsticos computacionales, ya sea con un grfico QQ plot o la prueba de
normalidad de Shapiro Wilks. En la primera prueba el valor r de correlacin debe ser mayor a
0.95 y en la segunda prueba el valor p de la prueba de hiptesis debe ser mayor a 0.05, estar en
H0. El programa INFOSTAT puede calcular los errores de cada dato y hace ambas pruebas. Sin
embargo este requisito no es tan importante como la Independencia de las Observaciones, pues en
general el ANDEVA es una prueba robusta. Esto quiere decir que, aunque los errores de las
observaciones no sean normales, las medias de los tratamientos son aproximadamente normales
debido al Teorema Central del Lmite. Sin embargo, si los errores de los datos son extremadamente
no-normales, es posible transformar los datos para cubrir este requisito, o bien emplear mtodos
no paramtricos.
Homogeneidad de varianzas de los diferentes tratamientos: Es muy importante para el
modelo verificar su hay homogeneidad de las varianzas de los diferentes tratamientos, pues si esto
no se cumple se pueden invalidar los resultados de una HA. Una poblacin heterognea en
varianzas no permite detectar si las diferencias observadas se deben diferencias de promedios o
de las varianzas.
Para corroborar o refutar las afirmaciones hechas respecto de la hiptesis de la homogeneidad de
las varianzas de los grupos o tratamientos respecto a la variable dependiente, se dispone de la
prueba de Levene de homogeneidad de varianzas. Esta prueba funciona como un estadstico F de
la distribucin F de Fisher, donde la H0 consiste en suponer que las varianzas de los errores
absolutos de los distintos grupos son iguales. Se rechazar esta H0 en el caso de que la significacin
del estadstico sea menor que 0,05. El estadstico de Levene se hace realizando una ANDEVA una
va con los errores en valor absoluto, INFOSTAT calcula este tipo de error.
5
Independencia de promedios y varianzas: Que un promedio mayor no tenga independencia

entre medias y varianzas es un caso especial de falta de homogeneidad de varianzas. En algunos
datos existe una relacin definida entre las medias y sus varianzas, por ejemplo el nmero de hojas
de plantas de tomate de un mes y de tres meses, en ambos casos no solo hay diferencias de
promedios sino tambin de varianzas, a ms edad mayor promedio y varianza. Este problema se
puede manejar con un buen diseo del experimento. Sin embargo esta relacin suele ser la causa
ms comn de heterogeneidad de varianza. Una correlacin positiva entre medias y varianzas es
una forma de detectar el problema, cuando se observa un amplio rango entre las medias. El
estadstico de Levene tambin detecta este problema.
Aditividad del modelo
Una prueba ANDEVA supone que los datos siguen un modelo lineal aditivo. Para cada diseo
experimental se construye un modelo matemtico lineal aditivo, para el caso de un diseo
completamente aleatorio, DCA, es = . La ecuacin expresa que el valor de
cualquier unidad experimental est compuesta por la media general, ms o menos el efecto de
tratamiento y ms o menos un termino de error caracterstico de cada dato . En este modelo
los trminos se suman, si esto no ocurre as, el ANDEVA nos puede llevar a conclusiones
incorrectas. La falta de aditividad puede ocurrir por un mal diseo del experimento, por ejemplo
si se prueban diferentes dosis de fertilizante, pero cada dosis se prueba en una especie de planta
diferente, puede resultar una interaccin entre dosis de fertilizante y especie de planta que rompa
el modelo aditivo.
Qu hacer cuando el modelo no funciona?
La violacin o falta de apego a cualquiera de estas suposiciones indica que los resultados podran
no tener validez. Dependiendo del tipo de problema, puede haber solucin o no al objetivo buscado
en el experimento. El dilema ms fuerte con el que ha de luchar el experimentador es el de la falta
de homogeneidad de varianzas, ya que si esto ocurre, no podemos saber si las diferencias entre los
tratamientos se deben a promedios diferentes o varianzas diferentes.
La falta de normalidad no es tan importante, pues la prueba ANDEVA es robusta a este problema
y, en casos extremos, se puede optar por el uso de transformaciones. En general para los casos en
6
que los supuestos de normalidad, homogeneidad, independencia de medias-varianzas o aditividad

no se cumplen, puedo usar transformaciones de datos, las ms usadas son:
Logaritmo Log (x), til cuando los datos crecen en sentido exponencial o cuando las
desviaciones estndares de las muestra sean aproximadamente
proporcionales a los promedios o hay evidencia de efectos principales multiplicativos de

los tratamientos en vez de aditividad.
La transformacin + 0.5 til cuando los nmeros observados son pequeos 0-10, por
ejemplo son acontecimientos pocos comunes, tienen una posibilidad muy baja de ocurrir
en cualquier individuo. Estos datos tienden a seguir una distribucin de Poisson.
La transformacin /100 cuando los datos son expresados en por ciento o son
proporciones de la muestra total. Por lo general estos datos tienen una distribucin
binomial y no de una distribucin normal como se espera.
Como ltimo recurso, ante datos dudosos de anlisis se puede usar el uso de mtodos de estadstica
no paramtrica. Es importante mencionar que el empleo de estadstica no paramtrica o el uso de
transformaciones no eliminan el problema de la falta de aleatoriedad de las unidades
experimentales, errores por un mal diseo del experimento o por una mala toma de datos, es decir,
la ejecucin incorrecta de un experimento no tiene ms remedio que repetir el experimento
corrigiendo los errores por falta de diseo o mal manejo.
2.3.4.- El modelo estadstico lineal

El modelo aditivo lineal deber ser formulado para incluir el trmino correspondiente el error de
muestreo:
= + + +
Donde:
= es el verdadero efecto medio
i= es el efecto del i-esimo tratamiento
ij= es el efecto de la j-esima unidad experimental sujeta a la i-esimo tratamiento (o error de
muestreo)
ijl= es igual que el efecto
7
Y= Es un estimador de
(Yi-Y)= Es un estimador de los efectos de tratamiento i
(Yij-Yi)= es el estimador del error experimental ij
(Yijl-Yij)= es un estimador del error de muestreo ijl
Hipotesis nula y alterna:
Ho: 1=2=3==k
Ha: 1 23k
Es decir;
Ho: no existe diferencia significativa entre los tratamientos.
Ha: existe diferencia significativa entre los tratamientos.
Cuadro de ANOVA en caso de submuestreo
2.3.5.- Diseo experimental completamente aleatorizado

En el Diseo de Experimentos al Completo Azar, el experimentador asigna las unidades
experimentales a los tratamientos al azar, con la nica restriccin del nmero de observaciones
que se tomarn en cada tratamiento. Es el ms sencillo y se origina por la asignacin aleatoria de
tratamientos a un conjunto de unidades experimentales.
Para aleatorizar una tabla de nmeros aleatorios resulta conveniente para elegir las unidades
experimentales que recibir cada tratamiento. Si cada tratamiento ha de repetirse cuatro veces, los
primeros cuatro nmeros aleatorios obtenidos se asignarn al tratamiento A, los siguientes cuatro
nmeros aleatorios al tratamiento B, y as sucesivamente.
El diseo al completo azar se utiliza cuando las condiciones del sitio o lugar experimental son
totalmente homogneas
Sea ni el nmero de observaciones en el i-simo tratamiento, i = 1,...,I. Entonces, los valores

n1,n2,...,nI, determinan por completo las propiedades estadsticas del diseo. Naturalmente, este
tipo de diseo se utiliza en experimentos que no incluyen factores bloque. El modelo matemtico
es de la forma: Respuesta = Constante + Efecto tratamiento + Error.
8
El diseo al completo azar tiene varias ventajas y desventajas entre estas se pueden mencionar las
siguientes:
Ventajas:
a) Su sencillez (estadstico fcil). Aun cuando el dato de algunos tratamiento se hayan perdido,
o rechacen por alguna causa el mtodo de anlisis sigue siendo sencillo. La prdida relativa
de informacin debida a los datos faltantes, es de menos importancia que en cualquier otro
sistema.
b) La flexibilidad. Puede utilizarse cualquier nmero de tratamientos y repeticiones y pueden
variar a voluntad del investigador el nmero de repeticiones de un tratamiento a otro, pero
no es recomendable sino existe una buena razn. Todo el material experimental disponible
puede usarse, lo cual es una ventaja en experimentos preliminares pequeos donde el
material experimental de que se dispone es escaso.
c) El nmero de grados de libertad es mximo en comparacin con otros modelos, el modelo
estadstico sigue siendo fcil aun cuando se pierdan unidades experimentales.
d) Aun cuando el dato de algn tratamiento se hayan perdido, o rechacen por alguna causa el
mtodo de anlisis sigue siendo sencillo
Desventajas:
a) La principal estriba en su grado de precisin, algn otro diseo suele ser capaz de
estimar el error estndar por unidad experimental (error experimental) con un
mayor grado de precisin
b) No siempre puede garantizarse condiciones de homogeneidad. No se asegura,
ninguna forma para aseverar que las unidades reciben un tratamiento similar a
aquellas que reciben otro tratamiento, toda la variacin que existe entre las
unidades pasa a formar parte del error experimental.
Por qu aleatorizar?
Para transformar la variabilidad sistemtica no planificada en variabilidad no planificada o ruido
aleatorio; en otros trminos: prevenir contra la introduccin de sesgos en el experimento. La
aleatorizacin evita la dependencia entre observaciones y valida muchos de los procedimientos
estadsticos ms comunes.
Cundo puede ser apropiada la aleatorizacin?
La aleatorizacin puede ser apropiada si:
a)
El material experimental es homogneo.
b)
Donde es probable que una parte apreciable de las unidades se destruyan o no
respondan
c)
En experimentos pequeos en donde la mayor precisin de otros diseos no
compensa la prdida de grados de libertad del error.
9
PROCEDIMIENTO DE ANLISIS
Procedimiento
a) Determinar el nmero de unidades experimentales (n) y numerarlas. Es posible
obtener n al multiplicar el nmero de tratamientos por el nmero de repeticiones
n = ( t * r).
b) Asignar el nmero de unidades experimentales a cada tratamiento utilizando una
tabla de nmeros aleatorios o bien cualquier otra herramienta que sirva para el
mismo propsito. Por ejemplo si cada tratamiento ha de repetirse cuatro veces, los
primeros cuatro nmeros aleatorios obtenidos se asignarn al tratamiento A, los
siguientes cuatro nmeros aleatorios al tratamiento B, y as sucesivamente.
c) Una vez hecha la distribucin anterior (liberal b) se numeran las unidades
experimentales y se localizan los tratamientos de acuerdo al nmero que les
corresponde y se obtiene as las distribucin de campo.
Modelo Estadstico
Yij = + t i + ij
En donde:
Yij
Variable respuesta de la ij-esima unidad experimental
Efecto de la media general

ti
Efecto del i-esimo tratamiento
ij
Efecto del error experimental asociado a la i-esima unidad experimental
Anlisis de Varianza
Hiptesis Nula Ho:
estudio)
t i = 0 (Los i tratamientos tienen el mismo efecto sobre la variable en
Hiptesis Alterna Ha: t i 0 (No todos los tratamientos tienen el mismo efecto sobre la variable
en estudio, al menos uno produce un resultado distinto)
Tabla de Datos
Tratamientos
1
2
3
.
.
.
R
Repeticiones
1
2
Y11
Y12
Y21
Y22
Y31
Y32
.
.
.
.
.
.
Yt1
Yt2
Yi.
3
Y12
Y23
Y33
.
.
.
Yt3
4
. .
. .
. .
. .
. .
. .
. .
10
.
.
.
.
.
.
.
r
Y1r
Y2r
Y3r
.
.
.
Ytr
Y1 .
Y2 .
Y3 .
.
.
.
Y..
Supuestos
Los supuestos que validan el anlisis varianza son:
1. Los errores son independientes
2. Los errores estn normalmente distribuidos con media cero y varianza constante
3. Existe homogeneidad de varianza entre los tratamientos.
Fuentes de variacin y grados de libertad.
Para el anlisis de varianza se construye una tabla de anlisis de varianza y se completan los
datos. Existen slo dos fuentes de variacin en el diseo completamente aleatorio: entre unidades
experimentales dentro de un tratamiento, la cual denominamos error experimental y aquella entre
medias de tratamiento.
Tabla de Anlisis de Varianza
Grados
Fuentes de
de
Variacin
Libertad
Tratamien- t 1
tos
Error
t ( r 1)
Total
t r -1
Suma de Cuadrados
Cuadrados Medios
Fc Calculada
Ft
Requerida
[(Y2../r Sctrat/gltotal
Scmedios/Cmerror
Y2..)/(tr)]
Sctotal - Scerror/glerror
SCtrat
[ (YijY2..)/ (tr) ]
Los grados de libertad son uno menos que el nmero de observaciones para cada fuente
de variacin.
Regla de Decisin
Rechazar la hiptesis Ho. Si Fc > Ft (Gltrat, Gl error, )
Aceptar la Hiptesis Ha. Si Fc < Ft (Gltrat, Gl error, )
Ft = Valor tabular .
Coeficiente de Variacin
Se puede considerar como medida relativa de la variacin que no es posible controlar en el
experimento (error experimental), por costumbre se utiliza como que se control adecuadamente
el error cuanto el coeficiente de variacin es menor de 20.
11
El coeficiente de variacin se calcula por medio de la frmula siguiente:

CV = ( Raiz(CM) / Y.. )*100
Y.. = Y.. / tr
2.3.6.- El modelo de efectos fijos

Sean , 2 k las medias de k poblaciones, y sea la media de todas las poblaciones. Se define j
como: j = j-. ij = Yij-j. En estas condiciones el modelo de efectos fijos puede ponerse como
Esta ltima igualdad establece que cualquier desviacin de una observacin con respecto a la
media global se debe a dos posibles causas: A la diferencia en el tratamiento o a un error aleatorio.
Si se rechaza la hiptesis nula H0: j=0, los datos de la muestra deben de demostrar que la
desviacin total que se debe a los tratamientos es, suficientemente ms grande, que la que se debe
al error aleatorio.
Los parmetros , 2 k y son desconocidos, pero pueden estimarse con base en las
observaciones de k muestra aleatorias.
Para la tabla anterior se define:
12
Al sustituir
Se obtiene:
Donde se ha descompuesto la desviacin de una observacin con respecto a la media total de la

muestra en dos componentes, la desviacin de la media del tratamiento con respecto a la media
total y la desviacin de la observacin con respecto a la media del tratamiento.
Para determinar un estadstico de prueba, elevando al cuadrado y sumando para todo i,j; se tiene:
El doble producto vale 0. Quedando pues la formula reducida a
El trmino de la izquierda STC es la suma total de cuadrados.

El siguiente trmino es SCTR la suma de cuadrados de los tratamientos.
Y el ltimo trmino es SCE la suma de cuadrados de los errores.
La expresin anterior se reduce a
STC = SCTR + SCE
SCE mide la cantidad de variacin de las observaciones debidas a un error aleatorio.
Puede demostrarse que bajo la hiptesis nula (H0: j = 0) y bajo la suposicin de que ij sigue una
normal N (0; 2) entonces:
SCTR/2 y SCE/2 son 2 variables aleatorias independientes con una distribucin chi-cuadrada,
y por tanto STC/2 tambin sigue una chi-cuadrado.
13
Como STC tiene N-1 grado de libertad, pues la suma de las desviaciones
Y SCTR tiene k-1 grado de libertad, pues
Esta restriccin surge del hecho de que
Por tanto, se tiene que SCE tendr (N-1)-(k-1) = (N-k) grados de libertad. Luego, resumiendo:
Por tanto
Este cociente es el estadstico apropiado para probar la hiptesis nula H0: j = 0.

Esto puede verificarse de la siguiente forma: Si definimos al cuadrado medio de los tratamientos
como
Y el cuadrado medio de los errores
14
Puede demostrarse que
Donde s2 es la varianza comn de los errores.

Si H0 es cierta, entonces j = 0 para cualquier j por tanto
Luego, E(CMTR)=s2. Es decir, tanto CME como CMTR son dos estimadores insesgados de 2. Pero
si H0 no es cierta, CMTR > CME dado que el sumando anterior es siempre positivo. En otras
palabras, cuanto mayor sea la diferencia entre las medias de los tratamientos y la media global,
mayor ser CMTR. Pero una ocurrencia de este tipo sugiere que las medias de los k tratamientos
no son todas iguales. En consecuencia, la hiptesis nula ser rechazada si
Se encuentra dentro de una regin crtica superior de tamao .

El anlisis anterior constituye la tcnica del anlisis de la varianza para un experimento con un
solo factor completamente aleatorizado. Todo ello se resume en la Tabla ANOVA.
15
2.3.7.- El modelo de efectos aleatorios

Para el caso de efectos aleatorios se formul la suposicin de que los niveles empleados en el
experimento fueran seleccionados en forma aleatoria de una poblacin de posibles niveles.
Adems se supondr que
La descomposicin en suma de cuadrados y del

anlisis de la varianza es igual a la del caso de efectos fijos para un experimento con un solo factor,
pero en este caso el valor esperado del cuadrado medio del tratamiento es diferente.
t2
j.
Dadas muestras del mismo tamao, n, para todos los niveles, se puede demostrar que
16
La regin apropiada de rechazo sigue siendo la misma ya que un valor grande del cociente entre
CMTR y CME sugiere que debe rechazarse la hiptesis nula H0 t2 = 0.
En el anlisis de la varianza, la estadstica F tambin es ms robusta entre varianzas desiguales
siempre y cuando los tamaos de la muestra de los tratamientos sean iguales. Esto para el caso de
efectos fijos.
El resultado no se extiende para el caso de efectos aleatorios en el que la violacin de la hiptesis
de varianzas iguales generalmente tendr efectos considerables sobre las inferencias an para
muestras del mismo tamao. La hiptesis crucial en el desarrollo del anlisis de la varianza es que
los errores aleatorios sean independientes. Si los errores son interdependientes, el tamao real de
la regin crtica puede ser, en forma sustancial, ms grande (5 6 veces) que el tamao dictado al
seleccionar la probabilidad de tipo I.
2.3.8.- La suma total de cuadrados

Cuadrados de Yi
Datos
A
B
C
D
E
I
15.68
745.84
1,246.09
1,688.39
2,391.21
Suma
6,087.21 6,172.40 7,327.26 6,710.99 26,297.85
a.
II
38.94
726.84
1,204.78
1,935.12
2,266.71
III
29.38
1,037.48
1,350.56
2,371.69
2,538.14
IV
123.43
907.82
1,473.02
1,745.57
2,461.15
Suma
207.43
3,417.98
5,274.46
7,740.77
9,657.22
Cuadrados de Tratamientos
SCtrat = (Yi)2 / r
Donde Yi totales de tratamientos y r el nmero de repeticiones en cada tratamiento. Cuando el

nmero de repeticiones no es el mismo para todos los tratamientos (se ha perdido un dato), el
cuadrado de un total debe ser dividido entre el nmero de repeticiones y as sucesivamente para
cada tratamiento, los resultados as obtenidos se suman para obtener el total.
SCtrat = 26,202.89 - 21,815.65 = 4,387.24
b.
Suma de Cuadrados Totales (Sctot).

SCtot = 26,297.85 - 21,815.65 = 4,482.20
c.
Suma de cuadrados del error (Sce)

17
Sce = Sctrat - SCtot

Sce = 4,482.20 4,387.24 = 94.96
d)
Cuadrados Medios de Tratamientos (CMtrat)
Los cuadrados medios de los tratamientos estn dados por la suma de cuadrados del error (Cce)
dividido entre el nmero de repeticiones (r).
CMtrat = Sce /r
CMtrat = 4,387.24/4 = 1,096.81
e)
Cuadrados medios del error (Cme)
Los cuadrados medios del error estn dados por la suma de cuadrados del error (Sce) dividido
entre del error.
Cme = Sce/Gle
Cme = 94.96/15 = 6.33
2.3.9.- La tabla de ANDEVA

Causa
de Grados de Suma de Cuadrados
Variacin
Libertad
Cuadrado
SC
Medio, CM
GL
Tratamientos
t 1
Error
S2
1(1 )2 (1 )
(n -1) (t SC total - SCtratamientos

1)
Total
(1 )
( )
n 1
FCalculado
18
2.3.10.- El diseo desbalanceado

2.3.11.i
2.3.12.- Intervalo d/confianza p/la diferencia d/medias d/2 tratamientos
2.3.13.- Anlisis de residuales y verificacin del modelo.
Para muestras de tamao diferente, el efecto de violar la suposicin de varianzas iguales cuando
se comparan dos medias puede ser sustancial. Dado que esta misma suposicin se formula cuando
se contrasta k medias, veamos cmo puede detectarse la violacin de estos supuestos.
ij.
Dado que
El residuo correspondiente, denotado por eij, se define por
Los residuos no son estimados en el sentido de estimacin de parmetros, sino como estimadores
ij con base en las medias muestrales
Si es cierta la suposicin de que los errores aleatorios tienen la misma varianza para los k niveles
de poblacin, entonces la grfica de los residuos para cada tratamiento no revelar ninguna
diferencia apreciable de los residuos alrededor de cero.
Para normalizar la escala de magnitudes es preferible utilizar los residuos estandarizados
Entonces, dado que los errores aleatorios se encuentran normalmente distribuidos, un residuo
estandarizado rara vez se encuentra ms all de 3.
Tambin se encuentra en la literatura estadstica procedimientos para verificar la hiptesis de
igualdad entre las k varianzas. Por ejemplo las pruebas de Bartlett y las pruebas de Hartley.
En el anlisis de la varianza, la estadstica F tambin es ms robusta entre varianzas desiguales
siempre y cuando los tamaos de la muestra de los tratamientos sean iguales. Esto para el caso de
efectos fijos.
El resultado no se extiende para el caso de efectos aleatorios en el que la violacin de la hiptesis
de varianzas iguales generalmente tendr efectos considerables sobre las inferencias an para
muestras del mismo tamao. La hiptesis crucial en el desarrollo del anlisis de la varianza es que
19
los errores aleatorios sean independientes. Si los errores son interdependientes, el tamao real de
la regin crtica puede ser, en forma sustancial, ms grande (5 6 veces) que el tamao dictado al
seleccionar la probabilidad de tipo I.
2.4.- Pruebas sobre medias de tratamientos individuales

2.4.1.- Comparacin grfica de medias
2.4.2.- Mtodo de la diferencia significativa mnima de Fisher
2.4.3.- Otros mtodos para pruebas sobre la diferencia d/medias d/2
tratamientos
2.5.- Determinacin del tamao de la muestra en experimentos con un solo
factor
Para decidir el nmero de rplicas que se har por cada tratamiento (tamao de muestra), si se
esperan diferencias pequeas entre tratamientos ser necesario un tamao grande de muestra.
Estimar el tamao muestral muchas veces requiere cierto conocimiento previo sobre la varianza
del error experimental. Si se recurre a la experiencia en los diseos se involucran un solo factor
vara entre cinco y diez. Inclinndose por un extremo de este rango e incluso salirse de ese rango,
tomando en cuenta las siguientes consideraciones:
1. Cuando se espera poca variabilidad entre los tratamientos, mayor ser la cantidad de
rplicas si se quiere detectar diferencias significativas y viceversa. Si se esperan grandes
diferencias, quiz con pocas rplicas sea sucinte.
2. Si se espera mucha variacin dentro de cada tratamiento, debido a variacin de fuentes no
controladas como mtodos de medicin, medio ambiente, materia prima, etc., entonces
ser necesario ms replicas.
3. Si son varios tratamientos (cuatro o ms), entonces este es un punto favorable para
reducir el nmero de rplicas.
Adems de lo anterior, considerar los costos y tiempo del experimento global. De aqu que si se
toman en cuenta las consideraciones de arriba se puede establecer el tamao de muestra que
permita responder en una primera fase las preguntas ms importantes que se quieren responder
con el experimento.
TAREA - Relacin de problemas

1.- Prob. 12-1, Pgs. 577, 579 Montgomery
2.- Prob. 14.51, pgs. 596, 597 Berenson
3.- Prob. 9, pg. 421 Devore
20
4.- Prob. 12.7, pg. 436 Canavos

5.- Prob. 11, pgs. 507, 508 Anderson
6.- Prob. 13.7 pgs. 519, 520 Walpole
7.- Prob. 3-1, Pgs. 119 Montgomery DE
Bibliografa bsica.
La propuesta en el programa
21

Estadistica Inferencial

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Inferencial

Cargado por

Copyright:

Formatos disponibles

NDICE

Unidad II.- Diseo de experimentos de un factor ................................................................................. 2

2.3.12.- Intervalo d/confianza p/la diferencia d/medias d/2 tratamientos ............................ 19

UNIDAD II.- DISEO DE EXPERIMENTOS DE UN FACTOR

2.1.- Estrategia de experimentacin

2.1.- Objetivos de un diseo de experimento

Enunciado o planteamiento del problema.

2.3.- Experimento con un solo factor completamente aleatorizado

2.3.1.- Trminos utilizados para una mejor comprensin de la unidad.

2.3.2.- El anlisis de varianza (ANDEVA o ANOVA)

Las suposiciones en las que se basa el ANDEVA son las siguientes:

Los errores de los datos son normales.

Varianzas son homogneas.

Independencia de medias y varianzas

Aditividad del modelo

Independencia de promedios y varianzas: Que un promedio mayor no tenga independencia

que los supuestos de normalidad, homogeneidad, independencia de medias-varianzas o aditividad

proporcionales a los promedios o hay evidencia de efectos principales multiplicativos de

2.3.4.- El modelo estadstico lineal

2.3.5.- Diseo experimental completamente aleatorizado

Sea ni el nmero de observaciones en el i-simo tratamiento, i = 1,...,I. Entonces, los valores

Efecto de la media general

t i = 0 (Los i tratamientos tienen el mismo efecto sobre la variable en

El coeficiente de variacin se calcula por medio de la frmula siguiente:

2.3.6.- El modelo de efectos fijos

Donde se ha descompuesto la desviacin de una observacin con respecto a la media total de la

El doble producto vale 0. Quedando pues la formula reducida a

El trmino de la izquierda STC es la suma total de cuadrados.

Y SCTR tiene k-1 grado de libertad, pues

Esta restriccin surge del hecho de que

Este cociente es el estadstico apropiado para probar la hiptesis nula H0: j = 0.

Y el cuadrado medio de los errores

Puede demostrarse que

Donde s2 es la varianza comn de los errores.

Se encuentra dentro de una regin crtica superior de tamao .

2.3.7.- El modelo de efectos aleatorios

La descomposicin en suma de cuadrados y del

2.3.8.- La suma total de cuadrados

6,087.21 6,172.40 7,327.26 6,710.99 26,297.85

Donde Yi totales de tratamientos y r el nmero de repeticiones en cada tratamiento. Cuando el

Suma de Cuadrados Totales (Sctot).

Suma de cuadrados del error (Sce)

Sce = Sctrat - SCtot

Cuadrados Medios de Tratamientos (CMtrat)

Cuadrados medios del error (Cme)

2.3.9.- La tabla de ANDEVA

de Grados de Suma de Cuadrados

(n -1) (t SC total - SCtratamientos

2.3.10.- El diseo desbalanceado

El residuo correspondiente, denotado por eij, se define por

2.4.- Pruebas sobre medias de tratamientos individuales

TAREA - Relacin de problemas

4.- Prob. 12.7, pg. 436 Canavos

También podría gustarte