Está en la página 1de 21

S.E.P.

TECNOLÓGICO NACIONAL DE MÉXICO

INSTITUTO TECNOLÓGICO
de Tuxtepec

MATERIA:
ESTADISTICA ADMINISTRATIVA II

UNIDAD:
5 UNIDAD

ALUMNO:
IRIS LUCERO OSORIO FLORENTINO.

ACTIVIDAD:
DISEÑO EXPERIMENTAL CON BLOQUE AL AZAR Y
DISEÑOS FACTORIALES.
DOCENTE:
ING. ANTONIO VILLALOBOS SERRANO

CARRERA:
CONTADOR PÚBLICO

GRADO Y GRUPO:
3° “B”

San Juan Bautista Tuxtepec Oaxaca a 16 de


Diciembre del 2021
Contenido
INTRODUCCION .............................................................................................................................. 3
5.1 METODOLOGÍA DEL DISEÑO EXPERIMENTAL DE BLOQUES AL AZAR. ........................................ 4
Modelo Estadístico ......................................................................................................................... 4
Tabla Anova - Análisis de Varianza ................................................................................................ 5
Supuestos del modelo .............................................................................................................. 6
Validación de los supuestos del modelo........................................................................................ 7
5.2 DISEÑO DE EXPERIMENTOS FACTORIALES. ............................................................................... 10
5.3 DISEÑO FACTORIAL 2^k .............................................................................................................. 12
5.4 DISEÑO DE CUADROS LATINOS. ................................................................................................. 14
5.5 DISEÑO DE CUADROS GRECOLATINOS. ..................................................................................... 18
CONCLUSION..................................................................................................................................... 21
INTRODUCCION

Diseño experimental que sirve para estudiar el efecto individual y de interacción de


varios factores sobre una o varias respuestas. Es decir, lo que se busca es estudiar
la relación entre factores y la respuesta, con la finalidad de conocer mejor como es
esta relación y generar conocimiento que permita tomar acciones y decisiones que
mejoren el desempeño de proceso. Uno de los objetivos particulares más
importantes que en general tiene un diseño factorial es determinar una combinación
de niveles de los factores en la cual el desempeño del proceso sea mejor que en
las condiciones de operación actuales, es decir, encontrar nuevas condiciones de
operación que eliminen o disminuyan cierto problema de calidad en la variable de
salida.
5.1 METODOLOGÍA DEL DISEÑO EXPERIMENTAL DE BLOQUES AL
AZAR.

En muchos problemas de diseño experimental es necesario diseñar el experimento


de modo que sea posible controlar la variabilidad generada por un factor indeseable.
El procedimiento general para el diseño aleatorizado por bloques completos
consiste en seleccionar b bloques y realizar una réplica completa del experimento
en cada uno de ellos. En cada bloque existen a observaciones (una por cada nivel
del factor), y el orden en que se toman estas observaciones se asigna de manera
aleatoria dentro del bloque.
Suponga que tiene interés en un solo factor que tiene a niveles, y que el experimento
se efectúa en b bloques. Las observaciones pueden presentarse con el modelo
estadístico lineal
Donde μ es la media global, iτ es el efecto del i-ésimo tratamiento, jβ es el efecto
del j ésimo bloque y jiε es el término de error aleatorio, el cual se supone que tiene
una distribución normal e independiente con media cero y varianza (). En principio,
los efectos de los tratamientos y de bloques son considerados como factores fijos.
Por otro lado, los efectos de los tratamientos y de los bloques son definidos como
desviaciones de la media global.

Modelo Estadístico

Para este diseño el modelo lineal esta dado por

Donde es la media global de los tratamientos, es el efecto del


tratamiento el cual es constante para todas las observaciones dentro del
tratamiento, es el efecto del bloque, es el término del error
aleatorio, el cual se distribuye normal e independiente con media 0 y varianza .
Las restricciones del modelo son:
Estimación de parámetros
Al aplicar el método de mínimos cuadrados, se obtiene como estimadores de los
parámetros.

Tabla Anova - Análisis de Varianza


La tabla de análisis de varianza para este diseño se presenta a continuación:
Tabla 02. Análisis de varianza para un diseño de bloques completos al azar.

Para contrastar las hipótesis de no efectos de tratamientos.


Se puede utilizar el cociente.

ya que si Ho es cierta y así, lo cual quiere decir


que CMttos es un estimador intestado de y como además CME es también
un estimador de entonces de tienen dos estimadores intestados de y
por tanto, su cociente deber ser un valor estadísticamente cercano a 1.

Supuestos del modelo

El residual en un diseño de bloques completos al azar es dado por

Los supuestos del modelo son:


i) El modelo es aditivo, es decir no existe interacción entre bloques y
tratamientos
ii) Las variables aleatorias error se distribuyen normal con media cero
iii) Las variables aleatorias error son no correlacionadas
(independientes).
Otra manera de enunciar los supuestos es:
i) Los efectos de tratamientos y bloques son aditivos; las respuestas
dentro de los bloques tienen la misma tendencia con respecto a los
efectos de los tratamientos.
ii) Las observaciones en las bt celdas constituyen muestras aleatorias de
tamaño 1 de cada una de las bt poblaciones Todas las bt poblaciones
son normalmente distribuidas,
iii) Las varianzas de cada una de las poblaciones son iguales.
Si la primera condición se tiene se dice que los efectos de bloques y tratamientos
no interactúan y una prueba para la no aditividad es debida a Tukey (1949)
Ascombe.

Validación de los supuestos del modelo

Antes de conocer los métodos de validación de supuestos es importante hacer las


siguientes observaciones:
1. La desviación relativamente grande del supuesto de homogeneidad de varianzas
tiene muy poco efecto sobre el nivel de significancia, aunque este puede ser mayor
que el nivel dado, el poco efecto es debido a que los tratamientos son igualmente
replicados.
2. La no actividad puede ser más seria ya que puede aumentar el estimado del error
experimental (CMEE) resultando en posibles fallas para detectar diferencias reales
de los tratamientos.
3. Antes de probar cualquier supuesto se debe asegurar que no existan valores
outlier en los datos. Algunos trabajos han venido desarrollándose para detectar
outlier en clasificaciones a dos vías que incluyen el DBC. Cuando el diseño tiene
residuales con varianza común, como podría ser el caso de diseños balanceado, la
mejor prueba para detectar un solo outlier es basada en el máximo residuo
normalizado (MRN).
Stefansky (1972) describe un método general para calcular valores críticos del MRN
y provee tablas para el caso de dos vías de clasificación con una observación por
celda. Para algunos valores de a solamente acotados para valores críticos pueden
ser obtenidos. Esas tablas son reproducidas en Martin Tablas C- 6a y C- 6b. Las
clasificaciones filas y columnas son intercambiables.
El máximo residuo normalizado es dado por:

Donde: y es el mayor residual


en valor absoluto. Si este valor excede el valor crítico de tabla, la observación es
declarada como un outlier potencial. Estas deben ser localizadas y examinadas para
buscar causas asignables. La eliminación arbitraria de valores extremos debe
evitarse.

Homogeneidad de varianza
La prueba gráfica de igualdad de varianza es graficar los residuales contra los
valores predichos si existe algún patrón especial que
muestre mayor dispersión para un lado de la gráfica se puede decir que no hay
homogeneidad de varianza.
Las pruebas analíticas para igualdad de varianza dadas por el DCA no son
aplicables a bloques ya que no se tienen estimadores independientes de las
varianzas de los tratamientos. Existen algunos procedimientos, pero quizá el más
simple es el desarrollado por Han (1961). Esta prueba es especialmente para un
DBC y asume:
i) Las poblaciones muestreadas sean normalmente distribuidas
ii) Los errores son igualmente correlacionados dentro de los bloques, pero
son independientes entre bloques.
La prueba estadística es:

Donde el estimado de la varianza para el tratamiento i es:


Donde b es el número de bloques y los son los residuales en el tratamiento i.
Note que la varianza no es calculada directamente de los datos, por ello la no
independencia de las varianzas. Observe que para el calculo de la varianza del
tratamiento 1 utiliza a la medias de los bloques, , y para el
tratamiento 2 utiliza también a a la medias de los bloques .
5.2 DISEÑO DE EXPERIMENTOS FACTORIALES.

En cualquier experimento diseñado, es siempre importante examinar los residuos y


verificar si se violan las suposiciones básicas (Normalidad, Independencia, Aditivita
e Igualdad de varianzas) que pueden invalidar los resultados. Los valores de los
residuos del diseño aleatorizado por bloques completos se obtienen, como es usual,
por la diferencia entre los valores observados y los estimados
El análisis de varianza del modelo supone que las observaciones están distribuidas
de manera normal e independiente, con la misma varianza para cada tratamiento o
nivel del factor. Estas suposiciones deben verificarse mediante el análisis de los
residuos.
La suposición de normalidad puede verificarse mediante la construcción de una
gráfica de probabilidad normal de los residuos. Para esto, los residuos se agrupan
en una tabla de distribución de frecuencias, se calcula la frecuencia relativa
acumulada para cada valor y se grafican en una hoja de papel de probabilidad
normal. Si la suposición es válida los puntos tenderán a agruparse sobre una línea
recta que pasa por el punto medio.
Así, por ejemplo, si el diseño experimental es bloques al azar, el modelo es:
yij = µ + τi + βj + ǫij.
Respuesta = media general + efecto de tratamiento + efecto de bloque + error
Si se trata de un diseño factorial, los tratamientos se forman combinando los
niveles de los factores en estudio, de manera que el efecto del tratamiento τi se
considera a su vez compuesto de los efectos de los factores y sus interacciones.
Por ejemplo, si son dos factores en estudio se tiene:
τi = τkl = αk + γl + ξk

Tratamiento = factor A + factor B + interacción AB


Haciendo una equivalencia entre los valores de i y los de k y l suponiendo que el
factor A tiene K niveles y el factor B L:
ikl
111
212
313
.. .. ..
tKL
Y el modelo resultante es: yklj = µ + αk + γl + ξkl + βj + ǫklj
Es poco usual tener diseños experimentales muy complicados en los
experimentos factoriales, ya que se discuta el análisis y la interpretación. Las
ventajas de los experimentos factoriales son:
1. Economía en el material experimental al obtener información sobre varios
factores sin aumentar el tamaño del experimento. Todas las u.e.se utilizan
para la evaluación de los efectos.
2. Se amplía la base de la inferencia en relación a un factor, ya que se estudia
en las diferentes condiciones representadas por los niveles de otros
factores. Se amplía el rango de validez del experimento.
3. Permite el estudio de la interacción, esto es, estudiar el grado y forma en la
cual se modifica el efecto de un factor por los niveles de los otros factores.
Una desventaja de los experimentos factoriales es que requiere un gran número
de u. E., sobre todo cuando se prueban muchos factores o muchos niveles de
algunos factores, es decir, se tiene un número grande de tratamientos.
(Factoriales fraccionales)
Suponga un diseño con dos factores: A con a niveles y B con b niveles, en diseño
completamente al azar. (Factorial a × b completo, balanceado, efectos fijos)
Sea yijk la respuesta para la k-ésimau.e. del nivel i de A y j de B.
yijk = µ + τi + βj + γij + ǫijk
i = 1,. . ., a j = 1, . . ., b k = 1, . . ., n
5.3 DISEÑO FACTORIAL 2^k
En ocasiones, cuando se utiliza un diseño aleatorizado por bloques completos,
alguna de las observaciones en uno de los bloques puede faltar. Esto sucede
debido algún descuido o error, o por razones fuera del control del experimentador,
como sería el caso de la pérdida de alguna unidad experimental. Una observación
faltante introduce un nuevo problema en el análisis, ya que los tratamientos dejan
de ser ortogonales a los bloques.
En otras palabras, cada tratamiento no ocurre en cada bloque. Existen dos formas
generales de resolver el problema de los valores faltantes. La primera es un análisis
aproximado en el que se estima la observación faltante. A continuación, se efectúa
el análisis de varianza usual como si la observación estimada fuera un dato real,
disminuyendo los grados de libertad del error en uno. La segunda es un análisis
exacto usando la prueba de significancia de regresión general.
Suponga que falta la observación correspondiente al tratamiento i y al bloque j.
Esta observación se representa mediante x el gran total con una observación
faltante se representará mediante y los totales del tratamiento y del bloque con un
dato faltante como y, respectivamente. Supongamos, además, que para estimar la
observación faltante se elige x, de manera que tenga una contribución mínima a la
suma de cuadrados del error. Como la suma de cuadrados del error está dada en
donde R incluye todos los términos que no contienen a x. Al derivar la SCE con
respecto a x e igualar a cero se obtiene Como un estimado para la observación
faltante.
El efecto de un factor se define como el cambio en la respuesta producida por un
cambio en el nivel del factor. Con frecuencia, éste se conoce como efecto principal
porque se refiere a los factores de interés primordial del experimento.
Por ejemplo, consideremos los datos. El efecto principal del factor A podría
interpretarse como la diferencia entre la respuesta promedio en el primer y segundo
nivel de ese factor. Numéricamente.

En otras palabras, incrementar el factor A del nivel 1 al 2 produce un cambio en la


respuesta promedio de 21 unidades. Similarmente, el efecto principal de B es:
Si los factores tienen más de dos niveles, el procedimiento anterior debe ser
modificado ya que las diferencias entre las respuestas promedio pueden expresarse
de muchas formas.
En algunos experimentos puede encontrarse que la diferencia en la respuesta entre
los niveles de un factor no es la misma en todos los niveles de los otros factores.
Cuando esto ocurre existe una interacción entre los factores. Por ejemplo,

En el primer nivel del factor B, el efecto de A es:


A = 50 - 20 = 30
Mientras que en el segundo nivel de B, el efecto de A es:
A = 12 - 40 = 28
Puede observarse que existe una interacción entre los factores A y B porque el
efecto de A depende del nivel elegido de B.

Estas ideas pueden ilustrarse gráficamente. Se muestra una gráfica de la respuesta


de los datos de la Tabla 1 contra los niveles del factor A para ambos niveles del
factor B. Se observa que las rectas B1 y B2 son, aproximadamente, paralelas. Esto
indica que no hay interacción entre los factores.
5.4 DISEÑO DE CUADROS LATINOS.

Un diseño cuadrado latino para p factores, o un cuadrado latino p x p, es un


cuadrado que contiene p renglones y p columnas. Cada una de las p2 celdas
contiene una de las p letras que corresponde a un tratamiento, y cada letra aparece
una sola vez en cada renglón y columna. El diseño cuadrado latino se usa para
eliminar dos fuentes de variabilidad problemáticas; en otras palabras, permite
analizar sistemáticamente por bloques en dos direcciones. A continuación, se
presentan algunos ejemplos de cuadrados latinos.
En donde:
Kjiy= observación correspondiente al i-ésimo renglón, la k-ésima columna y el j-
ésimo tratamiento.
Μ= la media general
Iα= es el i-ésimo efecto de renglón
Jτ= es el j-ésimo efecto de tratamiento
Kβ= es el k-ésimo efecto de la columna
Kjiε= es el error aleatorio
El modelo es completamente aditivo, en otras palabras, no existe interacción entre
los renglones, las columnas y los tratamientos. Sólo dos de los subíndices i, j y k
se requieren para especificar una observación en particular porque únicamente
hay una observación en cada celda.
El análisis de varianza consiste en descomponer la suma total de cuadrados de
las observaciones en sus componentes de renglón, columna, tratamiento y error
Cuyos grados de libertad.
Bajo la suposición de que el error aleatorio se distribuye en forma normal e
independiente, cada una de las sumas de cuadrados es al dividir entre, variables
aleatorias independientes con distribución ji-cuadrada.
Los diseños en cuadrados latinos son apropiados cuando es necesario controlar
dos fuentes de variabilidad. En dichos diseños el número de niveles del factor
principal tiene que coincidir con el número de niveles de las dos variables de
bloque o factores secundarios y además hay que suponer que no existe
interacción entre ninguna pareja de factores.
Supongamos que el número de niveles de cada uno de los factores es K. El
diseño en cuadrado latino utiliza K2bloques, cada uno de estos bloques
corresponde a una de las posibles combinaciones de niveles de los dos factores
de control. En cada bloque se aplica un solo tratamiento de manera que cada
tratamiento debe aparecer con cada uno de los niveles de los dos factores de
control.
Si consideramos una tabla de doble entrada donde las filas y las columnas
representan cada uno de los dos factores de bloque y las celdillas los niveles del
factor principal o tratamientos, el requerimiento anterior supone que cada
tratamiento debe aparecer una vez y sólo una en cada fila y en cada columna.
Recibe el nombre de cuadrado latino de orden K a una disposición en filas y
columnas de K letras latinas, de tal forma que cada letra aparece una sola vez en
cada Fila y en cada columna.
A continuación, vamos a dar una forma simple de construcción de cuadrados
latinos.
Se parte de una primera Fila con las letras latinas ordenadas alfabéticamente
Columna1 Columna 2 Columna 3 · · · Columna k
Fila 1 A B C ···K
La posición (construcción por permutación cíclica), el cuadrado así obtenido es un
cuadrado latino estándar. Un cuadrado latino se denomina estándar cuando las
letras de la primera
Fila y la primera columna están ordenadas alfabéticamente. A parte de los
cuadrados latinos así obtenidos existen otros cuadrados latinos diferentes,
estándares y no estándares. En el
Apéndice B se muestran algunos cuadrados latinos estándares para los órdenes
3, 4, 5, 6, 7, 8 y 9.
El procedimiento para construir un diseño en cuadrado latino es el siguiente:
1) Se elige aleatoriamente un cuadrado latino de los disponibles.
2) Se asigna aleatoriamente el orden de las filas y columnas.
3) Se asignan aleatoriamente los tres factores a las filas, columnas y letras,
respectivamente.
Ilustremos este procedimiento con el ejemplo del rendimiento de la semilla de
trigo. Al plantear este experimento se pensó que podría conseguirse mayor
precisión si se controlaba la variabilidad introducida por los tipos de abono e
insecticida. El instituto de experimentación agrícola está interesado en estudiar 4
tipos de semilla de trigo, (s1, s2, s3, s4) y decide realizar el experimento utilizando
un diseño en cuadrado latino. Para ello selecciona 4 niveles para cada una de las
variables de bloque: abono, (a1, a2, a3, a4), e insecticida, (i1, i2, i3, i4).
La selección de uno de los cuadrados se hace al azar. Supongamos que el
cuadrado latino elegido es el siguiente:
ABCD
BADC
CDAB
DCBA
A continuación, se asigna también al azar, el orden de las filas y las columnas.
Supongamos que el orden seleccionado para las filas sea (2, 3, 1, 4), entonces el
cuadrado latino anterior se convierte en:
BADC
CDAB
ABCD
DCBA
Se vuelven a generar otros 4 números aleatorios que se idéntica con el orden de
las columnas de este último cuadrado. Supongamos que los números obtenidos
son (4, 3, 1, 2), obteniéndose el siguiente cuadrado latino.

CDBA
BACD
DCAB
ABDC
Por último, se asignan al azar las filas, las columnas y las letras latinas a los tres
factores. Por ejemplo, supongamos que las filas, las columnas y las letras se
asignan, respectivamente, a los tipos de insecticidas, semillas y abonos, de tal
forma que el diseño resultante es
Table 5-1.
Semillas
Insecticidess 1 s2 s3 s4
i1 a3 a4 a2 a1
i2 a2 a1 a3 a4
i3 a4 a3 a1 a2
i4 a1 a2 a4 a3
Por convenio, se suele situar el factor principal, en este caso el tipo de semilla, en
las Celdillas. Reordenando el diseño anterior.
Abonos
Insecticidas a1 a2 a3 a4
i1 s4 s3 s1 s2
i2 s2 s1 s3 s4
i3 s3 s4 s2 s1
i4 s1 s2 s4 s3
En resumen, podemos decir que un diseño en cuadrado latino tiene las siguientes
características:
1) Se controlan tres fuentes de variabilidad, un factor principal y dos factores de
bloque.
2) Cada uno de los factores tiene el mismo número de niveles, K.
3) Cada nivel del factor principal aparece una vez en cada fila y una vez en cada
columna.
4) No hay interacción entre los factores.
5.5 DISEÑO DE CUADROS GRECOLATINOS.

Consideremos un cuadrado latino p × p al que se le sobrepone un segundo


cuadrado latino cuyos tratamientos se designan por letras griegas. Se dice que los
dos son ortogonales si al sobreponerse poseen la propiedad de que cada letra
griega aparece solamente una vez con cada letra latina.
El diseño cuadrado greco-latino puede utilizarse para controlar sistemáticamente
tres fuentes extrañas de variabilidad. En otras palabras, se usa para hacer un
análisis por bloques en tres direcciones. El diseño permite analizar cuatro factores
(renglón columna, letra griega y letra latina), cada uno con p niveles, usando
solamente p2 ensayos. Los cuadrados grecolatinos existen para toda excepto para
p = 6.
En donde:
lkjiy la observación que corresponde al renglón i, la columna k, la letra latina j y la
letra griega k.
μ= La media general
iθ= Es el efecto del i-ésimo renglón
jτ= Es el j-ésimo efecto de tratamiento de las letras latinas
kω= Es el k-ésimo efecto de tratamiento de las letras griegas
lψ= Es el efecto de la columna l
lkjiε= Es la componente del error aleatorio
Sólo dos de los cuatro subíndices son necesarios para identificar completamente
cualquier observación.
El análisis de varianza es muy similar al de un cuadrado latino. El factor
representado por las letras griegas es ortogonal a los renglones, las columnas y los
tratamientos de la letra latina porque cada letra griega ocurre una sola vez en cada
renglón, en cada columna y para cada letra latina. Por lo tanto la suma de letra
griega. El error experimental se reduce en esta cantidad. Las hipótesis nulas de
igualdad entre los renglones, entre las columnas, entre los tratamientos de la letra
latina y entre los tratamientos de la letra griega pueden probarse dividiendo la media
de cuadrados correspondiente entre la media de cuadrados del error
Los cuadrados greco-latinos se obtienen por superposición de dos cuadrados
latinos del mismo orden y ortogonales entre sí, uno de los cuadrados con letras
latinas el otro con letras griegas. Dos cuadrados reciben el nombre de ortogonales
si, al superponerlos, cada letra latina y griega aparecen juntas una sola vez en el
cuadrado resultante.
En el Apéndice C se muestra una tabla de cuadrados latinos que dan lugar, por
superposición de dos de ellos, a cuadrados greco-latinos. Notamos que no es
posible formar cuadrados greco-latinos de orden 6. K = 4
Cuadrado greco-latino
AαBβCγDδ
DγCδBαAβ
BδAγDβCα
CβDαAδBγ
Planteamiento del modelo
En un diseño en cuadrado greco-latino la variable respuesta yij(hp) viene descrita
por la siguiente ecuación:
yij(hp) = µ + τi + βj + γh + δp + ǫij(hp)
i = 1, 2 . . . , K
j = 1, 2 . . . , K
h = 1, 2 . . . , K
p = 1, 2 . . . , K ,
Donde:
µ es un efecto constante, común a todas las unidades. τi es el efecto producido
por el i-ésimo nivel del factor fila. Dichos efectos están sujetos a la restricción
iτi = 0.
Βj es el efecto producido por el j-ésimo nivel del factor columna. Dichos efectos
están sujetos a la restricción
jβj = 0.
Γh es el efecto producido por el h-ésimo nivel del factor letra latina. Dichos efectos
están sujetos a la restricción
hγh = 0.
δp es el efecto producido por el p-ésimo nivel del factor letra griega. Dichos efectos
están sujetos a la restricción
p δp = 0.
Ǫ ij(hp) son variables aleatorias independientes con distribución N(0, σ).
La notación yij(hp) indica que los niveles i y j determinan los niveles h y p para un
cuadrado greco-latino especificado. Es decir, los subíndices h y p toman valores
que dependen de la celdilla (i, j).
Se utiliza la siguiente notación:
N = K2 es el número total de observaciones.
El total y el promedio de todas las observaciones.
CONCLUSION
Nuestro objetivo es tener comparaciones precisas entre los tratamientos bajo
estudio. Utilizar bloques es una forma de reducir y controlar la varianza del error
experimental para tener mayor precisión.
En el diseño completamente al azar se supone que las u.e. son relativamente
homogéneas con respecto a factores que afectan la variable de respuesta. Sin
embargo, algunas veces no tenemos disponibles suficiente número de u.e.
homogéneas.
Cualquier factor que afecte la variable de respuesta y que varíe entre u.e. aumentará
la varianza del error experimental y disminuirá la precisión de las comparaciones.
Factores como la edad y el peso de los animales, diferentes lotes de material, sexo
de las personas y parcelas alejadas son ejemplos de variables externas a los
tratamientos que pueden incrementar la variación entre las observaciones de la
variable de respuesta.

También podría gustarte