Está en la página 1de 14

UNIVERSIDAD DE ORIENTE

NÚCLEO DE MONAGAS
COORDINACIÓN DE POSTGRADO
MAESTRÍA DE INGENIERÍA DE GAS
ESTADÍSTICA APLICADA A LA INGENIERÍA

DISEÑOS COMPLETAMENTE ALEATORIZADOS (DCA)

FACILITADOR: REALIZADO POR:


MSc. CARLOS DE LA CRUZ ING. BELIUSKA BRACAMONTE C.I. 22.710.326
ING. DIOGENES ZAPATA C.I. 20.233.707

MATURIN, MARZO DE 2021


INTRODUCCIÓN

Cuando se desea darle inicio a un experimento se debe especificar claramente el


problema y las preguntas que la investigación debe contestar; es decir, lo que podría
denominarse las “pruebas de interés”. En consecuencia, es necesario hacer una reflexión
sobre algunos aspectos estructurándolos mediante una serie de preguntas cuyas respuestas
ayudan a diseñar correctamente el experimento.
Se debe definir cuántas y que variables definen el problema propuesto. En primer
lugar, cuántas; es decir, si se trata de un problema de una o varias variables. Definida(s)
la(s) variable(s), es necesario dotar la(s) de unos valores que podrán ser cuantitativos o
cualitativos. Por consiguiente, conviene luego hacerse la pregunta: ¿Qué factores influyen
sobre la variable? Este es un punto fundamental dentro del proceso. En él, el
experimentador debe hacer una lista lo más exhaustiva posible de todos y cada uno de los
factores (causas) que pueden tener influencia sobre la variable (medición) que se va a
estudiar. Una vez resueltas las situaciones previamente mencionadas, conviene hacerse la
siguiente pregunta: ¿Cuántas veces y de qué forma repetirá el experimento? Esta suele ser
una pregunta muy repetida en la conversación investigador estadístico. Es necesario
determinar el tamaño mínimo del experimento con el objetivo de que el diseño sea
eficiente. Luego: ¿Que trascendencia tendrán las conclusiones? De acuerdo con la
importancia de rechazar la hipótesis nula cuando es cierta el investigador debe fijar el nivel
de significación con que realizará las pruebas estadísticas. Esta decisión ha de ser previa a
la adquisición de cualquier dato, no posterior a la vista de lo que más interese. Debe tenerse
en cuenta que los análisis estadísticos se realizan sobre datos y la presencia de una dato
erróneo puede causar resultados totalmente falsos aún con una buena realización del
experimento.
El objetivo final de todo experimento es proporcionar el máximo de información
sobre el problema estudiado. Sin embargo, esta información debe ser obtenida de una forma
eficiente tanto practica como estadísticamente. Si se “aleatoriza” la toma de muestra y se
asignan aleatoriamente los tratamientos a las unidades, las pruebas actúan como si la
anterior suposición fuera cierta. No es que la aleatorización asegure la independencia sino
que permite actuar como si lo fuera.
Los tratamientos en un diseño completamente al azar son asignados aleatoriamente a
las unidades experimentales y esto también se da en caso contrario. En la distribución de
los tratamientos a las unidades experimentales, el diseño no pone restricciones. El diseño
completamente al azar es ampliamente usado gracias a que es un diseño simple de realizar,
y en esta recopilación documental se dará fe de ello.
DISEÑOS COMPLETAMENTE ALEATORIZADOS (DCA)
El diseño completamente al azar (DCA) es el más simple de todos los diseños. Es un
diseño en el cual los tratamientos son asignados aleatoriamente a las unidades
experimentales sin ningún tipo de restricción. Este diseño es utilizado cuando las unidades
experimentales son bastante homogéneas, es decir, cuando la variabilidad entre ellas es
pequeña y no existe ningún criterio de bloqueo que permita disminuirla. Dado que los
tratamientos constituyen el único criterio de clasificación para las unidades experimentales,
a este diseño se le conoce también como diseño de clasificación de una vía (One Way). Se
verán los casos paramétrico y no paramétrico del DCA, el análisis de la varianza y las
pruebas de comparación de medias de tratamientos.
Los tratamientos en un diseño completamente al azar son asignados aleatoriamente a las
unidades experimentales y esto también se da en caso contrario. En la distribución de los
tratamientos a las unidades experimentales, el diseño no pone restricciones. El diseño
completamente al azar es ampliamente usado gracias a que es un diseño simple de realizar,
su aplicación se da cuando se estudian más tratamientos y su uso se limita a las siguientes
situaciones:
 Donde las unidades experimentales son relativamente homogéneas, tal como
laboratorios, invernaderos, etc.,
 En caso de que una parte del experimento se pierda y puede decirse que las
unidades experimentales deben tener la misma capacidad de respuesta.
 Si se tiene un experimento pequeño y donde la mayor precisión de otras
distribuciones no compensan la perdida de grados de libertad del error.
En este diseño puede probarse cualquier número de tratamientos, pero no es obligatorio
asignar el mismo número de unidades experimentales a cada tratamiento, ya que puede ser
un diseño con igual número de repeticiones o con desigual número de repeticiones.
Cabe aclarar que las fórmulas de la suma de cuadrados medios cambian para cada caso.

ALEATORIZACIÓN
La palabra aleatorio se usa para expresar una aparente carencia de propósito, causa,
u orden. En cambio, el término aleatoriedad se usa a menudo como sinónimo con un
número de propiedades estadísticas medibles, tales como la carencia de tendencias o
correlación, es decir, que no haya patrones que se puedan identificar.
La aleatoriedad ocupa un lugar importante en la ciencia y la filosofía.
¿Cómo podremos asegurar que las observaciones, y por tanto, los errores
experimentales, sean independientes? En general no se puede asegurar pues, como mínimo,
comparten un mismo terreno, mano de obra, etc. Sin embargo, si se aleatoriza la toma de
muestra y se asignan aleatoriamente los tratamientos a las unidades, las pruebas actúan
como si la anterior suposición fuera cierta. No es que la aleatorización asegure la
independencia sino que permite actuar como si lo fuera. Hay casos que la total
aleatorización del experimento no solo es imposible sino, además no recomendable. Lo
grave no es restringir la aleatorización si no tenerla en cuenta en el análisis de los datos y en
las conclusiones que se obtengan del análisis. Una gran parte de los diseños clásicamente
empleados y ampliamente descritos en las publicaciones como los bloques al azar, parcela
dividida “cross-over”, etc., tienen algún tipo de falta de aleatorización; incluso existen
diversos diseños totalmente sistemáticos. Estos últimos, los análisis basados en la
descomposición de la variación y la posterior prueba de significación mediante la
distribución F, no son aplicables.

VENTAJAS DEL DISEÑO COMPLETAMENTE ALEATORIZADO (DCA)


Siempre es conveniente que el investigador evalúe en base a su documentación cuales
son las ventajas y desventajas que contemplan el diseño experimental que eligió, para el
caso de diseños completamente aleatorizados DCA hay múltiples ventajas tales como:

 Su sencillez (estadístico fácil). Aun cuando el dato de algunos tratamiento se hayan


perdido, o rechacen por alguna causa el método de análisis sigue siendo sencillo. La
pérdida relativa de información debida a los datos faltantes, es de menos
importancia que en cualquier otro sistema.

 La flexibilidad. Puede utilizarse cualquier número de tratamientos y repeticiones y


pueden variar a voluntad del investigador el número de repeticiones de un
tratamiento a otro, pero no es recomendable sino existe una buena razón. Todo el
material experimental disponible puede usarse, lo cual es una ventaja en
experimentos preliminares pequeños donde el material experimental de que se
dispone es escaso.

 El número de grados de libertad es máximo en comparación con otros modelos, el


modelo estadístico sigue siendo fácil aun cuando se pierdan unidades
experimentales.

 Aun cuando el dato de algún tratamiento se hayan perdido, o rechacen por alguna
causa el método de análisis sigue siendo sencillo.

 La aleatorización evita la dependencia entre observaciones y valida muchos de los


procedimientos estadísticos más comunes.
DESVENTAJAS DEL USO DE DISEÑOS COMPLETAMENTE
ALEATORIZADOS (DCA)

En comparación con otros diseños experimentales donde se pueda ejercer control local, los
DCA son menos sensibles y tienen un poder analítico más débil. A continuación, algunas
de las desventajas contenidas dentro de lo propiamente dicho:
 Es apropiado para un número pequeño de tratamientos.
 Es apropiado sólo en caso de disponer de material experimental homogéneo.
 Presenta falta de sensibilidad, y esta se debe a que todos los factores que no se
controlaron se acumulan en el error experimental, provocando que este aumente y
no permita detectar diferencias significativas entre los tratamientos. Por este motivo
los investigadores estadígrafos se dedicaron a buscar diseños experimentales más
complejos, pero que fueran capaz de estimar el error experimental con mayor grado
de precisión.
 La principal estriba en su grado de precisión, algún otro diseño suele ser capaz de
estimar el error estándar por unidad experimental (error experimental) con un mayor
grado de precisión.
 No siempre puede garantizarse condiciones de homogeneidad. No se asegura,
ninguna forma para aseverar que las unidades reciben un tratamiento similar a
aquellas que reciben otro tratamiento, toda la variación que existe entre las unidades
pasa a formar parte del error experimental.

¿CUÁNDO PUEDE SER APROPIADA LA ALEATORIZACIÓN?


La aleatorización puede ser apropiada si:
 El material experimental es homogéneo.
 Donde es probable que una parte apreciable de las unidades se destruyan o no respondan
 En experimentos pequeños en donde la mayor precisión de otros diseños no compensa la
pérdida de grados de libertad del error.

NÚMERO DE REPETICIONES POR TRATAMIENTO


El número de repeticiones por tratamiento se escoge en función de:
 La variabilidad que se espera observar (exactitud en la medición)
 Diferencia mínima detectable (la de interés por el experimentador )
 Nivel de confianza deseado ( con que certeza)
 Se recomienda n =10 cuando hay poca dispersión y n = 30 cuando hay mucha
dispersión.

PROCEDIMIENTO DE ANÁLISIS
Procedimiento
 Determinar el número de unidades experimentales (n) y numerarlas. Es posible
obtener “n” al multiplicar el número de tratamientos por el número de repeticiones
n = (t * r).
 Asignar el número de unidades experimentales a cada tratamiento utilizando una
tabla de números aleatorios o bien cualquier otra herramienta que sirva para el
mismo propósito. Por ejemplo si cada tratamiento ha de repetirse cuatro veces, los
primeros cuatro números aleatorios obtenidos se asignarán al tratamiento A, los
siguientes cuatro números aleatorios al tratamiento B, y así sucesivamente.

 Una vez hecha la distribución se numeran las unidades experimentales y se


localizan los tratamientos de acuerdo al número que les corresponde y se obtiene así
la distribución de campo.

 Luego se realiza un análisis de varianza o ANOVA, se determinan los factores de


variación correspondientes a tratamientos, error y cuadrados totales en el diseño
experimental, con esto se define el valor –p que para comparar la probabilidad de
que un valor estadístico calculado sea posible dada una hipótesis nula cierta.

 Se determina o analiza la hipótesis con la regla de decisión Toda hipótesis que


difiere de una dada se llamará una hipótesis alternativa. Por ejemplo: Si una
hipótesis es p = 0,5, hipótesis alternativa podrían ser p = 0,7, dónde p > 0,5.

 De requerir un análisis más exhaustivo se realiza una comparación aplicando un


estudio de diferencias mínimas significativas para determinar qué tan alejado o
cercano están los tratamientos evaluados de la hipótesis nula. Con esto se pretende
básicamente realizar un análisis de dispersión estadística.

ANALISIS DE VARIANZA EN DCA


En estadística, el análisis de la varianza (ANOVA por sus sigloides en inglés,
ANalysis Of VAriance) es una colección de modelos estadísticos y sus procedimientos
asociados, en el cual la varianza está particionada en ciertos componentes debidos a
diferentes variables explicativas. Se utiliza de forma intensiva en el análisis y diseño de
experimentos para evaluar el efecto de tratamientos en la variabilidad de la variable
respuesta.
Desarrollada por el genetista R. A. Fisher en los años 1920 y 1930 y es algunas veces
conocido como "Anova de Fisher" o "análisis de varianza de Fisher", debido al uso de la
distribución F de Fisher como parte del contraste de hipótesis
Si el valor p cumple con la condición de ser menor que un nivel de significancia
impuesto arbitrariamente, este se considera como un resultado estadísticamente
significativo y, por lo tanto, permite rechazar la hipótesis nula.
Es fundamental reforzar que el valor p está basado en la presunción de que una hipótesis
nula (o hipótesis de partida) es cierta. Una «diferencia estadísticamente significativa»
solamente significa que hay evidencias estadísticas de que hay una diferencia; no significa
que la diferencia sea grande, importante o radicalmente diferente.
Entonces, para probar la hipótesis en un diseño completamente aleatorizado se debe
realizar un análisis de varianza: Consiste en analizar los cocientes de las varianzas para
probar la hipótesis de igualdad o desigualdad entre las medias debidas a los tratamientos.
Para lo cual se separa la variación total en las partes con que contribuye cada fuente de
variación. En el caso de DCA las fuentes de variación principales son las debidas a los
tratamientos y las debidas al error.

Con estas fuentes de variación se obtienen los cuadrados de las sumatorias de las
desviaciones, tanto del tratamiento como del error y se construye una tabla de ANOVA
Una vez que se rechaza la hipótesis nula y se acepta la hipótesis alternativa, se debe
investigar cuales tratamientos resultaron diferentes, o cuales tratamientos resultaron
diferentes, lo cual se puede realizar con diferentes métodos, dónde el más sencillo y usado
es el de las Diferencias Mínimas Significativas.

Dónde:
Tα/2, N-K= t Student (tablas)
N= repeticiones.
i-j= tratamientos
La tabla de ANOVA a llenar para conseguir el valor –p y comparar con el valor de alfa α o
nivel de significancia es la siguiente:
Tabla 1.1 ANOVA:

Dónde:
Yi•= Suma de las observaciones del tratamiento i.
Ῡi•= Media de las observaciones del i-ésimo tratamiento.
Y••= Suma total de las N= n1+n2+…+nk mediciones.
Ῡ••= Media global o promedio de todas las observaciones.

PRUEBA DE HIPOTESIS EN DCA


Hipótesis Estadística:
Al intentar alcanzar una decisión, es útil hacer hipótesis (o conjeturas) sobre la población
aplicada.
Tales hipótesis, que pueden ser o no ciertas, se llaman hipótesis estadísticas.
Son, en general, enunciados acerca de las distribuciones de probabilidad de las poblaciones.
Hipótesis Nula.
En muchos casos formulamos una hipótesis estadística con el único propósito de rechazarla
o invalidarla. Así, si queremos decidir si una moneda está trucada, formulamos la hipótesis
de que la moneda es buena (o sea p = 0,5, donde p es la probabilidad de cara).
Analógicamente, si deseamos decidir si un procedimiento es mejor que otro, formulamos la
hipótesis de que no hay diferencia entre ellos (o sea. Que cualquier diferencia observada se
debe simplemente a fluctuaciones en el muestreo de la misma población). Tales hipótesis se
suelen llamar hipótesis nula y se denotan por Ho.
Para todo tipo de investigación en la que tenemos dos o más grupos, se establecerá una
hipótesis nula.
La hipótesis nula es aquella que nos dice que no existen diferencias significativas entre los
grupos.
Por ejemplo, supongamos que un investigador cree que si un grupo de jóvenes se somete a
un entrenamiento intensivo de natación, éstos serán mejores nadadores que aquellos que no
recibieron entrenamiento. Para demostrar su hipótesis toma al azar una muestra de jóvenes,
y también al azar los distribuye en dos grupos: uno que llamaremos experimental, el cual
recibirá entrenamiento, y otro que no recibirá entrenamiento alguno, al que
llamaremos control. La hipótesis nula señalará que no hay diferencia en el desempeño de la
natación entre el grupo de jóvenes que recibió el entrenamiento y el que no lo recibió.
Una hipótesis nula es importante por varias razones:
Es una hipótesis que se acepta o se rechaza según el resultado de la investigación.
El hecho de contar con una hipótesis nula ayuda a determinar si existe una diferencia entre
los grupos, si esta diferencia es significativa, y si no se debió al azar.
No toda investigación precisa de formular hipótesis nula. Recordemos que la hipótesis nula
es aquella por la cual indicamos que la información a obtener es contraria a la hipótesis
de trabajo.
Al formular esta hipótesis, se pretende negar la variable independiente. Es decir, se enuncia
que la causa determinada como origen del problema fluctúa, por tanto, debe rechazarse
como tal.
Otro ejemplo:
Hipótesis: el aprendizaje de los niños se relaciona directamente con su edad.
Hipótesis Alternativa.
Toda hipótesis que difiere de una dada se llamará una hipótesis alternativa. Por ejemplo: Si
una hipótesis es p = 0,5, hipótesis alternativa podrían ser p = 0,7, p " 0,5 ó p > 0,5.
Una hipótesis alternativa a la hipótesis nula se denotará por H1 ó Hα.
 Al responder a un problema, es muy conveniente proponer otras hipótesis en que
aparezcan variables independientes distintas de las primeras que formulamos. Por
tanto, para no perder tiempo en búsquedas inútiles, es necesario hallar diferentes
hipótesis alternativas como respuesta a un mismo problema y elegir entre ellas
cuáles y en qué orden vamos a tratar su comprobación.
Las hipótesis, naturalmente, serán diferentes según el tipo de investigación que se esté
realizando. En los estudios exploratorios, a veces, el objetivo de la investigación podrá ser
simplemente el de obtener los mínimos conocimientos que permitan formular una hipótesis.
También es aceptable que, en este caso, resulten poco precisas, como cuando afirmamos
que "existe algún tipo de problema social en tal grupo", o que los planetas poseen algún
tipo de atmósfera, sin especificar de qué elementos está compuesto.
Suponiendo que contamos con un diseño compuesto por ciesta cantidad de tratamientos,
con N cantidad de repeticiones donde se desea probar si la hipótesis nula se acepta o se
rechaza, es necesario realizar un estudio ANOVA el cual ya fue representado en forma de
ecuación anteriormente. Entonces la inferencia estadística sobre el efecto del tratamiento
dice que: la hipótesis es nula si el factor en estudio no tiene efecto sobre cada tratamiento,
es decir, todos los tratamientos arrojan la misma variable de respuesta. Si por el contrario al
menos 1 de los tratamientos arroja una variable de respuesta diferente al resto de dichos
tratamientos, entonces el factor en estudio tuvo efecto.

Ho=Hipótesis nula
µ T 1 = µ T 2 ó T k = 0 (El factor no tiene efecto)

Ha=Hipótesis alternativa µ T1 ≠ µ T2 o Tk ≠ 0 (El factor tiene efecto)


Ejemplo: Un equipo de ingenieros investiga el efecto de cuatro configuraciones internas en
un separador A, B, C, D sobre el tiempo de retención de fluidos en segundos, esto para
mejorar la eficiencia operativa en pozos con alto caudal y altas velocidades de flujo. En
primera instancia la estrategia experimental es aplicar cuatro veces las cuatro
configuraciones internas en orden completamente aleatorio. Los tiempos de retención de
fluidos se muestran en la tabla 2.1. Si se usa un diseño completamente aleatorizado, se
supone que, además de la configuración y diseño interno del separador no existe ningún
otro factor que influya de manera significativa sobre la variable respuesta (tiempo de
retención de fluidos en cada separador).

Tabla 1.2 Diseño ordenado al azar


Diseño Interno de Separador
A B C D
6 7 11 10
8 9 16 12
7 10 11 11
8 8 13 9

El objetivo básicamente es realizar una prueba de hipótesis, las cuales se establecen de la


siguiente manera:
Ho=Hipótesis nula:
µ T 1 = µ T 2 ó T k = 0 (El factor no tiene efecto)
Ha=Hipótesis alternativa:
µ T1 ≠ µ T2 o Tk ≠ 0 (El factor tiene efecto)
La hipótesis alternativa, la cual es la que queremos comprobar plantea que al menos uno de
los diseños internos del separador bien sea A, B, C, D, arroja tiempos de retención de
fluidos menor o mayor que la media general de nuestra variable de respuesta.
La hipótesis nula, nos menciona que todos los tratamientos son iguales, para lo cual
seguramente el analista estadístico diría que cualquier configuración interna tendría el
mismo tiempo de retención de fluidos, es decir se elegiría cualquier método de ensamble o
diseño para este proceso.
Para poder realizar el análisis de varianza, tenemos que llenar la siguiente tabla:
Tabla 1.3: Resultados a obtener llenando la tabla ANOVA 1.1.
Fuente de Suma de Grados de Cuadrados Fο Valor P
variación cuadrados libertad medios
Tratamientos
Error
Total

¿Qué es lo que realizamos con el ANOVA? Pues básicamente el ANOVA divide la


variabilidad en el diseño experimental a través de sus diferentes fuentes, que en este caso
las fuentes de variación serían: los tratamientos, que son los cuatro diseños o ensambles del
separador, el error y la suma de cuadrados total.
Comenzaremos por definir cada término posible en las ecuaciones de la tabla ANOVA
con la finalidad de obtener dichas fuentes de variabilidad, grados de libertad y cuadrados
medios, etc., hasta obtener el valor –p.
 Yi•= Suma de las observaciones del tratamiento i.
Por ejemplo, para el tratamiento A: Yi•= 6+8+7+8 = 29.
 Ῡi•= Promedio de cada uno de los tratamientos (A, B, C, D)
Ῡi• para tratamiento A sería: (6+8+7+8)/4 = 7,25
 Y••= Sería la suma de todos los datos observados, en este caso los 16 tiempos de
retención en segundos de los diferentes diseños de separador.
Y••= (6+8+7+8+7+9+10+8+11+16+11+13+10+12+11+9)= 156
Diseño Interno de Separador
A B C D

6 7 11 10
8 9 16 12
7 10 11 11
8 8 13 9

Yi•=
Yi•= 29 34 51 42
7,25 8,5 12,75 10,5
Ῡi•=

Y••= 156
Con estos datos y aplicando las ecuaciones presentadas en la tabla 1.1 de ANOVA
obtenemos los resultados de cada uno de los términos para obtener finalmente el valor –p.
Se han aplicado correctamente todas las ecuaciones y procedimientos matemáticos
(bastante sencillos) hasta llenar la tabla 1.3, obteniendo los siguientes resultados:

Fuente de Suma de Grados de Cuadrados Fο Valor P


variación cuadrados libertad medios
Tratamientos 69,5 3 23,17 9,42 0,0018
Error 29,5 12 2,46
Total 99 15

El valor de P, se puede obtener buscando en una tabla de la distribución F de Fisher y/o con
herramientas de cálculo en calculadoras científicas avanzadas, paquete de Microsoft Excel,
etc. Entonces una vez obtenido el valor –p se compara con alfa α, para probar la hipótesis.
Dónde:
 Si el valor –p es menor que alfa se rechaza la hipótesis nula
 Si el valor –p es mayor que alfa no se rechaza la hipótesis nula.
En conclusión: Como el valor –p es menor que alfa α=0,05 se concluye que al menos un
tratamiento (diseño o ensamble interno del separador) es diferente del resto.
REFERENCIA BIBLIOGRÁFICA

Mercedes León Salazar, (2002). “Manual de la aplicación de los diseños experimentales


básicos en el paquete NCSS”.
García Leal, J. & Lara Porras, A.M. (1998). “Diseño Estadístico de Experimentos. Análisis
de la Varianza.” Grupo Editorial Universitario.
Lara Porras, A.M. (2000). “Diseño Estadístico de Experimentos, Análisis de la Varianza y
Temas Relacionados: Tratamiento Informático mediante SPSS” Proyecto Sur de Ediciones
Miller, I, Freud, J.E y Johnson, R.A. (2004). Probabilidad y Estadística para ingenieros.
Ciudad de México. México. Prentice-Hall Hispanoamericana.
http://www.virtual.unal.edu.co/cursos/ciencias/2000352/docs/contenido.html. Bajado (28
de Febrero de 2021).

También podría gustarte