CONTENIDO Introducción Objetivos de un experimento Unidad experimental y tratamiento Error experimental Repeticiones y sus funciones Factores que afectan el número de repeticiones Precisión relativa de diseños con pocos tratamientos Control del error Elección de los tratamientos Aleatorización Inferencia estadística INTRODUCCION
En el campo de la industria es frecuente hacer experimentos o pruebas con la
intención de resolver un problema o comprobar una idea (conjetura, hipótesis); por ejemplo, hacer algunos cambios en los materiales, métodos o condiciones de operación de un proceso, probar varias temperaturas en una máquina hasta encontrar la que da el mejor resultado o crear un nuevo material con la intención de lograr mejoras o eliminar algún problema. El diseño estadístico de experimentos es precisamente la forma más eficaz de hacer pruebas. El diseño de experimentos consiste en determinar cuáles pruebas se deben realizar y de qué manera, para obtener datos que, al ser analizados estadísticamente, proporcionen evidencias objetivas que permitan responder las interrogantes planteadas, y de esa manera clarificar los aspectos inciertos de un proceso, resolver un problema o lograr mejoras. Algunos problemas típicos que pueden resolverse con el diseño y el análisis de experimentos son los siguientes: 1. Comparar a dos o más materiales con el fin de elegir al que mejor cumple los requerimientos. 2. Comparar varios instrumentos de medición para verificar si trabajan con la misma precisión y exactitud. 3. Determinar los factores (las x vitales) de un proceso que tienen impacto sobre una o más características del producto final. 4. Encontrar las condiciones de operación (temperatura, velocidad, humedad, por ejemplo) donde se reduzcan los defectos o se logre un mejor desempeño del proceso. 5. Reducir el tiempo de ciclo del proceso. 6. Hacer el proceso insensible o robusto a oscilaciones de variables ambientales. 7. Apoyar el diseño o rediseño de nuevos productos o procesos. 8. Ayudar a conocer y caracterizar nuevos materiales. El objetivo de los métodos estadísticos es lograr que el proceso de generar conocimiento y aprendizaje sea lo más eficiente posible. En este proceso, que ha demostrado ser secuencial, interactúan dos polos, por un lado están la teoría, los modelos, las hipótesis, las conjeturas y los supuestos; por el otro, están la realidad, los hechos, los fenómenos, la evidencia y los datos. Definiciones básicas en el diseño de experimentos El diseño de experimentos: es la aplicación del método científico para generar conocimiento acerca de un sistema o proceso, por medio de pruebas planeadas adecuadamente. Un experimento: es un cambio en las condiciones de operación de un sistema o proceso, que se hace con el objetivo de medir el efecto del cambio sobre una o varias propiedades del producto o resultado. Asimismo, el experimento permite aumentar el conocimiento acerca del sistema. La unidad experimental: es la pieza(s) o muestra(s) que se utiliza para generar un valor que sea representativo del resultado del experimento o prueba. En cada diseño de experimentos es importante definir de manera cuidadosa la unidad experimental, ya que ésta puede ser una pieza o muestra de una sustancia o un conjunto de piezas producidas, dependiendo del proceso que se estudia. Variable de respuesta: A través de esta(s) variable(s) se conoce el efecto o los resultados de cada prueba experimental. Factores controlables: Son variables de proceso y/o características de los materiales y los métodos experimentales que se pueden fijar en un nivel dado. Factores no controlables: Son variables que no se pueden controlar durante el experimento o la operación normal del proceso. Factores estudiados: Son las variables que se investigan en el experimento para observar cómo afectan o influyen en la variable de respuesta. Niveles y tratamientos: Los diferentes valores que se asignan a cada factor estudiado en un diseño experimental se llaman niveles. Una combinación de niveles de todos los factores estudiados se llama tratamiento o punto de diseño. Por ejemplo, si en un experimento se estudia la influencia de la velocidad y la temperatura, y se decide probar cada una en dos niveles, entonces cada combinación de niveles (velocidad, temperatura) es un tratamiento. Error aleatorio: Es la variabilidad observada que no se puede explicar por los factores estudiados; resulta del pequeño efecto de los factores no estudiados y del error experimental. Por ejemplo, será parte de este error aleatorio el pequeño efecto que tienen los factores que no se estudiaron, siempre y cuando se mantenga pequeño o despreciable, así como la variabilidad de las mediciones hechas bajo las mismas condiciones. Sin embargo, el error aleatorio también absorberá todos los errores que el experimentador comete durante los experimentos, y si éstos son graves, más que error aleatorio hablaremos de error experimental. Error experimental: Componente del error aleatorio que refleja los errores del experimentador en la planeación y ejecución del experimento. Matriz de diseño: Es el arreglo formado por los tratamientos que serán corridos, incluyendo las repeticiones. Planeación: Son actividades encaminadas a entender, delimitar el problema u objeto de estudio y seleccionar variables de respuesta y factores. Concluye con la especificación de los tratamientos a realizar y con la organización del trabajo experimental. Aleatorización: Consiste en hacer corridas experimentales en orden aleatorio (al azar); este principio aumenta la posibilidad de que el supuesto de independencia de los errores se cumpla. Repetición: Es correr más de una vez un tratamiento o una combinación de factores. Es preciso no confundir este principio con medir varias veces el mismo resultado experimental. Repetir es volver a realizar un tratamiento, pero no inmediatamente después de haber corrido el mismo tratamiento, sino cuando corresponda de acuerdo con la aleatorización. Bloqueo: Consiste en nulificar o tomar en cuenta, en forma adecuada, todos los factores que puedan afectar la respuesta observada. Al bloquear, se supone que el subconjunto de datos que se obtengan dentro de cada bloque (nivel particular del factor bloqueado), debe resultar más homogéneo que el conjunto total de datos. Etapas en el diseño de experimentos Un aspecto fundamental del diseño de experimentos es decidir cuáles pruebas o tratamientos se van a realizar y cuántas repeticiones de cada uno se requieren, de manera que se obtenga la máxima información al mínimo costo posible. El arreglo formado por los diferentes tratamientos que serán corridos, incluyendo las repeticiones, recibe el nombre de matriz de diseño o sólo diseño. Para que un estudio experimental sea exitoso es necesario realizar, por etapas, diferentes actividades. En este sentido, la etapa más importante y a la que se le debe dedicar mayor tiempo es la planeación. ➢ Planeación y realización ✓ Entender y delimitar el problema u objeto de estudio ✓ Elegir la(s) variable(s) de respuesta que será medida en cada punto del diseño y verificar que se mide de manera confiable ✓ Determinar cuáles factores deben estudiarse o investigarse, de acuerdo a la supuesta influencia que tienen sobre la respuesta ✓ Seleccionar los niveles de cada factor, así como el diseño experimental adecuado a los factores que se tienen y al objetivo del experimento ✓ Planear y organizar el trabajo experimental ✓ Realizar el experimento ➢ Análisis: En esta etapa no se debe perder de vista que los resultados experimentales son observaciones muestrales, no poblacionales. Por ello, se debe recurrir a métodos estadísticos inferenciales para ver si las diferencias o efectos muestrales (experimentales) son lo suficientemente grandes para que garanticen diferencias poblacionales (o a nivel proceso). La técnica estadística central en el análisis de los experimentos es el llamado análisis de varianza ANOVA ➢ Interpretación: Aquí, con el respaldo del análisis estadístico formal, se debe analizar con detalle lo que ha pasado en el experimento, desde contrastar las conjeturas iniciales con los resultados del experimento, hasta observar los nuevos aprendizajes que sobre el proceso se lograron, verificar supuestos y elegir el tratamiento ganador, siempre con apoyo de las pruebas estadísticas. ➢ Control y conclusiones finales: Para concluir el estudio experimental se recomienda decidir qué medidas implementar para generalizar el resultado del estudio y para garantizar que las mejoras se mantengan. Además, es preciso organizar una presentación para difundir los logros. Clasificación y selección de los diseños experimentales Los cinco aspectos que más influyen en la selección de un diseño experimental, en el sentido de que cuando cambian por lo general nos llevan a cambiar de diseño, son: 1. El objetivo del experimento. 2. El número de factores a estudiar. 3. El número de niveles que se prueban en cada factor. 4. Los efectos que interesa investigar (relación factores-respuesta). 5. El costo del experimento, tiempo y precisión deseada. Definición de Hipótesis
También conocido como planteamiento del problema y definición de objetivos.
Contribuye a mejorar el conocimiento del fenómeno y por ende de la solución al problema. Se recomienda establecer los objetivos fundamentales ya que tratar de abordar problemas colaterales puede complicar innecesariamente el experimento. Normalmente la lista de objetivos es refinada a medida que se van ejecutando las etapas del diseño de experimentos. OBJETIVOS DE UN EXPERIMENTO El objetivo del experimento se utiliza como un criterio general de clasificación de los diseños experimentales, mientras que el numero de factores a estudiar, elnumero de niveles que se prueban en cada factor, los efectos que interesan investigar y el costo del experimento, tiempo y precisión deseada son útiles para subclasificarlos. En este sentido, de acuerdo con su objetivo y sin pretender ser exhaustivos, los diseños se pueden clasificar como: 1. Diseños para comparar dos o más tratamientos. 2. Diseños para estudiar el efecto de varios factores sobre la(s) respuesta(s). 3. Diseños para determinar el punto óptimo de operación del proceso. 4. Diseños para la optimización de una mezcla. 5. Diseños para hacer el producto o proceso insensible a factores no controlables. CLASIFICACIÓN GENERAL DE LOS DISEÑOS EXPERIMENTALES DE ACUERDO CON SU OBJETIVO UNIDAD EXPERIMENTAL Porción de material o terreno, individuo o grupo de individuos, susceptible de tratamiento experimental y sobre la que se observa una respuesta. Generalmente coincide con la Unidad de Observación. Ejemplos: planta, parcela de terreno, alícuota de materia prima (muestra de harina), grupo de insectos, etc. El tamaño de la unidad experimental es usualmente una decisión arbitraria, pero afecta la calidad de la observación de la variable respuesta. RESPUESTA
Cuando se planifica un experimento, se debe identificar la respuesta del sistema
que se va a evaluar
VARIABLES RESPUESTAS (variables dependientes)
➢ Caritativas ➢ Cuantitativas ➢ Univariables ➢ Multivariables variable cualitativa Es un tipo de variable estadística que describe las cualidades, circunstancias o características de un objeto o persona, sin hacer uso de números. De esta manera, las variables cualitativas permiten expresar una característica, atributo, cualidad o categoría no númerica. Por ejemplo, el sexo de una persona es una variable cualitativa, ya que es masculino o femenino.
Características de las variables cualitativas:
➢ No se puede medir numéricamente.
➢ No otorga datos específicos y a veces tampoco un orden. ➢ Especifica una condición, cualidad o característica. ➢ Cuando los valores de dicha variable son solamente dos, se llama dicotómica. ➢ Cuando distingue tres valores o más, se la llama politómica. ➢ Tipos de variables cualitativas ➢ La variable cualitativa puede ser nominal, ordinaria o binaria. variables cuantitativas Son aquellas variables estadísticas que otorgan, como resultado, un valor numérico. Por ejemplo, variables tales como el peso (62 kg, 80 kg), la altura (1.72 cm, 1.85 cm) o la cantidad de miembros en una familia (2, 3 o 4), son variables cuantitativas.
Características de las variables cuantitativas
➢ Expresan sus valores con números.
➢ Son utilizadas generalmente en encuestas o entrevistas. ➢ Utilizan gráficos llamados diagramas integrales y diagramas diferenciales para mostrar la frecuencia relativa de las variables. ➢ También pueden servirse de diagramas de barra para otorgar cifras. ➢ Tipos de las variables cuantitativas ➢ Las variables cuantitativas pueden ser discretas o continuas. Univariables Los métodos de análisis univariable se utilizan para estudiar el comportamiento de las variables de forma individual. Distribución de frecuencias: permiten obtener una primera aproximación de la tendencia de los resultados, ya que indican el número de individuos que tanto en valores absolutos como en valores porcentuales han mencionado cada uno de los códigos posibles (respuestas) que puede tomar una variable determinada.
Medidas de tendencia central: permiten apreciar cuál es el
comportamiento medio de cada variable. Los tres más utilizados son la moda, la mediana y la media. Medidas de dispersión: permiten analizar la variabilidad de la distribución, es decir, determinar si las respuestas que han dado las personas entrevistadas se han concentrado sólo en unos cuantos valores o si, por el contrario, han sido muy variadas. La dispersión se mide respecto del comportamiento medio de la variable, por lo que la elección de la medida de dispersión que hay que utilizar también depende de la escala en que esté medida la variable que se analiza.
Inferencia estadística: La inferencia estadística es el conjunto de métodos y técnicas
que permiten inducir, a partir de la información empírica proporcionada por una muestra, cual es el comportamiento de una determinada población con un riesgo de error medible en términos de probabilidad. Multivariable Es una rama de las estadísticas que abarca la observación y el análisis simultáneos de más de una variable respuesta. La aplicación de la estadística multivariante es llamada análisis multivariante. La estadística multivariante trata de comprender los diferentes objetivos y antecedentes de cada una de las diferentes formas de análisis multivariante y cómo se relacionan entre sí. La aplicación práctica de la estadística multivariante a un problema particular puede involucrar varios tipos de análisis univariados y multivariados para comprender las relaciones entre las variables y su relevancia para el problema que se está estudiando. Las estadísticas multivariadas se refieren a las distribuciones de probabilidad multivariadas, en términos de: ➢ cómo se pueden utilizar para representar las distribuciones de datos observados; ➢ cómo se pueden utilizar como parte de inferencia estadística, particularmente cuando varias cantidades diferentes son de interés para el mismo análisis. ERROR EXPERIMENTAL El término error experimental se refiere a la diferencia entre el valor observado de la variable respuesta sobre una unidad experimental y su valor esperado (de acuerdo a un modelo). El error experimental es el responsable de la variación observada entre unidades experimentales tratadas de la misma forma.
COMPONENTES DEL ERROR EXPERIMENTAL
➢ Error de medición: Variación que introduce el instrumento o procedimiento de medición. ➢ Error de muestreo: Variación en la respuesta diferencial de cada unidad experimental al tratamiento que recibe y depende de propiedades inherentes a la unidad experimental. ➢ Error de observación: Variación debida al submuestreo de la unidad experimental. ➢ Error de tratamiento: Variación en la respuesta debida a los errores en la reproducción del tratamiento. Usualmente, una vez obtenido un dato experimental, no es posible identificar la magnitud de las distintas componentes que, sumadas, conforman el error experimental. REPETICIÓN Se considera repetición a la aplicación de ese tratamiento a una nueva unidad experimental. Dado que toda observación tiene error, para estimar insesgadamente el efecto de un tratamiento, se debe promediar sobre un conjunto de repeticiones.
¿Qué diferencia hay entre réplicas y repeticiones?
Las mediciones de repetición y de réplica son múltiples mediciones de respuesta
tomadas con la misma combinación de valores de configuración de los factores, pero las mediciones de repetición se toman durante la misma corrida experimental o en corridas consecutivas, mientras que las mediciones de réplica se toman durante corridas experimentales idénticas pero separadas, que suelen estar aleatorizadas. Ejemplo de réplicas y repeticiones Una empresa de manufactura tiene una línea de producción con diferentes valores de configuración que pueden ser modificados por los operadores. Los ingenieros de control de calidad diseñan dos experimentos, uno con repeticiones y otro con réplicas, para evaluar el efecto de las configuraciones sobre la calidad. El primer experimento utiliza repeticiones. Los operadores establecen los factores en niveles predeterminados, completan una corrida de producción y miden la calidad de cinco productos. Luego establecen los equipos en nuevos valores, completan otra corrida de producción y miden la calidad de cinco productos. Hacen lo mismo hasta que la producción se ejecuta una vez con cada combinación de valores de los factores y se toman cinco mediciones de calidad en cada corrida. El segundo experimento utiliza réplicas. Los operadores establecen los factores en niveles predeterminados, completan una corrida de producción y toman una medición de calidad. Luego establecen la configuración de los equipos, completan otra corrida de producción y toman una medición de calidad. En orden aleatorio, los operadores utilizan cada combinación de valores de factores cinco veces y toman una medición en cada corrida. CONCLUSION: En cada experimento se toman cinco mediciones con cada combinación de valores de configuración de los factores. En el primer experimento, las cinco mediciones se toman durante la misma corrida; en el segundo experimento, las cinco mediciones se toman en corridas diferentes. La variabilidad entre las mediciones tomadas con la misma configuración de factores tiende a ser mayor para las réplicas que para las repeticiones, porque las máquinas se restablecen antes de cada corrida, lo cual agrega más variabilidad al proceso. Factores que afectan el número de repeticiones El número de réplicas para un experimento se determina con base en: ➢ El grado de precisión deseada ➢ Cantidad de Variabilidad presente en el material experimental ➢ Recursos disponibles, incluyendo personal y equipo ➢ Tamaño y forma de la unidad experimental
El grado de precisión deseado depende de la naturaleza y características de los
tratamientos y de la magnitud de la diferencia esperada entre los tratamientos. Si la diferencia es pequeña mayor será el número de repeticiones. El grado de precisión es definido como la variabilidad asociada con la media de tratamiento (la varianza de una media de tratamientos) Es necesario mencionar que el aumentar el número de repeticones en un experimento no permite reducir el error debido a tecnicas defectuosas.
Para determinar el número de repeticiones existen unas tablas construidas por
Bowman and Kastenbaun (1975). Para utilizarlas se deben especificar 𝛼, 𝛽, 𝑡, ∆∗ donde:
➢ 𝛼 es la probabilidad de cometer error tipo I (rechazar una hipótesis correcta)
➢ 𝛽 es la probabilidad de cometer error tipo II (apoyar una hipótesis falsa) o la seguridad conque se desea detectar la diferencia entre el mejor y el peor tratamiento. ➢ ∆∗ es la diferencia mínima estandarizada a considerar entre el tratamiento de mayor efecto y el de menor para considerarse significativamente diferente. FACTORES
Las potenciales fuentes de variación de la(s) variable(s) respuesta en un sistema
experimental identificadas a priori son llamadas factores Los distintos estados o valores de los factores se designan niveles La combinación de niveles evaluados para un conjunto de factores recibe el nombre de tratamiento TRATAMIENTO: conjunto de acciones que se aplican sobre las unidades experimentales y que son objeto de comparación. ALEATORIZACIÓN
La aleatorización es una técnica que se utiliza para equilibrar el efecto de
condiciones externas o no controlables que pueden influir en los resultados de un experimento. BLOQUEO
Aunque la aleatorización “distribuye los errores” y controla el sesgo, no elimina ni
minimiza el error experimental. El bloqueo es el resultado de un reconocimiento a priori de fuentes sistemáticas de error y permite obtener experimento más eficientes INFERENCIA ESTADÍSTICA
En investigación, una vez obtenidos los resultados es importante validarlos, es
decir, ver si hay diferencias entre los resultados obtenidos en la investigación y unos valores determinados conocidos a priori o teóricos; en caso de que las haya, hay que comprobar si estas diferencias son estadísticamente significativas o si, por el contrario, se deben al azar. MINI CURSO ESTADISTICA