Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Universidad de sucre
Licenciatura en física
Eliu Ruz
Humberto Enrique Ozuna Palencia
VII semestre
Sincelejo - Sucre
13/11/2022
Índice general
Resumen.......................................................................................................................................3
Abstract........................................................................................................................................4
1 Introducción.........................................................................................................................5
2 Experimento con un solo factor...........................................................................................7
3 Diseño completamente azar (DCA)......................................................................................8
3.1 Anova............................................................................................................................9
3.2 Diagramas de caja........................................................................................................9
3.3 Graficas de medida.......................................................................................................9
4 Pruebas de rangos múltiples................................................................................................9
4.1 (LSD).............................................................................................................................9
4.2 Tukey............................................................................................................................9
4.3 Contraste.......................................................................................................................9
5 Verificación de los supuestos del modelo.............................................................................9
5.1 Normalidad...................................................................................................................9
5.2 Varianza constante.......................................................................................................9
5.3 Independencia...............................................................................................................9
6 Tamaño de muestra..............................................................................................................9
7 Conclusiones.........................................................................................................................9
8 referencia..............................................................................................................................9
EXPERIMENTO CON UN SOLO FACTOR
13 de nov. de 22
Resumen
Abstract
2 Introducción
3 Introducción al diseño experimental
Con el tratamiento nulo quiere decir que estos son iguales estadísticamente en cuanto a su
media frente a la alternativa de que al menos dos de los tratamientos sean diferentes
(diferencia de tratamiento) la clave para resolver estos problemas es obteniendo las
muestras ideal o representativa de mediciones individuales de los tratamientos y armar un
estadístico de pruebas para escoger el resultado de la comparación.
Para la expresión del tratamiento nulo se podría aplicar la técnica de T studen a los posibles
pares de medias, pero esta aumentaría notablemente el error tipo I (rechazar H 0 siendo
verdadera) pero con el método mencionado inicialmente. En análisis de varianza sería
capaz de probar la hipótesis de igualdad de K medidas.
5 Diseño completamente al azar (DCA)
Como se mencionó en la sección del experimento de solo factor, que es el más simple de
todos los diseños por el hecho de comparar dos o más tratamientos considerando dos
fuentes de variabilidad: tratamiento y error aleatorio.
Se hará de preguntarse de ¿Por qué se llama completamente al azar o aleatorio? Se llama
así de forma que, si se realiza K pruebas, toda estas corren al azar completamente, de
manera que los posibles efectos se distribuyan equitativamente entre los tratamientos.
Ejemplo: Comparación de cuatro métodos de escritura
Comparación de cuatro métodos de escritura. Un grupo de mejora investiga el efecto de
cuatro métodos de escrituras por lo que cada método lo clasificaron como 1A, 2B, 3C y 4D,
sobre el tiempo de escritura en minutos. En primer momento, la estrategia experimental es
efectuar cuatro veces los cuatro métodos de escritura en orden completamente aleatorio (las
16 pruebas en orden aleatorio). Si se usa el diseño completamente aleatorio (DCA), se
supone que, además del método de escritura, no existe ningún otro factor que influya de
manera significativa sobre la variable de respuesta (tiempo de escritura) mencionado en la
introducción del diseño experimental.
Supongamos que se tienen k tratamientos, independientes y con medias desconocidas µ1, µ2 ,
2 2 2
…, µk , se suponen igualmente la varianzas son desconocidas σ 1 = σ 2 = … = σ k = σ 2 . Las
poblaciones pueden ser k métodos de producción, k tratamientos, k grupos, etc., y sus
medias se refieren o son medidas en términos de la variable de respuesta.
Para el caso del diseño completamente aleatorio generan datos para comparar dichas
poblaciones, para esto se puede crear un tabla de Y nm elementos donde m -ésima
observaciones que se hizo en el tratamiento n; Qnes el tamaño o las cantidades de veces que
se observa los tratamientos n.
Cuando Qn = Q para toda n se establece que el diseño está equilibrado. El número de
tratamientos k es determinado por el investigador y depende del problema particular de que
se trata. El número de observaciones por tratamiento (Q) debe escogerse con base en la
variabilidad que se espera observar en los datos, así como en la diferencia mínima que el
experimentador considera que es importante detectar. Con este tipo de consideraciones, por
lo general se recomiendan entre 5 y 30 mediciones en cada tratamiento. Por ejemplo, se usa
un tamaño de muestra grande cuando hay una dispersión alta de estas y cuando la
dispersión es mínima se utiliza una Q pequeña, con esto la dispersión de datos se puede
inferir el error que se propaga en un experimento. En caso de que los tratamientos tengan
efecto, las observaciones Y nm se podrán describir con el modelo estadístico lineal dado por:
Y mn=µ+Ʈ m+ Ԑ (2)
mn
-Donde μ es el parámetro de escala común a todos los tratamientos, llamado media global
- donde τ es un parámetro que mide el efecto del tratamiento m y ε mn , es el error atribuible a
la medición Y mn
El modelo anterior implica que la variabilidad se aplicara a los tratamientos y al error
aleatorio. Ya que μ de la variable de respuesta no es considerada como una fuente de
variabilidad, ya que es una constante común a todos los tratamientos, esto hace las veces de
un punto de referencia para comparar las respuestas obtenidas de los tratamientos. Si
obtenemos la respuesta media de un tratamiento en particular μi tiene mucha diferencia con
respecto a la media global μ, esto es indicio de que hay un efecto del tratamiento, ya que
τ m=μm −μ . La referencia para deducir que hay un efecto nos lo brinda el análisis de
varianza.
Cuando realizamos una práctica puede ocurrir que los tratamientos que deseamos comparar
sean demasiados como para experimentar con todos, para esto lo más conveniente es
comparar solo una de las muestras de la población de tratamientos, de tal forma que τ m pasa
a se una variable aleatoria con su propia varianza σ 2τ , en esta presentación solo se
presentara el caso en que los tratamientos tienen se prueban, ya que suponemos una
población pequeña de tratamientos, lo cual nos permite compararlos a todos, En este caso,
el modelo dado por la ecuación (2) se llama modelo de efectos fijos.
5.1 ANOVA
El análisis de varianza es la técnica enfocada en el análisis de datos experimentales. Esta
técnica se centra en dividir la variación total en las partes con las que contribuye cada
fuente de variación en el experimento. Para el caso del DCA se descompone la variabilidad
debida a los tratamientos y al error. Cuando la primera tiene más dominio sobre la segunda,
es cuando se define que los tratamientos tienen efecto (figura 3.1b), o dicho de otra forma,
existe un contrate de las medias. Cuando los tratamientos no tienen efecto contribuyen igual
o menos que el error, por lo que se entiende que las medias son iguales (figura 3.1a).
El objetivo del análisis de varianza en el DCA es evaluar la hipótesis de igualdad de los
tratamientos con respecto a la media de la correspondiente variable de respuesta:
H 0=µ1=µ2=..=µ k =µ (1)
H A =µ i ≠ µ j para algún i≠ j
H A =Ʈ i ≠ 0 j para algúni
Por último, es importante destacar que el ANOVA supone que la variable de respuesta se
reparte normal, con varianza constante (los tratamientos tienen varianza similar) y que las
mediciones no dependen entre sí. Estos supuestos deben verificarse para estar más seguros
de las conclusiones obtenidas.
Notación de puntos
La notación de puntos se usa para representar forma resumida las cantidades numéricas,
que se calculan a partir de datos experimentales, donde Y mn representa la n-èsima
observación en el tratamiento m, como m=1 , 2 … ., k y n=1 ,2 … , j i. Las cantidades de
interés son las siguientes
Y i∗¿=Suma de lasobservaciones del tratamiento m ¿
Ejemplo 1
Comparación de cuatro métodos de ensamble. Consideremos los datos del DCA dados en el
ejemplo 3.1, donde el interés era comparar cuatro métodos de ensamble en cuanto al tiempo
promedio en minutos que requiere cada uno de ellos. Se hicieron cuatro observaciones del
tiempo de ensamble en cada método. Los resultados se muestran en la tabla 3.1. Una
manera de comparar los métodos de ensamble (tratamientos) es probar la hipótesis:
H o :τ A =τ B=τ C =τ D =0
H A :τ i ≠ 0 para algun i= A , B , C , D
En caso de no rechazar H0 se concluye que los tiempos promedio de los cuatro métodos de
ensamble son estadísticamente iguales; pero si se rechaza, se concluye que al menos dos de
ellos son diferentes. En la tabla 3.6 se muestra el análisis de varianza correspondiente, en
donde se aprecia que el valor del valor-p = 0.0018 es menor que a = 0.05, por lo que se
rechaza H0 en este nivel de significancia en par ticular. No obstante, también se rechazaría
para cualquier otro nivel de significancia:
Tabla 1.1 ANOVA para los tipos de cuero
FV SC GL CM F 10 Valor-p
prefijado, a, que cumpla con a > 0.0018, ya que en esos casos el estadístico de prueba F0 =
9.42 caería en la región de rechazo.
Calculos manuales
Los cálculos se facilitan si en primer lugar obtenemos la información básica desplegada ne
la tabla 1.3, con la información presentada en el cuadro se puede calcular la suma de
cuadrados;
Tabla 1.3
Métodos de ensamble Operaciones básicas
4 4
Al no rechazar la hipótesis nula H 0=µ1=µ2=..=µ k =µ, el objetivo del experimento está envuelto
y la conclusión es que no es cierto que µi ≠ µ j . en cambio sí se rechaza H 0, y se acepta la hipótesis
alternativa H A =µ i ≠ µ j para algún i≠ j , es necesario saber cuáles tratamientos resultaron
diferentes, o cuáles lo provocan. Como se ilustro en la gráfica de medias, estos interrogantes se
responden probando la igualdad de todos los posibles pares de medias, para lo que se han propuesto
varios métodos, conocidos como métodos de comparaciones múltiples. La diferencia esencial entre
los métodos radica en la potencia que tienen para detectar las diferencias entre las medias, si esta es
capaz de detectar diferencias más pequeñas es más efectiva.
6.1 (LSD)
Una vez rechazado la hipótesis nula H 0 en el ANOVA, el problema es probar la igualdad de todos
los posibles pares de medias con la hipótesis:
H 0=µi=µ j
H A =µ i ≠ µ j
para toda i diferente j. Para k tratamientos se obtiene un neto de k(k – 1)/2 pares de medias. Por
ejemplo, si k = 5 existen 5 × 4/2 = 10 posibles pares de medias. El estadístico de prueba para cada
una de las hipótesis dadas en (3.11) es la correspondiente diferencia en valor absoluto entre sus
medias muéstrales No se acepta la hipótesis H 0=µi=µ jsi es cierto lo siguiente:
El valor de ta/2, N – k se busca en las tablas de la distribución T de Student con N – k
grados de libertad que corresponden al error, el cuadrado medio del error es CM E y se
obtiene de la tabla de ANOVA, ni y n j son el número de observaciones para los
tratamientos i y j, respectivamente. La cantidad LSD se denomina diferencia mínima
significativa (least significant difference), esta es la diferencia mínima que debe haber
entre dos medias muéstrales para tener en cuenta que los tratamientos correspondientes son
significativamente diferentes. detalle que si el diseño es balanceado, es decir, si
n1 =n2=..=nk =n, la diferencia mínima significativa se reduce a:
Si se acepta la hipótesis alternativa H A =µ i ≠ µ j, la cual nos indica que las medias de los
tratamientos i y j son distintas, entonces se rechaza la hipótesis H 0=µi=µ j . El método
LSD tiene una potencia fundamental, por lo que en ocasiones declara significativas aun
pequeñas diferencias.
Ejemplo:
6.2 Tukey
El método de Tukey, el cual trata en comparar las diferencias entre medias muéstrales con
el valor crítico dado por:
Ta = qa (k, N – k) CM n E i /
donde CME es el cuadrado medio del error, n es el número de observaciones por
tratamiento, k es el número de tratamientos, N – k es igual a los grados de libertad para el
error, a es el nivel de significancia prefijado y el estadístico qa(k, N – k) son puntos
porcentuales de la distribución del rango estudentizado, que se obtienen de la
correspondiente tabla en el apéndice. Se declaran significativamente diferentes los pares de
medias cuya diferencia muestral en valor absoluto sea mayor que Ta. A diferencia de los
métodos LSD y Duncan, el método de Tukey trabaja con un error a muy cercano al
declarado por el experimentador.
Hay varios métodos estándar para realizar comparaciones por pares que den credibilidad a
la tasa del error tipo I. Aquí se analizarán e ilustrarán dos de ellos. El primero, denominado
procedimiento de Tukey, permite la formación de intervalos de confianza del 100(1 – α)%
simultáneos para todas las comparaciones por pares. El método se basa en la distribución
del rango estudentizado. El punto apropiado del percentil es una función de α, k y v =
grados de libertad para s2 . En la tabla A.12 se presenta una lista de puntos porcentuales
superiores adecuados para α = 0.05. El método de Tukey de comparaciones por pares
implica encontrar una diferencia significativa entre las medias i y j (i ≠ j) si |yi. - yj.| excede
a q(α, k, v s n 2 . El procedimiento de Tukey se ilustra con facilidad. Considere un ejemplo
hipotético en el que se tienen 6 tratamientos en un diseño completamente aleatorizado de un
solo factor, en el que se hacen 5 observaciones por tratamiento. Suponga que el cuadrado
medio del error tomado de la tabla del análisis de varianza es s2 = 2.45 (24 grados de
libertad). Las medias muestrales están en orden ascendente,
5.3 Contraste
8 Tamaño de muestra
9 Conclusiones
10 Referencia
E., R. (2012). Probabilidad y estadística para ingenería y ciencias . México: Pearson Educación de
México, S.A. de C.V.
Gutiérrez, P. (2009). Elementos de Diseño de Experimentos. Mexico D.F: Astra Ediciones, S.A. de
C.V.