Está en la página 1de 16

1

Universidad de sucre

Facultad de educación y ciencia

Licenciatura en física

Experimento con un solo factor

Eliu Ruz
Humberto Enrique Ozuna Palencia

Asesor: Eduar Carvajal Taborda

VII semestre
Sincelejo - Sucre
13/11/2022
Índice general
Resumen.......................................................................................................................................3
Abstract........................................................................................................................................4
1 Introducción.........................................................................................................................5
2 Experimento con un solo factor...........................................................................................7
3 Diseño completamente azar (DCA)......................................................................................8
3.1 Anova............................................................................................................................9
3.2 Diagramas de caja........................................................................................................9
3.3 Graficas de medida.......................................................................................................9
4 Pruebas de rangos múltiples................................................................................................9
4.1 (LSD).............................................................................................................................9
4.2 Tukey............................................................................................................................9
4.3 Contraste.......................................................................................................................9
5 Verificación de los supuestos del modelo.............................................................................9
5.1 Normalidad...................................................................................................................9
5.2 Varianza constante.......................................................................................................9
5.3 Independencia...............................................................................................................9
6 Tamaño de muestra..............................................................................................................9
7 Conclusiones.........................................................................................................................9
8 referencia..............................................................................................................................9
EXPERIMENTO CON UN SOLO FACTOR

13 de nov. de 22

Resumen
Abstract
2 Introducción
3 Introducción al diseño experimental

En contextualización de algunos aspectos del experimento de un solo factor, tenemos que la


definicion clásica del experimento en el ambiento científico es considerado como la
observación o la determinación voluntaria de un fenómeno en estudio, o variable de
repuesta, en determinadas condiciones, por lo que los fenómenos reales son mucho más
complejos de lo que son capaces de describir los modelos teóricos, basados en ambientes
ideales y perfectos (esto nos ayuda relacionar o asimilar los comportamiento reales del
fenómeno), en consecuencia el objetivo del análisis estadístico será encontrar la variable de
respuesta del experimento y cuáles no. Estas variables que afectan o no a la variable de
respuesta (considerada variable independiente) se llamaran factores que es la característica
que diferencia a los tratamientos o poblaciones entre sí y además los valores que puede
tomar un factor se les denomina niveles que son diferentes tratamiento o poblaciones. En la
experimentación el principal rasgo es que existen unas condiciones que el experimentador o
analista controla, la primera es que al observar las modificaciones que se producen en la
variable de respuesta al manipular intencionalmente los valores de los niveles de los
factores que permite establecer una causa-efecto, esta condicion es aplicada por el
experimentador, en cambio para un experimento o estudio experimental es un estudio
observacional, donde el analista solo observa los datos sin influir en ninguno de ellos, es
decir este no tiene control sobre los factores por lo tanto no es fácil establecer una relación
causa-efecto.
Existen distintos tipos de experimentos que se pueden clasificar según el criterio del
experimentador o analista, entre ellos está el experimento para la selección de factores, para
la comparación de tratamientos y los de superficie de respuesta, pero para este caso se tiene
a un diseño unifactorial, de manera que estaríamos tratando con un experimento para la
comparación de tratamientos que es encontrar la diferencia entre los distintos niveles de
uno o más factores, por ejemplo, entre dos tipos de materiales cual es el que genera más
magnetización, en este experimento los números de valores de los factores son discreto.
Todo lo mencionado anteriormente se va a relacionar con el cuerpo de la monografía e
igualmente ustedes identificaran esa parte, además se detallará los métodos para obtener la
variable de respuesta en un experimento de un solo factor.
.
4 Experimento con un solo factor
El experimento con un solo factor es considerado el más simple porque solo necesita
comprobar la diferencia entre dos medidas, excluyendo las variables adicionales o
covariables que produzcan algún efecto en el experimento, por ejemplo, en un experimento
se midió el tiempo de una competencia de carrera de dos jugadores, aunque aún jugador se
le dio una bebida energizante y al otro no, es decir, se le dio un tratamiento y el factor es de
dos niveles para este caso.
En el problema de M > 2 muestras se estima que hay M muestra que se originan de M
poblaciones. Un proceso muy común que se prueban medias de la población es nombrado
análisis de varianza o ANOVA que es una técnica o método el cual consiste similarmente a
la teoría de la regresión, por lo que a partir de una suma neta de cuadrados que parte de dos
componentes una que es la regresión y la otra es el error. El interés del experimentador es
comparar los tratamientos en cuantos sus medidas poblacionales y también comparar
respecto a sus varianzas. El experimento se enfoca en comparar los tratamientos en cuanto
medias poblacionales incluyendo la comparación con respecto a sus varianzas que es
esencial, desde una perspectiva estadística, la hipótesis fundamental a probar cuando se
comparan varios tratamientos.
Tratamiento nulo:
H 0=µ1=µ2=..=µ k =µ (1)

Al menos dos de las medidas no son iguales:


H A =µ i ≠ µ j para algún i≠ j

Con el tratamiento nulo quiere decir que estos son iguales estadísticamente en cuanto a su
media frente a la alternativa de que al menos dos de los tratamientos sean diferentes
(diferencia de tratamiento) la clave para resolver estos problemas es obteniendo las
muestras ideal o representativa de mediciones individuales de los tratamientos y armar un
estadístico de pruebas para escoger el resultado de la comparación.
Para la expresión del tratamiento nulo se podría aplicar la técnica de T studen a los posibles
pares de medias, pero esta aumentaría notablemente el error tipo I (rechazar H 0 siendo
verdadera) pero con el método mencionado inicialmente. En análisis de varianza sería
capaz de probar la hipótesis de igualdad de K medidas.
5 Diseño completamente al azar (DCA)
Como se mencionó en la sección del experimento de solo factor, que es el más simple de
todos los diseños por el hecho de comparar dos o más tratamientos considerando dos
fuentes de variabilidad: tratamiento y error aleatorio.
Se hará de preguntarse de ¿Por qué se llama completamente al azar o aleatorio? Se llama
así de forma que, si se realiza K pruebas, toda estas corren al azar completamente, de
manera que los posibles efectos se distribuyan equitativamente entre los tratamientos.
Ejemplo: Comparación de cuatro métodos de escritura
Comparación de cuatro métodos de escritura. Un grupo de mejora investiga el efecto de
cuatro métodos de escrituras por lo que cada método lo clasificaron como 1A, 2B, 3C y 4D,
sobre el tiempo de escritura en minutos. En primer momento, la estrategia experimental es
efectuar cuatro veces los cuatro métodos de escritura en orden completamente aleatorio (las
16 pruebas en orden aleatorio). Si se usa el diseño completamente aleatorio (DCA), se
supone que, además del método de escritura, no existe ningún otro factor que influya de
manera significativa sobre la variable de respuesta (tiempo de escritura) mencionado en la
introducción del diseño experimental.
Supongamos que se tienen k tratamientos, independientes y con medias desconocidas µ1, µ2 ,
2 2 2
…, µk , se suponen igualmente la varianzas son desconocidas σ 1 = σ 2 = … = σ k = σ 2 . Las
poblaciones pueden ser k métodos de producción, k tratamientos, k grupos, etc., y sus
medias se refieren o son medidas en términos de la variable de respuesta.
Para el caso del diseño completamente aleatorio generan datos para comparar dichas
poblaciones, para esto se puede crear un tabla de Y nm elementos donde m -ésima
observaciones que se hizo en el tratamiento n; Qnes el tamaño o las cantidades de veces que
se observa los tratamientos n.
Cuando Qn = Q para toda n se establece que el diseño está equilibrado. El número de
tratamientos k es determinado por el investigador y depende del problema particular de que
se trata. El número de observaciones por tratamiento (Q) debe escogerse con base en la
variabilidad que se espera observar en los datos, así como en la diferencia mínima que el
experimentador considera que es importante detectar. Con este tipo de consideraciones, por
lo general se recomiendan entre 5 y 30 mediciones en cada tratamiento. Por ejemplo, se usa
un tamaño de muestra grande cuando hay una dispersión alta de estas y cuando la
dispersión es mínima se utiliza una Q pequeña, con esto la dispersión de datos se puede
inferir el error que se propaga en un experimento. En caso de que los tratamientos tengan
efecto, las observaciones Y nm se podrán describir con el modelo estadístico lineal dado por:

Y mn=µ+Ʈ m+ Ԑ (2)
mn

-Donde μ es el parámetro de escala común a todos los tratamientos, llamado media global
- donde τ es un parámetro que mide el efecto del tratamiento m y ε mn , es el error atribuible a
la medición Y mn
El modelo anterior implica que la variabilidad se aplicara a los tratamientos y al error
aleatorio. Ya que μ de la variable de respuesta no es considerada como una fuente de
variabilidad, ya que es una constante común a todos los tratamientos, esto hace las veces de
un punto de referencia para comparar las respuestas obtenidas de los tratamientos. Si
obtenemos la respuesta media de un tratamiento en particular μi tiene mucha diferencia con
respecto a la media global μ, esto es indicio de que hay un efecto del tratamiento, ya que
τ m=μm −μ . La referencia para deducir que hay un efecto nos lo brinda el análisis de
varianza.
Cuando realizamos una práctica puede ocurrir que los tratamientos que deseamos comparar
sean demasiados como para experimentar con todos, para esto lo más conveniente es
comparar solo una de las muestras de la población de tratamientos, de tal forma que τ m pasa
a se una variable aleatoria con su propia varianza σ 2τ , en esta presentación solo se
presentara el caso en que los tratamientos tienen se prueban, ya que suponemos una
población pequeña de tratamientos, lo cual nos permite compararlos a todos, En este caso,
el modelo dado por la ecuación (2) se llama modelo de efectos fijos.

5.1 ANOVA
El análisis de varianza es la técnica enfocada en el análisis de datos experimentales. Esta
técnica se centra en dividir la variación total en las partes con las que contribuye cada
fuente de variación en el experimento. Para el caso del DCA se descompone la variabilidad
debida a los tratamientos y al error. Cuando la primera tiene más dominio sobre la segunda,
es cuando se define que los tratamientos tienen efecto (figura 3.1b), o dicho de otra forma,
existe un contrate de las medias. Cuando los tratamientos no tienen efecto contribuyen igual
o menos que el error, por lo que se entiende que las medias son iguales (figura 3.1a).
El objetivo del análisis de varianza en el DCA es evaluar la hipótesis de igualdad de los
tratamientos con respecto a la media de la correspondiente variable de respuesta:

H 0=µ1=µ2=..=µ k =µ (1)

H A =µ i ≠ µ j para algún i≠ j

De manera equivalente se obtiene:


H 0=Ʈ 1=Ʈ 2=..=Ʈ k =0 (1)

H A =Ʈ i ≠ 0 j para algúni

Ʈ i es el efecto del tratamiento i la variable de respuesta. Si H 0 es correcto se afirma que los


efectos sobre la respuesta de k tratamientos son igual a cero y en el caso contrario al menos
hay un efecto diferente a cero.
De la ecuacion (2) se deduce la equivalencia de la hipótesis (3) y (4), pero se detalla fácil
en la figura 1 el cual es una forma de representar el DCA. En la figura se observa Ʈ i=¿
µi−µ, es el efecto del tratamiento, que sería la distancia entre la repuesta del tratamiento (
µi ¿ y la respuesta media global ( µ¿ , cuando esto es igual a cero equivale a µi = µ. Lo
anterior se representa por una línea horizontal, para esto se requiere que todos los efectos
sean iguales a cero.
La equivalencia menciona se prueba mediante la técnica NOVA, la variabilidad se divide
en dos partes, en la de los tratamientos y la otra de los errores aleatorios. Así como se
evidencia a continuación:
La suma total de cuadrado está descompuesta por la suma de cuadrado de tratamiento (
sc TRAT ) y la suma de cuadrados del error ( sc E )
La sc TRAT mide la diferencia de tratamientos, si estos son bastante desiguales entre sí,
sc
entonces la diferencia tendera a ser grande en valor absoluto, en cambio E
mide dentro de tratamientos, si hay mucha variación entre las observaciones pasara lo

mismo que en la sumatoria de cuadrados de tratamientos , de manera simplificada


esta descomposición de la suma total de cuadrados se expresa:

Por último, es importante destacar que el ANOVA supone que la variable de respuesta se
reparte normal, con varianza constante (los tratamientos tienen varianza similar) y que las
mediciones no dependen entre sí. Estos supuestos deben verificarse para estar más seguros
de las conclusiones obtenidas.
Notación de puntos
La notación de puntos se usa para representar forma resumida las cantidades numéricas,
que se calculan a partir de datos experimentales, donde Y mn representa la n-èsima
observación en el tratamiento m, como m=1 , 2 … ., k y n=1 ,2 … , j i. Las cantidades de
interés son las siguientes
Y i∗¿=Suma de lasobservaciones del tratamiento m ¿

Y i∗¿=Media de las observaciones del n−èsimatratameinto ¿

Y ¿∗¿= Sumatotal delas N=n +n +…+n mediciones ¿


1 2 k

Y ¿∗¿= Media global o promediode todaslas observaciones ¿

Ejemplo 1
Comparación de cuatro métodos de ensamble. Consideremos los datos del DCA dados en el
ejemplo 3.1, donde el interés era comparar cuatro métodos de ensamble en cuanto al tiempo
promedio en minutos que requiere cada uno de ellos. Se hicieron cuatro observaciones del
tiempo de ensamble en cada método. Los resultados se muestran en la tabla 3.1. Una
manera de comparar los métodos de ensamble (tratamientos) es probar la hipótesis:
H o :τ A =τ B=τ C =τ D =0

H A :τ i ≠ 0 para algun i= A , B , C , D

En caso de no rechazar H0 se concluye que los tiempos promedio de los cuatro métodos de
ensamble son estadísticamente iguales; pero si se rechaza, se concluye que al menos dos de
ellos son diferentes. En la tabla 3.6 se muestra el análisis de varianza correspondiente, en
donde se aprecia que el valor del valor-p = 0.0018 es menor que a = 0.05, por lo que se
rechaza H0 en este nivel de significancia en par ticular. No obstante, también se rechazaría
para cualquier otro nivel de significancia:
Tabla 1.1 ANOVA para los tipos de cuero
FV SC GL CM F 10 Valor-p

Tipo de 7072.33 3 2357.44 23.24 0.0000


cuero
Error 2029.0 20 101.45
Total 9101.33 23

Tabla 1.2 ANOVA para los métodos de ensamble


FV SC GL CM F0 Valor-p

Tratamientos 69.5 3 23.17 9042 0.0018


Error 29.5 12 2.45
Total 99.0 15

prefijado, a, que cumpla con a > 0.0018, ya que en esos casos el estadístico de prueba F0 =
9.42 caería en la región de rechazo.
Calculos manuales
Los cálculos se facilitan si en primer lugar obtenemos la información básica desplegada ne
la tabla 1.3, con la información presentada en el cuadro se puede calcular la suma de
cuadrados;

1. suma total de cuadrados


4 4 2 2
Y .. 156
S CT =∑ ∑ Y − =1620−
2
ij =99.0
i = j j=1 N 16
2. suma de cuadrados de tratamientos
4 2 2
Y i. Y .. (29 2+34 2 +512+ 422) 1562
S CTRAT =∑ − = − =69.5
I=1 4 N 4 16

3. suma de cuadrados del error


S C E=S C T −S C TRAT =99−69.5=29.5

Tabla 1.3
Métodos de ensamble Operaciones básicas

4 4

∑ ∑ Y 2ij=62 +¿ 72 +…+ 92=1620 ¿


A B C D i=1 j=1

=suma de los cuadrados de todas las


observaciones o datos
Observaciones ≫ 6 7 11 10
8 9 16 12
4 4

7 10 11 11 Y ..=∑ ∑ Y ❑ij =6+¿ 7+ …+9=156 ¿s


i=1 j=1

8 8 13 9 uma de los datos

Total por tratamiento (Y i .) ≫ 29 34 51 42 4


N=∑ ni=16 total de las mediciones
i=1

Numero de datos en cada Y .. 156


Y ..= = =9.75 media global
N 16
Tratamiento (ni ) ≫ 4 4 4 4

Media muestral por t^i=Y i . −Y .. efecto estimado del


método i
Tratamiento (Y i .) ≫ 7.25 8.50 12.75 10.50
Desviación respecto a la
Media global ( t^i)≫ -2.50 -1.25 3.0 0.75

Con esta información se procede a llenar el cuadro 1.2


5.2 Diagramas de caja
Estos diagramas representan descriptivamente comparaciones entre tratamientos, en la
figura que verán más adelante se presenta los diagramas de cajas simultáneos para los
cuatro métodos de ensamble del ejemplo anterior, como podemos observar el método C
parece muy diferente en las medidas a los métodos A y B. también se puede observar un
poco más de variabilidad en el método C que en los demás métodos. Ahora procedemos a
verificar que lo que se observa en el diagrama implica diferencias significativas entre los
tratamientos; por ende, lo recomendable es realizar pruebas estadísticas, ya que los datos
que se analizan en los diagramas de cajas son muestras.

5.3 Graficas de medida

6 Pruebas de rangos múltiples

En el rechazó la hipótesis nula en NOVA, es necesario ir a detalle e identificar los tratamientos


diferentes. A continuación, tres estrategias para ir a ese detalle.
Comparación de parejas de medias de tratamientos

Al no rechazar la hipótesis nula H 0=µ1=µ2=..=µ k =µ, el objetivo del experimento está envuelto
y la conclusión es que no es cierto que µi ≠ µ j . en cambio sí se rechaza H 0, y se acepta la hipótesis
alternativa H A =µ i ≠ µ j para algún i≠ j , es necesario saber cuáles tratamientos resultaron
diferentes, o cuáles lo provocan. Como se ilustro en la gráfica de medias, estos interrogantes se
responden probando la igualdad de todos los posibles pares de medias, para lo que se han propuesto
varios métodos, conocidos como métodos de comparaciones múltiples. La diferencia esencial entre
los métodos radica en la potencia que tienen para detectar las diferencias entre las medias, si esta es
capaz de detectar diferencias más pequeñas es más efectiva.

6.1 (LSD)
Una vez rechazado la hipótesis nula H 0 en el ANOVA, el problema es probar la igualdad de todos
los posibles pares de medias con la hipótesis:
H 0=µi=µ j

H A =µ i ≠ µ j

para toda i diferente j. Para k tratamientos se obtiene un neto de k(k – 1)/2 pares de medias. Por
ejemplo, si k = 5 existen 5 × 4/2 = 10 posibles pares de medias. El estadístico de prueba para cada
una de las hipótesis dadas en (3.11) es la correspondiente diferencia en valor absoluto entre sus
medias muéstrales No se acepta la hipótesis H 0=µi=µ jsi es cierto lo siguiente:
El valor de ta/2, N – k se busca en las tablas de la distribución T de Student con N – k
grados de libertad que corresponden al error, el cuadrado medio del error es CM E y se
obtiene de la tabla de ANOVA, ni y n j son el número de observaciones para los
tratamientos i y j, respectivamente. La cantidad LSD se denomina diferencia mínima
significativa (least significant difference), esta es la diferencia mínima que debe haber
entre dos medias muéstrales para tener en cuenta que los tratamientos correspondientes son
significativamente diferentes. detalle que si el diseño es balanceado, es decir, si
n1 =n2=..=nk =n, la diferencia mínima significativa se reduce a:

Si se acepta la hipótesis alternativa H A =µ i ≠ µ j, la cual nos indica que las medias de los
tratamientos i y j son distintas, entonces se rechaza la hipótesis H 0=µi=µ j . El método
LSD tiene una potencia fundamental, por lo que en ocasiones declara significativas aun
pequeñas diferencias.
Ejemplo:

6.2 Tukey
El método de Tukey, el cual trata en comparar las diferencias entre medias muéstrales con
el valor crítico dado por:
Ta = qa (k, N – k) CM n E i /
donde CME es el cuadrado medio del error, n es el número de observaciones por
tratamiento, k es el número de tratamientos, N – k es igual a los grados de libertad para el
error, a es el nivel de significancia prefijado y el estadístico qa(k, N – k) son puntos
porcentuales de la distribución del rango estudentizado, que se obtienen de la
correspondiente tabla en el apéndice. Se declaran significativamente diferentes los pares de
medias cuya diferencia muestral en valor absoluto sea mayor que Ta. A diferencia de los
métodos LSD y Duncan, el método de Tukey trabaja con un error a muy cercano al
declarado por el experimentador.
Hay varios métodos estándar para realizar comparaciones por pares que den credibilidad a
la tasa del error tipo I. Aquí se analizarán e ilustrarán dos de ellos. El primero, denominado
procedimiento de Tukey, permite la formación de intervalos de confianza del 100(1 – α)%
simultáneos para todas las comparaciones por pares. El método se basa en la distribución
del rango estudentizado. El punto apropiado del percentil es una función de α, k y v =
grados de libertad para s2 . En la tabla A.12 se presenta una lista de puntos porcentuales
superiores adecuados para α = 0.05. El método de Tukey de comparaciones por pares
implica encontrar una diferencia significativa entre las medias i y j (i ≠ j) si |yi. - yj.| excede
a q(α, k, v s n 2 . El procedimiento de Tukey se ilustra con facilidad. Considere un ejemplo
hipotético en el que se tienen 6 tratamientos en un diseño completamente aleatorizado de un
solo factor, en el que se hacen 5 observaciones por tratamiento. Suponga que el cuadrado
medio del error tomado de la tabla del análisis de varianza es s2 = 2.45 (24 grados de
libertad). Las medias muestrales están en orden ascendente,
5.3 Contraste

7 Verificación de los supuestos del modelo


7.1 Normalidad
7.2 Varianza constante
7.3 Independencia

8 Tamaño de muestra

9 Conclusiones

10 Referencia

E., R. (2012). Probabilidad y estadística para ingenería y ciencias . México: Pearson Educación de
México, S.A. de C.V.

Gutiérrez, H. (2008). Análisis y diseño de experimeentos . Mexico D.F:


McGRAW-HILL/INTERAMERICANA EDITORES, S.A. de C.V.

Gutiérrez, P. (2009). Elementos de Diseño de Experimentos. Mexico D.F: Astra Ediciones, S.A. de
C.V.

Sanchez, I. (s.f.). nueva docencia- ing telecomunicaciones . Obtenido de capunfactor :


http://www.est.uc3m.es/esp/nueva_docencia/leganes/ing_telecomunicacion/
metodos_mejora_calidad/MEMC/doc_generica/Temario/CapUnFactor/CapUnFactor.pdf

También podría gustarte