Está en la página 1de 14

Universidad de Sucre

Facultad de Educación y Ciencia


Licenciatura en Física

Experimento con un solo factor

Eliu Ruiz
Humberto Enrique Ozuna Palencia

Asesor: Eduar Carvajal Taborda

VII semestre
Sincelejo - Sucre

8/02/2023

1
8 de febrero de 2023

Índice
1. Introducción 3

2. Experimento de un solo factor 4

3. Diseño completamente azar (DCA) 5


3.1. Anova . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.2. Diagramas de caja . . . . . . . . . . . . . . . . . . . . . . . . 10
3.3. Gráfica de medida . . . . . . . . . . . . . . . . . . . . . . . . . 10

4. Prueba de rangos múltiples 10


4.1. (LSD) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.2. Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4.3. Contraste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

5. Verificación de los supuestos del modelo 12


5.1. Normalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.2. Varianza constante . . . . . . . . . . . . . . . . . . . . . . . . 12
5.3. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

6. Tamaño demuestra 12

7. Conclusión 13

8. Referencias 14

Resumen

Resumen

2
1. Introducción
En contextualización de algunos aspectos del experimento de un solo factor,
tenemos que la definicion clásica del experimento en el ambiento científico
es considerado como la observación o la determinación voluntaria de un
fenómeno en estudio, o variable de repuesta, en determinadas condiciones,
por lo que los fenómenos reales son mucho más complejos de lo que son
capaces de describir los modelos teóricos, basados en ambientes ideales y
perfectos (esto nos ayuda relacionar o asimilar los comportamiento reales
del fenómeno), en consecuencia el objetivo del análisis estadístico será
encontrar la variable de respuesta del experimento y cuáles no. Estas
variables que afectan o no a la variable de respuesta (considerada variable
independiente) se llamaran factores que es la característica que diferencia a
los tratamientos o poblaciones entre sí y además los valores que puede
tomar un factor se les denomina niveles que son diferentes tratamiento o
poblaciones. En la experimentación el principal rasgo es que existen unas
condiciones que el experimentador o analista controla, la primera es que al
observar las modificaciones que se producen en la variable de respuesta al
manipular intencionalmente los valores de los niveles de los factores que
permite establecer una causa-efecto, esta condicion es aplicada por el
experimentador, en cambio para un experimento o estudio experimental es
un estudio observacional, donde el analista solo observa los datos sin influir
en ninguno de ellos, es decir este no tiene control sobre los factores por lo
tanto no es fácil establecer una relación causa-efecto. Existen distintos tipos
de experimentos que se pueden clasificar según el criterio del
experimentador o analista, entre ellos está el experimento para la selección
de factores, para la comparación de tratamientos y los de superficie de
respuesta, pero para este caso se tiene a un diseño unifactorial, de manera
que estaríamos tratando con un experimento para la comparación de
tratamientos que es encontrar la diferencia entre los distintos niveles de uno
o más factores, por ejemplo, entre dos tipos de materiales cual es el que
genera más magnetización, en este experimento los números de valores de
los factores son discreto. Todo lo mencionado anteriormente se va a
relacionar con el cuerpo de la monografía e igualmente ustedes identificaran
esa parte, además se detallará los métodos para obtener la variable de
respuesta en un experimento de un solo factor.

3
2. Experimento de un solo factor
El experimento con un solo factor es considerado el más simple porque solo
necesita comprobar la diferencia entre dos medidas, excluyendo las variables
adicionales o covariables que produzcan algún efecto en el experimento, por
ejemplo, en un experimento se midió el tiempo de una competencia de
carrera de dos jugadores, aunque aún jugador se le dio una bebida
energizante y al otro no, es decir, se le dio un tratamiento y el factor es de
dos niveles para este caso. En el problema de M >2 muestras se estima que
hay M muestra que se originan de M poblaciones. Un proceso muy común
que se prueban medias de la población es nombrado análisis de varianza o
ANOVA que es una técnica o método el cual consiste similarmente a la
teoría de la regresión, por lo que a partir de una suma neta de cuadrados
que parte de dos componentes una que es la regresión y la otra es el error.
El interés del experimentador es comparar los tratamientos en cuantos sus
medidas poblacionales y también comparar respecto a sus varianzas. El
experimento se enfoca en comparar los tratamientos en cuanto medias
poblacionales incluyendo la comparación con respecto a sus varianzas que
es esencial, desde una perspectiva estadística, la hipótesis fundamental a
probar cuando se comparan varios tratamientos. Tratamiento nulo:

H0 = µ1 = µ2 = · · · == µ (1)

Al menos dos de las medidas no son iguales:

HA ≠= µj para algún i ̸= j (2)

Con el tratamiento nulo quiere decir que estos son iguales estadísticamente
en cuanto a su media frente a la alternativa de que al menos dos de los
tratamientos sean diferentes (diferencia de tratamiento) la clave para
resolver estos problemas es obteniendo las muestras ideal o representativa
de mediciones individuales de los tratamientos y armar un estadístico de
pruebas para escoger el resultado de la comparación. Para la expresión del
tratamiento nulo se podría aplicar la técnica de T studen a los posibles
pares de medias, pero esta aumentaría notablemente el error tipo I
(rechazar H0 siendo verdadera) pero con el método mencionado
inicialmente. En análisis de varianza sería capaz de probar la hipótesis de
igualdad de K medidas.

4
3. Diseño completamente azar (DCA)
Como se mencionó en la sección del experimento de solo factor, que es el
más simple de todos los diseños por el hecho de comparar dos o más
tratamientos considerando dos fuentes de variabilidad: tratamiento y error
aleatorio. Se hará de preguntarse de ¿Por qué se llama completamente al
azar o aleatorio? Se llama así de forma que, si se realiza K pruebas, toda
estas corren al azar completamente, de manera que los posibles efectos se
distribuyan equitativamente entre los tratamientos. Ejemplo: Comparación
de cuatro métodos de escritura Comparación de cuatro métodos de
escritura. Un grupo de mejora investiga el efecto de cuatro métodos de
escrituras por lo que cada método lo clasificaron como 1A, 2B, 3C y 4D,
sobre el tiempo de escritura en minutos. En primer momento, la estrategia
experimental es efectuar cuatro veces los cuatro métodos de escritura en
orden completamente aleatorio (las 16 pruebas en orden aleatorio). Si se
usa el diseño completamente aleatorio (DCA), se supone que, además del
método de escritura, no existe ningún otro factor que influya de manera
significativa sobre la variable de respuesta (tiempo de escritura)
mencionado en la introducción del diseño experimental. Supongamos que se
tienen k tratamientos, independientes y con medias desconocida
µ1, µ2, . . . , µk se suponen igualmente la varianzas son desconocidas
σ12 = σ22 = · · · = σk2 = σ 2 . Las poblaciones pueden ser k métodos de
producción, k tratamientos, k grupos, etc., y sus medias se refieren o son
medidas en términos de la variable de respuesta. Para el caso del diseño
completamente aleatorio generan datos para comparar dichas poblaciones,
para esto se puede crear un tabla de Ynm elementos donde m -ésima
observaciones que se hizo en el tratamiento n; Qn es el tamaño o las
cantidades de veces que se observa los tratamientos n. Cuando Qn = Q
para toda n se establece que el diseño está equilibrado. El número de
tratamientos k es determinado por el investigador y depende del problema
particular de que se trata. El número de observaciones por tratamiento (Q)
debe escogerse con base en la variabilidad que se espera observar en los
datos, así como en la diferencia mínima que el experimentador considera
que es importante detectar. Con este tipo de consideraciones, por lo general
se recomiendan entre 5 y 30 mediciones en cada tratamiento. Por ejemplo,
se usa un tamaño de muestra grande cuando hay una dispersión alta de
estas y cuando la dispersión es mínima se utiliza una Q pequeña, con esto
la dispersión de datos se puede inferir el error que se propaga en un
experimento. En caso de que los tratamientos tengan efecto, las
observaciones Ynm se podrán describir con el modelo estadístico lineal dado

5
por:

Ymn = µ + Tm+εmn (3)

-Donde µ es el parámetro de escala común a todos los tratamientos,


llamado media global - donde T es un parámetro que mide el efecto del
tratamiento m y ϵm n , es el error atribuible a la medición Ym n.
El modelo anterior implica que la variabilidad se aplicara a los tratamientos
y al error aleatorio. Ya que µ de la variable de respuesta no es considerada
como una fuente de variabilidad, ya que es una constante común a todos los
tratamientos, esto hace las veces de un punto de referencia para comparar
las respuestas obtenidas de los tratamientos. Si obtenemos la respuesta
media de un tratamiento en particular µi tiene mucha diferencia con
respecto a la media global µ, esto es indicio de que hay un efecto del
tratamiento, ya que Tm = µm − µ. La referencia para deducir que hay un
efecto nos lo brinda el análisis de varianza.
Cuando realizamos una práctica puede ocurrir que los tratamientos que
deseamos comparar sean demasiados como para experimentar con todos,
para esto lo más conveniente es comparar solo una de las muestras de la
población de tratamientos, de tal forma que Tm pasa a se una variable
aleatoria con su propia varianza µ2T , en esta presentación solo se presentara
el caso en que los tratamientos tienen se prueban, ya que suponemos una
población pequeña de tratamientos, lo cual nos permite compararlos a
todos, En este caso, el modelo dado por la ecuación (2) se llama modelo de
efectos fijos.

3.1. Anova
El análisis de varianza es la técnica enfocada en el análisis de datos
experimentales. Esta técnica se centra en dividir la variación total en las
partes con las que contribuye cada fuente de variación en el experimento.
Para el caso del DCA se descompone la variabilidad debida a los
tratamientos y al error. Cuando la primera tiene más dominio sobre la
segunda, es cuando se define que los tratamientos tienen efecto (figura
3.1b), o dicho de otra forma, existe un contrate de las medias. Cuando los
tratamientos no tienen efecto contribuyen igual o menos que el error, por lo
que se entiende que las medias son iguales (figura 3.1a).

6
El objetivo del análisis de varianza en el DCA es evaluar la hipótesis de
igualdad de los tratamientos con respecto a la media de la correspondiente
variable de respuesta:
Ti es el efecto del tratamiento i la variable de respuesta. Si H0 es correcto se
afirma que los efectos sobre la respuesta de k tratamientos son igual a cero
y en el caso contrario al menos hay un efecto diferente a cero. De la
ecuacion (2) se deduce la equivalencia de la hipótesis (3) y (4), pero se
detalla fácil en la figura 1 el cual es una forma de representar el DCA. En la
figura se observa Ti = µi -µ, es el efecto del tratamiento, que sería la
distancia entre la repuesta del tratamiento µi y la respuesta media global µ,
cuando esto es igual a cero equivale a µi = µ. Lo anterior se representa por
una línea horizontal, para esto se requiere que todos los efectos sean iguales
a cero. La equivalencia menciona se prueba mediante la técnica NOVA, la
variabilidad se divide en dos partes, en la de los tratamientos y la otra de
los errores aleatorios. Así como se evidencia a continuación: La suma total
de cuadrado está descompuesta por la suma de cuadrado de tratamiento

7
scT RAT y la suma de cuadrados del error scE

La scT RAT mide la diferencia de tratamientos, si estos son bastante


desiguales entre sí, entonces la diferencia Y⃗i . − Y⃗.. tendera a ser grande en
valor absoluto, en cambio scE mide dentro de tratamientos, si hay mucha
variación entre las observaciones pasara lo mismo que en la sumatoria de
cuadrados de tratamientos Y⃗i j. − Y⃗i . , de manera simplificada esta
descomposición de la suma total de cuadrados se expresa:

CSt = CSt rat + SCE

Por último, es importante destacar que el ANOVA supone que la variable


de respuesta se reparte normal, con varianza constante (los tratamientos
tienen varianza similar) y que las mediciones no dependen entre sí. Estos
supuestos deben verificarse para estar más seguros de las conclusiones
obtenidas. Notación de puntos La notación de puntos se usa para
representar forma resumida las cantidades numéricas, que se calculan a
partir de datos experimentales, donde Ym n representa la n-èsima
observación en el tratamiento m, como m = 1, 2. . . ., kyn = 1, 2. . . , ji .Las
cantidades de interés son las siguientes

Yi ∗ = Sumadelasobservacionesdeltratamientom

Yi ∗ = M ediadelasobservacionesdeln − simatratameinto
Y ∗ ∗ = SumatotaldelasN = n1 + n2 + +nk mediciones
Y ∗ ∗ = M ediaglobalopromediodetodaslasobservaciones
Ejemplo 1 Comparación de cuatro métodos de ensamble. Consideremos los
datos del DCA dados en el ejemplo 3.1, donde el interés era comparar
cuatro métodos de ensamble en cuanto al tiempo promedio en minutos que
requiere cada uno de ellos. Se hicieron cuatro observaciones del tiempo de
ensamble en cada método. Los resultados se muestran en la tabla 3.1. Una
manera de comparar los métodos de ensamble (tratamientos) es probar la
hipótesis:

Ho : TA = TB = TC = TD = 0

8
HA : Ti ̸= 0 para algun i = A, B, C, D
En caso de no rechazar H0 se concluye que los tiempos promedio de los
cuatro métodos de ensamble son estadísticamente iguales; pero si se
rechaza, se concluye que al menos dos de ellos son diferentes. En la tabla
3.6 se muestra el análisis de varianza correspondiente, en donde se aprecia
que el valor del valor-p = 0.0018 es menor que a = 0.05, por lo que se
rechaza H0 en este nivel de significancia en par ticular. No obstante,
también se rechazaría para cualquier otro nivel de significancia:
Tabla 1.1 ANOVA para los tipos de cuero
FV SC GL MC F1 0 Valor-P
Tipo de cuero 7072.33 3 2357.34 23.24 0.0000
Error 2029.0 20 101.45
Total 9101.33 23
Tabla 1.2 ANOVA para los métodos de emsanble
FV SC GL MC F1 0 Valor-P
Tratamientos 69.5 3 23.17 90.42 0.0018
Error 29.5 12 2.45
Total 99.0 15
prefijado, a, que cumpla con a >0.0018, ya que en esos casos el estadístico
de prueba F0 = 9.42 caería en la región de rechazo. Calculos manuales Los
cálculos se facilitan si en primer lugar obtenemos la información básica
desplegada ne la tabla 1.3, con la información presentada en el cuadro se
puede calcular la suma de cuadrados;
1. suma total de cuadrados
Y··2 1562
X  X 
4 4 2
SCT = i=j j = 1 Y ij − = 1620 − = 99,0
N 16
2. suma de cuadrados de tratamientos

Y i2 Y ..2 (292 + 342 + 512 + 422 ) 1562


X  
4
SCtrat = i=1 − = − = 69,5
4 N 4 16
3. suma de cuadrados del error

SCe = SCt − SCtrat = 99 − 69,5 = 29,5

4. cuadrados medios de tratamientos y del error

SCtrat 69,5
CMtrat = = = 23,17
k−1 3

9
y
SCe 29,5
CMe = = = 2,46
N −k 12
5. estadístico de prueba

CM trat 23,17
= = 9,42
CM e 2,46
tabla 1.3

3.2. Diagramas de caja


Estos diagramas representan descriptivamente comparaciones entre
tratamientos, en la figura que verán más adelante se presenta los diagramas
de cajas simultáneos para los cuatro métodos de ensamble del ejemplo
anterior, como podemos observar el método C parece muy diferente en las
medidas a los métodos A y B. también se puede observar un poco más de
variabilidad en el método C que en los demás métodos. Ahora procedemos
a verificar que lo que se observa en el diagrama implica diferencias
significativas entre los tratamientos; por ende, lo recomendable es realizar
pruebas estadísticas, ya que los datos que se analizan en los diagramas de
cajas son muestras.

3.3. Gráfica de medida

4. Prueba de rangos múltiples


En el rechazó la hipótesis nula en NOVA, es necesario ir a detalle e
identificar los tratamientos diferentes. A continuación, tres estrategias para
ir a ese detalle.

4.1. (LSD)
Una vez rechazado la hipótesis nula H0 en el ANOVA, el problema es
probar la igualdad de todos los posibles pares de medias con la hipótesis:

H0 = µi = µj

HA = µi ̸= µ( j)

10
para toda i diferente j. Para k tratamientos se obtiene un neto de k(k –
1)/2 pares de medias. Por ejemplo, si k = 5 existen 5 × 4/2 = 10 posibles
pares de medias. El estadístico de prueba para cada una de las hipótesis
dadas en (3.11) es la correspondiente diferencia en valor absoluto entre sus
medias muéstrales Y⃗i − Y⃗j No se acepta la hipótesis H0 = µi = µj si es
cierto lo siguiente

4.2. Tukey
El método de Tukey, el cual trata en comparar las diferencias entre medias
muéstrales con el valor crítico dado por: T a = qa(k, N ˘k) CM n E i
donde CME es el cuadrado medio del error, n es el número de observaciones
por tratamiento, k es el número de tratamientos, N ˘k es igual a los grados
de libertad para el error, a es el nivel de significancia prefijado y el
estadístico qa(k, N ˘k) son puntos porcentuales de la distribución del rango
estudentizado, que se obtienen de la correspondiente tabla en el apéndice.
Se declaran significativamente diferentes los pares de medias cuya diferencia
muestral en valor absoluto sea mayor que Ta. A diferencia de los métodos
LSD y Duncan, el método de Tukey trabaja con un error a muy cercano al
declarado por el experimentador.
Hay varios métodos estándar para realizar comparaciones por pares que den
credibilidad a la tasa del error tipo I. Aquí se analizarán e ilustrarán dos de
ellos. El primero, denominado procedimiento de Tukey, permite la
formación de intervalos de confianza del 100(1 – α) simultáneos para todas
las comparaciones por pares. El método se basa en la distribución del rango
estudentizado. El punto apropiado del percentil es una función de α, k y v
= grados de libertad para s2 . En la tabla A.12 se presenta una lista de
puntos porcentuales superiores adecuados para α= 0.05. El método de
Tukey de comparaciones por pares implica encontrar una diferencia
significativa entre las medias i y j (i ̸= j) si |yi. - yj.| excede a q(α, k, v s n
2 . El procedimiento de Tukey se ilustra con facilidad. Considere un ejemplo
hipotético en el que se tienen 6 tratamientos en un diseño completamente
aleatorizado de un solo factor, en el que se hacen 5 observaciones por
tratamiento. Suponga que el cuadrado medio del error tomado de la tabla
del análisis de varianza es s2 = 2.45 (24 grados de libertad). Las medias
muestrales están en orden ascendente,

11
4.3. Contraste

5. Verificación de los supuestos del modelo


5.1. Normalidad
5.2. Varianza constante
5.3. Independencia

6. Tamaño demuestra

12
7. Conclusión
Escriba aquí las conclusiones de su investigación.

13
8. Referencias
Referencias
[1] E., R. (2012). Probabilidad y estadística para ingenería y ciencias . Mé-
xico: Pearson Educación de México, S.A. de C.V.

[2] Gutiérrez, H. (2008). Análisis y diseño de experimeentos . Mexico D.F:


McGRAW-HILL/INTERAMERICANA EDITORES, S.A. de C.V.

[3] Gutiérrez, P. (2009). Elementos de Diseño de Experimentos. Mexico D.F:


Astra Ediciones, S.A. de C.V.

[4] Sanchez, I. (s.f.). nueva docencia- ing telecomunicaciones . Obtenido de


capunfactor : http://www.est.uc3m.es/esp/nueva docencia/leganes/ing
telecomunicacion/metodosmejoracalidad/MEMC
/docgenerica/Temario/CapUnFactor/CapUnFactor.pdf

14

También podría gustarte