Está en la página 1de 33

comparación de

dos tratamientos
Comparación de Dos
Tratamientos
PROPOSITO:
Presentar la metodología del Diseño de Experimentos para
una “X” en dos niveles.

OBJETIVOS:
1. Comprender los objetivos de un experimento --probar que las
potenciales Pocas “X” Vitales realmente son las Pocas Vitales.

2. Comprender los fundamentos de la recolección de datos en


experimentos para ayudar a controlar la variación.

3. Interpretar los resultados de experimentos de dos tratamientos.

4. Proporcionar ejemplos de experimentos de dos tratamientos --


algunos que vamos a realizar en clase.
Diseño de Experimentos - ¿Por qué usarlos?
Los Diseños de Experimentos se utilizan para :
Determinar cuales variables independientes (las X) tienen el
mayor impacto en la respuesta (Y).
Cuantificar los efectos de las variables independientes (las X)
sobre la respuesta (Y).

Probar que las variables independientes (las X) que piensas son


importantes realmente sí afectan el proceso.
Los resultados de los experimentos pueden usarse para:
1. Desplazar el promedio de un proceso.
proceso Por ejemplo, usar una temperatura
más elevada para un tratamiento térmico puede aumentar la dureza y desplazarla
hacia el centro de las especificaciones.
2. Reducir la variación. Por ejemplo, un programa de capacitación de dos
semanas para todos los telefonistas podría ser más efectivo que un programa de
una semana, lo cual podría reducir la variación en el tiempo de toma de llamadas
de un centro receptor de llamadas a otro.
3. Desplazar el promedio de un proceso y reducir la variación.
Por ejemplo, establecer un nivel más bajo en la concentración de la solución
limpiadora nos conduciría a una mejor y más consistente limpieza de partes en
un sistema de limpieza.
El papel que juega la estadística
El campo de la estadística trata con la variación en las siguientes formas:

Estadística Descriptiva -- describe un conjunto de datos con


gráficas y unos cuantos números que resumen una gran cantidad de
información (media, varianza, desviación estándar).

Estadística Inferencial -- determina cuando las diferencias en los


resultados pueden deberse a variación aleatoria y cuando las diferencias
en los resultados no pueden atribuirse a la variación aleatoria. (Intervalos
de Confianza y pruebas de hipótesis).

Diseño de Experimentos(DDE) -- recopila y analiza los datos para:


1.Desplazar el promedio de la distribución de los resultados.

2.Reducir la variación en los resultados.

3.Proporcionar resultados que se apliquen a un amplio rango de condiciones


para generar un proceso más robusto.
4.Demostrar que las potenciales Pocas “X” Vitales influyen o no en la
respuesta “Y”.
Diseño Experimental contra
Observación Pasiva
La Observación Pasiva se refiere a
observar un proceso, evitando hacer
cambios intencionales (es decir, sin
“manipular” el proceso durante la
recolección de los datos de línea base).

El Diseño Experimental se refiere a la


manipulación activa de las variables
independientes y la observación de los
efectos sobre las variables dependientes
(respuestas).

Mediante el Diseño Experimental, se puede demostrar la capacidad


para manipular o controlar las variables dependientes (“Y”) al hacer
cambios en las variables independientes (las “X”).
La Experimentación Dirigida
La experimentación dirigida es un método de aprendizaje a través de la
combinación de un evento crítico y un observador informado.
EJEMPLO: Originalmente el champán se produjo de manera natural. Es
probable que mucha gente observó esto sin notar nada en especial. Pero
finalmente un observador crítico notó lo que prometía el champán.
Los cambios tecnológicos actualmente están ocurriendo mucho más
rápido que en el pasado. Esto se debe en gran parte a los incrementos en
la probabilidad de aprender mediante métodos científicos.
Podemos mejorar este proceso de aprendizaje al:
• Asegurarnos de que los eventos informativos que ocurren de manera
natural atraigan la atención de observadores perceptivos.
• Inducir la ocurrencia de eventos informativos a través de la
experimentación dirigida.
Si tu cambias las cosas, tal vez ocurra algo emocionante.....

La Experimentación Dirigida aumenta la


Probabilidad de Eventos Informativos.

(Adaptado de una charla de George Box durante el curso: ”An Explanation of Taguchi’s
Contributions to Quality Improvement,”[Una explicación de las contribuciones de Taguchi a
la Mejora de Calidad] Universidad de Wisconsin, abril 27al 30, 1987.)
La Experimentación Dirigida (cont.)

Y
X3
X2 Variables dependientes;
X1
X
Respuestas Y1,Y2,..., Ym

Variables de proceso;
Variables independientes;
Variables de diseño X1, X2,..., Xk
Asumimos que tenemos un control directo de las variables de proceso (X1, X2, . . . , Xk).
Estas pueden ser las temperaturas y las presiones en el proceso, o la empresa de
transporte que utilizamos para enviar el producto y el turno en el cual el camión fue
cargado. Quisiéramos encontrar condiciones que mejoren las respuestas (Y1, Y2, . . . ,
Ym).

El Objetivo de un Experimento es Estimar los Efectos de


las Variables Independientes sobre las Respuestas.
La Naturaleza Adaptable de la Investigación
Datos ----------------------------------------------------------------------------------------

In
n


In

du
cc
du
cc

c
du
c

ció
du

ció

De
De

n
n
Idea ------------------------------------------------------------------------------------------

1
3

* Una solución

La ciencia generalmente es un proceso reiterativo; posiblemente una


serie de experimentos conduzcan a una solución.
Podría iniciar en diferentes lugares y aún así eventualmente llegar a una
solución.

Podría haber más de una ruta hacia la solución;


podría requerir múltiples experimentos para encontrarla.
¡¡Precaución!!
La Correlación No Implica Causalidad
Observe la gráfica de abajo a cerca de la población y las cigüeñas.
(Datos Verídicos de Oldenberg, Alemania, 1930-1936 publicados en Box,
Hunter, Hunter, Statistics for Experimenters [Estadísticas para Experimentadores], pág. 8.)
Población (Miles)
80

70

60 r = 0.901
50
¡Eliminar a las
40 cigüeñas no sería un
buen método de
30 control de natalidad!
120 150 180 210 240 270

Número de Cigüeñas
Podemos identificar una relación observando un proceso; dos variables pueden
tener tendencia a aumentar o disminuir juntas. Sin embargo, esto no significa
necesariamente que podemos ajustar una variable a través de la manipulación de la
otra variable.
Aunque “X” y “Y” están Correlacionadas, ¡Es posible que No podamos controlar
la “Y” con esa “X”! (CORRELACION  CAUSALIDAD)
Ejemplo: La Lavadora de Eje Horizontal
Objetivo: Estimar el efecto del tiempo de lavado en la capacidad para remover la grasa.

La variable dependiente (Y) es el cambio en la “brillantez” - una medición del brillo de la ropa.
La variable independiente (X) es el tiempo de lavado.
Un “tratamiento” es un nivel de una variable X. Los tratamientos en este ejemplo son los tiempos de
lavado de 20 y de 10 minutos.
El cambio en la brillantez para 16 cargas de ropa está registrado abajo:
Cambio en
Lavado de 20 Lavado de 10 Lavado de 20 minutos:
minutos la minutos
Brillantez 17.4, 17.7, 23.2, 20.4,
x 24 15.0, 24.0, 15.6, 15.2
x 23
22
21 Lavado de 10 minutos:
x 20 x 20.4, 19.3, 17.6, 16.3,
19 x
x 18 x
9.7, 16.4, 14.8, 12.3
x 17
x 16 xx
xx 15 x
14
13
12 x
11
10 x

18.5 Promedio 15.8


6 5
Desviación estándar
3.57 3.54
Usar Minitab para Comparar Dos
Tratamientos Gráficamente
File > Open > c:\mtb11\training\phase2\reflect.mtw Si tiene los datos en
C1 C2 C3 C4 columnas separadas
Veinte Diez Brillo Tiempo (como en C1 y C2),
17.4 20.4 17.4 20 debería apilar los
17.7 19.3 17.7 20 datos en la columna
23.2 17.6 23.2 20
C3. En la columna C4,
20.4 16.3 20.4 20
15.0 9.7 15.0 20
se empleó Calc>Make
24.0 16.4 24.0 20 Patterned Data para
15.6 14.8 15.6 20 generar (8) de 20 min
15.2 12.3 15.2 20 y (8) de 10 min. El
20.4 10 análisis en Minitab es
19.3 10 más fácil con datos
17.6 10 apilados (‘Stacked’).
Brillantez para
16.3 10
lavado de 20
Brillantez para 9.7 10
minutos. Los datos en las
lavado de 10 minutos. 16.4 10
columnas C3 y C4 se
14.8 10
12.3 10 usarán para generar
todas las gráficas y
Datos Apilados. respuestas numéricas.
Usar Minitab para Comparar Dos
Tratamientos Gráficamente (cont.)
Graph>Boxplot
Variables de la Gráfica: Y = Reflect (Brillo)
X = Time (Tiempo)
Llenar la caja de diálogo como se muestra abajo:
Boxplot of 10 min, 20 min

24

22

20

18
Data

16

14

12

10

10 min 20 min

• ¡Parece haber una posible diferencia en la brillantez entre el


lavado de 10 minutos y el de 20!
• Los dos grupos de datos se ven muy similares, pero los valores
promedio son ligeramente diferentes. ¿Esta diferencia se debe al
azar, o efectivamente el lavado de 20 minutos realza el brillo de la
ropa de manera significativa?
• Recuerde que podemos restar los promedios y obtener una
“estimación puntual” de la diferencia, pero también quisiéramos
tener una idea de qué variación esperar para esta estimación
puntual (un “intervalo de confianza”).
Usar Minitab para Comparar Dos
Tratamientos Matemáticamente
Para generar las estadísticas y un Intervalo de Confianza, usar la Prueba t 2 Muestras:
Stat>Basic Stat>2-sample t Podemos obtener una estimación
Llenar la caja de diálogo como se muestra puntual y un intervalo de confianza
abajo. Después hacer click en ‘OK’. de la diferencia promedio entre
cualquiera de dos conjuntos de
datos utilizando una prueba t.

Si existe una diferencia estadística entre las medias de los dos


tratamientos, el intervalo de confianza no incluirá el valor ‘0’.
Usar Minitab para Comparar Dos
Tratamientos Matemáticamente (cont.)
Salida de la Ventana Session:
Two-sample T for 10 min vs 20 min

N Mean StDev SE Mean


10 min 8 18.56 3.57 1.3
‘0’ cae dentro del intervalo;
20 min 8 15.85 3.54 1.3 por lo tanto, no podemos
decir que existe una
Difference = μ (10 min) - μ (20 min)
diferencia estadística.
Estimate for difference: 2.71
95% CI for difference: (-1.10, 6.53)
T-Test of difference = 0 (vs ≠): T-Value = 1.53 P-Value = 0.149 DF = 14
Both use Pooled StDev = 3.5559
p>0.05; otra forma de determinar
Ho: las medias en los tiempos de
que no se puede afirmar una
lavado de 20 y de 10 minutos son las
diferencia estadística.
mismas.
Ha: las medias son diferentes.
NOTA: El intervalo de confianza es un Rango de Posibles Valores
para la diferencia entre los promedios.

Un extremo del Intervalo de Confianza es Negativo y el otro es


Positivo, así que el ‘0’ está incluido en el Intervalo.
No puede afirmarse una diferencia (también p>0.05).
Ejercicio - Tiempo de Vuelo de un Helicóptero
Objetivo Estimar el efecto de lo ancho del ala sobre el Use las
tiempo de vuelo de un helicóptero de papel. instrucciones
en la página
¿Cuál es la variable dependiente (Y)? siguiente
¿Cuál es la variable independiente (X)?
Un “tratamiento” es un nivel de una variable X.
¿Cuántos tratamientos existen en este experimento?

Tiempo
de vuelo
Ala angosta (segs) Ala ancha

promedio
Desviación estándar
1.5”

configuración del
Clip metálico
helicóptero: para papel
3.5”

8.5”
1.5”

vista
tridimensional:
3.5”

4.5”

El “helicóptero” es un rehilete de
papel, la característica a medir es
el tiempo para descender de una
altura de 8 pies, mayor tiempo es
mejor.
Ejercicio en Clase : Usar Minitab para
Analizar el Tiempo de Vuelo del Helicóptero
Usar los resultados de tu experimento del helicóptero para
determinar si la longitud del ala cambia el tiempo de
vuelo.

1. Escribir
Ho -----------------------------------------------------------------------------
y
Ha -----------------------------------------------------------------------------
2. Ubicar los datos de respuesta en una columna y los tratamientos
(niveles “X”) en una segunda columna.

3. Usar la estadística descriptiva con gráficas para comparar los dos


tratamientos.

4. Efectuar Stat>Basic Stat>2-Sample t sobre tus datos.

¿¿CUALES SON TUS CONCLUSIONES??


Conceptos Clave
Comparación de Dos Tratamientos
1. El objetivo de un experimento es estimar los efectos de las variables independientes
(las X) sobre la respuesta (Y).

2. Dos tipos de variación ocurren cuando se recolectan datos:variación sistemática


(esperada y predecible) y variación aleatoria (NO predecible).

3. Las estadísticas tratan con la variación mediante la estadística descriptiva,


estadística inferencial y diseño de experimentos.

4. Para encontrar una solución se puede requerir de experimentos múltiples.

5. La correlación no implica causalidad.

6. Un “tratamiento” es un nivel de una variable independiente (X).

7. En un experimento que compara dos tratamientos, estás probando para ver si hay
una diferencia entre los promedios de cada tratamiento.

8. El intervalo de confianza proporciona el rango de valores posibles para la verdadera


diferencia entre promedios poblacionales. Si el intervalo de confianza incluye al “0”, no
puedes decir que existe una diferencia estadística.
Apéndice
Usar Minitab para
calcular la t-crítica
La t-crítica generalmente se puede localizar en una tabla. A la salida
del comando de la prueba t 2 muestras, el estadístico t dado es el valor
calculado, no el valor crítico (de tabla).

ASI QUE........¿Cómo se obtiene la t-crítica en MINITAB?


¡Usando la función inversa de probabilidad acumulada!
Calc>Probability Distribution>T

(#grupos)* (#de obs en cada


grupo -1) = (2) * (8-1)
(SI: varianza igual y
diseño balanceado)

Area bajo la curva, 1- 


(da un número positivo)

Función Inversa de Distribución


Acumulada
Distribución t de Student con 14 gl. El mismo valor t que
P( X <= x) x en la pág. 16.
0.9750 2.1448
El Efecto del Tamaño Muestral sobre la
Distribución de un Promedio
Promedio Promedio de Supongamos que probamos la
Diario 1 por día 4 por día brillantez en el lavado de 20 minutos
24 x
23 xx
durante 30 días consecutivos, y el
22 xx proceso de lavado es estable durante
21 xxx xx todo este tiempo. Supongamos que
20 xxxxxx
19
xx esto cae dentro de una distribución
xxxxxx xxxxx
18 xxxxx xxxxxxxx normal con un promedio de 19 y una
17 x xxxxxx desviación estándar de 3.6.
16 xxxx xxx
15 xx
14 Podríamos medir una muestra por día,
13 ó 4 muestras por día, y registrar el
xx
promedio.
promedio: 18.6 18.4 Lo siguiente es una simulación de los
desviació resultados de tomar mediciones de 1 ó
estándar:
n 2.84 1.45
4 muestras por día.
La desviación estándar para el promedio de las 4 muestras por día se calcula usando:

El Error Estándar de la Media: _x _x
n
La desviación estándar (variación) es más pequeña cuando se emplea un promedio de 4
mediciones por día. En realidad, es más pequeña por un factor aprox. de sqrt(4) = 2.
Conclusiones: Los promedios son menos variables que los datos individuales. Si la variabilidad
es más pequeña, entonces existe una mayor capacidad para detectar las diferencias.

También podría gustarte