Está en la página 1de 36

Curso Básico de Diseño de

Experimentos

Máster Universitario en Ingeniería de análisis de


datos, mejora de procesos y toma de decisiones

Departamento de Estadística e Investigación


Operativa Aplicadas y Calidad
Curso Básico de Diseño de
Experimentos
Contenidos
1. Conceptos estadísticos previos
2. Inferencia básica en poblaciones normales
3. ANOVA con un factor controlado
4. Diseño de Experimentos. Planes 2K
5. Planes con factores a más de dos niveles
Departamento de Estadística e Investigación
Operativa Aplicadas y Calidad
2 – Inferencia básica en poblaciones
normales

Ingeniería de análisis de datos, mejora de procesos y toma de decisiones


Contenidos

 Comparación de 2 poblaciones normales


 Preámbulo y consideraciones previas
 Contraste de hipótesis para la comparación de varianzas
 Intervalo de confianza para la comparación de varianzas
 Contraste de hipótesis para la comparación de medias
 Intervalo de confianza para la comparación de medias
 Contraste de hipótesis para la comparación de proporciones
 Intervalo de confianza para la comparación de proporciones

 Análisis de residuos
 Análisis de datos apareados
 Análisis mediante Statgraphics (prácticas)
Contenidos

 Comparación de 2 poblaciones normales


 Preámbulo y consideraciones previas
 Contraste de hipótesis para la comparación de varianzas
 Intervalo de confianza para la comparación de varianzas
 Contraste de hipótesis para la comparación de medias
 Intervalo de confianza para la comparación de medias
 Contraste de hipótesis para la comparación de proporciones
 Intervalo de confianza para la comparación de proporciones

 Análisis de residuos
 Análisis de datos apareados
 Análisis mediante Statgraphics (prácticas)
Objetivos
• Saber realizar un análisis de datos apareados

• Diferenciar entre situaciones de diseños


completamente al azar y diseños en bloques

• Entender el procedimiento clásico del ANOVA y el


ámbito de aplicación considerando un factor
controlado

• Saber aplicar el ANOVA e interpretar los


resultados que proporciona

• Conocer la importancia del análisis de residuos.


Utilizar diferentes técnicas de análisis de
residuos en situaciones prácticas
2 – Inferencia básica en poblaciones
normales

III - Análisis de datos apareados

Ingeniería de análisis de datos, mejora de procesos y toma de decisiones


Ejemplo

En una factoría automovilística, las suciedades


que aparecen en los capós de los automóviles a la
salida de los hornos de secado tras el proceso de
imprimación son un problema importante.

Alguien propone que, para reducir su número, se


levanten los capós a la entrada de los
hornos………
Objeto del estudio
Analizar el efecto de la medida propuesta
comparando las dos poblaciones resultantes:

- CAPÓS LEVANTADOS
- CAPÓS BAJADOS
a partir del análisis de muestras.

La comparación de dos poblaciones constituye el


caso más sencillo que puede plantearse en el
contexto del DISEÑO DE EXPERIMENTOS:

Un sólo factor (la posición del capó), con dos


variantes (bajado o levantado).
Realización del experimento:

Se decide hacer 20 pruebas:


Lunes – Viernes 10 con capó
levantado
2 T.mañana y
10 con capó
2 T.tarde
bajado

¿Qué se va a medir en cada prueba?

El número medio de suciedades en 10


capós consecutivos.
Diseño completamente al azar

Lu Ma Mi Ju Vi
B B B L B
Mañana
L B L B L
L B L B L
Tarde
B L L L B

B : CAPÓ BAJADO
L : CAPÓ LEVANTADO
Fundamento del análisis estadístico

Poblaciones

m1 σ1 m2 σ2
Muestreo: X1 , X2 , … , X10 X1 , X2 , … , X10

Estadísticos calculados
a partir de las muestras:
x1 s1 x2 s2

Preguntas fundamentales
> >
¿ m1 = m2 ? ¿ σ1 = σ2 ?
< <
Intervalo de confianza para m1-m2

I.C  −0.37,1.85

 Lo único que podemos afirmar con bastante


seguridad (95% de confianza) es que la diferencia
m1-m2 está comprendida entre -0.37 y 1.85

 La experiencia es, por lo tanto, poco potente

¿¿......??
Intervalo de confianza para m1-m2
I.C  −0.37,1.85
 La potencia de un experimento está asociada a la
capacidad para determinar con precisión (con un
margen de incertidumbre reducido) la magnitud del
efecto que se está estudiando (m1-m2)

Amplitud del intervalo de confianza

(3.56 − 2.82) ± 2.101⋅ 0.53 = [− 0.37,1.85]

 Falta de potenciaexcesiva variabilidad entre


pruebas, que hace que la comparación entre
tratamientos sea poco precisa
Planteamiento de las pruebas
Se propone realizar unas pruebas en condiciones
muy controladas y fijas, por ejemplo:
• Hacerlas sólo a primera hora de la tarde para
evitar la variabilidad debida a la hora del día

• Sólo en días que haya llovido, para que las


condiciones de contaminación ambiental sean
similares
• En un único modelo de coche, para evitar la
variabilidad entre modelos…..

¿Cuál crees que sería el campo de validez de las


conclusiones que se obtuvieran en un experimento
realizado en condiciones tan restrictivas?
Planteamiento de las pruebas
¿Es posible compatibilizar la triple exigencia de :

 potencia elevada,
 amplio campo de validez,

 número reducido de pruebas ?

Sí, siempre que se disponga “a priori” de suficientes


conocimientos técnicos sobre el proceso estudiado
que permita agrupar las pruebas en parejas
formadas por ensayos realizados en condiciones muy
similares
DISEÑO EN BLOQUES AL AZAR  Datos
apareados
Diseño de datos apareados
Se sabe que la causa fundamental de las
fluctuaciones en el número de suciedades es la
variabilidad en las condiciones de contaminación
ambiental  el hecho de que a determinadas horas
o determinados días haya mayor o menor polución

Las condiciones de contaminación ambiental en


dos pruebas consecutivas realizadas el mismo día y
turno con un intervalo de pocos minutos, serán más
parecidas que entre pruebas correspondientes a días
y turnos diferentes.

Bloque: dos pruebas realizadas en el mismo día


y turno
Diseño de datos apareados
En muchas ocasiones conviene diseñar la recogida
de datos de esta forma  Tiempo, máquina o
materia prima pueden afectar a la variable
respuesta y requerir que se formen bloques con
objeto de analizar los datos dentro de los mismos

Dentro de cada bloque, el orden de recogida de los


datos (la aplicación de los tratamientos) se
aleatoriza  Diseño en bloques al azar
Diseño de datos apareados
Dentro de cada día y turno (bloque) conviene
aleatorizar para protegernos de la posible
influencia de factores no identificados (pero que
también pudieran tener efecto sobre los resultados
obtenidos). Si estos factores existen, al aleatorizar
cabe esperar que su efecto se “difumine” entre los
dos tratamientos y en consecuencia no altere las
conclusiones del análisis

Bloquear neutraliza la influencia de fuentes de


variación conocidas pero no deseadas
Aleatorizar protege del efecto de posibles factores
con cierta influencia pero no identificados
Diseño en bloques al azar
- Organización de las pruebas -

Lu Ma Mi Ju Vi
L B L B B
Mañana
B L B L L
B L L L B
Tarde
L B B B L

B : CAPÓ BAJADO Bloque


L : CAPÓ LEVANTADO
Análisis estadístico
Diseño con Datos Apareados

Las diferencias dentro de los distintos bloques:

di = XB i - XL i
diferencia bajado levantado

¡Fluctúan mucho menos que los valores


individuales!

Se realizan comparaciones mucho más


precisas.

Variable aleatoria: diferencia en suc/capós entre


Bajados y Levantados el mismo día y turno.
Análisis estadístico de datos apareados

md = m1 - m2
md σd

Muestreo
d1 , d2 , … , d10 di = XB i - XL i

PREGUNTA A CONTESTAR: ¿ md = 0 ?

EQUIVALENTE A LA PREGUNTA PREVIA: ¿ m1 = m2 ?


DIFERENCIA EN CADA PAREJA DE PRUEBAS
(BLOQUE):
BLOQUE DÍA TURNO Bajado Levantado Diferencia
1 Mañanas 3.4 2.7 0.7
LUNES
2 Tardes 3.7 3.2 0.5
3 Mañanas 2.9 1.8 1.1
MARTES
4 Tardes 2.5 1.9 0.6
5 Mañanas 1.6 1.1 0.5
MIÉRC.
6 Tardes 2.8 2.2 0.6
7 Mañanas 3.7 2.8 0.9
JUEVES
8 Tardes 5.9 4.8 1.1
9 Mañanas 4.8 4.3 0.5
VIERNES
10 Tardes 4.3 3.4 0.9
d = 0'74
MEDIA 3’56 2’82
MUESTRAL
Sd = 0'24
H0 : md = 0 ( m1 = m2 ) H1 : md ≠ 0 ( m1 ≠ m2 )
d
Si md = 0 ( m1 = m2 ) ∼ tN-1
Sd / N
0.74
EJEMPLO: en nuestro caso = 9.70
0.24/ 10
t9

α / 2 = 0’025 Valor
obtenido
α / 2 = 0’025
9.70

-2.262 0 2.262

como t9 (5%) = 2.262 < 9.70  md ≠ 0  m1 ≠ m2


SE ACEPTA QUE mB > mL (α=0.05)
Intervalo de confianza para md
¿EN CUÁNTO PUEDE CIFRARSE LA MEJORÍA AL
LEVANTAR EL CAPÓ?

IC para md ( m1 - m2 )

Sd 0.24 0.57
d±t (5%)
9 = 0.74 ± 2.262 =
10 10 0.91

( )
0 0’57 0’91
Autoevaluación
1.- ¿Con qué desviación típica se estima ahora el
efecto estudiado m1- m2?

2.- ¿Cuál es la ganancia de precisión obtenida al


trabajar con datos apareados, respecto a la que se
hubiera obtenido en un diseño completamente al
azar?

3.- ¿Cuántas pruebas habría que haber realizado en


un diseño completamente al azar para obtener una
precisión similar a la lograda mediante estas diez
parejas de pruebas apareadas?
Otro ejemplo
 Cierta industria fabricante de lentes para gafas desea comparar
dos tipos de recubrimiento antirreflectante. Los dos tipos de
recubrimiento tienen idéntico aspecto y prestaciones, pero
antes de decidirse por uno ú otro desean comprobar si
realmente el tipo de recubrimiento influye en el deterioro
que sufre la lente.

Inicialmente en el estudio se pensó en seleccionar al azar 20


personas que utilizaran gafas, y asignar aleatoriamente gafas
sometidas al tratamiento A a 10 de estas personas y, gafas con
el tratamiento B a las 10 restantes. Al cabo de 6 meses se
realizaría un control y, tras tomar mediciones con el
instrumento adecuado, se analizaría si existían o no
diferencias estadísticamente significativas.
Otro ejemplo
El método planteado tiene cierto inconveniente
 !!!
En el desgaste que sufre una lente (presuntamente)
no influye únicamente el recubrimiento superficial,
sino también el trato (el uso) que recibe por parte
del usuario algunas personas, por sus hábitos
o profesión pueden deteriorar las lentes más de lo
normal (o menos)

Realizando el análisis como inicialmente se había


planteado, se corre el riesgo de atribuir a alguno de
los dos tratamientos un efecto que no le
corresponde en realidad (en verdad originado por el
usuario)
Otro ejemplo
¿Es posible eliminar el efecto de las personas
(usuarios) en el desgaste de las lentes?

Construir las gafas con una lente de cada tipo de


recubrimiento. Así si alguien las desgasta mucho, lo
hará en las dos lentes por igual y por tanto con ambos
tratamientos (lo mismo ocurrirá si las desgasta poco)

El método de análisis deberá tener en cuenta la


forma en la que se han recogido los datos:
Análisis de datos apareados
Otro ejemplo
 Supongamos que el estudio se realizó finalmente de esta
forma, con 10 individuos, y que al cabo de 6 meses se midió
el desgaste, obteniéndose los valores que se indican en la
tabla adjunta:

Individuo Desgaste Desgaste Resultados del estudio realizado


Lente - TA Lente - TB para comparar el desgaste en dos
tipos de lentes. La letra entre ()
1 6.7(I) 6.9(D) indica la posición (izquierda o
2 5.0(I) 5.8(D) derecha) a que se ha asignado
aleatoriamente cada lente
3 3.6(D) 4.1(I)
4 6.2(I) 7.0(D)
5 5.9(D) 7.0(I)
6 4.0(D) 4.6(I)
7 5.2(D) 5.5(I)
8 4.5(I) 5.0(D)
9 4.4(D) 4.3(I)
10 4.1(I) 4.8(D)
Análisis propuesto ejemplo:
 Realizar el análisis estadístico de los datos
indicando si existen diferencias significativas entre
los dos tipos de recubrimiento antirreflectante
utilizados en el estudio (α=0.05) . Establecer un
intervalo de confianza para la diferencia entre los
desgastes medios.
Análisis propuesto ejemplo:
Utilizando Statgraphics Centurion……..
Análisis propuesto ejemplo:
Ejercicio propuesto
 Se desea comparar dos algoritmos de inversión
de grandes matrices para ver cuál resulta en
promedio más rápido. El tiempo de resolución
depende de las características de cada matriz
(tamaño, número de ceros, posición de los
mismos….) por lo que fluctúa de un caso a otro. Se
invirtieron 12 matrices, cuyos valores se
generaron aleatoriamente mediante los dos
algoritmos, constatándose los siguientes tiempos
de resolución en segundos
Ejercicio propuesto
ALGORITMO 1 ALGORITMO 2
Matriz 1 2.3 2.1
Matriz 2 4.1 4.7
Matriz 3 5.6 5.8
Matriz 4 3.9 4.7
Matriz 5 1.2 1.7
Matriz 6 3.8 3.8
Matriz 7 6.9 7.7
Matriz 8 4.4 4.9
Matriz 9 2.4 3.1
Matriz 10 3.1 2.8
Matriz 11 8.6 9.2
Matriz 12 2.1 2.4
Ejercicio propuesto
Justificar cómo se abordaría el análisis a partir del
diseño planteado.

Estudiar si es razonable suponer que la diferencia


de tiempos de resolución entre ambos algoritmos
varía normalmente de unas matrices otras.

Estudiar si existen diferencias significativas entre


las velocidades promedias de ambos algoritmos
aplicando el test correspondiente y estableciendo un
intervalo de confianza para la diferencia entre los
tiempos promedios.

También podría gustarte