Está en la página 1de 32

Ingeniería

Civil
Industrial

Estadística para
Ingeniería

Arica, 26 de junio de 2019


U7
nidad

ingeniería
civil
industrial
ingeniería
7 civil
industrial
Arica, 26 de junio de 2019

Diseños 2k.

3
ingeniería
7 civil
industrial

i. diseños 2k

2019
4
Antes de experimentar se debe tener
conocimiento teórico del proceso para
estimar el rango de factores de interés

El conocimiento teórico previo, entrega una descripción


aproximada de la región – rango de variación de los factores
de interés – y hacer más eficiente el uso de los recursos.
La estrategia a emplear es poder encontrar las mejores
formas de proceder – ahorrando recursos – y ganar mucho
conocimiento con poco esfuerzo.
Para lograr esta estrategia es necesario ubicar en forma
eficiente los rangos de variación de los factores de interés,
para ello es preciso suponer el comportamiento de la función
respuesta. Suponiendo que tiene características de continua y
suave.
Si se quiere planificar un experimento
fijando un factor y haciendo variar el
otro, no es eficiente ni tampoco óptimo

Si se cree que para un proceso a optimizar afectan dos


factores, una planificación aparente sería “fijar un factor” e ir
probando diferentes niveles del otro, hasta encontrar aquella
combinación donde se optimiza el proceso. Posterior, se fija
el otro factor en su “mejor” nivel y se prueba con el primer
factor cambiando sus niveles, hasta hallar otro óptimo.
cantidad Tº=225ºC cantidad t=130 min.

Óptimo: 87 gr. Óptimo: 95 gr.


Tiempo: 130 m. Temperatura: 240ºC

tiempo temperatura
El procedimiento correcto es
experimentar con todas las
combinaciones de factores y niveles.
Si se grafican las curvas 60
de nivel de tiempo y 70
temperatura, se observa que 80
el proceso no alcanza su 90
óptimo. Por lo tanto, este 100
procedimiento no es
adecuado. Lo correcto era
hacer la combinación de
240 ºC
todas las variables y niveles,
para identificar la dirección
de las pendientes y alcanzar
las cimas o valles de la
superficies en sucesivos
experimentos. 130 min.
Ventajas - Desventajas

Ventajas
◦ Permite acercarse al óptimo y estimar interacciones.
◦ Proporciona estimaciones de los efectos de los factores con
una varianza reducida.
◦ Es relativamente simple de construir y analizar.

Desventajas
◦ Requiere un gran número de experimentos. Para sopesar
aquello, se puede usar dos caminos:
• Utilizar dos niveles por cada factor – Diseño 2k
• Utilizar diseños factoriales fraccionados – Diseño 2k-p
El efecto de interacción se da en ciertos
casos que no pueden ser explicados por
los efectos principales de los factores
Cierta cantidad de alcohol en el organismo produce
euforia y alegría, por otro lado, un medicamento antigripal
produce alivio; pero ¿Qué ocurre cuando ingerimos las dos
cosas?
El efecto final NO es aditivo.
 Intuición: Sensación de euforia y bienestar.
 Experiencia: Sensación de somnolencia y mareo.

Para un proceso industrial, si se trabaja un día a 220º C y se


Ejemplo

aumenta el tiempo de 90 a 150 min. la producción aumenta de 68


a 78 g. Si al día siguiente se sube la temperatura a 230º C y se
vuelve a aumentar el tiempo de 90 a 150 min. la producción se
mantuvo inalterable en 85 g., esto lo explica la Interacción.
El diseño factorial 2k es un método
eficiente, porque permite buscar puntos
óptimos con muy pocas observaciones.
Para un experimento que queremos medir la
Ejemplo

cantidad precipitada en un período de tiempo (),


cuyos factores son la temperatura (T), la
concentración (C) y el catalizador (K).
 = f (T, C, K)
Niveles: T: 160ºC – Mínima  Codificado (–1)
180ºC – Máxima  Codificado (+1)
C: 20% – Mínima  Codificado (–1)
40% – Máxima  Codificado (+1)
K: A – Mínima  Codificado (–1)
B – Máxima  Codificado (+1)
k = 3 factores  8 tratamientos
 7 fuentes de variabilidad
Lo primero de un diseño 2k, es entender
el orden de su estructura para poder
obtener los efectos y las SS de la ANOVA.
Se utiliza la codificación (–) y ( + ), para denotar los
dos niveles, también pudo haber sido (0) y (1), se tiene:
Ejemplo

T C K 1 2
– – – 60 62
+ – – 72 70
– + – 54 56
+ + – 68 67
– – + 52 51
+ – + 83 80
– + + 45 46
+ + + 80 82
La representación geométrica del diseño
2k, permite ver las respuestas con
relación a sus factores.
Considerando la primera corrida, se tiene:
Las columnas codificadas de todas las
interacciones se calcula al multiplicar los
códigos de los factores iniciales entre sí.
Primero, se debe calcular las columnas codificadas de
las interacciones:
Ejemplo

T C K TC TK CK TCK
– – – + + + –
+ – – – – + +
– + – – + – +
+ + – + – – –
– – + + – – –
+ – + – + – +
– + + – – + +
+ + + + + + –
Las columnas codificadas de cada factor
e interacción (–) y (+) permiten obtener
los contrastes para calcular los efectos.

Para determinar los efectos, primero hay que obtener


los contrastes, por cada factor e interacción. Un contraste es
una combinación de los tratamientos de acuerdo a su
codificación.
El contraste: es la multiplicación entre la respectiva
columna codificada del factor o interacción por la columna
de respuesta (𝜂1 ) o la columna resultante de la suma de
respuestas en caso de varias corridas ( 𝜂𝑖 )
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 = 𝑐𝑜𝑙𝑢𝑚. 𝑐𝑜𝑑. × 𝑐𝑜𝑙𝑢𝑚. 𝑟𝑒𝑠𝑝.
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 = 𝑐𝑜𝑙𝑢𝑚. 𝑐𝑜𝑑. × 𝑐𝑜𝑙𝑢𝑚. 𝑠𝑢𝑚𝑎 𝑟𝑒𝑠𝑝.
Los efectos de calculan de los contrastes y
hay que prestar atención a su magnitud y
sentido (signo)

Para determinar los efectos, sean estos principales o de


interacción (secundarios y terciarios) depende del contraste
obtenido y la cantidad de factores y corridas realizadas:
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒
ℰ𝒻𝑒𝑐𝑡𝑜 = 𝑘−1
2 ×𝑛
Así es posible obtener la suma de cuadrados de cada
tratamiento de la ANOVA, considerando su condición de
contraste ortogonal con un solo grado de libertad:
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 2
𝑆𝑆ℰ𝒻𝑒𝑐𝑡𝑜 =
2𝑘 × 𝑛
Las Suma de Cuadrados de los efectos
(SSefectos), permite ver la contribución
porcentual o carga de cada tratamiento.
Ejemplo

Para el caso anterior, obteniendo las columnas codificadas por


cada efecto y la columna resultante de la suma de los
resultados:
Las Suma de Cuadrados de los efectos
(SSefectos), permite ver la contribución
porcentual o carga de cada tratamiento.
Ejemplo

Calculando los contrastes de cada efecto principal y de


interacción junto con la Suma de Cuadrados de cada Factor, se
tiene:

𝑎 𝑏 𝑛
2 𝑦…2
𝑆𝑆𝑇𝑜𝑡𝑎𝑙 = 𝑦𝑖𝑗𝑘 − 𝑘
2 𝑛
𝑖=1 𝑗=1 𝑘=1
𝑆𝑆𝐸𝑟𝑟𝑜𝑟 = 𝑝𝑜𝑟 𝑠𝑢𝑠𝑡𝑟𝑎𝑐𝑐𝑖ó𝑛

𝑆𝑆𝑀𝑜𝑑𝑒𝑙𝑜 = 𝑆𝑆𝑖
𝑡𝑜𝑑𝑎𝑠 𝑆𝑆𝐹𝑎𝑐𝑡𝑜𝑟

Se puede apreciar que los factores T, C y TK tienen las mayores


cargas o contribuciones a la variabilidad de la respuesta.
Las Suma de Cuadrados de los efectos
(SSefectos), permite ver la contribución
porcentual o carga de cada tratamiento.
Ejemplo

Calculando el ANOVA, se determina los factores que son


significativos en la variabilidad de la respuesta:
Las Suma de Cuadrados de los efectos
(SSefectos), permite ver la contribución
porcentual o carga de cada tratamiento.
Ejemplo

Como conclusiones se tiene que:


1. El efecto principal de la Temperatura es significativa al 1% y
aumenta la respuesta en promedio 22 gr. cuando este
factor pasa de 160 a 180° C en promedio en toda la región
experimental.
2. El efecto principal de la Concentración es significativa al 1%
y disminuye la respuesta en promedio 4 gr. cuando el factor
pasa de 20 a 40% en promedio en toda la región
experimental.
3. El efecto interacción TK es significativo al 1% y aumenta la
respuesta en promedio 11 gr. cuando la interacción pasa de
(–) a (+) en promedio en toda la región experimental.
4. .
Con los efectos calculados de aquellos
factores significativos se puede obtener
un modelo de predicción de la respuesta.

De este modo el modelo general de regresión para


predecir respuestas, tendría la siguiente forma:
𝑙 𝑙

𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑙 𝑥𝑙 + ⋯ + 𝛽𝑖𝑗 𝑥𝑖 𝑥𝑗 + ⋯ + 𝛽𝑖𝑗𝑘 𝑥𝑖 𝑥𝑗 𝑥𝑘 + ⋯
𝑖𝑗 𝑖𝑗𝑘

Donde los 𝑥𝑖 son variables codificadas (de –1 a +1) y los


𝛽𝑖 son los coeficientes de regresión. 𝛽0 en el promedio global
y los 𝛽𝑖 restantes son la mitad de las estimaciones de los
efectos de los factores correspondientes, es la mitad porque
la estimación se basa en un cambio unitario de 𝑥𝑖 sobre la
media de 𝑦, ya que la estimación del efecto se basa en un
cambio de dos unidades (de –1 a +1)
Los coeficientes son la mitad de los
estimadores de los efectos de los
factores correspondientes.
Para el caso anterior, el modelo está dado por:
Ejemplo

22 −4 11
𝑦 = 64,25 + 𝑥1 + 𝑥2 + 𝑥1 𝑥3
2 2 2
Las variables codificadas 𝑥𝑖 de la 𝑇, 𝐶 y 𝑇𝐾 están dadas por:
𝑇 − (180° + 160°) 2 𝑇 − 170
𝑥1 = =
(180° − 160°) 2 10
𝐶 − (40% + 20%) 2 𝐶 − 30%
𝑥2 = =
(40% − 20%) 2 10%
𝐴 = −1
𝑥3 =
𝐵 = +1
2
El coeficiente de determinación 𝑅 del
modelo determina que parte de la
variabilidad total de 𝑦 explica el modelo.

La 𝑆𝑆𝑀𝑜𝑑𝑒𝑙𝑜 está dada por la suma de todas las 𝑆𝑆:


𝑆𝑆𝑀𝑜𝑑𝑒𝑙𝑜 = 𝑆𝑆𝐴 + 𝑆𝑆𝐵 + 𝑆𝑆𝐶 + 𝑆𝑆𝐴𝐵 + 𝑆𝑆𝐴𝐶 + 𝑆𝑆𝐵𝐶 + 𝑆𝑆𝐴𝐵𝐶

El coeficiente de determinación 𝑅2 mide la proporción


de la variabilidad total explicada por el modelo, es igual a:
2
𝑆𝑆𝑀𝑜𝑑𝑒𝑙𝑜
𝑅 =
𝑆𝑆𝑇𝑜𝑡𝑎𝑙
2
Pero para mayor precisión se usa 𝑅𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 dado por:
2 𝑆𝑆𝐸 𝑑𝑓𝐸
𝑅𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 = 1 −
𝑆𝑆𝑇𝑜𝑡𝑎𝑙 𝑑𝑓𝑇𝑜𝑡𝑎𝑙
2
como 𝑅 aumenta a medida que se
2
agreguen factores, se utiliza el 𝑅𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜
independe de la cantidad de factores.
Para el ejercicio anterior se tiene que el coeficiente de
Ejemplo

determinación está dado por:


𝑆𝑆𝑀𝑜𝑑𝑒𝑙𝑜 2.489
𝑅2 = = = 0,9944
𝑆𝑆𝑇𝑜𝑡𝑎𝑙 2.503
La 99,44% de la variabilidad de la respuesta es explicada por el
modelo.
Pero utilizando el coeficiente de determinación ajustado,
independiente de la cantidad de factores, está dado por:
2 𝑆𝑆𝐸 𝑑𝑓𝐸 14 8
𝑅𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 =1− =1− = 0,9895
𝑆𝑆𝑇𝑜𝑡𝑎𝑙 𝑑𝑓𝑇𝑜𝑡𝑎𝑙 2.503 15
La 98,95% de la variabilidad de la respuesta es explicada por el
modelo.
Otro método para calcular la significación
de los efectos de los factores es a través
de intervalos de confianza.
Para eso es necesario calcular el error estándar de los
efectos y con ello construir intervalos de confianza para los
efectos.
Si hay n repeticiones en cada una de las 2k corridas del
diseño, y si yi1, yi2, …, yin son las observaciones de la corrida
i-ésima, la estimación de la varianza de la corrida i-ésima está
dada por:
𝑛
2 1 2
𝑆𝑖 = 𝑦𝑖𝑗 − 𝑦𝑖 𝑖 = 1,2, … , 2𝑘
𝑛−1
𝑗=1

Las estimaciones de la varianza del diseño 2k pueden


combinarse para dar una estimación de la varianza global.
La estimación de la varianza global es
igual cuadrado medio del error (MSe) en
el ANOVA.
2𝑘 𝑛
1 2
𝑆2 = 𝑘 𝑦𝑖𝑗 − 𝑦𝑖
2 𝑛−1
𝑖=1 𝑗=1
Esta es también la estimación de la varianza dada por el
cuadrado medio del error en el ANOVA.
La varianza de la estimación de cada efecto es:
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 1
𝑉 ℰ𝒻𝑒𝑐𝑡𝑜 = 𝑉 = 𝑘−1 2𝑉 𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒
2𝑘−1 𝑛 2 𝑛
Cada contraste es una combinación lineal de los 2k
totales de los tratamientos, y cada total consta de:
𝑉 𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 = 2𝑘 𝑛𝜎 2
De la varianza del efecto se deduce el
error estándar estimado.
Por lo tanto, la varianza de cada efecto es:
𝜎2
𝑉 ℰ𝒻𝑒𝑐𝑡𝑜 =
2𝑘−2 𝑛
El error estándar de un efecto sería la raíz cuadrada de
esta expresión:
2𝜎
𝑠𝑒 ℰ𝒻𝑒𝑐𝑡𝑜 =
2𝑘 𝑛
El error estándar estimado se sustituye la varianza (𝜎2) por
su estimador (𝑆2):
2𝑆
𝑠𝑒 ℰ𝒻𝑒𝑐𝑡𝑜 =
2𝑘 𝑛
Determinar Intervalo Confianza,
mediante el error estándar y los grados
de libertad del MSe de la ANOVA
Según distribución normal se tiene: X  1  68%
X  2  95%
X  3  99%

Los intervalos de confianza al (1-𝛼)% para los efectos


se calculan:
𝐼𝐶 ℰ𝒻ℯ𝒸𝓉ℴ 1−𝛼 % = ℰ𝒻ℯ𝒸𝓉ℴ ± 𝑡 𝛼 𝑠𝑒(ℰ𝒻ℯ𝒸𝓉ℴ)
2,𝑁−𝑝
Donde:
◦ 𝑁: número total de corridas
◦ 𝑝: número de parámetros del modelo
Determinar Intervalo Confianza del
ejemplo anterior por medio de las tablas
de Carga y de la ANOVA
Ejemplo

Tabla de cargas:

Tabla de Anova:
calculando el error estándar del efecto
mediante la tabla ANOVA.

De la Tabla Anova se obtiene el cuadrado medio del error


Ejemplo

(MSe), el cual es utilizado como estimador de la varianza del


error (𝑆 2 = 𝑀𝑆𝑒 ):
2𝑆 2 1,75
𝑠𝑒 ℰ𝒻𝑒𝑐𝑡𝑜 = = = 0,6614
2𝑘 𝑛 23 2
Considerando un nivel de significancia del 1%, se tiene:
𝑡 0,005;8 = 3,3554
De este modo, se tendía un:
𝑠𝑒 ℰ𝒻𝑒𝑐𝑡𝑜 = 3,3554 × 0,6614
𝑠𝑒 ℰ𝒻𝑒𝑐𝑡𝑜 = 2,22.
calculando el intervalo de confianza del
efecto mediante la tabla de carga.

De la Tabla de Carga, se obtienen los efectos:


Ejemplo

Del error estándar recién calculado, se tiene:


𝑠𝑒 ℰ𝒻𝑒𝑐𝑡𝑜 = 2,22
Por lo tanto, la siguiente tabla muestra los
intervalos de confianza por cada efecto:
Conclusiones

1. El efecto temperatura es estadísticamente significativa al 99% y


aumenta la respuesta en 22 gr. cuando el factor pasa de 160°C a
180°C en promedio en toda la región experimental.
2. El efecto concentración es estadísticamente significativa al 99%
y disminuye la respuesta en 4 gr. cuando el factor pasa de 20% a
40% en promedio en toda la región experimental.
3. El efecto interacción TK es estadísticamente significativa al 99%
y aumenta la respuesta en 11 gr. cuando la interacción pasa de
(–) a (+) en promedio en toda la región experimental.
4. Tabla resumen: Efecto Nivel Adición
Significativo Sugerido Respuesta
T (+22) +1 (180ºC) 22/2
C (+4) –1 (20%) – 4/2
TK (+11) +1 (B) 10/2
Conclusiones

5. Modelo lineal funcional – modelo empírico funcional – que


describe el comportamiento de la respuesta, es:
22 −4 11
𝑦 = 64,25 + 𝑥1 + 𝑥2 + 𝑥1 𝑥3
2 2 2
Promedio Global: 64,25
Valor Óptimo: 82,75
6. El modelo se comprueba, si es bueno, mediante:
a. Se calculan las corridas (8) en el modelo y se resta a la respectiva
respuesta observada, obteniendo los residuos, si la suma al
cuadrada es pequeña, entonces es bueno el modelo.
b. Se grafican los residuos en un papel de probabilidad normal
ordenando los residuos de menor a mayor y si se ajuntan a la línea
de curva normal, el modelo es bueno el modelo.
c. Características: independiente, aleatoria, normal y pequeños.

También podría gustarte