Está en la página 1de 28

AJUSTES DE MODELOS DE

REGRESION

CAPITULO 10
Diseño y Análisis de Experimentos
Montgomery
Compendió: Ing. Rodrigo Wadnipar, M.Sc.
rwadnipa@uninorte.edu.co
INTRODUCCION
• En muchos problemas hay dos o más
variables relacionadas, y el interés se
centra en modelar y explorar esta relación.
• Por ejemplo, en un proceso químico el
rendimiento del producto está relacionado
con la temperatura de operación.
• Quizá el Ing. Químico quiera construir un
modelo que relacione el rendimiento con
la temperatura de operación para usarlo
después como herramienta de predicción
o bien de optimización o control del
proceso.
INTRODUCCION (continuación)
• En general, suponga que hay una sola variable
dependiente o de respuesta y que depende de k
variables independientes o regresores, por
ejemplo, x1, x2,…,xk.
• La relación que existe entre estas variables se
caracteriza por un modelo matemático llamado
modelo de regresión.
• En ocasiones el experimentador conoce la forma
exacta de la verdadera relación funcional entre y y
x1, x2,…,xk. Por ejemplo y = f (x1, x2,…,xk).
• Sin embargo, en la mayoría de los casos no se
conoce la verdadera relación funcional, y el
experimentador elige una función apropiada para
aproximar f.
• Los modelos polinomiales de orden inferior son de
uso generalizado como funciones de aproximación.
MODELOS DE REGRESIÓN LINEAL
• La atención se centrará en el ajuste de modelos de regresión lineal.
• Suponga que quiere desarrollarse un modelo empírico que relacione la
viscosidad de un polímero con la temperatura y la velocidad de
alimentación del catalizador. Un modelo que podría describir esta

y  x  x 
relación es:
  1
 2
 (10-1)
0 1 2

• Donde y representa la viscosidad, x1 la temperatura y x2 la velocidad


de alimentación del catalizador.
• Se trata de un modelo de regresión lineal múltiple con dos variables
independientes.
• Es común llamar a las variables independientes variables predictoras
o regresores (variables de regresión).
• En general, la variable de respuesta y puede relacionarse con k
regresores. Al modelo

y   x  x
0 1 1 2 2
 ...  
k x 
k (10-2)

• Se le llama modelo de regresión lineal múltiple con k regresores.


MODELOS DE REGRESIÓN LINEAL
(continuación)
• Con frecuencia los modelos cuya apariencia es más
compleja que la ecuación (10-2) pueden también
analizarse mediante técnicas de regresión lineal múltiple.
• Considere la incorporación de un término de interacción
en el modelo de primer orden de dos variables, por
ejemplo

y     x   x   x x 
0 1 1 2 2 12 1 2 (10-3)

• Si se hace x3 = x1 x2 y 3 = 12, entonces la ecuación


puede escribirse

y     x   x   x 
0 1 1 2 2 3 3 (10-4)

que es un modelo de regresión lineal múltiple estándar


con tres regresores.
MODELOS DE REGRESIÓN
LINEAL (continuación)
• Considérese el modelo de superficie de
respuesta de segundo orden en dos variables:
  x1   x2   x1   x   x x 
2 2
y 0 1 2 11 22 2 12 1 2 (10-5)
• Si se hace x3 = x12, x4 = x22, x5 = x1x2 y
3 = 11, 4 = 22, 5 = 12, entonces la ecuación
puede escribirse
• y     x   x   x   x   x 
0 1 1 2 2 3 3 4 4 5 5
(10-6)
que es un modelo de regresión lineal.
ESTIMACION DE LOS PARAMETROS EN
MODELOS DE REGRESIÓN LINEAL
• El método de mínimos cuadrados se usa para
estimar los coeficientes de regresión de un modelo
de regresión lineal múltiple.
• Suponga que se cuenta con n > k observaciones de
la variable de respuesta, por ejemplo y1, y2, …, yn.
• Junto con cada respuesta observada yi se tendrá
una observación de cada uno de los regresores, y
sea que xij denote la observación o nivel i-ésimo de
la variable xj.
• Los datos aparecerán como en la tabla 10-1.
• Se supone que el término del error  del método
tiene E() = 0 y V() = s2 y que las {i} son
variables aleatorias no correlacionadas.
ESTIMACION DE LOS PARAMETROS EN
MODELOS DE REGRESIÓN LINEAL (continuación)

Tabla 10-1 Datos de una regresión lineal múltiple


y x1 x2 … xk
y1 x11 x12 … x1k
y2 x21 x22 … x2k
. . . . .
. . . . .
. . . . .
yn xn1 xn2 … xnk
ESTIMACION DE LOS PARAMETROS EN
MODELOS DE REGRESIÓN LINEAL
(continuación)
• La ecuación 10-2 del modelo puede escribirse en
términos de las observaciones de la tabla 10-1 como:
y     xi1   xi 2  ...   xik   i
i 0 1 2 k
(10-7)
y      x 
k

i 0 j ij para i = 1, 2, …, n
i
j 1
• El método de mínimos cuadrados consiste en elegir
las  de la ecuación 10-7 de tal modo que la suma de
cuadrados de los errores, i, se minimice. La función
de mínimos cuadrados es:

(10-8)
ESTIMACION DE LOS PARAMETROS EN
MODELOS DE REGRESIÓN LINEAL (continuación)

y…
ESTIMACION DE LOS PARAMETROS EN MODELOS
DE REGRESIÓN LINEAL (continuación)
• Al simplificar la ecuación (10-9) se obtiene la
ecuación (10-10):

• Estas ecuaciones se denominan ecuaciones normales de


mínimos cuadrados.
• Hay p = k + 1 ecuaciones normales, una para cada uno de
los coeficientes de regresión desconocidos.

ESTIMACION DE LOS PARAMETROS EN
MODELOS DE REGRESIÓN LINEAL (continuación)
ESTIMACION DE LOS PARAMETROS EN
MODELOS DE REGRESIÓN LINEAL (continuación)
ESTIMACION DE LOS PARAMETROS EN
MODELOS DE REGRESIÓN LINEAL (continuación)
ESTIMACION DE LOS PARAMETROS EN
MODELOS DE REGRESIÓN LINEAL
(continuación)
Al desarrollar en detalle la ecuación (10-12) se obtiene:

El modelo de regresión ajustado es:

(10-14)
Ejemplo 10-1 pag 397
• En la tabla 10-2 se muestran 16 observaciones de la
viscosidad y de un polímero y dos variables del proceso:
la temperatura de reacción x1 y la velocidad de
alimentación del catalizador x2. Se ajustará el modelo de
regresión múltiple y   0   1 x1   2 x2  
Tabla 10-2 Datos de la viscosidad del ejemplo 10-1 (viscosidad en
centistokes @ 100oC)
Ttemperatura Velocidad de Alimentación
Observaciones Viscosidad
(x 1, oC) del catalizador (x 2, lb/h)
1 80 8 2256
2 93 9 2340
3 100 10 2426
4 82 12 2293
5 90 11 2330
6 99 8 2368
7 81 8 2250
8 96 10 2409
9 94 12 2364
10 93 11 2379
11 97 13 2440
12 95 11 2364
13 100 8 2404
14 85 12 2317
15 86 9 2309
16 87 12 2328
MATRICES - Ejemplo 10-1
MATRIZ X MATRIZ Y
X'X
1 80 8 2256
1 93 9 2340 16 1458 164
1 100 10 2426 1458 133560 14946
1 82 12 2293 164 14946 1726
1 90 11 2330
1 99 8 2368
X'Y
1 81 8 2250
1 96 10 2409 37577
1 94 12 2364 3429550
1 93 11 2379 385562
1 97 13 2440
1 95 11 2364 ^  (X'X)-1X'Y
1 100 8 2404
1 85 12 2317 1566,077771425
2309 7,621290077
1 86 9
1 87 12 2328 8,584845886

Viscosidad = 1566,08 + 7,62129*Temperatura + 8,58485*Velocidad Alimentación


Valores predichos, residuales y
otros diagnósticos del ejemplo 10-1
PREDICTED RESIDUALS SRESIDUALS LEVERAGES
OBSERVACION Y
Predicted Values Residuals Studentized Residuals Leverages (hij)
1 2256 2244.46 11.5403 0.866239 0.349507
2 2340 2352.12 -12.1214 -0.76978 0.102472
3 2426 2414.06 11.9448 0.793157 0.176671
4 2293 2294.04 -1.04171 -0.0707119 0.251084
5 2330 2346.43 -16.4272 -1.04922 0.0768901
6 2368 2389.26 -21.2643 -1.60603 0.265328
7 2250 2252.08 -2.08103 -0.148282 0.319351
8 2409 2383.57 25.4299 1.76489 0.0979706
9 2364 2385.5 -21.4972 -1.48254 0.141894
10 2379 2369.29 9.70895 0.603415 0.0798914
11 2440 2416.95 23.0541 1.79521 0.278357
12 2364 2384.53 -20.5336 -1.36321 0.0961841
13 2404 2396.89 7.11445 0.500863 0.289481
14 2317 2316.91 0.0944214 0.00614353 0.185198
15 2309 2298.77 10.2277 0.657058 0.134153
16 2328 2332.15 -4.14816 -0.265902 0.155567
Ejemplo 10-2 pag 403
• Un Ing. Químico está investigando el
rendimiento de un proceso. Tres de las
variables del proceso son de interés: La
temperatura, la presión y la concentración del
catalizador. Cada variable puede correrse en un
nivel bajo y uno alto, y el ingeniero decide correr
un diseño 23 con cuatro puntos centrales. En la
figura 10-5 se muestra el diseño y los
rendimientos resultantes, donde se presentan
tanto los niveles naturales del diseño como la
notación de variables codificadas +1, -1 que se
utiliza normalmente en los diseños factoriales 2k
para representar los niveles de los factores.
50
44
36 48
53
56
57 65
57 68
32 46
Variables del Proceso Variables Codificadas
Rendimiento
Temperatura Presión Concentración
Corrida o X1 X2 X3 Y
C (psig) (g/l)
1 120 40 15 -1 -1 -1 32
2 160 40 15 1 -1 -1 46
3 120 80 15 -1 1 -1 57
4 160 80 15 1 1 -1 65
5 120 40 30 -1 -1 1 36
6 160 40 30 1 -1 1 48
7 120 80 30 -1 1 1 57
8 160 80 30 1 1 1 68
9 140 60 22,5 0 0 0 50
10 140 60 22,5 0 0 0 44
11 140 60 22,5 0 0 0 53
12 140 60 22,5 0 0 0 56
Temperatura  140 Pr esión  60 Concentración  22.5
x1  20 x1

20 x3 
7.5

Figura 10-5 Diseño experimental del ejemplo 10-2


MATRICES - Ejemplo 10-2
• Suponga que el ingeniero decide ajustar un modelo que sólo
incluye los efectos principales, por ejemplo
y     x   x   x 
0 1 1 2 2 3 3

• Para este modelo la matriz X, el vector y, el vector solución y


el vector de los términos i son:
X y X'X
1 -1 -1 -1 32 12 0 0 0
1 1 -1 -1 46 0 8 0 0
1 -1 1 -1 57
65
0 0 8 0
1 1 1 -1
1 -1 -1 1 36 0 0 0 8
1 1 -1 1 48
1 -1 1 1 57 ^ = (X'X)-1X'Y X'Y
1 1 1 1 68 51.00000 612
1 0 0 0 50 5.62500 45
1 0 0 0 44
1 0 0 0 53 10.62500 85
1 0 0 0 56 1.12500 9
Variables del Proceso Variables Codificadas
Rendimiento
Temperatura Presión Concentración
Corrida X1 X2 X3 Y
o
C (psig) (g/l)
1 120 40 15 -1 -1 -1 32
2 160 40 15 1 -1 -1 46
3 120 80 15 -1 1 -1 57
4 160 80 15 1 1 -1 65
5 120 40 30 -1 -1 1 36
6 160 40 30 1 -1 1 48
7 120 80 30 -1 1 1 57
8 160 80 30 1 1 1 68
9 140 60 22,5 0 0 0 50
10 140 60 22,5 0 0 0 44
11 140 60 22,5 0 0 0 53
12 140 60 22,5 0 0 0 56
Temperatura  140 Pr esión  60 Concentración  22.5
x1  x1
 x 3

20 20 7.5
Figura 10-5 Diseño experimental del ejemplo 10-2
(continuación)
(continuación)
Variables del Proceso Variables Codificadas Rendimiento
Temperatura Presión Concentración
Corrida o X1 X2 X3 Y
C (psig) (g/l)
1 125 41 14 -0,75 -0,95 -1,13 32
2 158 40 15 0,90 -1,00 -1,00 46
3 121 82 15 -0,95 1,10 -1,00 57
4 160 80 15 1,00 1,00 -1,00 65
5 118 39 33 -1,10 -1,05 1,40 36
6 163 40 30 1,15 -1,00 1,00 48
7 122 80 30 -0,90 1,00 1,00 57
8 165 83 30 1,25 1,15 1,00 68
9 140 60 22,5 0 0 0 50
10 140 60 22,5 0 0 0 44
11 140 60 22,5 0 0 0 53
12 140 60 22,5 0 0 0 56
Temperatura  140 Pr esión  60 Concentración  22.5
x1  x1  x 3

20 20 7.5
5.41

También podría gustarte