Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Muchas aplicaciones del análisis de regresión incluyen situaciones en las que hay más
de una variable regresora, a un modelo de regresión que contiene más de una variable
regresora se le llama modelo de regresión múltiple.
Como un ejemplo suponga que la vida efectiva de una herramienta de corte depende
de la velocidad de corte y del Angulo de la herramienta, un modelo de regresión múltiple
que podría describir esta relación es.
y = β 0 + β1 x1 + β 2 x2 + ε
En general la variable respuesta o dependiente “y”, puede relacionarse con “k” variables
regresoras o independientes, el siguiente es un modelo de regresión lineal múltiple con
“k” variables regresoras, a los parámetros β j , j=0, 1, 2, …, k, se les llama coeficientes
de regresión.
Los modelos de regresión lineal múltiples se usan con frecuencia como funciones de
aproximación. Es decir, se desconoce la verdadera relación funcional entre “y”,
x1 , x2 ,..., xk , pero en ciertos rangos de las variables independientes el modelo de
regresión lineal es una aproximación adecuada.
Muchas veces, incluso los modelos cuya estructura es más compleja, pueden
analizarse mediante técnicas de regresión lineal múltiple. Por ejemplo, considere el
modelo de un polinomio cúbico en una variable regresora.
y = β 0 + β1 x + β 2 x 2 + β 3 x 3 + ε
y = β0 + β1 x1 + β 2 x2 + β3 x3 + ε
Los modelos que incluyen efectos de interacción también pueden analizarse utilizando
los métodos de regresión lineal múltiple. Una interacción entre dos variables puede
representarse con un término de un producto cruzado, tal como.
y = β 0 + β1 x1 + β 2 x2 + β12 x1 x2 + ε
y = β0 + β1 x1 + β 2 x2 + β3 x3 + ε
y x1 x2 …. xk
y1 x11 x12 …. x1k
y 2
x21 x22 .... x2 k
. . . . .
. . . . .
. . . . .
yn x1n x2 n xnk
En este caso las ecuaciones normales de mínimos cuadrados para obtener los
coeficientes de regresión en el modelo serian:
n n n n
nβ 0 + β1 ∑ xi1 + β 2 ∑ xi 2 + ... + β k ∑ xik = ∑ y i
i =1 i =1 i =1 i =1
n n n n n
β 0 ∑ xi1 + β1 ∑ xi21 + β 2 ∑ xi1 xi 2 + ... + β k ∑ xi1 xik = ∑ xi1 y i
i =1 i =1 i =1 i =1 i =1
.
.
.
n n n n n
β 0 ∑ xik + β 1 ∑ xik xi1 + β 2 ∑ xik xi 2 + ... + β k ∑ xik2 = ∑ xik y i
i =1 i =1 i =1 i =1 i =1
Obsérvese que hay p= k+1 ecuaciones normales, una para cada uno de los coeficientes
de regresión desconocidos. Las soluciones de las ecuaciones normales serán los
y = β 0 + β1 x1 + β 2 x2 + ε
25 25 25
N = 25, ∑ yi = 725.82 ,
i =1
∑ xi1 = 206 ,
i =1
∑x i =1
i2 = 8294
∑ xi21 = 2396,
i =1
∑ xi22 = 3531848 ,
i =1
∑ xi1 xi 2 = 77177 ,
i =1
∑x
i =1
i1 y i = 8008 .37
25
∑x
i =1
i2 y i = 274811 .31
n n n
nβ 0 + β1 ∑ xi1 + β 2 ∑ xi 2 = ∑ y1
i =1 i =1 i =1
n n n n
β 0 ∑ xi1 + β1 ∑ xi21 + β 2 ∑ xi1 xi 2 = ∑ xi1 yi
i =1 i =1 i =1 i =1
n n n n
β 0 ∑ xi 2 + β1 ∑ xi1 xi 2 + β 2 ∑ xi22 = ∑ xi 2 yi
i =1 i =1 i =1 i =1
Por último resolvemos el sistema de ecuaciones lineales por el método que mejor
domine, (suma y resta, Matrices, gauss Jordán, etc.) y obtenemos los valores de:
Esta ecuación puede usarse para predecir la resistencia al desprendimiento para pares
de valores en las variables regresoras de la longitud del alambre ( x1 ) y la altura de la
matriz ( x2 ). A si pues, podemos decir que un alambre de longitud 13 y con una altura
de matriz de 500, tiene una resistencia al desprendimiento de:
En los problemas de regresión lineal múltiple, las pruebas de hipótesis del modelo son
útiles para medir la adecuación del modelo, la prueba de la significación de una
regresión sirve para determinar si existe una relación lineal entre la variable de
respuesta “y” y un subconjunto de la variables regresoras, x1 , x 2 ..., x k . Las hipótesis
apropiadas son:
H 0 : β1 = β 2 = ... = β k = 0
H1 : β j ≠ 0
Para al menos una j.
SS R
k MS R
f0 = =
SS E MS E
(n − p)
En donde:
2 2
n n
∑ yi ∑ yi
SS R = βˆy − i =1
n
; SS E = SS T − SS R y SST = ∑ yi − i =1
2
n i =0 n
Ejemplo 1.6: Para el caso del ejemplo 1.4, suponga que deseamos realizar una prueba
de hipótesis con un 90% de confiabilidad, entonces α=0.1, k=2, p=3 y n-p=25-3=22, de
la tabla de distribución f α , k , n − p obtenemos un valor de 2.56 y un estadístico f 0
calculado de:
Iniciamos por determinar el valor del producto matricial β̂y para encontrar SSR.
725.82
β̂y = [2.26379 2.74427 0.01253] 8008.37 =27063.62
274811.31
i =1
Sustituimos y calculamos
2
n
∑ yi
SS R = βˆy − i =1 = 27063.62 −
526814.67
= 5991.03
n 25
∑y
i =0
i
2
= (9.95) 2 + (24.45) 2 + (31.75) 2 + ............. + (22.13) 2 + (21.15) 2 = 27133.39
Sustituimos y calculamos
2
n
n ∑ yi
SS T = ∑ yi − i =1 = 27133.39 −
526234.18
2
= 27133.39 − 21049.37 = 6084.02
i =0 n 25
SS R 5991.03
f0 = k = 2 = 2995.515
SS E 92.99 4.2268
(n − p) 22
Modo de uso.
• En la primer fila seleccionamos la columna con el valor de k especificado (en el
ejemplo k=2)
• En la primer columna ubicamos la fila con el valor de n-p (en el ejemplo p=3 y
n=25; n-p=22)
• El valor que se encuentra en la posición donde se cruzan la columna y la fila
seleccionada es el que se toma como valor de f α ,k ,n − p (En el ejemplo resulta
2.56)