Está en la página 1de 16

CARRERA:

Ingeniería Industrial.

MATERIA:
(Estadística inferencial 2)

GRUPO:
(UA1-4)

ACTIVIDAD:
Regresión lineal múltiple.

EQUIPO:
#8

DOCENTE:
Perez Magaña Juan Gerardo.

FUENTE DE INFORMACIÓN:

http://dm.udc.es/asignaturas/estadistica2/secprac_5_2.html

http://estadisticaejemplosyejercicios.blogspot.com/2012/05/regresion-
lineal-simple.html
https://www.gestiondeoperaciones.net/proyeccion-de-demanda/ejemplo-de-
una-regresion-lineal-multiple-para-un-pronostico-con-excel-y-minitab/

FECHA DE ENTREGA:
5 de Febrero de 2019.
Ejemplos de una Regresión Lineal Múltiple
Ejercicio 1.
En el siguiente artículo desarrollaremos un pronóstico a través de una regresión lineal
múltiple que en términos generales se puede representar
por donde es la variable
dependiente, las variables independientes y
los coeficientes de la regresión. En particular consideraremos en el siguiente ejemplo
una variable dependiente (Ganancias en Millones de $) y 2 variables explicativas o
independientes (Número de Vendedores y Precio del Producto $), es
decir, , donde es el N° de Vendedores y el Precio del
Producto ($). La información se resume en la tabla a continuación:

En el artículo Cómo utilizar una Regresión Lineal para realizar un Pronóstico de


Demanda se detalla el procedimiento para obtener una regresión lineal simple con una
variable explicativa, lo cual se favorece con la utilización de las herramientas que
provee Excel como se muestra en los siguientes gráficos:
La diferencia en los coeficientes de la regresión de ambos procedimientos obedece sólo
a aspectos de visualización de los resultados. Luego, la interpretación es la siguiente: las
variables independientes Número de Vendedores y Precio del Producto $ explican el
97,23% de la variación de las Ganancias en Millones de $. Notar que al considerar 2
variables independientes el coeficiente de determinación r cuadrado aumenta en
comparación a las alternativas que consideran sólo una variable independiente o
explicativa.

Ejercicio 2.

“Una desea estimar los gastos en alimentación de una familia en base a


la información que proporcionan las variables regresoras X =“ingresos mensuales”
1

y X =“número de miembros de la familia”. Para ello se recoge una muestra aleatoria


2

simple de 15 familias cuyos resultados son los de la tabla adjunta


(El gasto e ingreso está dado en cientos de miles de pesetas)”

Gasto Ingreso Tamaño Gasto Ingreso Tamaño

0 43
'
21
'
3 1 29
'
89
'
3

0 31
'
11
'
4 0 35
'
24
'
2

0 32
'
09
'
5 0 35
'
12
'
4

0 46
'
16
'
4 0 78
'
47
'
3

1 25
'
62
'
4 0 43
'
35
'
2

0 44
'
23
'
3 0 47
'
29
'
3

0 52
'
18
'
6 0 38
'
14
'
4

0 29
'
10
'
5
Los datos en forma matricial:

Con estos datos se obtiene

Por tanto
De donde

El modelo de regresión lineal que se obtiene es:

A partir de esta ecuación se obtienen las predicciones y los residuos asociados a las
observaciones muéstrales. Para la primera observación se
obtiene

Razonando así en todos los puntos muéstrales se obtiene

Calculo de scR

También se puede calcular la scR de la siguiente forma

yx =
i 2i

960
Se calculan los intervalos de confianza de los parámetros del modelo al 90%,
Para la varianza, 2

~ 12
2

5 2253
'

< < 21 0298


'

0 0034 <
' 2
< 0 0138
'
La varianza de los estimadores del modelo es

de donde se deduce que

= 0 0903
'

= 0 0099
'

= 0 0201
'

Intervalo de confianza para 0

. .
0 0903 <-0 160 -
'
<t '
0 12 0 0903
'

- 0 321 <'
< 0 001 0
'

Intervalo de confianza para 1 (ingreso)


. .
0 0099 < 0 149 -
'
<t '
0 0099 1 12
'

0 1314 < '


< 0 1666 1
'

Contrate H = 0, “la variable ingreso no influye” (contraste individual de la t)


0 1

Intervalo de confianza para 2 (tamaño)


. .
0 0201 < 0 077 -
'
<t '
0 0201 2 12
'

0 0412 < '


< 0 1128 2
'

Contrate H = 0, “la variable tamaño no influye” (contraste individual de la t)


0 2

Tabla Anova,

de donde

Tabla ANOVA

Fuentes de Suma de Grados de Varianzas


Variación Cuadrados libertad
scE (por el modelo) 1 3595
'
2 e
2
= 0 6797'

scR (Residual) 0 0721


'
12 R
2
= 0 0060'

scG (Global) 1 4316


'
14 y
2
= 0 1023'

Con estos datos se obtiene el siguiente contraste conjunto de la F

El contraste conjunto de la F indica claramente la influencia del modelo en la


variable respuesta. Por tanto, de los contrastes individuales y del conjunto se deduce la
influencia de cada una de las dos variables regresoras y la influencia conjunta del
modelo.

Ahora se calcula el contraste individual de la F respecto a la variable x =“tamaño”, 2

contraste que es equivalente al contraste individual de la t. Para ello, se obtiene la


regresión de la variable gasto respecto a la variable ingreso,

la tabla ANOVA de este modelo es

Tabla ANOVA

Fuentes de Suma de Grados de Varianzas


Variación Cuadrados libertad

scE (ingreso) 1 2716


'
1 e
2
= 1 2716 '

scR (Residual) 0 1600


'
13 R
2
= 0 0123 '

scG (Global) 1 4316


'
14 y
2
= 0 1022 '

La variabilidad incremental debida a la variable diámetro es

Este valor indica lo que aumenta la variabilidad explicada por el modelo al introducir
la variable tamaño.

Para contrastar la influencia o no de esta variable se utiliza el estadístico


Que da el mismo p-valor que en el contraste individual de la t (hay pequeñas diferencias
por los re sondeos).

Cálculo de los coeficientes de correlación:

El coeficiente de determinación,

El coeficiente de correlación múltiple

El coeficiente de determinación corregido por el número de grados de libertad.

El coeficiente de correlación simple entre las variables gasto e ingreso,

Este coeficiente es una medida de la relación lineal existente entre las variables gasto
e ingreso. También se puede calcular a partir del coeficiente de determinación de la
siguiente regresión

La tabla ANOVA del modelo es

Tabla ANOVA

Fuentes de Suma de Grados de Varianzas


Variación Cuadrados libertad

scE (ingreso) 1 2716


'
1 e
2
= 1 2716
'

scR (Residual) 0 1600


'
13 R
2
= 0 0123
'
scG (Global) 1 4316
'
14 y
2
= 0 1022
'

Análogamente, el coeficiente de correlación simple entre las variables gasto y


tamaño es,

Coeficiente de correlación parcial entre las variables gasto e ingreso.

r 2

= =
= 0 9496'

r = 0 974.'

Otra forma más compleja de calcular este coeficiente es la siguiente: se obtienen las
siguientes regresiones y se guardan los residuos,
tamaño + e .
gasto.tamaño

tamaño + e .
ingreso.tamaño

Ahora el coeficiente de correlación parcial entre las variables gasto e ingreso se obtiene
como el coeficiente de correlación simple entre las variables e ye
gasto.tamaño ingreso.tamaño

r = =

= 0 9740,
'

Este coeficiente mide la relación entre las variables gasto e ingreso libres de la
influencia de la variable tamaño.

Análogamente se obtiene que

Estimación de la media condicionada.

“Estimar el gasto medio en alimentación de una familia con unos ingresos de x = 3 0 y 1


'

un tamaño de x = 4. Esto es
2 ”.

Aplicando el modelo de regresión


Se calcula el valor de influencia asociado al dato h = =

La varianza del estimador es

Y un intervalo de confianza para m al 90% es


h

Predicción de una observación.

“La familia Pérez que tiene unos ingresos de x = 3 0 y un tamaño de x = 4. Esto


1
'
2

es ¿qué gasto en alimentación tendrá?”.

Aplicando el modelo de regresión estimado

La varianza de la predicción es

= 0 0065
'

Y un intervalo de prdicción al 90% es

Algunos gráficos de interés que ayudan a resolver el problema son los siguientes:

Gráficos parciales de las componentes


Gráficos de residuos,
Ejercicio 3.
Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y, kg) de
una muestra de 12 hombres adultos. Para cada estatura fijada previamente se observó el
peso de una persona seleccionada de entre el grupo con dicha estatura, resultando:

X 152 155 152 155 157 152 157 165 162 178 183 178
Y 50 61.5 54.5 57.5 63.5 59 61 72 66 72 84 82

Con estos datos vamos a plantear una ecuación de regresión simple que nos permita
pronosticar los pesos conociendo las tallas. Utilizaremos a = 0.05, y contrastaremos
nuestra hipótesis con la prueba F.

DESARROLLO

Representación matemática y gráfica de los datos:


Representación Matemática
estatura pesos Regresión Lineal I.C. para la media I. C. individual
datos x y x ^2 y ^2 xy y est. Residual L. I. L. S. L. I. L. S.
1 152 50 23104 2500 7600 56.43 -6.43 53.07 59.79 47.30 65.56
2 155 61.5 24025 3782.3 9532.5 59.03 2.47 56.09 61.97 50.05 68.02
3 152 54.5 23104 2970.3 8284 56.43 -1.93 53.07 59.79 47.30 65.56
4 155 57.5 24025 3306.3 8912.5 59.03 -1.53 56.09 61.97 50.05 68.02
5 157 63.5 24649 4032.3 9969.5 60.77 2.73 58.05 63.48 51.85 69.68
6 152 59 23104 3481 8968 56.43 2.57 53.07 59.79 47.30 65.56
7 157 61 24649 3721 9577 60.77 0.23 58.05 63.48 51.85 69.68
8 165 72 27225 5184 11880 67.71 4.29 65.17 70.24 58.85 76.57
9 162 66 26244 4356 10692 65.11 0.89 62.65 67.56 56.27 73.94
10 178 72 31684 5184 12816 78.99 -6.99 74.65 83.33 69.45 88.52
11 183 84 33489 7056 15372 83.32 0.68 78.01 88.64 73.31 93.34
12 178 82 31684 6724 14596 78.99 3.01 74.65 83.33 69.45 88.52

Representación Gráfica
HIPÓTESIS
HO: No hay relación entre la variable peso y la variable estatura.
HA: Hay relación entre la variable peso y la variable estatura.
Tabla de análisis de varianza
Fuente de Grados de Suma de Cuadrados
estadístico
Variación libertad cuadrados medios F
Debido a
la
regresión 1 1061.1 1061.1 73.08
error 10 145.2 14.5
total 11 1206.3
Se obtiene un valor F = 73.08 > 4.96, con lo cual se rechaza la hipótesis nula y
aceptamos que la variable estatura está relacionada con la variable peso con un 95% de
confianza.
 De acuerdo al desarrollo matemático hemos obtenido los siguientes cálculos:

Lo que nos permite obtener los coeficientes a y b.


Luego,
b = 1223 / 1409.667 = 0.8676
a = 65.25 – (0.8676) (162.167) = -75.446

INTERPRETACIÓN

 La ecuación de regresión estimada es:


Coeficiente de correlación: R= 0.9379
Coeficiente de determinación: R²=0.8796
El valor de b = 0.8676 indica el incremento del peso en kilogramos, en promedio, por
cada centímetro de aumento en la estatura de los hombres adultos.
El valor de a, no tiene interpretación práctica en el ejemplo, se interpretaría como el
valor obtenido, en promedio, para el peso Y, cuando la estatura es 0.
Utilizando la ecuación de regresión para estimar o predecir valores de la variable Y:
Para una talla de 180 se obtiene un peso de 80.7 kg.
¿Cuánto se espera que pese (en promedio) una persona que mide 1.60 m?
Sustituyendo el valor de interés en la ecuación:

Se obtiene:

CONCLUSIÓN

La ecuación de Regresión Lineal estimada para las variables estatura y peso muestran,
de acuerdo a la prueba F, relación.
Esta relación se ha estimado en un R = 93.7, que indica una fuerte relación positiva.
Además si consideramos el coeficiente de determinación R² = 87.9 podemos indicar que
el 87.9% de las variaciones que ocurren en el peso se explicarían por las variaciones en
la variable estatura.

También podría gustarte