Está en la página 1de 14

Estadística inferencial Regresión lineal simple

Semana 09 – Sesión 02
Logro: Al finalizar la sesión, el estudiante aplica conceptos de regresión lineal simple para predecir el valor de
la variable dependiente en función de la variable independiente, en casos de su especialidad.

Laboratorio Semana Nº 09
Regla de decisión usando SIG
Condición Decisión
Sig < α Rechazar H0
Sig ≥ α No rechazar H0

Indicaciones:
1. Realice las pruebas con un nivel de significación del 5% y los intervalos con un 95% de confianza.
2. En todas las pruebas asuma que las muestras fueron extraídas aleatoriamente.
3. Verifique si se cumplen los supuestos de normalidad de los errores y la no autocorrelación de errores.
4. La base de datos que se utilizará en este laboratorio encuentra en el AV con el nombre
MA461_202202_Semana 09_Sesión 02_BD.sav y corresponde a la empresa Green Lima.

Situación 1
El uso de vehículos menores como bicicletas eléctricas, constituye actualmente un medio económico para el
trasporte individual, el departamento de ventas de la empresa Green Lima desea estimar el monto total de
compra diaria en términos del número de bicicletas eléctricas compradas; si la estimación es menor a los 30
000 soles, cuando se compran 8 bicicletas, se hará un descuento del 5% en la compra de bicicletas eléctricas
en todas sus tiendas, con el objetivo de incentivar las compras de este tipo de vehículos.

Para filtro: tipo = 2 (bicicletas eléctricas)


Antes de Aplicar el filtro, en la base de datos fila 241 digite: 2 en la columna de la variable de filtro (tipo de
vehículo), 2 es el valor de la variable del Tipo de vehículo que corresponde a bicicletas eléctricas, el valor de X
= 8, en la columna de la variable independiente, éste es valor que toma la variable independiente para la
predicción.

Menú: Datos / Seleccionar casos / Si satisface la condición  Tipo = 2 /Continuar/Aceptar

Para la regresión: Menú: Analizar / Regresión / Lineales … Ingresar la variable dependiente e independiente/
En estadísticos marcar Durbin-Watson/continuar...

1
Estadística inferencial Regresión lineal simple

En Guardar, marcar: No estandarizados en valores


pronosticados y Residuos (Lo primero es para obtener la
estimación puntual y lo segundo para crear la variable
Error o residual) En Intervalos de predicción marcar
Individuos / Continuar y Aceptar.

Para el supuesto de Normalidad:


Menú: Analizar / Estadísticos descriptivos/Explorar …
Después de ingresar la variable Errores no estandarizados, en gráficos marcar: Gráficos de normalidad con
pruebas.

Para la estimación puntual y por intervalo:


No ubicamos en la parte final de la base de datos:

2
Estadística inferencial Regresión lineal simple

Interpretación:
Determinar si se realizará un descuento del 5% en la compra de bicicletas eléctricas en todas sus tiendas

Representación:
Variables:
Independiente (X): Número de vehículos comprados
Dependiente (Y): Monto total de compra
Herramienta Estadística: Regresión Lineal Simple (RLS)
Hipótesis:
H 0 : β 1=0; Modelo no válido o no significativo
H 1 : β1 ≠ 0; Modelo válido o significativo

3
Estadística inferencial Regresión lineal simple
Nivel de confianza = 95% (Se usa para intervalos de confianza)
Nivel de significación = 5% (Se usa para prueba de hipótesis)

Cálculos: Reportados por SPSS

Análisis y argumentación:
Validación de los supuestos:
1° Supuestos de normalidad de los errores.
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Unstandardized Residual .111 69 .034 .947 69 .005
a. Corrección de significación de Lilliefors

En este caso el tamaño de muestra es mayor que 50, por lo que utilizará el estadístico de Kolmogorov-
Smirnov.
Estadístico de Prueba: 0.111
Como Sig = 0.034 < Alfa 0.05
Decisión estadística: Rechazar Ho
Conclusión estadística: Al 5% de nivel de significación, los errores no se distribuyen normalmente, es decir no,
se cumple el supuesto de Normalidad. Por cuestiones didácticas seguiremos con el análisis.

2° No autocorrelación de Errores. Estadístico Durbin Watson (D-W)

Resumen del modelo


Error estándar
R cuadrado de la Durbin-
Modelo R R cuadrado ajustado estimación Watson
1 .958a .918 .917 2135.038 2.151

D-W = 2.151 pertenece al intervalo [1, 3]


Conclusión estadística: Al 5% de nivel de significancia, se cumple el supuesto de no autocorrelación de los
errores.

VALIDAR EL MODELO DE REGRESIÓN LINEAL SIMPLE (RLS)

Utilizando la Prueba F (Usar tabla de Análisis de Varianza ANOVA)


H 0 : β 1=0 ; (No existe relación lineal entre X e Y) Modelo no válido o no significativo
H 1 : β1 ≠ 0; (Existe relación lineal entre X e Y) Modelo válido o significativo

Usando la Tabla de Análisis de Varianza, tenemos:

ANOVAa
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 3440210749.376 1 3440210749.376 754.699 <.001b
Residuo 305411898.566 67 4558386.546

4
Estadística inferencial Regresión lineal simple
Total 3745622647.942 68

CMR
Estadístico de prueba: F cal= =754.699 ; Fcrítico = 3.984; Con Excel INV.F.CD (0,05;1;67)
CME

Fcal > Fcrítico; Se rechaza la hipotesis nula.


O, si nos basamos en el valor de sig.: Sig. < 0.001 < Alfa = 0.05; Se rechaza la hipótesis nula.

Decisión estadística: Rechazar H0


Conclusión estadística: Al 5% de nivel de significancia, estamos a favor de que β 1 ≠ 0 ;
Podemos afirmar que existe relación lineal entre el número de vehículos comprados (bicicletas eléctricas) y el
Monto total de compra.

Resumen del modelo


Error estándar
R cuadrado de la Durbin-
Modelo R R cuadrado ajustado estimación Watson
1 .958a .918 .917 2135.038 2.151

Interpretando Coeficiente de determinación (R2):

r2 = 0.918;

El 91.8 de la variabilidad que experimenta el monto total de la compra es explicada por el número de
vehículos comprados (bicicletas eléctricas) a través de la regresión y el 8.2% restante se debe a otros factores
no presentes en el modelo.

Interpretando Coeficiente de correlación (R):


r = 0.958: Existe una correlación positiva entre el número de vehículos comprados y el monto total de compra.

Ecuación de Regresión Lineal Simple estimada (usando la Tabla de Coeficientes):

Coeficientes a
Coeficientes
Coeficientes no estandarizados estandarizados
Modelo B Desv. Error Beta t Sig.
1 (Constante) 1884.442 427.940 4.404 <.001
Número de vehículos 2713.688 98.781 .958 27.472 <.001
comprados
a. Variable dependiente: Monto total de compra
Y^ =1884.442+2713.688 X

Interpretación del coeficiente de regresión: ^β 1


^β =2713 . 688
1
Cuando incrementamos en una unidad el número de vehículos comprados, el monto promedio total de
compra se incrementa en 2713.688 soles.

PREDICCIONES:

5
Estadística inferencial Regresión lineal simple
^ =1884.442+2713.688 ( 8 ) =253593.946 soles
Predicción puntual: Y
Cuando la compra es de 8 bicicletas eléctricas, el monto total de compra es de 23593.95 soles.

Predicción por intervalo (valor individual):

IC (Y /xo=8 )=[ 19209.43 27 978.47 ] soles


Con un nivel de confianza del 95%, cuando el número de vehículos (bicicletas eléctricas) comprados es 8, el
Monto total de compra se espera se encuentre contenido en el intervalo [ 19 209.43; 27 978.47 ]soles.
De acuerdo con los resultados obtenidos, el departamento de ventas de la empresa Green Lima hará un
descuento del 5% en las compras de bicicletas eléctricas en todas sus tiendas, porque la estimación es menor
a 30000 soles.

6
Estadística inferencial Regresión lineal simple

LOS ESTUDIANTES FORMARÁN GRUPOS, DEBEN RESPONDER Y EXPONER LA SOLUCIÓN DEL SIGUIENTE
EJERCICIO

Situación 2
El departamento de servicios generales de Green Lima desea estimar el costo por concepto de reparación y
mantenimiento de las motos eléctricas que comercializa en función de los años de antigüedad de éstos, para
los clientes satisfechos. Si el costo promedio de mantenimiento estimado es mayor a 450 soles, cuando la
moto eléctrica tiene 5 años de antigüedad, como promoción se regalará un par de guantes impermeables de
invierno al cliente por el servicio de mantenimiento que realiza.

Antes de Aplicar el filtro, digite en la


base de datos: 1 en la columna de la
variable de filtro (tipo de vehículo), 3
en la columna de la variable
Satisfacción y 5 en la columna de la
variable independiente, este valor es
el valor que toma la variable para la
predicción.

Ahora aplicaremos el filtro:

Menú: Datos / Seleccionar casos / Si satisface la condición  Tipo = 1 &Satisfacción = 3/Continuar/Aceptar

Para la regresión: Menú: Analizar / Regresión / Lineales … Ingresar la variable dependiente e independiente/
En estadísticos marcar Durbin-Watson/continuar...

7
Estadística inferencial Regresión lineal simple

En Guardar, marcar: No estandarizados en valores


pronosticados y Residuos (Lo primero es para
obtener la estimación puntual y lo segundo para
crear la variable Error o residual) En Intervalos de
predicción marcar Media / Continuar y Aceptar.

Para el supuesto de Normalidad:


Menú: Analizar / Estadísticos descriptivos/Explorar …
Después de ingresar la variable Errores no estandarizados, en gráficos marcar: Gráficos de normalidad con
pruebas.

Para la estimación puntual y por intervalo:


Nos ubicamos en la parte final de la base de datos:

8
Estadística inferencial Regresión lineal simple

Interpretación:
Determinar si se regalará como promoción un par de guantes impermeables de invierno al cliente por el
servicio de mantenimiento que realiza.
Representación:
Variables:
Independiente (X): Años de antigüedad
Dependiente (Y): Costo por concepto de reparación y mantenimiento.
Herramienta Estadística: Regresión Lineal Simple (RLS)
Hipótesis:
H 0 : β 1=0; Modelo no válido o no significativo
H 1 : β1 ≠ 0; Modelo válido o significativo
Nivel de confianza = 95% (Se usa para intervalos de confianza)
Nivel de significación = 5% (Se usa para prueba de hipótesis)

Cálculos: Reportados por SPSS

Análisis y argumentación:
Validación de los supuestos:
1° Supuestos de normalidad de los errores.
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente

Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Unstandardized Residual .068 90 .200* .979 90 .149
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors

Estadístico de Prueba: 0.068


Como Sig = 0.200 > Alfa 0.05
Decisión estadística: No rechazar Ho
Conclusión estadística: Al 5% de nivel de significación, los errores se distribuyen normalmente, es decir, se
cumple el supuesto de Normalidad.

2° No autocorrelación de Errores. Estadístico Durbin Watson (D-W)

Resumen del modelob


Error estándar
R cuadrado de la Durbin-
Modelo R R cuadrado ajustado estimación Watson
1 .527a .278 .269 80.696 2.188

D-W = 2.188 pertenece al intervalo [1, 3]


Conclusión estadística: Al 5% de nivel de significancia, se cumple el supuesto de no autocorrelación de los
errores.

9
Estadística inferencial Regresión lineal simple

VALIDAR EL MODELO DE REGRESIÓN LINEAL SIMPLE (RLS)

Utilizando la Prueba F (Usar tabla de Análisis de Varianza ANOVA)


H 0 : β 1=0 ; (No existe relación lineal entre X e Y) Modelo no válido o no significativo
H 1 : β1 ≠ 0; (Existe relación lineal entre X e Y) Modelo válido o significativo

Usando la Tabla de Análisis de Varianza, tenemos:

ANOVAa
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 220133.358 1 220133.358 33.805 <.001b
Residuo 573048.242 88 6511.912
Total 793181.600 89
a. Variable dependiente: Costo por concepto de mantenimiento y reparación
b. Predictores: (Constante), Años de antiguedad del vehículo

CMR
Estadístico de prueba: F cal= =33.805 ; Fcrítico =3.949; Con Excel INV.F.CD (0,05;1;88)
CME

Fcal < Fcrítico; No se rechaza la hípotesis nula.

Tambien si nos basamos en el valor de sig.: Sig. = 0,001 < Alfa = 0,05; se rechaza la hipótesis nula.
Decisión estadística: Rechazar H0
Conclusión estadística: Al 5% de nivel de significancia, estamos a favor de que β 1 ≠ 0 ;
Podemos afirmar que existe una relación lineal entre los años de antigüedad del vehículo y el Costo por
concepto de reparación y mantenimiento.

Coeficientesa
Coeficientes
Coeficientes no estandarizados estandarizados
Modelo B Desv. Error Beta t Sig.
1 (Constante) 320.293 13.299 24.083 <.001
Años de antiguedad del 43.958 7.560 .527 5.814 <.001
vehículo
a. Variable dependiente: Costo por concepto de mantenimiento y reparación

Y^ =320.293+ 43.958 X

 Interpretación del coeficiente de regresión: ^β 1


^β =43.958 Si el número años de antigüedad aumenta en una unidad, el costo por concepto de
1
reparación y mantenimiento aumenta aproximadamente 43.958 soles.

10
Estadística inferencial Regresión lineal simple

 Interpretación del Coeficiente de Determinación (R2):

Resumen del modelob


R cuadrado Error estándar de la
Modelo R R cuadrado ajustado estimación Durbin-Watson
1 .527 a
.278 .269 80.696 2.188

R2=27.8% El 27.8% de la variabilidad del costo por concepto de reparación y mantenimiento es


explicada por la ecuación de regresión ajustada sobre los años de antigüedad.

 Interpretación del Coeficiente de Correlación (R):

Resumen del modelob


R cuadrado Error estándar de la
Modelo R R cuadrado ajustado estimación Durbin-Watson
1 +.527a .278 .269 80.696 2.188

NOTA: Se debe colocar el signo a R que es el mismo signo de B1.


Interpretación: La relación lineal entre costo por concepto de reparación y mantenimiento y los años de
antigüedad es moderada y directa

PREDICCIONES:

Predicción puntual:
Cuando la antigüedad del vehículo es 5 de años, el costo por concepto de reparación y mantenimiento es de
540.08 soles.

Predicción por intervalo (valor promedio):

IC (u / xo=5 )=[482.726 ; 597,436 ]


Con un nivel de confianza del 95%, cuando la antigüedad del vehículo es 5 de años, el costo por concepto de
reparación y mantenimiento está contenido en el Interval [482,726 ; 597.436]soles.
De acuerdo con los resultados obtenidos, el departamento de servicios generales de Green Lima regalará un
par de guantes impermeables de invierno.
11
Estadística inferencial Regresión lineal simple

Situación 3
El gerente de la empresa desea estimar el monto total de compra que comercializa en función del número de
cuotas de la compra, para los clientes que compran motos para trabajo. Si el monto total promedio de
compra es menor a 16000 soles, cuando el número de cuotas sea 10, como promoción se regalará una llanta
de repuesto.

Antes de Aplicar el filtro, digite en la base de datos: 1 en la columna de la variable de filtro (motivo: trabajo =
1), y 10 en la columna de la variable independiente (número de cuotas), este valor es el valor que toma la
variable para la predicción.

Interpretación:
Determinar si se regalará como promoción una llanta de repuesto.
Representación:
Variables:
Independiente (X): número de cuotas
Dependiente (Y): monto total de compra.
Herramienta Estadística: Regresión Lineal Simple (RLS)
Hipótesis:
H 0 : β 1=0; Modelo no válido o no significativo
H 1 : β1 ≠ 0; Modelo válido o significativo
Nivel de confianza = 95% (Se usa para intervalos de confianza)
Nivel de significación = 5% (Se usa para prueba de hipótesis)

Cálculos: Reportados por SPSS

Análisis y argumentación:
Validación de los supuestos:
1° Supuestos de normalidad de los errores.

12
Estadística inferencial Regresión lineal simple
H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente

Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Unstandardized .106 174 <.001 .932 174 <.001
Residual
a. Corrección de significación de Lilliefors

Estadístico de Prueba: 0.106


Como Sig = 0.001 < Alfa 0.05
Decisión estadística: se rechaza Ho
Conclusión estadística: Al 5% de nivel de significación, los errores no se distribuyen normalmente. No se
cumple el supuesto de Normalidad.

2° No autocorrelación de Errores. Estadístico Durbin Watson (D-W)

Resumen del modelob


R cuadrado Error estándar de
Modelo R R cuadrado ajustado la estimación Durbin-Watson
1 .664 a
.441 .438 7677.148 1.646
a. Predictores: (Constante), Número de cuotas de la compra
b. Variable dependiente: Monto total de compra

D-W = 1.646 pertenece al intervalo [1 ; 3]


Conclusión estadística: Al 5% de nivel de significancia, se cumple el supuesto de no autocorrelación de los
errores.

VALIDAR EL MODELO DE REGRESIÓN LINEAL SIMPLE (RLS)

Utilizando la Prueba F (Usar tabla de Análisis de Varianza ANOVA)


H 0 : β 1=0 ; (No existe relación lineal entre X e Y) Modelo no válido o no significativo
H 1 : β1 ≠ 0; (Existe relación lineal entre X e Y) Modelo válido o significativo

Usando la Tabla de Análisis de Varianza, tenemos:

ANOVAa
Modelo Suma de cuadrados gl Media cuadrática F Sig.
1 Regresión 8010617018.945 1 8010617018.945 135.915 <.001b
Residuo 10137438176.756 172 58938594.051
Total 18148055195.701 173
a. Variable dependiente: Monto total de compra
b. Predictores: (Constante), Número de cuotas de la compra

CMR
Estadístico de prueba: F cal= =135.915 ;
CME
13
Estadística inferencial Regresión lineal simple

Sig = 0.001 < 0.05

Tambien si nos basamos en el valor de sig.: Sig. = 0,001 < Alfa = 0,05; se rechaza la hipótesis nula.
Decisión estadística: Rechazar H0
Conclusión estadística: Al 5% de nivel de significancia, estamos a favor de que β 1 ≠ 0 ;
Podemos afirmar que existe una relación lineal entre el monto total de compra y el número de cuotas
realizadas.

Coeficientesa
Coeficientes no estandarizados Coeficientes estandarizados
Modelo B Desv. Error Beta t Sig.
1 (Constante) 4751.914 1057.892 4.492 <.001
Número de cuotas de la compra 947.658 81.287 .664 11.658 <.001
a. Variable dependiente: Monto total de compra

Y^ =4751.914+ 947.658 X
Interpretación del coeficiente de regresión: ^β 1
^β =947.658
1
Cuando incrementamos en una unidad el número de cuotas realizadas por los clientes, el Monto total de
compra se incrementará aproximadamente en 947.658 soles.

Interpretación del Coeficiente de Determinación (R2):


R2 = 0.441: El 44.1% de la variabilidad del Monto total de compra es explicado por el Número de cuotas
realizadas por el cliente a través del modelo de regresión estimado.

PREDICCION:

Predicción por intervalo (valor promedio):

IC (u / xo=10 )=[ 13071.297; 15385.688 ] soles


Con un nivel de confianza del 95%, cuando el número de cuotas es 10, el monto total de compra está
contenido en el Intervalo [13071.297; 15385.688]soles.
De acuerdo con los resultados obtenidos, se recomienda regalar una llanta de repuesto.
.

14

También podría gustarte