Está en la página 1de 10

Asignatura Datos del alumno Fecha

Apellidos: Bernate Mira


Estadística Inferencial 01/10/2023
Nombre: Ibett Karina

Actividad. Aplicación del análisis de regresión


lineal simple

Objetivos

Con esta actividad vas a conseguir aprender mejor el concepto de regresión lineal y
su uso desde un punto de vista elemental.

Pautas de elaboración

Mediante un análisis de regresión lineal aplicado a un caso muy sencillo, podrás


comprender mejor el concepto de regresión lineal al tiempo y ver su aplicación en
un caso concreto con un registro pequeño de observaciones.

La idea original de esta actividad está sacada de un interesante artículo


que encontrarás en http://marketvariance.com/

Enunciado de la actividad

En una empresa de comida rápida se sabe que el nivel de satisfacción de los clientes
está relacionado con el tiempo de entrega en minutos del pedido. No obstante, por
mucho que quieran reducir los tiempos, es difícil controlar todas las variables
asociadas
© Universidad Internacional al (UNIR)
de La Rioja reparto que lleven así a reducir ese tiempo de entrega.

Aun así, Juanma Martínez, que atiende las llamadas de los clientes que realizan los
pedidos, sabe que algo que tranquiliza a sus clientes es darles una aproximación del
tiempo que van a tener que esperar, algo que, con un registro de entregas y

Tema 6. Actividades 1
Asignatura Datos del alumno Fecha
Apellidos: Bernate Mira
Estadística Inferencial 01/10/2023
Nombre: Ibett Karina

considerando la distancia a la que el repartidor deberá desplazarse, es fácil de


averiguar, al menos en promedio.

Los clientes siempre preguntan cuánto tiempo va a tardar en llegar su pedido. Para
darles una respuesta, Juanma necesita hacer pronósticos sobre el tiempo que
tardan los repartidores en llegar a su destino. Para ello, dispone de un registro de
datos sobre 10 entregas en las que se indica la distancia hasta la que fueron a llevar
el pedido los repartidores y el tiempo que tardaron en llegar.

La Tabla 1 contiene esos datos:

Distancia de entrega Tiempo de entrega


Entregas
en kilómetros en minutos

1 3 5

2 12 10

3 4 5

4 7 9

5 6 8

6 14 15

7 15 20

8 16 18

9 11 12

10 8 9

Tabla 1. Fuente: elaboración propia.


© Universidad Internacional de La Rioja (UNIR)

Una tarde cualquiera, una de sus tiendas comienza a recibir llamadas. En la primera
llamada, un cliente pide que le diga cuánto tiempo va a tardar en llegarle la pizza.
Sabiendo que ese cliente se encuentra a 14 kilómetros de distancia, ¿qué tiempo le

Tema 6. Actividades 2
Asignatura Datos del alumno Fecha
Apellidos: Bernate Mira
Estadística Inferencial 01/10/2023
Nombre: Ibett Karina

dirá? ¡Exacto! 15 minutos. Lo supo sin necesidad de hacer cálculos porque


anteriormente ya había entregado un pedido a la misma distancia y ese fue el
tiempo que le tomó a su repartidor.

En una segunda llamada, el cliente vuelve a lanzarle la dichosa pregunta y se sabe


que está a 10 kilómetros de distancia. En esta ocasión, vuelve a buscar en la tabla
de datos y se da cuenta de que no han hecho ninguna entrega a esa distancia, por
tanto, ¡no sabe cuánto tiempo de espera le debe indicar al cliente que está al
teléfono!

Vamos a ayudarle. Para ello, realiza los análisis de regresión necesarios para
satisfacer a los clientes dando respuesta a las siguientes posibles preguntas que
estos nos podrían plantear:

1. Analizando la primera llamada y el tiempo que el repartidor se ha demorado en


realizar el reparto, 13 minutos, ¿qué aprendizaje extraerías de la respuesta
errónea dada al cliente? Reflexiona sobre qué ha pasado e indica qué debería
haber hecho para dar respuesta al cliente.

2. En la segunda llamada, ¿qué le responderías al cliente? ¿Cuál es el porcentaje de


fiabilidad que le damos al valor transmitido a nuestros clientes?

3. Parece que nuestro responsable de llamadas va pillando la técnica, pero estar


haciendo cálculos constantemente le resulta agotador. Por tanto, ¿crees que
podría decirles a todos sus clientes con una fiabilidad del 99 % que el tiempo de
© Universidad Internacional de La Rioja (UNIR)
espera es los kilómetros a los que se encuentre más un coeficiente igual a
2,0603? ¿Cómo interpretarías ese coeficiente que le estamos sumando a la
distancia?

Tema 6. Actividades 3
Asignatura Datos del alumno Fecha
Apellidos: Bernate Mira
Estadística Inferencial 01/10/2023
Nombre: Ibett Karina

4. Realiza de nuevo el apartado anterior, esta vez, dando respuesta en base a un


intervalo de confianza. ¿Qué otro uso podrías hacer de ese intervalo?

Extensión y formato

Lo necesario para realizar el análisis de regresión lineal.

Rúbrica:

Aplicación del
Puntuación
análisis de Peso
Descripción máxima
regresión %
(puntos)
lineal simple
3,5
(0,75 el resultado de
Criterio 1 Es capaz de realizar correctamente los
cada coeficiente; 35 %
cálculos del análisis de relación lineal.
1,5 los cálculos
estadísticos previos)

Sabe interpretar cada apartado


Criterio 2 relacionándolo con los diferentes pasos del 2 20 %
análisis de relación lineal.

1,5
Utiliza Excel para realizar el cálculo de (0,5 para cada
Criterio 3 regresión mostrando así la estimación sobre elemento del gráfico: 15 %
una nube de puntos. nube puntos, recta y
ecuación)

2
Criterio 4 Realiza los cálculos correctamente. (0,5 en cada 20 %
apartado)

1
Criterio 5 Justifica bien las respuestas de acuerdo con
(0,25 en cada 10 %
los resultados obtenidos.
apartado)
© Universidad Internacional de La Rioja (UNIR) 10 100 %

Tema 6. Actividades 4
Asignatura Datos del alumno Fecha
Apellidos: Bernate Mira
Estadística Inferencial 01/10/2023
Nombre: Ibett Karina

REGRESION LINEAL SIMPLE


Dado el caso:

Distancia de entrega Tiempo de entrega


Entregas
en kilómetros en minutos
1 3 5
2 12 10
3 4 5
4 7 9
5 6 8
6 14 15
7 15 20
8 16 18
9 11 12
10 8 9

En el que la variable independiente “x” es la distancia en KM y la variable


dependiente “y” es el tiempo de entrega en minutos, graficamos los datos
iniciales:

Relacion Distancia/Tiempo de entrega


25
y- Tiempo de entrega

20
15
10
5
0
2 4 6 8 10 12 14 16 18
x- Distancia KM

Donde ya podemos identificar, que se trata de un caso de regresión lineal por el


comportamiento de los puntos de la gráfica.
Luego hallamos los datos necesarios para la ecuación de regresión lineal, dónde:
© Universidad Internacional de La Rioja (UNIR)
y=β 0 + β 1 x = E
Hallamos las medias para las variables:

x=¿ 9.6 Media X


y=¿ 11.1 Media Y

Tema 6. Actividades 5
Asignatura Datos del alumno Fecha
Apellidos: Bernate Mira
Estadística Inferencial 01/10/2023
Nombre: Ibett Karina

Aplicamos el método de mínimos cuadrados, para lograr establecer los valores


de β 0 y β 1:

Distancia de Tiempo de
entrega en entrega
Entregas
kilómetros en minutos ( x i−x ) ( y i− y) ( x i−x ) ( y i − y) ( x i−x )2
xi yi
1 3 5 -6,6 -6,1 40,26 43,56
2 12 10 2,4 -1,1 -2,64 5,76
3 4 5 -5,6 -6,1 34,16 31,36
4 7 9 -2,6 -2,1 5,46 6,76
5 6 8 -3,6 -3,1 11,16 12,96
6 14 15 4,4 3,9 17,16 19,36
7 15 20 5,4 8,9 48,06 29,16
8 16 18 6,4 6,9 44,16 40,96
9 11 12 1,4 0,9 1,26 1,96
10 8 9 -1,6 -2,1 3,36 2,56
0 202,4 194,4
∑ ( x i−x )( y i− y )
β 1= 2 β 0= y −β1 x
∑ ( xi −x )

β 1=¿ 1.0412
β 0=¿ 1.1049

De esta forma nuestra representación de la ecuación sería:

Relación Distancia y tiempo de entrega


25

20
y- Tiempo entrega Min

f(x) = 1.04115226337449 x + 1.10493827160494


15 R² = 0.889528147349075

10

5
© Universidad Internacional de La Rioja (UNIR)
0
2 4 6 8 10 12 14 16 18
x- Distancia KM

^y =1,049+ 1,0472 x

Tema 6. Actividades 6
Asignatura Datos del alumno Fecha
Apellidos: Bernate Mira
Estadística Inferencial 01/10/2023
Nombre: Ibett Karina

Analizando la primera llamada y el tiempo que el repartidor se ha demorado en


realizar el reparto, 13 minutos, ¿qué aprendizaje extraerías de la respuesta errónea
dada al cliente? Reflexiona sobre qué ha pasado e indica qué debería haber hecho
para dar respuesta al cliente.
- El error de Juanma fue darle un tiempo de entrega al cliente basado en un
único criterio, y no realizar una estimación con un modelo que le permita
predecir los tiempos de entrega aproximados según la distancia, ya que con los
únicos datos que tiene en su base, no podría dar respuesta a un cliente que se
ubique a una distancia “x” que no tenga en sus registros.
En la segunda llamada, ¿qué le responderías al cliente? ¿Cuál es el porcentaje de
fiabilidad que le damos al valor transmitido a nuestros clientes?
- En la segunda llamada el cliente indica que se encuentra a una distancia de
10km, a lo cual no se le puede dar respuesta ya que no se tiene un registro
de entrega a esa distancia. Para ello aplicamos la ecuación que hallamos
anteriormente:

^y =1,049+ 1,0472 x

Dónde “x” es la variable de distancia a la que le queremos dar un tiempo


aproximado en este caso 10 km, entonces:
^y =1,049+ 1,0472¿ 10)= 11.5

La respuesta que le daríamos a este cliente, es que el tiempo aproximado


para la entrega de su pedido son 11.5 minutos.

© Universidad Internacional de La Rioja (UNIR)

Tema 6. Actividades 7
Asignatura Datos del alumno Fecha
Apellidos: Bernate Mira
Estadística Inferencial 01/10/2023
Nombre: Ibett Karina

- El porcentaje de fiabilidad que tenemos con la aplicación de la ecuación se


halla de la siguiente manera: SCE=∑ ( yⅈ −^y i ) Suma de cuadrados
2

debida al error.
2
STC=∑ ( y i− y ) Suma total de cuadrados.
2
SCR=∑ ( ^y i− y ) Suma de cuadrados debido a la regresión.
Distancia de Tiempo de
entrega en entrega (yi-yEst) (yi-yEst)^2 (yEst-
Entregas yEst (yi-ybar)^2
kilómetros en minutos Error error 2 ybar)^2
xi yi
1 3 5 4,2 0,8 0,6 37,2 47,2
2 12 10 13,6 -3,6 13,0 1,2 6,2
3 4 5 5,3 -0,3 0,1 37,2 34,0
4 7 9 8,4 0,6 0,4 4,4 7,3
5 6 8 7,4 0,6 0,4 9,6 14,0
6 14 15 15,7 -0,7 0,5 15,2 21,0
7 15 20 16,7 3,3 10,7 79,2 31,6
8 16 18 17,8 0,2 0,1 47,6 44,4
9 11 12 12,6 -0,6 0,3 0,8 2,1
10 8 9 9,4 -0,4 0,2 4,4 2,8
26,17 236,90 210,73
SCE STC SCR

Con estos valores podemos hallar el coeficiente de determinación:


2 SCR
r=
SCT
2 210 , 73
Entonces r = =0,8895 , lo cual expresado en valor porcentual sería un
236 , 90
88,9% de fiabilidad en la respuesta dada al cliente.

© Universidad Internacional de La Rioja (UNIR)


5. Parece que nuestro responsable de llamadas va pillando la técnica, pero estar
haciendo cálculos constantemente le resulta agotador. Por tanto, ¿crees que
podría decirles a todos sus clientes con una fiabilidad del 99 % que el tiempo de
espera es los kilómetros a los que se encuentre más un coeficiente igual a

Tema 6. Actividades 8
Asignatura Datos del alumno Fecha
Apellidos: Bernate Mira
Estadística Inferencial 01/10/2023
Nombre: Ibett Karina

2,0603? ¿Cómo interpretarías ese coeficiente que le estamos sumando a la


distancia?
- Interpreto el coeficiente sugerido cómo el límite superior en un intervalo de
confianza del 99%, por lo tanto, para verificar si es correcta la afirmación,
procedemos a calcular el nivel de confianza de de “x”, al cuál le voy a dar un
valor estimado de 11km, para ello nos apoyamos con la formula:


2
1 ( x−x )
IC 99 %=^y ± t∗S y∗x +
n ∑ ( x −x )2

Hallamos el error estándar de la estimación:


2
∑ ( y− ^y )
s x∗ y =
n−2

Distancia de Tiempo de
entrega en entrega (yi-yEst) (yi-yEst)^2
Entregas yEst
kilómetros en minutos Error error 2
xi yi
1 3 5 4,2 0,8 0,6
2 12 10 13,6 -3,6 13,0
3 4 5 5,3 -0,3 0,1
4 7 9 8,4 0,6 0,4
5 6 8 7,4 0,6 0,4
6 14 15 15,7 -0,7 0,5
7 15 20 16,7 3,3 10,7
8 16 18 17,8 0,2 0,1
9 11 12 12,6 -0,6 0,3
10 8 9 9,4 -0,4 0,2
26,17

s x∗ y =
√ 26.17
10−2
= 0.7855

© Universidad Internacional de La Rioja (UNIR)

IC 99 %=19 ,85 ± 2,015∗0,7855


√ 1 1 ,96
+
10 194.4
I C99%= 19 , 85 ±1,5827 √ 0. 110 = 19,85 ± 0.52
Por lo tanto:

Tema 6. Actividades 9
Asignatura Datos del alumno Fecha
Apellidos: Bernate Mira
Estadística Inferencial 01/10/2023
Nombre: Ibett Karina

Linferior= 19,85-0.52= 19,33


Lsuperior= 19,85+0.52=20,37

Es decir que para una distancia de 11 km el tiempo máximo de espera es de 20,37


minutos.

© Universidad Internacional de La Rioja (UNIR)

Tema 6. Actividades 10

También podría gustarte