Está en la página 1de 2

Caso: Gastos de Viaje

El presente caso consiste en la aplicación de los conceptos de regresión lineal para aproximarnos a
un determinado fenómeno, en este caso cómo se relacionan los gastos de viaje en función de la
edad.

El caso muestra también cómo se pueden detectar algunas singularidades aún en fenómenos
aparentemente simples como este caso y ante los cuáles el especialista en Ciencia de datos debe
estar alerta.

Los datos para hacer la regresión se encuentran en 02.Gastos_viaje.xls y contiene la siguiente


información:

Observation: secuencial de los registros


Age: edad de la persona que registra gastos en los viajes
Expenditures: total de gastos realizados durante un viaje en feriados.

Preguntas
Utilice el R para desarrollar las siguientes preguntas y complete las respuestas y análisis en el
mismo archivo en Word, puede adjuntar también su archivo en rmd y html generado.

a. Cargue la información al dataframe df_viaje


Cargue los siguientes paquetes en R que le permitirán manipular los datos y conectarse
con un archivo excel:
library(tidyverse) # para manipular datos y graficarlos
library(readxl) # para manipular archivos excel

df_viaje <- read_xls(“02.Gastos_viaje.xls”) # lee archivo excel


df_viaje <- as.data.frame(df_viaje) # transforma a data frame

b. Realice el AED del Dataset (histograma, análisis de dispersión, correlación). Indique sus
conclusiones de esta fase.
c. Plantee un modelo y utilice todos los datos para realizar una estimación de un modelo de
regresión lineal. Muestre los valores de los coeficientes y sus conclusiones.
d. Pareciera que existen dos grupos que corresponden a 2 tipos de clientes, uno conformado
por los menores de 40 años y otro por los mayores de 40 años. Forme dos grupos y realice
la estimación de una regresión lineal para cada uno de ellos. Indique sus conclusiones.
e. ¿Qué puede concluir con base a los 3 modelos generados? ¿Qué observa en los
coeficientes asociados a la variable de gastos?

También podría gustarte