Está en la página 1de 16

ACTIVIDAD GRUPAL 2:

MINI CASE AW BIKES (II): CONVIRTIENDO DATOS EN CONOCIMIENTO

JESSICA JULIETH LAGUADO PABÓN

CLAUDIA VIVIANA RODRÍGUEZ BERNAL

PAULA ANDREA SIACHOQUE QUINTERO

WBEIMAR VILLADA MARULANDA

EQUIPO 4

ESPECIALIZACIÓN EN ALTA GERENCIA

INGENIERO HENRY FAJARDO FONSECA

DOCENTE

GESTIÓN DE PROYECTOS DE INTELIGENCIA DE NEGOCIOS

FUNDACIÓN UNIVERSITARIA INTERNACIONAL DE LA RIOJA

BOGOTÁ, 21 DE ABRIL DE 2024


INTRODUCCIÓN

En un mundo donde las empresas buscan comprender y adaptarse a las complejidades

de las dinámicas familiares y financieras de sus clientes, la empresa AW Bikes ha emprendido

un ejercicio de investigación profunda. AW Bikes, un fabricante líder de bicicletas de alta

calidad, se encuentra en un entorno empresarial competitivo donde la comprensión de las

necesidades y comportamientos de los consumidores es esencial para el éxito a largo plazo.

Conscientes de que las decisiones de compra están influenciadas por una multitud de factores,

desde el estado civil hasta el tamaño de la familia y el presupuesto disponible, AW Bikes se

ha embarcado en un estudio exhaustivo para explorar estas relaciones y comprender mejor a

su base de clientes.

El objetivo principal de este ejercicio de investigación es desentrañar las

complejidades que rodean la relación entre los factores familiares y financieros y el

comportamiento de compra de los clientes de AW Bikes. Para lograr este objetivo, la empresa

ha recopilado datos sobre una serie de variables clave, incluida la cantidad de hijos en el

hogar, el estado civil de los clientes y el presupuesto familiar promedio. Estos datos se

utilizarán para realizar análisis de regresión, una técnica estadística poderosa que permite

identificar relaciones significativas entre variables independientes (como el número de hijos)

y una variable dependiente (como el presupuesto disponible para comprar una bicicleta).

Este ejercicio de investigación tiene varias metas específicas tales como comprender

cómo el tamaño de la familia y el estado civil de los clientes influyen en sus decisiones de

compra. También la empresa está interesada en comprender cómo el presupuesto familiar

promedio se relaciona con la disposición de los clientes a comprar bicicletas. Por otro lado,

hallazgos de esta investigación proporcionarán información valiosa que puede ser utilizada
para informar la estrategia de marketing y desarrollo de productos de AW Bikes. Si se

identifican tendencias claras, la empresa podrá adaptar sus productos y mensajes de marketing

para satisfacer mejor las necesidades y deseos de sus clientes.

En última instancia, este ejercicio de investigación no solo beneficiará a AW Bikes al

proporcionar una comprensión más profunda de sus clientes, sino que también tiene el

potencial de generar conocimientos más amplios sobre la intersección entre las dinámicas

familiares, los factores financieros y el comportamiento del consumidor en la industria de

artículos de ocio al aire libre.

OBJETIVO GENERAL

Demostrar capacidades para modelar datos y focalizar esfuerzos de la compañía en de

un grupo de individuos.

OBJETIVOS ESPECÍFICOS

1. Entender la Influencia de las Familias y las Finanzas en las Decisiones de Compra de

Bicicletas de AW Bikes.

2. Examinar cómo el tamaño de la familia y el estado civil afectan las decisiones de

compra de bicicletas.

3. Investigar cómo el presupuesto familiar influye en el tipo de bicicleta que se elige y el

monto gastado en ella.

4. Utilizar los hallazgos para adaptar los productos y mensajes de marketing de AW

Bikes para satisfacer mejor las necesidades de los clientes.


ELECCIÓN DE VARIABLES PREDICTORAS Y SU JUSTIFICACIÓN

Para elegir las variables predictoras adecuadas, es importante considerar cómo cada

una puede influir en el comportamiento de compra de los clientes. En este caso, las variables

predictoras podrían incluir:

 Género: El género desempeña un papel en el comportamiento de

compra, ya que las preferencias de compra varían tanto en hombres como en mujeres

Genero
9350 Prevalece la compra del
9300
9250 género masculino con un
9200 Total
9150
51% y para el genero
9100
femenino el 49%
9050
9000
8950
F M

 Edad: La edad influye en la probabilidad de comprar una bicicleta. Por

ejemplo, es posible que los clientes con menos edad estén más interesados en comprar

bicicletas y realizar compras frecuentes.

Rango de Edades
La edad que más
7000
6000 representa compras está
5796 5974
5000
4000
en el rango de 36 a 45
4270
3000 años , seguido de 25 a 35
2000 2315
1000 años
0
23 - 35 36-45 46-56 57-94
 Estado civil: El estado civil también es importante, ya que las personas

casadas o con pareja tienen más responsabilidades familiares que influyan en sus

decisiones de compra.

Compras por Estado Civil


10500 Se evidencia que la
10000 mayoría de los
9500
compradores son
9000
8500 casados
8000
7500
Casado Soltero

 Número de hijos en el hogar: El número de hijos en el hogar podría

influir en la compra de bicicletas, ya que las necesidades y preferencias de la familia

pueden ser un factor importante.

Numero de Hijos en el Hogar


10000 De nuestra base de
9000
8000 datos, prevalece que los
7000
6000
compradores tienen 0
5000 hijos, seguido de
4000
3000 hogares con 2 hijos
2000
1000
0
0 1 2 3

 Número de carros en el hogar: El número de automóviles en el hogar

podría estar relacionado con la probabilidad de comprar una bicicleta como alternativa

de transporte y con el gasto en recambios.


Total de Carros Se evidencia que nuestra
8000
7000
mayor cantidad de
6000 compradores tienen
5000
4000
entre 1 y 2 vehículos en
3000 el hogar
2000
1000
0
0 1 2 3 4 5

 Número de ventas por país: El número de cliente de bicicletas por país.

Ventas por País


10000
Nuestro mayor número
8000 de compradores Se
6000
ubican en Estados
4000
2000 Unidos y en la segunda
0 posición Australia
Australia Canada France Germany United United
Kingdom States

 Gasto Promedio Mensual del Presupuesto:

Rango De Presupuestos
10000
9000
8000
7000
6000
5000
4000
3000
2000
1000
0
44 - 50 51 - 56 57 - 65
ELECCIÓN DE MODELO DE CLASIFICACIÓN: REGRESIÓN LOGÍSTICA

600 REGRESION LOGISTICA

500

400

300

200

100

0
0 50 100 150 200 250 300 350 400
Genero mujer y hombre Linear (Genero mujer y hombre )
Estado Civil Casados Linear (Estado Civil Casados)
Linear (Estado Civil Casados) Estado Civil Solteros
Linear (Estado Civil Solteros) Cantidad de Hijos Por Hogar 0
Linear (Cantidad de Hijos Por Hogar 0) Cantidad de Hijos Por Hogar 1
Linear (Cantidad de Hijos Por Hogar 1) Cantidad de Hijos Por Hogar 2
Linear (Cantidad de Hijos Por Hogar 2) Promedio de Presupuesto familiar
Linear (Promedio de Presupuesto familiar)

Grafica 1 Regresión logística

Línea (cantidad de hijos por hogar 0) y = 0,6135x + 180,36


Línea (estado civil casados) y = 1,165x - 48,308
Línea (estado civil solteros) y = 0,7811x + 68,263
Línea (cantidad de hijos por hogar 2) y = 0,7442x - 83,185
Línea (Promedio presupuesto
y = 0,0542x + 51,459
familiar)
Línea (cantidad de hijos por hogar 1) y = 0,5884x - 77,219
Estado civil solteros y = 0,9462x + 19,955

El tipo de modelo de clasificación que se elegio es el de Regresión Logística para

identificar clientes potenciales para la compra de bicicletas en AW-Bikes. Debido a que es un


modelo robusto y ampliamente utilizado. Además, este modelo es capaz de manejar variables

predictoras tanto categóricas como numéricas.

El eje Y representa el número de cantidad de hijos por hogar (0, 1 y 2) . La línea

amarilla verde y azul representa la tendencia general de la cantidad de niños por hogar, como

el género (hombre y mujer), el estado civil (casados y solteros), el presupuesto familiar

promedio y la interacción entre estas variables.

PRESENTACIÓN DE LA MATRIZ DE CONFUSIÓN

Dando continuidad a las fases de un proyecto de inteligencia de negocios, y avanzando

en cada una de sus fases, a continuación, se continua con la fase de construir, probar y refinar,

con el trascurrir del tiempo la tecnología a avanzado en la construcción de herramientas para

probar e implementar soluciones en la inteligencia de negocios, lo anterior alienado con la

productividad y la calidad. Para analizar el ejercicio en mención y las variables utilizadas, se

realizará utilizando la matriz de confusión, también conocida como matriz de error, la cual

contiene una tabla resumida, que se utiliza para evaluar el rendimiento de un modelo de

clasificación, en esta matriz, se resumen tanto las predicciones correctas como las incorrectas,

desglosadas por cada clase.

Con las siguientes definiciones se explica más a fondo de que trata cada valor y así

explicar más profundo la temática del tema

Definición:

Positivo (P): La observación es positiva (por ejemplo, es un perro).

Negativo (N): La observación no es positiva (por ejemplo, no es un perro).

Verdadero Positivo (TP): Resultado en el que el modelo predice correctamente la

clase positiva.
Verdadero Negativo (TN): Resultado donde el modelo predice correctamente la

clase negativa.

Falso Positivo (FP): También llamado error de tipo 1, ocurre cuando el modelo

predice incorrectamente la clase positiva cuando en realidad es negativa.

Falso Negativo (FN): También llamado error de tipo 2, es un resultado en el que el

modelo predice incorrectamente la clase negativa cuando en realidad es positiva.

Utilidad de la Matriz de Confusión:

Con el desarrollo de ejercicio se evalúa el rendimiento del modelo de clasificación

definido en el desarrollo de este trabajo, la cual se graficó por medio de una regresión

logística.

Supervisar y gestionar modelos.

Métricas Relacionadas:

La matriz de confusión permite calcular varias métricas, como la precisión, la sensibilidad y

la especificidad

La matriz de confusión es una herramienta para valorar el modelo de clasificación

utilizado para el ejercicio compra de bicicletas en AW-Bikes, sirve para mostrar de forma

explícita cuando una clase es confundida con otra, lo cual nos permite trabajar de forma

separada con distintos tipos de error.

ítem Predicción Valor Real Resultado


1 compra No compra VP
2 compra No compra VP
3 no compra No compra FP
4 compra No compra VP
5 compra No compra VP
6 no compra No compra FP
7 no compra No compra FP
8 compra No compra VP
9 no compra No compra FP
10 compra No compra VN
11 compra No compra VN
12 compra No compra VN
13 compra No compra VN
14 compra No compra VN
15 no compra No compra FN
Tabla N° 1 Actividad2 datos elaboración propia

FP
RESULTADO MATRIZ DE CON
VP PREDICCIÓN / REAL
VP P N
FP P VP FP
FP N FN VN
VP
FP
VN EXACTITUD (VP+VN)/(VP+FP+VN+FN)
VN ERROR (FP+FN)/VP+FP+VN+FN)
VN SENSIBILIDAD VP/(VP+FN)
VN ESPECIALIDAD VN/(VN+FP)
VN PRESICION VP / (VP+FP)
FN MEDIDA F(F - MEASURE) 2*VP(2VP+FP+FN)
VP TASA DE FALSOS NEGATIVOS FN/(FN+VP)
VALOR PREDICTIVO POSTIVO VP/(FP+VP)
VALOR PREDICTIVO NEGATIVO VN/(VN+FN)

Tabla N° 2 Matriz de confusión aplicada al ejercicio elaboración propia

En la tabla anterior se observa la diagonal principal los valores Verdadero Positivo

denominado VP y Verdadero Negativo VN, son los valores de la diagonal principal datos más

importantes corresponden a los valores estimados de forma correcta por el modelo, para el

caso del ejercicio VP = 6 y VN = 5.

La otra diagonal, por lo tanto, representa los casos en los que el modelo “se ha

equivocad Falsos Negativos FN = 1 y Falsos Positivos FP = 4

Exactitud: representa el porcentaje de predicciones correctas frente al total, para

nuestro caso el resultado arrojo el 69%, el anterior resultado es el cociente entre los casos bien

clasificados por el modelo.


Sensibilidad: representa la habilidad del modelo de los casos relevantes, de igual

manera representa la tasa de verdaderos positivos para nuestro caso el valor corresponde al

85% de casos que representan positivos para la compra de bicicletas

Especificidad: para esta clasificación se encuentra la tasa de verdaderos negativos, es

la proporción entre los casos negativos bien clasificados por el modelo respecto al total de

negativos. Para nuestro caso es valor equivale al 56% estos significan que la capacidad de

descrinar los casos negativos es buena, concluye que es un poco difícil obtener falsos

positivos.

Para nuestro caso el modelo a elegir es la sensibilidad. Por lo tanto, este modelo es

mucho mas sensible. Esta situación nos interesa cuando nuestro objeto es obtener los

verdaderos positivos para adquirir la compra de las bicicletas.

PRESENTACIÓN DE LA PREDICCIÓN APLICADA AL MODELO DE

CLASIFICACIÓN ELEGIDO

Según el modelo de clasificación elegido de Regresión Logística para identificar

clientes potenciales para la compra de bicicletas en AW-Bikes, y con los valores para la

variable independiente \( x \), se calculan los correspondientes valores de \( y \) utilizando las

ecuaciones de regresión dadas:

1. Para la línea "cantidad de hijos por hogar 0":

y = 0.6135x + 180.36

x = 0 ⇒ y = 0.6135(0) + 180.36 = 180.36

x = 50 ⇒ y = 0.6135(50) + 180.36 = 210.61

x = 100 ⇒ y = 0.6135(100) + 180.36 = 240.86

x = 150 ⇒ y = 0.6135(150) + 180.36 = 271.11

x = 200 ⇒ y = 0.6135(200) + 180.36 = 301.36


x = 250 ⇒ y = 0.6135(250) + 180.36 = 331.61

x = 300 ⇒ y = 0.6135(300) + 180.36 = 361.86

x = 350 ⇒ y = 0.6135(350) + 180.36 = 392.11

x = 400 ⇒ y = 0.6135(400) + 180.36 = 422.36

2. Para la línea "estado civil casados":

y = 1.165x - 48.308

x = 0 ⇒ y = 1.165(0) - 48.308 = -48.308

x = 50 ⇒ y = 1.165(50) - 48.308 = 54.192

x = 100 ⇒ y = 1.165(100) - 48.308 = 116.692

x = 150 ⇒ y = 1.165(150) - 48.308 = 179.192

x = 200 ⇒ y = 1.165(200) - 48.308 = 241.692

x = 250 ⇒ y = 1.165(250) - 48.308 = 304.192

x = 300 ⇒ y = 1.165(300) - 48.308 = 366.692

x = 350 ⇒ y = 1.165(350) - 48.308 = 429.192

x = 400 ⇒ y = 1.165(400) - 48.308 = 491.692

3. Para la línea "estado civil solteros":

y = 0.7811x + 68.263

x = 0 ⇒ y = 0.7811(0) + 68.263 = 68.263

x = 50 ⇒ y = 0.7811(50) + 68.263 = 106.373

x = 100 ⇒ y = 0.7811(100) + 68.263 = 144.473

x = 150 ⇒ y = 0.7811(150) + 68.263 = 182.583

x = 200 ⇒ y = 0.7811(200) + 68.263 = 220.693

x = 250 ⇒ y = 0.7811(250) + 68.263 = 258.803

x = 300 ⇒ y = 0.7811(300) + 68.263 = 296.913

x = 350 ⇒ y = 0.7811(350) + 68.263 = 335.023


x = 400 ⇒ y = 0.7811(400) + 68.263 = 373.133

4. Para la línea "cantidad de hijos por hogar 2":

y = 0.7442x - 83.185

x = 0 ⇒ y = 0.7442(0) - 83.185 = -83.185

x = 50 ⇒ y = 0.7442(50) - 83.185 = -46.085

x = 100 ⇒ y = 0.7442(100) - 83.185 = -8.985

x = 150 ⇒ y = 0.7442(150) - 83.185 = 28.115

x = 200 ⇒ y = 0.7442(200) - 83.185 = 65.215

x = 250 ⇒ y = 0.7442(250) - 83.185 = 102.315

x = 300 ⇒ y = 0.7442(300) - 83.185 = 139.415

x = 350 ⇒ y = 0.7442(350) - 83.185 = 176.515

x = 400 ⇒ y = 0.7442(400) - 83.185 = 213.615

5. Para la línea "Promedio presupuesto familiar":

y = 0.0542x + 51.459

x = 0 ⇒ y = 0.0542(0) + 51.459 = 51.459

x = 50 ⇒ y = 0.0542(50) + 51.459 = 53.569

x = 100 ⇒ y = 0.0542(100) + 51.459 = 55.679

x = 150 ⇒ y = 0.0542(150) + 51.459 = 57.789

x = 200 ⇒ y = 0.0542(200) + 51.459 = 59.899

x = 250 ⇒ y = 0.0542(250) + 51.459 = 62.009

x = 300 ⇒ y = 0.0542(300) + 51.459 = 64.119

x = 350 ⇒ y = 0.0542(350) + 51.459 = 66.229

x = 400 ⇒ y = 0.0542(400) + 51.459 = 68.339


1. Para la línea "cantidad de hijos por hogar 1":

y = 0.5884x - 77.219

x = 0 ⇒ y = 0.5884(0) - 77.219 = -77.219

x = 50 ⇒ y = 0.5884(50) - 77.219 = -48.019

x = 100 ⇒ y = 0.5884(100) - 77.219 = -18.819

x = 150 ⇒ y = 0.5884(150) - 77.219 = 10.381

x = 200 ⇒ y = 0.5884(200) - 77.219 = 39.581

x = 250 ⇒ y = 0.5884(250) - 77.219 = 68.781

x = 300 ⇒ y = 0.5884(300) - 77.219 = 97.981

x = 350 ⇒ y = 0.5884(350) - 77.219 = 127.181

x = 400 ⇒ y = 0.5884(400) - 77.219 = 156.381

1. Cantidad de hijos por hogar 0: Esto nos dice cómo cambia el dinero disponible en

un hogar cuando no hay hijos. A medida que aumenta el número de hijos, el dinero disponible

tiende a aumentar gradualmente.

2. Estado civil casados: Esta línea nos muestra cómo cambia el dinero disponible

dependiendo de si las personas están casadas. Sugiere que, en general, las personas casadas

tienden a tener más dinero disponible que las solteras.

3. Estado civil solteros: Similar al caso de los casados, esta línea nos dice cómo

cambia el dinero disponible para las personas solteras. Indica que las personas solteras

también tienden a tener más dinero disponible a medida que aumenta la variable relacionada

con el estado civil.

4. Cantidad de hijos por hogar 2: Nos muestra cómo afecta el tener dos hijos al

dinero disponible en un hogar. Mientras más hijos haya, se espera que haya más dinero

disponible.
5. Promedio presupuesto familiar: Esta línea nos dice cómo cambia el dinero

disponible en función del promedio del dinero que tienen las familias. Sugiere que, en

general, a medida que el promedio del dinero que tienen las familias aumenta, también lo hace

el dinero disponible.

6. Cantidad de hijos por hogar 1: Similar al caso de cero hijos y dos hijos, esta línea

nos muestra cómo afecta el tener un hijo al dinero disponible en un hogar. Indica que, en

promedio, tener un hijo más también está asociado con más dinero disponible.

En conclusión, estas líneas nos ayudan a entender cómo diferentes cosas en la vida

cotidiana, como si estás casado o cuántos hijos tienes, pueden estar relacionadas con la

cantidad de dinero que tienes disponible. Por ejemplo, parece que tener más hijos

generalmente significa tener más gastos, pero también hay otros factores en juego. Si estás

casado, es probable que tengas más dinero disponible en comparación con alguien soltero. Y

en general, cuanto más dinero tengan las familias, más dinero podrían tener disponible.

REFERENCIAS BIBLIOGRÁFICAS

Regresión logística (2023). Recuperado de https://www.ibm.com/docs/es/spss-statistics/saas?

topic=regression-logistic

Online Statistics Calculator. DATAtab e.U. Graz, Austria. Recuperado de

https://datatab.es/tutorial/logistic-regression

Recuerdo de los Santos, P. (2021). Cómo interpretar la Matriz de Confusión. Recuperado de

https://telefonicatech.com/blog/como-interpretar-la-matriz-de-confusion-ejemplo-
practico#:~:text=La%20matriz%20de%20confusi%C3%B3n%20es,con%20distintos%20tipos

%20de%20error.

También podría gustarte