Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MACHINE LEARNING
TelcoCustomerChurn
Integrantes
-Conocimiento de clientes
(Recolección de datos, preprocesamiento)
-Acciones históricas
(Extracción y selección de características)
-Optimización
(Creación y evaluación de modelos)
CASO DE ESTUDIO
Objetivo
Predecir los abandonos que sucederán e implementar
estrategias de retención para aquellos clientes más
propensos a abandonar al negocio.
Unidad de Estudio
Clientes que abandonaron.
ANÁLISIS EXPLORATORIO DE
DATOS
· ANÁLISIS EXPLORATORIO DE DATOS·
· ANÁLISIS EXPLORATORIO DE DATOS·
· EDA·
· EDA·
· EDA·
· EDA·
LIMPIEZA DE DATOS
Tratamiento de datos
Ya que:
No tendrá relevancia en la
representación gráfica
No deberían exisitir si
los cargos mensuales no
tienen valores faltantes
Si el problema no se encuentra en los cargos mensuales tenemos que
encontrar la columna donde no exista pertenencia, tenure(pertenencia)=0
Borramos
todos los
registros
que tengan
tenure=0
para que
no afecte
al análisis.
Árbol de decisiones
Correlación entre
variables :
FEATURE ENGINEERING
Comparación de valores en columnas
Comparación métodos de pago
Porcentaje resaltante
El porcentaje de personas jubiladas abandonan más el servicio
El contrato por mes tienen mayor probabilidad de abandonar la empresa
El método de pago electrónico suelen abandonar la empresa
Cantidad de VIF en variables
Correlación entre cargos totales y mensuales
Existe multicolienalidad
Existe multicolienalidad,
al existir ambas con alto
VIF, implica redundancia
y sobreajuste.
Dificultan la
interpretación del
modelo
Luego se revisa la correlación, y como se
comprueba bajo el VIF de los cargos
mensuales
ENTRENAMIENTO Y
VALIDACIÓN
Dividir los datos en 2 Grupos
Entrenamiento: Construir el
modelo
Prueba: Evaluar el
desempeño
Normalización de datos
Metricas
INTERPRETACIÓN DE
RESULTADOS
Importancia de Variables
Los valores más altos de información mutua muestran un
MonthlyCharges y Contract_Month-to-month
Resultados con hiperparámetros predeterminados
Utilizando los
hiperparámetros
predeterminados, el modelo
precisión corresponde al
modelo de aumento de
Classifier:
ting, Accuracy:
casi del 80%.
0.7963594
Resultados del modelo con mejores hiperparámetros
Comprobamos el rendimiento del modelo mediante el uso de la matriz de
confusión y obtuvimos:
Modelo
Accuracy:
0.798634
En cuanto a la exactitud