Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Certamen III Mineria de Datos
Certamen III Mineria de Datos
Autor:
Profesor:
Concepción, Chile
26 de Mayo de 2023
Contenido
Minería de Datos: Certamen III..............................................................................................1
1. INDICE
2. DESARROLLLO
2.1.Comprenda del problema: Describa la problemática, se debe generar un marco de referencia
Según las varíales del servicio, se debe indicar si los usuario darán de baja o no el servicio,
según distintas variables empleadas en la problemática ya sean en tiempo, cantidad de
llamadas y reclamos, cantidad de tiempo sin servicio, pagos adeudados y monto a pagar
mensualmente entre otros
2.2 Comprenda de los datos: Describir las variables según su naturaleza estadistica (tipo) y su
significado en el problema.
2.3 Preprocesamiento: Realice un análisis exploratorio de datos (EDA), además: Elimine variables
que no son relevantes mediante el algoritmo boruta.
2.4 Modelo: Entrene usando partición 80 – 20, el algoritmo de regresión logística, árbol de
decisión, KNN, Redes Neuronales.
2.5 Evaluación: Elabore un cuadro comparativo que evidencie los mejores modelos un ranking,
por medio del Exactitud, Sensibilidad, Especicidad, además tiempo de procesamiento del
algoritmo y procesador equipo usado.
Árbol de Redes
EVALUACIÓN Regresión Lineal KNN
Decisión Neuronales
2.6 Genere una curva ROC para cada modelo y elija la mejor.
Imagen N° 5, Regresión Lineal, ROC=0,635 Imagen N° 6, Árbol de Decisión, ROC=0,731
Finalmente la mejor opción para la simulación según la imagen N°8, correspondería a la curva ROC
de Redes Neuronales, ya que esta es la que más se acerca a 1.
2.7 Dado el mejor modelo describa los resultados, evidenciando el impacto de las variables y
mostrando una predicción.
Son las variables que más impactan en la decisión del usuario en dar de baja o no el servicio. En
este caso se evalúa
q_contencion_3
q_contencion_6
q_contencion_12
q_rx
3. REFERENCIA BIBLIOGRAFICA