Está en la página 1de 24

Nombre: Gregorio Castro Ponce.

Deber de métodos de analítica


Para este tema se utilizará el conjunto de datos telecom_churn.csv. El conjunto de datos consiste
en 7043 registros de clientes de una compañía de servicios de telecomunicaciones
correspondientes a un corte en el tiempo. Para cada cliente se presentan 20 variables (predictoras)
y una variable (respuesta) binaria "Churn" (Deserción, en español) que toma el valor de "Yes" si
el cliente ha terminado su relación comercial con la compañía y "No" si mantiene aún relaciones
comerciales con la compañía.

CODIFICACIÓN PARA LA LECTURA DE BASE DE DATOS.

RESULTADOS EN R
1. Prepare los datos convirtiendo correctamente las variables en categóricas y en
numéricas. (10 puntos)
2. Particionar los datos en 70% para entrenamiento del modelo y 30% para prueba. (10
puntos)
3. Compararemos el desempeño de cinco modelos de clasificación vistes durante el curso: bayes
ingenuo, árboles de clasificación, bosques aleatorios, AdaBoost y regresión logística. Para esto,
cree una tabla que compare el accuracy, specificity, y sensitivity para cada uno de los cinco
modelos de clasificación. (20 puntos)

• Modelo BAYES INGENUO.


• Modelo árbol de clasificación
• Modelo bosques aleatorios
• Modelo regresión logística
• Modelo Adaboost
Tabla que compara el accuracy, specificity, y sensitivity para cada uno de los cinco modelos
de clasificación.

ACCURACY SPECIFICITY SENSITIVITY


Modelo de Bayes 0,7272 0,8125 0,6964
Ingenuo
Modelo Árbol de 0,7903 0,4804 0,9025
clasificación
Modelo de bosques 0,796 0,4732 0,9128
aleatorios
Modelo de 0,8031 0,5518 0,8941
regresión logística
Modelo de 0,7633 0,4875 0,8630
Adaboost

4. Prepare una figura que contenga la curva ROC conjunta de los cinco modelos
5. Determine la selección de modelo. Justifique su respuesta. (20 puntos)

ACCURACY SPECIFICITY SENSITIVITY


Modelo de Bayes 0,7272 0,8125 0,6964
Ingenuo
Modelo Árbol de 0,7903 0,4804 0,9025
clasificación
Modelo de bosques 0,796 0,4732 0,9128
aleatorios
Modelo de 0,8031 0,5518 0,8941
regresión logística
Modelo de 0,7633 0,4875 0,8630
Adaboost

De acuerdo a la tabla y comparando los parámetros ACCURACY, SPECIFICITY Y


SENSITIVITY, se concluye que el modelo a seleccionar es el de bayes ingenuo, debido a que, el
valor del SPECIFICITY resultó ser el mayor con respecto a los demás modelos. A pesar de que
el ACCURACY y SENSITIVY son menores en comparación a los otros modelos, la diferencia
no es tan significativa como lo es en el specificity.
6. Describa cuáles podrían ser los siguientes pasos que tome la compañía para generar
valor organizacional utilizando los resultados del modelo encontrado. (20 puntos)
Luego del análisis de los parámetros, el porcentaje que arroja el modelo de bayes ingenuo en el
specificity es de 81,25% siendo este, un porcentaje alto de clientes que van a desistir de los
servicios de telecomunicaciones por esta razón, se considera importante para la generación de
valor organizacional lo siguiente:

• Controla la satisfacción de tus clientes.


• Implementa herramientas que ayuden a tu equipo a controlar la información y a
automatizar procesos.
• La integración de cada área de la compañía con la que sigue es clave.
Por lo tanto, los equipos deben comprometerse en procesos de aprendizaje flexibles, efectivos e
integradores para aumentar las posibilidades de encontrar oportunidades de mejora que puedan
contribuir a la generación de valor para los distintos stakeholders. Además, la compañía tiene el
deber de establecer las bases, los planes, las estrategias, las metodologías que ayuden a sus
colaboradores, en equipo, aprender acerca de las múltiples herramientas para impactar sus
funciones en el rol que desempeña y sus percepciones desde su individualidad como persona.

También podría gustarte