Está en la página 1de 12

TAREA #1: ENTENDER EL ENUNCIADO DEL PROBLEMA Y

EL CASO PRÁCTICO

Figura 1. Predicción de la Retención de Empleados


TAREA #2: IMPORTAR LAS LIBRERÍAS Y LOS DATASETS

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

# Necesitarás montar tu disco usando los siguientes comandos:
# Para obtener más información sobre el montaje, consulta esto: https://stackoverflow.com/

from google.colab import drive
drive.mount('/content/drive')

# Debe incluir el enlace completo al archivo csv que contiene su conjunto de datos

# 35 características en total, cada una con 1470 puntos de datos
TAREA #3: VISUALIZACIÓN DEL DATASET

# Reemplazamos las columnas 'Attritition' y 'overtime' por enteros antes de poder llevar a 

# Veamos si nos faltan datos, ¡afortunadamente no es así!

# Algunas características como 'MonthlyIncome' y 'TotalWorkingYears' tienen una distribuci
# Tiene sentido que nos desagamos de 'EmployeeCount' y 'Standardhours' ya que estos campos 

# Tiene sentido deshacerse de 'EmployeeCount' , 'Standardhours' y 'Over18' ya que son camp
# Eliminemos 'EmployeeNumber' también

# Veamos cuantos empleados dejan la empresa!

# Contamos el número de empleados que se quedaron y que se fueron
# Parece que estamos ante un conjunto de datos desequilibrado

left_df.describe()

# Comparemos la media y el error estándar de los empleados que se quedaron y se fueron
# 'age': la edad media de los empleados que se quedaron es mayor en comparación con los qu
# 'DailyRate':·El·rate·diario·de·los·empleados·que·se·quedaron·es·mayor
#·'DistanceFromHome':·Los·empleados·que·se·quedan·viven·más·cerca·del·trabajo
#·'EnvironmentSatisfaction'·&·'JobSatisfaction':·Los·empleados·que·se·quedan·están·en·gene
#·'StockOptionLevel':·Los·empleados·que·se·quedan·tienen·un·mayor·nivel·de·stocks·options

# Job level está altamente correlacionado con el número total de horas de trabajo
# Monthly income está altamente correlacionado con Job level
# Monthly income está altamente correlacionado con el número total de horas de trabajo
# Age está altamente correlacionado con los ingresos mensuales
# Los empleados solteros tienden a irse en comparación con los casados ​
y divorciados

# Los representantes de ventas tienden a irse en comparación con cualquier otro trabajo
# Los empleados menos involucrados tienden a dejar la empresa
# Los menos experimentados (nivel laboral bajo) tienden a dejar la empresa

# Veamos el Gender vs. Monthly Income

# Veamos el monthly income vs. job role

TAREA #4: CREAR LOS DATA SETS DE ENTRENAMIENTO Y


TESTING Y LLEVAR A CABO LA LIMPIEZA DE DATOS

Código Texto

# Notemos que hemos elminado la columna target, 'Atrittion'
TAREA #5: ENTENDER LA TEORÍA DETRÁS DE LA
REGRESIÓN LOGÍSTICA, REDES NEURONALES
ALRTIFICIALES Y CLASIFICADORES DE BOSQUES
ALEATORIOS
TAREA #6: ENTENDER COMO SE EVALUAN LOS MODELOS
DE CLASIFICACIÓN
TAREA #7: ENTRENAR Y EVALUAR UN CLASIFICADOR
UTILIZANDO LA REGRESIÓN LOGÍSTICA
# Resultados en el Conjunto de Testing

TAREA #8: ENTRENAR Y EVALUR UN CLASIFICADOR


UTILIZANDO BOSQUES ALEATORIOS

# Resultados en el Conjunto de Testing

TAREA #8: ENTRENAR Y EVALUR UN CLASIFICADOR


UTILIZANDO DEEP LEARNING
# oversampler = SMOTE(random_state=0)
# smote_train, smote_target = oversampler.fit_sample(X_train, y_train)
# epochs_hist = model.fit(smote_train, smote_target, epochs = 100, batch_size = 50)

# Resultados en el Conjunto de Testing

¡EXCELENTE TRABAJO! USTED DEBE ESTAR ORGULLOSO


DE SUS HABILIDADES RECIEN ADQUIRIDAS

También podría gustarte