Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EL CASO PRÁCTICO
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
# Necesitarás montar tu disco usando los siguientes comandos:
# Para obtener más información sobre el montaje, consulta esto: https://stackoverflow.com/
from google.colab import drive
drive.mount('/content/drive')
# Debe incluir el enlace completo al archivo csv que contiene su conjunto de datos
# 35 características en total, cada una con 1470 puntos de datos
TAREA #3: VISUALIZACIÓN DEL DATASET
# Reemplazamos las columnas 'Attritition' y 'overtime' por enteros antes de poder llevar a
# Veamos si nos faltan datos, ¡afortunadamente no es así!
# Algunas características como 'MonthlyIncome' y 'TotalWorkingYears' tienen una distribuci
# Tiene sentido que nos desagamos de 'EmployeeCount' y 'Standardhours' ya que estos campos
# Tiene sentido deshacerse de 'EmployeeCount' , 'Standardhours' y 'Over18' ya que son camp
# Eliminemos 'EmployeeNumber' también
# Veamos cuantos empleados dejan la empresa!
# Contamos el número de empleados que se quedaron y que se fueron
# Parece que estamos ante un conjunto de datos desequilibrado
left_df.describe()
# Comparemos la media y el error estándar de los empleados que se quedaron y se fueron
# 'age': la edad media de los empleados que se quedaron es mayor en comparación con los qu
# 'DailyRate':·El·rate·diario·de·los·empleados·que·se·quedaron·es·mayor
#·'DistanceFromHome':·Los·empleados·que·se·quedan·viven·más·cerca·del·trabajo
#·'EnvironmentSatisfaction'·&·'JobSatisfaction':·Los·empleados·que·se·quedan·están·en·gene
#·'StockOptionLevel':·Los·empleados·que·se·quedan·tienen·un·mayor·nivel·de·stocks·options
# Job level está altamente correlacionado con el número total de horas de trabajo
# Monthly income está altamente correlacionado con Job level
# Monthly income está altamente correlacionado con el número total de horas de trabajo
# Age está altamente correlacionado con los ingresos mensuales
# Los empleados solteros tienden a irse en comparación con los casados
y divorciados
# Los representantes de ventas tienden a irse en comparación con cualquier otro trabajo
# Los empleados menos involucrados tienden a dejar la empresa
# Los menos experimentados (nivel laboral bajo) tienden a dejar la empresa
# Veamos el Gender vs. Monthly Income
# Veamos el monthly income vs. job role
Código Texto
# Notemos que hemos elminado la columna target, 'Atrittion'
TAREA #5: ENTENDER LA TEORÍA DETRÁS DE LA
REGRESIÓN LOGÍSTICA, REDES NEURONALES
ALRTIFICIALES Y CLASIFICADORES DE BOSQUES
ALEATORIOS
TAREA #6: ENTENDER COMO SE EVALUAN LOS MODELOS
DE CLASIFICACIÓN
TAREA #7: ENTRENAR Y EVALUAR UN CLASIFICADOR
UTILIZANDO LA REGRESIÓN LOGÍSTICA
# Resultados en el Conjunto de Testing
# Resultados en el Conjunto de Testing
# Resultados en el Conjunto de Testing