0 calificaciones0% encontró este documento útil (0 votos)
11 vistas1 página
Este documento proporciona instrucciones para analizar y procesar un conjunto de datos de crédito. Incluye tareas como eliminar filas y columnas duplicadas, identificar valores constantes y faltantes, realizar diferentes tipos de gráficos, discretizar variables, calcular correlaciones, normalizar y estandarizar campos, identificar outliers, aplicar codificación one-hot, y extraer datos que cumplan con diferentes condiciones. El objetivo general es preparar y explorar el conjunto de datos para su posterior minería.
Este documento proporciona instrucciones para analizar y procesar un conjunto de datos de crédito. Incluye tareas como eliminar filas y columnas duplicadas, identificar valores constantes y faltantes, realizar diferentes tipos de gráficos, discretizar variables, calcular correlaciones, normalizar y estandarizar campos, identificar outliers, aplicar codificación one-hot, y extraer datos que cumplan con diferentes condiciones. El objetivo general es preparar y explorar el conjunto de datos para su posterior minería.
Este documento proporciona instrucciones para analizar y procesar un conjunto de datos de crédito. Incluye tareas como eliminar filas y columnas duplicadas, identificar valores constantes y faltantes, realizar diferentes tipos de gráficos, discretizar variables, calcular correlaciones, normalizar y estandarizar campos, identificar outliers, aplicar codificación one-hot, y extraer datos que cumplan con diferentes condiciones. El objetivo general es preparar y explorar el conjunto de datos para su posterior minería.
2. Quitar columnas duplicadas 3. Identificar columnas que tienen valores constantes 4. Identifique el porcentaje de valores faltantes en las columnas 5. Para el dataset hacer un análisis gráfico documentado de las variables: Histograms Scatter plots Distributions Boxplots Bar plot Heatmaps 6. Aplicar expresión matemática para el cálculo (CreditAmount / Duración)*residence_since 7. Discretizar en 4 quartiles duración, credit_amount, age, number_of_dependents. 8. Obtenga la matriz de correlación de las variables numéricas. 9. Obtenga la tabla de relación de frecuencias entre los atributos job y purpose. 10. Mapear a valores diferentes para atributos own_telephone, foreign_worker. 11. Normalizar el campo instalment_commitment 12. Estandarizar el campo instalment_commitment 13. De los gráficos Boxplot obtenidos quitar outliers por medio de Inter-quartil range 14. Utilice One-hot encoding en campo purpose. 15. Obtenga las instancias que cumplan la condición de un monto de crédito mayor a 3000 16. Obtenga las instancias que cumplen con la condición de que job sea igual a “skilled” y que el monto de crédito sea mayor a 2000. 17. Obtenga suma total del camp credit_amount agrupado por el campo purpose “new car”. 18. Obtenga age y class para los registros que tienen campo purpose “education” y housing “for_free”. 19. Obtenga el total y el promedio de credit amount agrupado por housing y class.