Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Descripción de la actividad
Para llevar a cabo esta actividad se nos indico el uso de un conjunto de datos en
específico. Este conjunto contiene información relacionada a transacciones
realizadas con tarjeta de crédito de distintos negocios; lo cual nos permite realizar
un algoritmo de aprendizaje que identifique cuando una transacción es fraude.
Actividades 1
Asignatura Datos del alumno Fecha
Edwin Isidro Zuñiga Escobar Javier Chuquillanqui Mendoza 18 de
Aprendizaje
abril del
Automático Jesús Ricardo Flores Montenegro Oscar Miranda Miranda 2022
Marco Teórico
Aprendizaje no supervisado
Isolation Forest
K-Means
DBSCAN--x
Desarrollo
Actividades 2
Asignatura Datos del alumno Fecha
Edwin Isidro Zuñiga Escobar Javier Chuquillanqui Mendoza 18 de
Aprendizaje
abril del
Automático Jesús Ricardo Flores Montenegro Oscar Miranda Miranda 2022
Oscar
A partir de 1.5
Variables Numéricas
Variables Categóricas
Detección de anomalías
Actividades 3
Asignatura Datos del alumno Fecha
Edwin Isidro Zuñiga Escobar Javier Chuquillanqui Mendoza 18 de
Aprendizaje
abril del
Automático Jesús Ricardo Flores Montenegro Oscar Miranda Miranda 2022
Se puede ver que los valores predichos anómalos y los valores que en el dataset son
fraudulentos, son similares. Lo que nos indica que nuestra predicción se acercó bien
a la información real.
Actividades 4
Asignatura Datos del alumno Fecha
Edwin Isidro Zuñiga Escobar Javier Chuquillanqui Mendoza 18 de
Aprendizaje
abril del
Automático Jesús Ricardo Flores Montenegro Oscar Miranda Miranda 2022
Como el modelo da una predicción casi cercana a los valores reales, se procederá a
realizar las pruebas con el modelo actual, y validar que el resultado sea similar al
entrenamiento.
Para un mejor análisis, se homologará el resultado del modelo que genera -1 para
datos anómalos (fraudulentos) y 1 para datos normales (no fraudulentos), se
transformará a 1 para fraudulentos y 0 para los no fraudulentos.
Se genera una vista grafica de uno de los estimadores del isolation forest.
La comparación grafica de los valores reales contra los predichos, usando las
columnas “Daily_chargeback_avg_amt” y “Total Number of declines/day”, y se
observa que la detección de la anomalía es similar al valor real.
Actividades 5
Asignatura Datos del alumno Fecha
Edwin Isidro Zuñiga Escobar Javier Chuquillanqui Mendoza 18 de
Aprendizaje
abril del
Automático Jesús Ricardo Flores Montenegro Oscar Miranda Miranda 2022
Para un análisis más preciso del resultado final, y como tenemos el resultado real,
se utilizará la matriz de confusión y la métrica de precisión.
Ventajas Desventajas
No se necesita demasiado procesamiento de la La visualización grafica de los árboles se
información. complica con muchos valores.
Da buenos resultados, teniendo los parámetros
correctos
Es rápido en su procesamiento, dependiendo de
nacional de La Rioja (UNIR)
los recursos disponibles
Actividades 6
Asignatura Datos del alumno Fecha
Edwin Isidro Zuñiga Escobar Javier Chuquillanqui Mendoza 18 de
Aprendizaje
abril del
Automático Jesús Ricardo Flores Montenegro Oscar Miranda Miranda 2022
Agrupamiento
edwin
Conclusiones
Ricardo f
Referencias
10 100 %
Actividades 7