Está en la página 1de 2

Modelos de Clasificación o Regresión:

Contenido sugerido del análisis e informe

1. Introducción: Una motivación del análisis, comentar la solicitud a atender, el objetivo o


problemática a resolver, qué dirección solicitó el modelo, y cual dirección o personas lo van
a usar.
2. Datos Disponibles: Fuente y origen de los datos, cantidad de filas, cantidad columnas,
periodo temporal de los datos (los años o meses considerados), descripción general de
variables, principalmente variables útiles para el análisis que no tengan un nombre
explicativo u obvio.
3. Análisis Descriptivo: Tabla resumen de promedios, desviación estándar, percentiles (si
fueran necesarios), cantidad de NULLS, cuenta de categorías en variables categóricas,
histogramas gráficos de dispersión si fueran necesarios, correlaciones, o pruebas
estadísticas que consideren de utilidad. Sujeto a aplicabilidad.
4. Procesamiento de Datos: Se refiere a cualquier limpieza que haya sido necesaria. Eliminar
o bien imputar valores NULL, eliminar variables por estar incompletas o por correlaciones o
por poca significancia, crear variables o índices adicionales a partir de otras variables,
unificar clases dentro de una variable categórica, ACP para reducir dimensionalidad o
eliminar correlación, centrado de variables numéricas. Sujeto a aplicabilidad.
5. Modelo Predictivo: Probar varias metodologías, validación cruzada, calibración
hiperparámetros. En general el enfoque es este:

Uso Interno
6. Resultados: Exponer resultados del modelo, modelo seleccionado y razón por seleccionarlo
(calidad de predicción, interpretación de resultados, otro), importancia de variables según
el modelo (esto también podría ir en la sección de Análisis Descriptivo según el enfoque que
se use), índices de calidad: para clasificación accuracy, precisión recall, curva roc, auc, curva
precisión-recall, f1 score, matriz confusión, para regresión error de regresión mse, mae,
calidad de ajuste. Sujeto a aplicabilidad (por eso se espera que el desarrollador conozca la
aplicabilidad de las métricas según el método)
7. Próximos Pasos: Indicar qué sigue en el modelo. Comentar limitaciones que se quieren
atacar en la próxima iteración del modelo (por motivos de tiempo no se pudo probar el
modelo boosting calibrado, en la medida de lo posible se planea considerar en otra iteración
del modelo), comentar si hay pruebas de back testing planeadas. Sujeto a aplicabilidad.

El analista o desarrollador del modelo tiene la flexibilidad y libertad de agregar otras etapas o
secciones del modelo e informe que crea necesarias o que se requieran según el tipo de análisis (es
imposible que esta lista sea totalmente exhaustiva); también podría suceder que el modelador
omita la aplicación de ciertas técnicas o pruebas sugeridas en la lista anterior, pero se espera una
justificación de dicha decisión en el informe (tiempos de ejecución, pruebas con modelos base, o
sea sin calibrar, sugerencia de negocio, viabilidad de aplicación). En general, lo recomendable es
brindar una justificación o respaldo en el informe a cualquier decisión que no se derive directamente
de índices o medidas cuantitativas, o consultar con el validador en caso de dudas.

Uso Interno

También podría gustarte