Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Taller
Cristián Bravo
2019
Sebastián Orozco
Temática
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Proceso KDD
Preprocesamiento
Selección
Patrones
Datos Interpretación y
transformados
Datos pre- Evaluación
procesados
Datos se-
Datos leccionados
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
CREACIÓN DE MODELOS
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Regresión Logística.
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Construcción
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Construcción (2)
p
ln
1 p se conoce como la función de enlace logit.
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Interpretación de Coeficientes
De la ecuación:
– Aumento en X, con coeficiente positivo -> aumento en posibilidad
de evento.
– Aumento en X, con coeficiente negativo -> disminución en
posibilidad de evento.
Coeficiente de sin variable (constante): “riesgo
intrínseco” a la población. Riesgo del modelo.
Logit: “Odds ratio” para el elemento.
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Balanceo de Muestras
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Controlar
convergenci
a, usar
valor alto.
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Beta(Variable):
Coeficiente de la
variable.
SE: Error estándar de
la variable.
Wald: Estadístico de
Wald de la variable.
Valores pequeños (<3)
indican variable con
peligro de ser cero.
Odds Ratios:
Proporción para
scores.
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
CREACIÓN DE MODELOS Y
VALIDACIÓN
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Sobreajuste
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Validación de Modelos
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Split Validation
Aquí sale el
modelo y el
Aquí colocamos conjunto de
los modelos de test y debemos
entrenamiento. calcular
efectividad.
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Proceso de Entrenamiento
Dentro de este
proceso es necesario
incluir una regresión
logística.
Además, necesitamos
algo para escribir el
modelo a un archivo.
– Los modelos se
almacenan en un archivo
.XML.
– Este archivo guarda los
parámetros, los
estadísticos, etc.
– Operador “Write Model”
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Proceso de Prueba
Para la prueba,
necesitamos un
proceso que aplique
el modelo entrenado
en el proceso de
entrenamiento.
– El proceso debe aplicar
el modelo y devolver un
vector de desempeño
del mismo
(“PerformanceVector”).
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Proceso Final
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Validación: Resultados
SELECCIÓN DE ATRIBUTOS
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Método Forward
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Resultados
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Resultados (III)
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
CONSTRUCCIÓN DE SCORES
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Escalamiento a Score
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Definimos:
– Puntos para Duplicar las Odds (PDO): Cantidad de puntos
necesaria para duplicar las chances de ocurrencia del evento.
Entonces, el score debe cumplir que:
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Ejemplo:
– Pdo = 20 puntos.
– En puntaje 600 quiero que se tengan chances de 50:1
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Resolviendo lo anterior:
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
El score corresponde a:
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica
Score Neutro:
C. Bravo-S. Orozco
Riesgo de Crédito
2019
División de Extensión Académica