Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Esto significa que si se escoge Edad y sta tiene ese KS para el punto de corte
26,3 aos, entonces el modelo
Si edad <= 26,3 aos rechace. Si no acepte.
Debe ahora correrse este modelo sobre una muestra de testeo. Si el KS en la
muestra de testeo da 15,2, entonces 15,2 es el estimador de KS que tiene el
modelo.
Lo que sigue es muy importante:
Puede ser que jugando con el punto de corte se descubre que en la base de
testeo el punto de corte 23,7 aos da un KS mejor, por ejemplo un KS de 17,8.
Sin embargo, si se desea usar ese nuevo punto de corte entonces debe
testearse el modelo en otra muestra independiente para poder estimar el KS. Si
no, no vale el clculo como estimador de lo que ser la capacidad de
Tomemos como ejemplo esta mini muestra (sacada de [2]) de construccin con
12 clientes (6 buenos y 6 malos), y cinco variables: Salario, Casa Propia, Auto
Propio, Edad y Estado Civil.
Esta muestra es extremadamente chica como para hacer nada serio, pero
permite ilustrar los conceptos bsicos. Adems, este ejemplo juguete permite
calcular a mano todo lo que sea necesario, y as asegurarse que uno ha
entendido el algoritmo de construccin de rboles.
Tomemos adems esta segunda muestra con 8 clientes (4 buenos y 4 malos), y
las mismas cinco variables. Esta ser nuestra muestra para testeo.
O sea el KS es slo de 25%. Esto quiere decir que si tomamos otra muestra
cualquiera de clientes, independiente de la muestra de construccin, el KS
andar alrededor de 25%, pudiendo variar desde 0 hasta 71% en la gran
mayora de los casos.
Modelos no lineales:
Existen varios tipos de modelos no lineales. Uno de los tipos no lineales es el
de rboles de decisin. Otros son las redes neuronales, los algoritmos
genticos y muchos otros.
Los modelos de redes neuronales asumen que todas las variables son
numricas. Si no lo son, o slo se trabaja con las numricas o bien se
convierten a numricas de acuerdo a un criterio especificado. El modelo
neuronal busca una combinacin de variables con sumas ponderadas y
funciones umbrales (si el valor es ms all de cierto umbral sale uno, si no sale
cero).
Los modelos genticos tambin requieren variables numricas. Los algoritmos
recombinan criterios creando nuevos a partir de criterios bsicos con mtodos
similares a la creacin de molculas recombinando partes de molculas y
haciendo mutaciones. En este caso, se mutan partes de frmulas y se crean
nuevas juntando frmulas. Aquellas frmulas con mejor capacidad de
discriminacin van sobreviviendo, y vuelven a mutarse y recombinarse.
Eventualmente se llegan a buenas frmulas que corresponden a criterios con
buena capacidad de discriminacin.
Naturalidad
Capacidad de discriminacin
Un estudio internacional, (ver [1]) llevado a cabo durante 4 aos por varios
centros estadsticos universitarios e industriales de varios pases de la
Comunidad Europea que compararon varias decenas de mtodos, concluy
que los mtodos de rboles de decisin son los de mejor capacidad de
discriminacin en crdito. De 23 algoritmos probados, de los cuales 5 eran de
rboles de decisin, el mejor result ser de rbol de decisin y tres algoritmos
de rboles estaban entre los seis primeros lugares. El estudio concluy que
parte de la razn del xito (de los rboles) en esta rea es sin lugar a dudas
que los mtodos de rboles de decisin pueden manejar ms naturalmente con
una gran cantidad de atributos binarios o categricos (siempre que el nmero
de alternativas sea pequeo). Ellos tambin incorporan trminos de interaccin
en su desarrollo. Y, quizs ms significativamente, ellos son un espejo del
proceso de decisin humana.
Aceptar todos
Rechazar a los con edad menor a 25 aos
Rechazar a los con edad menor a 25 aos o a los solteros con edad 25
aos o ms
Rechazar a todos
Las otras combinaciones no son naturales de acuerdo al rbol. Para cada corte
tendremos un KS, y su correspondiente desviacin. El corte ptimo se decide
con la muestra de construccin.
Una vez escogido el corte, se evalan todos los clientes de la muestra de
testeo. Se cuentan cuntos clientes buenos y malos caen en la zona de
rechazo (menor al corte), y con esos datos se obtiene una estimacin del KS.
Ajustes
Inclusin de clientes negados
Para que la adquisicin en centrales de riesgo sea efectiva debe tener los
siguientes requisitos: