Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Directora
Msc en Estadística
INTRODUCCIÓN………………………………………………………………………..
1. CAPITULO 1 ………………………………………………………………………
1.3 JUSTIFICACIÓN……………………………………………………..
1.4 ANTECEDENTES……………………………………………………
2. CAPITULO 2 METODOLOGIA……………………………….
3.2.7.1 Genero…………………….
CONCLUSIONES……………………………………………………………………..
BIBLIOGRAFIA……………………………………………………………………..
INTRODUCCIÓN
modalidades como lo es, ofreciendo tasas de interés atractivas y competitivas frente a las demás
entidades financieras.
Ante esta situación la cooperativa de ahorro y crédito sobre la cual se realizará el análisis
estadístico, evalúa una a una las operaciones con el objetivo de replantear la tasa inicialmente
otorgada ante las solicitudes aprobadas por los analistas de crédito, o ante los requerimientos
individualizados de asociados que optan por cambiar de entidad y cancelen de manera anticipada
el crédito vigente.
Por estas razones es importante conocer el perfil del asociado, cuál ha sido su
comportamiento de pago, la tasa que ha manejado en otros créditos y cuál es el nivel de recursos
de ahorro que mantiene en la entidad, ya que la presente investigación pretende identificar los
activa.
para analizar variables de los asociados y definir posibilidad de otorgar o no el beneficio, aplicar
Aplicar un modelo de scoring que permita identificar asociados potenciales que presenten
buen hábito de pago y tengan rotación de crédito en la Cooperativa, para asignarles un beneficio
estadísticas multivariadas.
periodo de estudio.
Aplicar la técnica de clúster para clasificar los asociados en tres grupos “Premium”,
1.3 JUSTIFICACIÓN
Los mercados financieros buscan día a día estar más cerca de los usuarios y satisfacer sus
tasa de interés de crédito que a través de la compra de cartera y otras líneas de crédito (libre
consumo, libranzas, tarjetas de crédito, etc.), así mismo, unificar las obligaciones financieras, en
caso de tener más de un crédito activo en el sector financiero, ampliando su plazo y mejorando el
flujo de caja del deudor. Ante esta situación, la Cooperativa conformó un comité de tasas de
crédito que le permita atender oportunamente las solicitudes de aquellos asociados que solicitan
una disminución en su tasa de interés del crédito vigente con la Cooperativa, o recoger cartera de
otras entidades financieras, o aquellos asociados que buscan prepagar el crédito, es decir; pagar
En estos casos se procede a evaluar la posibilidad de disminuir la tasa actual del crédito en
unos puntos porcentuales, de acuerdo al perfil del asociado, comportamiento de pago, tasa de
interés actual y novedades históricas, buen hábito de ahorro, esta es una forma de incentivar y
reevaluar las solicitudes de crédito, el presente trabajo tiene como finalidad, diseñar un modelo
scoring que aportará a la cooperativa la automatización del proceso de beneficio a asignar en cada
caso.
Será importante para el área de gerencia financiera para dar cumplimiento ante la
superintendencia solidaria que mediante requerimiento solicita fijar los criterios técnicos y
además se usará ampliamente por el área comercial, además se convierte en una herramienta útil
intereses. Con lo anterior, se justifica el objetivo de la entidad para fidelizar al asociado potencial
a través del otorgamiento de tasa de interés preferencial previamente a la aceptación del mismo.
1.4 ANTECEDENTES
La técnica de credit scoring tiene una gran aplicación en el campo financiero como
alternativa a las técnicas tradicionales de evaluación de crédito (poco eficientes) ante el gran
Arango & Restrepo (2017) plantearon un modelo scoring capaz de predecir la probabilidad de
incumplimiento del deudor, basado en regresión logística con base en información de la entidad
periodo determinado. El análisis se realizó sobre cuatro técnicas para modelos scoring como
modelo seleccionado fue el de regresión logística ya que acertó en más del 99% de las veces para
predecir un incumplimiento.
regresión logística con una base de datos de 16.000 clientes morosos de bancos, cooperativas y
empresas de servicios públicos. Los resultados indicaron que, según las características
de consumo y microcrédito son recuperables. Se concluyó que los modelos de scoring son de
gran utilidad para la gestión financiera, dado que facilita la implementación de políticas de ventas
clientes.
clientes de una cooperativa, para mejorar los procesos comerciales y de mercadeo buscando
impactar los resultados de la empresa. Para ello se usó las herramientas de clústering, donde la
tiene de sus clientes en las bases de datos y la experiencia en el manejo de las mismas. Los
clúster “El deudor independiente”, “el deudor asalariado” y “el inversionista de estrato”, que se
vio útil para el área comercial ya que son fuentes importantes en la redefinición de las estrategias
de venta.
El trabajo de investigación realizado por Jerez (2016) explora las asociaciones existentes
entre la venta de productos y las exigencias para acceder a los servicios en una entidad prestadora
de ahorro y crédito. Los datos fueron tomados de una encuesta de servicio, la cual indagó con sus
asociados diversos atributos de la cooperativa y se identificó las variables que son determinantes
los clientes a los que se les desembolsó un crédito con destino libre inversión en una entidad
aglomerativo. El estudio concluyó que el número óptimo de clusters son tres y que los
préstamos. Utilizó datos de solicitudes de tarjeta de crédito realizadas por clientes extranjeros de
una entidad bancaria, bajo un modelo se scoring a partir de la metodología logit a una muestra del
30 % del total de clientes a los que fue aprobada una tarjeta de crédito, 7.274 observaciones, para
las variables independientes usaron el método stpewise que realiza una secuencia de estadísticos
F para determinar la inclusión o no de las variables, el resultado fue enfocado en determinar los
concluyeron que las variables que más aportan al score con tasa de mora, la nacionalidad y el
pasivo.
base de una cooperativa financiera que contiene el histórico de créditos de 24786 personas, con
fecha de corte a noviembre de 2009, donde se identificaron 30 variables con relación a cada
registro de clientes de la entidad; uno de los resultados importantes es tener en cuenta que el
analista en ningún caso debe conocer las variables que en mayor medida aportan para que se
otorgue el crédito, pues este podrá acomodar variables a su tamaño para obtener un resultado. Así
mismo, concluyó que el poder predictivo del modelo promueve la acumulación de información
entre mayor sea la información con la que se cuente, mejor será la predicción que arroje el
modelo.
Granda y Niño (2016) que diseñaron un framework para mejorar la gestión de cobranza en el
programa de microcrédito de una cooperativa financiera , la cual parte de una base de asociados
logística. Los resultados permitieron una clasificación correcta superior al 90% en los tres
modelos, además elaboraron la tabla de score distribución que permitió identificar los puntos de
la Ley 31 de 1992, tiene como función estudiar las medidas monetarias, crediticias y bancarias
regula el costo de los créditos. Para lograr esto, el artículo 18 de la misma ley señala que las
plazo”. Cuando una economía genera niveles bajos de riqueza, los bancos centrales disminuyen
sus tasas de interés para permitir a más personas acceder a créditos a través de los Bancos
Privados en lo que se denomina un “ciclo recesivo”. Una vez la economía se dinamiza, los
Bancos Centrales aumentan sus tasas en lo que se conoce como un “ciclo de recuperación”.
La tasa de interés de Colombia ha disminuido consistentemente desde septiembre de
2016, del 7.75% al 4,25%. Esta reducción significa que la economía colombiana enfrenta un ciclo
recesivo, donde más crédito e incentivos a la creación de empresas son requeridas para poner la
Tanto como los Bancos Privados ajustan sus tasas de interés para el público y los
emprendedores, la Reserva Federal presta dinero a cada Banco Central de acuerdo a lo que se
denomina el “ciclo de deuda de largo plazo” que depende del estado de las finanzas
política monetaria que el banco cobra a las entidades financieras por los préstamos que les hace
mediante las operaciones de mercado abierto (OMA) y sus decisiones tienen vigencia a partir del
Esta tasa es el principal mecanismo de intervención de política monetaria usado por el Banco
República).
La tasa de interés puede concebirse, en rigor, como una media de las muchas tasas del
mercado ponderada según la importancia de cada crédito, depósito y colocación dentro del total.
Esto no significa despreciar la diferencia entre las distintas tasas. En particular, las tasas
nominales activas o de colocación de los bancos superan en 10 puntos los riesgos y los plazos en
función de diversas expectativas. Con todo tenemos la percepción de que, al menos en Colombia,
los movimientos relativos de las distintas tasas no son tan fuertes como para restarle importancia
al examen del promedio. En lo que sigue supondremos que tiene pertinencia la discusión sobre
los determinantes y efectos de la “tasa media de interés” y, más aún si podemos que hay un
República)
Es el precio del dinero en el mercado financiero. Al igual que el precio de cualquier producto,
cuando hay más dinero la tasa baja y cuando hay escasez sube. Cuando la tasa de interés sube, los
demandantes desean comprar menos, es decir, solicitan menos recursos en préstamo a los
intermediarios financieros, mientas que los oferentes buscan colocar más recursos (en cuentas de
ahorros, CDT, etc). Lo contrario sucede cuando baja la tasa: los demandantes del mercado
financiero solicitan más créditos, y los oferentes retiran sus ahorros. Existen dos tipos de tasas de
interés: La tasa pasiva o de captación: es la que pagan los intermediarios financieros a los
oferentes de recursos por el dinero captado y la tasa activa o de colocación: es la que reciben los
intermediarios financieros de los deudores por los préstamos otorgados. Siempre es mayor,
porque la diferencia con la tasa de captación es la que permite al intermediario financiero cubrir
los costos administrativos, dejando además una utilidad. Esta última asociada al estudio del
trabajo.
Las tasas de interés de colocación son aquellas que aplican para los diferentes tipos de créditos
y productos que otorgan las diferentes entidades financieras a sus clientes. Dentro de los
créditos especiales.
El Banco de la República calcula y publica los datos semanales y mensuales de tasas y montos
Superintendencia Financiera de Colombia, para esto utiliza el Formato 088 dentro del cual las
entidades registran las nuevas operaciones denominadas en moneda legal y realizada durante la
colocación consolidadas con periodicidad mensual presentan información desde marzo de 1998,
y de la tasa de interés activa total, la cual dejó de calcularse en el mes de abril de 2001 (Fuente
Banco de la República)
A partir de la información de tasas y montos reportados en el formato 088 por parte de los
los agregados de tasas activas. La metodología de cálculo consiste en tasas promedio ponderadas
por los desembolsos y sumatorias de montos que permiten agregar la información por categorías
∑ r i qi
i=1
n
∑ qi
i=1
la entidad i
acordados según las Leyes 550 de 1999 y 617 de 2000 por tipo de entidad y total de
entidades. - Tasas promedio ponderadas y sumatorias de los montos de las subcuentas por
criterio Banco de la República por tipo de entidad y total de entidades. Las subcuentas
ponderado por monto de las tasas de crédito de: consumo, preferencial, ordinario y tesorería.
Debido a la alta rotación de este último tipo de crédito, su ponderación se estableció como la
quinta parte de su desembolso semanal. Esto último debido a la alta volatilidad tanto en tasas
ponderado por monto de las tasas de crédito de: preferencial, ordinario y tesorería. Debido a la
alta rotación de este último tipo de crédito, su ponderación se estableció como la quinta parte de
su desembolso semanal.
Tasa de interés de colocación: Calculado como el promedio ponderado por monto de las
tasas de crédito de: consumo, preferencial, ordinario y tesorería. Banco de la República (s.f)
existe entre los intereses que paga el banco a quien ha solicitado el dinero y los que cobra a quien
se lo presta.
Las tasas de interés pueden ser fijas y mantenerse estables mientras dura la inversión o se
devuelve el préstamo, o variables y actualizarse cada período de tiempo con base en algún
para obtener la tasa de interés, de allí que muchas veces se indique que la entidad financiera
Con el objetivo de evitar que la Cooperativa otorgue créditos a asociados que presentan alto
riesgo de incumplimiento, se evalúan diversas variables a través del scoring de créditos, el cual le
Estos asociados que inicialmente toman crédito, posteriormente requiere que la Cooperativa
les ajuste la tasa de interés, disminuyéndola en unos puntos porcentuales, mejorar algunas de las
condiciones del crédito o prepagar la obligación en su totalidad porque otra entidad financiera les
presenta una mejor oferta o disponen del capital total para pagar el saldo del crédito. En estos
casos; si el asociado lo requiere, el comité de tasas de crédito evalúa nuevamente el perfil del
ingresos, actividad económica, entre otras, para determinar si le otorga el beneficio de reducirle la
tasa de interés.
1.5.6 Límites sobre las tasas de interés
Las entidades financieras, las Cooperativas de ahorro y crédito entre otras, deben regirse en
todo a las tasas certificadas por la Superintendencia Financiera de Colombia, quien emite la tasa
máxima de interés que pueden cobrar. Entidad que en ejercicio de sus atribuciones legales y en
especial de lo dispuesto en los Decretos 519 de 2007, 919 de 2008; 3819 de 2008, expide dicho
certificado.
En el evento en que la tasa de interés cobradas supere esos límites podría incurrirse en el delito
de usura registrado en el artículo 305 del Código Penal, el cual se configura cuando se recibe o
bienes o servicios a plazo, utilidad o ventaja que exceda en la mitad del Interés Bancario
Corriente que para los períodos correspondientes estén cobrando los bancos.
situación se debe instaurar ante la Fiscalía General de la Nación, entidad a la cual le corresponde
investigar conductas punibles, calificar los procesos y acusar ante los jueces y tribunales
competentes a los presuntos infractores de la ley penal, bien de oficio o por denuncia presentada
En caso de que el interés convenido excede dicho límite durante la vida de un crédito, deberá
aplicado por la entidad financiera deberá reflejarse durante los periodos de causación en que la
Los créditos de consumo están dirigidos a personas naturales para financiar la adquisición de
bienes o servicios. Es decir; recoge los créditos otorgados para compras comunes de los hogares,
utilizar para refinanciar pasivos con otras entidades financieras y proveedores de corto
plazo.
1.5.7.3 Microcrédito
1.5.7.4 Vivienda
individual.
Desde los años 60 las entidades financieras han utilizado scoring de crédito en sus actividades
crédito, estas técnicas permiten analizar su historial crediticio y predecir el comportamiento del
cliente en función de una característica o varias características observadas en el tiempo de
vinculación con la entidad. Los modelos de scoring son claramente métodos mucho más
sofisticados pues brindan mayor información acerca de las relaciones entre las variables,
proporcionando la viabilidad del crédito, que monto de crédito se otorgará y bajo qué
condiciones, por lo tanto, es estos modelos se cometan menos errores, al ser menos drásticos al
El presente trabajo se desarrolla con el fin de hallar un modelo que permita otorgar a los
mejorar el proceso de asignación de tasa para el mejoramiento del proceso mediante tres
Esta es una técnica que busca agrupar los individuos que presenten mayor homogeneidad
(similares o próximos entre sí) y que mediante la medida de similitud permite ir clasificando a los
Las variables se tienen en cuenta de acuerdo a su relevancia en los objetivos del estudio, lo que
permite la configuración de los grupos con una composición específica. Estas variables deben
presentar una métrica continua -aunque pueden ser cualitativas de tipo binario (dicotómicas, con
valores 0/1) o bien pueden ser datos de frecuencias. Generalmente, al previo análisis de clúster se
variable factorial obtiene los valores para cada individuo para proceder a la clasificación, esto con
el objetivo de obtener una nube de puntos donde los individuos se disponen de acuerdo a las
características que más les discriminan y los hacen diferentes, con las ventajas incorrelación
de los grupos. Hay variedad medidas que se representan como índices diversos donde se debe
tener en cuenta el nivel de medida de las variables. Las medidas o coeficientes de proximidad se
similaridad o disimilaridad.
Dentro de las medidas de similaridad que miden la proximidad entre dos elementos,
conforme aumenta su valor, aumentará la similaridad entre los individuos. En muchas ocasiones
de congruencia.
cercano a 0 como un indicador de que no hay relación lineal, un valor de correlación cercano a 1
es porque existe correlación y un valor mayor a cero que se acerque a 1 da una mayor correlación
ΣZxZy
r=
N
longitud del vector Xj por la longitud de la proyección de Xi sobre Xj. El coseno del ángulo es
una medida de similaridad entre Xi y Xj, con valores entre -1 y 1 en virtud de la desigualdad de
Schwarz.
p
∑ xr j ys j
j=1
C= p p
√∑ √∑
j=1
x ⋅ 2
rj
j=1
y 2s j
Respecto a las medidas de disimilitud o las medidas de distancia, que en su efecto cuanto
(individuo con dos características), se utilizada para identificar que tanto se parece X a Y ó en
cuanto se diferencia en cada característica y esas discrepancias quiero medir en un solo valor ,
ⅆ2 ( x , y )
Distancia Euclídea. es la raíz a la suma de los cuadrados de la diferencia entre los valores
de cada individuo.
2
ⅆ ( x , y )= √ ∑ ( x− y )
ẟ11 ẟ12 … ẟ1 n
ẟ21 ẟ22 …. ẟ2 n
Δ=⌈ … ⌉
…
…
ẟn 1 ẟn 2 … … ẟnn
Cada método puede generar soluciones distintas, a partir del mismo conjunto de datos
analizados, cada uno de ellos emplea criterios diferentes en la conformación de los grupos, por
esto, es importante conocer las características propias de cada método para seleccionar el más
las características del método clasificatorio puede o no exigir inicialmente, buscando determinar
seguidas es igual al número de casos menos uno. En cada etapa se calcula un valor que
indica la distancia en las que se forman las particiones. Al producirse un salto importante
en cada escala, es porque se han unido dos grupos con diferencias internas, en este caso al
decidir el número de grupos se debe tener en cuenta el criterio de retener la partición
anterior a la partición que se forma con un salto importante en el índice, es por esto que el
asociada a una proporción de varianza explicada mayor en relación a otra partición con
posición de los distintos grupos a través del cual podemos realizar comparaciones entre
para fijar una medida de ajuste entre los datos de partida y la estructura del dendrograma.
resultados.
c. Comparación de métodos distintos entre sí.
Mediante el proceso de validación se busca asegurar que la decisión sobre la tipología final
sea coherente, pertinente y estable, a su vez, existen otras técnicas descriptivas para la
interpretación de los resultados, como son las tablas estadísticas que relacionen las tipologías
obtenidas con las variables que han actuado de criterios clasificatorios, con otras que puedan ser
de comparaciones de medias.
relación entre una variable dependiente cualitativa, dicotómica (regresión logística binaria o
binomial) o más de dos categorías (regresión logística multinomial o regresión logística ordinal)
dependientes de tipo nominal con más de dos categorías (politómica) y es una extensión
multivariante de la regresión logística binaria clásica. Las variables independientes pueden ser
dependiente o de respuesta y se modelan varias ecuaciones simultáneamente, una para cada una
prueba.
categorías, y al considerarse una variable respuesta politómica (Y) con más de dos categorías de
p j( x) = P [ Y =Y J ./ X=x ] =f j ( x ) ∀ j=1 , … , k
k
respuesta. Así; ( Y/ X = x ) M (1; p 1(x), …, Pk (x)), siendo ∑ pj ( x ) =1.
j=1
Para un modelo lineal, se obtiene (2k) transformaciones logit para comparar cada par de categorías
de la variable respuesta, que sería de este tipo:
p i (x)
[ ]
ln
p i ( x )+ p j ( x ) pi (x)
p j(x )
p i ( x )+ p j ( x )
.
=
ln
[ ]
pi( x ) ,
.
∀ i, j=1, … k (i≠ j)
transformaciones logit básicas, definidas con respecto a una categoría de referencia, tomando
como referencia la última Yk. Así las transformaciones logit generalizadas se definen como;
p j(x )
Lj (x) = ln
[ ]
pk ( x )
∀ j = 1,…. K - 1 , siendo Lj (x) el logaritmo de la ventaja de respuesta el
El modelo lineal para cada una de las transformaciones logit generalizadas, para n variables
explicativas, es así:
n
Lj ( x )=∑ bsj x s=x b j ∀ j=1 , … . , k−1
s=0
Para cada vector de valores observados de las variables explicativas con X = (Xo, X1, X2,….
Xn) con Xo = 1 y bj = (boj, b1, … bnj) el vector de parámetros asociado a la categoría Yj.
variables de diseño mediante el método parcial que asigna un 1 a la variable asociada a cada
categoría y un cero 0 a las otras, y tomando como categoría de referencia la primera, obtenemos
p-1 variables que se denotan como X Am ( m=2 ,… p ) . Para el modelo se deben incorporar todas las
2. CAPÍTULO 2
METODOLOGÍA
de los créditos vigentes (activos) a cierre de diciembre de 2019, la cual se depuró, adicionalmente
cooperativa, evaluando los pesos asignados a cada una de las 19 variables a estudiar.
con la cooperativa
Activos: corresponde a los activos líquidos que reporta el asociado en la base única de
clientes.
Pasivos: corresponde a los pasivos líquidos que reporta el asociado en la base única de
clientes.
Saldo Depósitos: corresponde a la suma del valor acumulado en cdat, ahorros y aportes,
(pasivos / activos)
pagos establecido.
Valor Promedio desembolso: es el valor promedio de los créditos en los últimos cinco
años
Días de Mora cierre: es el número de días en estado moroso que presenta el asociado en
el crédito desembolsado.
Plazo: corresponde al periodo acordado para pagar las operaciones de crédito, hace
referencia al número de cuotas fijadas por el asociado para pagar la totalidad del crédito
vigente.
masculino y no definido, este último hace referencia a los asociados identificados como
persona jurídica.
Estrato: ubicación del domicilio de los asociados dentro de la sociedad, esta variable se
días de mora, la cual se clasifica en 4 categorías A son los créditos que presentan riesgo
mora, C es la calificación de riesgo regular por mora hasta 90 días, D es la calificación del
riesgo sobresaliente para mora que tiene un límite de hasta 120 días y la calificación E
significa el riesgo más alto dentro de la cartera, que es incobrable para mora mayores a
120 días.
identificación previa se decide realizar una serie de filtros, buscando congruencia en los datos, a
Los créditos bajo el destino económico “cupo activo”, son créditos que por su plan de pagos
presenta alta volatilidad, porque su saldo se activa de manera rotativa, de esta manera se
Los créditos que al momento de establecer las condiciones de pago presentan beneficio
en la misma, estos son los desembolsados bajo el código de producto “Finagro”, “Vivienda
registros.
referencia a aquellos créditos que han sufrido cambios en las condiciones de otorgamiento o en la
Los créditos con saldo en cero pesos, ya que al corte de generada la información son
reflejados, son 439 registros que se eliminan por tratarse del pago anticipado (prepago) del
crédito, que consiste en reembolsar todo el financiamiento antes del periodo pactado.
Los créditos duplicados se filtran 8.490 registros, que corresponde al número de créditos a
nombre del mismo asociado ya sea por el mismo destino o por otro. En este sentido permanecen
los créditos que contienen la cuantía mayor y conserva sus datos iniciales, respecto a las variables
otorgamiento de crédito es un requisito contar con este ingreso, se reducen 1.545 registros.
corresponde a la realidad, se asumen errores operativos en digitación por parte de los asesores
que al momento de diligenciar estos datos los realizan basados en cumplir un requisito y no se
por muestra el comportamiento real de los bienes, se depuran 16.903 activos y 17.936 en pasivos.
Respecto a los créditos de Presta U, se filtran 1.371 registros, toda vez que comprenden
créditos con ciertas campañas en becas y auxilio económico en la apertura de aportes por parte
Se filtran 1.089 registros que según el plazo pactado para terminar su crédito es de seis (6)
meses, ya que el retorno de los intereses es muy corto plazo. Posterior a depurar los anteriores
3. CAPÍTULO 3
ANALISIS EXPLORATORIO
variable respuesta arrojada en el clúster, que contiene tres categorías nombradas “Premium”,
Durante el tratamiento de los datos, se utilizó los comandos básicos para los análisis descriptivos
y el paquete FactoMiner, ade4, MASS, psych, rgl, ggplot2, grid, REdaS, psych, GPArotation,
análisis descriptivo para extraer conclusiones sobre el comportamiento de las variables utilizadas
en el estudio.
Al analizar la variable edad, se evidencia que la población en estudio refleja una edad promedio
en los asociados de 45,43 años, la edad mínima es de 18 años y la máxima de 88 años, respecto a
la antigüedad de los asociados presentan un promedio de 4,82 años, cabe resaltar que la
fidelizados. Por otro lado, en variables las variables que representan el comportamiento de los
resultados financieros de los asociados y que al momento de una solicitud de crédito dan a
conocer a la entidad financiera, los Activos que disponen los asociados tiene un valor mínimo de
valor del pasivo mínimo es de $830.000 y el máximo de $612.213.658 pesos, con un pasivo
promedio de $25.468.959 pesos. En cuento a los ingresos mensuales del asociado, que son
provenientes de las ventas de sus negocios, salarios, pensiones, arriendo entre otros. El ingreso
promedio se evidencia en $8.109.893, ocupando una fuerte concentración del 75% en montos de
Por último, apalancamiento es una variable calculada de los pasivos sobre los activos, es decir;
las deudas que presentan frente al respaldo que tienen para cumplir con sus obligaciones, y se
concentra en los índices del 7% y 34%, lo que indica que los asociados tienen un respaldo
Correspondiente a los recursos que tienen los asociados en la Cooperativa, a través de sus
cuentas de ahorros, CDATs, y aportes, el saldo mínimo de ahorros son $524 y el máximo que
presentan menos de un prepago, esto se refiere a las obligaciones financieras que el asociado ha
pagado en su totalidad anticipada a la fecha de su vencimiento. Durante los últimos cinco años el
75% de los asociados ha presentado 3 créditos, ya sean por diversos montos, plazos o líneas de
crédito y de los asociados el máximo que ha tenido crédito durante este lapso de tiempo han sido
87 créditos.
siendo el mínimo de $1.000.000 y el máximo de $700.000.000 es cual es un dato atípico para esta
El promedio de la tasa efectiva anual es del 22.56% con una minina del 11.20% y máxima
de 42.60%, las cuales son asignadas de acuerdo al destino económico, el plazo y el monto por el
cual se otorgue el crédito, en cuanto a los días de mora el promedio es de 17 días , con un
máximo de 2.658 días, el 75% de los asociados presentan cero días de mora, lo que indica un
buen habito de pago pago dentro de los datos analizados, el plazo está representado por los meses
a los que fue otorgada la operación de crédito, es decir un crédito de 1 año es equivalente a un
promedio asciende a 46 meses. Respecto a las cuotas pagadas se puede explorar que la media es
de 14 cuotas, y el 75% de los asociados llevan 22 cuotas pagas. La última variable cuantitativa
cuotas pendientes refleja un promedio de 32 meses y un máximo de 154 cuotas, se determina que
en promedio los asociados tienen más cuotas pendientes que las cuotas pagadas, a su vez el 75%
de los asociados presentan por debajo de 46 cuotas pendientes. Lo que quiere decir que estima
que el recaudo de cartera cumpla con el plan de pagos acordado al inicio de cada obligación
financiera.
En cuanto a la descripción de las variables categóricas, se involucra genero conformado
por 18.804 hombres, 14503 mujeres y 121 personas jurídicas, que al relacionar con la antigüedad
encuentra discriminado en : 1 el cual abarca 3.993, 2 con 11.377, 3 con 11.008, 4 con 5.694 , 5
con 915 , 6 con 240 y el ultimo estrato 7 con 201, presentando mayor concentración de asociados
en los estratos 2 y 3 denominamos como Bajo y Medio-bajo , respecto a la cartera está clasificada
en A con 31.552, 403 con B , 204 con C, 297 en d y 972 en E, lo que indica un fuerte
negativa y/o positiva entre las variables, determinando que variables como activos, pasivo, valor
desembolso, saldo promedio crédito. Pasivos presenta correlación mayor a 0,5 con; activo y valor
desembolso. Numero de crédito con crédito prepagados, valor desembolso con saldo promedio de
crédito. Plazo presenta correlación con cuotas pendientes están moderadamente positiva
relacionadas entre sí. Por lo tanto, estas variables miden la misma destreza en sus características y
como “persona jurídica”, poseen valores diferentes en variables como “promedio de créditos”,
“activos” e “ingresos”. Por lo tanto, se procede a excluir 121 datos del posterior agrupamiento y
se concluye estos asociados reflejan valores superiores y diferentes al resto de la población, por
En la figura 9 se muestra la representación gráfica que resume el proceso de agrupación para los
asociados “Persona Jurídica”, en donde es difícil visualizar la diferencia de los tres grupos y el
Cluster Dendrogram
2
1
H eigh t
0
09 119 505 567
9759 744 677
9 90 64 41
333 999152 147 340
972 15 41
332 177 389 107 805
9 18 94 33
333 018790 974 668
3 9 76 37
401 87 19
121 755 926 392 729
22 8822 55 29
5223
333 668922 379 739
7 1 12 81
8960 27 71
8 30 86 83
334 780404 624 256
1 8 48 32
446
387227781
0 5 94 76
3321
333 787849 260 464
5 3 39 20
8 7 05 32
2 0 36 11
712
7 13 67
2 08 94 23
333 178530 522 550
5 5 753 777
53
8 16 04
7 9 259 418
679
33 678 087 792 029
8 29 83
766
333 132145 768 213
26818
95 473 166
19 70
99 54 50
58 12 87
38 42 41
90
34 13 41
71 03 07
22 29
04 77 91
29 818 660
27 365 812
59 196 657
35
87 219 853
75 726 106
69
81 08 97
5605219
4
33 47
334 994
333 83
334 95
33 902
333 62
323 833
333 52
32 350
233 05
333 877
433 00
331 56
333 97
33 951
134 14
432065
434 02
33 76 04
313 25
333 88 49
333 27
322 17 80
333 54
333 113
333 63 39
333 44
33 83
332 560 37
333 83
331 965
33 47 63
323 72
333 729 86
212 99
321 378
233 640 79
23697
4
-1
literal 2.2) y análisis exploratorio (mencionado en el literal 3.1) , se contó con una base de 33.307
en uno de los objetivos específicos. Se estimaron tres grupos para diferenciar a los asociados
datos utilizada que asciende a 33.307 datos, además se basó en la minimización de la suma total
de las distancias en lugar de la suma de cuadrados de distancias, identificando así, el punto más
aplicando la técnica ACP (componentes principales) para las dieciséis (16) variables cuantitativas
y para las tres (3) variables categóricas, para estas últimas se creó un factor que almacena las
variables para el análisis de clúster, bajo el algoritmo CLARA (clustering for large applications)
donde se determinó que las siguientes variables predominan en la consecución de los clústeres.
Para enriquecer el trabajo, adicionalmente se utilizaron tres variables para identificar perfiles de
VARIABLES
VARIABLES
VARIABLES UTILIZADAS
UTILIZADAS EN EL
ESTUDIADAS ANALISIS
ANALISIS CLUSTER
CATEGORICO
Edad Activos Edad
Años de Antigüedad Pasivos Genero
Activos Saldo de Depósitos Estrato
Pasivos Apalancamiento
Ingresos Valor Desembolso
Saldo de Depósitos Saldo Prom. Créditos
Apalancamiento Tasa Efectiva
Créditos Prepagados Plazo
Número de Créditos Días de Mora
Valor Desembolso
Saldo Promedio
Créditos
Tasa Efectiva
Días de Mora
Plazo
Cuotas pagadas
Cuotas pendientes
Genero
Estrato
Calidad de la Cartera
3.2.5 Identificación del clúster asignado a cada asociado
xxxxxx
3.2.5.1 Ejecución de interacciones
Al ingresar los datos en el código de R, bajo el algotimo “clara” de clasificación no
Al correr nuevamente el modelo tomando como variables; activo, pasivo, saldos depósitos,
apalancamiento, valor desembolso, saldo promedio de crédito, tasa efectiva y plazo, las cuales
nos explican el 56,2%, siendo el modelo que presenta una correlación moderada entre las
variables.
Para el grupo 1 está conformado por 14.511, con un isolation de 1,545820, lo que
indicando que las distancias entre los individuos es menor frente al grupo 2, es decir se presenta
Para el grupo 2 está conformado por 10.328 individuos con un isolation de 1,975972, lo
que indicando que las distancias entre los individuos son menores frente al grupo 3, el promedio
de los datos es más alto que el grupo 1, dándose una mayor distancia entre los individuos.
Indicando que los individuos se encuentran un poco más dispersos del punto medio y representan
distancia frente a los dos grupos anteriores y se da una circunferencia más dispersa, indicando
que los datos se encuentran mucho más alejados del punto central o del centroide.
Cluster plot
15
10
Dim2 (15.9%)
cluster
1
2
3
5
-5
0 5 10 15 20
Dim1 (40.3%)
Clúster 1
De acuerdo a las características de los asociados se identifica que este clúster es catalogado como
“no aplica”, ya que su comportamiento respecto a los demás clústeres presenta menor similitud
para aplicar al beneficio, principalmente según los días de mora son superiores a 16 días.
Se cataloga como “Básico”, el cual lo integra los asociados con días de mora menores a 15 días,
Principalmente con depósitos intermedios entre $220.000 a $1.300.000 y con activos entre
Clúster 3
Se ha catalogado como “Premium” a los asociados que presentan menos de 5 días de mora los
cuales reflejan un buen habito de pago, su plazo de crédito en promedio es de 50 meses, lo que
nos permite tener un retorno acorde al plazo total, son asociados representativos por el valor del
2e+08
Presentando una concentración en el bigote, lo
1 2 3
cluster
75%.
Mediante la caja y bigotes se puede observar que los asociados tienen mayor dispersión en la
variable valor desembolso entre el 50% y 75%, frente al 25% y 50%. El bigote de la derecha es
más largo que el bigote de la izquierda dándose una mayor dispersión del valor de desembolso, a
su vez presenta un dato atípico. Es muy similar lo que ocurre con el clúster 2, sin embargo, en
la misma distribución frente al Q2, a su vez el bigote de la derecha es más largo dándose una
cluster
los tres clústeres presentan una distribución
1
0.50
2
3
de las observaciones con asimetría a la
100 1
2
diferente sucede con los datos extremos y atípicos
3
0
compartir el Q3. Este clúster, presenta una mayor
1 2 3
cluster
dispersión en el plazo entre el 50% y 75% de los
asociados, y el bigote de la derecha es más largo que el de la izquierda, por ello por ello hay más
dispersión en el plazo.
2
3 75% a diferencia del primer rango, a su vez
0.2
mediante el bigote de la derecha se observa
promedio del 24%. La tasa de interés mediante el clúster 2, presenta un promedio de la tasa del
21%, dándose una mayor dispersión de la tasa entre el rango el Q2 y Q3, que el Q2 y el Q1. A su
vez se observa una mayor dispersión en la tasa representado por el bigote derecho. Este clúster
presenta datos extremos. En el clúster 3, entre el Q1, Q2 y Q2, Q3, se observa que es muy
similar la dispersión en la tasa de interés que manejan los asociados, sin embargo, aquí se dan
más datos extremos indicando que hay asociados, aunque son pocos que tienen tasas más altas, la
tasa más baja que se da en la población estudiada se encuentra en este clúster con una tasa del
18,49%.
Al observar la variable ingresos para
4e+08
1
2
3 cuartiles, siendo los valores
2e+08
subsecuentes atípicos y/o extremos
0e+00
El cluster 3 que está conformado por
1 2 3
cluster 4.383 asociados, los cuales presentan
dos clústeres anteriores y se da más concentración entre el Q1 y Q2, frente al Q3. Así mismo,
8e+08
cluster
activos entorno a la media del
Activos
1
4e+08
2
clúster, es decir a $38 millones
3
en promedio, y presentan mayor
0e+00
1 2 3
cluster
Q3, como se observa en la gráfica. A través del clúster 2, se observan que los asociados que lo
conforman tienen activos que no son tan dispersos entre el Q1, y Q3. Se da una mayor dispersión
de los activos sobre el Q3, frente al primer Q1. Mediante el cluster 3, se observa que los activos
comprendidos entre el 25% y el 50% son más concentrados frente al 50% y 75%, dándose un
promedio de $411. 432.921. Así mismo, el bigote derecho es más pronunciado que el izquierdo,
dándose una mayor dispersión de los datos los cuales son denominados extremos y atípicos el
2
3 datos extremos y atípicos. A diferencia de
1 2 3
cluster Por otra parte, en el cluster 3, el 50% de
millones (Q3- Q1), el bigote del lado derecho es más largo frente al izquierdo lo que refleja una
alta dispersión en los cuales se presentan datos extremos y algunos atípicos, siendo el máximo de
$612millones en deudas.
1 2 3
cluster El cluster 2 y 3, son asociados que tienen
presentan mora, así mismo, el día de mora máximo son 15 días. Siendo estos asociados que
3e+08
1e+08
0e+00
1 2 3
cluster
tres cluster se presenta dispersión entre los datos reflejado en el bigote derecho, en una menor
proporción el cluster 2.
Así mismo, el clúster 3 y 1, presentan datos atípicos. Y se da una mayor concentración en el 25%
50
30
años, con un promedio de 3 años. Así mismo,
cluster
Años_antiguedad
20
3 derecho. Se presentan datos atípicos siendo el
máximo de 45 años.
10
En el cluster 2, el 50% de los asociados,
concentración en el 25% del bigote derecho frente al cluster 2. Y los dos cluster presentan datos
extremos, reflejando que hay asociados que tiene una antigüedad mayor a 9 años, la máxima para
3.2.7.1 Genero
1 2 3
E
D
C
80
1 2 3
cooperativa en estudio.
3.2.7.3 Estrato Socioeconómico
4
3
2
1 mayor población en dos niveles “Bajo” con el
60
respectivamente.
para evitar el sesgo del cluster 3 se realizó una división en la base de datos (esto mismo se hizo
para el ordinal y no fue solución) de la siguiente manera: Se tomó una base de entrenamiento
(con la cual se formularon los diferentes modelos) de 12.286 individuos, conformados por el 80%
del clúster 3 (3507 individuos), 40% del cluster 2 (4131 individuos) y el 25% del cluster 1 (4648
individuos) y una base de datos para la evaluación del modelo de 21021 datos. Con esta última se
evaluó que tan bien el modelo detecta cada uno de los grupos. Le hice el análisis al último
modelo planteado (tiene el menor AIC) y tiene un nivel de buena agrupación en la mayoría de los
coeficientes:
Al aumentar los ingresos aumenta la probabilidad de estar en la categoría dos o tres respecto a la
categoría uno (no aplica). De igual forma se observa con el aumento en los años de antigüedad o
en el aumento del tiempo de plazo de pago del crédito. En el caso de los día de mora, la relación
es inversa (singo negativo de los coeficientes), al disminuir los días de mora, aumenta la
37,1% (baja), sin embargo, al revisar la clasificación correcta por grupos tenemos que el modelo
Básico (categoría 2) en comparación con no aplicársele beneficio. Por cada aumento en un millón
comparación con no tener Beneficio. También se observa que por cada año de más en la
más probable que se obtenga el Beneficio Plus. En el caso del plazo, por cada mes de más,
obtener Beneficio Plus, en comparación con no tener Beneficio. Por cada día de mora, disminuye
años de antigüedad, tantos días de mora y tanto plazo…pueden variar alguna de las variables y
mirar las comparaciones. Hallan entonces la probabilidad de pertenecer al grupo Básico (armen
las ecuaciones del modelo), de pertener al grupo Plus (según las ecuaciones que se arman con los
0e+00
1e+08
2e+08
3e+08
4e+08
5e+08
6e+08
7e+08 0e+00
1e+08
2e+08
3e+08
4e+08
5e+08
6e+08
7e+08
Dias_de_mora = 0 Dias_de_mora = 510 Dias_de_mora = 1000 Dias_de_mora = 1500 Dias_de_mora = 2000
1.0
0.8
cluster (probability)
0.6
0.4
0.2
0.0
0e+00
1e+08
2e+08
3e+08
4e+08
5e+08
6e+08
7e+08 0e+00
1e+08
2e+08
3e+08
4e+08
5e+08
6e+08
7e+08 0e+00
1e+08
2e+08
3e+08
4e+08
5e+08
6e+08
7e+08
Ingresos
El gráfico deja ver que en clientes con no morosidad, el aumento de los ingresos aumenta
considerablemente la probabilidad de obtener beneficio Plus. Los clientes con alta morosidad
(más de 510 días de mora) no reciben beneficio alguno, a pesar del nivel de ingresos.
Años_antiguedad*Dias_de_mora effect plot
3
2
1
0 10 20 30 40 50 0 10 20 30 40 50
Dias_de_mora = 0 Dias_de_mora = 510 Dias_de_mora = 1000 Dias_de_mora = 1500 Dias_de_mora = 2000
1.0
0.8
cluster (probability)
0.6
0.4
0.2
0.0
0 10 20 30 40 50 0 10 20 30 40 50 0 10 20 30 40 50
Años_antiguedad
En el caso de años de antigüedad se observa que en clientes no morosos o con pocos días de
mora, al aumentar los años de permanencia en la cooperativa la probabilidad de obtener el
beneficio plus aumenta considerablemente, disminuyendo de igual forma la probabilidad de no
obtener beneficio. Los clientes con alta morosidad no se ven beneficiados a pesar de la
antigüedad en la cooperativa.
Dias_de_mora*Años_antiguedad effect plot
3
2
1
0.8
cluster (probability)
0.6
0.4
0.2
0.0
0 500 1000 1500 2000 0 500 1000 1500 2000 0 500 1000 1500 2000
Dias_de_mora
REFERENCIAS BIBLIOGRÁFICAS
ERADOS/conglomerados.pdf
Hand, D.J. and Henley, W.E. (1997) Statistical Classification Methods in Consumer Credit
https://doi.org/10.1111/j.1467-985X.1997.00078.x
http://noesis.uis.edu.co/bitstream/123456789/38756/1/163516.pdf
en: https://crear.poligran.edu.co/publ/00008/SFB.pdf
en: https://crear.poligran.edu.co/publ/00008/SFB.pdf
https://es.slideshare.net/gustavovasconez/scoring-una-herramienta-para-evaluacin-de-
microcrdito?next_slideshow=2
Dr. Dabós Marcelo, Credit Scoring -Escuela de Negocios –Universidad de Belgrano, (2015),
disponible en:
https://mba.americaeconomia.com/sites/mba.americaeconomia.com/files/credit_scoring.pdf
Martínez Zapata David, Desarrollo y validación de modelo de scoring de admisión para tarjetas
https://www.fundacionmapfre.org/documentacion/publico/i18n/catalogo_imagenes/imagen_id.c
md?idImagen=1102733
Arango Duque Laura y Restrepo Baena Daniel, Diseño de un modelo de scoring para el
https://repository.eafit.edu.co/bitstream/handle/10784/12434/Laura_ArangoDuque_Daniel_Restr
epoBaena_2017.pdf?sequence=2.
Grazt Diana, Caracterización de los clientes de una entidad financiera por medio del Análisis de
http://revistas.unipamplona.edu.co/ojs_viceinves/index.php/FACE/article/view/2650
Rodríguez, D.E. (2017, 2 de noviembre). Cómo funcionan las tasas de interés del Banco Central.
tasas-de-interes-del-banco-central
https://www.banrep.gov.co/es/estadisticas/tasas-interes-politica-monetaria
Posada, C.E. Banco de la República. Las tasas de interés en Colombia. Recuperado
https://www.banrep.gov.co/es/tasa-interes-colombia
https://www.banrep.gov.co/es/estadisticas/tasas-colocacion
Recuperado https://www.banrep.gov.co/sites/default/files/manual-usuario-tasas-de-
colocacion.pdf
Recuperado de https://www.netquest.com/blog/es/blog/es/muestreo-probabilistico-muestreo-
conglomerados
http://www.fuenterrebollo.com/Economicas/ECONOMETRIA/SEGMENTACION/CONGLOM
ERADOS/conglomerados.pdf
cuantitativa
Lopera E. (2018) los arboles de decisión como herramienta para el análisis de riesgos de los