Está en la página 1de 88

Descripción y de Desarrollo de las Cajas Municipales

Visión General de las Cajas Municipales


Las Cajas Municipales se encuentran formando parte integrante del Sistema Financiero Nacional, está sujeta
a la supervisión de la Superintendencia de Banca y Seguros (SBS) y a la regulación del Banco Central de
Reserva del Perú (BCRP). En su condición de entidades autorizadas a recibir depósitos de ahorro del público
son miembros del Fondo de Seguro de Depósitos (FSD). Por su naturaleza pública, son controladas por la
Contraloría General de la República y en materia presupuestal observan las disposiciones del Ministerio de
Economía y Finanzas, manteniéndose en todo momento su autonomía económica, financiera y administrativa
que le otorga la Ley.

Al 30 de Setiembre del 2010 otorgaron alrededor de 8 mil millones de soles entre todas las cajas, cuya cuota
por caja la podemos apreciar en el siguiente cuadro

Fuente : http://www.cmacpiura.com.pe/inst/pres.jsp

Como se puede apreciar el sistema de cajas municipales está conformado por 13 entidades que atienden al
30% del sistema microfinanciero regulado .

Hoy en día el ingreso de la banca al negocio del microcrédito, a través de la adquisición de entidades
especializadas, empuja a las cajas municipales a considerar la posibilidad de fusionarse e incorporar a nuevos
accionistas ya que muchas de ellas tienden a disminuir sus posibilidades en el mercado financiero.
Visión Estratégica de la Caja Trujillo
Han pasado más de 25 años desde el inicio de operaciones con el claro objetivo de atender a los pequeños y
medianos empresarios facilitándoles el acceso a créditos, y sirviéndoles de apoyo para poder hacer empresa
en nuestro país. Como entidad microfinanciera, Caja Trujillo fue fundada el 19 de octubre de 1982, pero el 12
de noviembre de 1984 inicia formalmente nuestras operaciones.

Durante estos 25 años, Caja Trujillo ha colaborado con el crecimiento microempresarial de miles de sus
clientes, logrando consolidarse como una institución orientada al apoyo crediticio a las PYME. En estos años,
no sólo ha sido testigo del crecimiento de sus clientes, sino que también ha sabido extenderse en diversas
provincias del país, con el único objetivo de estar cerca de sus clientes, brindándoles el mejor servicio y
ofreciéndoles productos de acuerdo a sus necesidades.

Su proceso de expansión se inició en 1990 con la puesta en funcionamiento de la primera agencia en el


centro comercial Las Malvinas, la misma que luego fue trasladada al CC Zona Franca. En 1991 inicia
operaciones en El Porvenir, y en 1994 abre su primera agencia fuera de Trujillo, siendo Chepén la ciudad
escogida. En el año 2001 inaugura su primera agencia fuera de la región, en la emprendedora ciudad de
Chiclayo, iniciando su expansión hacia otros departamentos.

Hoy se encuentra presente en la costa, sierra y oriente del país, con 50 agencias y oficinas, por lo que resulta
indiscutible e innegable no sólo el crecimiento de nuestros clientes, sino también el de la Caja.

Misión.
Brindar soluciones financieras en forma rápida y oportuna a los clientes, con un equipo humano orientado
hacia la excelencia, contribuyendo al desarrollo económico y social del país

Visión.

Ser la mejor institución microfinanciera ágil y confiable en la generación de valor para nuestros clientes,
colaboradores y accionistas

Valores

1. Orientación al cliente.
2. Desarrollo para los colaboradores.
3. Orientación al logro.
4. Integridad y honradez.
5. Trabajo en equipo.
6. Orientación a la innovación y calidad.
7. Liderazgo.
Organigrama
Funciones Principales de los Procesos de Estudio

Productos, Servicios y Sistema de Ramo.


La CMAC TRUJILLO es una entidad financiera no bancaria que sirve a los consumidores y negocios a través
de sus agencias. Cada agencia ofrece un rango de productos y servicios como:
 Productos Personales
o Créditos Comerciales.
o Créditos de Consumo,
o Crédito Hipotecario MI VIVIENDA;
o Cuenta de Ahorros,
o Cuenta de Ahorro a Plazo Fijo.
o Credi Joya
 Productos para Negocios
o CrediAmigo
o Crédito Mujer
o Crédito Pyme
o Crédito Taxi
o Crédito AgroEmprendedor
o Rapidiario
o Crédito Facilito

Créditos Comerciales

Son créditos directos o indirectos otorgados a personas naturales o jurídicas destinados al financiamiento de
actividades de producción y comercialización de bienes y servicios en sus diferentes fases.
También son aquellos créditos otorgados a las personas jurídicas a través de créditos, operaciones de
arrendamiento financiero u otras formas de financiamiento que tuvieran fines similares a lo señalado en el
párrafo anterior.

Son créditos que se otorgan a las personas naturales con la finalidad de atender gastos de consumo como:
compra de bienes, servicios y diversos gastos no relacionados con una actividad empresarial. Pignoraticio
Créditos Personales
Son créditos otorgados a trabajadores con ingreso mayoritariamente dependiente, cuyo pago debe realizarse
directamente en las oficinas de Créditos Institucionales

Son aquellos créditos que se otorgan a las personas naturales con la finalidad de atender la compra de
bienes, servicios o gastos NO relacionados con la actividad empresarial, para lo cual es indispensable que
medie un convenio institucional con la CMAC.
La empresa con la que se realice el contrato podrá ser pública o privada y deberá tener un mínimo de dos
años de funcionamiento debidamente sustentado.
Estos créditos se realizan mediante descuento directo en planilla de sueldos
Créditos Hipotecarios.
Crédito Hipotecario es un programa creado especialmente por la CMAC para financiar viviendas de interés
social, mediante un sistema de crédito hipotecario.
Gracias a este producto y la CMAC, cientos de familias cusqueñas podrán adquirir con mayores facilidades su
casa propia.

Cuenta de Ahorros
Es una cuenta de ahorros, de libre disponibilidad con una tasa de interés preferente.

Cuenta de Ahorros a Plazo Fijo


Es una cuenta de ahorros, a plazo fijo, el ahorrista goza de tasas de interés preferenciales por monida, por
plazo, muy por encima del mercado financiero local la misma que goza de gran acogida, por lo que es uno de
los productos estrella de la CMAC

Cuenta de Ahorros con Ordenes de Pago


Es una cuenta de ahorros que cuenta con la disponibilidad de una chequera, que facilita al cliente del a CMAC
la realización de sus transacciones comerciales.

Cuenta de Ahorros a Plazo Fijo - CTS


Es una cuenta de ahorros a plazo fijo destinada para los trabajadores dependientes, con atractivas tasas de
interés, además de ellos los clientes de este producto reciben beneficios adicionales al os demás.
Comprensión del Negocio

Determinación de objetivos de negocio

Dado el entorno que actualmente viven las cajas en donde se ven agobiadas por la competencia y

requieren fidelizar más a sus clientes surge la necesidad de establecer un proceso avanzado de

segmentación de sus clientes y establecer estrategias diferenciadas.

Así mismo el factor morosidad se encuentra agobiando a la institución a niveles de 9.1% más allá del

promedio del mercado 6.4%, (http://www.equilibrium.com.pe/CmacTruji.pdf) por lo que los créditos a

otorgar deben ser mejor evaluadas con técnicas automatizadas que determinen en base al análisis

histórico de los datos. Es necesario que esta evaluación y calificación del prestamista sea de una manera

más eficiente y automatiza con margen de error casi nulo. Veamos a continuación la evolución de la

cartera pesada:

Adicionalmente es necesario establecer metas exigidas pero a la vez alcanzables a cada sucursal y

a la vez estas sean replicadas a los niveles inferiores como son los supervisores y asesores de negocio.

Para ello es necesario contar con una herramienta automatizada que optimice la asignación respectiva de

las metas de captaciones y colocaciones.


Al 30 de Junio el indicador de rentabilidad (ROAE) medido como las utilidades anualizadas sobre

el patrimonio neto promedio fue de 8.9% tal como se puede apreciar en el siguiente cuadro.

Hacia finales de agosto del 2010 la clasificadora de riesgos: equilibrium presenta las siguientes

clasificaciones:

Lo cual marca una tendencia negativa si se comparan con indicadores anteriores.

En resumen se pueden establecer los siguientes objetivos prioritarios del negocio a nivel de la gestión

operativa que ayuden a una mejora en los indicadores y niveles de riesgo que la institución pueda

presentar se definen a continuación .

Objetivos de negocio

 Mantener y reducir los niveles de morosidad, asegurando una evaluación más exacta en los diferentes

tipos de solicitud de crédito que atiende.


 Mantener a los clientes que generan mayor valor a la institución a fin de reducir el riesgo de que se vayan

a la competencia

 Establecer metas adecuadas de captaciones y colocaciones a los diferentes niveles de la institución a

fin motivar un mejor rendimiento de los colaboradores.

Criterios de éxito de negocio

 Se tiene un posicionamiento e imagen positiva de la institución reconocida en el norte del país.

 Conocimiento del mercado de la pequeña y micro-empresa.

 Existe un sistema transaccional solido que asegura la integridad y rendimiento óptimo de las distintas

operaciones realizadas por sus clientes.

 Deseo constante de incorporación de nuevos productos en el mercado.

 Es supervisada en su gestión por organismos gubernamentales del estado peruano.

Contexto Actual

Se cuenta con información detallada de las operaciones vinculadas a los clientes, préstamos y

movimientos desde el año 2000 a la fecha. Todas las bases de información se encuentran normalizadas y

con la documentación vinculada a las mismas. Es decir respecto a la situación global del negocio se puede

decir que toda la información necesaria para la explotación de datos se encuentra disponible pero en

forma dispersa. Cada sucursal que forma parte de la organización tiene su base de datos que si bien es

cierto mantiene una misma estructura pero necesita de una tarea de integración de datos.

A continuación hacemos un repaso de los recursos, requerimientos, supuestos y riesgos de la

solución a implementar.

Inventario de Recursos

 Recursos de software.

o Motor de Base de Datos: SQL Server


o Software para construcción de Modelo de Minería de Datos: Servicios de Análisis de MS SQL

Server que incluye algoritmos de: Arboles de Decisión, Naive Bayes, Series de Tiempo,

Asociación, etc.

o Add-ins de Minería de Datos para MS Office con conexiones directas al motor de datos.

o Multiples Plataformas de Trabajo

 Aplicaciones Locales

 Aplicaciones Distribuidas.

 Recursos de hardware: cuenta con un Data Center equipado con equipos de alta generación.

o Servidores Web

o Servidor de Administración de Archivos.

o Servidor de Aplicaciones

o Servidores de Bases de Datos. Se han agrupado en 2 sites:

SITE 1

 Marca IBM – x366

 Procesadores: 4x 3.16

 Memoria: 4 Gb x 3.16

 Tarjetas de Fibra 2

 Cantidad de Servidores: 2

 Switch de Fibra: 2005 B16

 Sistema de almacenamiento externo: DS4800 IBM con la siguiente configuración :

SITE 2
 Marca IBM – X255

 Procesadores: 4

 Memoria: 4 Gb

 Tarjetas de Fibra 2

 Cantidad de Servidores: 2

 Switch de Fibra: 2005 B16

 Sistema de almacenamiento externo: DS4300 IBM con la siguiente configuración :

o Estaciones de trabajo HP de última generación.

 Fuentes de datos y reconocimiento.

o Base de Datos con operaciones por cada sucursal.

o Documentación actualizada y permanente de la base de datos.

 Personal

o Se cuenta con personal experto en análisis de datos utilizando técnicas estadísticas

convencionales y uso intensivo de hojas de cálculo.

o Algoritmos propios desarrollados por el personal especializado.

o Hay contacto directo y permanente con los administradores de la base de datos, personal y

soporte técnico.

o A continuación mostramos los expertos y equipo de investigadores que ayudarán en la

consecución del trabajo.

Experto Proceso Negocios

Atención Clientes

Créditos y Colocaciones

Planificación
Requerimientos, Supuestos y Riegos

A continuación presentamos una lista de los requerimientos, así como los supuestos, restricciones y riesgos

respectivos a fin de tener en cuenta como parte del desarrollo normal de la investigación. Cabe resaltar que es

necesario prestar atención a estos puntos ya de demarcaran el desarrollo futuro y normal del proyecto y

permitirán satisfacer los objetivos propuestos del negocio.

a. Requerimientos

o Equipo de Trabajo

Nombre Rol en el Proyecto

Experto en Minería de Datos

Investigador en Minería de Datos

Administrador de Base de Datos


o Disponibilidad de Datos (acceso de consulta, de un mínimo de 3 últimos años)
 Datos de Clientes
 Datos de Prestamos
 Datos de Cronogramas de Pagos.
 Datos de Cobranzas de Prestamos.
 Modelo de Datos de tablas mencionadas anteriormente.

o Herramientas a utilizar
 SQL Server 2008 Edición Developer o Enterprise.
 BI Development Studio. Integration Services
 BI Development Studio. Analysis Services.
 MS Excel 2007 o superior

b. Supuestos

o Se cuenta con el equipamiento y comunicaciones suficientes para el desarrollo del proyecto.


o La institución proporciona los accesos de lectura a la Base de Datos o a parte de ella.
o Se cuenta con la documentación de la base de datos transaccionales.
o El software a utilizar para la implementación del producto se encuentra licenciado.
o El personal que propone la institución tendrá la disponibilidad suficiente para el proyecto.
c. Restricciones
o El estudio debe completarse en un máximo de 3 meses.
o El equipo del proyecto se compromete a la total Confidencialidad de la Base de Datos de la
institución.
o La plataforma de trabajo debe ser usando herramientas Microsoft.
o El código fuente y los algoritmos identificados serán propiedad de la institución por tiempo
indefinido para ser usado dentro de cualquier parte de la misma sin límite alguno.
o Se proporcionará una muestra de la información, por razones de seguridad y confidencialidad de
los datos.

Terminología

o Ver Anexo 1: Glosario de terminología relevante de negocio.


o Ver Anexo 2: Glosario de terminología de minería de datos.

Determinar las Metas de la Minería de Datos

Objetivos de la Minería de Datos

De acuerdo a los objetivos del negocio planteados para la investigación los objetivos a cumplir son los

siguientes:

 Proporciona modelos predictivo de clasificación a los clientes de la institución

basada en los datos acumulados en el tiempo.

 Crear un modelo de predicción que asigne un nivel de calificación a los clientes que

solicitaran préstamos de diferente tipo.

 Definir un modelo de pronósticos automatizado, basados en algoritmos de series de

tiempo, para definir las captaciones y colocaciones entre los diferentes niveles

organizacionales.

Factores de Éxito de la Minería de Datos


o Los modelos de predicción propuestos serán evaluados y controlados con consultas SQL

directas sobre la base de datos proporcionada. Se definirán muestras de consultas manuales a

cada base de datos con lo que se establecerá los criterios de éxitos de cada resultado.

o Identificar un mínimo de 2 algoritmos de minería de datos para cumplir los dos primeros objetivos

planteados referidos a la segmentación de clientes y nivel de riesgo crediticio.

o Presentar un nivel de calificación a cada cliente cada vez que se presente a realizar un

préstamo.
Producir el Plan del Proyecto

A cada una de las muestras tomadas se analizará el contenido y se realizarán trabajos de normalización de

información y adaptación para su mejor interpretación.

En forma paralela se irá describiendo en detalle en diccionario de terminología de negocio (Anexo

COMPRENSION DE LOS DATOS

 Etapa 1: Recolección Inicial de la Base de Datos.

o Instalación del Producto

o Restauración de las bases de datos muestras entregadas.

 Etapa 2: Descripción de la Base de Datos

o Análisis de la estructura de datos e información de las bases de datos en

producción.

o Contrastación con el modelo de datos proporcionado (Anexo 4. Modelo de

Datos)

 Etapa 3: Exploración de los datos

o Ejecución de consultas para la captura de muestras representativas en 1

sucursal.

o Ejecución de consultas para la captura de muestras representativas en varias

sucursales.

 Etapa 4.: Verificación de la Calidad de los Datos. Se aplicaran técnicas de integridad de

datos, evaluando principalmente:

o Integridad de Entidad.

o Integridad de Dominio.

o Integridad Referencial.

PREPARACION DE LOS DATOS

 Etapa 5: Preparación de la Colección de los Datos: Conversión y normalización de

datos según estructura requerida por los sistemas donde los datos serán procesados.
 Etapa 5: Selección de los Datos de Ejecución de los procesos de explotación de datos

sobre toda la información obtenida y parametrizada.

 Etapa 6: Limpieza de los Datos

 Etapa 7: Construcción de los Datos

 Etapa 8: Integración y Formato de los Datos

MODELADO DE LOS DATOS

 Etapa 9: Selección de las Técnicas de Modelado a aplicar en función a los objetivos

propuestos.

EVALUACION

 Etapa 10: Evaluacion de los resultados.

 Etapa 11. Revisiones finales del proceso.

 Etapa 12, Aplicaciones


Comprensión de la Data.

Recolección de Datos

Identificación de Clientes
 Son identificados con un código interno y dependiendo del tipo se les incluye
un numero de documento de identificación como el RUC o DNI
 Se les asigna un código CIUU en el caso de ser empresas
 Se identifica el tipo de negocio
 Se define la ubicación del cliente.
 Se determina la edad del cliente
 Que propiedades posee.
 Su comportamiento de pagos
 Montos de crédito tenidos.
 Existe una categoría especial para los grandes clientes.

Productos Ofrecidos
 Existen diferentes tipos de producto:
o Negocio
 Crédito Prendario
 CrediTaxi
 Credito Agro-emprendedor
 Créditos Pyme y Mypes
 Crédito Mujer
 Facilito
o Personales
 Depósitos
 Credijoya
 Hipotecarios
 Personales
 Innovación de nuevos productos
o Cada 2 años.

Tiempo en que se realiza la renovación de categoría: Cada 6 meses


 Nivel de aceptación de productos
 Cantidad de créditos obtenidos
 Cantidad de nuevos clientes
 Cantidad de colocaciones

Deserción de clientes:
 No se tiene un control de este dato

Nivel de Riesgo de un cliente


 Oportunidad de pagos
 Créditos obtenidos en la institución
 Créditos obtenidos en otras instituciones (centrales de riesgo)
 Saldos deudores
 Nivel de Ingresos

Fechas comerciales: coinciden con las fechas cronológicas.


Calificación de clientes
 Existente basado en un valores de 0 a 10. Los niveles bajos indican un nivel
menor de riesgo.
 La re-calificación se produce cada 6 meses.

Requisitos: Varían en función al tipo de préstamo, por ejemplo en los casos de:
 Credijoya:
o Persona natural.
o DNI.
o Joyas u objetos de oro
 Hipotecarios
o Copia de DNI.
o Recibos de servicios del domicilio.
o Estados de cuenta de préstamos o tarjetas de créditos usadas.

 Ingresos como Dependientes


 3 últimas boletas (ingresos fijos), 6 últimas (ingresos
variables)
 Estado de cuenta de AFP detallado.
 Ingresos por Renta de 4ª categoría
 Recibos por Honorarios de los últimos 6 meses.
 6 últimos PDT´s presentados a SUNAT.
 Ingresos por negocio propio
 6 últimas declaraciones mensuales presentadas a SUNAT.
 2 últimas declaraciones anuales presentadas a SUNAT.
 Otros documentos que sustenten la actividad

Descripción de los Datos

Bases de Datos
Base de Datos Tamaño (Gb)
BancoLaLibertad 17 Gb
BancoLima 4 Gb

Descripción de las Tablas a Usar

TABLA DESCRIPCION
AREA Area dependiente
CARGO Cargo del Colaborador
CLIENTE Cliente de la institución
CUENTA Cuenta que administra el cliente
ITEMTABLA Detalle de códigos
OPE_RESUMEN Resumen de Operaciones
OPERACIONES Operaciones y movimientos generales
PERSONAL Persona que realiza la operación
SUCURSAL Sucursal donde se produce la operación
TABLA Tabla de Códigos
TARJETERO Tabla de marcaciones
UBIGEO Tabla de ubicaciones geográficas
PRESTAMOS Tabla de Préstamos otorgados
CRONOGRAMAS Detalle de cronograma de pagos
Cantidad de Registros de los datos muestras asignados

Tabla Nro Registros

AGENCIA 9

AHORRO 13,905

ANALISTA 8

CRONOGRAMA 177,436

MOVIMIENTO 318,893

PRESTAMO 10,776

SOCIOS 4,952

SUBTIPAHO 20

TIPOACTIVIDAD 35

TIPOCATEGORIA 5

TIPOCLIENTE 5

TIPOCUENTA 8

TIPOCUOTA 2

TIPODESTINO 8

TIPOESTCIVIL 7

TIPOFINANCIAM 23

TIPOFUENTE 4

TIPOINSTRUC 9

TIPOMODALIDAD 16
Tabla Nro Registros

TIPOMOVIMIENTO 102

TIPONACIONAL 184

TIPOPRESTAMO 4

TIPOPRODUCTO 41

TIPOPROFESION 88

TIPORIGEN 14

TIPOZONA 16

TIPVAR 61

TIPVIA 17

Exploración de los Datos

 Cantidad de Movimientos por anio

Annual NroRegistros
2005 207,417
2006 245,235
2007 296,644
2008 296,940
2009 297,079
2010 297,829

 Cantidad de Movimiento del 2008, 2009 de los Meses de Enero a Diciembre

Anio Mes Nro Movimientos


2008 33021
1
2008 33022
2
2008 32907
3
2008 33097
4
2008 33073
5
2008 32925
6
2008 32961
7
2008 32852
8
2008 33082
9
2009 32978
1
2009 33016
2
2009 32930
3
2009 33101
4
2009 33068
5
2009 32894
6
2009 33130
7
2009 33017
8
2009 32945
9

 Cantidad de Clientes según Tipo de Persona

TipoPersona NroClientes Descripción


3 6414 Persona Jurídica
1 148 Persona Natural
Verificación de la Calidad de los Datos

 Integridad de Entidad:
Se puede apreciar que las tablas suministradas mantienen una clave primaria
lo cual asegura unicidad de las operaciones.

 Integridad de Dominio:

Se aplicaron las siguientes órdenes:

select distinct IdEstadoCivil from CLIENTE


select distinct SEXO from CLIENTE
select distinct IdOcupacion from CLIENTE
 Integridad de Referencial
 Determinación de datos NULL

No se observan reglas de dominio en los campos claves por lo que es necesario


incorporarlos.

 Integridad Referencial
En este caso las tablas se encuentran relacionadas, salvo las tablas que
administran códigos como:
o Tabla
o ItemTabla

Es necesario incluir las observaciones de la creación de reglas de


validación dentro de las tablas claves

 Integridad de Operaciones ;

o Prestamos vs Cronogramas de Pago

select c.idCredito, MontoCredito, SUM(Monto) AS DetalleCredito


from Creditos c INNER JOIN cronograma cc ON c.idCredito =
cc.idCredito
group by c.idCredito, Montocredito
HAVING MontoCredito<> SUM(Monto)
o Saldos vs Movimientos

select cta.ID, cta.Saldo , SUM(op.OPE_Monto *


case when OPE_ID =1 THEN -1 ELSE 1 END )
from CUENTA cta INNER JOIN OPERACIONES as op On cta.ID =
op.OPE_ID
group by cta.ID, cta.Saldo
HAVING cta.Saldo <> SUM(op.OPE_Monto *
case when OPE_ID =1 THEN -1 ELSE 1 END )
Preparación de los Datos

A continuación mostramos en esquema de lo que se realizará en esta etapa:

Nótese que la preparación de la data involucra las siguientes actividades, previas a la


preparación del modelado, estas son:
 Preparación de la colección de Datos
 Selección de los Datos
 Limpieza de los datos
 Integración de datos
 Formateo de los datos.

Preparación de la Colección de los Datos.

Los informes en la fase de preparación de datos se enfocan en los pasos de pre-proceso que producen los

datos que serán minados. El resultado final constituirá la Base de Datos de estudio y aplicación de los

modelos respectivos, como podrían ser: Arboles de Decisión, Series de Tiempo, entre otros.

Conjunto de Datos
A continuación definiremos el conjunto de datos, llamada también data de entrenamiento necesaria para la

preparación de los modelos que se harán en las fases siguientes. Dada que la data proviene de 2 bases de

datos es necesario aplicar procesos de integración de datos. El enfoque constará de los componentes

siguientes:

 Valores observados hoy de las variables que se esperaba predecir tiempo atrás.

 Conjunto de valores de las variables a predecir en el mismo periodo de tiempo.

Las variables a predecir están en función a cada objetivo definido en la etapa de comprensión de negocio

y que basado en los objetivos de la minería de datos se pueden observar en el siguiente cuadro

Objetivos del Negocio Objetivos Minería de datos Variable a Predecir

Disminuir Morosidad Modelo de Clasificación de Condición del cliente al

Clientes momento de evaluar el crédito

(Malo, Bueno)

Mantener Clientes Modelo de Segmentación de Clasificación del Cliente

Clientes

Establecer metas adecuadas Modelo de Pronósticos basado en Montos en Colocaciones

series de tiempo
Cantidad de Colocaciones

Las características a tomar en cuenta, dependiendo del Objetivo ha implementar estarán determinadas por:

 En el caso de mantener clientes estos estarán representados por la tabla denominada:

v_Cliente_crm.

A continuación mostramos la lista de datos proporcionados

Campo Descripción Necesario


Nombre
idProfesion Código Profesión si
Profesion Profesión si
idEstadoCivil Código Estado Civil
EstadoCivil Estado Civil si
idNivelInstruccion Código Nivel Instrucción
NivelInstruccion Nivel Instrucción si
idNacionalidad Código Nacionalidad
Nacionalidad Nacionalidad si
idTipoCliente Código Tipo Cliente
TipoCliente Tipo Cliente si
Actividad Actividad si
idTipoActividad Código de Actividad
idTipoPersona Tipo de Persona
FechaNacim Fecha Nacimiento si
LugarNacimiento Lugar de Nacimiento si
Genero Genero si
Ocupacion Ocupación del cliente si
idTipoDeport Tipo Deporte si
idTipoEntretimiento Tipo Entretenimiento si
id_Cliente Código del cliente si

 En el caso de mantener clientes estos estarán representados por la tabla denominada:

v_movimiento.
Campo Descripción Necesario
IdAgencia Código de Agencia
idCajero Código de Cajero
NroTransacc Numero de Transacción
Cajero Cajero
idSubTipo Código Sub Tipo de Cuenta
idTipo Código de Tipo de Cuenta
SubTipoCta Sub tipo de cuenta
TipoCta Tipo de cuenta
Agencia Nombre de agencia
TipoMovimiento Tipo de Movimiento
idCuenta Código de cuenta
Moneda Moneda
TipoCambio Tipo de Cambio
Capital Capital
Interes Interés
FechaMov Fecha de Movimiento
Cliente Cliente
Signo Signo de operación
 En el caso de mantener clientes estos estarán representados por la tabla denominada:

v_Prestamo_Riesgo_Cab.
Campo Descripción Necesario
idAgencia Código de Agencia
Agencia Nombre de Agencia Sí
idAnalista Código de Analista
Analista Nombre de Analista Sí
MontoPrestamo Monto de Préstamo Sí
FechaPrestamo Fecha Préstamo Sí
idTipoFuente Código Tipo Fuente
Fuente Fuente de fondos Sí
idTipoDestino Código de Destino
Destino Destino Sí
idTipoFinan Código Tipo Financiamiento
Financiamiento Financiamiento Sí
idTipoCuota Código Tipo de Cuota
TipoCuota Tipo de Cuota Sí
idTipoModalidad Código Tipo de Modalidad
Modalidad Modalidad del Préstamo Sí
idCliente Código del cliente
Cliente Nombre del cliente Sí
IdClave Clave de Movimiento Sí
Conjunto de Datos

Este es el inventario de datos de trabajo para v_Cliente_crm

Campo Tipo de Dato . Datos distintos Valor Máximo Valor Mínimo


Nombre varchar 60 9902
Profesion Oficio varchar 50 63 Abogado Vigilante
EstadoCivil varchar 50 7 Casado (a) Viudo
NivelInstruccion varchar 50 8 Analfabeto Universitario
Nacionalidad varchar 60 2 Estados Unidos Perú
TipoCliente varchar 50 3 Especial Temporal
Venta al por
Agricultura y Mayor de
Actividad varchar 60 29 Ganadería Abarrotes
FechaNacim smalldatetime 4 3619 09/09/1911 26/11/2006
LugarNacimiento varchar 30 376 A.SHAMBIYACU ZAPATERO3
Genero char 1 2 Femenino Masculino
Ocupacion varchar 40 610 A.ENFERMER ZOOTENISTA
Numero Prestamos Int 19 1 19
MontoPrestamo Numeric 9,2
MontoSaldo Numeric 9,2

Este es el inventario de datos de trabajo para v_Prestamo_Cabecera

Datos
Campo Tipo Dato . distintos Valor Maximo Valor Minimo
Agencia varchar 50 2 SUCURSAL 01 SUCURSAL 02
Analista char 10 6 ARANA VICTOR L
MontoPrestamo decimal 9
FechaPrestamo smalldatetime 4 1805 13/11/1999 30/12/2006
RECURSOS
Fuente varchar 60 1 RECURSOS PROPIOS PROPIOS
Destino varchar 60 5 Activo Fijo Mixto
Adquisicion bien
Financiamiento varchar 50 14 terminado Vehicular
TipoCuota varchar 60 2 Cuota Capital Cuota Fija
Modalidad varchar 60 1 Otros Otros
Cliente varchar 60 9902
Selección de los Datos.

De acuerdo a la data preparada procederemos a la selección respectiva, bajo el criterio de dominio que
tiene cada atributo.

Variables Incluidas

Nivel de Instrucción: se observa una diferenciación interesante entre los diferentes tipos de valores y la
casuística de los mismos

Estado Civil
Actividad que desarrollan

Variables Excluidas

 En el caso de la Nacionalidad

Tipo Persona:
Se puede observar que el 97% de personas corresponden a personas naturales o de un negocios de
responsabilidad limitada con 1 o 2 socios. Por lo que el estudio se realizarax en su totalidad con este tipo de
clientes
Lugar de Nacimiento

Lugar de Nacimiento Nro Registros


462
900457 2
956115 2
A.SHAMBIYACU 2
ABANCAY 2
AGUA BLANCA 34
AGUA BLANCA - SISA 2
AHCAYACU 2
ALON.ALV.ROQUE 2
ALONSO DE ALVARADO 8
ALONSO DE ALVARADO ROQUE 2
ALTO AMAZONAS 2
ALTO SHAMBOYACO 2
ALTO SHAMBOYACU 18
ALTO SHAMBUYACU 34
AMAZONAS 14
AMOZONAS 2
ANCASH 2
ARAMANGO-AMAZONAS 2
AREQUIPA 4
ATALAYA 4
AUCAYACO 2
AUCAYACU - HUANUCO 2

Por ser un dato que el operador del sistema lo escribe directamente, presenta mucha
diversificación, por lo que será omitido.
Limpieza de Datos.

Estos son los registros a depurar:

v_cliente_crm

Al validar la data respecto al nombre de los clientes se pudo determinar con la siguiente
orden:

select * from v_cliente_crm where nombre = ' ' or LEN(nombre) <10

Nombre Id Profesión Profesión


99 No Especificada
ARCIJESAM 50 Docente
APAE-PDA 99 No Especificada
CODEMUCA 99 No Especificada
99 No Especificada
99 No Especificada
ARCIJESAM 50 Docente
APAE-PDA 99 No Especificada
CODEMUCA 99 No Especificada
99 No Especificada

Esto es aplicable al resto de la data de entrenamiento

select * from v_movimiento where cliente = ' ' or LEN(cliente) <10

select * from v_v_Prestamo_Riesgo_Cab where Cliente = ' ' or LEN(Cliente) <10


En el caso de las fechas de nacimiento estamos descartando a las personas nacidas antes del
año 1900, ya que no se mantuvo una actualización constante de datos con estos clientes

select * from v_cliente_crm where year(fechaNacim) <= 1900

Construcción de los Datos.

Esta tarea incluye la posibilidad de generar atributos derivados a partir de otros campos. Por ejemplo en el
caso de las fechas de vencimiento o actualización de saldos o número de préstamos obtenidos por cada
cliente del banco.

En el caso de algunas variables continuas caso los montos prestados, estos se convertirán en variables
continuas durante la creación del modelado, ya que existen alguno algoritmos de las herramientas de
minado de datos en SQL Server que nos soportados en el manejo de variables continuas caso el
Algoritmos Naive Bayes.

Estas son las consultas que nos permitirán construir algunas variables:

Obteniendo la edad de la persona:


Estamos aplicando la función DATEDIFF que calcula la diferencia en una frecuencia de tiempo
determinada, en este caso en años respecto a la fecha de hoy

select v.* , edad = DATEDIFF( YY, fechanacim, GETDATE())


from v_cliente_crm v

Obteniendo el Número de Préstamos de una Persona:

A continuación agruparemos por el nombre de la persona y enlazaremos los datos de los clientes con los
de préstamos.

select Nombre, COUNT(*) AS NroPrestamos


from V_CLIENTE_CRM cr INNER JOIN dbo.v_Prestamo_Riesgo_Cab prc ON
cr.id_Cliente = prc.idCliente
GROUP BY Nombre
Obteniendo el Monto de Préstamos de una Persona:

A continuación agruparemos por el nombre de la persona y enlazaremos los datos de los clientes con los
de préstamos a fin de determinar los montos prestados.

select Nombre, SUM(MontoPrestamo) AS MontoPrestamos


from V_CLIENTE_CRM cr INNER JOIN dbo.v_Prestamo_Riesgo_Cab prc ON
cr.id_Cliente = prc.idCliente
GROUP BY Nombre

Obteniendo el Año mes de un Préstamo:

A continuación obtendremos el año y mes respectivo de cada préstamo a fin de realizar los pronósticos
respectivos por agencia.

select Agencia, convert(char(6), FechaPrestamo , 112) AS KeyTiempo


from dbo.v_Prestamo_Riesgo_Cab
Integración de los Datos.

Ya con los datos seleccionados procederemos a Integrarlos en una base de datos que tendrá
toda la data de entrenamiento y que servirá posteriormente para aplicar los Modelo de
Minado.
Este es el esquema de trabajo

Para realizar esta labor utilizaremos una herramienta que permitirá integrar la data seleccionada en las
fases anteriores. Esta herramienta es el: Integration Services que forma parte del Business Intelligence
Development Studio. A continuación mostramos los pasos para construir esta integración .
a. Creando Proyecto de Integración.

b. Estableciendo Conexiones
b.1 Conexión a Base Sucursal 01:
b.2 Conexión a Base Sucursal 02
b.3 Conexión a Base Entrenamiento

c. Estableciendo Esquema General de Integración de datos

d. Integrando datos de acuerdo a objetivos


d.1 Objetivo Metas

La consulta preparada como origen de datos es la siguiente:


SELECT distinct MOVIMIENTO.COD_AGENCIA, MOVIMIENTO.COD_CAJERO,
MOVIMIENTO.NRO_TRANSAC, CAJERO.COD_USER AS Cajero,
SUBTIPOCTA.SUBTIPO_CTA, SUBTIPOCTA.TIPO_CTA, SUBTIPOCTA.NOM_AHO AS
SubCuenta, TIPOCUENTA.DESCRIPCION AS TipoCuenta,
AGENCIA.NOMBRE AS Agencia, TIPOMOVIMIENTO.DESCRIPCION AS TipoMovimiento,
MOVIMIENTO.CUENTA_ID, MOVIMIENTO.MONEDA, MOVIMIENTO.TIPO_CAMBIO,
MOVIMIENTO.CAPITAL, MOVIMIENTO.INTERES, MOVIMIENTO.FECHA_MOV,
CLIENTE.RAZON_SOCIAL AS Cliente, Signo =
case when movimiento.TIPO_DOC IN ('01','03') THEN 1 ELSE -1 END
FROM SUBTIPOCTA INNER JOIN
TIPOCUENTA ON SUBTIPOCTA.TIPO_CTA = TIPOCUENTA.TIPO_CTA INNER JOIN
MOVIMIENTO ON movimiento.SUBTIPO_AHO =SUBTIPOCTA.SUBTIPO_CTA and
MOVIMIENTO.TIPO_AHO = SUBTIPOCTA.TIPO_CTA
INNER JOIN CAJERO ON MOVIMIENTO.COD_EMPRESA = CAJERO.COD_EMPRESA and
cajero.COD_AGENCIA = MOVIMIENTO .COD_AGENCIA and CAJERO.COD_CAJERO =
MOVIMIENTO.COD_CAJERO
INNER JOIN AGENCIA ON CAJERO.COD_EMPRESA = AGENCIA.COD_EMPRESA AND
CAJERO.COD_AGENCIA = AGENCIA.COD_AGENCIA
INNER JOIN TIPOMOVIMIENTO ON MOVIMIENTO.SISTEMA = TIPOMOVIMIENTO.SISTEMA
AND MOVIMIENTO.TIPOMOV_ID = TIPOMOVIMIENTO.TIPOMOV_ID
INNER JOIN CUENTA ON SUBTIPOCTA.TIPO_CTA = CUENTA.TIPO_CTA AND
SUBTIPOCTA.SUBTIPO_CTA = CUENTA.SUBTIPO_CTA AND
MOVIMIENTO.CUENTA_ID = CUENTA.CUENTA_ID AND MOVIMIENTO.TIPO_AHO =
CUENTA.TIPO_CTA AND
MOVIMIENTO.SUBTIPO_AHO = CUENTA.SUBTIPO_CTA INNER JOIN
CLIENTE ON CUENTA.CLIENTE_ID = CLIENTE.CLIENTE_ID
d.2 Objetivo Riesgo Morosidad

La consulta preparada como origen de datos es la siguiente

SELECT distinct AGENCIA.COD_AGENCIA, AGENCIA.NOMBRE AS Agencia,


ANALISTA.COD_ANALISTA, ANALISTA.COD_USER AS Analista,
PRESTAMO.MONTOPRESTAMO,
PRESTAMO.OTORGA, TIPOFUENTE.TIPO_FUENTE, TIPOFUENTE.DESCRIPCION AS
Fuente, TIPODESTINO.TIPO_DESTINO,
TIPODESTINO.DESCRIPCION AS Destino, TIPOFINANCIAM.TIPO_FINA,
TIPOFINANCIAM.DESCRIPCION AS Financiamiento, TIPOCUOTA.TIPO_CUOTA,
TIPOCUOTA.DESCRIPCION AS Cuota, TIPOMODALIDAD.TIPO_MODALIDAD,
TIPOMODALIDAD.DESCRIPCION AS Modalidad, PRESTAMO.CLIENTE_ID,
v_cliente_crm.Nombre AS Cliente, pagare + convert(char(10), otorga, 112) + cliente_id as
IdClave
FROM AGENCIA INNER JOIN
ANALISTA ON AGENCIA.COD_EMPRESA = ANALISTA.COD_EMPRESA INNER JOIN
PRESTAMO ON ANALISTA.COD_EMPRESA = PRESTAMO.COD_EMPRESA AND
ANALISTA.COD_AGENCIA = PRESTAMO.COD_AGENCIA AND
ANALISTA.COD_ANALISTA = PRESTAMO.COD_ANALISTA INNER JOIN
TIPOFUENTE ON PRESTAMO.TIPO_FUENTE = TIPOFUENTE.TIPO_FUENTE INNER
JOIN
TIPODESTINO ON PRESTAMO.TIPO_PRES = TIPODESTINO.TIPO_PRES AND
PRESTAMO.TIPO_DESTINO = TIPODESTINO.TIPO_DESTINO INNER JOIN
TIPOCUOTA ON PRESTAMO.TIPO_CUOTA = TIPOCUOTA.TIPO_CUOTA INNER JOIN
TIPOMODALIDAD ON PRESTAMO.TIPO_MODALIDAD =
TIPOMODALIDAD.TIPO_MODALIDAD INNER JOIN
TIPOFINANCIAM ON PRESTAMO.TIPO_PRES = TIPOFINANCIAM.TIPO_PRES AND
PRESTAMO.TIPO_FINA = TIPOFINANCIAM.TIPO_FINA INNER JOIN
TIPOPRODUCTO ON PRESTAMO.TIPO_PRODUCTO =
TIPOPRODUCTO.TIPO_PRODUCTO INNER JOIN
v_cliente_crm ON PRESTAMO.CLIENTE_ID = v_cliente_crm.id_Cliente
d.3 Objetivo Clientes

SELECT DISTINCT CLIENTE.RAZON_SOCIAL, TIPOPROFESION.TIPO_PROF,


TIPOPROFESION.DESCRIPCION AS Profesion, TIPOESTCIVIL.TIPO_ESTADCIVIL,
TIPOESTCIVIL.DESCRIPCION AS EstadoCivil, NIVELINSTRUC.TIPO_INST,
NIVELINSTRUC.NOM_INST AS NivelInstruccion, TIPONACIONAL.TIPO_NAC,
TIPONACIONAL.NOM_NAC AS Nacionalidad, TIPOCLIENTE.TIPO_CLIENTE,
TIPOCLIENTE.DESCRIPCION AS TipoCliente, TIPOACTIVIDAD.DESCRIPCION,
TIPOACTIVIDAD.TIPO_ACTIVIDAD AS Actividad, CLIENTE.TIPO_PERSONA,
CLIENTE.FECHA_NAC, CLIENTE.LUGAR_NAC, CLIENTE.GENERO, CLIENTE.OCUPACION,
CLIENTE.TIPO_DEPORT, CLIENTE.TIPO_ENTRET , cliente.cliente_id
FROM CLIENTE INNER JOIN
TIPOESTCIVIL ON CLIENTE.TIPO_ESTADCIVIL = TIPOESTCIVIL.TIPO_ESTADCIVIL
INNER JOIN
NIVELINSTRUC ON CLIENTE.TIPO_INST = NIVELINSTRUC.TIPO_INST INNER JOIN
TIPOCLIENTE ON CLIENTE.TIPO_CLIENTE = TIPOCLIENTE.TIPO_CLIENTE INNER
JOIN
TIPOPROFESION ON CLIENTE.TIPO_PROF = TIPOPROFESION.TIPO_PROF INNER
JOIN
TIPONACIONAL ON CLIENTE.TIPO_NAC = TIPONACIONAL.TIPO_NAC INNER JOIN
TIPOACTIVIDAD ON CLIENTE.TIPO_ACTIVIDAD =
TIPOACTIVIDAD.TIPO_ACTIVIDAD
Resumen de Data de Entrenamiento a usar:

Data Entrenamiento Cantidad Registros


v_cliente_crm 9902
v_movimiento 532802
v_Prestamo_Riesgo_Cab 192708
v_Prestamo_Riesgo_Detalle 354872

Formateo de los Datos.

En esta etapa se realiza el cambio de tipos de datos y ordenamientos efectuados. Solo tuvimos un cambio
en la fecha de nacimiento de smalldatetime pasamos a datetime.
Modelado

Seleccionar la Técnica de Modelamiento

Dependiendo del objetivo a cumplir se identifican las tareas respectivas y por consiguiente la aplicación
del algoritmo o modelo de minado a aplicar.
A continuación veamos la posibilidad ofrecida por el producto en la aplicación del algoritmo respectivo.

De acuerdo a los objetivos planteados los Algoritmos elegidos son:

Objetivos del Negocio Objetivos Minería de datos Algoritmo elegido

Establecer metas adecuadas Modelo de Pronósticos basado en Series de tiempo

series de tiempo

Disminuir Morosidad Modelo de Clasificación de Arboles de decisión

Clientes
Naive Bayes

Mantener Clientes Modelo de Segmentación de Redes Neuronales

Clientes
Segmentación

En el caso de series de tiempo

El algoritmo de serie temporal de Microsoft utiliza una combinación de análisis ARIMA y regresión lineal
basada en árboles de decisión para analizar los datos relacionados con el tiempo, como las ventas
mensuales o los beneficios anuales. Los patrones que detecta se pueden usar para predecir valores de
estadios temporales futuros. El algoritmo se puede personalizar para que use el método del árbol de
decisión, ARIMA o ambos
En el caso de Arboles de Decisión.

El algoritmo de árboles de decisión de Microsoft es un algoritmo de clasificación adecuado para el


modelado de predicción. El algoritmo admite la predicción de atributos discretos y continuos.

Probablemente sea uno de los más usados en técnicas de predicción creando un perfil a partir del
comportamiento de los datos acumulados en el tiempo tal como veremos mas adelante.

En el caso de Clusters (Agrupamientos)

El algoritmo de clústeres de Microsoft utiliza técnicas iterativas para agrupar los registros de un conjunto
de datos en clústeres que contengan características similares. Esta capacidad resulta útil para buscar
agrupaciones generales en los datos.

Construir el Modelo

Este son los pasos para la creación del Modelo de Minado, para lo cual utilizaremos los Servicios de
Análisis de Microsoft SQL Server incluidos el Business Development Studio.

Esta es la propuesta que desarrolla Microsoft para la implementación de una solución de minería de datos.
Nótese que los pasos 1 y 2 ya han sido desarrollados anteriormente.

Pasos para implementar una solución de Minería de Datos

A continuación desarrollaremos los pasos 3 (Construir el esquema de Datos) y el paso 4


(Construir el Modelo).
Preparando el Modelado
 Creando el Proyecto

 Creando la Conexión respectiva


 Estableciendo el acceso a los datos

 Creando la Vista de la Conexión


o Seleccionando Tablas y Vistas a usar
o Esquema de la Vista de la Conexión

Nótese que se ha establecido una relación entre v_Prestamo_Cabecera y


v_Prestamo_Detalle

Para el caso de pronósticos se ha incluido la vista: v_Series, la misma que


permitirá proyectar por cada Agencia:

. Los Montos de Prestamos


. Numero de Colocaciones.

La vista creada es la siguiente:

CREATE VIEW v_Series


as
select Agencia, convert(char(6), FechaPrestamo , 112) AS
KeyTiempo,
SUM(MontoPrestamo) AS MontoPrestamo, COUNT(*) AS
NroColocaciones
from dbo.v_Prestamo_Riesgo_Cab
GROUP BY Agencia , convert(char(6), FechaPrestamo , 112)

 Modelos de minado
o Pronósticos de Colocaciones y Prestamos
a. Definiendo el Método de Selección de la Data de Entrenamiento: dado
que la data existe en la Vista de la conexión a partir de una Base de Datos
Relacional se elegirá de acuerdo a la siguiente interfaz.
b. Eligiendo la técnica o algoritmo de minado. En este caso elegiremos:
Series de Tiempo de Microsoft
c. Confirmando la Vista de la Conexión :

d. Especificando la Tabla a usar:


e. Definiendo datos de entrada y salida (variables predictivas)

Nótese que es necesario incluir una clave primaria para la data de


entrenamiento, la cual resulta obligada en la data a ser aplicada el
modelo. En este caso estamos usando la data histórica de cada agencia en
un año mes específico lo que ha vendido y colocado en préstamos.

f. Especificando los tipos de datos.


Dado que el caso de series de tiempo debe definirse un tipo de dato que
haga referencia al tiempo a pronosticar este atributo debe ser entero. Por
ello que a KeyTiempo se le define como long; tal como se puede apreciar a
continuación. Ademas en contenido corresponde al Key Time.
g. Definiendo un nombre al modelo de minado:
 Descripción del Modelo
a. Presentando la estructura de minado: estos son lo datos disponibles

b. Modelo de Minado
Muestra las variables predictivas a utilizar

c. Configurando Parámetros. Los periodos de trabajo para la proyección y


que van asociados a las variables tiempo son: PERIODICITY_HINT = {12}
d. Procesar el Modelo
. Desplegando Modelo

. Procesando el Modelo

e. Modelo Procesado:
o Riesgo Crediticio
Arboles de Decisión:
a. Incorporando la data de entrenamiento basada en la vista de riesgo
crediticio:

b. Definiendo el Método de Selección de la Data de Entrenamiento: dado


que la data existe en la Vista de la conexión a partir de una Base de Datos
Relacional se elegirá de acuerdo a la siguiente interfaz.
c. Eligiendo la técnica o algoritmo de minado. En este caso elegiremos:
Arboles de Decisión de Microsoft
d. Confirmando la Vista de la Conexión :

e. Especificando la Tabla a usar:


f. Definiendo datos de entrada y salida (variables predictivas)

Definiendo nivel de participación de la data de entrenamiento:


g. Especificando los tipos de datos.
Nótese que existen algunas variables continuas, las cuales, en el caso de
algunos algoritmos como el Naive Bayes no es posible manejarlas, como
más adelante veremos:
Ponderación de la data de entrenamiento
h. Definiendo un nombre al modelo de minado:
 Descripción del Modelo
a. Presentando la estructura de minado: estos son los datos disponibles

b. Modelo de Minado
Muestra las variables predictivas a utilizar

c. Procesar el Modelo
. Desplegando Modelo
. Procesando el Modelo

d. Modelo Procesado:

Naive Bayes
a. Creando el algoritmo:
En este algoritmo todas las variables deben ser continuas, por lo que
aparece la siguiente advertencia:

b. Creando variables discretas en continuas


 Edad: Edad_NB
c. Variables a usar:
d. Ejemplo de Creación de Variable Continua a Discreta

e. Proceso Final del Algoritmo

o Deserción de Clientes:
Arboles de Decisión:
a. Incorporando la variable edad, dentro del Data Source View a partir de la
tabla: v_cliente_crm
b. Definiendo el Método de Selección de la Data de Entrenamiento: dado
que la data existe en la Vista de la conexión a partir de una Base de Datos
Relacional se elegirá de acuerdo a la siguiente interfaz.
c. Eligiendo la técnica o algoritmo de minado. En este caso elegiremos:
Arboles de Decisión de Microsoft
`
d. Confirmando la Vista de la Conexión :

e. Especificando la Tabla a usar:


f. Definiendo datos de entrada y salida (variables predictivas)
Definiendo nivel de participación de la data de entrenamiento:

g. Especificando los tipos de datos.


h. Definiendo un nombre al modelo de minado:

o Descripción del Modelo


a. Presentando la estructura de minado: estos son los datos disponibles

b. Modelo de Minado
Muestra las variables a utilizar

c. Procesar el Modelo
. Desplegando Modelo

. Procesando el Modelo
d. Modelo Procesado:

Evaluar el Modelo

Corresponde a una evaluación puramente técnica y estadística basada fundamentalmente en


el resultado obtenido a partir de la tarea de minado aplicada.

Nivel de Riesgo Crediticio

 Arboles de Decisión
Nivel de Dependencia de las variables:

Nótese el perfil creado:


Riesgo Muy Alto: Si son atendidos por:
o Analista: BETTYM
o Profesión: Diferente Comerciante
o Edad: Entre 38 y 49 años
a. Edad de 40 a 42 años es el nivel más riesgoso.
 Naive Bayes
Existe una alta probabilidad (Nivel de Riesgo Medio Alto) cuando se cumpla el siguiente
patrón creado:

Pronostico

 Monto en colocaciones
 Numero de captaciones

Fidelización de Clientes: Clustering

Dependencia de Clusters creados:


Perfiles de los Clusters creados:
Evaluar el Modelo

De acuerdo a los objetivos del negocio planteados, vamos a continuación a realizar la


evaluación del modelo:

 Mantener y reducir los niveles de morosidad, asegurando una evaluación más exacta en los diferentes

tipos de solicitud de crédito que atiende.

A continuación veremos la matriz de clasificación que en las columnas predice los porcentajes

obtenidos de acuerdo a los riesgos crediticios:

Matriz de Clasificación

De acuerdo a los niveles establecidos en cuanto a ponderación se aplican los siguientes rangos.

Nivel de Riesgo Ponderación

Sin Riesgo 0

Muy Bajo Menor a 0.05

Bajo Desde 0.05 hasta Menor a 0.10

Medio Alto Desde 0.10 hasta Menor a 0.20

Alto Desde 0.20 hasta Menor a 0.40

Muy Alto Desde 0.40 hasta Menor a 0.60

No Prestar Mayor a 0.6

Si se siguiera con los mismos patrones de evaluación y aprobación de préstamos los resultados de

acuerdo a la Matriz de Clasificación y Predicción, serían los siguientes: habría un 5% (Ponderación de 0.55

– 0.81) de créditos que tienen un nivel de riesgo entre muy alto y otros que se rechazar la solicitud de
préstamo. También se puede encontrar un 7.2% de préstamos (Ponderación de 0.27 - .55) que tienen un

nivel de riesgo medio alto.

 Mantener a los clientes que generan mayor valor a la institución a fin de reducir el riesgo de que se vayan

a la competencia

Para esto se han establecido grupos de clientes en donde el sistema ha definido:

Vamos a preparar la lista de clientes:

Con un grupo asignado:


Se crearon nueve clusters

 Establecer metas adecuadas de captaciones y colocaciones a los diferentes niveles de la institución a


fin motivar un mejor rendimiento de los colaboradores.
Aplicaciones de Usuario Final

 Herramienta Ofimática
Excel 2007 o Excel 2010
Addins de Minería de Datos para SQL Server 2005

Ejemplo de Elaboración de Pronósticos desde Excèl:


o Hacer clic en la barra de herramientas: Pronósticos, con lo que se activará el asistente
respectivo:
o Elegir la Data de entrenamiento:

o Definir variable tiempo y pronostico a establecer:


o Confirmando Datos Finales
o Este es el modelo de predicción que elabora el sistema
 Herramienta de Desarrollo

Característica Versión

Plataforma .NET (Framework 3.5)


Motor de Minería de Datos Analysis Services 2005 – 2008
Tipo de Proyecto Windows Application
Herramienta de Desarrollo Visual Studio 2008
Lenguaje de Programación C#
Librerías de Conexión ADODM

a. Pantalla de Acceso al Sistema

Este es el código que permite la conexión al Motor de Minado de Datos

private void btnTest_Click(object sender, EventArgs e)


{
AdomdConnection conn = new AdomdConnection(this.ConnectionString);
{
conn.Open();
conn.Close();
MessageBox.Show("Test Succeeded", "Connection Succeeded");
}
}
public string ConnectionString
{
get
{
return "Provider=MSOLAP.3;Data Source=" + m_ServerName + ";Initial Catalog=" +
m_CatalogName;
}
}

b. Muestra de Análisis de Series de Tiempo y de Cauterización

 Una vez establecida la conexión el programa lee los modelos de


minería realizados en el motor utilizando para ello el siguiente
código:

private void LoadCatalog()


{
AdomdConnection conn = null;
cmbCatalog.Items.Clear();
try
{
conn = new AdomdConnection(this.ConnectionString);
this.Cursor = Cursors.WaitCursor;
conn.Open();
DataSet ds = conn.GetSchemaDataSet(AdomdSchemaGuid.Catalogs, null);
foreach (DataRow row in ds.Tables[0].Rows)
cmbCatalog.Items.Add(row[0].ToString());
}
catch (System.Exception)
{
/**/
}
this.Cursor = Cursors.Default;
if (conn != null)
conn.Close();
}

 Se ha optado por permitir 2 análisis simultáneos con algoritmos


diferentes, tal como se puede apreciar a continuación
Evaluadoras de Riesgos
http://www.classrating.com/Trujillo.PDF
(http://www.equilibrium.com.pe/CmacTruji.pdf)
Equipamiento

http://docs.seace.gob.pe/mon/docs/procesos/2010/002336/000012_02_EXO-2-2010-
CMAC_T%20S_A_-
INSTRUMENTO%20QUE%20APRUEBA%20LA%20EXONERACION.pdf

Evolución de Cartera Pesada.


http://www.cajatrujillo.com.pe/portalnew/doc/cajaencifras/carteraPesada.pdf

Fusiones de las Cajas


http://gestion.pe/noticia/495325/cajas-municipales-alistan-fusiones-nuevos-actores
ANEXO 05 . CUESTIONARIOS APLICADOS
Persona :
Cargo : Jefe de Atención a Clientes
Fecha :
Preguntas :
f. Como direcciona la creación de nuevos productos
g. Como establece la clasificación de cada cliente
h. Que datos o variables utiliza para el trato diferenciado con sus clientes.
d. Cada que tiempo realiza la evaluación o re -categorización de clientes
e. Podría proporcionar una Ficha de Admisión de un Cliente.
f. Tiene alguna dependencia con el área de Sistemas para esta labor. Cual?
g. Que hacen cuando no se tiene el dato del cliente en la base de datos.
h. Como determinan el nivel de aceptación de los productos que ofrecen hacia los clientes.
i. En qué momento consideran que un cliente se puede ir a otra institución?
j. Existe consistencia y calidad en los datos a evaluar
Riesgo Crediticio
Persona :
Cargo : Jefe de Créditos y Colocaciones
Fecha :
Preguntas :

a. Como determinan el nivel de riesgo de un cliente


b. Existe alguna calificación crediticia para cada cliente?
c. Cuáles son los datos o variables que determinan esa calificación?
d. Cada que tiempo de produce una re-calificación del cliente
e. Quien la realiza o es automático? Si fuera automático que oficina define los parámetros?
f. Cuando el cliente es nuevo que datos son los que se validan adicionalmente
g. Como observa la tendencia de la morosidad?
h. Hay algún trato especial en el otorgamiento de créditos para grupos de clientes? Si no fuera
así cuál sería su propuesta?
i. Cuáles son los requisitos para acceder a cada tipo de préstamo?
j. Como es el procedimiento para aprobación del crédito una vez recepcionada la solicitud?
Existen casos particulares o todos tienen el mismo procedimiento?
k. Tiene alguna dependencia con el área de Sistemas para esta labor. Cuál?
l. Que hacen cuando no se tiene el dato a evaluar en la base de datos.
m. Existe consistencia y calidad en los datos a evaluar
Persona :
Cargo : Jefe de Planificación
Fecha :
Preguntas :

c. Como realiza el proceso de pronósticos para metas futuras como: colocaciones por ejemplo.
d. Que pronósticos realiza referente a las operaciones de la institución?
e. Qué variables o datos tiene en cuenta para cada pronostico realizado?
f. Que técnicas de pronostico aplica?
g. Desde hace que tiempo se utilizan las mismas variables o datos.
h. Tiene alguna dependencia con el área de Sistemas para esta labor. Cuál?
i. Que hacen cuando no se tiene el dato a evaluar en la base de datos.
j. Existe consistencia y calidad en los datos a evaluar
k. Cada que tiempo se realizan ajustes después del pronóstico realizado.
l. Que tan aproximados se encuentran los pronósticos realizados respecto a la realidad?
m. Cada que tiempo son ajustados
n. Se puede obtener alguna muestra de los pronostico realizados?

También podría gustarte