Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Al 30 de Setiembre del 2010 otorgaron alrededor de 8 mil millones de soles entre todas las cajas, cuya cuota
por caja la podemos apreciar en el siguiente cuadro
Fuente : http://www.cmacpiura.com.pe/inst/pres.jsp
Como se puede apreciar el sistema de cajas municipales está conformado por 13 entidades que atienden al
30% del sistema microfinanciero regulado .
Hoy en día el ingreso de la banca al negocio del microcrédito, a través de la adquisición de entidades
especializadas, empuja a las cajas municipales a considerar la posibilidad de fusionarse e incorporar a nuevos
accionistas ya que muchas de ellas tienden a disminuir sus posibilidades en el mercado financiero.
Visión Estratégica de la Caja Trujillo
Han pasado más de 25 años desde el inicio de operaciones con el claro objetivo de atender a los pequeños y
medianos empresarios facilitándoles el acceso a créditos, y sirviéndoles de apoyo para poder hacer empresa
en nuestro país. Como entidad microfinanciera, Caja Trujillo fue fundada el 19 de octubre de 1982, pero el 12
de noviembre de 1984 inicia formalmente nuestras operaciones.
Durante estos 25 años, Caja Trujillo ha colaborado con el crecimiento microempresarial de miles de sus
clientes, logrando consolidarse como una institución orientada al apoyo crediticio a las PYME. En estos años,
no sólo ha sido testigo del crecimiento de sus clientes, sino que también ha sabido extenderse en diversas
provincias del país, con el único objetivo de estar cerca de sus clientes, brindándoles el mejor servicio y
ofreciéndoles productos de acuerdo a sus necesidades.
Hoy se encuentra presente en la costa, sierra y oriente del país, con 50 agencias y oficinas, por lo que resulta
indiscutible e innegable no sólo el crecimiento de nuestros clientes, sino también el de la Caja.
Misión.
Brindar soluciones financieras en forma rápida y oportuna a los clientes, con un equipo humano orientado
hacia la excelencia, contribuyendo al desarrollo económico y social del país
Visión.
Ser la mejor institución microfinanciera ágil y confiable en la generación de valor para nuestros clientes,
colaboradores y accionistas
Valores
1. Orientación al cliente.
2. Desarrollo para los colaboradores.
3. Orientación al logro.
4. Integridad y honradez.
5. Trabajo en equipo.
6. Orientación a la innovación y calidad.
7. Liderazgo.
Organigrama
Funciones Principales de los Procesos de Estudio
Créditos Comerciales
Son créditos directos o indirectos otorgados a personas naturales o jurídicas destinados al financiamiento de
actividades de producción y comercialización de bienes y servicios en sus diferentes fases.
También son aquellos créditos otorgados a las personas jurídicas a través de créditos, operaciones de
arrendamiento financiero u otras formas de financiamiento que tuvieran fines similares a lo señalado en el
párrafo anterior.
Son créditos que se otorgan a las personas naturales con la finalidad de atender gastos de consumo como:
compra de bienes, servicios y diversos gastos no relacionados con una actividad empresarial. Pignoraticio
Créditos Personales
Son créditos otorgados a trabajadores con ingreso mayoritariamente dependiente, cuyo pago debe realizarse
directamente en las oficinas de Créditos Institucionales
Son aquellos créditos que se otorgan a las personas naturales con la finalidad de atender la compra de
bienes, servicios o gastos NO relacionados con la actividad empresarial, para lo cual es indispensable que
medie un convenio institucional con la CMAC.
La empresa con la que se realice el contrato podrá ser pública o privada y deberá tener un mínimo de dos
años de funcionamiento debidamente sustentado.
Estos créditos se realizan mediante descuento directo en planilla de sueldos
Créditos Hipotecarios.
Crédito Hipotecario es un programa creado especialmente por la CMAC para financiar viviendas de interés
social, mediante un sistema de crédito hipotecario.
Gracias a este producto y la CMAC, cientos de familias cusqueñas podrán adquirir con mayores facilidades su
casa propia.
Cuenta de Ahorros
Es una cuenta de ahorros, de libre disponibilidad con una tasa de interés preferente.
Dado el entorno que actualmente viven las cajas en donde se ven agobiadas por la competencia y
requieren fidelizar más a sus clientes surge la necesidad de establecer un proceso avanzado de
Así mismo el factor morosidad se encuentra agobiando a la institución a niveles de 9.1% más allá del
otorgar deben ser mejor evaluadas con técnicas automatizadas que determinen en base al análisis
histórico de los datos. Es necesario que esta evaluación y calificación del prestamista sea de una manera
más eficiente y automatiza con margen de error casi nulo. Veamos a continuación la evolución de la
cartera pesada:
Adicionalmente es necesario establecer metas exigidas pero a la vez alcanzables a cada sucursal y
a la vez estas sean replicadas a los niveles inferiores como son los supervisores y asesores de negocio.
Para ello es necesario contar con una herramienta automatizada que optimice la asignación respectiva de
el patrimonio neto promedio fue de 8.9% tal como se puede apreciar en el siguiente cuadro.
Hacia finales de agosto del 2010 la clasificadora de riesgos: equilibrium presenta las siguientes
clasificaciones:
En resumen se pueden establecer los siguientes objetivos prioritarios del negocio a nivel de la gestión
operativa que ayuden a una mejora en los indicadores y niveles de riesgo que la institución pueda
Objetivos de negocio
Mantener y reducir los niveles de morosidad, asegurando una evaluación más exacta en los diferentes
a la competencia
Existe un sistema transaccional solido que asegura la integridad y rendimiento óptimo de las distintas
Contexto Actual
Se cuenta con información detallada de las operaciones vinculadas a los clientes, préstamos y
movimientos desde el año 2000 a la fecha. Todas las bases de información se encuentran normalizadas y
con la documentación vinculada a las mismas. Es decir respecto a la situación global del negocio se puede
decir que toda la información necesaria para la explotación de datos se encuentra disponible pero en
forma dispersa. Cada sucursal que forma parte de la organización tiene su base de datos que si bien es
cierto mantiene una misma estructura pero necesita de una tarea de integración de datos.
solución a implementar.
Inventario de Recursos
Recursos de software.
Server que incluye algoritmos de: Arboles de Decisión, Naive Bayes, Series de Tiempo,
Asociación, etc.
o Add-ins de Minería de Datos para MS Office con conexiones directas al motor de datos.
Aplicaciones Locales
Aplicaciones Distribuidas.
Recursos de hardware: cuenta con un Data Center equipado con equipos de alta generación.
o Servidores Web
o Servidor de Aplicaciones
SITE 1
Procesadores: 4x 3.16
Memoria: 4 Gb x 3.16
Tarjetas de Fibra 2
Cantidad de Servidores: 2
SITE 2
Marca IBM – X255
Procesadores: 4
Memoria: 4 Gb
Tarjetas de Fibra 2
Cantidad de Servidores: 2
Personal
o Hay contacto directo y permanente con los administradores de la base de datos, personal y
soporte técnico.
Atención Clientes
Créditos y Colocaciones
Planificación
Requerimientos, Supuestos y Riegos
A continuación presentamos una lista de los requerimientos, así como los supuestos, restricciones y riesgos
respectivos a fin de tener en cuenta como parte del desarrollo normal de la investigación. Cabe resaltar que es
necesario prestar atención a estos puntos ya de demarcaran el desarrollo futuro y normal del proyecto y
a. Requerimientos
o Equipo de Trabajo
o Herramientas a utilizar
SQL Server 2008 Edición Developer o Enterprise.
BI Development Studio. Integration Services
BI Development Studio. Analysis Services.
MS Excel 2007 o superior
b. Supuestos
Terminología
De acuerdo a los objetivos del negocio planteados para la investigación los objetivos a cumplir son los
siguientes:
Crear un modelo de predicción que asigne un nivel de calificación a los clientes que
tiempo, para definir las captaciones y colocaciones entre los diferentes niveles
organizacionales.
cada base de datos con lo que se establecerá los criterios de éxitos de cada resultado.
o Identificar un mínimo de 2 algoritmos de minería de datos para cumplir los dos primeros objetivos
o Presentar un nivel de calificación a cada cliente cada vez que se presente a realizar un
préstamo.
Producir el Plan del Proyecto
A cada una de las muestras tomadas se analizará el contenido y se realizarán trabajos de normalización de
producción.
Datos)
sucursal.
sucursales.
o Integridad de Entidad.
o Integridad de Dominio.
o Integridad Referencial.
datos según estructura requerida por los sistemas donde los datos serán procesados.
Etapa 5: Selección de los Datos de Ejecución de los procesos de explotación de datos
propuestos.
EVALUACION
Recolección de Datos
Identificación de Clientes
Son identificados con un código interno y dependiendo del tipo se les incluye
un numero de documento de identificación como el RUC o DNI
Se les asigna un código CIUU en el caso de ser empresas
Se identifica el tipo de negocio
Se define la ubicación del cliente.
Se determina la edad del cliente
Que propiedades posee.
Su comportamiento de pagos
Montos de crédito tenidos.
Existe una categoría especial para los grandes clientes.
Productos Ofrecidos
Existen diferentes tipos de producto:
o Negocio
Crédito Prendario
CrediTaxi
Credito Agro-emprendedor
Créditos Pyme y Mypes
Crédito Mujer
Facilito
o Personales
Depósitos
Credijoya
Hipotecarios
Personales
Innovación de nuevos productos
o Cada 2 años.
Deserción de clientes:
No se tiene un control de este dato
Requisitos: Varían en función al tipo de préstamo, por ejemplo en los casos de:
Credijoya:
o Persona natural.
o DNI.
o Joyas u objetos de oro
Hipotecarios
o Copia de DNI.
o Recibos de servicios del domicilio.
o Estados de cuenta de préstamos o tarjetas de créditos usadas.
Bases de Datos
Base de Datos Tamaño (Gb)
BancoLaLibertad 17 Gb
BancoLima 4 Gb
TABLA DESCRIPCION
AREA Area dependiente
CARGO Cargo del Colaborador
CLIENTE Cliente de la institución
CUENTA Cuenta que administra el cliente
ITEMTABLA Detalle de códigos
OPE_RESUMEN Resumen de Operaciones
OPERACIONES Operaciones y movimientos generales
PERSONAL Persona que realiza la operación
SUCURSAL Sucursal donde se produce la operación
TABLA Tabla de Códigos
TARJETERO Tabla de marcaciones
UBIGEO Tabla de ubicaciones geográficas
PRESTAMOS Tabla de Préstamos otorgados
CRONOGRAMAS Detalle de cronograma de pagos
Cantidad de Registros de los datos muestras asignados
AGENCIA 9
AHORRO 13,905
ANALISTA 8
CRONOGRAMA 177,436
MOVIMIENTO 318,893
PRESTAMO 10,776
SOCIOS 4,952
SUBTIPAHO 20
TIPOACTIVIDAD 35
TIPOCATEGORIA 5
TIPOCLIENTE 5
TIPOCUENTA 8
TIPOCUOTA 2
TIPODESTINO 8
TIPOESTCIVIL 7
TIPOFINANCIAM 23
TIPOFUENTE 4
TIPOINSTRUC 9
TIPOMODALIDAD 16
Tabla Nro Registros
TIPOMOVIMIENTO 102
TIPONACIONAL 184
TIPOPRESTAMO 4
TIPOPRODUCTO 41
TIPOPROFESION 88
TIPORIGEN 14
TIPOZONA 16
TIPVAR 61
TIPVIA 17
Annual NroRegistros
2005 207,417
2006 245,235
2007 296,644
2008 296,940
2009 297,079
2010 297,829
Integridad de Entidad:
Se puede apreciar que las tablas suministradas mantienen una clave primaria
lo cual asegura unicidad de las operaciones.
Integridad de Dominio:
Integridad Referencial
En este caso las tablas se encuentran relacionadas, salvo las tablas que
administran códigos como:
o Tabla
o ItemTabla
Integridad de Operaciones ;
Los informes en la fase de preparación de datos se enfocan en los pasos de pre-proceso que producen los
datos que serán minados. El resultado final constituirá la Base de Datos de estudio y aplicación de los
modelos respectivos, como podrían ser: Arboles de Decisión, Series de Tiempo, entre otros.
Conjunto de Datos
A continuación definiremos el conjunto de datos, llamada también data de entrenamiento necesaria para la
preparación de los modelos que se harán en las fases siguientes. Dada que la data proviene de 2 bases de
datos es necesario aplicar procesos de integración de datos. El enfoque constará de los componentes
siguientes:
Valores observados hoy de las variables que se esperaba predecir tiempo atrás.
Las variables a predecir están en función a cada objetivo definido en la etapa de comprensión de negocio
y que basado en los objetivos de la minería de datos se pueden observar en el siguiente cuadro
(Malo, Bueno)
Clientes
series de tiempo
Cantidad de Colocaciones
Las características a tomar en cuenta, dependiendo del Objetivo ha implementar estarán determinadas por:
v_Cliente_crm.
v_movimiento.
Campo Descripción Necesario
IdAgencia Código de Agencia
idCajero Código de Cajero
NroTransacc Numero de Transacción
Cajero Cajero
idSubTipo Código Sub Tipo de Cuenta
idTipo Código de Tipo de Cuenta
SubTipoCta Sub tipo de cuenta
TipoCta Tipo de cuenta
Agencia Nombre de agencia
TipoMovimiento Tipo de Movimiento
idCuenta Código de cuenta
Moneda Moneda
TipoCambio Tipo de Cambio
Capital Capital
Interes Interés
FechaMov Fecha de Movimiento
Cliente Cliente
Signo Signo de operación
En el caso de mantener clientes estos estarán representados por la tabla denominada:
v_Prestamo_Riesgo_Cab.
Campo Descripción Necesario
idAgencia Código de Agencia
Agencia Nombre de Agencia Sí
idAnalista Código de Analista
Analista Nombre de Analista Sí
MontoPrestamo Monto de Préstamo Sí
FechaPrestamo Fecha Préstamo Sí
idTipoFuente Código Tipo Fuente
Fuente Fuente de fondos Sí
idTipoDestino Código de Destino
Destino Destino Sí
idTipoFinan Código Tipo Financiamiento
Financiamiento Financiamiento Sí
idTipoCuota Código Tipo de Cuota
TipoCuota Tipo de Cuota Sí
idTipoModalidad Código Tipo de Modalidad
Modalidad Modalidad del Préstamo Sí
idCliente Código del cliente
Cliente Nombre del cliente Sí
IdClave Clave de Movimiento Sí
Conjunto de Datos
Datos
Campo Tipo Dato . distintos Valor Maximo Valor Minimo
Agencia varchar 50 2 SUCURSAL 01 SUCURSAL 02
Analista char 10 6 ARANA VICTOR L
MontoPrestamo decimal 9
FechaPrestamo smalldatetime 4 1805 13/11/1999 30/12/2006
RECURSOS
Fuente varchar 60 1 RECURSOS PROPIOS PROPIOS
Destino varchar 60 5 Activo Fijo Mixto
Adquisicion bien
Financiamiento varchar 50 14 terminado Vehicular
TipoCuota varchar 60 2 Cuota Capital Cuota Fija
Modalidad varchar 60 1 Otros Otros
Cliente varchar 60 9902
Selección de los Datos.
De acuerdo a la data preparada procederemos a la selección respectiva, bajo el criterio de dominio que
tiene cada atributo.
Variables Incluidas
Nivel de Instrucción: se observa una diferenciación interesante entre los diferentes tipos de valores y la
casuística de los mismos
Estado Civil
Actividad que desarrollan
Variables Excluidas
En el caso de la Nacionalidad
Tipo Persona:
Se puede observar que el 97% de personas corresponden a personas naturales o de un negocios de
responsabilidad limitada con 1 o 2 socios. Por lo que el estudio se realizarax en su totalidad con este tipo de
clientes
Lugar de Nacimiento
Por ser un dato que el operador del sistema lo escribe directamente, presenta mucha
diversificación, por lo que será omitido.
Limpieza de Datos.
v_cliente_crm
Al validar la data respecto al nombre de los clientes se pudo determinar con la siguiente
orden:
Esta tarea incluye la posibilidad de generar atributos derivados a partir de otros campos. Por ejemplo en el
caso de las fechas de vencimiento o actualización de saldos o número de préstamos obtenidos por cada
cliente del banco.
En el caso de algunas variables continuas caso los montos prestados, estos se convertirán en variables
continuas durante la creación del modelado, ya que existen alguno algoritmos de las herramientas de
minado de datos en SQL Server que nos soportados en el manejo de variables continuas caso el
Algoritmos Naive Bayes.
Estas son las consultas que nos permitirán construir algunas variables:
A continuación agruparemos por el nombre de la persona y enlazaremos los datos de los clientes con los
de préstamos.
A continuación agruparemos por el nombre de la persona y enlazaremos los datos de los clientes con los
de préstamos a fin de determinar los montos prestados.
A continuación obtendremos el año y mes respectivo de cada préstamo a fin de realizar los pronósticos
respectivos por agencia.
Ya con los datos seleccionados procederemos a Integrarlos en una base de datos que tendrá
toda la data de entrenamiento y que servirá posteriormente para aplicar los Modelo de
Minado.
Este es el esquema de trabajo
Para realizar esta labor utilizaremos una herramienta que permitirá integrar la data seleccionada en las
fases anteriores. Esta herramienta es el: Integration Services que forma parte del Business Intelligence
Development Studio. A continuación mostramos los pasos para construir esta integración .
a. Creando Proyecto de Integración.
b. Estableciendo Conexiones
b.1 Conexión a Base Sucursal 01:
b.2 Conexión a Base Sucursal 02
b.3 Conexión a Base Entrenamiento
En esta etapa se realiza el cambio de tipos de datos y ordenamientos efectuados. Solo tuvimos un cambio
en la fecha de nacimiento de smalldatetime pasamos a datetime.
Modelado
Dependiendo del objetivo a cumplir se identifican las tareas respectivas y por consiguiente la aplicación
del algoritmo o modelo de minado a aplicar.
A continuación veamos la posibilidad ofrecida por el producto en la aplicación del algoritmo respectivo.
series de tiempo
Clientes
Naive Bayes
Clientes
Segmentación
El algoritmo de serie temporal de Microsoft utiliza una combinación de análisis ARIMA y regresión lineal
basada en árboles de decisión para analizar los datos relacionados con el tiempo, como las ventas
mensuales o los beneficios anuales. Los patrones que detecta se pueden usar para predecir valores de
estadios temporales futuros. El algoritmo se puede personalizar para que use el método del árbol de
decisión, ARIMA o ambos
En el caso de Arboles de Decisión.
Probablemente sea uno de los más usados en técnicas de predicción creando un perfil a partir del
comportamiento de los datos acumulados en el tiempo tal como veremos mas adelante.
El algoritmo de clústeres de Microsoft utiliza técnicas iterativas para agrupar los registros de un conjunto
de datos en clústeres que contengan características similares. Esta capacidad resulta útil para buscar
agrupaciones generales en los datos.
Construir el Modelo
Este son los pasos para la creación del Modelo de Minado, para lo cual utilizaremos los Servicios de
Análisis de Microsoft SQL Server incluidos el Business Development Studio.
Esta es la propuesta que desarrolla Microsoft para la implementación de una solución de minería de datos.
Nótese que los pasos 1 y 2 ya han sido desarrollados anteriormente.
Modelos de minado
o Pronósticos de Colocaciones y Prestamos
a. Definiendo el Método de Selección de la Data de Entrenamiento: dado
que la data existe en la Vista de la conexión a partir de una Base de Datos
Relacional se elegirá de acuerdo a la siguiente interfaz.
b. Eligiendo la técnica o algoritmo de minado. En este caso elegiremos:
Series de Tiempo de Microsoft
c. Confirmando la Vista de la Conexión :
b. Modelo de Minado
Muestra las variables predictivas a utilizar
. Procesando el Modelo
e. Modelo Procesado:
o Riesgo Crediticio
Arboles de Decisión:
a. Incorporando la data de entrenamiento basada en la vista de riesgo
crediticio:
b. Modelo de Minado
Muestra las variables predictivas a utilizar
c. Procesar el Modelo
. Desplegando Modelo
. Procesando el Modelo
d. Modelo Procesado:
Naive Bayes
a. Creando el algoritmo:
En este algoritmo todas las variables deben ser continuas, por lo que
aparece la siguiente advertencia:
o Deserción de Clientes:
Arboles de Decisión:
a. Incorporando la variable edad, dentro del Data Source View a partir de la
tabla: v_cliente_crm
b. Definiendo el Método de Selección de la Data de Entrenamiento: dado
que la data existe en la Vista de la conexión a partir de una Base de Datos
Relacional se elegirá de acuerdo a la siguiente interfaz.
c. Eligiendo la técnica o algoritmo de minado. En este caso elegiremos:
Arboles de Decisión de Microsoft
`
d. Confirmando la Vista de la Conexión :
b. Modelo de Minado
Muestra las variables a utilizar
c. Procesar el Modelo
. Desplegando Modelo
. Procesando el Modelo
d. Modelo Procesado:
Evaluar el Modelo
Arboles de Decisión
Nivel de Dependencia de las variables:
Pronostico
Monto en colocaciones
Numero de captaciones
Mantener y reducir los niveles de morosidad, asegurando una evaluación más exacta en los diferentes
A continuación veremos la matriz de clasificación que en las columnas predice los porcentajes
Matriz de Clasificación
De acuerdo a los niveles establecidos en cuanto a ponderación se aplican los siguientes rangos.
Sin Riesgo 0
Si se siguiera con los mismos patrones de evaluación y aprobación de préstamos los resultados de
acuerdo a la Matriz de Clasificación y Predicción, serían los siguientes: habría un 5% (Ponderación de 0.55
– 0.81) de créditos que tienen un nivel de riesgo entre muy alto y otros que se rechazar la solicitud de
préstamo. También se puede encontrar un 7.2% de préstamos (Ponderación de 0.27 - .55) que tienen un
Mantener a los clientes que generan mayor valor a la institución a fin de reducir el riesgo de que se vayan
a la competencia
Herramienta Ofimática
Excel 2007 o Excel 2010
Addins de Minería de Datos para SQL Server 2005
Característica Versión
http://docs.seace.gob.pe/mon/docs/procesos/2010/002336/000012_02_EXO-2-2010-
CMAC_T%20S_A_-
INSTRUMENTO%20QUE%20APRUEBA%20LA%20EXONERACION.pdf
c. Como realiza el proceso de pronósticos para metas futuras como: colocaciones por ejemplo.
d. Que pronósticos realiza referente a las operaciones de la institución?
e. Qué variables o datos tiene en cuenta para cada pronostico realizado?
f. Que técnicas de pronostico aplica?
g. Desde hace que tiempo se utilizan las mismas variables o datos.
h. Tiene alguna dependencia con el área de Sistemas para esta labor. Cuál?
i. Que hacen cuando no se tiene el dato a evaluar en la base de datos.
j. Existe consistencia y calidad en los datos a evaluar
k. Cada que tiempo se realizan ajustes después del pronóstico realizado.
l. Que tan aproximados se encuentran los pronósticos realizados respecto a la realidad?
m. Cada que tiempo son ajustados
n. Se puede obtener alguna muestra de los pronostico realizados?