Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Método de Recolección de Datos
Método de Recolección de Datos
El modo con el cual se recolectarán datos para esta investigación es a través de una entrevista
personal de tipo dirigida realizada de manera presencial, ya que se ha realizado de acuerdo a
un cuestionario de preguntas (anexo 1), donde las personas entrevistadas son los socios
interesados obtener un crédito por convenio.
Además, para validar la guía de entrevista se solicitó la revisión de los documentos a presentar
por el socio.
Preguntas RESPUESTAS
1.- ¿Cuál es su rango de edad? 1. De 18 a 25 años
2. De 25 a 40 años
3. De 40 a 65 años
4. Mayor a 65 años
1. Negociopropio/conyuge/notiene
3.- ¿Percibe otros ingresos? 2. Consultoría especializada
3. Inversiones
4. Alquileres – Otros
En la presente investigación la base de datos estuvo constituida por la encuesta a los 4000
que forman parte de la cartera de crédito personal de la Cooperativa de Ahorro y Crédito.
Por criterio de los investigadores, el análisis estadístico se llevó a cabo considerando todas las
variables en estudio. Al inicio fue necesario evaluar la relación entre la variable dependiente y
las variables independientes con el objeto de encontrar al menos una variable explicativa que
permita la construcción del modelo; así como probar la normalidad de las variables no se
consideró asignar un porcentaje al conjunto de testeo por la limitación de no contar con una
mayor cantidad de datos. En la modelización predictiva del conjunto de datos de
entrenamiento se generaron fácilmente modelos que predijeran el valor del TARGET (variable
Respuesta) a partir de un conjunto de valores de entrada; sin embargo, estas predicciones solo
fueron precisas para el propio conjunto de entrenamiento. El intento de generalizar las
predicciones de este conjunto de datos a un conjunto independiente pero con una distribución
similar puede producir resultados con un deterioro significativo de la precisión, con el fin de
evitar este problema se utilizó el conjunto de validación como forma de evaluar
independientemente la performance de un modelo. Para tratar los valores faltantes que se
presentaron en el modelo se trabajó con el método de valores faltantes para variables de
clase: moda, constante, distribución, árbol de clasificación (con o sin reglas subrogantes). En el
modelamiento de datos se utilizaron las técnicas de Regresión Logística, Árboles de
Clasificación y Redes Neuronales para la estimación de la probabilidad de default (PD), una vez
hallado los modelos predictivos se procedió a comparar y evaluar utilizando estadísticos como:
Matriz de confusión (sensibilidad, especificidad, valor predictivo positivo, precisión o 80 error
de clasificación), la curva ROC, índice de GINI, el estadístico de Kolmogórov-Smirnov (𝐾𝑆) y la
Curva de Porcentaje Acumulado de Respuesta Capturada (CAPC) para poder determinar el
mejor modelo predictivo en eficiencia y predictibilidad para el otorgamiento del crédito
personal en la cooperativa de ahorro y crédito.