Está en la página 1de 4

Método de recolección de datos

El modo con el cual se recolectarán datos para esta investigación es a través de una entrevista
personal de tipo dirigida realizada de manera presencial, ya que se ha realizado de acuerdo a
un cuestionario de preguntas (anexo 1), donde las personas entrevistadas son los socios
interesados obtener un crédito por convenio.

La guía de entrevista está compuesta por 6 preguntas y se elaboró considerando la literatura


científica expuesta en los capítulos anteriores, ya que, tras la revisión de dicha literatura, se
identificaron las prácticas que se utilizan con mayor frecuencia en la gestión de riesgo de
crédito.

Además, para validar la guía de entrevista se solicitó la revisión de los documentos a presentar
por el socio.
Preguntas RESPUESTAS
1.- ¿Cuál es su rango de edad? 1. De 18 a 25 años
2. De 25 a 40 años
3. De 40 a 65 años
4. Mayor a 65 años

2.- ¿Cuál es su remuneración mensual?


1.- S/. 1,000
2. S/. 1,000 ≤ S/.3000
3. S/. 3,001≤ S/.5,000
4. S/. 5,000

1. Negociopropio/conyuge/notiene
3.- ¿Percibe otros ingresos? 2. Consultoría especializada
3. Inversiones
4. Alquileres – Otros

4.- ¿Cuenta con retenciones judiciales? 1. Sin retención


2. 01 retención judicial
3. Mas 01 retención judicial

5.-¿Cuál es su relación laboral? 1. Permanente


2. Contratado
3. CAS- Independiente

6. ¿ Cuál es el importe que solicita el 1.- S/. 10,000


2. S/.10,000 ≤ S/.30,000
crédito? 3. –. S/. 30,000 ≤ S/. 50,000
4 .-S/.50,000 ≤ S/. 250,000

En la presente investigación la base de datos estuvo constituida por la encuesta a los 4000
que forman parte de la cartera de crédito personal de la Cooperativa de Ahorro y Crédito.

Por criterio de los investigadores, el análisis estadístico se llevó a cabo considerando todas las
variables en estudio. Al inicio fue necesario evaluar la relación entre la variable dependiente y
las variables independientes con el objeto de encontrar al menos una variable explicativa que
permita la construcción del modelo; así como probar la normalidad de las variables no se
consideró asignar un porcentaje al conjunto de testeo por la limitación de no contar con una
mayor cantidad de datos. En la modelización predictiva del conjunto de datos de
entrenamiento se generaron fácilmente modelos que predijeran el valor del TARGET (variable
Respuesta) a partir de un conjunto de valores de entrada; sin embargo, estas predicciones solo
fueron precisas para el propio conjunto de entrenamiento. El intento de generalizar las
predicciones de este conjunto de datos a un conjunto independiente pero con una distribución
similar puede producir resultados con un deterioro significativo de la precisión, con el fin de
evitar este problema se utilizó el conjunto de validación como forma de evaluar
independientemente la performance de un modelo. Para tratar los valores faltantes que se
presentaron en el modelo se trabajó con el método de valores faltantes para variables de
clase: moda, constante, distribución, árbol de clasificación (con o sin reglas subrogantes). En el
modelamiento de datos se utilizaron las técnicas de Regresión Logística, Árboles de
Clasificación y Redes Neuronales para la estimación de la probabilidad de default (PD), una vez
hallado los modelos predictivos se procedió a comparar y evaluar utilizando estadísticos como:
Matriz de confusión (sensibilidad, especificidad, valor predictivo positivo, precisión o 80 error
de clasificación), la curva ROC, índice de GINI, el estadístico de Kolmogórov-Smirnov (𝐾𝑆) y la
Curva de Porcentaje Acumulado de Respuesta Capturada (CAPC) para poder determinar el
mejor modelo predictivo en eficiencia y predictibilidad para el otorgamiento del crédito
personal en la cooperativa de ahorro y crédito.

También podría gustarte