Está en la página 1de 24

EPG_REG_V01065 Formato de carátula para los trabajos de los alumnos de maestrías

Maestría: Maestría en Gestión

Promoción: Sexta Ciclo: 0

Curso: Estadística y probabilidad para Data Science

Docente: Eduardo Mantilla

Trabajo: Trabajo Grupal - Informe

Integrante(s):
Lucero Stefany Díaz Obregón

Geraldine Jazmín Roncal Paucar

Akemy Cristina Saucedo Bravo

Mayra Alejandra Vallejos Campos

2023
1
En base a los datos obtenidos del archivo Excel “Datos Trabajo Grupal” que presenta
información de una muestra de 1,736 clientes que accedieron a préstamos en una
institución financiera de Estados Unidos, el informe tiene como objetivo analizar
estadísticamente los datos de las siguientes variables:

LOANAMT: monto del préstamo otorgado (en miles de dólares).

OBRAT: otras obligaciones del cliente (como % del ingreso del cliente).

APPINC: ingreso anual del cliente (en miles de dólares).

UNEM: tasa de desempleo de la industria donde trabaja el cliente.

HRAT: gastos en el hogar (como % del ingreso del cliente).

REP: número de créditos que tenía el cliente antes de la aprobación de este último
préstamo.

LIQ: activos líquidos del cliente (en miles de dólares).

Para las variables descritas se realizaron cuatro análisis:

El primer análisis nos permitió ubicar datos atípicos anulando sus observaciones
correspondientes para cada variable.

Como segundo análisis se elaboró una tabla con estadísticos descriptivos para cada
variable calculando la media, mediana y desviación estándar y los resultados fueron
interpretados.

Seguidamente construimos cuadros de frecuencia para las variables LOANAMT,


APPINC y LIQ, describiendo como se ubicaban distribuidos sus datos.

A continuación, se desarrolló y analizó un modelo de regresión lineal múltiple que


permitió explicar los factores que influyen en el monto del préstamo otorgado por la
institución financiera a sus clientes.

Finalmente, el informe presenta otros factores no observados que pueden llegar a


explicar la variable dependiente que en el caso es: monto del préstamo otorgado en
miles de dólares (LOANAMT)

2
Análisis de datos atípicos

Para su identificación se calculó para cada variable los 5 números importantes: el


mínimo, cuartil 1, cuartil 2, cuartil 3 y el máximo, así como el rango intercuartílico a fin
de anular las observaciones que se ubicaban fuera de los límites superior e inferior de
este rango.

Resumen de la variable LOANAMT

Mínimo 2
Cuartil 1 100
Cuartil 2 126
Cuartil 3 162
Máximo 980

RIC = 62
Lim. Inferior 7
Lim. Superior 255

Interpretación de los cuartiles 1 y 3

Cuartil 1: El 25% de los préstamos fueron por un valor menor a 100 miles de dólares.

Cuartil 3: El 25% de los préstamos fueron por un valor mayor a 162 miles de dólares.

Los datos atípicos de la variable fueron los siguientes (expresados en miles de


dólares):

2 285 336 450


256 287 338 460
257 288 345 480
259 289 348 484
260 290 349 490
262 292 350 496
264 296 352 500
265 297 360 550
267 299 370 600
268 300 373 632
270 304 376 650
272 308 380 700
274 310 390 732
275 312 396 750
276 313 400 800
278 315 405 980
279 320 412
280 322 425
281 324 426
284 330 436
3
Visualizamos de mejor manera el resultado a través de un diagrama de caja y bigote:

Resumen de la variable OBRAT

Mínimo 0
Cuartil 1 27.9
Cuartil 2 32.6
Cuartil 3 36.275
Máximo 95

RIC = 8.375
Lim. Inferior 15.3375
Lim. Superior 48.8375

4
Interpretación de los cuartiles 1 y 3

Cuartil 1: El 25% de las obligaciones de los clientes son menores al 27.9% de su


ingreso.

Cuartil 3: El 25% de las obligaciones de los clientes son mayores al 36.275% de sus
ingresos.

Los datos atípicos de la variable fueron los siguientes (expresados en % del ingreso
del cliente):

0 15
4 49
5.6 50
6.99 51
7 52
8 53
10 55
10.6 56
10.8 57
11 57.7
11.3 58
11.4 60.5
12 61
12.1 69.2
12.6 73
13 83
14 95
14.3
14.4
14.6

5
Visualizamos de mejor manera el resultado a través de un diagrama de caja y bigote:

Resumen de la variable APPINC

Mínimo 4
Cuartil 1 49
Cuartil 2 64
Cuartil 3 88.75
Máximo 870

RIC = 39.75
Lim. Inferior 4
Lim. Superior 148.375

Interpretación de los cuartiles 1 y 3

Cuartil 1: El 25% de los ingresos anuales de los clientes son menores a 49 miles de
dólares.

Cuartil 3: El 25% de los ingresos anuales de los clientes son mayores a 88.75 miles de
dólares.
6
Los datos atípicos de la variable fueron los siguientes (expresados en miles de
dólares):

150 177 213 280 477


151 178 218 285 621
152 179 220 288 641
153 180 223 295 666
155 182 226 300 796
156 183 234 312 870
157 184 240 321
158 187 242 324
159 188 250 329
160 189 252 330
161 192 253 342
162 194 255 350
163 198 259 351
164 199 260 372
167 200 264 384
168 201 265 396
169 204 270 400
170 205 275 420
174 206 276 430
175 211 277 432

7
Visualizamos de mejor manera el resultado a través de un diagrama de caja y bigote:

Resumen de la variable UNEM

Mínimo 1.8
Cuartil 1 3.1
Cuartil 2 3.2
Cuartil 3 3.9
Máximo 10.6

RIC = 0.8
Lim. Inferior 1.9
Lim.
Superior 5.1

Interpretación de los cuartiles 1 y 3

Cuartil 1: El 25% de las tasas de desempleo de las industrias donde trabajan los
clientes son menores a 3.1%.

8
Cuartil 3: El 25% de las tasas de desempleo de las industrias donde trabajan los
clientes son mayores a 3.9%.

Los datos atípicos de la variable fueron los siguientes (expresados en %):

1.8
5.3
8.9
10.6

Visualizamos de mejor manera el resultado a través de un diagrama de caja y bigote:

Resumen de la variable HRAT

Mínimo 1
Cuartil 1 21
Cuartil 2 25.46
Cuartil 3 28.975
Máximo 72

RIC = 7.975
Lim. Inferior 9.0375
Lim.
Superior 40.9375

9
Interpretación de los cuartiles 1 y 3

Cuartil 1: El 25% de los clientes tienen gastos en el hogar menores al 25.46% de su


ingreso.

Cuartil 3: El 25% de los clientes tienen gastos en el hogar mayores al 28.975% de su


ingreso.

Los datos atípicos de la variable fueron los siguientes (expresados en % del ingreso
del cliente):

1 45
2.8 46
3.8 46.85
4 47
5 50
5.3 52
5.4 53.6
6 56.1
6.99 71
7 72
7.4
8
8.2
8.8
8.82
9
9.01
41
42.61
44

10
Visualizamos de mejor manera el resultado a través de un diagrama de caja y bigote:

Resumen de la variable REP

Mínimo 0
Cuartil 1 1
Cuartil 2 1
Cuartil 3 2
Máximo 9

RIC = 1
Lim. Inferior 0
Lim. Superior 3.5

Interpretación de los cuartiles 1 y 3

Cuartil 1: El 25% de los clientes tuvieron créditos menores a 1 antes de la aprobación


del último préstamo.

Cuartil 3: El 25% de los clientes tuvieron créditos mayores a 2 antes de la aprobación


del último préstamo.

Los datos atípicos de la variable fueron los siguientes (expresados en número de


créditos del cliente previo a la aprobación del último crédito):

11
4
5
6
8
9

Visualizamos de mejor manera el resultado a través de un diagrama de caja y bigote:

Resumen de la variable LIQ

Mínimo 0
Cuartil 1 21
Cuartil 2 40
Cuartil 3 88.75
Máximo 1000000

RIC = 67.75
Lim. Inferior 0
Lim. Superior 190.375

Interpretación de los cuartiles 1 y 3

Cuartil 1: El 25% de los activos líquidos de los clientes son menores a 40 miles de
dólares.

Cuartil 3: El 25% de los activos líquido de los clientes cliente son mayores a 88.75
miles de dólares.
12
Los datos atípicos de la variable fueron los siguientes (expresados en miles de
dólares):

192 221 249 277 365 461 766 2657


193.8 222 249.6 286 373 463 783 2970
195 223 251 288 376.5 472 793.9 1000000
196 223.6 252.5 298 379 488 814
196.1 224 254 299 388 500 816
198 227 255 303 398 516 842
200 227.8 256 308 402 517 867
201 228 256.4 316 403 519 870
203 229 256.7 322.7 405 523.7 878
203.1 230 257 324 427.9 527 924
204 231 258 325 429 534 1000
204.2 233 263 328 430 572 1100
206 235 263.4 338 434.6 590 1203
207 237 267 339 435.5 612 1211
209 239 269 340 439.6 618 1213
210 239.6 269.7 347 441 627 1600
214 240 270 349 443 632.6 1687
216 241 273 356 445.9 665 1700
217 246 274 361.9 447 683 2369
219 248 275 362 449 729 2577

13
Visualizamos de mejor manera el resultado a través de un diagrama de caja y bigote:

14
Tablas con estadísticos descriptivos - Interpretaciones

Variable LOANAMT

Media = 143.48

Mediana = 126.00
LOANAMT
Desv. Est. = 82.12

Sesgo = 3.20

Media: A los clientes se les ha otorgado en promedio un préstamo de 143.48 miles de


dólares.

Mediana: El 50% de los clientes ha recibido un préstamo menor a los 126 mil de
dólares. El 50% restante recibió un préstamo mayor.

Desviación estándar: En promedio, la desviación típica respecto a la media es de


82.12 miles de dólares.

Sesgo: La distribución está muy sesgada hacia la derecha.

Variable OBRAT

Media = 31.91
Mediana = 32.60
OBRAT
Desv. Est. = 7.66
Sesgo = 0.29

Media: En promedio las obligaciones de los clientes representan el 31.91% de sus


ingresos.

Mediana: El 50% de los clientes tienen obligaciones que representan menos del
32.60% de sus ingresos. El 50% restante tienen obligaciones mayores a este
porcentaje.

Desviación estándar: En promedio, la desviación típica respecto a la media es de


7.66%

Sesgo: La distribución está ligeramente sesgada hacia la izquierda.

15
Variable APPINC

Media = 83.67
Mediana = 64.00
APPINC
Desv. Est. = 80.50
Sesgo = 5.25

Media: En promedio el ingreso anual de los clientes es de 83.67 miles de dólares.

Mediana: El 50% de los clientes tiene un ingreso anual menor a los 64 mil dólares. El
50% restante tiene un ingreso superior.

Desviación estándar: En promedio, la desviación típica respecto a la media es de


80.50 miles de dólares

Sesgo: La distribución está muy sesgada hacia la derecha.

Variable UNEM

Media = 3.84
Mediana = 3.20
UNEM
Desv. Est. = 2.10
Sesgo = 2.43

Media: En promedio, la tasa de desempleo de la industria donde trabajan los clientes


es de 3.84%

Mediana: El 50% de los clientes trabajan en una industria con una tasa de desempleo
menor al 3.20%. El 50% restante trabaja en una industria con una tasa de desempleo
superior.

Desviación estándar: En promedio, la desviación típica respecto a la media es de


2.10%

Sesgo: La distribución está sesgada hacia la derecha.

Variable HRTAT

Media = 24.66
Mediana = 25.46
HRTAT
Desv. Est. = 6.74
Sesgo = 0.07

Media: En promedio, los gastos de hogar de los clientes representan el 24.66% de sus
ingresos.
16
Mediana: El 50% de los clientes tienen gastos en el hogar que representan menos del
25.46% de sus ingresos. El 50% restante tiene gastos superiores.

Desviación estándar: En promedio, la desviación típica respecto a la media es de


6.74%

Sesgo: La distribución está sesgada hacia la izquierda.

Variable REP

Media = 1.50
Mediana = 1.00
REP
Desv. Est. = 0.98
Sesgo = 1.45

Media: En promedio, los clientes tenían 1.50 créditos antes de la aprobación del último
préstamo.

Mediana: El 50% de los clientes tenían 1 crédito menos antes de la aprobación del
último préstamo. El 50% tenían más de 1 crédito

Desviación estándar: En promedio, la desviación típica respecto a la media es de 0.98


créditos.

Sesgo: La distribución está sesgada hacia la derecha.

Variable LIQ

Media = 4,697.34
Mediana = 40.00
LIQ
Desv. Est. = 67,741.54
Sesgo = 14.64

Media: En promedio, los clientes cuentan con activos líquidos por 4,697.34 miles de
dólares.

Mediana: El 50% de los clientes cuentan con menos de 40 mil dólares en activos
líquidos. El otro 50% cuenta con más que dicho importe.

Desviación estándar: En promedio, la desviación típica respecto a la media es de


67,741.54 miles de dólares.

Sesgo: La distribución está muy sesgada hacia la derecha.

17
Cuadros de frecuencia

Variables: LOANAMT, APPINC, LIQ.

Análisis LOANAMT: Monto del préstamo otorgado en miles de dólares

Amplitud 978
Sturges 11.69
Número de
intervalos 12

TIC 81.500
TIC redondeado 81.5

Análisis LOANAMT fi fri pi (%)


Desde 2 Hasta 83.5 248 0.14 14.29
Desde 83.5 Hasta 165 1064 0.61 61.29
Desde 165 Hasta 246.5 287 0.17 16.53
Desde 246.5 Hasta 328 82 0.05 4.72
Desde 328 Hasta 409.5 26 0.01 1.50
Desde 409.5 Hasta 491 15 0.01 0.86
Desde 491 Hasta 572.5 4 0.00 0.23
Desde 572.5 Hasta 654 5 0.00 0.29
Desde 654 Hasta 735.5 2 0.00 0.12
Desde 735.5 Hasta 817 2 0.00 0.12
Desde 817 Hasta 898.5 0 0.00 0.00
Desde 898.5 Hasta 980 1 0.00 0.06

18
Se observa una distribución asimétrica, donde aproximadamente el 61% de los datos
se encuentran concentrados entre 83.5 y 165 mil dólares. Es decir, más del 60% de
los clientes accedió a un préstamo financiero entre 83.6 y 164 mil dólares.

Análisis APPINC: Ingreso anual del cliente (en miles de dólares)

Amplitud 866
Sturges 11.69051408
Número de
intervalos 12

TIC 72.167
TIC
redondeado 72.2

Análisis APPINC fi fri pi (%)


Desde 4 Hasta 76.2 1149 0.66 66.19
Desde 76.2 Hasta 148.4 460 0.26 26.50
Desde 148.4 Hasta 220.6 63 0.04 3.63
Desde 220.6 Hasta 292.8 27 0.02 1.56
Desde 292.8 Hasta 365 10 0.01 0.58
Desde 365 Hasta 437.2 7 0.00 0.40
Desde 437.2 Hasta 509.4 1 0.00 0.06
Desde 509.4 Hasta 581.6 0 0.00 0.00
Desde 581.6 Hasta 653.8 2 0.00 0.12
19
Desde 653.8 Hasta 726 15 0.01 0.86
Desde 726 Hasta 798.2 1 0.00 0.06
Desde 798.2 Hasta 870.4 1 0.00 0.06

Se observa una distribución asimétrica, donde aproximadamente el 92% de los datos


se encuentran concentrados entre 4 y 148.40 miles de dólares. Es decir, más del 90%
de los clientes que accedieron a un préstamo financiero tienen un ingreso anual entre
4 a 148.4 mil dólares

Análisis LIQ: activos líquidos del cliente (en miles de dólares)

Amplitud 1000000
Sturges 11.69051408
Número de
intervalos 12

TIC 83333.333
TIC redondeado 83333.34

20
Análisis LIQ fi fri pi (%)
Desde 0 Hasta 83333.34 1728 0.995 99.54
Desde 83333.34 Hasta 166666.68 0 0.000 0.00
Desde 166666.68 Hasta 250000.02 0 0.000 0.00
Desde 250000.02 Hasta 333333.36 0 0.000 0.00
Desde 333333.36 Hasta 416666.7 0 0.000 0.00
Desde 416666.7 Hasta 500000.04 0 0.000 0.00
Desde 500000.04 Hasta 583333.38 0 0.000 0.00
Desde 583333.38 Hasta 666666.72 0 0.000 0.00
Desde 666666.72 Hasta 750000.06 0 0.000 0.00
Desde 750000.06 Hasta 833333.4 0 0.000 0.00
Desde 833333.4 Hasta 916666.74 0 0.000 0.00
Desde 916666.74 Hasta 1000000.1 8 0.005 0.46

Se observa una distribución asimétrica, donde aproximadamente el 99% de los datos


se encuentran concentrados entre 0 y 83333.4 miles de dólares. Es decir, casi el 100%
de los clientes que accedieron a un préstamo financiero tienen activos líquidos hasta
83333 mil dólares.

21
Modelo de regresión lineal múltiple que explica los factores que influyen en el
monto de préstamo otorgado por la institución financiera a los clientes

Resumen

Estadísticas de la regresión
Coeficiente de correlación 0.54144
múltiple 767
Coeficiente de determinación 0.29316
R^2 558
0.29071
R^2 ajustado 272
69.1645
Error típico 381
Observaciones 1736

ANÁLISIS DE
VARIANZA
Suma de Promedio Valor
Grados de cuadrado de los crítico
libertad s cuadrados F de F
3430498. 571749.77 119.5195 1.761E-
Regresión 6 65 5 75 126
8271074. 4783.7333
Residuos 1729 93 3
11701573
Total 1735 .6

Coefic Error Estadí Proba Inferio Superi Inferior Superio


ientes típico stico t bilidad r 95% or 95% 95.0% r 95.0%
- -
17.49 9.158 1.910 0.056 0.463 35.460 0.4636 35.4608
Intercepción 85806 17906 70523 20771 69458 8559 9458 559
- -
OBRAT(% de obligaciones sobre el 0.295 0.283 1.043 0.296 0.260 0.8521 0.2601 0.85210
ingreso del cliente ) 99739 53271 96205 64888 1058 0057 058 057
APPINC(ingreso anual del cliente 0.550 0.021 25.48 6.508 0.508 0.5927 0.5080 0.59276
en miles de dólares) 41136 59612 65863 E-122 0541 6863 541 863
- - - - - -
UNEM(tasa de desempleo de la 2.714 0.792 3.425 0.000 4.268 1.1599 4.2683 1.15995
industria donde trabaja el cliente) 17682 42864 1372 62885 39641 5722 9641 722
HRAT(gastos en el hogar como % 3.075 0.328 9.356 2.456 2.430 3.7202 2.4308 3.72020
del ingreso del cliente) 53792 68871 99281 9E-20 86859 0724 6859 724
REP(número de créditos que tenía
el cliente antes de la aprobación de - -
este 3.234 1.712 1.888 0.059 0.123 6.5926 0.1239 6.59260
último préstamo.) 31777 24594 93294 06804 97352 0905 7352 905
- -
LIQ(activos líquidos del cliente (en 4.541 2.462 1.844 0.065 2.889 9.3709 2.889E 9.3709E
miles de dólares)) E-05 6E-05 02148 35101 E-06 E-05 -06 -05

0.00004 * Liq

22
El 29.32% de la variabilidad en el monto del préstamo otorgado puede ser explicado
por las obligaciones, ingreso anual y gastos del hogar de los clientes. Asimismo, está
explicado por la tasa de desempleo de la industria donde trabaja el cliente, su número
de créditos antes de la aprobación del último préstamo y sus activos líquidos.

OBRAT (Otras Obligaciones del Cliente): Un aumento del 1% en las otras


obligaciones del cliente se asocia, en promedio, con un aumento de alrededor de
0.296 unidades en el monto del préstamo otorgado, manteniendo constantes las
demás variables. Esto puede indicar que a medida que las otras obligaciones del
cliente aumentan, es probable que el monto del préstamo también aumente, aunque la
relación no es muy fuerte.

APPINC (Ingreso Anual del Cliente): Un aumento de 1 unidad en el ingreso anual del
cliente (en miles de dólares) se relaciona, en promedio, con un aumento de alrededor
de 0.550 unidades en el monto del préstamo otorgado. Esto sugiere que los clientes
con ingresos más altos tienden a recibir préstamos de mayor monto.

UNEM (Tasa de Desempleo de la Industria): Un aumento de 1 unidad en la tasa de


desempleo de la industria donde trabaja el cliente se asocia, en promedio, con una
disminución de alrededor de 2.714 unidades en el monto del préstamo otorgado. Esto
indica que un aumento en la tasa de desempleo en la industria del cliente está
relacionado con una reducción en el monto del préstamo que se le otorga.

HRAT (Gastos en el Hogar): Un aumento de 1% en los gastos en el hogar del cliente


se relaciona, en promedio, con un aumento de aproximadamente 3.076 unidades en el
monto del préstamo otorgado. Esto sugiere que a medida que los gastos en el hogar
aumentan, es probable que el monto del préstamo también aumente.

REP (Número de Créditos Anteriores): Un aumento de 1 unidad en el número de


créditos que tenía el cliente antes de la aprobación del último préstamo se asocia, en
promedio, con un aumento de alrededor de 3.234 unidades en el monto del préstamo
otorgado. Esto indica que los clientes con un historial crediticio más extenso pueden
recibir préstamos de mayor monto.

LIQ (Activos Líquidos del Cliente): Un aumento de 1 unidad en los activos líquidos
del cliente (en miles de dólares) se relaciona con un aumento extremadamente
pequeño de aproximadamente 0.00004541 unidades en el monto del préstamo
otorgado. Esto indica que los activos líquidos del cliente tienen una influencia muy
limitada en el monto del préstamo.

Factores no observados que podrían explicar la variable dependiente

Consideramos que los factores no observados que pueden explicar la variable “Monto
de préstamo otorgado” son:

- Edad del cliente

23
- Cantidad de hijos o miembros dependientes del cliente.

- Estabilidad domiciliar

- Pago de impuestos personales (% de cumplimiento por parte del cliente)

- Garantía personal o historial crediticio (% cumplimiento de sus pagos por parte


del cliente)

- Duración promedio de empleo actual y anteriores.

- Plazo del préstamo en meses o años.

24

También podría gustarte