Está en la página 1de 22

FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICAS

ESTADÍSTICA

Análisis del perfil crediticio de una institución


financiera en base a parámetros que permitan
determinan los perfiles ideales al momento de
otorgar un préstamo.

GRUPO #5
INTEGRANTES:
ABIFANDI MORALES ILENIA MARIELA
CASTILLO CHERREZ ANDREA YELITZA
CHINGA DE LA CRUZ LUIS ANTHONY
SORIANO ARTEAGA MIGUEL SEBASTIAN
VERDEZOTO INTRIAGO STEEVEN JOFFRE
PARALELO: 7

PROFESORA: Mgtr. SANDRA GONZALEZ

FECHA DE PRESENTACIÓN:
02-09-2019
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

Proyecto de Clase

INDICE GENERAL

1. Introducción..............................................................................................................................3
2. Objetivos...................................................................................................................................3
2.1. Objetivo General...............................................................................................................3
2.2. Objetivos Específicos........................................................................................................3
3. Variables y Metodología...........................................................................................................3
4. Análisis Descriptivo de Datos...................................................................................................5
4.1. Cálculos de la Variable Age..............................................................................................5
4.2. Cálculos de la Variable Balance.......................................................................................6
4.3. Cálculos de la Variable Loan............................................................................................7
4.4. Cálculos de la Variable Housing......................................................................................8
4.5. Cálculos de la Variable Education....................................................................................8
5. Análisis Estadístico Bivariado..................................................................................................9
5.1. Distribución conjunta Age-Loan.......................................................................................9
5.2. Distribución conjunta Balance-Education......................................................................10
6. Estadística Inferencial............................................................................................................12
6.1. Bondad de ajuste.............................................................................................................12
6.2. Prueba de hipótesis e intervalos de confianza.................................................................15
7. Análisis de contingencia.........................................................................................................20
7.1. Prueba de independencia entre Balance y Education.....................................................20
7.2. Prueba de independencia para Edad y Loan...................................................................21
8. CONLUSIONES......................................................................................................................22
9. REFERENCIAS BIBLIOGRÁFICAS Y ELECTRÓNICAS.......................................................22
10. ANEXOS..............................................................................................................................22

2
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

1. Introducción

El análisis estadístico de datos es una herramienta fundamental a la hora de tomar


decisiones en una empresa, ya que, si se obtienen conclusiones notables a partir de un
estudio, esto puede alterar significativamente el rumbo de una compañía.
Al momento de otorgar un préstamo, los agentes bancarios se ven en la necesidad de
establecer parámetros que definan de manera objetiva el perfil de los clientes con mayores
probabilidades de pagar conforme lo acordado. Del mismo modo, se debe establecer un
límite en el monto de los préstamos a clientes que puedan representar un riesgo crediticio.
Por esta razón, en nuestro proyecto se pretende identificar los parámetros que podrían
seguir las instituciones financieras.

2. Objetivos
2.1.Objetivo General

- Descifrar a través de un estudio estadístico el comportamiento de una población


cliente de un banco para estimar con mayor precisión los beneficios y riesgos del
banco.

2.2.Objetivos Específicos

- Designar una muestra de la población a través de una fórmula estadística en base al


porcentaje de confianza y error que esperemos.
- Desarrollar un análisis descriptivo e inferencial para establecer los datos que nos
guiarán en nuestras conclusiones
- Establecer conclusiones fundamentadas en el estudio estadístico para asegurar los
cambios que se puedan efectuar en la entidad bancaria y así reducir al mínimo los
riesgos de quiebra.

3. Variables y Metodología

La investigación por desarrollar es de tipo aplicada, en ella solo se analizan los datos por medio de
técnicas estadísticas y modelos existentes para desarrollar diferentes conocimientos sin construir
nuevos modelos. 
Para identificar el proceso realizado es necesario tener en cuenta la definición de los términos y
esquemas a usar en el desarrollo y análisis de nuestra base de datos.

3
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

Tabla 1. Metodología

Nombre Descripción Representación


Conjunto de individuos,
objetos o fenómenos que
Población N
se desea estudiar una o
más características.
Subconjunto de individuos
Muestra provenientes de la n
población.
Es el promedio de un
conjunto de datos, se
n
suman todos los números 1
Media x́= ∑ x i
del conjunto de datos y se n i=1
divide para el número de
valores del conjunto.

Es punto medio de la
Mediana muestra es decir ocupa M e =¿
una posición central.
El valor con mayor Mo
Moda
frecuencia.
n
Es la dispersión que existe ∑ ( x i−x́ )2
Varianza entre los datos con su s2= i=1
media. n−1

Esta es el escalar que


Desviación Estándar
indica la distancia de los s=+ √ s 2
datos con respecto a su
media.
n
1 3
Es la medida que indica la ∙ ∑ ( x i− x́ ) ∙ ni
simetría de la distribución m3 n i=1
Sesgo λ 1= =
s3 3
de una variable respecto a 1
n

la media aritmética. [ ∙ ∑ ( x −x́ )2 ∙ ni


n i=1 i ] 2

De la base poblacional de dos mil datos, de los cuales se tomó una muestra de ciento cuarenta
individuos. Las variables para considerar en nuestro estudio se describen a continuación:

4
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

Tabla 2. Variables Utilizadas

VARIABLES

UNIDAD DE
NOMBRE CODIGO DEFINICION TIPO
MEDIDA

Age #bank client data Edad del entrevistado Años Cuantitativa

Educación máxima
Education #bank client data alcanzada por el Cualitativa
entrevistado

Balance monetario
Balance #bank client data promedio del Euros Cuantitativa
entrevistado

Pertenencia de
Housing Loan #bank client data Cualitativa
Hipoteca
Existencia de
Loan #bank client data Cualitativa
préstamos

Una vez obtenida la muestra de la población objetivo realizamos los cálculos pertinentes para la
elaboración de la Tabla de Frecuencias por medio de las ecuaciones redactadas en el cuadro
teórico.
Se procede a calcular las medidas de tendencia central, dispersión y posición, con esta información
se elabora el histograma de frecuencia, el diagrama de barras y el diagrama de cajas.
El análisis descriptivo de las variables facilita la obtención de las medidas de tendencia central y de
dispersión para establecer la relación entre las variables por medio de bondad de ajustes se
determina si dicha variable sigue alguna distribución específica.

4. Análisis Descriptivo de Datos


4.1.Cálculos de la Variable Age
El Cuadro 1 indica que los datos obtenidos en el análisis estadístico de la variable Edad el mayor
porcentaje es de 27% que se encuentra en el intervalo entre [30 – 36) años, que representa la mayor
concentración de datos y un porcentaje de 3% entre el intervalo [66 – 78] que indica los usuarios de
edad avanzada. El primer cuartil de la variable Edad representa el 25% de las observaciones de la
muestra que toman valores menores o iguales a 32 años, el tercer cuartil indica que hasta el 75% de
las observaciones toman valores menores o iguales a 48 años

5
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

Cuadro 2.
Titulo
Cuadro
Estadística Descriptiva de1.
la Variable Balance
Título de  proyecto
Estadística Descriptiva de la Variable Age
Tabla de Frecuencias
“Balance”  
Tabla de Frecuencias
“Age”

Diagrama de cajas
"Balance"

Diagrama de cajas
"Age"

$ 0,00 $ 2.500,00 $ 5.000,00 $ 7.500,00 $ 10.000,00 $ 12.500,00 $ 15.000,00 $ 17.500,00


balance

Estadísticas Descriptivas
“Balance”
20 30 40 50 60 70 80

Estadísticas  Descriptivas
“Age”

4.2.Cálculos de la Variable Balance


El Cuadro 2 muestra que de los datos obtenidos en el análisis estadístico de la variable Balance
tiene un porcentaje de 71,5% entre el intervalo [0, 2000) siendo el intervalo con mayor
concentración de datos. El primer cuartil de la variable representa el 25% de las observaciones
de la muestra toman valores menores o iguales 122, el tercer cuartil indica que hasta el 75% de
las observaciones toman valores menores o iguales a 1803 dólares. El diagrama de cajas nos
indica que existen algunos valores aberrantes, es decir se encuentra demasiado alejados de
donde existe la mayor concentración de datos.

6
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

4.3.Cálculos de la Variable Loan

En el Cuadro 3 podemos observar el análisis descriptivo de la variable loan, la cual dice si los
usuarios cuentan con un préstamo bancario, con respecto a nuestra muestra podemos observar
que el 83.57% no cuenta con un préstamo mientras que el 16.43% si lo hace.

Cuadro 1.Titulo
Tabla de Frecuencias Estadística Descriptiva de la Variable Loan
“Loan”

Proporció
Loan
n
YES 0,164
NO 0,836
TOTAL 1,000

4.4.Cálculos de la Variable Housing


En el Cuadro 4 se aprecia la descripción de la variable Housing la cual dice si los usuarios
cuentan o no con una Hipoteca, como vemos el 47.86% de la muestra cuenta con una hipoteca,
mientras que el 52.14% no lo hace.

Cuadro 2.
Título
Estadística descriptiva de la variable Housing

Tabla de Frecuencias
‘’Housing’’

Housing Proporción
YES 0.4786
NO 0.5214

7
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

4.5.Cálculos de la Variable Education


En el Cuadro 5 se puede apreciar la descripción de la variable education la cual habla del nivel
académico de los usuarios estudiados (140 individuos), como vemos el 17,14% cuenta con la
primaria, el 47.14% con la secundaria, el 31,43% con la Universidad, y el 4,29% es
desconocido.

Cuadro 3.
Titulo
Estadistica descriptiva de la variable Educattion

Tabla de Frecuencia
‘Education’

Education Probabilidad
Primary 0.171
Secondary 0.471
Tertiary 0.314
Unknown 0.043
Toral 1,000

5. Análisis Estadístico Bivariado


5.1.Distribución conjunta Age-Loan
Tabla 3. Distribución conjunta Age vs. Loan

LOAN
MARG. AGE
NO YES
[20, 30] 13 4 17
[30, 40) 52 8 60
AGE

[40, 50) 24 7 31
[50, 60) 20 4 24
[60, 70) 6 0 6
[70, 80] 2 0 2
MARG. LOAN 117 23 140

La Tabla 3 describe la distribución conjunta entre las variables Age y Loan, en donde Age describe
la edad de los usuarios en rangos de 10, mientras que la variable Loan dice si alguno de los
usuarios posee algún préstamo bancario. Las marginales hablan de la proporción de personas que
cumplen con la condición de la marginal estudiada, como vemos 117 de las 140 personas de la
muestra no poseen un préstamo, mientras que 23 de 40 si lo posee, en el marginal de Age vemos el
numero de personas que hay por cada intervalo de edades.

Probabilidad condicional
8
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

f (age , loan)
f ( age|loan )=
f (loan)

Respecto al análisis condicional revisaremos las siguientes condiciones:

 Probabilidad de que los usuarios tengan menos de 40 años dado que hayan hecho un
préstamo:

12
f ( age< 40|loan= yes )= =0.52
23

Esto significa que el 52% de las personas que han hecho un préstamo tienen menos de 40
años.

 Probabilidad de que los usuarios tengan más de 40 años dado que hayan hecho un
préstamo:
11
f ( age> 40|loan= yes )= =0.48
23
Mientras que el 48% de las personas que hicieron un préstamo tienen más de 40 años.

 Probabilidad de que los usuarios tengan menos de 40 años dado que no hayan hecho un
préstamo:

65
f ( age< 40|loan=no ) = =0.56
117

El 56% de las personas que no han hecho un préstamo tienen menos de 40 años.

 Probabilidad de que los usuarios tengan más de 40 años dado que no hayan hecho un
préstamo:

52
f ( age> 40|loan=no ) = =0.44
117

El 44% de las personas que no han hecho un préstamo tienen más de 40 años.

Por lo tanto, podemos concluir que es más probable que las personas de menos de 40 años tengan
un préstamo bancario, teniendo en cuenta que solo el 16% de los usuarios han hecho préstamo,
además del 83,57% que no ha hecho un préstamo la mayoría, un 56% tienen menos de 40 años.

5.2.Distribución conjunta Balance-Education


Tabla 4. Distribución conjunta Balance vs Education

EDUCATION MAR.
primary secondary tertiary unknown BALANCE
BALANCE

[-2000,0) 7 5 5 3 20
[0,2000) 15 46 27 1 89
[2000,4000) 2 7 6 0 15
9
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

[40000,6000) 0 5 4 1 10
[6000,80000) 0 0 1 1 3
[8000,10000) 0 1 0 0 1
[10000,12000) 0 0 1 0 1
[12000,14000) 0 0 0 0 0
[14000,16000) 0 1 0 0 1
[16000,18000) 0 1 0 0 1
MAR. EDUCATION 24 66 44 6 140

En la Tabla 4 se observa la distribución conjunta de las variables Balance y Education, en donde


Balance dicta el rango de dinero que posee la persona en el banco, y Education dicta el nivel de
educación al que han llegado los usuarios, como vemos en el marginal de Age 24 de las 140
personas estudiadas han completado la primeria, 66 la secundaria, 44 el nivel terciario y de 6
personas no se conoce su nivel académico.

Probabilidad condicional
Respecto al análisis condicional revisaremos las siguientes condiciones:

 Probabilidad de tener un balance de menor/mayor $10000 dado que el usuario tiene solo
educación primaria:

24
f ( balance<10000|education= primary ) = =1
24

0
f ( balance>10000|education= primary ) = =0
24

Esto nos dice que el 100% de las personas que solo tienen educación primaria no superan
los $10000 en su balance, por lo que la probabilidad de superar $10000 teniendo solo la
educación primaria es nula.

 Probabilidad de tener un balance menor/mayor a $10000 dado que el usuario tiene


educación secundaria.

64
f ( balance<10000|education=secondary ) = =0.97
66

2
f ( balance>10000|education=secondary ) = =0.03
66

Mediante este análisis podemos concluir que el 3% de las personas que tienen educación
secundaria logran superar $10000 en su balance, mientras que el 97% no logran hacerlo.

 Probabilidad de tener un balance menor/mayor a $10000 dado que el usuario tiene


educación terciaria.

10
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

43
f ( balance<10000|education=tertiary )= =0.98
44

1
f ( balance>10000|education=tertiary )= =0.02
44

La probabilidad de superar un balance mayor de $10000 dado que el usuario ha llegado a la


educación terciaria es del 2% mientras que el 98% no logra superarlo.

 Probabilidad de tener un balance menor/mayor a $10000 dado que el usuario su educación


es desconocida.

6
f ( balance<10000|education=unknown )= =1
6

0
f ( balance>10000|education=unknown )= =0
6

La probabilidad de tener un balance mayor de $10000 dado que se desconoce la educación


del usuario es del 0%, mientras que tener un balance menor a 10000$ es del 1000%

6. Estadística Inferencial
6.1.Bondad de ajuste
 Variable: Balance

Cuadro 6
Perfil ideal para préstamo bancario.
Bondad de Ajuste para “Balance”
Supuestos Estadísticas Descriptivas

Medi Error estándar de Desviación Median Mod Sesg


ei ≥ 5 a la media Estándar a a o

1450 219 2587 448 0 -0.01


Contraste de Hipótesis Estadístico de Prueba Valor p

H0: Balance tiene una k


( oi−ei )2
distribución Uniforme vs.
H1: Balance no tiene una
∑ e 567,020 X 20.05,9=16.92 0,0001
i=1 i
distribución Uniforme

Tabla 5. Valores Observados y Valores Esperados de “Balance”

Contribución a
Clase Frecuencia observada Frecuencia Esperada
chi-cuadrada
1 9 7,6105 0,254

11
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

2 100 14,8287 489,195


3 15 16,0440 0,068
4 10 16,1757 2,358
5 2 2,4872 0,095
6 1 24,0163 22,058
7 1 20,3757 18,425
8 0 0,0015 0,001
9 1 16,6490 14,709
10 1 21,8114 19,857
Total 140 140 567,02

Gráfica 1. Valores Observados y Esperados de “Balance”

En el Cuadro 6 podemos observar un resumen de la prueba de hipótesis de bondad de ajuste para el


Balance, en donde se quiere verificar si dicha variable tiene una distribución uniforme, en la Tabla
5 se puede apreciar los valores observados y los valores esperados que arrojan la distribución
uniforme supuesta, el valor del nos arroja el Chi cuadrado es 567,02 en cual comparado con
estadístico de prueba Chi cuadrado con 9 grados de libertad es mucho mayor, además ya que el
valor p es menor que 0.05:

Rechazo H0 en favor de H1, por lo que el Balance no tiene una distribución Uniforme.

 Variable: Edad

12
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

Cuadro 7
Perfil ideal para préstamo bancario.
Bondad de Ajuste para “Edad”
Supuestos Estadísticas Descriptivas

Medi Error estándar Desviación Median Mod Sesg


a de la media Estándar a a o
ei ≥ 5
40,49
0,967 11,437 38 32 7,57
3
Contraste de Hipótesis Estadístico de Prueba Valor p

H0: Edad tiene una distribución k


( oi−ei )2
Uniforme vs.
H1: Edad no tiene una
∑ e 109,097 X 20.05,9=16.92 0,0001
i=1 i
distribución Uniforme

Tabla 6. Valores observados y esperado de "Edad"

Contribución a
Categoría Frecuencia Observada Frecuencia Esperada
chi-cuadrada
1 4 14,0 7,1429
2 13 14,0 0,0714
3 38 14,0 41,1429
4 35 14,0 31,5000
5 12 14,0 0,2857
6 15 14,0 0,0714
7 15 14,0 0,0714
8 4 7,0 1,2857
9 2 11,2 7,5571
10 2 23,8 19,9681
TOTAL 140 140 109,097

Gráfica 2. Valores Esperados y Observados de “Edad”

13
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

En el Cuadro 7 podemos observar un resumen de la prueba de hipótesis de bondad de ajuste para la


Edad, en donde se quiere verificar si dicha variable tiene una distribución uniforme, en la Tabla 6
se puede apreciar los valores observados y los valores esperados que arrojan la distribución
uniforme supuesta, el valor del nos arroja el Chi cuadrado es 109,09 el cual comparado con
estadístico de prueba Chi cuadrado con 9 grados de libertad es mucho mayor, además ya que el
valor p es menor que 0.05:

Rechazo H0 en favor de H1, por lo que el Edad no tiene una distribución Uniforme.

6.2.Prueba de hipótesis e intervalos de confianza


Prueba de Hipótesis para la Media
Media NC=95%

Cuadro 8
Perfil ideal para préstamo bancario.
Prueba de Hipótesis para una Media de la variable “edad”.
Supuestos Estadísticas Descriptivas
Muestra Grande. Media Error Estándar Desviación Sesgo Mediana Moda
La media de edad de personas de la Media Estándar
con préstamos hipotecarios es 39,00 1,132 9,674 7,57 37,000 32
de 37 años.
0
Contraste de Hipótesis Estadístico de Prueba Valor p
H0:  = 37 vs. H1: ¿ 37 x́−μ0 z=¿ 1.76 [ P( z >1.76) ]=0.0392
z=
s
√n
Intervalo de Confianza

s s 37,143< μ< 40,856


x́−z 0.05 ≤ μ ≤ x́ + z 0.05
√n √n

En el Cuadro 8 se observa la prueba de hipótesis para una Media de la variable “Edad” en donde se
ha supuesto una muestra grande mayor a 30 individuos, nuestra Hipótesis se basa en que la madia
es mayor a 37, la cual mediante el estadístico de prueba hemos logrado definir que se rechaza H0
en favor de H1, por lo que la media de Edad es mayor a 37 años.

14
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

Cuadro 9
Perfil ideal para préstamo bancario.
Prueba de Hipótesis para una Media de la variable “balance”.

Supuestos Estadísticas Descriptivas


Media Error Estándar Desviación Sesgo Mediana Moda
Muestra Grande.
de la Media Estándar
La media del balance de las
personas con estudios de tercer 1670 359,853 2387 -0,01 660,50 0
nivel es mayor a 1500. 0
Contraste de Hipótesis Estadístico de Prueba Valor p
x́−μ0
z=
s z=¿ 0,47 [ P( z >0,47)] =0.3192
H0:  = 1500 vs.
H1: ¿ 1500
√n
Intervalo de Confianza
s s
x́−z 0.05 ≤ μ ≤ x́ + z 0.05 1080< μ<2260
√n √n

En el Cuadro 9 se observa la prueba de hipótesis para una Media de la variable “Balance” en donde
se ha supuesto una muestra grande mayor a 30 individuos, nuestra Hipótesis se basa en que la
madia es mayor a 1500, la cual mediante el estadístico de prueba hemos logrado definir que No se
rechaza H0, por lo que la media de Balance es igual a $1500

Prueba de Hipótesis para la Varianza


Varianza NC=95%

Cuadro 10
Perfil ideal para préstamo bancario.
Prueba de Hipótesis para Varianza de la variable “edad”.

Supuestos Estadísticas Descriptivas


Media Error Estándar Desviación Sesgo Mediana Moda
Muestra pequeña n=23
de la Media Estándar
La desviación estándar de la
edad de personas con algún 38,34 2,036 9,764 7,57 37 41
tipo de préstamo es 8 años. 0
Contraste de Hipótesis Estadístico de Prueba Valor p
2
(n−1) s
χ 2= χ 2gl=(n−1) χ 2gl: 22= 32,77 2(0,05)=0,1
H0: σ 2 = 64
σ2
vs Intervalo de Confianza
H1: σ 2 ≠ 64 2
^2
(n−1) ^s 2 ( n−1) s
≤ σ ≤
χ 2∝ χ2 ∝ 56,994< σ 2 <191,019
1−
2 2

En el Cuadro 10 se observa la prueba de hipótesis para la varianza de la variable “Edad” en donde


se ha supuesto una muestra menor a 30 individuos, nuestra Hipótesis se basa en que la varianza es
diferente a 64, la cual mediante el estadístico de prueba hemos logrado definir que No rechazo H0
dado que 0,1 es mayor a 0,05, por lo que la varianza de las personas con préstamo es de 64.

15
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

Cuadro 11
Perfil ideal para préstamo bancario.
Prueba de Hipótesis para Varianza de la variable “edad”

Supuestos Estadísticas Descriptivas


Muestra grande n=73 Media Error Estándar Desviación Sesgo Mediana Moda
La desviación estándar de la de la Media Estándar
edad de personas con
39,00 1,132 9,674 7,57 37 32
préstamo hipotecario es 8
años. 0
Contraste de Hipótesis Estadístico de Prueba Valor p
2
(n−1) s
χ 2= χ 2gl=(n−1) χ 2gl: 72= 105,28 0,01
H0: σ 2 = 64
σ2
vs Intervalo de Confianza
H1: σ 2>¿ 64 2
^2
(n−1) ^s 2 ( n−1) s
≤ σ ≤
χ 2∝ χ2 ∝ 67,382<σ 2<¿ 134,764
1−
2 2

En el Cuadro 11 se observa la prueba de hipótesis para la varianza de la variable “Edad” en donde


se ha supuesto una muestra menor a 30 individuos, nuestra Hipótesis se basa en que la varianza es
mayor a 64, la cual mediante el estadístico de prueba hemos logrado definir que rechazo H0 en
favor de H1, por lo que la varianza de la edad de las personas con préstamo hipotecario es mayor a
64.

Prueba de Hipótesis para la Proporción


Proporción NC=95%

Cuadro 12
Perfil ideal para préstamo bancario.
Prueba de Hipótesis para una Proporción de la variable “Housing”
Supuestos Estadísticas Descriptivas
El 60% de las personas con Proporció Tamaño de la Moda
estudios secundarios tiene n muestra
balance menor a 1000 0,68 66 Yes
dólares.
Contraste de Hipótesis Estadístico de Prueba Valor p
x
− po
n
z= z=¿1,32 2(0,092) =0,184
H0: p = 60% po (1−p o )
H1:
vs
p ≠ 60% √n
Intervalo de Confianza
p^ q^
p= ^p ± z ∝
2 √ n
0,567< p< 0,792

En el Cuadro 12 se observa la prueba de hipótesis para la proporción de la variable “Housing” en


donde se ha supuesto que el 60% de las personas con estudios secundarios tiene un balance menor
16
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

a 100000 dólares, nuestra Hipótesis se basa en que la proporción de “Housing” es diferente al 60%,
la cual mediante el estadístico de prueba hemos logrado definir que no se rechaza H0, por lo que la
proporción de la variable Housing es del 60%.

Cuadro 13
Análisis Estadístico De Personas Mayores A 25 Años Con Préstamos Bancarios En Portugal
Prueba de Hipótesis para una Proporción de la variable “Edad”
Supuestos Estadísticas Descriptivas
El 55% de las personas
Proporció Tamaño de la
mayores a 40 años que
n muestra
tienen estudios secundarios
no tienen préstamos 0,607 28
hipotecarios
Contraste de Hipótesis Estadístico de Prueba Valor p
x
− po
n
z= z=0,606 0,255
H0: p=55 % po (1−p o )
H1:
vs
p>55 % √ n
Intervalo de Confianza
p^ q^
p= ^p ± z ∝
2 √ n
En el Cuadro 13 se observa la prueba de hipótesis para la proporción de la variable “Edad” en
0,426< p< 0,789

donde se ha supuesto el 55% de las personas mayor a 40 años que tienen estudios secundarios no
tienen prestamos hipotecarios, nuestra Hipótesis se basa en que la proporción es mayor al 50%, la
cual mediante el estadístico de prueba hemos logrado definir no se rechaza H0, por lo que la
proporción de la variable edad es del 55%

Prueba de Hipótesis para la Diferencia de Medias


Considerando que no = 1 y yes = 2
La media del balance de personas con estudios secundarios es igual a la media de personas con
estudios de tercer nivel.

17
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

Cuadro 14
Perfil ideal para préstamo bancario.
Prueba de Hipótesis para Diferencia de Medias.
Supuestos Estadísticas Descriptivas
Muestras Grandes Media Error Estándar Desviación Sesgo Mediana Moda
de la Media Estándar
n1 =44 1670,25 359,854 2387,45 0 660,50 0
1600,76 371,121 3015,27 0 436,0 0
n2 =66
Contraste de Hipótesis Estadístico de Prueba Valor p
H0: μ1−μ 2=0 x́ 1− x́ 2 Z=0,13 2(0,4483) =0,8966
vs z=
s 1 2 s 22
H1: μ1−μ 2 ≠ 0
√( n1 n2
+ ) Intervalo de Confianza
2 −943.849< μ1 −μ2< 1082,82
s 22
x́ 1− x´2 ± z ∝
2 √( s1
+
n1 n2 )
En el Cuadro 14 se observa la prueba de hipótesis para la diferencia de Medias entre la media del
balance de personas con estudios secundarios es igual a la media del balance de personas con
estudios de tercer nivel, en donde se ha supuesto dos muestras grandes, nuestra Hipótesis se basa
en que la diferencia de medias es diferente a cero, la cual mediante el estadístico de prueba hemos
logrado definir que no se rechaza dado que el valor p está muy por encima de 0,05, por lo que la
diferencia entre la media de edad de personas con educación de tercer nivel y secundaria, con
préstamo hipotecario es igual a cero.

Cuadro 15
Perfil ideal para préstamo bancario.
Prueba de Hipótesis para Diferencia de Medias.
Supuestos Estadísticas Descriptivas
Muestra grande y muestra Media Error Estándar Desviación Sesgo Mediana Moda
pequeña de la Media Estándar
n1 =33 38,57 1,69 10,00 0 36,00 32
n2 =22 37,41 1,71 8,03 0 35,50 32

Contraste de Hipótesis Estadístico de Prueba Valor p


H0: μ1−μ 2=0 x´1− x́ 2 t 53=¿0,1 2(0,45) =0,9
vs t=
H1: μ1−μ 2 ≠ 0 sp
(√ n1 + n1 )
1 2
Intervalo de Confianza
2 -3,625¿ μ1−μ2 <¿ 5,945
s 22
x́ 1− x´2 ± z ∝
2 √( s
+ 1
n1 n2 )
En el Cuadro 15 se observa la prueba de hipótesis para la diferencia de Medias entre la media de la
edad de personas con préstamo hipotecario es igual a la media de la edad de personas sin préstamo
hipotecario, en donde se ha supuesto una muestra grande y una pequeña, nuestra Hipótesis se basa
en que la diferencia de medias es diferente a cero, la cual mediante el estadístico de prueba hemos
logrado definir que no se rechaza dado que dado el valor p no se rechaza H0, por lo que la media de
18
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

la edad de personas con préstamo hipotecario es igual a la media de la edad de personas sin
préstamo hipotecario

Prueba de Hipótesis para Igualdad de Varianza


En el cuadro 16 se estudia si la varianza del balance entre las personas sin crédito hipotecario es
igual al de las personas con crédito hipotecario.
Cuadro 16
Análisis Estadístico De Personas Mayores A 25 Años Con Préstamos Bancarios En Portugal
Prueba de Hipótesis para Igualdad de Varianzas.
Supuestos Estadísticas Descriptivas
Muestras grandes Media Error Estándar
de la Media
Desviación
Estándar
Sesgo Mediana Moda

1647 366 2996 505 0


1268 252 2150 427 0

Contraste de Hipótesis Estadístico de Prueba Valor p


2
σ =σ
H0: 1
2
2
2
S^ / σ
1
2
1
F=1,942 0,002

vs F= 2 2
2 2 S^ / σ
2 2
H1: σ 1 ≠ σ 2
Intervalo de Confianza
S^ 21 / S^ 22 σ 21 S^ 21 / S^ 22 σ 21
≤ ≤ 1,294< <1,705
F ∝ σ 22 F ∝ σ 22
1−
2 2

Según los resultados del estudio y dado el valor se rechaza H0 en favor de H1


En el cuadro 17 se estudia si la varianza de la edad de las personas sin prestamos (loan) es igual a
aquellas con préstamos (loan).
Cuadro 17
Perfil ideal para préstamo bancario.
Prueba de Hipótesis para Igualdad de Varianzas.
Supuestos Estadísticas Descriptivas
Muestras grandes Media Error Estándar Desviación Sesgo Mediana Moda
de la Media Estándar

40,91 1,08 11,73 38,0 32


38,35 2,04 9,76 37,0 41

Contraste de Hipótesis Estadístico de Prueba Valor p


2
H0:σ 1 =σ 2
2
S^ 21 / σ 21 F=1,44 0,025

vs F= 2 2
2 2 S^ 2 / σ 2
H1: σ 1 ≠ σ 2

Intervalo de Confianza
S^ 21 / S^ 22 σ 21 S^ 21 / S^ 22 σ 21
≤ ≤ 1,120< 2 < 2,618
F ∝ σ 22 F ∝ σ2
1−
2 2

Por lo que según el estudio y dado el valor se rechaza H0 en favor de H1, por lo que las varianzas
son diferentes.
19
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

7. Análisis de contingencia
7.1.Prueba de independencia entre Balance y Education

Tabla 7. Tabla de Contingencia entre Balance y Education

EDUCATION
TOTAL
Primaria Secundaria Superior Desconocida
[-2000,0) 7 5 5 3 20
[0,2000) 15 46 27 1 89
[2000,4000) 2 7 6 0 15
[40000,6000) 0 5 4 1 10
BALANCE

[6000,80000) 0 0 1 1 2
[8000,10000) 0 1 0 0 1
[10000,12000) 0 0 1 0 1
[12000,14000) 0 0 0 0 0
[14000,16000) 0 1 0 0 1
[16000,18000) 0 1 0 0 1
TOTAL 24 66 44 6 140

Cuadro 18
Perfil ideal para préstamo bancario.
Prueba de Hipótesis Chi-Cuadrado para la relación Balance-Educación.
Contraste de Hipótesis Estadístico de Prueba Valor x 2α ;(r−1)(k−1 )
H0: Balance y r k
n ij −eij z=34,576 2
x 0.05; (9−1) ( 4−1)=36,42
Educación son
independientes
vs.
z=∑ ∑
i=1 j=1
[ e ij ]
H1: H0

Por lo tanto, según el Cuadro 18 en donde se deseaba verificar si Balance y educación son
independientes, dado el valor del estadístico de prueba se concluye que Balance y Educación no
son independientes.

7.2.Prueba de independencia para Edad y Loan


Tabla 8. Tabla de contingencia entre Age y Loan

LOAN
TOTAL
NO YES
[20, 30] 13 4 17
[30, 40) 52 8 60
[40, 50) 24 7 31
AGE

[50, 60) 20 4 24
[60, 70) 6 0 6
[70, 80] 2 0 2

20
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

TOTAL 117 23 140

Cuadro 19
Perfil ideal para préstamo bancario.
Prueba de Hipótesis Chi-Cuadrado para la relación Edad-Loan.
Contraste de Hipótesis Estadístico de Prueba Valor x 2α ;(r−1)(k−1 )
H0: Edad y Loan son r k
n ij −eij z=3,471 x 20.05; (6−1) (2−1 )=3,471
independientes
vs.
H1 : H0
z=∑ ∑
i=1 j=1
[ e ij ]

Por lo tanto, según el Cuadro 19 en donde se desea verificar si Edad y Loan son independiente,
dado el valor del estadístico de prueba se concluye que Age y Loan no son independientes.

8. CONLUSIONES

Haciendo uso de la teoría de muestreo simple se logró determinar que una muestra de 140
individuos estima el comportamiento de la población con una seguridad del 95%.
El presente proyecto se desarrolló bajo el estudio de una población conformada por los clientes de
una entidad bancaria. Para efectos prácticos se tomó una muestra que represente el comportamiento
de la población y se analizaron aspectos como edad, nivel de educación, balance bancario, entre
otros. Tras aplicar conceptos estadísticos sobre la muestra seleccionada y sus características de
interés llegamos a las siguientes conclusiones:

9. REFERENCIAS BIBLIOGRÁFICAS Y ELECTRÓNICAS

18, M. (s.f.). https://support.minitab.com/es-mx/minitab/18/.


Herrera, G. Z. (2010). Probabilidad y Estadística, Fundamentos y Aplicaciones (Segunda ed.).
Guayaquil, Guayas, Ecuador: ESPOL.
Ojeda, L. R. (2007). Probabilidad y Estadística Básica para Ingenieros. Guayaquil, Ecuador:
ESPOL.

21
Proyecto de Estadística
Paralelo 7
Abifandi Ilenia, Castillo Andrea, Chinga Luis, Soriano Miguel, Verdezoto Steeven
Proyecto de Clase

10. ANEXOS

22
Proyecto de Estadística
Paralelo 7