Está en la página 1de 15

1. El gerente de una empresa dice que el saldo promedio de sus tarjetas de crédito es de $500.

¿Cree usted que esta afirmación está justificada? Utilice una prueba t de una muestra para
sacar su conclusión.

Sí, el saldo promedio de sus tarjetas de crédito es de $500. Por tanto, la afirmación está
justificada. Se concluye basándose en la prueba t de una muestra.

Explicación :
Hipótesis nula: el saldo promedio de la tarjeta de crédito es de $500
Hipótesis alternativa: el saldo promedio de la tarjeta de crédito no es de $500

Prueba t: dos muestras asumiendo varianzas


desiguales

Balance
Significar 520.015
Diferencia 211378.2253
Observaciones 400
Media hipotética 500
df 399
t estadística 0.870673781
P(T<=t) una cola 0.192227914
t Crítico de una cola 1.648681534
P(T<=t) dos colas 0.384455827
t Crítico de dos colas 1.965927296

Como el valor P de una prueba de cola es mayor que nuestro nivel de significancia 0,05,
la hipótesis nula no puede rechazarse, es decir, el saldo promedio de la tarjeta de crédito
es de $500.

2. ¿Existe diferencia entre hombres y mujeres en cuanto al saldo medio? Utilice una prueba t
de dos muestras para sacar su conclusión.
No existe una diferencia significativa entre hombres y mujeres en cuanto al saldo medio
se refiere.
Explicación :
Hipótesis nula: el saldo promedio de la tarjeta de crédito para hombres y mujeres no tiene
diferencia.
Hipótesis alternativa: El saldo promedio de las tarjetas de crédito para hombres y mujeres es
diferente.

t-Test: Two-Sample Assuming Unequal Variances

Men Women
Mean 509.8031088 529.5362
Variance 213554.5652 210187.1
Observations 193 207
Hypothesized Mean Difference 0
df 396
t Stat -0.42838443
P(T<=t) one-tail 0.334302083
t Critical one-tail 1.648710601
P(T<=t) two-tail 0.668604165
t Critical two-tail 1.965972608

No se puede rechazar la hipótesis nula µ1 es igual a µ2


Por tanto, el saldo medio de hombres y mujeres no tiene diferencias significativas, es
decir, es el mismo.

3. ¿Existe diferencia entre estudiantes y no estudiantes en cuanto al saldo medio? Utilice una
prueba t de dos muestras para sacar su conclusión.

Sí, existe una diferencia significativa entre estudiantes y no estudiantes en lo que


respecta al saldo promedio.
Explicación :
Hipótesis nula: El saldo promedio de la tarjeta de crédito para estudiantes y no estudiantes
no tiene diferencia.
Hipótesis alternativa: el saldo promedio de la tarjeta de crédito para estudiantes y no
estudiantes es diferente.
Como el valor P de la prueba de dos colas es menor que nuestro nivel de significancia de
0,05, se puede rechazar la hipótesis nula, es decir, el saldo promedio de la tarjeta de crédito es
diferente para estudiantes y no estudiantes.

4. Generalmente se supone que si hay más tarjetas de crédito, el saldo de las mismas será
mayor. Según este conjunto de datos, ¿crees que esto es cierto? Calcula un coeficiente de
correlación y muestra un diagrama de dispersión para respaldar tu respuesta.
No, esto no es cierto. No existe correlación entre ellos. El coeficiente de correlación es
muy menor .

Coeficiente de correlación:
Cards Balance
Cards 1
Balance 0.086456 1

El coeficiente de correlación es casi igual a cero, lo que implica que no existe relación entre
el número de tarjetas y el saldo de las mismas.
Gráfico de dispersión:
Los valores caen dispersos y no siguen la línea de tendencia, la correlación es muy menor.

5. Examinar si las siguientes variables demográficas influyen en el equilibrio: (a) edad, (b)
años de educación, (c) estado civil. Para la edad y los años de educación, utilice diagramas de
dispersión para representar su relación con el equilibrio y calcular el coeficiente de
correlación. Para la relación entre estado civil y equilibrio, utilice una prueba t de dos
muestras para sacar su conclusión
Las variables demográficas edad, años de educación, estatus marcial no influyen en el
saldo crediticio.
5a y 5b
Coeficiente de correlación:
Age Education Balance
Age 1
Education 0.003619 1
Balance 0.001835 -0.00806 1

El coeficiente de correlación es casi igual a cero, lo que implica que no existe relación
entre la edad y la educación en el saldo crediticio.

Gráfico de dispersión:
Está claro que la tendencia no muestra correlación, por lo que el saldo crediticio no
depende de estas variables.

5c.
Hipótesis nula: el saldo promedio de la tarjeta de crédito para solteros y casados es el
mismo.
Hipótesis alternativa: El saldo promedio de la tarjeta de crédito para solteros y casados
es diferente.

t-Test: Two-Sample Assuming Unequal Variances

Single Married
Mean 523.2903226 517.9429
Variance 221735.0385 205696.7
Observations 155 245
Hypothesized Mean Difference
0
df 319
t Stat 0.112233601
P(T<=t) one-tail0.455354389
t Critical one-tail
1.649644319
P(T<=t) two-tail0.910708777
t Critical two-tail
1.967428387

El valor p es mayor, por lo que la hipótesis es nula, por lo que no se puede rechazar, lo
que significa que no hay cambios significativos debido al estado civil.
6 . El origen étnico del titular de la tarjeta no importa en lo que respecta al saldo”. Realizar un
análisis de varianza (ANOVA) y discutir si esta afirmación está respaldada por los datos o no.
Hipótesis nula: el origen étnico del titular de la tarjeta no importa en lo que respecta al saldo,
es decir, el mismo
Hipótesis alternativa: el origen étnico del titular de la tarjeta es importante en lo que
respecta al saldo

Según ANOVA, está claro que el valor de P es mayor que 0,05, por lo que el origen étnico no
tiene ningún impacto en el equilibrio.

Anova: Single Factor

SUMMARY
Groups Count Sum Average Variance
African American 99 52569 531 235839.2
Asian 102 52256 512.3137 231748.3
Caucasian 199 103181 518.4975 190922.4

ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 18454.20047 2 9227.1 0.043443 0.957492 3.018452
Within Groups 84321457.71 397 212396.6

Total 84339911.91 399

7. Un principio general que suelen seguir las compañías de tarjetas de crédito es asignar un
límite de crédito más alto a las personas con una calificación crediticia más alta. ¿Muestran
los datos que se está siguiendo este principio?
Sí, se sigue este principio.

Coeficiente de correlación:
Limit Rating
Limit 1
Rating 0.99688 1

Tiene un buen acuerdo.


Gráfico de dispersión :

Lo que suelen seguir las compañías de tarjetas de crédito es asignar un límite de crédito
más alto a las personas con una calificación crediticia más alta, como en nuestro caso.
Se justifica en base a la correlación.

8. Ejecute una regresión lineal simple del saldo del límite de crédito. (Aquí el límite de
crédito es la X y el saldo es la Y). Informe los coeficientes y el R cuadrado. Muestra un
diagrama de dispersión.

Regresión lineal simple :


SUMMARY OUTPUT

Regression Statistics
Multiple R 0.861697
R Square 0.742522
Adjusted R Square 0.741875
Standard Error 233.585
Observations 400

ANOVA
df SS MS F Significance F
Regression 1 62624255 62624255 1147.764 2.5E-119
Residual 398 21715657 54561.95
Total 399 84339912

Coefficients
Standard Error t Stat P-value Lower 95%Upper 95%Lower 95.0%
Upper 95.0%
Intercept -292.79 26.68341 -10.9728 1.18E-24 -345.249 -240.332 -345.249 -240.332
Credit Limit 0.171637 0.005066 33.87867 2.5E-119 0.161677 0.181597 0.161677 0.181597

Gráfico de dispersión :

El límite de crédito es un predictor importante. Tiene una correlación decente, es decir, R 2 =


0,74
9. Ejecute una regresión lineal simple del saldo (Y) sobre la calificación crediticia (X).
Informe los coeficientes y R cuadrado. Mostrar un diagrama de dispersión
Regresión lineal simple :
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.863625161
R Square 0.745848418
Adjusted R Square 0.745209846
Standard Error 232.0713048
Observations 400

ANOVA
df SS MS F Significance F
Regression 1 62904789.88 62904790 1167.994581 1.8989E-120
Residual 398 21435122.03 53857.09
Total 399 84339911.91

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0%Upper 95.0%
Intercept -390.8463418 29.06851463 -13.4457 3.07318E-34 -447.993365 -333.6993186 -447.993365 -333.699
Credit Rating(X) 2.566240327 0.075089102 34.17594 1.8989E-120 2.418619483 2.713861171 2.418619483 2.713861

Gráfico de dispersión :

Sí, la calificación crediticia influye en el saldo crediticio. Tiene una correlación decente.

10. Considere sus hallazgos en las preguntas 8 y 9. Discutir mecanismos comerciales para
aumentar o disminuir el saldo de las tarjetas de crédito. Intenta cuantificar tus respuestas.
 Está claro que la calificación y el límite de crédito de la tarjeta de crédito tienen un
impacto significativo en el saldo de la tarjeta de crédito. Ambos tienen buena
correlación. Ambos son un predictor importante del saldo de la tarjeta de crédito. El
saldo es alto para aquellos que tienen una calificación crediticia y un límite de crédito
altos. Tanto la calificación como el límite son predictores importantes del equilibrio.

 Se puede aumentar el saldo de las personas con calificación más alta y límite de
crédito más alto, mientras que el saldo de las personas con calificación más baja y
límite de crédito más bajo debe disminuirse (según este análisis).

11. El límite de crédito se proporciona como un monto consolidado para todas las tarjetas de
crédito que tenga el titular de la tarjeta. Ejecute una regresión lineal múltiple del Saldo (Y) en
Límite y Tarjetas como dos variables X. Informe los coeficientes. Analice el efecto sobre el
saldo de (a) aumentar el límite de crédito en el mismo número de tarjetas y (b) aumentar el
número de tarjetas sin alterar el límite de crédito total.
Regresión lineal múltiple:
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.865188295
R Square 0.748550786
Adjusted R Square 0.74728404
Standard Error 231.1247525
Observations 400

ANOVA
df SS MS F Significance F
Regression 2 63132707.37 31566354 590.9238 9.8E-120
Residual 397 21207204.54 53418.65
Total 399 84339911.91

Coefficients Standard Error t Stat P-value Lower 95%Upper 95%Lower 95.0%


Upper 95.0%
Intercept -369.0359554 36.16414657 -10.2045 7.23E-22 -440.133 -297.939 -440.133 -297.939
Credit Limit 0.171479037 0.005013136 34.20594 2E-120 0.161623 0.181335 0.161623 0.181335
Cards 26.03375427 8.438363509 3.085166 0.002177 9.444291 42.62322 9.444291 42.62322

El límite de crédito y el número de tarjetas son un predictor importante del saldo de crédito y
ambos tienen un mayor impacto en el saldo.
Coeficiente de correlación = 0,865 y R-cuadrado = 0,748
El aumento en una sola unidad ($) del límite de crédito con la misma tarjeta aumentará 0.17
del saldo. (El límite de crédito se mide en una escala más amplia en comparación con las
tarjetas y tiene 34,2 como error estándar).
El aumento en una tarjeta aumentará 26.03 en el saldo. Es decir, el aumento en la tarjeta
aumenta el saldo.
12. Ejecute una ecuación de regresión lineal simple con Ingreso como X y Saldo como Y.
Informe los coeficientes. ¿El coeficiente de ingreso es significativamente diferente de cero?
¿Qué dice esto sobre el efecto del ingreso en el equilibrio?

Balance(y) y = 6.0484x + 246.51


R² = 0.215
2500

2000
SUMMARY OUTPUT
1500
Regression Statistics
Multiple R 0.463656457
1000
R Square 0.21497731
Adjusted R Square 0.213004891
500
Standard Error 407.8647195
Observations 400
0
0 50 100 150 200
ANOVA
df SS MS F Significance F
Regression 1 18131167.4 18131167 108.9917152 1.03089E-22
Residual 398 66208744.51 166353.6
Total 399 84339911.91

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 246.5147506 33.19934735 7.425289 6.90344E-13 181.2467485 311.7827527 181.2467485 311.7827527
Income 6.048363409 0.579350163 10.43991 1.03089E-22 4.909394402 7.187332415 4.909394402 7.187332415

Ingreso Saldo(año)
Ingreso 1
Saldo(año) 0.46365645 1
7

Coeficiente de correlación para las dos variables =0,46


Basado en el coeficiente de regresión del ingreso es 6,048. Sí; está muy lejos de cero, toma el
valor de 4,90 a 7,18. Agregar una unidad de ingreso aumentará el saldo 6,04 más y es un
predictor significativo. Según la escala, al verlo t - stat, hay un error estándar de 10,4 lejos de
cero.

13. Con base en la ecuación derivada de la pregunta 12, ¿cuál es el saldo estimado para una
persona con un ingreso de USD 100 mil al año?
Balance(y)
2500

2000

1500
f(x) = 6.04836340853157 x + 246.514750591403
R² = 0.214977310132406
1000

500

0
0 20 40 60 80 100 120 140 160 180 200

Basado en la ecuación derivada Y = 6.0484 (X)+246.51


X= Ingresos
Y = 6,0484(100) + 246,51
Saldo estimado para una persona con un ingreso de USD 100k al año= $ 851,35.

14.Con base en el conjunto de datos, explore la relación entre el saldo de la tarjeta de crédito
(Y) y (a) Ingresos (b) Edad (c) Educación (c) Límite y (d) Calificación como X variables.
Estimar un modelo de regresión lineal múltiple e informar la significancia estadística de cada
una de estas variables.

Modelo de regresión múltiple:


SUMMARY OUTPUT

Regression Statistics
Multiple R 0.936702578
R Square 0.87741172
Adjusted R Square
0.875856031
Standard Error
161.9917647
Observations 400

ANOVA
df SS MS F Significance F
Regression 5 74000827.17 14800165.43 564.0020686 4.5908E-177
Residual 394 10339084.74 26241.33183
Total 399 84339911.91

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%Lower 95.0%
Upper 95.0%
Intercept -473.2514026 55.10833546 -8.587655545 2.08837E-16 -581.5945666 -364.908 -581.595 -364.908
Income -7.608832003 0.381931562 -19.92197755 1.37077E-61 -8.359710677 -6.85795 -8.35971 -6.85795
Limit 0.07901642 0.044791005 1.764113581 0.078487737 -0.009042839 0.167076 -0.00904 0.167076
Rating 2.773843725 0.667079559 4.158190261 3.93909E-05 1.462363177 4.085324 1.462363 4.085324
Age -0.860030445 0.478700493 -1.796594023 0.073165937 -1.801157147 0.081096 -1.80116 0.081096
Education 1.967791521 2.605290902 0.755305874 0.450516748 -3.154218733 7.089802 -3.15422 7.089802

Income Limit Rating Age Education Balance


Income 1
Limit 0.792088 1
Rating 0.791378 0.99688 1
Age 0.175338 0.100888 0.103165 1
Education -0.02769 -0.02355 -0.03014 0.003619 1
Balance 0.463656 0.861697 0.863625 0.001835 -0.00806 1
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.93547739
R Square 0.875117948
Adjusted R Square 0.874488819
Standard Error 162.8813393
Observations 400

ANOVA
df SS MS F Significance F
Regression 2 73807370.62 36903685.31 1390.999823 4.5212E-180
Residual 397 10532541.29 26530.33071
Total 399 84339911.91

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept -534.8121502 21.60269845 -24.75672896 1.66359E-82 -577.2821357 -492.3421648 -577.282136 -492.3421648
Income -7.672124366 0.378462026 -20.2718472 3.1071E-63 -8.416164597 -6.928084134 -8.4161646 -6.928084134
Rating 3.949264832 0.086209035 45.81033566 1.4482E-160 3.77978154 4.118748125 3.77978154 4.118748125

Explicación :
 Según el análisis de regresión múltiple, queda claro que los ingresos y la calificación
son los dos predictores estadísticamente significativos según el valor p.
 Todas estas variables, es decir, ingresos, educación, edad, límite y calificación, juntas
han contribuido al 87,7% de la variación en el saldo de las tarjetas de crédito.
 Pero para comprender si estas variables también han contribuido (sólo algunas han
contribuido a la variación del equilibrio), se conservan los análisis con valores P
aceptables.
 Entonces, manteniendo las X con valor p bajo, es decir, digamos solo con ingresos y
calificación , se realizó nuevamente el análisis de regresión.
 En esta regresión, el análisis con estas dos variables arrojó una variación del 87,5% en
el saldo de las tarjetas de crédito.
 Que es casi el mismo valor de r cuadrado que el anterior.
 En base a eso, está muy claro que los ingresos y la calificación son los dos predictores
importantes .
 También se estudian los errores (residuales) y el patrón.
 Al centrarse en los residuos de ingresos, se ve que más valores están en el lado
negativo y específicamente más grupos de ingresos más bajos y la línea de ajuste
tampoco es lineal.
 Los residuos de calificación mostraron un lado positivo para calificaciones más bajas
y más altas, mientras que mostraron calificaciones negativas para otras calificaciones
típicas, donde la línea de ajuste de calificaciones es decente.
Observaciones finales,
 El ingreso y la calificación son las dos variables importantes que contribuyen
al cambio en el equilibrio, mientras que el límite, la edad y la educación no
son variables significativas para el equilibrio.

También podría gustarte