Está en la página 1de 6

Ejercicio de repaso

En una compañía de seguros de vida están interesados en predecir la longevidad de


sus clientes, debido a que su compensación y sus beneficios dependen de esta
variable. Un actuario de una compañía de seguros obtuvo datos de 100 clientes
hombres que murieron recientemente. Se obtuvieron los registros de la edad de
muerte del cliente, las edades de muerte de su padre y madre, y también la edad
media de muerte de sus abuelos y abuelas. Un cero en la variable fumador indica
que la persona no fumaba y un uno significa que se trataba de un fumador
considerable.

Longevidad Madre Padre Abuelas Abuelos Fumador


80 85 78 72 71 0
73 88 63 76 66 1
70 66 75 67 57 1
72 72 67 68 55 1
79 88 73 64 73 0
83 90 72 74 62 0
70 67 65 70 59 1
72 76 71 74 61 1
72 66 75 71 63 1
71 78 64 76 61 1
67 69 66 61 69 1
74 71 76 73 60 0
80 74 77 69 68 0
63 68 66 67 67 1
71 70 70 71 67 1
66 64 66 63 57 1
74 82 71 75 65 0
71 71 71 68 62 1
65 75 60 63 62 1
74 76 66 66 69 0
66 69 68 61 65 1
71 76 67 63 71 1
73 69 80 64 61 1
74 79 70 77 60 0
68 74 62 59 63 1
77 81 78 73 62 0
77 85 69 80 65 0
74 77 69 75 69 1
68 72 71 72 66 1
68 75 63 65 65 1
74 82 66 72 62 0
71 73 72 68 71 1
80 84 73 77 68 0
72 75 61 77 61 1
77 82 76 71 63 0
76 88 69 75 67 0
62 65 57 68 57 1
70 75 57 67 57 1
71 72 67 67 64 1
69 72 63 68 67 1
73 79 71 74 65 1
72 77 69 72 65 1
84 80 90 72 71 0
73 76 74 69 65 1
70 78 70 78 54 1
78 75 74 58 70 0
82 83 78 77 65 0
77 75 66 72 60 0
67 68 69 73 62 1
72 69 72 69 68 1
67 67 67 72 66 1
72 78 64 67 66 1
75 73 69 71 61 0
72 71 66 68 68 1
75 73 73 66 59 0
80 84 75 71 74 0
72 78 64 66 61 1
71 76 61 74 61 1
71 77 70 73 61 1
89 86 77 74 69 0
74 79 71 70 77 0
72 72 77 71 68 1
74 78 68 67 72 0
77 85 77 77 71 0
77 72 72 63 64 0
73 67 71 65 69 1
72 74 64 74 62 1
65 66 63 72 60 1
81 82 77 73 69 0
76 80 70 63 60 0
64 71 67 66 66 1
72 73 69 64 67 1
69 75 67 60 62 1
59 59 62 68 56 1
69 73 69 72 53 1
76 82 65 72 69 0
63 71 56 61 53 1
66 74 64 72 63 1
72 85 60 67 67 1
68 72 66 65 68 1
73 80 75 67 67 1
78 82 72 71 72 0
83 82 82 76 72 0
78 82 70 76 64 0
67 73 62 65 59 1
70 77 60 69 67 1
68 74 79 72 65 1
66 80 63 75 59 1
75 76 72 69 64 0
71 71 60 71 66 1
72 77 64 70 69 1
71 76 67 66 64 1
77 79 74 73 70 0
67 68 68 70 57 1
68 71 61 66 64 1
67 76 62 66 62 1
74 77 64 66 69 0
70 66 68 63 66 1
72 78 70 71 64 1
69 73 60 74 60 1

a. Indica si el modelo construido es estadísticamente significativo con una


significancia del 5%.

Con la prueba ANOVA se puede concluir que el modelo sí es estadísticamente


significativo con una significancia del 5%, ya que el p-valor (sig.) es menor que
0.05.

Analysis of Variance Section


Sum of Mean
Source DF Squares Square F-Ratio Sig.
Model 5 2096.303 419.2607 77.663 0.0000
Error 94 507.4566 5.398475

Por lo anterior podemos decir que al menos una de las variables independientes se
relacionan linealmente con la longevidad de una persona.

b. ¿Cuál es el porcentaje de variabilidad en la longevidad de un hombre que es


explicado por el modelo de regresión?

R2 Adj = 0.7947 lo que indica que el 79.47% de la variación de Y es explicado por el


modelo de regresión.

c. ¿Es la edad de los padres significativa, con una significancia del 5%, para
pronosticar la longevidad de un hombre?

En este caso se realizan las pruebas de significancia para las pendientes de madre y
padre. Como puede observarse los p-valores (sig.) para ambas pendientes son
menores al 0.05.

Regression Equation Section


Regression Standard T-Value
Independent Coefficient Error to test
Variable b(i) Sb(i) H0:B(i)=0 Sig.
Intercept 23.5673 5.9785 3.942 0.0002
Abuelas 0.0316 0.0577 0.548 0.5853
Abuelos 0.0778 0.0573 1.358 0.1777
Fumador -3.7190 0.6691 -5.558 0.0000
Madre 0.3061 0.0542 5.648 0.0000
Padre 0.3030 0.0476 6.368 0.0000

Entonces sí es significativa la edad de los padres para pronosticar la longevidad de


un hombre debido a que ambas pendientes son diferentes de cero con una
significancia del 5%, por lo que ambas variables tienen relación lineal con la
longevidad de la persona.

d. ¿Existe alguna variable que no sea significativa, con una significancia del 5%, en
la predicción de la longevidad de un hombre?

Realizando las pruebas de significancia para todas las pendientes se puede


observar que los p-valores (sig.) de abuelas y abuelos son mayores a la significancia
de 0.05.

Regression Equation Section


Regression Standard T-Value
Independent Coefficient Error to test
Variable b(i) Sb(i) H0:B(i)=0 Sig.
Intercept 23.5673 5.9785 3.942 0.0002
Abuelas 0.0316 0.0577 0.548 0.5853
Abuelos 0.0778 0.0573 1.358 0.1777
Fumador -3.7190 0.6691 -5.558 0.0000
Madre 0.3061 0.0542 5.648 0.0000
Padre 0.3030 0.0476 6.368 0.0000

Por lo que las variables abuelas y abuelos no son variables significativas lo que
significa que no se relacionan linealmente con la longevidad de una persona ya que
ambas pendientes son iguales a cero con una significancia del 5%.

e. ¿Afecta el fumar a la longevidad de la persona? Realiza la prueba con una


significancia del 5%.

En la prueba de significancia para la variable fumador se puede observar que el p-


valor (sig.) es menor que 0.05.

Regression Equation Section


Regression Standard T-Value
Independent Coefficient Error to test
Variable b(i) Sb(i) H0:B(i)=0 Sig.
Intercept 23.5673 5.9785 3.942 0.0002
Abuelas 0.0316 0.0577 0.548 0.5853
Abuelos 0.0778 0.0573 1.358 0.1777
Fumador -3.7190 0.6691 -5.558 0.0000
Madre 0.3061 0.0542 5.648 0.0000
Padre 0.3030 0.0476 6.368 0.0000

Por lo anterior se puede decir que fumar tiene relación lineal con la longevidad de
una persona.

f. ¿Cuál sería la longevidad promedio de una persona que fuma, si su padre


muriera a los 78 años, su madre a los 81 años, su abuelo a los 62 años y su
abuela a los 73 años?
Se construye una estimación por intervalo para Y dados los valores señalados de
las X’s.

Y estimada = 79.128

Error estándar o desviación estándar de Y estimada = 0.567

Límites de confianza al 95% ( 78.002 < y < 80.254 )

El intervalo indica que el 95% de las veces que las X’s tomen los valores utilizados
para obtener a Y estimada la longevidad de una persona podrá tomar cualquier
valor contenido entre los límites del intervalo.

g. ¿Con una confianza del 95%, cuál es el cambio en la longevidad de un hombre si


la edad de muerte de su padre incrementa en un año?

Se construye una estimación por intervalo para la pendiente de padre.

( 0.2085 < Padre < 0.3975)

El intervalo indica que el 95% de las veces que la edad de muerte del padre se
incremente en un año la longevidad de una persona podrá incrementar una
cantidad contenida entre los límites del intervalo.

h. ¿Cuál es el cambio promedio en la longevidad de una persona que fuma?

Se construye una estimación por intervalo para la beta de fumador que representa
el cambio en el intercepto del modelo de regresión, es decir el cambio en el valor
inicial de la longevidad de una persona que fuma respecto a una persona que no
fuma.

( -5.0475 < Fumador < -2.3905)

El intervalo indica que el 95% de las personas que fuman su longevidad disminuirá
en una cantidad contenida entre los límites del intervalo respecto de una persona
que no fuma.

i. Indica si el modelo de regresión presenta problemas de colinealidad.

Variance
Independent Inflation
Variable Factor
Abuela 1.3600
Abuelo 1.4034
Fumador 1.8866
Madre 1.9844
Padre 1.5031

Dado que los valores de los VIF son menores que 3 se puede decir que no hay evidencia
de que se presente relación lineal entre las variables independientes por lo que este
modelo no presenta problemas de colinealidad.

Les sugiero que repitan el ejercicio utilizando Excel o SPSS.

También podría gustarte