Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Calificación:
1. Se ha llevado a cabo un ajuste de regresión lineal a una nube de puntos formada por
observaciones de dos variables X e Y y se ha obtenido un coeficiente de determinación
0.03. Indica la respuesta correcta:
(a) El coeficiente de correlación lineal entre X e Y valdrá 0.173.
(b) El coeficiente de determinación entre −X e Y valdrá −0.03.
(c) El coeficiente de correlación lineal entre X e Y puede tomar el valor 0.173 o el valor
−0.173.
(d) El 3% de la variabilidad total de Y queda sin explicar en el modelo.
Teniendo en cuenta el valor χ2α,(h−1)(k−1) que corresponda para cada caso, con un nivel
de significación 0.05. Indica la respuesta correcta:
(a) Hay asociación entre el estado de salud (X) y el sexo (Y).
(b) El estado de salud (X) está asociado al nivel de ejercicio (Z).
(c) El nivel de ejercicio (Z) realizado depende del sexo (Y).
(d) Todas son falsas.
3. Dadas dos variables X e Y , sabemos que α1,0 = 1 y α2,0 = 10, calcula el coeficiente de
variación de Pearson de la variable Z = 2X
(a) 3.
(b) -3.
(c) 6.
(d) -6.
Edad 56 42 72 36 63 47 55 49 38 42
Presión 14.8 12.6 15.9 11.8 14.9 13 15.1 14.2 11.4 14.1
(a) Calcula el coeficiente de correlación lineal entre las variables e indica qué significa.
(b) Determina la recta de regresión de la presión en función de la edad. Interpreta los
coeficientes.
(c) Analiza la calidad o bondad del ajuste.
(d) Realiza las predicciones siguientes, sólo cuando tengan sentido:
d.1) Presión sanguı́nea de una niña de 10 años.
d.2) Presión sanguı́nea de una mujer de 51 años.
d.3) Presión sanguı́nea de un hombre de 54 años.
X
0 1 2 3 4
Y
0 0 0 2 1 2
1 0 0 8 2 0
2 0 2 5 1 0
3 0 2 0 0 0
4 1 1 1 0 0
5 2 0 0 0 0
1. Se ha llevado a cabo un ajuste de regresión lineal a una nube de puntos formada por
observaciones de dos variables X e Y y se ha obtenido un coeficiente de determinación
0.03. Indica la respuesta correcta:
(a) El coeficiente de correlación lineal entre X e Y valdrá 0.173.
(b) El coeficiente de determinación entre −X e Y valdrá −0.03.
(c) El coeficiente de correlación lineal entre X e Y puede tomar el valor 0.173 o el
valor −0.173.
(d) El 3% de la variabilidad total de Y queda sin explicar en el modelo.
Teniendo en cuenta el valor χ2α,(h−1)(k−1) que corresponda para cada caso, con un nivel
de significación 0.05. Indica la respuesta correcta:
(a) Hay asociación entre el estado de salud (X) y el sexo (Y).
(b) El estado de salud (X) está asociado al nivel de ejercicio (Z).
(c) El nivel de ejercicio (Z) realizado depende del sexo (Y).
(d) Todas son falsas.
(a) Falso, dado que χ20.05,3 = 7.815 y χ2 (X, Y ) = 6.1 ≤ 7.815 = χ20.05,3 . Por tanto no
se rechaza la hipótesis nula de independencia.
(b) Verdadero, dado que χ20.05,6 = 12.592 y χ2 (X, Z) = 14.2 ≥ 12.592 = χ20.05,6 .
Por tanto se rechaza la hipótesis nula de independencia y concluimos que existe
asociación entre las variables.
(c) Falso, dado que χ20.05,2 = 5.991 y χ2 (Y, Z) = 4.5 ≤ 5.991 = χ20.05,2 . Por tanto no se
rechaza la hipótesis nula de independencia. No podemos concluir que dependan
a un nivel de significación 0.05
(d) Falso, dado que la b es verdadera.
3. Dadas dos variables X e Y , sabemos que α1,0 = 1 y α2,0 = 10, calcula el coeficiente de
variación de Pearson de la variable Z = 2X
(a) 3.
(b) -3.
(c) 6.
(d) -6.
Por tanto, son dependientes. También podemos aplicar las propiedades vistas en clase:
Además,
Edad 56 42 72 36 63 47 55 49 38 42
Presión 14.8 12.6 15.9 11.8 14.9 13 15.1 14.2 11.4 14.1
(a) Calcula el coeficiente de correlación lineal entre las variables e indica qué significa.
Solución: Primero de todo construimos la tabla auxiliar para realizar los cálculos de los
apartados (a) y (b)
xi yj x2i yj2 xi yj
56 14.8 3136 219.04 828.8
42 12.6 1764 158.76 529.2
72 15.9 5184 252.81 1144.8
36 11.8 1296 139.24 424.8
63 14.9 3969 222.01 938.7
47 13 2209 169 611
55 15.1 3025 228.01 830.5
49 14.2 2401 201.64 695.8
38 11.4 1444 129.96 433.2
42 14.1 1764 198.81 592.2
500 137.8 26192 1919.28 7029
Sxy 13.9
b= 2
= = 0.12, a = ȳ − bx̄ = 13.78 − 0.12 · 50 = 7.78.
Sx 119.2
(d) Sólo tiene sentido realizar la predicción d.2). Para un valorx = 51 el modelo predice
un valor
y = 7.95 + 0.12 · 51 = 13.90.
Problema 2: En una clase compuesta por 30 alumnos, se ha hecho un estudio sobre el
número de horas diarias de estudio X y el número de suspensos Y , obteniéndose la siguiente
tabla de doble entrada
X
0 1 2 3 4
Y
0 0 0 2 1 2
1 0 0 8 2 0
2 0 2 5 1 0
3 0 2 0 0 0
4 1 1 1 0 0
5 2 0 0 0 0
Solución:
(a) En la siguiente tabla las primeras dos columnas se corresponden a la distribución
marginal de la variable Y , el resto se corresponden a cálculos Ası́ la media y la
yj nj yj nj yj2 nj
0 5 0 0
1 10 10 10
2 8 16 32
3 2 6 18
4 3 12 48
5 2 10 50
Suma 30 54 158
xi ni
0 3
1 5
2 16
3 4
4 2
Y |x = 3 nj fj|x=3 Nj
0 1 0.25 1
1 2 0.50 3
2 1 0.25 4
Y |x = 2 nj fj|x=3 Nj
0 2 0.125 2
1 8 0.5 10
2 5 0.3125 15
4 1 0.0625 16
(e) No son independientes. Por los apartados (c) y (d) se puede concluir directamente,
dado que las distribuciones marginales no son las mismas. Por tanto, dependen de los
valores de x.
Problema 3: El tiempo en minutos que tarda una persona para ir de su casa al trabajo
oscila de forma uniforme entre 20 y 30, X ∼ U (20, 30).
(a) Hallar la función de densidad y la de distribución.
(f) Si debe llegar al trabajo a las 8 de la mañana, ¿a qué hora debe salir de su casa para
tener una probabilidad de 0.9 de no llegar tarde?
Solución:
(a)
0 si x < 20
( 1
si 20 ≤ x ≤ 30 x − 20
f (x) = 10 F (x) = si 20 ≤ x ≤ 30
0 en otro caso 10
1 si x > 30
(b)
a+b 20 + 30 50
E[X] = = = = 25.
2 2 2
(b − a)2 (30 − 20)2 100
V [X] = = = = 25/3 = 8.33, =⇒ σ = 2.89.
12 12 12
(c)
25
E[2X + 3] = 2E[X] + 3 = 2 · 25 + 3 = 53. V [2X + 3] = 4V [X] = 4 = 33.33.
3
(c) Aplicamos el teorema central del lı́mite, por tanto el promedio se distribuye normal-
mente como sigue X̄ ∼ N(78, 0.6). De esta forma
76 − 78
P X̄ < 76 = P Z < = P [Z < −3.33] = 1−P [Z ≤ 3.33] = 1−0.9996 = 0.0004.
0.6
(b) ¿Qué tamaño mı́nimo debe de tener una muestra aleatoria simple con media x̄ = 90
para que el lı́mite superior del intervalo de confianza al 99% sea inferior a 110, sabiendo
que la desviación tı́pica de la población es σ = 20?
(c) El director de la prisión en el informe anual ha destacado que las presas realizan exac-
tamente 100 minutos diarios a actividades deportivas. Sabiendo que para una muestra
de 40 presas hemos obtenido un tiempo medio de dedicación a actividades deportivas
de x̄ = 98 minutos diarios con una varianza muestral de 16 minutos. Comprobar si hay
evidencia suficiente para rechazar la afirmación del director a un nivel de significación
del 5%.
(d) Con los datos expuestos en el apartado (c), comprobar si hay evidencia suficiente para
rechazar la afirmación del director a un nivel de significación del 1%, sabiendo ahora
que la varianza poblacional toma el valor σ 2 = 25.
Solución:
(a) Tenemos que hacer un intervalo de confianza para la media de una población con
varianza desconocida, por tanto tendremos que usar la cuasivarianza. Además, en este
caso, como el tamaño de la muestra es pequeño usamos el estadı́stico t-student. Por
tanto el intervalo de confianza buscado es de la forma
s s
IC = x̄ − tn−1,α/2 √ , x̄ + tn−1,α/2 √ .
n n
p
Siendo x̄ = 90, s = 20/19 · 9 = 3.08, n = 20, α = 0.1 y t19,0.05 = 1.7291. Por tanto
el intervalo de confianza es IC90% = (88.81, 91.19).
(b) En este caso al conocer la varianza el intervalo de confianza viene dado por
σ σ
IC = x̄ − zα/2 √ , x̄ + zα/2 √ .
n n
Siendo x̄ = 90, σ = 20, n =?, α = 0.01 y z0.005 = 2.56. Ahora buscamos n tal que
σ 20
x̄ + zα/2 √ < 110 =⇒ 90 + 2.56 √ < 110 =⇒ n > 6.55
n n
H0 : µ = 100
H1 : µ 6= 100
H0 : µ = 100
H1 : µ 6= 100
x̄ − µ0 98 − 100
√ = √ = −2.53 ∈ (−2.56, 2.56).
σ/ n 5/ 40
Por tanto, no tenemos evidencias suficientes para rechazar H0 , por tanto la “acepta-
mos”.