Está en la página 1de 15

Instrumentos Matemáticos y Análisis de Datos

Examen Convocatoria Mayo 2019 Nombre:


U.R.J.C.
Grupo DNI

Calificación:

Instrucciones Tipo Test (20%)

• Las respuestas tienen que estar justificadas. Plantilla para respuestas


• No se corregirán respuestas que no estén justificadas. Pregunta a b c d
• Rellenar las respuestas en la plantilla adjunta. Pregunta 1
Pregunta 2
• No se corregirán respuestas que no estén recogidas Pregunta 3
en la plantilla. Pregunta 4
• Cada pregunta puntúa lo mismo, es decir 0.4. Pregunta 5

• Una respuesta incorrecta resta 0 puntos.

1. Se ha llevado a cabo un ajuste de regresión lineal a una nube de puntos formada por
observaciones de dos variables X e Y y se ha obtenido un coeficiente de determinación
0.03. Indica la respuesta correcta:
(a) El coeficiente de correlación lineal entre X e Y valdrá 0.173.
(b) El coeficiente de determinación entre −X e Y valdrá −0.03.
(c) El coeficiente de correlación lineal entre X e Y puede tomar el valor 0.173 o el valor
−0.173.
(d) El 3% de la variabilidad total de Y queda sin explicar en el modelo.

2. En una muestra aleatoria de personas se analizan algunos hábitos de la vida. Se recogen


datos de las siguientes variables:

• X. Estado general de salud: muy bueno, bueno, regular, malo.


• Y . Sexo: mujer, hombre.
• Z. Nivel de ejercicio diario: intenso, moderado, ninguno.
Realizadas las tablas de contingencia correspondientes, se calcularon los siguientes es-
tadı́sticos para contrastar la asociación:

χ2 (X, Y ) = 6.1, χ2 (Y, Z) = 4.5, χ2 (X, Z) = 14.2,

Teniendo en cuenta el valor χ2α,(h−1)(k−1) que corresponda para cada caso, con un nivel
de significación 0.05. Indica la respuesta correcta:
(a) Hay asociación entre el estado de salud (X) y el sexo (Y).
(b) El estado de salud (X) está asociado al nivel de ejercicio (Z).
(c) El nivel de ejercicio (Z) realizado depende del sexo (Y).
(d) Todas son falsas.

3. Dadas dos variables X e Y , sabemos que α1,0 = 1 y α2,0 = 10, calcula el coeficiente de
variación de Pearson de la variable Z = 2X
(a) 3.
(b) -3.
(c) 6.
(d) -6.

4. Sean A y B dos sucesos tales que

P (Ā) = 0.7, P (B) = 0.4, P (Ā ∩ B) = 0.3.

(a) No son independientes y P (A ∪ B) = 0.6.


(b) Son independientes y P (A ∪ B) = 0.4.
(c) No son dependientes y P (A ∪ B) = 0.6.
(d) Son dependientes y P (A ∪ B) = 0.4.

5. En un contraste de hipótesis, el nivel de significación α es la probabilidad de:


(a) No rechazar H0 dado que H0 es verdadera.
(b) No rechazar H0 cuando H0 es falsa.
(c) Rechazar H0 cuando es falsa.
(d) Rechazar H0 dado que H0 es verdadera.
Notar que esta última cuestión es una definición, por tanto basta con señalar la correcta.
Problemas (80%) Cada alumno debe elegir 3 de los 5 problemas propuestos.
Cada problema tiene la misma puntuación.
1. Problema 1: La tabla siguiente contiene la edad X y la máxima presión sanguı́nea Y
de un grupo de 10 mujeres:

Edad 56 42 72 36 63 47 55 49 38 42
Presión 14.8 12.6 15.9 11.8 14.9 13 15.1 14.2 11.4 14.1

(a) Calcula el coeficiente de correlación lineal entre las variables e indica qué significa.
(b) Determina la recta de regresión de la presión en función de la edad. Interpreta los
coeficientes.
(c) Analiza la calidad o bondad del ajuste.
(d) Realiza las predicciones siguientes, sólo cuando tengan sentido:
d.1) Presión sanguı́nea de una niña de 10 años.
d.2) Presión sanguı́nea de una mujer de 51 años.
d.3) Presión sanguı́nea de un hombre de 54 años.

2. Problema 2: En una clase compuesta por 30 alumnos, se ha hecho un estudio sobre


el número de horas diarias de estudio X y el número de suspensos Y , obteniéndose la
siguiente tabla de doble entrada

X
0 1 2 3 4
Y
0 0 0 2 1 2
1 0 0 8 2 0
2 0 2 5 1 0
3 0 2 0 0 0
4 1 1 1 0 0
5 2 0 0 0 0

(a) Halla la distribución marginal de Y. ¿Cuál es el número medio y la desviación tı́pica


de suspensos?
(b) Obtén la distribución del número de horas diarias de estudio. ¿Cuál es la cantidad
de horas más frecuente?
(c) Calcula la distribución del número de suspensos dado que se han estudiado 3 horas.
Calcula la mediana, el decil 5 y el percentil 75.
(d) Si se han estudiado 2 horas. Calcula, haciendo uso de la distribución marginal que
corresponda, el número mı́nimo de suspensos que tienen el 75% de las personas que
más suspensos tienen.
(e) ¿Son independientes el número de suspensos y las horas dedicadas al estudio? Ra-
zona la respuesta.
3. Problema 3: El tiempo en minutos que tarda una persona para ir de su casa al trabajo
oscila de forma uniforme entre 20 y 30, X ∼ U (20, 30).
(a) Hallar la función de densidad y la de distribución.
(b) Calcular la media y la desviación tı́pica de la variable X.
(c) Calcular la media y la desviación tı́pica de la variable 2X + 3
(d) Probabilidad de que la persona tarde exactamente 15 minutos en llegar.
(e) Probabilidad de que la persona tarde menos de 15 minutos en llegar.
(f) Si debe llegar al trabajo a las 8 de la mañana, ¿a qué hora debe salir de su casa
para tener una probabilidad de 0.9 de no llegar tarde?
4. Problema 4: (Se recomienda el uso de cuatro decimales). Se supone que los resultados
de un examen siguen una distribución normal con media µ = 78 y varianza σ 2 = 36.
(a) ¿Cuál es la probabilidad de que una persona que se presenta al examen tenga una
calificación superior a 81?
(b) Si se sabe que la calificación de un estudiante es mayor que 72. ¿Cuál es la proba-
bilidad de que su calificación sea, de hecho, superior a 81?
(c) ¿Cuál es la probabilidad de que al realizar 100 exámenes el promedio de las califi-
caciones sea menor que 76?
(d) Para pasar al siguiente nivel de estudios es necesario superar una cierta nota de
corte. Se sabe que el 70% de los que se presentan no pasan al siguiente nivel. ¿Cuál
es la nota de corte que buscamos?
5. Problema 5: El tiempo diario que las mujeres de una determinada prisión dedican
a actividades deportivas, expresado en minutos, sigue una distribución con media µ y
desviación tı́pica σ desconocida. (Cada apartado contiene su propia información para
resolverse, por tanto se resuelven independientemente si no se indica lo contrario)
(a) Para una muestra de 20 prisioneras se ha obtenido un tiempo medio de dedicación
a actividades deportivas de x̄ = 90 minutos diarios con una varianza muestral de 9
minutos. Calcular un intervalo de confianza al 90% para la media.
(b) ¿Qué tamaño mı́nimo debe de tener una muestra aleatoria simple con media x̄ = 90
para que el lı́mite superior del intervalo de confianza al 99% sea inferior a 110,
sabiendo que la desviación tı́pica de la población es σ = 20?
(c) El director de la prisión ha destacado, en una rueda de prensa, que las presas
realizan exactamente 100 minutos diarios a actividades deportivas. Sabiendo que
para una muestra de 40 presas hemos obtenido un tiempo medio de dedicación a
actividades deportivas de x̄ = 98 minutos diarios con una varianza muestral de
16 minutos. Comprobar si hay evidencia suficiente para rechazar la afirmación del
director a un nivel de significación del 5%.
(d) Con los datos expuestos en el apartado (c), comprobar si hay evidencia suficiente
para rechazar la afirmación del director a un nivel de significación del 1%, sabiendo
ahora que la varianza poblacional toma el valor σ 2 = 25.
Solución
Tipo Test

1. Se ha llevado a cabo un ajuste de regresión lineal a una nube de puntos formada por
observaciones de dos variables X e Y y se ha obtenido un coeficiente de determinación
0.03. Indica la respuesta correcta:
(a) El coeficiente de correlación lineal entre X e Y valdrá 0.173.
(b) El coeficiente de determinación entre −X e Y valdrá −0.03.
(c) El coeficiente de correlación lineal entre X e Y puede tomar el valor 0.173 o el
valor −0.173.
(d) El 3% de la variabilidad total de Y queda sin explicar en el modelo.

Solución: La respuesta correcta es la c.


√ √
(a) Falso, rXY = ± R2 = ± 0.03 = ±0.173.
(b) Falso, R2 nunca puede ser negativo.
(d) Falso, si R2 = 0.03, quiere decir que el modelo explica el 3% de la variabilidad de
Y . Por tanto, queda por explicar un 97%.

2. En una muestra aleatoria de personas se analizan algunos hábitos de la vida. Se recogen


datos de las siguientes variables:

– X. Estado general de salud: muy bueno, bueno, regular, malo.


– Y . Sexo: mujer, hombre.
– Z. Nivel de ejercicio diario: intenso, moderado, ninguno.

Realizadas las tablas de contingencia correspondientes, se calcularon los siguientes


estadı́sticos para contrastar la asociación:

χ2 (X, Y ) = 6.1, χ2 (Y, Z) = 4.5, χ2 (X, Z) = 14.2,

Teniendo en cuenta el valor χ2α,(h−1)(k−1) que corresponda para cada caso, con un nivel
de significación 0.05. Indica la respuesta correcta:
(a) Hay asociación entre el estado de salud (X) y el sexo (Y).
(b) El estado de salud (X) está asociado al nivel de ejercicio (Z).
(c) El nivel de ejercicio (Z) realizado depende del sexo (Y).
(d) Todas son falsas.

Solución: La respuesta correcta es la b.

(a) Falso, dado que χ20.05,3 = 7.815 y χ2 (X, Y ) = 6.1 ≤ 7.815 = χ20.05,3 . Por tanto no
se rechaza la hipótesis nula de independencia.
(b) Verdadero, dado que χ20.05,6 = 12.592 y χ2 (X, Z) = 14.2 ≥ 12.592 = χ20.05,6 .
Por tanto se rechaza la hipótesis nula de independencia y concluimos que existe
asociación entre las variables.
(c) Falso, dado que χ20.05,2 = 5.991 y χ2 (Y, Z) = 4.5 ≤ 5.991 = χ20.05,2 . Por tanto no se
rechaza la hipótesis nula de independencia. No podemos concluir que dependan
a un nivel de significación 0.05
(d) Falso, dado que la b es verdadera.

3. Dadas dos variables X e Y , sabemos que α1,0 = 1 y α2,0 = 10, calcula el coeficiente de
variación de Pearson de la variable Z = 2X
(a) 3.
(b) -3.
(c) 6.
(d) -6.

Solución: La respuesta correcta es la a.


El coeficiente de variación de pearson es invariante por cambios en la escala. Por
SX
tanto, CVZ = CVX . Por definición CVX = , donde SX y x̄ son la desviación tı́pica

y la media de la variable X, respectivamente. La varianza de la variable X a partir de
los momentos viene dada por
2 2
SX = α2,0 − α1,0 = 10 − 1 = 9.

Ahora, la desviación tı́pica es la raı́z cuadrada positiva de la varianza SX = 3. Por


otra parte, sabemos que x̄ = α1,0 = 1. Ası́
SX 3
CVX = = = 3.
x̄ 1

4. Sean A y B dos sucesos tales que

P (Ā) = 0.7, P (B) = 0.4, P (Ā ∩ B) = 0.3.

(a) No son independientes y P (A ∪ B) = 0.6.


(b) Son independientes y P (A ∪ B) = 0.4.
(c) No son dependientes y P (A ∪ B) = 0.6.
(d) Son dependientes y P (A ∪ B) = 0.4.

Solución: La respuesta correcta es la a.


En primer lugar, calculamos P (A ∪ B). Hay varias formas de calcularlo, en particular,
con el diagrama de Venn se ve claramente que

P (A ∪ B) = P (A) + P (Ā ∩ B) = 0.3 + 0.3 = 0.6.


Por otra parte,

P (A ∩ B) = P (A) + P (B) − P (A ∪ B) = 0.3 + 0.4 − 0.6 = 0.1 6= 0.12 = P (A)P (B).

Por tanto, son dependientes. También podemos aplicar las propiedades vistas en clase:

P (B) = P (Ā∩B)+P (A∩B), =⇒ P (A∩B) = 0.4−0.3 = 0.1 6= 0.12 = P (A)P (B).

Además,

P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 0.3 + 0.4 − 0.1 = 0.6.

5. En un contraste de hipótesis, el nivel de significación α es la probabilidad de:


(a) No rechazar H0 dado que H0 es verdadera.
(b) No rechazar H0 cuando H0 es falsa.
(c) Rechazar H0 cuando es falsa.
(d) Rechazar H0 dado que H0 es verdadera.

Solución: La respuesta correcta es la d.


La probabilidad de cometer un error de Tipo I se denomina nivel de significación α.
Además el error de Tipo I se define como error al rechazar H0 cuando es verdadera.
Problemas

Problema 1: La tabla siguiente contiene la edad X y la máxima presión sanguı́nea Y de


un grupo de 10 mujeres:

Edad 56 42 72 36 63 47 55 49 38 42
Presión 14.8 12.6 15.9 11.8 14.9 13 15.1 14.2 11.4 14.1

(a) Calcula el coeficiente de correlación lineal entre las variables e indica qué significa.

(b) Determina la recta de regresión de la presión en función de la edad. Interpreta los


coeficientes.

(c) Analiza la calidad o bondad del ajuste.

(d) Realiza las predicciones siguientes, sólo cuando tengan sentido:

d.1) Presión sanguı́nea de una niña de 10 años.


d.2) Presión sanguı́nea de una mujer de 51 años.
d.3) Presión sanguı́nea de un hombre de 54 años.

Solución: Primero de todo construimos la tabla auxiliar para realizar los cálculos de los
apartados (a) y (b)

xi yj x2i yj2 xi yj
56 14.8 3136 219.04 828.8
42 12.6 1764 158.76 529.2
72 15.9 5184 252.81 1144.8
36 11.8 1296 139.24 424.8
63 14.9 3969 222.01 938.7
47 13 2209 169 611
55 15.1 3025 228.01 830.5
49 14.2 2401 201.64 695.8
38 11.4 1444 129.96 433.2
42 14.1 1764 198.81 592.2
500 137.8 26192 1919.28 7029

(a) Las medias son:


500 137.8
x̄ = = 50, ȳ = = 13.78,
10 10
Las varianzas son:
26192 1919.28
Sx2 = − 502 = 119.2, Sy2 = − 13.782 = 2.04.
10 10
La covarianza es:
7029
Sxy = − 50 · 13.78 = 13.9.
10
De esta forma, el coeficiente de correlación lineal viene dado por:
Sxy 13.9
rxy = =√ √ = 0.89.
Sx Sy 119.2 2.04
El valor obtenido indica que existe relación lineal directa entre las variables X e Y .
Cuanto mayor es X mayor tiende a ser Y .

(b) La recta de regresión de Y sobre X es y ∗ = a + bx, cuyos coeficientes son:

Sxy 13.9
b= 2
= = 0.12, a = ȳ − bx̄ = 13.78 − 0.12 · 50 = 7.78.
Sx 119.2

El coeficiente a es la intersección con el eje de ordenadas, mientras que b es la pendiente


de la recta de regresión.

(c) El ajuste del modelo se mide mediante el coeficiente de determinación R2 , que en el


2
caso del modelo lineal coincide con rxy . Entonces, R2 = 0.892 = 0.79, que indica que
un 79% de la variabilidad de Y viene explicada por el modelo de la recta de regresión,
mientras que queda sin explicar un 21% de variabilidad.

(d) Sólo tiene sentido realizar la predicción d.2). Para un valorx = 51 el modelo predice
un valor
y = 7.95 + 0.12 · 51 = 13.90.
Problema 2: En una clase compuesta por 30 alumnos, se ha hecho un estudio sobre el
número de horas diarias de estudio X y el número de suspensos Y , obteniéndose la siguiente
tabla de doble entrada
X
0 1 2 3 4
Y
0 0 0 2 1 2
1 0 0 8 2 0
2 0 2 5 1 0
3 0 2 0 0 0
4 1 1 1 0 0
5 2 0 0 0 0

(a) Halla la distribución marginal de Y. ¿Cuál es el número medio y la desviación tı́pica de


suspensos?
(b) Obtén la distribución del número de horas diarias de estudio. ¿Cuál es la cantidad de
horas más frecuente?
(c) Calcula la distribución del número de suspensos dado que se han estudiado 3 horas.
Calcula la mediana, el decil 5 y el percentil 75.
(d) Si se han estudiado 2 horas. Calcula, haciendo uso de la distribución marginal que
corresponda, el número mı́nimo de suspensos que tienen el 75% de las personas que más
suspensos tienen.
(e) ¿Son independientes el número de suspensos y las horas dedicadas al estudio? Razona
la respuesta.

Solución:
(a) En la siguiente tabla las primeras dos columnas se corresponden a la distribución
marginal de la variable Y , el resto se corresponden a cálculos Ası́ la media y la

yj nj yj nj yj2 nj
0 5 0 0
1 10 10 10
2 8 16 32
3 2 6 18
4 3 12 48
5 2 10 50
Suma 30 54 158

desviación tı́pica son


r
54 158
Ȳ = = 1.8, SY = − 1.82 = 1.42.
30 30
(b) La distribución de la variable X es

xi ni
0 3
1 5
2 16
3 4
4 2

El valor más frecuente es dos horas diarias de estudio.

(c) Calculamos la distribución condicionada y obtenemos

Y |x = 3 nj fj|x=3 Nj
0 1 0.25 1
1 2 0.50 3
2 1 0.25 4

La mediana y el decil 5 son el mismo valor. Como N = 4, entonces N/2 = 2 ası́ la


mediana es 1. Son solo cuatro datos, por tanto también podemos realizar un listado
con los datos y ver que efectivamente el dato que deja un 50% de la muestra a cada
lado es el 1.
Para el cálculo del percentil 75 hacemos 75 · 4/100 = 3. Como 3 aparece en la tabla de
frecuencias absolutas acumuladas P70 = (1 + 2)/2 = 1.5.

(d) En este caso la distribución marginal es

Y |x = 2 nj fj|x=3 Nj
0 2 0.125 2
1 8 0.5 10
2 5 0.3125 15
4 1 0.0625 16

(e) No son independientes. Por los apartados (c) y (d) se puede concluir directamente,
dado que las distribuciones marginales no son las mismas. Por tanto, dependen de los
valores de x.
Problema 3: El tiempo en minutos que tarda una persona para ir de su casa al trabajo
oscila de forma uniforme entre 20 y 30, X ∼ U (20, 30).
(a) Hallar la función de densidad y la de distribución.

(b) Calcular la media y la desviación tı́pica de la variable X.

(c) Calcular la media y la varianza de la variable 2X + 3

(d) Probabilidad de que la persona tarde exactamente 15 minutos en llegar.

(e) Probabilidad de que la persona tarde menos de 15 minutos en llegar.

(f) Si debe llegar al trabajo a las 8 de la mañana, ¿a qué hora debe salir de su casa para
tener una probabilidad de 0.9 de no llegar tarde?

Solución:

(a) 
 0 si x < 20
( 1 
si 20 ≤ x ≤ 30 x − 20
f (x) = 10 F (x) = si 20 ≤ x ≤ 30
0 en otro caso  10
1 si x > 30

(b)
a+b 20 + 30 50
E[X] = = = = 25.
2 2 2
(b − a)2 (30 − 20)2 100
V [X] = = = = 25/3 = 8.33, =⇒ σ = 2.89.
12 12 12
(c)
25
E[2X + 3] = 2E[X] + 3 = 2 · 25 + 3 = 53. V [2X + 3] = 4V [X] = 4 = 33.33.
3

(d) 0. Es una variable aleatoria continua.

(e) 0. Dado que el tiempo se mueve entre 20 y 30 minutos.

(f) Calculamos el valor de a tal que P (X ≤ a) = 0.9.


a − 20
P (X ≤ a) = F (a) = = 0.9 =⇒ a = 29.
10
Por tanto, debe salir de casa a las 7h 31 min.
Problema 4: Se supone que los resultados de un examen siguen una distribución normal
con media µ = 78 y varianza σ 2 = 36. Se pide:
(a) ¿Cuál es la probabilidad de que una persona que se presenta al examen tenga una
calificación superior a 81?
(b) Si se sabe que la calificación de un estudiante es mayor que 72. ¿Cuál es la probabilidad
de que su calificación sea, de hecho, superior a 81?
(c) ¿Cuál es la probabilidad de que al realizar 100 exámenes el promedio de las calificaciones
sea menor que 76?
(d) Para pasar al siguiente nivel de estudios es necesario superar una cierta nota de corte.
Se sabe que el 70% de los que se presentan no pasan al siguiente nivel. ¿Cuál es la nota
de corte que buscamos?

En este problema se recomienda el uso de cuatro decimales

Solución: X=Resultado de un examen. X ∼ N(78, 6).


(a)
 
81 − 78
P [X > 81] = P Z > = P [Z > 0.5] = 1 − P [Z ≤ 0.5] = 1 − 0.6915 = 0.3085.
6

(b) Aplicando la definición de probabilidad condicionada


P [X > 81 ∩ X > 72] P [X > 81] 0.3085
P [X > 81|X > 72] = = = = 0.3667.
P [X > 72] P [X > 72] 0.8413
Donde la P [X > 72] se calcula como sigue
 
72 − 78
P [X > 72] = P Z > = P [Z > −1] = P [Z ≤ 1] = 0.8413.
6

(c) Aplicamos el teorema central del lı́mite, por tanto el promedio se distribuye normal-
mente como sigue X̄ ∼ N(78, 0.6). De esta forma
 
  76 − 78
P X̄ < 76 = P Z < = P [Z < −3.33] = 1−P [Z ≤ 3.33] = 1−0.9996 = 0.0004.
0.6

(d) La probabilidad de no pasar al siguiente nivel es 0.7. Además no pasas si no superar


la norta de corte. Por tanto, P[X ≤ c], siendo c la nota de corte, representa la
probabilidad de no pasar. Ası́,
c − 78
P[X ≤ c] = 0.7 =⇒ P[Z ≤ ] = 0.7
6
Buscando en la tabla de la normal, tenemos
c − 78
= 0.53, =⇒ c = 81.18.
6
Problema 5: El tiempo diario que las mujeres de una determinada prisión dedican a ac-
tividades deportivas, expresado en minutos, sigue una distribución con media µ y desviación
tı́pica σ desconocida.
(a) Para una muestra de 20 prisioneras se ha obtenido un tiempo medio de dedicación
a actividades deportivas de x̄ = 90 minutos diarios con una varianza muestral de 9
minutos. Calcular un intervalo de confianza al 90% para la media.

(b) ¿Qué tamaño mı́nimo debe de tener una muestra aleatoria simple con media x̄ = 90
para que el lı́mite superior del intervalo de confianza al 99% sea inferior a 110, sabiendo
que la desviación tı́pica de la población es σ = 20?

(c) El director de la prisión en el informe anual ha destacado que las presas realizan exac-
tamente 100 minutos diarios a actividades deportivas. Sabiendo que para una muestra
de 40 presas hemos obtenido un tiempo medio de dedicación a actividades deportivas
de x̄ = 98 minutos diarios con una varianza muestral de 16 minutos. Comprobar si hay
evidencia suficiente para rechazar la afirmación del director a un nivel de significación
del 5%.

(d) Con los datos expuestos en el apartado (c), comprobar si hay evidencia suficiente para
rechazar la afirmación del director a un nivel de significación del 1%, sabiendo ahora
que la varianza poblacional toma el valor σ 2 = 25.

Solución:

(a) Tenemos que hacer un intervalo de confianza para la media de una población con
varianza desconocida, por tanto tendremos que usar la cuasivarianza. Además, en este
caso, como el tamaño de la muestra es pequeño usamos el estadı́stico t-student. Por
tanto el intervalo de confianza buscado es de la forma
 
s s
IC = x̄ − tn−1,α/2 √ , x̄ + tn−1,α/2 √ .
n n
p
Siendo x̄ = 90, s = 20/19 · 9 = 3.08, n = 20, α = 0.1 y t19,0.05 = 1.7291. Por tanto
el intervalo de confianza es IC90% = (88.81, 91.19).

(b) En este caso al conocer la varianza el intervalo de confianza viene dado por
 
σ σ
IC = x̄ − zα/2 √ , x̄ + zα/2 √ .
n n

Siendo x̄ = 90, σ = 20, n =?, α = 0.01 y z0.005 = 2.56. Ahora buscamos n tal que
σ 20
x̄ + zα/2 √ < 110 =⇒ 90 + 2.56 √ < 110 =⇒ n > 6.55
n n

Por tanto nmin = 7.


(c) Tenemos que resolver el siguiente contraste de hipótesis

H0 : µ = 100
H1 : µ 6= 100

Tenemos la siguiente información n = 40, x̄ = 98, Sx2 = 16 y α = 0.05. Dado


que no conocemos la varianza poblacional pero si la muestral tenemos que usar la
cuasivarianza, además la muestra es lo suficientemente representativa. Por tanto, la
región de aceptación viene dada por
x̄ − µ0
−zα/2 ≤ √ ≤ zα/2 ,
s/ n
x̄−µ
p
siendo s = n/(n − 1)Sx = 4.04. Como zα/2 = z0.025 = 1.96, comprobamos si √0
s/ n
pertenece al intervalo (-1.96,1.96)
x̄ − µ0 98 − 100
√ = √ = −3.13 6∈ (−1.96, 1.96).
s/ n 4.04/ 40

Por tanto, rechazamos la hipótesis nula de igualdad.

(d) Tenemos que resolver el siguiente contraste de hipótesis

H0 : µ = 100
H1 : µ 6= 100

Tenemos la siguiente información n = 40, x̄ = 98, σ 2 = 25 y α = 0.01. Dado que


conocemos la varianza poblacional, la región de aceptación viene dada por
x̄ − µ0
−zα/2 ≤ √ ≤ zα/2 ,
σ/ n
x̄−µ
Como zα/2 = z0.005 = 2.56, comprobamos si √0
σ/ n
pertenece al intervalo (-2.56,2.56)

x̄ − µ0 98 − 100
√ = √ = −2.53 ∈ (−2.56, 2.56).
σ/ n 5/ 40

Por tanto, no tenemos evidencias suficientes para rechazar H0 , por tanto la “acepta-
mos”.

También podría gustarte