Está en la página 1de 220

NOTA REVISADA FIRMA Estadística Básica

Examen Sustitutorio

Facultad de Ingeniería 1:20pm 17/7/2018


Semestre 2018-I
Duración: 3 h

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de su
enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega, pero no se corrige. Entregar el cuadernillo y cada hoja del
enunciado por separado. Tu evaluación será escaneada para prevenir fraude.

Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se
reclame), de lo contrario no será atendido. El reclamo deberá basarse en errores de corrección en base a esa
solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar. NOTA
1. A continuación, se muestra un conjunto de tablas. En cada una hay tres frases, donde sólo una es correcta. En
cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3 si la
FIRMA
elección es incorrecta). No hay que justificar.

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.1 Cuantos más datos tengamos, el histograma debe hacerse con menos clases.
1.2 Por debajo del primer percentil está, aproximadamente, el 1% de los datos. X
1.3 La distancia entre el primer cuartil y el segundo cuartil se denomina rango intercuartílico.

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.4 La curtosis es un coeficiente adimensional. X
1.5 Si el histograma es bimodal, la curtosis tenderá a ser alta.
1.6 La curtosis mide cómo de apuntada está la distribución en las modas.

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.7 Sea X una variable aleatoria discreta, si x=20 es el percentil 30, entonces necesariamente 𝐹(20) ≥ 0.30 x
1.8 Sea X una variable aleatoria discreta, si x=20 es el percentil 30, entonces necesariamente 𝐹(20) ≤ 0.30

1.3 Sea X una variable aleatoria discreta, si x=20 es el percentil 30, entonces necesariamente 𝐹(20) = 0.30

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.10 Si X es una variable aleatoria continua y 𝑃(𝑋 = 1) = 0, entonces el 1 no está en su espacio muestral
1.11 Si X es continua y 𝑓(1) = 0 entonces el 1 es un suceso imposible X
1.12 Si X es continua y 𝑓(2) = 1 entonces el 2 es el suceso seguro

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.13 Si A y B son sucesos independientes 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴)[1 + 𝑃(𝐵)] + 𝑃(𝐵)
1.14 Si A y B son sucesos equiprobables 𝑃(𝐴|𝐵) = 𝑃(𝐵|𝐴) X
1.15 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴|𝐵)𝑃(𝐵) si y sólo si A y B son independientes
NOTA
APELLIDOS:______________________________________________NOMBRE:________________________
Sección:___________________
.
FIRMA

2. Un proceso consta de dos etapas. Cuando un artículo entra en la etapa 1, se realizan sobre él las tareas
A y B. La duración en minutos de dichas tareas, 𝑋𝐴 y 𝑋𝐵 , son variables aleatorias que pueden
modelizarse según las siguientes normales -notación 𝑁(𝜇, 𝜎 2 ) −: 𝑋𝐴 ∼ 𝑁(10, 4) y 𝑋𝐵 ∼ 𝑁(20,9). La etapa
2 sólo tiene una tarea, la C, cuya duración sigue una exponencial: 𝑋𝐶 ∼ 𝐸𝑥𝑝(𝜆 = 0.03 ). Las tres duraciones
son independientes unas de otras. La siguiente figura resume este proceso:

Se pide, usando una precisión de 4 decimales para las probabilidades (no necesitas justificar):
(max. 5 puntos)

a. Probabilidad de que la ejecución de la tarea A demore más de 12 minutos. (0.5p) 0.1586

b. Probabilidad de que la ejecución de la etapa 1 demore más de 35 minutos. (1p) 0.0823

c. Probabilidad de que la etapa 2 se culmine antes de 20 minutos desde que se inició. (0.5p) 0.4512

d. Sea T=duración del proceso. Calcula la desviación estándar de T, 𝜎𝑇 . (1p) 33.53

e. Si tras 25 minutos desde el inicio de la etapa 1, ésta aún no ha culminado, ¿cuál es la probabilidad
0.9103
de que termine en los 10 minutos siguientes? (1p)

f. ¿Cuál es la probabilidad de que las tres tareas demoren más de 10 minutos cada una? (1p) 0.3689

g. ¿Cuál es la probabilidad de que un artículo haya demorado más tiempo en la tarea 1 que en la
0.0028
tarea 2? (1p)
SOLUCIÓN:

a. Probabilidad de que la ejecución de la tarea A demore más de 12 minutos.


12 − 10
𝑃(𝑋𝐴 > 12) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 1) = 0.1586
2

b. Probabilidad de que la ejecución de la etapa 1 demore más de 35 minutos.


La suma de normales es también una normal. Como son independientes, se cumple que:
𝑇1 = 𝑋𝐴 + 𝑋𝐵 ∼ 𝑁(30,13)
35 − 30
𝑃(𝑇1 > 35) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 1.39) = 0.0823.
3.61

c. Probabilidad de que la etapa 2 se culmine antes de 20 minutos desde que se inició.


𝑃(𝑋𝐶 < 20) = 1 − 𝑒 −20×0.03 = 0.4512

d. Sea T=duración del proceso. Calcula su desviación típica.


Al ser independientes
𝜎𝑇2 ≡ 𝑉𝑎𝑟(𝑇) = 𝑉𝑎𝑟(𝑋𝐴 + 𝑋𝐵 + 𝑋𝐶 ) = 𝑉𝑎𝑟(𝑋𝐴 = +𝑉𝑎𝑟(𝑋𝐵 ) + 𝑉𝑎𝑟(𝑋𝐶 )
1
=4+9+ = 1124.1 ⇒ 𝜎𝑇 = 33.53.
0.032

e. Si tras 25 minutos desde el inicio de la etapa 1, ésta aún no ha culminado, ¿cuál es la probabilidad de
que termine en los 10 minutos siguientes?
Usando que 𝑇1 = 𝑋𝐴 + 𝑋𝐵 ∼ 𝑁(30,13) se tiene:
𝑃[(𝑇1 < 35) ∩ (𝑇1 > 25)] 𝑃(25 < 𝑇1 < 35)
𝑃(𝑇1 < 35|𝑇1 > 25) = =
𝑃(𝑇1 > 25) 𝑃(𝑇1 > 25)
35 − 30 25 − 30
𝑃 (𝑍 < ) − 𝑃 (𝑍 < )
𝑃(𝑇1 < 35) − 𝑃(𝑇1 < 25) √13 √13
= =
𝑃(𝑇1 > 25) 25 − 30
𝑃 (𝑍 > )
√13
𝑃(𝑍 < 1.39) − 𝑃(𝑍 < −1.39) 0.9177 − 0.0823
= = = 0.9103
𝑃(𝑍 > −1.39) 0.9177

f. ¿Cuál es la probabilidad de que las tres tareas demoren más de 10 minutos cada una?
𝑃[(𝑋1 > 10) ∩ (𝑋2 > 10) ∩ (𝑋3 > 10)] = 𝑃(𝑋1 > 10)𝑃(𝑋2 > 10)𝑃(𝑋3 > 10)
= 𝑃(𝑍 > 0)𝑃(𝑍 > −3.33)𝑒 −0.03×10 = (0.5)(0.996)(0.7408) = 0.3689

g. ¿Cuál es la probabilidad de que un artículo haya demorado más tiempo en la tarea 1 que en la tarea
2?
𝑃(𝑋1 > 𝑋2 ) = 𝑃(𝑋1 − 𝑋2 > 0), donde 𝑋1 − 𝑋2 ∼ 𝑁(−10; 13). Por tanto
10
𝑃(𝑋1 − 𝑋2 > 0) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 2.77) = 0.0028
√13
APELLIDOS:______________________________________________NOMBRE:________________________
NOTA

Sección:___________________

FIRMA

1. Se ha realizado un experimento para comprobar si existe una diferencia entre los pesos obtenidos con dos
balanzas diferentes. Para ello, se ha pesado un mismo conjunto de objetos con ambas balanzas. Los
resultados se muestran a continuación:
Objeto 1 2 3 4 5 6 7
Peso Balanza A (g) 20.35 12.54 18.71 19.24 15.32 17.21 19.87
Peso Balanza B (g) 20.33 12.53 18.74 19.21 15.38 17.22 19.91

Además, se ha determinado que los pesos medidos por la balanza A y la balanza B se distribuyen
normalmente.

Responda, de manera completa y justificada, a las siguientes cuestiones:

a. Balanza B: A la vista de los datos, un estudiante afirma que la varianza del peso medido por la balanza
B no es menor que 8. Corrobore dicha afirmación mediante un contraste de hipótesis. Utilice 𝛼 = 10%.
(3 p)

𝐻0 : 𝜎 2 ≥ 8 𝐻1 : 𝜎 2 < 8
Escriba las hipótesis del
contraste (0.5 p)
Cualquier otra respuesta: 0 p.

Escriba la fórmula del


estadístico de contraste y (𝑛 − 1)𝑠̂ 2 6 × 7.909
χ20 = = = 𝟓. 𝟗𝟑𝟐
calcule su valor (4 decimales) 𝜎02 8
(0.5 p)

Distribución del estadístico de


χ20 ~ χ26 (0.25 p)
contraste (0.5 p)
Porque el peso se distribuye normalmente. (0.25 p)
Justifique brevemente

Calcule el valor crítico y dibuje


las regiones de aceptación y
rechazo sobre la distribución
de referencia (0.5p)

Las regiones deben ser coherentes con las hipótesis planteadas.

A la vista de los resultados,


¿Se acepta o se rechaza la • Se acepta la hipótesis nula (𝜎 2 ≥ 8). (0.5 p)
hipótesis nula? ¿qué se • Hay evidencia suficiente para afirmar que la varianza no es menor que 8.
concluye? (1 p) (0.5 p)
Las conclusiones deben ser coherentes con el apartado anterior.
Justifique brevemente
b. Utilizando un intervalo de confianza, responda si es posible afirmar que no hay una diferencia
significativa entre el peso medio medido por la balanza A y el medido por la balanza B. Utilice 𝛼 = 5%.
(2 p)

En primer lugar, al ser datos emparejados, se calcula la diferencia de los pesos (Peso A – Peso B):

0.02 0.01 -0.03 0.03 -0.06 -0.01 -0.04

𝑥̅ = −0.0114
𝑠̂ = 0.0334
Se pide contrastar si 𝜇1 − 𝜇2 = 0.
Entonces, por tratarse de una población normal, cuya varianza no se conoce:
0.0334
𝐼. 𝐶. (0.95%): 𝜇1 − 𝜇2 ∈ {−0.0114 ± 2.447 } = [−0.0423; 0.0195] (𝟏 𝒑)
√7
Por lo tanto, debido a que el valor 0 se encuentra dentro del intervalo de confianza (0.5 p), es posible afirmar
que no existe una diferencia significativa entre el peso medio medido por A y el medido por B (0.5 p).

2. A continuación, se muestra el resumen de las


estaturas de un conjunto de estudiantes que han
sido medidos en un estudio.

Además, se sabe que, de los estudiantes


medidos en el estudio, solo 5 practican deporte
con regularidad.

Responda, de manera justificada, a las siguientes preguntas:

a) Con la información con la que se cuenta, ¿es correcto realizar inferencia para la varianza? Responda en un
máximo de dos líneas. (0.5 p)

Sí es correcto, porque la estatura se ajusta a una distribución normal (0.25 p), lo que se evidencia porque el p-valor
de la prueba de normalidad es mayor que el nivel de significación (5%) (0.25 p).

b) Con la información con la que se cuenta, ¿es correcto realizar inferencia para la proporción de estudiantes
que practican deporte con regularidad? Responda en un máximo de dos líneas. (0.5 p)

No es correcto, porque la proporción muestral no se aproxima a una distribución normal (0.25 p), pues 𝑛𝑝̂ 𝑞̂ ≈ 4.5
es menor que 5. (0.25 p).

c) Con la información con la que se cuenta, ¿es correcto realizar inferencia para la estatura media de los
estudiantes? Responda en un máximo de dos líneas. (0.5 p)

Sí es correcto, porque la media muestral se distribuye normalmente (0.25 p), lo que se evidencia porque el p-valor
de la prueba de normalidad es mayor que el nivel de significación (población normal) y porque la muestra es
grande (n>30) (0.25 p). Basta con dar uno de los dos argumentos (pobl. normal o muestra grande).
APELLIDOS:______________________________________________NOMBRE:________________________
NOTA

Sección:___________________

FIRMA
3. Se ha recogido información sobre distintos blogs
educativos, para analizar el número de likes en la última
entrada del blog (variable X). A continuación, se muestra
el resumen, brindado por Minitab, de los datos recogidos:

a) En el resumen hay un p-valor encerrado en un recuadro. Escriba las hipótesis del contraste asociado a ese pvalor.
(0.5 p)

𝐻0 : 𝑋 ~ 𝑁 (80.077, 1866.554)
𝐻1 : 𝑋 ≁ 𝑁 (80.077, 1866.554)

b) ¿Cuál es la interpretación de dicho p-valor? ¿Qué se concluye a partir de él? Responda en un máximo de tres
líneas. (0.5 p)

Interpretación: Probabilidad de que, si X se distribuyera normalmente, se obtengan distancias tan grandes como la de
los datos (0.25 p). Conclusión: Se acepta 𝐻0 , es decir, que X (número de likes) se ajusta a una distribución normal
(0.25 p).

c) Si se toma una muestra aleatoria de 15 blogs, ¿cuál es la probabilidad de que el número medio de likes de los
blogs de dicha muestra sea mayor que 70? (0.5 p)

Si se acepta que: 𝑋 ~ 𝑁 (80.077, 1866.554), entonces se sabe que:


1866.554
𝑋̅ ~ 𝑁 (80.077, ) (𝟎. 𝟐𝟓 𝒑)
15

Si lo anterior no es correcto, el puntaje total es 0.

70−80.77
Se pide: 𝑃(𝑋̅ > 70) = 𝑃 (𝑍 > 43.204⁄ ) = 𝑃(𝑍 > −0.97) = 1 − 0.1660 = 𝟎. 𝟖𝟑𝟒𝟎 (𝟎. 𝟐𝟓 𝐩)
√15
a) ¿El número de habitantes en una vivienda es significativo para predecir la energía consumida en un mes?
Responda, en un máximo de dos líneas. (0.5 p)

Sí, pues el p-valor de la prueba de significatividad es 0 (< 5%) (0.25 p), por lo que se rechaza la hipótesis nula, es
decir, se rechaza que 𝛽1 = 0 (0.25 p).

b) ¿Qué se puede comentar sobre el modelo a partir de la gráfica A? Responda en un máximo de dos líneas.
Debe justificar sus afirmaciones. (0.5 p)

Se puede afirmar que los residuos se ajustan a una distribución normal (0.25 p), pues los puntos se alinean lo
suficiente a la gráfica de probabilidad normal (0.25 p).

Si solo han escrito que los puntos se alinean, pero no han comentado nada sobre la normalidad, el puntaje es 0.

c) ¿Qué se puede comentar sobre el modelo a partir de la gráfica B? Responda en un máximo de dos líneas.
Debe justificar sus afirmaciones. (0.5 p)

Debido a que se evidencia una estructura en los puntos (0.25 p), se puede afirmar que no hay linealidad en el
modelo (0.25 p).

d) Asumiendo que se cumplen las hipótesis básicas del modelo, ¿cuál es la probabilidad de que en una casa con
5 habitantes haya un consumo mayor que 150 KWh en un mes? (0.5 p)

Si se cumplen las hipótesis básicas, entonces, cuando 𝑋 = 5 ℎ𝑎𝑏𝑖𝑡𝑎𝑛𝑡𝑒𝑠: 𝑌 ~ 𝑁 (101.6; 59.8752 )

150−101.6
Se pide: 𝑃(𝑌 > 150) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 0.81) = 1 − 0.7910 = 𝟎. 𝟐𝟎𝟗𝟎
59.875
NOTA REVISADA FIRMA Estadística Básica
Examen Final

Facultad de Ingeniería 3:00 am 2/7/2018


Semestre 2018-I
Duración: 3 h

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de
su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega, pero no se corrige. Entregar el cuadernillo y cada hoja
del enunciado por separado. Tu evaluación será escaneada para prevenir fraude.

Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se
reclame). El reclamo deberá basarse en errores de corrección en base a esa solución. Si simplemente NOTA
se alega que se merece más puntaje, el reclamo no va a prosperar.
1. Sea 𝑋₁ la duración de un filamento de wolframio en espiral simple, y 𝑋₂ la duración usando espiral doble. Se
toma una muestra de tamaño 200 de ambos tipos de filamentos teniéndose unas duraciones medias de 𝑥̅ ₁ = FIRMA

1100 horas, y 𝑥̅ ₂ = 1108 horas. Las varianzas poblacionales de las duraciones de cada tipo de filamento son
𝜎₁² = 20² y 𝜎₂² = 23². Se pide, utilizando 𝜶 = 𝟎. 𝟎𝟓:

Escriba las hipótesis de un contraste


para analizar si el filamento de espiral
doble tiene una duración media mayor
𝐻0 : 𝜇1 ≥ 𝜇2 𝐻1 : 𝜇1 < 𝜇2
que el de espiral simple.(0.5 p)

𝑥̅1 − 𝑥̅2
𝑧= [0.5𝑝]
Escriba la fórmula del estadístico de
𝜎2 𝜎22
contraste y calcule su valor (4 √ 1 +
𝑛1 𝑛2
decimales) (1 p)
1100 − 1108
= = −3.7119 [0.5𝑝]
2 2
√ 20 + 23
200 200

Distribución del estadístico de Como las muestras son grandes (0.25p)


contraste (0.5 p) 𝑍 ∼ 𝑁(0,1) (0.25p)
independientemente de cómo se distribuyan 𝑋1 𝑦 𝑋2
Justifique brevemente (es falso concluir que por ser las muestras grandes entonces 𝑋1 𝑦 𝑋2 son normales)

Calcule el valor crítico y dibuje las


regiones de aceptación y rechazo
sobre la distribución de referencia (1p)

(Debe ser consistente con las hipótesis y el estadístico de contraste)

a) El estadístico de contraste toma un valor en la muestra que cae en la región


de rechazo de Ho. (0.5p)
A la vista de los resultados ¿qué se b) La diferencia entre las duraciones medias encontrada es significativa. Hay
concluye sobre la doble espiral? (1p) evidencia de que los filamentos de espiral doble tienen una mayor duración
Justifique brevemente
media. (0.5p)
(El resultado debe ser consistente con el desarrollo del ejercicio. No vale de nada
acertar ‘por casualidad’)
NOTA
APELLIDOS:______________________________________________NOMBRE:________________________
Sección:___________________
.
FIRMA

2. Los granos de cereales deben estar secos


antes de ser envasados. Unos técnicos de
laboratorio recogen datos sobre la humedad de los granos
después de un tratamiento en el horno. Se realiza con
Minitab una regresión que predice el porcentaje de
humedad (en escala 0-1) en función del tiempo de secado
en el horno, obteniéndose los siguientes resultados:

a. ¿Es el tiempo de secado significativo? Justifica. (1p)

Sí lo es, pues el p-valor del contraste de significatividad individual es 0.000, por lo que se rechaza que 𝛽1 = 0

b. Escribe la ecuación de la regresión. (1p)

𝑌̂ = 0.147 − 0.000911 𝑋, con 𝑌 =porcentahe de humedad, y 𝑋 = tiempo

c. Interpreta los coeficientes de la ecuación de regresión. (1p)

• El término constante (0.147: 14.7%) sería la humedad prevista cuando los cereales pasan 0 unidades de tiempo en el horno
de secado. Es decir, sería la humedad media de los cereales antes de entrar al horno. Es posible que esta interpretación no
sea fiable si no se han observado datos de humedad en esas circunstancias, pues el enunciado dice que los datos utilizados
son “después de un tratamiento en el horno “. (0.5p)

• El término constante dice que por cada unidad de tiempo adicional que estén los cereales en el horno, el contenido medio
de humedad disminuye en 0.0009 (0.09%) (0.5p)

d. Interpreta el coeficiente R-cuad (1p)

El tiempo de permanencia en el horno explica el 45.18% del contenido de humedad de los cereales a la salida del horno

e. ¿Qué puede concluirse de las gráficas de residuos? Justifica. (2p)

• El gráfico de residuos frente a valores previstos muestra un patrón de curvatura, aunque no es muy fuerte. Por tanto, la
linealidad no parece muy buena. (1p)

• El histograma y el gráfico de probabilidad muestran que los residuos no son muy normales, aunque el alejamiento de la
normalidad tampoco es muy acusado. (1p)
APELLIDOS:______________________________________________NOMBRE:_______________________
NOTA

Sección:___________________

FIRMA
3. El Ministerio de Salud ha realizado un estudio sobre el
peso de los niños de 12 años de una ciudad de la región
Lambayeque. Los datos tomados se resumen en la
siguiente tabla brindada por Minitab:

Además, se ha construido el siguiente I.C. para el peso


medio:

Responda a las siguientes preguntas, justificando su respuesta:

a. ¿Es conveniente realizar inferencia para la varianza? (0.5 p)

Sí es conveniente, porque la población de la que proceden los datos se ajusta a una distribución normal. (0.25 p)

Se afirma esto porque el p-valor de la prueba de normalidad (0.494) es mayor que 𝛼 (0.05). (0.25 p)

Si solo han escrito la segunda idea, pero no la primera, no hay puntaje.

b. Un analista supone que la varianza del peso no es mayor que 28.8. Realice un contraste de hipótesis (𝛼 = 10%)
para determinar si los datos apoyan dicha suposición. (3.5 p)

Escriba las hipótesis del contraste 𝐻0 : 𝜎 2 ≤ 28.8 𝐻1 : 𝜎 2 > 28.8


(0.5 p)
Cualquier otra respuesta: 0 p.

Escriba la fórmula del estadístico


de contraste y calcule su valor (4 (𝑛 − 1)𝑠̂ 2 28 × 33.54
χ20 = = = 𝟑𝟐. 𝟔𝟎𝟖𝟑
decimales) (0.5 p) 𝜎02 28.8

Distribución del estadístico de χ20 ~ χ228


contraste (0.5 p)

Justifique brevemente
Porque el peso se ajusta a una distribución normal.
Calcule el valor crítico y dibuje las
regiones de aceptación y rechazo
sobre la distribución de
referencia (0.5p)

Las regiones deben ser coherentes con las hipótesis planteadas.

Debido a que el estadístico de contraste se encuentra en la región de


aceptación:

a) Se acepta 𝐻0 . (0.5 p)
A la vista de los resultados ¿qué b) Se concluye que hay suficiente evidencia para aceptar que la varianza
se concluye? (1p) no es mayor que 28.8; es decir, los datos apoyan la suposición del
analista. (0.5 p)
Justifique brevemente
Las conclusiones deben ser coherentes con las regiones de
aceptación/rechazo definidas, el estadístico de contraste y las hipótesis
planteadas.

χ20 ~ χ228

𝝌𝟐𝟎 = 𝟑𝟐. 𝟔𝟏 → 𝒑 − 𝒗𝒂𝒍𝒐𝒓 ≈ 𝟎. 𝟐𝟓 (0.5 p)


Calcule el p-valor del contraste
(0.5 p) El p-valor debe ser coherente con el estadístico de contraste y las hipótesis
planteadas.

c. Un estudiante afirma que no se tiene la certeza de que la media de la muestra tomada en el estudio pertenece
al intervalo de confianza construido. ¿Es correcta su afirmación? Justifique. (0.5 p)

La afirmación no es correcta, pues, como se puede ver, la media muestral (𝑥̅ = 44.329) se encuentra dentro del

intervalo de confianza. Es evidente, pues el intervalo se construye a partir de la media muestral (𝑋̅ ± 𝐿). (0.5 p)

De lo que no se tiene certeza es si la media poblacional se encuentra en el intervalo de confianza.

Si han respondido a esta pregunta utilizando un contraste de hipótesis, o han respondido que no se tiene la certeza (100%
de seguridad) de que la media pertenece al intervalo: 0 p.
d. Se desea estimar la proporción de padres de familia que conocen sobre alimentación balanceada, con un
margen de error de 2% y un nivel de confianza de 85%. ¿A cuántos padres se debería entrevistar? (1 p)

Para estimar la proporción:


2
√𝑝̂ 𝑞̂
𝑛 = (𝑧𝛼⁄2 × )
𝐿

Se busca:

𝐿 = 0.02

Dado que no se conoce ninguna proporción muestral (𝑝̂ ), uno debe ponerse en el peor de los casos:

𝑝̂ = 0.5 → 𝑞̂ = 1 − 0.5 = 0.5 (0.25 p)

Además, como se quiere un nivel de confianza del 85%:


𝛼
𝛼 = 0.15 → = 0.075 → 𝑧𝛼⁄2 = 𝑧0.075 = 1.44 (0.5 p)
2

Entonces:
2
√0.5×0.5
𝑛 = (1.44 × ) = 1296 (0.25 p)
0.02

Respuesta:

Se debe entrevistar a 1296 padres.


APELLIDOS:______________________________________________NOMBRE:________________________
NOTA

Sección:___________________

FIRMA

4. Se ha determinado que el tiempo que demora un programa informático en ejecutar una tarea es una variable
uniforme continua, definida entre 0 y 𝑘. Se desea estimar el parámetro 𝑘, por lo que se toman los datos de
6 tiempos de ejecución (segundos), resultando los siguientes valores: 0.87, 0.97, 0.92, 0.89, 0.85, 0.89

Responda a las siguientes preguntas, justificando su respuesta:

a. Estime 𝑘 utilizando el método de los momentos. (1 p)

𝑋 es una variable uniforme continua:

𝑋 ~ 𝑈 (0, 𝑘)

1
𝑓(𝑥) =
𝑘−0
𝑘+0 𝑘
𝐸(𝑋) = 𝜇 = =
2 2
Por el método de los momentos:

1) 𝑘 = 2𝜇 = 2 × 𝑀1 (0.25 p)

̂1 = 𝑚1 = 𝑋̅
2) 𝑀

̂ = 𝟐×𝑴
3) 𝒌 ̂ 𝟏 = 𝟐𝑿
̅ (0.25 p)

Se sabe que:

0.87 + 0.97 + 0.92 + 0.89 + 0.85 + 0.89


𝑥̅ = = 0.8983
6
Entonces:

𝑘̂ = 2 × 𝑀
̂1 = 2𝑥̅ = 2 × 0.8983 = 𝟏. 𝟕𝟗𝟔𝟔 (0.5 p)

̂ , con 𝒌.
Para tener el puntaje completo, no deben haber confundido 𝒌

b. Calcule el error cuadrático medio del estimador cuando 𝑘 = 1.5 (1.5 p).

a) Sesgo (0.5 p):

𝑆𝑒𝑠𝑔𝑜(𝑘̂) = 𝐸(𝑘̂ ) − 𝑘 = 𝐸(2𝑋̅) − 2𝜇 = 2 × 𝐸(𝑋̅) − 2𝜇 = 2𝜇 − 2𝜇 = 0

b) Varianza (0.5 p):

(𝑘 − 0)2 (1.5 − 0)2


𝜎2 12 12
𝑉𝑎𝑟(𝑘̂ ) = 𝑉𝑎𝑟(2𝑋̅) = 22 × 𝑉𝑎𝑟(𝑋̅) = 4 × =4× =4× = 0.125
6 6 6

2
Entonces: 𝐸𝐶𝑀(𝑘̂) = 𝑆𝑒𝑠𝑔𝑜(𝑘̂) + 𝑉𝑎𝑟(𝑘̂ ) = 02 + 0.125 = 𝟎. 𝟏𝟐𝟓 (0.5 p)
APELLIDOS:______________________________________________NOMBRE:________________________
NOTA

Sección:___________________

FIRMA

5. Un grupo de estudiantes ha realizado una toma de datos en una cafetería, registrando información sobre 23
clientes. En primer lugar, han tomado los datos del monto pagado por cada uno, cuyo resumen se muestra
a continuación:

Además, han registrado que 11 clientes pagaron en efectivo.

Responda a las siguientes preguntas:

a. Se desea estimar, utilizando un intervalo de confianza el monto medio que paga un cliente. ¿Es correcto realizar
dicha estimación? Justifique su respuesta. Si es así, construya el intervalo de confianza. (1 p)

No sería correcto, pues la variable no se ajusta a una distribución normal (0.25 p) (p-valor de la prueba de
normalidad es menor que el nivel de significación, 0.05 (0.25 p)).

Además, se cuenta con 23 datos, por lo que la muestra no es grande (0.5 p).

b. Se desea estimar, utilizando un intervalo de confianza, la proporción de clientes que pagan en efectivo. ¿Es
correcto realizar dicha estimación? Justifique su respuesta. Si es así, construya el intervalo de confianza. (1 p)

Por la información que se tiene:

11 12
𝑝̂ = = 0.4783 → 𝑞̂ = = 0.5217
23 23
Par realizar inferencia para la proporción, se debe comprobar que 𝑝̂ se distribuya normalmente. Para ello, se
verifica que:

𝑛𝑝̂ 𝑞̂ > 5

23 × 0.4783 × 0.5217 = 5.74 > 5 (0.25 p)

Entonces, sí es correcto realizar inferencia para la proporción (0.25 p). Se construye un intervalo de confianza
del 95%:

𝑝̂ 𝑞̂
𝐼. 𝐶. (0.95): 𝑝 ∈ {𝑝̂ ± 𝑧0.025 × √ }
23

0.4783 × 0.5217
𝐼. 𝐶. (0.95): 𝑝 ∈ {0.4783 ± 1.96 × √ }
23

𝑰. 𝑪. (𝟎. 𝟗𝟓): 𝒑 ∈ [𝟎. 𝟐𝟕𝟒𝟏; 𝟎. 𝟔𝟖𝟐𝟓] (0.5 p)


NOTA REVISADA FIRMA Estadística Básica
Parcial

Facultad de Ingeniería 3:00 pm 7/5/2018


Semestre 2018-I
Duración: 3h

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de
su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega, pero no se corrige. Entregar el cuadernillo y cada hoja
del enunciado por separado.

Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se
reclame). El reclamo deberá basarse en errores de corrección en base a esa solución. Si simplemente NOTA
se alega que se merece más puntaje, el reclamo no va a prosperar.
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3 FIRMA
si la elección es incorrecta). No hay que justificar.

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.1 Sea X una variable aleatoria discreta, si x=20 es el percentil 30, entonces necesariamente 𝐹(20) = 0.30
1.2 Sea X una variable aleatoria discreta, si x=20 es el percentil 30, entonces necesariamente 𝐹(20) ≤ 0.30
1.3 Sea X una variable aleatoria discreta, si x=20 es el percentil 30, entonces necesariamente 𝐹(20) ≥ 0.30 X

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.4 Si a un conjunto de datos se le suma una constante 𝑐 < 0, la varianza queda multiplicada por 𝑐 2
1.5 Si a un conjunto de datos se le suma una constante 𝑐 < 0, el coeficiente de asimetría no cambia X
1.6 Si a un conjunto de datos le multiplicamos por una constante 𝑐 > 0, la curtosis aumenta

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.7 𝐸(𝑎𝑋 + 𝑏𝑌) = 𝑎𝐸(𝑋) + 𝑏𝐸(𝑌) sólo si 𝑋 e 𝑌 son independientes
1.8 𝑉𝑎𝑟(𝑎𝑋 + 𝑏𝑌) = 𝑎𝑉𝑎𝑟(𝑋) + 𝑏𝑉𝑎𝑟(𝑌) sólo si 𝑋 e 𝑌 son independientes
1.9 Si X e Y son independientes, 𝑉𝑎𝑟(2𝑋 − 2𝑌) = 4𝑉𝑎𝑟(𝑌 + 𝑋) X

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.10 Si X es una variable aleatoria continua y 𝑃(𝑋 = 1) = 0, entonces el 1 no está en su espacio muestral
1.11 Si X es continua y 𝑓(1) = 0 entonces el 1 es un suceso imposible X
1.12 Si X es continua y 𝑓(2) = 1 entonces el 2 es el suceso seguro

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.13 Si A y B son sucesos independientes 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴)[1 + 𝑃(𝐵)] + 𝑃(𝐵)
1.14 Si A y B son sucesos equiprobables 𝑃(𝐴|𝐵) = 𝑃(𝐵|𝐴) X
1.15 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴|𝐵)𝑃(𝐵) si y sólo si A y B son independientes
Esta página debe permanecer vacía. No se corregirá ningún procedimiento en la pregunta 1.
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________

FIRMA
2. Un aerogenerador (molino de viento) genera una potencia entre 0 y su capacidad
máxima en función de la velocidad del viento. Sea 𝑋 una variable aleatoria continua definida
en el intervalo [0,1] que representa la proporción de la potencia instalada que genera dicho
aerogenerador en un instante determinado. Su función de densidad viene determinada por

𝑓(𝑥) = 𝑘(𝑥 − 𝑥 4 ) 𝑥 ∈ [0,1]

Se pide, justificando la respuesta:


a) Demuestra que 𝑘 = 10/3.
b) Calcula la moda.
c) Calcula la función de distribución.
d) Calcula la probabilidad de que el aerogenerador genere una potencia superior al 75% de su capacidad máxima
en un instante determinado.
e) Calcula la proporción del tiempo que este aerogenerador generará una potencia inferior al 10% de su
capacidad máxima.
f) Si la capacidad máxima instalada es de 1.5 MW, ¿qué potencia, en MW, genera por término medio este
aerogenerador?
g) Calcula la varianza de 𝑋.
h) Se sabe que el aerogenerador está generando una potencia superior a su media, ¿cuál es la probabilidad de
que esté funcionando por encima del 80% de su capacidad?

Solución:

a) Una función de densidad debe integrar uno en el espacio muestral. Por tanto,
1 1
3 10
∫ 𝑘(𝑥 − 𝑥 4 )𝑑𝑥 = 1 ⇒ 𝑘 ∫ (𝑥 − 𝑥 4 )𝑑𝑥 = 𝑘 =1⇒𝑘=
0 0 10 3

b) La siguiente figura es la representación de 𝑓(𝑥).

Vemos que en los extremos vale 0, por lo que el máximo estará en algún valor intermedio. Como es una función suave
(derivable), en el máximo habrá una tangente horizontal, y se anulará su primera derivada. Derivando:

10
𝑓 ′ (𝑥) = (1 − 4𝑥 3 ) = 0 ⇒ 4𝑥 3 = 1
3
1
⇒ 𝑀𝑜𝑑𝑎 = 3 = 0.630
√4
c) La función de distribución es:
𝑥
𝐹(𝑥) = ∫ 𝑓(𝑢)𝑑𝑢
−∞
como
𝑥
10 5 2
∫ (𝑢 − 𝑢4 )𝑑𝑢 = 𝑥 2 − 𝑥 5 ,
0 3 3 3

se tiene:
0 𝑠𝑖 𝑥 < 0
5 2 2 5
𝐹(𝑥) = { 𝑥 − 𝑥 𝑠𝑖 0 ≤ 𝑥 ≤ 1
3 3
1 𝑠𝑖 𝑥 > 1

d) Nos piden 𝑃(𝑋 > 0.75).


1
10
𝑃(𝑋 > 0.75) = ∫ (𝑥 − 𝑥 4 )𝑑𝑥 = 1 − 𝐹(0.75) = 0.22.
0.75 3
e) Nos piden 𝑃(𝑋 < 0.10)
0.1
10
𝑃(𝑋 < 0.10) = ∫ (𝑥 − 𝑥 4 )𝑑𝑥 = 𝐹(0.10) = 0.017.
0 3
f) La esperanza de esta variable es
1
10
𝜇 = 𝐸(𝑋) = ∫ 𝑥 (𝑥 − 𝑥 4 )𝑑𝑥 = 0.556
0 3
Es decir, por término medio genera el 55.6% de la capacidad instalada. Como ésta es 1.5 MW, generará por término
medio
0.5556 × 1.5 = 0.8333 𝑀𝑊
g) La varianza es
1
10
𝑉𝑎𝑟(𝑋) = ∫ (𝑥 − 0.5556)2 (𝑥 − 𝑥 4 )𝑑𝑥 = 0.0485.
0 3

h) Nos piden 𝑃(𝑋 > 0.8|𝑋 > 0.5556)


𝑃[(𝑋 > 0.8) ∩ (𝑋 > 0.556)]
𝑃(𝑋 > 0.8|𝑋 > 0.556) =
𝑃(𝑋 > 0.556)
𝑃(𝑋 > 0.8) 1 − 𝐹(0.8) 0.152
= = = = 0.292.
𝑃(𝑋 > 0.556) 1 − 𝐹(0.556) 0.52
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________

FIRMA
3. Complete la siguiente tabla con la información solicitada:

- En la columna “modelo de probabilidad” (0.25 p), escriba únicamente qué modelo de probabilidad
describe mejor a la variable 𝑋 (binomial, uniforme continua, uniforme discreta, etc.). De escribir dos o más
modelos, la respuesta se invalida. Si el modelo escrito es incorrecto, todo el apartado se invalida.
- En la columna “parámetros” (0.25 p), escriba únicamente los parámetros que definen al modelo de probabilidad y
su valor numérico. Si los parámetros son incorrectos, se invalida también la probabilidad calculada. De escribir un
parámetro que no es el que define al modelo, la respuesta se invalida.
- En la columna “probabilidad” (0.5 p), escriba únicamente la respuesta de la probabilidad calculada con una precisión
de 4 decimales. No debe escribir ningún procedimiento. De escribir dos o más valores, alguna explicación adicional
(numérica o escrita), o no utilizar 4 decimales, la respuesta se invalida.

Modelo de Parámetro(s) que


Variable (𝑿) Probabilidad Puntaje
probabilidad de 𝑿 define(n) al modelo

(a) La gerente de un restaurante


de comida rápida está interesada
en estudiar los reclamos
realizados por los clientes. Por 1 𝑟𝑒𝑐𝑙𝑎𝑚𝑜𝑠
información histórica, se sabe λ= Probabilidad de que
14 𝑑í𝑎
que, en promedio, se realiza 1 pasen más de 15 días.
reclamo cada 2 semanas (semana Exponencial
de 7 días), de manera 0.3425
No es válido si han
independiente. Un cliente acaba 𝟏 𝒓𝒆𝒄𝒍𝒂𝒎𝒐
de realizar un reclamo; 𝑋 es el escrito 𝟏𝟒 𝒅í𝒂𝒔
tiempo (días) que pasará hasta
que un cliente presente otro
reclamo.

(b) La temperatura (°C) de una Probabilidad de que


persona sigue una distribución más de la mitad de las
𝑁(36,1). Se realiza un estudio con personas en estudio
una muestra de 18 personas para tengan una
𝑛 = 18 temperatura superior
averiguar ( 𝑋 ) el número de Binomial
𝑝 = 0.5
personas de la muestra cuya a 36 °C.
temperatura es mayor que 36°C.
0.4073

(c) Se desea elegir al azar a una


persona de un grupo de 12
voluntarios. Para ello, se asigna un
número entero del 1 al 12 (sin Uniforme discreta Probabilidad de que
repetición) a cada voluntario y salga escogido el 4, 5,
No es válido si solo 6, 7 u 8.
luego se realiza un sorteo, 𝑎=1
han escrito
seleccionando aleatoriamente “uniforme”, pero no
𝑏 = 12
uno de los números. Siendo 𝑋 el han aclarado que es 0.4167
número elegido en el sorteo, ¿qué discreta.
distribución sigue 𝑋?
(d) En una planta se envasa agua
de mesa en diferentes
presentaciones. Se sabe que el
agua en el tanque de
almacenamiento tiene algunas
partículas, que, hasta cierto nivel, Probabilidad de que no
son inofensivas para la salud. haya partículas en una
Además, se conoce que las botella de agua de 2.5
impurezas aparecen de manera 𝑝𝑎𝑟𝑡.
Poisson λ = 0.0125 litros.
estable e independiente y que se 2.5 𝑙
encuentran, en promedio, 5
0.9876
partículas por cada 1000 litros de
agua. Se desea conocer ( 𝑋 ) el
número de impurezas que se
encuentran en una botella de
agua de 2.5 litros.

(e) Un futbolista profesional se ha


especializado en tiros libres. Tiene
el mejor récord de su equipo,
pues, en promedio, 7 de cada 10 Probabilidad de que al
tiros libres que ha pateado, han menos tres tiros libres
resultado en gol. Si, durante un 𝑛=5 resulten en gol.
determinado partido, este Binomial
𝑝 = 0.7
futbolista tiene la oportunidad de
0.8369
patear 5 tiros libres, 𝑋 es el
número de tiros libres que
resultan en gol.

(f) A un concurrido centro


comercial llegan clientes con un 𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
ritmo medio de 500 por hora. Se λ = 2500
5ℎ Probabilidad de que
sabe, además, que las llegadas lleguen más de 2400
son independientes. Se desea clientes en 5 horas.
estudiar la variable 𝑋 , que Poisson
representa el número de clientes Por ser 𝝀 > 𝟓, por TCL,
que llegan en un periodo de 5 se puede usar la 0.9772
aproximación a la
horas.
normal.

Esta parte de la hoja debe permanecer vacía. No se corregirá ningún procedimiento en la pregunta 3.
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________

FIRMA
4. Una planta tiene diversas áreas de trabajo, independientes entre sí. En el área A, se cuenta con un
horno de inducción para la fusión de cobre. La temperatura de dicho horno (𝑇1 ) es una variable normal
con una media de 1183°C y una desviación estándar de 50°C. Por otro lado, en el área B, se cuenta con
un horno para calentar acero. En este horno, la temperatura (𝑇2 ) es una variable normal con media
500°C y desviación estándar de 60°C. Asimismo, en el área C, un operario realiza el pulido de hierro durante un tiempo
(𝑋) que se distribuye como una exponencial de media 12 minutos.

Los requerimientos del proceso son los siguientes:

- La temperatura de fusión del cobre es de 1085°C, por lo que la temperatura del horno para este proceso debe ser
superior a dicho valor.
- El acero debe calentarse entre 400°C y 550°C para alcanzar un módulo de elasticidad apropiado para el trabajo del
acero en la planta.

Responda las siguientes preguntas, mostrando su procedimiento:

a) ¿Cuál es la probabilidad de que el horno en el área A no esté a una temperatura adecuada para fundir el cobre?
(0.5 p)
b) ¿Cuál es la probabilidad de que el pulido de hierro se realice en, al menos, 12 minutos? (0.5 p)
c) La temperatura del horno en el área B se encuentra dentro del intervalo adecuado para trabajar el acero. ¿Cuál es
la probabilidad de que dicha temperatura esté por encima de los 500°C? (1 p)
d) ¿Cuál es la probabilidad de que la tarea de pulido de hierro se realice en un tiempo total menor que 10 minutos, si
el operario lleva trabajando ya 4 minutos? (1 p)
e) ¿Cuál debe ser el valor de la desviación estándar de 𝑇2 para que la probabilidad de que dicha temperatura sea
menor que 350 sea 2.5%? (1 p)

SOLUCIÓN

a)

Se pide: 𝑃(𝑇1 ≤ 1085)

Se sabe que: 𝑇1 ~ 𝑁(1183, 502 )

Entonces:

1085 − 1183
𝑃(𝑇1 ≤ 1085) = 𝑃 (𝑍 ≤ ) = 𝑃(𝑍 ≤ −1.96) = 𝟎. 𝟎𝟐𝟓 (𝟎. 𝟓 𝒑)
50

Se corregirá todo el procedimiento. Si hay algún error, el puntaje es cero (0).

b)

Se pide: 𝑃(𝑋 ≥ 12)

1
Se sabe que: 𝑋 ~ 𝐸𝑥𝑝 ( )
12

Entonces:
1
𝑃(𝑋 ≥ 12) = 𝑒 −12×12 = 𝑒 −1 = 𝟎. 𝟑𝟔𝟕𝟗 (𝟎. 𝟓 𝒑)
Se corregirá todo el procedimiento. Si hay algún error, el puntaje es cero (0).
c)

Se pide: 𝑃(𝑇2 > 500 | 400 < 𝑇2 < 550) (𝟎. 𝟐𝟓 𝒑)

Si lo anterior está mal planteado, el puntaje total es cero (0).

Se sabe que: 𝑇2 ~ 𝑁(500, 602 )

Entonces:

𝑃[(𝑇2 > 500 ) ∩ (400 < 𝑇2 < 550)] 𝑃(500 < 𝑇2 < 550)
𝑃(𝑇2 > 500 | 400 < 𝑇2 < 550) = =
𝑃(400 < 𝑇2 < 550) 𝑃(400 < 𝑇2 < 550)

550 − 500 500 − 500


𝑃(𝑇2 < 550) − 𝑃(𝑇2 < 500) 𝑃 (𝑍 < ) − 𝑃 (𝑍 < )
= (𝟎. 𝟐𝟓 𝒑) = 60 60
𝑃(𝑇2 < 550) − 𝑃(𝑇2 < 400) 550 − 500 400 − 500
𝑃 (𝑍 < ) − 𝑃 (𝑍 < )
60 60

𝑃(𝑍 < 0.83) − 𝑃(𝑍 < 0) 0.7967 − 0.5


= = = 𝟎. 𝟑𝟗𝟔𝟎 (𝟎. 𝟓 𝒑)
𝑃(𝑍 < 0.83) − 𝑃(𝑍 < −1.67) 0.7967 − 0.0475

d)

Se pide: 𝑃(𝑋 < 10 | 𝑋 > 4) (𝟎. 𝟐𝟓 𝒑)

Si lo anterior está mal planteado, el puntaje total es cero (0).

1
Se sabe que: 𝑋 ~ 𝐸𝑥𝑝 ( )
12

Entonces:

𝑃(𝑋 < 10 ∩ 𝑋 > 4) 𝑃(4 < 𝑋 < 10)


𝑃(𝑋 < 10 | 𝑋 > 4) = =
𝑃(𝑋 > 4) 𝑃(𝑋 > 4)
1 1
− ×10
𝑃(𝑋 < 10) − 𝑃(𝑋 < 4) (1 − 𝑒 12 ) − (1 − 𝑒 −12×4 )
= (𝟎. 𝟐𝟓 𝒑) = 1 = 0.3935 (𝟎. 𝟓 𝒑)
𝑃(𝑋 > 4)
𝑒 −12×4

e)

Se pide: 𝝈, 𝑡𝑎𝑙 𝑞𝑢𝑒 𝑃(𝑇2 < 350) = 0.025

Se sabe que: 𝑃(𝑍 < −1.96) = 0.025 (por tablas) (𝟎. 𝟐𝟓 𝒑)

Entonces:

350 − 500
𝑃(𝑇2 < 350) = 𝑃 (𝑍 < ) = 0.025 = 𝑃(𝑍 < −1.96)
𝝈

350 − 500
→𝑍= = −1.96
𝝈

𝝈 = 𝟕𝟔. 𝟓𝟑 (𝟎. 𝟕𝟓 𝒑)
NOTA REVISADA FIRMA Estadística Básica
Práctica 4

Facultad de Ingeniería 7:10 am 15/6/2018


Semestre 2018-I
Duración: 1h45m

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de
su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega, pero no se corrige. Entregar el cuadernillo y cada hoja
del enunciado por separado. Tu evaluación será escaneada para prevenir fraude.

Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se
reclame). El reclamo deberá basarse en errores de corrección en base a esa solución. Si simplemente NOTA
se alega que se merece más puntaje, el reclamo no va a prosperar.
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3 FIRMA
si la elección es incorrecta). No hay que justificar. Salvo que se indique lo contrario, se usará 𝛼 = 0.05.

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.1 Si los valores de un intervalo de confianza de 𝜇 son todos positivos no podremos rechazar que 𝜇 = 0.

1.2 Siempre se puede aumentar el margen de error aumentando el tamaño muestral


A igualdad del resto de factores, los intervalos de confianza de 𝜇 basados en la t de Student son más
1.3
anchos que los basados en la normal X
Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)
2
1.4 Los intervalos de confianza de 𝜎 2 basados en la distribución 𝜒𝑛−1 sólo son válidos si n→ ∞
1.5 2
Los intervalos de confianza de 𝜎 2 basados en la distribución 𝜒𝑛−1 sólo son válidos si la población es normal X
2 2
1.6 Los intervalos de confianza de 𝜎 basados en la 𝜒𝑛−1 sólo son válidos si contienen a la varianza muestral

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.7 Si encuestamos a 400 personas podremos estimar una proporción con un margen de error inferior a 0.05 X
1.8 Para rechazar 𝐻𝑜 : 𝑝 ≥ 0.3 es suficiente con que 𝑝̂ < 0.3
1.9 La proporción muestral se aproxima suficientemente a la normal si 𝑝(1 − 𝑝) > 5

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.10 𝑡15;0.025 < 𝑧0.05
1.11 𝑡15;0.025 = −𝑡15;0.975 X
2 2
1.12 𝜒15;0.02 = −𝜒15;0.98

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


Se realiza el contraste con 𝐻0 : 𝜇 ≥ 10 y se obtiene un pvalor de 0.01. Entonces el contraste con 𝐻0 : 𝜇 ≤ 10
1.13
tendrá un pvalor de 0.99 X
Se realiza el contraste con 𝐻0 : 𝜇 ≥ 10 y se obtiene un pvalor de 0.01. Entonces el contraste con 𝐻0 : 𝜇 = 10
1.14
tendrá también un pvalor de 0.01
1.15 En un contraste con 𝐻0 : 𝜇 ≥ 10, el pvalor será el área que queda a la izquierda del valor crítico
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________

2. Un fabricante de fertilizantes para plantas desea desarrollar una fórmula de fertilizante que produzca
FIRMA
el mayor aumento en la altura de las plantas. Para probar las fórmulas de fertilizantes, un científico
prepara dos grupos de 15 plántulas idénticas (plántula=semilla recién germinada). Al primero de los
grupos le aplica el fertilizante, llamado FertiPlan. El segundo grupo será el de control, al que no se
aplicará ningún fertilizante. Las plantas permanecen tres meses en un ambiente de invernadero controlado. Al finalizar
dicho periodo, el científico mide la altura de las plantas. La siguiente tabla resume los resultados:

Fertilizante N Media Desv. Est


1 FertiPlan 15 22 4.57
2 Ninguno 15 20 5.00

Asumiremos que no hay valores atípicos, que la altura de las plantas sigue una distribución normal, y que la varianza
poblacional de las alturas es la misma en ambos grupos. Se pide, utilizando 𝜶 = 𝟎. 𝟎𝟓:

Escriba las hipótesis de un contraste para


analizar si el fertilizante ayuda en el 𝐻0 : 𝜇1 ≤ 𝜇2 𝐻1 : 𝜇1 > 𝜇2
crecimiento medio de las plantas. (0.5 p)

𝑥̅1 − 𝑥̅2 22 − 20
𝑡0 = = = 1.1435
Escriba la fórmula del estadístico de 1 1 1 1
contraste y calcule su valor (4 decimales)
𝑠̂ 𝑇 √ +
𝑛1 𝑛2 4.7898√ +
15 15
(1 p)
Se usa el estimador conjunto de 𝜎 2 :
(𝑛1 − 1)𝑠̂12 + (𝑛2 − 1)𝑠̂22
𝑠̂ 𝑇2 = = 22.9425 ⇒ 𝑠̂ 𝑇 = 4.7898
𝑛1 + 𝑛2 − 2

Distribución del estadístico de contraste Como la población es normal, y las varianzas poblacionales iguales:
(0.5 p) 𝑡0 ~𝑡𝑛1−𝑛2−2 = 𝑡28
(si no justifica o justifica erróneamente,por ejemplo, diciendo que es solo
Justifique brevemente porque la muestra es pequeña, 0.25p)

De 𝐻1 puede deducirse
Calcule el valor crítico y dibuje las que la región de rechazo
regiones de aceptación y rechazo sobre la está a la derecha de la
distribución de referencia (1p) distribución, por tanto,
el valor crítico es

𝑡28;0.05 = 1.701

a. Como 𝑡0 = 1.14 está en la región de aceptación, no podemos rechazar 𝐻0


A la vista de los resultados ¿qué se con 𝛼 = 0.05.
concluye sobre el fertilizante? (1p) b. No hay evidencia suficiente de que el fertilizante ayude en el crecimiento
de las plantas
Justifique brevemente
Deben tener ambas conclusiones (“a” y “b”) correctas. Si sólo pone una 0.5p

De las tablas de la normal se obtiene:


Calcule el pvalor utilizando una
aproximación a la normal e interprételo. 𝑃(𝑧 > 1.14) = 0.1271 > 0.05,
(1p)
por tanto, nos encontramos en la región de rechazo de 𝐻0
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________

FIRMA
3. Se ha realizado un estudio en una empresa de transporte que presta servicio exclusivo a una empresa
cervecera. El estudio se ha enfocado en el tiempo (en minutos) de viaje de cada camión en la ruta
desde la planta de producción hasta un centro de distribución en Chiclayo. Se ha identificado que dicho
tiempo se distribuye normalmente y se han tomado 20 datos, a partir de los cuales se han calculado
las siguientes medidas descriptivas en Minitab:

a. Realice un contraste de hipótesis para comprobar si, a partir de los datos, es posible afirmar que el tiempo medio
de transporte en la ruta en estudio es superior a los 335 minutos. Utilice un nivel de significación de 2%.

𝑯𝟎 : 𝝁 ≤ 𝟑𝟑𝟓 𝑯𝟏 : 𝝁 > 𝟑𝟑𝟓

Hipótesis (0.5 p) En ambas conclusiones deben estar presentes el símbolo de la media


poblacional (𝛍, no 𝐱̅ ni otro estadístico o parámetro) y el valor de la
media hipotética (335), de lo contrario: 0 p.

𝑥̅ − 𝜇0 339 − 335
Estadístico de contraste (0.5 p) 𝑡0 = = = 0.5023
𝑠̂⁄ 35.61⁄
Indique el símbolo que lo representa, √𝑛 √20
su fórmula, y su valor numérico.
Si el valor es correcto: 0.5 p.
Utilice una precisión de 4 decimales.
Si el valor es incorrecto: 0 p.
Como la población es normal
Distribución del estadístico de
𝑇0 ~ 𝑡19
contraste (0.5 p)
(si no justifica, o lo hace mal, por ejemplo, diciendo que solo
justifica brevemente
es porque la muestra es pequeña, 0.25p)
Si los tres apartados anteriores (hipótesis, estadístico y distribución) son correctos, se continúa con la
corrección.
Si al menos uno es incorrecto, no se corrige el siguiente apartado (conclusión).

JUSTIFICACIÓN (0.5 p):

Conclusión del contraste (1 p)

JUSTIFICACIÓN: el estadístico de contraste se encuentra en la


Responda: región de aceptación (< 2.205).
 ¿Acepto o rechazo Ho?
(El valor 2.205 debe estar presente en esta opción de respuesta, de
 ¿Se puede afirmar que el tiempo
lo contrario se considera incorrecta).
medio es mayor que 335 minutos?
Si no han justificado o han justificado incorrectamente, no se corrige
la conclusión.
Debe justificar su conclusión.
CONCLUSIÓN (0.5 p):
a. Se acepta la hipótesis nula (Ho).
b. No hay evidencia para afirmar que el tiempo medio es mayor
que 335.

Deben tener ambas conclusiones (“a” y “b”) correctas (0.5 p). De lo


contrario: 0 p.
b. Utilizando un intervalo de confianza, responda: ¿es posible afirmar que la varianza tiene un valor de 1000?
Utilice 𝛼 = 1%. (2.5 p)

SOLUCIÓN:

En primer lugar, se construye el intervalo de confianza:

(𝑛 − 1)𝑠̂ 2 (𝑛 − 1)𝑠̂ 2
𝐼. 𝐶. (0.99): 𝜎 2 𝜖 [ 2 ; ]
χ𝑛−1,0.005 χ2𝑛−1,0.995

19 × 35.612 19 × 35.612
𝐼. 𝐶. (0.99): 𝜎 2 𝜖 [ ; ] = [624.50; 3522.42] (𝟏 𝒑)
38.58 6.84

Si el intervalo es correcto: 1 p.
Si el intervalo es incorrecto: 0 p.

Para evaluar si es posible afirmar si la varianza tiene un valor de 1000, se comprueba si dicho valor pertenece al
intervalo de confianza:

Para esta parte, considerar el intervalo de confianza construido como “correcto”. Es decir, no considerar ‘arrastre de error’.

1000 pertenece al I.C., por lo tanto, se acepta la hipótesis nula (𝝈𝟐 = 𝟏𝟎𝟎𝟎). Se puede afirmar que la varianza
tiene un valor de 1000. (1. 5 p)

Si el intervalo de confianza que han construido no contiene a 1000, debe decir: no se puede afirmar que la varianza tiene un
valor de 1000.
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________

4. El Ministerio de Educación de un país ha implementado un programa de becas que da a los egresados


universitarios la oportunidad de estudiar maestrías y doctorados en distintas universidades en el FIRMA
mundo. Se desea conocer la evolución del programa, por lo que se pretende estimar la proporción de
ex becarios que lograron concluir sus estudios. Responda, de manera justificada:

a. ¿A cuántos ex becarios se debe incluir en una muestra para estimar dicha proporción con un máximo margen de
error de 3.5% y un nivel de confianza del 90%? (2 p)

SOLUCIÓN

𝑝̂ 𝑞̂
𝑛 = (𝑧0.05 )2 ×
0.0352
Ya que no se conoce 𝑝̂ , hay que ponerse en el “peor de los casos”: 𝑝̂ = 0.5.

0.5 × 0.5
𝑛 = (1.645)2 ×
0.0352
𝑛 = 552.25 (𝟏 𝒑) ≈ 553 (𝟏 𝒑)

 ̂, el puntaje es 1p.
Si han utilizado otro valor de 𝒑
 Si no han redondeado, el puntaje es 1.5 p.
 Si han redondeado hacia abajo (n = 552), el puntaje es 1.5 p.

b. Un analista del Ministerio ha tomado una muestra de 1200 ex becarios, de los cuales 72 no lograron concluir sus
estudios. Con base en dicha información, ha afirmado que la proporción de ex becarios que no lograron concluir
sus estudios no supera el 7%. Realice un contraste de hipótesis (𝛼 = 1.5%) para comprobar si los datos apoyan
dicha afirmación.

𝑯𝟎 : 𝒑 ≤ 𝟎. 𝟎𝟕 𝑯𝟏 : 𝒑 > 𝟎. 𝟎𝟕
Hipótesis (0.5 p) En ambas hipótesis deben estar presentes el símbolo de la
proporción poblacional (𝒑) y el valor de la proporción hipotética
(0.03), de lo contrario: 0 p.

𝑝̂ − 𝑝0 0.06 − 0.07
𝑍0 = = = −1.3577
Estadístico de contraste (0.5 p) 𝑝 𝑞
√ 0 0 √0.07 × 0.93
𝑛 1200
Indique el símbolo que lo representa,
su fórmula, y su valor numérico. Si el valor es correcto: 0.5 p.
Utilice una precisión de 4 decimales. Si el valor es incorrecto: 0 p.

Como la muestras es suficientemente grande (np(1-p)>5) 𝑍0


Distribución del estadístico de puede aproximarse con una normal
contraste (0.5 p)
𝑍0 ~ 𝑁(0,1)
Justifique brevemente
(si no justifican o la justificación es errónea, 0.25p)

Si los tres apartados anteriores (hipótesis, estadístico y distribución) son correctos, se continúa con la
corrección.

Si al menos uno es incorrecto, no se corrigen los siguientes apartados (p-valor y conclusión).

Solo hay dos posibles respuestas:

𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 1 − 0.0885 = 0.9115


p-valor del contraste (0.5 p)
𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 1 − 0.0869 = 0.9131
JUSTIFICACIÓN (0.5 p):

Es posible justificar (1) usando el p-valor, o (2) usando el valor crítico.

OPCIÓN 1:

Debido a que el p-valor es mayor que el nivel de significación


(𝛼 = 0.015).

OPCIÓN 2:

Conclusión del contraste (1 p)

Responda:
 ¿Acepto o rechazo Ho?
 ¿Qué se concluye?
JUSTIFICACIÓN: el estadístico de contraste se encuentra en la
región de aceptación (< 2.18).

Debe justificar su conclusión. (El valor 2.18 debe estar presente en esta opción de respuesta).

Si no han justificado o han justificado incorrectamente, no se corrige


la conclusión.

CONCLUSIÓN (0.5 p):

a. Se acepta la hipótesis nula (Ho).


b. No hay evidencia para afirmar que la proporción de ex
becarios que no concluyeron sus estudios es mayor que el
7%.

Deben tener ambas conclusiones (“a” y “b”) correctas (0.5 p).


De lo contrario: 0 p.
NOTA REVISADA FIRMA Estadística Básica
Sustitutorio

Facultad de Ingeniería 13/12/2018


Semestre 2018-II 3 horas

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________

No se puede consultar ninguna documentación salvo las tablas y el formulario de la asignatura. Con calculadora. Contesta cada pregunta sólo
en la hoja de su enunciado. El cuadernillo no se entrega. Salvo que se indique otra cifra, usa 𝜶 = 𝟎. 𝟎𝟓.
Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.

NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta. En
cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar.

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)


1.1 Sea X una variable aleatoria discreta, si x=10 es el percentil 25, entonces necesariamente 𝐹(0.25) = 10

1.2 Sea X una variable aleatoria discreta, si x=10 es el percentil 25, entonces necesariamente 𝐹(10) ≤ 0.25

1.3 Sea X una variable aleatoria discreta, si x=10 es el percentil 25, entonces necesariamente 𝐹(10) ≥ 0.25 X

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.4 Si 𝑋 ∼ 𝑃𝑜𝑖(𝜆1 ) y 𝑌 ∼ 𝑃𝑜𝑖(𝜆2 ) e independientes, entonces 𝐸(𝑋 + 𝑌) = 𝑉𝑎𝑟(𝑋 + 𝑌) X


1.5 Si 𝑋 ∼ 𝐸𝑥𝑝(𝜆 = 0.1), entonces 𝑃(𝑋 = 0) = 0.1
1.6 Si 𝑋 ∼ 𝐵(4; 0.7), la moda es 4.

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)


Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 una muestra aleatoria de una población 𝑋…
1.7 Si n es grande (𝑛 > 30) 𝑋 será aproximadamente normal.

1.8 Si 𝐸(𝑋) = 1 y 𝑉𝑎𝑟(𝑋) = 1 entonces 𝑉𝑎𝑟(𝑋̅) = 2/𝑛


𝑥1 +𝑥2
1.9 El estadístico es un estimador insesgado de 𝐸(𝑋) X
2

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)


1.10 Si al realizar un contraste rechazo 𝐻0 : 𝜇1 = 𝜇2 necesariamente rechazaré 𝐻0 : 𝜇1 ≥ 𝜇2

1.11 Para rechazar el contraste 𝐻0 : 𝜇1 ≥ 𝜇2 , necesariamente tiene que cumplirse que 𝑥̅1 < 𝑥̅2 X

1.12 Si al realizar un contraste rechazo 𝐻0 : 𝜇1 ≥ 𝜇2 necesariamente rechazaré 𝐻0 : 𝜇1 = 𝜇2

1
Apellidos:_____________________________________________________Nombre_______________________
Sección:___________________
NOTA

2. A continuación, se muestran los histogramas y resúmenes estadísticos de cuatro conjuntos de datos, realizados con el
Minitab. ¿A qué histograma, C1 a C4, le corresponde cada resumen estadístico, (1) a (4)? Justifica la respuesta (cuantas más
medidas características uses en tu argumentación, más puntaje)

Las asignaciones más fáciles de identificar son C3 y C4

• C3 es la distribución con mayor asimetría positiva y alto apuntamiento, por lo que claramente corresponde con
el resumen (1)
• C4 es una distribución bimodal, por lo que tendrá la menor curtosis, y una media en torno a 0.4, por lo que
claramente le corresponde el resumen (3)

Los histogramas C1 y C2 se diferencian en el apuntamiento y la asimetría

• C2 es más apuntado y más simétrica que C1, por lo que le corresponde el resumen (4)
• C1 es menos apuntado y tiene asimetría negativa, por lo que le corresponde el resumen (2)

2
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________

3. Sea X una variable aleatoria con función de densidad


1
𝑓(𝑥) = 𝑥 4 ; 𝑥 ∈ [0, 𝑎]
4

Contesta de forma justificada a las siguientes cuestiones


a) Demuestra que, para que 𝑓(𝑥) sea una función de densidad debe cumplir que 𝑎 =1.82 (0.5p
𝑎
𝑎
𝑥4 𝑥5 𝑎5 1
∫ 𝑑𝑥 = 1 ⇒ [ ] = 1 ⇒ = 1 ⇒ 𝑎 = 205 = 1.82
0 4 20 0
20

b) Calcula 𝐸(𝑋) (1p)

1.82
1.82 1.82
𝑥5 𝑥6 1.826
𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥 = ∫ 𝑑𝑥 = [ ] = = 1.51
0 0 4 24 0 24

c) Calcula la moda de 𝑋 (0.5p)

𝑓(𝑥) es monótona creciente en el dominio, por tanto, el máximo estará en 𝑥 = 1.82,


que será la moda.

1.82

d) Calcula la mediana de 𝑋 (1p)


𝑥
𝑥𝑚
𝑥4 𝑥5 𝑚 5
𝑥𝑚 1
∫ 𝑑𝑥 = 0.5 ⇒ [ ] = 0.5 ⇒ = 0.5 ⇒ 𝑥𝑚 = 105 = 1.5849
0 4 20 0 20

e) Calcula 𝑃(𝑋 > 1.5|𝑋 > 1.2) (1p)

𝑃[(𝑋 > 1.5) ∩ (𝑋 > 1.2)] 𝑃(𝑋 > 1.5)


𝑃(𝑋 > 1.5|𝑋 > 1.2) = = (0.5𝑝)
𝑃(𝑋 > 1.2) 𝑃(𝑋 > 1.2)
4
1.82 𝑥
∫1.5 4 𝑑𝑥 0.619
= = = 0.708 (0.5𝑝)
1.82 𝑥 4 0.874
∫1.2 4 𝑑𝑥

SIGUE →

3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
.

4. Supongamos ahora que tenemos la variable aleatoria X con función de densidad


1
𝑓(𝑥) = 𝑥 4 ; 𝑥 ∈ [0, 𝑐]
𝑏
con 𝑏 y 𝑐 parámetros desconocidos, y que se tiene la muestra de datos: 1.8, 1.5, 1.3, 1.7, 1.85. Obtén las estimaciones
de c y b a partir de la muestra disponible.

Para que sea función de densidad debe cumplirse que


𝑐
𝑐
𝑥4 1 𝑥5 𝑐5 𝑐5
∫ 𝑑𝑥 = 1 ⇒ [ ] = =1⇒𝑏=
0 𝑏 𝑏 5 0 5𝑏 5

Podemos ahora aplicar el método de los momentos:


𝑐 5
𝑥 𝑐6 5 𝑐6 5
𝐸(𝑋) = ∫ 𝑑𝑥 = = 5 = 𝑐=𝜇
0 𝑏 6𝑏 𝑐 6 6
6
⇒𝑐= 𝜇
5
6 𝑐̂ 5
⇒ 𝑐̂ = 𝑥̅ ; 𝑏̂ =
5 5

De la muestra disponible se tiene:


1.8 + 1.5 + 1.3 + 1.7 + 1.85
𝑥̅ = = 1.63
5
Por tanto
𝑐̂ = 1.956; 𝑏̂ = 5.726

4
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
.

5. En la central telefónica de una empresa se ha registrado el tiempo de duración (en segundos) de un conjunto de 100 llamadas
seleccionadas de manera aleatoria. Se ha realizado esta toma de datos con el fin de comprobar si se cumple la meta de que
la duración media de una llamada sea inferior a los 180 segundos.

a. A partir de dicha información, se ha realizado un contraste de hipótesis para averiguar si se cumple o no con la meta,
obteniéndose un p-valor de 0.068. ¿Se puede afirmar que se cumple la meta? (1 p)

Las hipótesis del contraste son 𝐻0 : 𝜇 ≥ 180; 𝐻1 : 𝜇 < 180. (0.5 p) Como el p-valor es mayor que el nivel de

6. significación (𝛼 = 0.05), se acepta 𝐻0 , por lo que no se puede afirmar que se cumple con la meta. (0.5 p)

Si en la respuesta no se explica cuáles son las hipótesis del contraste, el puntaje es cero.

b. Se realiza otro contraste para averiguar si el tiempo medio es 177 segundos. El estadístico de contraste resulta ser 0.79.
¿Cuál es el p-valor de dicho contraste? (0.5 p)

El estadístico de contraste (muestra grande, población de distribución desconocida) es 𝑧0 = 0.79.

Entonces, el p-valor del contraste, por ser bilateral, será:

𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.2148 × 2 = 0.4296

(0.5 p) Solo se corregirá la respuesta. Cualquier otra respuesta tiene puntaje cero (incluso si han calculado el valor 0.2148 pero
no lo han multiplicado por 2).

6. Una ONG va a realizar un proyecto de mejora de plantas de tratamiento de aguas residuales en una región. Para ello, el
Ministerio de Vivienda, Construcción y Saneamiento le exige que realice un sondeo en dicha región, que permita estimar el
porcentaje de habitantes que está de acuerdo con la ejecución del proyecto. A partir de la información recopilada en las 500
encuestas tomadas, se construyó el siguiente intervalo de confianza para la proporción de habitantes que manifestaron estar
de acuerdo con el proyecto: [0.40; 0.46]. Calcule el nivel de confianza de dicho intervalo. (1.5 p)

0.40+0.46
Como el intervalo es [0.40; 0.46], entonces 𝑝̂ = = 0.43. (0.75 p)
2

Además, se puede calcular el margen de error:

2𝐿 = 0.46 − 0.40 → 𝐿 = 0.03 (0.25 p)

Entonces:

𝑝̂ (1 − 𝑝̂ )
𝐿 = 𝑧𝛼⁄2 × √
𝑛

0.43×0.57
0.03 = 𝑧𝛼⁄2 × √ → 𝑧𝛼⁄2 = 1.35 (0.25 p)
500

Por tablas: 𝛼⁄2 = 0.0885 → 𝛼 = 0.177

Finalmente, el nivel de confianza es: 𝑁. 𝐶. = 100 × (1 − 𝛼)% = 𝟖𝟐. 𝟑% (0.25 p)

5
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
.

7. Se ha realizado una prueba de bondad de ajuste del índice acumulado de los alumnos de Ingeniería.

A partir de la información mostrada, responda:

a. ¿Qué distribución(es) se ajusta(n) a la variable índice acumulado? (0.5 p)

Normal (0.25 p) y Gamma (0.25 p).

Si han escrito algún otro modelo, todo este apartado tiene puntaje cero.

b. ¿Cuál es la mejor distribución que describe a los datos de la variable índice acumulado? ¿Por
qué? (1 p)

La distribución normal, porque tiene el máximo p-valor.

Si no hay justificación o es incorrecta, el puntaje del apartado es cero. Cualquier otra respuesta tiene puntaje cero.

8. Se ha construido un modelo que permite predecir el volumen (ml) de jugo obtenido al exprimir una naranja a partir de su
peso (g). Asumiendo que se cumplen las hipótesis de linealidad del modelo y normalidad del error, responda:

a. La variable peso tiene asociado un p- valor igual a 0. Indique cuáles son


las hipótesis asociadas al contraste a partir del cual ha sido calculado dicho
p-valor. (0.5 p)

𝐻0 : 𝛽1 = 0

𝐻1 : 𝛽1 ≠ 0

Cualquier otra respuesta tiene puntaje 0, incluyendo aquellas


que usan 𝛽̂1 .

b. Interprete el coeficiente 𝛽̂1 de la ecuación de la recta de regresión en un espacio máximo de dos líneas. (1 p)

Por cada gramo adicional que pese una naranja (0.25 p), el volumen de jugo extraído de ella aumentará

en 0.3522 ml (0.25 p) por término medio (0.5 p).

c. Interprete el valor del coeficiente de determinación en un espacio máximo de dos líneas. (1 p)

El modelo explica el 47.98% de la variabilidad del volumen de jugo extraído.

d. ¿Cuál es la probabilidad de obtener más de 100 ml de jugo de una naranja de 98 gramos? (1 p)

𝑉𝑜𝑙𝑢𝑚𝑒𝑛 | 𝑃𝑒𝑠𝑜 = 98 𝑔 ~ 𝑁 (59.92; 16.21032 ) (0.5 p)

Si alguno de los dos parámetros es incorrecto, no se corrige el resto de la solución.

100−59.92
Entonces: 𝑃(𝑉𝑜𝑙𝑢𝑚𝑒𝑛 > 100 𝑚𝑙 | 𝑃𝑒𝑠𝑜 = 98 𝑔) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 2.47) = 0.0068
16.2103

Probabilidad: 0.5 p si el valor es correcto, 0 p si el valor es incorrecto.

6
NOTA REVISADA FIRMA Estadística Básica
Final

Facultad de Ingeniería 04/12/2018


Semestre 2018-II 3 horas

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________

No se puede consultar ninguna documentación salvo las tablas y el formulario de la asignatura. Contesta cada pregunta sólo en la hoja de su
enunciado. El cuadernillo no se entrega. Salvo que se indique otra cifra, usa 𝜶 = 𝟎. 𝟎𝟓.
Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.

NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta. En
cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3 si la
elección es incorrecta). No hay que justificar.

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)


1.1 Si planteo la hipótesis 𝐻0 : 𝜇 ≥ 9, y en mi muestra obtengo 𝑥̅ = 12, aceptaré 𝐻0 X
1.2 El pvalor es la probabilidad de que 𝐻0 sea falsa

1.3 El pvalor es una medida de cómo de alejados están los datos de la hipótesis alternativa

Solución:
1.1 Sólo podremos rechazar 𝐻0 si los datos hacen lo que dice 𝐻1 de forma muy evidente. Si 𝑥̅ = 12 no contradice 𝐻0 : 𝜇 ≥
9 por lo que no podremos rechazar 𝐻0 .

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.4 Para estimar una proporción 𝑝 con un margen de error de 0.05 hay que tomar un mínimo de 385 datos X
1.5 Para estimar una proporción 𝑝 con un margen de error de 0.05 hay que tomar un máximo de 384 datos
1.6 Para estimar una proporción 𝑝 con un margen de error de 0.05 hay que tomar un mínimo de 1537 datos

Solución
2
1.96(0.5)
𝑛 = ⌈( ) ⌉ = 385
0.05

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)


1.7 La media muestral estará dentro de su intervalo de confianza el (1 − 𝛼) × 100% de las veces

1.8 Para estimar 𝜎 2 es necesario que la población sea normal

1.9 El estimador de 𝜎 2 por el método de los momentos es sesgado X

Solución:
1.7: La media muestral siempre está dentro de su intervalo de confianza
1.9: El estimador de 𝜎 2 por el método de los momentos es 𝑠 2 (divide por n) y es sesgado

1
Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)
1.10 Si en el contraste con 𝐻0 : 𝜇1 ≥ 𝜇2 se rechaza 𝐻0 con pvalor=0.04, también rechazaremos 𝐻0 : 𝜇1 = 𝜇2

1.11 A mayor pvalor más significativa es la diferencia entre los datos y 𝐻0

1.12 Si rechazo 𝐻0 : 𝜇1 ≥ 𝜇2 aceptaré 𝐻0 : 𝜇1 ≤ 𝜇2 X

Solución:

1.10 FALSA. En el contraste con 𝐻0 : 𝜇1 ≥ 𝜇2 , la región de rechazo, para 𝛼 = 0.05, estará a la izquierda del valor crítico
−1.645. Si el pvalor es 0.04, el estadístico 𝑡0 estará donde indica la Figura 1.

Figura 1 Figura 2

Sin embargo, en el contraste 𝐻0 : 𝜇1 = 𝜇2 la región de rechazo está en ambas colas, cada una con área 0.025, por lo que el
estadístico 𝑡0 , que deja a la izquierda un área de 0,04, estará en la región de No Rechazo, como indica la Figura 2. Por lo
tanto, esta cuestión es falsa.

1.12 VERDADERA. La región de rechazo del contraste 𝐻0 : 𝜇1 ≥ 𝜇2 está a la izquierda del valor -1.645 (Figura 3), y la región
de aceptación del contraste 𝐻0 : 𝜇1 ≤ 𝜇2 está a la izquierda del valor +1.645. Por tanto, si el estadístico de contraste,
𝑡0 , está en la región de rechazo el primer contraste, estará en la región de aceptación del segundo contraste.

Figura 3 Figura 4

2
Apellidos:_____________________________________________________Nombre_______________________
Sección:___________________

Informe de resumen de C4
2. En una central telefónica de una empresa retail se ha registrado el Prueba de normalidad de Anderson-Darling
tiempo de duración (en segundos) de un conjunto de llamadas A-cuadrado 0.22
Valor p 0.828
seleccionadas de manera aleatoria. A continuación, se muestra un
Media 175.04
fragmento del resumen de dichos datos, obtenido con Minitab. Desv.Est. 9.31
A partir de dicha información, ¿es posible afirmar que el tiempo medio Varianza 86.77
Asimetría -0.407419
de duración de las llamadas que recibe esta empresa es de 180 Curtosis 0.228924
segundos? Responde en la tabla siguiente.(5 p) N 35
Mínimo 150.15
1er cuartil 168.36
Mediana 175.88
3er cuartil 180.92
Máximo 192.32
Intervalo de confianza de 95% para la media
Hipótesis (1 p) 𝑯𝟎 : 𝝁 = 𝟏𝟖𝟎 𝑯𝟏171.84
: 𝝁 ≠ 𝟏𝟖𝟎 178.24
150 160 170 180 190
Intervalo de confianza de 95% para la mediana
Estadístico de contraste (1 p) 172.41 178.60
Indique el símbolo que lo representa, su fórmula, los 𝑥̅ − 180 Intervalo de 175.04 − 180 para la desviación estándar
𝑡0 = = [0.5𝑝] = confianza de 95% = −3.1519 [0.5𝑝]
valores que utiliza en la fórmula y el valor numérico del 𝑠̂⁄ 9.31
7.53 12.20
estadístico. √𝑛 √35
Utilice una precisión de 4 decimales.

Intervalos de confianza de 95%


𝑡0 ∼ 𝑡34
Distribución delMedia
estadístico de contraste (0.5 p)
Cualquier otra respuesta, tiene puntaje cero.
Mediana
De acuerdo al test de normalidad, podemos asumir que la muestra viene de
172 174 176 una población
178 normal. Por tanto, el estadístico 𝑡0 sigue una distribución 𝑡𝑛−1 .

¿Por qué ha elegido dicha distribución? (0.5 p)


Decir que por ser una población normal entonces 𝑡0 ∼ 𝑁(0,1) no es correcto (0p)
Responda en un máximo de 2 líneas
Decir que 𝑡0 ∼ 𝑁(0,1) porque la muestra es grande no es del todo correcto, pues se
estaría usando una distribución aproximada, en lugar de la distribución 𝑡34 exacta que
podemos usar por tener una población normal (0.5p)

Decir que 𝑡0 ∼ 𝑡34 por ser una muestra pequeña o grande no es correcto (0p)

Para calcular el valor crítico con las tablas disponibles usaremos 𝑡30 . De las
tablas se obtiene 𝑡30;0.025 = 2.042. La región de aceptación es |𝑡0 | ≤ 2.042.
(ver figura)

Como |𝑡0 | = 3.1519 estamos en la región de rechazo de 𝐻0 .(1p)


Conclusión del contraste (2 p)
1. ¿Se acepta o se rechaza la hipótesis nula? Por tanto, los datos muestran evidencia suficiente para rechazar que la
2. ¿Por qué? duración media de las llamadas sea 180 (1p sólo si los apartados 1 y 2 son
3. Responda a la pregunta planteada en el correctos)
enunciado.

Para que su respuesta sea válida, debe justificar su


conclusión.

3
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________

3. La multinacional DMG está probando un nuevo sistema de corte automático de barras de


aluminio para su tronzadora AP-350 (ver figura), que incorpora un sensor más avanzado. Con ese
fin se programa cortar unas barras con una longitud determinada, y evaluar posteriormente cómo
de diferentes fueron las longitudes realmente cortadas. A mayor variabilidad, menor precisión en
el corte. La longitud de las barras obtenida es:

12 12 12.2 12.1 12.3 11.9 11.8 12.2 12.1 11.8

El técnico experto en la calibración de este tipo de máquinas afirma que para considerar que el
corte programado usando el nuevo sensor mejora al sistema anterior, la varianza poblacional Tronzadora automática AP350
debe ser inferior a 0.03. Asumiendo que la longitud cortada sigue una distribución normal, se pide:
(5p)

Escriba las hipótesis de un contraste 𝐻0 : 𝜎 2 ≥ 0.03 𝐻1 : 𝜎 2 < 0.03


para analizar si la varianza
poblacional es menor que 0.03 (1p)
Cualquier otra respuesta, tiene puntaje cero.

Escriba la fórmula del estadístico de


contraste y calcule su valor (0.5p) (𝑛 − 1)𝑠̂ 2 9 × 0.0293
(4 decimales) χ20 = = = 8.7900
𝜎20 0.03

χ20 ~ χ29
Distribución del estadístico de
contraste (0.5 p)
Cualquier otra respuesta, tiene puntaje cero.

¿Por qué ha elegido esta Porque la población es normal y se está realizando inferencia para la varianza.
distribución? (0.5p)
Justifique brevemente Si la distribución planteada es incorrecta, este apartado tiene puntaje 0 p.

Calcule el valor crítico y dibuje la


región de aceptación y rechazo
sobre la distribución de referencia
(1p)

¿Se acepta o se rechaza la hipótesis


nula? (0.5p) Se acepta la hipótesis nula.

Se concluye que la varianza de las longitudes cortadas no es menor que 0.03. (0.75 p)
A la vista de los resultados ¿qué se
Por tanto, usar el nuevo sensor para el corte no mejora su precisión. (0.25 p)
concluye sobre la precisión de la
máquina de corte? (1p) • No es correcto: la varianza es mayor que 0.03 (0 p).
Justifique brevemente • Si solo han escrito que la varianza “no es menor” que 0.03, pero no han escrito que la
precisión mejora: 0.75 p.

4
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
.

4. Un gran supermercado tiene un sistema basado en energía solar


fotovoltaica que utiliza para dar respaldo a su sistema de
refrigeración para la conservación de los alimentos preparados.
Para analizar su eficiencia toma un conjunto de pares de datos
(X,Y) donde X= cantidad de energía solar suministrada en una
hora, y Y=temperatura de la cámara frigorífica en esa hora. Se
realiza con Minitab una regresión cuyos resultados se muestran
en la tabla adjunta. Basándose sólo en los valores de esta tabla contesta a las siguientes preguntas (6p)
a) Escribe la recta de regresión: (0.5p)
𝑌̂ = 9.29995 − 0.18955 𝑋
b) ¿Es significativa la relación entre Energía y Temperatura? Justifica brevemente (1p)

Sí, porque el p-valor (0) es menor que el nivel de significación (𝛼 = 0.05), por lo que se rechaza la hipótesis 𝐻0 : 𝛽1 = 0 y se acepta la
hipótesis 𝐻1 : 𝛽1 ≠ 0.

c) Interpreta los coeficientes de la regresión (2p)

• 𝛽̂0 : Cuando no se suministra energía desde el sistema de respaldo de energía solar en una hora, la temperatura esperada en
dicha hora es 9.30. (1 p).

• 𝛽̂1 : Por cada unidad adicional de energía que se suministra en una hora, la temperatura en dicha hora disminuye en 0.18955
unidades (0.5 p) por término medio (0.5 p).

d) Interpreta el valor del coeficiente S que aparece en la figura (0.5p)

El coeficiente 𝑠 = 1.55215 es la desviación estándar de los residuos.

2
1

Interpreta estas dos figura de los residuos (2p)

Figura 1:

Se observa que los puntos se alinean a la gráfica de probabilidad (0.25 p), por lo que se puede afirmar que el error se
distribuye normalmente (0.75 p).
Si se ha comentado la linealidad de la relación entre ambas variables a partir de la figura 1, el puntaje es cero.

Figura 2:

Se observa una estructura de puntos en la gráfica (0.25 p), por lo que se afirma que la relación entre la energía suministrada
en una hora y la temperatura en esa hora no es lineal (0.75 p).

5
NOTA REVISADA FIRMA Estadística Básica
Parcial

Facultad de Ingeniería 01/10/2018


Semestre 2018-II
3 horas

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________

No se puede consultar ninguna documentación salvo las tablas y el formulario de la asignatura. Contesta cada pregunta sólo en la hoja de su
enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo no se entrega. Tu evaluación será escaneada para prevenir fraude.
Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.

NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta. En
cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3 si la
elección es incorrecta). No hay que justificar.
FIRMA

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.1 Sea X una variable aleatoria discreta, si x=20 es el percentil 30, entonces necesariamente 𝐹(20) = 0.30

1.2 Sea X una variable aleatoria discreta, si x=20 es el percentil 30, entonces necesariamente 𝐹(20) ≤ 0.30

1.3 Sea X una variable aleatoria discreta, si x=20 es el percentil 30, entonces necesariamente 𝐹(20) ≥ 0.30 X

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)

1.4 En un conjunto de datos con asimetría negativa, la desviación típica será siempre mayor que 0. X
1.5 Si un histograma es unimodal con asimetría positiva, la mediana tenderá a ser mayor que la media.
1.6 Si un conjunto de datos presenta simetría, el coeficiente de curtosis será 3.

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.7 𝐸(𝑎𝑋 + 𝑏𝑌) = 𝑎𝐸(𝑋) + 𝑏𝐸(𝑌) sólo si 𝑋 e 𝑌 son independientes
1.8 𝑉𝑎𝑟(2𝑋) = 𝑉𝑎𝑟(𝑋 + 𝑋) = 𝑉𝑎𝑟(𝑋) + 𝑉𝑎𝑟(𝑋)
1.9 Si X e Y son independientes, 𝑉𝑎𝑟(𝑋 − 𝑌) = 𝑉𝑎𝑟(𝑌 + 𝑋) X

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.10 Si 𝑋 ∼ 𝑃𝑜𝑖(𝜆1 = 1) y 𝑌 ∼ 𝐸𝑥𝑝(𝜆2 = 2) e independientes, entonces 𝑉𝑎𝑟(𝑋 + 𝑌) = 3
1.11 Si 𝑋 ∼ 𝐵(1; 0.8) el primer cuartil es 0.
1.12 Si 𝑋 ∼ 𝐵(1; 0.8) la moda es 1. X

Marca con X la frase correcta. (+1 si acierto, -1/3 si fallo)


1.13 Si X es exponencial, 𝑃(𝑋 > 2|𝑋 > 1) = 𝑃(𝑋 > 2)
1.14 Si X es exponencial, 𝑃(𝑋 > 2|𝑋 > 1) = 𝑃(𝑋 > 1) X
1.15 Si X es exponencial, 𝑃(𝑋 > 2|𝑋 > 1) = 𝑃(𝑋 > 1|𝑋 > 2)

1
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________

2. Para cada una de las siguientes variables descritas, identifique el modelo de probabilidad que sigue y los parámetros que
definen el modelo. Escoja entre las siguientes opciones:

B:Binomial; E:Exponencial; P: Poisson; N:Normal; U:Uniforme continua

Ejemplo:

Modelo de
Variable Parámetros
probabilidad
La longitud de una pieza (𝑋) es una variable normal que tiene una
N 𝑋~𝑁(15; 3)
esperanza de 15 m y una varianza de 3.

Puntuación:
Modelo elegido correctamente: + 0.25 p.
Parámetros elegidos correctamente: + 0.75 p. (solo si el modelo es elegido correctamente)

Modelo de
Variable Parámetros
probabilidad

En una ciudad, el 5% de la población sufre de algún tipo de


alergia. ¿Qué distribución sigue 𝑋 = número de personas B
𝐵(200; 0.05)
con alergia en una muestra de 200 personas?

𝑋 es el número de defectos en un alambre de 15 m hecho


de un material que tiene una tasa de 2.3 defectos/metro.
P Poi(34.5)
La aparición de defectos es estable e independiente. ¿Qué
distribución sigue 𝑋?

Un cable presenta, por término medio, un defecto por


cada 20 metros, apareciendo los defectos de forma
E Exp(0.05)
fortuita. ¿Qué distribución sigue 𝑋=metros de cable entre
dos defectos consecutivos?

𝑋 es un número real seleccionado al azar entre -1 y 1.


U 𝑈(−1; 1)
¿Qué distribución sigue 𝑋?

Los accidentes en una planta ocurren de manera estable e


independiente. En promedio, ocurre 1 accidente cada 4
semanas (semanas de 7 días). Acaba de ocurrir un E Exp(0.0357)
accidente; 𝑋 es el tiempo (en días) que pasará hasta que
vuelva a ocurrir otro accidente. ¿Qué distribución sigue 𝑋?

2
Apellidos:_________________________________________________________Nombre_______________________

Sección:___________________ NOTA
.

3. En una gran piscifactoría del norte de Piura se está probando un servicio de entrega de paquetes dentro del FIRMA
recinto de la piscifactoría utilizando drones (vehículo volador no tripulado). Con ese fin, se realiza un
experimento que consiste en llevar diferentes paquetes desde un punto A a otro punto B. Asumiremos que la
variable aleatoria X= tiempo de vuelo del dron desde A hasta B sigue una normal de media 3 minutos y
desviación estándar 0.4. Contesta, de forma justificada, a las siguientes preguntas.

a) ¿Cuál es la probabilidad de que cubra el trayecto desde A hasta B en menos de 2.8 minutos? (1p)

2.8 − 3
𝑃(𝑋 < 2.8) = 𝑃 (𝑍 < ) = 𝑃(𝑍 < −0.5) = 0.3085
0.4

b) Si se observa que, tras 2 minutos de vuelo, el dron aún no ha llegado al punto B ¿cuál es ahora la
probabilidad de que se cubra el trayecto desde A hasta B en menos de 2.8 minutos? (2p)

𝑃[(𝑋 < 2.8) ∩ (𝑋 > 2)] 𝑃(𝑋 < 2.8) − 𝑃(𝑋 < 2)
𝑃(𝑋 < 2.8|𝑋 > 2) = =
𝑃(𝑋 > 2) 𝑃(𝑋 > 2)
2.8 − 3 2−3
𝑃 (𝑍 < ) − 𝑃 (𝑍 < )
= 0.4 0.4 = 𝑃(𝑍 < −0.5) − 𝑃(𝑍 < −2.5)
2−3 𝑃(𝑍 > −2.5)
𝑃 (𝑍 > )
0.4
0.3085 − 0.0062
= = 0.3042
1 − 0.0062

c) Calcula los cuartiles de X (2p)


Primer cuartil:
𝑄1 − 3
𝑃(𝑍 ≤ 𝑧1 ) = 0.25 ⇒ 𝑧1 ≈ −0.67 ⇒ = −0.67 ⇒ 𝑄1 = −0.67(0.4) + 3 = 2.732
0.4
Segundo cuartil
𝑄2 = 𝜇 = 3

Tercer cuartil:
Por simetría
𝑄1 − 3
𝑃(𝑍 ≤ 𝑧3 ) = 0.75 ⇒ 𝑧1 ≈ 0.67 ⇒ = 0.67 ⇒ 𝑄1 = 0.67(0.4) + 3 = 3.268
0.4

SIGUE

3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________

d) Si asumimos que el tiempo de retorno de B a A es una distribución independiente de X, pero con el mismo modelo
de distribución, 𝑁(3, 0.42 ). ¿Cuál es la probabilidad de que en un viaje de ida y vuelta entre A y B se demore el
dron menos de 6,5 minutos? (2p)
Viaje de A a B: 𝑋1 ∼ 𝑁(3, 0.42 ). Viaje de B a A: 𝑋2 ∼ 𝑁(3, 0.42 ). Viaje total:
𝑌 = 𝑋1 + 𝑋2 ∼ 𝑁(6; 0.32)
6.5 − 6
𝑃(𝑌 < 6.5) = 𝑃 (𝑍 < ) = 𝑃(𝑍 < 0.88) = 0.8106
0.5657

e) Calcula los apartados a), b) y c) pero asumiendo ahora que el tiempo de vuelo es 𝑈(2; 4) (3p)

1
Si 𝑋 ∼ 𝑈(2; 4) ⇒ 𝑓(𝑥) = = 0.5
4−2

• a)𝑃(𝑋 < 2.8) = (2.8 − 2)(0.5) = 0.4

• b)
𝑃[(𝑋 < 2.8) ∩ (𝑋 > 2)] 𝑃(𝑋 < 2.8) − 𝑃(𝑋 < 2) 0.4 − 0
𝑃(𝑋 < 2.8|𝑋 > 2) = = = = 0.4
𝑃(𝑋 > 2) 𝑃(𝑋 > 2) 1

• c) 𝑄1 :
(𝑄1 − 2)0.5 = 0.25 ⇒ 𝑄1 = 2.5
𝑄2 = 3
𝑄3 = 3.5

4
NOTA REVISADA FIRMA Estadística Básica
Práctica 4

Facultad de Ingeniería 16/11/2018


Semestre 2018-II

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de su
enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega. Cuando se solicite RECLAMO, deberá adjuntarse copia de la
solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá basarse en errores de corrección en base a NOTA
esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar. Tu evaluación será escaneada.

1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta. FIRMA
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3
si la elección es incorrecta). No hay que justificar. (4p)

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)


2 2
1.1 𝜒𝑛;0.05 = 1 − 𝜒𝑛;0.95

1.2 𝑡300 ≈ 𝑁(0,1) X


1.3 𝑡𝑛−1;0.025 < 𝑧0.025

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

Para calcular el tamaño muestral para estimar una proporción de la que desconocemos completamente su
1.4
valor, lo mejor es asumir 𝑝 = 0.5 X
El margen de error de estimar una proporción próxima a cero es mayor que el de estimar una proporción
1.5
próxima a uno.

1.6 Si 𝑛𝑝(1 − 𝑝) > 5 podemos aproximar la proporción poblacional 𝑝 a una normal

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)


Si al realizar el contraste 𝐻0 : 𝜇 ≥ 100 se obtiene un pvalor=0.10, el contraste 𝐻0 : 𝜇 = 100 tendrá un
1.7
pvalor de 0.05
Si al realizar el contraste 𝐻0 : 𝜇 ≥ 100 se obtiene un pvalor=0.10, el contraste 𝐻0 : 𝜇 = 100 tendrá un X
1.8
pvalor de 0.20
1.9 Si rechazo 𝐻0 en el contraste 𝐻0 : 𝜇 ≥ 𝜇0, también rechazaré 𝐻0 en el contraste 𝐻0 : 𝜇 ≤ 𝜇0

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.10 Si tenemos una muestra grande de una población 𝑋, entonces 𝑋 se podrá aproximar a una normal

𝑋̅ −𝜇
1.11 Si 𝑋 ∼ 𝑁(𝜇; 𝜎 2 ), entonces ∼ 𝑡𝑛−1
𝜎 ⁄√𝑛

(𝑛−1)𝑆̂ 2
1.12 Si 𝑋 ∼ 𝑁(𝜇; 𝜎 2 ), entonces
𝜎2
2
∼ 𝜒𝑛−1 X

1
Apellidos:______________________________________________________Nombre_______________________

Sección:___________________ NOTA

2. Un grupo de estudiantes está interesado en estudiar medidas antropométricas. Por ejemplo, la envergadura FIRMA
es la distancia entre las puntas de los dedos de las dos manos de una persona cuando tiene los brazos en
cruz completamente extendidos. Este grupo ha escuchado una creencia común: la envergadura de una
persona coincide con su estatura. Por ello, decidieron medir a 10 amigos, cuyos valores se muestran en la
siguiente tabla:

Individuo 1 2 3 4 5 6 7 8 9 10
X1: Estatura (cm) 162 169 167 172 175 173 181 174 169 170
X2: Envergadura (cm) 160 166 165 169 173 175 184 168 164 166
Diferencia: Y = X1 – X2 2 3 2 3 2 -2 -3 6 5 4
Los estudiantes, además, han comprobado que tanto la estatura como la envergadura siguen una distribución normal.

Solución: Son datos emparejados


̅ = 𝟐. 𝟐𝟐
𝒚
𝒔̂𝒚 = 𝟐. 𝟖𝟐𝟏

a. Realice un contraste para averiguar si, a partir de los datos, es posible afirmar que ambas medidas son, en promedio,
iguales.

𝑯𝟎 : 𝝁𝒚 = 𝟎 (𝝁𝟏 = 𝝁𝟐 ) 𝑯𝟏 : 𝝁𝒚 ≠ 𝟎 (𝝁𝟏 ≠ 𝝁𝟐 )
Hipótesis (0.5 p)
Cualquier otra respuesta, es incorrecta

Estadístico de contraste (0.5 p)


𝑦̅ − 0 2.22
Indique el símbolo que lo 𝑡0 = = = 2.4886
𝑠̂𝑦 2.821⁄
representa, su fórmula, los √10
√𝑛
valores que utiliza en la fórmula y
el valor numérico del estadístico. Hay que verificar que hayan usado los valores correctos en el cálculo.
De lo contrario, el puntaje es cero. Si han escrito que el estadístico de
Utilice una precisión de 4 contraste es 𝑍0 , el puntaje se reduce a la mitad.
decimales.

Distribución del estadístico de


contraste Porque la población es normal (0.25 p), la distribución del
estadístico de contraste es:
Justifique brevemente
𝑇0 ~𝑡9 (0.25 p)
(0.5 p)

Si han respondido correctamente los tres apartados anteriores (hipótesis, estadístico y distribución), se
continúa corrigiendo. De lo contrario, el puntaje, en adelante, es cero.

p-valor aproximado (0.5 p) p-valor ≈ 0.04

2
JUSTIFICACIÓN (opción 1) (0.5 p):

Conclusión del contraste (1 p)


JUSTIFICACIÓN: el estadístico de contraste se encuentra en la
región de rechazo (|𝑡0 | > 2.262).
Responda: (El valor 2.262 debe estar presente en esta opción de respuesta, de
 ¿Se acepta o se rechaza Ho? lo contrario se considera incorrecta).
 ¿Se puede afirmar que ambas
medidas son, en promedio,
iguales?
JUSTIFICACIÓN (opción 2) (0.5 p):

JUSTIFICACIÓN: el p-valor (0.04) es menor que el nivel de


Debe justificar su conclusión. significación (𝛼 = 0.05).

(El p-valor = 0.04 debe estar presente en esta opción de respuesta,


de lo contrario se considera incorrecta).

Si no han justificado o han justificado incorrectamente, no se corrige


la conclusión (puntaje cero).

CONCLUSIÓN (0.5 p):


a. Se rechaza la hipótesis nula (Ho).
b. No hay evidencia suficiente para afirmar que la estatura
media y la envergadura media son iguales.

Deben tener ambas conclusiones (“a” y “b”) correctas (0.5 p). De lo


contrario: 0 p.

b. Si ambas variables en estudio no fueran normales, ¿qué ocurriría? Responda en un máximo de dos líneas. (1 p)

No se cumpliría que la media de las diferencias (y ̅) sigue una distribución normal, por lo que los resultados del contraste

no serían del todo fiables.

3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________

3. Una empresa farmacéutica que elabora comprimidos de vitaminas evalúa de forma regular NOTA
el peso de estos comprimidos. Tras tomar una muestra de comprimidos y pesarlos se
obtuvo el siguiente resumen con Minitab:
FIRMA

Figura 1: Resumen gráfico

Asumiremos que el peso de los comprimidos sigue una distribución normal. Contesta a las siguientes preguntas de forma
justificada:

a) Un analista asegura que hay un error en el intervalo de confianza de la media, y que alguien ha editado y manipulado
esta figura. Construye el intervalo de confianza de la media y comprueba quién tiene razón. (2p)

Al tratarse de una muestra de una población normal, el intervalo es:

𝑠̂ 𝑠̂
𝐼𝐶(0.95): 𝜇 ∈ [𝑋̅ − 𝑡50,0.025 ; 𝑋̅ + 𝑡50,0.025 ] (1𝑝)
√51 √51

donde 𝑋̅ =3.0225; 𝑠̂ = 0.0274; 𝑡50;0.025 = 2.009. Por tanto:

0.0274 0.0274
𝐼𝐶(0.95): 𝜇 ∈ [3.0225 − 2.009 ; 3.0225 − 2.009 ] = [3.0148; 3.0302](1𝑝)
√51 √51

El intervalo es, por tanto, correcto.

Si se usa la aproximación a la normal, en lugar de la distribución t de Student exacta, con 𝑧0.025 = 1.96, el intervalo queda
[3.0150; 3.0300]. que, al ser muestra grande, es muy similar al que proporciona el Minitab, pero no es igual. (sólo 1 punto)

b) Ese mismo analista sostiene que el intervalo que el Minitab proporciona para la desviación típica no se construye
tomando la raíz cuadrada del intervalo de la varianza habitual, sino que lo construye con otras fórmulas. Construye el
intervalo de confianza de la varianza y comprueba si el analista tiene razón. (2p)

El intervalo para la varianza de una normal es

50𝑠̂ 2 50𝑠̂ 2 50(0.0274)2 50(0.0274)2


𝐼𝐶(0.95): 𝜎 2 ∈ { 2 ;2 }={ ; } = {0.000526; 0.00116}
𝜒50;0.025 𝜒50;0.975 71.42 32.36

y su raíz cuadrada es {0.0229; 0.0341}, que coincide con el Minitab, luego no tiene razón el analista

(si tiene bien el planteamiento, pero no le sale el mismo resultado por cuestión del redondeo antes de sacarla raíz
cuadrada, dar puntaje completo)

4
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
.

c) Contrasta, con un nivel de significación del 5%, que el peso medio de los comprimidos es inferior a
3.03 unidades. FIRMA

Hipótesis (1p) 𝑯𝟎 : 𝝁 ≥ 𝟑. 𝟎𝟑 𝑯𝟏 : 𝝁 < 𝟑. 𝟎𝟑

Estadístico de
contraste (1p)
Indique el símbolo que Como no conocemos la desviación típica poblacional, el estadístico es
lo representa, su 𝑥̅ − 𝜇0 3.0225 − 3.03
fórmula, y su valor 𝑡= = = −1.9548
𝑠̂⁄ 0.0274⁄
numérico. Utilice una √𝑛 √51
precisión de 4
decimales.

Distribución del Al tratarse de una población normal, y usarse la cuasidesviación típica, la distribución del
estadístico de estadístico de contraste es 𝑡50 .
contraste (1p)
Justifique brevemente (Con la justificación de que la población es normal es suficiente para tener el puntaje
completo. Si usan la N(0,1) por ser muestra grande, sólo 0.5 p)

Conclusión del
contraste (1p)

Responda:
Como −𝑡50;0.05 = −1.676 , nos encontramos en la
 ¿Acepto o rechazo
región de rechazo de 𝐻0 . Hay evidencia suficiente, con
Ho?
un nivel de significación del 5%, para asumir que el peso
 ¿Se puede afirmar
que el peso medio de medio es inferior a 3.03
los comprimidos es (con −𝑧0.05 = −1.645, la conclusión sería la misma, y el
inferior a 3.03 puntaje completo)
unidades?

Debe justificar su
conclusión.

¿Con qué valor de la media muestral se conseguiría un pvalor de 0.05 en este contraste? Justifica brevemente (2p)

Para tener un pvalor de 0.05, el valor del estadístico de contraste debería ser precisamente el valor crítico, es decir:

𝑥̅ − 3.03
𝑡= = −1.676 ⇒ 𝑥̅ = 3.0236
0.0274⁄
√51

(con 𝑧0.05 sale 𝑥̅ = 3.0237)

5
NOTA REVISADA FIRMA Estadística Básica
SUSTITUTORIO

15/07/2019

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario oficiales de la asignatura. Contesta cada
pregunta sólo en la hoja de su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega. Cuando se
solicite RECLAMO, deberá adjuntarse copia de la solución publicada. NOTA

1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar. (5p) FIRMA

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)


Si la distribución de los datos es simétrica, el coeficiente de asimetría será positivo, y si es asimétrica será
1.1
negativo
1.2 La moda es un coeficiente que es muy sensible a valores atípicos

1.3 El rango intercuartílico no es sensible a valores atípicos X

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.4 Dos sucesos independientes serán mutuamente excluyentes

1.5 𝑃(𝐴|𝐵) = 𝑃(𝐵|𝐴)/𝑃(𝐴)


X
1.6 𝑃(𝐴) = 𝑃(𝐴|𝐵)(1 − 𝑃(𝐵̅) + 𝑃(𝐴|𝐵̅)(1 − 𝑃(𝐵))

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.7 La suma de dos variables de Poisson independientes es también Poisson X

1.8 La suma de dos variables exponenciales independientes es también exponencial

1.9 La suma de dos variables uniformes independientes es también uniforme

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.10 Si tenemos la función de densidad 𝑓(𝑥) = 𝑥 2 , con 𝑥 ∈ [0, 𝑎] entonces 𝑎 = 1

1.11 La moda de 𝑋 ∼ 𝐸𝑥𝑝(𝜆 = 1) es 𝑥 = 1

1.12 Si tenemos la función de densidad 𝑓(𝑥) = 𝑥 𝑎 , con 𝑥 ∈ [0,1], entonces 𝑎 = 0 X

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.13 Si p-valor<𝛼, la diferencia encontrada entre los datos y 𝐻0 no es significativa

1.14 Si p-valor> 𝛼, podemos apoyarnos en los datos para probar que se cumple 𝐻0 X

1.15 Si p-valor=𝛼 el contraste no es concluyente

1
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
2. Se ha elaborado un modelo de regresión lineal que permite predecir, en una piscifactoría, el peso
de un langostino en la semana 10 (Sem_10) de su desarrollo, a partir de su peso en la primera
semana (Sem_1). Todos los pesos están en gramos. Se ha comprobado, además, que se cumplen las FIRMA
hipótesis básicas del modelo. A continuación, se muestra parte de los resultados obtenidos con
Minitab:

a. Además de usar un gráfico de dispersión, ¿cómo se puede evaluar gráficamente si la relación entre ambas variables
es lineal? Explique en un máximo de dos líneas. (0.5 p)
Utilizando un gráfico de residuos frente a valores previstos (ajustes).

Cualquier otra respuesta adicional invalida todo el apartado.

b. Interprete el coeficiente de determinación del modelo en máximo dos líneas (0.5 p).
El modelo explica el 52.83% de la variabilidad del peso de los langostinos en la semana 10.
Si la respuesta no está completa y bien redactada, el puntaje es cero.
Cualquier otra respuesta adicional invalida todo el apartado.

c. Interprete el coeficiente que corresponde a la pendiente de la ecuación de la recta en máximo dos líneas. (0.5 p)
Por cada gramo adicional que pese un langostino, su peso en la semana 10 aumentará en 4.86 g por término
medio.
Si la respuesta no está completa y bien redactada, el puntaje es cero.
Cualquier otra respuesta adicional invalida todo el apartado.

d. Calcule la probabilidad de que un langostino que pesó 1 g en la primera semana pese por lo menos 7 g en la semana
10. (0.5 p)

Como se cumple la hipótesis de normalidad: 𝑒𝑖 ~𝑁(0; 1.512 ), se sabe que: 𝑆𝑒𝑚10 | 𝑆𝑒𝑚1 = 1 ~ 𝑁 (6.676; 1.512 ).
Entonces, si el peso en la semana 1 es de 1 gramo:

7 − 6.676
𝑃(𝑆𝑒𝑚10 ≥ 7) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 0.21) = 1 − 0.5832 = 𝟎. 𝟒𝟏𝟔𝟖
1.51

Si la respuesta es incorrecta, el puntaje es cero.

3. Sea 𝑌 una variable aleatoria cuya función de densidad es 𝑓(𝑦) = 𝛼𝑦 𝛼−1 ; 0 ≤ 𝑦 ≤ 1, se ha tomado una muestra de 15
datos, a partir de la cual se ha calculado el momento 𝑚3 = 0.11. A partir de dicha información, estime el parámetro 𝛼.
Muestre su procedimiento claramente. (1 p)

Como se tiene 𝑚3 , conviene buscar la relación entre 𝛼 y 𝑀3 (0.5 p):

1 1
𝛼𝑦 𝛼+3 1 𝛼 × 1𝛼+3 𝛼 × 0𝛼+3 𝛼 𝟑𝑴𝟑
𝑀3 = ∫ 𝑦 3 ∙ 𝛼𝑦 𝛼−1 𝑑𝑦 = ∫ 𝛼𝑦 𝛼+2 𝑑𝑦 = ( )| = ( )−( )= → 𝜶=
0 0 𝛼+3 0 𝛼+3 𝛼+3 𝛼+3 𝟏 − 𝑴𝟑

Entonces (0.5 p):


3𝑀̂3 3𝑚3 3 × 0.11
𝛼̂ = = = = 𝟎. 𝟑𝟕𝟎𝟖
̂
1 − 𝑀3 1 − 𝑚3 1 − 0.11
2
Apellidos:______________________________________________________Nombre_______________________
Sección:___________________
NOTA

4. Un inspector de calidad de un proceso productivo que fabrica artículos manufacturados realiza el


siguiente protocolo de inspección. Cada 15 minutos toma una muestra (Muestra 1) de 10 artículos, y FIRMA
verifica cuántos son defectuosos. Si encuentra más de dos, toma una segunda muestra (Muestra 2)
independiente de la anterior y vuelve a verificar cuántos artículos defectuosos tiene. Si en esta segunda
muestra vuelve a encontrar más de dos artículos defectuosos, se detiene el proceso para buscar las
causas del problema. Si suponemos que el proceso produce un 5% de artículos defectuosos, contesta de forma
justificada a las siguientes cuestiones:

a. ¿Cuál es la probabilidad de que en la Muestra 1 se encuentre sólo 1 artículo defectuoso? (0.5p)

Sea 𝑋1 𝑛=nº de artículos defectuosos en la Muestra 1, que consta de 𝑛 = 10 artículos donde cada uno
tiene una probabilidad de 𝑝 = 0.05 de ser defectuosos. Entonces 𝑋1 ∼ 𝐵(10; 0.05)
10
𝑃(𝑋1 = 1) = ( ) 0.051 (0.95)9 = 0.3151
1

b. ¿Qué proporción de las veces que hace la inspección tendrá que tomar la segunda muestra? (1p)

Tomará la segunda muestra si 𝑋1 ≥ 3


𝑃(𝑋1 ≥ 3) = 1 − 𝑃(𝑋1 ≤ 2) = 1 − [𝑃(𝑋1 = 0) + 𝑃(𝑋1 = 1) + 𝑃(𝑋1 = 2)]
= 1 − (0.5987 + 0.3151 + 0.0746) = 0.0116 (1.16%)

c. ¿Cuál es la probabilidad de que en una inspección en la que se tenga que tomar la segunda muestra, se tengan
más de 3 artículos defectuosos entre ambas muestras? (1p)

Sea 𝑋2 =nº de artículos defectuosos en la Muestra 2, que consta de 𝑛 = 10 artículos donde cada uno
tiene una probabilidad de 𝑝 = 0.05 de ser defectuosos. Entonces 𝑋2 ∼ 𝐵(10; 0.05) siendo
independiente de 𝑋1 .

𝑃{[(𝑋1 + 𝑋2 ) ≤ 3] ∩ (𝑋1 ≥ 3)}


𝑃(𝑋1 + 𝑋2 ≥ 4|𝑋1 ≥ 3) = 1 − 𝑃(𝑋1 + 𝑋2 ≤ 3|𝑋1 ≥ 3) = 1 −
𝑃(𝑋1 ≥ 3)
Si 𝑋1 ≥ 3, la única opción para que 𝑋1 + 𝑋2 ≤ 3 es que en la segunda muestra no haya ningún
artículo defectuoso y en la primera exactamente 3.
𝑃[(𝑋1 = 3) ∩ (𝑋2 = 0)] 𝑃(𝑋1 = 3)𝑃(𝑋2 = 0)
𝑃(𝑋1 + 𝑋2 ≥ 4|𝑋1 ≥ 3) = 1 − = 1−
𝑃(𝑋1 ≥ 3) 𝑃(𝑋1 ≥ 3)
(0.0105)(0.5987)
=1− = 0.4581
0.0116

d. ¿Qué proporción de las inspecciones, que realiza cada 15 minutos, tienen como resultado la detención del
proceso? (1p)
𝑃[(𝑋1 ≥ 3) ∩ (𝑋2 ≥ 3)] = 𝑃(𝑋2 ≥ 3|𝑋1 ≥ 3)𝑃(𝑋1 ≥ 3) = 𝑃(𝑋2 ≥ 3)𝑃(𝑋1 ≥ 3) = 0.01162 = 0.000135

3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA

5. Un concursante de un evento recibirá un premio de 2000, 1000 o 500 soles, según el tiempo que tarde
en realizar un “reto”: si menos de 10 minutos hora, entre 10 y 20 minutos y entre 20 y 30 minutos,
FIRMA
respectivamente. Una vez transcurridos 30 minutos, la prueba concluye, y el concursante no recibe
ningún premio. La probabilidad de realizar el trabajo en menos de 10 minutos es 0.1; entre 10 y 20
minutos, 0.3; y entre 20 y 30 minutos, 0.5. Definiremos la variable 𝑋 = premio recibido.

Responda de forma justificada a los siguientes puntos:

a. Determine la esperanza y la varianza de 𝑋. (1p)

La variable X se define en la siguiente tabla:


𝑋 𝑝(𝑋) 𝐹(𝑥)
0 0.1 0.1
500 0.5 0.6
1000 0.3 0.9
2000 0.1 1

𝜇 = 𝐸(𝑋) = ∑ 𝑥𝑖 𝑝(𝑥𝑖 ) = 0 × 0.1 + 500 × 0.5 + 1000 × 0.3 + 2000 × 0.1 = 750

𝑉𝑎𝑟(𝑋) = ∑(𝑥𝑖 − 𝜇)2 𝑝(𝑥𝑖 ) = (0 − 750)2 × 0.1 + (500 − 750)2 × 0.5

+(1000 − 750)2 × 0.3 + (2000 − 750)2 × 0.1 = 262500

b. Construya la función de probabilidad de 𝑋. (0.5p)


Ya se construyó 𝑝(𝑥) en el apartado anterior

c. Obtenga los cuartiles de 𝑋. (1p)

𝑄1 = 500; 𝑄2 = 500; 𝑄3 = 1000

d. Si sabemos que el concursante ha obtenido un premio, ¿Cuál es la probabilidad de que haya sido el más elevado?
(1p)

𝑃[(𝑋 = 2000) ∩ 𝑋 > 0) 𝑃(𝑋 = 2000) 0.1


𝑃(𝑋 = 2000|𝑋 > 0) = = = = 0.111
𝑃(𝑋 > 0) 1 − 𝑃(𝑋 = 0) 0.9

4
Apellidos:_________________________________________________________Nombre_______________________

Sección:___________________
NOTA
6. En una embotelladora de gaseosas, se tiene como objetivo envasar, en cada botella persona, 500 ml
de gaseosa. Sin embargo, se sabe que la máquina no vierte exactamente ese volumen en las botellas,
por lo que se consideran aceptables aquellas que tengan entre 495 y 509 ml (incluyendo ambos
valores). Se ha registrado el volumen de gaseosa (ml) que contiene un conjunto de botellas. A FIRMA
continuación, se muestran los datos que se han tomado y su resumen, obtenido con Minitab.

502.718 495.944 503.828 503.276


496.553 500.567 503.141 491.381
503.111 505.574 500.747 506.777
509.3 503.975 498.227 500.36
494.885 499.46 503.966 495.863
508.622 498.038 510.632 493.559
493.214 505.961 496.574 496.256
492.566 509.912 514.511 505.349
513.383 499.562 497.09 490.052

a. En el resumen aparece un p-valor de 0.815. Indique cuáles son las hipótesis asociadas al contraste en el cual se ha
obtenido dicho p-valor. Defínalas completamente. (0.5 p)
𝐻0 : 𝑋 ~ 𝑁(501.25; 38.89)
𝐻1 : 𝑋≁ 𝑁(501.25; 38.89)

b. ¿Qué se concluye a partir de dicho p-valor? Explique en un máximo de 2 líneas. (0.5 p)


Hay suficiente evidencia para afirmar que el volumen sigue una distribución normal (0.25 p) de media 501.25 y
varianza 38.89 (0.25 p).

c. A partir de los datos, ¿es posible afirmar que más de la cuarta parte de botellas son defectuosas? (1.5 p)
Hipótesis (0.25 p):
𝐻0 : 𝑝 ≤ 0.25
𝐻1 : 𝑝 > 0.25
Estadístico de contraste (0.25 p):
𝑝̂ − 𝑝0 0.3056 − 0.25
𝑧0 = = = 𝟎. 𝟕𝟕
√ 𝑝0 (1 − 𝑝0 ) √ 0.25 × 0.75
𝑛 36

Distribución del estadístico (justifique) (0.25 p. Sin justificación correcta: 0 p):


𝑝(1−𝑝)
Como 𝑛𝑝̂ (1 − 𝑝̂ ) > 5, entonces, por TLC, 𝑝̂ ~𝑁 (𝑝, ). Por lo tanto:
𝑛
𝒁𝟎 ~ 𝑵(𝟎, 𝟏)

Si hay algún error en las hipótesis, el estadístico de contraste o su distribución, ya no se sigue


corrigiendo el resto.

Valor(es) crítico(s) y regiones de aceptación y rechazo (0.25 p):

Conclusión (0.5 p):


El estadístico de contraste se encuentra en la región de aceptación. Hay suficiente evidencia para aceptar la
hipótesis nula y rechazar la alternativa Entonces, no hay suficiente evidencia para aceptar que más de la cuarta
parte de botellas son defectuosas.

5
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
.
7. Una empresa ha desarrollado un termómetro para medir la temperatura corporal de pacientes en un tiempo muy
corto. Para probarlo, en un hospital, se ha medido la temperatura corporal de un grupo de pacientes con el nuevo
termómetro (A) y con uno tradicional (B). El jefe de médicos tiene la sospecha de que el termómetro tradicional
registra, en promedio, menores medidas de temperatura en comparación con el nuevo termómetro. Sin embargo, el
desarrollador del termómetro piensa que no.

Individuo 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Termómetro A 37.02 36.86 37.29 37.46 36.80 36.85 37.16 37.40 37.51 36.69 37.38 36.81 37.19 36.83
Termómetro B 37.04 36.84 37.29 37.45 36.79 36.82 37.17 37.38 37.50 36.68 37.36 36.81 37.17 36.83
Diferencia (A-B) -0.02 0.02 0.00 0.01 0.01 0.03 -0.01 0.02 0.01 0.01 0.02 0.00 0.02 0.00

A continuación, se muestra el resumen de ambos conjuntos de datos obtenido con Minitab:


Termómetro A Termómetro B

a. Mediante un contraste de hipótesis, evalúe a quién le daría la razón. Muestre su procedimiento y enuncie cada
una de sus suposiciones para resolver este problema y explíquelas. Utilice 𝛼 = 1%. (1.5 p)
Hipótesis (0.25 p): Se trata de datos emparejados. Sea 𝒀 = 𝑻𝑨 − 𝑻𝑩
𝐻0 : 𝜇𝑦 ≤ 0
𝐻1 : 𝜇𝑦 > 0
Estadístico de contraste (0.25 p):
𝑦̅ − 0 0.0086 − 0
𝑡0 = = = 0.3973 ≈ 𝟎. 𝟒𝟎
𝑠̂𝑦 0.081⁄
⁄ √14
√𝑛

Distribución del estadístico (justifique) (0.25 p):


Como ambas poblaciones siguen una distribución normal, su diferencia también sigue una distribución normal.
Entonces: 𝑻𝒐 ~𝒕𝟏𝟑

Valor(es) crítico(s) y regiones de aceptación y rechazo (0.25 p):

Conclusión (¿A quién le da la razón? ¿Por qué?) (0.5 p):


El estadístico de contraste se encuentra en la región de aceptación. Se acepta la hipótesis nula y se rechaza la
alternativa. Entonces, los datos muestran evidencia que apoya al desarrollador del termómetro, porque no
hay suficiente evidencia para afirmar que el termómetro tradicional registra, en promedio, menores medidas
de temperatura en comparación con el nuevo termómetro.

Si se ha trabajado como muestras independientes, los puntajes son: Hipótesis 0.25p, estadístico y
distribución (justificada) 0.25 p, valores críticos y regiones 0.25 p, conclusión 0.25 p.

b. A partir de los datos, ¿es posible afirmar que la varianza de las temperaturas medidas por el termómetro nuevo
es 0.075? Responda a esta pregunta utilizando un intervalo de confianza. Explique y sustente cada una de sus
suposiciones para resolver este problema. Utilice un nivel de significación de 1%. (1 p)

(𝑛−1)𝑠̂ 2 (𝑛−1)𝑠̂ 2 14×0.081 14×0.081


𝐼. 𝐶. (99%): 𝜎 2 𝜖 [ ; ]=[ ; ] = [0.038; 0.3176] (0.5 p)
χ2
13;0.005 χ2
13;0.995 29.82 3.57
Como el valor 0.075 se encuentra en el intervalo de confianza, se acepta la hipótesis nula; es decir, hay suficiente
evidencia para afirmar que la varianza es 0.075. (0.5 p). Si el intervalo está mal construido, el puntaje total es 0.
6
NOTA REVISADA FIRMA Estadística Básica
Final

14/06/2019

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario oficiales de la asignatura. Contesta cada pregunta sólo en
la hoja de su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega. Cuando se solicite RECLAMO, deberá
adjuntarse copia de la solución publicada. NOTA

1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar. (5p) FIRMA

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.1 En una muestra aleatoria, el sesgo de los estimadores es nulo


Un estadístico es una variable aleatoria de la que sólo observamos el valor que se obtiene con nuestra
1.2
muestra X
1.3 La varianza de un estimador nos dice cuánto varía el sesgo de unas muestras a otras

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.4 La distribución muestra de la media es siempre normal

1.5 Si la muestra procede de una normal, la distribución muestral de la media es una t de Student

1.6 Si la muestra procede de una normal, la distribución muestral de la media es una normal X

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.7 Dado un tamaño muestral, puedo disminuir el margen de error si aumento el nivel de confianza

1.8 Dado un margen de error, al aumentar el tamaño muestral aumentará el nivel de confianza X
1.9 Dado un nivel de confianza, aumentando el tamaño muestral aumentará el margen de error

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.10 Si 𝐻0 : 𝜃 = 100 y 𝜃̂ ≠ 100 tendremos necesariamente que rechazar 𝐻0

1.11 Si 𝐻0 : 𝜃 ≥ 100 y 𝜃̂ > 100 tendremos necesariamente que aceptar 𝐻0 X


1.12 Si 𝐻1 : 𝜃 > 100 y 𝜃̂ > 100 tendremos necesariamente que aceptar 𝐻1

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.13 Cuanto mayor sea el nivel de significación más fácil será rechazar 𝐻0 X
1.14 El nivel de significación es el área que ocupa la región de aceptación

1.15 Si el estadístico de contraste es menor que el nivel de significación, rechazaremos 𝐻0

1
Página en blanco

2
Apellidos:______________________________________________________Nombre_______________________
Sección:___________________
NOTA

Un fabricante de fertilizantes para plantas desea desarrollar una fórmula de fertilizante orgánico que
produzca el mayor aumento en la altura de las plantas. Para probar su fórmula, se preparan dos grupos FIRMA
de plantas del mismo tipo: un grupo de control (grupo 1) sin ningún tipo de fertilizante, y un grupo
(grupo 2) con el nuevo fertilizante, denominado GrowFast. Después de que las plantas han
permanecido tres meses en un ambiente de invernadero controlado, se mide la altura de las plantas. El
resultado de esas mediciones se muestra en las siguientes figuras. Conteste de forma justificada a las siguientes
cuestiones:

Grupo 1 Grupo 2

a. Construya un intervalo de confianza del 95% de la altura media de las plantas sin fertilizante. (1p)

Según el gráfico de probabilidad y el pvalor del contraste AD (Anderson-Darling) puede asumirse que la
muestra procede de una población normal. (0.25p) Entonces
𝑠̂ 3.704
𝐼𝐶(0.95): 𝜇 ∈ [𝑥̅ ± 𝑡11;0.025 ] = [21.58 ± 2.201 ] = [21.58 ± 2.35] = [23.93 ; 19.23]
√𝑛 √12

b. ¿Qué tamaño muestral se necesita para estimar la altura media (sin fertilizante) con un margen de error inferior a 1? (1p)
Vamos a suponer que el n necesario será mayor que 30, por lo que podemos utilizar la fórmula para muestras
grandes.

3.704 1.96(3.704) 2
𝐿 = 1.96 <1⇒𝑛>( ) = 52.7 ⇒ 𝑛 ≥ 53
√𝑛 1

Vemos que 𝑛 > 30, por lo que la formulación empleada es la apropiada.

c. Si la altura de las plantas sin fertilizante es 𝑋1 ∼ 𝑁(𝜇1 ; 𝜎 2 ) y con fertilizante es 𝑋2 ∼ 𝑁(𝜇2 ; 𝜎 2 ), ¿qué distribución
muestral tendría la media muestral de todos los datos (12+11). Especifica también sus parámetros.(1p)

𝑥1,1 +𝑥1,2 +⋯+𝑥1,12 𝜎2 𝑥2,1 +𝑥2,2 +⋯+𝑥2,11 𝜎2


muestra 1: ∼ 𝑁 (𝜇1 ; ); muestra 2: ∼ 𝑁 (𝜇2 ; )
12 12 11 11
La media muestral de todos los datos es:
𝑥1,1 + 𝑥1,2 + ⋯ + 𝑥1,12 + 𝑥2,1 + 𝑥2,2 + ⋯ + 𝑥2,11 12 11
𝑥̅ = = 𝑥̅1 + 𝑥̅2
23 23 23

Por tanto, 𝑥̅ será una combinación lineal de 𝑥̅1 y 𝑥̅2 y será, por tanto, normal 𝑥̅ ∼ 𝑁(𝐸(𝑥̅ ); 𝑉𝑎𝑟(𝑥̅ )).
12 11 12 11
𝐸(𝑥̅ ) = 𝐸 ( 𝑥̅1 + 𝑥̅2 ) = 𝜇1 + 𝜇2
23 23 23 23
12 11 122 𝜎 2 112 𝜎 2 12 11
𝑉𝑎𝑟(𝑥̅ ) = 𝑉𝑎𝑟 ( 𝑥̅1 + 𝑥̅2 ) = 2 + = 𝜎 2 ( 2 + 2)
23 23 23 12 232 11 23 23

3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________

NOTA
(Continuamos con los datos de los fertilizantes)

d. ¿Aumenta el fertilizante la altura de las plantas? Responda mediante un contraste con un nivel de
significación de 5%. Responda en la tabla siguiente.(5p) FIRMA

Sin fertilizante: Grupo 1. Con fertilizante: Grupo 2.

Hipótesis (1p) 𝑯𝟎 : 𝝁𝟏 ≥ 𝝁𝟐 𝑯𝟏 : 𝝁𝟏 < 𝝁𝟐

𝑥̅1 − 𝑥̅2 21.58 − 23.45


𝑡= = = −1.3431.
1 1 1 1
Estadístico de contraste (1p) 𝑠̂ 𝑇 √ + 3.3354√ +
𝑛1 𝑛2 12 11
Indique el símbolo que lo representa, su
fórmula, los valores que utiliza en la fórmula
y el valor numérico del estadístico.
Utilice una precisión de 4 decimales. donde
11(3.704)2 + 10(2.876)2
𝑠̂ 𝑇2 = = 11.1252
21

Distribución del estadístico de


contraste (0.5p) 𝑡𝑛1+𝑛2−2 = 𝑡21

o Las muestras vienen de poblaciones normales.


o La varianza poblacional se puede asumir igual para ambas poblaciones (la mayor
¿Por qué ha elegido dicha
desv. estándar no es más del doble que la menor),
distribución? (0.5p)
o y como no se conoce la varianza poblacional, se estima a partir de las
cuasivarianzas.

Dibuja la distribución de referencia,


las regiones de aceptación y
rechazo, y localiza el valor del
estadístico de contraste. (1p)

Conclusión del contraste (1p)


1. ¿Se acepta o se rechaza la o Se acepta 𝐻0 , con un nivel de significación del 5%. (0.25p)
hipótesis nula? o El estadístico de contraste cae en la zona de aceptación de 𝐻0 . (0.25p)
2. ¿Por qué? o No hay evidencia suficiente para poder rechazar 𝐻0 , por lo que, con un nivel
3. Responda a la pregunta planteada de significación del 5%, no podemos asumir (no queda probado) que el
en el enunciado: fertilizante ayude a aumentar la altura de las plantas. Las diferencias
¿Aumenta el fertilizante la altura encontradas no son estadísticamente significativas. (0.5p)
de las plantas?
Debe ser coherente con el resto de la solución
Para que su respuesta sea válida, debe
justificar su conclusión.

4
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________

1. Un proceso industrial tiene dos indicadores que son de interés para evaluar su rendimiento. Sin
embargo, la medición continua de ambos indicadores es muy costosa. Por ello, se han tomado datos, NOTA
a partir de los cuales se ha construido un modelo de regresión lineal que permite predecir el valor del
Indicador 2 a partir del valor del Indicador 1.
FIRMA

a. ¿Es posible afirmar que los residuos se ajustan a una distribución normal? Justifique su respuesta en un máximo de 2
líneas. (1 p)
Sí es posible, pues, en la gráfica de probabilidad normal de residuos, los puntos se alinean a la línea recta que representa a
la distribución normal.
Cualquier otro argumento adicional, invalida completamente la respuesta (0 p)

b. ¿Es posible afirmar que la relación entre el Indicador 1 y el Indicador 2 es lineal? Use un máximo de 2 líneas. (1 p)
No es posible, porque, en la gráfica de residuos vs. valores previstos se observa una estructura de puntos que evidencia
no linealidad.
Cualquier otro argumento adicional, invalida completamente la respuesta (0 p)

c. Explique de dónde procede el p-valor que está asociado a la variable Indicador1. Dé su respuesta en un máximo de tres
líneas. (0.5 p)
Procede de la prueba de significatividad de la relación entre el indicador 1 y el indicador 2.

Cualquier otro argumento adicional, invalida completamente la respuesta (0 p)

2. Se tiene una muestra de pesos de un conjunto de monedas. Se han realizado pruebas de bondad de ajuste a distintas
distribuciones. Los resultados se muestran a continuación. En la tabla, la columna AD muestra el estadístico de la
prueba de bondad de ajuste y la columna P muestra el p-valor de dicha prueba.

a. A la vista de los resultados, ¿qué distribuciones son aceptables? Justifique su respuesta (0.5 p).

Son aceptables las distribuciones: normal, lognormal, Weibull de 3


parámetros, Gamma, Logística y Loglogística (0. 25p) porque el p-valor
asociado a cada una de ellas es mayor que el nivel de significación (5%)
(0.25 p).

5
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
.

b. ¿Cuál es la mejor distribución que elegiría para modelar el peso de las monedas? Justifique su respuesta en un
máximo de dos líneas. (0.5 p)
Elegiría la lognormal, porque es la distribución con cuya prueba de bondad de ajuste se obtiene el mayor p-valor.

Otra respuesta posible: Gamma. Cualquier otra respuesta: 0 p.

c. Interprete el significado del p-valor 0.081 de la prueba de bondad de ajuste a la distribución Logística. Use un
máximo de dos líneas. (1 p)
Es la probabilidad de que, si el modelo fuese correcto, se obtengan distancias tan grandes como las obtenidas en
la muestra que se ha tomado.

3. Un grupo de alumnos de Estadística construyó un modelo que permite predecir el volumen de jugo (en ml) de una
naranja a partir de su peso (en g). Minitab ha mostrado los siguientes resultados:

Además, verificó que la relación entre ambas variables es significativa y que se cumplen las hipótesis básicas del
modelo. Responda, de manera justificada, a las cuestiones que se plantean a continuación. Para que sus respuestas
sean válidas, deben ser claras y tener una buena redacción.

a. Interprete el coeficiente que representa la pendiente de la recta de regresión. Dé su respuesta en un máximo de


dos líneas. (1 p)
Por cada gramo adicional que pese una naranja (0.25 p), el volumen del jugo que se obtendrá aumenta en
0.3522 ml (0.25 p), por término medio (0.5 p)
En la interpretación, deben estar presentes los valores numéricos.
Cualquier otra respuesta: 0 p.

b. Interprete el valor del coeficiente de determinación. Dé su respuesta en un máximo de dos líneas. (0.5 p)
El modelo de regresión construido explica el 47.98 % de la variabilidad del volumen de jugo que se obtiene de
una naranja.
Cualquier otra respuesta: 0 p.

c. ¿Cuál es la probabilidad de extraer más de 100 ml de jugo de una naranja de 200 g? (1 p)

𝐸 (𝑉𝑜𝑙𝑢𝑚𝑒𝑛 | 𝑃𝑒𝑠𝑜 = 200𝑔) = 95.84 (0.25 p)


𝑉𝑎𝑟 (𝑉𝑜𝑙𝑢𝑚𝑒𝑛 | 𝑃𝑒𝑠𝑜 = 200𝑔) = 16.21032

Como se cumple la hipótesis de normalidad del error, entonces:


𝑉𝑜𝑙𝑢𝑚𝑒𝑛 | 𝑃𝑒𝑠𝑜 = 200𝑔 ~ 𝑁(95.84; 16.21032 ) (0.25 p)

Entonces, cuando el peso de una naranja es de 200 g:


100−95.84
𝑃(𝑉𝑜𝑙𝑢𝑚𝑒𝑛 > 100) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 0.26) = 1 − 0.6026 = 𝟎. 𝟑𝟗𝟕𝟒 (0.5 p)
16.2103

6
NOTA REVISADA FIRMA Estadística Básica
Parcial
Facultad de Ingeniería
11/05/2019

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________

Con calculadora y formulario y tablas oficial de la asignatura. Todas las evaluaciones se escanean para prevenir fraude. Contesta cada pregunta
sólo en la hoja de su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega.
NOTA
Cuando se solicite reclamo, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El
reclamo deberá basarse en errores de corrección en base a esa solución.
1. A continuación, se muestra una tabla con un conjunto de afirmaciones. Para cada una de ellas, responde FIRMA

si es verdadera (V) o falsa (F). Para cada una, la puntuación es +0.5 si la respuesta es correcta y −0.5 si
se falla. No hay que justificar. (5p)

1.1 Si A y B son sucesos complementarios 𝑃(𝐴) + 𝑃(𝐵) = 1 V


1.2 Los sucesos elementales de un experimento aleatorio son mutuamente excluyentes V
Si el número de clientes por unidad de tiempo sigue un modelo de Poisson, el tiempo entre clientes
1.3
consecutivos seguirá un modelo exponencial.
V
1.4 Si X es una variable aleatoria continua y 𝑓(1) = 0 entonces 𝑥 = 1 no está en el espacio muestral V
1.5 Si 𝑋 ∼ 𝐵(2,0.1) entonces 𝑝(1) = 0.5 F
1.6 Si 𝑋 ∼ 𝐵(2,0.1) entonces F(2) = 1 V
1.7 Si 𝑋1 ∼ 𝑃𝑜𝑖(3) y 𝑋2 ∼ 𝑃𝑜𝑖(2) entonces 𝑌 = 𝑋1 + 𝑋2 ∼ 𝑃𝑜𝑖(6) F
1.8 Sea 𝑋 ∼ 𝐸𝑥𝑝(𝜆 = 1), entonces el primer cuartil es, con cuatro decimales de precisión, 0.2877 V
1.9 Si 𝑋 ∼ 𝑁(10,1) y 𝑌 ∼ 𝑁(20,1), entonces 𝑃(𝑋 + 𝑌 > 30) = 0.5 V
1.10 La ausencia de memoria en un experimento significa que los valores futuros tienen probabilidad nula F

1
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________

2. (6p) En un paradero de ómnibus, el tiempo, X, en minutos, que transcurre desde que se va un ómnibus hasta el siguiente
es una variable aleatoria que se distribuye como 𝑋 ∼ 𝑁(8,4). (Se usará la notación 𝑁(𝜇, 𝜎 2 ))

Un pasajero llega al paradero justo cuando se va un ómnibus. Responde, justificando brevemente, a las siguientes
preguntas:
a) ¿Cuánto tiempo esperará por término medio hasta que venga el siguiente ómnibus? (0.25p)
Piden 𝐸(𝑋) = 𝜇 = 8

b) ¿Cuál es la probabilidad de que tenga que esperar más de 10 minutos? (1p)


𝑋 − 8 10 − 8
𝑃(𝑋 > 10) = 𝑃 ( > ) = 𝑃(𝑍 > 1) = 1 − 𝑃(𝑍 < 1) = 1 − 0.8413 = 0.1587
2 2

c) Han transcurrido ya 5 minutos y este pasajero sigue esperando a que llegue el ómnibus. ¿Cuál es la probabilidad de que
el ómnibus demore todavía cinco minutos más en llegar (el tiempo de espera desde que llegó seria así de más de 10
minutos) (1,25p)

𝑃[(𝑋 > 10) ∩ (𝑋 > 5) 𝑃(𝑋 > 10) 0.1587


𝑃(𝑋 > 10|𝑋 > 5) = = = = 0.1701
𝑃(𝑋 > 5) 𝑃(𝑋 > 5) 1 − 0.0668

d) Cuando este pasajero llegó al paradero, estaba él solo, pues el resto de los pasajeros partieron en el último ómnibus.
Mientras espera, han aparecido más pasajeros. Asumiremos que los pasajeros llegan independientemente unos de otros
a un ritmo medio de 2 pasajeros por minuto. ¿Cuál es la probabilidad de que durante los 5 minutos que lleva esperando
hayan llegado 10 pasajeros? (1p)

Sea Y=nº de pasajeros que llegan en 5 minutos. Como lo hacen con media constante e independencia, es una
Poisson. Si en media llegan 2 por minuto, en 5 minutos la media será 10
𝑝𝑎𝑠 1010 −10
𝑌 ∼ 𝑃𝑜𝑖 (𝜆 = 10 ) ⇒ 𝑃(𝑌 = 10) = 𝑒 = 0.1251
5 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 10!

e) Por fin llega el ómnibus, y nuestro pasajero sube a él. El pasajero planea bajarse en la tercera parada a contar desde el
momento en que se ha subido. La duración del trayecto desde la posición actual hasta la siguiente parada (parada 1) se
distribuye como una normal 𝑋1 ∼ 𝑁(3,0.5), la duración entre la parada 1 y la parada 2 se distribuye como 𝑋2 ∼ 𝑁(4,1),
y la duración entre la parada 2 y la parada 3 sigue el modelo 𝑋3 ∼ 𝑁(3,1), siendo las tres duraciones independientes.
¿Cuál es la probabilidad de que su viaje dure más de 8 minutos? (1.5p)

D=duración del viaje=𝑋1 + 𝑋2 + 𝑋3 . Al ser normales independientes se cumple que 𝐷 ∼ 𝑁(10,2.5)


8 − 10
⇒ 𝑃(𝐷 > 8) = 1 − 𝑃 (𝑧 < ) = 1 − 𝑃(𝑧 < −1.26) = 1 − 0.1038 = 0.8962.
√2.5

f) La empresa de transporte cuenta con 5 ómnibus. La probabilidad de que un día se averíe un ómnibus es del 5%. ¿Cuál
es la probabilidad de que un día haya dos ómnibus averiados? (1p)

A=nº de ómnibus averiados.

5
𝐴 ∼ 𝐵(5,0.05) ⇒ 𝑃(𝐴 = 2) = ( ) 0.052 × 0,953 = 0.0214
2

2
Apellidos:_________________________________________________________Nombre_______________________

Sección:___________________ NOTA
.
3. A partir de un conjunto de datos, se ha elaborado la siguiente tabla de frecuencias relativas acumuladas.
Calcule, a partir de la información brindada, el coeficiente de variación de los datos. Muestre su FIRMA
procedimiento. (1.5 p)

x 1 2 3 5 6 7 8
Frec. relativa
14% 36% 52% 64% 84% 96% 100%
acumulada
Frec. relativa 0.14 0.22 0.16 0.12 0.20 0.12 0.04

𝑥̅ = 1 × 0.14 + 2 × 0.22 + 3 × 0.16 + 5 × 0.12 + 6 × 0.20 + 7 × 0.12 + 8 × 0.04 (0.25 p)

̅ = 𝟒. 𝟎𝟐 (0.25 p)
→𝒙

𝑠 2 = (1 − 4.02)2 × 0.14 + (2 − 4.02)2 × 0.22 + (3 − 4.02)2 × 0.16 + (5 − 4.02)2 × 0.12 + (6 − 4.02)2 × 0.20 +
(7 − 4.02)2 × 0.12 + (8 − 4.02)2 × 0.04 (0.25 p)

𝑠 2 = 4.9306 → 𝒔 = 𝟐. 𝟐𝟐 (0.25 p)

𝑠 2.22
Entonces, el coeficiente de variación será (0.5 p): 𝐶𝑉 = = = 𝟎. 𝟓𝟓𝟐𝟐
|𝑥̅ | 4.02

4. En una tienda de ropa, el monto de la compra (𝑋, en soles) de un cliente tiene la siguiente función de densidad:

20000
; 𝑥 ≥ 100
𝑓(𝑥) = { 𝑥3
0; 𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

a. ¿Cuál es la varianza del monto de la compra de un cliente? (1 p)

+∞ +∞
20000 20000 +∞ 20000
𝐸(𝑋) = ∫ 𝑥 ∙ 𝑓(𝑥)𝑑𝑥 (𝟎. 𝟐𝟓 𝒑) = ∫ 𝑑𝑥 = (− )| = (0 + ) = 𝟐𝟎𝟎 (𝟎. 𝟐𝟓 𝒑)
−∞ 100 𝑥2 𝑥 100 100

+∞ +∞
20000
𝑉𝑎𝑟(𝑋) = ∫ (𝑥 − 𝜇)2 ∙ 𝑓(𝑥)𝑑𝑥 = ∫ (𝑥 − 200)2 ∙ (𝟎. 𝟐𝟓 𝒑) = +∞ (𝟎. 𝟐𝟓 𝒑)
−∞ 100 𝑥3

b. De los clientes que gastan menos de S/1000. ¿Qué porcentaje gastan más de 500? (1 p)

𝑃(𝑋 > 500 | 𝑋 < 1000) (0.25 p) Si se ha planteado otra probabilidad, el puntaje de toda la pregunta es 0.

𝑃(𝑋 > 500 ∩ 𝑋 < 1000) 𝑃(500 < 𝑋 < 1000)


𝑃(𝑋 > 500 | 𝑋 < 1000) = = (𝟎. 𝟐𝟓 𝐩)
𝑃(𝑋 < 1000) 𝑃(𝑋 < 1000)

1000 20000
∫500 𝑑𝑥
𝑃(𝑋 > 500 | 𝑋 < 1000) = 𝑥3 = 𝟎. 𝟎𝟑𝟎𝟑 (𝟎. 𝟓 𝒑)
1000 20000
∫100 𝑑𝑥
𝑥3

c. Defina completamente la función de distribución de 𝑋. (1 p)

Se puede hallar 𝐹(𝑥) (0.75 p):


𝑥
20000 10000 𝑥 10000
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑑𝑥 = (− )| =1−
100 𝑥
3 𝑥 2 100 𝑥2
0; 𝑠𝑖 𝑥 < 100
Entonces (0.25 p): 𝐹(𝑥) = { 10000
1 − 2 ; 𝑠𝑖 𝑥 ≥ 100
𝑥

3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
.

d. ¿Qué valor es tan alto que solo el 30% de los clientes gasta un monto mayor que él? (1 p)

Se pide 𝑃70 . Se sabe que: 𝐹(𝑃70 ) = 𝑃(𝑋 ≤ 𝑃70 ) = 0.70 (𝟎. 𝟐𝟓 𝒑)

𝑃70
20000
∫ 𝑑𝑥 = 0.70
100 𝑥3

10000 𝑃70 10000


(− )| =1− 2 = 0.70
𝑥2 100 𝑃70

→ 𝑷𝟕𝟎 = 𝟏𝟖𝟐. 𝟓𝟕 (𝟎. 𝟕𝟓 𝒑)

e. La tienda tiene la siguiente política: si un cliente gasta S/500 o más, se le invita a adquirir una membresía VIP, que
tiene un costo anual. Si gasta menos de S/500 no se le hace la invitación. Además, se sabe, por información
histórica, que únicamente el 10% de los clientes a los que se les hace la invitación, aceptan.
Un nuevo cliente realiza una compra en la tienda, ¿cuán probable es que adquiera la membresía VIP? (1.5 p)

Sean los sucesos A: El cliente gasta más de S/500; B: El cliente adquiere la membresía anual.
Se sabe que:
500 20000
 𝑃(𝐴) = 𝑃(𝑋 > 500) = 1 − 𝑃(𝑋 ≤ 500) = 1 − ∫100 𝑑𝑥 = 0.04 (𝟎. 𝟓 𝒑)
𝑥3
 𝑃(𝐵 | 𝐴) = 0.10
 𝑃(𝐵 | 𝐴̅) = 0

Se pide P(B). Entonces: 𝑃(𝐵) = 𝑃(𝐵 | 𝐴) × 𝑃(𝐴) + 𝑃(𝐵 | 𝐴̅) × 𝑃(𝐴̅) (𝟎. 𝟓 𝒑)

𝑃(𝐵) = 0.10 × 0.04 + 0 × (1 − 0.04) → 𝑷(𝑩) = 𝟎. 𝟎𝟎𝟒 (𝟎. 𝟓 𝒑)

5. Sea 𝑌 una variable aleatoria, cuya función de probabilidad es:


(𝑦6 )
; 𝑝𝑎𝑟𝑎 𝑥 ∈ {0; 1; 2; … ; 6}
𝑝(𝑦) =
64
Responda a las siguientes preguntas, mostrando su procedimiento:

a. Calcule 𝐸(𝑌 2 ). (1 p)

6 6
(𝑦6 ) (60) (6 ) (6 ) (6 ) (6 ) (6 ) (6 )
𝐸(𝑌 2) 2
= ∑ 𝑦 ∙ 𝑝(𝑦) = ∑ 𝑦 ∙ 2
= 02 × + 12 × 1 + 22 × 2 + 32 × 3 + 42 × 4 + 52 × 5 + 62 × 6
64 64 64 64 64 64 64 64
0 0

𝑬(𝒀𝟐 ) = 𝟏𝟎. 𝟓 (𝟏 𝒑)

b. Si se sabe que 𝑌 tiene un valor mayor que 1, ¿cuán probable es que tenga un valor de al menos 4? (1 p)

𝑃(𝑌 ≥ 4 | 𝑌 > 1) (𝟎. 𝟐𝟓 𝒑) Si se ha planteado otra probabilidad, el puntaje de toda la pregunta es 0.

(64) (65) (66)


𝑃(𝑌 ≥ 4) 64 + 64 + 64
𝑃(𝑌 ≥ 4 | 𝑌 > 1) = = = 𝟎. 𝟑𝟖𝟔𝟎 (𝟎. 𝟕𝟓 𝒑)
𝑃(𝑌 > 1) (60) (61)
1−[ + ]
64 64

4
NOTA REVISADA FIRMA Estadística Básica
Práctica 4

Facultad de Ingeniería 14/06/2019

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de su
enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega. Cuando se solicite RECLAMO, deberá adjuntarse copia de la
solución publicada. NOTA

1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar. (4p) FIRMA

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.1 𝑧0.025 = 1 − 𝑧0.95


2
1.2 𝑡300 ≈ 𝜒300

1.3 𝑡𝑛−1;0.025 > 𝑧0.025 X

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

Para calcular el tamaño muestral para estimar una proporción 𝑝 de la que desconocemos completamente
1.4 X
su valor, lo mejor es asumir 𝑝 = 0.5

1.5 Si el intervalo de confianza del 95% de p es [0.01; 0.03] no puedo rechazar que 𝑝 = 0.05 con 𝛼 = 5%

1.6 Si 𝑛𝑝(1 − 𝑝) > 5 podemos aproximar la proporción muestral 𝑝̂ a una Bernoulli

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)


Si al realizar el contraste 𝐻0 : 𝜇 ≥ 10 se obtiene un pvalor=0.10, el contraste 𝐻0 : 𝜇 = 10 tendrá un pvalor
1.7
de 0.05
Si al realizar el contraste 𝐻0 : 𝜇 ≥ 100 se obtiene un pvalor=0.10, el contraste 𝐻0 : 𝜇 ≤ 100 tendrá un
1.8 X
pvalor de 0.90
1.9 Si rechazo 𝐻0 en el contraste 𝐻0 : 𝜇 ≥ 𝜇0, también rechazaré 𝐻0 en el contraste 𝐻0 : 𝜇 ≤ 𝜇0

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.10 Si quiero contrastar si la media es inferior a 100, tendré que usar 𝐻0 : 𝜇 ≠ 100

1.11 Si quiero contrastar si la media supera el valor 200, tendré que usar 𝐻0 : 𝜇 > 200

1.12 Si quiero contrastar si la media es negativa, tendré que usar 𝐻0 : 𝜇 ≥ 0 X

1
NOTA REVISADA FIRMA Estadística Básica
Práctica 4

Facultad de Ingeniería 14/06/2019

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de su
enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega. Cuando se solicite RECLAMO, deberá adjuntarse copia de la
solución publicada. NOTA

1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3 FIRMA
si la elección es incorrecta). No hay que justificar. (4p)

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.1 𝑧0.025 = 1 − 𝑧0.95


2
1.2 𝑡300 ≈ 𝜒300

1.3 𝑡𝑛−1;0.025 > 𝑧0.025 X

SOLUCIÓN:
1.1 Falsa. El subíndice indica el área a la derecha de la distribución. Como 𝑍 es simétrica y de meda cero, se tendrá que 𝑧0.025 = 1 − 𝑧0.975
1.2 Falsa. 𝑡300 ≈ 𝑁(0,1)
1.3 Verdadera. La distribución t de Student tiene la zona de las colas más ancha que la 𝑁(0,1), por lo que la función de densidad se acerca
asintóticamente a cero más despacio. Por tanto, 𝑡𝑛−1;0.025 > 𝑧0.025 .

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

Para calcular el tamaño muestral para estimar una proporción 𝑝 de la que desconocemos completamente
1.4 X
su valor, lo mejor es asumir 𝑝 = 0.5

1.5 Si el intervalo de confianza del 95% de p es [0.01; 0.03] no puedo rechazar que 𝑝 = 0.05 con 𝛼 = 5%

1.6 Si 𝑛𝑝(1 − 𝑝) > 5 podemos aproximar la proporción muestral 𝑝̂ a una Bernoulli

SOLUCIÓN:
1.4 Verdadera. Deesa formase calcula para el caso más desfavorable
1.5 Falsa. Como 0.05 no está en el intervalo del 95%, sí podemos rechazar que la proporción poblacional sea 0.05 con 𝛼 = 5%
1.6 Falsa. Si 𝑛𝑝(1 − 𝑝) > 5 podemos aproximar la proporción muestral 𝑝̂ a una Normal.

2
Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)
Si al realizar el contraste 𝐻0 : 𝜇 ≥ 10 se obtiene un pvalor=0.10, el contraste 𝐻0 : 𝜇 = 10 tendrá un pvalor
1.7
de 0.05
Si al realizar el contraste 𝐻0 : 𝜇 ≥ 100 se obtiene un pvalor=0.10, el contraste 𝐻0 : 𝜇 ≤ 100 tendrá un
1.8 X
pvalor de 0.90
1.9 Si rechazo 𝐻0 en el contraste 𝐻0 : 𝜇 ≥ 𝜇0, también rechazaré 𝐻0 en el contraste 𝐻0 : 𝜇 ≤ 𝜇0

SOLUCIÓN:
1.7 Falso. En el contraste con 𝐻0 : 𝜇 ≥ 10 el pvalor es el área a la izquierda del valor del estadístico de contraste, mientas que con 𝐻0 : 𝜇 = 10,
es el doble de dicha área, por lo que el pvalor sería 0.20.
1.8 Verdadero. En el contraste con 𝐻0 : 𝜇 ≥ 10 el pvalor es el área a la izquierda del valor del estadístico de contraste, mientas que con 𝐻0 : 𝜇 ≤
10, es el área a la izquierda, que sería 0.90,
1.9 Falso. Si rechazo con 𝐻0 : 𝜇 ≥ 𝜇0 será porque el estadístico de contraste está en la zona de la cola de la izquierda de la distribución
N(0,1) o 𝑡𝑛−1 . Por el contrario, para rechazar 𝐻0 : 𝜇 ≤ 𝜇0 habría que estar en la zona de la cola de la derecha.

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.10 Si quiero contrastar si la media es inferior a 100, tendré que usar 𝐻0 : 𝜇 ≠ 100

1.11 Si quiero contrastar si la media supera el valor 200, tendré que usar 𝐻0 : 𝜇 > 200

1.12 Si quiero contrastar si la media es negativa, tendré que usar 𝐻0 : 𝜇 ≥ 0

SOLUCIÓN:
1.10 Falso. Tendré que usar 𝐻0 : 𝜇 ≥ 100; 𝐻1 : 𝜇 < 100
1.11 Falso. Tendré que usar 𝐻0 : 𝜇 ≤ 200; 𝐻1 : 𝜇 > 200
1.12 Verdadero. Tendré que usar 𝐻0 : 𝜇 ≥ 0; 𝐻1 : 𝜇 < 0

3
Apellidos:______________________________________________________Nombre_______________________

Sección:___________________ NOTA

2. Un horno metalúrgico en el que se elabora cierta aleación debe mantener una temperatura lo más FIRMA
estable posible alrededor del valor de temperatura especificado. Para monitorear la temperatura del
horno se toma una muestra de 30 temperaturas a intervalos regulares, obteniéndose una media de 𝑥̅ =
1970 , y una cuasi-varianza de 𝑠̂ 2 = 100 . Asumiendo que las temperaturas de este proceso se
distribuyen como una normal, se pide:

a. Construye un intervalo de confianza para la temperatura media el proceso. (2p)

Como la población de la que procede la muestra es normal, el intervalo de la media poblacional se basa en la distribución
𝑡𝑛−1 = 𝑡29
𝑆̂ 10
𝐼𝐶(0.95): 𝜇 ∈ (𝑋̅ ± 𝑡29;0.025 ) = (1970 ± 2.045 ) = (1970 ± 3.74) = (1966.27; 1973.74)
√𝑛 √30

b. ¿Se puede afirmar que la temperatura media del horno es de 1975 grados? Justifica adecuadamente tu respuesta.
(2p)

Debemos hacer el contraste bilateral 𝐻0 : 𝜇 = 1975; 𝐻1 : 𝜇 ≠ 1975. Este contraste es equivalente a comprobar si 1975
está dentro del intervalo de confianza que use el mismo 𝛼 . Como 1975 no está en el intervalo, rechazamos que la
temperatura media del horno sea 1975.

c. Construye ahora un intervalo de confianza para 𝜎 2 . (2p)

Como la población de la que procede la muestra es normal, el intervalo de la media poblacional se basa en la distribución
2 2
𝜒𝑛−1 = 𝜒29

29 𝑠̂ 2 29 𝑠̂ 2 29(100) 29 (100)
𝐼𝐶(0.95): 𝜎 2 ∈ [ 2 ; 2 ]=[ ; ] = [63.43 ; 180.69
𝜒29;0.025 𝜒29;0.025 45.72 16.05

3. Realiza el contraste de que la varianza de las temperaturas es inferior a 105. (2 p)

• Debemos hacer el contraste 𝐻0 : 𝜎 2 ≥ 105; 𝐻1 : 𝜎 2 < 105 (0.5p)

• El estadístico de contraste es
(𝑛 − 1)𝑠̂ 2 29(100)
𝑋02 = = = 27.62 (0.25p)
𝜎02 105
• Al ser la población normal, la distribución de referencia es la 𝜒29
2
.
(0.25p)

• La región de rechazo se encuentra en la cola de la izquierda, y el valor crítico es 𝜒29;0.95


2
= 17.71 (0.25p)
• Como 𝑋02 = 27.62 > 17.71 estamos en la región de aceptación (0.25p)
• Con un nivel de significación del 5% no podemos rechazar que la varianza de las temperaturas sea mayor o igual a
105. La varianza no es inferior a 105 (rechazamos que sea menor a 105) (0.5p)

4
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________

4. Se quiere conocer qué proporción de estudiantes universitarios está estudiando portugués, como lengua NOTA
extranjera. ¿A cuántos deberíamos preguntar para estimar dicha proporción con un margen de error de
0.05? (2 p)
FIRMA
• Como no se tiene ninguna proporción muestral, se asume el “peor de los casos”: 𝑝̂ = 0.5. (0.5 p)
• Como no se tiene más información, se asume que se construirá el intervalo con un nivel de
confianza del 95%.

2 2
√𝑝̂ (1 − 𝑝̂ ) √0.5 × 0.5
𝑛 = (𝑧𝛼⁄2 ) = (1.96 × )
𝐿 0.05

𝑛 = 384.16 (1 p)

𝑛 ≈ 385 (0.5 p)

5. Después de preguntar a 50 estudiantes, obtenemos que 5 de ellos estudia portugués. Aprovechando esta información,
¿a cuántos deberíamos preguntar para estimar dicha proporción con un margen de error de 0.05? (1.5 p)

• Como no se tiene más información, se asume que se construirá el intervalo con un nivel de confianza del 95%.
5
• Según la información que se tiene: 𝑝̂ = = 0.10. (0.5 p)
50

2 2
√𝑝̂ (1 − 𝑝̂ ) √0.1 × 0.9
𝑛 = (𝑧𝛼⁄2 ) = (1.96 × )
𝐿 0.05

𝑛 = 138.30 (0.75 p)

𝑛 ≈ 139 (0.25 p)

6. Tras preguntar a 200 estudiantes, 12 de ellos estudian portugués. Contrasta que la proporción poblacional de estudiantes
que estudia portugués sea como mínimo el 10%. (1.5 p)

1) Se definen las hipótesis (0.25 p): 4) Se definen las regiones de aceptación y rechazo
𝐻𝑜 : 𝑝 ≥ 0.10 (0.25 p):
𝐻1 : 𝑝 < 0.10

2) Se calcula el estadístico de contraste (0.25 p):


𝑝̂ − 𝑝0 0.06 − 0.10
𝑧0 = = = −1.8856
√𝑝0 (1 − 𝑝0 ) √0.10 × 0.90
𝑛 200 Zo=-1.8856

5) Conclusión
3) Como 𝑛𝑝̂ (1 − 𝑝̂ ) > 5, la distribución del
a. Se rechaza la hipótesis nula (se acepta la
estadístico de contraste es (0.25 p):
hipótesis alternativa).
𝑍0 ~𝑁(0,1)
b. No hay suficiente evidencia para afirmar que la
Si alguno de los tres pasos anteriores es proporción de estudiantes que estudia
incorrecto, el resto del procedimiento no se portugués es como mínimo 10%.
corrige. La conclusión debe ser coherente con el paso 4.
Si todo es correcto, 0.5 p. Si hay algún error: 0 p.

5
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
.

7. Se desea estudiar el número de artículos defectuosos que se encuentra en una caja de 6 dispositivos
electrónicos. Se ha tomado una muestra aleatoria de varias cajas, cuya frecuencia se muestra a FIRMA
continuación
Número de dispositivos
Número de cajas
defectuosos
0 73
1 43
2 11
3 2
4 1
5 1

a. A partir de la información muestral, ¿es posible afirmar que el número medio de artículos defectuosos en una
caja de 6 dispositivos no es inferior al valor de 1? Resuélvalo utilizando el p-valor. (2 p)

1) Se definen las hipótesis (0.25 p): 4) Se calcula el p-valor (0.5 p):


𝐻𝑜 : 𝜇 ≥ 1 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 𝑃(𝑍 < −5.16)
𝐻1 : 𝜇 < 1 𝑝 − 𝑣𝑎𝑙𝑜𝑟 ≈ 0

2) Se calcula el estadístico de contraste (0.25 p): 5) Conclusión. Como el p-valor es menor que el nivel
𝑥̅ − 𝜇0 0.61 − 1 de significación (5%), entonces:
𝑡0 = = = −5.16
𝑠̂ 0.8644 c. Se rechaza la hipótesis nula (se acepta la
√𝑛 √131 hipótesis alternativa).
d. No hay suficiente evidencia para afirmar que el
3) Como la muestra es grande, la distribución del número medio de artículos defectuosos no es
estadístico de contraste es (0.25 p): inferior al valor de 1. (Hay suficiente evidencia
𝑇0 ~𝑁(0,1) para afirmar que el número medio es inferior
a 1).
Si alguno de los tres pasos anteriores es
La conclusión debe ser coherente con el paso 4.
incorrecto, el resto del procedimiento no se Si todo es correcto, 0.75 p. Si hay algún error: 0 p.
corrige.

b. A partir de la información de la muestra, ¿es posible afirmar que el porcentaje de cajas que tienen al menos un
artículo defectuoso es mayor que el 50%? Resuélvalo utilizando el p-valor. (1 p)

1) Se definen las hipótesis (0.125 p): 4) Se calcula el p-valor (0.25 p):


𝐻𝑜 : 𝑝 ≤ 0.50 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 𝑃(𝑍 > −1.31)
𝐻1 : 𝑝 > 0.50 𝑝 − 𝑣𝑎𝑙𝑜𝑟 ≈ 0.9049

2) Se calcula el estadístico de contraste (0.25 p): 5) Conclusión. Como el p-valor es mayor que el nivel
𝑝̂ − 𝑝0 0.4427 − 0.50 de significación (5%), entonces:
𝑧0 = = = −1.3117
𝑝0 (1 − 𝑝0 ) 0.50 × 0.50 a. Se acepta la hipótesis nula (se rechaza la
√ √
𝑛 131 hipótesis alternativa).
b. No hay suficiente evidencia para afirmar que
3) Como 𝑛𝑝̂ (1 − 𝑝̂ ) > 5 , la distribución del el porcentaje de cajas que tienen al menos un
estadístico de contraste es (0.125 p): artículo defectuoso es mayor que el 50%.
𝑍0 ~𝑁(0,1) La conclusión debe ser coherente con el paso 4.
Si todo es correcto, 0.25 p. Si hay algún error: 0
Si alguno de los tres pasos anteriores es p.
incorrecto, el resto del procedimiento no se
corrige.

6
ESTADÍSTICA BÁSICA
SEMESTRE 2019-II
CONTROL DE LABORATORIO 4-A
MIÉRCOLES, 20 DE NOVIEMBRE DE 2019

Apellidos:__________________________________________________Nombre________________________
Sección:___________________
Contesta sólo en los recuadros. Salvo que se indique lo contrario, utiliza 𝛼 = 0.05. No se puede consultar ningún tipo de documentación

1. Una plantación de tabaco de Tarapoto quiere comparar la efectividad de dos tratamientos diferentes para evitar la aparición
de lesiones en las hojas de tabaco. Se seleccionan 8 hojas. En cada una, se impregna la mitad de la hoja con un preparado
del tratamiento 1, y la otra mitad con el tratamiento 2. Transcurrido un tiempo se cuenta el número de lesiones que hay en
cada mitad de las hojas. Los datos se encuentran en el archivo LesionTabaco.MTW. El tratamiento más efectivo será aquel
que consigue menos lesiones. Contrasta si el tratamiento 1 es menos efectivo que el tratamiento 2. Asumiremos normalidad
en las poblaciones.

p-valor = 0.017 (datos emparejados) (2p)


Conclusión: (3p)
Rechazamos la hipótesis nula 𝐻0 : 𝜇1 ≤ 𝜇2 frente a la alternativa 𝐻1 : 𝜇1 > 𝜇2 (el tratamiento 1 es menos
efectivo pues produce más lesiones por término medio)
Por tanto, los datos nos llevan a concluir, con un pvalor de 0.017, que el tratamiento 1 es menos efectivo.

Si el pvalor está mal, esta parte no se puntúa

2. El archivo FrenosITV.MTW tiene datos de un conjunto de autos tomados en un taller de inspección de vehículos. La variable
‘Eficacia’ tiene la eficacia de la frenada. Es un valor entre 0 y 100, que cuanto mayor sea más efectiva es la frenada. La variable
ABS vale 1 si el auto está equipado con el dispositivo ABS que evita el bloqueo de los frenos, y 0 si no dispone de él. Contrasta
si la eficacia de frenado es la misma con o sin ABS.

p-valor = 0.491 (como las cuasidesv. son similares, se utiliza la desv. estándar agrupada) (2p)
Conclusión: (3p)
No podemos rechazar la hipótesis nula de igualdad de medias.
No hay evidencia, por tanto, de que el tener ABS modifique la eficacia de frenado.
Si el pvalor está mal, esta parte no se puntúa

3. Las partículas en suspensión en el aire que tienen un tamaño menor de 10μm se denominan PM10, y pueden estar
constituidas por multitud de contaminantes diferentes. Estas partículas permanecen de forma estable en el aire durante
largos periodos de tiempo sin caer al suelo pudiendo ser trasladadas por el viento a distancias importantes. El archivo
ConcentraPM10_CERO.mtw contiene datos sobre concentración de PM10 medida en una estación de medición de cierta
ciudad europea (variable PM10). Cada fila corresponde a una hora del día. Además, contiene la variable ‘coches’, que es el
número de autos que durante esa hora pasaron frente la estación de medición.
a. ¿Te parece que una regresión lineal puede ser adecuada para analizar la relación entre el número de autos y el
nivel de PM10? Razona brevemente. (2p)

El gráfico de dispersión muestra relación lineal, pero débil. (1p)


El coeficiente de correlación es 0.269, que es bajo. (1p)
La regresión lineal es adecuada por haber relación lineal, pero será poco precisa.

(si simplemente dice que la gráfica no muestra relación: 1p)


(si dice que gráficamente no hay relación y la correlación es muy baja, 0.262: 2p)

Sigue →
b. Escribe el modelo de regresión que prediga el nivel de PM10 en función del número de autos (2p)

PM10 = 2,92468 + 0,00017765 Coches (2p)

c. Interpreta los coeficientes de la regresión (4p)

• 𝛽̂0 : Cuando no circulen autos (coches=0), el nivel previsto (o esperado) de PM10 es


de 2.92 (2p) (si no dice que es el nivel ‘previsto’ o ‘esperado’ o ‘por término medio’
o similar, sólo 1p)

• 𝛽̂1 : Cuando el número de autos aumenta en una unidad, el nivel de PM10 previsto
(medio) aumenta en 0.000178 unidades (2p) (si no dice que el aumento es ‘previsto’
o ‘esperado’ o ‘por término medio’ o similar, sólo 1p)

d. Predice el nivel de PM10 que se espera cuando circulen 1000 autos (2p)

PM10 previsto= 2,92468 + 0,00017765 * 1000= 3.103 (2p)


ESTADÍSTICA BÁSICA
SEMESTRE 2019-II
CONTROL DE LABORATORIO 4-B
MIÉRCOLES, 20 DE NOVIEMBRE DE 2019

Apellidos::__________________________________________________Nombre___________________________
Sección:___________________
Contesta sólo en los recuadros. Salvo que se indique lo contrario, utiliza 𝛼 = 0.05. No se puede consultar ningún tipo de documentación.

1. El archivo frenosITV.mtw tiene datos de un conjunto de autos tomados en un taller de inspección de vehículos. La variable
‘Eficacia’ tiene la eficacia de la frenada. Es un valor entre 0 y 100, que cuanto mayor sea más efectiva es la frenada. La variable
ABS vale 1 si el auto está equipado con el dispositivo ABS que evita el bloqueo de los frenos, y 0 si no dispone de él. Contrasta
si el dispositivo ABS mejora la eficacia de frenado.

p-valor = 0.246 (como las cuasidesv. son similares, se utiliza la desv. estándar agrupada) (2p)
Conclusión: (3p)
No podemos rechazar la hipótesis nula 𝐻0 : 𝜇0 ≥ 𝜇1 , frente a 𝐻1 : 𝜇0 < 𝜇1 .de igualdad de medias.
No hay evidencia, por tanto, de que el tener ABS haga que los frenos sean más eficaces.
Si el pvalor está mal, esta parte no se puntúa

2. El ingeniero de calidad de una empresa dedicada al cultivo de tabaco quiere comparar la efectividad de dos tratamientos
diferentes para evitar la aparición de lesiones en las hojas de tabaco. Se seleccionan 8 hojas. En cada una, se impregna la
mitad de la hoja con un preparado del tratamiento 1, y la otra mitad con el tratamiento 2. Transcurrido un tiempo se cuenta
el número de lesiones que hay en cada mitad de las hojas (asumiremos normalidad en las poblaciones). Los datos se
encuentran en el archivo LesionTabaco.MTW. El tratamiento más efectivo será aquel que consigue menos lesiones. Contrasta
si ambos tratamientos son igual de eficaces.

p-valor = 0.034 (datos emparejados) (2p)


Conclusión: (3p)
Rechazamos la hipótesis nula 𝐻0 : 𝜇1 = 𝜇2 frente a la alternativa 𝐻1 : 𝜇1 ≠ 𝜇2 .
Por tanto, los datos nos llevan a concluir, con un pvalor de 0.034, que la efectividad de los tratamientos es
diferente.
Si el pvalor está mal, esta parte no se puntúa

3. El archivo 30oyster.MTW contiene datos de una muestra de 30 ostras. Entre otra información se tiene el volumen de la ostra
(variable C3: Volumen_cc). Este dato es importante, pues el precio que la ostra alcanzará en el mercado depende de su
tamaño. Medir el volumen de cada ostra es muy lento y costoso. Una forma indirecta de medir el tamaño de la ostra es
mediante el registro de una imagen en 3D. Los píxeles que ocupe la imagen deben ser proporcionales al volumen de la
ostra. La variable Pixels_3D (columna C4) contiene el tamaño de dicha imagen para cada ostra. Se desea construir un modelo
estadístico que prediga el volumen de la ostra a partir de su imagen 3D.
a. ¿Te parece que una regresión lineal puede ser adecuada para predecir el volumen de la ostra a partir del tamaño
de su imagen 3D? Razona brevemente.

El gráfico de dispersión muestra relación lineal y fuerte. La nube de puntos es estrecha. (1p)
Además, el coeficiente de correlación es 0.977, que es muy alto. (1p)
La regresión lineal es adecuada por haber relación lineal, y será muy precisa.

Sigue →
b. Escribe el modelo de regresión que prediga el volumen de la ostra a partir de Pixels_3D. (2p)

Volumen_cc = 0,419572 + 0,00000247522 Pixels_3D


(pueden redondear a 0.42+0.000002 Pixels_3D)

c. Interpreta los coeficientes de la regresión (4p)

• 𝛽̂0 : sería el volumen previsto de una ostra cuya imagen tiene 0 pixels. Esto no tiene
sentido por lo que este coeficiente no tiene interpretación en este caso. (2p)

• 𝛽̂1 : Cuando la imagen 3D aumenta en un pixel, el volumen previsto (o esperado, o


por término medio) de la ostra aumenta en 0,00000247522 cc. (2p) (si no dice que
el aumento es ‘previsto’ o ‘esperado’ o ‘por término medio’ o similar, sólo 1p)

d. Predice el volumen de una ostra que tiene una imagen de 500 000 pixels
No se puede predecir ese valor, pues está fuera del rango de valores de los datos (2p)

(si hacen el cálculo Volumen previsto = 0,419572 + 0,00000247522 * 500 000=1.657 ó 1.42
sin advertir que está fuera de rango sólo 1p)
ESTADÍSTICA BÁSICA
SEMESTRE 2019-II
CONTROL DE LABORATORIO 4-A
JUEVES, 21 DE NOVIEMBRE DE 2019

Apellidos:__________________________________________________Nombre________________________
Sección:___________________
Contesta sólo en los recuadros. Salvo que se indique lo contrario, utiliza 𝛼 = 0.05. No se puede consultar ningún tipo de documentación

1. El archivo FishCatch.MTW tiene datos de un conjunto de 159 peces que han sido atrapados. Se pretende construir un modelo
de regresión lineal que permita predecir la relación entre el peso de un pescado y su longitud (Long2). ¿Cómo es la relación
entre ambas variables? ¿Es conveniente usar el modelo? Usa la información del gráfico de dispersión y el coeficiente de
correlación (indica su valor). Responde en un máximo de 3 líneas.

Hay una alta correlación entre ambas variables (correlación = 0.919). (0.75 p) Sin embargo, en el gráfico de dispersión
se evidencia una relación no lineal. (0.75 p) No es conveniente usar el modelo.(0.5 p)

2. El archivo FishCatch.MTW tiene datos de un conjunto de 159 peces que han sido atrapados. En la muestra, existen 7 especies
de peces. A partir de los datos, se desea averiguar si es posible afirmar que los peces de la especie Bermejuela (especie = 3)
tienen un peso medio inferior a los de especie Brema blanca (especie = 4).

p-valor = 0.466 (2 p)
Si han escrito 0.465: 1 p.
Si es incorrecto, no se corrige la conclusión.
Conclusión:
Como el p-valor es mayor que 𝛼 = 0.05, se acepta la hipótesis nula 𝐻𝑜 : 𝜇3 ≥ 𝜇4 y se rechaza la alternativa
𝐻1 : 𝜇3 < 𝜇4 . (1.5 p)
No hay suficiente evidencia para afirmar que los peces de especie Bermejuela tienen un peso medio inferior
a los de especie Brema blanca. (1.5 p)

3. Una plantación de tabaco quiere comparar la efectividad de dos tratamientos diferentes para evitar la aparición de lesiones
en las hojas de tabaco. Se seleccionan 8 hojas. En cada una, se impregna la mitad de la hoja con un preparado del tratamiento
1, y la otra mitad con el tratamiento 2. Transcurrido un tiempo se cuenta el número de lesiones que hay en cada mitad de
las hojas. Los datos se encuentran en el archivo LesionTabaco.MTW. El tratamiento más efectivo será aquel que consigue
menos lesiones. Contrasta si el tratamiento 1 es menos efectivo que el tratamiento 2. Asumiremos normalidad en las
poblaciones.

pvalor: 0.017 (2 p)
Si es incorrecto, no se corrige la conclusión.
Conclusión:
Como el p-valor es menor que 𝛼 = 0.05, se rechaza la hipótesis nula 𝐻𝑜 : 𝜇 𝑇1 ≤ 𝜇 𝑇2 y se acepta la alternativa
𝐻1 : 𝜇 𝑇1 > 𝜇 𝑇2 . (1.5 p)
Hay suficiente evidencia para afirmar que el tratamiento 1 es menos efectivo que el tratamiento 2. (1.5 p)

Sigue →
4. Se desea construir un modelo de regresión que prediga la temperatura de ebullición del agua a partir de la presión
atmosférica. Use los datos de EbullicionHimalaya.MTW.

a. Escribe el modelo de regresión.

Temperatura = 63.141 + 38.399 Presión (2 p)

b. Interpreta los coeficientes de la regresión.

• 63.141: Sería el valor previsto de la temperatura cuando la presión es 0 atm. Una presión
de 0 está fuera del rango de datos a partir de los cuales se ha construido el modelo,
por lo que no se considera válida dicha interpretación. (2 p)

• 39.399: Por cada unidad que aumente o disminuya la presión, la temperatura de


ebullición aumentará o disminuirá en 63.141 unidades (1 p), por término medio (1 p).
(en lugar de ‘por término medio’ se puede hacer mención a ‘la temperatura prevista’
o ‘esperada’

c. Predice la temperatura de ebullición del agua cuando la presión atmosférica es 0.75 atm.

91.9395 (2 p)
Otro valor posible: 91.9403 (2 p)
ESTADÍSTICA BÁSICA
SEMESTRE 2019-II
CONTROL DE LABORATORIO 4-B
JUEVES, 21 DE NOVIEMBRE DE 2019

Apellidos:__________________________________________________Nombre________________________
Sección:___________________
Contesta sólo en los recuadros. Salvo que se indique lo contrario, utiliza 𝛼 = 0.05. No se puede consultar ningún tipo de documentación

1. El archivo FishCatch.MTW tiene datos de un conjunto de 159 peces que han sido atrapados. En la muestra, existen 7 especies
de peces. A partir de los datos, se desea averiguar si es posible afirmar que los peces de la especie Besugo (especie = 1)
tienen un peso promedio inferior a los de especie Lucio (especie = 6).

p-valor = 0.234 (2 p)
Si han escrito 0.174: 1 p.
Si es incorrecto, no se corrige la conclusión.
Conclusión:
Como el p-valor es mayor que 𝛼 = 0.05, se acepta la hipótesis nula 𝐻𝑜 : 𝜇1 ≥ 𝜇6 y se rechaza la alternativa
𝐻1 : 𝜇1 < 𝜇6 . (1.5 p)
No hay suficiente evidencia para afirmar que los peces de especie Besugo tienen un peso medio inferior a
los de especie Lucio. (1.5 p)

5. El archivo FishCatch.MTW tiene datos de un conjunto de 159 peces que han sido atrapados. Se pretende construir un modelo
de regresión lineal que permita predecir la relación entre el peso de un pescado y su longitud (Long1). ¿Cómo es la relación
entre ambas variables? ¿Es conveniente usar el modelo? Usa la información del gráfico de dispersión y el coeficiente de
correlación (indica su valor). Responde en un máximo de 3 líneas.

Hay una alta correlación entre ambas variables (correlación = 0.916). (0.75 p) Sin embargo, en el gráfico de dispersión
se evidencia una relación no lineal. (0.75 p) No es conveniente usar el modelo. (0.5 p)

2. Una plantación de tabaco quiere comparar la efectividad de dos tratamientos diferentes para evitar la aparición de lesiones
en las hojas de tabaco. Se seleccionan 8 hojas. En cada una, se impregna la mitad de la hoja con un preparado del tratamiento
1, y la otra mitad con el tratamiento 2. Transcurrido un tiempo se cuenta el número de lesiones que hay en cada mitad de
las hojas. Los datos se encuentran en el archivo LesionTabaco.MTW. El tratamiento más efectivo será aquel que consigue
menos lesiones. Contrasta si ambos tratamientos son igual de eficaces. Asumiremos normalidad en las poblaciones.

pvalor: 0.034 (2 p)
Si es incorrecto, no se corrige la conclusión.
Conclusión:
Como el p-valor es menor que 𝛼 = 0.05, se rechaza la hipótesis nula 𝐻𝑜 : 𝜇 𝑇1 = 𝜇 𝑇2 y se acepta la alternativa
𝐻1 : 𝜇 𝑇1 ≠ 𝜇 𝑇2 . (1.5 p)
No hay suficiente evidencia para afirmar que ambos tratamientos son igual de eficaces. (1.5 p)

Sigue →
3. Se desea construir un modelo de regresión que prediga la presión atmosférica a partir de la temperatura de ebullición del
agua. Use los datos de EbullicionHimalaya.MTW.

a. Escribe el modelo de regresión.

Presión = -1.6273 + 0.025850 Temperatura (2 p)

b. Interpreta los coeficientes de la regresión.

• -1.6273: Sería el valor previsto de la presión cuando la temperatura de ebullición es 0.


Dicha interpretación no tiene ningún sentido. (2 p)

• 0.0259: Por cada unidad que aumente o disminuya la temperatura de ebullición, la


presión aumentará o disminuirá en 0.0259 unidades (1 p), por término medio (1 p).

(en lugar de ‘por término medio’ se puede hacer mención a ‘la temperatura prevista’
o ‘esperada’

c. Predice la presión atmosférica cuando la temperatura de ebullición es 95°C.

0.828435 (2 p)
NOTA NOTA REVISADA FIRMA Estadística Básica
Examen sustitutorio
Semestre 2019-II 11/12/19
Duración: 3 h

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
Con calculadora, tablas y formulario oficial de la asignatura. Contesta cada pregunta sólo en la hoja de su enunciado.
Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega. La notación de la normal es 𝑵(𝝁; 𝝈𝟐 )
Cuando se solicite reclamo, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta. HOJA 1
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar. (5p)

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.1 Sólo debemos hacer histogramas con pocas clases si tenemos un tamaño muestral muy grande

1.2 Cuando hay asimetría positiva, la media tiende ser mayor que la mediana X
1.3 Un valor atípico muy extremo puede provocar que la curtosis tome un valor negativo muy elevado.

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.4 Si dos sucesos son elementales, serán mutuamente excluyentes X


1.5 Si dos sucesos son elementales, serán independientes

1.6 Si tenemos una muestra de tamaño 𝑛 > 30 de una variable 𝑋, entonces 𝑋 se puede aproximar a una normal.

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.7 Si 𝑋 es una variable aleatoria discreta 𝐹(𝑄2 ) ≥ 0.5 X


1.8 Si 𝑋 es una variable continua 𝑉𝑎𝑟(𝑋 + 𝑋) = 2𝑉𝑎𝑟(𝑋)

1.9 Si 𝑋1 ∼ 𝑃𝑜𝑖(2) y 𝑋2 ∼ 𝑁(0,1) ambas independientes, 𝑉𝑎𝑟(𝑋1 − 𝑋2 ) = 1

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)


Se realiza el contraste con 𝐻0 : 𝜇 ≥ 10 y se obtiene un pvalor de 0.01. Entonces el contraste con 𝐻0 : 𝜇 ≤ 10
1.10
tendrá un pvalor de 0.99 X
Se realiza el contraste con 𝐻0 : 𝜇 ≥ 10 y se obtiene un pvalor de 0.01. Entonces el contraste con 𝐻0 : 𝜇 = 10
1.11
tendrá también un pvalor de 0.01
1.12 En un contraste con 𝐻0 : 𝜇 ≥ 10, el pvalor será el área que queda a la izquierda del valor crítico

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.13 Si X es una variable aleatoria continua y 𝑃(𝑋 = 3) = 0, entonces el 3 no está en su espacio muestral

1.14 Si X es continua y 𝑓(3) = 0 entonces el 3 es un suceso imposible X


1.15 Si X es continua y 𝑓(3) = 1 entonces el 3 es el suceso seguro

1
Página en blanco

2
Apellidos:______________________________________________________Nombre:_____________________
Sección:______________

2. Un proceso productivo de manufactura consta de dos etapas, cuyo objetivo es transformar unos artículos NOTA
metálicos mediante deformación en caliente. En la etapa 1 se realiza sobre el artículo una operación donde HOJA 2
se invierte un tiempo que es aleatorio de acuerdo con el modelo (en segundos) 𝑋1 ∼ 𝑁(25,4). Tras esa
operación se pasa el artículo a la etapa 2, en la que se invierte un tiempo (segundos) que sigue el modelo
𝑋2 ∼ 𝑁(22,2), y que es independiente del de la etapa 1. Finalizada estas etapas, el artículo se somete a un
proceso de inspección. Este proceso es mediante un sensor, por lo que no consume tiempo adicional. Si el artículo no es
aceptable, lo que ocurre el 10% de los casos, se retira de la línea de producción. Responde de forma justificada a las
siguientes cuestiones: (2.5p)

a. ¿Cuál es la probabilidad de que, para un artículo, la etapa 1 demore más de 28 segundos y, además, la etapa 2 demore
más de 20 segundos? Se pide una única probabilidad para este suceso compuesto. (0.5p)

Al ser las duraciones independientes se tiene que:


28 − 25 20 − 22
𝑃[(𝑋1 > 28) ∩ (𝑋2 > 20)] = 𝑃(𝑋1 > 28)𝑃(𝑋2 > 20) = 𝑃 (𝑍 > ) 𝑃 (𝑍 > )
2 1.4142
= 𝑃(𝑍 > 1.50)𝑃(𝑍 > −1.41) = (1 − 0.9332)(1 − 0.0793) = (0.0668)(0.9207) = 0.0615.

b. Si tras 25 segundos aún no ha terminado la etapa 1, ¿cuál es la probabilidad de que termine en los próximos 3
segundos? (0.5p)

𝑃(25 < 𝑋1 < 28) 𝑃(𝑋1 < 28) − 𝑃(𝑋1 < 25) 0.9332 − 0.5
𝑃(𝑋1 < 28|𝑋1 > 25) = = = = 0.8664
𝑃(𝑋1 > 25) 𝑃(𝑋1 > 25) 0.5

c. ¿Cuál es la probabilidad de que la duración de la operación 2 sea mayor que la de la operación 1 (𝑋2 > 𝑋1 )? (0.5p)

Al ser las duraciones independientes y normales se tiene:

𝑋 = 𝑋2 − 𝑋1 ∼ 𝑁(22 − 25; 4 + 2) = 𝑁(−3,6)


3
𝑃(𝑋 > 0) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 1.23) = 1 − 0.8907 = 0.1093
√6

d. Sea Y la duración total de este proceso (las dos etapas). ¿Cuál es la probabilidad de que el proceso demore más de 50
segundos? (0.5p)

Al ser las duraciones independientes y normales se tiene

50 − 47
𝑌 = 𝑋1 + 𝑋2 ∼ 𝑁(47,6); 𝑃(𝑌 > 50) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 1.23) = 0.1093
√6

e. ¿Cuál es la probabilidad de que, al fabricar 10 artículos, haya más de 2 artículo defectuosos? (0.5p)

𝑋 =número de artículos defectuosos en un lote de 10. 𝑋 ∼ 𝐵(10,0.1)

𝑃(𝑋 > 2) = 1 − [𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)] = 1 − 0.9298 = 0.07

3
Apellidos:__________________________________________________________Nombre:________________________
Sección:______________

3. Los clientes que acuden a un puesto de servicio lo hacen independientemente unos de otros y a un ritmo medio de 3
clientes por minuto. (2.5p)
a) ¿Cuál es la probabilidad de que no lleguen clientes en un minuto? (0.5p)

Al ser las llegadas independientes y con media constante: 𝑋 =número de clientes por minuto. 𝑋 ∼ 𝑃𝑜𝑖(𝜆 = 3)

𝜆0 −𝜆
𝑃(𝑋 = 0) = 𝑒 = 𝑒 −3 = 0.0498
0!

b) ¿Cuál es la probabilidad de que entre dos clientes consecutivos transcurran más de dos minutos? (0.5p)

Como el número de clientes por minuto sigue una exponencial, el intervalo entre dos llegadas es una exponencial

𝑇 =tiempo entre clientes consecutivos. 𝑇 ∼ 𝐸𝑥𝑝(𝜆 = 3).

𝑃(𝑇 > 2) = 𝑒 −𝜆×2 = 𝑒 −6 = 0.0025

c) Cuánto tiempo transcurre, por término medio, entre la llegada de dos clientes consecutivos. (0.5p)

𝑇 =tiempo entre clientes consecutivos. 𝑇 ∼ 𝐸𝑥𝑝(𝜆 = 3).


1 1
𝐸(𝑇) = = = 0.33 minutos
𝜆 3

d) ¿Cuál es la probabilidad de que en una hora lleguen más de 200 clientes? (1p)

𝑌 =número de clientes en 60 minutos, 𝑌 ∼ 𝑃𝑜𝑖(𝜆∗ = 180) ≈ 𝑁(180,180)

200 − 180
𝑃(𝑌 > 200) ≈ 𝑃 (𝑍 > ) = 𝑃(𝑍 > 1.49) = 1 − 0.9319 = 0.0681
√180

4. Calcula la moda y los cuartiles de la siguiente variable aleatoria 𝑋 ∼ 𝐵(5,0.2). (1.p)


𝑋 𝑝(𝑥) 𝐹(𝑥)
0 0,32768 0,32768
Moda=1. Q1=0; Q2=1; Q3=2
1 0,40960 0,73728
2 0,20480 0,94208
3 0,05120 0,99328
4 0,00640 0,99968
5 0,00032 1

4
Apellidos:__________________________________________________________Nombre:________________________
Sección:______________

5. En el curso, se ha explicado que, para hacer inferencia para la media, resulta útil tener una muestra NOTA
grande. ¿Qué significa eso? ¿Cuál es la consecuencia de que la muestra sea grande? (0.5 p) HOJA 3
Significa que la muestra tiene más de 30 datos.
La consecuencia es que la media muestral se aproxima (por TCL) a una normal.
Si han escrito que “la muestra se distribuye normalmente” o que “la población es normal”, la respuesta es incorrecta.

6. Sea la variable aleatoria 𝑌 , definida por la función densidad 𝑓(𝑦) = 2(𝑎 − 𝑦)𝑎 −2 ; 𝑦 ∈ [0; 𝑎]. Se ha tomado una
∑50 2
𝑖=1 𝑦𝑖
muestra de 50 datos y se ha calculado: 𝑚2 = = 1.44. Utilizando el método de los momentos, construya el
50
estimador de 𝑎. (1.5 p)
𝑎
𝑎2
𝑀2 = ∫ 2𝑦 2 (𝑎 − 𝑦)𝑎 −2 𝑑𝑦 = → 𝑎 = √6𝑀2 (0.75 𝑝)
6
0

̂2 = √6𝑚2 (0.75 𝑝) = 2.9394 (0.25 𝑝)


⇒ 𝑎̂ = √6𝑀

7. Un pediatra se encuentra realizando un estudio sobre el crecimiento en niños y niñas, para lo cual ha tomado una
muestra de infantes de 10 años y ha medido su peso. La mitad de ellos son niños y la otra mitad, niñas. Los datos se
muestran a continuación:

NIÑAS 26.15 25.37 26.38 24.38 26.37 26.13 25.31 26.01 25.48 25.37 25.14 25.45 24.93 27.07 26.65 24.45
NIÑOS 29.73 28.16 23.91 26.60 23.25 25.73 25.79 27.05 28.20 25.94 25.16 25.89 27.16 26.98 26.51 27.85

A partir de esos datos, se ha calculado que las niñas de la muestra pesan, en promedio, 25.665 kg y los niños, 26.494
kg. Las cuasidesviaciones estándar de ambos conjuntos de datos son 0.7680 (niñas) y 1.6274 (niños).
a. ¿Es posible afirmar que el peso promedio de niños y niñas de 10 años es el mismo? Utilice el p-valor en la justificación
de su respuesta. Muestre todos los pasos del contraste. (1.5 p)

𝐻0 : 𝜇1 = 𝜇2 Si las hipótesis, estadístico y distribución son correctos, se


𝐻1 : 𝜇1 ≠ 𝜇2 (0.25 p) continúa corrigiendo. Si no, no se corrige lo demás.

𝑥̅1 − 𝑥̅2 25.665 − 26.494 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 2 × 𝑃(𝑍 < −1.84) = 2 × 0.0329 =


𝑧0 = = 0.0658 (0.25 p)
2 2
𝑠̂12 𝑠̂22 √0.7680 + 1.6274 Si el p-valor es incorrecto, no se corrige la conclusión
√ + 16 16
𝑛1 𝑛2
= −1.8427 (0.5 p) Como 𝑝 − 𝑣𝑎𝑙𝑜𝑟 > 0.05, se acepta la hipótesis nula
Si han considerado varianzas iguales o datos y se rechaza la alternativa. Hay suficiente evidencia
emparejados: 0 p. para afirmar que el peso promedio de niños y niñas
𝑍0 ~ 𝑁(0; 1) (0.25 p) de 10 años es el mismo. (0.25 p)

b. Un estudiante ha llegado a la conclusión de que el peso de los niños se distribuye normalmente. Mediante un contraste,
desea confirmar su hipótesis de que la varianza del peso de los niños de 10 años es menor que 1.445. ¿Cómo debe ser
el nivel de significación para concluir que su hipótesis es correcta? (1.5 p)

𝐻0 : 𝜎 2 ≥ 1.445 Si las hipótesis, estadístico y distribución son correctos, se


𝐻1 : 𝜎 2 < 1.445 (0.25 p) continúa corrigiendo. Si no, no se corrige lo demás.
2
𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 𝑃(𝜒15 < 27.49) = 1 − 0.025 =
(16 − 1) × 1.62742 0.975 (0.25 p)
𝜒02 = = 27.49 (0.25 p) Si el p-valor es incorrecto, no se corrige la respuesta final.
1.445

2
𝜒02 ~ 𝜒15 (0.25 p) Para aceptar que su hipótesis es correcta (𝐻1 : 𝜎 2 <
1.445), se debe cumplir que 𝑝 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼, es decir
𝛼 > 0.975. (0.25 p)
5
Apellidos:__________________________________________________Nombre__________________

8. Dibuje, de forma aproximada, cómo sería el gráfico de residuos frente a valores previstos de una regresión simple
ajustada a los datos del siguiente gráfico (0.75 p):
Gráfico de dispersión Gráfico de residuos frente a valores previstos

9. Suponga que tiene un conjunto de datos y quiere determinar cuál es la distribución (modelo de probabilidad) que
mejor se ajusta a dichos datos.
a. ¿Cómo evaluaría gráficamente cuál es la distribución que se ajusta mejor a los datos? Responda en una línea. (0.5 p)
Con un histograma, CDF empírica, gráfica de probabilidad. Si solo han mencionado una: 0.25 p.

b. ¿Cómo evaluaría analíticamente cuál es la distribución que se ajusta mejor a los datos? (0.5 p)
Realizando una prueba de bondad de ajuste con diferentes distribuciones. Si el p-valor de la prueba es
mayor que el nivel de significación, se acepta que la distribución es adecuada.

c. Cuando se hace una prueba de normalidad, se obtiene un p-valor. ¿Cuál es la interpretación de dicho valor? Responda
en un máximo de dos líneas. (0.5 p)
Es la probabilidad de que, si el modelo fuese el correcto, se obtengan distancias tan grandes como las obtenidas con
la muestra.

10. En un proceso industrial, existen dos indicadores (indicador 1 e


indicador 2) que son clave para medir el desempeño de las
máquinas. Se han tomado 729 datos y se ha construido un modelo
que permite predecir el indicador 2 a partir del 1. Los resultados
se muestran a continuación.

a) Se ha realizado la diagnosis y se ha comprobado que se cumplen


las dos hipótesis básicas del modelo de regresión lineal simple.
Indique cuáles son dichas hipótesis. (0.5 p)
Linealidad.
Normalidad del error.

b) Interprete el coeficiente de determinación en un máximo de dos líneas. (0.5 p)


El modelo explica el 87.02% de la variabilidad del indicador 2.
Si la respuesta es “parecida” pero no es clara, no expresa lo mismo o no tiene sentido: 0 p.

c) Interprete 𝛽̂1 en un máximo de dos líneas. (0.5 p)


Si el indicador 1 aumenta o disminuye en una unidad, el indicador 2 aumentará o disminuirá en 0.9287 unidades,
por término medio. Si la respuesta está completa: 0.5 p. Si no está completa: 0 p.

d) En cierto momento, se mide el indicador 1 y se obtiene un valor de 5. ¿Cuál es la probabilidad de que el indicador 2 sea
mayor que 3.5? (0.75 p)
Como se ha comprobado la normalidad del error (apartado a), entonces 𝐼2 | 𝐼1 = 5 ~ 𝑁(5.215; 1.169082 ) (0.25 p)

3 − 5.215
𝑆𝑖 𝐼1 = 5 ⇒ 𝑃(𝐼2 > 3.5) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > −1.89)(0.25 p. Si es incorrecto, no se corrige lo demás)
1.16908

= 1 − 0.0294 = 0.9706 (0.25 p)


6
PRÁCTICA PARTICIPACIÓN ACTA ACTA REVISADA FIRMA Estadística Básica
Examen final
Semestre 2019-II 5/12/19
Duración: 3 h

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
Con calculadora, tablas y formulario oficial de la asignatura. Todas las evaluaciones se escanean para prevenir fraude.
Contesta cada pregunta sólo en la hoja de su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega.
Cuando se solicite reclamo, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar. (5p)

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.1 Es preferible un estimador con sesgo positivo a otro con sesgo negativo.

1.2 Es preferible un estimador que minimice el error cuadrático medio X

1.3 El error cuadrático medio es igual al sesgo más la varianza del estimador

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.4 La varianza de la media disminuye con el tamaño muestral X

1.5 Si la muestra procede de una normal, la distribución muestral de la media es una t de Student

1.6 Si tenemos una muestra de tamaño 𝑛 > 30 de una variable 𝑋, entonces 𝑋 se puede aproximar a una normal.

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.7 𝑠𝑖 𝑛 → ∞ entonces 𝑡𝑛 → 𝑁(0,1) X

1.8 𝑡150;0.5 = 1
2 2
1.9 𝜒20;0.05 = −𝜒20;0.95

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)


Se realiza el contraste con 𝐻0 : 𝜇 ≥ 10 y se obtiene un pvalor de 0.01. Entonces el contraste con 𝐻0 : 𝜇 ≤ 10
1.10 X
tendrá un pvalor de 0.99
Se realiza el contraste con 𝐻0 : 𝜇 ≥ 10 y se obtiene un pvalor de 0.01. Entonces el contraste con 𝐻0 : 𝜇 = 10
1.11
tendrá también un pvalor de 0.01
1.12 En un contraste con 𝐻0 : 𝜇 ≥ 10, el pvalor será el área que queda a la izquierda del valor crítico

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.13 Si rechazamos 𝐻0 : 𝜇 = 𝜇0 con 𝛼 = 0.01 también se va a rechazar con 𝛼 = 0.05. X

1.14 El nivel de significación es el área que ocupa la región de aceptación

1.15 Si el estadístico de contraste es menor que el nivel de significación, rechazaremos 𝐻0

1
Página en blanco

2
Apellidos:__________________________________________________________Nombre:________________________
Sección:______________

2. El tiempo entre las llegadas de clientes (min) a una tienda por departamentos es una variable exponencial NOTA
cuya media se desconoce. Se ha planteado el siguiente contraste con las hipótesis 𝐻0 : 𝜇 = 0.5 y 𝐻1 : 𝜇 ≠ HOJA 1
0.5. Se ha tomado una muestra de 51 datos y se ha calculado que el estadístico de contraste es 𝑡0 = 2.678.

a. ¿Cuál es el p-valor del contraste? (0.5 p)

La población no es normal y la muestra es grande, entonces 𝑇0 ~ 𝑁(0; 1).

𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 2 × 𝑃(𝑍 > 2.68) = 2 × 0.0037 = 𝟎. 𝟎𝟎𝟕𝟒

Cualquier otro valor: 0 p. No es correcto si se ha calculado con la distribución t de Student, ya que la población no es normal.

b. ¿Cuál es el mínimo nivel de significación necesario para aceptar la hipótesis alternativa? (0.5 p)

Para aceptar la hipótesis alternativa (rechazar la hipótesis nula), se debe cumplir que 𝑝 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼.
Entonces, el nivel de significación debe ser: 𝜶 > 𝟎. 𝟎𝟎𝟕𝟒.

3. Con el fin de estimar el valor de la media poblacional de una variable 𝑌 a partir de una muestra aleatoria simple de 4
datos (𝑌1 ; 𝑌2 ; 𝑌3 ; 𝑌4 ), se ha construido el estimador 𝜇̂ = 0.1𝑌1 + 0.2𝑌2 + 0.3𝑌3 + 0.4𝑌4 . Si se sabe que 𝑌 es una variable
normal de media 5 y varianza 9. ¿Cuál es la distribución muestral del estimador? Indique el modelo de probabilidad y sus
parámetros. Muestre su procedimiento. (1 p)

Como se trata de una muestra aleatoria simple:


𝐸(𝑌1 ) = 𝐸(𝑌2 ) = 𝐸(𝑌3 ) = 𝐸(𝑌4 ) = 𝐸(𝑌) = 5
𝑉𝑎𝑟(𝑌1 ) = 𝑉𝑎𝑟(𝑌2 ) = 𝑉𝑎𝑟(𝑌3 ) = 𝑉𝑎𝑟(𝑌4 ) = 𝑉𝑎𝑟(𝑌) = 9

𝐸(𝜇̂ ) = 𝐸(0.1𝑌1 + 0.2𝑌2 + 0.3𝑌3 + 0.4𝑌4 ) = 0.1𝐸(𝑌1 ) + 0.2𝐸(𝑌2 ) + 0.3𝐸(𝑌3 ) + 0.4𝐸(𝑌4 )

= 0.1(5) + 0.2(5) + 0.3(5) + 0.4(5) = 𝟓 (0.25 p)

Cualquier otro valor: 0 p. Si no hay procedimiento: 0 p.

𝑉𝑎𝑟(𝜇̂ ) = 𝑉𝑎𝑟(0.1𝑌1 + 0.2𝑌2 + 0.3𝑌3 + 0.4𝑌4 ) = 0.12 𝑉𝑎𝑟(𝑌1 ) + 0.22 𝑉𝑎𝑟(𝑌2 ) + 0.32 𝑉𝑎𝑟(𝑌3 ) + 0.42 𝑉𝑎𝑟(𝑌4 )

= 0.12 (9) + 0.22 (9) + 0.32 (9) + 0.42 (9) = 𝟐. 𝟕 (0.5 p)

Cualquier otro valor: 0 p. Si no hay procedimiento: 0 p.

Entonces, como 𝑌 se distribuye normalmente, entonces 𝜇̂ también se distribuye normalmente, por ser la combinación
lineal de 4 variables normales (𝑌1 ; 𝑌2 ; 𝑌3 ; 𝑌4 ). (0.25 p)

𝜇̂ ~ 𝑁(5; 2.7)

4. Sea la variable aleatoria 𝑋, definida por la función densidad 𝑓(𝑥). Utilizando el método de
los momentos, construya el estimador de 𝜃. Muestre su procedimiento. (1 p)

𝜃
2(𝜃 − 𝑥)
𝜇 = ∫𝑥 ∙ 𝑑𝑥
𝜃2
0

Si se ha planteado el cálculo de la media de manera incorrecta, toda la pregunta tiene puntaje cero.

𝜃
2(𝜃 − 𝑥) 2𝑥 2𝑥 2 𝜃 𝜃
𝜇 = ∫𝑥 ∙ 2
𝑑𝑥 = ( − 2 ) | = → 𝜽 = 𝟑𝝁 = 𝟑𝑴𝟏 (0.5 p)
𝜃 𝜃 𝜃 0 3
0

Entonces: 𝜃̂ = 3𝑀 ̂ = 𝟑𝒙
̂1 = 3𝑚1 → 𝜽 ̅ (0.5 p)
3
Apellidos:__________________________________________________Nombre__________________

5. El área de calidad de una empresa ha tomado una muestra de los artículos


producidos por la empresa y se ha medido la longitud (cm) de dichos artículos.
A partir de la información de la muestra, se ha obtenido el siguiente resumen
de Minitab:

a. ¿Qué distribución de referencia usaría para construir intervalos de


confianza para la varianza de la longitud? Explique su respuesta en un
máximo de 2 líneas. (0.5 p)
2
En este caso no se puede usar la 𝜒𝑛−1 porque la longitud no se ajusta a una normal (porque 𝑝 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼)
(0.25 p). Debe haberse explicado por qué la longitud no se ajusta a una normal (p-valor de la prueba de normalidad).

Por lo tanto, con los conocimientos del curso, no se puede construir un I.C. para la varianza. (0.25 p)

b. Con esta misma muestra de artículos, unos analistas han construido el siguiente intervalo de confianza para la
proporción de artículos defectuosos: [0.0273; 0.0641] . Responda a las siguientes cuestiones, mostrando su
procedimiento:

b.1. Indique el nivel de confianza de dicho intervalo. (1 p)

0.0273 + 0.0641
𝑝̂ = = 0.0457 (0.25 p)
2
Si 𝑝̂ es incorrecto, no se corrige el resto de la solución.

𝐿 = 0.0641 − 0.0457 = 0.0184


0.0457×(1−0.0457)
Se sabe que: 𝐿 = 𝑧𝛼⁄2 × √ = 0.0184 → 𝑧𝛼⁄2 = 2.33 (0.25 p)
700

Entonces: 𝛼⁄2 = 𝑃(𝑍 > 2.33) = 0.0099 → 𝛼 = 0.0198 (0.25 p) → 𝑁. 𝐶. = (1 − 𝛼) × 100% = 𝟗𝟖. 𝟎𝟐% (0.25 p)

b.2. ¿Es posible afirmar que el porcentaje de artículos defectuosos es mayor que 1.5%? Justifique su respuesta
utilizando el p-valor. Utilice 𝛼 = 0.05 (1.5 p)

Hipótesis (0.5 p): 𝐻0 : 𝑝 ≤ 0.015


𝐻1 : 𝑝 > 0.015
Estadístico de contraste:
𝑝̂ − 𝑝0 0.0457 − 0.015
𝑧0 = = = 6.68 (0.25 p)
√ 𝑝0 × (1 − 𝑝0 ) √ 0.015 × (1 − 0.015)
𝑛 700
Distribución del estadístico de contraste:
Como 𝑛𝑝̂ (1 − 𝑝̂ ) > 5, entonces 𝒁𝟎 ~ 𝑵(𝟎, 𝟏) (0.25 p)

Si las hipótesis, el estadístico y su distribución son correctos, se continúa con la corrección. De lo contrario, no se corrige lo siguiente.

𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 𝑃(𝑍 > 6.68) ≈ 𝟎 (0.25 p)

Si el p-valor es incorrecto, no se corrige la conclusión.

Como el p-valor es mayor que el nivel de significación, se rechaza la hipótesis nula y se acepta la alternativa. Hay
suficiente evidencia para aceptar que más del 1.5% de los artículos son defectuosos. (0.25 p)

4
Apellidos:______________________________________________________Nombre__________________ NOTA
Sección:__________________ HOJA 2

6. Una empresa agrícola exporta uvas del tipo Crimson en empaques de 500 gramos. La empresa quiere valorar
si las uvas empacadas pierden peso con el paso del tiempo, por deshidratación. Esta información es muy importante,
pues si las uvas van perdiendo peso durante su traslado a los mercados de destino, se deberán llenar los empaques con
una cantidad superior. Con ese fin, se han almacenado 8 empaques en una cámara frigorífica similar a la utilizada en el
traslado real. Cada empaque se ha pesado en el momento de ser introducido en la
cámara (Peso_0) y se ha vuelto a pesar transcurrida una semana en la cámara
(Peso_1). Los datos se muestran en la siguiente tabla. También se muestra un
pequeño resumen estadístico con Minitab.

Empaque 1 2 3 4 5 6 7 8
Peso_0 518 528 519 524 518 527 528 528
Peso_1 515 523 517 522 515 524 524 524

¿Disminuye el peso de las uvas durante una semana en cámara frigorífica? Responda
mediante un contraste con un nivel de significación del 5%. Responda en la tabla
siguiente. (5p)

Hipótesis (1p) 𝑯𝟎 : 𝝁𝟎 ≤ 𝝁𝟏 𝑯𝟏 : 𝝁𝟎 > 𝝁𝟏


Se trata de una comparación de medias con datos apareados

Estadístico de contraste (0.5p) 𝑑̅ 3.25


Indique el símbolo que lo representa, su fórmula, los valores 𝑡0 = = = 8.8807
que utiliza en la fórmula y el valor numérico del estadístico. 𝑠̂𝑑 /√𝑛 1.0351
Utilice una precisión de 4 decimales. √8
Si se propone un test de medias con muestras independientes, 0 puntos
en el resto del problema, solo se valora la hipótesis
Distribución del estadístico de contraste (0.5p) 𝑡7
Las pruebas de normalidad de los datos nos llevan a inferir que las
muestras vienen de poblaciones normales, por lo que la diferencia de
¿Por qué ha elegido dicha distribución?
pesos, 𝑑 , será normal. Por tanto, al estandarizar con su
cuasidesviación estándar, hace que 𝑡0 ∼ 𝑡𝑛−1 ≡ 𝑡7
Responde de forma justificada (1p)

Si sólo menciona que hay normalidad, pero no se hace referencia al


test de normalidad, 0.5 p

Dibuja la distribución de referencia, las regiones de


aceptación y rechazo, y localiza el valor del
estadístico de contraste. (1p)

Conclusión del contraste (1p)


1. ¿Se acepta o se rechaza la hipótesis nula? 1. Se rechaza la hipótesis nula (0.25)
2. ¿Por qué? 2. El estadístico de contraste cae en la región de rechazo (0.25)
3. Responda a la pregunta planteada en el 3. Hay evidencia para afirmar que tras una semana en cámara el
enunciado: peso medio de las uvas se ha reducido. (0.5)
¿Disminuye el peso de las uvas?

Para que su respuesta sea válida, debe justificar su


conclusión.

5
Apellidos:______________________________________________________Nombre__________________

7. Continuamos con los datos relativos a la pérdida de peso de las


uvas en empaques de 500 g de la pregunta anterior. El
experimento de mantener un conjunto de empaques en una
cámara y registrar su peso cada día se extiende hasta un total
de 40 días, y 98 empaques. Para ver cómo se relaciona el peso
al inicio del experimento (Peso_0) y a los 40 días (Peso_40) se
realiza una regresión simple con Minitab, obteniéndose los
siguientes resultados: (4p)

a. ¿Qué se puede concluir del gráfico de la izquierda? Justifique. (1 p)


Este gráfico es sobre la normalidad de los residuos. Los puntos no siguen la línea recta del gráfico de
probabilidad normal, por lo que se concluye que estos residuos no se distribuyen como una normal
Si menciona la normalidad, pero no se dice que es de los residuos: 0.5p
b. ¿Es posible afirmar que entre ambas variables hay una relación lineal muy fuerte? Justifique (1p)
• El gráfico de la derecha, de residuos vs valores previstos, no muestra ninguna estructura no lineal, por lo
que se puede concluir que no hay relación no-lineal. (0.5p)
• Además, el pvalor de la variable Peso_0 es muy bajo, por lo que la relación es significativa. Hay relación
lineal significativa, no es algo ‘casual’ de estos datos. (0.25p)
• Sin embargo, esa relación lineal no es muy fuerte, pues explica sólo el 48% (R2=48,29%) de la variabilidad
del peso en la semana 40. (0.25p)
La relación es lineal pero moderada.
c. Interprete los coeficientes de la regresión (1p)
𝛽̂0 : Este coeficiente mostraría el peso previsto en la semana 40 cuando en la semana 0 el peso es 0, lo que no
tiene sentido. Este coeficiente no tiene, por tanto, interpretación práctica (0.5p)

𝛽̂1 : Cuando el peso del empaque en la semana 0 aumenta en un gramo, 40 semanas después, se prevé que
aumente en 0.95 gramos, y no el gramo que se añadió al inicio. Por tanto, en esas 40 semanas el peso disminuye,
por término medio, un 5% aproximadamente. (0.5p)

Si no dice que el cambio en Peso_40 es ‘en promedio’, ‘previsto’, o ‘por término’, sólo 0.25p

d. ¿A qué contraste corresponde el pvalor del coeficiente de Peso_0? (0.5p)

Al contraste de significatividad de la relación entre X e Y, es decir, al contraste 𝐻0 : 𝛽1 = 0 𝐻1 : 𝛽1 ≠ 0


e. Para un empaque que al inicio del experimento pesase 530 gramos, y a los 40 días pesase 510 gramos, ¿Cuál sería el valor
de su residuo? (0.5p)
̂40 = 16.1565 + 0.952866 × 530 = 521.1755
Si Peso_0=530, el peso previsto a las 40 semanas es 𝑃𝑒𝑠𝑜

̂ = 510 − 521.1755 = −11.1755


Residuo 𝑒 = 𝑌 − 𝑌̂ = 𝑃𝑒𝑠𝑜40 − 𝑃𝑒𝑠𝑜40

6
NOTA REVISADA FIRMA Estadística Básica
Parcial
7/10/2019
Facultad de Ingeniería Duración: 3:00
Semestre 2019-II

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
Con calculadora y formulario oficial de la asignatura. Todas las evaluaciones se escanean para prevenir fraude.
Contesta cada pregunta sólo en la hoja de su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega.
Cuando se solicite reclamo, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
NOTA
1. A continuación, se muestra un conjunto de tablas. En cada una hay tres frases, donde sólo una es correcta. En cada
tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar.

FIRMA

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

Si el número de cliente que accede a un puesto de servicio sigue una Poisson, el tiempo entre clientes
1.1
consecutivos será una exponencial X
Si el número de cliente que accede a un puesto de servicio sigue una Poisson, el tiempo entre clientes
1.2
consecutivos es también una Poisson.

1.3 El número de clientes que acceden en una hora puede modelizarse como una binomial

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.4 Si 𝑍 ∼ 𝑁(0,1) entonces 𝑃(𝑍 > 1) = 0.8413

1.5 Si 𝑍 ∼ 𝑁(0,1) entonces el percentil 33 es 0.6293

1.6 Si 𝑍 ∼ 𝑁(0,1) entonces el percentil 33 es -0.44 X


Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.7
Si al lanzar un dado obtengo el valor i, i veces (una vez el 1, 2 veces el 2, etc), la mediana de la distribución que
se obtiene es 5
X
Si al lanzar un dado obtengo el valor i, i veces (una vez el 1, 2 veces el 2, etc), la distribución que se obtiene
1.8
será asimétrica positiva
Si al lanzar un dado obtengo el valor i, i veces (una vez el 1, 2 veces el 2, etc), el tercer cuartil de la distribución
1.9
que se obtiene será 4.5

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

1.10 Sean 𝐴1 , 𝐴2 , 𝐴3 sucesos elementales de un experimento, entonces 𝑃[𝐴1 |𝐴2 ∪ 𝐴3 ] = 0 X


1.11 Si A y B son independientes y 𝑃(𝐴 ∪ 𝐵) = 0.5 entonces son equiprobables

1.12 Sean 𝐴1 , 𝐴2 los dos sucesos elementales de un experimento. Entonces 𝑃(𝐴1 ) = 𝑃(𝐴1 |𝐴2 )𝑃(𝐴2 )

Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)

Sea 𝑋 =nº de artículos defectuosos en un lote de 10, donde cada uno tiene una probabilidad de 0.01 de ser defectuoso,
1.13
independiente de que lo sean los demás, entonces 𝑋 ∼ 𝐵(10; 0.01) X
Sea 𝑋 =nº de artículos defectuosos en un lote de 10, donde cada uno tiene una probabilidad de 0.01 de ser defectuoso,
1.14
independiente de que lo sean los demás, entonces 𝑋 ∼ 𝑃𝑜𝑖(0.1)
Sea 𝑋 =nº de artículos defectuosos en un lote de 10, donde cada uno tiene una probabilidad de 0.01 de ser defectuoso,
1.15
independiente de que lo sean los demás, entonces 𝑋 ∼ 𝐸𝑥𝑝(0.1)

1
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________

FIRMA
2. A la calle C vienen los autos que proceden de la calle A y la calle B (ver figura). De la calle A vienen los
autos según un proceso de Poisson, a un ritmo medio de 5 autos por minuto. De la calle B vienen los
autos según otro proceso de Poisson, independiente, a un ritmo medio de 10 autos por minuto.

Responde de forma justificada a las siguientes preguntas:

a) ¿Cuál es la probabilidad de que por la calle A vengan más de 3 autos


en un minuto? (1p)

Llamamos 𝑋𝐴 = nº de autos que proceden de A en un minuto


𝑃(𝑋𝐴 > 3) = 1 − 𝑃(𝑋𝐴 ≤ 3) = 1 − 0.265 = 0.735

b) ¿Cuál es el percentil 10 del nº de autos que vienen por A en un minuto? (1p)

Como 𝑃(𝑋𝐴 ≤ 1) = 0.04 y 𝑃(𝑋𝐴 ≤ 2) = 0.124 , el percentil 10 es 𝑃10 = 2 pues es el menor valor de 𝑋𝐴 que
acumula una probabilidad mayor o igual a 10.

c) ¿Cuál es la probabilidad de que lleguen a C más de tres autos en un minuto (da igual por donde vengan)? (1p)

𝑋𝐶 = 𝑋𝐴 + 𝑋𝐵 ∼ 𝑃𝑜𝑖(15).

𝑃(𝑋𝐶 > 3) = 1 − 𝑃(𝑋𝐶 ≤ 3) = 1 − (𝑃(𝑋𝐶 = 0) + 𝑃(𝑋𝐶 = 1) + 𝑃(𝑋𝐶 = 2) + 𝑃(𝑋𝐶 = 3)) = 0.9998

d) ¿Cuál es la probabilidad de que entre dos autos consecutivos que entran a la calle C (da igual por donde vengan)
transcurra menos de un cuarto de minuto? (2p)

𝑇 = tiempo entre dos autos consecutivos∼ 𝐸𝑥𝑝(15)

𝑃(𝑇 < 0.25) = 1 − 𝑒 −15×0.25 = 0.9765

e) ¿Cuál es la probabilidad de que pasen por C más de 230 autos en 15 minutos? (1p)
En un minuto: 𝑋𝐶 = 𝑋𝐴 + 𝑋𝐵 ∼ 𝑃𝑜𝑖(15). En 15 minutos 𝑋𝐶∗ ∼ 𝑃𝑜𝑖(225) ≈ 𝑁(225,225)
230 − 225
𝑃(𝑋𝐶∗ > 230) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 0.33) = 1 − 𝑃(𝑍 < 0.33) = 1 − 0.629 = 0.371
√225

f) Se observa que por la calle A no ha circulado ningún auto durante 15 segundos. ¿Calcula la probabilidad de que
estemos otros 15 segundos adicionales sin que vengan autos por esa calle? (1p)
𝑇𝐴 =tiempo entre dos autos consecutivos en A∼ 𝐸𝑥𝑝(5)
𝑃(𝑇𝐴 > 0.5 ∩ 𝑇𝐴 > 0.25) 𝑃(𝑇𝐴 > 0.5)
𝑃(𝑇𝐴 > 0.5|𝑇𝐴 > 0.25) = = =
𝑃(𝑇𝐴 > 0.25) 𝑃(𝑇𝐴 > 0.25)
𝑒 −0.5×5
= −0.25×5 = 𝑒 −0.25×5 = 0.2865 ≡ 𝑃(𝑇𝐴 > 0.25)
𝑒

Puede verse que es igual a no haber estado ya esperando, pues en una exponencial, no hay memoria.

2
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
. NOTA

1. En una fábrica se producen piezas de metal circulares cuyo diámetro (𝑋, en mm) es de especial interés.
Se sabe que los diámetros de las piezas producidas son independientes entre sí y siguen una distribución
normal de media 170 mm y desviación estándar 1.5 mm. Las piezas se envían a los clientes en lotes de FIRMA
12 y se considera que una pieza es aceptable (no defectuosa) si su diámetro se encuentra entre 167 y
173 mm.

a. ¿Cuál es la probabilidad de que una pieza sea aceptable? (0.5 p)

𝑃(𝑃𝑖𝑒𝑧𝑎 𝑎𝑐𝑒𝑝𝑡𝑎𝑏𝑙𝑒) = 𝑃(167 ≤ 𝑋 ≤ 173)


167 − 170 173 − 170
= 𝑃( <𝑍≤ ) = 𝑃(−2 < 𝑍 ≤ 2)
1.5 1.5
= 𝑃(𝑍 ≤ 2) − 𝑃(𝑍 < −2) = 0.9772 − 0.0228 (0.25 p) = 𝟎. 𝟗𝟓𝟒𝟒 (0.25 p)
Cualquier otra respuesta: 0 p.

b. Un inspector de calidad selecciona dos piezas al azar: A y B. Indique el valor de la probabilidad de que la pieza A
sea aceptable o que la pieza B sea defectuosa. Hay una única respuesta. (0.75 p)

Sucesos:
A: Pieza A es aceptable. 𝑷(𝑨 ∪ 𝑩 ̅ ) (0.25 p) = 𝑷(𝑨) + 𝑷(𝑩
̅ ) − 𝑷(𝑨 ∩ 𝑩
̅)
B: Pieza B es aceptable. 𝑃(𝐴 ∪ 𝐵̅ ) = 0.9544 + 0.0456 − 0.9544 × 0.0456 = 𝟎. 𝟗𝟓𝟔𝟓
𝑃(𝐴) = 𝑃(167 ≤ 𝑋 ≤ 173) = 0.9544
̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ Respuesta final: 0.5 p. Si han asumido que 𝑃(𝐴 ∩ 𝐵̅) = 0: 0p.
𝑃(𝐵̅ ) = 𝑃(167 ≤ 𝑋 ≤ 173) = 0.0456
No hay puntaje por definirlas.

c. ¿Cuán probable es que, en un lote, haya más de 3 piezas defectuosas? (1 p)

𝑌: Número de piezas defectuosas en un lote de 12 piezas


𝑌~𝐵(12; 0.0456) (0.25 p)
Si han usado otra distribución, el puntaje del apartado es cero.
3
12
𝑃(𝑌 > 3) = 1 − ∑ ( ) × 0.0456𝑟 × 0.954412−𝑟 (0.25 p) = 1 − 0.9984 = 𝟎. 𝟎𝟎𝟏𝟔 (0.5 p)
𝑟
𝑟=0

d. Se selecciona una pieza y su RADIO se encuentra entre 84.82 y 85.21. ¿Cuál es la probabilidad de que dicho radio
sea, al menos, 85.1 mm? (1 p)
𝑅𝑎𝑑𝑖𝑜: 𝑌 = 0.5𝑋; 𝒀 ~ 𝑵(𝟖𝟓; 𝟎. 𝟕𝟓𝟐 )

𝑃(𝑌 ≥ 85.1 ∩ 84.82 ≤ 𝑌 ≤ 85.21) 𝑃(85.1 ≤ 𝑌 ≤ 85.21)


𝑃(𝑌 ≥ 85.1 | 84.82 ≤ 𝑌 ≤ 85.21)(0.25 p*) = =
𝑃(84.82 ≤ 𝑌 ≤ 85.21) 𝑃(84.82 ≤ 𝑌 ≤ 85.21)

85.1 − 85 85.21 − 85
𝑃( <𝑍≤ ) 𝑃(0.13 < 𝑍 ≤ 0.28) 𝑃(𝑍 ≤ 0.28) − 𝑃(𝑍 < 0.13)
= 0.75 0.75 = = (0.25 p)
84.82 − 85 85.21 − 85 𝑃(−0.24 < 𝑍 ≤ 0.28) 𝑃(𝑍 ≤ 0.28) − 𝑃(𝑍 < −0.24)
𝑃( <𝑍≤ )
0.75 0.75
0.6103 − 0.5517 0.0586 (0.25 p)
= = = 𝟎. 𝟐𝟖𝟓𝟕
0.6103 − 0.4052 0.2051 (0.25 p)

* Si han tomado como variable el diámetro, deben haber escrito: 𝑃(𝑋 ≥ 170.2 | 169.64 ≤ 𝑋 ≤ 170.42).
Si han calculado otra probabilidad, el puntaje del apartado es cero.

e. Si se colocan 4 piezas en una misma línea (ver figura), ¿cuál es la probabilidad de que el largo total del ensamble
(𝐿) sea superior a los 685 mm? (0.75 p)

𝑳 ~ 𝑵(𝟔𝟖𝟎; 𝟗)(0.25 p)
Si han usado otra distribución, el puntaje del
apartado es cero.
𝐿 = 𝐷1 + 𝐷2 + 𝐷3 + 𝐷4 685 − 680
𝑃(𝐿 > 1710) = 𝑃 (𝑍 > )
√9
𝐸(𝐿) = 𝐸(𝐷1 ) + 𝐸(𝐷2 ) + 𝐸(𝐷3 ) + 𝐸(𝐷4 ) = 4 × 170 = 680 = 𝑃(𝑍 > 1.67) = 1 − 0.9525
= 𝟎. 𝟎𝟒𝟕𝟓 (0.5 p)
𝑉𝑎𝑟(𝐿) = 𝑉𝑎𝑟(𝐷1 ) + 𝑉𝑎𝑟(𝐷2 ) + 𝑉𝑎𝑟(𝐷3 ) + 𝑉𝑎𝑟(𝐷4 ) = 4 × 1.52 = 9
3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
.

2. Una empresa de seguros clasifica a todos sus clientes en tres categorías: alto riesgo (A), medio riesgo (B) y bajo riesgo
(C). 25.6% de los clientes pertenecen a la primera categoría; 57.2%, a la segunda; mientras que, el resto, a la tercera.
El costo (en dólares) en el que incurre la empresa por un cliente por un cliente en un año es una variable aleatoria
(𝑋). Si un cliente pertenece a la categoría A, la función de densidad del costo es:
𝒙
𝒇(𝒙) = ; 𝑠𝑖 𝑥 ∈ [0; 2000]
𝟐 × 𝟏𝟎𝟔
Por otro lado, si un cliente pertenece a la categoría B, el costo es una variable uniforme continua entre 0 y 1000
dólares; mientras que, si pertenece a la categoría C, el costo es una exponencial de media 350 dólares.

a. Calcule el valor del cuartil 3 del costo si un cliente pertenece a la categoría C. (0.5 p)

1
𝐹(𝑄3 ) = 1 − 𝑒 − 350×𝑄3 = 0.75

𝑸𝟑 = 𝟒𝟖𝟓. 𝟐𝟏 (0.5 p) Cualquier otra respuesta: 0 p.

b. ¿Cuál es la probabilidad de que un cliente de la categoría A genere un costo superior a los 800 dólares? (0.5 p)

2000
𝑥
(𝑋 > 800 | 𝐴) = ∫ 𝑑𝑥 = 𝟎. 𝟖𝟒 (0.5 p)
2 × 106
800
Cualquier otra respuesta: 0 p.

c. Un cliente pertenece a la categoría A. ¿Cuál es la varianza del costo en que incurre la empresa por él? ¿En qué
unidades está expresada? (1 p)
+∞ 2000
𝑥
𝜇 = 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥 = ∫ 𝑥 ∙ 𝑑𝑥 = 1333.3 𝑈𝑆𝐷 (0.25 p)
2 × 106
−∞ 0

+∞ 2000
𝑥
𝑉𝑎𝑟(𝑋) = ∫ (𝑥 − 𝜇) 𝑓(𝑥)𝑑𝑥 = ∫ (𝑥 − 1333.3)2 ∙
2
𝑑𝑥 = 222 222 (0.5 p) 𝑈𝑆𝐷2 (0.25 p)
2 × 106
−∞ 0

d. Un cliente genera un costo superior a los 800 dólares. ¿Cuál es la probabilidad de que pertenezca a la categoría
A? (2 p)

𝑃(𝐴 ∩ 𝑋 > 800) 𝑃(𝑋 > 800 | 𝐴) × 𝑃(𝐴)


𝑃(𝐴 | 𝑋 > 800)(0.25 p) = =
𝑃(𝑋 > 800) 𝑃(𝑋 > 800)

• Si el cliente es de la categoría A:
𝑃(𝑋 > 800 | 𝐴) = 0.84 (apartado b)
• Si el cliente es de la categoría B:
1000
1
𝑃(𝑋 > 800 | 𝐵) = ∫ 𝑑𝑥 = 0.2 (0.5 p. Debe haber procedimiento.)
1000
800
• Si el cliente es de la categoría C:
1
𝑃(𝑋 > 800 | 𝐶) = 𝑒 − 350×800 = 0.1017 (0.5 p. Debe haber procedimiento.)

Entonces:

𝑃(𝑋 > 800) = 𝑃(𝑋 > 800 | 𝐴) × 𝑃(𝐴) + 𝑃(𝑋 > 800 | 𝐵) × 𝑃(𝐵) + 𝑃(𝑋 > 800 | 𝐶) × 𝑃(𝐶)

𝑃(𝑋 > 800) = 0.84 × 0.256 + 0.2 × 0.572 + 0.1017 × 0.172 = 𝟎. 𝟑𝟒𝟔𝟗 (0.5 p)

𝑃(𝑋 > 800 | 𝐴) × 𝑃(𝐴) 0.84 × 0.256


𝑃(𝐴 | 𝑋 > 800) = = = 𝟎. 𝟔𝟏𝟗𝟗 (0.25 p)
𝑃(𝑋 > 800) 0.3469

4
PRÁCTICA PARTICIPACIÓN ACTA ACTA REVISADA FIRMA Estadística Básica
Práctica 4
Semestre 2019-II 08/11/2019
Duración: 1:30

Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
Con calculadora, tablas y formulario oficial de la asignatura. Todas las evaluaciones se escanean para prevenir fraude.
Contesta cada pregunta sólo en la hoja de su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega.
Cuando se solicite reclamo, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
NOTA
1. A continuación, se muestra un conjunto de tablas. En cada una hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar.

Marca con X la frase correcta. (+1.5 si acierto, -0.5 si fallo) FIRMA

1.1 Sólo aceptamos 𝐻0 si los datos muestran mucha evidencia en contra de ella
1.2 Siempre podremos aceptar 𝐻0 utilizando un nivel de significación suficientemente grande
Si los datos están muy alejados de 𝐻0 , más de lo que cabría esperar solo por el azar del muestreo,
1.3 X
rechazaré 𝐻0

Marca con X la frase correcta. (+1.5 si acierto, -0.5 si fallo)


Quiero contrastar si 𝐻0 : 𝜇 ≥ 30, como he obtenido que 𝑥̅ = 31 puedo concluir que Acepto 𝐻0 sin
1.4 X
necesidad de hacer cálculos adicionales
1.5 Si rechazo 𝐻0 : 𝜇 ≥ 30 también rechazaré 𝐻0 : 𝜇 ≤ 30
1.6 Si en el contraste 𝐻0 : 𝜇 = 30 obtengo que 𝑥̅ = 31 y acepto 𝐻0, entonces no puedo rechazar que 𝑥̅ = 30

Marca con X la frase correcta. (+1.5 si acierto, -0.5 si fallo)

1.7 Si el pvalor es mayor que el nivel de significación, rechazaré 𝐻0


1.8 Cuanto mayor sea el pvalor, más lejos se encuentra la muestra de 𝐻0.
1.9 Si quiero contrastar 𝐻0 : 𝜇 ≥ 30 y obtengo 𝑥̅ = 30, el pvalor del contraste es 0.5 X

2. El partido político JV ha elegido a su candidato a la presidencia. Por ello, se desea estimar, con un margen de error máximo
del 3%, cuál es el porcentaje de aceptación que tiene dicho candidato. El nivel de confianza que se pretende es del 90%.
¿Cuántas encuestas se deben realizar? (3.5 p)

𝐿 = 0.03; 𝑁. 𝐶. = 90%
2
√𝑝̂ (1 − 𝑝̂ )
𝑛 = (𝑧0.05 × ) (𝟏 𝒑)
𝐿

Como no se tiene información de alguna muestra, se asume el peor de los casos: 𝑝̂ = 0.5.

2
√0.5(1 − 0.5)
𝑛 = (1.645 × ) = 751.67 (𝟐 𝒑) ≈ 𝟕𝟓𝟐(𝟎. 𝟓 𝒑)
0.03

̂, el puntaje total es cero. Si han usado otra fórmula, el puntaje total es cero.
Si han usado otro valor de 𝒑

1
Apellidos:__________________________________________________Nombre__________________ NOTA

3. Un grupo de médicos se encuentra realizando un estudio sobre hábitos de sueño de estudiantes


universitarios. Han realizado una encuesta y han obtenido los siguientes resultados: 12 estudiantes FIRMA
duermen 4 horas diarias; 28 estudiantes, 5 horas; 17 estudiantes, 6 horas; 13 estudiantes, 7 horas; y 8
estudiantes, 8 horas. Con esta información, se obtiene que la media muestral es 5.71. y que la
cuasivarianza es 1.48. A partir de los datos, responda, de manera justificada:

a. ¿Es posible afirmar que el número medio de horas diarias que duermen los estudiantes universitarios es superior a las 5.5
horas? (6p)

Hipótesis (1p)
Debe estar el símbolo 𝜇 y el valor 5.5. Si han planteado 𝑯𝟎 : 𝝁 ≤ 𝟓. 𝟓 𝑯𝟏 : 𝝁 > 𝟓. 𝟓
otras hipótesis: 0 p.
Estadístico de contraste (1p) 𝑥̅ − 𝜇0 5.71 − 5.5
𝑡0 = (𝟎. 𝟓 𝒑) = = 1.52 (𝟎. 𝟓 𝒑)
Indique el símbolo del estadístico, su fórmula, los 𝑠̂ √1.48
valores que utiliza en la fórmula y el valor numérico √𝑛 √78
Distribución del estadístico de contraste (1p)
𝑇0 ~ 𝑁(0,1)

¿Por qué ha elegido dicha distribución? (1p) Porque hay 78 datos; es decir, la muestra es grande (n > 30).

Si los tres primeros pasos (hipótesis, estadístico y distribución) son correctos, se continúa con la corrección. Si al menos uno
es incorrecto, el resto de pasos no se corrige (puntaje 0). No considerar la explicación del porqué de la distribución.

Dibuja la distribución de referencia, las


regiones de aceptación y rechazo, y localiza el
valor del estadístico de contraste. (1p)

Si el valor crítico (1.645) es incorrecto, el puntaje es 0.


Si la región de rechazo está ubicada hacia la izquierda
o hacia ambos lados, el puntaje es 0.

1. Se acepta la hipótesis nula.


Conclusión del contraste (1p) 2. No hay suficiente evidencia para afirmar que el número
1. ¿Se acepta o se rechaza la hipótesis nula? medio de horas de sueño es superior a 5.5 horas.
2. Responda a la pregunta planteada en el Si ambas son correctas: 1 p.
enunciado: Si al menos una es incorrecta o no ha sido respondida: 0 p.

b. ¿Es posible afirmar que el 10% de la población de estudiantes universitarios duerme 8 horas diarias? Responda a este
contraste utilizando el p-valor. (6 p)

Hipótesis (1p)
Debe estar el símbolo 𝑝 y el valor 0.1. Si han 𝑯𝟎 : 𝒑 = 𝟎. 𝟏 𝑯𝟏 : 𝒑 ≠ 𝟎. 𝟏
planteado otras hipótesis: 0 p.
8
Estadístico de contraste (1p) 𝑝̂ − 𝑝0 − 0.1
𝑧0 = (𝟎. 𝟓 𝒑) = 78 = 0.08 (𝟎. 𝟓 𝒑)
Indique el símbolo del estadístico, su fórmula, los
valores que utiliza en la fórmula y el valor numérico √ 𝑝0 (1 − 𝑝0 ) √ 0.1(1 − 0.1)
𝑛 78
Distribución del estadístico de contraste (1p) 𝑍0 ~ 𝑁(0,1)

¿Por qué ha elegido dicha distribución? (1p)


Porque 𝑛𝑝̂ (1 − 𝑝̂ ) = 7.18 > 5; es decir, la muestra es grande.

2
p-valor del contraste ( 1p) Como el contraste es bilateral:

Cualquier otro valor: 0 p. 𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 2 × 𝑃(𝑍 > 0.08) = 2 × (1 − 0.5319) = 𝟎. 𝟗𝟑𝟔𝟐


Si los cuatro primeros pasos (hipótesis, estadístico, distribución y p-valor) son correctos, se continúa con la corrección. Si al
menos uno es incorrecto, el resto de pasos no se corrige (puntaje 0). No considerar la explicación del porqué de la
distribución.

1. Se acepta la hipótesis nula.


Conclusión del contraste (1p) 2. Hay suficiente evidencia para aceptar que el 10% de la
1. ¿Se acepta o se rechaza la hipótesis nula? población duerme 8 horas.
2. Responda a la pregunta planteada en el Si ambas son correctas: 1 p.
enunciado. Si al menos una es incorrecta o no ha sido respondida: 0 p.

3
ESTADÍSTICA BÁSICA
SEMESTRE 2015-II
SUSTITUTORIO
MIÉRCOLES, 9 DE DICIEMBRE DE 2015

Nombre:___________________________________________________________________________
Sección:___________________

DEBES ENTREGAR ESTA HOJA, JUNTO CON EL CUADERNILLO, CON LAS RESPUESTAS DE LAS PREGUNTA 1
Sólo están permitidas las tablas que se entregan con el examen. Salvo que se indique lo contrario, utiliza 𝛼 = 0.05.

1. Sea (𝑥1 , 𝑦1 ), … , (𝑥100 , 𝑦100 ) una muestra aleatoria de 𝑛 = 100 pares de puntos de la población (𝑋, 𝑌). Sea
𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝑢 con 𝑢 ∼ 𝑁(0, 𝜎 2 ), y sean 𝜇𝑥 y 𝜎𝑥2 , la media y varianza de 𝑋, respectivamente. Decir si las
siguientes afirmaciones son verdaderas (V) o falsas (F). CONTESTA EN LA TABLA SIGUIENTE. No necesitas
justificar. Respuesta correcta +0.5, incorrecta -0.25.

a) Como 𝑛 > 30 entonces 𝑋 se puede aproximar con una normal. F

b) Si 𝑌 depende linealmente de 𝑋, ambos coeficientes de regresión, 𝛽0 y 𝛽1 , serán no nulos. F

c) Si el p-valor del contraste 𝐻0 : β1 = 0 es menor que 𝛼 , se rechazará que haya relación entre 𝑋 e 𝑌. F

d) Si 𝑋 aumenta en una unidad, 𝑌 aumenta, por término medio, en 𝛽1 unidades. V

e) Si 𝑋 = 0 , entonces 𝑌 ∼ 𝑁(𝛽0 , 𝜎 2 ). V

f) El margen de error del intervalo de confianza para 𝜇𝑥 disminuye con 𝑛 y aumenta con 𝜎𝑥2 . V
El contraste 𝐻0 : 𝜇𝑥 ≤ 𝜇0 , 𝐻1 : 𝜇𝑥 > 𝜇0 se puede resolver comprobando si 𝜇0 está dentro del
g) F
intervalo de confianza para 𝜇𝑥
h) El rango intercuartílico de 𝑋 tiene el mismo número de datos que el rango intercuartílico de 𝑌 V

SOLUCIÓN

a. FALSO. La distribución de una variable aleatoria no depende del tamaño de la muestra que se extraiga de
ella. Sería cierto para 𝑋�.
b. FALSO. La dependencia entre X e Y sólo afecta a 𝛽1 .
c. FALSO. Al contrario, se rechazará 𝐻0 que es la ausencia de relación. Por tanto, si el pvalor es bajo, se acepta
que hay relación.
d. VERDADERO.
e. VERDADERO, pues el modelo de regresión simple (que hemos estudiado) asume 𝑌 ∼ 𝑁(𝛽0 + 𝛽1 𝑋; 𝜎)
f. VERDADERO. SE deduce fácilmente de la fórmula
g. FALSO. Esa equivalencia es sólo para contrastes bilaterales.
h. VERDADERO. Entre el rango intercuartílico está el 50% de los datos, que en nuestro caso son 50.

1
2. Un proceso productivo produce, cuando funciona en condiciones óptimas, un 1% de artículos defectuosos.
Después de una avería en la que hubo que reparar algunas máquinas se produjeron 6 artículos defectuosos en
500 artículos producidos. ¿Ha empeorado el proceso tras la reparación de la avería?

SOLUCIÓN:

Tras la avería puede que haya empeorado el proceso (𝑝 > 0.01) o sigua igual (𝑝 = 0.01, ó 𝑝 ≤ 0.01). El
contraste a realizar es, por tanto, (1p)

𝐻0 : 𝑝 ≤ 0.01 (ó 𝑝 = 0.01)
𝐻1 : 𝑝 > 0.01
En la muestra se obtiene

6
𝑝̂ = = 0.012,
500
que discrepa de 𝐻0 , y está del lado de 𝐻1 . Tenemos que realizar un contraste de hipótesis para valorar si esa
diferencia con respecto a 𝐻0 es significativa o, por el contrario, se puede explicar por el azar del muestreo.
Con este fin, en primer lugar vemos que el tamaño muestral n=500 es elevado y, además,

𝑛𝑝̂ (1 − 𝑝̂ ) = 500(0.012)(1 − 0.012) = 5.92 > 5,

por lo que, para realizar el contraste, podemos utilizar la aproximación a la normal para el estimador 𝑝̂ . (1p)

El estadístico de contraste que vamos a utilizar entonces es,


𝑝̂ − 𝑝0
𝑧₀ =
𝑝 𝑞
� 0 0
𝑛
y el valor que toma en nuestra muestra, es (1p)
𝑝̂ − 𝑝0 0.012 − 0.01
𝑧₀ = = = 0.45
𝑝 𝑞
� 0 0 �0.01 × 0.99
𝑛 500

La distribución de referencia es la N(0,1), y la región de rechazo será la cola de la derecha, como se muestra en
esta figura.(1p)

Para 𝛼 = 0.05 el valor crítico es 1.65. Por tanto, se rechazaría la hipótesis nula si 𝑧₀ > 1.65. Como 𝑧0 =
0.45 < 1.65 no podemos rechazar la hipótesis nula. No hay evidencia suficiente para pensar que tras la
reparación el proceso haya empeorado.(1p)

2
3. La variable aleatoria 𝑋 sigue la siguiente función de densidad:
𝑓(𝑥) = 𝑎𝑎; 0<𝑥<𝑏
a) Calcula los valores de a y b sabiendo que la mediana de 𝑋 es 𝑥𝑚 = 1. (1p)
b) Calcula la esperanza de esta variable.(1p)
c) Calcula la función de distribución.(1p)
d) A partir de la función de distribución, calcula los cuartiles. (1p)
e) A partir de una muestra aleatoria de esta variable, de tamaño 𝑛 = 20, un analista propone usar la media
muestral 𝑋� como estimador de la mediana de esta distribución. ¿Qué sesgo cometemos al usar 𝑋� como
estimador de la mediana de la población? (2p)

SOLUCIÓN:

a) Si 𝑥𝑚 = 1 es la mediana se tiene que


1 1
1 𝑎𝑥 2 𝑎 1
� 𝑎𝑎𝑎𝑎 = ⇒� � = = ⇒ 𝑎 = 1.
2 2 0 2 2
0
Además, para que 𝑓(𝑥) sea una función de densidad debe integrar uno en su dominio. Podemos usar esta
restricción para calcular el valor de b
𝑏 𝑏
𝑥2 𝑏2
� 𝑥𝑥𝑥 = 1 ⇒ � � = = 1 ⇒ 𝑏 = √2.
2 0 2
0
Por tanto, la función de densidad es
𝑓(𝑥) = 𝑥; 0 < 𝑥 < √2.
(Hay que calcular correctamente 𝑎 y 𝑏 para tener puntuación en este apartado)

b) La esperanza matemática es
√2 √2
𝑥3
𝜇 = 𝐸(𝑋) = � 𝑥 2 𝑑𝑑 = � � = 0.9428
3 0
0
c) La función de distribución es
0 ;𝑥 ≤ 0
⎧ 𝑥
⎪𝑥2
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = � 𝑢𝑢𝑢 = ; 0 < 𝑥 < √2
⎨0 2

⎩ 1 ; 𝑥 ≥ √2

d) Los cuartiles son entonces


1 𝑄12 1 1
𝐹(𝑄1 ) = ⇒ = ⇒ 𝑄1 = = 0.7071
4 2 4 √2
1 𝑄22 1
𝐹(𝑄2 ) = ⇒ = ⇒ 𝑄2 = 1
2 2 2
3 𝑄32 3 3
𝐹(𝑄3 ) = ⇒ = ⇒ 𝑄3 = � = 1.2247
4 2 4 2
e) La media muestral es un estadístico cuya media es la media poblacional. En nuestro caso:
𝐸(𝑋� ) = 𝐸(𝑋) = 0.9428.
Como la mediana es 𝑥𝑚 = 1, el sesgo que cometemos al estimar este valor usando 𝑋� es

𝑆𝑆𝑆𝑆𝑆(𝑋�) = 𝐸(𝑋� ) − 𝑚 = 0.9428 − 1 = −0.0572

3
4. Un portal de internet dedicado a la venta on-line, está probando un servicio de entrega de paquetes
utilizando drones (vehículo volador no tripulado). Con ese fin, realiza un experimento que consiste en
llevar diferentes paquetes desde un punto A a otro punto B. La tabla y figura que se muestran a
continuación muestran el análisis con Minitab del tiempo de vuelo de 40 pruebas. En este análisis se
evalúa el ajuste de los datos a una distribución normal y a una exponencial. A la vista de estos
resultados, contesta, de forma justificada, a las siguientes preguntas. (5p)
a) ¿Cuál es la probabilidad de se que cubra el trayecto desde A hasta B en menos de 15 minutos?
b) Si se observa que tras 14 minutos de vuelo, el dron aún no ha llegado al punto B ¿cuál es ahora la
probabilidad de que se cubra el trayecto desde A hasta B en menos de 15 minutos?

Media 13.1 Gráfica de probabilidad para Vuelo


Cuasidesv. tipica 1.1 Normal Exponencial
Cuasi-Varianza 1.3 99 Prueba de bondad del ajuste
Asimetría -0.02 95
Normal
Kurtosis 2.8 95
80
AD = 0,277
Valor P = 0,636
N 40.0
Mínimo 10.6 80 50 Exponencial
AD = 15,407
1er cuartil 12.4 Valor P = 0,003
Porcentaje

Porcentaje
Mediana 13.1 20
50
3er cuartil 13.8
Máximo 15.3
20
5

5
2

1 1
10 12 14 16 0,1 1 10 100
Vuelo Vuelo

SOLUCIÓN:

a) La evaluación del ajuste a la normal muestra que los puntos del gráfico de probabilidad se alinean bastante
bien alrededor de la recta de referencia. Los datos muestran así un buen ajuste a la normal (mejor sería ver el
histograma, que aquí no se muestra de forma intencionada). Además, el pvalor del test de bondad de ajuste
que realiza el Minitab (test de Anderson-Darling) es muy alto, mayor que 𝛼, por lo que podemos acepar la
hipótesis de normalidad para la población de la que proceden estos datos. Esto no ocurre con el ajuste a la
exponencial. El gráfico de probabilidad muestra un alejamiento muy importante de la recta de referencia, y el
p-valor es mucho menor que 𝛼. Además, el resumen estadístico revela que los datos parecen bastante
simétricos, lo que no se cumple en una distribución exponencial. Asumiremos entonces que el tiempo de
vuelo del dron sigue el modelo, usando la notación 𝑁(𝜇; 𝜎), X∼ 𝑁(13.1; 1.1). (2p)

Por tanto
15−13.1
𝑃(𝑋 < 15) = 𝑃 �𝑧 < � = 𝑃(𝑧 < 1.73) = 0.9582. (1p)
1.1
b) Nos interesa ahora la probabilidad condicionada
𝑃((𝑋 < 15) ∩ (𝑋 > 14)) 𝑃(14 < 𝑋 < 15) 𝑃(𝑋 < 15) − 𝑃(𝑋 < 14)
𝑃(𝑋 < 15|𝑋 > 14) = = =
𝑃(𝑋 > 14) 𝑃(𝑋 > 14) 𝑃(𝑋 > 14)
0.9456 − 0.7939
= = 0.7361 (2p)
(1 − 0.7939)
donde se ha usado que

14 − 13.1
𝑃(𝑋 < 14) = 𝑃 �𝑧 < � = 𝑃(𝑧 < 0.82) = 0.7939
1.1

4
ESTADÍSTICA BÁSICA
SEMESTRE 2015-II
EXAMEN FINAL
MIÉRCOLES, 25 DE NOVIEMBRE DE 2015

Nombre:___________________________________________________________________________
Sección:___________________
Sólo están permitidas las tablas que se entregan con el examen. Salvo que se indique lo contrario, utiliza
𝛼 = 0.05

1. En cierto proceso químico interesa mantener la temperatura en valores estables. Con ese fin, se instala
en el horno un controlador automático cuyo objetivo es mantener la temperatura del proceso en 80ºC.
Lo que hace este controlador es regular la entrada de calor en función de las oscilaciones de
temperatura que detecte, con el fin de contrarrestarlas. El resultado no es un proceso con
temperatura perfectamente constante, pero sí con variaciones muy pequeñas. Una muestra de 26
temperaturas ha proporcionado una temperatura media de 79.1ºC con una cuasivarianza de 0.09.
Asumiendo que la variación de temperatura sigue una distribución normal, se pide:
a) Construye un intervalo de confianza para la varianza de la temperatura del horno. (2p)
b) Tras analizar la tecnología de este controlador, se ve que es una versión mejorada del que se
ha estado utilizando con anterioridad, por lo que, presuntamente, se debe conseguir mantener
la temperatura en unos márgenes más estrechos. De acuerdo a los datos históricos, el anterior
controlador proporcionaba valores de temperatura con una varianza de 0.16. ¿Hay evidencia
de que el nuevo controlador ha conseguido disminuir la varianza de la temperatura? (2p)

SOLUCIÓN:

a) Al tratarse de una población normal, el intervalo de confianza para la varianza es


(𝑛 − 1)𝑆̂ 2 (𝑛 − 1)𝑆̂ 2 25 × 0.09 25 × 0.09 2.25 2.25
𝐼𝐼(95%): 𝜎 2 ∈ � 2 ; 2 �=� 2 ; 2 �= � ; �
𝜒𝑛−1;𝛼⁄2 𝜒𝑛−1;1−𝛼⁄2 𝜒25;0.025 𝜒25;0.975 40.65 13.12
= [0.0554; 0.1715]

b) Si el nuevo controlador es necesariamente mejor, proporcionará unos valores de temperatura con


varianza 𝜎 2 < 0.16. No sabremos su varianza verdadera, pero se descartarían valores de 𝜎 2 ≥ 16. Si
queremos buscar el respaldo de los datos a esta afirmación, necesitamos realizar el contraste de
hipótesis (1p)
𝐻0 : 𝜎 2 = 0.16 (ó 𝜎 2 ≥ 0.16)
𝐻1 : 𝜎 2 < 0.16 Acepto H
0

(Resolver este contraste usando el intervalo de confianza del


apartado anterior no es correcto).
Puesto que la población es normal, el estadístico de contraste es χ n2−1;1−α
(0.5p)
(𝑛 − 1)𝑆̂ 2 25 × 0.09
𝑋02 = = = 14.06
𝜎02 0.16
2
y la región de rechazo estará en la cola de la izquierda de la distribución 𝜒25 . Con 𝛼 = 0.05 el valor
2 2
crítico es 𝜒25;0.95 = 14.61. Como 𝑋0 < 14.61 estamos en la región de rechazo de 𝐻0 . Hay evidencia
suficiente para asegurar que el nuevo controlador es mejor. (1p)

1
2. Se tiene una muestra de 191 estudiantes de ingeniería. Entre otras, se tienen las variables:
• ‘Altura’: altura en cm
• ‘Dinero fin de semana’: dinero gastado en ocio en el fin de semana (soles)
• ‘Tiempo de construcción’: tiempo, en segundos, que se demora en la construcción de un
avión de papel
• ‘Sexo’: 1=chicos, 0=chicas.

Se pide:

a) A partir de los resultados de Minitab suministrados: ¿hay diferencias significativas entre


hombres y mujeres en cuanto a ’Tiempo de construcción’ y ‘Dinero fin de semana’? La
respuesta para cada una de estas variables debe contener la siguiente información: contraste
que se realiza, p-valor, e interpretación del resultado en términos de cómo varía la variable
dependiente por sexos. Escribe el resumen de los resultados en los recuadros que se
suministran y el desarrollo y justificación en el cuadernillo.

Variable Resultados
𝐻0 : 𝛽1 = 0 ( no hay diferencias) 𝐻1 : 𝛽1 ≠ 0
p-valor: 0,172
Interpretación resultado:
‘Tiempo de
construcción’ Como p-valor>𝛼, no hay diferencias significativas entre chicos y
(1.5p) chicas en el tiempo medio que se demoran en construir el avión de
papel.

𝐻0 : 𝛽1 = 0 ( no hay diferencias) 𝐻1 : 𝛽1 ≠ 0
p-valor: 0,014
Interpretación resultado:
‘Dinero fin de
semana’ Como pvalor< 𝛼 sí hay diferencias significativas entre chicos y chicas.
(1.5p) En media, los chicos se gastan casi 18 soles más que las chicas.

b) Utilizando los resultados de Minitab que se adjuntan ¿Cuál es la probabilidad de que un


chico de la población de la que procede esta muestra mida más de 175 cm? Justifica
adecuadamente la respuesta, así como los supuestos e hipótesis en los que te bases.(3p)

2
Análisis de regresión: ALTURA vs. SEXO

Término Coef EE coef. T P


Constante 159,236 0,836192 190,430 0,000
SEXO 11,102 0,990954 11,203 0,000

S = 6,20137 R-cuad. = 39,91%

Análisis de regresión: DINERO FIN DE SEMANA vs. SEXO

Término Coef EE coef. T P


Constante 36,2909 6,07175 5,97701 0,000
SEXO 17,9370 7,19550 2,49281 0,014

S = 45,0293 R-cuad. = 3,18%

Análisis de regresión: TIEMPO DE CONSTRUCCIÓN vs. SEXO

Término Coef EE Coef T P


Constante 51,345 4,955 10,36 0,000
SEXO 8,108 5,911 1,37 0,172

S = 36,7469 R-cuad. = 1,0%

Gráficas de residuos para ALTURA


Gráfica de probabilidad normal vs. ajustes
99,9 20
99

90 10
Porcentaje

Residuo

50 0

10
-10
1
0,1 -20
-20 -10 0 10 20 160,0 162,5 165,0 167,5 170,0
Residuo Valor ajustado

Histograma vs. orden


20
40
10
Frecuencia

30
Residuo

0
20
-10
10

0 -20
-18 -12 -6 0 6 12 18 1 20 40 60 80 100 120 140 160 180
Residuo Orden de observación

3
SOLUCIÓN:

a) A partir de la regresión simple, el coeficiente estimado 𝛽̂1 nos sirve para contrastar la igualdad de
los valores medios de cada variable en cada uno de los grupos que se forman con las variables
binarias. Contrastar si la media es igual en chicos o en chicas, es equivalente a contrastar si la
variable sexo es relevante

𝐻0 : 𝜇0 = 𝜇1 𝐻0 : 𝛽1 = 0

𝐻1 : 𝜇0 ≠ 𝜇1 𝐻1 : 𝛽1 ≠ 0

(Escribir 𝐻0 : 𝛽̂1 = 0 no es correcto). Nuestra muestra es suficientemente grande. Con muchos


datos, el estadístico de contraste de este test sigue una normal N(0,1), y para n=191 se tiene que
𝑡𝑛−1 ≈ 𝑁(0,1). Por tanto, el p-valor del contraste basado en la t de Student que realiza el Minitab
es válido.

Para el caso de la variable ’Tiempo de construcción’, el pvalor es mayor de 0.05, por lo que no
podemos rechazar la hipótesis nula de que el tiempo medio de construcción no depende del sexo
(𝛽1 = 0). Por tanto, clasificar las observaciones según el sexo es irrelevante para entenderé las
diferencias en el tiempo que se demoran en construir un avión de papel.

En el caso del dinero que se gastan en el fin de semana en ocio, el pvalor es menor que 0.05, por
lo que sí hay diferencias significativas entre chicos y chicas. Los chicos gastan, en media, 18 soles
más que las chicas.

b) Según los resultados que se muestran, el sexo es una variable significativa para explicar la altura
media de los estudiantes. El pvalor es muy pequeño, mucho menor que 𝛼 (hasta el tercer decimal
es cero). En media, los chicos miden 11 cm más que las chicas. Por tanto, para los chicos puede
estimarse que la estatura media es 𝜇̂ = 159.23 + 11.10 = 170.3

Los residuos son, además, normales, según se aprecia por el histograma y el gráfico de
probabilidad, por lo que la distribución de las estaturas en cada grupo es una normal.

La desviación típica de los residuos es 6.2. Por tanto, 𝑌 ∼ 𝑁(170.3; 6.2)


175 − 170.3
𝑃(𝑌 > 175) = 𝑃 �𝑧 > � = 𝑃(𝑧 > 0.75) = 0.2266
6.2

4
3. Un practicante del departamento de operaciones de un call center piensa que el número de
llamadas que reciben sigue una distribución de Poisson.

Para comprobar esto, observa el número de llamadas que recibe por minuto, durante un intervalo
de 200 minutos, calcula la media de esa muestra y resulta ser de 3.5 llamadas por minuto. La
gráfica que aparece a continuación resume la distribución que encontró durante su período de
observación.

Frecuencia observada

50 45
39
40 35
29
30 25
21
20

10 6

0
0 1 2 3 4 5 6 ó mas

Número de llamadas por minuto

¿Los datos obtenidos respaldan la sospecha del practicante? (5 puntos)

SOLUCIÓN:

Ho: El número de llamadas que recibe el call center sigue una distribución de Poisson con
parámetro 3.5 llamadas por minuto.
H1: El número de llamadas que recibe el call center no sigue una distribución de Poisson con
parámetro 3.5 llamadas por minuto.

Nivel de significancia 5%

X F. Observada P(X) F. Esperada


0 6 0.030197 6.0394
1 21 0.105691 21.1382
2 35 0.184959 36.9918
3 45 0.215785 43.1570
4 39 0.188812 37.7624
5 29 0.132169 26.4338
6 a más 25 0.142387 28.4774

Chi cuadrado de la prueba: 0.9014282. Chi cuadrado crítico para 5 grados de libertad y nivel de
significancia del 5%: 11.07. Por lo tanto aceptamos Ho. Los datos muestran suficiente evidencia a
favor de la distribución de Poisson, como sospecha el practicante.

5
4. Una máquina que llena cajas de leche siguiendo una distribución normal ha sido ajustada para
que descargue en promedio 260 ml de leche. El encargado de producción piensa que después de
un tiempo la máquina se ha descalibrado y que está llenando las cajas con más leche de lo
debido. Para verificar esto, toma una muestra de 10 cajas de leche. A continuación se muestran
los resultados obtenidos:

Muestra Caja1 Caja2 Caja 3 Caja 4 Caja 5 Caja 6 Caja 7 Caja 8 Caja 9 Caja 10

(ML) 256 263 259 270 255 253 259 262 261
264

¿Existe evidencia suficiente para afirmar que la máquina se ha descalibrado? (5 puntos)

SOLUCIÓN:
𝐻0 : µ = 260 𝑚𝑚
𝐻1 : µ > 260 𝑚𝑚
Prueba de 1 cola, RR a la derecha
Nivel de significancia del 5%
De la información de la mustra se tiene 𝑥̅ = 260.2, 𝑠̂ = 4.96. El estadístico t para el contraste es

260.2 − 260
𝑡 = = 0.1275
4.96
√10
El valor que deja un área de 𝛼 = 0.05 en la cola de la derecha de la 𝑡9 –valor crítico- es 𝑡9;0.05 =
1.833. La región de rechazo serán los valores 𝑡 > 1.833. Como nuestro valor es 0.1275 estamos
en la región de aceptación, por lo tanto no hay evidencia suficiente para afirmar que la máquina
se ha descalibrado.

6
ESTADÍSTICA BÁSICA
SEMESTRE 2015-II
PARCIAL
JUEVES, 8 DE OCTUBRE DE 2015

Apellidos:___________________________________________________________________________
Nombre:___________________________________________________________________________
Sección:___________________

No se puede consultar ningún tipo de documentación.

En este examen se proporciona una serie de recuadros en los que se ha de escribir el resultado final de cada
cuestión que se plantea. El desarrollo ha de realizarse en el cuadernillo. Estas hojas SE ENTREGARÁN JUNTO
CON EL CUADERNILLO, y se escanearán para prevenir fraudes posteriores. Por esta razón NO SE
CONSIDERARÁ NINGUNA RESPUESTA QUE NO SE HAYA ESCRITO EN LOS RECUADROS HABILITADOS Y QUE
NO SE HAYA RAZONADO EN EL CUADERNILLO.

1. Un artículo manufacturado está compuesto por dos piezas, P1 y P2, como muestra la figura.

P1 P2
𝐿1 𝐿2
𝐿

Debido a la variabilidad del sistema productivo, las longitudes respectivas, 𝐿1 y 𝐿2 , son variables
aleatorias, que verifican 𝐿1 ∼ 𝑁(10, 𝜎 2 = 1) y 𝐿2 ∼ 𝑁(12, 𝜎 2 = 4), siendo ambas longitudes variables
aleatorias independientes.
a) ¿Cómo será la variable aleatoria 𝐿 (distribución y parámetros)? (3 p.)

𝐿 ∼ 𝑁(22, 𝜎 2 = 5)

b) Este artículo es aceptable si su longitud total verifica que 𝐿 ∈ [21,24] ¿Qué proporción de artículos
defectuosos se está produciendo? (2 p.)

Proporción=51%

SOLUCIÓN:

a) Al tratarse de normales independientes se verifica que su suma será normal,


𝐿 ∼ 𝑁(𝐸(𝐿), 𝑉𝑉𝑉(𝐿))
con
𝐸(𝐿) = 𝐸(𝐿1 ) + 𝐸(𝐿2 ) = 22
𝑉𝑉𝑉(𝐿) = 𝑉𝑉𝑉(𝐿1 ) + 𝑉𝑉𝑉(𝐿2 ) = 5
Por tanto,
𝐿 ∼ 𝑁(22,5)
b) La proporción de defectuosos es:
P(defectuoso)=𝑃(𝐿 > 24) + 𝑃(𝐿 < 21)
Para usar las tablas de la N(0,1) hacemos los siguientes cálculos
1
𝑃(𝐿 > 24) + 𝑃(𝐿 < 21) = �1 − 𝑃(𝐿 ≤ 24)� + 𝑃(𝐿 < 21)
24 − 22 21 − 22
= 1 − 𝑃 �𝑧 ≤ � + 𝑃 �𝑧 ≤ �
√5 √5
= 1 − 𝑃(𝑧 ≤ 0.89) + 𝑃(𝑧 ≤-0.45)
= 1 − 0.8133 + 0.3264 = 0.51

2. Un examen consta de 5 preguntas del tipo Verdadero/Falso. Contesta de forma razonada a las
siguientes cuestiones.
a) Si la puntuación es de 4 puntos por respuesta correcta y 0 por respuesta incorrecta, ¿qué
puntuación espera obtener (en media) un estudiante que conteste al azar? (2 p.)

Puntuación esperada=10

b) ¿Cuál es la probabilidad de que un estudiante apruebe (11 puntos o más) contestando al azar?
(1 p.)

Probabilidad=0.5

c) El profesor decide ahora que si la respuesta a una pregunta es correcta el valor es de 4 puntos,
pero si es incorrecta, se obtiene una puntuación negativa de -3. ¿Qué nota esperará ahora
obtener el estudiante que conteste al azar? (2 p.)

Puntuación esperada=2.5

SOLUCIÓN:

a) Contestar de forma correcta una pregunta al responder al azar entre Verdadero o Falso tiene
probabilidad 0.5. Si llamamos 𝑋 =número de respuestas correctas en un grupo de 5 preguntas,
donde la probabilidad de acertar en cada una es 0.5, tenemos que
𝑋 ∼ 𝐵(5,0.5)
Por tanto, 𝐸(𝑋) = 𝑛𝑛 = 2.5 preguntas. Si cada pregunta vale 4 puntos, la puntuación esperada
será de 10.

b) Para aprobar se necesita un mínimo de 11 puntos. Como cada pregunta vale 4 puntos, es
necesario acertar un mínimo de 3 preguntas, lo que proporcionaría un mínimo de 12 puntos.
𝑃(𝑋 ≥ 3) = 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4) + 𝑃(𝑋 = 5)
5 5 5 5 5 5
= � � 0.53 0.52 + � � 0.54 0.51 � � 0.55 = 0.55 �� � + � � + � ��
3 4 5 3 4 5
= 0.313(10 + 5 + 1) = 0.5

c) Sea 𝑋𝑖 =puntuación de la pregunta i-ésima contestada al azar. Esta variable aleatoria se define
como
4, 𝑝(4) = 𝑃(𝑋𝑖 = 4) = 0.5
𝑋𝑖 = �
−3, 𝑝(−3) = 𝑃(𝑋 = −3) = 0.5

El valor esperado de esta variable es


𝐸(𝑋𝑖 ) = 4 × 𝑝(4) − 3 × 𝑝(−3) = 0.5
Entonces, la puntuación total puede escribirse como
𝑋 = 𝑋1 + 𝑋2 + 𝑋3 + 𝑋4 + 𝑋5
2
Y su valor esperado es
𝐸(𝑋) = 𝐸(𝑋1 ) + 𝐸(𝑋2 ) + 𝐸(𝑋3 ) + 𝐸(𝑋4 ) + 𝐸(𝑋5 ) = 5 × 0.5 = 2.5

3. Sea 𝑋 una variable aleatoria con la siguiente función de densidad de probabilidad


𝑓(𝑥) = 𝑘(1 − 𝑥 2 ); 𝑥 ∈ [−1,1]
Se pide:
a) Calcula 𝑘 y dibuja 𝑓(𝑥).(1 p.)

𝑘 =3/4

b) Calcula la moda, la mediana y la media.(2 p)

Moda=0 Mediana= 0 Media=0

c) Calcula 𝑃(𝑋 > 0.4) (2 p.)

𝑃(𝑋 > 0.4) = 0.216

SOLUCIÓN:

a) El valor 𝑘 debe verificar que


1 1
2 )𝑑𝑑
𝑥3 2 2 3
𝑘 � (1 − 𝑥 = 1 ⇒ 𝑘 �𝑥 − � = 𝑘 � + � = 1 ⇒ 𝑘 =
−1 3 −1 3 3 4

b) La distribución es simétrica alrededor del 0, por lo que media, mediana y moda son iguales a 0
c) La probabilidad se obtiene integrando 𝑓(𝑥):
1
3 1
𝑃(𝑋 > 0.4) = � 𝑓(𝑥)𝑑𝑑 = � (1 − 𝑥 2 )𝑑𝑑 = 0.216
0.4 4 0.4

3
4. Microluz es un importante fabricante del sector de la electrónica especializado en iluminación LED. El
tiempo de vida de sus bombillas LED sigue una distribución exponencial de media 10 años. No
obstante, algunas de ellas son defectuosas y siguen una exponencial cuya vida media es de sólo 1 año.
Se sabe que el 10 % de las bombillas fabricadas por la empresa son defectuosas.
a) Calcula la probabilidad, para cada tipo de bombilla, de que duren más de 1 año. (0.5 p.)

Bombillas aceptables=0.905
Bombillas defectuosas=0.368

b) Calcula la probabilidad de que una bombilla elegida al azar dure más de 1 año. (1 p.)

Probabilidad=0.852

c) Se selecciona al azar una bombilla LED de esta empresa y después de un año sigue
funcionando. ¿Cuál es la probabilidad de que sea de las defectuosas? (1.5 p.)

Probabilidad=0.043

d) ¿Cuál es la probabilidad de que esta bombilla que lleva ya un año funcionando funcione al
menos otro año más? Razonar la respuesta. (2 p.)

Probabilidad=0.880

SOLUCIÓN:

a) Sea A =bombilla aceptable, con vida media de 10 años, con 𝑃(𝐴) = 0.9. Sea D = bombilla
defectuosa, con vida media de 1 año, con 𝑃(𝐷) = 0.1. Las duraciones de cada tipo de bombilla se
pueden denotar por las siguientes variables aleatorias:
𝑇 = tiempo de vida de una bombilla seleccionada al azar,
𝑇𝐴 = tiempo de vida de una bombilla con media 10 años. 𝑇𝐴 ∼ 𝐸𝐸𝐸(𝜆𝐴 = 1/10),
𝑇𝐷 = tiempo de vida de una bombilla con media 1 año. 𝑇𝐷 ∼ 𝐸𝐸𝐸(𝜆𝐷 = 1).

Se tiene entonces que


1
𝑃(𝑇𝐴 > 1) = 𝑒 −𝜆𝐴 ×1 = 𝑒 −10 = 0.905
𝑃(𝑇𝐷 > 1) = 𝑒 −𝜆𝐷×1 = 𝑒 −1 = 0.368

b) Para calcular 𝑃(𝑇 > 1) aplicamos el teorema de la probabilidad total:

𝑃(𝑇 > 1) = 𝑃(𝑇 > 1|𝐷)𝑃(𝐷) + 𝑃(𝑇 > 1|𝐴)𝑃(𝐴)

= 0.368 × 0.1 + 0.905 × 0.9 = 0.852

c) Nos preguntan por 𝑃(𝐷|𝑇 > 1). Según el Teorema de Bayes:

𝑃(𝑇 > 1|𝐷)𝑃(𝐷) 0.368 × 0.1


𝑃(𝐷|𝑇 > 1) = = = 0.043,
𝑃(𝑇 > 1) 0.852

4
d) Nos preguntan por la probabilidad siguiente
𝑃(𝑇 > 2 ∩ 𝑇 > 1) 𝑃(𝑇 > 2)
𝑃(𝑇 > 2|𝑇 > 1) = = .
𝑃(𝑇 > 1) 𝑃(𝑇 > 1)
Procediendo como en el apartado anterior tenemos que

𝑃(𝑇 > 2) = 𝑃(𝑇 > 2|𝐷)𝑃(𝐷) + 𝑃(𝑇 > 2|𝐴)𝑃(𝐴)

donde

𝑃(𝑇 > 2|𝐴) = 𝑃(𝑇𝐴 > 2) = 𝑒 −𝜆𝐴 ×2 = 𝑒 −0.2 = 0.8187

𝑃(𝑇 > 2|𝐷) = 𝑃(𝑇𝐷 > 2) = 𝑒 −𝜆𝐷×2 = 𝑒⁻² = 0.135 .

Por tanto, tenemos que

𝑃(𝑇 > 2) = 0.1353 × 0.1 + 0.8187 × 0.9 = 0.750 .

Finalmente resulta que


𝑃(𝑇 > 2) 0.750
𝑃(𝑇 > 2|𝑇 > 1) = = = 0.88
𝑃(𝑇 > 1) 0.852

5
ESTADÍSTICA BÁSICA
SEMESTRE 2015-II
PRÁCTICA 5
JUEVES, 5 DE NOVIEMBRE DE 2015

Nombre:___________________________________________________________________________
Sección:___________________
DEBES ENTREGAR ESTA HOJA, JUNTO CON EL CUADERNILLO, CON LAS RESPUESTAS DE LAS PREGUNTAS 1 y 2
Salvo que se indique lo contrario, utiliza 𝛼 = 0.05

1. Analizando las calificaciones de una asignatura de años anteriores, se observa que los alumnos han
obtenido una nota media de 12 con varianza 2. A partir de una muestra aleatoria de 30 estudiantes del
presente año se obtiene una media de 13 con cuasi-varianza muestral de 2.1. A continuación se
enuncian un conjunto de hipótesis sobre los valores poblacionales de las calificaciones de esta
asignatura. Reescríbelas EN LA TABLA SIGUIENTE como hipótesis nula y alternativa. No necesitas
justificar. (Respuesta correcta +0.5).

Hipótesis sobre la población H0 H1


1 La varianza se mantiene en su valor histórico 𝜎2 = 2 𝜎2 ≠ 2

2 La nota media ha cambiado respecto al histórico 𝜇 = 12 𝜇 ≠ 12

3 La nota media ha disminuido respecto al histórico 𝜇 ≥ 12 𝜇 < 12

4 La nota media aumentó en un punto 𝜇 = 13 𝜇 ≠ 13

2. Sea 𝑋 una variable aleatoria de media 𝜇 y varianza 𝜎², y sea 𝑋1 , … , 𝑋𝑛 una muestra aleatoria de dicha
variable. Sea 𝑋� la media muestral y 𝑆̂ la cuasi-desviación típica, basadas en dicha muestra. Decir si las
siguientes afirmaciones son verdaderas (V) o falsas (F). CONTESTA EN LA TABLA SIGUIENTE. No
necesitas justificar. Respuesta correcta +0.8, incorrecta -0.5.

Antes de tomar los datos, la muestra 𝑋1 , … , 𝑋𝑛 es un conjunto de variables aleatorias independientes e


1 V
idénticas a 𝑋.
Si 𝑋 es normal, un intervalo de confianza para 𝜇 basado en la t de Student será correcto aunque 𝑛 sea
2 V
pequeño.
3 Si 𝑛 > 30, la variable 𝑋 se aproximará a una normal. F

4 Si 𝑋 ∼ 𝑁(𝜇, 𝜎 2 ), entonces 𝑆̂ 2 /√𝑛 sigue una distribución 𝜒𝑛−1


2 F

Si la hipótesis nula 𝐻0 : 𝜇 = 100 se acepta con un nivel de significación del 10%, también se aceptará
5 V
con cualquier nivel de significación menor.

6 Si 𝑋 es normal, el p-valor de un contraste sobre 𝝁 ha de realizarse integrando la 𝑡𝑛−1 . V

7 Para muestras grandes, (𝑛 − 1)𝑆̂ 2 /𝜎 2 sigue una 𝜒𝑛−1


2
independientemente de la distribución de 𝑋. F

8 A mayor varianza poblacional, el intervalo de confianza de 𝝈𝟐 será más ancho. F

9 El p-valor de un contraste de hipótesis es 0,07. Si 𝛼 =0,10 concluiremos que debemos rechazar 𝐻0 . V

10 Si 𝑋 no es normal, no sabríamos hacer un intervalo de confianza para 𝝈𝟐 con lo aprendido en clase V

1
3. Un servidor web de una red informática recibe por término medio 5 intentos de ataque por virus por
cada 1000 peticiones de conexión. La organización que posee dicho servidor hace una campaña de
publicidad para difundir la dirección de su sitio web. Al día siguiente de dicha campaña, el servidor
recibe 830 peticiones de conexión, de las que 10 son ataques por virus. ¿Hay evidencia suficiente para
afirmar que la campaña publicitaria ha atraído a los virus? Razona la respuesta.

SOLUCIÓN:

Sea 𝑝=proporción de conexiones con virus. Sea 𝑝̂ =proporción muestral de conexiones por virus.
Como n=830 es muy grande, y

10 829
𝑛𝑝̂ (1 − 𝑝̂ ) = 830 � �� � > 5,
830 830

podemos utilizar la aproximación a la normal para 𝑝̂ . (1p)


El contraste es (1p)
𝐻0 : 𝑝 ≤ 0.005
𝐻1 : 𝑝 > 0.005

El estadístico de contraste es (1p)

10
𝑝̂ − 𝑝0 − 0.005
𝑧₀ = = 830 = 2.88.
𝑝 𝑞
� 0 0 �0.005 × 0.995
𝑛 830

La distribución de referencia es la N(0,1), y la región de rechazo será la cola de la derecha, como se


muestra en esta figura.(1p)

Para 𝛼 = 0.05 el valor crítico es 1.65. Por tanto, se rechazará la hipótesis nula si 𝑧₀ > 1.65. Como
𝑧₀ = 2.88 > 1.65 se rechaza la hipótesis nula. Parece evidente que la campaña publicitaria ha atraído
también a los ataques por virus, y habrá que tomar medidas.(1p)

2
4. Un ingeniero está midiendo la eficiencia de un nuevo tipo de motor de inyección para motos. Con ese
fin, realiza un experimento en el laboratorio consistente en poner en funcionamiento 10 motores
alimentados con 1 litro de combustible cada uno. Los motores funcionan a un régimen de revoluciones
constante controlado, por lo que su consumo debería ser teóricamente el mismo. Sin embargo,
diversos factores que no se pueden controlar en el experimento hacen que el consumo de los
diferentes motores varíe. Los motores tienen acoplado un sistema de medida que calcula la distancia
que habrían recorrido si estuviesen montados sobre una motocicleta. Cuando los motores agotan el
combustible, se registra la distancia recorrida. Con las 10 distancias de la muestra se obtiene una
distancia media de 54 km con una cuasidesviación típica de 2 km. Asumiendo que la distancia recorrida
con un litro de combustible sigue una distribución normal, se pide:
a. Construye un intervalo de confianza para la media de la distancia recorrida. (1.5p)
b. Construye un intervalo de confianza para la varianza de la distancia recorrida. (1.5p)
c. ¿Puede aceptarse que la distancia que puede recorrer este tipo de motor con un litro de
combustible sigue una normal de media 53 km y varianza 4? (2p)

SOLUCIÓN:

a. Al ser una población normaI, el intervalo será

𝑠̂ 2
𝐼𝐼(95%): 𝜇 ∈ �𝑥̅ ± 𝑡9,0.025 � = �54 ± 2.262 � = (52.57; 55.43)
√𝑛 √10

b. Al tratarse de una población normal, el intervalo de confianza de la varianza será


2
(𝑛 − 1)𝑆̂ 2 (𝑛 − 1)𝑆̂ 2 9×4 9×4 36 36
𝐼𝐼(95%): 𝜎 ∈ � 2 ; 2 �=� 2 ; 2 �= � ; �
𝜒𝑛−1;𝛼⁄2 𝜒𝑛−1;1−𝛼⁄2 𝜒9;0.025 𝜒9;0.975 19.02 2.70
= [1.89; 13.33]

c. Nos piden realizar los siguientes contrastes:

𝐻0 : 𝜇 = 53 𝐻0 : 𝜎 2 = 4
𝐻1 : 𝜇 ≠ 53 𝐻0 : 𝜎 2 ≠ 4

Para un mismo 𝛼, un intervalo de confianza y un contraste de hipótesis bilateral son equivalentes,


en el sentido de que no podremos rechazar ningún valor de 𝐻0 que esté contenido dentro del
intervalo. Podemos entonces contestar a la pregunta usando los intervalos que acabamos de
construir. En nuestro caso, ambos valores están dentro de los intervalos de confianza anteriores.
Por tanto:
“Con un nivel de significación del 5% puede aceptarse que 𝝁 = 𝟓𝟓 y 𝝈𝟐 = 𝟒.”

3
ESTADÍSTICA BÁSICA
SEMESTRE 2015-II
PRÁCTICA 4
JUEVES, 22 DE OCTUBRE DE 2015

Nombre:___________________________________________________________________________
Sección:___________________
DEBES ENTREGAR ESTA HOJA, JUNTO CON EL CUADERNILLO, CON LAS RESPUESTAS DE LA PREGUNTA 2

1. A partir de dos observaciones 𝑋₁ y 𝑋₂ extraídas aleatoriamente de una población 𝑋 de media 𝜇 y


varianza 𝜎² = 1, se proponen los siguientes estimadores de 𝜇:

𝑋1 + 2𝑋2 𝑋1 + 4𝑋2
𝜇̂ 1 = 𝑦 𝜇̂ 2 = .
3 6

a) Halla el sesgo de cada estimador. (1p)


b) Halla la varianza de cada estimador. (1p)
c) ¿Cuál es mejor de los dos? Justifica la respuesta. (1p)
d) Un analista propone estimar 𝜇 promediando los dos estimadores anteriores. ¿Es mejor que
ellos? (2p)

SOLUCIÓN

a) Sesgo(𝜇̂ ) = 𝐸(𝜇̂ ) − 𝜇. Para cada estimador tenemos:


𝑋1 + 2𝑋2 1
𝐸(𝜇̂ 1 ) = 𝐸 � � = (𝜇 + 2𝜇) = 𝜇 .
3 3
𝑋1 + 4𝑋2 1 5
𝐸(𝜇̂ 2 ) = 𝐸 � � = (𝜇 + 4𝜇) = 𝜇 .
6 6 6

Sesgo(𝜇̂ 1 ) = 𝜇 − 𝜇 = 0 ⇒ Insesgado
5 1
Sesgo(𝜇̂ 2 ) = 𝜇 − 𝜇 = − 𝜇 = −0.17𝜇 ⇒ Sesgado
6 6

b) Para cada estimador tenemos, aplicando que 𝑋1 y 𝑋2 son independientes:

𝑋1 + 2𝑋2 1 5
Var(𝜇̂ 1 ) = Var � � = (𝜎 2 + 4𝜎 2 ) = 𝜎 2 = 0.56
3 9 9
𝑋1 + 4𝑋2 1 2 17 2
Var(𝜇̂ 2 ) = Var � �= (𝜎 + 16𝜎 2 ) = 𝜎 = 0.47
6 36 36
Tiene menor varianza 𝜇̂ 2 .

c) El mejor será el de menor error cuadrático medio. ECM(𝜇̂ ) = sesgo(𝜇̂ )2 + Var(𝜇̂ ). Para cada
estimador se tiene

𝐸𝐸𝐸(𝜇̂ 1 ) = 0.56

𝐸𝐸𝐸(𝜇̂ 2 ) = 0.028𝜇2 + 0.47

Vemos que el estimador de menor ECM depende del valor 𝜇. Si fuese muy bajo, compensaría el
estimador sesgado; pero si es alto, sería mejor el insesgado. El estimador 𝜇̂ 2 es mejor que 𝜇̂ 1 si

00.028𝜇2 + 0.470.56 < 0.56 ⇒ 𝜇2 < 3.2 ⇒ |𝜇| < 1.8

1
d) Compararemos los ECM respectivos. Si promediamos ambos estimadores tenemos el estimador

1 1 3𝑋1 + 8𝑋2
𝜇̂ 3 = 𝜇̂ 1 + 𝜇̂ 2 =
2 2 12

con

3𝑋1 + 8𝑋2 11
𝐸(𝜇̂ 3 ) = 𝐸 � �= 𝜇 = 0.92𝜇
12 12

⇒ sesgo(𝜇̂ 3 ) = 0.92𝜇 − 𝜇 = −0.08𝜇

3𝑋1 + 8𝑋2 9 + 64 2
Var (𝜇̂ 3 ) = Var � �= 𝜎 = 0.51
12 144

En sesgo y varianza se coloca entre los dos anteriores. El ECM es

𝐸𝐸𝐸(𝜇̂ 3 ) = 0.0064𝜇2 + 0.51

De nuevo, dependiendo del valor de 𝜇 así es la posición relativa de este nuevo estimador. Este
estimador será mejor que 𝜇̂ 1 si

0.0064𝜇2 + 0.51 < 0.56 ⇒ 𝜇2 < 7.8 ⇒ |𝜇| < 2.8

Y será mejor que 𝜇̂ 2 si

0.0064𝜇2 + 0.51 < 0.028𝜇2 + 0.47 ⇒ 𝜇2 > 6.25 ⇒ |𝜇| > 2.5

Por tanto, es el mejor sólo en un rango muy estrecho. No tiene ventajas claras.

2
2. Sea X una variable aleatoria de media 𝜇 y varianza 𝜎², y sea 𝑥1 , … , 𝑥100 una muestra aleatoria de dicha
variable. Decir si las siguientes afirmaciones son verdaderas (V) o falsas (F). Contesta en la tabla
siguiente. No necesitas justificar. Respuesta correcta +0.8, incorrecta -0.5.

1 Como la muestra es grande, 𝑋 será una normal por el teorema del límite central. F

2 La media muestral tiene una varianza que es sólo la centésima parte de la varianza de X. V

3 El intervalo de confianza de 𝜇 deberá estar centrado en 𝜇. F

4 El margen de error del intervalo de confianza de 𝜇 depende de 𝜎. V

5 Como la muestra es grande, la varianza de la muestra 𝑠𝑥2 será un estimador insesgado. F

El 95% de los intervalos de confianza de 𝜇, con 𝛼 = 0.05, que se obtengan con V


6
diferentes muestras contendrá el valor de 𝜇.

Dado un nivel de confianza, un intervalo de confianza más amplio implicará una menor
7 F
incertidumbre sobre el valor de 𝜇.

Si 𝜎 2 = 100 y queremos que el margen de error de estimar 𝜇 con 𝛼 = 0.05 sea de 1, F


8
entonces habrá que tomar al menos 100 datos.

Cuanto mayor sea el nivel de confianza de un intervalo de confianza de 𝜇 menor será su F


9
margen de error.

Si 𝜎 2 = 100 , los diferentes valores de 𝑋� que se obtengan de diferentes muestras F


10
estarán en el intervalo {𝜇 ± 2} con una probabilidad del 97.7%.

SOLUCIÓN

1. Falso. La distribución de 𝑋 no depende de cómo se muestree de ella.


2. Verdadero. 𝑉𝑉𝑉(𝑋�) = 𝜎 2 ⁄𝑛 = 𝜎 2 /100.
3. Falso. Está centrado en 𝑋�.
4. Verdadero. El margen de error es 𝐿 = 𝑧𝛼⁄2 𝜎/√𝑛 .
5. Falso. 𝑆𝑥2 es siempre sesgado .
6. Verdadero. Esa es la definición del intervalo de confianza.
7. Falso. A mayor amplitud, mayor incertidumbre sobre 𝜇.
8. Falso.
𝑧𝛼⁄2 𝜎 2 1.96 × 10 2
𝑛=� � =� � ≈ 385.
𝐿 1
9. Falso. La amplitud es dos veces el margen de error. A mayor amplitud mayor margen de error.
10. Falso. El intervalo sería {𝜇 ± 2.27}
𝜎2 𝑧𝛼⁄2 𝜎 𝑧𝛼⁄2 𝜎
𝑋� ∼ 𝑁 �𝜇, � ⇒ 𝑃 �𝜇 − < 𝑋� < 𝜇 + � = 1 − 𝛼.
𝑛 √𝑛 √𝑛
Si 1 − 𝛼 = 0.977 ⇒ 𝛼 = 0.023 ⇒ 𝛼 ⁄2 = 0.0115 ⇒ 1 − 𝛼 ⁄2 = 0.9885 ⇒ 𝑧𝛼⁄2 ≈ 2.27 (ver
tabla), y con 𝜎 2 = 100 se tiene que

2.27 × 10 2.27 × 10
𝑃 �𝜇 − < 𝑋� < 𝜇 + � = 𝑃(𝜇 − 2.27 < 𝑋� < 𝜇 + 2.27) = 0.977.
√100 √100

3
3. La denominada distribución de Erlang tiene la siguiente función de densidad:
(𝜆𝜆)𝑘−1
𝑓(𝑥) = 𝜆𝑒 −𝜆𝜆 ; 𝑘, 𝜆, 𝑥 > 0
(𝑘 − 1)!

con 𝜇 = 𝐸(𝑋) = 𝑘/𝜆 y 𝜎 2 =Var(𝑋) = 𝑘/𝜆2 . Contesta de forma razonada a las siguientes preguntas:

a) Obtén los estimadores de 𝜆 y 𝑘 utilizando el método de los momentos. (2p)


b) Se tiene la siguiente muestra de esta población: 1, 5, 3, 4, 6. Con ella, obtén estimaciones de 𝜇 y
𝜎 2 empleando estimadores insesgados. (1p)
c) ¿Sería válido el intervalo de confianza para 𝜇 visto en clase con estos datos? (1p)
d) Utilizando la fórmula vista en clase, calcula el tamaño muestral necesario para construir un
intervalo de confianza para 𝜇 del 95% de confianza, con margen de error de 𝐿 = 0.2. (2p)
e) ¿Sería válido el intervalo de confianza usando el tamaño muestral del punto anterior? (1p)

SOLUCIÓN

a) A partir de 𝐸(𝑋) y Var(𝑋) despejamos 𝜆 y 𝑘.


𝑘
𝐸(𝑋) = ⇒ 𝑘 = 𝜆𝜆(𝑋)
𝜆
𝑘
𝑉𝑉𝑉(𝑋) = 2 ⇒ 𝑘 = 𝜆2 𝑉𝑉𝑉(𝑋)
𝜆
𝜆𝜆(𝑋) 𝐸(𝑋) 𝐸(𝑋)2
⇒ 2 =1⇒𝜆= ⇒𝑘=
𝜆 𝑉𝑉𝑉(𝑋) 𝑉𝑉𝑉(𝑋) 𝑉𝑉𝑉(𝑋)
Los estimadores se obtienen reemplazando 𝐸(𝑋) y 𝑉𝑉𝑉(𝑋) por 𝑋� y 𝑆̂ 2 . Por tanto
𝑋�
𝜆̂ = 2
𝑆̂
𝑋� 2
𝑘� = 2
𝑆̂

b) El estimador insesgado de 𝜇 es la media muestral, y de 𝜎 2 la cuasivarianza. Se obtiene:


𝑥̅ = 3.8; 𝑠̂ 2 = 3.7

(Las estimaciones de los parámetros de la Erlang que se consiguen con estas estimaciones son
𝜆̂ = 1.03, y 𝑘� = 3.9)
c) No sería válido, pues la población no es normal, y el tamaño muestral es pequeño. No podemos
garantizar que 𝑋� sea normal, que es la condición en la que se basa el intervalo de confianza para
𝜇.
d) El cálculo del tamaño muestral necesita de una estimación de 𝜎, que será la obtenida en un
apartado anterior.
𝑧𝛼⁄2 𝜎� 2 1.96 × 1.924 2
𝑛=� � =� � ≈ 356
𝐿 0.2
e) Con n=356 se tiene un tamaño muestral suficientemente grande para considerar que 𝑋� sea
normal. El intervalo de confianza sería válido.

4
ESTADÍSTICA BÁSICA
SEMESTRE 2016-I
SUSTITUTORIO
MIÉRCOLES, 13 DE JULIO DE 2016

Nombre:___________________________________________________________________________
Sección:___________________
No se puede consultar ningún tipo de documentación salvo las tablas y el formulario que se entrega. 𝜶 = 𝟎. 𝟎𝟎.
LAS PREGUNTAS 1 Y 2 HAN DE RESPONDERSE EXCLUSIVAMENTE EN LA HOJA DE ENUNCIADOS, QUE DEBE ENTREGARSE

1. El departamento comercial de una empresa dedicada a la venta de ropa por catálogo ha hecho un estudio para estimar las
ventas realizadas (V), en cientos de euros. Para ello se han recogido datos durante 300 días de las siguientes variables:
número de líneas telefónicas abiertas para pedidos (L), número de catálogos enviados por correo durante la semana
anterior(C) y el Día de la semana (D) en el que se realizó la venta (D=1: fin de semana, D=0: de lunes a viernes). En la
siguiente tabla presentamos el resultado de dicho estudio.

Utilizando la información brindada, indique la verdad (V) o falsedad (F) de las siguientes afirmaciones, y justifique
brevemente su respuesta. (1 p por enunciado)

V/F Enunciado y justificación

El modelo de regresión asume dos hipótesis: (1) que existe linealidad entre las ventas y las
variables L, C y D, y (2) que las variables L, C y D se distribuyen normalmente.

F La hipótesis (2) no es correcta. El modelo de regresión asume la normalidad de los residuos,


no de las variables explicativas.

Solo el número de catálogos enviados es significativo para estimar las ventas.

F
El número de catálogos no es significativo, porque su p-valor es mayor que 0.05 (nivel de
significación).

Si abrimos una línea telefónica adicional, manteniendo constante el número de catálogos


enviados y el día de la semana, las ventas medias aumentan en 500 euros.

V La variable L es significativa porque su p-valor es menor que 0.05. Su coeficiente es 5, por lo


que se concluye que las ventas medias aumentarán en 500 euros por cada unidad adicional
de la variable L (línea telefónica adicional).

En los fines de semana las ventas medias aumentan en promedio 300 euros, cuando las
demás variables se mantienen constantes.

V La variable D es significativa porque su p-valor es menor que 0.05. Su coeficiente es 3, por lo


que se concluye que las ventas medias aumentarán en 300 cuando tome el valor de 1 (fin de
semana).

1
LAS PREGUNTAS 1 Y 2 HAN DE RESPONDERSE EXCLUSIVAMENTE EN LA HOJA DE ENUNCIADOS

2. Se ha realizado un estudio sobre el uso de la biblioteca por los estudiantes de una Universidad. Para ello, se cuenta
con la siguiente información histórica:
• El tiempo (horas), A, que un estudiante usuario utiliza la sala de lectura en un día sigue una distribución
desconocida con media 2.3 y varianza 1.21.
• El 67% de los alumnos utilizan el servicio de la Biblioteca al menos dos veces por semana.
• El tiempo (días), B, que un profesor usuario tiene en su poder un libro de la Biblioteca es una variable aleatoria
normal de media 3.1 y desviación estándar 0.8.

Se encuestó a 111 estudiantes y 20 profesores, y de esta encuesta se tienen los siguientes datos:
• El tiempo diario (horas) que un estudiante usa la sala de lectura es de 2.15 y su varianza es 1.4.
• 50 estudiantes utilizan el servicio de Biblioteca al menos dos veces por semana.
• El tiempo (días) que los profesores usuarios tienen en su poder un libro prestado de Biblioteca tiene una media
de 2.7 y cuasivarianza 0.618.

Con base en la información brindada, complete la tabla de la siguiente manera:


- Escriba las hipótesis nula y alternativa.
- Indique el valor del estadístico de contraste.
- Realice el gráfico del contraste, señalando las regiones de aceptación y rechazo, y ubique el estadístico de
contraste.
- Indique el p-valor y marque si se acepta o se rechaza la hipótesis nula.

De no ser posible calcular el p-valor, escriba “NP”. (1.5 p cada contraste).

2
3. El sistema que se muestra en la figura está formado por los dispositivos, C1 a C5. Los dispositivos fallan
de manera independiente, siendo la probabilidad de fallo de cada uno de ellos la misma e igual a 0.05. El
sistema funciona siempre que haya conexión entre los puntos A y B. Se pide:

a. Calcula la probabilidad de que el subsistema formado por C1, C2, y C3 funcione. (2p)
b. Calcula la probabilidad de que el sistema completo funcione. (1p)
c. Si sabemos que el sistema funciona, calcula la probabilidad de que C4 funcione. (1p)

SOLUCIÓN:
a. Vamos llamar 𝐶𝑖 al suceso ‘El componente Ci funciona’, y 𝐶𝑖𝑖𝑖… al suceso ‘el subsistema formado
por los componentes Ci, Cj Ck,… funciona. Nos piden calcular 𝑃(𝐶123 ) , que será:
𝑃(𝐶123 ) = 𝑃�(𝐶1 ∪ 𝐶2 ) ∩ 𝐶3 � = 𝑃(𝐶1 ∪ 𝐶2 )𝑃(𝐶3 ) = �1 − 𝑃(𝐶1̅ )𝑃(𝐶2̅ )�𝑃(𝐶3 )
= �1 − 0.05(0.05)�0.95 = 0.9476

b. La probabilidad de que el sistema completo funcione es


𝑃(𝐶12345 ) = 𝑃(𝐶1234 )𝑃(𝐶5 ) = �1 − 𝑃(𝐶4̅ )𝑃(𝐶123
̅ )�𝑃(𝐶5 )
= �1 − 0.05(1 − 0.9476)�0.95 = 0.9475

c. La probabilidad de que C4 funcione sabiendo que el sistema funcione es, aplicando el teorema de
Bayes
𝑃(𝐶12345|𝐶4 )𝑃(𝐶4 ) 𝑃(𝐶12345|𝐶4 )0.95
𝑃(𝐶4 |𝐶12345 ) = =
𝑃(𝐶12345 ) 0.9475
Si C4 funciona, no importa si el subsistema C123 funciona o no. El sistema funcionará sólo si
funciona C5. Es decir 𝑃(𝐶12345 |𝐶4) = 𝑃(𝐶5 ). Este mismo resultado se obtiene si en los cálculo de la
sección b utilizamos que 𝑃(𝐶4 ) = 1 y 𝑃(𝐶4̅ ) = 0. Se tiene entonces que
𝑃(𝐶12345|𝐶4 ) = �1 − 𝑃(𝐶4̅ )𝑃(𝐶123
̅ )�𝑃(𝐶5 )
= �1 − 0 × 𝑃(𝐶123̅ )�𝑃(𝐶5 ) = 𝑃(𝐶5 ) = 0.95.
Se tiene entonces que
0.95(0.95)
𝑃(𝐶4 |𝐶12345) = = 0.9525
0.9475

3
4. Dado el siguiente gráfico de dispersión, indica de forma
breve pero razonada:
a. Qué transformación podría hacerse a la variable x
para conseguir una relación lineal. (1p)
b. Qué transformación podría hacerse a la variable y
para conseguir una relación lineal. (1p)

SOLUCIÓN:

a. Hay que usar una transformación que expanda, en


sentido horizontal, los números más grandes, en
mayor medida que los pequeños. Esto se consigue
con transformaciones del tipo ℎ(𝑥) = 𝑥 𝑐 con 𝑐 > 1.

b. En este caso, también hay que usar una


transformación que expanda, en sentido vertical, los
números más grandes, en mayor medida que a los
pequeños. Esto se consigue con transformaciones del
tipo ℎ(𝑦) = 𝑦 𝑐 con 𝑐 > 1.

4
5. El número de llamadas que recibe una central telefónica sigue una distribución de Poisson con media 10
llamadas/hora.
a. Suponga que el servicio ha comenzado a operar a las 8:00 horas. Cuál es la probabilidad de que la
primera llamada ocurra antes de las 8:10? (2p)
b. ¿Cuál es la probabilidad de que a las 8:15 aún no hayan recibió ninguna llamada. (1p)
c. ¿Cuál es la probabilidad de que en una jornada de 8 horas reciban más de 100 llamadas? (1p)

SOLUCIÓN:

a. Sea 𝑋 =número de llamadas que se reciben en una hora, con 𝑋 ∼ Poi(𝜆 = 10). Entonces, la variable
aleatoria 𝑇 = tiempo (en horas) entre llamadas será una exponencial 𝑇 ∼ 𝐸𝐸𝐸(𝜆 = 10 ). Debido a la
ausencia de memoria del proceso de Poisson, el intervalo desde un instante dado hasta que se
observa el siguiente suceso será también una exponencial. Por tanto, el tiempo desde que comienza
el servicio hasta que llega un cliente es una exponencial. En minutos será 𝑇𝑚 ∼ 𝐸𝐸𝐸(𝜆𝑚 =
0.167 llamadas/minuto). El que la primera llamada ocurra antes de los 10 minutos tendrá la
siguiente probabilidad:
𝑃(𝑇𝑚 < 10) = 1 − 𝑒 −𝜆𝑚×10 = 1 − 𝑒 −0.1667×10 = 1 − 𝑒 −1.667 = 0.8112.

b. La probabilidad de que la siguiente llamada demore más de 15 minutos es


𝑃(𝑇𝑚 > 15) = 𝑒 −𝜆𝑚×15 = 𝑒 −0.1667×15 = 0.0820.

c. Denotemos 𝑋𝑑 =número de llamadas en 8 horas. Entonces, por la propiedad de aditividad de la


Poisson, 𝑋𝑑 ∼ Poi(𝜆𝑑 = 80 llamadas/dia). Para calcular 𝑃(𝑋𝑑 > 100) haremos uso del Teorema del
Limite Central: como 𝜆𝑑 es muy elevado se puede aproximar 𝑋𝑑 a una normal. Por tanto 𝑋𝑑 ∼
𝑁(80,80). De esta forma
100 − 80
𝑃(𝑋𝑑 > 100) = 𝑃 �𝑧 > � = 𝑃(𝑧 > 2.24)
√80
= 1 − 𝑃(𝑧 ≤ 2.24) = 1 − 0.9875 = 0.0125.

5
ESTADÍSTICA BÁSICA
SEMESTRE 2016-I
EXAMEN FINAL
LUNES, 4 DE JULIO DE 2016
Nombre:___________________________________________________________________________
Sección:___________________
Sólo se permiten las tablas y formulario que se entregan con el examen. 𝛼 = 0.05
LOS PROBLEMAS 2 Y 3 DEBEN ENTREGARSE EN UN CUADERNILLO DIFERENTE AL PROBLEMA 1

1. La Universidad de Piura ha realizado la migración del sistema de mensajería a la plataforma Office 365, de
Microsoft. Sin embargo, el área de Tecnologías de Información ha detectado que las herramientas ofrecidas
por dicha plataforma no están siendo aprovechadas eficientemente. Para ello, se realizó un estudio con el fin
de medir tres aspectos importantes: (1) porcentaje de trabajadores que usan el sistema de comunicación
interna, (2) número de horas que un trabajador invierte en el envío de mensajes a través del correo
electrónico, y (3) número de días a la semana en que un alumno accede a su cuenta de Pregrado.

Por información histórica se conoce lo siguiente:


• El 65% de trabajadores ha venido usando el sistema informático de comunicación interna (chat),
pero se espera que dicho porcentaje aumente con la campaña de difusión que se hizo del nuevo
sistema de mensajería Skype For Business.
• Antes de la migración a la nueva plataforma, el tiempo invertido por un trabajador en enviar
mensajes por correo electrónico se distribuía normalmente con media 2.5 y varianza 0.5.
• No se cuenta con información respecto a la frecuencia de acceso (número de días a la semana) de un
alumno de Pregrado a su cuenta de correo electrónico.

El estudio sobre el nuevo sistema se llevó a cabo en colaboración con los alumnos de Estadística, realizándose
81 encuestas a trabajadores y 110 encuestas a alumnos de Pregrado. Algunos de los resultados se muestran a
continuación:

Tabla 1. Número de trabajadores que usan el sistema Tabla 3. Número de días a la semana (de 7 días) que
de comunicación interna (Resultado de la encuesta). un alumno accede a su cuenta de correo electrónico
de Pregrado (Resultado de la encuesta)
Respuesta Frecuencia
Número de
Sí usa 47 Frecuencia
días
No usa 34 0 5
1 15
Tabla 2. Estadísticas descriptivas de la muestra de la
variable tiempo de uso del correo electrónico por un
2 24
trabajador (Resultado de la encuesta). 3 30
4 23
Parámetro Valor 5 10
Media 2.71 6 2
Cuasidesviación 7 1
0.85
estándar

En base a estos datos, se le pide responder las siguientes cuestiones:

a) ¿Se puede afirmar que la campaña de difusión de Skype For Business ha aumentado el uso del sistema
de comunicación interna en los trabajadores? 2p.
b) A partir de los datos de la encuesta, elabore un intervalo de confianza para el número medio de horas
que un trabajador invierte en usar el correo electrónico con el nuevo sistema. 1p.
c) En base a dicho intervalo (apartado b), ¿es posible afirmar que la media ha cambiado respecto al
sistema anterior? Fundamente brevemente su respuesta. 2p.
d) ¿Cuántas encuestas se deben realizar como mínimo para reducir a la mitad el margen de error del
intervalo de confianza calculado en el apartado b? 1p.
e) Un analista considera que el número de días de la semana que un alumno accede a su cuenta de correo
puede modelizarse como una binomial. A la vista de los datos de la encuesta ¿es aceptable la hipótesis
de este analista? 4p.

1
SOLUCIÓN:

a) (2p) Como 𝑛𝑝̂ (1 − 𝑝̂ ) = 19.73 > 5 podemos usar la aproximación a la normal para la proporción
muestral. Se realiza un contraste de hipótesis unilateral, para el cual se establecen las siguientes
hipótesis:
𝐻0 : 𝑝 ≤ 0.65
𝐻1 : 𝑝 > 0.65

𝑝̂ = 0.5802
𝑞� = 0.4198
𝑝𝑝
𝑝̂ ~ 𝑁 �𝑝, �
𝑛
→ 𝑝̂ ~ 𝑁 (0.65, 0.0028)

0.5802 − 0.65
𝑧= ≈ −1.32
√0.0028
1.65

Como -1.32 < 1.65 se acepta la hipótesis nula, y por tanto que la proporción no ha aumentado, es
decir, que la campaña no ha sido efectiva. De hecho, como p� = 0.5802 ≤ 0.65, está del lado de la
hipótesis nula, y por tanto no habría hecho falta realizar ningún cálculo adicional para concluir que
aceptamos H0 . Sólo se va a rechazar H0 si los datos hacen lo que dice H1 ( es decir, si p� > 0.65) de
forma muy marcada.

b) (1 p) Como n > 30, se puede considerar a la muestra como grande y utilizar que 𝑥̅ se distribuye como
una normal, que es en lo que se fundamenta el intervalo de confianza para 𝜇 en muestras grandes.
0.85
𝐼𝐼 (0.95): 𝜇 ∈ 2.71 ± 1.96 = [2.5249, 2.8951]
√81
Otras alternativas válidas: usando la varianza poblacional, pues no se ha demostrado (aún) que la
varianza haya cambiado, o usando la t de Student.
0.7071
𝐼𝐼 (0.95): 𝜇 ∈ 2.71 ± 1.96 = [2.5560, 2.8640]
√81
0.85
𝐼𝐼 (0.95): 𝜇 ∈ 2.71 ± 1.99 = [2.5221, 2.8979]
√81

c) (2p) Un intervalo de confianza de nivel de confianza 1 − 𝛼 es equivalente a un contraste bilateral de


nivel de significación 𝛼, de manera que los valores del interior del intervalo son valores de 𝐻0 que no se
pueden rechazar. En nuestro caso, el valor 2.5 se encuentra fuera del intervalo de confianza. Por lo
tanto, rehazamos 𝐻0 y consideramos que, con un nivel de significación del 5% la media ha cambiado.
(1 p por procedimiento con contraste de hipótesis completo, se pidió evaluar “en base al intervalo”).

d) (1 p) Se tiene que reducir a la mitad el margen de error L:

0.85
𝐿 = 1.96 = 0.1851
√81
El nuevo margen de error debe ser:

0.1851
𝐿′ = = 0.0926
2
El nuevo tamaño muestral debe ser:
1.96 × 0.85 2
𝑛= � � ≈ 324 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
0.0926

2
1.96 ×0.7071 2 1.99 ×0.85 2
Otras alternativas válidas: 𝑛 = � � ≈ 325 𝑒𝑒𝑒𝑒𝑒𝑒𝑒͊𝑎𝑎 ; 𝑛 = � � ≈ 324 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
0.0940 0.0770

e) La variable aleatoria que nos ocupa es 𝑋 =número de días de la semana (de 7 días) que un alumno
consulta el correo electrónico. Se tiene que 𝑋 = 0,1,2,3,4,5,6,7. Se pide realizar una prueba de bondad
de ajuste binomial, es decir, se quiere contrastar a partir de una muestra si
𝑋 ∼ 𝐵(𝑛 = 7, 𝑝)
El contraste es:
𝐻0 : 𝑋 ~ 𝐵 (7, 𝑝)
𝐻1 : 𝑋 ≁ 𝐵 (7, 𝑝)

Para realizar el contraste, se tiene una muestra de 110 individuos, cada uno estudiado como una
semana en la que se pueden ingresar de 0 a 7 días por semana al correo Pregrado. En primer lugar, se
estima el parámetro p:

0 × 5 + 1 × 15 + 2 × 24 + 3 × 30 + 4 × 23 + 5 × 10 + 6 × 2 + 7 × 1
µ� = = 2.8545
110

2.8545
µ� = np� → 𝑝̂ = = 0.4078 (1p)
7

(3p) El resto del procedimiento se ha calificado de acuerdo al valor de p calculado en cada caso.
A continuación, se realiza la prueba ji-cuadrado:
Factor
X Oi p(x) Ei Clase Oi Ei (𝑶𝒊 − 𝑬𝒊 )𝟐
𝑬𝒊
0 5 0.0255 2.81
[0-1] 20 16.3538 0.8129
1 15 0.1231 13.54
2 24 27.9801 0.5661
2 24 0.2544 27.98
3 30 32.1126 0.1389
3 30 0.2919 32.11
4 23 0.2010 22.11 4 23 22.1134 0.0356
5 10 0.0831 9.14 [5-7] 13 11.4401 0.2127
6 2 0.0191 2.10 5
7 1 0.0019 0.21 2
(𝑶𝒊 − 𝑬𝒊 )𝟐
𝑋 = � = 1.7663
𝑬𝒊
1
Como no todas las frecuencias esperadas son mayores
que 5, se agrupan las clases.

Número de grados de libertad: 𝑔 = 𝑘 – 𝑣 – 1 = 5 – 1 – 1 = 3 𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙. El valor crítico es


2
𝜒(3;0.05) = 7.81 . Finalmente, como 𝑋 2 es menor que 7.81, se acepta, con 𝛼 = 0.05, la hipótesis nula; es
decir, que los datos se distribuyen como una binomial 𝐵 (7, 0.4078).

3
2. Se tienen datos de un conjunto de alumnos de cierta asignatura del pasado semestre. En este curso, que
cuenta con dos secciones, se encuentran alumnos que pertenecen a 3 programas académicos diferentes.
Para cada alumno se tiene la siguiente información:

• SecBin: sección de la asignatura en la que está matriculado. 0: sección A, 1: sección B.


• IA: índice acumulado (nota media de las asignaturas cursadas por el alumno).
• Vez: número de veces que se ha matriculado en esta asignatura: 1,2,3,...
• ProgAc: programa académico en el que está matriculado: 1, 2 ó 3.
• P1: binaria. Vale 1 si el alumno pertenece al programa académico 1 y 0 en caso contrario.
• P2: binaria. Similar a P1 pero para el programa académico 2.
• P3: binaria. Similar a P1 y P2 pero para el programa académico 3.

A continuación se proporcionan los resultados de Minitab para un conjunto de modelos.

1-Análisis de regresión: IA vs. SecBin 2-Análisis de regresión: IA vs. ProgAc

Predictor Coef SE Coef T P Predictor Coef SE Coef T P


Constante 11,6990 0,1573 74,39 0,000 Constante 11,4465 0,2801 40,87 0,000
SecBin -0,6235 0,2224 -2,80 0,006 ProgAc -0,0337 0,1458 -0,23 0,817
3-Análisis de regresión: IA vs. P1; P3 4-Análisis de regresión: IA vs. Vez

Predictor Coef SE Coef T P Predictor Coef SE Coef T P


Constante 11,0202 0,4075 27,04 0,000 Constante 12,5920 0,2813 44,76 0,000
P1 0,4829 0,4682 1,67 0,198 Vez -1,0006 0,2009 -4,63 0,000
P3 0,9147 0,5261 1,74 0,036
Para cada una de las siguientes cuestiones, contesta si es verdadera o falsa, justificando la respuesta. (6p)

a) No hay diferencias significativas entre el IA de cada sección.


b) En la sección A tienen un IA medio de 11,6990.
c) No hay diferencias significativas en el IA de los distintos programas académicos.
d) El programa académico 3 es el que tiene mayor IA medio.
e) El programa académico 2 tiene un IA significativamente menor que el 1.
f) Por término medio los alumnos que se matriculan por primera vez en esta asignatura tienen un
punto de IA menos que los que lo hacen por segunda o tercera vez.

SOLUCIÓN:

a) FALSO. El modelo 1 tiene como variable explicativa SecBin, que es binaria. Cuando SecBin=0, el modelo
proporciona el IA medio de la sección A, que resulta ser 𝛽̂0 = 11.699. Cuando SecBin=1, e modelo
proporciona la media para la sección B, que resulta ser 𝛽̂0 + 𝛽̂1 = 11.699 − 0.6235 = 11.0755. El pvalor
del coeficiente 𝛽̂1 , correspondiente a la variable binaria SecBin es 0.006, que es muy bajo. Por lo tanto
rechazamos la 𝐻0 : 𝛽1 = 0. Por tanto, hay diferencias significativas en el IA medio de cada sección. Por
término medio, los alumnos de la sección B (SecBin=1) tienen 0.6235 puntos menos de IA. La diferencia es
lo suficientemente grande como para pensar que se deba al azar del muestreo.

b) VERDADERO. El IA de la sección A corresponde al caso SecBin=0, por lo que el resultado de la regresión,


que proporciona el valor medio de la variable respuesta, es 11.699.
• Valor medio cuando SecBin=0: 𝐼𝐼 ���0 = 𝐸� (𝐼𝐼|SecBin = 0) = 𝛽̂0 + 𝛽̂1 × 0 = 𝛽̂0 = 11.699
• Valor medio cuando SecBin=1: 𝐼𝐼 ���1 = 𝐸� (𝐼𝐼|SecBin = 1) = 𝛽̂0 + 𝛽̂1 × 1 = 𝛽̂0 + 𝛽̂1 =
11.699 − 0.6235 = 11.0755

c) FALSO. La regresión 3 tiene las variables binarias P1 y P3, y no tiene P2. Por tanto, el término constante
nos proporciona la media del grupo P2, mientras que los otros coeficientes nos muestran las diferencias
en la media de IA de los programas 1 y 3, respectivamente, respecto del programa 2. El pvalor del

4
coeficiente de P3 en la regresión 3 es muy bajo (0.036 < 0.05), por lo que hay diferencias significativas
entre el IA medio del programa académico 3 y el del programa académico 2. La diferencia es de casi un
punto a favor del programa 3. (La regresión 2 no es interpretable, pues la variable ProgAc es cualitativa. La
regresión 2 no tiene sentido).

d) VERDADERO. La media de cada programa académico dentro de la muestra analizada es:


• Programa académico 1: P1=1, P3=0
���𝑃1 = 11.0202 + 0.4829 × 1 + 0.9147 × 0 = 11.5031.
𝐼𝐼
• Programa académico 2: P1=0, P3=0
���𝑃2 = 11.0202 + 0.4829 × 0 + 0.9147 × 0 = 11.0202.
𝐼𝐼
• Programa académico 3: P1=0, P3=1
���𝑃3 = 11.0202 + 0.4829 × 0 + 0.9147 × 1 = 11.9349.
𝐼𝐼
Por tanto, en esta muestra, la media muestral del IA del programa académico 3 es la mayor.

e) FALSO. En la regresión 3, la diferencia entre el IA medio de los programas 1 y 2 no es significativa, pues el


pvalor de la variable P1 es muy alto (0.198 > 0.05). Por tanto, la diferencia de 0.4829 que se ha
encontrado en la muestra no es significativa, y puede explicarse por el azar del muestreo. No es
extrapolable a toda la población.

f) FALSO. Según el modelo 4, cada vez que se repite, el IA medio tiende a bajar un punto, y no a subir. Los
que repiten una vez tienen un punto menos, y los que repiten dos veces, dos puntos menos en el IA medio
respecto de los que se matriculan por primera vez.

3. Un proceso productivo consta de dos etapas, cuyas duraciones respectivas, X1 y X2 , son variables
aleatorias independientes, distribuidas según un modelo exponencial de parámetros λ y 2λ,
respectivamente. Es decir, X1 ∼ Exp(λ), X2 ∼ Exp(2λ). La duración total del proceso puede entonces
escribirse como la variable aleatoria T = X1 + X 2 . Se tiene una muestra de los tiempos totales T que se
invirtió en la fabricación de 5 artículos: t1 = 12; t 2 = 8; t 3 = 9; t 4 = 19; t 5 = 11. Se pide, razonando las
respuestas:

a) Obtén el estimador de λ por el método de los momentos, basado en una muestra aleatoria simple
𝑡1 , 𝑡2 , … , 𝑡𝑛 de T.
b) Usando este estimador y los datos del enunciado, calcula la estimación de λ.

SOLUCIÓN:

a. El método de los momentos obtiene estimadores de los parámetros a partir de estimar los
momentos poblacionales con los muestrales. El primer momento poblacional de 𝑇 es:
1 1 3
𝜇 𝑇 = 𝐸(𝑇) = 𝐸(𝑋1 + 𝑋2 ) = 𝐸(𝑋1 ) + 𝐸(𝑋2 ) = + = .
𝜆 2𝜆 2𝜆
Por tanto,
3
𝜆= .
2𝜇 𝑇
El estimador será:
3 3𝑛
⇒ 𝜆̂ = = .
2𝑡̅ 2 ∑𝑛𝑖=1 𝑡𝑖

b. La estimación es
3𝑛 3×5
𝜆̂ = 𝑛 = = 0.1271
2 ∑𝑖=1 𝑡𝑖 2(12 + 8 + 9 + 19 + 11)

5
ESTADÍSTICA BÁSICA
SEMESTRE 2016-I
PARCIAL
LUNES, 2 DE MAYO DE 2016

Nombre:___________________________________________________________________________
Sección:___________________

1. Se tiene un sistema formado por 3 componentes como el de la figura. La avería de un componente es


independiente del estado de los otros componentes. El sistema funciona si entre A y B es posible
encontrar un camino de componentes que funcionen.

Las duraciones (tiempo hasta avería) de los componentes son variables aleatorias. Para los
componentes C1 y C2, la duración sigue una distribución exponencial de media 5000 horas. Para el
componente C3 es una distribución normal con la misma media y desviación típica que el
componente C1. Contesta de forma justificada a las siguientes cuestiones (6p):

a. Calcula la probabilidad de que el componente C1 dure más de 6000 horas.(0.5p)


b. Calcula la probabilidad de que el componente C3 dure más de 6000 horas. (0.5p)
c. Calcula la probabilidad de que el subsistema formado por C1 y C2 dure más de 6000 horas.(1p)
d. Calcula la probabilidad de que todo el sistema siga funcionando después de 6000 horas.(1.5p)
e. Si el sistema lleva funcionando ya 6000 horas, calcula la probabilidad de que lo siga haciendo
después de otras 6000 horas adicionales (llevaría entonces 12000 horas funcionando).(2p)
f. A la vista de estos resultados, ¿la duración de este sistema es una variable aleatoria con
memoria? Razona la respuesta. (0.5p)

SOLUCIÓN

a) Sea 𝑇𝑖 la duración de componente C𝑖. Al ser una exponencial tenemos:


1 1
𝐸(𝑇1 ) = 5000 = ⇒ 𝜆1 =
𝜆1 5000
6000
𝑃(𝑇1 > 6000) = 𝑒 −5000 = 0.301.

b) Para definir la distribución de C3 necesitamos su media y desviación típica, que son las mismas
que la de C1:
𝜇 = 𝐸(𝑇1 ) = 5000,
1
𝜎 = �𝑣𝑣𝑣(𝑇1 ) = = 5000 horas
𝜆1

Al ser una normal, calculamos la probabilidad con la tabla, para lo que necesitamos estandarizar:

6000 − 5000
𝑃(𝑇3 > 6000) = 𝑃 �𝑍 > � = 𝑃(𝑍 > 0.2)
5000
= 1 − 𝑃(𝑍 ≤ 0.20) = 1 − 0.5793 = 0.421.

1
c) Para que el subsistema formado por los componentes C1 y C2 dure más de 6000 horas basta con
que lo haga uno de ellos. O bien, el subsistema durará menos de 6000 horas si ambos
componentes duran menos de 6000 horas. Si denotamos por C12 a este subsistema y 𝑇12 a su
duración tenemos:

𝑃(𝑇12 > 6000) = 𝑃[(𝑇1 > 6000) ∪ (𝑇2 > 6000)] = 1 − 𝑃[(𝑇1 ≤ 6000) ∩ (𝑇2 ≤ 6000)]

Dado que los componentes se averían de forma independiente de los demás, y que C1 y C2 son
idénticos, tenemos que
1 − 𝑃[(𝑇1 ≤ 6000) ∩ (𝑇2 ≤ 6000)] = 1 − 𝑃(𝑇1 < 6000)2
6000 2
= 1 − �1 − 𝑒 −5000 � = 1 − (1 − 0.301)2 = 0.511.

d) Todo el sistema durará más de 6000 horas si lo hacen tanto el subsistema C12 como el
componente C3. Si denotamos por C123 a todo el sistema y 𝑇123 a su duración tenemos:

𝑃(𝑇123 > 6000) = 𝑃[(𝑇12 > 6000) ∩ (𝑇3 > 6000)]


= 𝑃(𝑇12 > 6000)𝑃(𝑇3 > 6000) = 0.511 × 0.421 = 0.215.

e) Queremos calcular ahora la probabilidad de durar otras 6000 horas, es decir,

𝑃(𝑇123 > 6000 + 6000|𝑇123 > 6000) = 𝑃(𝑇123 > 12000|𝑇123 > 6000) =
𝑃[(𝑇123 > 12000) ∩ (𝑇123 > 6000)] 𝑃(𝑇123 > 12000)
= .
𝑃(𝑇123 > 6000) 0.215

Tenemos entonces que calcular la probabilidad del numerador. Hay que realizar las mismas
operaciones que en apartados anteriores, pero reemplazando el valor 6000 por 12000.

𝑃(𝑇123 > 12000) = 𝑃(𝑇12 > 12000)𝑃(𝑇3 > 12000).

12000 2
𝑃(𝑇12 > 12000) = 1 − �1 − 𝑒 − 5000 � = 1 − (1 − 0.091)2 = 0.172
12000 − 5000
(𝑇3 > 12000) = 𝑃 �𝑍 > � = 𝑃(𝑍 > 1.4)
5000
= 1 − 𝑃(𝑍 ≤ 1.4) = 1 − 0.9192 = 0.081.

Queda entonces
𝑃(𝑇123 > 12000) = 0.172 × 0.081 = 0.014.

0.014
𝑃(𝑇123 > 12000|𝑇123 > 6000) = = 0.065.
0.215

f) Si el sistema no tuviese memoria, la probabilidad de durar un determinado tiempo no dependería


de ningún suceso anterior, es decir,
𝑃(𝑇123 > 𝑡1 + 𝑡2 |𝑇123 > 𝑡1 ) = 𝑃(𝑇123 > 𝑡2 ),

y es como si el sistema no se acordase de que lleva ya 𝑡1 horas funcionando. En nuestro caso


tenemos que
𝑃(𝑇123 > 6000 + 6000|𝑇123 > 6000) = 0.065
mientras que
𝑃(𝑇123 > 6000) = 0.215 .
Ambas probabilidades son diferentes. Por tanto, el sistema tiene memoria. La probabilidad de
durar 6000 horas más se ha visto reducida por haber estado ya funcionando 6000 horas. El
sistema está envejeciendo.

2
2. Para cada una de las afirmaciones siguientes, conteste si son verdaderas o falsas, justificando
brevemente la respuesta: (4p)

a. Sea X una variable aleatoria continua. Si P(X = 1) = 0 entonces el valor 1 no está en el


espacio muestral de X. (1p)

b. Si al realizar una regresión simple Y = β�0 + β�1 X + e resulta β�1 < 0 entonces ambas variables
X e Y no están relacionadas. (1p)

c. La mediana xm de una variable aleatoria X continua de función de distribución F(x) verifica


que F(0.5) = xm . (1p)

d. Sean A y B dos sucesos mutuamente excluyentes, entonces P(A|B) = P(B|A). (1p)

SOLUCIÓN

a. Falso, en una variable aleatoria continua cualquier punto cumple 𝑃(𝑋 = 𝑥) = 0, esté o no en
el espacio muestral de X. Para distinguir los valores que están o no en el espacio muestral hay
que consultar a la función de densidad. Los valores que estén en el espacio muestral verifican
que 𝑓(𝑥) > 0, mientras que los que no lo estén verifican que 𝑓(𝑥) = 0.

b. Falso. Si no están relacionadas se tendrá 𝛽̂1 = 0.

c. Falso, la mediana verifica que 𝐹(𝑥𝑚 ) = 0.5


d. Verdadero. Si son mutuamente excluyentes, 𝐴 ∩ 𝐵 = ∅. Entonces
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴|𝐵) = =0
𝑃(𝐵)
y lo mismo ocurrirá con 𝑃(𝐵|𝐴). Por tanto, 𝑃(𝐴|𝐵) = 𝑃(𝐵|𝐴) = 0

3. Una máquina fabrica ejes cuyos radios (cm) se distribuyen según la siguiente función de densidad:

k (x − 1)(3 − x); si x ∈ [1, 3]


f (x) = �
0 ; si x ∉ [1, 3]

Se pide, razonando la respuesta: (4p)

a. Calcular k . (0.5p)
b. Defina la función de distribución de los radios de los ejes. (1.5p)
c. Si los ejes aceptables miden entre 1.5 y 2.5, ¿qué proporción de ejes son considerados
defectuosos? (1p)
d. Calcule la longitud media de los ejes producidos. (1p)

SOLUCIÓN

3 4 3
a. ∫1 𝑘 (𝑥 − 1)(3 − 𝑥) 𝑑𝑑 = 1 ⇒ 𝑘 × =1⇒𝑘 =
3 4

b. Función de distribución de los radios de los ejes.

3
0; 𝑥 < 1
⎧ 3 𝑥3 4
𝐹(𝑥) = − � − 2𝑥 2 + 3𝑥 − � ; 1 ≤ 𝑥 ≤ 3
⎨ 4 3 3
⎩ 1; 𝑥 > 3

c. Proporción de ejes aceptables:


2.5
3
� (x − 1)(3 − x)dx = 0.6875
1.5 4
La proporción de ejes defectuosos será 1-0.6875=0.3125

d. Calcule la longitud promedio de los ejes producidos. (0.5 puntos)


3
3
� 𝑥(𝑥 − 1)(3 − 𝑥)𝑑𝑑 = 2 𝑐𝑐
1 4

4. La empresa Metales del Norte S.A.C. ha recibido quejas de algunos clientes sobre la calidad de su
producto, láminas de aluminio de 1 𝑚2 . Por el uso que se le da a las placas, los clientes aceptan un
máximo de 2 imperfecciones por placa. Con más de 2 imperfecciones se considera que la placa es
defectuosa. Las placas se producen cortando una lámina grande de aluminio, en la que luego de
estudiarse, se detecta que la aparición de defectos en su superficie es estable e independiente, con
una razón media de 50 defectos cada 10 metros cuadrados. Se pide, justificando la respuesta: (3p)
a. Calcula la probabilidad de que una placa de 1 m2 sea defectuosa. (1p)
b. Dentro de un lote de 150 placas de 1 m2 entregadas a un cliente, ¿cuántas placas defectuosas se
espera encontrar? (2p)

SOLUCIÓN

a. 𝑋: Número de defectos por placa (es decir, por 𝑚2 ). 𝑋 ~ 𝑃𝑃𝑃 (5 defectos /𝑚2 )
2
5𝑟 −5
𝑝 = 𝑃(𝑋 > 2) = 1 – 𝑃(𝑋 ≤ 2) = 1 − � 𝑒 = 0.8753
𝑟!
𝑟=0

b. Y: Número de placas defectuosas, dentro de un lote de 150 placas. 𝑌 ~ 𝐵 (150, 𝑝)

𝐸 (𝑌) = 𝑛𝑛 = 150 × 0.8753 = 𝟏𝟏𝟏. 𝟑𝟑

4
5. La nueva tienda de souvenirs de la Universidad, Udep Store, ha decidido realizar un estudio de la
afluencia de clientes a su establecimiento, llegando a las siguientes conclusiones:

- Hay tres tipos de clientes: alumnos, trabajadores de la Udep y personas externas a la Udep.
- Las llegadas de los clientes ocurren de manera estable e independiente.
- Por término medio llegan 3 alumnos cada dos horas.
- La llegada de trabajadores de la Udep ocurre con una tasa media de 1 trabajador cada dos horas.
- Llegan 2 personas externas en promedio cada 3 horas.

Considerando que se atiende 8 horas diarias, responda de forma justificada a las siguientes
cuestiones: (3p)

a. ¿Qué porcentaje de días no llega ninguna persona externa? (1p)


b. ¿Qué porcentaje de días la persona que atiende esperará más de 20 minutos, desde el inicio de
un día cualquiera, hasta ver llegar al primer cliente? (2p)

SOLUCIÓN

a. X: Número de personas externas que llegan en un día. 𝑋 ~ 𝑃𝑃𝑃 (5.33 personas/día)

5.330
𝑃 (𝑋 = 0) = × 𝑒 −5.33 = 0.005 = 0.5%
0!

b. Definimos
3
• 𝑋𝑎 : nº de alumnos por minuto. 𝑋𝑎 ∼ 𝑃𝑃𝑃(𝜆𝑎 ) donde 𝜆𝑎 = 𝑎lumnos/hora =
2
0.025 alumnos/minuto.
1
• 𝑋𝑡 : nº de trabajadores Udep por minuto. 𝑋𝑡 ∼ 𝑃𝑃𝑃(𝜆𝑡 ) donde 𝜆𝑡 =
2
trabajadores/hora = 0.0083 trabajadores/minuto.
2
• 𝑋𝑒 : nº de personas externas por minuto. 𝑋𝑎 ∼ 𝑃𝑃𝑃(𝜆𝑒 ) donde 𝜆𝑒 = personas/hora =
3
0.011 trabajadores/minuto.
• 𝑋𝑇 =nº total de clientes=𝑋𝑎 + 𝑋𝑡 + 𝑋𝑒 ∼ 𝑃𝑃𝑃(0.044 clientes/minuto)

𝑇: Tiempo en minutos entre la llegada de cada cliente. 𝑇 ~ Exp (0.044 clientes / minuto)

𝑃 (𝑇 > 20) = 𝑒 −0.044×20 = 0.41 = 417%

5
ESTADÍSTICA BÁSICA
SEMESTRE 2016-I
PRÁCTICA 5
JUEVES, 9 DE JUNIO DE 2016

Nombre:___________________________________________________________________________
Sección:___________________
Sólo se pueden usar las tablas y formulario que se suministra. 𝛼 = 0.05

1. Los datos históricos muestran que las puntuaciones de cierta asignatura de primer ciclo siguen una distribución
normal de media 11.5. En el presente curso, los alumnos de esta asignatura han aplicado técnicas de estudio
innovadoras, basadas en aprendizaje activo. Tras una evaluación, una muestra aleatoria de 20 de estos
estudiantes ha obtenido una calificación media de 12.8 y una cuasivarianza de 27.56.
a. ¿Puede afirmarse que las nuevas técnicas de estudio son eficaces? (3p)
b. Construye un intervalo de confianza para la varianza de las calificaciones.(3p)
c. Un experto sostiene la hipótesis de que, con las nuevas metodologías, los alumnos que
tradicionalmente sacan peores notas son los que obtienen mejores resultados, pues las nuevas
técnicas facilitan la concentración de estos alumnos. Como resultado, la varianza de las calificaciones
disminuirá. Si la varianza histórica de las de las calificaciones es de 30, ¿apoyan los datos esta
hipótesis?(4p)

SOLUCIÓN

a. Se quiere evaluar si 𝜇 > 11.5 o, por el contrario, 𝜇 ≤ 11.5.


Entonces
𝐻0 : 𝜇 ≤ 11.5
𝐻1 : 𝜇 > 11.5 (1p)
El estadístico de contraste vale
𝑥̅ − 𝜇0 12.8 − 11.5
𝑡= = = 1.107 (1𝑝)
𝑠̂ /√𝑛 5.25/√20
Como la población es normal, se rechaza si 𝑡 > 𝑡19;0.05 = 1.729. Como 𝑡 = 1.107 < 1.729 estamos en
la región de aceptación de 𝐻0 . No hay evidencia suficiente para afirmar que la media haya aumentado
(1p).

b. Al tratarse de una población normal, el intervalo de confianza para la varianza es


(𝑛 − 1)𝑆̂ 2 (𝑛 − 1)𝑆̂ 2 19 × 27.56 19 × 27.56 523.6 523.6
𝐼𝐼(95%): 𝜎 2 ∈ � 2 ; 2 �=� 2 ; 2 �= � ; �
𝜒𝑛−1;𝛼⁄2 𝜒𝑛−1;1−𝛼⁄2 𝜒19;0.025 𝜒19;0.975 32.85 8.91
= [15.94; 58.77]

c. Se quiere contrastar si 𝜎 2 < 30 o, por el contrario, 𝜎 2 ≥ 30 . Entonces el contraste es


H0 : σ2 ≥ 30 (ó 𝜎 2 = 30)
H1 : σ2 < 30 (1p)
(Al tratarse de un contraste unilateral, resolverlo basándose en el intervalo de confianza del apartado
anterior no es correcto).
Puesto que la población es normal, el estadístico de contraste es
(n − 1)S� 2 19 × 27.56
X02 = = = 17.45 (2𝑝)
σ20 30 Acepto H
0
y la región de rechazo estará en la cola de la izquierda de la
2 2
distribución χ19 . Con α = 0.05 el valor crítico es χ19;0.95 = 10.12 .
2
Como X0 > 10.12, estamos en la región de aceptación de H0 . Los
datos no muestran evidencia suficiente, con 𝛼 = 0.05, para asegurar χ n2−1;1−α
que la nueva metodología disminuye la varianza. (1p)

1
2. El gerente de producción de una fábrica de cubos de Rubik ha decidido realizar un estudio para conocer cómo se
distribuye el número de artículos defectuosos dentro de sus lotes de producción, de 20 unidades. Se estudiaron
85 lotes seleccionados de manera aleatoria y se obtuvieron los siguientes datos:

Número de Frecuencia
defectos observada
0 30
1 30
2 15
3 5
4 4
5 1
>5 0

¿Se puede concluir que el número de defectos por lote sigue una distribución binomial? Para las probabilidades use
4 decimales. (6 puntos)

SOLUCIÓN

Hipótesis nula y alternativa: (0.5 puntos)


Ho: El número de defectos por lote sigue una distribución binomial.
H1: El número de defectos por lote no sigue una distribución binomial.

Estimación de p: (1 punto)
En primer lugar, se estima p a partir de la muestra:
1.1294
𝜇̂ = 𝑛𝑝̂ = 1.1294 → 𝑝̂ = = 0.0565
20
Por tanto, las probabilidades se tienen que calcular con una distribución binomial con n = 20 y p = 0.0565.
Cálculo de la frecuencia esperada: (2 puntos)

Número
Frecuencia Frecuencia
de p(x)
observada esperada
defectos
0 30 0.3127 26.58
1 30 0.3743 31.81
2 15 0.2128 18.09
3 5 0.0764 6.50
4 4 0.0194 1.65
5 1 0.0037 0.32
>5 0 0.0006 0.05

Agrupación de clases y cálculo del ji-cuadrado: (1.5 puntos)

Número Factor
Frecuencia Frecuencia (𝑶𝒊− 𝑬𝒊 )2
ji - cuadrado
de ji - cuadrado
observada esperada 𝑬𝒊 crítico
defectos
0 30 26.58 0.441 1.329 5.990
1 30 31.81 0.103
2 15 18.09 0.528
>2 10 8.52 0.258
Se consideran 2 grados de libertad.

2
(Si se consideran agrupaciones con frecuencia esperada de <=3

Número
Frecuencia Frecuencia ji - cuadrado
de Factor ji - cuadrado
observada esperada crítico
defectos
0 30 26.58 0.441 5.800 7.81
1 30 31.81 0.103
2 15 18.09 0.528
3 5 6.50 0.344
>3 5 2.02 4.384
Se considera una ji-cuadrado de 5-2=3 grados de libertad.

Conclusión de la prueba: (1 punto)


Aceptamos Ho: El número de defectos se ajusta a una distribución binomial B (20, 0.06)

3. Los alumnos que ingresaron a la Facultad de Ingeniería han sido clasificados en 4 grupos, según su nivel socio-
económico, tal como se indica:

A B C D
12 20 31 33

Investigue si los alumnos ingresantes a la Facultad pertenecen indistintamente a los distintos niveles. (4 puntos)

SOLUCIÓN:

Hipótesis nula y alternativa: (0.5 puntos)


Ho: El número de alumnos por nivel sigue una distribución uniforme discreta.
H1: El número de alumnos por nivel no sigue una distribución uniforme discreta.

Prueba de bondad de ajuste: (2.5 puntos)

Factor ji -
Frecuencia Frecuencia ji -
p(x) (𝑶𝒊− 𝑬𝒊 )2 cuadrado
observada esperada cuadrado
𝑬𝒊 crítico
A 12 0.25 24 6 12.083 7.81
B 20 0.25 24 0.66666667
C 31 0.25 24 2.04166667
D 33 0.25 24 3.375
Se considera una ji-cuadrado de 4-1=3 grados de libertad
Conclusión de la prueba: (1 punto)
Rechazamos Ho: La distribución no es uniforme

3
ESTADÍSTICA BÁSICA
SEMESTRE 2016-I
PRACTICA 4
JUEVES, 26 DE MAYO DE 2016

Nombre:___________________________________________________________________________
Sección:___________________
Sólo se pueden consultar las tablas y el formulario que se suministran con el examen. Use 𝜶 = 𝟎. 𝟎𝟎.

1. Analizando todas las evaluaciones de una asignatura en todos los años anteriores, se observa que los alumnos han obtenido
una nota media de 11.8 con varianza 1.2, siendo la tasa de aprobados del 75%. Se desea saber si el presente curso supone
una continuidad en cuanto a estos resultados, o ha cambiado algo. Con este fin, se toma una muestra aleatoria de 30
estudiantes del presente curso, obteniéndose una nota media muestral de 12.2 con varianza muestral 2, y siendo el número
de aprobados en esta muestra igual a 20 alumnos. A continuación se enuncian un conjunto de hipótesis sobre los valores
poblacionales de las calificaciones de esta asignatura. Escribe en términos estadísticos, la hipótesis nula y alternativa que
corresponden con cada una de estas hipótesis. (respuesta correcta +0.5).(5p)

Hipótesis H0 H1
Ejemplo: La nota media poblacional es ahora 12 𝜇 = 12 𝜇 ≠ 12

La nota media ha disminuido respecto a su valor histórico. 𝜇 ≥ 11.8 𝜇 < 11.8

La nota media no ha cambiado respecto a su valor histórico. 𝜇 = 11.8 𝜇 ≠ 11.8

La nota media ha aumentado respecto a su valor histórico. 𝜇 ≤ 11.8 𝜇 > 11.8

Se mantiene la proporción de aprobados 𝑝 = 0.75 𝑝 ≠ 0.75

La proporción de aprobados ha descendido 𝑝 ≥ 0.75 𝑝 < 0.75

2. Sea 𝑋 una variable aleatoria de media 𝜇 y varianza 𝜎 2 . Para estimar la media 𝜇 se promedian los valores de 20
datos, consiguiéndose la media muestral 𝑥̅(1) . Posteriormente, se consigue un dato adicional, 𝑥21 . Un analista
decide entonces construir un nuevo estimador de 𝜇 promediando ambos valores de la forma
𝑥̅(1) + 𝑥21
𝜇̂ 1 = .
2
a) ¿Es este estimador insesgado? Justifica la respuesta (2p).
b) Compara el error cuadrático medio de este estimador con otro, 𝜇̂ 2 , que sea la media aritmética de los
21 datos. ¿Cuál es preferible? Justifica la respuesta. (3p)

SOLUCIÓN:
a) Es insesgado
𝑥̅(1) + 𝑥21 𝐸(𝑥̅(1) ) + 𝐸(𝑥21 ) 𝜇 + 𝜇
𝐸(𝜇̂ 1 ) = 𝐸 � �= = =𝜇
2 2 2

b) El error cuadrático medio de un estimador es ECM=sesgo2 +varianza. Como 𝜇̂ 1 es insesgado, su ECM


será su varianza:
1 𝜎2 21 2
𝐸𝐸𝑀1 = 𝑣𝑣𝑣(𝜇̂ 1 ) = � + 𝜎 2 � = 𝜎 = 0.2625𝜎 2 .
4 20 80
Por otra parte, al ser 𝜇̂ 2 la media aritmética, también es insesgado. Su ECM será también su varianza:
𝜎2 1 2
𝐸𝐸𝑀2 = = 𝜎 = 0.0476𝜎 2 ,
𝑛 + 1 21
que es menor que 𝐸𝐸𝑀1 , por lo que el estimador 𝜇̂ 2 es preferible.

1
3. Se desea saber el gasto medio anual de un estudiante en fotocopias. Con ese fin se analiza una muestra de 100
personas y se obtiene una media muestral de 210 y cuasidesviación típica 20.
a) Determina un intervalo de confianza del 95% para el gasto medio en fotocopias en la población.
Interpreta su significado. Justifica la respuesta. (2p)
b) ¿Qué tamaño muestral sería necesario para reducir a la mitad el margen de error de ese intervalo? (3p)

SOLUCIÓN
a) Como tenemos una muestra grande, el intervalo de confianza viene dado, por 𝑋 ± 𝑧𝛼/2 𝑠̂ /√𝑛 . Por
tanto
20
𝐼𝐼(0.95): 𝜇 ∈ �210 ± 1.96 × � = [206.08,213.92]
10

Tenemos una confianza del 95% de que la media poblacional estará dentro de este intervalo.

b) El margen de error 𝐿 del intervalo viene dado por 𝑧𝛼/2 𝜎/√𝑛 . Con la información de la muestra de 100
personas es igual, estimando 𝜎 con 𝑠̂ , a 1.96(20/10) . Para reducirlo a la mitad necesitamos
1.96(20/20) y por tanto 20 = √𝑛 lo cual implica 𝑛 = 400 personas.

4. Para las elecciones presidenciales, un partido político ha contratado a una encuestadora para realizar un estudio
de la intención de voto 3 meses antes de las elecciones. El estudio, en el que se encuestó a 1500 personas, dio
como resultado que el 35% de los electores votarán por dicho partido.
a) Elabore el intervalo de confianza para el porcentaje de votantes que elegirán a ese partido. Justifique la
respuesta. (2p)
b) Dos meses antes de las elecciones, en una nueva encuesta, 570 de las 1750 personas encuestadas
afirmaron que votarían por el partido. ¿Se podría concluir que la intención de voto por el partido es
inferior al 35%? (3p)

SOLUCIÓN
a) Como 𝑛𝑝̂ (1 − 𝑝̂ ) = 1500 × 0.35 × 0.65 = 341 > 5 podemos usar la aproximación a la normal para la
proporción muestral.

De acuerdo a esta aproximación, el intervalo de confianza es

0.35 × 0.65
𝐼𝐼 (0.95): 𝑝 ∈ 0.35 ± 1.96 � = [0.3259, 0.3741]
1500
b) La nueva encuesta dice que 𝑝̂ = 0.3257. Queremos realizar el siguiente contraste de hipótesis
unilateral:
𝐻0 : 𝑝 ≥ 0.35
𝐻1 : 𝑝 < 0.35

Como 𝑛𝑝̂ (1 − 𝑝̂ ) = 1750 × 0.33 × 0.67 =


386.9 > 5, podemos basar el contraste en la
aproximación de 𝑝̂ a la normal. Entonces:

𝑝̂ − 𝑝0 0.3257 − 0.35
𝑍0 = = = −2.13 < −1.64 → Rechaza la hipótesis nula
�𝑝0 𝑞0�𝑛 �0.35 × 0.65�1750

La diferencia entre el valor 𝑝̂ observado y 𝑝0 es significativa. Se puede concluir con un nivel de


significación del 5% que la proporción de votantes que desean elegir al partido es inferior al 35%.

2
ESTADÍSTICA BÁSICA
SEMESTRE 2016-II
SUSTITUTORIO
SÁBADO, 10 DE DICIEMBRE DE 2016

Nombre:___________________________________________________________________________
Sección:___________________
Sólo pueden utilizarse las tablas y formulario que se proporcionan. JUSTIFICA TODAS TUS RESPUESTAS. Utiliza 𝜶 = 𝟎. 𝟎𝟓.

 Para solicitar reclamo de esta evaluación, es necesario anexar esta solución impresa, señalando
en ella aquellos puntos sobre los que se realiza el reclamo.
 Todo reclamo debe estar correctamente fundamentado en relación a este solucionario.
 Sólo podrán proceder aquellos reclamos que se basen en discordancias objetivas entre el criterio
señalado en este solucionario y el aplicado a la evaluación.
 No procederán aquellos reclamos que se basen en desacuerdos sobre los criterios de valoración
que se han empleado en el solucionario, y que son competencia de los profesores de la
asignatura.

1. (4p) Un periódico español publicó la siguiente noticia acerca de los salarios anuales de los españoles:

Según los datos que maneja el Ministerio de Economía, el 34% de los 19,3 millones de asalariados que hay en
España cobra menos de 10.000 euros anuales, aunque el porcentaje se eleva al 66% si se tienen también en
cuenta los ciudadanos que cobran hasta 20.000 euros. Las personas con rentas salariales de entre 20.000 y
30.000 euros ascienden a 1,6 millones. En cambio, solo 7.000 contribuyentes declaran cobrar más de 600.000
euros, mientras que 16.000 ciudadanos perciben rentas de entre 300.000 euros y 600.000 euros.

a) Construye una tabla de frecuencias agrupadas de la distribución de salarios anuales. En la tabla, incluye
frecuencias absolutas, frecuencias relativas y frecuencias relativas acumuladas. (1p)

b) ¿Cómo es la asimetría de esta distribución? Justifica tu respuesta. (1p)

c) Elegimos un ciudadano al azar y le preguntamos si su salario anual es superior a 30.000 euros, a lo que
responde afirmativamente. ¿Cuál es la probabilidad de que este ciudadano sea uno de los 7000 que gana
más de 600.000 al año? (1p)

d) Elegimos un ciudadano al azar y le preguntamos si su salario es superior a 30.000 euros, a lo que responde
negativamente. ¿Cuál es la probabilidad de que este ciudadano gane más de 10.000 euros? (1p)

SOLUCIÓN

a) La siguiente tabla resume los datos del recorte de prensa. En negrita se muestran los datos proporcionados
en el enunciado. El resto de cifras se obtienen con cálculos sencillos.

Fr. relativa
Intervalo Fr. absoluta Fr. relativa
acum.
1 <10000 6.562.000 34,00% 34,00%
2 10.000-20.000 6.176.000 32,00% 66,00%
3 20.000-30.000 1.600.000 8,29% 74,29%
4 30.000-300.000 4.939.000 25,59% 99,88%
5 300.000-600.000 16.000 0,0829% 99,96%
6 >600.000 7.000 0,0363% 100,00%
total 19.300.000 100%
b) La asimetría es positiva. Puede verse haciendo un diagrama de barras con la columna de frecuencias
relativas. Las barras tienen un área aproximadamente proporcional a la frecuencia relativa.

También puede verse en que la distancia desde el mínimo a la mediana es de 20000, mientras que de la
mediana al percentil 99 es de casi 600000.

c) Sea 𝑋 el salario de esta persona. Se desea calcular 𝑃(𝑋 > 600.000|𝑋 > 30.000). Aplicando probabilidad
condicionada:
𝑃((𝑋 > 600.000) ∪ 𝑋(> 30.000))
𝑃(𝑋 > 600.000|𝑋 > 30.000) =
𝑃(𝑋 > 30.000)
𝑃(𝑋 > 600.000) 0,00036
= = = 0.0014
𝑃(𝑋 > 30.000) 1 − 0.7429
d) Se desea calcular 𝑃(𝑋 > 10.000|𝑋 > 30.000). Aplicando probabilidad condicionada:
𝑃((𝑋 > 10.000) ∪ (𝑋 < 30.000))
𝑃(𝑋 > 10.000|𝑋 < 30.000) =
𝑃(𝑋 < 30.000)
𝑃(𝑋 < 30.000) − 𝑃(𝑋 < 10.000) 0,7429 − 0,34
= = = 0.5423.
𝑃(𝑋 < 30.000) 0,7429
2. (8p) Sea 𝑇𝑖 el tiempo que invierte el viajero i-ésimo en el mostrador de facturación del
aeropuerto antes de embarcar. 𝑇𝑖 es una variable aleatoria normal de media 5 minutos
y varianza 2. Asumiremos que el tiempo invertido en cada viajero es independiente de
los demás. Contesta de forma razonada las siguientes cuestiones.

a) ¿Cuál es la probabilidad de que se atienda a un viajero en menos de 4 minutos? (1p)

b) ¿Cuál es la probabilidad de que ese mostrador pueda atender a 20 viajeros en


menos de una hora? (2p)

c) Tras atender a 25 clientes, se ha registrado un tiempo medio de atención de 4.5 minutos, con una
cuasivarianza de 0.9. ¿Podemos decir que han cambiado media y varianza respecto a los valores
poblacionales iniciales? (4p)

d) ¿Cómo cambiaría la respuesta a la pregunta anterior si el tiempo de atención no se distribuyese como una
normal? Razona tu respuesta. (1p)

SOLUCIÓN

a) 𝑇𝑖 ∼ 𝑁(5, 𝜎 2 = 2)
4−5
⇒ 𝑃(𝑇𝑖 < 4) = 𝑃 (𝑍 <) = 𝑃(𝑍 < −0.71) = 0.2389
√2
b) Al ser el tiempo para cada viajero variables normales independientes se tiene que el tiempo 𝑇 que se tarda en
atender 20 viajeros verifica que
𝑇 = 𝑇1 + 𝑇2 + ⋯ + 𝑇20
⇒ 𝐸(𝑇) = 𝐸(𝑇1 + 𝑇2 + ⋯ + 𝑇20 ) = 20×5 = 100
Asimismo, al ser los tiempos 𝑇𝑖 independientes:
𝑉𝑎𝑟(𝑇) = 𝑉𝑎𝑟(𝑇1 + 𝑇2 + ⋯ + 𝑇20 ) = 20×𝑉𝑎𝑟(𝑇𝑖 ) = 40
⇒ 𝑇 ∼ 𝑁(100; 40)(1.5𝑝)

60 − 100
⇒ 𝑃(𝑇 < 60) = 𝑃 (𝑍 < ) = 𝑃(𝑍 < −6.32) ≈ 0. (0.5𝑝)
√40

Es prácticamente imposible atender a los 20 en sólo una hora.

c) Como no estamos seguros de que los parámetros poblacionales se mantienen, basaremos los contrastes en las
estimaciones disponibles.

Veamos en primer lugar si ha cambado la media. El contraste será (0.5p):


𝐻0 : 𝜇 = 5
𝐻1 : 𝜇 ≠ 5
El estadístico de contraste es, si suponemos que la varianza poblacional podría también haber cambiado,
𝑋̅ − 𝜇
𝑡0 = ,
𝑆̂⁄
√𝑛
Con la información de nuestra muestra, este estadístico toma el valor
4.5 − 5
𝑡0 = = −2.635. (0.5𝑝)
√ 0.9
25

Como la población de la que procede la muestra es una normal, y


utilizamos en el estadístico la cuasidesviación típica, la distribución de
referencia de este estadístico 𝑡0 es 𝑡24 . (0.25p)

(Si tuviésemos la seguridad de que la varianza poblacional no ha cambiado, deberíamos usar el estadístico
𝑋̅ − 𝜇
𝑧0 = 𝜎
⁄ 𝑛

y la distribución de referencia sería entonces la N(0,1) y no 𝑡𝑛−1 , aunque la muestra sea pequeña. Con muestras pequeñas
no es correcto usar la N(0,1) para el estadístico 𝑡0 . Si la muestra procede de una normal, la distribución 𝑡𝑛−1 es siempre la
adecuada para 𝑡0 para cualquier tamaño muestral)
Se trata de un contraste a dos colas, por lo que rechazamos la hipótesis nula si |𝑡0 | > 𝑡24;0.025 = 2.064. (0.25p)
Como |𝑡0 | = 2.635 > 2.064 nos encontramos en la región de rechazo.

Rechazamos, con 𝛼 = 0.05, la hipótesis nula de que la media no ha variado. Los datos muestran suficiente
evidencia del cambio en la media. La diferencia encontrada entre 𝑥̅ = 4.5 y 𝜇 = 5 es significativa, y es muy
improbable que se deba al azar del muestreo. (0.5p)

Veamos ahora si ha cambiado la varianza. El contraste es (0.5p):


𝐻0 : 𝜎 2 = 2
𝐻1 : 𝜎 2 ≠ 2
El estadístico de contraste es
(𝑛 − 1)𝑆̂ 2
𝑋02 = .
2

Con la información de la muestra se tiene


24×0.9
𝑥02 = = 10.8 (0.5𝑝)
2

Al ser la población normal, la distribución de referencia es


2
la 𝜒24 (para cualquier tamaño muestral). (0.25p)

Como 𝐻1 : 𝜎 2 ≠ 2 la región de aceptación es (0.25)


2 2
𝜒24;0.975 ≤ 𝑋0 ≤ 𝜒24;0.025
12.40 ≤ 𝑋0 ≤ 39.36

El test es, por tanto, bilateral a dos colas, como en el caso


de la media.

Como 𝑋0 = 10.8, estamos en la región de rechazo de 𝐻0 .


Hay suficiente evidencia para rechazar 𝐻0 , y podemos asumir, con 𝛼 = 0.05, que la varianza poblacional ha
cambiado, y que la discrepancia que se observa entre 𝑠̂ 2 y 𝜎 2 es significativa; es decir, NO se debe al azar del
muestreo. (0.5p)

d) Si la población de la que procede nuestra muestra no es normal no sabríamos realizar estos contrastes con lo
que se ha cubierto en la asignatura.

Al ser el tamaño muestral pequeño, la distribución del estadístico 𝑡0 usado en el contraste de medias depende
de cómo es la población, no se puede utilizar la aproximación a la normal estándar, y la distribución 𝑡𝑛−1 ya no
es aplicable. En el caso del estadístico 𝑋02 sólo se ha estudiado en este curso su distribución bajo normalidad de
2
la población, y que resulta ser una 𝜒𝑛−1 .
3. Un estudiante del curso de Estadística realiza una pasantía en el área Logística de una importante empresa de
servicios. Por sus conocimientos en la materia, decide analizar la calidad de un producto que la empresa
adquiere como insumo a un proveedor local. Para ello, toma una muestra de 1500 cajas, donde cada una de
las cuales contiene 7 artículos, y contabiliza cuántos artículos defectuosos hay en cada caja. De dicha muestra
obtiene los siguientes datos:
Número de artículos
Número de cajas
defectuosos
0 11
1 139
2 300
3 448
4 355
5 189
6 48
7 10

El estudiante considera que el número de artículos defectuosos en cada paquete sigue una distribución
binomial. Con base en los datos de la tabla, ¿es acertada esta afirmación? Justifica la respuesta.(4p)

SOLUCIÓN:
Se pide realizar una prueba de bondad de ajuste a la binomial. Se tiene una muestra de 1500 lotes, cada uno
conteniendo 7 artículos.

Las hipótesis son (0.25 p) 𝐻0 : 𝑋 ~ 𝐵 (7, 𝑝)


𝐻1 : 𝑋 ≁ 𝐵 (7, 𝑝)

En primer lugar, se estima el parámetro p:

0×11 + 1×139 + 2×300 + 3×448 + 4×355 + 5×189 + 6×48 + 7×10


𝜇̂ = 𝑥̅ = = 3.204
1500

3.204
𝜇̂ = 𝑛𝑝̂ → 𝑝̂ = = 0.4577 (1𝑝)
7
Si se tiene una estimación incorrecta de p, se pierde también el punto del cálculo de la columna p(x).

Factor (0.25 p)
x Oi p(x) (1 p) Ei (0.5 p) (𝑶𝒊 − 𝑬𝒊 )𝟐 𝜒2
𝑬𝒊
0 11 0.0138 20.69 4.54 10.48
1 139 0.0815 122.22 2.30
2 300 0.2063 309.49 0.29
3 448 0.2902 435.37 0.37
4 355 0.2450 367.47 0.42
5 189 0.1241 186.10 0.05
6 48 0.0349 52.36 0.36
7 10 0.0042 6.31 2.15

Número de grados de libertad: 𝑔 = 𝑘 – 𝑣 – 1 = 8 – 1 – 1 = 6 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 (0.25 p)



𝜒 2 6,0.05 = 12.59 (0.25 p)

Finalmente, como 𝜒 2 es menor que 10.48, se acepta la hipótesis nula, es decir que los datos se distribuyen como
una binomial B (7, 0.4577). (0.5 p)
4. (4p) La distribución de la figura pertenece a una familia de distribuciones
denominada de Pareto. Se suele utilizar en economía para modelizar la
renta de una población donde hay una renta mínima. Su función de
densidad es
𝛼
𝑓(𝑥) = 𝛼+1 , 𝑥 ≥ 1.
𝑥

Se tiene una muestra de esta distribución: (1.24, 1.36, 1.30, 1.53, 1.63,
1.94). A partir de esta muestra estima el parámetro 𝛼 utilizando el método
de los momentos y calcula la probabilidad de que 𝑋 > 2. (4p)

SOLUCIÓN:

Calculamos 𝜇 = 𝐸(𝑋) y relacionamos su media con el parámetro 𝛼.


∞ ∞
𝛼 1 ∞ 𝛼 𝛼
𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥 = ∫ 𝛼𝑥 −𝛼 𝑑𝑥 = [ 𝛼−1 ] = (0 − 1) =
1−𝛼 𝑥 1 1−𝛼 𝛼−1
1 1
𝜇
⇒𝛼= (2𝑝)
𝜇−1
Por tanto, el estimador será
𝑋̅
𝛼̂ = . (0.5𝑝)
𝑋̅ − 1
Con la muestra disponible se tiene:
1.24 + ⋯ + 1.94
𝑥̅ = = 1.5
6
1.5
⇒ 𝛼̂ = = 3. (0.5𝑝)
1.5 − 1

La probabilidad que se pide es (1p):



3 1
𝑃(𝑋 > 2) = ∫ 4
𝑑𝑥 = = 0.125
𝑥 8
2
ESTADÍSTICA BÁSICA
SEMESTRE 2016-II
PRÁCTICA 5
VIERNES, 2 DE DICIEMBRE DE 2016

Nombre:___________________________________________________________________________
Sección:___________________
Sólo pueden utilizarse las tablas y formulario que se proporcionan. JUSTIFICA TODAS TUS RESPUESTAS. Utiliza 𝜶 = 𝟎. 𝟎𝟓.
DEBES ENTREGAR ESTA HOJA CON LA RESPUESTS DEL PROBLEMA 1

Para solicitar los reclamos para el examen final, es necesario anexar la solución impresa,
señalando en ella aquellos puntos en los que se realiza el reclamo. Todo reclamo debe estar
correctamente fundamentado en relación a este solucionario

1. Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una muestra aleatoria simple de una población 𝑋 de media 𝜇0 y varianza 𝜎02 , y cuya media
muestral es 𝑋̅0 y la cuasivarianza 𝑆̂02 . Responde si las siguientes afirmaciones son verdaderas (V) o falsas (F).
CONTESTA SÓLO EN LA TABLA SIGUIENTE. No necesitas justificar. Respuesta correcta +1, incorrecta -1.
Máxima puntuación para esta pregunta: 7 puntos.

1.1 𝑆̂02 es un estimador insesgado de 𝜎02 . V

1.2
Si queremos contrastar si la media poblacional ha aumentado usaremos 𝐻0 : 𝜇 ≥ 𝜇0 frente a F
𝐻1 : 𝜇 < 𝜇0 .

Si queremos contrastar que la varianza de la población ha aumentado usaremos 𝐻0 : 𝑆̂ 2 ≤ 𝑆̂02 F


1.3
frente a 𝐻1 : 𝑆̂ 2 > 𝑆̂02 .

1.4
Si queremos contrastar que la media poblacional no ha cambiado usaremos 𝐻0 : 𝜇 = 𝜇0 frente a V
𝐻1 : 𝜇 ≠ 𝜇0 .

1.5 Si 𝑋 es normal, entonces la distribución de 𝑋̅ en el muestreo es 𝑡𝑛−1 . F

Si 𝜎02 = 1, necesitaremos más de 384 datos para estimar un intervalo de confianza para 𝜇0 con V
1.6
un margen de error de 0.1.

1.7 El estadístico 𝑋̅ ∗ = (𝑋1 + 𝑋𝑛 )/2 es un estimador insesgado de 𝜇0 . V

1.8 ̅ − 𝜇0 )⁄𝜎0
Si 𝑋 ∼ 𝑁(𝜇0 ; 𝜎02 ) entonces (𝑋 ∼ 𝑁(0,1). F

1.9 Si rechazamos 𝐻0 : 𝜇 = 𝜇0 con 𝛼 = 0.01 también se va a rechazar con 𝛼 = 0.05. V

1.10
Sea 𝑝 el pvalor del contraste con 𝐻0 : 𝜇 ≥ 𝜇0 obtenido a partir de la información de una muestra. V
Entonces, el pvalor del contraste con 𝐻0 : 𝜇 ≤ 𝜇0 con la misma muestra será 1 − 𝑝.

SOLUCIÓN

1.1. Verdadero. Esa es la principal característica de la cuasivarianza.

1.2. Falso, será 𝐻0 : 𝜇 ≤ 𝜇0 frente a 𝐻1 : 𝜇 > 𝜇0 .


1.3. Falso, será 𝐻0 : 𝜎 2 ≤ 𝜎02 frente a 𝐻1 : 𝜎 2 > 𝜎02.

1.4. Verdadero.

1.5. Falso, será también normal, al ser una combinación lineal de los elementos de la muestra, que serán
normales idénticas a 𝑋.

1.6. Verdadero. Para ese tamaño muestra se puede aplicar que


𝑧0.025 𝜎0 2 1.96 × 1 2
𝑛=( ) =( ) = 384.16 ≈ 385,
𝐿 0.1
pues 𝑛 ha de ser entero, pero no menor que 384.16.

1.7. Verdadero
𝑋1 + 𝑋𝑛 𝐸(𝑋1 ) + 𝐸(𝑋2 ) 𝜇0 + 𝜇0
𝐸( )= = = 𝜇0
2 2 2

1.8. Falso. La distribución de la media muestral de una población normal es


𝜎02
𝑋̅ ∼ 𝑁 (𝜇0 ; )
𝑛
por tanto, el estadístico que sigue la normal estándar será
𝑋̅ − 𝜇0
𝜎0 ∼ 𝑁(0,1)

√𝑛
1.9. Verdadero, si con con 𝛼 = 0.01 estamos en la región de rechazo, al agrandar ésta hasta con 𝛼 = 0.05
seguiremos en la región de rechazo.

1.10. Verdadero. La región de rechazo con 𝐻0 : 𝜇 ≥ 𝜇0 , 𝐻1 : 𝜇 < 𝜇0 , está en la cola de la izquierda, por lo que el pvalor
será el área a la izquierda del estadístico de contraste. Por otra parte, con 𝐻0 : 𝜇 ≤ 𝜇0 , 𝐻1 : 𝜇 > 𝜇0 , está a la derecha,
y el pvalor será el área a la derecha del estadístico de contraste.
2. Se han utilizado dos tipos de anzuelo para la pesca de peces en un lago. El anzuelo tipo
1 tiene un señuelo de vinilo que imita a un pequeño pez (ver figura). El anzuelo tipo 2
utiliza un señuelo orgánico consistente en una bola de masilla a base de maíz y harina
de pescado. Durante 10 días se probaron ambos tipos de anzuelo en cierto intervalo
horario (de 8 a 11 am). Para ello, se utilizaron dos cañas de forma simultánea, cada
una con un tipo de anzuelo, y situadas a una distancia de 5 metros una de la otra. De
esta forma, las diferencias en el número de capturas con una u otra caña se atribuirán
al tipo de anzuelo. La siguiente tabla muestra el número de capturas diarias que se consiguieron con cada tipo de
anzuelo. Se considera que constituyen una muestra aleatoria de sus respectivas poblaciones. Dada la forma en que
se han recogido, estos datos forman un conjunto de datos apareados o emparejados. Asumiremos que el número
de capturas diarias con cada tipo de anzuelo puede aproximarse a una normal.

Día
Anzuelo 1 2 3 4 5 6 7 8 9 10 ̅
𝒙 𝒔̂
Tipo 1 6 7 1 4 2 6 2 5 9 2 4.4 2.6
Tipo 2 7 8 3 5 3 8 6 7 9 1 5.7 2.6
Tabla 1: Capturas diarias de 8 a 11 am.

Se pide:

a) Construye un intervalo de confianza para el número medio de capturas diarias, en el intervalo horario de 8
a 11 am, con el anzuelo tipo 1. (2p)
b) Contrasta la hipótesis de que la varianza del número de peces que se pesca con el anzuelo del tipo 2 es
menor que 9. (2p)
c) Contrasta la hipótesis de que con el anzuelo tipo 2 se pescan, por término medio, más peces que con el
anzuelo del tipo 1. (2p)

SOLUCIÓN

a) Se desea construir un intervalo de confianza de una media poblacional, 𝜇1 , basado en la media muestral, 𝑥̅1 , de 10
observaciones. El tamaño muestral es muy pequeño, por lo que las propiedades estadísticas de 𝑥̅1 , en las que se
basa el intervalo, dependen de la distribución de la población. Como nos dicen que la población es normal, podemos
utilizar el intervalo de confianza basado en la t de Student, que es una distribución a la medida del tamaño muestral.
Por tanto
𝑠̂1 2.6
𝐼𝐶(0.95) 𝜇1 ∈ {𝑥̅1 ± 𝑡9;0.025 } = {4.4 ± 2.262 } = {4.4 ± 1.86} = (2.54 ; 6.26)
√𝑛 √10

• Como usamos la cuasidesviación típica 𝑠̂1 y la muestra es pequeña, no es correcto usar 𝑧0.025 .(−1p)
• El uso de la 𝑡𝑛−1 no es porque la muestra sea pequeña, sino porque la muestra procede de una normal. Si se usa 𝑡𝑛−1 pero
no se justifica por la normalidad de la población: −0.25
• El tamaño muestral no es el número total de peces capturados (ese es un error grave) sino el número de datos que se
promedian en la media muestral.

b) El contraste es (0.5p)
𝐻0 : 𝜎22 ≥ 9
𝐻1 : 𝜎22 < 9.
El estadístico de contraste es
(𝑛 − 1)𝑆̂22
𝑋02 = .
9
Con la información de la muestra se tiene
9 × 2.62
𝑥02 = = 6.76 (0.5p)
9
Al ser la población normal (0.25p), la distribución de referencia es la 𝜒92 . Como 𝐻1 : 𝜎22 < 9 La región de rechazo es
2
la cola de la izquierda, por lo que rechazaremos 𝐻0 si 𝑥02 < 𝜒9;0.95 = 3.33 (0.25p). Como 𝑥02 = 6.76 > 3.33 estamos
en la región de aceptación de la hipótesis nula. No hay evidencia entonces (con 𝛼 = 0.05 ) para concluir que la
varianza sea menor de 9.
c) Estamos ante datos emparejados o apareados, por lo que la manera correcta de comparar ambos tipos de anzuelo
es calculando la diferencia diaria entre ambos, y plantear el contraste con esta diferencia

Día
Anzuelo 1 2 3 4 5 6 7 8 9 10
Tipo 1 6 7 1 4 2 6 2 5 9 2
Tipo 2 7 8 3 5 3 8 6 7 9 1 ̅𝒅
𝒙 𝒔̂𝒅
𝑑=Tipo 1-Tipo 2 -1 -1 -2 -1 -1 -2 -4 -2 0 1 -1.3 1.34

Llamemos 𝑑 =diferencia entre el número de capturas del Tipo 1 y el Tipo 2, de media poblacional 𝜇𝑑 y desviación
típica poblacional 𝜎𝑑 . Si el anzuelo Tipo 2 es, por término medio, mejor se tendrá que 𝜇1 < 𝜇2 ⇒ 𝜇1 − 𝜇2 < 0 ⇒
𝜇𝑑 < 0. El contraste será entonces:
𝐻0 : 𝜇𝑑 ≥ 0
𝐻1 : 𝜇𝑑 < 0
De los datos de las diferencias entre ambas cañas en los 10 días se tiene que 𝑥̅ = 1.3 y

(−1 − (−1.3))2 + ⋯ + (1 − (−1.3))2


𝑠̂𝑑 = √ = 1.3.
9
El estadístico de contraste es
𝑋̅𝑑
𝑡0 =
𝑠̂𝑑

√10
Con la muestra obtenida se tiene:
−1.30
𝑡0 = = −3.07.
1.33⁄
√10
Como el número de capturas de cada caña se distribuye como a una normal, su diferencia será también una normal,
al tratarse de una combinación lineal de normales. Por tanto, la distribución de referencia para 𝑡0 será 𝑡9 . La región
de recazo es la cola izquierda de la distribución, por lo que se rechaza 𝐻0 si 𝑡0 < 𝑡9;0.95 = −1.833. Como 𝑡0 = −3.16
estamos en la región de rechazo.

Hay, por tanto, suficiente evidencia para afirmar (con 𝛼 = 0.05) que el anzuelo Tipo 2 es más efectivo.

Si se ignora que los datos son emparejados y se hace un test de igualdad de medias como si fuesen muestras independientes,
estaríamos perdiendo información. Sería una solución incorrecta. El contraste sería menos sensible. No obstante, los alumnos que
hayan propuesto esta solución se les calificará con un máximo de 1 punto. El contraste sería
𝐻0 : 𝜇1 ≥ 𝜇2
𝐻1 : 𝜇1 < 𝜇2
Como las desviaciones típicas muestrales son iguales, no podremos descartar que las desviaciones típicas poblacionales son
iguales. El estadístico de contraste sería, por tanto,
𝑥̅1 − 𝑥̅2
𝑡0 =
1 1
𝑠̂ 𝑇 √ +
𝑛1 𝑛2
9×2.62 +9×2.62
donde 𝑠̂ 𝑇 = √ = 2.6. Queda entonces
18
−1.3
𝑡0 = = −1.12.
2
2.6√
10
Como las poblaciones son normales, la distribución de referencia es la 𝑡𝑛1+𝑛2−2 = 𝑡18 . La región de rechazo está en la cola de la
izquierda de esta distribución. Por tanto, rechazamos 𝐻0 si 𝑡0 << 𝑡18;0.95 = −1.734. Como 𝑡0 = −1.12 > −1.734 estamos en la
zona de aceptación. No hay evidencia suficiente para asegurar que el anzuelo 2 es mejor. En este caso no somos capaces de ver
las diferencias entre anzuelos. La razón es que las diferencias entre ambos tipos de anzuelo son menores que las diferencias entre
unos días y otros, de manera que si no analizamos la diferencias día a día (datos apareados), su efecto queda enmascarado con
la variabilidad muestral debido a los días.

3. Se tienen datos de una muestra de 𝑛 = 148 autos. Entre otras, se tienen las siguientes variables:
• ‘price’: precio, en dólares, del vehículo.
• ‘horsepower’: potencia del motor (caballos de vapor).
• ‘mpg’: millas recorridas por galón de combustible.
• ‘displace’: capacidad de los cilindros (pulgadas cúbicas).
• ‘weight’: peso del vehículo (libras).
Los autos son de origen americano (EEUU), europeo o japonés. El origen de los autos queda definido con las
siguientes variables binarias:
• ‘Origen_1’: toma valor 1 si el auto es de EEUU y 0 en caso contrario.
• ‘Origen_2’: toma valor 1 si el auto es europeo y 0 en caso contrario.
• ‘Origen_3’: toma valor 1 si el auto es japonés, y 0 en caso contrario.

Las siguientes figuras muestran el resultado de una regresión múltiple para explicar el precio de los autos.

Se pide:

a) ¿Qué puede deducirse de las dos gráficas de residuos que se muestran? Justifica brevemente la
respuesta.(1p)
b) ¿Qué variables son significativas para explicar el precio de un auto? Justifica la respuesta. (1p)
c) Interpreta los coeficientes de las variables horsepower, mpg, displace, y weight. (2p)
d) Interpreta los coeficientes de las variables Origen_1 y Origen_2. (2p)
e) Supongamos autos de EEUU con los siguientes valores: Horsepower=90; mpg=30; displace=150;
weight=2000. (1p)
o ¿Cuál es el precio medio de dichos autos?
o ¿Cuál es la varianza del precio de dichos autos?
o ¿Cuál es la probabilidad de que su precio sea superior a 5000 dólares?
SOLUCIÓN

a) El gráfico de la izquierda nos muestra que podemos asumir que los residuos proceden de una normal. No
solo están los puntos alineados en el gráfico probabilístico normal, sino que el test de normalidad tiene un
p-valor suficientemente alto. Según este test no podemos rechazar la hipótesis nula de normalidad. Esta
normalidad nos garantiza, entre otras cosas, que los p-valores de los tests de significatividad individual son
válidos.
El gráfico de la derecha, de residuos frente a valores previstos, no tiene ningún tipo de estructura evidente,
por lo que podemos asumir que el modelo lineal que plantea la regresión es correcto.

Puntuación:
o Gráfico de probabilidad normal: Normalidad de residuos: 0.50 pts.
o Gráfico de residuos vs. ajustes: Modelo de regresión correcto: 0.50 pts.

b) Utilizando sólo la información de este modelo, y usando un nivel de significación del 5%, todas las variables
menos Origen_2 son significativas. En ellas, el pvalor es inferior al 5%. Como se dijo antes, estos pvalores
son fiables si podemos asumir normalidad del termino de error del modelo de regresión.

Puntuación:
o Variables significativas: 0.50 pts.
o Justificación: 0.50 pts.

c) Nos piden interpretar los coeficientes de las variables cuantitativas:


• horsepower: para un mismo origen, consumo (mpg), cilindrada (displace) y peso (weight), los autos
que tienen un caballo de potencia adicional ven aumentado su precio en 23.15 dólares, por término
medio.
• mpg: para un mismo origen, potencia, cilindrada y peso, los autos que son capaces de recorrer una
milla más con un galón de combustible ven aumentado su precio en 125.47 dólares por término
medio.
• displace: para un mismo origen, potencia, consumo y peso, una unidad adicional de cilindrada
resulta en autos con un precio menor en 11.71 dólares por término medio.
• weigt: para un mismo origen, potencia, consumo y cilindrada (displace), un kilo más de peso implica
un coste adicional de 2.56 dólares por término medio.

Puntuación:
o Aumento o disminución por cada unidad adicional: 0.50 pts.
o Se mantienen constantes los valores de las demás variables: 0.75 pts.
o El aumento del precio es por término medio: 0.75 pts.

d) Nos piden ahora interpretar los coeficientes de las variables binarias. Estas variables tienen que ver con el
origen de los autos. Son tres orígenes, pero sólo hay dos variables binarias: la del origen 1 (EEUU) y la 2
(Europa). Se ha omitido la de origen 3 (Japón). Por tanto, los coeficientes miden la diferencia respecto el
precio medio de un auto de origen japonés.
• Origen_1. Esta variable es significativa. Para unas mismas características (potencia, consumo, peso,
cilindrada), los autos de EEUU tienen un precio de 680 dólares menos, por término medio, que los
japoneses.
• Origen_2. Esta variable no es significativa, pues su pvalor es mucho mayor que el 5%. Esta variable
no es relevante para explicar el precio. Por tanto, para autos con las mismas características, los autos
europeos cuestan lo mismo que los japoneses, por término medio.

Puntuación:
o Aumento o disminución por cada unidad adicional: 0.25 pts.
o Se mantienen constantes los valores de las demás variables: 0.50 pts.
o El aumento del precio es por término medio: 0.50 pts.
o Los coeficientes indican la diferencia respecto a los autos japoneses: 0.75 pts.
e) Para ese auto, el precio medio condicionado a los valores de las variables que se indican es, aplicando la
ecuación de regresión:
Precio medio=2687.2.

La desviación típica condicionada es la desviación típica residual: 𝑠̂ 𝑇 = 1494.93.


Varianza residual = 2234815.7049. Por tanto
5000 − 2687.2
𝑃(𝑋 > 5000) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 1.55) = 1 − 0.9394 = 0.0606.
1494.93

Puntuación:
o Precio medio: 0.25 pts.
o Varianza: 0.25 pts.
o Probabilidad: 0.50 pts.
ESTADÍSTICA BÁSICA
SEMESTRE 2016-II
PARCIAL
JUEVES, 15 DE SEPTIEMBRE DE 2016

Nombre:___________________________________________________________________________
Sección:___________________
No se puede consultar ningún tipo de documentación salvo las tablas y formulario que se entrega con el examen.

1. Indique si las siguientes afirmaciones son verdaderas o falsas, justificando la respuesta: (5p)
a. Si tenemos un grupo de 140 datos, en los que el número 3 se repite 40 veces, el −3 se repite también 40
veces, y el 0 se repite 60 veces, entonces los cuartiles son −3, 0 y 3, respectivamente. (1p)
b. Si A y B son dos sucesos equiprobables entonces 𝑃(𝐴 | 𝐵) = 𝑃(𝐵 | 𝐴). (1p)
c. Sean (𝑥𝑖 , 𝑦𝑖 ), 𝑖 = 1, … , 𝑛 un conjunto de pares de puntos de dos variables, y sean (𝑥𝑖∗ , 𝑦𝑖∗ ) esos mismos
datos pero estandarizados. Entonces, la recta de regresión simple usando los datos estandarizados es
𝑦̂𝑖∗ = 𝜌𝑥𝑖∗ , donde 𝜌 es la correlación entre 𝑥 e 𝑦 . (1p)
d. Si a un puesto de servicio llegan clientes de forma independiente y a un ritmo medio de 10 clientes por
hora, la probabilidad de que en una hora lleguen justo 5 clientes es superior al 5%, y de que lleguen más
de 18 clientes en una hora es superior al 40%. (1p)
e. Si lanzamos un dado 5 veces, la probabilidad de sacar el nº 6 dos veces es 0.16. (1p)

SOLUCIÓN:

a. Verdadero. Al tener un número par de


datos, el cuartil 𝑄2 , que es la mediana, será
el promedio de los dos datos centrales, en
posiciones 70 y 71. Ambos números son el 0,
por lo que 𝑄2 = 0. A ambos lados de la
mediana quedan 70 datos. El primer cuartil
será el dato en posición 35, que es un -3, y
el tercer cuartil el dato en posición 101, que
es un 3. Por tanto
𝑄1 = −3
𝑄2 = 0
𝑄3 = 3

b. Verdadero. A y B son equiprobables, es decir, 𝑃(𝐴) = 𝑃(𝐵). Aplicando Bayes y que 𝑃(𝐴) = 𝑃(𝐵)
tenemos
𝑃(𝐵|𝐴)𝑃(𝐴) 𝑃(𝐵|𝐴)𝑃(𝐴)
𝑃(𝐴|𝐵) = = = 𝑃(𝐵|𝐴).
𝑃(𝐵) 𝑃(𝐴)

c. Verdadero. La recta de regresión será 𝑦̂ ∗ = 𝛽̂0 + 𝛽̂1 𝑥 ∗ , donde

𝑐𝑜𝑣(𝑦 ∗ , 𝑥 ∗ )
𝛽̂1 = ,
(𝑠𝑥∗ )2
𝛽̂0 = 𝑦̅ ∗ − 𝛽̂1 𝑥̅ ∗ .

La estandarización de una variable consiste en restarle su media y dividirla por su desviación típica, es
decir,
𝑥 − 𝑥̅
𝑥∗ = ,
𝑠𝑥

de esta forma, la variable estandarizada tendrá media 0 y deviación típica 1, es decir

𝑥̅ ∗ = 0; 𝑠𝑥∗ = 1.
.Al ser (𝑥 ∗ , 𝑦 ∗ ) variables estandarizadas, tendrán media 0 y varianza 1. Por tanto

𝛽̂1 = 𝑐𝑜𝑣(𝑦 ∗ , 𝑥 ∗ )
𝛽̂0 = 0
Por otra parte, tenemos que
𝑐𝑜𝑣(𝑦 ∗ , 𝑥 ∗ )
𝜌= = 𝑐𝑜𝑣(𝑦 ∗ , 𝑥 ∗ ).
𝑠𝑦∗ 𝑠𝑥∗
Queda por tanto que
𝑦̂ ∗ = 𝜌𝑥 ∗ .

d. Falso. De acuerdo a los datos que se proporcionan, el número de clientes a la hora que llega a un puesto
de servicio será una v.a. de Poisson de media 10, es decir:
𝑋 ∼ 𝑃𝑜𝑖(𝜆 = 10).
Por tanto
𝜆5 105 −10
𝑃(𝑋 = 5) = 𝑒 −𝜆 = 𝑒 = 0.0378 < 0.05.
5! 5!

Para calcular 𝑃(𝑋 > 25) utilizamos la aproximación a la normal, al ser 𝜆 > 5. Tenemos que 𝑋 ≈
𝑁(10,10). Para usar las tablas de la N(0,1) tenemos que estandarizar.
18 − 10
𝑃(𝑋 > 25) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 2.53) = 0.0057 < 0.40.
√10

e. Verdadero. Si definimos X=nº de seises que se obtienen al lanzar un dado cinco veces, donde en cada
lanzamiento la probabilidad es 1/6 se tiene que
1
𝑋 ∼ 𝐵 (5; )
6
Por tanto
5 1 2 1 3
𝑃(𝑋 = 2) = ( ) ( ) (1 − ) = 0.1608
2 6 6
2. El sistema que se muestra en la figura
está formado por 5 dispositivos, C1 a C5.
La duración (tiempo hasta que falle) del
primer componente sigue una
distribución exponencial de media 1000
horas. Los componentes C2 a C5 son
idénticos, y la duración de cada uno de
ellos sigue una variable normal de media
1500 y desviación típica 600. Los
dispositivos fallan de manera
independiente unos de otros. El sistema
funciona siempre que haya conexión
entre los puntos A y B.
a. Calcula, para cada componente, la probabilidad de que continúe funcionando después de
trascurridas 1000 horas desde que se conectó el sistema. (2p)
b. Calcula la probabilidad de que todo el sistema esté funcionado transcurridas 1000 horas. (2p)

Supongamos ahora que el sistema lleva ya 1000 horas de funcionamiento desde que se conectó.
c. Calcula, para cada componente, la probabilidad de que continúe funcionando otras 1000 horas
adicionales. (2p)
d. Calcula ahora la probabilidad de que todo el sistema esté funcionado otras 1000 horas
adicionales. (1p)

SOLUCIÓN:

a. Vamos a denominar 𝐶𝑖 =duración del componente i. De los datos que se proporcionan se tiene que
1
𝐶1 ∼ 𝐸𝑥𝑝 ( ) ; 𝐶𝑗 ∼ 𝑁(1500,6002 ), 𝑗 = 2, … ,5.
1000

La probabilidad que se pide es 𝑃(𝐶𝑖 > 1000).

1000
𝑃(𝐶1 > 1000) = 𝑒 −1000 = 𝑒 −1 = 0.3679.
1000 − 1500
𝑃(𝐶𝑗 > 1000) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > −0.83) = 1 − 0.2033 = 0.7967.
600

b. Vamos a definir el suceso 𝑆 =el sistema dura más de 1000 horas (es decir, 𝐶12345 > 1000), y 𝐷𝑖𝑗𝑘𝑙 =el
conjunto formado por los componentes Ci,CJ… dura más de 1000 horas.

𝑃(𝑆) = 𝑃(𝐷1 ∩ 𝐷2345 ) = 𝑃(𝐷1 )𝑃(𝐷2345 ) = (0.3679)𝑃(𝐷2345 ).

Por otra parte, los componentes C2-C5 están en paralelo, por lo que fallarán antes de las 1000 horas sólo
si fallan todos los componentes antes de las 1000 horas. Tenemos entonces que

̅2345) = 1 − (1 − 0.7967)4 = 0.9983.


𝑃(𝐷2345 ) = 1 − 𝑃(𝐷

Por tanto
𝑃(𝑆) = (0.3679)(0.9983) = 0.3673.
c. La probabilidad de durar 1000 horas adicionales a las que ya se llevan consumidas es
𝑃(𝐶𝑖 > 2000 ∩ 𝐶𝑖 > 1000) 𝑃(𝐶𝑖 > 2000)
𝑃(𝐶𝑖 > 2000|𝐶𝑖 > 1000) = =
𝑃(𝐶𝑖 > 1000) 𝑃(𝐶𝑖 > 1000)
Para 𝑖 = 1:
2000
𝑃(𝐶1 > 2000) 𝑒 −1000
𝑃(𝐶1 > 2000|𝐶1 > 1000) = = 1000 = 𝑒 −1 = 0.3679.
𝑃(𝐶1 > 1000)
𝑒 − 1000

que es igual a 𝑃(𝐶1 > 1000) por la propiedad de ausencia de memoria de la exponencial. Este componente
no envejece. Para los otros componentes tenemos que
2000 − 1500
𝑃(𝐶𝑗 > 2000) 𝑃 (𝑍 > 600
)
𝑃(𝐶𝑗 > 2000|𝐶𝑗 > 1000) = =
𝑃(𝐶𝑗 > 1000) 𝑃 (𝑍 > 1000 − 1500)
600

𝑃(𝑍 > 0.83) 0.2033


= = = 0.2552.
𝑃(𝑍 > −0.83) 0.7967
0.
Este componente sí envejece, pues antes teníamos que 𝑃(𝐶𝑗 > 1000) = 0.7967.

d. Para todo el sistema tenemos:


𝑃(𝐶12345 > 2000)
𝑃(𝐶12345 > 2000|𝐶12345 > 1000) =
𝑃(𝐶12345 > 1000)

La probabilidad del denominador ya se calculó en el apartado (b). Por tanto

𝑃(𝐶12345 > 1000) = 𝑃(𝑆) = 0.3673.

La probabilidad del numerador se calcula igual que la del denominador, pero usando las probabilidades del
apartado c. Se tiene entonces que

𝑃(𝐶12345 > 2000) = 𝑃((𝐶1 > 2000) ∩ (𝐶2345 > 2000)) = 𝑃(𝐶1 > 2000)𝑃(𝐶2345 > 2000)

2000
𝑃(𝐶1 > 2000) = 𝑒 −1000 = 𝑒 −2 = 0.1353.

𝑃(𝐶2345 > 2000) = 1 − 𝑃(𝐶2345 ≤ 2000) = 1 − 𝑃(𝐶2 ≤ 2000)4 = 1 − (1 − 0.2033)4 = 0.5971.

Por tanto

𝑃(𝐶12345 > 2000) = (0.1353)(0.5971) = 0.0808.

𝑃(𝐶12345 > 2000) 0.0808


𝑃(𝐶12345 > 2000|𝐶12345 > 1000) = = = 0.2200.
𝑃(𝐶12345 > 1000) 0.3673

que es inferior a 𝑃(𝐶12345 > 1000), por lo que este sistema envejece.
3. La academia CES ofrece un curso de preparación para superar el examen de admisión de una universidad. Esta
prueba de admisión es finalmente superada por el 40% de los estudiantes presentados. Se ha podido averiguar
que el 15% de los alumnos presentados se preparó en la academia CES. Esta academia realiza un análisis sobre el
desempeño de sus estudiantes, y concluye con orgullo que el 90% de sus estudiantes había superado el examen
de admisión.
a. ¿Cuál es el porcentaje de aprobados entre los estudiantes que no se prepararon en la academia CES? (1p)
b. ¿Qué proporción de los alumnos admitidos se prepararon en la academia CES? (1p)

SOLUCIÓN:

a. Sean los siguientes sucesos, con sus correspondientes probabilidades:


 𝐶 =el alumno se prepara en la academia ⇒ 𝑃(𝐶) = 0.15 ⇒ 𝑃(𝐶̅ ) = 0.85
 𝐴 = el alumno supera el examen de admisión ⇒ 𝑃(𝐴) = 0.4

Los datos nos dicen que 𝑃(𝐴|𝐶) = 0.9 ⇒ 𝑃(𝐴̅|𝐶) = 0.1. Nos preguntan por 𝑃(𝐴|𝐶̅ ). Usando la regla de la
probabilidad total se tiene que
𝑃(𝐴) = 𝑃(𝐴|𝐶)𝑃(𝐶) + 𝑃(𝐴|𝐶̅ )𝑃(𝐶̅ )

𝑃(𝐴) − 𝑃(𝐴|𝐶)𝑃(𝐶) 0.4 − 0.9(0.15)


⇒ 𝑃(𝐴|𝐶̅ ) = = = 0.312. (31.2%)
𝑃(𝐶̅ ) 0.85

b. Nos piden ahora calcular 𝑃(𝐶|𝐴). Aplicando Bayes tenemos


𝑃(𝐴|𝐶)𝑃(𝐶) 0.9(0.15)
𝑃(𝐶|𝐴) = = = 0.338 (33.8%)
𝑃(𝐴) 0.4
4. Sea 𝑋 una variable aleatoria continua que representa la
desviación de una medida 𝐿 de cierto artículo
manufacturado respecto de su valor ideal. Su función
de densidad es 𝑓(𝑥) = 𝑘 + 𝑘𝑥 2 , 𝑥 ∈ [−2 2] . La
desviación 𝑋 es nula si 𝐿 es igual al valor ideal, será
positiva si 𝐿 es mayor al ideal, y negativa en caso
contrario (ver figura). Dadas las condiciones de
fabricación, el alejamiento del valor ideal no puede ser
superior a 2 unidades. Asumiremos que el valor de 𝑋
de un artículo es independiente de los anteriores.
Contesta a las siguientes preguntas de forma razonada:
(6p)

a. Demuestra que 𝑘 = 3/28.


b. Calcula la media, la mediana y la moda de 𝑋.
c. Un artículo se considera aceptable si −1.7 < 𝑋 < 1.9. Calcula la probabilidad de que un artículo sea
defectuoso.
d. ¿Qué proporción de artículos defectuosos lo será por ser demasiado grandes?
e. ¿Cuál es la probabilidad de que al producir 10 artículos haya más de un artículo defectuoso?
f. El ingeniero de calidad sugiere que al final del proceso de producción se añada una etapa de rectificado,
que consiste en recortar todas las piezas, reduciendo su longitud en 0.1 unidades, y así ayudar a evitar
que haya artículos demasiado grandes. ¿Qué proporción de artículos defectuosos habrá ahora? ¿Mejora
la calidad?

SOLUCIÓN

a. Para que sea función de densidad debe verificar que


2
∫ 𝑘 + 𝑘𝑥 2 𝑑𝑥 = 1
−2
2
𝑘𝑥 3 𝑘16 3
⇒ 𝑘𝑥 + | = 𝑘4 + =1⇒𝑘= .
3 −2 3 28

b. La función es una parábola. Gráficamente, es inmediato ver que la


distribución es simétrica alrededor del 0. Su media y su mediana
son, por tanto, 0. Tiene dos modas, en 2 y -2.

c. La probabilidad de que un artículo sea aceptable es

1.9
3 3 2
𝑃(artículo aceptable) = 𝑃(−1.7 < 𝑋 < 1.9) = ∫ + 𝑥 𝑑𝑥 = 0.806
−1.7 28 28
⇒ 𝑃(artículo defectuoso) = 1 − 0.806 = 0.194.

d. Nos piden la probabilidad de que un artículo defectuoso lo sea por ser demasiado grande, es decir,

𝑃(𝑑𝑒𝑚𝑎𝑠𝑖𝑎𝑑𝑜 𝑔𝑟𝑎𝑛𝑑𝑒|𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜) = 𝑃(𝑋 > 1.9|(𝑋 > 1.9) ∩ (𝑋 < −1.7))


Los artículos demasiado grandes serán los que midan más de 1.9:
2
3 3 2
𝑝(𝑑𝑒𝑚𝑎𝑠𝑖𝑎𝑑𝑜 𝑔𝑟𝑎𝑛𝑑𝑒) = 𝑃(𝑋 > 1.9) = ∫ + 𝑥 𝑑𝑥 = 0.051. (5.1%)
1.9 28 28
La probabilidad pedida es
𝑃[(𝑋 > 1.9) ∩ ((𝑋 > 1.9) ∪ (𝑋 < −1.7))]
𝑃(𝑋 > 1.9|(𝑋 > 1.9) ∪ (𝑋 < −1.7)) =
𝑃[((𝑋 > 1.9) ∪ (𝑋 < −1.7))]
𝑃(𝑋 > 1.9) 0.051
= = = 0.263 (26.3%)
𝑃[((𝑋 > 1.9) ∪ (𝑋 < −1.7))] 0.194

e. Sea Y=nº de artículos defectuosos en un lote de 𝑛 = 10, donde cada uno tiene una probabilidad de ser
defectuosos de 𝑝 = 0.194. Entonces
𝑌 ∼ 𝐵(10,0.194)
Por tanto
𝑃(𝑌 > 1) = 1 − 𝑃(𝑌 ≤ 1) = 1 − 𝑃(𝑌 = 0) − 𝑃(𝑌 = 1)
10 10
= 1 − ( ) 0.1940 (1 − 0.194)10 − ( ) 0.1941 (1 − 0.194)9
0 1
= 1 − (1 − 0.194)10 − 10×0.1941 (1 − 0.194)9 = 0.6058

f. La nueva longitud será 𝑅 = 𝑋 − 0.1. La nueva proporción de artículos defectuosos será entonces
𝑃(defectuoso) = 𝑃(𝑅 > 1.9) + 𝑃(𝑅 < −1.7) = 𝑃(𝑋 − 0.1 > 1.9) + 𝑃(𝑋 − 0.1 < −1.7)
= 𝑃(𝑋 > 2) + 𝑃(𝑋 < −1.6)
−1.6
3 3 2
=0+∫ + 𝑥 𝑑𝑥 = 0.182 < 0.194
−2 28 28
Por tanto, se reduce la proporción de artículos defectuosos. Se mejora.
ESTADÍSTICA BÁSICA
SEMESTRE 2016-II
PRÁCTICA 5
JUEVES, 3 DE NOVIEMBRE DE 2016

Nombre:___________________________________________________________________________
Sección:___________________
Sólo pueden utilizarse las tablas y formulario que se proporcionan. JUSTIFICA TODAS TUS RESPUESTAS. Utiliza 𝜶 = 𝟎. 𝟎𝟓.

1. En un estudio sobre accidentabilidad en carretera en los últimos años se concluye que, a nivel nacional, se
produce una media de 6.03 accidentes de tránsito en carretera al día.
a) Se tienen datos de los primeros 100 días del año 2016, y en ellos se ha producido una media de 6.5
accidentes por día, con una cuasi-desviación típica de 3.2. ¿Hay evidencia de que haya aumentado la
accidentabilidad? (3p)
b) En los últimos 15 días se ha producido una media de 5 accidentes de tránsito al día, con una cuasi-
desviación típica de 2.8. Asumiendo que el número de accidentes al día se distribuye como una normal,
¿hay ahora evidencia de que esté disminuyendo la siniestralidad? (3p)
c) Utilizando únicamente la información del apartado (b), calcula un intervalo de confianza para la varianza
del número de accidentes de tránsito en carretera al día. (2p)

SOLUCIÓN:

a) La variable aleatoria (la población) de interés es 𝑋 = número de accidentes al día. Según el enunciado, la
accidentabilidad se mide con el número medio de accidentes al día, es decir con 𝜇 = 𝐸(𝑋). En los últimos
años se tiene que esta media es 𝜇 = 6.03 accidentes/día. La cuestión que nos planteamos sobre la
población es si esta media ha aumentado a la vista de los datos de los últimos 100 días (𝜇𝐴 > 6.03) o no ha
aumentado (𝜇 ≤ 6.03, o simplemente que no ha variado, 𝜇 = 6.03). Se puede resolver con un contraste de
hipótesis.

Las hipótesis a contrastar son: (1p)


𝐻0 : 𝜇 ≤ 6.03 (𝑜 𝜇 = 6.03)
𝐻1 : 𝜇 > 6.03

Se asumirá que 𝐻0 es cierta salvo que los datos muestren mucha evidencia en contra, es decir, si 𝑥̅ ≫ 6.03.
En nuestro caso 𝑥̅ = 6.5 > 6.03 por lo que tenemos que valorar si esa distancia eso lo suficientemente
grande para rechazar 𝐻0 . Esta tarea se realiza con el estadístico de contraste y su distribución de referencia.

El estadístico de contraste es
𝑥̅ − 6.03
𝑡0 = .
𝑠̂ /√𝑛
Con los datos de la muestra se tiene:
6.5 − 6.03
𝑡0 = = 1.47 (0.5p)
3.2
√100

Como la muestra es suficientemente grande, la distribución de referencia será la 𝑁(0,1), (0.5p)


independientemente de cómo se distribuya 𝑋 (nótese que no conocemos la distribución de 𝑋).

La región de rechazo se encuentra en la cola de la derecha. El valor crítico es 𝑧0.05 = 1.65. (0.5p)

Como 𝑡0 < 𝑧0.05 los datos se encuentran en la región de aceptación. Por tanto, no hay evidencia suficiente,
con 𝛼 = 0.05, para rechazar 𝐻0 . Los datos no muestran evidencia para pensar que la accidentabilidad haya
aumentado. La diferencia observada entre la media poblacional hipotética 𝜇 = 6.03 y la muestral 𝑥̅ = 6.5
no es estadísticamente significativa, y puede explicarse por el azar del muestreo. (0.5p)
b) En esta ocasión se plantea si la accidentabilidad se ha reducido (𝜇 < 6.03) o no (𝜇 ≥ 6.03 o 𝜇 = 6.03). El
contraste será (1p)
𝐻0 : 𝜇 ≥ 6.03 (o 𝜇 = 6.03)
𝐻1 : 𝜇 < 6.03

Asumiremos que 𝐻0 es cierta salvo que los datos muestren mucha evidencia en contra; es decir, si 𝑥̅ ≪ 6.03.
En este caso 𝑥̅ = 5 < 6.03, por lo que tenemos que valorar si esa diferencia es suficientemente grande
(significativa estadísticamente).

El estadístico de contraste es
𝑥̅ − 6.03
𝑡0 = .
𝑠̂ /√𝑛
Con los datos de la muestra se tiene:
5−6.03
𝑡0 = 2.8 = −1.42.(0.5p)
√15

La muestra es pequeña, por lo que la distribución de 𝑡0 depende de cómo se distribuya 𝑋. En este caso nos
aseguran que es una normal. Por consiguiente, la distribución de referencia es 𝑡𝑛−1 = 𝑡14 . (0.5p)

La región de rechazo se encuentra en la cola de la izquierda. El valor crítico es −𝑡14;0.05 = −1.761. (0.5p)

Como 𝑡0 > −𝑡14;0.05 los datos se encuentran en la región de aceptación. Por tanto, no hay evidencia
suficiente, con 𝛼 = 0.05, para rechazar 𝐻0 . Los datos no muestran suficiente evidencia para pensar que la
accidentabilidad haya disminuido. Con 𝛼 = 0.05, la diferencia observada entre la media poblacional
hipotética 𝜇 = 6.03 y la muestral 𝑥̅ = 5 puede explicarse por el azar del muestreo, no es estadísticamente
significativa. (0.5p)

c) Como la distribución de 𝑋 es una normal, el intervalo de confianza de la varianza es:


(𝑛 − 1)𝑆̂ 2 (𝑛 − 1)𝑆̂ 2 14×2.82 14×2.82 109.76 109.76
𝐼𝐶(95%): 𝜎 2 ∈ [ 2 ; 2 ]=[ 2 ; 2 ] (𝟏𝒑) = [ ; ]
𝜒𝑛−1;𝛼⁄2 𝜒𝑛−1;1−𝛼⁄2 𝜒14;0.025 𝜒14;0.975 26.12 5.63
= [4.20; 19.50](𝟏𝒑)
2. Se desea estimar la proporción de varones que, tras ingresar a cierta tienda de moda, acaba comprando algún
producto. Con ese fin, se coloca una cámara a la que se conecta un ordenador con un programa de
reconocimiento de imágenes que permite recabar la información solicitada de forma automática. Tras ingresar
200 varones, 10 de ellos compraron algún producto. Responde a las siguientes cuestiones de forma justificada.
a) A partir de esta información, construye un intervalo de confianza para la proporción de varones que tras
ingresar a la tienda compran algún producto. (3p)
b) Un experto en marketing dice que el 10% de los varones que entren a una tienda de este tipo acaba
comprando algo. ¿Tiene razón este experto? (2p)
c) ¿Qué tamaño muestral es necesario para estimar esa proporción con un margen de error de 0.01? (2p)

SOLUCIÓN:

a) Sea 𝑝 = proporción de varones que compran un producto en esa tienda, de entre los varones que han
ingresado en ella. Con la muestra de 𝑛 = 200 se estima que
10
𝑝̂ = = 0.05.
200
Como se verifica que 𝑛𝑝̂ (1 − 𝑝̂ ) = 200×0.05×0.95 = 9.5 > 5 podemos aplicar el Teorema del Límite
Central, y considerar que el estimador 𝑝̂ sigue una distribución normal. (1p)

A partir de este resultado, el intervalo de confianza será

𝑝̂ (1 − 𝑝̂ )
𝐼𝐶 (1 − 𝛼): 𝑝 ∈ {𝑝̂ ± 𝑧𝛼⁄2 √ }.
𝑛

Con la muestra obtenida resulta:

0.05 ×0.95
𝐼𝐶 (0.95): 𝑝 ∈ {0.05 ± 1.96 √ } = [0.0198 ; 0.0802].(2p)
200

b) El experto dice que en ese tipo de tiendas se verifica que 𝑝 = 0.1. Ese valor no se encuentra dentro del
intervalo de confianza obtenido en el apartado anterior, por lo que los datos que se poseen no lo respaldan.
Se puede rechazar, con un nivel de significación de 𝛼 = 0.05, que 𝑝 = 0.10. (2p)

c) Dado que podemos aplicar el Teorema del Límite Central, (0.5p) el cálculo del tamaño muestral 𝑛 necesario
para tener un margen de error 𝐿 con un nivel de confianza (1 − 𝛼) en la estimación de 𝑝 es

2
𝑧𝛼⁄2 √𝑝(1 − 𝑝)
𝑛=( )
𝐿
Como 𝑝 no es conocido, tenemos varias opciones para solventarlo (con hacer una opción es suficiente
(1.5p)). Por una parte, podemos ponernos en el caso más desfavorable, en el que 𝑝 = 𝑞 = 0.5, donde 𝑞 =
1 − 𝑝. Entonces, el cálculo es
2
1.96√0.5×0.5
𝑛=( ) = 9604,
0.01
que es un tamaño muestral considerable. Una segunda opción es basarnos en una estimación previa de 𝑝 a
partir de la muestra del apartado (a). En ese caso reemplazamos 𝑝 por 𝑝̂ = 0.05 y tenemos
2
1.96√0.05×0.95
𝑛=( ) ≈ 1825,
0.01
que proporciona un tamaño muestral sensiblemente inferior.

Otra opción, sería confiar en el experto mencionado en la sección (b) (a pesar de que los datos desmientan,
con un nivel de significación del 5%, que sea aplicable a nuestra tienda), y usar que 𝑝 = 0.1, quedando los
cálculos:
2
1.96√0.10×0.90
𝑛=( ) ≈ 3458,
0.01
3. La panela es un tipo de azúcar que se obtiene al evaporar el jugo de la caña de azúcar. Para su producción se
emplea un horno especialmente diseñado para poder mantener una temperatura alta y estable. Sólo de esta
forma se consigue transformar el jugo en miel, que posteriormente se cristaliza y forma la panela. Con el fin de
mejorar el rendimiento de un horno, se han llevado a cabo un conjunto de reparaciones y modificaciones. El
objetivo es que el proceso mejorado alcance una mayor temperatura media con una menor varianza. Para poder
evaluar estas mejoras se han tomado datos del proceso antes y después de la implantación de las mejoras.
Durante los días previos a la implantación de las mejoras, se registró la temperatura del proceso en diferentes
momentos, obteniéndose una muestra de 46 observaciones de temperatura (Muestra 1). Tras la implantación de
las mejoras, se volvió a tomar otra muestra (Muestra 2) de las temperaturas del proceso, en este caso 32
observaciones. La tabla siguiente muestra el resumen estadístico de estas dos muestras de temperaturas.

Se pide:
a) Realiza un contraste de hipótesis que permita contrastar si tras las mejoras la temperatura media del
proceso es mayor. Razona tu respuesta (no asumas que las varianzas son iguales, pues ha podido disminuir
tras las mejoras). (3p)
b) Calcula el p-valor del contraste e interprétalo. (2p)

SOLUCIÓN:

a) Llamemos 𝑋𝐴 = temperatura del proceso antes de las mejoras, cuyos parámetros serán 𝜇𝐴 = 𝐸(𝑋𝐴 ); 𝜎𝐴2 =
𝑉𝑎𝑟(𝑋𝐴 ). Asimismo, llamemos 𝑋𝐷 = temperatura del proceso después de las mejoras, cuyos parámetros
serán 𝜇𝐷 = 𝐸(𝑋𝐷 ); 𝜎𝐷2 = 𝑉𝑎𝑟(𝑋𝐷 ). 𝑋𝐴 y 𝑋𝐷 son variables aleatorias que, si las modificaciones realmente
mejoran el proceso, cumplirán que 𝜇𝐴 < 𝜇𝐷 ; 𝜎𝐴2 > 𝜎𝐷2 .

Vamos a contrastar, usando la información de las dos muestras independientes, si la temperatura media ha
aumentado (𝜇𝐴 < 𝜇𝐷 ) o no (𝜇𝐴 ≥ 𝜇𝐷 o 𝜇𝐴 = 𝜇𝐷 ). Las hipótesis de este contraste son (1p)
𝐻0 : 𝜇𝐴 ≥ 𝜇𝐷 𝑜 𝜇𝐴 = 𝜇𝐷
𝐻1 : 𝜇𝐴 < 𝜇𝐷 .
Mantendremos 𝐻0 como cierta salvo que los datos mucha evidencia en contra; es decir, sólo rechazaremos
la hipótesis nula si 𝑥̅𝐴 ≪ 𝑥̅𝐵 .

Como no hay garantía de que la varianza sea la misma antes y después de la mejora (es más, se espera que
haya disminuido), debemos emplear un estadístico de contraste que utilice varianzas diferentes. El
estadístico de contraste es
𝑥̅𝐴 − 𝑥̅𝐵
𝑡0 =
𝑠̂ 2 𝑠̂ 2
√ 𝐴+ 𝐵
𝑛𝐴 𝑛𝐵
que con los datos disponibles resulta
93 − 97
𝑡0 = = −2.80.(0.5p)
81
√ + 9
46 32

Como el tamaño muestral es suficientemente grande, la distribución de referencia será la 𝑁(0,1). (0.5p)
La región de rechazo estará en la cola de la izquierda. Para 𝛼 = 0.05 el valor crítico es −1.65. (0.5p)
Como 𝑡0 < −1.65 , los datos se encuentran en la región de rechazo. Por tanto, hay evidencia suficiente (con
𝛼 = 0.05) para rechazar la hipótesis nula y concluir que la mejora ha permitido aumentar la temperatura
media del proceso. La diferencia entre las medias antes y después de la mejora es estadísticamente
significativa. (0.5p)

b) El p-valor es el área que tendría la región de rechazo si el valor crítico fuese −2.80. Es decir
p-valor = 𝑃(𝑧 < −2.80) = 0.0026
Como es inferior a 𝛼 nos encontramos en la región de rechazo. Es muy pequeño, por lo que hay mucha
evidencia a favor de la hipótesis alternativa.
ESTADÍSTICA BÁSICA
SEMESTRE 2016-II
PRÁCTICA 4
JUEVES, 20 DE OCTUBRE DE 2016

Nombre:___________________________________________________________________________
Sección:___________________
Sólo pueden utilizarse las tablas y formulario que se proporcionan. JUSTIFICA TODAS TUS RESPUESTAS.

1. Sea 𝑋 una variable aleatoria de cuya distribución sólo conocemos que tiene media 𝜇 = 10 y desviación típica
𝜎 = 2, y de la que tomamos una muestra aleatoria simple de tamaño 𝑛 = 100. Indique si las siguientes
afirmaciones son verdaderas o falsas, justificando la respuesta: (6p)
a. Habrá un 50% de probabilidad de que la media muestral 𝑋̅ que se obtenga con esa muestra sea
mayor que 10. (2p)
b. Habrá un 50 % de probabilidad de que la media muestral 𝑋̅ que se obtenga con esa muestra se
encuentre entre 9.87 y 10.14. (2p)
c. Para asegurarnos de que 𝜇 se encuentre en el intervalo 𝑋̅ ± 0.1 con un 95% de confianza,
deberíamos tomar más de 1500 datos. (2p)

SOLUCIÓN:

a. VERDADERO. La media muestral es un estimador de 𝜇 que tiene las siguientes propiedades, para cualquier
tamaño de muestra, e independientemente de cómo sea la población de la que se extrae:
𝐸(𝑋̅) = 𝜇 ; 𝑉𝑎𝑟(𝑋̅ ) = 𝜎 2 /𝑛
Además, con 𝑛 = 100 el tamaño muestral es suficientemente grande para poder considerar que 𝑋̅ es
normal. Por tanto:
𝜎2
𝑋̅ ∼ 𝑁 (𝜇, ) = 𝑁(10 , 0.04) .
𝑛
Al ser la normal una distribución continua y simétrica se tiene que 𝑃(𝑋̅ > 𝜇) = 0.5.

b. VERDADERO. Como
𝑋̅ ∼ 𝑁(10 , 0.04)
se tiene que
9.87 − 10 10.14 − 10
𝑃(9.87 < 𝑋̅ < 10.14) = 𝑃 ( <𝑍< )
0.2 0.2
= 𝑃(−0.65 < 𝑍 < 0.70) = 𝑃(𝑍 < 0.70) − 𝑃(𝑍 < −0.65) = 0.758 − 0.258 = 0.5.

(Nota: aquí puede haber una variedad de respuestas dependiendo de cómo redondeen. No tomar en
cuenta esas diferencias)

c. VERDADERO. Si queremos que el margen de error del intervalo de confianza del 95% sea 𝐿 = 0.1
necesitamos que
𝑧0.025 𝜎 2 1.96×2 2
𝑛=( ) =( ) ≈ 1537 > 1500.
𝐿 0.1
2. Sea 𝑋 la holgura que queda entre cierto cilindro y su pistón tras su
ensamble (ver figura). Esta holgura es una variable aleatoria distribuida
según una distribución uniforme continua en el intervalo [0; 𝑏]. Se ha
medido la holgura de 5 ensambles, obteniéndose los valores, en mm, de
0.2, 0.3, 0.4, 0.5, 0.6, respectivamente. Se pide, justificado la respuesta (7p)

a. Estima 𝑏 utilizando el método de los momentos. (2p)


b. Demuestra que este estimador es insesgado. (2p)
c. Calcula el error cuadrático medio de este estimador para el caso 𝑏 = 1. (2p)
d. Comenta brevemente qué problema tendría que se construyese un intervalo
de confianza para la media de esta distribución con esa muestra usando la
𝑠̂
fórmula {𝑥̅ ± 𝑧𝛼⁄2 }. (1p)
√𝑛

SOLUCIÓN:

a. De las propiedades de la uniforme 𝑈(0, 𝑏) tenemos que


𝑏
𝐸(𝑋) = ≡ 𝜇 ⇒ 𝑏 = 2𝜇 ⇒ 𝑏̂ = 2𝑥̅ = 2×0.4 = 0.8
2
b. ̂
Será insesgado si 𝐸(𝑏) = 𝑏. Como la media muestral es siempre un estimador insesgado de 𝜇, tenemos que
2𝑏
𝐸(𝑏̂) = 𝐸(2𝑋̅) = 2𝐸(𝑋̅) = 2𝜇 = = 𝑏.
2
c. Como el estimador es insesgado, su ECM será su varianza. La varianza de la media muestral es
𝜎2 𝜎2
𝑉𝑎𝑟(𝑋̅) = = .
𝑛 5
Por otra parte, tenemos que la varianza de una uniforme 𝑈(𝑎, 𝑏) es (ver formulario)
(𝑏 − 𝑎)2
𝜎2 = ,
12
por lo que la varianza de la variable uniforme 𝑈(0,1) será
1
𝜎2 = .
12
Se tiene entonces que
𝜎2 1/12 1
𝐸𝐶𝑀(𝑏̂) = 𝑉𝑎𝑟(𝑏̂) = 𝑉𝑎𝑟(2𝑋̅) = 4 =4 = .
5 5 15
d. Esa fórmula es para calcular intervalos de confianzas de 𝜇 si la muestra es grande, típicamente mayor que
30. En este caso la muestra es de sólo 𝑛 = 5. Por tanto, el intervalo resultante será erróneo en el sentido de
que no va a tener el nivel de confianza que se desea. No será de nivel (1 − 𝛼)×100%.
3. En una piscifactoría donde se cultivan langostinos resulta crucial tener una buena estimación del peso
medio de los langostinos de una determinada edad. Con ese fin se pesan 50 langostinos, obteniéndose los
siguientes resultados proporcionados por Minitab (7p).

a) Construye un intervalo de confianza de nivel 95% para el peso medio. (2p)


b) Calcula el tamaño muestral necesario si queremos que el margen de error con una confianza del
95% sea 𝐿 = 0.005. (2p)
c) A partir de estos datos, un analista construye el siguiente intervalo de confianza:
i. 𝜇 ∈ (0.9733 ; 0.9943)
Comparando simplemente los valores de este intervalo con el intervalo calculado en el punto (a),
¿su nivel de confianza será superior o inferior al 95%? Razona la respuesta. (1p)
d) Calcula el nivel de confianza del intervalo del punto (c). (2p)

SOLUCIÓN:

a. El tamaño muestras es suficientemente grande para considerar que 𝑥̅ sigue una normal. En ese caso, el
intervalo será
𝑠̂ 0.04488
𝐼𝐶(95%): 𝜇 ∈ {𝑥̅ ± 𝑧𝛼⁄2 } = {0.98379 ± 1.96 }
√𝑛 √50
= 0.98379 ± 0.01244
= (0.971; 0.996)

b. Asumiendo igualmente que el tamaño muestras será >30, el tamaño muestral se calcula con la siguiente
expresión, válida para muestras grandes.

1.96×0.04488 2
𝑛=( ) = 309.5 ≈ 310,
0.005

pues no podemos tomar un número no entero de datos.

c. El intervalo es más estrecho que el del 95%; por tanto, habrá menos seguridad de que vaya a contener al
valor verdadero. Por tanto, tendrá un menor nivel de confianza.

d. El intervalo puede escribirse como


𝜇 ∈ (0.98379 ± 0.0105).
Se obtiene entonces que
0.04488
𝑧𝛼⁄2 = 0.0105 ⇒ 𝑧𝛼⁄2 = 1.6543.
√50
Buscando en las tablas de la normal tenemos que

𝛼
𝑧𝛼⁄2 = 1.6543 ⇒ = 0.05 ⇒ 𝛼 = 0.10.
2

Por tanto, el nivel de confianza es del 90%.


ESTADÍSTICA BÁSICA
SEMESTRE 2017-I
APLAZADO
SÁBADO 22 DE JULIO DE 2017

Nombre:___________________________________________________________________________
Sección:___________________
Sólo puede consultarse el formulario y las tablas que se adjuntan. Utiliza 𝜶 = 𝟎. 𝟎𝟓 salvo que se indique lo contrario.
Justifica todas tus respuestas.

1. A partir de las siguientes figuras, señala la correspondencia entre cada histograma y los box-plots, justificando tu
respuesta.

SOLUCIÓN:

1-A: El histograma 1 es asimétrico negativo, con la cola de la distribución apuntando hacia los valores bajos del eje
X. Eso mismo se aprecia en el box-plot A, donde el bigote del primer cuartil es más largo
3-C: En este caso la asimetría es positiva, y la cola de la distribución está a la derecha, apuntando a +∞. Le
corresponde el box-plot C, que muestra también esa asimetría.
2-B y 4-D: el histograma 2 muestras una gran varianza, debido a la bimodalidad, por eso le corresponde el box-plot
D, donde el rango intercuartílico es mayor. E histograma 4 es el más simétrico, y al ser unimodal tiene menos
varianza que el 4. Por eso le corresponde el box-plot B
2. Un laboratorio ha desarrollado un nuevo test para detectar un virus del que se estima se ha contagiado el 1% de la
población. Esta detección es importante, pues ese virus puede facilitar el desarrollo de ciertas enfermedades. Este
test no es infalible, pues se estima que el 20% de las personas que portan el virus no son detectadas por el nuevo
test. Por el contrario, en las personas sanas, el test puede dar positivo (positivo=el test dice que tiene el virus) con
una probabilidad de 0.001.
a. ¿Cuál es la probabilidad de que una persona que tiene el virus dé positivo en el test?
b. ¿Cuál es la probabilidad de que el test dé positivo en una persona seleccionada al azar?
c. ¿Cuál es la probabilidad de que tenga el virus una persona que ha dado positivo en el test?
d. ¿Cuál es la probabilidad de que una persona que ha dado positivo en el test no tenga el virus?

SOLUCIÓN
Definimos los siguientes sucesos:
V: una persona tiene el virus
p: el test detecta el virus (resultado positivo)

Los datos dicen que


𝑃(𝑉) = 0.01
𝑃(𝑝̅ |𝑉) = 0.2
𝑃(𝑝|𝑉̅ ) = 0.001

a. Nos piden 𝑃(𝑝|𝑉). Del enunciado se deduce que


𝑃(𝑝̅ |𝑉) = 0.2 ⇒ 𝑃(𝑝|𝑉) = 0.8.

b. Nos piden 𝑃(𝑝). Aplicando el teorema de la probabilidad total tenemos:


𝑃(𝑝) = 𝑃(𝑝|𝑉)𝑃(𝑉) + 𝑃(𝑝|𝑉̅ )𝑃(𝑉̅ )

De los datos del enunciado se deduce que


𝑃(𝑉) = 0.01 ⇒ 𝑃(𝑉̅ ) = 0.99
𝑃(𝑝̅|𝑉) = 0.2 ⇒ 𝑃(𝑝|𝑉) = 0.8.

Con estos valores se obtiene:


𝑃(𝑝) = 0.8(0.01) + 0.001(0.99) = 0.009 (0.9%).

c. Ahora nos piden 𝑃(𝑉|𝑝). Aplicando el teorema de Bayes se obtiene:


𝑃(𝑝|𝑉)𝑝(𝑉) 0.8(0.01)
𝑃(𝑉|𝑝) = = = 0.889.
𝑃(𝑝) 0.009

d. Nos piden 𝑃(𝑉̅ |𝑝), que es justo el complementario del resultado anterior:
𝑃(𝑉̅ |𝑝) = 1 − 𝑃(𝑉|𝑝) = 1 − 0.889 = 0.111

3. Dada la función de distribución 𝐹(𝑥) = 8𝑥 3 , 0 ≤ 𝑥 ≤ 𝑎, se pide:


a. Demuestra que 𝑎 = 0.5
b. Calcula la función de densidad.
c. Calcula el rango intercuartílico de esta distribución.
d. Calcula la media.
ESTADÍSTICA BÁSICA
SEMESTRE 2017-I
FINAL
SÁBADO 15 DE JULIO DE 2017

Nombre:___________________________________________________________________________
Sección:___________________
Sólo puede consultarse el formulario y las tablas que se adjuntan. Utiliza 𝜶 = 𝟎. 𝟎𝟓 salvo que se indique lo contrario.
Justifica todas tus respuestas.

1. Se sabe que la probabilidad de que un alumno desapruebe un examen es del 25%, la probabilidad de que un
alumno estudie para dicho examen es del 90%, y de que un alumno estudie y apruebe es de 85%.
a) ¿Es independiente el hecho de que un alumno estudie con su aprobación? Fundamente su respuesta
analíticamente. (1 p)
b) Calcule la probabilidad de que un alumno apruebe el examen o estudie para dicho examen. (1 p)

SOLUCIÓN

Sean los sucesos:

• 𝐴: Aprobar el examen.
• 𝐸: Estudiar para el examen

𝑃(𝐴̅) = 0.25
𝑃(𝐴) = 0.75

𝑃(𝐸) = 0.90
𝑃(𝐴 ∩ 𝐸) = 0.85

a) Si 𝐴 y 𝐸 son sucesos independientes, deberá cumplirse que:

𝑃(𝐴 ∩ 𝐸) = 𝑃(𝐴) × 𝑃(𝐸)

Se tiene que 𝑃(𝐴)𝑃(𝐵) = 0.75 × 0.90 ≠ 0.85, por lo que no se cumple dicha condición, se puede afirmar que
ambos sucesos no son independientes. (1 p)

b) La probabilidad de que un alumno apruebe o estudie es 𝑃(𝐴 ∪ 𝐸)

𝑃(𝐴 ∪ 𝐸) = 𝑃(𝐴) + 𝑃(𝐸) − 𝑃(𝐴 ∩ 𝐸)

𝑃(𝐴 ∪ 𝐸) = 0.75 + 0.90 − 0.85

𝑷(𝑨 ∪ 𝑬) = 𝟎. 𝟖𝟎 (1 p)
2. En un parque temático, se han clasificado a los clientes, en relación con el consumo (en dólares) que realizan en
el parque, en dos categorías: A y B. El consumo de los clientes tipo A es una variable aleatoria con la siguiente
función de densidad:

𝑘𝑥 ; 0 ≤ 𝑥 ≤ 50

𝑓(𝑥) 200 − 𝑥
; 50 < 𝑥 ≤ 200
15000

El consumo de los clientes tipo B es una variable exponencial de media $40. Además, se sabe que, de los
clientes que llegan al parque, el 60% es del tipo A y el 40% es del tipo B.

Responda de manera justificada las siguientes preguntas:

1
a) Demuestre que 𝑘 tiene un valor de . Utilice este valor para sus cálculos posteriores. (0.5 p)
5000
b) Calcule los cuartiles de la distribución del consumo de los clientes del tipo B. (1 p)
c) Calcule la probabilidad de que un cliente tipo A consuma menos de $60 en el parque temático. (1 p)
d) Calcule la probabilidad de que, sabiendo que un cliente tipo B está dispuesto a gastar como máximo $60,
gaste más de $20 en el parque temático. (1.5 p)
e) Calcule la probabilidad de que un cliente cualquiera consuma menos de $60 en el parque temático. (2 p)
f) Si en un día determinado llegan 120 clientes del tipo A, ¿cuál es la probabilidad de que más de la mitad de
dichos clientes consuma menos de $60 en el parque temático? (2 p)

SOLUCIÓN

a) Si 𝑓(𝑥) es función densidad, se debe cumplir que:


+∞

∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞

50 200
200 − 𝑥
∫ 𝑘𝑥 𝑑𝑥 + ∫ 𝑑𝑥 = 1
15000
0 50

50

∫ 𝑘𝑥 𝑑𝑥 + 0.75 = 1
0

50

∫ 𝑘𝑥 𝑑𝑥 = 0.25
0

𝑘(502 ) 𝑘(02 )
− =1
2 2
1
𝑘= (0.5 p)
5000
b) El gasto de los clientes tipo B se distribuye como una exponencial de media 40:

1
𝜇 = 40 =
λ
1
λ= (0.25 p)
40

1
Sea B el gasto de un cliente del tipo B: 𝐵~𝐸𝑥𝑝 ( )
40

Sus cuartiles serán:

- 𝑃(𝐵 < 𝑄1 ) = 0.25


𝑄1
1 − 𝑒 −40 = 0.25
𝑄1
𝑒 −40 = 0.75

𝑄1
− = ln(0.75)
40

𝑄1 = 11.51 (0.25 p)

- 𝑃(𝐵 < 𝑄2 ) = 0.50


𝑄2
1 − 𝑒 −40 = 0.50
𝑄2
𝑒 −40 = 0.50

𝑄2
− = ln(0.50)
40

𝑄2 = 27.73 (0.25 p)

- 𝑃(𝐵 < 𝑄3 ) = 0.75


𝑄3
1 − 𝑒 −40 = 0.75
𝑄3
𝑒 −40 = 0.25

𝑄3
− = ln(0.25)
40

𝑄3 = 55.45 (0.25 p)

c) Sea 𝐴 el gasto de un cliente del tipo A:

50 𝑥 200 200−𝑥
𝑃(𝐴 < 60) = ∫0 𝑑𝑥 + ∫50 𝑑𝑥 = 0.25 + 0.0967 = 𝟎. 𝟑𝟒𝟔𝟕 (1 p)
5000 15000

d) Sea 𝐵 el gasto de un cliente del tipo B:

𝑃(𝐵 > 20 ∩ 𝐵 ≤ 60)


𝑃(𝐵 > 20 | 𝐵 ≤ 60) =
𝑃(𝐵 ≤ 60)
60 20

𝑃(20 < 𝐵 ≤ 60) (1 − 𝑒
40 ) − (1 − 𝑒 −40 )
= = 60 = 𝟎. 𝟒𝟗𝟑𝟓
𝑃(𝐵 ≤ 60)
1 − 𝑒 −40
- Definición correcta de la probabilidad condicionada: 1 p.
- Cálculo de la probabilidad: 0.5 p.

e) Sea 𝐺 el gasto de un cliente cualquiera, sea 60% la probabilidad de que sea del tipo A, y 40% la probabilidad de
que sea del tipo B:

𝑃(𝐺 < 60) = 𝑃(𝐺 < 60 | 𝑇𝑖𝑝𝑜 𝐴) × 𝑃(𝑇𝑖𝑝𝑜 𝐴) + 𝑃(𝐺 < 60 | 𝑇𝑖𝑝𝑜 𝐵) × 𝑃(𝑇𝑖𝑝𝑜 𝐵)

𝑃(𝐺 < 60) = 0.3467 × 0.6 + 0.7769 × 0.4

𝑃(𝐺 < 60) = 𝟎. 𝟓𝟏𝟖𝟖

- Definición correcta de la probabilidad total: 1.5 p.


- Cálculo de la probabilidad: 0.5 p.

f) Sea 𝑋 el número de clientes del tipo A que gastan menos de $60 en un grupo de 120 clientes de dicho tipo:

𝑋~𝐵(120, 0.3467) (0. 5 p)

Debido a que 𝑛𝑝𝑞 = 120 × 0.3467 × 0.6533 = 27.18 > 5, por el TCL se puede aproximar la distribución binomial a
una normal con:

• Media: 𝜇 = 𝑛𝑝 = 120 × 0.3467 = 41.60


• Varianza: 𝜎 2 = 𝑛𝑝𝑞 = 120 × 0.3467 × 0.6533 = 27.18

𝑋~𝑁(41.60, 27.18) (0. 5 p)

Entonces, se pide 𝑃(𝑋 > 60)

60−41.60
𝑧= = 3.53 (0. 5 p)
√27.18

Finalmente: 𝑃(𝑋 > 60) = 𝑃(𝑍 > 3.53) ≈ 0 (0. 5 p)


3. De una población normal se obtienen las observaciones: -0.67, 0.53, -1.20, 0.18, -0.75, 1.43, 1.26, -0.78. Un
analista afirma que esta muestra procede de una población de media=0.1. Contrasta estadísticamente esta
afirmación. (4p)

SOLUCIÓN:
Vamos a realizar el contraste (1p)
𝐻0 : 𝜇 = 0.1
𝐻1 : 𝜇 ≠ 0.1
Como la población de la que procede nuestra muestra es una normal, podemos realizar el contraste basado en el
estadístico de contraste t:
𝑥̅ − 0.1
𝑡0 = .
𝑠̂ /√𝑛

En esta fórmula ha de emplearse la cuasi-desviación típica, donde se ha de dividir por 𝑛 − 1 . Con la muestra que se
proporciona calculamos:
−0.67 + 0.53 + ⋯ + (−0.78)
𝑥̅ = = 0.0000
8
(−0.67 − 0)2 + ⋯ + (−0.78 − 0)2
𝑠̂ = √ = 1.0004
7
y el estadístico queda entonces:
0 − 0.1
𝑡0 = = −0.2827 (𝟏𝒑).
1.0004/√8

Al tratarse de una población normal, la distribución de


referencia es la 𝑡𝑛−1 ≡ 𝑡7 . La región de rechazo es
|𝑡| > 𝑡7;0.025 = 2.365 (𝟏𝒑),
por lo que, con 𝑡0 = −0.2827, estamos en la región de
aceptación de 𝐻0 . Por tanto, podemos asumir que la muestra
procede de una población de media 𝜇 = 0.1. O bien, no hay
evidencia suficiente para rechazar que 𝜇 = 0.1. (1p)

4. Se desea conocer qué porcentaje de vehículos tiene contratada una póliza de seguro vehicular. ¿A cuántos
vehículos debemos preguntar para estimar dicha proporción con un margen de error de 0.05? (2p)

SOLUCIÓN

Colocándonos en la situación más desfavorable, donde 𝑝 = 𝑞 = 0.5, y asumiendo que 𝑛 será lo suficientemente
grande para que 𝑝̂ se distribuya como una normal, el tamaño muestral necesario será
2
𝑧𝛼⁄2 √𝑝𝑞 1.96 × 0.5 2
𝑛=( ) =( ) = 384.16 ≈ 385
𝐿 0.05

donde, como buscamos el n que garantice que el margen de error no sea mayor a 0.05, redondeamos al entero
superior.
5. Se poseen datos de una muestra de estudiantes de EDB. La información que se tiene es:
a. Promedio: nota final obtenida en la asignatura (sin descuentos por inasistencias)
b. IA: índice académico de cada estudiante
c. Frec: variable binaria que representa que el alumno asiste frecuentemente a clase. 1=menos de 5
inasistencias, 0=5 ó más inasistencias.
Con estas variables se realiza una regresión que explique la variable Promedio en función de IA y Frec. Los
resultados se resumen en la siguiente tabla.

Se pide, justificando la respuesta:


a) Interpreta los coeficientes de la regresión, incluido el del término constante. (3p)
b) A partir de los resultados del modelo, ¿le interesa a un alumno ir frecuentemente a clase? (1p)

SOLUCIÓN

a)
• IA: 0.89. El coeficiente es significativo, por lo que se acepta que ejerce una influencia en el valor del
promedio. Si IA aumenta en una unidad, independientemente de si el alumno asiste o no a clase, la
nota del promedio aumenta en 0,89 puntos por término medio.
• Frec: el coeficiente es significativo, por lo que se acepta que influye en el valor del promedio. Para un
mismo IA, el asistir regularmente a clase (Frec=1) aumenta el promedio en 1.69 respecto de los que no
lo hacen (Frec=0), por término medio.
• El término constante es el valor previsto del promedio cuando los factores toman el valor cero. En este
caso, esa situación no existe, pues no hay IA=0 en alumnos que estén cursando EDB.
b) Si, pues independientemente de su IA, asistir a clase supone, por término medio, un aumento de 1.69
puntos en el promedio.
ESTADÍSTICA BÁSICA
SEMESTRE 2017-I
PRÁCTICA 5
VIERNES, 23 DE JUNIO DE 2017

Nombre:___________________________________________________________________________
Sección:___________________
Sólo puede consultarse el formulario y las tablas que se adjuntan. Utiliza 𝜶 = 𝟎. 𝟎𝟓 salvo que se indique lo contrario

1. Un analista desea realizar una encuesta para saber la proporción de estudiantes universitarios que tienen a Claro
como operador de su celular.
a) Si desea estimar dicha proporción con un margen de error de 0.05, para una confianza del 95%, ¿a cuántos
estudiantes debe encuestar? Justifica adecuadamente tu respuesta. (2p)
b) Cuando el analista lleva ya 50 estudiantes encuestados obtiene que el 22% de los alumnos tienen como
operador a Claro. Utilizando esta información, ¿cuál deberá ser ahora el tamaño de la muestra para cumplir
los objetivos especificados en el apartado (a)? (2p)
c) Además del operador de telefonía, este analista les pregunta sobre la duración de su última llamada
registrada. Las respuestas de los 50 encuestados tienen una duración media de 𝑥̅ = 3.50 minutos, con una
cuasidesviación típica de 𝑠̂ = 1.4 minutos. Asumiendo que la duración de una llamada sigue una distribución
normal, contrasta si la duración media de una llamada es inferior a 4 minutos. Al realizar este contraste,
escribe claramente cuál es la hipótesis nula, la alternativa, el estadístico de contraste y la distribución de
referencia, justificando adecuadamente tu respuesta. (2p)
d) Repite el contraste de la sección anterior, pero ahora sin asumir que la muestra procede de una distribución
normal. Comenta brevemente qué diferencias hay en la realización de este contraste respecto al realizado en
el apartado (c). (2p)

SOLUCIÓN

a) Para calcular el tamaño muestral necesario para un margen de error determinado nos basaremos en la
fórmula
2
𝑧0.025 √𝑝𝑞
𝑛=( ) . (0.5p)
𝐿

Esta expresión asume que la proporción muestral, 𝑝̂ , se puede aproximar a una normal, para lo que se
necesitará que 𝑛 sea lo suficientemente grande para que se cumpla 𝑛𝑝𝑞 > 5.(0.5p)

En esta expresión, es necesario usar un valor de 𝑝 que, obviamente, desconocemos. Para solventarlo,
tomamos el caso más desfavorable, en el que 𝑝𝑞 toma su máximo valor, lo que sucede cuando 𝑝 = 𝑞 =
0.5. (0.5p)
Entonces, el tamaño muestral para 𝐿 = 0.05 es

2
1.96√0.5×0.5
𝑛=( ) ≈ 385. (0.5p)
0.05

Es fácil comprobar que 385(0.5)(0.5) > 5, por lo que la aproximación a la normal de 𝑝̂ , en la que se basa
esta fórmula, es válida.

b) Usando la estimación 𝑝̂ = 0.22, el tamaño muestral requerido será


2 2
𝑧0.025 √𝑝̂ 𝑞̂ 1.96√0.22×0.78
𝑛=( ) =( ) ≈ 264.
𝐿 0.05

Se comprueba que 𝑛𝑝𝑞 = 264(0.22)(0.78) = 45.3 > 5, por lo que la aproximación a la normal de 𝑝̂ , en la
que se basa esta fórmula, es válida.
c) La media poblacional será inferior a 4 minutos (𝜇 < 4) o no (𝜇 ≥ 4). El contraste de medias será:
𝐻0 : 𝜇 ≥ 4
𝐻1 : 𝜇 < 4. (0.25p)

El estadístico de contraste, dado que no conocemos 𝜎, será el estadístico 𝑡:

𝑥̅ − 𝜇0 3.50 − 4
𝑡= = = −2.525. (0.25p)
𝑠̂ /√𝑛 1.4/√50

Al tratarse de una muestra de una población normal, la distribución de referencia es la 𝑡𝑛−1 ≡ 𝑡49 (0.5p).
Dado que 𝐻1 : 𝜇 < 4, la región de rechazo está en la cola de la izquierda de la distribución (ver figura)
(0.25p).

Para buscar el valor crítico −𝑡49;0.05 con las tablas que


estamos manejando, tomamos como valor más próximo el
valor correspondiente a 𝑡50 (en la práctica usaríamos una
computadora), obteniéndose que
−𝑡49;0.05 ≈ −1.676 (0.25p)

Como 𝑡 = −2.525 < −1.676 nos encontramos en la región de rechazo. La diferencia encontrada (entre los
3.5 minutos de media muestral y los 4 minutos de media poblacional) es significativa (muy poco probable
que sea un efecto del muestreo) y, por tanto, debemos rechazar 𝐻0 . Los datos muestran evidencia
suficiente para asumir que la duración media de una llamada es inferior a 4 minutos. (0.5p)

d) Si no podemos asumir que la muestra viene de una normal,


podemos utilizar la aproximación a la normal de 𝑥̅ , al tener una
muestra grande (> 30). Los resultados serán menos precisos.
En la elaboración del contraste, lo único que cambia es la
distribución de referencia, que ahora será la N(0,1) (ver figura).
El valor crítico para 𝛼 = 0.05 es −1.645.

En este caso, seguimos estando en la región de rechazo de la hipótesis nula,


2. Una compañía aseguradora se encuentra estudiando la siniestralidad de tres marcas de autos, A, B y C. Para ello,
toma una muestra de un registro de 150 autos de cada marca.
- De la muestra de la marca A, se encuentra que 30 autos habían sufrido algún accidente.
- De la muestra de la marca B, se encuentra que 45 autos habían sufrido algún accidente.
- De la muestra de la marca C, se encuentra que 40 autos habían sufrido algún accidente.

Definimos el nivel de accidentes de una determinada marca como la proporción (poblacional) de vehículos de dicha
marca que han sufrido accidentes. Responda de manera justificada las siguientes cuestiones:

a) Con base en los datos tomados, ¿es posible afirmar que el nivel de accidentes es mayor en los autos de B que
en los de A? (2.5 p)
b) Construya un intervalo de confianza de la diferencia de proporciones de autos que han sufrido accidentes de
las marcas B y C. (2.5 p)
c) Con base en el intervalo de confianza construido en el apartado anterior, ¿es posible afirmar que no existe
diferencia entre el nivel de accidentes de las marcas B y C? (1 p)

SOLUCIÓN:

a) Se necesita comparar la proporción de autos que han sufrido accidentes en las marcas A (𝑝𝐴 )y de la marca B
(𝑝𝐵 ), para comprobar si dicha proporción es mayor en B que en A.

1. Se establecen las hipótesis (0.5 p):


𝐻0 : 𝑝𝐴 ≥ 𝑝𝐵
𝐻0 : 𝑝𝐴 < 𝑝𝐵

2. Se establece el estadístico de contraste (0.5 p):

(𝑝̂𝐴 − 𝑝̂𝐵 ) 0.2 − 0.3


𝑍0 = = = −2.00
1 1
√𝑝̂0 𝑞̂0 ( + ) √0.25×0.75× ( 1 + 1 )
𝑛𝐴 𝑛𝐵 150 150

𝑛𝐴 𝑝̂𝐴 + 𝑛𝐵 𝑝̂𝐵 150×0.2 + 150×0.3


𝑝̂0 = = = 0.25
𝑛𝐴 + 𝑛𝐵 300

3. Se establece la distribución del estadístico de contraste (0.5 p):

𝑍0 ~𝑁(0,1)

4. Se realiza el contraste. Este es un contraste hacia la izquierda; por ser 𝛼 = 0.05, el valor crítico del
contraste es −1.645 (0.5 p).

-2.00

Como el valor del estadístico de contraste es menor que el valor crítico, se rechaza la hipótesis nula. Por lo
tanto, los datos muestran suficiente evidencia de que el nivel de accidentes es mayor en los autos de la
marca B que en los de A (0.5 p).
- También es posible que hayan realizado el contraste:

𝐻0 : 𝑝𝐵 ≤ 𝑝𝐴
𝐻0 : 𝑝𝐵 > 𝑝𝐴

En dicho caso, el valor crítico es +𝟏. 𝟔𝟒𝟓. La conclusión debe ser la misma.

b) Se pide construir un intervalo de confianza de la diferencia de las proporciones de autos que han sufrido
accidentes en los autos de las marcas B y C.

𝑝̂𝐵 𝑞̂𝐵 𝑝̂𝐶 𝑞̂𝐶


𝐼𝐶(0.95) = 𝑝𝐵 − 𝑝𝐶 ∈ {𝑝̂𝐵 − 𝑝̂𝐶 ± 𝑧𝛼 √ + }
2 𝑛𝐵 𝑛𝐶

0.3×0.7 0.2667×0.7333
𝐼𝐶(0.95) = 𝑝𝐵 − 𝑝𝐶 ∈ {0.3 − 0.2667 ± 1.96√ + }
150 150

𝐼𝐶(0.95) = 𝑝𝐵 − 𝑝𝐶 ∈ [−0.0686; 0.1352]

- Intervalo construido correctamente: 2.5 p.

- También es posible que hayan calculado 𝑰𝑪(𝟎. 𝟗𝟓) = 𝒑𝑪 − 𝒑𝑩 ∈ [−𝟎. 𝟏𝟑𝟓𝟐; 𝟎. 𝟎𝟔𝟖𝟔] . Dicha
alternativa también tiene puntaje completo.

- No son correctas estas alternativas:


𝒑𝑩 − 𝒑𝑪 ∈ [−𝟎. 𝟏𝟑𝟓𝟐; 𝟎. 𝟎𝟔𝟖𝟔]
𝒑𝑪 − 𝒑𝑩 ∈ [−𝟎. 𝟎𝟔𝟖𝟔; 𝟎. 𝟏𝟑𝟓𝟐]
Si se ha cometido ese error, el puntaje es de 1.5 p.

c) Se pide realizar un contraste de hipótesis para comprobar si la diferencia entre las proporciones del apartado
anterior es igual a cero. Dicho contraste debe realizarse utilizando el intervalo de confianza construido en el
apartado b.

Respuesta: Sí es posible afirmar que no existe diferencia significativa, debido a que el valor “0” se encuentra en
el intervalo de confianza, lo que indica que hay evidencia suficiente para afirmar que la diferencia entre ambas
proporciones tiene un valor igual a cero.

- Respuesta correcta justificada: 1 punto.


- Respuesta incorrecta, o sin justificación: 0 puntos.
3. El tiempo para ejecutar una determinada tarea de producción en una fábrica es una variable aleatoria normal con
una media histórica de 30 segundos, y una desviación estándar de 3 segundos, que tomaremos como valores
poblacionales. Un ingeniero ha logrado disminuir el tiempo medio de ejecución de esta tarea a 25 segundos, pero
teme que exista el riesgo de que la variabilidad haya aumentado. Para analizar este riesgo, ha tomado una muestra
de 100 tiempos de ejecución de la tarea, y ha encontrado que la cuasidesviación estándar es de 3.1 segundos.
Responda de manera justificada a las siguientes cuestiones:

a) ¿Apoyan los datos la suposición de que la variabilidad del tiempo de ejecución ha aumentado? (2 p)
b) Construya un intervalo de confianza de la varianza del tiempo de ejecución de la tarea. (2 p)
c) ¿Qué ocurriría con nuestro análisis si la distribución del tiempo no fuera normal? (2 p)

SOLUCIÓN

a) Se pide realizar un contraste de hipótesis para comprobar si la desviación es ahora mayor, que su valor
histórico, 3. Se realizará, por tanto, un contraste de hipótesis para comprobar si la varianza es mayor que 9.

1. Se establecen las hipótesis (0.5 p):


𝐻0 : 𝜎 2 ≤ 9
𝐻0 : 𝜎 2 > 9

2. Se establece el estadístico de contraste. Como se conoce 𝑠̂ (0.5 p):

(𝑛 − 1)𝑠̂ 2 99×9.61
𝜒02 = = = 105.71
𝜎02 9

3. Se establece la distribución del estadístico de contraste (0.5 p):


Por ser una muestra de 100 datos procedente de una población normal, la distribución del estadístico de
contraste es una chi-cuadrado con 99 grados de libertad.
𝜒02 ∼ 𝜒99
2

4. Se realiza el contraste. Este es un contraste hacia la derecha; por ser 𝛼 = 0.05, el valor crítico del contraste
es 123.22 (0.5 p)*.

2 2 2
Como las tablas que se utilizan no tienen 𝜒99 , tomamos como valor aproximado 𝜒100 , siendo 𝜒100;0.05 =
124.3.

Como el valor del estadístico de contraste (105.71) es menor que el valor crítico, se acepta la hipótesis
nula. Por lo tanto, no hay evidencia para afirmar que la variabilidad ha aumentado (0.5 p).

- Si se utilizan los valores de 3 y 3.1 como varianza y cuasivarianza, se corrigen únicamente los 1.5
puntos de las partes 3 y 4 (la distribución del estadístico de contraste, el valor crítico y región de
rechazo, y la conclusión, con base en el estadístico calculado).
b) Se pide construir un intervalo de confianza de la diferencia de la varianza.

(𝑛 − 1)𝑠̂ 2 (𝑛 − 1)𝑠̂ 2
𝐼𝐶(0.95): 𝜎 2 𝜖 [ 2 ; 2 ]
𝜒99,0.025 𝜒99,0.975

99×9.61 99×9.61
𝐼𝐶(0.95): 𝜎 2 𝜖 [ ; ]
128.42 73.36

𝐼𝐶(0.95): 𝜎 2 𝜖[7.4084, 12.9688]

Para la corrección, es igual de válido si se usan:


𝝌𝟐𝟏𝟎𝟎,𝟎.𝟎𝟐𝟓 = 𝟏𝟐𝟗. 𝟓𝟔
𝝌𝟐𝟏𝟎𝟎,𝟎.𝟗𝟕𝟓 = 𝟕𝟒. 𝟐𝟐

En dicho caso, el intervalo de confianza resultante es:

𝑰𝑪(𝟎. 𝟗𝟓): 𝝈𝟐 𝝐[𝟕. 𝟑𝟒𝟑𝟐, 𝟏𝟐. 𝟖𝟏𝟖𝟓]

c) Si X no es normal, no se cumple que:

(𝑛 − 1)𝑠̂ 2
𝜒02 = 2
~𝜒𝑛−1
𝜎02
(1 p)

Esto tendría como consecuencia que el análisis realizado (contraste de hipótesis e intervalo de confianza) no sea
válido, debido a que el nivel de confianza no será el buscado, sino uno distinto. (1p)
ESTADÍSTICA BÁSICA
SEMESTRE 2017-I
PRÁCTICA 4
VIERNES, 9 DE JUNIO DE 2017

Nombre:___________________________________________________________________________
Sección:___________________
Sólo puede consultarse el formulario y las tablas que se adjuntan. La notación de la normal es 𝑵(𝝁; 𝝈𝟐 ). Utiliza 𝜶 = 𝟎. 𝟎𝟓
salvo que se indique lo contrario

1. Sea 𝑋 una variable aleatoria de función de densidad


𝑓(𝑥 ) = 𝛽𝑥 𝛽−1 ,0 ≤ 𝑥 ≤ 1.
Esta distribución depende del parámetro 𝛽. Se pide, justificando la
respuesta:
a) Encuentra, aplicando el método de los momentos, un
estimador del parámetro 𝛽 a partir de una muestra
aleatoria simple 𝑥1 ,𝑥2 ,… , 𝑥𝑛. (3p)

b) Un analista recoge diez datos de esta distribución y


obtiene que
∑10 2
1 𝑥𝑖
𝑚2 = = 0.1
10
Utilizando el método de los momentos, encuentra un estimador de 𝛽 que pueda utilizar esta
información y obtén la estimación que corresponde. (3p)

SOLUCIÓN
a) La opción más sencilla para aplicar el método de los momentos es utilizando el momento de primer orden.
Calculamos así el primer momento y vemos su relación con el parámetro 𝛽.
1 1 1
𝑥 𝛽+1 𝛽
𝐸(𝑋) = ∫ 𝑥𝑓(𝑥 )𝑑𝑥 = ∫ 𝛽𝑥 𝛽 𝑑𝑥 = 𝛽 [ ] = = 𝜇 (1𝑝)
0 0 𝛽+1 𝛽+1
0
Por tanto, podemos relacionar 𝜇 con 𝛽. Operando:
𝜇(𝛽 + 1) = 𝛽 ⇒ 𝜇 = 𝛽 (1 − 𝜇)
𝜇
⇒𝛽= (1𝑝)
1− 𝜇
El estimador por el método de los momentos se consigue reemplazando en esta expresión los parámetros (𝛽 y
𝜇) por sus estimadores.
𝑥̅
𝛽̂ = . (1𝑝)
1 − 𝑥̅

b) Si tenemos el segundo momento muestral, necesitaremos un estimador de 𝛽 basado en este segundo


momento. El segundo momento poblacional de 𝑋 es
1 1 1
𝑥 𝛽+2 𝛽
𝐸(𝑋 2 ) = ∫ 𝑥 2 𝑓(𝑥 )𝑑𝑥 =∫ 𝛽𝑥 𝛽+1 𝑑𝑥 = 𝛽 [ ] = ≡ 𝑀2 (1𝑝)
0 0 𝛽+2 𝛽+2
0
Por tanto, podemos relacionar 𝑀2 con 𝛽. Operando:
𝑀2(𝛽 + 2) = 𝛽 ⇒ 2𝑀2 = 𝛽 (1 − 𝑀2 )
2𝑀2
⇒𝛽 = (0.5𝑝)
1 − 𝑀2
El estimador por el método de los momentos se consigue reemplazando en esta expresión los parámetros (𝛽 y
𝑀2) por sus estimadores.
2𝑚 2
𝛽̂ = , (1𝑝)
1 − 𝑚2
y para los datos que se tienen resulta la siguiente estimación:
2×0.1
𝛽̂ = = 0.222. (0.5𝑝)
1 − 0.1
2. Responde de forma breve, pero razonada, a las siguientes cuestiones:
a) ¿Qué es preferible, un estimador insesgado u otro con poca varianza? (2p)
b) Realizamos el contraste de hipótesis con hipótesis alternativa 𝐻1:𝜇 < 100 y a partir de unos datos
concluimos que, con 𝛼 = 0.05, rechazamos 𝐻0. ¿Podríamos aceptar 𝐻1 si usamos 𝛼 = 0.01? (2p)
c) Si quiero contrastar si la población de cierta variable tiene una media negativa he de realizar el
contraste 𝐻0: 𝜇 ≤ 0 frente a 𝐻1: 𝜇 > 0. ¿Verdadero o falso? Justifica.(2p)
d) Deseo estimar 𝜇 mediante un intervalo de confianza. Si tomo el doble de datos, reduciré mi margen
de error a la mitad, para un mismo nivel de confianza. ¿Verdadero o falso? Justifica. (2p)

SOLUCIÓN

a) No está claro, pues el estimador insesgado puede tener mucha varianza, lo que es malo, y el de poca
varianza podría ser muy sesgado, lo que tampoco es deseable. Elegiremos el que tenga menos error
cuadrático medio (ECM) que se basa tanto en el sesgo como en la varianza.
2
𝐸𝐶𝑀(𝜃̂) = 𝑠𝑒𝑠𝑔𝑜(𝜃̂) + 𝑣𝑎𝑟(𝜃̂)

b) Sí se podría, dependiendo del pvalor. Si el pvalor


está en el intervalo 0.01 < 𝑝𝑣𝑎𝑙𝑜𝑟 < 0.05 (zona A
de la figura) la decisión cambiaría, pues pasaríamos
de estar en la región de rechazo de 𝐻0 (aceptación
de 𝐻1 ) a la región de aceptación de 𝐻0. Pero si el
pvalor es 𝑝𝑣𝑎𝑙𝑜𝑟 < 0.01 (zona B de la figura)
seguiríamos manteniendo la misma decisión
(rechazar 𝐻0).

c) Falso. Si quiero saber si 𝜇 < 0, esa restricción ha de estar en una de las hipótesis, y, por tanto, la otra
hipótesis sería 𝜇 ≥ 0. Como la hipótesis nula ha de tener el signo = se tiene que el contraste es
𝐻0 :𝜇 ≥ 0, 𝐻1:𝜇 < 0

d) Falso. Si con 𝑛 datos tengo el siguiente margen de error:


𝑧𝛼⁄2 𝜎
𝐿1 =
√𝑛
cuando tenga 2𝑛 datos tendré
𝑧𝛼⁄2𝜎 1 𝐿1
𝐿2 = = 𝐿1 ≠
√2𝑛 √2 2
3. En cierto país, se sabe que, históricamente, el número de hijos por familia tiene un valor medio de 3 y una
varianza de 1.96.
a) Un analista realiza un estudio, tomando una muestra de 100 familias y obteniendo que el número medio
de hijos en dicha muestra es 2.7. ¿Puede este analista afirmar que el número medio de hijos por familia
en dicho país es ahora menor que 3? Utilice el p-valor. (2 p)
b) Otro analista toma una nueva muestra de 35 familias y obtiene que el número medio de hijos de dicho
grupo es 3.2. Calcule el intervalo de confianza para el número medio de hijos por familia que se obtiene
con esta muestra. (1.5 p)
c) Calcule el tamaño muestral necesario para que el margen de error del intervalo de confianza del
apartado b) sea 0.1. (1.5 p)
d) Con base en el intervalo hallado en el apartado b), ¿puede afirmarse que el número medio de hijos por
familia en dicho país es ahora distinto de 3? (1 p)

SOLUCIÓN:

a) Se pide realizar un contraste de hipótesis para comprobar si 𝜇 < 3.


1° Se definen las hipótesis (0.5 p):
𝐻0 : 𝜇 ≥ 3; 𝐻! : 𝜇 < 3
2° Se define el estadístico de contraste (0.25 p):
2.7−3
Como se usa el valor de 𝜎  𝑧0 = 1.4 = −2.14
√ 100
3° La distribución de Z0 es (0.25 p): 𝑍0 ~𝑁(0,1)

4° Se realiza el contraste utilizando el p-valor


𝛼 = 0.05
𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 𝑃(𝑍 < −2.14) = 0.0162 (0.5 p)
𝑝 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼 → 𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0

Respuesta: Hay suficiente evidencia para afirmar que el número medio de hijos en dicho país ha
disminuido (es ahora menor que 3) (0.5 p).

b) El valor del margen de error es:


1.4
𝐿 = 1.96 = 0.4638
√35

𝐼. 𝐶(0.95): 𝜇 ∈ {3.2 ± 0.4638} (1 p)


𝜇 ∈ [2.7362; 3.6638] (0.5 p)

c) Para obtener 𝐿 = 0.1, se debe tener una muestra de tamaño (1.5 p):
1.96×1.4 2
𝑛=( ) = 752.95 ≈ 753
0.1
d) Se quiere comprobar si 𝜇 ≠ 3, por lo que se debe realizar un contraste de hipótesis bilateral. Esto equivale
a comprobar si el valor 3 se encuentra en el intervalo de confianza del 95%:

Se tiene el intervalo de confianza del apartado anterior:

𝐼. 𝐶(0.95): 𝜇 ∈ [2.7362; 3.6638]

- Se comprueba si 3 pertenece al intervalo (0.5 p).


- Como sí pertenece, se puede aceptar la hipótesis nula de dicho contraste: no hay suficiente evidencia
para afirmar que la media sea distinta de 3 (0.5 p).
NOTA REVISADA FIRMA ESTADÍSTICA BÁSICA
SEMESTRE 2017-II
SUSTITUTORIO
09/12/2017

APELLIDOS:______________________________________________NOMBRE:_____________________________
Sección:___________________
Sólo se puede consultar el formulario y tablas de la asignatura. Salvo que se indique lo contrario usa 𝜶 = 𝟎. 𝟎𝟓.
Contesta cada pregunta sólo en la hoja de su enunciado, por ambas caras. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega,
pero no se corrige. Entrega cada pregunta por separado, y el cuadernillo aparte.
Cuando se solicite reclamo, deberá adjuntarse copia de la solución que se publique. El reclamo deberá basarse en esa solución.

1. Para las siguientes cuestiones, responde si son verdaderas o falsas, justificando adecuadamente tu NOTA
respuesta
(el puntaje se obtiene por la justificación, y no por haber acertado en si son verdaderas o falsas)
FIRMA
a) En una población normal, el estimador de 𝜎 2 aplicando el método de los momentos es la cuasivarianza.
(1p)

Solución:

Según el método de los momentos, el estimador de la varianza será el segundo momento centrado muestral, es
decir, la varianza muestral (divide por n), y no la cuasivarianza (divide por n-1). La afirmación es, por tanto, falsa.
∑𝑛 (𝑋 − 𝑋̅)2 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅ )2
𝜎 2 = 𝐸[(𝑋 − 𝜇)2 ] ≡ 𝑀2𝑐 ⇒ 𝜎̂ 2 = 𝑀 ̂2𝑐 = 𝑚2𝑐 = 𝑖=1 𝑖 ≠
𝑛 𝑛−1

b) Cuando cierto proceso productivo funciona adecuadamente, fabrica piezas cuya longitud sigue una variable aleatoria
normal de media 𝜇 = 10 y desviación típica 𝜎 = 2. Para analizar si la media del proceso cambia, se toma una muestra
de 𝑛 = 16 y se calcula 𝑥̅ . Asumiremos que la varianza poblacional no va a variar. Entonces, si la media muestral
obtenida difiere de 𝜇 en más de 0.5 unidades (en valor absoluto), deberemos concluir que, con un nivel de significación
del 5%, la media del proceso ha cambiado. (1p)

Solución:

Si queremos saber si la media del proceso cambia podemos hacer el contraste 𝐻0 : 𝜇 = 10, 𝐻1 : 𝜇 ≠ 10, donde el
estadístico de contraste, puesto que la varianza poblacional es conocida, será

𝑥̅ − 𝜇 𝑥̅ − 10
𝑧0 = 𝜎 = = 2(𝑥̅ − 10).
⁄ 𝑛 2⁄
√ √16

Como la población es normal y estamos usando el valor poblacional de 𝜎 2 , la distribución de referencia es la N(0,1).
El test es a dos colas, y la región de rechazo será:

1.96
|𝑧0 | = 2|𝑥̅ − 10| > 𝑧0.025 = 1.96 ⇒ |𝑥̅ − 10| > > 0.98 ≈ 1
2

Es decor, el nivel de significación será de 0.05 si rechazamos cuando |𝑥̅ − 10| > 1. Por tanto, concluiremos, con un
5% de significación, que 𝜇 ha cambiado sólo si 𝑥̅ difiere de 𝜇 en al menos una unidad, y no en 0.5 unidades. La
afirmación es, por tanto, falsa.
c) De una población de media 𝜇 = 10 y varianza 𝜎 2 = 1 tomamos una muestra de 𝑛 = 100 observaciones. La
probabilidad de que la media 𝑥̅ de esa muestra sea mayor a 11 es prácticamente nula. (1p)

Solución
De la información del enunciado se deduce que 𝑥̅ es normal de media 𝜇 = 10 y varianza 𝜎 2 ⁄𝑛 = 0.01; es decir,𝑥̅ ∼
𝑁(10; 0.01). Por tanto
𝑥̅ − 𝜇 11 − 10
𝑃(𝑥̅ > 11) = 𝑃 ( 𝜎 > ) = 𝑃(𝑧 > 10) ≈ 0.
1
√𝑛 10
Por lo tanto, esta afirmación es cierta.

2. De una población normal se obtienen las observaciones: 0.34, 1.53, −0.20, 1.17, 0.25, 2.43, 2.26, 0.22. Se piensa que
esta muestra procede de una población de varianza 𝜎 2 = 0.4967 . Contrasta esta afirmación. (2p)

Solución

Hacemos el contraste
𝐻0 : 𝜎 2 = 0.4967
𝐻1 : 𝜎 2 ≠ 0.4967
El estadístico de contraste es

(𝑛 − 1)𝑠̂ 2 7 × 0.9984
𝑋0 = = = 14.0705
𝜎02 0.4967

donde hemos utilizado que, a partir de la muestra disponible de 𝑛 = 8 observaciones, 𝑠̂ 2 = 0.9984.

Al tratarse de una población normal, la distribución de referencia para este estadístico de contraste es la 𝜒72

Nos piden que resolvamos el contraste calculando el pvalor, en lugar


de calcular los valores críticos. Al ser un contraste a dos colas, el
pvalor será el doble del área desde 14.0705 a la derecha, como se
muestra en la figura. En la tabla vemos que 𝑃(𝜒72 > 14.07) = 0.05,
por lo que el pvalor será

𝑝𝑣𝑎𝑙𝑜𝑟 = 2 × 𝑃(𝜒72 > 14.07) = 0.10

Como es mayor que 𝛼 = 0.05 no podemos rechazar 𝐻0 , por lo que


hay evidencia suficiente para asumir que 𝜎 2 = 0.4967. O bien, no
podemos rechazar que 𝜎 2 = 0.4967.

Si calculamos los valores críticos para este nivel de


significación tenemos:
2 2
𝜒𝑛−1;𝛼 ⁄2 = 𝜒7;0.025 = 16.01,
2 2
𝜒𝑛−1;1−𝛼 ⁄2 = 𝜒7;0.975 = 1.69.
La región de aceptación es, por tanto, la zona 1.69 ≤
𝑋0 ≤ 16.01 . Como 𝑋0 = 14.0705 , la muestra se
encuentra en la región de aceptación, por lo que hay
evidencia suficiente para asumir que 𝜎 2 = 0.4967.
3. Se mide la eficacia de frenado de un conjunto de autos. A mayor eficacia, los frenos tienen mayor capacidad de
frenado. Se dividen los datos en dos grupos de autos: los que tienen sistema ABS (antibloqueo) y los que no lo tienen.
Las siguientes figuras muestran un resumen estadístico de estas dos muestras, realizado con Minitab.

Responde a las siguientes cuestiones justificando tu respuesta, en especial la relativa a la distribución de referencia
que se use en cada apartado:

a) Construye un intervalo de confianza para la eficacia media de frenado de los autos sin ABS e interpreta el significado
de dicho intervalo. (1p)

El contraste de bondad de ajuste de Anderson Darling (AD) nos dice que podemos asumir normalidad
(pvalor=0.150). Además, la desviación estándar que proporciona el Minitab es realmente la cuasi-desviación
estándar, 𝑠̂ . Por tanto, en el intervalo debemos usar la distribución t de Student y dicha estimación 𝑠̂ . El
intervalo será:
𝑠̂ 5.689
𝐼𝐶(0.95): 𝜇 ∈ [𝑥̅ ± 𝑡40;0.025 ] = [58.411 ± 2.021 ]
√𝑛 √41

= [58.411 ± 1.7956] = [56.6154; 60.2066]

Interpretación: Tenemos una confianza del 95% de que la media poblacional 𝜇 sea un valor contenido entre los
límites de este intervalo. El 95% de las muestras a las que se les aplique esta fórmula, obtendrán intervalos que
sí contendrán el verdadero valor de 𝜇. No sabemos si nuestra muestra forma parte de ese 95%, o del 5%
restante.
b) Analiza mediante un contraste estadístico si el ABS mejora la eficacia media de frenado. Justifica adecuadamente
todas las decisiones que tomes en tu procedimiento. (4p)

Solución
Usaremos el subíndice 1 para los autos con ABS y 2 para los autos sin ABS. Sin una adecuada justificación no hay
puntaje.

• (0.5p) El contraste que hay que realizar es


𝐻0 : 𝜇1 ≤ 𝜇2 𝑣𝑒𝑟𝑠𝑢𝑠 𝐻1 : 𝜇1 > 𝜇2

Justificación: Se posee información de dos muestras independientes, una muestra de la


población 1 (autos con ABS y eficacia de frenado media 𝜇1 ) y otra de la población 2 (autos sin
ABS, con eficacia de frenado media 𝜇2 ). Necesitamos conocer cómo son las medias
poblacionales de las que proceden estas muestras. Si el ABS mejora la eficacia media tendremos
que 𝜇1 > 𝜇2 , y si no la mejora tendremos 𝜇1 ≤ 𝜇2 . Como la hipótesis nula debe tener el signo
igual, el contraste a realzar será, por tanto, 𝐻0 : 𝜇1 ≤ 𝜇2 𝐻1 : 𝜇1 > 𝜇2 .

• (0.5p) Utilizaremos el estadístico de contraste basado en varianzas poblacionales iguales:


𝑥̅1 − 𝑥̅2
𝑡0 =
1 1
𝑠̂ 𝑇 √ +
𝑛1 𝑛2

Justificación: El estadístico de contraste de este test depende de si las varianzas de ambas


poblaciones son iguales, 𝜎12 = 𝜎22 , o diferentes, 𝜎12 ≠ 𝜎22 . No tenemos esa información de la
población, sino sólo las cuasivarianzas de las muestras, 𝑠̂12 y 𝑠̂22 , calculadas con el Minitab.
Puede observarse, no obstante, que ambas cuasivarianzas son iguales: 𝑠̂12 = 𝑠̂22 = 32.369, por
lo que no podremos rechazar que ambas varianzas poblacionales sean iguales, 𝜎12 = 𝜎22 . Es
decir, si planteásemos un contraste 𝐻0 : 𝜎12 = 𝜎22 𝐻1 : 𝜎12 ≠ 𝜎22 , al observar que 𝑠̂12 = 𝑠̂22
aceptaríamos 𝐻0 directamente, sin necesidad de evaluar ningún estadístico de contraste, pues
los datos no contradicen la hipótesis nula (recuerda que, en cualquier contraste, siempre
aceptamos 𝐻0 salvo que los datos hagan lo que dice 𝐻1 de forma muy evidente).

• (0.5p) Calculamos el valor del estadístico a partir de los datos. Como ambas cuasivarianzas son iguales, el estimador
agrupado será igual a las cuasivarianzas:

(𝑛1 − 1)𝑠̂12 + (𝑛2 − 1)𝑠̂22


𝑠̂ 𝑇2 = = 32.369 (= 𝑠̂12 = 𝑠̂22 ).
𝑛1 + 𝑛2 − 2
y el estadístico de contraste es:
𝑥̅1 − 𝑥̅2 59.851 − 58.411
𝑡0 = = = 1.4422
1 1 1 1
𝑠̂ 𝑇 √ + 5.6894√ +
𝑛1 𝑛2 156 41

• (1p) La distribución de referencia es 𝑡195

Justificación: tanto los histogramas como los contrastes de normalidad de Andreson-Darling


nos llevan a asumir la normalidad de ambas poblaciones (pvalores 0.439 y 0.15,
respectivamente). Como, además, estamos usando como estimador de la varianza poblacional
a 𝑠̂ 𝑇2 , la distribución de referencia será
𝑡0 ∼ 𝑡𝑛1+𝑛2−2 = 𝑡195 .
• (0.5p) Tomaremos como región de rechazo son los valores 𝑡0 > 1.66

Justificación: La región de rechazo está donde indique 𝐻1 . En este caso, si 𝜇1 > 𝜇2 el estadístico
tenderá a tener valores positivos muy altos. La región de rechazo estará a la derecha de la
distribución 𝑡195 . Por tanto, el valor crítico es 𝑡195;0.05 ≈ 1.66 (como no hay tablas de 𝑡195 se ha
tomado el valor de 𝑡100;0.05). La región de rechazo serán los valores 𝑡0 tal que 𝑡0 > 1.66.

• (1p) No podemos rechazar la hipótesis nula de que el ABS no mejora la eficacia de frenado, con un nivel de
significatividad del 5%.

Justificación: En nuestro caso, con 𝑡0 = 1.44 < 1.66 estamos en la región de aceptación. No
podemos rechazar la hipótesis nula de igualdad de medias. Los datos no aportan evidencia
suficiente para afirmar que el ABS ayude a aumentar la eficacia de frenado. La diferencia de
eficacia media encontrada en ambas muestras no es significativa, y puede explicarse por el azar
del muestreo.

(Este resultado es lógico, pues el ABS simplemente impide que la rueda se bloque durante la frenada, mientras que la
eficacia tiene que ver con la mayor o menor presión que ejerce el freno. Además, la prueba que se realiza para medir
esta eficacia se realiza de tal manera que no se bloqueen las ruedas, por lo que el sistema ABS no se activa en ningún
momento de la medición)
APELLIDOS:______________________________________________NOMBRE:________________________
Sección:___________________ NOTA
.

1. Se desea predecir la velocidad máxima que un auto es capaz de alcanzar a partir de la potencia de
FIRMA
su motor (potencia), peso (peso) y un coeficiente aerodinámico (aerodin). A continuación, se
muestran los principales resultados.

Responda a las siguientes preguntas usando únicamente el espacio asignado.

a. Escriba las dos hipótesis básicas del modelo general de regresión. Use únicamente una línea para cada una. (1 p)

Linealidad

Normalidad del error (además, media cero y homocedasticidad)

No es válido si han escrito las hipótesis del test de significatividad individual.

b. Interprete el coeficiente de la variable peso en el modelo de regresión. (0.5 p)

Cuando el peso de un auto aumente en una unidad, la velocidad máxima disminuirá en 0.02418 por término medio,

mientras la potencia y el coeficiente aerodinámico permanezcan constantes.

De haber escrito que la velocidad “aumenta”, la respuesta se invalida.

c. Un auto pesa 1300 kg, tiene un motor con una potencia de 180 y un coeficiente aerodinámico de 0.85.
Asumiendo que se cumplen las hipótesis básicas del modelo, ¿cuál es la probabilidad de que tenga una velocidad
máxima mayor que 220? Debe mostrar su procedimiento. (0.5 p)

𝑒𝑖 ~𝑁(0, 5.400342 )

𝐸(𝑃𝑒𝑠𝑜 | 𝑋 = (180; 0.85; 1300) = 180.51 + 0.6131 × 180 − 57.5 × 0.85 − 0.02148 × 1300 = 𝟐𝟏𝟒. 𝟎𝟔𝟗

𝑉𝑎𝑟(𝑃𝑒𝑠𝑜 | 𝑋 = (180; 0.85; 1300) = 𝟓. 𝟒𝟎𝟎𝟑𝟒𝟐

𝑃𝑒𝑠𝑜 | 𝑋 = (180; 0.85; 1300) ~𝑁(214.069; 5.400342 )

Entonces:

220 − 214.069
𝑃(𝑋 > 220) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 1.1) = 1 − 0.8643 = 𝟎. 𝟏𝟑𝟓𝟕
5.40034
APELLIDOS:______________________________________________NOMBRE:________________________
NOTA
Sección:___________________
.

FIRMA
2. Complete la siguiente tabla con la información solicitada:

- En la columna “modelo de probabilidad” (0.25 p), escriba únicamente qué modelo de


probabilidad describe mejor a la variable (binomial, uniforme continua, uniforme discreta, etc.). De escribir dos
o más modelos, la respuesta se invalida. Si el modelo escrito es incorrecto, el apartado se invalida.
- En la columna “parámetros” (0.25 p), escriba únicamente los parámetros que definen al modelo de probabilidad
y su valor numérico. De escribir un parámetro que no es el que define al modelo, la respuesta se invalida.
- En la columna “probabilidad” (0.5 p), escriba únicamente la respuesta de la probabilidad calculada con una
precisión de 4 decimales. De escribir dos o más valores, alguna explicación (numérica o escrita) adicional, o no
utilizar 4 decimales, la respuesta se invalida.

Parámetro(s)
Modelo de
Variable (𝑿) que define(n) al Probabilidad Puntaje
probabilidad de 𝑿
modelo

𝑛 = 20
Probabilidad de que en la clase
(a) En una clase hay 20 alumnos. Se sabe 𝑝 = 0.40 haya como máximo 7 alumnos
que 3 de cada 5 alumnos no utilizan con anteojos.
Binomial
anteojos. 𝑋 es el número de alumnos De haber usado
que usan anteojos en la clase. 𝒑 = 𝟎. 𝟔𝟎, la 𝟎. 𝟒𝟏𝟓𝟗
respuesta se
invalida

(b) 𝑋 es el número de defectos que se


encuentran en un cable eléctrico de 12
Probabilidad de que haya más
metros. Se sabe que los defectos
𝑑𝑒𝑓. de 5 defectos en el cable.
aparecen de manera estable e Poisson λ=4
independiente y que, por término 𝑐𝑎𝑏𝑙𝑒
𝟎. 𝟐𝟏𝟒𝟗
medio, se encuentra 1 defecto cada 3
metros.

(c) Se desea elegir al azar a una persona


de un grupo de 8 voluntarios. Para ello,
Uniforme discreta
se asigna un número entero del 1 al 8
Probabilidad de que salgan
(sin repetición) a cada voluntario y
De no haber escrito 𝑎=1
escogidos el número 2 o el 7.
luego se realiza un sorteo
“discreta”, la
seleccionando aleatoriamente uno de 𝑏=8
respuesta no es 𝟎. 𝟐𝟓𝟎𝟎
los números. Siendo 𝑋 el número
válida
elegido en el sorteo, ¿qué distribución
sigue 𝑋?

(d) En una planta ocurren accidentes 𝑎𝑐𝑐.


con un ritmo promedio de 1 accidente λ = 0.0357
𝑑í𝑎 Probabilidad de que pasen más
cada 4 semanas (semanas de 7 días), de
o bien: de 20 días.
manera independiente. Acaba de Exponencial
ocurrir un accidente; 𝑋 es el número de
1 𝑎𝑐𝑐. 𝟎. 𝟒𝟖𝟗𝟓
días que pasarán hasta que ocurra otro λ=
accidente. ¿Qué distribución sigue 𝑋? 28 𝑑í𝑎

(e) Un estudiante responde un examen


Probabilidad de que acierte al
que consta de 10 preguntas de 𝑛 = 10
menos 5 preguntas.
verdadero y falso. Contesta todas las Binomial
preguntas al azar. 𝑋 es el número de 𝑝 = 0.50
𝟎. 𝟔𝟐𝟑𝟎
preguntas contestadas correctamente.
NOTA
APELLIDOS:______________________________________________NOMBRE:________________________
Sección:___________________
.
FIRMA

3. Una central que monitorea la información climatológica de un país tiene la siguiente información histórica
sobre su ciudad capital durante los días de verano:

- El 70% de los días son soleados.


- El 40% de los días soleados tienen presencia de lluvia.
- El 30% de los días tienen presencia de lluvia.
- El 70% de los días en los que se presentan lluvia tienen presencia de vientos fuertes.
- El 20% de los días tienen presencia de vientos fuertes, pero no de lluvia.

La empresa proveedora de fluido eléctrico desea averiguar qué tan bien preparado está su sistema de transmisión ante
la posibilidad de averías ante lluvias, debido a unas mejoras muy costosas que recientemente se han implementado. Se
tiene la información histórica de que, durante los días de verano:

- El 1% de los días tienen presencia de averías en el sistema de transmisión.


- El 28% de los días tienen presencia de averías en el sistema de transmisión o tienen presencia de lluvias.

Utilice la siguiente notación para los sucesos elementales:

Suceso L El día tiene presencia de lluvia


Suceso S El día es soleado
Suceso V El día tiene presencia de vientos fuertes
El día tiene presencia de averías en el sistema
Suceso A
de transmisión

Responda a las siguientes cuestiones, mostrando su procedimiento. (1 p cada apartado):

a. ¿Son independientes la presencia de lluvia y la presencia de averías en el sistema de transmisión eléctrico?


Demuestre analíticamente.

Si hay independencia, se debe cumplir: 𝑃(𝐿 ∩ 𝐴) = 𝑃(𝐿) × 𝑃(𝐴)

Se sabe que:
- El 30% de los días tienen presencia de lluvia: 𝑃(𝐿) = 0.30
- El 1% de los días tienen presencia de averías en el sistema de transmisión: 𝑃(𝐴) = 0.01
- El 28% de los días tienen presencia de averías en el sistema de transmisión o tienen presencia de lluvias:
𝑃(𝐿 ∪ 𝐴) = 0.28

Entonces:

𝑃(𝐿 ∪ 𝐴) = 0.28 = 𝑃(𝐿) + 𝑃(𝐴) − 𝑃(𝐿 ∩ 𝐴) = 0.30 + 0.01 − 𝑃(𝐿 ∩ 𝐴) → 𝑷(𝑳 ∩ 𝑨) = 𝟎. 𝟎𝟑 (𝟎. 𝟓 𝐩)

Por lo tanto:

𝑃(𝐿 ∩ 𝐴) = 𝑃(𝐿) × 𝑃(𝐴)

0.03 = 0.30 × 0.01 → 𝑠𝑒 𝑐𝑢𝑚𝑝𝑙𝑒 𝑙𝑎 𝑐𝑜𝑛𝑑𝑖𝑐𝑖ó𝑛

Respuesta: Sí hay independencia entre ambos sucesos. (𝟎. 𝟓 𝐩)

Si solo han escrito el criterio para identificar la independencia, pero no han calculado la intersección, no es válido.

Si han usado un criterio incorrecto para identificar la independencia, solo hay puntaje si han calculado bien la
intersección.

continúa 
b. ¿Qué proporción de los días en los que se presentan lluvias son soleados? Dé su respuesta con una precisión de 4
decimales.

Se pide: 𝑃(𝑆 | 𝐿) (𝟎. 𝟐𝟓 𝐩)

Se sabe que:
- El 40% de los días soleados tienen presencia de lluvias: 𝑃(𝐿 | 𝑆) = 0.40
- El 70% de los días son soleados: 𝑃(𝑆) = 0.70
- El 30% de los días tienen presencia de lluvia: 𝑃(𝐿) = 0.30

𝑃 (𝐿 | 𝑆) × 𝑃(𝑆) 0.40 × 0.70


𝑃(𝑆 | 𝐿) = = = 𝟎. 𝟗𝟑𝟑𝟑 (𝟎. 𝟕𝟓 𝐩)
𝑃(𝐿) 0.30

c. ¿Cuál es la probabilidad de que llueva durante algún día de verano? Dé su respuesta con una precisión de 4 decimales.

El 30% de los días tienen presencia de lluvia: 𝑃(𝐿)(𝟎. 𝟐𝟓 𝐩) = 0.30 (𝟎. 𝟕𝟓 𝐩)


NOTA REVISADA FIRMA ESTADÍSTICA BÁSICA
SEMESTRE 2017-II
FINAL
27/11/2017

APELLIDOS:______________________________________________NOMBRE:_____________________________
Sección:___________________

Sólo se puede consultar el formulario y tablas de la asignatura. Salvo que se indique lo contrario usa 𝜶 = 𝟎. 𝟎𝟓.
NOTA
Contesta cada pregunta sólo en la hoja de su enunciado, por ambas caras. Usa el cuadernillo sólo como borrador. El cuadernillo
se entrega, pero no se corrige. Entrega cada pregunta por separado, y el cuadernillo aparte.
Cuando se solicite reclamo, deberá adjuntarse copia de la solución que se publique. El reclamo deberá basarse en esa solución.
FIRMA 1. Para las siguientes cuestiones, contesta si son verdaderas o falsas, justificando brevemente la respuesta.
Emplea sólo el espacio que se proporciona.

a) Sólo se puede usar la distribución t de Student para el contraste de una media si la muestra es pequeña y la
población es normal. (1p)

Falso. Si la población es normal de media 𝜇0 , el estadístico “t” basado en la cuasidesviación típica,


𝑥̅ − 𝜇0
𝑡0 = ,
𝑠̂ ⁄√𝑛
que es el que se usa en el contraste, se distribuye como una t de Student para cualquier tamaño
muestral.

b) Si tenemos 40 datos, y obtenemos con ellos que 𝑝̂ = 0.30, no deberemos hacer un contraste de hipótesis de una
proporción asumiendo muestras grandes. (1p)

Falso. Para poder hacer inferencia de una proporción utilizando la aproximación a la normal influye
tanto 𝑛 como 𝑝. En este caso se tiene que 𝑛𝑝̂ (1 − 𝑝̂ ) = 40 × 0.3 × 0.7 = 8.4 > 5 por lo que podemos
asumir que la muestra es suficientemente grande y usar la aproximación a la normal.

c) A partir de una muestra se construye un intervalo de confianza para 𝜇. Entonces, cualquier valor 𝜇0 que esté contenido
en él será una hipótesis nula que no se podrá rechazar en un contraste bilateral. (1p)

Verdadero. Puede demostrarse que un contraste bilateral 𝐻0 : 𝜇 = 𝜇0 con nivel de significación 𝛼, es


equivalente a comprobar si 𝜇0 está dentro de un intervalo de confianza de nivel 1 − 𝛼. Si está dentro,
aceptamos 𝐻0 .

d) A partir de una muestra se obtiene 𝑥̅ = 11. Si se rechaza 𝐻0 : 𝜇 = 10 con pvalor 0.02, se rechazará 𝐻0 : 𝜇 ≥ 10 con
pvalor 0.01. (1p)

Falso. Si 𝑥̅ = 11 no podremos nunca rechazar 𝐻0 : 𝜇 ≥ 10. Sólo se rechaza una hipótesis nula si los datos la contradicen;
es decir, si hacen lo contrario de forma muy evidente. En este caso sólo se podría rechazar 𝐻0 : 𝜇 ≥ 10 si 𝑥̅ ≪ 10.
2. ¿Qué tamaño muestral es necesario para estimar la proporción de hogares que cuenta con conexión a internet si se quiere
asegurar que el margen de error sea menor a 0.05? (1.5p)

Como no conocemos el valor de 𝑝, nos ponemos en el peor der los casos, que es cuando 𝑝 = 𝑞 = 0.5. El tamaño muestral será,
redondeando al entero superior:
2
𝑧0.025 √0.5 0.5 1.96 2
𝑛 = ⌈( ) ⌉ = ⌈( ) ⌉ = 385
0.05 2(0.05)

3. A partir de una muestra de 35 datos de una población normal se construye un intervalo de confianza para la varianza
poblacional del 95%, resultando 𝜎 2 ∈ (2.62; 6.87) ¿Cuál sería el intervalo del 90%? Justifica. (1.5p)

SOLUCIÓN

Del intervalo se obtiene que:


(𝑛 − 1)𝑠̂ 2 34 × 𝑠̂ 2 34 × 𝑠̂ 2 2.67 × 46.98
2 = 2.67 ⇒ 2 = = 2.67 ⇒ 𝑠̂ 2 = = 3.69
𝜒𝑛−1;𝛼⁄2 𝜒34;0.025 46.98∗ 34
2
(* como en las tablas no se tiene el caso de 𝑔 = 34, aproximamos al valor 𝜒30;0.025 = 46.98)

El intervalo de confianza del 90% será entonces:

34 × 3.69 34 × 3.69 34 × 3.69 34 × 3.69


𝐼𝐶(0.90): 𝜎 2 ∈ [ 2 ; 2 ]=[ ; ] = [2.86; 6.78]
𝜒34;0.05 𝜒34;0.95 43.77∗ 18.49∗

2 2
(* como en las tablas no se tiene el caso de 𝑔 = 34, aproximamos a los valores 𝜒30;0.05 = 43.77 y 𝜒30;0.95 = 18.49)

4. Se pesa una muestra de monedas del mismo tipo, obteniéndose los siguientes valores en gramos:
9.0; 9.3; 9.3; 9.2; 9.2; 9.1; 9.2; 9.3; 9.3;
Asumiendo que el peso de las monedas se distribuye como una normal, ¿puede afirmarse que el peso medio de este tipo
de monedas es de 9.2 gramos? Justifica tu respuesta. (3p)

SOLUCIÓN:

Se realiza un contraste de hipótesis:


𝐻0 : 𝜇 = 9.2
𝐻1 : 𝜇 ≠ 9.2
El estadístico de contraste es
𝑥̅ − 9.2 9.2111 − 9.2
𝑡0 = = = 0.3159.
𝑠̂ /√9 0.1054/√9

Como la población es normal, la distribución de referencia es 𝑡𝑛−1 = 𝑡8 .

El contraste es bilateral, con región de rechazo a dos colas. La región de rechazo es |𝑡| > 𝑡8;0.025 = 2.306 .

Por tanto, estamos en la región de aceptación. Con un nivel de significación del 5%, sí hay evidencia suficiente para afirmar
que la media poblacional sea 9.2. La diferencia encontrada entre 𝑥̅ = 9.2111 y 9.2 no resulta significativa y puede deberse
al azar del muestreo.
NOTA
APELLIDOS:______________________________________________NOMBRE:________________________
Sección:___________________
.
FIRMA

5. Se desea predecir, mediante un modelo de regresión lineal múltiple, la Nota de un alumno (escala del 0 al 10)
a partir de sus horas de estudio (horas_estudio), sus horas de asistencia a clase (horas_clase) y su inversión en
material de estudio (Inversion). A continuación, se muestran los resultados obtenidos en el análisis de regresión.

Responda a las siguientes cuestiones:

a. ¿Qué puede concluir del gráfico número 1? Usa como máximo 1 línea. (1 p)

A partir de la gráfica, se puede concluir que el error sigue una distribución normal. 𝑒𝑖 ~𝑁(0, 0.9696762 ) (1 p)

Otra respuesta: Se concluye que hay normalidad (0.5 p)

Respuesta NO válida: Se concluye que hay linealidad (0 p). Si esta afirmación se incluye en alguna de las
respuestas anteriores, se tendrá un descuento de 0.25 p.

b. La variable Inversión tiene un p-valor asociado a un test de significatividad individual. ¿Cuáles son las hipótesis
nula y alternativa de dicho contraste? Escribe solo las hipótesis. (0.5 p)

𝐻0 : 𝛽3 = 0
𝐻1 : 𝛽3 ≠ 0

Respuestas NO válidas:
̂𝟑 = 𝟎
𝑯𝟎 : 𝜷
̂𝟑 ≠ 𝟎
𝑯𝟏 : 𝜷

𝑯𝟎 : 𝜷𝟎 = 𝟎
𝑯𝟏 : 𝜷𝟎 ≠ 𝟎

𝑯𝟎 : 𝐈𝐧𝐯𝐞𝐫𝐬𝐢𝐨𝐧 = 𝟎
𝑯𝟏 : 𝐈𝐧𝐯𝐞𝐫𝐬𝐢𝐨𝐧 ≠ 𝟎

𝑯𝟎 : 𝑰 = 𝟎
𝑯𝟏 : 𝑰 ≠ 𝟎

c. Interpreta el coeficiente de la variable horas_estudio en el modelo de regresión. Usa como máximo 3 líneas. (1
p)

Por cada hora de estudio adicional, la nota de un estudiante aumentará en 0.1207 puntos por término medio, si los
valores de las demás variables permanecen constantes.
La respuesta debe estar completa para obtener el punto completo.

d. Interpreta el valor de 𝑅2 . Usa como máximo 2 líneas. (0.5 p)

El modelo de regresión explica el 67.05% de la variabilidad de la Nota.

e. ¿Cuál es la ventaja del 𝑅2 ajustado (𝑅̅2 ) frente al 𝑅2 ? Usa como máximo 2 líneas. (0.5 p)

A diferencia del 𝑅2 , el 𝑅2 ajustado (𝑅̅ 2 ) solo aumenta cuando se añaden variables significativas al modelo.

f. Un estudiante ha invertido $60 en material de estudio, ha estudiado 25 horas y ha asistido a 45 horas de clase.
¿Cuán probable es que obtenga una nota mayor que 5? Muestra todo tu procedimiento. (2 p)

𝑒𝑖 ~𝑁(0, 0.9696762 )

𝐼𝑛𝑣𝑒𝑟𝑠𝑖𝑜𝑛 = 60

ℎ𝑜𝑟𝑎𝑠_𝑒𝑠𝑡𝑢𝑑𝑖𝑜 = 25

ℎ𝑜𝑟𝑎𝑠_𝑐𝑙𝑎𝑠𝑒 = 45

𝐸(𝑁𝑜𝑡𝑎 | 𝑋 = (25; 45; 60)) = −1.015 + 0.1207 × 25 + 0.08417 × 45 + 0.01351 × 60


= 6.60075 (𝟎. 𝟐𝟓 𝒑)

𝑉𝑎𝑟(𝑁𝑜𝑡𝑎 | 𝑋 = (25; 45; 60)) = 0.9696762 (𝟎. 𝟐𝟓 𝒑)

→ 𝑵𝒐𝒕𝒂 | 𝑿 = (𝟐𝟓; 𝟒𝟓; 𝟔𝟎) ~ 𝑵(𝟔. 𝟔𝟎𝟎𝟕𝟓, 𝟎. 𝟗𝟔𝟗𝟔𝟕𝟔𝟐 ) (𝟏 𝒑)

𝑆𝑒 𝑝𝑖𝑑𝑒: 𝑃 (𝑁𝑜𝑡𝑎 > 5)

5 − 6.60075
𝑃(𝑁𝑜𝑡𝑎 > 5) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > −1.65) = 𝟎. 𝟗𝟓𝟎𝟓 (𝟎. 𝟓 𝒑)
0.969676
Para los últimos 0.5 puntos, todo debe ser correcto.
6. A continuación, se muestran los resultados de la prueba de bondad de ajuste de la variable tiempo (𝑋) y su histograma.

Histograma de tiempo
Normal
25
Media 41.22
Desv.Est. 25.39
N 90
20

Frecuencia
15

10

0
0 30 60 90 120
tiempo

Responda a las siguientes cuestiones (0.5 p cada una):

a. Escribe las hipótesis nula y alternativa de la prueba de bondad de ajuste a la normal de la variable tiempo (𝑋).

𝐻0 : 𝑋 ~ 𝑁 (41.22, 25.392 )

𝐻1 : 𝑋 ≁ 𝑁 (41.22, 25.392 )

b. ¿Qué distribución(es) se ajusta(n) a la variable tiempo?

Weibull y gamma.
Si solo han escrito una de las dos: 0.25 p.
Si han escrito alguna otra distribución: 0 p.

c. ¿Cuál es la mejor distribución que describe a los datos de la variable tiempo? Justifica tu respuesta en no más
de 1 línea.

Weibull, porque es la que tiene el mayor p-valor en la prueba de bondad de ajuste.

d. La transformación Box-Cox pretende obtener normalidad en los datos. ¿Cómo lo logra? Usa como máximo 1
línea.

Lo logra corrigiendo la asimetría.

e. ¿Cómo aplicaría la transformación Box-Cox con la variable tiempo? Usa como máximo 1 línea.

𝑋 λ; λ < 1
7. Se tienen datos del precio (𝑋) de un conjunto de 155 autos. Debido a que la variable precio no se distribuye normalmente,
se realiza una transformación Box-Cox, obteniéndose un valor óptimo de 𝜆 = 0.5. La variable transformada resultante sí
se distribuye normalmente.

A continuación, se muestra el histograma de la variable transformada y sus principales medidas descriptivas:

¿Cuál es la probabilidad de que el precio de un auto supere los 5500 dólares? (2 p)

𝑃(𝑋 > 5500) = 𝑃(𝑋 0.5 > 55000.5 ) = 𝑃(𝑋 0.5 > 74.16) (𝟎. 𝟓 𝒑)

𝑌𝑎 𝑞𝑢𝑒 𝑋 0.5 ~𝑁(66.7, 13.52 ), 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠:

74.16 − 66.7
= 𝑃 (𝑍 > ) = 𝑃(𝑍 > 0.55) (𝟏 𝒑)
13.5

= 1 − 0.7088 = 𝟎. 𝟐𝟗𝟏𝟐 (𝟎. 𝟓 𝒑) Esta respuesta debe ser coherente con la línea anterior.
NOTA REVISADA FIRMA ESTADÍSTICA BÁSICA
SEMESTRE 2017-II
PARCIAL
05/10/2017

APELLIDOS:______________________________________________NOMBRE:_____________________________
Sección:___________________

Contesta cada pregunta sólo en la hoja de su enunciado, por ambas caras. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega,
pero no se corrige. Entrega cada pregunta por separado, y el cuadernillo.
Cuando se solicite reclamo, deberá adjuntarse copia de la solución que se publique. El reclamo deberá basarse en errores de corrección en
base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.

NOTA 1. Durante varios días se han observado el número de


ejemplares vendidos cada día en la librería Crisol de un
determinado libro de un reconocido autor. A partir de esa
FIRMA información se obtiene el siguiente diagrama de frecuencias
acumuladas. Dibuja el diagrama de caja (box-plot) de este
conjunto de datos, especificando los valores numéricos que
se emplean en su construcción. Utiliza el eje de abscisas que
se proporciona. (2p)

La muestra tiene 30 datos. La mediana es el promedio entre el dato en posición 15 (6) y el dato en posición 16 (7). Por tanto
𝑄2 = 6.5. De los primeros 15 datos, su mediana es el dato en posición 8, que es 𝑄2 = 5. Asimismo, se tiene 𝑄3 = 8. El
rango intercuartílico es 3. La barrera interna superior estará en 8 + 1.5 × 3 = 12.5. La barrera interna inferior estará en
5 − 1.5 × 3 = 0.5. Por tanto, los bigotes se prologan por la izquierda hasta el mínimo (4), y por la derecha hasta el 11. El
14 queda marcado como dato atípico. (En la corrección, en general se descontará 0.333 por cada error)

2. La siguiente figura muestra el resultado de una regresión con Minitab. Escribe la ecuación de regresión e
interpreta sus coeficientes (3p)

𝑌̂ = 896 + 20,01 𝑋 (0.5𝑝)

• Por cada unidad de aumento de X, el valor previsto de 𝑌, es decir, 𝑌̂, aumenta en 20 unidades. (1.5p) (si se dice
que lo que aumenta no es 𝑌̂ sino 𝑌, 1p)
• El término constante sería el valor previsto de Y cuando X=0 (0.5p). Puede verse en el gráfico que ese valor está
fuera del rango de los datos, por lo que no procede atribuir ninguna interpretación a ese coeficiente. (0.5p)
APELLIDOS:____________________________________________________NOMBRE:________________________

Sección:___________________
.
NOTA

3. Para la fabricación de cierto artículo se utiliza una máquina que produce un 4% de artículos defectuosos. Con el fin
de mejorar la calidad, se ha ideado un test que permite detectar rápidamente si el artículo es defectuoso o no, sin
FIRMA
necesidad de hacer un análisis profundo que demoraría todo el proceso. La rapidez del test hace, sin embargo, que
éste no sea infalible. El test detecta el 95% de los artículos defectuosos. Cuando el artículo es aceptable, el test
identifica erróneamente que es defectuoso con una probabilidad del 1%. Usaremos la notación 𝐴 = artículo
aceptable, 𝐷 =artículo defectuoso, 𝑑 = el test determina que el artículo es defectuoso y 𝑎 =el test determina que el
artículo es aceptable. (5p)

a) Calcula las siguientes probabilidades. Escribe el resultado en la tabla con 4 decimales. No necesitas
justificar. (1p)
𝑃(𝑎|𝐴) 0.99 𝑃(𝑎|𝐷) 0.05 𝑃(𝐴|𝐷) 0 (0.25p)
𝑃(𝑑|𝐴) 0.01 𝑃(𝑑|𝐷) 0.95 𝑃(𝑎) 0.9524 (0.5p)

(Las 4 celdas de la izquierda es la información que se proporciona en el enunciado: 0.25p)

b) Si el test determina que un artículo es aceptable, ¿cuál es la probabilidad de que realmente lo sea?
Justifique. (2p)

𝑃(𝑎) = 𝑃(𝑎|𝐴)𝑃(𝐴) + 𝑃(𝑎|𝐷)𝑃(𝐷) = 0.99(0.96) + 0.05(0.04) = 0.9524


𝑃(𝑎|𝐴)𝑃(𝐴) 0.99(0.96)
𝑃(𝐴|𝑎) = = = 0.9979 (99.79%)
𝑃(𝑎) 0.9524
(1𝑝) (1𝑝)
(si no hay justificación no hay puntaje)

c) Todos los artículos producidos son analizados con este test. Cuando el test identifica que un artículo es
defectuoso, éste se retira del proceso. Es decir, sólo se consideran aquellos artículos que pasen el test.
¿Qué proporción de artículos defectuosos se tendrá como resultado de este procedimiento de
depuración? (1p)

Sólo se consideran artículos que pasen el test. De ellos, los defectuosos son
𝑃(𝐷|𝑎) = 1 − 𝑃(𝐴|𝑎) = 1 − 0.9979 = 0.0021 (0.21%)
(0.25𝑝) (0.75𝑝)

(si no hay justificación no hay puntaje)

b) ¿Qué proporción de los artículos descartados era aceptable? (1p)

𝑃(𝑑|𝐴)𝑃(𝐴) 0.01(0.96) (0.01)(0.96)


𝑃(𝐴|𝑑) = = = = 0.2017 (20.17%)
𝑃(𝑑) 1 − 0.9524 0.0476
(0.5𝑝) (0.5𝑝)

(si no hay justificación no hay puntaje)


APELLIDOS:______________________________________________NOMBRE:________________________
NOTA
Sección:___________________
.

FIRMA
4. Para cada una de las siguientes variables descritas, identifique el modelo de probabilidad que sigue y los
parámetros que definen el modelo. Escoja entre las siguientes opciones:

B:Binomial; E:Exponencial; P: Poisson; N:Normal; U:Uniforme continua

Ejemplo:

Modelo de
Variable Parámetros
probabilidad
La longitud de una pieza (𝑋) es una variable normal que tiene una
N 𝑋~𝑁(15; 3)
esperanza de 15 m y una varianza de 3.

Puntuación:
Modelo elegido correctamente: + 0.25 p.
Parámetros elegidos correctamente: + 0.25 p. (solo si el modelo es elegido correctamente)
Modelo elegido incorrectamente: - 0.20 p.

Modelo de
Variable Parámetros
probabilidad

𝑋 es el número de personas que han sufrido 𝑋~𝐵(15000,0.15)


asaltos dentro de una ciudad con 15000
pobladores. La probabilidad de sufrir un asalto es 𝐵
la misma para todos los pobladores, y tiene un
valor de 15%. ¿Qué distribución sigue 𝑋? Si se ha escrito 1500, esta respuesta no es válida.

𝑋 es el número de defectos en un alambre de 15


m hecho de un material que tiene una tasa de 2.3 𝑑𝑒𝑓.
defectos/metro. La aparición de defectos es 𝑃 𝑋~ 𝑃𝑜𝑖 (34.5 )
𝑎𝑙𝑎𝑚𝑏𝑟𝑒 (15 𝑚)
estable e independiente. ¿Qué distribución sigue
𝑋?

Un niño juega en un estanque utilizando un cubo


de 5 litros para extraer peces. Se sabe que los
peces aparecen, con estabilidad e independencia, 𝑝𝑒𝑐𝑒𝑠
𝑃 𝑋~ 𝑃𝑜𝑖 (10.75 )
con una tasa de 2150 peces cada 1000 litros. 𝑐𝑢𝑏𝑜 (5𝑙)
Siendo 𝑋 el número de peces que el niño atrapa
en su cubo, ¿qué distribución sigue 𝑋?

𝑋 es un número real seleccionado al azar entre 0 y


1. La probabilidad de seleccionar un número es la 𝑈 𝑋~ 𝑈(0,1)
misma para todos. ¿Qué distribución sigue 𝑋?

Los accidentes en una planta ocurren de manera


estable e independiente. En promedio, ocurre 1
accidente cada 4 semanas (semanas de 7 días). 𝑎𝑐𝑐𝑖𝑑.
𝐸 𝑋~ 𝐸𝑥𝑝 (0.0357 )
Acaba de ocurrir un accidente; 𝑋 es el tiempo (en 𝑑í𝑎
días) que pasará hasta que vuelva a ocurrir otro
accidente. ¿Qué distribución sigue 𝑋?
APELLIDOS:______________________________________________NOMBRE:_________________________
Sección:___________________
.

NOTA 5. Se tienen las siguientes variables:

o 𝑿~𝑩(𝟓𝟎𝟎; 𝟎. 𝟑)
−3(𝑦 2 −4𝑦+3)
FIRMA o 𝒀, con una función densidad 𝑓(𝑦) = ; 𝑥 ∈ [1; 3].
4

a) Calcule la varianza de 𝑍 = 2𝑌 + 5. (1.5 p)


b) Calcule la probabilidad de que 𝑋 sea mayor que 250. (1 p)

SOLUCIÓN

a)

En primer lugar, se calcula la media de Y:

3
−3(𝑦 2 − 4𝑦 + 3)
𝐸(𝑌) = ∫ 𝑦 ∙ 𝑑𝑦 = 2 (𝟎. 𝟓 𝒑)
4
1

Luego, se calcula la varianza de 𝑌:


3
−3(𝑦 2 − 4𝑦 + 3)
𝑉𝑎𝑟(𝑌) = ∫(𝑦 − 2)2 ∙ 𝑑𝑦 = 0.2 (𝟎. 𝟓 𝒑)
4
1

Finalmente, se calcula la varianza de 𝑍:

𝑉𝑎𝑟(𝑍) = 𝑉𝑎𝑟(2𝑌 + 5) = 2 × 𝑉𝑎𝑟(𝑌) = 2 × 0.2 = 0.4 (𝟎. 𝟓 𝒑)

b)

𝑋~𝐵(500; 0.3)

Se pide:

500 250
500 500
𝑃(𝑋 > 250) = ∑ ( ) × 0.3𝑟 × 0.7500−𝑟 = 1 − ∑ ( ) × 0.3𝑟 × 0.7500−𝑟
𝑟 𝑟
𝑟=251 𝑟=0

(Si solo han hecho esto: 𝟎. 𝟐𝟓 𝒑)

Al ser una sumatoria muy grande, se evalúa si se puede aplicar el TCL para simplificar el cálculo:

𝑛𝑝𝑞 = 105 → 𝑠𝑒 𝑐𝑢𝑚𝑝𝑙𝑒 𝑒𝑙 𝑇𝐶𝐿

Entonces, se puede aproximar:

𝑋~𝑁(150; 105) (𝟎. 𝟐𝟓 𝒑)

Se debe haber definido claramente la aproximación a la norma.

Finalmente:

250 − 150
𝑃(𝑋 > 250) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 0.95) = 1 − 0.8289 = 0.1711 (𝟎. 𝟓 𝒑)
105
APELLIDOS:______________________________________________NOMBRE:_________________________
Sección:___________________
.

NOTA
6. Una empresa consultora ha realizado un estudio en un supermercado y ha determinado lo siguiente:

FIRMA - Los clientes se clasifican en tipo A y tipo B.


- Los clientes tipo A llegan al supermercado en un proceso de Poisson a razón de 80 clientes por minuto.
- Los clientes tipo B llegan al supermercado en un proceso de Poisson a razón de 120 clientes cada 3 minutos.
- El gasto de un cliente tipo A en el supermercado es una variable normal de media S/75 y desviación estándar S/10.
- El gasto de un cliente tipo B en el supermercado sigue una distribución: 𝐸𝑥𝑝(0.015).

Conteste, de manera justificada, las siguientes cuestiones:

a) ¿Cuán probable es que, desde que abre el supermercado, lleguen más de 5.3 clientes (incluye tanto a los de tipo
A como a los de tipo B) durante los primeros 5 segundos? (1.5 p)
b) El primer cliente (incluye tanto a los de tipo A como a los de tipo B) llegó después de 15 minutos de la apertura del
supermercado. ¿Cuán probable es que el siguiente cliente llegue antes de los próximos 3 segundos? (1 p)
c) Se va a incluir en una promoción a los clientes tipo A que gasten entre S/60 y S/95. ¿Qué proporción de clientes
tipo A no serán incluidos en la promoción? (1 p)
d) Indique cuál es el valor del gasto mínimo del 30% de los clientes tipo B que gasta más. (1.5 p)

Nota:
Para cada apartado, indique claramente qué variable está utilizando. Es decir, si utiliza una variable 𝑿, indique qué
representa. Por ejemplo “𝑿: Gasto de un cliente tipo B”.
Utilice 4 decimales para dar los valores de las probabilidades.

SOLUCIÓN:

a) Sea 𝑋: número de clientes que llegan al supermercado en 5 segundos. (𝟎. 𝟐𝟓 𝒑)

𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
𝑋~𝑃𝑜𝑖 (10 ) (𝟎. 𝟓 𝒑)
5 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠

𝑃(𝑋 > 5.3) = 𝑃(𝑋 > 5) (𝟎. 𝟐𝟓 𝒑) = 1 − 𝑃(𝑋 ≤ 5) = 1 − 0.0671 = 𝟎. 𝟗𝟑𝟐𝟗 (𝟎. 𝟓 𝒑)

Se debe haber trabajado con una única variable 𝑿 que represente al total de clientes que llegan al supermercado en 5
segundos.

Si se ha aproximado a la normal: descuento 𝟎. 𝟐𝟓 𝒑.

b) Sea 𝑋: tiempo (minutos) entre llegadas consecutivas de clientes (𝟎. 𝟐𝟓 𝒑)

𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
𝑋~𝐸𝑥𝑝 (120 )
𝑚𝑖𝑛𝑢𝑡𝑜

𝑃(𝑋 < 15.05 ∩ 𝑋 > 15) 𝑃(15 < 𝑋 < 15.05) 𝑃(𝑋 < 15.05) − 𝑃(𝑋 < 15)
𝑃(𝑋 < 15.05 | 𝑋 > 15) = = = (𝟎. 𝟓 𝒑)
𝑃(𝑋 > 15) 𝑃(𝑋 > 15) 𝑃(𝑋 > 15)

(1 − 𝑒 −1806 ) − (1 − 𝑒 −1800 )
= = 1 − 𝑒 −6 = 𝟎. 𝟗𝟗𝟕𝟓 (𝟎. 𝟐𝟓 𝒑)
𝑒 −1800
También es válido:

Sea 𝑋: tiempo (segundos) entre llegadas consecutivas de clientes (𝟎. 𝟐𝟓 𝒑)

𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
𝑋~𝐸𝑥𝑝 (2 )
𝑠𝑒𝑔𝑢𝑛𝑑𝑜

𝑃(𝑋 < 903 ∩ 𝑋 > 900) 𝑃(900 < 𝑋 < 903) 𝑃(𝑋 < 903) − 𝑃(𝑋 < 900)
𝑃(𝑋 < 903 | 𝑋 > 900) = = = (𝟎. 𝟓 𝒑)
𝑃(𝑋 > 900) 𝑃(𝑋 > 900) 𝑃(𝑋 > 900)

(1 − 𝑒 −1806 ) − (1 − 𝑒 −1800 )
= = 1 − 𝑒 −6 = 𝟎. 𝟗𝟗𝟕𝟓 (𝟎. 𝟐𝟓 𝒑)
𝑒 −1800

No son válidas “respuestas similares” con procedimientos no válidos.

c) Sea 𝑋: gasto de un cliente del tipo A.

𝑋~𝑁(75, 100)

Dentro de la promoción:

60 − 75 95 − 75
𝑃(60 < 𝑋 < 95) = 𝑃 ( <𝑍< ) = 𝑃(−1.5 < 𝑍 < 2) (𝟎. 𝟐𝟓 𝒑)
10 10

= 𝑃(𝑍 < 2) − 𝑃(𝑍 < 1.5) (𝟎. 𝟐𝟓 𝒑) = 0.9772 − 0.0668 = 𝟎. 𝟗𝟏𝟎𝟒 (𝟎. 𝟐𝟓 𝒑)

Fuera de la promoción:

𝑃(𝑋 < 60 ∪ 𝑋 > 95) = 1 − 𝑃(60 < 𝑋 < 95) = 1 − 9104 = 𝟎. 𝟎𝟖𝟗𝟔 (𝟎. 𝟐𝟓 𝒑)

d) Sea 𝑋: gasto de un cliente del tipo B.

𝑋~𝐸𝑥𝑝(0.015)

Se pide el percentil 70 (𝟎. 𝟓 𝒑).

Si se ha calculado el percentil 30, el puntaje en esta pregunta es 𝟎 𝒑.

𝐹(𝑃70 ) = 0.7 → 1 − 𝑒 −0.015𝑃70 = 0.7 (𝟎. 𝟓 𝒑)

𝑒 −0.015𝑃70 = 0.3

−0.015𝑃70 = ln(0.3)

𝑃70 = 80.26 (𝟎. 𝟓 𝒑)


NOTA REVISADA FIRMA ESTADÍSTICA BÁSICA
SEMESTRE 2017-II
PRACTICA 5
10/11/2017

APELLIDOS:______________________________________________NOMBRE:_____________________________
Sección:___________________

Cuando se solicite reclamo, deberá adjuntarse copia de la solución que se publique (sólo del ejercicio
sobre el que se reclame). El reclamo deberá basarse en errores de corrección en base a esa solución. Si
simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
1. La empresa Plutón S.A. exporta uva de mesa a diversos países de Europa. El nuevo gerente ha ordenado
NOTA una revisión de procesos, por lo que se ha medido el tiempo durante el cual la fruta se encuentra a la intemperie,
desde que se corta del árbol hasta que es trasladada a la planta de empaque. Se ha concluido que dicho tiempo
(min) es una variable aleatoria normal. Para el estudio, se ha hecho seguimiento de 9 lotes de uva cosechada,
FIRMA
tomando el tiempo desde su cosecha hasta su llegada a la planta de empaque. A partir de los 9 datos de la
muestra, se ha calculado una media de 28 min y una cuasidesviación estándar de 2.449 min. Responda, de
manera justificada, las siguientes cuestiones:

a. Construya un intervalo de confianza del 90% para la varianza del tiempo. (2 p)

(𝑛 − 1)𝑠̂ 2 (𝑛 − 1)𝑠̂ 2
𝐼. 𝐶. (0.90): 𝜎 2 𝜖 [ ; 2 ]
χ2𝑛−1,0.05 χ𝑛−1,0.95

8 × 2.4492 8 × 2.4492
𝐼. 𝐶. (0.90): 𝜎 2 𝜖 [ ; ] = [3.0935; 17.5754]
15.51 2.73

Si el intervalo es correcto: 2 p.
Si el intervalo es incorrecto: 0 p.

b. Realice un contraste de hipótesis para comprobar si, a partir de los datos, es posible afirmar que el tiempo
medio que la uva se encuentra a la intemperie es menor que la media histórica 30.3641 𝑚𝑖𝑛. Utilice un nivel
de significación de 10%.

𝑯𝟎 : 𝝁 ≥ 𝟑𝟎. 𝟑𝟔𝟒𝟏 𝑯𝟏 : 𝝁 < 𝟑𝟎. 𝟑𝟔𝟒𝟏

Hipótesis (0.5 p) En ambas hipótesis deben estar presentes el símbolo de la


media poblacional (𝝁) y el valor de la media hipotética
(30.3641), de lo contrario: 0 p.

𝑋̅ − 𝜇0 28 − 30.3641
𝑇0 = = = −2.8960
Estadístico de contraste (0.5 p) 𝑠̂⁄ 2.449⁄
√𝑛 √9

Indique el símbolo que lo representa


y su valor. Utilice una precisión de 4 Si el valor es correcto: 0.5 p.
decimales.
Si el valor es incorrecto: 0 p.

𝑇0 ~ 𝑡8

Distribución del estadístico de


contraste (0.5 p) Si la distribución es correcta: 0.5 p.

Si la distribución es incorrecta: 0 p.
Si los tres apartados anteriores (hipótesis, estadístico y distribución) son correctos, se continúa
con la corrección.

Si al menos uno es incorrecto, no se corrigen los siguientes apartados (p-valor y conclusión).

𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.01
p -valor del contraste (0.5 p)
(0.5 p)

JUSTIFICACIÓN (0.5 p):

Es posible justificar (1) usando el p-valor, o (2) usando el


valor crítico.

OPCIÓN 1:

Debido a que el p-valor es menor que el nivel de


significación (𝛼 = 0.10).

OPCIÓN 2:

Conclusión del contraste (1 p)

Responda:
• ¿Acepto o rechazo Ho?
• ¿Se puede afirmar que el tiempo
medio es menor que 30.3641 JUSTIFICACIÓN: el estadístico de contraste se encuentra en
minutos? la región de rechazo (< -1.397).

(El valor -1.397 debe estar presente en esta opción de


respuesta).
Debe justificar su conclusión.

Si no han justificado o han justificado incorrectamente, no


se corrige la conclusión.

CONCLUSIÓN (0.5 p):

a. Se rechaza la hipótesis nula (Ho).


b. Hay evidencia para afirmar que el tiempo medio es
menor que 30.3641.

Deben tener ambas conclusiones (“a” y “b”) correctas (0.5


p). De lo contrario: 0 p.
2. Sea 𝑋1 ∼ 𝑁(𝜇1 ; 𝜎12 ) una variable aleatoria de la que se posee la muestra 𝑥11 , 𝑥12 , … , 𝑥1𝑛 , con media y
cuasivarianza muestrales 𝑥̅1 y 𝑠̂12 . Y sea 𝑋2 ∼ 𝑁(𝜇2 ; 𝜎22 ) otra variable aleatoria de la que se posee la
muestra 𝑥21 , 𝑥22 , … , 𝑥2𝑛 , con media y cuasivarianza muestrales 𝑥̅2 y 𝑠̂22 . A continuación, se enuncia un
conjunto de hipótesis sobre ambas poblaciones. Escribe en términos estadísticos, la hipótesis nula y
alternativa que corresponden con cada una de estas hipótesis. (Respuesta correcta +0.25).(2p) (no
necesitas justificar)

Hipótesis H0 H1

La media de 𝑋1 es menor que la de 𝑋2 . 𝜇1 ≥ 𝜇2 𝜇1 < 𝜇2

Ambas varianzas son iguales. 𝜎12 = 𝜎22 𝜎12 ≠ 𝜎22

La media de 𝑋1 es superior a 3 𝜇1 ≤ 3 𝜇1 > 3

La varianza de 𝑋1 no supera a la de 𝑋2 𝜎12 ≤ 𝜎22 𝜎12 > 𝜎22


APELLIDOS:______________________________________________NOMBRE:________________________
NOTA
Sección:___________________
.

FIRMA
3. Una empresa productora se encuentra realizando una inspección de su proceso, debido a recientes quejas de
sus clientes. Se toma una muestra de 250 artículos, de los cuales 10 resultan defectuosos.

a. Realice un contraste de hipótesis para comprobar si, a partir de los datos, es posible afirmar que la proporción
de defectuosos es mayor que 3%. Para ello, complete la información que se pide en la siguiente tabla:
b.

𝑯𝟎 : 𝒑 ≤ 𝟎. 𝟎𝟑 𝑯𝟏 : 𝒑 > 𝟎. 𝟎𝟑

Hipótesis (0.5 p) En ambas hipótesis deben estar presentes el símbolo de la


proporción poblacional ( 𝒑 ) y el valor de la proporción
hipotética (0.03), de lo contrario: 0 p.

𝑝̂ − 𝑝0 0.04 − 0.03
𝑍0 = = = 0.9269
𝑝0 𝑞0
√0.03 × 0.97
Estadístico de contraste (0.5 p)

𝑛 250

Indique el símbolo que lo representa


y su valor. Utilice una precisión de 4 Si el valor es correcto: 0.5 p.
decimales.
Si el valor es incorrecto: 0 p.

𝑍0 ~ 𝑁(0,1)

Distribución del estadístico de


contraste (0.5 p) Si la distribución es correcta: 0.5 p.

Si la distribución es incorrecta: 0 p.

Si los tres apartados anteriores (hipótesis, estadístico y distribución) son correctos, se continúa
con la corrección.

Si al menos uno es incorrecto, no se corrigen los siguientes apartados (p-valor y conclusión).

𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 1 − 0.8238 = 0.1762

p -valor del contraste (0.5 p)


Si el p-valor es correcto: 0.5 p.

Si el p-valor es incorrecto: 0p.

JUSTIFICACIÓN (0.5 p):

Conclusión del contraste (1 p)

Es posible justificar (1) usando el p-valor, o (2) usando el


valor crítico.
Responda:
• ¿Acepto o rechazo Ho?
• ¿Se puede afirmar que la
proporción de defectuosos es OPCIÓN 1:
mayor que 3%?
Debido a que el p-valor es mayor que el nivel de
Justifique su respuesta. significación (𝛼 = 0.05).
OPCIÓN 2:

JUSTIFICACIÓN: el estadístico de contraste se encuentra en


la región de rechazo (< 1.645).

(El valor -1.645 debe estar presente en esta opción de


respuesta).

Si no han justificado o han justificado incorrectamente, no


se corrige la conclusión.

CONCLUSIÓN (0.5 p):

a. Se acepta la hipótesis nula (Ho).


b. No hay evidencia para afirmar que la proporción de
defectuosos es mayor que 3%.

Deben tener ambas conclusiones (“a” y “b”) correctas (0.5


p). De lo contrario: 0 p.

c. Utilizando un intervalo de confianza, compruebe, con base en los datos, si es posible afirmar que la proporción
de defectuosos poblacional es del 3.5%. Utilice una precisión de 4 decimales en el intervalo de confianza. (2 p)

En primer lugar, se construye el I.C.:

𝑝̂ 𝑞̂
𝐼. 𝐶. (0.95): 𝑝 ∈ {𝑝̂ ± 𝑧𝛼⁄2 × √ }
𝑛

0.04 × 0.96
𝐼. 𝐶. (0.95): 𝑝 ∈ {0.04 ± 1.96 × √ }
250

𝐼. 𝐶. (0.95): 𝑝 ∈ {0.04 ± 0.0243} = [0.0157; 0.0643] (1 p)

Intervalo de confianza correcto: 1 p.


Intervalo de confianza incorrecto: 0 p.
Si el intervalo de confianza es incorrecto, considerar dicho intervalo como correcto para la justificación de la
conclusión:
Finalmente, para comprobar si es posible afirmar si la proporción tiene un valor de 3.5%, se comprueba si dicho
valor (0.035) se encuentra en el intervalo de confianza:

Sí es posible afirmar que la proporción tiene un valor de 3.5% porque dicho valor se encuentra dentro del
intervalo de confianza. (1 p)

Conclusión justificada correctamente: 1 p.


Conclusión justificada de manera incorrecta o no justificada: 0 p.

4. Decir si las siguientes afirmaciones son verdaderas (V) o falsas (F). Contesta en la tabla siguiente. No
necesitas justificar. Respuesta correcta +0.5, incorrecta -0.5. (máximo 2 puntos)

Si tenemos 40 datos, y obtenemos con ellos que 𝑝̂ = 0.05, no podremos hacer un contraste de
1 V
hipótesis de una proporción asumiendo muestras grandes.
Si la proporción poblacional sigue una distribución normal, siempre podremos hacer un contraste
2 F
de hipótesis sobre una proporción para cualquier tamaño muestral.
Dado un tamaño muestral, el margen de error de un intervalo de confianza de una proporción será
3 V
mayor si p=0.4 que si p=0.2
Si al realizar un contraste rechazo que 𝑝 ≥ 0.5, el pvalor del contraste con 𝐻0 : 𝑝 ≤ 0.5 tendrá un
4 V
pvalor mayor que 0.05.
Sólo podemos usar la distribución t de Student para el contraste de una media si la muestra es
5 F
pequeña y la población es Normal

SOLUCIÓN:

1- V. En ese caso 𝑛𝑝̂ (1 − 𝑝̂ ) = 1.9 < 5 por lo que la aproximación a la normal no es satisfactoria.
2- F. La proporción poblacional será un número, y no una variable aleatoria.
3- El margen de error del intervalo es

𝑝(1 − 𝑝)
1.96√
𝑛
y es tanto mayor cuanto más próximo esté 𝑝 a 0.5. Para 𝑝 = 0.4 será
1.96
0.4899
√𝑛
y para 𝑝 = 0.2 será
1.96
0.40
√𝑛
que es menor.
4- V.Si se rechaza que 𝑝 ≥ 0.5 es porque 𝑝̂ ≪ 0.5 . Por tanto, si con ese valor tomamos 𝐻0 = 𝑝 ≤ 0.5 no
podríamos rechazarlo, pues los datos están del lado de 𝐻0 . El pvalor será mucho mayor que 0.05.
5- F. Podremos usar la t de Student si la población es normal, aunque la muestra sea pequeña.
APELLIDOS:______________________________________________NOMBRE:_________________________
NOTA Sección:___________________
.

FIRMA
5. Se desea comparar dos tipos de mezclas distintas para la elaboración de concreto. Cada mezcla
tiene una formulación diferente de sus agregados. Para compararlos, se elabora con cada mezcla
un conjunto de probetas (probeta=cilindro recto de 15 cm. de diámetro y 30 cm. de alto) y se mide
la presión a la que se rompen. Para la mezcla M1 se construyeron 62 probetas, con las que se obtuvo
una resistencia media de 39.12 con cuasidesviación típica de 16. Para la mezcla M2 se construyeron
40 probetas, con la que se obtuvo una media muestral de 30.24 y una cuasidesviación típica de 14.

Asumiendo que la resistencia de las probetas sigue una distribución normal, y que las varianzas
poblacionales para ambas mezclas es la misma, contrasta si la mezcla M1 tiene una mayor
resistencia media que la mezcla M2. Para ello, complete la información que se pide en la siguiente
tabla:

Hipótesis (1 p) 𝑯𝟎 : 𝝁𝟏 ≤ 𝝁𝟐 𝑯𝟏 : 𝝁𝟏 > 𝝁𝟐

Estadístico de contraste (1 p)
𝑥̅1 − 𝑥̅2 8.8800
𝑡= = = 2.8710
Indique el símbolo que lo representa, su 1 1 1 1
𝑆̂𝑇 √ + 15.2512√ +
fórmula, y su valor numérico. Utilice una 𝑛1 𝑛2 62 40
precisión de 4 decimales.

Distribución del estadístico de contraste


𝑡100
(1 p)

Valor crítico (1 p)
1.660

Pvalor (aproximado) (1 p) 0.0025

Conclusión del contraste (1 p)

Responda:
• RESULTADO: Se Rechaza H0 Por tanto sí hay evidencia suficiente
• ¿Acepto o rechazo Ho?
para pensar que la mezcla M1 es mejor. (0.5p)
• ¿Se puede afirmar que la mezcla M1
es mejor?
• JUSTIFICACIÓN:Como t=2.8710>1.660 nos encontramos en la
Debe justificar su conclusión. región de rechazo. Además, el pvalor es menor que el nivel de
significación del %5.

(basta con que lo justifiquen sólo con el pvalor o con el valor crítico)
NOTA REVISADA FIRMA ESTADÍSTICA BÁSICA
SEMESTRE 2017-II
PRACTICA 4
27/10/2017

APELLIDOS:______________________________________________NOMBRE:_____________________________
Sección:___________________

Contesta cada pregunta sólo en la hoja de su enunciado, por ambas caras. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega,
pero no se corrige. Entrega cada pregunta por separado, y el cuadernillo.
Cuando se solicite reclamo de esta práctica, deberá adjuntarse copia de la solución que se publique. El reclamo deberá basarse en errores
de corrección en base a esa esa solución.

NOTA 1. Para elaborar cierto artículo se han de cubrir dos etapas (ver figura) cuyas duraciones, X e Y, son variables
aleatorias.
Etapa 1 Etapa 2
FIRMA X Y

X
La duración de la primera etapa se distribuye como una normal:X𝑋 ∼ 𝑁(𝜇, 1). La duración de la segunda etapa
es una exponencial: 𝑌 ∼ 𝐸𝑥𝑝 (1⁄3𝜇). Se desea estimar el parámetro 𝜇 empleando el método de los momentos.
Con ese fin se ha cronometrado el tiempo que demora la fabricación de 5 artículos, obteniéndose los siguientes
resultados:
artículo X Y
1 2 7
2 3 8
3 4 10
4 2 6
5 3 9

Se pide, justificando la respuesta:

a) Utilizando sólo la muestra de 𝑋 halla el estimador de 𝜇 por el método de los momentos, así como la
estimación que se obtiene con la muestra. (1p)
En el método de los momentos relacionamos los parámetros que queremos estimar con los momentos
de la variable aleatoria.
𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5
𝐸(𝑋) = 𝜇 ⇒ 𝜇̂ = 𝑥̅ = (0.75)
5

La estimación será:

2+3+4+2+3
𝑥̅ = = 2.8 (0.25)
5

b) Utilizando sólo la muestra de Y, halla el estimador de 𝜇 por el método de los momentos, así como la
estimación que se obtiene con la muestra. (2p)

𝑌 ∼ 𝐸𝑥𝑝(𝜆) ⇒ 𝐸(𝑌) = 1/𝜆


En este caso tenemos que
𝐸(𝑌) 𝑦̅
𝐸(𝑌) = 3𝜇 ⇒ 𝜇 = ⇒ 𝜇̂ = (𝟏. 𝟓𝒑)
3 3
La estimación será
1 7 + 8 + 10 + 6 + 9 8
𝜇̂ = × = = 2.67 (𝟎. 𝟓𝐩)
3 5 3
c) ¿Es insesgado este estimador de la sección (b)? Justifica. (2p)

Será insesgado si 𝐸(𝜇̂ ) = 𝜇

𝑦̅ 1 𝐸(𝑌) 3𝜇
𝐸(𝜇̂ ) = 𝐸 ( ) = 𝐸(𝑦̅) = = = 𝜇. (1.5)
3 3 3 3

Por tanto es insesgado.(0.5p)

2. A continuación, se enuncia un conjunto de hipótesis sobre los valores poblacionales de las duraciones
de estas tareas. Escribe en términos estadísticos, la hipótesis nula y alternativa que corresponden con
cada una de estas hipótesis. (Respuesta correcta +0.5).(3p) (no necesitas justificar)

Hipótesis H0 H1

La duración media de la tarea X es 10. 𝜇 = 10 𝜇 ≠ 10

𝜇𝑦 ≥ 9 ⇒ 𝜇 ≥ 3 𝜇𝑦 < 9 ⇒ 𝜇 < 3
La duración media de la tarea Y es menor de 9.
(ambas son válidas) (ambas son válidas)

La duración media de la tarea X es superior a 3 𝜇≤3 𝜇>3


APELLIDOS:______________________________________________NOMBRE:________________________
NOTA
Sección:___________________
.

FIRMA

3. Se realiza un estudio sobre la estatura de los ciudadanos de un país. Se toma una muestra de 225
individuos y, de esta muestra, se obtienen una media de 166 cm y una varianza de 35.

Responda, con un procedimiento justificado, las siguientes cuestiones:

a. Construya un IC para la media, con un nivel de confianza de 95%. (1 p).

SOLUCIÓN

𝑥̅ = 166
𝑠̂ 2 = 35
𝑛 = 225

𝑠̂ √35
𝐼. 𝐶. (0.95): {𝑋̅ ± 𝑧0.025 } = {166 ± 1.96 }
√𝑛 √225

𝑰. 𝑪. (𝟎. 𝟗𝟓): [𝟏𝟔𝟓. 𝟐𝟑; 𝟏𝟔𝟔. 𝟕𝟕](𝟏 𝒑)

Puntaje:

- Valor incorrecto de 𝑧 = 1.96: −𝟎. 𝟕𝟓 𝒑.

b. ¿Cuál debería ser el tamaño muestral para, con un nivel de confianza de 95%, tener un margen
de error máximo de 0.4 cm? (1.5 p)

2
𝑠̂ 2 √35
𝑛 = (𝑧0.025 ) = (1.96 × ) = 840.35 ≈ 841 (𝟏. 𝟓/𝟏. 𝟓 𝒑)
𝐿 0.4

𝑆𝑖 ℎ𝑎𝑛 𝑟𝑒𝑑𝑜𝑛𝑑𝑒𝑎𝑑𝑜 𝑎 840: 𝟏𝒑/𝟏. 𝟓𝒑

c. Un analista ha utilizado la información de este estudio y ha construido el siguiente intervalo de


confianza: [165.4; 166.6]. ¿Cuál es el nivel de confianza de dicho intervalo? (1.5 p)

SOLUCIÓN

𝐼𝐶(1 − 𝛼): [165.4; 166.6] = {166 ± 0.6}

𝑠̂ √35
𝐿 = 0.6 = 𝑧𝛼⁄2 → 0.6 = 𝑧𝛼⁄2 ×
√𝑛 √225

𝑧𝛼⁄2 ≈ 1.52 (𝟎. 𝟓 𝒑)

𝛼⁄ = 0.0643 → 𝛼 = 0.1286 (𝟎. 𝟓 𝒑)


2
Entonces, el nivel de confianza será: 1 − 𝛼 = 0.8714 (𝟎. 𝟓 𝒑)
4. Sea 𝑋 una variable aleatoria de media 𝜇 y varianza 4, y sea 𝑥1 , … , 𝑥100 una muestra aleatoria de dicha
variable. Decir si las siguientes afirmaciones son verdaderas (V) o falsas (F). Contesta en la tabla
siguiente. No necesitas justificar. Respuesta correcta +0.5, incorrecta -0.5. (máximo 2 puntos)

1 Como la muestra es grande, 𝑋 se distribuirá como una normal. F

2 La media muestral es una variable aleatoria de varianza 0.4. F

3 El intervalo de confianza de 𝜇 será mayor cuanta más confianza tengamos en él. V


El intervalo de confianza proporciona un rango de valores entre los que el margen de
4 V
error del intervalo de confianza de 𝜇 depende de 𝜎.
5 Para reducir a la mitad el margen de error debemos tomar el doble de datos F
APELLIDOS:______________________________________________NOMBRE:_________________________
NOTA Sección:___________________
.

FIRMA
5. Una empresa productora de perfumes vendidos por catálogo se encuentra realizando un estudio
sobre el número de perfumes adquiridos por cada comprador. El objetivo del estudio es averiguar si
la última campaña promocional ha logrado aumentar el número promedio histórico de perfumes
adquiridos por compra, que es de 2.5 perfumes por compra. De un total de 100 compras analizadas,
se obtuvieron los siguientes datos en el estudio:

Número de Número de
perfumes adquiridos compras
1 25
2 25
3 35
4 15

Responda, de manera justificada, las siguientes cuestiones:

a. Con base en la información del estudio, ¿se puede afirmar que la campaña promocional ha cumplido
su cometido? (2 p)

𝑥̅ = 2.4
𝑠̂ 2 = 1.0505 → 𝑠̂ = 1.0249
No hay puntaje solo por calcular estos valores.

Se realiza un contraste de hipótesis:


I. Se plantean las hipótesis (𝟎. 𝟓 𝒑)
𝐻0 : 𝜇 ≤ 2.5
𝐻1 : 𝜇 > 2.5

Se acepta 𝐻0 salvo que los datos hagan lo que dice 𝐻1 de forma muy evidente. Es decir, sólo
rechazaremos 𝐻0 si 𝑥̅ ≫ 2.5 . Como 𝑥̅ = 2.4 < 2.5 los datos no contradicen a 𝐻0 por lo que la
conclusión del contraste es de aceptación de 𝐻0 . No hay evidencia de que la campaña haya
funcionado. (los alumnos que hayan respondido esto, tienen ya el puntaje completo: 2p)

Si no han realizado ningún contraste y solo han concluido que la media no ha aumentado porque
̅ = 𝟐. 𝟒 es menor que 𝟐. 𝟓, el puntaje es 0.25 p.
𝒙

Si se continúa haciendo el resto de pasos del contraste:

II. Se define el estadístico de contraste

𝑥̅ − 𝜇0 2.4 − 2.5
𝑡0 = = = −0.9756 (𝟎. 𝟓 𝒑)
𝑠̂⁄ 1.0249⁄
√𝑛 √100

III. Se define la distribución del estadístico de contraste. Al ser muestra grande se tiene que:

𝑇0 ~𝑁(0,1)

IV. Se definen las regiones de aceptación y rechazo


𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 𝑠𝑒𝑟á: 𝟏. 𝟔𝟒𝟓 (𝟎. 𝟓 𝒑).
Este puntaje también es por haber definido correctamente que la región de rechazo es hacia la derecha.
Si se ha definido hacia la izquierda, o ambos lados, no hay puntaje en esta parte.

Nota: si han partido de una mala definición de hipótesis en la primera parte (I), esta parte (IV) también
será incorrecta (0 puntos en ambas partes).

Finalmente, 𝑡0 = −0.98 se encuentra en la región de aceptación. Se acepta 𝐻0 ; es decir:


No hay suficiente evidencia para afirmar que la media ha aumentado.
( 𝑪𝒐𝒏𝒄𝒍𝒖𝒔𝒊ó𝒏: 𝟎. 𝟓 𝒑. 𝐿𝑎 𝑟𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎 𝑑𝑒𝑏𝑒 𝑒𝑠𝑡𝑎 𝑐𝑜𝑚𝑝𝑙𝑒𝑡𝑎).

b. Realice un contraste de hipótesis con un nivel de significación del 3% y averigüe si la media del
número de perfumes adquiridos por compra ha cambiado. (2 p)

Se realiza un contraste de hipótesis:

I. Se plantean las hipótesis (𝟎. 𝟓 𝒑)


𝐻0 : 𝜇 = 2.5
𝐻1 : 𝜇 ≠ 2.5

II. Se define el estadístico de contraste

𝑥̅ − 𝜇0 2.4 − 2.5
𝑡0 = = = −0.9756 (𝟎. 𝟓 𝒑, 𝑝𝑢𝑒𝑑𝑒𝑛 𝑢𝑠𝑎𝑟𝑙𝑜 𝑑𝑒𝑙 𝑎𝑝𝑎𝑟𝑡𝑎𝑑𝑜 "𝑎")
𝑠̂⁄ 1.0249⁄
√𝑛 √100

III. Se define la distribución del estadístico de contraste

𝑇0 ~𝑁(0,1)

IV. Se definen las regiones de aceptación y rechazo para 𝛼 = 0.03:

𝐿𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑐𝑟í𝑡𝑖𝑐𝑜𝑠 𝑠𝑒𝑟á𝑛: ±𝑧0.015 = ±𝟐. 𝟏𝟕 (𝟎. 𝟓 𝒑)


Este puntaje también es por haber definido correctamente que la región de rechazo es hacia ambos
lados. Si se ha definido hacia la izquierda o hacia la derecha, no hay puntaje en esta parte.

Nota: si han partido de una mala definición de hipótesis en la primera parte (I), esta parte (IV) también
será incorrecta (0 puntos en ambas partes).

Finalmente, 𝑡0 = −0.98 se encuentra en la región de aceptación. Se acepta 𝐻0 ; es decir:

No hay suficiente evidencia para afirmar que la media ha cambiado.


( Conclusión: 0.5 p. La respuesta debe estar completa).
Este último contraste, debido a que es bilateral, se puede realizar utilizando un intervalo de confianza del
97% (esta solución alternativa es igual de válida para obtener el puntaje completo):

𝐼. 𝐶. (0.97): 𝜇 ∈ {2.4 ± 2.17 × 1.0249⁄ }


√100

𝐼. 𝐶. (0.97): 𝜇 ∈ [2.18; 2.62]

Entonces, como la hipótesis nula es 𝜇 = 2.5, y dicha media hipotética (2.5) se encuentra dentro del intervalo
se puede concluir lo siguiente:

Se acepta 𝐻0 ; es decir, no hay suficiente evidencia para afirmar que la media ha cambiado.

6. Sea 𝑋 una variable aleatoria de media 𝜇 y varianza 𝜎 2 . Sea el nivel de significación 𝛼 = 0.05. Decir si
las siguientes afirmaciones son verdaderas (V) o falsas (F). Contesta en la tabla siguiente. No necesitas
justificar. Respuesta correcta +0.5, incorrecta -0.5. (máximo 2 puntos)

1 Si se obtiene que 𝑠̂ 2 > 4 podríamos aceptar la hipótesis nula que 𝜎 2 ≤ 4. V


Si la media muestral es 𝑥̅ = 10, y rechazamos 𝐻0 : 𝜇 ≥ 11 entonces aceptaríamos
2 V
𝐻0 : 𝜇 ≤ 11.
3 Si la media muestral es 𝑥̅ = 10, podríamos aceptar tanto 𝐻0 : 𝜇 ≥ 11 como 𝐻0 : 𝜇 ≤ 11. V
Si la media muestral es 𝑥̅ = 10, y la muestra es suficientemente grande rechazaremos
4 V
𝐻0 : 𝜇 ≥ 11.
5 Si aceptamos 𝐻0 con 𝛼 = 0.05 también aceptaremos con 𝛼 > 0.05 F

También podría gustarte