Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Examen Sustitutorio
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de su
enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega, pero no se corrige. Entregar el cuadernillo y cada hoja del
enunciado por separado. Tu evaluación será escaneada para prevenir fraude.
Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se
reclame), de lo contrario no será atendido. El reclamo deberá basarse en errores de corrección en base a esa
solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar. NOTA
1. A continuación, se muestra un conjunto de tablas. En cada una hay tres frases, donde sólo una es correcta. En
cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3 si la
FIRMA
elección es incorrecta). No hay que justificar.
1.3 Sea X una variable aleatoria discreta, si x=20 es el percentil 30, entonces necesariamente 𝐹(20) = 0.30
2. Un proceso consta de dos etapas. Cuando un artículo entra en la etapa 1, se realizan sobre él las tareas
A y B. La duración en minutos de dichas tareas, 𝑋𝐴 y 𝑋𝐵 , son variables aleatorias que pueden
modelizarse según las siguientes normales -notación 𝑁(𝜇, 𝜎 2 ) −: 𝑋𝐴 ∼ 𝑁(10, 4) y 𝑋𝐵 ∼ 𝑁(20,9). La etapa
2 sólo tiene una tarea, la C, cuya duración sigue una exponencial: 𝑋𝐶 ∼ 𝐸𝑥𝑝(𝜆 = 0.03 ). Las tres duraciones
son independientes unas de otras. La siguiente figura resume este proceso:
Se pide, usando una precisión de 4 decimales para las probabilidades (no necesitas justificar):
(max. 5 puntos)
c. Probabilidad de que la etapa 2 se culmine antes de 20 minutos desde que se inició. (0.5p) 0.4512
e. Si tras 25 minutos desde el inicio de la etapa 1, ésta aún no ha culminado, ¿cuál es la probabilidad
0.9103
de que termine en los 10 minutos siguientes? (1p)
f. ¿Cuál es la probabilidad de que las tres tareas demoren más de 10 minutos cada una? (1p) 0.3689
g. ¿Cuál es la probabilidad de que un artículo haya demorado más tiempo en la tarea 1 que en la
0.0028
tarea 2? (1p)
SOLUCIÓN:
e. Si tras 25 minutos desde el inicio de la etapa 1, ésta aún no ha culminado, ¿cuál es la probabilidad de
que termine en los 10 minutos siguientes?
Usando que 𝑇1 = 𝑋𝐴 + 𝑋𝐵 ∼ 𝑁(30,13) se tiene:
𝑃[(𝑇1 < 35) ∩ (𝑇1 > 25)] 𝑃(25 < 𝑇1 < 35)
𝑃(𝑇1 < 35|𝑇1 > 25) = =
𝑃(𝑇1 > 25) 𝑃(𝑇1 > 25)
35 − 30 25 − 30
𝑃 (𝑍 < ) − 𝑃 (𝑍 < )
𝑃(𝑇1 < 35) − 𝑃(𝑇1 < 25) √13 √13
= =
𝑃(𝑇1 > 25) 25 − 30
𝑃 (𝑍 > )
√13
𝑃(𝑍 < 1.39) − 𝑃(𝑍 < −1.39) 0.9177 − 0.0823
= = = 0.9103
𝑃(𝑍 > −1.39) 0.9177
f. ¿Cuál es la probabilidad de que las tres tareas demoren más de 10 minutos cada una?
𝑃[(𝑋1 > 10) ∩ (𝑋2 > 10) ∩ (𝑋3 > 10)] = 𝑃(𝑋1 > 10)𝑃(𝑋2 > 10)𝑃(𝑋3 > 10)
= 𝑃(𝑍 > 0)𝑃(𝑍 > −3.33)𝑒 −0.03×10 = (0.5)(0.996)(0.7408) = 0.3689
g. ¿Cuál es la probabilidad de que un artículo haya demorado más tiempo en la tarea 1 que en la tarea
2?
𝑃(𝑋1 > 𝑋2 ) = 𝑃(𝑋1 − 𝑋2 > 0), donde 𝑋1 − 𝑋2 ∼ 𝑁(−10; 13). Por tanto
10
𝑃(𝑋1 − 𝑋2 > 0) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 2.77) = 0.0028
√13
APELLIDOS:______________________________________________NOMBRE:________________________
NOTA
Sección:___________________
FIRMA
1. Se ha realizado un experimento para comprobar si existe una diferencia entre los pesos obtenidos con dos
balanzas diferentes. Para ello, se ha pesado un mismo conjunto de objetos con ambas balanzas. Los
resultados se muestran a continuación:
Objeto 1 2 3 4 5 6 7
Peso Balanza A (g) 20.35 12.54 18.71 19.24 15.32 17.21 19.87
Peso Balanza B (g) 20.33 12.53 18.74 19.21 15.38 17.22 19.91
Además, se ha determinado que los pesos medidos por la balanza A y la balanza B se distribuyen
normalmente.
a. Balanza B: A la vista de los datos, un estudiante afirma que la varianza del peso medido por la balanza
B no es menor que 8. Corrobore dicha afirmación mediante un contraste de hipótesis. Utilice 𝛼 = 10%.
(3 p)
𝐻0 : 𝜎 2 ≥ 8 𝐻1 : 𝜎 2 < 8
Escriba las hipótesis del
contraste (0.5 p)
Cualquier otra respuesta: 0 p.
En primer lugar, al ser datos emparejados, se calcula la diferencia de los pesos (Peso A – Peso B):
𝑥̅ = −0.0114
𝑠̂ = 0.0334
Se pide contrastar si 𝜇1 − 𝜇2 = 0.
Entonces, por tratarse de una población normal, cuya varianza no se conoce:
0.0334
𝐼. 𝐶. (0.95%): 𝜇1 − 𝜇2 ∈ {−0.0114 ± 2.447 } = [−0.0423; 0.0195] (𝟏 𝒑)
√7
Por lo tanto, debido a que el valor 0 se encuentra dentro del intervalo de confianza (0.5 p), es posible afirmar
que no existe una diferencia significativa entre el peso medio medido por A y el medido por B (0.5 p).
a) Con la información con la que se cuenta, ¿es correcto realizar inferencia para la varianza? Responda en un
máximo de dos líneas. (0.5 p)
Sí es correcto, porque la estatura se ajusta a una distribución normal (0.25 p), lo que se evidencia porque el p-valor
de la prueba de normalidad es mayor que el nivel de significación (5%) (0.25 p).
b) Con la información con la que se cuenta, ¿es correcto realizar inferencia para la proporción de estudiantes
que practican deporte con regularidad? Responda en un máximo de dos líneas. (0.5 p)
No es correcto, porque la proporción muestral no se aproxima a una distribución normal (0.25 p), pues 𝑛𝑝̂ 𝑞̂ ≈ 4.5
es menor que 5. (0.25 p).
c) Con la información con la que se cuenta, ¿es correcto realizar inferencia para la estatura media de los
estudiantes? Responda en un máximo de dos líneas. (0.5 p)
Sí es correcto, porque la media muestral se distribuye normalmente (0.25 p), lo que se evidencia porque el p-valor
de la prueba de normalidad es mayor que el nivel de significación (población normal) y porque la muestra es
grande (n>30) (0.25 p). Basta con dar uno de los dos argumentos (pobl. normal o muestra grande).
APELLIDOS:______________________________________________NOMBRE:________________________
NOTA
Sección:___________________
FIRMA
3. Se ha recogido información sobre distintos blogs
educativos, para analizar el número de likes en la última
entrada del blog (variable X). A continuación, se muestra
el resumen, brindado por Minitab, de los datos recogidos:
a) En el resumen hay un p-valor encerrado en un recuadro. Escriba las hipótesis del contraste asociado a ese pvalor.
(0.5 p)
𝐻0 : 𝑋 ~ 𝑁 (80.077, 1866.554)
𝐻1 : 𝑋 ≁ 𝑁 (80.077, 1866.554)
b) ¿Cuál es la interpretación de dicho p-valor? ¿Qué se concluye a partir de él? Responda en un máximo de tres
líneas. (0.5 p)
Interpretación: Probabilidad de que, si X se distribuyera normalmente, se obtengan distancias tan grandes como la de
los datos (0.25 p). Conclusión: Se acepta 𝐻0 , es decir, que X (número de likes) se ajusta a una distribución normal
(0.25 p).
c) Si se toma una muestra aleatoria de 15 blogs, ¿cuál es la probabilidad de que el número medio de likes de los
blogs de dicha muestra sea mayor que 70? (0.5 p)
70−80.77
Se pide: 𝑃(𝑋̅ > 70) = 𝑃 (𝑍 > 43.204⁄ ) = 𝑃(𝑍 > −0.97) = 1 − 0.1660 = 𝟎. 𝟖𝟑𝟒𝟎 (𝟎. 𝟐𝟓 𝐩)
√15
a) ¿El número de habitantes en una vivienda es significativo para predecir la energía consumida en un mes?
Responda, en un máximo de dos líneas. (0.5 p)
Sí, pues el p-valor de la prueba de significatividad es 0 (< 5%) (0.25 p), por lo que se rechaza la hipótesis nula, es
decir, se rechaza que 𝛽1 = 0 (0.25 p).
b) ¿Qué se puede comentar sobre el modelo a partir de la gráfica A? Responda en un máximo de dos líneas.
Debe justificar sus afirmaciones. (0.5 p)
Se puede afirmar que los residuos se ajustan a una distribución normal (0.25 p), pues los puntos se alinean lo
suficiente a la gráfica de probabilidad normal (0.25 p).
Si solo han escrito que los puntos se alinean, pero no han comentado nada sobre la normalidad, el puntaje es 0.
c) ¿Qué se puede comentar sobre el modelo a partir de la gráfica B? Responda en un máximo de dos líneas.
Debe justificar sus afirmaciones. (0.5 p)
Debido a que se evidencia una estructura en los puntos (0.25 p), se puede afirmar que no hay linealidad en el
modelo (0.25 p).
d) Asumiendo que se cumplen las hipótesis básicas del modelo, ¿cuál es la probabilidad de que en una casa con
5 habitantes haya un consumo mayor que 150 KWh en un mes? (0.5 p)
150−101.6
Se pide: 𝑃(𝑌 > 150) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 0.81) = 1 − 0.7910 = 𝟎. 𝟐𝟎𝟗𝟎
59.875
NOTA REVISADA FIRMA Estadística Básica
Examen Final
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de
su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega, pero no se corrige. Entregar el cuadernillo y cada hoja
del enunciado por separado. Tu evaluación será escaneada para prevenir fraude.
Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se
reclame). El reclamo deberá basarse en errores de corrección en base a esa solución. Si simplemente NOTA
se alega que se merece más puntaje, el reclamo no va a prosperar.
1. Sea 𝑋₁ la duración de un filamento de wolframio en espiral simple, y 𝑋₂ la duración usando espiral doble. Se
toma una muestra de tamaño 200 de ambos tipos de filamentos teniéndose unas duraciones medias de 𝑥̅ ₁ = FIRMA
1100 horas, y 𝑥̅ ₂ = 1108 horas. Las varianzas poblacionales de las duraciones de cada tipo de filamento son
𝜎₁² = 20² y 𝜎₂² = 23². Se pide, utilizando 𝜶 = 𝟎. 𝟎𝟓:
𝑥̅1 − 𝑥̅2
𝑧= [0.5𝑝]
Escriba la fórmula del estadístico de
𝜎2 𝜎22
contraste y calcule su valor (4 √ 1 +
𝑛1 𝑛2
decimales) (1 p)
1100 − 1108
= = −3.7119 [0.5𝑝]
2 2
√ 20 + 23
200 200
Sí lo es, pues el p-valor del contraste de significatividad individual es 0.000, por lo que se rechaza que 𝛽1 = 0
• El término constante (0.147: 14.7%) sería la humedad prevista cuando los cereales pasan 0 unidades de tiempo en el horno
de secado. Es decir, sería la humedad media de los cereales antes de entrar al horno. Es posible que esta interpretación no
sea fiable si no se han observado datos de humedad en esas circunstancias, pues el enunciado dice que los datos utilizados
son “después de un tratamiento en el horno “. (0.5p)
• El término constante dice que por cada unidad de tiempo adicional que estén los cereales en el horno, el contenido medio
de humedad disminuye en 0.0009 (0.09%) (0.5p)
El tiempo de permanencia en el horno explica el 45.18% del contenido de humedad de los cereales a la salida del horno
• El gráfico de residuos frente a valores previstos muestra un patrón de curvatura, aunque no es muy fuerte. Por tanto, la
linealidad no parece muy buena. (1p)
• El histograma y el gráfico de probabilidad muestran que los residuos no son muy normales, aunque el alejamiento de la
normalidad tampoco es muy acusado. (1p)
APELLIDOS:______________________________________________NOMBRE:_______________________
NOTA
Sección:___________________
FIRMA
3. El Ministerio de Salud ha realizado un estudio sobre el
peso de los niños de 12 años de una ciudad de la región
Lambayeque. Los datos tomados se resumen en la
siguiente tabla brindada por Minitab:
Sí es conveniente, porque la población de la que proceden los datos se ajusta a una distribución normal. (0.25 p)
Se afirma esto porque el p-valor de la prueba de normalidad (0.494) es mayor que 𝛼 (0.05). (0.25 p)
b. Un analista supone que la varianza del peso no es mayor que 28.8. Realice un contraste de hipótesis (𝛼 = 10%)
para determinar si los datos apoyan dicha suposición. (3.5 p)
Justifique brevemente
Porque el peso se ajusta a una distribución normal.
Calcule el valor crítico y dibuje las
regiones de aceptación y rechazo
sobre la distribución de
referencia (0.5p)
a) Se acepta 𝐻0 . (0.5 p)
A la vista de los resultados ¿qué b) Se concluye que hay suficiente evidencia para aceptar que la varianza
se concluye? (1p) no es mayor que 28.8; es decir, los datos apoyan la suposición del
analista. (0.5 p)
Justifique brevemente
Las conclusiones deben ser coherentes con las regiones de
aceptación/rechazo definidas, el estadístico de contraste y las hipótesis
planteadas.
χ20 ~ χ228
c. Un estudiante afirma que no se tiene la certeza de que la media de la muestra tomada en el estudio pertenece
al intervalo de confianza construido. ¿Es correcta su afirmación? Justifique. (0.5 p)
La afirmación no es correcta, pues, como se puede ver, la media muestral (𝑥̅ = 44.329) se encuentra dentro del
intervalo de confianza. Es evidente, pues el intervalo se construye a partir de la media muestral (𝑋̅ ± 𝐿). (0.5 p)
Si han respondido a esta pregunta utilizando un contraste de hipótesis, o han respondido que no se tiene la certeza (100%
de seguridad) de que la media pertenece al intervalo: 0 p.
d. Se desea estimar la proporción de padres de familia que conocen sobre alimentación balanceada, con un
margen de error de 2% y un nivel de confianza de 85%. ¿A cuántos padres se debería entrevistar? (1 p)
Se busca:
𝐿 = 0.02
Dado que no se conoce ninguna proporción muestral (𝑝̂ ), uno debe ponerse en el peor de los casos:
Entonces:
2
√0.5×0.5
𝑛 = (1.44 × ) = 1296 (0.25 p)
0.02
Respuesta:
Sección:___________________
FIRMA
4. Se ha determinado que el tiempo que demora un programa informático en ejecutar una tarea es una variable
uniforme continua, definida entre 0 y 𝑘. Se desea estimar el parámetro 𝑘, por lo que se toman los datos de
6 tiempos de ejecución (segundos), resultando los siguientes valores: 0.87, 0.97, 0.92, 0.89, 0.85, 0.89
𝑋 ~ 𝑈 (0, 𝑘)
1
𝑓(𝑥) =
𝑘−0
𝑘+0 𝑘
𝐸(𝑋) = 𝜇 = =
2 2
Por el método de los momentos:
1) 𝑘 = 2𝜇 = 2 × 𝑀1 (0.25 p)
̂1 = 𝑚1 = 𝑋̅
2) 𝑀
̂ = 𝟐×𝑴
3) 𝒌 ̂ 𝟏 = 𝟐𝑿
̅ (0.25 p)
Se sabe que:
𝑘̂ = 2 × 𝑀
̂1 = 2𝑥̅ = 2 × 0.8983 = 𝟏. 𝟕𝟗𝟔𝟔 (0.5 p)
̂ , con 𝒌.
Para tener el puntaje completo, no deben haber confundido 𝒌
b. Calcule el error cuadrático medio del estimador cuando 𝑘 = 1.5 (1.5 p).
2
Entonces: 𝐸𝐶𝑀(𝑘̂) = 𝑆𝑒𝑠𝑔𝑜(𝑘̂) + 𝑉𝑎𝑟(𝑘̂ ) = 02 + 0.125 = 𝟎. 𝟏𝟐𝟓 (0.5 p)
APELLIDOS:______________________________________________NOMBRE:________________________
NOTA
Sección:___________________
FIRMA
5. Un grupo de estudiantes ha realizado una toma de datos en una cafetería, registrando información sobre 23
clientes. En primer lugar, han tomado los datos del monto pagado por cada uno, cuyo resumen se muestra
a continuación:
a. Se desea estimar, utilizando un intervalo de confianza el monto medio que paga un cliente. ¿Es correcto realizar
dicha estimación? Justifique su respuesta. Si es así, construya el intervalo de confianza. (1 p)
No sería correcto, pues la variable no se ajusta a una distribución normal (0.25 p) (p-valor de la prueba de
normalidad es menor que el nivel de significación, 0.05 (0.25 p)).
Además, se cuenta con 23 datos, por lo que la muestra no es grande (0.5 p).
b. Se desea estimar, utilizando un intervalo de confianza, la proporción de clientes que pagan en efectivo. ¿Es
correcto realizar dicha estimación? Justifique su respuesta. Si es así, construya el intervalo de confianza. (1 p)
11 12
𝑝̂ = = 0.4783 → 𝑞̂ = = 0.5217
23 23
Par realizar inferencia para la proporción, se debe comprobar que 𝑝̂ se distribuya normalmente. Para ello, se
verifica que:
𝑛𝑝̂ 𝑞̂ > 5
Entonces, sí es correcto realizar inferencia para la proporción (0.25 p). Se construye un intervalo de confianza
del 95%:
𝑝̂ 𝑞̂
𝐼. 𝐶. (0.95): 𝑝 ∈ {𝑝̂ ± 𝑧0.025 × √ }
23
0.4783 × 0.5217
𝐼. 𝐶. (0.95): 𝑝 ∈ {0.4783 ± 1.96 × √ }
23
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de
su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega, pero no se corrige. Entregar el cuadernillo y cada hoja
del enunciado por separado.
Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se
reclame). El reclamo deberá basarse en errores de corrección en base a esa solución. Si simplemente NOTA
se alega que se merece más puntaje, el reclamo no va a prosperar.
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3 FIRMA
si la elección es incorrecta). No hay que justificar.
FIRMA
2. Un aerogenerador (molino de viento) genera una potencia entre 0 y su capacidad
máxima en función de la velocidad del viento. Sea 𝑋 una variable aleatoria continua definida
en el intervalo [0,1] que representa la proporción de la potencia instalada que genera dicho
aerogenerador en un instante determinado. Su función de densidad viene determinada por
Solución:
a) Una función de densidad debe integrar uno en el espacio muestral. Por tanto,
1 1
3 10
∫ 𝑘(𝑥 − 𝑥 4 )𝑑𝑥 = 1 ⇒ 𝑘 ∫ (𝑥 − 𝑥 4 )𝑑𝑥 = 𝑘 =1⇒𝑘=
0 0 10 3
Vemos que en los extremos vale 0, por lo que el máximo estará en algún valor intermedio. Como es una función suave
(derivable), en el máximo habrá una tangente horizontal, y se anulará su primera derivada. Derivando:
10
𝑓 ′ (𝑥) = (1 − 4𝑥 3 ) = 0 ⇒ 4𝑥 3 = 1
3
1
⇒ 𝑀𝑜𝑑𝑎 = 3 = 0.630
√4
c) La función de distribución es:
𝑥
𝐹(𝑥) = ∫ 𝑓(𝑢)𝑑𝑢
−∞
como
𝑥
10 5 2
∫ (𝑢 − 𝑢4 )𝑑𝑢 = 𝑥 2 − 𝑥 5 ,
0 3 3 3
se tiene:
0 𝑠𝑖 𝑥 < 0
5 2 2 5
𝐹(𝑥) = { 𝑥 − 𝑥 𝑠𝑖 0 ≤ 𝑥 ≤ 1
3 3
1 𝑠𝑖 𝑥 > 1
FIRMA
3. Complete la siguiente tabla con la información solicitada:
- En la columna “modelo de probabilidad” (0.25 p), escriba únicamente qué modelo de probabilidad
describe mejor a la variable 𝑋 (binomial, uniforme continua, uniforme discreta, etc.). De escribir dos o más
modelos, la respuesta se invalida. Si el modelo escrito es incorrecto, todo el apartado se invalida.
- En la columna “parámetros” (0.25 p), escriba únicamente los parámetros que definen al modelo de probabilidad y
su valor numérico. Si los parámetros son incorrectos, se invalida también la probabilidad calculada. De escribir un
parámetro que no es el que define al modelo, la respuesta se invalida.
- En la columna “probabilidad” (0.5 p), escriba únicamente la respuesta de la probabilidad calculada con una precisión
de 4 decimales. No debe escribir ningún procedimiento. De escribir dos o más valores, alguna explicación adicional
(numérica o escrita), o no utilizar 4 decimales, la respuesta se invalida.
Esta parte de la hoja debe permanecer vacía. No se corregirá ningún procedimiento en la pregunta 3.
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________
FIRMA
4. Una planta tiene diversas áreas de trabajo, independientes entre sí. En el área A, se cuenta con un
horno de inducción para la fusión de cobre. La temperatura de dicho horno (𝑇1 ) es una variable normal
con una media de 1183°C y una desviación estándar de 50°C. Por otro lado, en el área B, se cuenta con
un horno para calentar acero. En este horno, la temperatura (𝑇2 ) es una variable normal con media
500°C y desviación estándar de 60°C. Asimismo, en el área C, un operario realiza el pulido de hierro durante un tiempo
(𝑋) que se distribuye como una exponencial de media 12 minutos.
- La temperatura de fusión del cobre es de 1085°C, por lo que la temperatura del horno para este proceso debe ser
superior a dicho valor.
- El acero debe calentarse entre 400°C y 550°C para alcanzar un módulo de elasticidad apropiado para el trabajo del
acero en la planta.
a) ¿Cuál es la probabilidad de que el horno en el área A no esté a una temperatura adecuada para fundir el cobre?
(0.5 p)
b) ¿Cuál es la probabilidad de que el pulido de hierro se realice en, al menos, 12 minutos? (0.5 p)
c) La temperatura del horno en el área B se encuentra dentro del intervalo adecuado para trabajar el acero. ¿Cuál es
la probabilidad de que dicha temperatura esté por encima de los 500°C? (1 p)
d) ¿Cuál es la probabilidad de que la tarea de pulido de hierro se realice en un tiempo total menor que 10 minutos, si
el operario lleva trabajando ya 4 minutos? (1 p)
e) ¿Cuál debe ser el valor de la desviación estándar de 𝑇2 para que la probabilidad de que dicha temperatura sea
menor que 350 sea 2.5%? (1 p)
SOLUCIÓN
a)
Entonces:
1085 − 1183
𝑃(𝑇1 ≤ 1085) = 𝑃 (𝑍 ≤ ) = 𝑃(𝑍 ≤ −1.96) = 𝟎. 𝟎𝟐𝟓 (𝟎. 𝟓 𝒑)
50
b)
1
Se sabe que: 𝑋 ~ 𝐸𝑥𝑝 ( )
12
Entonces:
1
𝑃(𝑋 ≥ 12) = 𝑒 −12×12 = 𝑒 −1 = 𝟎. 𝟑𝟔𝟕𝟗 (𝟎. 𝟓 𝒑)
Se corregirá todo el procedimiento. Si hay algún error, el puntaje es cero (0).
c)
Entonces:
𝑃[(𝑇2 > 500 ) ∩ (400 < 𝑇2 < 550)] 𝑃(500 < 𝑇2 < 550)
𝑃(𝑇2 > 500 | 400 < 𝑇2 < 550) = =
𝑃(400 < 𝑇2 < 550) 𝑃(400 < 𝑇2 < 550)
d)
1
Se sabe que: 𝑋 ~ 𝐸𝑥𝑝 ( )
12
Entonces:
e)
Entonces:
350 − 500
𝑃(𝑇2 < 350) = 𝑃 (𝑍 < ) = 0.025 = 𝑃(𝑍 < −1.96)
𝝈
350 − 500
→𝑍= = −1.96
𝝈
𝝈 = 𝟕𝟔. 𝟓𝟑 (𝟎. 𝟕𝟓 𝒑)
NOTA REVISADA FIRMA Estadística Básica
Práctica 4
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de
su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega, pero no se corrige. Entregar el cuadernillo y cada hoja
del enunciado por separado. Tu evaluación será escaneada para prevenir fraude.
Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se
reclame). El reclamo deberá basarse en errores de corrección en base a esa solución. Si simplemente NOTA
se alega que se merece más puntaje, el reclamo no va a prosperar.
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3 FIRMA
si la elección es incorrecta). No hay que justificar. Salvo que se indique lo contrario, se usará 𝛼 = 0.05.
2. Un fabricante de fertilizantes para plantas desea desarrollar una fórmula de fertilizante que produzca
FIRMA
el mayor aumento en la altura de las plantas. Para probar las fórmulas de fertilizantes, un científico
prepara dos grupos de 15 plántulas idénticas (plántula=semilla recién germinada). Al primero de los
grupos le aplica el fertilizante, llamado FertiPlan. El segundo grupo será el de control, al que no se
aplicará ningún fertilizante. Las plantas permanecen tres meses en un ambiente de invernadero controlado. Al finalizar
dicho periodo, el científico mide la altura de las plantas. La siguiente tabla resume los resultados:
Asumiremos que no hay valores atípicos, que la altura de las plantas sigue una distribución normal, y que la varianza
poblacional de las alturas es la misma en ambos grupos. Se pide, utilizando 𝜶 = 𝟎. 𝟎𝟓:
𝑥̅1 − 𝑥̅2 22 − 20
𝑡0 = = = 1.1435
Escriba la fórmula del estadístico de 1 1 1 1
contraste y calcule su valor (4 decimales)
𝑠̂ 𝑇 √ +
𝑛1 𝑛2 4.7898√ +
15 15
(1 p)
Se usa el estimador conjunto de 𝜎 2 :
(𝑛1 − 1)𝑠̂12 + (𝑛2 − 1)𝑠̂22
𝑠̂ 𝑇2 = = 22.9425 ⇒ 𝑠̂ 𝑇 = 4.7898
𝑛1 + 𝑛2 − 2
Distribución del estadístico de contraste Como la población es normal, y las varianzas poblacionales iguales:
(0.5 p) 𝑡0 ~𝑡𝑛1−𝑛2−2 = 𝑡28
(si no justifica o justifica erróneamente,por ejemplo, diciendo que es solo
Justifique brevemente porque la muestra es pequeña, 0.25p)
De 𝐻1 puede deducirse
Calcule el valor crítico y dibuje las que la región de rechazo
regiones de aceptación y rechazo sobre la está a la derecha de la
distribución de referencia (1p) distribución, por tanto,
el valor crítico es
𝑡28;0.05 = 1.701
FIRMA
3. Se ha realizado un estudio en una empresa de transporte que presta servicio exclusivo a una empresa
cervecera. El estudio se ha enfocado en el tiempo (en minutos) de viaje de cada camión en la ruta
desde la planta de producción hasta un centro de distribución en Chiclayo. Se ha identificado que dicho
tiempo se distribuye normalmente y se han tomado 20 datos, a partir de los cuales se han calculado
las siguientes medidas descriptivas en Minitab:
a. Realice un contraste de hipótesis para comprobar si, a partir de los datos, es posible afirmar que el tiempo medio
de transporte en la ruta en estudio es superior a los 335 minutos. Utilice un nivel de significación de 2%.
𝑥̅ − 𝜇0 339 − 335
Estadístico de contraste (0.5 p) 𝑡0 = = = 0.5023
𝑠̂⁄ 35.61⁄
Indique el símbolo que lo representa, √𝑛 √20
su fórmula, y su valor numérico.
Si el valor es correcto: 0.5 p.
Utilice una precisión de 4 decimales.
Si el valor es incorrecto: 0 p.
Como la población es normal
Distribución del estadístico de
𝑇0 ~ 𝑡19
contraste (0.5 p)
(si no justifica, o lo hace mal, por ejemplo, diciendo que solo
justifica brevemente
es porque la muestra es pequeña, 0.25p)
Si los tres apartados anteriores (hipótesis, estadístico y distribución) son correctos, se continúa con la
corrección.
Si al menos uno es incorrecto, no se corrige el siguiente apartado (conclusión).
SOLUCIÓN:
(𝑛 − 1)𝑠̂ 2 (𝑛 − 1)𝑠̂ 2
𝐼. 𝐶. (0.99): 𝜎 2 𝜖 [ 2 ; ]
χ𝑛−1,0.005 χ2𝑛−1,0.995
19 × 35.612 19 × 35.612
𝐼. 𝐶. (0.99): 𝜎 2 𝜖 [ ; ] = [624.50; 3522.42] (𝟏 𝒑)
38.58 6.84
Si el intervalo es correcto: 1 p.
Si el intervalo es incorrecto: 0 p.
Para evaluar si es posible afirmar si la varianza tiene un valor de 1000, se comprueba si dicho valor pertenece al
intervalo de confianza:
Para esta parte, considerar el intervalo de confianza construido como “correcto”. Es decir, no considerar ‘arrastre de error’.
1000 pertenece al I.C., por lo tanto, se acepta la hipótesis nula (𝝈𝟐 = 𝟏𝟎𝟎𝟎). Se puede afirmar que la varianza
tiene un valor de 1000. (1. 5 p)
Si el intervalo de confianza que han construido no contiene a 1000, debe decir: no se puede afirmar que la varianza tiene un
valor de 1000.
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________
a. ¿A cuántos ex becarios se debe incluir en una muestra para estimar dicha proporción con un máximo margen de
error de 3.5% y un nivel de confianza del 90%? (2 p)
SOLUCIÓN
𝑝̂ 𝑞̂
𝑛 = (𝑧0.05 )2 ×
0.0352
Ya que no se conoce 𝑝̂ , hay que ponerse en el “peor de los casos”: 𝑝̂ = 0.5.
0.5 × 0.5
𝑛 = (1.645)2 ×
0.0352
𝑛 = 552.25 (𝟏 𝒑) ≈ 553 (𝟏 𝒑)
̂, el puntaje es 1p.
Si han utilizado otro valor de 𝒑
Si no han redondeado, el puntaje es 1.5 p.
Si han redondeado hacia abajo (n = 552), el puntaje es 1.5 p.
b. Un analista del Ministerio ha tomado una muestra de 1200 ex becarios, de los cuales 72 no lograron concluir sus
estudios. Con base en dicha información, ha afirmado que la proporción de ex becarios que no lograron concluir
sus estudios no supera el 7%. Realice un contraste de hipótesis (𝛼 = 1.5%) para comprobar si los datos apoyan
dicha afirmación.
𝑯𝟎 : 𝒑 ≤ 𝟎. 𝟎𝟕 𝑯𝟏 : 𝒑 > 𝟎. 𝟎𝟕
Hipótesis (0.5 p) En ambas hipótesis deben estar presentes el símbolo de la
proporción poblacional (𝒑) y el valor de la proporción hipotética
(0.03), de lo contrario: 0 p.
𝑝̂ − 𝑝0 0.06 − 0.07
𝑍0 = = = −1.3577
Estadístico de contraste (0.5 p) 𝑝 𝑞
√ 0 0 √0.07 × 0.93
𝑛 1200
Indique el símbolo que lo representa,
su fórmula, y su valor numérico. Si el valor es correcto: 0.5 p.
Utilice una precisión de 4 decimales. Si el valor es incorrecto: 0 p.
Si los tres apartados anteriores (hipótesis, estadístico y distribución) son correctos, se continúa con la
corrección.
OPCIÓN 1:
OPCIÓN 2:
Responda:
¿Acepto o rechazo Ho?
¿Qué se concluye?
JUSTIFICACIÓN: el estadístico de contraste se encuentra en la
región de aceptación (< 2.18).
Debe justificar su conclusión. (El valor 2.18 debe estar presente en esta opción de respuesta).
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación salvo las tablas y el formulario de la asignatura. Con calculadora. Contesta cada pregunta sólo
en la hoja de su enunciado. El cuadernillo no se entrega. Salvo que se indique otra cifra, usa 𝜶 = 𝟎. 𝟎𝟓.
Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta. En
cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar.
1.2 Sea X una variable aleatoria discreta, si x=10 es el percentil 25, entonces necesariamente 𝐹(10) ≤ 0.25
1.3 Sea X una variable aleatoria discreta, si x=10 es el percentil 25, entonces necesariamente 𝐹(10) ≥ 0.25 X
1.11 Para rechazar el contraste 𝐻0 : 𝜇1 ≥ 𝜇2 , necesariamente tiene que cumplirse que 𝑥̅1 < 𝑥̅2 X
1
Apellidos:_____________________________________________________Nombre_______________________
Sección:___________________
NOTA
2. A continuación, se muestran los histogramas y resúmenes estadísticos de cuatro conjuntos de datos, realizados con el
Minitab. ¿A qué histograma, C1 a C4, le corresponde cada resumen estadístico, (1) a (4)? Justifica la respuesta (cuantas más
medidas características uses en tu argumentación, más puntaje)
• C3 es la distribución con mayor asimetría positiva y alto apuntamiento, por lo que claramente corresponde con
el resumen (1)
• C4 es una distribución bimodal, por lo que tendrá la menor curtosis, y una media en torno a 0.4, por lo que
claramente le corresponde el resumen (3)
• C2 es más apuntado y más simétrica que C1, por lo que le corresponde el resumen (4)
• C1 es menos apuntado y tiene asimetría negativa, por lo que le corresponde el resumen (2)
2
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________
1.82
1.82 1.82
𝑥5 𝑥6 1.826
𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥 = ∫ 𝑑𝑥 = [ ] = = 1.51
0 0 4 24 0 24
1.82
SIGUE →
3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
.
4
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
.
5. En la central telefónica de una empresa se ha registrado el tiempo de duración (en segundos) de un conjunto de 100 llamadas
seleccionadas de manera aleatoria. Se ha realizado esta toma de datos con el fin de comprobar si se cumple la meta de que
la duración media de una llamada sea inferior a los 180 segundos.
a. A partir de dicha información, se ha realizado un contraste de hipótesis para averiguar si se cumple o no con la meta,
obteniéndose un p-valor de 0.068. ¿Se puede afirmar que se cumple la meta? (1 p)
Las hipótesis del contraste son 𝐻0 : 𝜇 ≥ 180; 𝐻1 : 𝜇 < 180. (0.5 p) Como el p-valor es mayor que el nivel de
6. significación (𝛼 = 0.05), se acepta 𝐻0 , por lo que no se puede afirmar que se cumple con la meta. (0.5 p)
Si en la respuesta no se explica cuáles son las hipótesis del contraste, el puntaje es cero.
b. Se realiza otro contraste para averiguar si el tiempo medio es 177 segundos. El estadístico de contraste resulta ser 0.79.
¿Cuál es el p-valor de dicho contraste? (0.5 p)
(0.5 p) Solo se corregirá la respuesta. Cualquier otra respuesta tiene puntaje cero (incluso si han calculado el valor 0.2148 pero
no lo han multiplicado por 2).
6. Una ONG va a realizar un proyecto de mejora de plantas de tratamiento de aguas residuales en una región. Para ello, el
Ministerio de Vivienda, Construcción y Saneamiento le exige que realice un sondeo en dicha región, que permita estimar el
porcentaje de habitantes que está de acuerdo con la ejecución del proyecto. A partir de la información recopilada en las 500
encuestas tomadas, se construyó el siguiente intervalo de confianza para la proporción de habitantes que manifestaron estar
de acuerdo con el proyecto: [0.40; 0.46]. Calcule el nivel de confianza de dicho intervalo. (1.5 p)
0.40+0.46
Como el intervalo es [0.40; 0.46], entonces 𝑝̂ = = 0.43. (0.75 p)
2
Entonces:
𝑝̂ (1 − 𝑝̂ )
𝐿 = 𝑧𝛼⁄2 × √
𝑛
0.43×0.57
0.03 = 𝑧𝛼⁄2 × √ → 𝑧𝛼⁄2 = 1.35 (0.25 p)
500
5
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
.
7. Se ha realizado una prueba de bondad de ajuste del índice acumulado de los alumnos de Ingeniería.
Si han escrito algún otro modelo, todo este apartado tiene puntaje cero.
b. ¿Cuál es la mejor distribución que describe a los datos de la variable índice acumulado? ¿Por
qué? (1 p)
Si no hay justificación o es incorrecta, el puntaje del apartado es cero. Cualquier otra respuesta tiene puntaje cero.
8. Se ha construido un modelo que permite predecir el volumen (ml) de jugo obtenido al exprimir una naranja a partir de su
peso (g). Asumiendo que se cumplen las hipótesis de linealidad del modelo y normalidad del error, responda:
𝐻0 : 𝛽1 = 0
𝐻1 : 𝛽1 ≠ 0
b. Interprete el coeficiente 𝛽̂1 de la ecuación de la recta de regresión en un espacio máximo de dos líneas. (1 p)
Por cada gramo adicional que pese una naranja (0.25 p), el volumen de jugo extraído de ella aumentará
100−59.92
Entonces: 𝑃(𝑉𝑜𝑙𝑢𝑚𝑒𝑛 > 100 𝑚𝑙 | 𝑃𝑒𝑠𝑜 = 98 𝑔) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 2.47) = 0.0068
16.2103
6
NOTA REVISADA FIRMA Estadística Básica
Final
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación salvo las tablas y el formulario de la asignatura. Contesta cada pregunta sólo en la hoja de su
enunciado. El cuadernillo no se entrega. Salvo que se indique otra cifra, usa 𝜶 = 𝟎. 𝟎𝟓.
Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta. En
cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3 si la
elección es incorrecta). No hay que justificar.
1.3 El pvalor es una medida de cómo de alejados están los datos de la hipótesis alternativa
Solución:
1.1 Sólo podremos rechazar 𝐻0 si los datos hacen lo que dice 𝐻1 de forma muy evidente. Si 𝑥̅ = 12 no contradice 𝐻0 : 𝜇 ≥
9 por lo que no podremos rechazar 𝐻0 .
1.4 Para estimar una proporción 𝑝 con un margen de error de 0.05 hay que tomar un mínimo de 385 datos X
1.5 Para estimar una proporción 𝑝 con un margen de error de 0.05 hay que tomar un máximo de 384 datos
1.6 Para estimar una proporción 𝑝 con un margen de error de 0.05 hay que tomar un mínimo de 1537 datos
Solución
2
1.96(0.5)
𝑛 = ⌈( ) ⌉ = 385
0.05
Solución:
1.7: La media muestral siempre está dentro de su intervalo de confianza
1.9: El estimador de 𝜎 2 por el método de los momentos es 𝑠 2 (divide por n) y es sesgado
1
Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)
1.10 Si en el contraste con 𝐻0 : 𝜇1 ≥ 𝜇2 se rechaza 𝐻0 con pvalor=0.04, también rechazaremos 𝐻0 : 𝜇1 = 𝜇2
Solución:
1.10 FALSA. En el contraste con 𝐻0 : 𝜇1 ≥ 𝜇2 , la región de rechazo, para 𝛼 = 0.05, estará a la izquierda del valor crítico
−1.645. Si el pvalor es 0.04, el estadístico 𝑡0 estará donde indica la Figura 1.
Figura 1 Figura 2
Sin embargo, en el contraste 𝐻0 : 𝜇1 = 𝜇2 la región de rechazo está en ambas colas, cada una con área 0.025, por lo que el
estadístico 𝑡0 , que deja a la izquierda un área de 0,04, estará en la región de No Rechazo, como indica la Figura 2. Por lo
tanto, esta cuestión es falsa.
1.12 VERDADERA. La región de rechazo del contraste 𝐻0 : 𝜇1 ≥ 𝜇2 está a la izquierda del valor -1.645 (Figura 3), y la región
de aceptación del contraste 𝐻0 : 𝜇1 ≤ 𝜇2 está a la izquierda del valor +1.645. Por tanto, si el estadístico de contraste,
𝑡0 , está en la región de rechazo el primer contraste, estará en la región de aceptación del segundo contraste.
Figura 3 Figura 4
2
Apellidos:_____________________________________________________Nombre_______________________
Sección:___________________
Informe de resumen de C4
2. En una central telefónica de una empresa retail se ha registrado el Prueba de normalidad de Anderson-Darling
tiempo de duración (en segundos) de un conjunto de llamadas A-cuadrado 0.22
Valor p 0.828
seleccionadas de manera aleatoria. A continuación, se muestra un
Media 175.04
fragmento del resumen de dichos datos, obtenido con Minitab. Desv.Est. 9.31
A partir de dicha información, ¿es posible afirmar que el tiempo medio Varianza 86.77
Asimetría -0.407419
de duración de las llamadas que recibe esta empresa es de 180 Curtosis 0.228924
segundos? Responde en la tabla siguiente.(5 p) N 35
Mínimo 150.15
1er cuartil 168.36
Mediana 175.88
3er cuartil 180.92
Máximo 192.32
Intervalo de confianza de 95% para la media
Hipótesis (1 p) 𝑯𝟎 : 𝝁 = 𝟏𝟖𝟎 𝑯𝟏171.84
: 𝝁 ≠ 𝟏𝟖𝟎 178.24
150 160 170 180 190
Intervalo de confianza de 95% para la mediana
Estadístico de contraste (1 p) 172.41 178.60
Indique el símbolo que lo representa, su fórmula, los 𝑥̅ − 180 Intervalo de 175.04 − 180 para la desviación estándar
𝑡0 = = [0.5𝑝] = confianza de 95% = −3.1519 [0.5𝑝]
valores que utiliza en la fórmula y el valor numérico del 𝑠̂⁄ 9.31
7.53 12.20
estadístico. √𝑛 √35
Utilice una precisión de 4 decimales.
Decir que 𝑡0 ∼ 𝑡34 por ser una muestra pequeña o grande no es correcto (0p)
Para calcular el valor crítico con las tablas disponibles usaremos 𝑡30 . De las
tablas se obtiene 𝑡30;0.025 = 2.042. La región de aceptación es |𝑡0 | ≤ 2.042.
(ver figura)
3
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________
El técnico experto en la calibración de este tipo de máquinas afirma que para considerar que el
corte programado usando el nuevo sensor mejora al sistema anterior, la varianza poblacional Tronzadora automática AP350
debe ser inferior a 0.03. Asumiendo que la longitud cortada sigue una distribución normal, se pide:
(5p)
χ20 ~ χ29
Distribución del estadístico de
contraste (0.5 p)
Cualquier otra respuesta, tiene puntaje cero.
¿Por qué ha elegido esta Porque la población es normal y se está realizando inferencia para la varianza.
distribución? (0.5p)
Justifique brevemente Si la distribución planteada es incorrecta, este apartado tiene puntaje 0 p.
Se concluye que la varianza de las longitudes cortadas no es menor que 0.03. (0.75 p)
A la vista de los resultados ¿qué se
Por tanto, usar el nuevo sensor para el corte no mejora su precisión. (0.25 p)
concluye sobre la precisión de la
máquina de corte? (1p) • No es correcto: la varianza es mayor que 0.03 (0 p).
Justifique brevemente • Si solo han escrito que la varianza “no es menor” que 0.03, pero no han escrito que la
precisión mejora: 0.75 p.
4
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
.
Sí, porque el p-valor (0) es menor que el nivel de significación (𝛼 = 0.05), por lo que se rechaza la hipótesis 𝐻0 : 𝛽1 = 0 y se acepta la
hipótesis 𝐻1 : 𝛽1 ≠ 0.
• 𝛽̂0 : Cuando no se suministra energía desde el sistema de respaldo de energía solar en una hora, la temperatura esperada en
dicha hora es 9.30. (1 p).
• 𝛽̂1 : Por cada unidad adicional de energía que se suministra en una hora, la temperatura en dicha hora disminuye en 0.18955
unidades (0.5 p) por término medio (0.5 p).
2
1
Figura 1:
Se observa que los puntos se alinean a la gráfica de probabilidad (0.25 p), por lo que se puede afirmar que el error se
distribuye normalmente (0.75 p).
Si se ha comentado la linealidad de la relación entre ambas variables a partir de la figura 1, el puntaje es cero.
Figura 2:
Se observa una estructura de puntos en la gráfica (0.25 p), por lo que se afirma que la relación entre la energía suministrada
en una hora y la temperatura en esa hora no es lineal (0.75 p).
5
NOTA REVISADA FIRMA Estadística Básica
Parcial
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación salvo las tablas y el formulario de la asignatura. Contesta cada pregunta sólo en la hoja de su
enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo no se entrega. Tu evaluación será escaneada para prevenir fraude.
Cuando se solicite RECLAMO, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta. En
cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3 si la
elección es incorrecta). No hay que justificar.
FIRMA
1.2 Sea X una variable aleatoria discreta, si x=20 es el percentil 30, entonces necesariamente 𝐹(20) ≤ 0.30
1.3 Sea X una variable aleatoria discreta, si x=20 es el percentil 30, entonces necesariamente 𝐹(20) ≥ 0.30 X
1.4 En un conjunto de datos con asimetría negativa, la desviación típica será siempre mayor que 0. X
1.5 Si un histograma es unimodal con asimetría positiva, la mediana tenderá a ser mayor que la media.
1.6 Si un conjunto de datos presenta simetría, el coeficiente de curtosis será 3.
1
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
2. Para cada una de las siguientes variables descritas, identifique el modelo de probabilidad que sigue y los parámetros que
definen el modelo. Escoja entre las siguientes opciones:
Ejemplo:
Modelo de
Variable Parámetros
probabilidad
La longitud de una pieza (𝑋) es una variable normal que tiene una
N 𝑋~𝑁(15; 3)
esperanza de 15 m y una varianza de 3.
Puntuación:
Modelo elegido correctamente: + 0.25 p.
Parámetros elegidos correctamente: + 0.75 p. (solo si el modelo es elegido correctamente)
Modelo de
Variable Parámetros
probabilidad
2
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________ NOTA
.
3. En una gran piscifactoría del norte de Piura se está probando un servicio de entrega de paquetes dentro del FIRMA
recinto de la piscifactoría utilizando drones (vehículo volador no tripulado). Con ese fin, se realiza un
experimento que consiste en llevar diferentes paquetes desde un punto A a otro punto B. Asumiremos que la
variable aleatoria X= tiempo de vuelo del dron desde A hasta B sigue una normal de media 3 minutos y
desviación estándar 0.4. Contesta, de forma justificada, a las siguientes preguntas.
a) ¿Cuál es la probabilidad de que cubra el trayecto desde A hasta B en menos de 2.8 minutos? (1p)
2.8 − 3
𝑃(𝑋 < 2.8) = 𝑃 (𝑍 < ) = 𝑃(𝑍 < −0.5) = 0.3085
0.4
b) Si se observa que, tras 2 minutos de vuelo, el dron aún no ha llegado al punto B ¿cuál es ahora la
probabilidad de que se cubra el trayecto desde A hasta B en menos de 2.8 minutos? (2p)
𝑃[(𝑋 < 2.8) ∩ (𝑋 > 2)] 𝑃(𝑋 < 2.8) − 𝑃(𝑋 < 2)
𝑃(𝑋 < 2.8|𝑋 > 2) = =
𝑃(𝑋 > 2) 𝑃(𝑋 > 2)
2.8 − 3 2−3
𝑃 (𝑍 < ) − 𝑃 (𝑍 < )
= 0.4 0.4 = 𝑃(𝑍 < −0.5) − 𝑃(𝑍 < −2.5)
2−3 𝑃(𝑍 > −2.5)
𝑃 (𝑍 > )
0.4
0.3085 − 0.0062
= = 0.3042
1 − 0.0062
Tercer cuartil:
Por simetría
𝑄1 − 3
𝑃(𝑍 ≤ 𝑧3 ) = 0.75 ⇒ 𝑧1 ≈ 0.67 ⇒ = 0.67 ⇒ 𝑄1 = 0.67(0.4) + 3 = 3.268
0.4
SIGUE
3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
d) Si asumimos que el tiempo de retorno de B a A es una distribución independiente de X, pero con el mismo modelo
de distribución, 𝑁(3, 0.42 ). ¿Cuál es la probabilidad de que en un viaje de ida y vuelta entre A y B se demore el
dron menos de 6,5 minutos? (2p)
Viaje de A a B: 𝑋1 ∼ 𝑁(3, 0.42 ). Viaje de B a A: 𝑋2 ∼ 𝑁(3, 0.42 ). Viaje total:
𝑌 = 𝑋1 + 𝑋2 ∼ 𝑁(6; 0.32)
6.5 − 6
𝑃(𝑌 < 6.5) = 𝑃 (𝑍 < ) = 𝑃(𝑍 < 0.88) = 0.8106
0.5657
e) Calcula los apartados a), b) y c) pero asumiendo ahora que el tiempo de vuelo es 𝑈(2; 4) (3p)
1
Si 𝑋 ∼ 𝑈(2; 4) ⇒ 𝑓(𝑥) = = 0.5
4−2
• b)
𝑃[(𝑋 < 2.8) ∩ (𝑋 > 2)] 𝑃(𝑋 < 2.8) − 𝑃(𝑋 < 2) 0.4 − 0
𝑃(𝑋 < 2.8|𝑋 > 2) = = = = 0.4
𝑃(𝑋 > 2) 𝑃(𝑋 > 2) 1
• c) 𝑄1 :
(𝑄1 − 2)0.5 = 0.25 ⇒ 𝑄1 = 2.5
𝑄2 = 3
𝑄3 = 3.5
4
NOTA REVISADA FIRMA Estadística Básica
Práctica 4
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de su
enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega. Cuando se solicite RECLAMO, deberá adjuntarse copia de la
solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá basarse en errores de corrección en base a NOTA
esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar. Tu evaluación será escaneada.
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta. FIRMA
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3
si la elección es incorrecta). No hay que justificar. (4p)
Para calcular el tamaño muestral para estimar una proporción de la que desconocemos completamente su
1.4
valor, lo mejor es asumir 𝑝 = 0.5 X
El margen de error de estimar una proporción próxima a cero es mayor que el de estimar una proporción
1.5
próxima a uno.
1.10 Si tenemos una muestra grande de una población 𝑋, entonces 𝑋 se podrá aproximar a una normal
𝑋̅ −𝜇
1.11 Si 𝑋 ∼ 𝑁(𝜇; 𝜎 2 ), entonces ∼ 𝑡𝑛−1
𝜎 ⁄√𝑛
(𝑛−1)𝑆̂ 2
1.12 Si 𝑋 ∼ 𝑁(𝜇; 𝜎 2 ), entonces
𝜎2
2
∼ 𝜒𝑛−1 X
1
Apellidos:______________________________________________________Nombre_______________________
Sección:___________________ NOTA
2. Un grupo de estudiantes está interesado en estudiar medidas antropométricas. Por ejemplo, la envergadura FIRMA
es la distancia entre las puntas de los dedos de las dos manos de una persona cuando tiene los brazos en
cruz completamente extendidos. Este grupo ha escuchado una creencia común: la envergadura de una
persona coincide con su estatura. Por ello, decidieron medir a 10 amigos, cuyos valores se muestran en la
siguiente tabla:
Individuo 1 2 3 4 5 6 7 8 9 10
X1: Estatura (cm) 162 169 167 172 175 173 181 174 169 170
X2: Envergadura (cm) 160 166 165 169 173 175 184 168 164 166
Diferencia: Y = X1 – X2 2 3 2 3 2 -2 -3 6 5 4
Los estudiantes, además, han comprobado que tanto la estatura como la envergadura siguen una distribución normal.
a. Realice un contraste para averiguar si, a partir de los datos, es posible afirmar que ambas medidas son, en promedio,
iguales.
𝑯𝟎 : 𝝁𝒚 = 𝟎 (𝝁𝟏 = 𝝁𝟐 ) 𝑯𝟏 : 𝝁𝒚 ≠ 𝟎 (𝝁𝟏 ≠ 𝝁𝟐 )
Hipótesis (0.5 p)
Cualquier otra respuesta, es incorrecta
Si han respondido correctamente los tres apartados anteriores (hipótesis, estadístico y distribución), se
continúa corrigiendo. De lo contrario, el puntaje, en adelante, es cero.
2
JUSTIFICACIÓN (opción 1) (0.5 p):
b. Si ambas variables en estudio no fueran normales, ¿qué ocurriría? Responda en un máximo de dos líneas. (1 p)
No se cumpliría que la media de las diferencias (y ̅) sigue una distribución normal, por lo que los resultados del contraste
3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
3. Una empresa farmacéutica que elabora comprimidos de vitaminas evalúa de forma regular NOTA
el peso de estos comprimidos. Tras tomar una muestra de comprimidos y pesarlos se
obtuvo el siguiente resumen con Minitab:
FIRMA
Asumiremos que el peso de los comprimidos sigue una distribución normal. Contesta a las siguientes preguntas de forma
justificada:
a) Un analista asegura que hay un error en el intervalo de confianza de la media, y que alguien ha editado y manipulado
esta figura. Construye el intervalo de confianza de la media y comprueba quién tiene razón. (2p)
𝑠̂ 𝑠̂
𝐼𝐶(0.95): 𝜇 ∈ [𝑋̅ − 𝑡50,0.025 ; 𝑋̅ + 𝑡50,0.025 ] (1𝑝)
√51 √51
0.0274 0.0274
𝐼𝐶(0.95): 𝜇 ∈ [3.0225 − 2.009 ; 3.0225 − 2.009 ] = [3.0148; 3.0302](1𝑝)
√51 √51
Si se usa la aproximación a la normal, en lugar de la distribución t de Student exacta, con 𝑧0.025 = 1.96, el intervalo queda
[3.0150; 3.0300]. que, al ser muestra grande, es muy similar al que proporciona el Minitab, pero no es igual. (sólo 1 punto)
b) Ese mismo analista sostiene que el intervalo que el Minitab proporciona para la desviación típica no se construye
tomando la raíz cuadrada del intervalo de la varianza habitual, sino que lo construye con otras fórmulas. Construye el
intervalo de confianza de la varianza y comprueba si el analista tiene razón. (2p)
y su raíz cuadrada es {0.0229; 0.0341}, que coincide con el Minitab, luego no tiene razón el analista
(si tiene bien el planteamiento, pero no le sale el mismo resultado por cuestión del redondeo antes de sacarla raíz
cuadrada, dar puntaje completo)
4
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
.
c) Contrasta, con un nivel de significación del 5%, que el peso medio de los comprimidos es inferior a
3.03 unidades. FIRMA
Estadístico de
contraste (1p)
Indique el símbolo que Como no conocemos la desviación típica poblacional, el estadístico es
lo representa, su 𝑥̅ − 𝜇0 3.0225 − 3.03
fórmula, y su valor 𝑡= = = −1.9548
𝑠̂⁄ 0.0274⁄
numérico. Utilice una √𝑛 √51
precisión de 4
decimales.
Distribución del Al tratarse de una población normal, y usarse la cuasidesviación típica, la distribución del
estadístico de estadístico de contraste es 𝑡50 .
contraste (1p)
Justifique brevemente (Con la justificación de que la población es normal es suficiente para tener el puntaje
completo. Si usan la N(0,1) por ser muestra grande, sólo 0.5 p)
Conclusión del
contraste (1p)
Responda:
Como −𝑡50;0.05 = −1.676 , nos encontramos en la
¿Acepto o rechazo
región de rechazo de 𝐻0 . Hay evidencia suficiente, con
Ho?
un nivel de significación del 5%, para asumir que el peso
¿Se puede afirmar
que el peso medio de medio es inferior a 3.03
los comprimidos es (con −𝑧0.05 = −1.645, la conclusión sería la misma, y el
inferior a 3.03 puntaje completo)
unidades?
Debe justificar su
conclusión.
¿Con qué valor de la media muestral se conseguiría un pvalor de 0.05 en este contraste? Justifica brevemente (2p)
Para tener un pvalor de 0.05, el valor del estadístico de contraste debería ser precisamente el valor crítico, es decir:
𝑥̅ − 3.03
𝑡= = −1.676 ⇒ 𝑥̅ = 3.0236
0.0274⁄
√51
5
NOTA REVISADA FIRMA Estadística Básica
SUSTITUTORIO
15/07/2019
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario oficiales de la asignatura. Contesta cada
pregunta sólo en la hoja de su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega. Cuando se
solicite RECLAMO, deberá adjuntarse copia de la solución publicada. NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar. (5p) FIRMA
1.14 Si p-valor> 𝛼, podemos apoyarnos en los datos para probar que se cumple 𝐻0 X
1
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
2. Se ha elaborado un modelo de regresión lineal que permite predecir, en una piscifactoría, el peso
de un langostino en la semana 10 (Sem_10) de su desarrollo, a partir de su peso en la primera
semana (Sem_1). Todos los pesos están en gramos. Se ha comprobado, además, que se cumplen las FIRMA
hipótesis básicas del modelo. A continuación, se muestra parte de los resultados obtenidos con
Minitab:
a. Además de usar un gráfico de dispersión, ¿cómo se puede evaluar gráficamente si la relación entre ambas variables
es lineal? Explique en un máximo de dos líneas. (0.5 p)
Utilizando un gráfico de residuos frente a valores previstos (ajustes).
b. Interprete el coeficiente de determinación del modelo en máximo dos líneas (0.5 p).
El modelo explica el 52.83% de la variabilidad del peso de los langostinos en la semana 10.
Si la respuesta no está completa y bien redactada, el puntaje es cero.
Cualquier otra respuesta adicional invalida todo el apartado.
c. Interprete el coeficiente que corresponde a la pendiente de la ecuación de la recta en máximo dos líneas. (0.5 p)
Por cada gramo adicional que pese un langostino, su peso en la semana 10 aumentará en 4.86 g por término
medio.
Si la respuesta no está completa y bien redactada, el puntaje es cero.
Cualquier otra respuesta adicional invalida todo el apartado.
d. Calcule la probabilidad de que un langostino que pesó 1 g en la primera semana pese por lo menos 7 g en la semana
10. (0.5 p)
Como se cumple la hipótesis de normalidad: 𝑒𝑖 ~𝑁(0; 1.512 ), se sabe que: 𝑆𝑒𝑚10 | 𝑆𝑒𝑚1 = 1 ~ 𝑁 (6.676; 1.512 ).
Entonces, si el peso en la semana 1 es de 1 gramo:
7 − 6.676
𝑃(𝑆𝑒𝑚10 ≥ 7) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 0.21) = 1 − 0.5832 = 𝟎. 𝟒𝟏𝟔𝟖
1.51
3. Sea 𝑌 una variable aleatoria cuya función de densidad es 𝑓(𝑦) = 𝛼𝑦 𝛼−1 ; 0 ≤ 𝑦 ≤ 1, se ha tomado una muestra de 15
datos, a partir de la cual se ha calculado el momento 𝑚3 = 0.11. A partir de dicha información, estime el parámetro 𝛼.
Muestre su procedimiento claramente. (1 p)
1 1
𝛼𝑦 𝛼+3 1 𝛼 × 1𝛼+3 𝛼 × 0𝛼+3 𝛼 𝟑𝑴𝟑
𝑀3 = ∫ 𝑦 3 ∙ 𝛼𝑦 𝛼−1 𝑑𝑦 = ∫ 𝛼𝑦 𝛼+2 𝑑𝑦 = ( )| = ( )−( )= → 𝜶=
0 0 𝛼+3 0 𝛼+3 𝛼+3 𝛼+3 𝟏 − 𝑴𝟑
Sea 𝑋1 𝑛=nº de artículos defectuosos en la Muestra 1, que consta de 𝑛 = 10 artículos donde cada uno
tiene una probabilidad de 𝑝 = 0.05 de ser defectuosos. Entonces 𝑋1 ∼ 𝐵(10; 0.05)
10
𝑃(𝑋1 = 1) = ( ) 0.051 (0.95)9 = 0.3151
1
b. ¿Qué proporción de las veces que hace la inspección tendrá que tomar la segunda muestra? (1p)
c. ¿Cuál es la probabilidad de que en una inspección en la que se tenga que tomar la segunda muestra, se tengan
más de 3 artículos defectuosos entre ambas muestras? (1p)
Sea 𝑋2 =nº de artículos defectuosos en la Muestra 2, que consta de 𝑛 = 10 artículos donde cada uno
tiene una probabilidad de 𝑝 = 0.05 de ser defectuosos. Entonces 𝑋2 ∼ 𝐵(10; 0.05) siendo
independiente de 𝑋1 .
d. ¿Qué proporción de las inspecciones, que realiza cada 15 minutos, tienen como resultado la detención del
proceso? (1p)
𝑃[(𝑋1 ≥ 3) ∩ (𝑋2 ≥ 3)] = 𝑃(𝑋2 ≥ 3|𝑋1 ≥ 3)𝑃(𝑋1 ≥ 3) = 𝑃(𝑋2 ≥ 3)𝑃(𝑋1 ≥ 3) = 0.01162 = 0.000135
3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
5. Un concursante de un evento recibirá un premio de 2000, 1000 o 500 soles, según el tiempo que tarde
en realizar un “reto”: si menos de 10 minutos hora, entre 10 y 20 minutos y entre 20 y 30 minutos,
FIRMA
respectivamente. Una vez transcurridos 30 minutos, la prueba concluye, y el concursante no recibe
ningún premio. La probabilidad de realizar el trabajo en menos de 10 minutos es 0.1; entre 10 y 20
minutos, 0.3; y entre 20 y 30 minutos, 0.5. Definiremos la variable 𝑋 = premio recibido.
𝜇 = 𝐸(𝑋) = ∑ 𝑥𝑖 𝑝(𝑥𝑖 ) = 0 × 0.1 + 500 × 0.5 + 1000 × 0.3 + 2000 × 0.1 = 750
d. Si sabemos que el concursante ha obtenido un premio, ¿Cuál es la probabilidad de que haya sido el más elevado?
(1p)
4
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
6. En una embotelladora de gaseosas, se tiene como objetivo envasar, en cada botella persona, 500 ml
de gaseosa. Sin embargo, se sabe que la máquina no vierte exactamente ese volumen en las botellas,
por lo que se consideran aceptables aquellas que tengan entre 495 y 509 ml (incluyendo ambos
valores). Se ha registrado el volumen de gaseosa (ml) que contiene un conjunto de botellas. A FIRMA
continuación, se muestran los datos que se han tomado y su resumen, obtenido con Minitab.
a. En el resumen aparece un p-valor de 0.815. Indique cuáles son las hipótesis asociadas al contraste en el cual se ha
obtenido dicho p-valor. Defínalas completamente. (0.5 p)
𝐻0 : 𝑋 ~ 𝑁(501.25; 38.89)
𝐻1 : 𝑋≁ 𝑁(501.25; 38.89)
c. A partir de los datos, ¿es posible afirmar que más de la cuarta parte de botellas son defectuosas? (1.5 p)
Hipótesis (0.25 p):
𝐻0 : 𝑝 ≤ 0.25
𝐻1 : 𝑝 > 0.25
Estadístico de contraste (0.25 p):
𝑝̂ − 𝑝0 0.3056 − 0.25
𝑧0 = = = 𝟎. 𝟕𝟕
√ 𝑝0 (1 − 𝑝0 ) √ 0.25 × 0.75
𝑛 36
5
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
.
7. Una empresa ha desarrollado un termómetro para medir la temperatura corporal de pacientes en un tiempo muy
corto. Para probarlo, en un hospital, se ha medido la temperatura corporal de un grupo de pacientes con el nuevo
termómetro (A) y con uno tradicional (B). El jefe de médicos tiene la sospecha de que el termómetro tradicional
registra, en promedio, menores medidas de temperatura en comparación con el nuevo termómetro. Sin embargo, el
desarrollador del termómetro piensa que no.
Individuo 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Termómetro A 37.02 36.86 37.29 37.46 36.80 36.85 37.16 37.40 37.51 36.69 37.38 36.81 37.19 36.83
Termómetro B 37.04 36.84 37.29 37.45 36.79 36.82 37.17 37.38 37.50 36.68 37.36 36.81 37.17 36.83
Diferencia (A-B) -0.02 0.02 0.00 0.01 0.01 0.03 -0.01 0.02 0.01 0.01 0.02 0.00 0.02 0.00
a. Mediante un contraste de hipótesis, evalúe a quién le daría la razón. Muestre su procedimiento y enuncie cada
una de sus suposiciones para resolver este problema y explíquelas. Utilice 𝛼 = 1%. (1.5 p)
Hipótesis (0.25 p): Se trata de datos emparejados. Sea 𝒀 = 𝑻𝑨 − 𝑻𝑩
𝐻0 : 𝜇𝑦 ≤ 0
𝐻1 : 𝜇𝑦 > 0
Estadístico de contraste (0.25 p):
𝑦̅ − 0 0.0086 − 0
𝑡0 = = = 0.3973 ≈ 𝟎. 𝟒𝟎
𝑠̂𝑦 0.081⁄
⁄ √14
√𝑛
Si se ha trabajado como muestras independientes, los puntajes son: Hipótesis 0.25p, estadístico y
distribución (justificada) 0.25 p, valores críticos y regiones 0.25 p, conclusión 0.25 p.
b. A partir de los datos, ¿es posible afirmar que la varianza de las temperaturas medidas por el termómetro nuevo
es 0.075? Responda a esta pregunta utilizando un intervalo de confianza. Explique y sustente cada una de sus
suposiciones para resolver este problema. Utilice un nivel de significación de 1%. (1 p)
14/06/2019
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario oficiales de la asignatura. Contesta cada pregunta sólo en
la hoja de su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega. Cuando se solicite RECLAMO, deberá
adjuntarse copia de la solución publicada. NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar. (5p) FIRMA
1.5 Si la muestra procede de una normal, la distribución muestral de la media es una t de Student
1.6 Si la muestra procede de una normal, la distribución muestral de la media es una normal X
1.7 Dado un tamaño muestral, puedo disminuir el margen de error si aumento el nivel de confianza
1.8 Dado un margen de error, al aumentar el tamaño muestral aumentará el nivel de confianza X
1.9 Dado un nivel de confianza, aumentando el tamaño muestral aumentará el margen de error
1.13 Cuanto mayor sea el nivel de significación más fácil será rechazar 𝐻0 X
1.14 El nivel de significación es el área que ocupa la región de aceptación
1
Página en blanco
2
Apellidos:______________________________________________________Nombre_______________________
Sección:___________________
NOTA
Un fabricante de fertilizantes para plantas desea desarrollar una fórmula de fertilizante orgánico que
produzca el mayor aumento en la altura de las plantas. Para probar su fórmula, se preparan dos grupos FIRMA
de plantas del mismo tipo: un grupo de control (grupo 1) sin ningún tipo de fertilizante, y un grupo
(grupo 2) con el nuevo fertilizante, denominado GrowFast. Después de que las plantas han
permanecido tres meses en un ambiente de invernadero controlado, se mide la altura de las plantas. El
resultado de esas mediciones se muestra en las siguientes figuras. Conteste de forma justificada a las siguientes
cuestiones:
Grupo 1 Grupo 2
a. Construya un intervalo de confianza del 95% de la altura media de las plantas sin fertilizante. (1p)
Según el gráfico de probabilidad y el pvalor del contraste AD (Anderson-Darling) puede asumirse que la
muestra procede de una población normal. (0.25p) Entonces
𝑠̂ 3.704
𝐼𝐶(0.95): 𝜇 ∈ [𝑥̅ ± 𝑡11;0.025 ] = [21.58 ± 2.201 ] = [21.58 ± 2.35] = [23.93 ; 19.23]
√𝑛 √12
b. ¿Qué tamaño muestral se necesita para estimar la altura media (sin fertilizante) con un margen de error inferior a 1? (1p)
Vamos a suponer que el n necesario será mayor que 30, por lo que podemos utilizar la fórmula para muestras
grandes.
3.704 1.96(3.704) 2
𝐿 = 1.96 <1⇒𝑛>( ) = 52.7 ⇒ 𝑛 ≥ 53
√𝑛 1
c. Si la altura de las plantas sin fertilizante es 𝑋1 ∼ 𝑁(𝜇1 ; 𝜎 2 ) y con fertilizante es 𝑋2 ∼ 𝑁(𝜇2 ; 𝜎 2 ), ¿qué distribución
muestral tendría la media muestral de todos los datos (12+11). Especifica también sus parámetros.(1p)
Por tanto, 𝑥̅ será una combinación lineal de 𝑥̅1 y 𝑥̅2 y será, por tanto, normal 𝑥̅ ∼ 𝑁(𝐸(𝑥̅ ); 𝑉𝑎𝑟(𝑥̅ )).
12 11 12 11
𝐸(𝑥̅ ) = 𝐸 ( 𝑥̅1 + 𝑥̅2 ) = 𝜇1 + 𝜇2
23 23 23 23
12 11 122 𝜎 2 112 𝜎 2 12 11
𝑉𝑎𝑟(𝑥̅ ) = 𝑉𝑎𝑟 ( 𝑥̅1 + 𝑥̅2 ) = 2 + = 𝜎 2 ( 2 + 2)
23 23 23 12 232 11 23 23
3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
(Continuamos con los datos de los fertilizantes)
d. ¿Aumenta el fertilizante la altura de las plantas? Responda mediante un contraste con un nivel de
significación de 5%. Responda en la tabla siguiente.(5p) FIRMA
4
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
1. Un proceso industrial tiene dos indicadores que son de interés para evaluar su rendimiento. Sin
embargo, la medición continua de ambos indicadores es muy costosa. Por ello, se han tomado datos, NOTA
a partir de los cuales se ha construido un modelo de regresión lineal que permite predecir el valor del
Indicador 2 a partir del valor del Indicador 1.
FIRMA
a. ¿Es posible afirmar que los residuos se ajustan a una distribución normal? Justifique su respuesta en un máximo de 2
líneas. (1 p)
Sí es posible, pues, en la gráfica de probabilidad normal de residuos, los puntos se alinean a la línea recta que representa a
la distribución normal.
Cualquier otro argumento adicional, invalida completamente la respuesta (0 p)
b. ¿Es posible afirmar que la relación entre el Indicador 1 y el Indicador 2 es lineal? Use un máximo de 2 líneas. (1 p)
No es posible, porque, en la gráfica de residuos vs. valores previstos se observa una estructura de puntos que evidencia
no linealidad.
Cualquier otro argumento adicional, invalida completamente la respuesta (0 p)
c. Explique de dónde procede el p-valor que está asociado a la variable Indicador1. Dé su respuesta en un máximo de tres
líneas. (0.5 p)
Procede de la prueba de significatividad de la relación entre el indicador 1 y el indicador 2.
2. Se tiene una muestra de pesos de un conjunto de monedas. Se han realizado pruebas de bondad de ajuste a distintas
distribuciones. Los resultados se muestran a continuación. En la tabla, la columna AD muestra el estadístico de la
prueba de bondad de ajuste y la columna P muestra el p-valor de dicha prueba.
a. A la vista de los resultados, ¿qué distribuciones son aceptables? Justifique su respuesta (0.5 p).
5
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
.
b. ¿Cuál es la mejor distribución que elegiría para modelar el peso de las monedas? Justifique su respuesta en un
máximo de dos líneas. (0.5 p)
Elegiría la lognormal, porque es la distribución con cuya prueba de bondad de ajuste se obtiene el mayor p-valor.
c. Interprete el significado del p-valor 0.081 de la prueba de bondad de ajuste a la distribución Logística. Use un
máximo de dos líneas. (1 p)
Es la probabilidad de que, si el modelo fuese correcto, se obtengan distancias tan grandes como las obtenidas en
la muestra que se ha tomado.
3. Un grupo de alumnos de Estadística construyó un modelo que permite predecir el volumen de jugo (en ml) de una
naranja a partir de su peso (en g). Minitab ha mostrado los siguientes resultados:
Además, verificó que la relación entre ambas variables es significativa y que se cumplen las hipótesis básicas del
modelo. Responda, de manera justificada, a las cuestiones que se plantean a continuación. Para que sus respuestas
sean válidas, deben ser claras y tener una buena redacción.
b. Interprete el valor del coeficiente de determinación. Dé su respuesta en un máximo de dos líneas. (0.5 p)
El modelo de regresión construido explica el 47.98 % de la variabilidad del volumen de jugo que se obtiene de
una naranja.
Cualquier otra respuesta: 0 p.
6
NOTA REVISADA FIRMA Estadística Básica
Parcial
Facultad de Ingeniería
11/05/2019
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
Con calculadora y formulario y tablas oficial de la asignatura. Todas las evaluaciones se escanean para prevenir fraude. Contesta cada pregunta
sólo en la hoja de su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega.
NOTA
Cuando se solicite reclamo, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El
reclamo deberá basarse en errores de corrección en base a esa solución.
1. A continuación, se muestra una tabla con un conjunto de afirmaciones. Para cada una de ellas, responde FIRMA
si es verdadera (V) o falsa (F). Para cada una, la puntuación es +0.5 si la respuesta es correcta y −0.5 si
se falla. No hay que justificar. (5p)
1
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
2. (6p) En un paradero de ómnibus, el tiempo, X, en minutos, que transcurre desde que se va un ómnibus hasta el siguiente
es una variable aleatoria que se distribuye como 𝑋 ∼ 𝑁(8,4). (Se usará la notación 𝑁(𝜇, 𝜎 2 ))
Un pasajero llega al paradero justo cuando se va un ómnibus. Responde, justificando brevemente, a las siguientes
preguntas:
a) ¿Cuánto tiempo esperará por término medio hasta que venga el siguiente ómnibus? (0.25p)
Piden 𝐸(𝑋) = 𝜇 = 8
c) Han transcurrido ya 5 minutos y este pasajero sigue esperando a que llegue el ómnibus. ¿Cuál es la probabilidad de que
el ómnibus demore todavía cinco minutos más en llegar (el tiempo de espera desde que llegó seria así de más de 10
minutos) (1,25p)
d) Cuando este pasajero llegó al paradero, estaba él solo, pues el resto de los pasajeros partieron en el último ómnibus.
Mientras espera, han aparecido más pasajeros. Asumiremos que los pasajeros llegan independientemente unos de otros
a un ritmo medio de 2 pasajeros por minuto. ¿Cuál es la probabilidad de que durante los 5 minutos que lleva esperando
hayan llegado 10 pasajeros? (1p)
Sea Y=nº de pasajeros que llegan en 5 minutos. Como lo hacen con media constante e independencia, es una
Poisson. Si en media llegan 2 por minuto, en 5 minutos la media será 10
𝑝𝑎𝑠 1010 −10
𝑌 ∼ 𝑃𝑜𝑖 (𝜆 = 10 ) ⇒ 𝑃(𝑌 = 10) = 𝑒 = 0.1251
5 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 10!
e) Por fin llega el ómnibus, y nuestro pasajero sube a él. El pasajero planea bajarse en la tercera parada a contar desde el
momento en que se ha subido. La duración del trayecto desde la posición actual hasta la siguiente parada (parada 1) se
distribuye como una normal 𝑋1 ∼ 𝑁(3,0.5), la duración entre la parada 1 y la parada 2 se distribuye como 𝑋2 ∼ 𝑁(4,1),
y la duración entre la parada 2 y la parada 3 sigue el modelo 𝑋3 ∼ 𝑁(3,1), siendo las tres duraciones independientes.
¿Cuál es la probabilidad de que su viaje dure más de 8 minutos? (1.5p)
f) La empresa de transporte cuenta con 5 ómnibus. La probabilidad de que un día se averíe un ómnibus es del 5%. ¿Cuál
es la probabilidad de que un día haya dos ómnibus averiados? (1p)
5
𝐴 ∼ 𝐵(5,0.05) ⇒ 𝑃(𝐴 = 2) = ( ) 0.052 × 0,953 = 0.0214
2
2
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________ NOTA
.
3. A partir de un conjunto de datos, se ha elaborado la siguiente tabla de frecuencias relativas acumuladas.
Calcule, a partir de la información brindada, el coeficiente de variación de los datos. Muestre su FIRMA
procedimiento. (1.5 p)
x 1 2 3 5 6 7 8
Frec. relativa
14% 36% 52% 64% 84% 96% 100%
acumulada
Frec. relativa 0.14 0.22 0.16 0.12 0.20 0.12 0.04
̅ = 𝟒. 𝟎𝟐 (0.25 p)
→𝒙
𝑠 2 = (1 − 4.02)2 × 0.14 + (2 − 4.02)2 × 0.22 + (3 − 4.02)2 × 0.16 + (5 − 4.02)2 × 0.12 + (6 − 4.02)2 × 0.20 +
(7 − 4.02)2 × 0.12 + (8 − 4.02)2 × 0.04 (0.25 p)
𝑠 2 = 4.9306 → 𝒔 = 𝟐. 𝟐𝟐 (0.25 p)
𝑠 2.22
Entonces, el coeficiente de variación será (0.5 p): 𝐶𝑉 = = = 𝟎. 𝟓𝟓𝟐𝟐
|𝑥̅ | 4.02
4. En una tienda de ropa, el monto de la compra (𝑋, en soles) de un cliente tiene la siguiente función de densidad:
20000
; 𝑥 ≥ 100
𝑓(𝑥) = { 𝑥3
0; 𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
+∞ +∞
20000 20000 +∞ 20000
𝐸(𝑋) = ∫ 𝑥 ∙ 𝑓(𝑥)𝑑𝑥 (𝟎. 𝟐𝟓 𝒑) = ∫ 𝑑𝑥 = (− )| = (0 + ) = 𝟐𝟎𝟎 (𝟎. 𝟐𝟓 𝒑)
−∞ 100 𝑥2 𝑥 100 100
+∞ +∞
20000
𝑉𝑎𝑟(𝑋) = ∫ (𝑥 − 𝜇)2 ∙ 𝑓(𝑥)𝑑𝑥 = ∫ (𝑥 − 200)2 ∙ (𝟎. 𝟐𝟓 𝒑) = +∞ (𝟎. 𝟐𝟓 𝒑)
−∞ 100 𝑥3
b. De los clientes que gastan menos de S/1000. ¿Qué porcentaje gastan más de 500? (1 p)
𝑃(𝑋 > 500 | 𝑋 < 1000) (0.25 p) Si se ha planteado otra probabilidad, el puntaje de toda la pregunta es 0.
1000 20000
∫500 𝑑𝑥
𝑃(𝑋 > 500 | 𝑋 < 1000) = 𝑥3 = 𝟎. 𝟎𝟑𝟎𝟑 (𝟎. 𝟓 𝒑)
1000 20000
∫100 𝑑𝑥
𝑥3
3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
.
d. ¿Qué valor es tan alto que solo el 30% de los clientes gasta un monto mayor que él? (1 p)
𝑃70
20000
∫ 𝑑𝑥 = 0.70
100 𝑥3
e. La tienda tiene la siguiente política: si un cliente gasta S/500 o más, se le invita a adquirir una membresía VIP, que
tiene un costo anual. Si gasta menos de S/500 no se le hace la invitación. Además, se sabe, por información
histórica, que únicamente el 10% de los clientes a los que se les hace la invitación, aceptan.
Un nuevo cliente realiza una compra en la tienda, ¿cuán probable es que adquiera la membresía VIP? (1.5 p)
Sean los sucesos A: El cliente gasta más de S/500; B: El cliente adquiere la membresía anual.
Se sabe que:
500 20000
𝑃(𝐴) = 𝑃(𝑋 > 500) = 1 − 𝑃(𝑋 ≤ 500) = 1 − ∫100 𝑑𝑥 = 0.04 (𝟎. 𝟓 𝒑)
𝑥3
𝑃(𝐵 | 𝐴) = 0.10
𝑃(𝐵 | 𝐴̅) = 0
Se pide P(B). Entonces: 𝑃(𝐵) = 𝑃(𝐵 | 𝐴) × 𝑃(𝐴) + 𝑃(𝐵 | 𝐴̅) × 𝑃(𝐴̅) (𝟎. 𝟓 𝒑)
a. Calcule 𝐸(𝑌 2 ). (1 p)
6 6
(𝑦6 ) (60) (6 ) (6 ) (6 ) (6 ) (6 ) (6 )
𝐸(𝑌 2) 2
= ∑ 𝑦 ∙ 𝑝(𝑦) = ∑ 𝑦 ∙ 2
= 02 × + 12 × 1 + 22 × 2 + 32 × 3 + 42 × 4 + 52 × 5 + 62 × 6
64 64 64 64 64 64 64 64
0 0
𝑬(𝒀𝟐 ) = 𝟏𝟎. 𝟓 (𝟏 𝒑)
b. Si se sabe que 𝑌 tiene un valor mayor que 1, ¿cuán probable es que tenga un valor de al menos 4? (1 p)
4
NOTA REVISADA FIRMA Estadística Básica
Práctica 4
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de su
enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega. Cuando se solicite RECLAMO, deberá adjuntarse copia de la
solución publicada. NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar. (4p) FIRMA
Para calcular el tamaño muestral para estimar una proporción 𝑝 de la que desconocemos completamente
1.4 X
su valor, lo mejor es asumir 𝑝 = 0.5
1.5 Si el intervalo de confianza del 95% de p es [0.01; 0.03] no puedo rechazar que 𝑝 = 0.05 con 𝛼 = 5%
1.10 Si quiero contrastar si la media es inferior a 100, tendré que usar 𝐻0 : 𝜇 ≠ 100
1.11 Si quiero contrastar si la media supera el valor 200, tendré que usar 𝐻0 : 𝜇 > 200
1
NOTA REVISADA FIRMA Estadística Básica
Práctica 4
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
No se puede consultar ninguna documentación, salvo las tablas y formulario de la asignatura. Contesta cada pregunta sólo en la hoja de su
enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega. Cuando se solicite RECLAMO, deberá adjuntarse copia de la
solución publicada. NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. (+1 si la elección es correcta, -1/3 FIRMA
si la elección es incorrecta). No hay que justificar. (4p)
SOLUCIÓN:
1.1 Falsa. El subíndice indica el área a la derecha de la distribución. Como 𝑍 es simétrica y de meda cero, se tendrá que 𝑧0.025 = 1 − 𝑧0.975
1.2 Falsa. 𝑡300 ≈ 𝑁(0,1)
1.3 Verdadera. La distribución t de Student tiene la zona de las colas más ancha que la 𝑁(0,1), por lo que la función de densidad se acerca
asintóticamente a cero más despacio. Por tanto, 𝑡𝑛−1;0.025 > 𝑧0.025 .
Para calcular el tamaño muestral para estimar una proporción 𝑝 de la que desconocemos completamente
1.4 X
su valor, lo mejor es asumir 𝑝 = 0.5
1.5 Si el intervalo de confianza del 95% de p es [0.01; 0.03] no puedo rechazar que 𝑝 = 0.05 con 𝛼 = 5%
SOLUCIÓN:
1.4 Verdadera. Deesa formase calcula para el caso más desfavorable
1.5 Falsa. Como 0.05 no está en el intervalo del 95%, sí podemos rechazar que la proporción poblacional sea 0.05 con 𝛼 = 5%
1.6 Falsa. Si 𝑛𝑝(1 − 𝑝) > 5 podemos aproximar la proporción muestral 𝑝̂ a una Normal.
2
Marca con X la frase correcta. (+1 si acierto, -0.25 si fallo)
Si al realizar el contraste 𝐻0 : 𝜇 ≥ 10 se obtiene un pvalor=0.10, el contraste 𝐻0 : 𝜇 = 10 tendrá un pvalor
1.7
de 0.05
Si al realizar el contraste 𝐻0 : 𝜇 ≥ 100 se obtiene un pvalor=0.10, el contraste 𝐻0 : 𝜇 ≤ 100 tendrá un
1.8 X
pvalor de 0.90
1.9 Si rechazo 𝐻0 en el contraste 𝐻0 : 𝜇 ≥ 𝜇0, también rechazaré 𝐻0 en el contraste 𝐻0 : 𝜇 ≤ 𝜇0
SOLUCIÓN:
1.7 Falso. En el contraste con 𝐻0 : 𝜇 ≥ 10 el pvalor es el área a la izquierda del valor del estadístico de contraste, mientas que con 𝐻0 : 𝜇 = 10,
es el doble de dicha área, por lo que el pvalor sería 0.20.
1.8 Verdadero. En el contraste con 𝐻0 : 𝜇 ≥ 10 el pvalor es el área a la izquierda del valor del estadístico de contraste, mientas que con 𝐻0 : 𝜇 ≤
10, es el área a la izquierda, que sería 0.90,
1.9 Falso. Si rechazo con 𝐻0 : 𝜇 ≥ 𝜇0 será porque el estadístico de contraste está en la zona de la cola de la izquierda de la distribución
N(0,1) o 𝑡𝑛−1 . Por el contrario, para rechazar 𝐻0 : 𝜇 ≤ 𝜇0 habría que estar en la zona de la cola de la derecha.
1.10 Si quiero contrastar si la media es inferior a 100, tendré que usar 𝐻0 : 𝜇 ≠ 100
1.11 Si quiero contrastar si la media supera el valor 200, tendré que usar 𝐻0 : 𝜇 > 200
SOLUCIÓN:
1.10 Falso. Tendré que usar 𝐻0 : 𝜇 ≥ 100; 𝐻1 : 𝜇 < 100
1.11 Falso. Tendré que usar 𝐻0 : 𝜇 ≤ 200; 𝐻1 : 𝜇 > 200
1.12 Verdadero. Tendré que usar 𝐻0 : 𝜇 ≥ 0; 𝐻1 : 𝜇 < 0
3
Apellidos:______________________________________________________Nombre_______________________
Sección:___________________ NOTA
2. Un horno metalúrgico en el que se elabora cierta aleación debe mantener una temperatura lo más FIRMA
estable posible alrededor del valor de temperatura especificado. Para monitorear la temperatura del
horno se toma una muestra de 30 temperaturas a intervalos regulares, obteniéndose una media de 𝑥̅ =
1970 , y una cuasi-varianza de 𝑠̂ 2 = 100 . Asumiendo que las temperaturas de este proceso se
distribuyen como una normal, se pide:
Como la población de la que procede la muestra es normal, el intervalo de la media poblacional se basa en la distribución
𝑡𝑛−1 = 𝑡29
𝑆̂ 10
𝐼𝐶(0.95): 𝜇 ∈ (𝑋̅ ± 𝑡29;0.025 ) = (1970 ± 2.045 ) = (1970 ± 3.74) = (1966.27; 1973.74)
√𝑛 √30
b. ¿Se puede afirmar que la temperatura media del horno es de 1975 grados? Justifica adecuadamente tu respuesta.
(2p)
Debemos hacer el contraste bilateral 𝐻0 : 𝜇 = 1975; 𝐻1 : 𝜇 ≠ 1975. Este contraste es equivalente a comprobar si 1975
está dentro del intervalo de confianza que use el mismo 𝛼 . Como 1975 no está en el intervalo, rechazamos que la
temperatura media del horno sea 1975.
Como la población de la que procede la muestra es normal, el intervalo de la media poblacional se basa en la distribución
2 2
𝜒𝑛−1 = 𝜒29
29 𝑠̂ 2 29 𝑠̂ 2 29(100) 29 (100)
𝐼𝐶(0.95): 𝜎 2 ∈ [ 2 ; 2 ]=[ ; ] = [63.43 ; 180.69
𝜒29;0.025 𝜒29;0.025 45.72 16.05
• El estadístico de contraste es
(𝑛 − 1)𝑠̂ 2 29(100)
𝑋02 = = = 27.62 (0.25p)
𝜎02 105
• Al ser la población normal, la distribución de referencia es la 𝜒29
2
.
(0.25p)
4
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
4. Se quiere conocer qué proporción de estudiantes universitarios está estudiando portugués, como lengua NOTA
extranjera. ¿A cuántos deberíamos preguntar para estimar dicha proporción con un margen de error de
0.05? (2 p)
FIRMA
• Como no se tiene ninguna proporción muestral, se asume el “peor de los casos”: 𝑝̂ = 0.5. (0.5 p)
• Como no se tiene más información, se asume que se construirá el intervalo con un nivel de
confianza del 95%.
2 2
√𝑝̂ (1 − 𝑝̂ ) √0.5 × 0.5
𝑛 = (𝑧𝛼⁄2 ) = (1.96 × )
𝐿 0.05
𝑛 = 384.16 (1 p)
𝑛 ≈ 385 (0.5 p)
5. Después de preguntar a 50 estudiantes, obtenemos que 5 de ellos estudia portugués. Aprovechando esta información,
¿a cuántos deberíamos preguntar para estimar dicha proporción con un margen de error de 0.05? (1.5 p)
• Como no se tiene más información, se asume que se construirá el intervalo con un nivel de confianza del 95%.
5
• Según la información que se tiene: 𝑝̂ = = 0.10. (0.5 p)
50
2 2
√𝑝̂ (1 − 𝑝̂ ) √0.1 × 0.9
𝑛 = (𝑧𝛼⁄2 ) = (1.96 × )
𝐿 0.05
𝑛 = 138.30 (0.75 p)
𝑛 ≈ 139 (0.25 p)
6. Tras preguntar a 200 estudiantes, 12 de ellos estudian portugués. Contrasta que la proporción poblacional de estudiantes
que estudia portugués sea como mínimo el 10%. (1.5 p)
1) Se definen las hipótesis (0.25 p): 4) Se definen las regiones de aceptación y rechazo
𝐻𝑜 : 𝑝 ≥ 0.10 (0.25 p):
𝐻1 : 𝑝 < 0.10
5) Conclusión
3) Como 𝑛𝑝̂ (1 − 𝑝̂ ) > 5, la distribución del
a. Se rechaza la hipótesis nula (se acepta la
estadístico de contraste es (0.25 p):
hipótesis alternativa).
𝑍0 ~𝑁(0,1)
b. No hay suficiente evidencia para afirmar que la
Si alguno de los tres pasos anteriores es proporción de estudiantes que estudia
incorrecto, el resto del procedimiento no se portugués es como mínimo 10%.
corrige. La conclusión debe ser coherente con el paso 4.
Si todo es correcto, 0.5 p. Si hay algún error: 0 p.
5
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
NOTA
.
7. Se desea estudiar el número de artículos defectuosos que se encuentra en una caja de 6 dispositivos
electrónicos. Se ha tomado una muestra aleatoria de varias cajas, cuya frecuencia se muestra a FIRMA
continuación
Número de dispositivos
Número de cajas
defectuosos
0 73
1 43
2 11
3 2
4 1
5 1
a. A partir de la información muestral, ¿es posible afirmar que el número medio de artículos defectuosos en una
caja de 6 dispositivos no es inferior al valor de 1? Resuélvalo utilizando el p-valor. (2 p)
2) Se calcula el estadístico de contraste (0.25 p): 5) Conclusión. Como el p-valor es menor que el nivel
𝑥̅ − 𝜇0 0.61 − 1 de significación (5%), entonces:
𝑡0 = = = −5.16
𝑠̂ 0.8644 c. Se rechaza la hipótesis nula (se acepta la
√𝑛 √131 hipótesis alternativa).
d. No hay suficiente evidencia para afirmar que el
3) Como la muestra es grande, la distribución del número medio de artículos defectuosos no es
estadístico de contraste es (0.25 p): inferior al valor de 1. (Hay suficiente evidencia
𝑇0 ~𝑁(0,1) para afirmar que el número medio es inferior
a 1).
Si alguno de los tres pasos anteriores es
La conclusión debe ser coherente con el paso 4.
incorrecto, el resto del procedimiento no se Si todo es correcto, 0.75 p. Si hay algún error: 0 p.
corrige.
b. A partir de la información de la muestra, ¿es posible afirmar que el porcentaje de cajas que tienen al menos un
artículo defectuoso es mayor que el 50%? Resuélvalo utilizando el p-valor. (1 p)
2) Se calcula el estadístico de contraste (0.25 p): 5) Conclusión. Como el p-valor es mayor que el nivel
𝑝̂ − 𝑝0 0.4427 − 0.50 de significación (5%), entonces:
𝑧0 = = = −1.3117
𝑝0 (1 − 𝑝0 ) 0.50 × 0.50 a. Se acepta la hipótesis nula (se rechaza la
√ √
𝑛 131 hipótesis alternativa).
b. No hay suficiente evidencia para afirmar que
3) Como 𝑛𝑝̂ (1 − 𝑝̂ ) > 5 , la distribución del el porcentaje de cajas que tienen al menos un
estadístico de contraste es (0.125 p): artículo defectuoso es mayor que el 50%.
𝑍0 ~𝑁(0,1) La conclusión debe ser coherente con el paso 4.
Si todo es correcto, 0.25 p. Si hay algún error: 0
Si alguno de los tres pasos anteriores es p.
incorrecto, el resto del procedimiento no se
corrige.
6
ESTADÍSTICA BÁSICA
SEMESTRE 2019-II
CONTROL DE LABORATORIO 4-A
MIÉRCOLES, 20 DE NOVIEMBRE DE 2019
Apellidos:__________________________________________________Nombre________________________
Sección:___________________
Contesta sólo en los recuadros. Salvo que se indique lo contrario, utiliza 𝛼 = 0.05. No se puede consultar ningún tipo de documentación
1. Una plantación de tabaco de Tarapoto quiere comparar la efectividad de dos tratamientos diferentes para evitar la aparición
de lesiones en las hojas de tabaco. Se seleccionan 8 hojas. En cada una, se impregna la mitad de la hoja con un preparado
del tratamiento 1, y la otra mitad con el tratamiento 2. Transcurrido un tiempo se cuenta el número de lesiones que hay en
cada mitad de las hojas. Los datos se encuentran en el archivo LesionTabaco.MTW. El tratamiento más efectivo será aquel
que consigue menos lesiones. Contrasta si el tratamiento 1 es menos efectivo que el tratamiento 2. Asumiremos normalidad
en las poblaciones.
2. El archivo FrenosITV.MTW tiene datos de un conjunto de autos tomados en un taller de inspección de vehículos. La variable
‘Eficacia’ tiene la eficacia de la frenada. Es un valor entre 0 y 100, que cuanto mayor sea más efectiva es la frenada. La variable
ABS vale 1 si el auto está equipado con el dispositivo ABS que evita el bloqueo de los frenos, y 0 si no dispone de él. Contrasta
si la eficacia de frenado es la misma con o sin ABS.
p-valor = 0.491 (como las cuasidesv. son similares, se utiliza la desv. estándar agrupada) (2p)
Conclusión: (3p)
No podemos rechazar la hipótesis nula de igualdad de medias.
No hay evidencia, por tanto, de que el tener ABS modifique la eficacia de frenado.
Si el pvalor está mal, esta parte no se puntúa
3. Las partículas en suspensión en el aire que tienen un tamaño menor de 10μm se denominan PM10, y pueden estar
constituidas por multitud de contaminantes diferentes. Estas partículas permanecen de forma estable en el aire durante
largos periodos de tiempo sin caer al suelo pudiendo ser trasladadas por el viento a distancias importantes. El archivo
ConcentraPM10_CERO.mtw contiene datos sobre concentración de PM10 medida en una estación de medición de cierta
ciudad europea (variable PM10). Cada fila corresponde a una hora del día. Además, contiene la variable ‘coches’, que es el
número de autos que durante esa hora pasaron frente la estación de medición.
a. ¿Te parece que una regresión lineal puede ser adecuada para analizar la relación entre el número de autos y el
nivel de PM10? Razona brevemente. (2p)
Sigue →
b. Escribe el modelo de regresión que prediga el nivel de PM10 en función del número de autos (2p)
• 𝛽̂1 : Cuando el número de autos aumenta en una unidad, el nivel de PM10 previsto
(medio) aumenta en 0.000178 unidades (2p) (si no dice que el aumento es ‘previsto’
o ‘esperado’ o ‘por término medio’ o similar, sólo 1p)
d. Predice el nivel de PM10 que se espera cuando circulen 1000 autos (2p)
Apellidos::__________________________________________________Nombre___________________________
Sección:___________________
Contesta sólo en los recuadros. Salvo que se indique lo contrario, utiliza 𝛼 = 0.05. No se puede consultar ningún tipo de documentación.
1. El archivo frenosITV.mtw tiene datos de un conjunto de autos tomados en un taller de inspección de vehículos. La variable
‘Eficacia’ tiene la eficacia de la frenada. Es un valor entre 0 y 100, que cuanto mayor sea más efectiva es la frenada. La variable
ABS vale 1 si el auto está equipado con el dispositivo ABS que evita el bloqueo de los frenos, y 0 si no dispone de él. Contrasta
si el dispositivo ABS mejora la eficacia de frenado.
p-valor = 0.246 (como las cuasidesv. son similares, se utiliza la desv. estándar agrupada) (2p)
Conclusión: (3p)
No podemos rechazar la hipótesis nula 𝐻0 : 𝜇0 ≥ 𝜇1 , frente a 𝐻1 : 𝜇0 < 𝜇1 .de igualdad de medias.
No hay evidencia, por tanto, de que el tener ABS haga que los frenos sean más eficaces.
Si el pvalor está mal, esta parte no se puntúa
2. El ingeniero de calidad de una empresa dedicada al cultivo de tabaco quiere comparar la efectividad de dos tratamientos
diferentes para evitar la aparición de lesiones en las hojas de tabaco. Se seleccionan 8 hojas. En cada una, se impregna la
mitad de la hoja con un preparado del tratamiento 1, y la otra mitad con el tratamiento 2. Transcurrido un tiempo se cuenta
el número de lesiones que hay en cada mitad de las hojas (asumiremos normalidad en las poblaciones). Los datos se
encuentran en el archivo LesionTabaco.MTW. El tratamiento más efectivo será aquel que consigue menos lesiones. Contrasta
si ambos tratamientos son igual de eficaces.
3. El archivo 30oyster.MTW contiene datos de una muestra de 30 ostras. Entre otra información se tiene el volumen de la ostra
(variable C3: Volumen_cc). Este dato es importante, pues el precio que la ostra alcanzará en el mercado depende de su
tamaño. Medir el volumen de cada ostra es muy lento y costoso. Una forma indirecta de medir el tamaño de la ostra es
mediante el registro de una imagen en 3D. Los píxeles que ocupe la imagen deben ser proporcionales al volumen de la
ostra. La variable Pixels_3D (columna C4) contiene el tamaño de dicha imagen para cada ostra. Se desea construir un modelo
estadístico que prediga el volumen de la ostra a partir de su imagen 3D.
a. ¿Te parece que una regresión lineal puede ser adecuada para predecir el volumen de la ostra a partir del tamaño
de su imagen 3D? Razona brevemente.
El gráfico de dispersión muestra relación lineal y fuerte. La nube de puntos es estrecha. (1p)
Además, el coeficiente de correlación es 0.977, que es muy alto. (1p)
La regresión lineal es adecuada por haber relación lineal, y será muy precisa.
Sigue →
b. Escribe el modelo de regresión que prediga el volumen de la ostra a partir de Pixels_3D. (2p)
• 𝛽̂0 : sería el volumen previsto de una ostra cuya imagen tiene 0 pixels. Esto no tiene
sentido por lo que este coeficiente no tiene interpretación en este caso. (2p)
d. Predice el volumen de una ostra que tiene una imagen de 500 000 pixels
No se puede predecir ese valor, pues está fuera del rango de valores de los datos (2p)
(si hacen el cálculo Volumen previsto = 0,419572 + 0,00000247522 * 500 000=1.657 ó 1.42
sin advertir que está fuera de rango sólo 1p)
ESTADÍSTICA BÁSICA
SEMESTRE 2019-II
CONTROL DE LABORATORIO 4-A
JUEVES, 21 DE NOVIEMBRE DE 2019
Apellidos:__________________________________________________Nombre________________________
Sección:___________________
Contesta sólo en los recuadros. Salvo que se indique lo contrario, utiliza 𝛼 = 0.05. No se puede consultar ningún tipo de documentación
1. El archivo FishCatch.MTW tiene datos de un conjunto de 159 peces que han sido atrapados. Se pretende construir un modelo
de regresión lineal que permita predecir la relación entre el peso de un pescado y su longitud (Long2). ¿Cómo es la relación
entre ambas variables? ¿Es conveniente usar el modelo? Usa la información del gráfico de dispersión y el coeficiente de
correlación (indica su valor). Responde en un máximo de 3 líneas.
Hay una alta correlación entre ambas variables (correlación = 0.919). (0.75 p) Sin embargo, en el gráfico de dispersión
se evidencia una relación no lineal. (0.75 p) No es conveniente usar el modelo.(0.5 p)
2. El archivo FishCatch.MTW tiene datos de un conjunto de 159 peces que han sido atrapados. En la muestra, existen 7 especies
de peces. A partir de los datos, se desea averiguar si es posible afirmar que los peces de la especie Bermejuela (especie = 3)
tienen un peso medio inferior a los de especie Brema blanca (especie = 4).
p-valor = 0.466 (2 p)
Si han escrito 0.465: 1 p.
Si es incorrecto, no se corrige la conclusión.
Conclusión:
Como el p-valor es mayor que 𝛼 = 0.05, se acepta la hipótesis nula 𝐻𝑜 : 𝜇3 ≥ 𝜇4 y se rechaza la alternativa
𝐻1 : 𝜇3 < 𝜇4 . (1.5 p)
No hay suficiente evidencia para afirmar que los peces de especie Bermejuela tienen un peso medio inferior
a los de especie Brema blanca. (1.5 p)
3. Una plantación de tabaco quiere comparar la efectividad de dos tratamientos diferentes para evitar la aparición de lesiones
en las hojas de tabaco. Se seleccionan 8 hojas. En cada una, se impregna la mitad de la hoja con un preparado del tratamiento
1, y la otra mitad con el tratamiento 2. Transcurrido un tiempo se cuenta el número de lesiones que hay en cada mitad de
las hojas. Los datos se encuentran en el archivo LesionTabaco.MTW. El tratamiento más efectivo será aquel que consigue
menos lesiones. Contrasta si el tratamiento 1 es menos efectivo que el tratamiento 2. Asumiremos normalidad en las
poblaciones.
pvalor: 0.017 (2 p)
Si es incorrecto, no se corrige la conclusión.
Conclusión:
Como el p-valor es menor que 𝛼 = 0.05, se rechaza la hipótesis nula 𝐻𝑜 : 𝜇 𝑇1 ≤ 𝜇 𝑇2 y se acepta la alternativa
𝐻1 : 𝜇 𝑇1 > 𝜇 𝑇2 . (1.5 p)
Hay suficiente evidencia para afirmar que el tratamiento 1 es menos efectivo que el tratamiento 2. (1.5 p)
Sigue →
4. Se desea construir un modelo de regresión que prediga la temperatura de ebullición del agua a partir de la presión
atmosférica. Use los datos de EbullicionHimalaya.MTW.
• 63.141: Sería el valor previsto de la temperatura cuando la presión es 0 atm. Una presión
de 0 está fuera del rango de datos a partir de los cuales se ha construido el modelo,
por lo que no se considera válida dicha interpretación. (2 p)
c. Predice la temperatura de ebullición del agua cuando la presión atmosférica es 0.75 atm.
91.9395 (2 p)
Otro valor posible: 91.9403 (2 p)
ESTADÍSTICA BÁSICA
SEMESTRE 2019-II
CONTROL DE LABORATORIO 4-B
JUEVES, 21 DE NOVIEMBRE DE 2019
Apellidos:__________________________________________________Nombre________________________
Sección:___________________
Contesta sólo en los recuadros. Salvo que se indique lo contrario, utiliza 𝛼 = 0.05. No se puede consultar ningún tipo de documentación
1. El archivo FishCatch.MTW tiene datos de un conjunto de 159 peces que han sido atrapados. En la muestra, existen 7 especies
de peces. A partir de los datos, se desea averiguar si es posible afirmar que los peces de la especie Besugo (especie = 1)
tienen un peso promedio inferior a los de especie Lucio (especie = 6).
p-valor = 0.234 (2 p)
Si han escrito 0.174: 1 p.
Si es incorrecto, no se corrige la conclusión.
Conclusión:
Como el p-valor es mayor que 𝛼 = 0.05, se acepta la hipótesis nula 𝐻𝑜 : 𝜇1 ≥ 𝜇6 y se rechaza la alternativa
𝐻1 : 𝜇1 < 𝜇6 . (1.5 p)
No hay suficiente evidencia para afirmar que los peces de especie Besugo tienen un peso medio inferior a
los de especie Lucio. (1.5 p)
5. El archivo FishCatch.MTW tiene datos de un conjunto de 159 peces que han sido atrapados. Se pretende construir un modelo
de regresión lineal que permita predecir la relación entre el peso de un pescado y su longitud (Long1). ¿Cómo es la relación
entre ambas variables? ¿Es conveniente usar el modelo? Usa la información del gráfico de dispersión y el coeficiente de
correlación (indica su valor). Responde en un máximo de 3 líneas.
Hay una alta correlación entre ambas variables (correlación = 0.916). (0.75 p) Sin embargo, en el gráfico de dispersión
se evidencia una relación no lineal. (0.75 p) No es conveniente usar el modelo. (0.5 p)
2. Una plantación de tabaco quiere comparar la efectividad de dos tratamientos diferentes para evitar la aparición de lesiones
en las hojas de tabaco. Se seleccionan 8 hojas. En cada una, se impregna la mitad de la hoja con un preparado del tratamiento
1, y la otra mitad con el tratamiento 2. Transcurrido un tiempo se cuenta el número de lesiones que hay en cada mitad de
las hojas. Los datos se encuentran en el archivo LesionTabaco.MTW. El tratamiento más efectivo será aquel que consigue
menos lesiones. Contrasta si ambos tratamientos son igual de eficaces. Asumiremos normalidad en las poblaciones.
pvalor: 0.034 (2 p)
Si es incorrecto, no se corrige la conclusión.
Conclusión:
Como el p-valor es menor que 𝛼 = 0.05, se rechaza la hipótesis nula 𝐻𝑜 : 𝜇 𝑇1 = 𝜇 𝑇2 y se acepta la alternativa
𝐻1 : 𝜇 𝑇1 ≠ 𝜇 𝑇2 . (1.5 p)
No hay suficiente evidencia para afirmar que ambos tratamientos son igual de eficaces. (1.5 p)
Sigue →
3. Se desea construir un modelo de regresión que prediga la presión atmosférica a partir de la temperatura de ebullición del
agua. Use los datos de EbullicionHimalaya.MTW.
(en lugar de ‘por término medio’ se puede hacer mención a ‘la temperatura prevista’
o ‘esperada’
0.828435 (2 p)
NOTA NOTA REVISADA FIRMA Estadística Básica
Examen sustitutorio
Semestre 2019-II 11/12/19
Duración: 3 h
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
Con calculadora, tablas y formulario oficial de la asignatura. Contesta cada pregunta sólo en la hoja de su enunciado.
Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega. La notación de la normal es 𝑵(𝝁; 𝝈𝟐 )
Cuando se solicite reclamo, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta. HOJA 1
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar. (5p)
1.1 Sólo debemos hacer histogramas con pocas clases si tenemos un tamaño muestral muy grande
1.2 Cuando hay asimetría positiva, la media tiende ser mayor que la mediana X
1.3 Un valor atípico muy extremo puede provocar que la curtosis tome un valor negativo muy elevado.
1.6 Si tenemos una muestra de tamaño 𝑛 > 30 de una variable 𝑋, entonces 𝑋 se puede aproximar a una normal.
1.13 Si X es una variable aleatoria continua y 𝑃(𝑋 = 3) = 0, entonces el 3 no está en su espacio muestral
1
Página en blanco
2
Apellidos:______________________________________________________Nombre:_____________________
Sección:______________
2. Un proceso productivo de manufactura consta de dos etapas, cuyo objetivo es transformar unos artículos NOTA
metálicos mediante deformación en caliente. En la etapa 1 se realiza sobre el artículo una operación donde HOJA 2
se invierte un tiempo que es aleatorio de acuerdo con el modelo (en segundos) 𝑋1 ∼ 𝑁(25,4). Tras esa
operación se pasa el artículo a la etapa 2, en la que se invierte un tiempo (segundos) que sigue el modelo
𝑋2 ∼ 𝑁(22,2), y que es independiente del de la etapa 1. Finalizada estas etapas, el artículo se somete a un
proceso de inspección. Este proceso es mediante un sensor, por lo que no consume tiempo adicional. Si el artículo no es
aceptable, lo que ocurre el 10% de los casos, se retira de la línea de producción. Responde de forma justificada a las
siguientes cuestiones: (2.5p)
a. ¿Cuál es la probabilidad de que, para un artículo, la etapa 1 demore más de 28 segundos y, además, la etapa 2 demore
más de 20 segundos? Se pide una única probabilidad para este suceso compuesto. (0.5p)
b. Si tras 25 segundos aún no ha terminado la etapa 1, ¿cuál es la probabilidad de que termine en los próximos 3
segundos? (0.5p)
𝑃(25 < 𝑋1 < 28) 𝑃(𝑋1 < 28) − 𝑃(𝑋1 < 25) 0.9332 − 0.5
𝑃(𝑋1 < 28|𝑋1 > 25) = = = = 0.8664
𝑃(𝑋1 > 25) 𝑃(𝑋1 > 25) 0.5
c. ¿Cuál es la probabilidad de que la duración de la operación 2 sea mayor que la de la operación 1 (𝑋2 > 𝑋1 )? (0.5p)
d. Sea Y la duración total de este proceso (las dos etapas). ¿Cuál es la probabilidad de que el proceso demore más de 50
segundos? (0.5p)
50 − 47
𝑌 = 𝑋1 + 𝑋2 ∼ 𝑁(47,6); 𝑃(𝑌 > 50) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 1.23) = 0.1093
√6
e. ¿Cuál es la probabilidad de que, al fabricar 10 artículos, haya más de 2 artículo defectuosos? (0.5p)
3
Apellidos:__________________________________________________________Nombre:________________________
Sección:______________
3. Los clientes que acuden a un puesto de servicio lo hacen independientemente unos de otros y a un ritmo medio de 3
clientes por minuto. (2.5p)
a) ¿Cuál es la probabilidad de que no lleguen clientes en un minuto? (0.5p)
Al ser las llegadas independientes y con media constante: 𝑋 =número de clientes por minuto. 𝑋 ∼ 𝑃𝑜𝑖(𝜆 = 3)
𝜆0 −𝜆
𝑃(𝑋 = 0) = 𝑒 = 𝑒 −3 = 0.0498
0!
b) ¿Cuál es la probabilidad de que entre dos clientes consecutivos transcurran más de dos minutos? (0.5p)
Como el número de clientes por minuto sigue una exponencial, el intervalo entre dos llegadas es una exponencial
c) Cuánto tiempo transcurre, por término medio, entre la llegada de dos clientes consecutivos. (0.5p)
d) ¿Cuál es la probabilidad de que en una hora lleguen más de 200 clientes? (1p)
200 − 180
𝑃(𝑌 > 200) ≈ 𝑃 (𝑍 > ) = 𝑃(𝑍 > 1.49) = 1 − 0.9319 = 0.0681
√180
4
Apellidos:__________________________________________________________Nombre:________________________
Sección:______________
5. En el curso, se ha explicado que, para hacer inferencia para la media, resulta útil tener una muestra NOTA
grande. ¿Qué significa eso? ¿Cuál es la consecuencia de que la muestra sea grande? (0.5 p) HOJA 3
Significa que la muestra tiene más de 30 datos.
La consecuencia es que la media muestral se aproxima (por TCL) a una normal.
Si han escrito que “la muestra se distribuye normalmente” o que “la población es normal”, la respuesta es incorrecta.
6. Sea la variable aleatoria 𝑌 , definida por la función densidad 𝑓(𝑦) = 2(𝑎 − 𝑦)𝑎 −2 ; 𝑦 ∈ [0; 𝑎]. Se ha tomado una
∑50 2
𝑖=1 𝑦𝑖
muestra de 50 datos y se ha calculado: 𝑚2 = = 1.44. Utilizando el método de los momentos, construya el
50
estimador de 𝑎. (1.5 p)
𝑎
𝑎2
𝑀2 = ∫ 2𝑦 2 (𝑎 − 𝑦)𝑎 −2 𝑑𝑦 = → 𝑎 = √6𝑀2 (0.75 𝑝)
6
0
7. Un pediatra se encuentra realizando un estudio sobre el crecimiento en niños y niñas, para lo cual ha tomado una
muestra de infantes de 10 años y ha medido su peso. La mitad de ellos son niños y la otra mitad, niñas. Los datos se
muestran a continuación:
NIÑAS 26.15 25.37 26.38 24.38 26.37 26.13 25.31 26.01 25.48 25.37 25.14 25.45 24.93 27.07 26.65 24.45
NIÑOS 29.73 28.16 23.91 26.60 23.25 25.73 25.79 27.05 28.20 25.94 25.16 25.89 27.16 26.98 26.51 27.85
A partir de esos datos, se ha calculado que las niñas de la muestra pesan, en promedio, 25.665 kg y los niños, 26.494
kg. Las cuasidesviaciones estándar de ambos conjuntos de datos son 0.7680 (niñas) y 1.6274 (niños).
a. ¿Es posible afirmar que el peso promedio de niños y niñas de 10 años es el mismo? Utilice el p-valor en la justificación
de su respuesta. Muestre todos los pasos del contraste. (1.5 p)
b. Un estudiante ha llegado a la conclusión de que el peso de los niños se distribuye normalmente. Mediante un contraste,
desea confirmar su hipótesis de que la varianza del peso de los niños de 10 años es menor que 1.445. ¿Cómo debe ser
el nivel de significación para concluir que su hipótesis es correcta? (1.5 p)
2
𝜒02 ~ 𝜒15 (0.25 p) Para aceptar que su hipótesis es correcta (𝐻1 : 𝜎 2 <
1.445), se debe cumplir que 𝑝 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼, es decir
𝛼 > 0.975. (0.25 p)
5
Apellidos:__________________________________________________Nombre__________________
8. Dibuje, de forma aproximada, cómo sería el gráfico de residuos frente a valores previstos de una regresión simple
ajustada a los datos del siguiente gráfico (0.75 p):
Gráfico de dispersión Gráfico de residuos frente a valores previstos
9. Suponga que tiene un conjunto de datos y quiere determinar cuál es la distribución (modelo de probabilidad) que
mejor se ajusta a dichos datos.
a. ¿Cómo evaluaría gráficamente cuál es la distribución que se ajusta mejor a los datos? Responda en una línea. (0.5 p)
Con un histograma, CDF empírica, gráfica de probabilidad. Si solo han mencionado una: 0.25 p.
b. ¿Cómo evaluaría analíticamente cuál es la distribución que se ajusta mejor a los datos? (0.5 p)
Realizando una prueba de bondad de ajuste con diferentes distribuciones. Si el p-valor de la prueba es
mayor que el nivel de significación, se acepta que la distribución es adecuada.
c. Cuando se hace una prueba de normalidad, se obtiene un p-valor. ¿Cuál es la interpretación de dicho valor? Responda
en un máximo de dos líneas. (0.5 p)
Es la probabilidad de que, si el modelo fuese el correcto, se obtengan distancias tan grandes como las obtenidas con
la muestra.
d) En cierto momento, se mide el indicador 1 y se obtiene un valor de 5. ¿Cuál es la probabilidad de que el indicador 2 sea
mayor que 3.5? (0.75 p)
Como se ha comprobado la normalidad del error (apartado a), entonces 𝐼2 | 𝐼1 = 5 ~ 𝑁(5.215; 1.169082 ) (0.25 p)
3 − 5.215
𝑆𝑖 𝐼1 = 5 ⇒ 𝑃(𝐼2 > 3.5) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > −1.89)(0.25 p. Si es incorrecto, no se corrige lo demás)
1.16908
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
Con calculadora, tablas y formulario oficial de la asignatura. Todas las evaluaciones se escanean para prevenir fraude.
Contesta cada pregunta sólo en la hoja de su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega.
Cuando se solicite reclamo, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
NOTA
1. A continuación, se muestra un conjunto de tablas. En cada tabla hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar. (5p)
1.1 Es preferible un estimador con sesgo positivo a otro con sesgo negativo.
1.3 El error cuadrático medio es igual al sesgo más la varianza del estimador
1.5 Si la muestra procede de una normal, la distribución muestral de la media es una t de Student
1.6 Si tenemos una muestra de tamaño 𝑛 > 30 de una variable 𝑋, entonces 𝑋 se puede aproximar a una normal.
1.8 𝑡150;0.5 = 1
2 2
1.9 𝜒20;0.05 = −𝜒20;0.95
1
Página en blanco
2
Apellidos:__________________________________________________________Nombre:________________________
Sección:______________
2. El tiempo entre las llegadas de clientes (min) a una tienda por departamentos es una variable exponencial NOTA
cuya media se desconoce. Se ha planteado el siguiente contraste con las hipótesis 𝐻0 : 𝜇 = 0.5 y 𝐻1 : 𝜇 ≠ HOJA 1
0.5. Se ha tomado una muestra de 51 datos y se ha calculado que el estadístico de contraste es 𝑡0 = 2.678.
Cualquier otro valor: 0 p. No es correcto si se ha calculado con la distribución t de Student, ya que la población no es normal.
b. ¿Cuál es el mínimo nivel de significación necesario para aceptar la hipótesis alternativa? (0.5 p)
Para aceptar la hipótesis alternativa (rechazar la hipótesis nula), se debe cumplir que 𝑝 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼.
Entonces, el nivel de significación debe ser: 𝜶 > 𝟎. 𝟎𝟎𝟕𝟒.
3. Con el fin de estimar el valor de la media poblacional de una variable 𝑌 a partir de una muestra aleatoria simple de 4
datos (𝑌1 ; 𝑌2 ; 𝑌3 ; 𝑌4 ), se ha construido el estimador 𝜇̂ = 0.1𝑌1 + 0.2𝑌2 + 0.3𝑌3 + 0.4𝑌4 . Si se sabe que 𝑌 es una variable
normal de media 5 y varianza 9. ¿Cuál es la distribución muestral del estimador? Indique el modelo de probabilidad y sus
parámetros. Muestre su procedimiento. (1 p)
𝑉𝑎𝑟(𝜇̂ ) = 𝑉𝑎𝑟(0.1𝑌1 + 0.2𝑌2 + 0.3𝑌3 + 0.4𝑌4 ) = 0.12 𝑉𝑎𝑟(𝑌1 ) + 0.22 𝑉𝑎𝑟(𝑌2 ) + 0.32 𝑉𝑎𝑟(𝑌3 ) + 0.42 𝑉𝑎𝑟(𝑌4 )
Entonces, como 𝑌 se distribuye normalmente, entonces 𝜇̂ también se distribuye normalmente, por ser la combinación
lineal de 4 variables normales (𝑌1 ; 𝑌2 ; 𝑌3 ; 𝑌4 ). (0.25 p)
𝜇̂ ~ 𝑁(5; 2.7)
4. Sea la variable aleatoria 𝑋, definida por la función densidad 𝑓(𝑥). Utilizando el método de
los momentos, construya el estimador de 𝜃. Muestre su procedimiento. (1 p)
𝜃
2(𝜃 − 𝑥)
𝜇 = ∫𝑥 ∙ 𝑑𝑥
𝜃2
0
Si se ha planteado el cálculo de la media de manera incorrecta, toda la pregunta tiene puntaje cero.
𝜃
2(𝜃 − 𝑥) 2𝑥 2𝑥 2 𝜃 𝜃
𝜇 = ∫𝑥 ∙ 2
𝑑𝑥 = ( − 2 ) | = → 𝜽 = 𝟑𝝁 = 𝟑𝑴𝟏 (0.5 p)
𝜃 𝜃 𝜃 0 3
0
Entonces: 𝜃̂ = 3𝑀 ̂ = 𝟑𝒙
̂1 = 3𝑚1 → 𝜽 ̅ (0.5 p)
3
Apellidos:__________________________________________________Nombre__________________
Por lo tanto, con los conocimientos del curso, no se puede construir un I.C. para la varianza. (0.25 p)
b. Con esta misma muestra de artículos, unos analistas han construido el siguiente intervalo de confianza para la
proporción de artículos defectuosos: [0.0273; 0.0641] . Responda a las siguientes cuestiones, mostrando su
procedimiento:
0.0273 + 0.0641
𝑝̂ = = 0.0457 (0.25 p)
2
Si 𝑝̂ es incorrecto, no se corrige el resto de la solución.
Entonces: 𝛼⁄2 = 𝑃(𝑍 > 2.33) = 0.0099 → 𝛼 = 0.0198 (0.25 p) → 𝑁. 𝐶. = (1 − 𝛼) × 100% = 𝟗𝟖. 𝟎𝟐% (0.25 p)
b.2. ¿Es posible afirmar que el porcentaje de artículos defectuosos es mayor que 1.5%? Justifique su respuesta
utilizando el p-valor. Utilice 𝛼 = 0.05 (1.5 p)
Si las hipótesis, el estadístico y su distribución son correctos, se continúa con la corrección. De lo contrario, no se corrige lo siguiente.
Como el p-valor es mayor que el nivel de significación, se rechaza la hipótesis nula y se acepta la alternativa. Hay
suficiente evidencia para aceptar que más del 1.5% de los artículos son defectuosos. (0.25 p)
4
Apellidos:______________________________________________________Nombre__________________ NOTA
Sección:__________________ HOJA 2
6. Una empresa agrícola exporta uvas del tipo Crimson en empaques de 500 gramos. La empresa quiere valorar
si las uvas empacadas pierden peso con el paso del tiempo, por deshidratación. Esta información es muy importante,
pues si las uvas van perdiendo peso durante su traslado a los mercados de destino, se deberán llenar los empaques con
una cantidad superior. Con ese fin, se han almacenado 8 empaques en una cámara frigorífica similar a la utilizada en el
traslado real. Cada empaque se ha pesado en el momento de ser introducido en la
cámara (Peso_0) y se ha vuelto a pesar transcurrida una semana en la cámara
(Peso_1). Los datos se muestran en la siguiente tabla. También se muestra un
pequeño resumen estadístico con Minitab.
Empaque 1 2 3 4 5 6 7 8
Peso_0 518 528 519 524 518 527 528 528
Peso_1 515 523 517 522 515 524 524 524
¿Disminuye el peso de las uvas durante una semana en cámara frigorífica? Responda
mediante un contraste con un nivel de significación del 5%. Responda en la tabla
siguiente. (5p)
5
Apellidos:______________________________________________________Nombre__________________
𝛽̂1 : Cuando el peso del empaque en la semana 0 aumenta en un gramo, 40 semanas después, se prevé que
aumente en 0.95 gramos, y no el gramo que se añadió al inicio. Por tanto, en esas 40 semanas el peso disminuye,
por término medio, un 5% aproximadamente. (0.5p)
Si no dice que el cambio en Peso_40 es ‘en promedio’, ‘previsto’, o ‘por término’, sólo 0.25p
6
NOTA REVISADA FIRMA Estadística Básica
Parcial
7/10/2019
Facultad de Ingeniería Duración: 3:00
Semestre 2019-II
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
Con calculadora y formulario oficial de la asignatura. Todas las evaluaciones se escanean para prevenir fraude.
Contesta cada pregunta sólo en la hoja de su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega.
Cuando se solicite reclamo, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
NOTA
1. A continuación, se muestra un conjunto de tablas. En cada una hay tres frases, donde sólo una es correcta. En cada
tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar.
FIRMA
Si el número de cliente que accede a un puesto de servicio sigue una Poisson, el tiempo entre clientes
1.1
consecutivos será una exponencial X
Si el número de cliente que accede a un puesto de servicio sigue una Poisson, el tiempo entre clientes
1.2
consecutivos es también una Poisson.
1.3 El número de clientes que acceden en una hora puede modelizarse como una binomial
1.7
Si al lanzar un dado obtengo el valor i, i veces (una vez el 1, 2 veces el 2, etc), la mediana de la distribución que
se obtiene es 5
X
Si al lanzar un dado obtengo el valor i, i veces (una vez el 1, 2 veces el 2, etc), la distribución que se obtiene
1.8
será asimétrica positiva
Si al lanzar un dado obtengo el valor i, i veces (una vez el 1, 2 veces el 2, etc), el tercer cuartil de la distribución
1.9
que se obtiene será 4.5
1.12 Sean 𝐴1 , 𝐴2 los dos sucesos elementales de un experimento. Entonces 𝑃(𝐴1 ) = 𝑃(𝐴1 |𝐴2 )𝑃(𝐴2 )
Sea 𝑋 =nº de artículos defectuosos en un lote de 10, donde cada uno tiene una probabilidad de 0.01 de ser defectuoso,
1.13
independiente de que lo sean los demás, entonces 𝑋 ∼ 𝐵(10; 0.01) X
Sea 𝑋 =nº de artículos defectuosos en un lote de 10, donde cada uno tiene una probabilidad de 0.01 de ser defectuoso,
1.14
independiente de que lo sean los demás, entonces 𝑋 ∼ 𝑃𝑜𝑖(0.1)
Sea 𝑋 =nº de artículos defectuosos en un lote de 10, donde cada uno tiene una probabilidad de 0.01 de ser defectuoso,
1.15
independiente de que lo sean los demás, entonces 𝑋 ∼ 𝐸𝑥𝑝(0.1)
1
Apellidos:_________________________________________________________Nombre_______________________
NOTA
Sección:___________________
FIRMA
2. A la calle C vienen los autos que proceden de la calle A y la calle B (ver figura). De la calle A vienen los
autos según un proceso de Poisson, a un ritmo medio de 5 autos por minuto. De la calle B vienen los
autos según otro proceso de Poisson, independiente, a un ritmo medio de 10 autos por minuto.
Como 𝑃(𝑋𝐴 ≤ 1) = 0.04 y 𝑃(𝑋𝐴 ≤ 2) = 0.124 , el percentil 10 es 𝑃10 = 2 pues es el menor valor de 𝑋𝐴 que
acumula una probabilidad mayor o igual a 10.
c) ¿Cuál es la probabilidad de que lleguen a C más de tres autos en un minuto (da igual por donde vengan)? (1p)
𝑋𝐶 = 𝑋𝐴 + 𝑋𝐵 ∼ 𝑃𝑜𝑖(15).
d) ¿Cuál es la probabilidad de que entre dos autos consecutivos que entran a la calle C (da igual por donde vengan)
transcurra menos de un cuarto de minuto? (2p)
e) ¿Cuál es la probabilidad de que pasen por C más de 230 autos en 15 minutos? (1p)
En un minuto: 𝑋𝐶 = 𝑋𝐴 + 𝑋𝐵 ∼ 𝑃𝑜𝑖(15). En 15 minutos 𝑋𝐶∗ ∼ 𝑃𝑜𝑖(225) ≈ 𝑁(225,225)
230 − 225
𝑃(𝑋𝐶∗ > 230) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 0.33) = 1 − 𝑃(𝑍 < 0.33) = 1 − 0.629 = 0.371
√225
f) Se observa que por la calle A no ha circulado ningún auto durante 15 segundos. ¿Calcula la probabilidad de que
estemos otros 15 segundos adicionales sin que vengan autos por esa calle? (1p)
𝑇𝐴 =tiempo entre dos autos consecutivos en A∼ 𝐸𝑥𝑝(5)
𝑃(𝑇𝐴 > 0.5 ∩ 𝑇𝐴 > 0.25) 𝑃(𝑇𝐴 > 0.5)
𝑃(𝑇𝐴 > 0.5|𝑇𝐴 > 0.25) = = =
𝑃(𝑇𝐴 > 0.25) 𝑃(𝑇𝐴 > 0.25)
𝑒 −0.5×5
= −0.25×5 = 𝑒 −0.25×5 = 0.2865 ≡ 𝑃(𝑇𝐴 > 0.25)
𝑒
Puede verse que es igual a no haber estado ya esperando, pues en una exponencial, no hay memoria.
2
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
. NOTA
1. En una fábrica se producen piezas de metal circulares cuyo diámetro (𝑋, en mm) es de especial interés.
Se sabe que los diámetros de las piezas producidas son independientes entre sí y siguen una distribución
normal de media 170 mm y desviación estándar 1.5 mm. Las piezas se envían a los clientes en lotes de FIRMA
12 y se considera que una pieza es aceptable (no defectuosa) si su diámetro se encuentra entre 167 y
173 mm.
b. Un inspector de calidad selecciona dos piezas al azar: A y B. Indique el valor de la probabilidad de que la pieza A
sea aceptable o que la pieza B sea defectuosa. Hay una única respuesta. (0.75 p)
Sucesos:
A: Pieza A es aceptable. 𝑷(𝑨 ∪ 𝑩 ̅ ) (0.25 p) = 𝑷(𝑨) + 𝑷(𝑩
̅ ) − 𝑷(𝑨 ∩ 𝑩
̅)
B: Pieza B es aceptable. 𝑃(𝐴 ∪ 𝐵̅ ) = 0.9544 + 0.0456 − 0.9544 × 0.0456 = 𝟎. 𝟗𝟓𝟔𝟓
𝑃(𝐴) = 𝑃(167 ≤ 𝑋 ≤ 173) = 0.9544
̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ Respuesta final: 0.5 p. Si han asumido que 𝑃(𝐴 ∩ 𝐵̅) = 0: 0p.
𝑃(𝐵̅ ) = 𝑃(167 ≤ 𝑋 ≤ 173) = 0.0456
No hay puntaje por definirlas.
d. Se selecciona una pieza y su RADIO se encuentra entre 84.82 y 85.21. ¿Cuál es la probabilidad de que dicho radio
sea, al menos, 85.1 mm? (1 p)
𝑅𝑎𝑑𝑖𝑜: 𝑌 = 0.5𝑋; 𝒀 ~ 𝑵(𝟖𝟓; 𝟎. 𝟕𝟓𝟐 )
85.1 − 85 85.21 − 85
𝑃( <𝑍≤ ) 𝑃(0.13 < 𝑍 ≤ 0.28) 𝑃(𝑍 ≤ 0.28) − 𝑃(𝑍 < 0.13)
= 0.75 0.75 = = (0.25 p)
84.82 − 85 85.21 − 85 𝑃(−0.24 < 𝑍 ≤ 0.28) 𝑃(𝑍 ≤ 0.28) − 𝑃(𝑍 < −0.24)
𝑃( <𝑍≤ )
0.75 0.75
0.6103 − 0.5517 0.0586 (0.25 p)
= = = 𝟎. 𝟐𝟖𝟓𝟕
0.6103 − 0.4052 0.2051 (0.25 p)
* Si han tomado como variable el diámetro, deben haber escrito: 𝑃(𝑋 ≥ 170.2 | 169.64 ≤ 𝑋 ≤ 170.42).
Si han calculado otra probabilidad, el puntaje del apartado es cero.
e. Si se colocan 4 piezas en una misma línea (ver figura), ¿cuál es la probabilidad de que el largo total del ensamble
(𝐿) sea superior a los 685 mm? (0.75 p)
𝑳 ~ 𝑵(𝟔𝟖𝟎; 𝟗)(0.25 p)
Si han usado otra distribución, el puntaje del
apartado es cero.
𝐿 = 𝐷1 + 𝐷2 + 𝐷3 + 𝐷4 685 − 680
𝑃(𝐿 > 1710) = 𝑃 (𝑍 > )
√9
𝐸(𝐿) = 𝐸(𝐷1 ) + 𝐸(𝐷2 ) + 𝐸(𝐷3 ) + 𝐸(𝐷4 ) = 4 × 170 = 680 = 𝑃(𝑍 > 1.67) = 1 − 0.9525
= 𝟎. 𝟎𝟒𝟕𝟓 (0.5 p)
𝑉𝑎𝑟(𝐿) = 𝑉𝑎𝑟(𝐷1 ) + 𝑉𝑎𝑟(𝐷2 ) + 𝑉𝑎𝑟(𝐷3 ) + 𝑉𝑎𝑟(𝐷4 ) = 4 × 1.52 = 9
3
Apellidos:_________________________________________________________Nombre_______________________
Sección:___________________
.
2. Una empresa de seguros clasifica a todos sus clientes en tres categorías: alto riesgo (A), medio riesgo (B) y bajo riesgo
(C). 25.6% de los clientes pertenecen a la primera categoría; 57.2%, a la segunda; mientras que, el resto, a la tercera.
El costo (en dólares) en el que incurre la empresa por un cliente por un cliente en un año es una variable aleatoria
(𝑋). Si un cliente pertenece a la categoría A, la función de densidad del costo es:
𝒙
𝒇(𝒙) = ; 𝑠𝑖 𝑥 ∈ [0; 2000]
𝟐 × 𝟏𝟎𝟔
Por otro lado, si un cliente pertenece a la categoría B, el costo es una variable uniforme continua entre 0 y 1000
dólares; mientras que, si pertenece a la categoría C, el costo es una exponencial de media 350 dólares.
a. Calcule el valor del cuartil 3 del costo si un cliente pertenece a la categoría C. (0.5 p)
1
𝐹(𝑄3 ) = 1 − 𝑒 − 350×𝑄3 = 0.75
b. ¿Cuál es la probabilidad de que un cliente de la categoría A genere un costo superior a los 800 dólares? (0.5 p)
2000
𝑥
(𝑋 > 800 | 𝐴) = ∫ 𝑑𝑥 = 𝟎. 𝟖𝟒 (0.5 p)
2 × 106
800
Cualquier otra respuesta: 0 p.
c. Un cliente pertenece a la categoría A. ¿Cuál es la varianza del costo en que incurre la empresa por él? ¿En qué
unidades está expresada? (1 p)
+∞ 2000
𝑥
𝜇 = 𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥 = ∫ 𝑥 ∙ 𝑑𝑥 = 1333.3 𝑈𝑆𝐷 (0.25 p)
2 × 106
−∞ 0
+∞ 2000
𝑥
𝑉𝑎𝑟(𝑋) = ∫ (𝑥 − 𝜇) 𝑓(𝑥)𝑑𝑥 = ∫ (𝑥 − 1333.3)2 ∙
2
𝑑𝑥 = 222 222 (0.5 p) 𝑈𝑆𝐷2 (0.25 p)
2 × 106
−∞ 0
d. Un cliente genera un costo superior a los 800 dólares. ¿Cuál es la probabilidad de que pertenezca a la categoría
A? (2 p)
• Si el cliente es de la categoría A:
𝑃(𝑋 > 800 | 𝐴) = 0.84 (apartado b)
• Si el cliente es de la categoría B:
1000
1
𝑃(𝑋 > 800 | 𝐵) = ∫ 𝑑𝑥 = 0.2 (0.5 p. Debe haber procedimiento.)
1000
800
• Si el cliente es de la categoría C:
1
𝑃(𝑋 > 800 | 𝐶) = 𝑒 − 350×800 = 0.1017 (0.5 p. Debe haber procedimiento.)
Entonces:
𝑃(𝑋 > 800) = 𝑃(𝑋 > 800 | 𝐴) × 𝑃(𝐴) + 𝑃(𝑋 > 800 | 𝐵) × 𝑃(𝐵) + 𝑃(𝑋 > 800 | 𝐶) × 𝑃(𝐶)
𝑃(𝑋 > 800) = 0.84 × 0.256 + 0.2 × 0.572 + 0.1017 × 0.172 = 𝟎. 𝟑𝟒𝟔𝟗 (0.5 p)
4
PRÁCTICA PARTICIPACIÓN ACTA ACTA REVISADA FIRMA Estadística Básica
Práctica 4
Semestre 2019-II 08/11/2019
Duración: 1:30
Apellidos:__________________________________________________________Nombre:________________________
Sección:___________________
Con calculadora, tablas y formulario oficial de la asignatura. Todas las evaluaciones se escanean para prevenir fraude.
Contesta cada pregunta sólo en la hoja de su enunciado. Usa el cuadernillo sólo como borrador. El cuadernillo NO se entrega.
Cuando se solicite reclamo, deberá adjuntarse copia de la solución publicada (sólo del ejercicio sobre el que se reclame). El reclamo deberá
basarse en errores de corrección en base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
NOTA
1. A continuación, se muestra un conjunto de tablas. En cada una hay tres frases, donde sólo una es correcta.
En cada tabla, marque con X en la casilla de la derecha de la frase correcta. No hay que justificar.
1.1 Sólo aceptamos 𝐻0 si los datos muestran mucha evidencia en contra de ella
1.2 Siempre podremos aceptar 𝐻0 utilizando un nivel de significación suficientemente grande
Si los datos están muy alejados de 𝐻0 , más de lo que cabría esperar solo por el azar del muestreo,
1.3 X
rechazaré 𝐻0
2. El partido político JV ha elegido a su candidato a la presidencia. Por ello, se desea estimar, con un margen de error máximo
del 3%, cuál es el porcentaje de aceptación que tiene dicho candidato. El nivel de confianza que se pretende es del 90%.
¿Cuántas encuestas se deben realizar? (3.5 p)
𝐿 = 0.03; 𝑁. 𝐶. = 90%
2
√𝑝̂ (1 − 𝑝̂ )
𝑛 = (𝑧0.05 × ) (𝟏 𝒑)
𝐿
Como no se tiene información de alguna muestra, se asume el peor de los casos: 𝑝̂ = 0.5.
2
√0.5(1 − 0.5)
𝑛 = (1.645 × ) = 751.67 (𝟐 𝒑) ≈ 𝟕𝟓𝟐(𝟎. 𝟓 𝒑)
0.03
̂, el puntaje total es cero. Si han usado otra fórmula, el puntaje total es cero.
Si han usado otro valor de 𝒑
1
Apellidos:__________________________________________________Nombre__________________ NOTA
a. ¿Es posible afirmar que el número medio de horas diarias que duermen los estudiantes universitarios es superior a las 5.5
horas? (6p)
Hipótesis (1p)
Debe estar el símbolo 𝜇 y el valor 5.5. Si han planteado 𝑯𝟎 : 𝝁 ≤ 𝟓. 𝟓 𝑯𝟏 : 𝝁 > 𝟓. 𝟓
otras hipótesis: 0 p.
Estadístico de contraste (1p) 𝑥̅ − 𝜇0 5.71 − 5.5
𝑡0 = (𝟎. 𝟓 𝒑) = = 1.52 (𝟎. 𝟓 𝒑)
Indique el símbolo del estadístico, su fórmula, los 𝑠̂ √1.48
valores que utiliza en la fórmula y el valor numérico √𝑛 √78
Distribución del estadístico de contraste (1p)
𝑇0 ~ 𝑁(0,1)
¿Por qué ha elegido dicha distribución? (1p) Porque hay 78 datos; es decir, la muestra es grande (n > 30).
Si los tres primeros pasos (hipótesis, estadístico y distribución) son correctos, se continúa con la corrección. Si al menos uno
es incorrecto, el resto de pasos no se corrige (puntaje 0). No considerar la explicación del porqué de la distribución.
b. ¿Es posible afirmar que el 10% de la población de estudiantes universitarios duerme 8 horas diarias? Responda a este
contraste utilizando el p-valor. (6 p)
Hipótesis (1p)
Debe estar el símbolo 𝑝 y el valor 0.1. Si han 𝑯𝟎 : 𝒑 = 𝟎. 𝟏 𝑯𝟏 : 𝒑 ≠ 𝟎. 𝟏
planteado otras hipótesis: 0 p.
8
Estadístico de contraste (1p) 𝑝̂ − 𝑝0 − 0.1
𝑧0 = (𝟎. 𝟓 𝒑) = 78 = 0.08 (𝟎. 𝟓 𝒑)
Indique el símbolo del estadístico, su fórmula, los
valores que utiliza en la fórmula y el valor numérico √ 𝑝0 (1 − 𝑝0 ) √ 0.1(1 − 0.1)
𝑛 78
Distribución del estadístico de contraste (1p) 𝑍0 ~ 𝑁(0,1)
2
p-valor del contraste ( 1p) Como el contraste es bilateral:
3
ESTADÍSTICA BÁSICA
SEMESTRE 2015-II
SUSTITUTORIO
MIÉRCOLES, 9 DE DICIEMBRE DE 2015
Nombre:___________________________________________________________________________
Sección:___________________
DEBES ENTREGAR ESTA HOJA, JUNTO CON EL CUADERNILLO, CON LAS RESPUESTAS DE LAS PREGUNTA 1
Sólo están permitidas las tablas que se entregan con el examen. Salvo que se indique lo contrario, utiliza 𝛼 = 0.05.
1. Sea (𝑥1 , 𝑦1 ), … , (𝑥100 , 𝑦100 ) una muestra aleatoria de 𝑛 = 100 pares de puntos de la población (𝑋, 𝑌). Sea
𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝑢 con 𝑢 ∼ 𝑁(0, 𝜎 2 ), y sean 𝜇𝑥 y 𝜎𝑥2 , la media y varianza de 𝑋, respectivamente. Decir si las
siguientes afirmaciones son verdaderas (V) o falsas (F). CONTESTA EN LA TABLA SIGUIENTE. No necesitas
justificar. Respuesta correcta +0.5, incorrecta -0.25.
c) Si el p-valor del contraste 𝐻0 : β1 = 0 es menor que 𝛼 , se rechazará que haya relación entre 𝑋 e 𝑌. F
e) Si 𝑋 = 0 , entonces 𝑌 ∼ 𝑁(𝛽0 , 𝜎 2 ). V
f) El margen de error del intervalo de confianza para 𝜇𝑥 disminuye con 𝑛 y aumenta con 𝜎𝑥2 . V
El contraste 𝐻0 : 𝜇𝑥 ≤ 𝜇0 , 𝐻1 : 𝜇𝑥 > 𝜇0 se puede resolver comprobando si 𝜇0 está dentro del
g) F
intervalo de confianza para 𝜇𝑥
h) El rango intercuartílico de 𝑋 tiene el mismo número de datos que el rango intercuartílico de 𝑌 V
SOLUCIÓN
a. FALSO. La distribución de una variable aleatoria no depende del tamaño de la muestra que se extraiga de
ella. Sería cierto para 𝑋�.
b. FALSO. La dependencia entre X e Y sólo afecta a 𝛽1 .
c. FALSO. Al contrario, se rechazará 𝐻0 que es la ausencia de relación. Por tanto, si el pvalor es bajo, se acepta
que hay relación.
d. VERDADERO.
e. VERDADERO, pues el modelo de regresión simple (que hemos estudiado) asume 𝑌 ∼ 𝑁(𝛽0 + 𝛽1 𝑋; 𝜎)
f. VERDADERO. SE deduce fácilmente de la fórmula
g. FALSO. Esa equivalencia es sólo para contrastes bilaterales.
h. VERDADERO. Entre el rango intercuartílico está el 50% de los datos, que en nuestro caso son 50.
1
2. Un proceso productivo produce, cuando funciona en condiciones óptimas, un 1% de artículos defectuosos.
Después de una avería en la que hubo que reparar algunas máquinas se produjeron 6 artículos defectuosos en
500 artículos producidos. ¿Ha empeorado el proceso tras la reparación de la avería?
SOLUCIÓN:
Tras la avería puede que haya empeorado el proceso (𝑝 > 0.01) o sigua igual (𝑝 = 0.01, ó 𝑝 ≤ 0.01). El
contraste a realizar es, por tanto, (1p)
𝐻0 : 𝑝 ≤ 0.01 (ó 𝑝 = 0.01)
𝐻1 : 𝑝 > 0.01
En la muestra se obtiene
6
𝑝̂ = = 0.012,
500
que discrepa de 𝐻0 , y está del lado de 𝐻1 . Tenemos que realizar un contraste de hipótesis para valorar si esa
diferencia con respecto a 𝐻0 es significativa o, por el contrario, se puede explicar por el azar del muestreo.
Con este fin, en primer lugar vemos que el tamaño muestral n=500 es elevado y, además,
por lo que, para realizar el contraste, podemos utilizar la aproximación a la normal para el estimador 𝑝̂ . (1p)
La distribución de referencia es la N(0,1), y la región de rechazo será la cola de la derecha, como se muestra en
esta figura.(1p)
Para 𝛼 = 0.05 el valor crítico es 1.65. Por tanto, se rechazaría la hipótesis nula si 𝑧₀ > 1.65. Como 𝑧0 =
0.45 < 1.65 no podemos rechazar la hipótesis nula. No hay evidencia suficiente para pensar que tras la
reparación el proceso haya empeorado.(1p)
2
3. La variable aleatoria 𝑋 sigue la siguiente función de densidad:
𝑓(𝑥) = 𝑎𝑎; 0<𝑥<𝑏
a) Calcula los valores de a y b sabiendo que la mediana de 𝑋 es 𝑥𝑚 = 1. (1p)
b) Calcula la esperanza de esta variable.(1p)
c) Calcula la función de distribución.(1p)
d) A partir de la función de distribución, calcula los cuartiles. (1p)
e) A partir de una muestra aleatoria de esta variable, de tamaño 𝑛 = 20, un analista propone usar la media
muestral 𝑋� como estimador de la mediana de esta distribución. ¿Qué sesgo cometemos al usar 𝑋� como
estimador de la mediana de la población? (2p)
SOLUCIÓN:
b) La esperanza matemática es
√2 √2
𝑥3
𝜇 = 𝐸(𝑋) = � 𝑥 2 𝑑𝑑 = � � = 0.9428
3 0
0
c) La función de distribución es
0 ;𝑥 ≤ 0
⎧ 𝑥
⎪𝑥2
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = � 𝑢𝑢𝑢 = ; 0 < 𝑥 < √2
⎨0 2
⎪
⎩ 1 ; 𝑥 ≥ √2
3
4. Un portal de internet dedicado a la venta on-line, está probando un servicio de entrega de paquetes
utilizando drones (vehículo volador no tripulado). Con ese fin, realiza un experimento que consiste en
llevar diferentes paquetes desde un punto A a otro punto B. La tabla y figura que se muestran a
continuación muestran el análisis con Minitab del tiempo de vuelo de 40 pruebas. En este análisis se
evalúa el ajuste de los datos a una distribución normal y a una exponencial. A la vista de estos
resultados, contesta, de forma justificada, a las siguientes preguntas. (5p)
a) ¿Cuál es la probabilidad de se que cubra el trayecto desde A hasta B en menos de 15 minutos?
b) Si se observa que tras 14 minutos de vuelo, el dron aún no ha llegado al punto B ¿cuál es ahora la
probabilidad de que se cubra el trayecto desde A hasta B en menos de 15 minutos?
Porcentaje
Mediana 13.1 20
50
3er cuartil 13.8
Máximo 15.3
20
5
5
2
1 1
10 12 14 16 0,1 1 10 100
Vuelo Vuelo
SOLUCIÓN:
a) La evaluación del ajuste a la normal muestra que los puntos del gráfico de probabilidad se alinean bastante
bien alrededor de la recta de referencia. Los datos muestran así un buen ajuste a la normal (mejor sería ver el
histograma, que aquí no se muestra de forma intencionada). Además, el pvalor del test de bondad de ajuste
que realiza el Minitab (test de Anderson-Darling) es muy alto, mayor que 𝛼, por lo que podemos acepar la
hipótesis de normalidad para la población de la que proceden estos datos. Esto no ocurre con el ajuste a la
exponencial. El gráfico de probabilidad muestra un alejamiento muy importante de la recta de referencia, y el
p-valor es mucho menor que 𝛼. Además, el resumen estadístico revela que los datos parecen bastante
simétricos, lo que no se cumple en una distribución exponencial. Asumiremos entonces que el tiempo de
vuelo del dron sigue el modelo, usando la notación 𝑁(𝜇; 𝜎), X∼ 𝑁(13.1; 1.1). (2p)
Por tanto
15−13.1
𝑃(𝑋 < 15) = 𝑃 �𝑧 < � = 𝑃(𝑧 < 1.73) = 0.9582. (1p)
1.1
b) Nos interesa ahora la probabilidad condicionada
𝑃((𝑋 < 15) ∩ (𝑋 > 14)) 𝑃(14 < 𝑋 < 15) 𝑃(𝑋 < 15) − 𝑃(𝑋 < 14)
𝑃(𝑋 < 15|𝑋 > 14) = = =
𝑃(𝑋 > 14) 𝑃(𝑋 > 14) 𝑃(𝑋 > 14)
0.9456 − 0.7939
= = 0.7361 (2p)
(1 − 0.7939)
donde se ha usado que
14 − 13.1
𝑃(𝑋 < 14) = 𝑃 �𝑧 < � = 𝑃(𝑧 < 0.82) = 0.7939
1.1
4
ESTADÍSTICA BÁSICA
SEMESTRE 2015-II
EXAMEN FINAL
MIÉRCOLES, 25 DE NOVIEMBRE DE 2015
Nombre:___________________________________________________________________________
Sección:___________________
Sólo están permitidas las tablas que se entregan con el examen. Salvo que se indique lo contrario, utiliza
𝛼 = 0.05
1. En cierto proceso químico interesa mantener la temperatura en valores estables. Con ese fin, se instala
en el horno un controlador automático cuyo objetivo es mantener la temperatura del proceso en 80ºC.
Lo que hace este controlador es regular la entrada de calor en función de las oscilaciones de
temperatura que detecte, con el fin de contrarrestarlas. El resultado no es un proceso con
temperatura perfectamente constante, pero sí con variaciones muy pequeñas. Una muestra de 26
temperaturas ha proporcionado una temperatura media de 79.1ºC con una cuasivarianza de 0.09.
Asumiendo que la variación de temperatura sigue una distribución normal, se pide:
a) Construye un intervalo de confianza para la varianza de la temperatura del horno. (2p)
b) Tras analizar la tecnología de este controlador, se ve que es una versión mejorada del que se
ha estado utilizando con anterioridad, por lo que, presuntamente, se debe conseguir mantener
la temperatura en unos márgenes más estrechos. De acuerdo a los datos históricos, el anterior
controlador proporcionaba valores de temperatura con una varianza de 0.16. ¿Hay evidencia
de que el nuevo controlador ha conseguido disminuir la varianza de la temperatura? (2p)
SOLUCIÓN:
1
2. Se tiene una muestra de 191 estudiantes de ingeniería. Entre otras, se tienen las variables:
• ‘Altura’: altura en cm
• ‘Dinero fin de semana’: dinero gastado en ocio en el fin de semana (soles)
• ‘Tiempo de construcción’: tiempo, en segundos, que se demora en la construcción de un
avión de papel
• ‘Sexo’: 1=chicos, 0=chicas.
Se pide:
Variable Resultados
𝐻0 : 𝛽1 = 0 ( no hay diferencias) 𝐻1 : 𝛽1 ≠ 0
p-valor: 0,172
Interpretación resultado:
‘Tiempo de
construcción’ Como p-valor>𝛼, no hay diferencias significativas entre chicos y
(1.5p) chicas en el tiempo medio que se demoran en construir el avión de
papel.
𝐻0 : 𝛽1 = 0 ( no hay diferencias) 𝐻1 : 𝛽1 ≠ 0
p-valor: 0,014
Interpretación resultado:
‘Dinero fin de
semana’ Como pvalor< 𝛼 sí hay diferencias significativas entre chicos y chicas.
(1.5p) En media, los chicos se gastan casi 18 soles más que las chicas.
2
Análisis de regresión: ALTURA vs. SEXO
90 10
Porcentaje
Residuo
50 0
10
-10
1
0,1 -20
-20 -10 0 10 20 160,0 162,5 165,0 167,5 170,0
Residuo Valor ajustado
30
Residuo
0
20
-10
10
0 -20
-18 -12 -6 0 6 12 18 1 20 40 60 80 100 120 140 160 180
Residuo Orden de observación
3
SOLUCIÓN:
a) A partir de la regresión simple, el coeficiente estimado 𝛽̂1 nos sirve para contrastar la igualdad de
los valores medios de cada variable en cada uno de los grupos que se forman con las variables
binarias. Contrastar si la media es igual en chicos o en chicas, es equivalente a contrastar si la
variable sexo es relevante
𝐻0 : 𝜇0 = 𝜇1 𝐻0 : 𝛽1 = 0
⇒
𝐻1 : 𝜇0 ≠ 𝜇1 𝐻1 : 𝛽1 ≠ 0
Para el caso de la variable ’Tiempo de construcción’, el pvalor es mayor de 0.05, por lo que no
podemos rechazar la hipótesis nula de que el tiempo medio de construcción no depende del sexo
(𝛽1 = 0). Por tanto, clasificar las observaciones según el sexo es irrelevante para entenderé las
diferencias en el tiempo que se demoran en construir un avión de papel.
En el caso del dinero que se gastan en el fin de semana en ocio, el pvalor es menor que 0.05, por
lo que sí hay diferencias significativas entre chicos y chicas. Los chicos gastan, en media, 18 soles
más que las chicas.
b) Según los resultados que se muestran, el sexo es una variable significativa para explicar la altura
media de los estudiantes. El pvalor es muy pequeño, mucho menor que 𝛼 (hasta el tercer decimal
es cero). En media, los chicos miden 11 cm más que las chicas. Por tanto, para los chicos puede
estimarse que la estatura media es 𝜇̂ = 159.23 + 11.10 = 170.3
Los residuos son, además, normales, según se aprecia por el histograma y el gráfico de
probabilidad, por lo que la distribución de las estaturas en cada grupo es una normal.
4
3. Un practicante del departamento de operaciones de un call center piensa que el número de
llamadas que reciben sigue una distribución de Poisson.
Para comprobar esto, observa el número de llamadas que recibe por minuto, durante un intervalo
de 200 minutos, calcula la media de esa muestra y resulta ser de 3.5 llamadas por minuto. La
gráfica que aparece a continuación resume la distribución que encontró durante su período de
observación.
Frecuencia observada
50 45
39
40 35
29
30 25
21
20
10 6
0
0 1 2 3 4 5 6 ó mas
SOLUCIÓN:
Ho: El número de llamadas que recibe el call center sigue una distribución de Poisson con
parámetro 3.5 llamadas por minuto.
H1: El número de llamadas que recibe el call center no sigue una distribución de Poisson con
parámetro 3.5 llamadas por minuto.
Nivel de significancia 5%
Chi cuadrado de la prueba: 0.9014282. Chi cuadrado crítico para 5 grados de libertad y nivel de
significancia del 5%: 11.07. Por lo tanto aceptamos Ho. Los datos muestran suficiente evidencia a
favor de la distribución de Poisson, como sospecha el practicante.
5
4. Una máquina que llena cajas de leche siguiendo una distribución normal ha sido ajustada para
que descargue en promedio 260 ml de leche. El encargado de producción piensa que después de
un tiempo la máquina se ha descalibrado y que está llenando las cajas con más leche de lo
debido. Para verificar esto, toma una muestra de 10 cajas de leche. A continuación se muestran
los resultados obtenidos:
Muestra Caja1 Caja2 Caja 3 Caja 4 Caja 5 Caja 6 Caja 7 Caja 8 Caja 9 Caja 10
(ML) 256 263 259 270 255 253 259 262 261
264
SOLUCIÓN:
𝐻0 : µ = 260 𝑚𝑚
𝐻1 : µ > 260 𝑚𝑚
Prueba de 1 cola, RR a la derecha
Nivel de significancia del 5%
De la información de la mustra se tiene 𝑥̅ = 260.2, 𝑠̂ = 4.96. El estadístico t para el contraste es
260.2 − 260
𝑡 = = 0.1275
4.96
√10
El valor que deja un área de 𝛼 = 0.05 en la cola de la derecha de la 𝑡9 –valor crítico- es 𝑡9;0.05 =
1.833. La región de rechazo serán los valores 𝑡 > 1.833. Como nuestro valor es 0.1275 estamos
en la región de aceptación, por lo tanto no hay evidencia suficiente para afirmar que la máquina
se ha descalibrado.
6
ESTADÍSTICA BÁSICA
SEMESTRE 2015-II
PARCIAL
JUEVES, 8 DE OCTUBRE DE 2015
Apellidos:___________________________________________________________________________
Nombre:___________________________________________________________________________
Sección:___________________
En este examen se proporciona una serie de recuadros en los que se ha de escribir el resultado final de cada
cuestión que se plantea. El desarrollo ha de realizarse en el cuadernillo. Estas hojas SE ENTREGARÁN JUNTO
CON EL CUADERNILLO, y se escanearán para prevenir fraudes posteriores. Por esta razón NO SE
CONSIDERARÁ NINGUNA RESPUESTA QUE NO SE HAYA ESCRITO EN LOS RECUADROS HABILITADOS Y QUE
NO SE HAYA RAZONADO EN EL CUADERNILLO.
1. Un artículo manufacturado está compuesto por dos piezas, P1 y P2, como muestra la figura.
P1 P2
𝐿1 𝐿2
𝐿
Debido a la variabilidad del sistema productivo, las longitudes respectivas, 𝐿1 y 𝐿2 , son variables
aleatorias, que verifican 𝐿1 ∼ 𝑁(10, 𝜎 2 = 1) y 𝐿2 ∼ 𝑁(12, 𝜎 2 = 4), siendo ambas longitudes variables
aleatorias independientes.
a) ¿Cómo será la variable aleatoria 𝐿 (distribución y parámetros)? (3 p.)
𝐿 ∼ 𝑁(22, 𝜎 2 = 5)
b) Este artículo es aceptable si su longitud total verifica que 𝐿 ∈ [21,24] ¿Qué proporción de artículos
defectuosos se está produciendo? (2 p.)
Proporción=51%
SOLUCIÓN:
2. Un examen consta de 5 preguntas del tipo Verdadero/Falso. Contesta de forma razonada a las
siguientes cuestiones.
a) Si la puntuación es de 4 puntos por respuesta correcta y 0 por respuesta incorrecta, ¿qué
puntuación espera obtener (en media) un estudiante que conteste al azar? (2 p.)
Puntuación esperada=10
b) ¿Cuál es la probabilidad de que un estudiante apruebe (11 puntos o más) contestando al azar?
(1 p.)
Probabilidad=0.5
c) El profesor decide ahora que si la respuesta a una pregunta es correcta el valor es de 4 puntos,
pero si es incorrecta, se obtiene una puntuación negativa de -3. ¿Qué nota esperará ahora
obtener el estudiante que conteste al azar? (2 p.)
Puntuación esperada=2.5
SOLUCIÓN:
a) Contestar de forma correcta una pregunta al responder al azar entre Verdadero o Falso tiene
probabilidad 0.5. Si llamamos 𝑋 =número de respuestas correctas en un grupo de 5 preguntas,
donde la probabilidad de acertar en cada una es 0.5, tenemos que
𝑋 ∼ 𝐵(5,0.5)
Por tanto, 𝐸(𝑋) = 𝑛𝑛 = 2.5 preguntas. Si cada pregunta vale 4 puntos, la puntuación esperada
será de 10.
b) Para aprobar se necesita un mínimo de 11 puntos. Como cada pregunta vale 4 puntos, es
necesario acertar un mínimo de 3 preguntas, lo que proporcionaría un mínimo de 12 puntos.
𝑃(𝑋 ≥ 3) = 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4) + 𝑃(𝑋 = 5)
5 5 5 5 5 5
= � � 0.53 0.52 + � � 0.54 0.51 � � 0.55 = 0.55 �� � + � � + � ��
3 4 5 3 4 5
= 0.313(10 + 5 + 1) = 0.5
c) Sea 𝑋𝑖 =puntuación de la pregunta i-ésima contestada al azar. Esta variable aleatoria se define
como
4, 𝑝(4) = 𝑃(𝑋𝑖 = 4) = 0.5
𝑋𝑖 = �
−3, 𝑝(−3) = 𝑃(𝑋 = −3) = 0.5
𝑘 =3/4
SOLUCIÓN:
b) La distribución es simétrica alrededor del 0, por lo que media, mediana y moda son iguales a 0
c) La probabilidad se obtiene integrando 𝑓(𝑥):
1
3 1
𝑃(𝑋 > 0.4) = � 𝑓(𝑥)𝑑𝑑 = � (1 − 𝑥 2 )𝑑𝑑 = 0.216
0.4 4 0.4
3
4. Microluz es un importante fabricante del sector de la electrónica especializado en iluminación LED. El
tiempo de vida de sus bombillas LED sigue una distribución exponencial de media 10 años. No
obstante, algunas de ellas son defectuosas y siguen una exponencial cuya vida media es de sólo 1 año.
Se sabe que el 10 % de las bombillas fabricadas por la empresa son defectuosas.
a) Calcula la probabilidad, para cada tipo de bombilla, de que duren más de 1 año. (0.5 p.)
Bombillas aceptables=0.905
Bombillas defectuosas=0.368
b) Calcula la probabilidad de que una bombilla elegida al azar dure más de 1 año. (1 p.)
Probabilidad=0.852
c) Se selecciona al azar una bombilla LED de esta empresa y después de un año sigue
funcionando. ¿Cuál es la probabilidad de que sea de las defectuosas? (1.5 p.)
Probabilidad=0.043
d) ¿Cuál es la probabilidad de que esta bombilla que lleva ya un año funcionando funcione al
menos otro año más? Razonar la respuesta. (2 p.)
Probabilidad=0.880
SOLUCIÓN:
a) Sea A =bombilla aceptable, con vida media de 10 años, con 𝑃(𝐴) = 0.9. Sea D = bombilla
defectuosa, con vida media de 1 año, con 𝑃(𝐷) = 0.1. Las duraciones de cada tipo de bombilla se
pueden denotar por las siguientes variables aleatorias:
𝑇 = tiempo de vida de una bombilla seleccionada al azar,
𝑇𝐴 = tiempo de vida de una bombilla con media 10 años. 𝑇𝐴 ∼ 𝐸𝐸𝐸(𝜆𝐴 = 1/10),
𝑇𝐷 = tiempo de vida de una bombilla con media 1 año. 𝑇𝐷 ∼ 𝐸𝐸𝐸(𝜆𝐷 = 1).
4
d) Nos preguntan por la probabilidad siguiente
𝑃(𝑇 > 2 ∩ 𝑇 > 1) 𝑃(𝑇 > 2)
𝑃(𝑇 > 2|𝑇 > 1) = = .
𝑃(𝑇 > 1) 𝑃(𝑇 > 1)
Procediendo como en el apartado anterior tenemos que
donde
5
ESTADÍSTICA BÁSICA
SEMESTRE 2015-II
PRÁCTICA 5
JUEVES, 5 DE NOVIEMBRE DE 2015
Nombre:___________________________________________________________________________
Sección:___________________
DEBES ENTREGAR ESTA HOJA, JUNTO CON EL CUADERNILLO, CON LAS RESPUESTAS DE LAS PREGUNTAS 1 y 2
Salvo que se indique lo contrario, utiliza 𝛼 = 0.05
1. Analizando las calificaciones de una asignatura de años anteriores, se observa que los alumnos han
obtenido una nota media de 12 con varianza 2. A partir de una muestra aleatoria de 30 estudiantes del
presente año se obtiene una media de 13 con cuasi-varianza muestral de 2.1. A continuación se
enuncian un conjunto de hipótesis sobre los valores poblacionales de las calificaciones de esta
asignatura. Reescríbelas EN LA TABLA SIGUIENTE como hipótesis nula y alternativa. No necesitas
justificar. (Respuesta correcta +0.5).
2. Sea 𝑋 una variable aleatoria de media 𝜇 y varianza 𝜎², y sea 𝑋1 , … , 𝑋𝑛 una muestra aleatoria de dicha
variable. Sea 𝑋� la media muestral y 𝑆̂ la cuasi-desviación típica, basadas en dicha muestra. Decir si las
siguientes afirmaciones son verdaderas (V) o falsas (F). CONTESTA EN LA TABLA SIGUIENTE. No
necesitas justificar. Respuesta correcta +0.8, incorrecta -0.5.
Si la hipótesis nula 𝐻0 : 𝜇 = 100 se acepta con un nivel de significación del 10%, también se aceptará
5 V
con cualquier nivel de significación menor.
1
3. Un servidor web de una red informática recibe por término medio 5 intentos de ataque por virus por
cada 1000 peticiones de conexión. La organización que posee dicho servidor hace una campaña de
publicidad para difundir la dirección de su sitio web. Al día siguiente de dicha campaña, el servidor
recibe 830 peticiones de conexión, de las que 10 son ataques por virus. ¿Hay evidencia suficiente para
afirmar que la campaña publicitaria ha atraído a los virus? Razona la respuesta.
SOLUCIÓN:
Sea 𝑝=proporción de conexiones con virus. Sea 𝑝̂ =proporción muestral de conexiones por virus.
Como n=830 es muy grande, y
10 829
𝑛𝑝̂ (1 − 𝑝̂ ) = 830 � �� � > 5,
830 830
10
𝑝̂ − 𝑝0 − 0.005
𝑧₀ = = 830 = 2.88.
𝑝 𝑞
� 0 0 �0.005 × 0.995
𝑛 830
Para 𝛼 = 0.05 el valor crítico es 1.65. Por tanto, se rechazará la hipótesis nula si 𝑧₀ > 1.65. Como
𝑧₀ = 2.88 > 1.65 se rechaza la hipótesis nula. Parece evidente que la campaña publicitaria ha atraído
también a los ataques por virus, y habrá que tomar medidas.(1p)
2
4. Un ingeniero está midiendo la eficiencia de un nuevo tipo de motor de inyección para motos. Con ese
fin, realiza un experimento en el laboratorio consistente en poner en funcionamiento 10 motores
alimentados con 1 litro de combustible cada uno. Los motores funcionan a un régimen de revoluciones
constante controlado, por lo que su consumo debería ser teóricamente el mismo. Sin embargo,
diversos factores que no se pueden controlar en el experimento hacen que el consumo de los
diferentes motores varíe. Los motores tienen acoplado un sistema de medida que calcula la distancia
que habrían recorrido si estuviesen montados sobre una motocicleta. Cuando los motores agotan el
combustible, se registra la distancia recorrida. Con las 10 distancias de la muestra se obtiene una
distancia media de 54 km con una cuasidesviación típica de 2 km. Asumiendo que la distancia recorrida
con un litro de combustible sigue una distribución normal, se pide:
a. Construye un intervalo de confianza para la media de la distancia recorrida. (1.5p)
b. Construye un intervalo de confianza para la varianza de la distancia recorrida. (1.5p)
c. ¿Puede aceptarse que la distancia que puede recorrer este tipo de motor con un litro de
combustible sigue una normal de media 53 km y varianza 4? (2p)
SOLUCIÓN:
𝑠̂ 2
𝐼𝐼(95%): 𝜇 ∈ �𝑥̅ ± 𝑡9,0.025 � = �54 ± 2.262 � = (52.57; 55.43)
√𝑛 √10
𝐻0 : 𝜇 = 53 𝐻0 : 𝜎 2 = 4
𝐻1 : 𝜇 ≠ 53 𝐻0 : 𝜎 2 ≠ 4
3
ESTADÍSTICA BÁSICA
SEMESTRE 2015-II
PRÁCTICA 4
JUEVES, 22 DE OCTUBRE DE 2015
Nombre:___________________________________________________________________________
Sección:___________________
DEBES ENTREGAR ESTA HOJA, JUNTO CON EL CUADERNILLO, CON LAS RESPUESTAS DE LA PREGUNTA 2
𝑋1 + 2𝑋2 𝑋1 + 4𝑋2
𝜇̂ 1 = 𝑦 𝜇̂ 2 = .
3 6
SOLUCIÓN
Sesgo(𝜇̂ 1 ) = 𝜇 − 𝜇 = 0 ⇒ Insesgado
5 1
Sesgo(𝜇̂ 2 ) = 𝜇 − 𝜇 = − 𝜇 = −0.17𝜇 ⇒ Sesgado
6 6
𝑋1 + 2𝑋2 1 5
Var(𝜇̂ 1 ) = Var � � = (𝜎 2 + 4𝜎 2 ) = 𝜎 2 = 0.56
3 9 9
𝑋1 + 4𝑋2 1 2 17 2
Var(𝜇̂ 2 ) = Var � �= (𝜎 + 16𝜎 2 ) = 𝜎 = 0.47
6 36 36
Tiene menor varianza 𝜇̂ 2 .
c) El mejor será el de menor error cuadrático medio. ECM(𝜇̂ ) = sesgo(𝜇̂ )2 + Var(𝜇̂ ). Para cada
estimador se tiene
𝐸𝐸𝐸(𝜇̂ 1 ) = 0.56
Vemos que el estimador de menor ECM depende del valor 𝜇. Si fuese muy bajo, compensaría el
estimador sesgado; pero si es alto, sería mejor el insesgado. El estimador 𝜇̂ 2 es mejor que 𝜇̂ 1 si
1
d) Compararemos los ECM respectivos. Si promediamos ambos estimadores tenemos el estimador
1 1 3𝑋1 + 8𝑋2
𝜇̂ 3 = 𝜇̂ 1 + 𝜇̂ 2 =
2 2 12
con
3𝑋1 + 8𝑋2 11
𝐸(𝜇̂ 3 ) = 𝐸 � �= 𝜇 = 0.92𝜇
12 12
3𝑋1 + 8𝑋2 9 + 64 2
Var (𝜇̂ 3 ) = Var � �= 𝜎 = 0.51
12 144
De nuevo, dependiendo del valor de 𝜇 así es la posición relativa de este nuevo estimador. Este
estimador será mejor que 𝜇̂ 1 si
0.0064𝜇2 + 0.51 < 0.028𝜇2 + 0.47 ⇒ 𝜇2 > 6.25 ⇒ |𝜇| > 2.5
Por tanto, es el mejor sólo en un rango muy estrecho. No tiene ventajas claras.
2
2. Sea X una variable aleatoria de media 𝜇 y varianza 𝜎², y sea 𝑥1 , … , 𝑥100 una muestra aleatoria de dicha
variable. Decir si las siguientes afirmaciones son verdaderas (V) o falsas (F). Contesta en la tabla
siguiente. No necesitas justificar. Respuesta correcta +0.8, incorrecta -0.5.
1 Como la muestra es grande, 𝑋 será una normal por el teorema del límite central. F
2 La media muestral tiene una varianza que es sólo la centésima parte de la varianza de X. V
Dado un nivel de confianza, un intervalo de confianza más amplio implicará una menor
7 F
incertidumbre sobre el valor de 𝜇.
SOLUCIÓN
2.27 × 10 2.27 × 10
𝑃 �𝜇 − < 𝑋� < 𝜇 + � = 𝑃(𝜇 − 2.27 < 𝑋� < 𝜇 + 2.27) = 0.977.
√100 √100
3
3. La denominada distribución de Erlang tiene la siguiente función de densidad:
(𝜆𝜆)𝑘−1
𝑓(𝑥) = 𝜆𝑒 −𝜆𝜆 ; 𝑘, 𝜆, 𝑥 > 0
(𝑘 − 1)!
con 𝜇 = 𝐸(𝑋) = 𝑘/𝜆 y 𝜎 2 =Var(𝑋) = 𝑘/𝜆2 . Contesta de forma razonada a las siguientes preguntas:
SOLUCIÓN
(Las estimaciones de los parámetros de la Erlang que se consiguen con estas estimaciones son
𝜆̂ = 1.03, y 𝑘� = 3.9)
c) No sería válido, pues la población no es normal, y el tamaño muestral es pequeño. No podemos
garantizar que 𝑋� sea normal, que es la condición en la que se basa el intervalo de confianza para
𝜇.
d) El cálculo del tamaño muestral necesita de una estimación de 𝜎, que será la obtenida en un
apartado anterior.
𝑧𝛼⁄2 𝜎� 2 1.96 × 1.924 2
𝑛=� � =� � ≈ 356
𝐿 0.2
e) Con n=356 se tiene un tamaño muestral suficientemente grande para considerar que 𝑋� sea
normal. El intervalo de confianza sería válido.
4
ESTADÍSTICA BÁSICA
SEMESTRE 2016-I
SUSTITUTORIO
MIÉRCOLES, 13 DE JULIO DE 2016
Nombre:___________________________________________________________________________
Sección:___________________
No se puede consultar ningún tipo de documentación salvo las tablas y el formulario que se entrega. 𝜶 = 𝟎. 𝟎𝟎.
LAS PREGUNTAS 1 Y 2 HAN DE RESPONDERSE EXCLUSIVAMENTE EN LA HOJA DE ENUNCIADOS, QUE DEBE ENTREGARSE
1. El departamento comercial de una empresa dedicada a la venta de ropa por catálogo ha hecho un estudio para estimar las
ventas realizadas (V), en cientos de euros. Para ello se han recogido datos durante 300 días de las siguientes variables:
número de líneas telefónicas abiertas para pedidos (L), número de catálogos enviados por correo durante la semana
anterior(C) y el Día de la semana (D) en el que se realizó la venta (D=1: fin de semana, D=0: de lunes a viernes). En la
siguiente tabla presentamos el resultado de dicho estudio.
Utilizando la información brindada, indique la verdad (V) o falsedad (F) de las siguientes afirmaciones, y justifique
brevemente su respuesta. (1 p por enunciado)
El modelo de regresión asume dos hipótesis: (1) que existe linealidad entre las ventas y las
variables L, C y D, y (2) que las variables L, C y D se distribuyen normalmente.
F
El número de catálogos no es significativo, porque su p-valor es mayor que 0.05 (nivel de
significación).
En los fines de semana las ventas medias aumentan en promedio 300 euros, cuando las
demás variables se mantienen constantes.
1
LAS PREGUNTAS 1 Y 2 HAN DE RESPONDERSE EXCLUSIVAMENTE EN LA HOJA DE ENUNCIADOS
2. Se ha realizado un estudio sobre el uso de la biblioteca por los estudiantes de una Universidad. Para ello, se cuenta
con la siguiente información histórica:
• El tiempo (horas), A, que un estudiante usuario utiliza la sala de lectura en un día sigue una distribución
desconocida con media 2.3 y varianza 1.21.
• El 67% de los alumnos utilizan el servicio de la Biblioteca al menos dos veces por semana.
• El tiempo (días), B, que un profesor usuario tiene en su poder un libro de la Biblioteca es una variable aleatoria
normal de media 3.1 y desviación estándar 0.8.
Se encuestó a 111 estudiantes y 20 profesores, y de esta encuesta se tienen los siguientes datos:
• El tiempo diario (horas) que un estudiante usa la sala de lectura es de 2.15 y su varianza es 1.4.
• 50 estudiantes utilizan el servicio de Biblioteca al menos dos veces por semana.
• El tiempo (días) que los profesores usuarios tienen en su poder un libro prestado de Biblioteca tiene una media
de 2.7 y cuasivarianza 0.618.
2
3. El sistema que se muestra en la figura está formado por los dispositivos, C1 a C5. Los dispositivos fallan
de manera independiente, siendo la probabilidad de fallo de cada uno de ellos la misma e igual a 0.05. El
sistema funciona siempre que haya conexión entre los puntos A y B. Se pide:
a. Calcula la probabilidad de que el subsistema formado por C1, C2, y C3 funcione. (2p)
b. Calcula la probabilidad de que el sistema completo funcione. (1p)
c. Si sabemos que el sistema funciona, calcula la probabilidad de que C4 funcione. (1p)
SOLUCIÓN:
a. Vamos llamar 𝐶𝑖 al suceso ‘El componente Ci funciona’, y 𝐶𝑖𝑖𝑖… al suceso ‘el subsistema formado
por los componentes Ci, Cj Ck,… funciona. Nos piden calcular 𝑃(𝐶123 ) , que será:
𝑃(𝐶123 ) = 𝑃�(𝐶1 ∪ 𝐶2 ) ∩ 𝐶3 � = 𝑃(𝐶1 ∪ 𝐶2 )𝑃(𝐶3 ) = �1 − 𝑃(𝐶1̅ )𝑃(𝐶2̅ )�𝑃(𝐶3 )
= �1 − 0.05(0.05)�0.95 = 0.9476
c. La probabilidad de que C4 funcione sabiendo que el sistema funcione es, aplicando el teorema de
Bayes
𝑃(𝐶12345|𝐶4 )𝑃(𝐶4 ) 𝑃(𝐶12345|𝐶4 )0.95
𝑃(𝐶4 |𝐶12345 ) = =
𝑃(𝐶12345 ) 0.9475
Si C4 funciona, no importa si el subsistema C123 funciona o no. El sistema funcionará sólo si
funciona C5. Es decir 𝑃(𝐶12345 |𝐶4) = 𝑃(𝐶5 ). Este mismo resultado se obtiene si en los cálculo de la
sección b utilizamos que 𝑃(𝐶4 ) = 1 y 𝑃(𝐶4̅ ) = 0. Se tiene entonces que
𝑃(𝐶12345|𝐶4 ) = �1 − 𝑃(𝐶4̅ )𝑃(𝐶123
̅ )�𝑃(𝐶5 )
= �1 − 0 × 𝑃(𝐶123̅ )�𝑃(𝐶5 ) = 𝑃(𝐶5 ) = 0.95.
Se tiene entonces que
0.95(0.95)
𝑃(𝐶4 |𝐶12345) = = 0.9525
0.9475
3
4. Dado el siguiente gráfico de dispersión, indica de forma
breve pero razonada:
a. Qué transformación podría hacerse a la variable x
para conseguir una relación lineal. (1p)
b. Qué transformación podría hacerse a la variable y
para conseguir una relación lineal. (1p)
SOLUCIÓN:
4
5. El número de llamadas que recibe una central telefónica sigue una distribución de Poisson con media 10
llamadas/hora.
a. Suponga que el servicio ha comenzado a operar a las 8:00 horas. Cuál es la probabilidad de que la
primera llamada ocurra antes de las 8:10? (2p)
b. ¿Cuál es la probabilidad de que a las 8:15 aún no hayan recibió ninguna llamada. (1p)
c. ¿Cuál es la probabilidad de que en una jornada de 8 horas reciban más de 100 llamadas? (1p)
SOLUCIÓN:
a. Sea 𝑋 =número de llamadas que se reciben en una hora, con 𝑋 ∼ Poi(𝜆 = 10). Entonces, la variable
aleatoria 𝑇 = tiempo (en horas) entre llamadas será una exponencial 𝑇 ∼ 𝐸𝐸𝐸(𝜆 = 10 ). Debido a la
ausencia de memoria del proceso de Poisson, el intervalo desde un instante dado hasta que se
observa el siguiente suceso será también una exponencial. Por tanto, el tiempo desde que comienza
el servicio hasta que llega un cliente es una exponencial. En minutos será 𝑇𝑚 ∼ 𝐸𝐸𝐸(𝜆𝑚 =
0.167 llamadas/minuto). El que la primera llamada ocurra antes de los 10 minutos tendrá la
siguiente probabilidad:
𝑃(𝑇𝑚 < 10) = 1 − 𝑒 −𝜆𝑚×10 = 1 − 𝑒 −0.1667×10 = 1 − 𝑒 −1.667 = 0.8112.
5
ESTADÍSTICA BÁSICA
SEMESTRE 2016-I
EXAMEN FINAL
LUNES, 4 DE JULIO DE 2016
Nombre:___________________________________________________________________________
Sección:___________________
Sólo se permiten las tablas y formulario que se entregan con el examen. 𝛼 = 0.05
LOS PROBLEMAS 2 Y 3 DEBEN ENTREGARSE EN UN CUADERNILLO DIFERENTE AL PROBLEMA 1
1. La Universidad de Piura ha realizado la migración del sistema de mensajería a la plataforma Office 365, de
Microsoft. Sin embargo, el área de Tecnologías de Información ha detectado que las herramientas ofrecidas
por dicha plataforma no están siendo aprovechadas eficientemente. Para ello, se realizó un estudio con el fin
de medir tres aspectos importantes: (1) porcentaje de trabajadores que usan el sistema de comunicación
interna, (2) número de horas que un trabajador invierte en el envío de mensajes a través del correo
electrónico, y (3) número de días a la semana en que un alumno accede a su cuenta de Pregrado.
El estudio sobre el nuevo sistema se llevó a cabo en colaboración con los alumnos de Estadística, realizándose
81 encuestas a trabajadores y 110 encuestas a alumnos de Pregrado. Algunos de los resultados se muestran a
continuación:
Tabla 1. Número de trabajadores que usan el sistema Tabla 3. Número de días a la semana (de 7 días) que
de comunicación interna (Resultado de la encuesta). un alumno accede a su cuenta de correo electrónico
de Pregrado (Resultado de la encuesta)
Respuesta Frecuencia
Número de
Sí usa 47 Frecuencia
días
No usa 34 0 5
1 15
Tabla 2. Estadísticas descriptivas de la muestra de la
variable tiempo de uso del correo electrónico por un
2 24
trabajador (Resultado de la encuesta). 3 30
4 23
Parámetro Valor 5 10
Media 2.71 6 2
Cuasidesviación 7 1
0.85
estándar
a) ¿Se puede afirmar que la campaña de difusión de Skype For Business ha aumentado el uso del sistema
de comunicación interna en los trabajadores? 2p.
b) A partir de los datos de la encuesta, elabore un intervalo de confianza para el número medio de horas
que un trabajador invierte en usar el correo electrónico con el nuevo sistema. 1p.
c) En base a dicho intervalo (apartado b), ¿es posible afirmar que la media ha cambiado respecto al
sistema anterior? Fundamente brevemente su respuesta. 2p.
d) ¿Cuántas encuestas se deben realizar como mínimo para reducir a la mitad el margen de error del
intervalo de confianza calculado en el apartado b? 1p.
e) Un analista considera que el número de días de la semana que un alumno accede a su cuenta de correo
puede modelizarse como una binomial. A la vista de los datos de la encuesta ¿es aceptable la hipótesis
de este analista? 4p.
1
SOLUCIÓN:
a) (2p) Como 𝑛𝑝̂ (1 − 𝑝̂ ) = 19.73 > 5 podemos usar la aproximación a la normal para la proporción
muestral. Se realiza un contraste de hipótesis unilateral, para el cual se establecen las siguientes
hipótesis:
𝐻0 : 𝑝 ≤ 0.65
𝐻1 : 𝑝 > 0.65
𝑝̂ = 0.5802
𝑞� = 0.4198
𝑝𝑝
𝑝̂ ~ 𝑁 �𝑝, �
𝑛
→ 𝑝̂ ~ 𝑁 (0.65, 0.0028)
0.5802 − 0.65
𝑧= ≈ −1.32
√0.0028
1.65
Como -1.32 < 1.65 se acepta la hipótesis nula, y por tanto que la proporción no ha aumentado, es
decir, que la campaña no ha sido efectiva. De hecho, como p� = 0.5802 ≤ 0.65, está del lado de la
hipótesis nula, y por tanto no habría hecho falta realizar ningún cálculo adicional para concluir que
aceptamos H0 . Sólo se va a rechazar H0 si los datos hacen lo que dice H1 ( es decir, si p� > 0.65) de
forma muy marcada.
b) (1 p) Como n > 30, se puede considerar a la muestra como grande y utilizar que 𝑥̅ se distribuye como
una normal, que es en lo que se fundamenta el intervalo de confianza para 𝜇 en muestras grandes.
0.85
𝐼𝐼 (0.95): 𝜇 ∈ 2.71 ± 1.96 = [2.5249, 2.8951]
√81
Otras alternativas válidas: usando la varianza poblacional, pues no se ha demostrado (aún) que la
varianza haya cambiado, o usando la t de Student.
0.7071
𝐼𝐼 (0.95): 𝜇 ∈ 2.71 ± 1.96 = [2.5560, 2.8640]
√81
0.85
𝐼𝐼 (0.95): 𝜇 ∈ 2.71 ± 1.99 = [2.5221, 2.8979]
√81
0.85
𝐿 = 1.96 = 0.1851
√81
El nuevo margen de error debe ser:
0.1851
𝐿′ = = 0.0926
2
El nuevo tamaño muestral debe ser:
1.96 × 0.85 2
𝑛= � � ≈ 324 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
0.0926
2
1.96 ×0.7071 2 1.99 ×0.85 2
Otras alternativas válidas: 𝑛 = � � ≈ 325 𝑒𝑒𝑒𝑒𝑒𝑒𝑒͊𝑎𝑎 ; 𝑛 = � � ≈ 324 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
0.0940 0.0770
e) La variable aleatoria que nos ocupa es 𝑋 =número de días de la semana (de 7 días) que un alumno
consulta el correo electrónico. Se tiene que 𝑋 = 0,1,2,3,4,5,6,7. Se pide realizar una prueba de bondad
de ajuste binomial, es decir, se quiere contrastar a partir de una muestra si
𝑋 ∼ 𝐵(𝑛 = 7, 𝑝)
El contraste es:
𝐻0 : 𝑋 ~ 𝐵 (7, 𝑝)
𝐻1 : 𝑋 ≁ 𝐵 (7, 𝑝)
Para realizar el contraste, se tiene una muestra de 110 individuos, cada uno estudiado como una
semana en la que se pueden ingresar de 0 a 7 días por semana al correo Pregrado. En primer lugar, se
estima el parámetro p:
0 × 5 + 1 × 15 + 2 × 24 + 3 × 30 + 4 × 23 + 5 × 10 + 6 × 2 + 7 × 1
µ� = = 2.8545
110
2.8545
µ� = np� → 𝑝̂ = = 0.4078 (1p)
7
(3p) El resto del procedimiento se ha calificado de acuerdo al valor de p calculado en cada caso.
A continuación, se realiza la prueba ji-cuadrado:
Factor
X Oi p(x) Ei Clase Oi Ei (𝑶𝒊 − 𝑬𝒊 )𝟐
𝑬𝒊
0 5 0.0255 2.81
[0-1] 20 16.3538 0.8129
1 15 0.1231 13.54
2 24 27.9801 0.5661
2 24 0.2544 27.98
3 30 32.1126 0.1389
3 30 0.2919 32.11
4 23 0.2010 22.11 4 23 22.1134 0.0356
5 10 0.0831 9.14 [5-7] 13 11.4401 0.2127
6 2 0.0191 2.10 5
7 1 0.0019 0.21 2
(𝑶𝒊 − 𝑬𝒊 )𝟐
𝑋 = � = 1.7663
𝑬𝒊
1
Como no todas las frecuencias esperadas son mayores
que 5, se agrupan las clases.
3
2. Se tienen datos de un conjunto de alumnos de cierta asignatura del pasado semestre. En este curso, que
cuenta con dos secciones, se encuentran alumnos que pertenecen a 3 programas académicos diferentes.
Para cada alumno se tiene la siguiente información:
SOLUCIÓN:
a) FALSO. El modelo 1 tiene como variable explicativa SecBin, que es binaria. Cuando SecBin=0, el modelo
proporciona el IA medio de la sección A, que resulta ser 𝛽̂0 = 11.699. Cuando SecBin=1, e modelo
proporciona la media para la sección B, que resulta ser 𝛽̂0 + 𝛽̂1 = 11.699 − 0.6235 = 11.0755. El pvalor
del coeficiente 𝛽̂1 , correspondiente a la variable binaria SecBin es 0.006, que es muy bajo. Por lo tanto
rechazamos la 𝐻0 : 𝛽1 = 0. Por tanto, hay diferencias significativas en el IA medio de cada sección. Por
término medio, los alumnos de la sección B (SecBin=1) tienen 0.6235 puntos menos de IA. La diferencia es
lo suficientemente grande como para pensar que se deba al azar del muestreo.
c) FALSO. La regresión 3 tiene las variables binarias P1 y P3, y no tiene P2. Por tanto, el término constante
nos proporciona la media del grupo P2, mientras que los otros coeficientes nos muestran las diferencias
en la media de IA de los programas 1 y 3, respectivamente, respecto del programa 2. El pvalor del
4
coeficiente de P3 en la regresión 3 es muy bajo (0.036 < 0.05), por lo que hay diferencias significativas
entre el IA medio del programa académico 3 y el del programa académico 2. La diferencia es de casi un
punto a favor del programa 3. (La regresión 2 no es interpretable, pues la variable ProgAc es cualitativa. La
regresión 2 no tiene sentido).
f) FALSO. Según el modelo 4, cada vez que se repite, el IA medio tiende a bajar un punto, y no a subir. Los
que repiten una vez tienen un punto menos, y los que repiten dos veces, dos puntos menos en el IA medio
respecto de los que se matriculan por primera vez.
3. Un proceso productivo consta de dos etapas, cuyas duraciones respectivas, X1 y X2 , son variables
aleatorias independientes, distribuidas según un modelo exponencial de parámetros λ y 2λ,
respectivamente. Es decir, X1 ∼ Exp(λ), X2 ∼ Exp(2λ). La duración total del proceso puede entonces
escribirse como la variable aleatoria T = X1 + X 2 . Se tiene una muestra de los tiempos totales T que se
invirtió en la fabricación de 5 artículos: t1 = 12; t 2 = 8; t 3 = 9; t 4 = 19; t 5 = 11. Se pide, razonando las
respuestas:
a) Obtén el estimador de λ por el método de los momentos, basado en una muestra aleatoria simple
𝑡1 , 𝑡2 , … , 𝑡𝑛 de T.
b) Usando este estimador y los datos del enunciado, calcula la estimación de λ.
SOLUCIÓN:
a. El método de los momentos obtiene estimadores de los parámetros a partir de estimar los
momentos poblacionales con los muestrales. El primer momento poblacional de 𝑇 es:
1 1 3
𝜇 𝑇 = 𝐸(𝑇) = 𝐸(𝑋1 + 𝑋2 ) = 𝐸(𝑋1 ) + 𝐸(𝑋2 ) = + = .
𝜆 2𝜆 2𝜆
Por tanto,
3
𝜆= .
2𝜇 𝑇
El estimador será:
3 3𝑛
⇒ 𝜆̂ = = .
2𝑡̅ 2 ∑𝑛𝑖=1 𝑡𝑖
b. La estimación es
3𝑛 3×5
𝜆̂ = 𝑛 = = 0.1271
2 ∑𝑖=1 𝑡𝑖 2(12 + 8 + 9 + 19 + 11)
5
ESTADÍSTICA BÁSICA
SEMESTRE 2016-I
PARCIAL
LUNES, 2 DE MAYO DE 2016
Nombre:___________________________________________________________________________
Sección:___________________
Las duraciones (tiempo hasta avería) de los componentes son variables aleatorias. Para los
componentes C1 y C2, la duración sigue una distribución exponencial de media 5000 horas. Para el
componente C3 es una distribución normal con la misma media y desviación típica que el
componente C1. Contesta de forma justificada a las siguientes cuestiones (6p):
SOLUCIÓN
b) Para definir la distribución de C3 necesitamos su media y desviación típica, que son las mismas
que la de C1:
𝜇 = 𝐸(𝑇1 ) = 5000,
1
𝜎 = �𝑣𝑣𝑣(𝑇1 ) = = 5000 horas
𝜆1
Al ser una normal, calculamos la probabilidad con la tabla, para lo que necesitamos estandarizar:
6000 − 5000
𝑃(𝑇3 > 6000) = 𝑃 �𝑍 > � = 𝑃(𝑍 > 0.2)
5000
= 1 − 𝑃(𝑍 ≤ 0.20) = 1 − 0.5793 = 0.421.
1
c) Para que el subsistema formado por los componentes C1 y C2 dure más de 6000 horas basta con
que lo haga uno de ellos. O bien, el subsistema durará menos de 6000 horas si ambos
componentes duran menos de 6000 horas. Si denotamos por C12 a este subsistema y 𝑇12 a su
duración tenemos:
𝑃(𝑇12 > 6000) = 𝑃[(𝑇1 > 6000) ∪ (𝑇2 > 6000)] = 1 − 𝑃[(𝑇1 ≤ 6000) ∩ (𝑇2 ≤ 6000)]
Dado que los componentes se averían de forma independiente de los demás, y que C1 y C2 son
idénticos, tenemos que
1 − 𝑃[(𝑇1 ≤ 6000) ∩ (𝑇2 ≤ 6000)] = 1 − 𝑃(𝑇1 < 6000)2
6000 2
= 1 − �1 − 𝑒 −5000 � = 1 − (1 − 0.301)2 = 0.511.
d) Todo el sistema durará más de 6000 horas si lo hacen tanto el subsistema C12 como el
componente C3. Si denotamos por C123 a todo el sistema y 𝑇123 a su duración tenemos:
𝑃(𝑇123 > 6000 + 6000|𝑇123 > 6000) = 𝑃(𝑇123 > 12000|𝑇123 > 6000) =
𝑃[(𝑇123 > 12000) ∩ (𝑇123 > 6000)] 𝑃(𝑇123 > 12000)
= .
𝑃(𝑇123 > 6000) 0.215
Tenemos entonces que calcular la probabilidad del numerador. Hay que realizar las mismas
operaciones que en apartados anteriores, pero reemplazando el valor 6000 por 12000.
12000 2
𝑃(𝑇12 > 12000) = 1 − �1 − 𝑒 − 5000 � = 1 − (1 − 0.091)2 = 0.172
12000 − 5000
(𝑇3 > 12000) = 𝑃 �𝑍 > � = 𝑃(𝑍 > 1.4)
5000
= 1 − 𝑃(𝑍 ≤ 1.4) = 1 − 0.9192 = 0.081.
Queda entonces
𝑃(𝑇123 > 12000) = 0.172 × 0.081 = 0.014.
0.014
𝑃(𝑇123 > 12000|𝑇123 > 6000) = = 0.065.
0.215
2
2. Para cada una de las afirmaciones siguientes, conteste si son verdaderas o falsas, justificando
brevemente la respuesta: (4p)
b. Si al realizar una regresión simple Y = β�0 + β�1 X + e resulta β�1 < 0 entonces ambas variables
X e Y no están relacionadas. (1p)
SOLUCIÓN
a. Falso, en una variable aleatoria continua cualquier punto cumple 𝑃(𝑋 = 𝑥) = 0, esté o no en
el espacio muestral de X. Para distinguir los valores que están o no en el espacio muestral hay
que consultar a la función de densidad. Los valores que estén en el espacio muestral verifican
que 𝑓(𝑥) > 0, mientras que los que no lo estén verifican que 𝑓(𝑥) = 0.
3. Una máquina fabrica ejes cuyos radios (cm) se distribuyen según la siguiente función de densidad:
a. Calcular k . (0.5p)
b. Defina la función de distribución de los radios de los ejes. (1.5p)
c. Si los ejes aceptables miden entre 1.5 y 2.5, ¿qué proporción de ejes son considerados
defectuosos? (1p)
d. Calcule la longitud media de los ejes producidos. (1p)
SOLUCIÓN
3 4 3
a. ∫1 𝑘 (𝑥 − 1)(3 − 𝑥) 𝑑𝑑 = 1 ⇒ 𝑘 × =1⇒𝑘 =
3 4
3
0; 𝑥 < 1
⎧ 3 𝑥3 4
𝐹(𝑥) = − � − 2𝑥 2 + 3𝑥 − � ; 1 ≤ 𝑥 ≤ 3
⎨ 4 3 3
⎩ 1; 𝑥 > 3
4. La empresa Metales del Norte S.A.C. ha recibido quejas de algunos clientes sobre la calidad de su
producto, láminas de aluminio de 1 𝑚2 . Por el uso que se le da a las placas, los clientes aceptan un
máximo de 2 imperfecciones por placa. Con más de 2 imperfecciones se considera que la placa es
defectuosa. Las placas se producen cortando una lámina grande de aluminio, en la que luego de
estudiarse, se detecta que la aparición de defectos en su superficie es estable e independiente, con
una razón media de 50 defectos cada 10 metros cuadrados. Se pide, justificando la respuesta: (3p)
a. Calcula la probabilidad de que una placa de 1 m2 sea defectuosa. (1p)
b. Dentro de un lote de 150 placas de 1 m2 entregadas a un cliente, ¿cuántas placas defectuosas se
espera encontrar? (2p)
SOLUCIÓN
a. 𝑋: Número de defectos por placa (es decir, por 𝑚2 ). 𝑋 ~ 𝑃𝑃𝑃 (5 defectos /𝑚2 )
2
5𝑟 −5
𝑝 = 𝑃(𝑋 > 2) = 1 – 𝑃(𝑋 ≤ 2) = 1 − � 𝑒 = 0.8753
𝑟!
𝑟=0
4
5. La nueva tienda de souvenirs de la Universidad, Udep Store, ha decidido realizar un estudio de la
afluencia de clientes a su establecimiento, llegando a las siguientes conclusiones:
- Hay tres tipos de clientes: alumnos, trabajadores de la Udep y personas externas a la Udep.
- Las llegadas de los clientes ocurren de manera estable e independiente.
- Por término medio llegan 3 alumnos cada dos horas.
- La llegada de trabajadores de la Udep ocurre con una tasa media de 1 trabajador cada dos horas.
- Llegan 2 personas externas en promedio cada 3 horas.
Considerando que se atiende 8 horas diarias, responda de forma justificada a las siguientes
cuestiones: (3p)
SOLUCIÓN
5.330
𝑃 (𝑋 = 0) = × 𝑒 −5.33 = 0.005 = 0.5%
0!
b. Definimos
3
• 𝑋𝑎 : nº de alumnos por minuto. 𝑋𝑎 ∼ 𝑃𝑃𝑃(𝜆𝑎 ) donde 𝜆𝑎 = 𝑎lumnos/hora =
2
0.025 alumnos/minuto.
1
• 𝑋𝑡 : nº de trabajadores Udep por minuto. 𝑋𝑡 ∼ 𝑃𝑃𝑃(𝜆𝑡 ) donde 𝜆𝑡 =
2
trabajadores/hora = 0.0083 trabajadores/minuto.
2
• 𝑋𝑒 : nº de personas externas por minuto. 𝑋𝑎 ∼ 𝑃𝑃𝑃(𝜆𝑒 ) donde 𝜆𝑒 = personas/hora =
3
0.011 trabajadores/minuto.
• 𝑋𝑇 =nº total de clientes=𝑋𝑎 + 𝑋𝑡 + 𝑋𝑒 ∼ 𝑃𝑃𝑃(0.044 clientes/minuto)
𝑇: Tiempo en minutos entre la llegada de cada cliente. 𝑇 ~ Exp (0.044 clientes / minuto)
5
ESTADÍSTICA BÁSICA
SEMESTRE 2016-I
PRÁCTICA 5
JUEVES, 9 DE JUNIO DE 2016
Nombre:___________________________________________________________________________
Sección:___________________
Sólo se pueden usar las tablas y formulario que se suministra. 𝛼 = 0.05
1. Los datos históricos muestran que las puntuaciones de cierta asignatura de primer ciclo siguen una distribución
normal de media 11.5. En el presente curso, los alumnos de esta asignatura han aplicado técnicas de estudio
innovadoras, basadas en aprendizaje activo. Tras una evaluación, una muestra aleatoria de 20 de estos
estudiantes ha obtenido una calificación media de 12.8 y una cuasivarianza de 27.56.
a. ¿Puede afirmarse que las nuevas técnicas de estudio son eficaces? (3p)
b. Construye un intervalo de confianza para la varianza de las calificaciones.(3p)
c. Un experto sostiene la hipótesis de que, con las nuevas metodologías, los alumnos que
tradicionalmente sacan peores notas son los que obtienen mejores resultados, pues las nuevas
técnicas facilitan la concentración de estos alumnos. Como resultado, la varianza de las calificaciones
disminuirá. Si la varianza histórica de las de las calificaciones es de 30, ¿apoyan los datos esta
hipótesis?(4p)
SOLUCIÓN
1
2. El gerente de producción de una fábrica de cubos de Rubik ha decidido realizar un estudio para conocer cómo se
distribuye el número de artículos defectuosos dentro de sus lotes de producción, de 20 unidades. Se estudiaron
85 lotes seleccionados de manera aleatoria y se obtuvieron los siguientes datos:
Número de Frecuencia
defectos observada
0 30
1 30
2 15
3 5
4 4
5 1
>5 0
¿Se puede concluir que el número de defectos por lote sigue una distribución binomial? Para las probabilidades use
4 decimales. (6 puntos)
SOLUCIÓN
Estimación de p: (1 punto)
En primer lugar, se estima p a partir de la muestra:
1.1294
𝜇̂ = 𝑛𝑝̂ = 1.1294 → 𝑝̂ = = 0.0565
20
Por tanto, las probabilidades se tienen que calcular con una distribución binomial con n = 20 y p = 0.0565.
Cálculo de la frecuencia esperada: (2 puntos)
Número
Frecuencia Frecuencia
de p(x)
observada esperada
defectos
0 30 0.3127 26.58
1 30 0.3743 31.81
2 15 0.2128 18.09
3 5 0.0764 6.50
4 4 0.0194 1.65
5 1 0.0037 0.32
>5 0 0.0006 0.05
Número Factor
Frecuencia Frecuencia (𝑶𝒊− 𝑬𝒊 )2
ji - cuadrado
de ji - cuadrado
observada esperada 𝑬𝒊 crítico
defectos
0 30 26.58 0.441 1.329 5.990
1 30 31.81 0.103
2 15 18.09 0.528
>2 10 8.52 0.258
Se consideran 2 grados de libertad.
2
(Si se consideran agrupaciones con frecuencia esperada de <=3
Número
Frecuencia Frecuencia ji - cuadrado
de Factor ji - cuadrado
observada esperada crítico
defectos
0 30 26.58 0.441 5.800 7.81
1 30 31.81 0.103
2 15 18.09 0.528
3 5 6.50 0.344
>3 5 2.02 4.384
Se considera una ji-cuadrado de 5-2=3 grados de libertad.
3. Los alumnos que ingresaron a la Facultad de Ingeniería han sido clasificados en 4 grupos, según su nivel socio-
económico, tal como se indica:
A B C D
12 20 31 33
Investigue si los alumnos ingresantes a la Facultad pertenecen indistintamente a los distintos niveles. (4 puntos)
SOLUCIÓN:
Factor ji -
Frecuencia Frecuencia ji -
p(x) (𝑶𝒊− 𝑬𝒊 )2 cuadrado
observada esperada cuadrado
𝑬𝒊 crítico
A 12 0.25 24 6 12.083 7.81
B 20 0.25 24 0.66666667
C 31 0.25 24 2.04166667
D 33 0.25 24 3.375
Se considera una ji-cuadrado de 4-1=3 grados de libertad
Conclusión de la prueba: (1 punto)
Rechazamos Ho: La distribución no es uniforme
3
ESTADÍSTICA BÁSICA
SEMESTRE 2016-I
PRACTICA 4
JUEVES, 26 DE MAYO DE 2016
Nombre:___________________________________________________________________________
Sección:___________________
Sólo se pueden consultar las tablas y el formulario que se suministran con el examen. Use 𝜶 = 𝟎. 𝟎𝟎.
1. Analizando todas las evaluaciones de una asignatura en todos los años anteriores, se observa que los alumnos han obtenido
una nota media de 11.8 con varianza 1.2, siendo la tasa de aprobados del 75%. Se desea saber si el presente curso supone
una continuidad en cuanto a estos resultados, o ha cambiado algo. Con este fin, se toma una muestra aleatoria de 30
estudiantes del presente curso, obteniéndose una nota media muestral de 12.2 con varianza muestral 2, y siendo el número
de aprobados en esta muestra igual a 20 alumnos. A continuación se enuncian un conjunto de hipótesis sobre los valores
poblacionales de las calificaciones de esta asignatura. Escribe en términos estadísticos, la hipótesis nula y alternativa que
corresponden con cada una de estas hipótesis. (respuesta correcta +0.5).(5p)
Hipótesis H0 H1
Ejemplo: La nota media poblacional es ahora 12 𝜇 = 12 𝜇 ≠ 12
2. Sea 𝑋 una variable aleatoria de media 𝜇 y varianza 𝜎 2 . Para estimar la media 𝜇 se promedian los valores de 20
datos, consiguiéndose la media muestral 𝑥̅(1) . Posteriormente, se consigue un dato adicional, 𝑥21 . Un analista
decide entonces construir un nuevo estimador de 𝜇 promediando ambos valores de la forma
𝑥̅(1) + 𝑥21
𝜇̂ 1 = .
2
a) ¿Es este estimador insesgado? Justifica la respuesta (2p).
b) Compara el error cuadrático medio de este estimador con otro, 𝜇̂ 2 , que sea la media aritmética de los
21 datos. ¿Cuál es preferible? Justifica la respuesta. (3p)
SOLUCIÓN:
a) Es insesgado
𝑥̅(1) + 𝑥21 𝐸(𝑥̅(1) ) + 𝐸(𝑥21 ) 𝜇 + 𝜇
𝐸(𝜇̂ 1 ) = 𝐸 � �= = =𝜇
2 2 2
1
3. Se desea saber el gasto medio anual de un estudiante en fotocopias. Con ese fin se analiza una muestra de 100
personas y se obtiene una media muestral de 210 y cuasidesviación típica 20.
a) Determina un intervalo de confianza del 95% para el gasto medio en fotocopias en la población.
Interpreta su significado. Justifica la respuesta. (2p)
b) ¿Qué tamaño muestral sería necesario para reducir a la mitad el margen de error de ese intervalo? (3p)
SOLUCIÓN
a) Como tenemos una muestra grande, el intervalo de confianza viene dado, por 𝑋 ± 𝑧𝛼/2 𝑠̂ /√𝑛 . Por
tanto
20
𝐼𝐼(0.95): 𝜇 ∈ �210 ± 1.96 × � = [206.08,213.92]
10
Tenemos una confianza del 95% de que la media poblacional estará dentro de este intervalo.
b) El margen de error 𝐿 del intervalo viene dado por 𝑧𝛼/2 𝜎/√𝑛 . Con la información de la muestra de 100
personas es igual, estimando 𝜎 con 𝑠̂ , a 1.96(20/10) . Para reducirlo a la mitad necesitamos
1.96(20/20) y por tanto 20 = √𝑛 lo cual implica 𝑛 = 400 personas.
4. Para las elecciones presidenciales, un partido político ha contratado a una encuestadora para realizar un estudio
de la intención de voto 3 meses antes de las elecciones. El estudio, en el que se encuestó a 1500 personas, dio
como resultado que el 35% de los electores votarán por dicho partido.
a) Elabore el intervalo de confianza para el porcentaje de votantes que elegirán a ese partido. Justifique la
respuesta. (2p)
b) Dos meses antes de las elecciones, en una nueva encuesta, 570 de las 1750 personas encuestadas
afirmaron que votarían por el partido. ¿Se podría concluir que la intención de voto por el partido es
inferior al 35%? (3p)
SOLUCIÓN
a) Como 𝑛𝑝̂ (1 − 𝑝̂ ) = 1500 × 0.35 × 0.65 = 341 > 5 podemos usar la aproximación a la normal para la
proporción muestral.
0.35 × 0.65
𝐼𝐼 (0.95): 𝑝 ∈ 0.35 ± 1.96 � = [0.3259, 0.3741]
1500
b) La nueva encuesta dice que 𝑝̂ = 0.3257. Queremos realizar el siguiente contraste de hipótesis
unilateral:
𝐻0 : 𝑝 ≥ 0.35
𝐻1 : 𝑝 < 0.35
𝑝̂ − 𝑝0 0.3257 − 0.35
𝑍0 = = = −2.13 < −1.64 → Rechaza la hipótesis nula
�𝑝0 𝑞0�𝑛 �0.35 × 0.65�1750
2
ESTADÍSTICA BÁSICA
SEMESTRE 2016-II
SUSTITUTORIO
SÁBADO, 10 DE DICIEMBRE DE 2016
Nombre:___________________________________________________________________________
Sección:___________________
Sólo pueden utilizarse las tablas y formulario que se proporcionan. JUSTIFICA TODAS TUS RESPUESTAS. Utiliza 𝜶 = 𝟎. 𝟎𝟓.
Para solicitar reclamo de esta evaluación, es necesario anexar esta solución impresa, señalando
en ella aquellos puntos sobre los que se realiza el reclamo.
Todo reclamo debe estar correctamente fundamentado en relación a este solucionario.
Sólo podrán proceder aquellos reclamos que se basen en discordancias objetivas entre el criterio
señalado en este solucionario y el aplicado a la evaluación.
No procederán aquellos reclamos que se basen en desacuerdos sobre los criterios de valoración
que se han empleado en el solucionario, y que son competencia de los profesores de la
asignatura.
1. (4p) Un periódico español publicó la siguiente noticia acerca de los salarios anuales de los españoles:
Según los datos que maneja el Ministerio de Economía, el 34% de los 19,3 millones de asalariados que hay en
España cobra menos de 10.000 euros anuales, aunque el porcentaje se eleva al 66% si se tienen también en
cuenta los ciudadanos que cobran hasta 20.000 euros. Las personas con rentas salariales de entre 20.000 y
30.000 euros ascienden a 1,6 millones. En cambio, solo 7.000 contribuyentes declaran cobrar más de 600.000
euros, mientras que 16.000 ciudadanos perciben rentas de entre 300.000 euros y 600.000 euros.
a) Construye una tabla de frecuencias agrupadas de la distribución de salarios anuales. En la tabla, incluye
frecuencias absolutas, frecuencias relativas y frecuencias relativas acumuladas. (1p)
c) Elegimos un ciudadano al azar y le preguntamos si su salario anual es superior a 30.000 euros, a lo que
responde afirmativamente. ¿Cuál es la probabilidad de que este ciudadano sea uno de los 7000 que gana
más de 600.000 al año? (1p)
d) Elegimos un ciudadano al azar y le preguntamos si su salario es superior a 30.000 euros, a lo que responde
negativamente. ¿Cuál es la probabilidad de que este ciudadano gane más de 10.000 euros? (1p)
SOLUCIÓN
a) La siguiente tabla resume los datos del recorte de prensa. En negrita se muestran los datos proporcionados
en el enunciado. El resto de cifras se obtienen con cálculos sencillos.
Fr. relativa
Intervalo Fr. absoluta Fr. relativa
acum.
1 <10000 6.562.000 34,00% 34,00%
2 10.000-20.000 6.176.000 32,00% 66,00%
3 20.000-30.000 1.600.000 8,29% 74,29%
4 30.000-300.000 4.939.000 25,59% 99,88%
5 300.000-600.000 16.000 0,0829% 99,96%
6 >600.000 7.000 0,0363% 100,00%
total 19.300.000 100%
b) La asimetría es positiva. Puede verse haciendo un diagrama de barras con la columna de frecuencias
relativas. Las barras tienen un área aproximadamente proporcional a la frecuencia relativa.
También puede verse en que la distancia desde el mínimo a la mediana es de 20000, mientras que de la
mediana al percentil 99 es de casi 600000.
c) Sea 𝑋 el salario de esta persona. Se desea calcular 𝑃(𝑋 > 600.000|𝑋 > 30.000). Aplicando probabilidad
condicionada:
𝑃((𝑋 > 600.000) ∪ 𝑋(> 30.000))
𝑃(𝑋 > 600.000|𝑋 > 30.000) =
𝑃(𝑋 > 30.000)
𝑃(𝑋 > 600.000) 0,00036
= = = 0.0014
𝑃(𝑋 > 30.000) 1 − 0.7429
d) Se desea calcular 𝑃(𝑋 > 10.000|𝑋 > 30.000). Aplicando probabilidad condicionada:
𝑃((𝑋 > 10.000) ∪ (𝑋 < 30.000))
𝑃(𝑋 > 10.000|𝑋 < 30.000) =
𝑃(𝑋 < 30.000)
𝑃(𝑋 < 30.000) − 𝑃(𝑋 < 10.000) 0,7429 − 0,34
= = = 0.5423.
𝑃(𝑋 < 30.000) 0,7429
2. (8p) Sea 𝑇𝑖 el tiempo que invierte el viajero i-ésimo en el mostrador de facturación del
aeropuerto antes de embarcar. 𝑇𝑖 es una variable aleatoria normal de media 5 minutos
y varianza 2. Asumiremos que el tiempo invertido en cada viajero es independiente de
los demás. Contesta de forma razonada las siguientes cuestiones.
c) Tras atender a 25 clientes, se ha registrado un tiempo medio de atención de 4.5 minutos, con una
cuasivarianza de 0.9. ¿Podemos decir que han cambiado media y varianza respecto a los valores
poblacionales iniciales? (4p)
d) ¿Cómo cambiaría la respuesta a la pregunta anterior si el tiempo de atención no se distribuyese como una
normal? Razona tu respuesta. (1p)
SOLUCIÓN
a) 𝑇𝑖 ∼ 𝑁(5, 𝜎 2 = 2)
4−5
⇒ 𝑃(𝑇𝑖 < 4) = 𝑃 (𝑍 <) = 𝑃(𝑍 < −0.71) = 0.2389
√2
b) Al ser el tiempo para cada viajero variables normales independientes se tiene que el tiempo 𝑇 que se tarda en
atender 20 viajeros verifica que
𝑇 = 𝑇1 + 𝑇2 + ⋯ + 𝑇20
⇒ 𝐸(𝑇) = 𝐸(𝑇1 + 𝑇2 + ⋯ + 𝑇20 ) = 20×5 = 100
Asimismo, al ser los tiempos 𝑇𝑖 independientes:
𝑉𝑎𝑟(𝑇) = 𝑉𝑎𝑟(𝑇1 + 𝑇2 + ⋯ + 𝑇20 ) = 20×𝑉𝑎𝑟(𝑇𝑖 ) = 40
⇒ 𝑇 ∼ 𝑁(100; 40)(1.5𝑝)
60 − 100
⇒ 𝑃(𝑇 < 60) = 𝑃 (𝑍 < ) = 𝑃(𝑍 < −6.32) ≈ 0. (0.5𝑝)
√40
c) Como no estamos seguros de que los parámetros poblacionales se mantienen, basaremos los contrastes en las
estimaciones disponibles.
(Si tuviésemos la seguridad de que la varianza poblacional no ha cambiado, deberíamos usar el estadístico
𝑋̅ − 𝜇
𝑧0 = 𝜎
⁄ 𝑛
√
y la distribución de referencia sería entonces la N(0,1) y no 𝑡𝑛−1 , aunque la muestra sea pequeña. Con muestras pequeñas
no es correcto usar la N(0,1) para el estadístico 𝑡0 . Si la muestra procede de una normal, la distribución 𝑡𝑛−1 es siempre la
adecuada para 𝑡0 para cualquier tamaño muestral)
Se trata de un contraste a dos colas, por lo que rechazamos la hipótesis nula si |𝑡0 | > 𝑡24;0.025 = 2.064. (0.25p)
Como |𝑡0 | = 2.635 > 2.064 nos encontramos en la región de rechazo.
Rechazamos, con 𝛼 = 0.05, la hipótesis nula de que la media no ha variado. Los datos muestran suficiente
evidencia del cambio en la media. La diferencia encontrada entre 𝑥̅ = 4.5 y 𝜇 = 5 es significativa, y es muy
improbable que se deba al azar del muestreo. (0.5p)
d) Si la población de la que procede nuestra muestra no es normal no sabríamos realizar estos contrastes con lo
que se ha cubierto en la asignatura.
Al ser el tamaño muestral pequeño, la distribución del estadístico 𝑡0 usado en el contraste de medias depende
de cómo es la población, no se puede utilizar la aproximación a la normal estándar, y la distribución 𝑡𝑛−1 ya no
es aplicable. En el caso del estadístico 𝑋02 sólo se ha estudiado en este curso su distribución bajo normalidad de
2
la población, y que resulta ser una 𝜒𝑛−1 .
3. Un estudiante del curso de Estadística realiza una pasantía en el área Logística de una importante empresa de
servicios. Por sus conocimientos en la materia, decide analizar la calidad de un producto que la empresa
adquiere como insumo a un proveedor local. Para ello, toma una muestra de 1500 cajas, donde cada una de
las cuales contiene 7 artículos, y contabiliza cuántos artículos defectuosos hay en cada caja. De dicha muestra
obtiene los siguientes datos:
Número de artículos
Número de cajas
defectuosos
0 11
1 139
2 300
3 448
4 355
5 189
6 48
7 10
El estudiante considera que el número de artículos defectuosos en cada paquete sigue una distribución
binomial. Con base en los datos de la tabla, ¿es acertada esta afirmación? Justifica la respuesta.(4p)
SOLUCIÓN:
Se pide realizar una prueba de bondad de ajuste a la binomial. Se tiene una muestra de 1500 lotes, cada uno
conteniendo 7 artículos.
3.204
𝜇̂ = 𝑛𝑝̂ → 𝑝̂ = = 0.4577 (1𝑝)
7
Si se tiene una estimación incorrecta de p, se pierde también el punto del cálculo de la columna p(x).
Factor (0.25 p)
x Oi p(x) (1 p) Ei (0.5 p) (𝑶𝒊 − 𝑬𝒊 )𝟐 𝜒2
𝑬𝒊
0 11 0.0138 20.69 4.54 10.48
1 139 0.0815 122.22 2.30
2 300 0.2063 309.49 0.29
3 448 0.2902 435.37 0.37
4 355 0.2450 367.47 0.42
5 189 0.1241 186.10 0.05
6 48 0.0349 52.36 0.36
7 10 0.0042 6.31 2.15
Finalmente, como 𝜒 2 es menor que 10.48, se acepta la hipótesis nula, es decir que los datos se distribuyen como
una binomial B (7, 0.4577). (0.5 p)
4. (4p) La distribución de la figura pertenece a una familia de distribuciones
denominada de Pareto. Se suele utilizar en economía para modelizar la
renta de una población donde hay una renta mínima. Su función de
densidad es
𝛼
𝑓(𝑥) = 𝛼+1 , 𝑥 ≥ 1.
𝑥
Se tiene una muestra de esta distribución: (1.24, 1.36, 1.30, 1.53, 1.63,
1.94). A partir de esta muestra estima el parámetro 𝛼 utilizando el método
de los momentos y calcula la probabilidad de que 𝑋 > 2. (4p)
SOLUCIÓN:
Nombre:___________________________________________________________________________
Sección:___________________
Sólo pueden utilizarse las tablas y formulario que se proporcionan. JUSTIFICA TODAS TUS RESPUESTAS. Utiliza 𝜶 = 𝟎. 𝟎𝟓.
DEBES ENTREGAR ESTA HOJA CON LA RESPUESTS DEL PROBLEMA 1
Para solicitar los reclamos para el examen final, es necesario anexar la solución impresa,
señalando en ella aquellos puntos en los que se realiza el reclamo. Todo reclamo debe estar
correctamente fundamentado en relación a este solucionario
1. Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una muestra aleatoria simple de una población 𝑋 de media 𝜇0 y varianza 𝜎02 , y cuya media
muestral es 𝑋̅0 y la cuasivarianza 𝑆̂02 . Responde si las siguientes afirmaciones son verdaderas (V) o falsas (F).
CONTESTA SÓLO EN LA TABLA SIGUIENTE. No necesitas justificar. Respuesta correcta +1, incorrecta -1.
Máxima puntuación para esta pregunta: 7 puntos.
1.2
Si queremos contrastar si la media poblacional ha aumentado usaremos 𝐻0 : 𝜇 ≥ 𝜇0 frente a F
𝐻1 : 𝜇 < 𝜇0 .
1.4
Si queremos contrastar que la media poblacional no ha cambiado usaremos 𝐻0 : 𝜇 = 𝜇0 frente a V
𝐻1 : 𝜇 ≠ 𝜇0 .
Si 𝜎02 = 1, necesitaremos más de 384 datos para estimar un intervalo de confianza para 𝜇0 con V
1.6
un margen de error de 0.1.
1.8 ̅ − 𝜇0 )⁄𝜎0
Si 𝑋 ∼ 𝑁(𝜇0 ; 𝜎02 ) entonces (𝑋 ∼ 𝑁(0,1). F
1.10
Sea 𝑝 el pvalor del contraste con 𝐻0 : 𝜇 ≥ 𝜇0 obtenido a partir de la información de una muestra. V
Entonces, el pvalor del contraste con 𝐻0 : 𝜇 ≤ 𝜇0 con la misma muestra será 1 − 𝑝.
SOLUCIÓN
1.4. Verdadero.
1.5. Falso, será también normal, al ser una combinación lineal de los elementos de la muestra, que serán
normales idénticas a 𝑋.
1.7. Verdadero
𝑋1 + 𝑋𝑛 𝐸(𝑋1 ) + 𝐸(𝑋2 ) 𝜇0 + 𝜇0
𝐸( )= = = 𝜇0
2 2 2
1.10. Verdadero. La región de rechazo con 𝐻0 : 𝜇 ≥ 𝜇0 , 𝐻1 : 𝜇 < 𝜇0 , está en la cola de la izquierda, por lo que el pvalor
será el área a la izquierda del estadístico de contraste. Por otra parte, con 𝐻0 : 𝜇 ≤ 𝜇0 , 𝐻1 : 𝜇 > 𝜇0 , está a la derecha,
y el pvalor será el área a la derecha del estadístico de contraste.
2. Se han utilizado dos tipos de anzuelo para la pesca de peces en un lago. El anzuelo tipo
1 tiene un señuelo de vinilo que imita a un pequeño pez (ver figura). El anzuelo tipo 2
utiliza un señuelo orgánico consistente en una bola de masilla a base de maíz y harina
de pescado. Durante 10 días se probaron ambos tipos de anzuelo en cierto intervalo
horario (de 8 a 11 am). Para ello, se utilizaron dos cañas de forma simultánea, cada
una con un tipo de anzuelo, y situadas a una distancia de 5 metros una de la otra. De
esta forma, las diferencias en el número de capturas con una u otra caña se atribuirán
al tipo de anzuelo. La siguiente tabla muestra el número de capturas diarias que se consiguieron con cada tipo de
anzuelo. Se considera que constituyen una muestra aleatoria de sus respectivas poblaciones. Dada la forma en que
se han recogido, estos datos forman un conjunto de datos apareados o emparejados. Asumiremos que el número
de capturas diarias con cada tipo de anzuelo puede aproximarse a una normal.
Día
Anzuelo 1 2 3 4 5 6 7 8 9 10 ̅
𝒙 𝒔̂
Tipo 1 6 7 1 4 2 6 2 5 9 2 4.4 2.6
Tipo 2 7 8 3 5 3 8 6 7 9 1 5.7 2.6
Tabla 1: Capturas diarias de 8 a 11 am.
Se pide:
a) Construye un intervalo de confianza para el número medio de capturas diarias, en el intervalo horario de 8
a 11 am, con el anzuelo tipo 1. (2p)
b) Contrasta la hipótesis de que la varianza del número de peces que se pesca con el anzuelo del tipo 2 es
menor que 9. (2p)
c) Contrasta la hipótesis de que con el anzuelo tipo 2 se pescan, por término medio, más peces que con el
anzuelo del tipo 1. (2p)
SOLUCIÓN
a) Se desea construir un intervalo de confianza de una media poblacional, 𝜇1 , basado en la media muestral, 𝑥̅1 , de 10
observaciones. El tamaño muestral es muy pequeño, por lo que las propiedades estadísticas de 𝑥̅1 , en las que se
basa el intervalo, dependen de la distribución de la población. Como nos dicen que la población es normal, podemos
utilizar el intervalo de confianza basado en la t de Student, que es una distribución a la medida del tamaño muestral.
Por tanto
𝑠̂1 2.6
𝐼𝐶(0.95) 𝜇1 ∈ {𝑥̅1 ± 𝑡9;0.025 } = {4.4 ± 2.262 } = {4.4 ± 1.86} = (2.54 ; 6.26)
√𝑛 √10
• Como usamos la cuasidesviación típica 𝑠̂1 y la muestra es pequeña, no es correcto usar 𝑧0.025 .(−1p)
• El uso de la 𝑡𝑛−1 no es porque la muestra sea pequeña, sino porque la muestra procede de una normal. Si se usa 𝑡𝑛−1 pero
no se justifica por la normalidad de la población: −0.25
• El tamaño muestral no es el número total de peces capturados (ese es un error grave) sino el número de datos que se
promedian en la media muestral.
b) El contraste es (0.5p)
𝐻0 : 𝜎22 ≥ 9
𝐻1 : 𝜎22 < 9.
El estadístico de contraste es
(𝑛 − 1)𝑆̂22
𝑋02 = .
9
Con la información de la muestra se tiene
9 × 2.62
𝑥02 = = 6.76 (0.5p)
9
Al ser la población normal (0.25p), la distribución de referencia es la 𝜒92 . Como 𝐻1 : 𝜎22 < 9 La región de rechazo es
2
la cola de la izquierda, por lo que rechazaremos 𝐻0 si 𝑥02 < 𝜒9;0.95 = 3.33 (0.25p). Como 𝑥02 = 6.76 > 3.33 estamos
en la región de aceptación de la hipótesis nula. No hay evidencia entonces (con 𝛼 = 0.05 ) para concluir que la
varianza sea menor de 9.
c) Estamos ante datos emparejados o apareados, por lo que la manera correcta de comparar ambos tipos de anzuelo
es calculando la diferencia diaria entre ambos, y plantear el contraste con esta diferencia
Día
Anzuelo 1 2 3 4 5 6 7 8 9 10
Tipo 1 6 7 1 4 2 6 2 5 9 2
Tipo 2 7 8 3 5 3 8 6 7 9 1 ̅𝒅
𝒙 𝒔̂𝒅
𝑑=Tipo 1-Tipo 2 -1 -1 -2 -1 -1 -2 -4 -2 0 1 -1.3 1.34
Llamemos 𝑑 =diferencia entre el número de capturas del Tipo 1 y el Tipo 2, de media poblacional 𝜇𝑑 y desviación
típica poblacional 𝜎𝑑 . Si el anzuelo Tipo 2 es, por término medio, mejor se tendrá que 𝜇1 < 𝜇2 ⇒ 𝜇1 − 𝜇2 < 0 ⇒
𝜇𝑑 < 0. El contraste será entonces:
𝐻0 : 𝜇𝑑 ≥ 0
𝐻1 : 𝜇𝑑 < 0
De los datos de las diferencias entre ambas cañas en los 10 días se tiene que 𝑥̅ = 1.3 y
Hay, por tanto, suficiente evidencia para afirmar (con 𝛼 = 0.05) que el anzuelo Tipo 2 es más efectivo.
Si se ignora que los datos son emparejados y se hace un test de igualdad de medias como si fuesen muestras independientes,
estaríamos perdiendo información. Sería una solución incorrecta. El contraste sería menos sensible. No obstante, los alumnos que
hayan propuesto esta solución se les calificará con un máximo de 1 punto. El contraste sería
𝐻0 : 𝜇1 ≥ 𝜇2
𝐻1 : 𝜇1 < 𝜇2
Como las desviaciones típicas muestrales son iguales, no podremos descartar que las desviaciones típicas poblacionales son
iguales. El estadístico de contraste sería, por tanto,
𝑥̅1 − 𝑥̅2
𝑡0 =
1 1
𝑠̂ 𝑇 √ +
𝑛1 𝑛2
9×2.62 +9×2.62
donde 𝑠̂ 𝑇 = √ = 2.6. Queda entonces
18
−1.3
𝑡0 = = −1.12.
2
2.6√
10
Como las poblaciones son normales, la distribución de referencia es la 𝑡𝑛1+𝑛2−2 = 𝑡18 . La región de rechazo está en la cola de la
izquierda de esta distribución. Por tanto, rechazamos 𝐻0 si 𝑡0 << 𝑡18;0.95 = −1.734. Como 𝑡0 = −1.12 > −1.734 estamos en la
zona de aceptación. No hay evidencia suficiente para asegurar que el anzuelo 2 es mejor. En este caso no somos capaces de ver
las diferencias entre anzuelos. La razón es que las diferencias entre ambos tipos de anzuelo son menores que las diferencias entre
unos días y otros, de manera que si no analizamos la diferencias día a día (datos apareados), su efecto queda enmascarado con
la variabilidad muestral debido a los días.
3. Se tienen datos de una muestra de 𝑛 = 148 autos. Entre otras, se tienen las siguientes variables:
• ‘price’: precio, en dólares, del vehículo.
• ‘horsepower’: potencia del motor (caballos de vapor).
• ‘mpg’: millas recorridas por galón de combustible.
• ‘displace’: capacidad de los cilindros (pulgadas cúbicas).
• ‘weight’: peso del vehículo (libras).
Los autos son de origen americano (EEUU), europeo o japonés. El origen de los autos queda definido con las
siguientes variables binarias:
• ‘Origen_1’: toma valor 1 si el auto es de EEUU y 0 en caso contrario.
• ‘Origen_2’: toma valor 1 si el auto es europeo y 0 en caso contrario.
• ‘Origen_3’: toma valor 1 si el auto es japonés, y 0 en caso contrario.
Las siguientes figuras muestran el resultado de una regresión múltiple para explicar el precio de los autos.
Se pide:
a) ¿Qué puede deducirse de las dos gráficas de residuos que se muestran? Justifica brevemente la
respuesta.(1p)
b) ¿Qué variables son significativas para explicar el precio de un auto? Justifica la respuesta. (1p)
c) Interpreta los coeficientes de las variables horsepower, mpg, displace, y weight. (2p)
d) Interpreta los coeficientes de las variables Origen_1 y Origen_2. (2p)
e) Supongamos autos de EEUU con los siguientes valores: Horsepower=90; mpg=30; displace=150;
weight=2000. (1p)
o ¿Cuál es el precio medio de dichos autos?
o ¿Cuál es la varianza del precio de dichos autos?
o ¿Cuál es la probabilidad de que su precio sea superior a 5000 dólares?
SOLUCIÓN
a) El gráfico de la izquierda nos muestra que podemos asumir que los residuos proceden de una normal. No
solo están los puntos alineados en el gráfico probabilístico normal, sino que el test de normalidad tiene un
p-valor suficientemente alto. Según este test no podemos rechazar la hipótesis nula de normalidad. Esta
normalidad nos garantiza, entre otras cosas, que los p-valores de los tests de significatividad individual son
válidos.
El gráfico de la derecha, de residuos frente a valores previstos, no tiene ningún tipo de estructura evidente,
por lo que podemos asumir que el modelo lineal que plantea la regresión es correcto.
Puntuación:
o Gráfico de probabilidad normal: Normalidad de residuos: 0.50 pts.
o Gráfico de residuos vs. ajustes: Modelo de regresión correcto: 0.50 pts.
b) Utilizando sólo la información de este modelo, y usando un nivel de significación del 5%, todas las variables
menos Origen_2 son significativas. En ellas, el pvalor es inferior al 5%. Como se dijo antes, estos pvalores
son fiables si podemos asumir normalidad del termino de error del modelo de regresión.
Puntuación:
o Variables significativas: 0.50 pts.
o Justificación: 0.50 pts.
Puntuación:
o Aumento o disminución por cada unidad adicional: 0.50 pts.
o Se mantienen constantes los valores de las demás variables: 0.75 pts.
o El aumento del precio es por término medio: 0.75 pts.
d) Nos piden ahora interpretar los coeficientes de las variables binarias. Estas variables tienen que ver con el
origen de los autos. Son tres orígenes, pero sólo hay dos variables binarias: la del origen 1 (EEUU) y la 2
(Europa). Se ha omitido la de origen 3 (Japón). Por tanto, los coeficientes miden la diferencia respecto el
precio medio de un auto de origen japonés.
• Origen_1. Esta variable es significativa. Para unas mismas características (potencia, consumo, peso,
cilindrada), los autos de EEUU tienen un precio de 680 dólares menos, por término medio, que los
japoneses.
• Origen_2. Esta variable no es significativa, pues su pvalor es mucho mayor que el 5%. Esta variable
no es relevante para explicar el precio. Por tanto, para autos con las mismas características, los autos
europeos cuestan lo mismo que los japoneses, por término medio.
Puntuación:
o Aumento o disminución por cada unidad adicional: 0.25 pts.
o Se mantienen constantes los valores de las demás variables: 0.50 pts.
o El aumento del precio es por término medio: 0.50 pts.
o Los coeficientes indican la diferencia respecto a los autos japoneses: 0.75 pts.
e) Para ese auto, el precio medio condicionado a los valores de las variables que se indican es, aplicando la
ecuación de regresión:
Precio medio=2687.2.
Puntuación:
o Precio medio: 0.25 pts.
o Varianza: 0.25 pts.
o Probabilidad: 0.50 pts.
ESTADÍSTICA BÁSICA
SEMESTRE 2016-II
PARCIAL
JUEVES, 15 DE SEPTIEMBRE DE 2016
Nombre:___________________________________________________________________________
Sección:___________________
No se puede consultar ningún tipo de documentación salvo las tablas y formulario que se entrega con el examen.
1. Indique si las siguientes afirmaciones son verdaderas o falsas, justificando la respuesta: (5p)
a. Si tenemos un grupo de 140 datos, en los que el número 3 se repite 40 veces, el −3 se repite también 40
veces, y el 0 se repite 60 veces, entonces los cuartiles son −3, 0 y 3, respectivamente. (1p)
b. Si A y B son dos sucesos equiprobables entonces 𝑃(𝐴 | 𝐵) = 𝑃(𝐵 | 𝐴). (1p)
c. Sean (𝑥𝑖 , 𝑦𝑖 ), 𝑖 = 1, … , 𝑛 un conjunto de pares de puntos de dos variables, y sean (𝑥𝑖∗ , 𝑦𝑖∗ ) esos mismos
datos pero estandarizados. Entonces, la recta de regresión simple usando los datos estandarizados es
𝑦̂𝑖∗ = 𝜌𝑥𝑖∗ , donde 𝜌 es la correlación entre 𝑥 e 𝑦 . (1p)
d. Si a un puesto de servicio llegan clientes de forma independiente y a un ritmo medio de 10 clientes por
hora, la probabilidad de que en una hora lleguen justo 5 clientes es superior al 5%, y de que lleguen más
de 18 clientes en una hora es superior al 40%. (1p)
e. Si lanzamos un dado 5 veces, la probabilidad de sacar el nº 6 dos veces es 0.16. (1p)
SOLUCIÓN:
b. Verdadero. A y B son equiprobables, es decir, 𝑃(𝐴) = 𝑃(𝐵). Aplicando Bayes y que 𝑃(𝐴) = 𝑃(𝐵)
tenemos
𝑃(𝐵|𝐴)𝑃(𝐴) 𝑃(𝐵|𝐴)𝑃(𝐴)
𝑃(𝐴|𝐵) = = = 𝑃(𝐵|𝐴).
𝑃(𝐵) 𝑃(𝐴)
𝑐𝑜𝑣(𝑦 ∗ , 𝑥 ∗ )
𝛽̂1 = ,
(𝑠𝑥∗ )2
𝛽̂0 = 𝑦̅ ∗ − 𝛽̂1 𝑥̅ ∗ .
La estandarización de una variable consiste en restarle su media y dividirla por su desviación típica, es
decir,
𝑥 − 𝑥̅
𝑥∗ = ,
𝑠𝑥
𝑥̅ ∗ = 0; 𝑠𝑥∗ = 1.
.Al ser (𝑥 ∗ , 𝑦 ∗ ) variables estandarizadas, tendrán media 0 y varianza 1. Por tanto
𝛽̂1 = 𝑐𝑜𝑣(𝑦 ∗ , 𝑥 ∗ )
𝛽̂0 = 0
Por otra parte, tenemos que
𝑐𝑜𝑣(𝑦 ∗ , 𝑥 ∗ )
𝜌= = 𝑐𝑜𝑣(𝑦 ∗ , 𝑥 ∗ ).
𝑠𝑦∗ 𝑠𝑥∗
Queda por tanto que
𝑦̂ ∗ = 𝜌𝑥 ∗ .
d. Falso. De acuerdo a los datos que se proporcionan, el número de clientes a la hora que llega a un puesto
de servicio será una v.a. de Poisson de media 10, es decir:
𝑋 ∼ 𝑃𝑜𝑖(𝜆 = 10).
Por tanto
𝜆5 105 −10
𝑃(𝑋 = 5) = 𝑒 −𝜆 = 𝑒 = 0.0378 < 0.05.
5! 5!
Para calcular 𝑃(𝑋 > 25) utilizamos la aproximación a la normal, al ser 𝜆 > 5. Tenemos que 𝑋 ≈
𝑁(10,10). Para usar las tablas de la N(0,1) tenemos que estandarizar.
18 − 10
𝑃(𝑋 > 25) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 2.53) = 0.0057 < 0.40.
√10
e. Verdadero. Si definimos X=nº de seises que se obtienen al lanzar un dado cinco veces, donde en cada
lanzamiento la probabilidad es 1/6 se tiene que
1
𝑋 ∼ 𝐵 (5; )
6
Por tanto
5 1 2 1 3
𝑃(𝑋 = 2) = ( ) ( ) (1 − ) = 0.1608
2 6 6
2. El sistema que se muestra en la figura
está formado por 5 dispositivos, C1 a C5.
La duración (tiempo hasta que falle) del
primer componente sigue una
distribución exponencial de media 1000
horas. Los componentes C2 a C5 son
idénticos, y la duración de cada uno de
ellos sigue una variable normal de media
1500 y desviación típica 600. Los
dispositivos fallan de manera
independiente unos de otros. El sistema
funciona siempre que haya conexión
entre los puntos A y B.
a. Calcula, para cada componente, la probabilidad de que continúe funcionando después de
trascurridas 1000 horas desde que se conectó el sistema. (2p)
b. Calcula la probabilidad de que todo el sistema esté funcionado transcurridas 1000 horas. (2p)
Supongamos ahora que el sistema lleva ya 1000 horas de funcionamiento desde que se conectó.
c. Calcula, para cada componente, la probabilidad de que continúe funcionando otras 1000 horas
adicionales. (2p)
d. Calcula ahora la probabilidad de que todo el sistema esté funcionado otras 1000 horas
adicionales. (1p)
SOLUCIÓN:
a. Vamos a denominar 𝐶𝑖 =duración del componente i. De los datos que se proporcionan se tiene que
1
𝐶1 ∼ 𝐸𝑥𝑝 ( ) ; 𝐶𝑗 ∼ 𝑁(1500,6002 ), 𝑗 = 2, … ,5.
1000
1000
𝑃(𝐶1 > 1000) = 𝑒 −1000 = 𝑒 −1 = 0.3679.
1000 − 1500
𝑃(𝐶𝑗 > 1000) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > −0.83) = 1 − 0.2033 = 0.7967.
600
b. Vamos a definir el suceso 𝑆 =el sistema dura más de 1000 horas (es decir, 𝐶12345 > 1000), y 𝐷𝑖𝑗𝑘𝑙 =el
conjunto formado por los componentes Ci,CJ… dura más de 1000 horas.
Por otra parte, los componentes C2-C5 están en paralelo, por lo que fallarán antes de las 1000 horas sólo
si fallan todos los componentes antes de las 1000 horas. Tenemos entonces que
Por tanto
𝑃(𝑆) = (0.3679)(0.9983) = 0.3673.
c. La probabilidad de durar 1000 horas adicionales a las que ya se llevan consumidas es
𝑃(𝐶𝑖 > 2000 ∩ 𝐶𝑖 > 1000) 𝑃(𝐶𝑖 > 2000)
𝑃(𝐶𝑖 > 2000|𝐶𝑖 > 1000) = =
𝑃(𝐶𝑖 > 1000) 𝑃(𝐶𝑖 > 1000)
Para 𝑖 = 1:
2000
𝑃(𝐶1 > 2000) 𝑒 −1000
𝑃(𝐶1 > 2000|𝐶1 > 1000) = = 1000 = 𝑒 −1 = 0.3679.
𝑃(𝐶1 > 1000)
𝑒 − 1000
que es igual a 𝑃(𝐶1 > 1000) por la propiedad de ausencia de memoria de la exponencial. Este componente
no envejece. Para los otros componentes tenemos que
2000 − 1500
𝑃(𝐶𝑗 > 2000) 𝑃 (𝑍 > 600
)
𝑃(𝐶𝑗 > 2000|𝐶𝑗 > 1000) = =
𝑃(𝐶𝑗 > 1000) 𝑃 (𝑍 > 1000 − 1500)
600
La probabilidad del numerador se calcula igual que la del denominador, pero usando las probabilidades del
apartado c. Se tiene entonces que
𝑃(𝐶12345 > 2000) = 𝑃((𝐶1 > 2000) ∩ (𝐶2345 > 2000)) = 𝑃(𝐶1 > 2000)𝑃(𝐶2345 > 2000)
2000
𝑃(𝐶1 > 2000) = 𝑒 −1000 = 𝑒 −2 = 0.1353.
Por tanto
que es inferior a 𝑃(𝐶12345 > 1000), por lo que este sistema envejece.
3. La academia CES ofrece un curso de preparación para superar el examen de admisión de una universidad. Esta
prueba de admisión es finalmente superada por el 40% de los estudiantes presentados. Se ha podido averiguar
que el 15% de los alumnos presentados se preparó en la academia CES. Esta academia realiza un análisis sobre el
desempeño de sus estudiantes, y concluye con orgullo que el 90% de sus estudiantes había superado el examen
de admisión.
a. ¿Cuál es el porcentaje de aprobados entre los estudiantes que no se prepararon en la academia CES? (1p)
b. ¿Qué proporción de los alumnos admitidos se prepararon en la academia CES? (1p)
SOLUCIÓN:
Los datos nos dicen que 𝑃(𝐴|𝐶) = 0.9 ⇒ 𝑃(𝐴̅|𝐶) = 0.1. Nos preguntan por 𝑃(𝐴|𝐶̅ ). Usando la regla de la
probabilidad total se tiene que
𝑃(𝐴) = 𝑃(𝐴|𝐶)𝑃(𝐶) + 𝑃(𝐴|𝐶̅ )𝑃(𝐶̅ )
SOLUCIÓN
1.9
3 3 2
𝑃(artículo aceptable) = 𝑃(−1.7 < 𝑋 < 1.9) = ∫ + 𝑥 𝑑𝑥 = 0.806
−1.7 28 28
⇒ 𝑃(artículo defectuoso) = 1 − 0.806 = 0.194.
d. Nos piden la probabilidad de que un artículo defectuoso lo sea por ser demasiado grande, es decir,
e. Sea Y=nº de artículos defectuosos en un lote de 𝑛 = 10, donde cada uno tiene una probabilidad de ser
defectuosos de 𝑝 = 0.194. Entonces
𝑌 ∼ 𝐵(10,0.194)
Por tanto
𝑃(𝑌 > 1) = 1 − 𝑃(𝑌 ≤ 1) = 1 − 𝑃(𝑌 = 0) − 𝑃(𝑌 = 1)
10 10
= 1 − ( ) 0.1940 (1 − 0.194)10 − ( ) 0.1941 (1 − 0.194)9
0 1
= 1 − (1 − 0.194)10 − 10×0.1941 (1 − 0.194)9 = 0.6058
f. La nueva longitud será 𝑅 = 𝑋 − 0.1. La nueva proporción de artículos defectuosos será entonces
𝑃(defectuoso) = 𝑃(𝑅 > 1.9) + 𝑃(𝑅 < −1.7) = 𝑃(𝑋 − 0.1 > 1.9) + 𝑃(𝑋 − 0.1 < −1.7)
= 𝑃(𝑋 > 2) + 𝑃(𝑋 < −1.6)
−1.6
3 3 2
=0+∫ + 𝑥 𝑑𝑥 = 0.182 < 0.194
−2 28 28
Por tanto, se reduce la proporción de artículos defectuosos. Se mejora.
ESTADÍSTICA BÁSICA
SEMESTRE 2016-II
PRÁCTICA 5
JUEVES, 3 DE NOVIEMBRE DE 2016
Nombre:___________________________________________________________________________
Sección:___________________
Sólo pueden utilizarse las tablas y formulario que se proporcionan. JUSTIFICA TODAS TUS RESPUESTAS. Utiliza 𝜶 = 𝟎. 𝟎𝟓.
1. En un estudio sobre accidentabilidad en carretera en los últimos años se concluye que, a nivel nacional, se
produce una media de 6.03 accidentes de tránsito en carretera al día.
a) Se tienen datos de los primeros 100 días del año 2016, y en ellos se ha producido una media de 6.5
accidentes por día, con una cuasi-desviación típica de 3.2. ¿Hay evidencia de que haya aumentado la
accidentabilidad? (3p)
b) En los últimos 15 días se ha producido una media de 5 accidentes de tránsito al día, con una cuasi-
desviación típica de 2.8. Asumiendo que el número de accidentes al día se distribuye como una normal,
¿hay ahora evidencia de que esté disminuyendo la siniestralidad? (3p)
c) Utilizando únicamente la información del apartado (b), calcula un intervalo de confianza para la varianza
del número de accidentes de tránsito en carretera al día. (2p)
SOLUCIÓN:
a) La variable aleatoria (la población) de interés es 𝑋 = número de accidentes al día. Según el enunciado, la
accidentabilidad se mide con el número medio de accidentes al día, es decir con 𝜇 = 𝐸(𝑋). En los últimos
años se tiene que esta media es 𝜇 = 6.03 accidentes/día. La cuestión que nos planteamos sobre la
población es si esta media ha aumentado a la vista de los datos de los últimos 100 días (𝜇𝐴 > 6.03) o no ha
aumentado (𝜇 ≤ 6.03, o simplemente que no ha variado, 𝜇 = 6.03). Se puede resolver con un contraste de
hipótesis.
Se asumirá que 𝐻0 es cierta salvo que los datos muestren mucha evidencia en contra, es decir, si 𝑥̅ ≫ 6.03.
En nuestro caso 𝑥̅ = 6.5 > 6.03 por lo que tenemos que valorar si esa distancia eso lo suficientemente
grande para rechazar 𝐻0 . Esta tarea se realiza con el estadístico de contraste y su distribución de referencia.
El estadístico de contraste es
𝑥̅ − 6.03
𝑡0 = .
𝑠̂ /√𝑛
Con los datos de la muestra se tiene:
6.5 − 6.03
𝑡0 = = 1.47 (0.5p)
3.2
√100
La región de rechazo se encuentra en la cola de la derecha. El valor crítico es 𝑧0.05 = 1.65. (0.5p)
Como 𝑡0 < 𝑧0.05 los datos se encuentran en la región de aceptación. Por tanto, no hay evidencia suficiente,
con 𝛼 = 0.05, para rechazar 𝐻0 . Los datos no muestran evidencia para pensar que la accidentabilidad haya
aumentado. La diferencia observada entre la media poblacional hipotética 𝜇 = 6.03 y la muestral 𝑥̅ = 6.5
no es estadísticamente significativa, y puede explicarse por el azar del muestreo. (0.5p)
b) En esta ocasión se plantea si la accidentabilidad se ha reducido (𝜇 < 6.03) o no (𝜇 ≥ 6.03 o 𝜇 = 6.03). El
contraste será (1p)
𝐻0 : 𝜇 ≥ 6.03 (o 𝜇 = 6.03)
𝐻1 : 𝜇 < 6.03
Asumiremos que 𝐻0 es cierta salvo que los datos muestren mucha evidencia en contra; es decir, si 𝑥̅ ≪ 6.03.
En este caso 𝑥̅ = 5 < 6.03, por lo que tenemos que valorar si esa diferencia es suficientemente grande
(significativa estadísticamente).
El estadístico de contraste es
𝑥̅ − 6.03
𝑡0 = .
𝑠̂ /√𝑛
Con los datos de la muestra se tiene:
5−6.03
𝑡0 = 2.8 = −1.42.(0.5p)
√15
La muestra es pequeña, por lo que la distribución de 𝑡0 depende de cómo se distribuya 𝑋. En este caso nos
aseguran que es una normal. Por consiguiente, la distribución de referencia es 𝑡𝑛−1 = 𝑡14 . (0.5p)
La región de rechazo se encuentra en la cola de la izquierda. El valor crítico es −𝑡14;0.05 = −1.761. (0.5p)
Como 𝑡0 > −𝑡14;0.05 los datos se encuentran en la región de aceptación. Por tanto, no hay evidencia
suficiente, con 𝛼 = 0.05, para rechazar 𝐻0 . Los datos no muestran suficiente evidencia para pensar que la
accidentabilidad haya disminuido. Con 𝛼 = 0.05, la diferencia observada entre la media poblacional
hipotética 𝜇 = 6.03 y la muestral 𝑥̅ = 5 puede explicarse por el azar del muestreo, no es estadísticamente
significativa. (0.5p)
SOLUCIÓN:
a) Sea 𝑝 = proporción de varones que compran un producto en esa tienda, de entre los varones que han
ingresado en ella. Con la muestra de 𝑛 = 200 se estima que
10
𝑝̂ = = 0.05.
200
Como se verifica que 𝑛𝑝̂ (1 − 𝑝̂ ) = 200×0.05×0.95 = 9.5 > 5 podemos aplicar el Teorema del Límite
Central, y considerar que el estimador 𝑝̂ sigue una distribución normal. (1p)
𝑝̂ (1 − 𝑝̂ )
𝐼𝐶 (1 − 𝛼): 𝑝 ∈ {𝑝̂ ± 𝑧𝛼⁄2 √ }.
𝑛
0.05 ×0.95
𝐼𝐶 (0.95): 𝑝 ∈ {0.05 ± 1.96 √ } = [0.0198 ; 0.0802].(2p)
200
b) El experto dice que en ese tipo de tiendas se verifica que 𝑝 = 0.1. Ese valor no se encuentra dentro del
intervalo de confianza obtenido en el apartado anterior, por lo que los datos que se poseen no lo respaldan.
Se puede rechazar, con un nivel de significación de 𝛼 = 0.05, que 𝑝 = 0.10. (2p)
c) Dado que podemos aplicar el Teorema del Límite Central, (0.5p) el cálculo del tamaño muestral 𝑛 necesario
para tener un margen de error 𝐿 con un nivel de confianza (1 − 𝛼) en la estimación de 𝑝 es
2
𝑧𝛼⁄2 √𝑝(1 − 𝑝)
𝑛=( )
𝐿
Como 𝑝 no es conocido, tenemos varias opciones para solventarlo (con hacer una opción es suficiente
(1.5p)). Por una parte, podemos ponernos en el caso más desfavorable, en el que 𝑝 = 𝑞 = 0.5, donde 𝑞 =
1 − 𝑝. Entonces, el cálculo es
2
1.96√0.5×0.5
𝑛=( ) = 9604,
0.01
que es un tamaño muestral considerable. Una segunda opción es basarnos en una estimación previa de 𝑝 a
partir de la muestra del apartado (a). En ese caso reemplazamos 𝑝 por 𝑝̂ = 0.05 y tenemos
2
1.96√0.05×0.95
𝑛=( ) ≈ 1825,
0.01
que proporciona un tamaño muestral sensiblemente inferior.
Otra opción, sería confiar en el experto mencionado en la sección (b) (a pesar de que los datos desmientan,
con un nivel de significación del 5%, que sea aplicable a nuestra tienda), y usar que 𝑝 = 0.1, quedando los
cálculos:
2
1.96√0.10×0.90
𝑛=( ) ≈ 3458,
0.01
3. La panela es un tipo de azúcar que se obtiene al evaporar el jugo de la caña de azúcar. Para su producción se
emplea un horno especialmente diseñado para poder mantener una temperatura alta y estable. Sólo de esta
forma se consigue transformar el jugo en miel, que posteriormente se cristaliza y forma la panela. Con el fin de
mejorar el rendimiento de un horno, se han llevado a cabo un conjunto de reparaciones y modificaciones. El
objetivo es que el proceso mejorado alcance una mayor temperatura media con una menor varianza. Para poder
evaluar estas mejoras se han tomado datos del proceso antes y después de la implantación de las mejoras.
Durante los días previos a la implantación de las mejoras, se registró la temperatura del proceso en diferentes
momentos, obteniéndose una muestra de 46 observaciones de temperatura (Muestra 1). Tras la implantación de
las mejoras, se volvió a tomar otra muestra (Muestra 2) de las temperaturas del proceso, en este caso 32
observaciones. La tabla siguiente muestra el resumen estadístico de estas dos muestras de temperaturas.
Se pide:
a) Realiza un contraste de hipótesis que permita contrastar si tras las mejoras la temperatura media del
proceso es mayor. Razona tu respuesta (no asumas que las varianzas son iguales, pues ha podido disminuir
tras las mejoras). (3p)
b) Calcula el p-valor del contraste e interprétalo. (2p)
SOLUCIÓN:
a) Llamemos 𝑋𝐴 = temperatura del proceso antes de las mejoras, cuyos parámetros serán 𝜇𝐴 = 𝐸(𝑋𝐴 ); 𝜎𝐴2 =
𝑉𝑎𝑟(𝑋𝐴 ). Asimismo, llamemos 𝑋𝐷 = temperatura del proceso después de las mejoras, cuyos parámetros
serán 𝜇𝐷 = 𝐸(𝑋𝐷 ); 𝜎𝐷2 = 𝑉𝑎𝑟(𝑋𝐷 ). 𝑋𝐴 y 𝑋𝐷 son variables aleatorias que, si las modificaciones realmente
mejoran el proceso, cumplirán que 𝜇𝐴 < 𝜇𝐷 ; 𝜎𝐴2 > 𝜎𝐷2 .
Vamos a contrastar, usando la información de las dos muestras independientes, si la temperatura media ha
aumentado (𝜇𝐴 < 𝜇𝐷 ) o no (𝜇𝐴 ≥ 𝜇𝐷 o 𝜇𝐴 = 𝜇𝐷 ). Las hipótesis de este contraste son (1p)
𝐻0 : 𝜇𝐴 ≥ 𝜇𝐷 𝑜 𝜇𝐴 = 𝜇𝐷
𝐻1 : 𝜇𝐴 < 𝜇𝐷 .
Mantendremos 𝐻0 como cierta salvo que los datos mucha evidencia en contra; es decir, sólo rechazaremos
la hipótesis nula si 𝑥̅𝐴 ≪ 𝑥̅𝐵 .
Como no hay garantía de que la varianza sea la misma antes y después de la mejora (es más, se espera que
haya disminuido), debemos emplear un estadístico de contraste que utilice varianzas diferentes. El
estadístico de contraste es
𝑥̅𝐴 − 𝑥̅𝐵
𝑡0 =
𝑠̂ 2 𝑠̂ 2
√ 𝐴+ 𝐵
𝑛𝐴 𝑛𝐵
que con los datos disponibles resulta
93 − 97
𝑡0 = = −2.80.(0.5p)
81
√ + 9
46 32
Como el tamaño muestral es suficientemente grande, la distribución de referencia será la 𝑁(0,1). (0.5p)
La región de rechazo estará en la cola de la izquierda. Para 𝛼 = 0.05 el valor crítico es −1.65. (0.5p)
Como 𝑡0 < −1.65 , los datos se encuentran en la región de rechazo. Por tanto, hay evidencia suficiente (con
𝛼 = 0.05) para rechazar la hipótesis nula y concluir que la mejora ha permitido aumentar la temperatura
media del proceso. La diferencia entre las medias antes y después de la mejora es estadísticamente
significativa. (0.5p)
b) El p-valor es el área que tendría la región de rechazo si el valor crítico fuese −2.80. Es decir
p-valor = 𝑃(𝑧 < −2.80) = 0.0026
Como es inferior a 𝛼 nos encontramos en la región de rechazo. Es muy pequeño, por lo que hay mucha
evidencia a favor de la hipótesis alternativa.
ESTADÍSTICA BÁSICA
SEMESTRE 2016-II
PRÁCTICA 4
JUEVES, 20 DE OCTUBRE DE 2016
Nombre:___________________________________________________________________________
Sección:___________________
Sólo pueden utilizarse las tablas y formulario que se proporcionan. JUSTIFICA TODAS TUS RESPUESTAS.
1. Sea 𝑋 una variable aleatoria de cuya distribución sólo conocemos que tiene media 𝜇 = 10 y desviación típica
𝜎 = 2, y de la que tomamos una muestra aleatoria simple de tamaño 𝑛 = 100. Indique si las siguientes
afirmaciones son verdaderas o falsas, justificando la respuesta: (6p)
a. Habrá un 50% de probabilidad de que la media muestral 𝑋̅ que se obtenga con esa muestra sea
mayor que 10. (2p)
b. Habrá un 50 % de probabilidad de que la media muestral 𝑋̅ que se obtenga con esa muestra se
encuentre entre 9.87 y 10.14. (2p)
c. Para asegurarnos de que 𝜇 se encuentre en el intervalo 𝑋̅ ± 0.1 con un 95% de confianza,
deberíamos tomar más de 1500 datos. (2p)
SOLUCIÓN:
a. VERDADERO. La media muestral es un estimador de 𝜇 que tiene las siguientes propiedades, para cualquier
tamaño de muestra, e independientemente de cómo sea la población de la que se extrae:
𝐸(𝑋̅) = 𝜇 ; 𝑉𝑎𝑟(𝑋̅ ) = 𝜎 2 /𝑛
Además, con 𝑛 = 100 el tamaño muestral es suficientemente grande para poder considerar que 𝑋̅ es
normal. Por tanto:
𝜎2
𝑋̅ ∼ 𝑁 (𝜇, ) = 𝑁(10 , 0.04) .
𝑛
Al ser la normal una distribución continua y simétrica se tiene que 𝑃(𝑋̅ > 𝜇) = 0.5.
b. VERDADERO. Como
𝑋̅ ∼ 𝑁(10 , 0.04)
se tiene que
9.87 − 10 10.14 − 10
𝑃(9.87 < 𝑋̅ < 10.14) = 𝑃 ( <𝑍< )
0.2 0.2
= 𝑃(−0.65 < 𝑍 < 0.70) = 𝑃(𝑍 < 0.70) − 𝑃(𝑍 < −0.65) = 0.758 − 0.258 = 0.5.
(Nota: aquí puede haber una variedad de respuestas dependiendo de cómo redondeen. No tomar en
cuenta esas diferencias)
c. VERDADERO. Si queremos que el margen de error del intervalo de confianza del 95% sea 𝐿 = 0.1
necesitamos que
𝑧0.025 𝜎 2 1.96×2 2
𝑛=( ) =( ) ≈ 1537 > 1500.
𝐿 0.1
2. Sea 𝑋 la holgura que queda entre cierto cilindro y su pistón tras su
ensamble (ver figura). Esta holgura es una variable aleatoria distribuida
según una distribución uniforme continua en el intervalo [0; 𝑏]. Se ha
medido la holgura de 5 ensambles, obteniéndose los valores, en mm, de
0.2, 0.3, 0.4, 0.5, 0.6, respectivamente. Se pide, justificado la respuesta (7p)
SOLUCIÓN:
SOLUCIÓN:
a. El tamaño muestras es suficientemente grande para considerar que 𝑥̅ sigue una normal. En ese caso, el
intervalo será
𝑠̂ 0.04488
𝐼𝐶(95%): 𝜇 ∈ {𝑥̅ ± 𝑧𝛼⁄2 } = {0.98379 ± 1.96 }
√𝑛 √50
= 0.98379 ± 0.01244
= (0.971; 0.996)
b. Asumiendo igualmente que el tamaño muestras será >30, el tamaño muestral se calcula con la siguiente
expresión, válida para muestras grandes.
1.96×0.04488 2
𝑛=( ) = 309.5 ≈ 310,
0.005
c. El intervalo es más estrecho que el del 95%; por tanto, habrá menos seguridad de que vaya a contener al
valor verdadero. Por tanto, tendrá un menor nivel de confianza.
𝛼
𝑧𝛼⁄2 = 1.6543 ⇒ = 0.05 ⇒ 𝛼 = 0.10.
2
Nombre:___________________________________________________________________________
Sección:___________________
Sólo puede consultarse el formulario y las tablas que se adjuntan. Utiliza 𝜶 = 𝟎. 𝟎𝟓 salvo que se indique lo contrario.
Justifica todas tus respuestas.
1. A partir de las siguientes figuras, señala la correspondencia entre cada histograma y los box-plots, justificando tu
respuesta.
SOLUCIÓN:
1-A: El histograma 1 es asimétrico negativo, con la cola de la distribución apuntando hacia los valores bajos del eje
X. Eso mismo se aprecia en el box-plot A, donde el bigote del primer cuartil es más largo
3-C: En este caso la asimetría es positiva, y la cola de la distribución está a la derecha, apuntando a +∞. Le
corresponde el box-plot C, que muestra también esa asimetría.
2-B y 4-D: el histograma 2 muestras una gran varianza, debido a la bimodalidad, por eso le corresponde el box-plot
D, donde el rango intercuartílico es mayor. E histograma 4 es el más simétrico, y al ser unimodal tiene menos
varianza que el 4. Por eso le corresponde el box-plot B
2. Un laboratorio ha desarrollado un nuevo test para detectar un virus del que se estima se ha contagiado el 1% de la
población. Esta detección es importante, pues ese virus puede facilitar el desarrollo de ciertas enfermedades. Este
test no es infalible, pues se estima que el 20% de las personas que portan el virus no son detectadas por el nuevo
test. Por el contrario, en las personas sanas, el test puede dar positivo (positivo=el test dice que tiene el virus) con
una probabilidad de 0.001.
a. ¿Cuál es la probabilidad de que una persona que tiene el virus dé positivo en el test?
b. ¿Cuál es la probabilidad de que el test dé positivo en una persona seleccionada al azar?
c. ¿Cuál es la probabilidad de que tenga el virus una persona que ha dado positivo en el test?
d. ¿Cuál es la probabilidad de que una persona que ha dado positivo en el test no tenga el virus?
SOLUCIÓN
Definimos los siguientes sucesos:
V: una persona tiene el virus
p: el test detecta el virus (resultado positivo)
d. Nos piden 𝑃(𝑉̅ |𝑝), que es justo el complementario del resultado anterior:
𝑃(𝑉̅ |𝑝) = 1 − 𝑃(𝑉|𝑝) = 1 − 0.889 = 0.111
Nombre:___________________________________________________________________________
Sección:___________________
Sólo puede consultarse el formulario y las tablas que se adjuntan. Utiliza 𝜶 = 𝟎. 𝟎𝟓 salvo que se indique lo contrario.
Justifica todas tus respuestas.
1. Se sabe que la probabilidad de que un alumno desapruebe un examen es del 25%, la probabilidad de que un
alumno estudie para dicho examen es del 90%, y de que un alumno estudie y apruebe es de 85%.
a) ¿Es independiente el hecho de que un alumno estudie con su aprobación? Fundamente su respuesta
analíticamente. (1 p)
b) Calcule la probabilidad de que un alumno apruebe el examen o estudie para dicho examen. (1 p)
SOLUCIÓN
• 𝐴: Aprobar el examen.
• 𝐸: Estudiar para el examen
𝑃(𝐴̅) = 0.25
𝑃(𝐴) = 0.75
𝑃(𝐸) = 0.90
𝑃(𝐴 ∩ 𝐸) = 0.85
Se tiene que 𝑃(𝐴)𝑃(𝐵) = 0.75 × 0.90 ≠ 0.85, por lo que no se cumple dicha condición, se puede afirmar que
ambos sucesos no son independientes. (1 p)
𝑷(𝑨 ∪ 𝑬) = 𝟎. 𝟖𝟎 (1 p)
2. En un parque temático, se han clasificado a los clientes, en relación con el consumo (en dólares) que realizan en
el parque, en dos categorías: A y B. El consumo de los clientes tipo A es una variable aleatoria con la siguiente
función de densidad:
𝑘𝑥 ; 0 ≤ 𝑥 ≤ 50
𝑓(𝑥) 200 − 𝑥
; 50 < 𝑥 ≤ 200
15000
El consumo de los clientes tipo B es una variable exponencial de media $40. Además, se sabe que, de los
clientes que llegan al parque, el 60% es del tipo A y el 40% es del tipo B.
1
a) Demuestre que 𝑘 tiene un valor de . Utilice este valor para sus cálculos posteriores. (0.5 p)
5000
b) Calcule los cuartiles de la distribución del consumo de los clientes del tipo B. (1 p)
c) Calcule la probabilidad de que un cliente tipo A consuma menos de $60 en el parque temático. (1 p)
d) Calcule la probabilidad de que, sabiendo que un cliente tipo B está dispuesto a gastar como máximo $60,
gaste más de $20 en el parque temático. (1.5 p)
e) Calcule la probabilidad de que un cliente cualquiera consuma menos de $60 en el parque temático. (2 p)
f) Si en un día determinado llegan 120 clientes del tipo A, ¿cuál es la probabilidad de que más de la mitad de
dichos clientes consuma menos de $60 en el parque temático? (2 p)
SOLUCIÓN
∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞
50 200
200 − 𝑥
∫ 𝑘𝑥 𝑑𝑥 + ∫ 𝑑𝑥 = 1
15000
0 50
50
∫ 𝑘𝑥 𝑑𝑥 + 0.75 = 1
0
50
∫ 𝑘𝑥 𝑑𝑥 = 0.25
0
𝑘(502 ) 𝑘(02 )
− =1
2 2
1
𝑘= (0.5 p)
5000
b) El gasto de los clientes tipo B se distribuye como una exponencial de media 40:
1
𝜇 = 40 =
λ
1
λ= (0.25 p)
40
1
Sea B el gasto de un cliente del tipo B: 𝐵~𝐸𝑥𝑝 ( )
40
𝑄1
− = ln(0.75)
40
𝑄1 = 11.51 (0.25 p)
𝑄2
− = ln(0.50)
40
𝑄2 = 27.73 (0.25 p)
𝑄3
− = ln(0.25)
40
𝑄3 = 55.45 (0.25 p)
50 𝑥 200 200−𝑥
𝑃(𝐴 < 60) = ∫0 𝑑𝑥 + ∫50 𝑑𝑥 = 0.25 + 0.0967 = 𝟎. 𝟑𝟒𝟔𝟕 (1 p)
5000 15000
e) Sea 𝐺 el gasto de un cliente cualquiera, sea 60% la probabilidad de que sea del tipo A, y 40% la probabilidad de
que sea del tipo B:
𝑃(𝐺 < 60) = 𝑃(𝐺 < 60 | 𝑇𝑖𝑝𝑜 𝐴) × 𝑃(𝑇𝑖𝑝𝑜 𝐴) + 𝑃(𝐺 < 60 | 𝑇𝑖𝑝𝑜 𝐵) × 𝑃(𝑇𝑖𝑝𝑜 𝐵)
f) Sea 𝑋 el número de clientes del tipo A que gastan menos de $60 en un grupo de 120 clientes de dicho tipo:
Debido a que 𝑛𝑝𝑞 = 120 × 0.3467 × 0.6533 = 27.18 > 5, por el TCL se puede aproximar la distribución binomial a
una normal con:
60−41.60
𝑧= = 3.53 (0. 5 p)
√27.18
SOLUCIÓN:
Vamos a realizar el contraste (1p)
𝐻0 : 𝜇 = 0.1
𝐻1 : 𝜇 ≠ 0.1
Como la población de la que procede nuestra muestra es una normal, podemos realizar el contraste basado en el
estadístico de contraste t:
𝑥̅ − 0.1
𝑡0 = .
𝑠̂ /√𝑛
En esta fórmula ha de emplearse la cuasi-desviación típica, donde se ha de dividir por 𝑛 − 1 . Con la muestra que se
proporciona calculamos:
−0.67 + 0.53 + ⋯ + (−0.78)
𝑥̅ = = 0.0000
8
(−0.67 − 0)2 + ⋯ + (−0.78 − 0)2
𝑠̂ = √ = 1.0004
7
y el estadístico queda entonces:
0 − 0.1
𝑡0 = = −0.2827 (𝟏𝒑).
1.0004/√8
4. Se desea conocer qué porcentaje de vehículos tiene contratada una póliza de seguro vehicular. ¿A cuántos
vehículos debemos preguntar para estimar dicha proporción con un margen de error de 0.05? (2p)
SOLUCIÓN
Colocándonos en la situación más desfavorable, donde 𝑝 = 𝑞 = 0.5, y asumiendo que 𝑛 será lo suficientemente
grande para que 𝑝̂ se distribuya como una normal, el tamaño muestral necesario será
2
𝑧𝛼⁄2 √𝑝𝑞 1.96 × 0.5 2
𝑛=( ) =( ) = 384.16 ≈ 385
𝐿 0.05
donde, como buscamos el n que garantice que el margen de error no sea mayor a 0.05, redondeamos al entero
superior.
5. Se poseen datos de una muestra de estudiantes de EDB. La información que se tiene es:
a. Promedio: nota final obtenida en la asignatura (sin descuentos por inasistencias)
b. IA: índice académico de cada estudiante
c. Frec: variable binaria que representa que el alumno asiste frecuentemente a clase. 1=menos de 5
inasistencias, 0=5 ó más inasistencias.
Con estas variables se realiza una regresión que explique la variable Promedio en función de IA y Frec. Los
resultados se resumen en la siguiente tabla.
SOLUCIÓN
a)
• IA: 0.89. El coeficiente es significativo, por lo que se acepta que ejerce una influencia en el valor del
promedio. Si IA aumenta en una unidad, independientemente de si el alumno asiste o no a clase, la
nota del promedio aumenta en 0,89 puntos por término medio.
• Frec: el coeficiente es significativo, por lo que se acepta que influye en el valor del promedio. Para un
mismo IA, el asistir regularmente a clase (Frec=1) aumenta el promedio en 1.69 respecto de los que no
lo hacen (Frec=0), por término medio.
• El término constante es el valor previsto del promedio cuando los factores toman el valor cero. En este
caso, esa situación no existe, pues no hay IA=0 en alumnos que estén cursando EDB.
b) Si, pues independientemente de su IA, asistir a clase supone, por término medio, un aumento de 1.69
puntos en el promedio.
ESTADÍSTICA BÁSICA
SEMESTRE 2017-I
PRÁCTICA 5
VIERNES, 23 DE JUNIO DE 2017
Nombre:___________________________________________________________________________
Sección:___________________
Sólo puede consultarse el formulario y las tablas que se adjuntan. Utiliza 𝜶 = 𝟎. 𝟎𝟓 salvo que se indique lo contrario
1. Un analista desea realizar una encuesta para saber la proporción de estudiantes universitarios que tienen a Claro
como operador de su celular.
a) Si desea estimar dicha proporción con un margen de error de 0.05, para una confianza del 95%, ¿a cuántos
estudiantes debe encuestar? Justifica adecuadamente tu respuesta. (2p)
b) Cuando el analista lleva ya 50 estudiantes encuestados obtiene que el 22% de los alumnos tienen como
operador a Claro. Utilizando esta información, ¿cuál deberá ser ahora el tamaño de la muestra para cumplir
los objetivos especificados en el apartado (a)? (2p)
c) Además del operador de telefonía, este analista les pregunta sobre la duración de su última llamada
registrada. Las respuestas de los 50 encuestados tienen una duración media de 𝑥̅ = 3.50 minutos, con una
cuasidesviación típica de 𝑠̂ = 1.4 minutos. Asumiendo que la duración de una llamada sigue una distribución
normal, contrasta si la duración media de una llamada es inferior a 4 minutos. Al realizar este contraste,
escribe claramente cuál es la hipótesis nula, la alternativa, el estadístico de contraste y la distribución de
referencia, justificando adecuadamente tu respuesta. (2p)
d) Repite el contraste de la sección anterior, pero ahora sin asumir que la muestra procede de una distribución
normal. Comenta brevemente qué diferencias hay en la realización de este contraste respecto al realizado en
el apartado (c). (2p)
SOLUCIÓN
a) Para calcular el tamaño muestral necesario para un margen de error determinado nos basaremos en la
fórmula
2
𝑧0.025 √𝑝𝑞
𝑛=( ) . (0.5p)
𝐿
Esta expresión asume que la proporción muestral, 𝑝̂ , se puede aproximar a una normal, para lo que se
necesitará que 𝑛 sea lo suficientemente grande para que se cumpla 𝑛𝑝𝑞 > 5.(0.5p)
En esta expresión, es necesario usar un valor de 𝑝 que, obviamente, desconocemos. Para solventarlo,
tomamos el caso más desfavorable, en el que 𝑝𝑞 toma su máximo valor, lo que sucede cuando 𝑝 = 𝑞 =
0.5. (0.5p)
Entonces, el tamaño muestral para 𝐿 = 0.05 es
2
1.96√0.5×0.5
𝑛=( ) ≈ 385. (0.5p)
0.05
Es fácil comprobar que 385(0.5)(0.5) > 5, por lo que la aproximación a la normal de 𝑝̂ , en la que se basa
esta fórmula, es válida.
Se comprueba que 𝑛𝑝𝑞 = 264(0.22)(0.78) = 45.3 > 5, por lo que la aproximación a la normal de 𝑝̂ , en la
que se basa esta fórmula, es válida.
c) La media poblacional será inferior a 4 minutos (𝜇 < 4) o no (𝜇 ≥ 4). El contraste de medias será:
𝐻0 : 𝜇 ≥ 4
𝐻1 : 𝜇 < 4. (0.25p)
𝑥̅ − 𝜇0 3.50 − 4
𝑡= = = −2.525. (0.25p)
𝑠̂ /√𝑛 1.4/√50
Al tratarse de una muestra de una población normal, la distribución de referencia es la 𝑡𝑛−1 ≡ 𝑡49 (0.5p).
Dado que 𝐻1 : 𝜇 < 4, la región de rechazo está en la cola de la izquierda de la distribución (ver figura)
(0.25p).
Como 𝑡 = −2.525 < −1.676 nos encontramos en la región de rechazo. La diferencia encontrada (entre los
3.5 minutos de media muestral y los 4 minutos de media poblacional) es significativa (muy poco probable
que sea un efecto del muestreo) y, por tanto, debemos rechazar 𝐻0 . Los datos muestran evidencia
suficiente para asumir que la duración media de una llamada es inferior a 4 minutos. (0.5p)
Definimos el nivel de accidentes de una determinada marca como la proporción (poblacional) de vehículos de dicha
marca que han sufrido accidentes. Responda de manera justificada las siguientes cuestiones:
a) Con base en los datos tomados, ¿es posible afirmar que el nivel de accidentes es mayor en los autos de B que
en los de A? (2.5 p)
b) Construya un intervalo de confianza de la diferencia de proporciones de autos que han sufrido accidentes de
las marcas B y C. (2.5 p)
c) Con base en el intervalo de confianza construido en el apartado anterior, ¿es posible afirmar que no existe
diferencia entre el nivel de accidentes de las marcas B y C? (1 p)
SOLUCIÓN:
a) Se necesita comparar la proporción de autos que han sufrido accidentes en las marcas A (𝑝𝐴 )y de la marca B
(𝑝𝐵 ), para comprobar si dicha proporción es mayor en B que en A.
𝑍0 ~𝑁(0,1)
4. Se realiza el contraste. Este es un contraste hacia la izquierda; por ser 𝛼 = 0.05, el valor crítico del
contraste es −1.645 (0.5 p).
-2.00
Como el valor del estadístico de contraste es menor que el valor crítico, se rechaza la hipótesis nula. Por lo
tanto, los datos muestran suficiente evidencia de que el nivel de accidentes es mayor en los autos de la
marca B que en los de A (0.5 p).
- También es posible que hayan realizado el contraste:
𝐻0 : 𝑝𝐵 ≤ 𝑝𝐴
𝐻0 : 𝑝𝐵 > 𝑝𝐴
En dicho caso, el valor crítico es +𝟏. 𝟔𝟒𝟓. La conclusión debe ser la misma.
b) Se pide construir un intervalo de confianza de la diferencia de las proporciones de autos que han sufrido
accidentes en los autos de las marcas B y C.
0.3×0.7 0.2667×0.7333
𝐼𝐶(0.95) = 𝑝𝐵 − 𝑝𝐶 ∈ {0.3 − 0.2667 ± 1.96√ + }
150 150
- También es posible que hayan calculado 𝑰𝑪(𝟎. 𝟗𝟓) = 𝒑𝑪 − 𝒑𝑩 ∈ [−𝟎. 𝟏𝟑𝟓𝟐; 𝟎. 𝟎𝟔𝟖𝟔] . Dicha
alternativa también tiene puntaje completo.
c) Se pide realizar un contraste de hipótesis para comprobar si la diferencia entre las proporciones del apartado
anterior es igual a cero. Dicho contraste debe realizarse utilizando el intervalo de confianza construido en el
apartado b.
Respuesta: Sí es posible afirmar que no existe diferencia significativa, debido a que el valor “0” se encuentra en
el intervalo de confianza, lo que indica que hay evidencia suficiente para afirmar que la diferencia entre ambas
proporciones tiene un valor igual a cero.
a) ¿Apoyan los datos la suposición de que la variabilidad del tiempo de ejecución ha aumentado? (2 p)
b) Construya un intervalo de confianza de la varianza del tiempo de ejecución de la tarea. (2 p)
c) ¿Qué ocurriría con nuestro análisis si la distribución del tiempo no fuera normal? (2 p)
SOLUCIÓN
a) Se pide realizar un contraste de hipótesis para comprobar si la desviación es ahora mayor, que su valor
histórico, 3. Se realizará, por tanto, un contraste de hipótesis para comprobar si la varianza es mayor que 9.
(𝑛 − 1)𝑠̂ 2 99×9.61
𝜒02 = = = 105.71
𝜎02 9
4. Se realiza el contraste. Este es un contraste hacia la derecha; por ser 𝛼 = 0.05, el valor crítico del contraste
es 123.22 (0.5 p)*.
2 2 2
Como las tablas que se utilizan no tienen 𝜒99 , tomamos como valor aproximado 𝜒100 , siendo 𝜒100;0.05 =
124.3.
Como el valor del estadístico de contraste (105.71) es menor que el valor crítico, se acepta la hipótesis
nula. Por lo tanto, no hay evidencia para afirmar que la variabilidad ha aumentado (0.5 p).
- Si se utilizan los valores de 3 y 3.1 como varianza y cuasivarianza, se corrigen únicamente los 1.5
puntos de las partes 3 y 4 (la distribución del estadístico de contraste, el valor crítico y región de
rechazo, y la conclusión, con base en el estadístico calculado).
b) Se pide construir un intervalo de confianza de la diferencia de la varianza.
(𝑛 − 1)𝑠̂ 2 (𝑛 − 1)𝑠̂ 2
𝐼𝐶(0.95): 𝜎 2 𝜖 [ 2 ; 2 ]
𝜒99,0.025 𝜒99,0.975
99×9.61 99×9.61
𝐼𝐶(0.95): 𝜎 2 𝜖 [ ; ]
128.42 73.36
(𝑛 − 1)𝑠̂ 2
𝜒02 = 2
~𝜒𝑛−1
𝜎02
(1 p)
Esto tendría como consecuencia que el análisis realizado (contraste de hipótesis e intervalo de confianza) no sea
válido, debido a que el nivel de confianza no será el buscado, sino uno distinto. (1p)
ESTADÍSTICA BÁSICA
SEMESTRE 2017-I
PRÁCTICA 4
VIERNES, 9 DE JUNIO DE 2017
Nombre:___________________________________________________________________________
Sección:___________________
Sólo puede consultarse el formulario y las tablas que se adjuntan. La notación de la normal es 𝑵(𝝁; 𝝈𝟐 ). Utiliza 𝜶 = 𝟎. 𝟎𝟓
salvo que se indique lo contrario
SOLUCIÓN
a) La opción más sencilla para aplicar el método de los momentos es utilizando el momento de primer orden.
Calculamos así el primer momento y vemos su relación con el parámetro 𝛽.
1 1 1
𝑥 𝛽+1 𝛽
𝐸(𝑋) = ∫ 𝑥𝑓(𝑥 )𝑑𝑥 = ∫ 𝛽𝑥 𝛽 𝑑𝑥 = 𝛽 [ ] = = 𝜇 (1𝑝)
0 0 𝛽+1 𝛽+1
0
Por tanto, podemos relacionar 𝜇 con 𝛽. Operando:
𝜇(𝛽 + 1) = 𝛽 ⇒ 𝜇 = 𝛽 (1 − 𝜇)
𝜇
⇒𝛽= (1𝑝)
1− 𝜇
El estimador por el método de los momentos se consigue reemplazando en esta expresión los parámetros (𝛽 y
𝜇) por sus estimadores.
𝑥̅
𝛽̂ = . (1𝑝)
1 − 𝑥̅
SOLUCIÓN
a) No está claro, pues el estimador insesgado puede tener mucha varianza, lo que es malo, y el de poca
varianza podría ser muy sesgado, lo que tampoco es deseable. Elegiremos el que tenga menos error
cuadrático medio (ECM) que se basa tanto en el sesgo como en la varianza.
2
𝐸𝐶𝑀(𝜃̂) = 𝑠𝑒𝑠𝑔𝑜(𝜃̂) + 𝑣𝑎𝑟(𝜃̂)
c) Falso. Si quiero saber si 𝜇 < 0, esa restricción ha de estar en una de las hipótesis, y, por tanto, la otra
hipótesis sería 𝜇 ≥ 0. Como la hipótesis nula ha de tener el signo = se tiene que el contraste es
𝐻0 :𝜇 ≥ 0, 𝐻1:𝜇 < 0
SOLUCIÓN:
Respuesta: Hay suficiente evidencia para afirmar que el número medio de hijos en dicho país ha
disminuido (es ahora menor que 3) (0.5 p).
c) Para obtener 𝐿 = 0.1, se debe tener una muestra de tamaño (1.5 p):
1.96×1.4 2
𝑛=( ) = 752.95 ≈ 753
0.1
d) Se quiere comprobar si 𝜇 ≠ 3, por lo que se debe realizar un contraste de hipótesis bilateral. Esto equivale
a comprobar si el valor 3 se encuentra en el intervalo de confianza del 95%:
APELLIDOS:______________________________________________NOMBRE:_____________________________
Sección:___________________
Sólo se puede consultar el formulario y tablas de la asignatura. Salvo que se indique lo contrario usa 𝜶 = 𝟎. 𝟎𝟓.
Contesta cada pregunta sólo en la hoja de su enunciado, por ambas caras. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega,
pero no se corrige. Entrega cada pregunta por separado, y el cuadernillo aparte.
Cuando se solicite reclamo, deberá adjuntarse copia de la solución que se publique. El reclamo deberá basarse en esa solución.
1. Para las siguientes cuestiones, responde si son verdaderas o falsas, justificando adecuadamente tu NOTA
respuesta
(el puntaje se obtiene por la justificación, y no por haber acertado en si son verdaderas o falsas)
FIRMA
a) En una población normal, el estimador de 𝜎 2 aplicando el método de los momentos es la cuasivarianza.
(1p)
Solución:
Según el método de los momentos, el estimador de la varianza será el segundo momento centrado muestral, es
decir, la varianza muestral (divide por n), y no la cuasivarianza (divide por n-1). La afirmación es, por tanto, falsa.
∑𝑛 (𝑋 − 𝑋̅)2 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅ )2
𝜎 2 = 𝐸[(𝑋 − 𝜇)2 ] ≡ 𝑀2𝑐 ⇒ 𝜎̂ 2 = 𝑀 ̂2𝑐 = 𝑚2𝑐 = 𝑖=1 𝑖 ≠
𝑛 𝑛−1
b) Cuando cierto proceso productivo funciona adecuadamente, fabrica piezas cuya longitud sigue una variable aleatoria
normal de media 𝜇 = 10 y desviación típica 𝜎 = 2. Para analizar si la media del proceso cambia, se toma una muestra
de 𝑛 = 16 y se calcula 𝑥̅ . Asumiremos que la varianza poblacional no va a variar. Entonces, si la media muestral
obtenida difiere de 𝜇 en más de 0.5 unidades (en valor absoluto), deberemos concluir que, con un nivel de significación
del 5%, la media del proceso ha cambiado. (1p)
Solución:
Si queremos saber si la media del proceso cambia podemos hacer el contraste 𝐻0 : 𝜇 = 10, 𝐻1 : 𝜇 ≠ 10, donde el
estadístico de contraste, puesto que la varianza poblacional es conocida, será
𝑥̅ − 𝜇 𝑥̅ − 10
𝑧0 = 𝜎 = = 2(𝑥̅ − 10).
⁄ 𝑛 2⁄
√ √16
Como la población es normal y estamos usando el valor poblacional de 𝜎 2 , la distribución de referencia es la N(0,1).
El test es a dos colas, y la región de rechazo será:
1.96
|𝑧0 | = 2|𝑥̅ − 10| > 𝑧0.025 = 1.96 ⇒ |𝑥̅ − 10| > > 0.98 ≈ 1
2
Es decor, el nivel de significación será de 0.05 si rechazamos cuando |𝑥̅ − 10| > 1. Por tanto, concluiremos, con un
5% de significación, que 𝜇 ha cambiado sólo si 𝑥̅ difiere de 𝜇 en al menos una unidad, y no en 0.5 unidades. La
afirmación es, por tanto, falsa.
c) De una población de media 𝜇 = 10 y varianza 𝜎 2 = 1 tomamos una muestra de 𝑛 = 100 observaciones. La
probabilidad de que la media 𝑥̅ de esa muestra sea mayor a 11 es prácticamente nula. (1p)
Solución
De la información del enunciado se deduce que 𝑥̅ es normal de media 𝜇 = 10 y varianza 𝜎 2 ⁄𝑛 = 0.01; es decir,𝑥̅ ∼
𝑁(10; 0.01). Por tanto
𝑥̅ − 𝜇 11 − 10
𝑃(𝑥̅ > 11) = 𝑃 ( 𝜎 > ) = 𝑃(𝑧 > 10) ≈ 0.
1
√𝑛 10
Por lo tanto, esta afirmación es cierta.
2. De una población normal se obtienen las observaciones: 0.34, 1.53, −0.20, 1.17, 0.25, 2.43, 2.26, 0.22. Se piensa que
esta muestra procede de una población de varianza 𝜎 2 = 0.4967 . Contrasta esta afirmación. (2p)
Solución
Hacemos el contraste
𝐻0 : 𝜎 2 = 0.4967
𝐻1 : 𝜎 2 ≠ 0.4967
El estadístico de contraste es
(𝑛 − 1)𝑠̂ 2 7 × 0.9984
𝑋0 = = = 14.0705
𝜎02 0.4967
Al tratarse de una población normal, la distribución de referencia para este estadístico de contraste es la 𝜒72
Responde a las siguientes cuestiones justificando tu respuesta, en especial la relativa a la distribución de referencia
que se use en cada apartado:
a) Construye un intervalo de confianza para la eficacia media de frenado de los autos sin ABS e interpreta el significado
de dicho intervalo. (1p)
El contraste de bondad de ajuste de Anderson Darling (AD) nos dice que podemos asumir normalidad
(pvalor=0.150). Además, la desviación estándar que proporciona el Minitab es realmente la cuasi-desviación
estándar, 𝑠̂ . Por tanto, en el intervalo debemos usar la distribución t de Student y dicha estimación 𝑠̂ . El
intervalo será:
𝑠̂ 5.689
𝐼𝐶(0.95): 𝜇 ∈ [𝑥̅ ± 𝑡40;0.025 ] = [58.411 ± 2.021 ]
√𝑛 √41
Interpretación: Tenemos una confianza del 95% de que la media poblacional 𝜇 sea un valor contenido entre los
límites de este intervalo. El 95% de las muestras a las que se les aplique esta fórmula, obtendrán intervalos que
sí contendrán el verdadero valor de 𝜇. No sabemos si nuestra muestra forma parte de ese 95%, o del 5%
restante.
b) Analiza mediante un contraste estadístico si el ABS mejora la eficacia media de frenado. Justifica adecuadamente
todas las decisiones que tomes en tu procedimiento. (4p)
Solución
Usaremos el subíndice 1 para los autos con ABS y 2 para los autos sin ABS. Sin una adecuada justificación no hay
puntaje.
• (0.5p) Calculamos el valor del estadístico a partir de los datos. Como ambas cuasivarianzas son iguales, el estimador
agrupado será igual a las cuasivarianzas:
Justificación: La región de rechazo está donde indique 𝐻1 . En este caso, si 𝜇1 > 𝜇2 el estadístico
tenderá a tener valores positivos muy altos. La región de rechazo estará a la derecha de la
distribución 𝑡195 . Por tanto, el valor crítico es 𝑡195;0.05 ≈ 1.66 (como no hay tablas de 𝑡195 se ha
tomado el valor de 𝑡100;0.05). La región de rechazo serán los valores 𝑡0 tal que 𝑡0 > 1.66.
• (1p) No podemos rechazar la hipótesis nula de que el ABS no mejora la eficacia de frenado, con un nivel de
significatividad del 5%.
Justificación: En nuestro caso, con 𝑡0 = 1.44 < 1.66 estamos en la región de aceptación. No
podemos rechazar la hipótesis nula de igualdad de medias. Los datos no aportan evidencia
suficiente para afirmar que el ABS ayude a aumentar la eficacia de frenado. La diferencia de
eficacia media encontrada en ambas muestras no es significativa, y puede explicarse por el azar
del muestreo.
(Este resultado es lógico, pues el ABS simplemente impide que la rueda se bloque durante la frenada, mientras que la
eficacia tiene que ver con la mayor o menor presión que ejerce el freno. Además, la prueba que se realiza para medir
esta eficacia se realiza de tal manera que no se bloqueen las ruedas, por lo que el sistema ABS no se activa en ningún
momento de la medición)
APELLIDOS:______________________________________________NOMBRE:________________________
Sección:___________________ NOTA
.
1. Se desea predecir la velocidad máxima que un auto es capaz de alcanzar a partir de la potencia de
FIRMA
su motor (potencia), peso (peso) y un coeficiente aerodinámico (aerodin). A continuación, se
muestran los principales resultados.
a. Escriba las dos hipótesis básicas del modelo general de regresión. Use únicamente una línea para cada una. (1 p)
Linealidad
Cuando el peso de un auto aumente en una unidad, la velocidad máxima disminuirá en 0.02418 por término medio,
c. Un auto pesa 1300 kg, tiene un motor con una potencia de 180 y un coeficiente aerodinámico de 0.85.
Asumiendo que se cumplen las hipótesis básicas del modelo, ¿cuál es la probabilidad de que tenga una velocidad
máxima mayor que 220? Debe mostrar su procedimiento. (0.5 p)
𝑒𝑖 ~𝑁(0, 5.400342 )
𝐸(𝑃𝑒𝑠𝑜 | 𝑋 = (180; 0.85; 1300) = 180.51 + 0.6131 × 180 − 57.5 × 0.85 − 0.02148 × 1300 = 𝟐𝟏𝟒. 𝟎𝟔𝟗
Entonces:
220 − 214.069
𝑃(𝑋 > 220) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 1.1) = 1 − 0.8643 = 𝟎. 𝟏𝟑𝟓𝟕
5.40034
APELLIDOS:______________________________________________NOMBRE:________________________
NOTA
Sección:___________________
.
FIRMA
2. Complete la siguiente tabla con la información solicitada:
Parámetro(s)
Modelo de
Variable (𝑿) que define(n) al Probabilidad Puntaje
probabilidad de 𝑿
modelo
𝑛 = 20
Probabilidad de que en la clase
(a) En una clase hay 20 alumnos. Se sabe 𝑝 = 0.40 haya como máximo 7 alumnos
que 3 de cada 5 alumnos no utilizan con anteojos.
Binomial
anteojos. 𝑋 es el número de alumnos De haber usado
que usan anteojos en la clase. 𝒑 = 𝟎. 𝟔𝟎, la 𝟎. 𝟒𝟏𝟓𝟗
respuesta se
invalida
3. Una central que monitorea la información climatológica de un país tiene la siguiente información histórica
sobre su ciudad capital durante los días de verano:
La empresa proveedora de fluido eléctrico desea averiguar qué tan bien preparado está su sistema de transmisión ante
la posibilidad de averías ante lluvias, debido a unas mejoras muy costosas que recientemente se han implementado. Se
tiene la información histórica de que, durante los días de verano:
Se sabe que:
- El 30% de los días tienen presencia de lluvia: 𝑃(𝐿) = 0.30
- El 1% de los días tienen presencia de averías en el sistema de transmisión: 𝑃(𝐴) = 0.01
- El 28% de los días tienen presencia de averías en el sistema de transmisión o tienen presencia de lluvias:
𝑃(𝐿 ∪ 𝐴) = 0.28
Entonces:
𝑃(𝐿 ∪ 𝐴) = 0.28 = 𝑃(𝐿) + 𝑃(𝐴) − 𝑃(𝐿 ∩ 𝐴) = 0.30 + 0.01 − 𝑃(𝐿 ∩ 𝐴) → 𝑷(𝑳 ∩ 𝑨) = 𝟎. 𝟎𝟑 (𝟎. 𝟓 𝐩)
Por lo tanto:
Si solo han escrito el criterio para identificar la independencia, pero no han calculado la intersección, no es válido.
Si han usado un criterio incorrecto para identificar la independencia, solo hay puntaje si han calculado bien la
intersección.
continúa
b. ¿Qué proporción de los días en los que se presentan lluvias son soleados? Dé su respuesta con una precisión de 4
decimales.
Se sabe que:
- El 40% de los días soleados tienen presencia de lluvias: 𝑃(𝐿 | 𝑆) = 0.40
- El 70% de los días son soleados: 𝑃(𝑆) = 0.70
- El 30% de los días tienen presencia de lluvia: 𝑃(𝐿) = 0.30
c. ¿Cuál es la probabilidad de que llueva durante algún día de verano? Dé su respuesta con una precisión de 4 decimales.
APELLIDOS:______________________________________________NOMBRE:_____________________________
Sección:___________________
Sólo se puede consultar el formulario y tablas de la asignatura. Salvo que se indique lo contrario usa 𝜶 = 𝟎. 𝟎𝟓.
NOTA
Contesta cada pregunta sólo en la hoja de su enunciado, por ambas caras. Usa el cuadernillo sólo como borrador. El cuadernillo
se entrega, pero no se corrige. Entrega cada pregunta por separado, y el cuadernillo aparte.
Cuando se solicite reclamo, deberá adjuntarse copia de la solución que se publique. El reclamo deberá basarse en esa solución.
FIRMA 1. Para las siguientes cuestiones, contesta si son verdaderas o falsas, justificando brevemente la respuesta.
Emplea sólo el espacio que se proporciona.
a) Sólo se puede usar la distribución t de Student para el contraste de una media si la muestra es pequeña y la
población es normal. (1p)
b) Si tenemos 40 datos, y obtenemos con ellos que 𝑝̂ = 0.30, no deberemos hacer un contraste de hipótesis de una
proporción asumiendo muestras grandes. (1p)
Falso. Para poder hacer inferencia de una proporción utilizando la aproximación a la normal influye
tanto 𝑛 como 𝑝. En este caso se tiene que 𝑛𝑝̂ (1 − 𝑝̂ ) = 40 × 0.3 × 0.7 = 8.4 > 5 por lo que podemos
asumir que la muestra es suficientemente grande y usar la aproximación a la normal.
c) A partir de una muestra se construye un intervalo de confianza para 𝜇. Entonces, cualquier valor 𝜇0 que esté contenido
en él será una hipótesis nula que no se podrá rechazar en un contraste bilateral. (1p)
d) A partir de una muestra se obtiene 𝑥̅ = 11. Si se rechaza 𝐻0 : 𝜇 = 10 con pvalor 0.02, se rechazará 𝐻0 : 𝜇 ≥ 10 con
pvalor 0.01. (1p)
Falso. Si 𝑥̅ = 11 no podremos nunca rechazar 𝐻0 : 𝜇 ≥ 10. Sólo se rechaza una hipótesis nula si los datos la contradicen;
es decir, si hacen lo contrario de forma muy evidente. En este caso sólo se podría rechazar 𝐻0 : 𝜇 ≥ 10 si 𝑥̅ ≪ 10.
2. ¿Qué tamaño muestral es necesario para estimar la proporción de hogares que cuenta con conexión a internet si se quiere
asegurar que el margen de error sea menor a 0.05? (1.5p)
Como no conocemos el valor de 𝑝, nos ponemos en el peor der los casos, que es cuando 𝑝 = 𝑞 = 0.5. El tamaño muestral será,
redondeando al entero superior:
2
𝑧0.025 √0.5 0.5 1.96 2
𝑛 = ⌈( ) ⌉ = ⌈( ) ⌉ = 385
0.05 2(0.05)
3. A partir de una muestra de 35 datos de una población normal se construye un intervalo de confianza para la varianza
poblacional del 95%, resultando 𝜎 2 ∈ (2.62; 6.87) ¿Cuál sería el intervalo del 90%? Justifica. (1.5p)
SOLUCIÓN
2 2
(* como en las tablas no se tiene el caso de 𝑔 = 34, aproximamos a los valores 𝜒30;0.05 = 43.77 y 𝜒30;0.95 = 18.49)
4. Se pesa una muestra de monedas del mismo tipo, obteniéndose los siguientes valores en gramos:
9.0; 9.3; 9.3; 9.2; 9.2; 9.1; 9.2; 9.3; 9.3;
Asumiendo que el peso de las monedas se distribuye como una normal, ¿puede afirmarse que el peso medio de este tipo
de monedas es de 9.2 gramos? Justifica tu respuesta. (3p)
SOLUCIÓN:
El contraste es bilateral, con región de rechazo a dos colas. La región de rechazo es |𝑡| > 𝑡8;0.025 = 2.306 .
Por tanto, estamos en la región de aceptación. Con un nivel de significación del 5%, sí hay evidencia suficiente para afirmar
que la media poblacional sea 9.2. La diferencia encontrada entre 𝑥̅ = 9.2111 y 9.2 no resulta significativa y puede deberse
al azar del muestreo.
NOTA
APELLIDOS:______________________________________________NOMBRE:________________________
Sección:___________________
.
FIRMA
5. Se desea predecir, mediante un modelo de regresión lineal múltiple, la Nota de un alumno (escala del 0 al 10)
a partir de sus horas de estudio (horas_estudio), sus horas de asistencia a clase (horas_clase) y su inversión en
material de estudio (Inversion). A continuación, se muestran los resultados obtenidos en el análisis de regresión.
a. ¿Qué puede concluir del gráfico número 1? Usa como máximo 1 línea. (1 p)
A partir de la gráfica, se puede concluir que el error sigue una distribución normal. 𝑒𝑖 ~𝑁(0, 0.9696762 ) (1 p)
Respuesta NO válida: Se concluye que hay linealidad (0 p). Si esta afirmación se incluye en alguna de las
respuestas anteriores, se tendrá un descuento de 0.25 p.
b. La variable Inversión tiene un p-valor asociado a un test de significatividad individual. ¿Cuáles son las hipótesis
nula y alternativa de dicho contraste? Escribe solo las hipótesis. (0.5 p)
𝐻0 : 𝛽3 = 0
𝐻1 : 𝛽3 ≠ 0
Respuestas NO válidas:
̂𝟑 = 𝟎
𝑯𝟎 : 𝜷
̂𝟑 ≠ 𝟎
𝑯𝟏 : 𝜷
𝑯𝟎 : 𝜷𝟎 = 𝟎
𝑯𝟏 : 𝜷𝟎 ≠ 𝟎
𝑯𝟎 : 𝐈𝐧𝐯𝐞𝐫𝐬𝐢𝐨𝐧 = 𝟎
𝑯𝟏 : 𝐈𝐧𝐯𝐞𝐫𝐬𝐢𝐨𝐧 ≠ 𝟎
𝑯𝟎 : 𝑰 = 𝟎
𝑯𝟏 : 𝑰 ≠ 𝟎
c. Interpreta el coeficiente de la variable horas_estudio en el modelo de regresión. Usa como máximo 3 líneas. (1
p)
Por cada hora de estudio adicional, la nota de un estudiante aumentará en 0.1207 puntos por término medio, si los
valores de las demás variables permanecen constantes.
La respuesta debe estar completa para obtener el punto completo.
e. ¿Cuál es la ventaja del 𝑅2 ajustado (𝑅̅2 ) frente al 𝑅2 ? Usa como máximo 2 líneas. (0.5 p)
A diferencia del 𝑅2 , el 𝑅2 ajustado (𝑅̅ 2 ) solo aumenta cuando se añaden variables significativas al modelo.
f. Un estudiante ha invertido $60 en material de estudio, ha estudiado 25 horas y ha asistido a 45 horas de clase.
¿Cuán probable es que obtenga una nota mayor que 5? Muestra todo tu procedimiento. (2 p)
𝑒𝑖 ~𝑁(0, 0.9696762 )
𝐼𝑛𝑣𝑒𝑟𝑠𝑖𝑜𝑛 = 60
ℎ𝑜𝑟𝑎𝑠_𝑒𝑠𝑡𝑢𝑑𝑖𝑜 = 25
ℎ𝑜𝑟𝑎𝑠_𝑐𝑙𝑎𝑠𝑒 = 45
5 − 6.60075
𝑃(𝑁𝑜𝑡𝑎 > 5) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > −1.65) = 𝟎. 𝟗𝟓𝟎𝟓 (𝟎. 𝟓 𝒑)
0.969676
Para los últimos 0.5 puntos, todo debe ser correcto.
6. A continuación, se muestran los resultados de la prueba de bondad de ajuste de la variable tiempo (𝑋) y su histograma.
Histograma de tiempo
Normal
25
Media 41.22
Desv.Est. 25.39
N 90
20
Frecuencia
15
10
0
0 30 60 90 120
tiempo
a. Escribe las hipótesis nula y alternativa de la prueba de bondad de ajuste a la normal de la variable tiempo (𝑋).
𝐻0 : 𝑋 ~ 𝑁 (41.22, 25.392 )
𝐻1 : 𝑋 ≁ 𝑁 (41.22, 25.392 )
Weibull y gamma.
Si solo han escrito una de las dos: 0.25 p.
Si han escrito alguna otra distribución: 0 p.
c. ¿Cuál es la mejor distribución que describe a los datos de la variable tiempo? Justifica tu respuesta en no más
de 1 línea.
d. La transformación Box-Cox pretende obtener normalidad en los datos. ¿Cómo lo logra? Usa como máximo 1
línea.
e. ¿Cómo aplicaría la transformación Box-Cox con la variable tiempo? Usa como máximo 1 línea.
𝑋 λ; λ < 1
7. Se tienen datos del precio (𝑋) de un conjunto de 155 autos. Debido a que la variable precio no se distribuye normalmente,
se realiza una transformación Box-Cox, obteniéndose un valor óptimo de 𝜆 = 0.5. La variable transformada resultante sí
se distribuye normalmente.
𝑃(𝑋 > 5500) = 𝑃(𝑋 0.5 > 55000.5 ) = 𝑃(𝑋 0.5 > 74.16) (𝟎. 𝟓 𝒑)
74.16 − 66.7
= 𝑃 (𝑍 > ) = 𝑃(𝑍 > 0.55) (𝟏 𝒑)
13.5
= 1 − 0.7088 = 𝟎. 𝟐𝟗𝟏𝟐 (𝟎. 𝟓 𝒑) Esta respuesta debe ser coherente con la línea anterior.
NOTA REVISADA FIRMA ESTADÍSTICA BÁSICA
SEMESTRE 2017-II
PARCIAL
05/10/2017
APELLIDOS:______________________________________________NOMBRE:_____________________________
Sección:___________________
Contesta cada pregunta sólo en la hoja de su enunciado, por ambas caras. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega,
pero no se corrige. Entrega cada pregunta por separado, y el cuadernillo.
Cuando se solicite reclamo, deberá adjuntarse copia de la solución que se publique. El reclamo deberá basarse en errores de corrección en
base a esa solución. Si simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
La muestra tiene 30 datos. La mediana es el promedio entre el dato en posición 15 (6) y el dato en posición 16 (7). Por tanto
𝑄2 = 6.5. De los primeros 15 datos, su mediana es el dato en posición 8, que es 𝑄2 = 5. Asimismo, se tiene 𝑄3 = 8. El
rango intercuartílico es 3. La barrera interna superior estará en 8 + 1.5 × 3 = 12.5. La barrera interna inferior estará en
5 − 1.5 × 3 = 0.5. Por tanto, los bigotes se prologan por la izquierda hasta el mínimo (4), y por la derecha hasta el 11. El
14 queda marcado como dato atípico. (En la corrección, en general se descontará 0.333 por cada error)
2. La siguiente figura muestra el resultado de una regresión con Minitab. Escribe la ecuación de regresión e
interpreta sus coeficientes (3p)
• Por cada unidad de aumento de X, el valor previsto de 𝑌, es decir, 𝑌̂, aumenta en 20 unidades. (1.5p) (si se dice
que lo que aumenta no es 𝑌̂ sino 𝑌, 1p)
• El término constante sería el valor previsto de Y cuando X=0 (0.5p). Puede verse en el gráfico que ese valor está
fuera del rango de los datos, por lo que no procede atribuir ninguna interpretación a ese coeficiente. (0.5p)
APELLIDOS:____________________________________________________NOMBRE:________________________
Sección:___________________
.
NOTA
3. Para la fabricación de cierto artículo se utiliza una máquina que produce un 4% de artículos defectuosos. Con el fin
de mejorar la calidad, se ha ideado un test que permite detectar rápidamente si el artículo es defectuoso o no, sin
FIRMA
necesidad de hacer un análisis profundo que demoraría todo el proceso. La rapidez del test hace, sin embargo, que
éste no sea infalible. El test detecta el 95% de los artículos defectuosos. Cuando el artículo es aceptable, el test
identifica erróneamente que es defectuoso con una probabilidad del 1%. Usaremos la notación 𝐴 = artículo
aceptable, 𝐷 =artículo defectuoso, 𝑑 = el test determina que el artículo es defectuoso y 𝑎 =el test determina que el
artículo es aceptable. (5p)
a) Calcula las siguientes probabilidades. Escribe el resultado en la tabla con 4 decimales. No necesitas
justificar. (1p)
𝑃(𝑎|𝐴) 0.99 𝑃(𝑎|𝐷) 0.05 𝑃(𝐴|𝐷) 0 (0.25p)
𝑃(𝑑|𝐴) 0.01 𝑃(𝑑|𝐷) 0.95 𝑃(𝑎) 0.9524 (0.5p)
b) Si el test determina que un artículo es aceptable, ¿cuál es la probabilidad de que realmente lo sea?
Justifique. (2p)
c) Todos los artículos producidos son analizados con este test. Cuando el test identifica que un artículo es
defectuoso, éste se retira del proceso. Es decir, sólo se consideran aquellos artículos que pasen el test.
¿Qué proporción de artículos defectuosos se tendrá como resultado de este procedimiento de
depuración? (1p)
Sólo se consideran artículos que pasen el test. De ellos, los defectuosos son
𝑃(𝐷|𝑎) = 1 − 𝑃(𝐴|𝑎) = 1 − 0.9979 = 0.0021 (0.21%)
(0.25𝑝) (0.75𝑝)
FIRMA
4. Para cada una de las siguientes variables descritas, identifique el modelo de probabilidad que sigue y los
parámetros que definen el modelo. Escoja entre las siguientes opciones:
Ejemplo:
Modelo de
Variable Parámetros
probabilidad
La longitud de una pieza (𝑋) es una variable normal que tiene una
N 𝑋~𝑁(15; 3)
esperanza de 15 m y una varianza de 3.
Puntuación:
Modelo elegido correctamente: + 0.25 p.
Parámetros elegidos correctamente: + 0.25 p. (solo si el modelo es elegido correctamente)
Modelo elegido incorrectamente: - 0.20 p.
Modelo de
Variable Parámetros
probabilidad
o 𝑿~𝑩(𝟓𝟎𝟎; 𝟎. 𝟑)
−3(𝑦 2 −4𝑦+3)
FIRMA o 𝒀, con una función densidad 𝑓(𝑦) = ; 𝑥 ∈ [1; 3].
4
SOLUCIÓN
a)
3
−3(𝑦 2 − 4𝑦 + 3)
𝐸(𝑌) = ∫ 𝑦 ∙ 𝑑𝑦 = 2 (𝟎. 𝟓 𝒑)
4
1
b)
𝑋~𝐵(500; 0.3)
Se pide:
500 250
500 500
𝑃(𝑋 > 250) = ∑ ( ) × 0.3𝑟 × 0.7500−𝑟 = 1 − ∑ ( ) × 0.3𝑟 × 0.7500−𝑟
𝑟 𝑟
𝑟=251 𝑟=0
Al ser una sumatoria muy grande, se evalúa si se puede aplicar el TCL para simplificar el cálculo:
Finalmente:
250 − 150
𝑃(𝑋 > 250) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > 0.95) = 1 − 0.8289 = 0.1711 (𝟎. 𝟓 𝒑)
105
APELLIDOS:______________________________________________NOMBRE:_________________________
Sección:___________________
.
NOTA
6. Una empresa consultora ha realizado un estudio en un supermercado y ha determinado lo siguiente:
a) ¿Cuán probable es que, desde que abre el supermercado, lleguen más de 5.3 clientes (incluye tanto a los de tipo
A como a los de tipo B) durante los primeros 5 segundos? (1.5 p)
b) El primer cliente (incluye tanto a los de tipo A como a los de tipo B) llegó después de 15 minutos de la apertura del
supermercado. ¿Cuán probable es que el siguiente cliente llegue antes de los próximos 3 segundos? (1 p)
c) Se va a incluir en una promoción a los clientes tipo A que gasten entre S/60 y S/95. ¿Qué proporción de clientes
tipo A no serán incluidos en la promoción? (1 p)
d) Indique cuál es el valor del gasto mínimo del 30% de los clientes tipo B que gasta más. (1.5 p)
Nota:
Para cada apartado, indique claramente qué variable está utilizando. Es decir, si utiliza una variable 𝑿, indique qué
representa. Por ejemplo “𝑿: Gasto de un cliente tipo B”.
Utilice 4 decimales para dar los valores de las probabilidades.
SOLUCIÓN:
𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
𝑋~𝑃𝑜𝑖 (10 ) (𝟎. 𝟓 𝒑)
5 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
𝑃(𝑋 > 5.3) = 𝑃(𝑋 > 5) (𝟎. 𝟐𝟓 𝒑) = 1 − 𝑃(𝑋 ≤ 5) = 1 − 0.0671 = 𝟎. 𝟗𝟑𝟐𝟗 (𝟎. 𝟓 𝒑)
Se debe haber trabajado con una única variable 𝑿 que represente al total de clientes que llegan al supermercado en 5
segundos.
𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
𝑋~𝐸𝑥𝑝 (120 )
𝑚𝑖𝑛𝑢𝑡𝑜
𝑃(𝑋 < 15.05 ∩ 𝑋 > 15) 𝑃(15 < 𝑋 < 15.05) 𝑃(𝑋 < 15.05) − 𝑃(𝑋 < 15)
𝑃(𝑋 < 15.05 | 𝑋 > 15) = = = (𝟎. 𝟓 𝒑)
𝑃(𝑋 > 15) 𝑃(𝑋 > 15) 𝑃(𝑋 > 15)
(1 − 𝑒 −1806 ) − (1 − 𝑒 −1800 )
= = 1 − 𝑒 −6 = 𝟎. 𝟗𝟗𝟕𝟓 (𝟎. 𝟐𝟓 𝒑)
𝑒 −1800
También es válido:
𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
𝑋~𝐸𝑥𝑝 (2 )
𝑠𝑒𝑔𝑢𝑛𝑑𝑜
𝑃(𝑋 < 903 ∩ 𝑋 > 900) 𝑃(900 < 𝑋 < 903) 𝑃(𝑋 < 903) − 𝑃(𝑋 < 900)
𝑃(𝑋 < 903 | 𝑋 > 900) = = = (𝟎. 𝟓 𝒑)
𝑃(𝑋 > 900) 𝑃(𝑋 > 900) 𝑃(𝑋 > 900)
(1 − 𝑒 −1806 ) − (1 − 𝑒 −1800 )
= = 1 − 𝑒 −6 = 𝟎. 𝟗𝟗𝟕𝟓 (𝟎. 𝟐𝟓 𝒑)
𝑒 −1800
𝑋~𝑁(75, 100)
Dentro de la promoción:
60 − 75 95 − 75
𝑃(60 < 𝑋 < 95) = 𝑃 ( <𝑍< ) = 𝑃(−1.5 < 𝑍 < 2) (𝟎. 𝟐𝟓 𝒑)
10 10
= 𝑃(𝑍 < 2) − 𝑃(𝑍 < 1.5) (𝟎. 𝟐𝟓 𝒑) = 0.9772 − 0.0668 = 𝟎. 𝟗𝟏𝟎𝟒 (𝟎. 𝟐𝟓 𝒑)
Fuera de la promoción:
𝑃(𝑋 < 60 ∪ 𝑋 > 95) = 1 − 𝑃(60 < 𝑋 < 95) = 1 − 9104 = 𝟎. 𝟎𝟖𝟗𝟔 (𝟎. 𝟐𝟓 𝒑)
𝑋~𝐸𝑥𝑝(0.015)
𝑒 −0.015𝑃70 = 0.3
−0.015𝑃70 = ln(0.3)
APELLIDOS:______________________________________________NOMBRE:_____________________________
Sección:___________________
Cuando se solicite reclamo, deberá adjuntarse copia de la solución que se publique (sólo del ejercicio
sobre el que se reclame). El reclamo deberá basarse en errores de corrección en base a esa solución. Si
simplemente se alega que se merece más puntaje, el reclamo no va a prosperar.
1. La empresa Plutón S.A. exporta uva de mesa a diversos países de Europa. El nuevo gerente ha ordenado
NOTA una revisión de procesos, por lo que se ha medido el tiempo durante el cual la fruta se encuentra a la intemperie,
desde que se corta del árbol hasta que es trasladada a la planta de empaque. Se ha concluido que dicho tiempo
(min) es una variable aleatoria normal. Para el estudio, se ha hecho seguimiento de 9 lotes de uva cosechada,
FIRMA
tomando el tiempo desde su cosecha hasta su llegada a la planta de empaque. A partir de los 9 datos de la
muestra, se ha calculado una media de 28 min y una cuasidesviación estándar de 2.449 min. Responda, de
manera justificada, las siguientes cuestiones:
(𝑛 − 1)𝑠̂ 2 (𝑛 − 1)𝑠̂ 2
𝐼. 𝐶. (0.90): 𝜎 2 𝜖 [ ; 2 ]
χ2𝑛−1,0.05 χ𝑛−1,0.95
8 × 2.4492 8 × 2.4492
𝐼. 𝐶. (0.90): 𝜎 2 𝜖 [ ; ] = [3.0935; 17.5754]
15.51 2.73
Si el intervalo es correcto: 2 p.
Si el intervalo es incorrecto: 0 p.
b. Realice un contraste de hipótesis para comprobar si, a partir de los datos, es posible afirmar que el tiempo
medio que la uva se encuentra a la intemperie es menor que la media histórica 30.3641 𝑚𝑖𝑛. Utilice un nivel
de significación de 10%.
𝑋̅ − 𝜇0 28 − 30.3641
𝑇0 = = = −2.8960
Estadístico de contraste (0.5 p) 𝑠̂⁄ 2.449⁄
√𝑛 √9
𝑇0 ~ 𝑡8
Si la distribución es incorrecta: 0 p.
Si los tres apartados anteriores (hipótesis, estadístico y distribución) son correctos, se continúa
con la corrección.
𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0.01
p -valor del contraste (0.5 p)
(0.5 p)
OPCIÓN 1:
OPCIÓN 2:
Responda:
• ¿Acepto o rechazo Ho?
• ¿Se puede afirmar que el tiempo
medio es menor que 30.3641 JUSTIFICACIÓN: el estadístico de contraste se encuentra en
minutos? la región de rechazo (< -1.397).
Hipótesis H0 H1
FIRMA
3. Una empresa productora se encuentra realizando una inspección de su proceso, debido a recientes quejas de
sus clientes. Se toma una muestra de 250 artículos, de los cuales 10 resultan defectuosos.
a. Realice un contraste de hipótesis para comprobar si, a partir de los datos, es posible afirmar que la proporción
de defectuosos es mayor que 3%. Para ello, complete la información que se pide en la siguiente tabla:
b.
𝑯𝟎 : 𝒑 ≤ 𝟎. 𝟎𝟑 𝑯𝟏 : 𝒑 > 𝟎. 𝟎𝟑
𝑝̂ − 𝑝0 0.04 − 0.03
𝑍0 = = = 0.9269
𝑝0 𝑞0
√0.03 × 0.97
Estadístico de contraste (0.5 p)
√
𝑛 250
𝑍0 ~ 𝑁(0,1)
Si la distribución es incorrecta: 0 p.
Si los tres apartados anteriores (hipótesis, estadístico y distribución) son correctos, se continúa
con la corrección.
c. Utilizando un intervalo de confianza, compruebe, con base en los datos, si es posible afirmar que la proporción
de defectuosos poblacional es del 3.5%. Utilice una precisión de 4 decimales en el intervalo de confianza. (2 p)
𝑝̂ 𝑞̂
𝐼. 𝐶. (0.95): 𝑝 ∈ {𝑝̂ ± 𝑧𝛼⁄2 × √ }
𝑛
0.04 × 0.96
𝐼. 𝐶. (0.95): 𝑝 ∈ {0.04 ± 1.96 × √ }
250
Sí es posible afirmar que la proporción tiene un valor de 3.5% porque dicho valor se encuentra dentro del
intervalo de confianza. (1 p)
4. Decir si las siguientes afirmaciones son verdaderas (V) o falsas (F). Contesta en la tabla siguiente. No
necesitas justificar. Respuesta correcta +0.5, incorrecta -0.5. (máximo 2 puntos)
Si tenemos 40 datos, y obtenemos con ellos que 𝑝̂ = 0.05, no podremos hacer un contraste de
1 V
hipótesis de una proporción asumiendo muestras grandes.
Si la proporción poblacional sigue una distribución normal, siempre podremos hacer un contraste
2 F
de hipótesis sobre una proporción para cualquier tamaño muestral.
Dado un tamaño muestral, el margen de error de un intervalo de confianza de una proporción será
3 V
mayor si p=0.4 que si p=0.2
Si al realizar un contraste rechazo que 𝑝 ≥ 0.5, el pvalor del contraste con 𝐻0 : 𝑝 ≤ 0.5 tendrá un
4 V
pvalor mayor que 0.05.
Sólo podemos usar la distribución t de Student para el contraste de una media si la muestra es
5 F
pequeña y la población es Normal
SOLUCIÓN:
1- V. En ese caso 𝑛𝑝̂ (1 − 𝑝̂ ) = 1.9 < 5 por lo que la aproximación a la normal no es satisfactoria.
2- F. La proporción poblacional será un número, y no una variable aleatoria.
3- El margen de error del intervalo es
𝑝(1 − 𝑝)
1.96√
𝑛
y es tanto mayor cuanto más próximo esté 𝑝 a 0.5. Para 𝑝 = 0.4 será
1.96
0.4899
√𝑛
y para 𝑝 = 0.2 será
1.96
0.40
√𝑛
que es menor.
4- V.Si se rechaza que 𝑝 ≥ 0.5 es porque 𝑝̂ ≪ 0.5 . Por tanto, si con ese valor tomamos 𝐻0 = 𝑝 ≤ 0.5 no
podríamos rechazarlo, pues los datos están del lado de 𝐻0 . El pvalor será mucho mayor que 0.05.
5- F. Podremos usar la t de Student si la población es normal, aunque la muestra sea pequeña.
APELLIDOS:______________________________________________NOMBRE:_________________________
NOTA Sección:___________________
.
FIRMA
5. Se desea comparar dos tipos de mezclas distintas para la elaboración de concreto. Cada mezcla
tiene una formulación diferente de sus agregados. Para compararlos, se elabora con cada mezcla
un conjunto de probetas (probeta=cilindro recto de 15 cm. de diámetro y 30 cm. de alto) y se mide
la presión a la que se rompen. Para la mezcla M1 se construyeron 62 probetas, con las que se obtuvo
una resistencia media de 39.12 con cuasidesviación típica de 16. Para la mezcla M2 se construyeron
40 probetas, con la que se obtuvo una media muestral de 30.24 y una cuasidesviación típica de 14.
Asumiendo que la resistencia de las probetas sigue una distribución normal, y que las varianzas
poblacionales para ambas mezclas es la misma, contrasta si la mezcla M1 tiene una mayor
resistencia media que la mezcla M2. Para ello, complete la información que se pide en la siguiente
tabla:
Hipótesis (1 p) 𝑯𝟎 : 𝝁𝟏 ≤ 𝝁𝟐 𝑯𝟏 : 𝝁𝟏 > 𝝁𝟐
Estadístico de contraste (1 p)
𝑥̅1 − 𝑥̅2 8.8800
𝑡= = = 2.8710
Indique el símbolo que lo representa, su 1 1 1 1
𝑆̂𝑇 √ + 15.2512√ +
fórmula, y su valor numérico. Utilice una 𝑛1 𝑛2 62 40
precisión de 4 decimales.
Valor crítico (1 p)
1.660
Responda:
• RESULTADO: Se Rechaza H0 Por tanto sí hay evidencia suficiente
• ¿Acepto o rechazo Ho?
para pensar que la mezcla M1 es mejor. (0.5p)
• ¿Se puede afirmar que la mezcla M1
es mejor?
• JUSTIFICACIÓN:Como t=2.8710>1.660 nos encontramos en la
Debe justificar su conclusión. región de rechazo. Además, el pvalor es menor que el nivel de
significación del %5.
(basta con que lo justifiquen sólo con el pvalor o con el valor crítico)
NOTA REVISADA FIRMA ESTADÍSTICA BÁSICA
SEMESTRE 2017-II
PRACTICA 4
27/10/2017
APELLIDOS:______________________________________________NOMBRE:_____________________________
Sección:___________________
Contesta cada pregunta sólo en la hoja de su enunciado, por ambas caras. Usa el cuadernillo sólo como borrador. El cuadernillo se entrega,
pero no se corrige. Entrega cada pregunta por separado, y el cuadernillo.
Cuando se solicite reclamo de esta práctica, deberá adjuntarse copia de la solución que se publique. El reclamo deberá basarse en errores
de corrección en base a esa esa solución.
NOTA 1. Para elaborar cierto artículo se han de cubrir dos etapas (ver figura) cuyas duraciones, X e Y, son variables
aleatorias.
Etapa 1 Etapa 2
FIRMA X Y
X
La duración de la primera etapa se distribuye como una normal:X𝑋 ∼ 𝑁(𝜇, 1). La duración de la segunda etapa
es una exponencial: 𝑌 ∼ 𝐸𝑥𝑝 (1⁄3𝜇). Se desea estimar el parámetro 𝜇 empleando el método de los momentos.
Con ese fin se ha cronometrado el tiempo que demora la fabricación de 5 artículos, obteniéndose los siguientes
resultados:
artículo X Y
1 2 7
2 3 8
3 4 10
4 2 6
5 3 9
a) Utilizando sólo la muestra de 𝑋 halla el estimador de 𝜇 por el método de los momentos, así como la
estimación que se obtiene con la muestra. (1p)
En el método de los momentos relacionamos los parámetros que queremos estimar con los momentos
de la variable aleatoria.
𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5
𝐸(𝑋) = 𝜇 ⇒ 𝜇̂ = 𝑥̅ = (0.75)
5
La estimación será:
2+3+4+2+3
𝑥̅ = = 2.8 (0.25)
5
b) Utilizando sólo la muestra de Y, halla el estimador de 𝜇 por el método de los momentos, así como la
estimación que se obtiene con la muestra. (2p)
𝑦̅ 1 𝐸(𝑌) 3𝜇
𝐸(𝜇̂ ) = 𝐸 ( ) = 𝐸(𝑦̅) = = = 𝜇. (1.5)
3 3 3 3
2. A continuación, se enuncia un conjunto de hipótesis sobre los valores poblacionales de las duraciones
de estas tareas. Escribe en términos estadísticos, la hipótesis nula y alternativa que corresponden con
cada una de estas hipótesis. (Respuesta correcta +0.5).(3p) (no necesitas justificar)
Hipótesis H0 H1
𝜇𝑦 ≥ 9 ⇒ 𝜇 ≥ 3 𝜇𝑦 < 9 ⇒ 𝜇 < 3
La duración media de la tarea Y es menor de 9.
(ambas son válidas) (ambas son válidas)
FIRMA
3. Se realiza un estudio sobre la estatura de los ciudadanos de un país. Se toma una muestra de 225
individuos y, de esta muestra, se obtienen una media de 166 cm y una varianza de 35.
SOLUCIÓN
𝑥̅ = 166
𝑠̂ 2 = 35
𝑛 = 225
𝑠̂ √35
𝐼. 𝐶. (0.95): {𝑋̅ ± 𝑧0.025 } = {166 ± 1.96 }
√𝑛 √225
Puntaje:
b. ¿Cuál debería ser el tamaño muestral para, con un nivel de confianza de 95%, tener un margen
de error máximo de 0.4 cm? (1.5 p)
2
𝑠̂ 2 √35
𝑛 = (𝑧0.025 ) = (1.96 × ) = 840.35 ≈ 841 (𝟏. 𝟓/𝟏. 𝟓 𝒑)
𝐿 0.4
SOLUCIÓN
𝑠̂ √35
𝐿 = 0.6 = 𝑧𝛼⁄2 → 0.6 = 𝑧𝛼⁄2 ×
√𝑛 √225
FIRMA
5. Una empresa productora de perfumes vendidos por catálogo se encuentra realizando un estudio
sobre el número de perfumes adquiridos por cada comprador. El objetivo del estudio es averiguar si
la última campaña promocional ha logrado aumentar el número promedio histórico de perfumes
adquiridos por compra, que es de 2.5 perfumes por compra. De un total de 100 compras analizadas,
se obtuvieron los siguientes datos en el estudio:
Número de Número de
perfumes adquiridos compras
1 25
2 25
3 35
4 15
a. Con base en la información del estudio, ¿se puede afirmar que la campaña promocional ha cumplido
su cometido? (2 p)
𝑥̅ = 2.4
𝑠̂ 2 = 1.0505 → 𝑠̂ = 1.0249
No hay puntaje solo por calcular estos valores.
Se acepta 𝐻0 salvo que los datos hagan lo que dice 𝐻1 de forma muy evidente. Es decir, sólo
rechazaremos 𝐻0 si 𝑥̅ ≫ 2.5 . Como 𝑥̅ = 2.4 < 2.5 los datos no contradicen a 𝐻0 por lo que la
conclusión del contraste es de aceptación de 𝐻0 . No hay evidencia de que la campaña haya
funcionado. (los alumnos que hayan respondido esto, tienen ya el puntaje completo: 2p)
Si no han realizado ningún contraste y solo han concluido que la media no ha aumentado porque
̅ = 𝟐. 𝟒 es menor que 𝟐. 𝟓, el puntaje es 0.25 p.
𝒙
𝑥̅ − 𝜇0 2.4 − 2.5
𝑡0 = = = −0.9756 (𝟎. 𝟓 𝒑)
𝑠̂⁄ 1.0249⁄
√𝑛 √100
III. Se define la distribución del estadístico de contraste. Al ser muestra grande se tiene que:
𝑇0 ~𝑁(0,1)
Nota: si han partido de una mala definición de hipótesis en la primera parte (I), esta parte (IV) también
será incorrecta (0 puntos en ambas partes).
b. Realice un contraste de hipótesis con un nivel de significación del 3% y averigüe si la media del
número de perfumes adquiridos por compra ha cambiado. (2 p)
𝑥̅ − 𝜇0 2.4 − 2.5
𝑡0 = = = −0.9756 (𝟎. 𝟓 𝒑, 𝑝𝑢𝑒𝑑𝑒𝑛 𝑢𝑠𝑎𝑟𝑙𝑜 𝑑𝑒𝑙 𝑎𝑝𝑎𝑟𝑡𝑎𝑑𝑜 "𝑎")
𝑠̂⁄ 1.0249⁄
√𝑛 √100
𝑇0 ~𝑁(0,1)
Nota: si han partido de una mala definición de hipótesis en la primera parte (I), esta parte (IV) también
será incorrecta (0 puntos en ambas partes).
Entonces, como la hipótesis nula es 𝜇 = 2.5, y dicha media hipotética (2.5) se encuentra dentro del intervalo
se puede concluir lo siguiente:
Se acepta 𝐻0 ; es decir, no hay suficiente evidencia para afirmar que la media ha cambiado.
6. Sea 𝑋 una variable aleatoria de media 𝜇 y varianza 𝜎 2 . Sea el nivel de significación 𝛼 = 0.05. Decir si
las siguientes afirmaciones son verdaderas (V) o falsas (F). Contesta en la tabla siguiente. No necesitas
justificar. Respuesta correcta +0.5, incorrecta -0.5. (máximo 2 puntos)