Documentos de Académico
Documentos de Profesional
Documentos de Cultura
SEMESTRE 2016-I
EXAMEN FINAL
LUNES, 4 DE JULIO DE 2016
Nombre:___________________________________________________________________________
Sección:___________________
Sólo se permiten las tablas y formulario que se entregan con el examen. 𝛼 = 0.05
LOS PROBLEMAS 2 Y 3 DEBEN ENTREGARSE EN UN CUADERNILLO DIFERENTE AL PROBLEMA 1
1. La Universidad de Piura ha realizado la migración del sistema de mensajería a la plataforma Office 365, de
Microsoft. Sin embargo, el área de Tecnologías de Información ha detectado que las herramientas ofrecidas
por dicha plataforma no están siendo aprovechadas eficientemente. Para ello, se realizó un estudio con el fin
de medir tres aspectos importantes: (1) porcentaje de trabajadores que usan el sistema de comunicación
interna, (2) número de horas que un trabajador invierte en el envío de mensajes a través del correo
electrónico, y (3) número de días a la semana en que un alumno accede a su cuenta de Pregrado.
El estudio sobre el nuevo sistema se llevó a cabo en colaboración con los alumnos de Estadística, realizándose
81 encuestas a trabajadores y 110 encuestas a alumnos de Pregrado. Algunos de los resultados se muestran a
continuación:
Tabla 1. Número de trabajadores que usan el sistema Tabla 3. Número de días a la semana (de 7 días) que
de comunicación interna (Resultado de la encuesta). un alumno accede a su cuenta de correo electrónico
de Pregrado (Resultado de la encuesta)
Respuesta Frecuencia
Número de
Sí usa 47 Frecuencia
días
No usa 34 0 5
1 15
Tabla 2. Estadísticas descriptivas de la muestra de la
variable tiempo de uso del correo electrónico por un
2 24
trabajador (Resultado de la encuesta). 3 30
4 23
Parámetro Valor 5 10
Media 2.71 6 2
Cuasidesviación 7 1
0.85
estándar
a) ¿Se puede afirmar que la campaña de difusión de Skype For Business ha aumentado el uso del sistema
de comunicación interna en los trabajadores? 2p.
b) A partir de los datos de la encuesta, elabore un intervalo de confianza para el número medio de horas
que un trabajador invierte en usar el correo electrónico con el nuevo sistema. 1p.
c) En base a dicho intervalo (apartado b), ¿es posible afirmar que la media ha cambiado respecto al
sistema anterior? Fundamente brevemente su respuesta. 2p.
d) ¿Cuántas encuestas se deben realizar como mínimo para reducir a la mitad el margen de error del
intervalo de confianza calculado en el apartado b? 1p.
e) Un analista considera que el número de días de la semana que un alumno accede a su cuenta de correo
puede modelizarse como una binomial. A la vista de los datos de la encuesta ¿es aceptable la hipótesis
de este analista? 4p.
1
SOLUCIÓN:
a) (2p) Como 𝑛𝑝̂ (1 − 𝑝̂ ) = 19.73 > 5 podemos usar la aproximación a la normal para la proporción
muestral. Se realiza un contraste de hipótesis unilateral, para el cual se establecen las siguientes
hipótesis:
𝐻0 : 𝑝 ≤ 0.65
𝐻1 : 𝑝 > 0.65
𝑝̂ = 0.5802
𝑞� = 0.4198
𝑝𝑝
𝑝̂ ~ 𝑁 �𝑝, �
𝑛
→ 𝑝̂ ~ 𝑁 (0.65, 0.0028)
0.5802 − 0.65
𝑧= ≈ −1.32
√0.0028
1.65
Como -1.32 < 1.65 se acepta la hipótesis nula, y por tanto que la proporción no ha aumentado, es
decir, que la campaña no ha sido efectiva. De hecho, como p� = 0.5802 ≤ 0.65, está del lado de la
hipótesis nula, y por tanto no habría hecho falta realizar ningún cálculo adicional para concluir que
aceptamos H0 . Sólo se va a rechazar H0 si los datos hacen lo que dice H1 ( es decir, si p� > 0.65) de
forma muy marcada.
b) (1 p) Como n > 30, se puede considerar a la muestra como grande y utilizar que 𝑥̅ se distribuye como
una normal, que es en lo que se fundamenta el intervalo de confianza para 𝜇 en muestras grandes.
0.85
𝐼𝐼 (0.95): 𝜇 ∈ 2.71 ± 1.96 = [2.5249, 2.8951]
√81
Otras alternativas válidas: usando la varianza poblacional, pues no se ha demostrado (aún) que la
varianza haya cambiado, o usando la t de Student.
0.7071
𝐼𝐼 (0.95): 𝜇 ∈ 2.71 ± 1.96 = [2.5560, 2.8640]
√81
0.85
𝐼𝐼 (0.95): 𝜇 ∈ 2.71 ± 1.99 = [2.5221, 2.8979]
√81
0.85
𝐿 = 1.96 = 0.1851
√81
El nuevo margen de error debe ser:
0.1851
𝐿′ = = 0.0926
2
El nuevo tamaño muestral debe ser:
1.96 × 0.85 2
𝑛= � � ≈ 324 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
0.0926
2
1.96 ×0.7071 2 1.99 ×0.85 2
Otras alternativas válidas: 𝑛 = � � ≈ 325 𝑒𝑒𝑒𝑒𝑒𝑒𝑒͊𝑎𝑎 ; 𝑛 = � � ≈ 324 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
0.0940 0.0770
e) La variable aleatoria que nos ocupa es 𝑋 =número de días de la semana (de 7 días) que un alumno
consulta el correo electrónico. Se tiene que 𝑋 = 0,1,2,3,4,5,6,7. Se pide realizar una prueba de bondad
de ajuste binomial, es decir, se quiere contrastar a partir de una muestra si
𝑋 ∼ 𝐵(𝑛 = 7, 𝑝)
El contraste es:
𝐻0 : 𝑋 ~ 𝐵 (7, 𝑝)
𝐻1 : 𝑋 ≁ 𝐵 (7, 𝑝)
Para realizar el contraste, se tiene una muestra de 110 individuos, cada uno estudiado como una
semana en la que se pueden ingresar de 0 a 7 días por semana al correo Pregrado. En primer lugar, se
estima el parámetro p:
0 × 5 + 1 × 15 + 2 × 24 + 3 × 30 + 4 × 23 + 5 × 10 + 6 × 2 + 7 × 1
µ� = = 2.8545
110
2.8545
µ� = np� → 𝑝̂ = = 0.4078 (1p)
7
(3p) El resto del procedimiento se ha calificado de acuerdo al valor de p calculado en cada caso.
A continuación, se realiza la prueba ji-cuadrado:
Factor
X Oi p(x) Ei Clase Oi Ei (𝑶𝒊 − 𝑬𝒊 )𝟐
𝑬𝒊
0 5 0.0255 2.81
[0-1] 20 16.3538 0.8129
1 15 0.1231 13.54
2 24 27.9801 0.5661
2 24 0.2544 27.98
3 30 32.1126 0.1389
3 30 0.2919 32.11
4 23 0.2010 22.11 4 23 22.1134 0.0356
5 10 0.0831 9.14 [5-7] 13 11.4401 0.2127
6 2 0.0191 2.10 5
7 1 0.0019 0.21 2
(𝑶𝒊 − 𝑬𝒊 )𝟐
𝑋 = � = 1.7663
𝑬𝒊
1
Como no todas las frecuencias esperadas son mayores
que 5, se agrupan las clases.
3
2. Se tienen datos de un conjunto de alumnos de cierta asignatura del pasado semestre. En este curso, que
cuenta con dos secciones, se encuentran alumnos que pertenecen a 3 programas académicos diferentes.
Para cada alumno se tiene la siguiente información:
SOLUCIÓN:
a) FALSO. El modelo 1 tiene como variable explicativa SecBin, que es binaria. Cuando SecBin=0, el modelo
proporciona el IA medio de la sección A, que resulta ser 𝛽̂0 = 11.699. Cuando SecBin=1, e modelo
proporciona la media para la sección B, que resulta ser 𝛽̂0 + 𝛽̂1 = 11.699 − 0.6235 = 11.0755. El pvalor
del coeficiente 𝛽̂1 , correspondiente a la variable binaria SecBin es 0.006, que es muy bajo. Por lo tanto
rechazamos la 𝐻0 : 𝛽1 = 0. Por tanto, hay diferencias significativas en el IA medio de cada sección. Por
término medio, los alumnos de la sección B (SecBin=1) tienen 0.6235 puntos menos de IA. La diferencia es
lo suficientemente grande como para pensar que se deba al azar del muestreo.
c) FALSO. La regresión 3 tiene las variables binarias P1 y P3, y no tiene P2. Por tanto, el término constante
nos proporciona la media del grupo P2, mientras que los otros coeficientes nos muestran las diferencias
en la media de IA de los programas 1 y 3, respectivamente, respecto del programa 2. El pvalor del
4
coeficiente de P3 en la regresión 3 es muy bajo (0.036 < 0.05), por lo que hay diferencias significativas
entre el IA medio del programa académico 3 y el del programa académico 2. La diferencia es de casi un
punto a favor del programa 3. (La regresión 2 no es interpretable, pues la variable ProgAc es cualitativa. La
regresión 2 no tiene sentido).
f) FALSO. Según el modelo 4, cada vez que se repite, el IA medio tiende a bajar un punto, y no a subir. Los
que repiten una vez tienen un punto menos, y los que repiten dos veces, dos puntos menos en el IA medio
respecto de los que se matriculan por primera vez.
3. Un proceso productivo consta de dos etapas, cuyas duraciones respectivas, X1 y X2 , son variables
aleatorias independientes, distribuidas según un modelo exponencial de parámetros λ y 2λ,
respectivamente. Es decir, X1 ∼ Exp(λ), X2 ∼ Exp(2λ). La duración total del proceso puede entonces
escribirse como la variable aleatoria T = X1 + X 2 . Se tiene una muestra de los tiempos totales T que se
invirtió en la fabricación de 5 artículos: t1 = 12; t 2 = 8; t 3 = 9; t 4 = 19; t 5 = 11. Se pide, razonando las
respuestas:
a) Obtén el estimador de λ por el método de los momentos, basado en una muestra aleatoria simple
𝑡1 , 𝑡2 , … , 𝑡𝑛 de T.
b) Usando este estimador y los datos del enunciado, calcula la estimación de λ.
SOLUCIÓN:
a. El método de los momentos obtiene estimadores de los parámetros a partir de estimar los
momentos poblacionales con los muestrales. El primer momento poblacional de 𝑇 es:
1 1 3
𝜇 𝑇 = 𝐸(𝑇) = 𝐸(𝑋1 + 𝑋2 ) = 𝐸(𝑋1 ) + 𝐸(𝑋2 ) = + = .
𝜆 2𝜆 2𝜆
Por tanto,
3
𝜆= .
2𝜇 𝑇
El estimador será:
3 3𝑛
⇒ 𝜆̂ = = .
2𝑡̅ 2 ∑𝑛𝑖=1 𝑡𝑖
b. La estimación es
3𝑛 3×5
𝜆̂ = 𝑛 = = 0.1271
2 ∑𝑖=1 𝑡𝑖 2(12 + 8 + 9 + 19 + 11)