Final EDB 2016 I Solucion

ESTADÍSTICA BÁSICA
SEMESTRE 2016-I
EXAMEN FINAL
LUNES, 4 DE JULIO DE 2016
Nombre:___________________________________________________________________________
Sección:___________________
Sólo se permiten las tablas y formulario que se entregan con el examen. 𝛼 = 0.05
LOS PROBLEMAS 2 Y 3 DEBEN ENTREGARSE EN UN CUADERNILLO DIFERENTE AL PROBLEMA 1
1. La Universidad de Piura ha realizado la migración del sistema de mensajería a la plataforma Office 365, de
Microsoft. Sin embargo, el área de Tecnologías de Información ha detectado que las herramientas ofrecidas
por dicha plataforma no están siendo aprovechadas eficientemente. Para ello, se realizó un estudio con el fin
de medir tres aspectos importantes: (1) porcentaje de trabajadores que usan el sistema de comunicación
interna, (2) número de horas que un trabajador invierte en el envío de mensajes a través del correo
electrónico, y (3) número de días a la semana en que un alumno accede a su cuenta de Pregrado.
Por información histórica se conoce lo siguiente:

• El 65% de trabajadores ha venido usando el sistema informático de comunicación interna (chat),
pero se espera que dicho porcentaje aumente con la campaña de difusión que se hizo del nuevo
sistema de mensajería Skype For Business.
• Antes de la migración a la nueva plataforma, el tiempo invertido por un trabajador en enviar
mensajes por correo electrónico se distribuía normalmente con media 2.5 y varianza 0.5.
• No se cuenta con información respecto a la frecuencia de acceso (número de días a la semana) de un
alumno de Pregrado a su cuenta de correo electrónico.
El estudio sobre el nuevo sistema se llevó a cabo en colaboración con los alumnos de Estadística, realizándose
81 encuestas a trabajadores y 110 encuestas a alumnos de Pregrado. Algunos de los resultados se muestran a
continuación:
Tabla 1. Número de trabajadores que usan el sistema Tabla 3. Número de días a la semana (de 7 días) que
de comunicación interna (Resultado de la encuesta). un alumno accede a su cuenta de correo electrónico
de Pregrado (Resultado de la encuesta)
Respuesta Frecuencia
Número de
Sí usa 47 Frecuencia
días
No usa 34 0 5
1 15
Tabla 2. Estadísticas descriptivas de la muestra de la
variable tiempo de uso del correo electrónico por un
2 24
trabajador (Resultado de la encuesta). 3 30
4 23
Parámetro Valor 5 10
Media 2.71 6 2
Cuasidesviación 7 1
0.85
estándar
En base a estos datos, se le pide responder las siguientes cuestiones:
a) ¿Se puede afirmar que la campaña de difusión de Skype For Business ha aumentado el uso del sistema
de comunicación interna en los trabajadores? 2p.
b) A partir de los datos de la encuesta, elabore un intervalo de confianza para el número medio de horas
que un trabajador invierte en usar el correo electrónico con el nuevo sistema. 1p.
c) En base a dicho intervalo (apartado b), ¿es posible afirmar que la media ha cambiado respecto al
sistema anterior? Fundamente brevemente su respuesta. 2p.
d) ¿Cuántas encuestas se deben realizar como mínimo para reducir a la mitad el margen de error del
intervalo de confianza calculado en el apartado b? 1p.
e) Un analista considera que el número de días de la semana que un alumno accede a su cuenta de correo
puede modelizarse como una binomial. A la vista de los datos de la encuesta ¿es aceptable la hipótesis
de este analista? 4p.
1
SOLUCIÓN:
a) (2p) Como 𝑛𝑝̂ (1 − 𝑝̂ ) = 19.73 > 5 podemos usar la aproximación a la normal para la proporción
muestral. Se realiza un contraste de hipótesis unilateral, para el cual se establecen las siguientes
hipótesis:
𝐻0 : 𝑝 ≤ 0.65
𝐻1 : 𝑝 > 0.65
𝑝̂ = 0.5802
𝑞� = 0.4198
𝑝𝑝
𝑝̂ ~ 𝑁 �𝑝, �
𝑛
→ 𝑝̂ ~ 𝑁 (0.65, 0.0028)
0.5802 − 0.65
𝑧= ≈ −1.32
√0.0028
1.65
Como -1.32 < 1.65 se acepta la hipótesis nula, y por tanto que la proporción no ha aumentado, es
decir, que la campaña no ha sido efectiva. De hecho, como p� = 0.5802 ≤ 0.65, está del lado de la
hipótesis nula, y por tanto no habría hecho falta realizar ningún cálculo adicional para concluir que
aceptamos H0 . Sólo se va a rechazar H0 si los datos hacen lo que dice H1 ( es decir, si p� > 0.65) de
forma muy marcada.
b) (1 p) Como n > 30, se puede considerar a la muestra como grande y utilizar que 𝑥̅ se distribuye como
una normal, que es en lo que se fundamenta el intervalo de confianza para 𝜇 en muestras grandes.
0.85
𝐼𝐼 (0.95): 𝜇 ∈ 2.71 ± 1.96 = [2.5249, 2.8951]
√81
Otras alternativas válidas: usando la varianza poblacional, pues no se ha demostrado (aún) que la
varianza haya cambiado, o usando la t de Student.
0.7071
𝐼𝐼 (0.95): 𝜇 ∈ 2.71 ± 1.96 = [2.5560, 2.8640]
√81
0.85
𝐼𝐼 (0.95): 𝜇 ∈ 2.71 ± 1.99 = [2.5221, 2.8979]
√81
c) (2p) Un intervalo de confianza de nivel de confianza 1 − 𝛼 es equivalente a un contraste bilateral de

nivel de significación 𝛼, de manera que los valores del interior del intervalo son valores de 𝐻0 que no se
pueden rechazar. En nuestro caso, el valor 2.5 se encuentra fuera del intervalo de confianza. Por lo
tanto, rehazamos 𝐻0 y consideramos que, con un nivel de significación del 5% la media ha cambiado.
(1 p por procedimiento con contraste de hipótesis completo, se pidió evaluar “en base al intervalo”).
d) (1 p) Se tiene que reducir a la mitad el margen de error L:
0.85
𝐿 = 1.96 = 0.1851
√81
El nuevo margen de error debe ser:
0.1851
𝐿′ = = 0.0926
2
El nuevo tamaño muestral debe ser:
1.96 × 0.85 2
𝑛= � � ≈ 324 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
0.0926
2
1.96 ×0.7071 2 1.99 ×0.85 2
Otras alternativas válidas: 𝑛 = � � ≈ 325 𝑒𝑒𝑒𝑒𝑒𝑒𝑒͊𝑎𝑎 ; 𝑛 = � � ≈ 324 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
0.0940 0.0770
e) La variable aleatoria que nos ocupa es 𝑋 =número de días de la semana (de 7 días) que un alumno
consulta el correo electrónico. Se tiene que 𝑋 = 0,1,2,3,4,5,6,7. Se pide realizar una prueba de bondad
de ajuste binomial, es decir, se quiere contrastar a partir de una muestra si
𝑋 ∼ 𝐵(𝑛 = 7, 𝑝)
El contraste es:
𝐻0 : 𝑋 ~ 𝐵 (7, 𝑝)
𝐻1 : 𝑋 ≁ 𝐵 (7, 𝑝)
Para realizar el contraste, se tiene una muestra de 110 individuos, cada uno estudiado como una
semana en la que se pueden ingresar de 0 a 7 días por semana al correo Pregrado. En primer lugar, se
estima el parámetro p:
0 × 5 + 1 × 15 + 2 × 24 + 3 × 30 + 4 × 23 + 5 × 10 + 6 × 2 + 7 × 1
µ� = = 2.8545
110
2.8545
µ� = np� → 𝑝̂ = = 0.4078 (1p)
7
(3p) El resto del procedimiento se ha calificado de acuerdo al valor de p calculado en cada caso.
A continuación, se realiza la prueba ji-cuadrado:
Factor
X Oi p(x) Ei Clase Oi Ei (𝑶𝒊 − 𝑬𝒊 )𝟐
𝑬𝒊
0 5 0.0255 2.81
[0-1] 20 16.3538 0.8129
1 15 0.1231 13.54
2 24 27.9801 0.5661
2 24 0.2544 27.98
3 30 32.1126 0.1389
3 30 0.2919 32.11
4 23 0.2010 22.11 4 23 22.1134 0.0356
5 10 0.0831 9.14 [5-7] 13 11.4401 0.2127
6 2 0.0191 2.10 5
7 1 0.0019 0.21 2
(𝑶𝒊 − 𝑬𝒊 )𝟐
𝑋 = � = 1.7663
𝑬𝒊
1
Como no todas las frecuencias esperadas son mayores
que 5, se agrupan las clases.
Número de grados de libertad: 𝑔 = 𝑘 – 𝑣 – 1 = 5 – 1 – 1 = 3 𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙. El valor crítico es

2
𝜒(3;0.05) = 7.81 . Finalmente, como 𝑋 2 es menor que 7.81, se acepta, con 𝛼 = 0.05, la hipótesis nula; es
decir, que los datos se distribuyen como una binomial 𝐵 (7, 0.4078).
3
2. Se tienen datos de un conjunto de alumnos de cierta asignatura del pasado semestre. En este curso, que
cuenta con dos secciones, se encuentran alumnos que pertenecen a 3 programas académicos diferentes.
Para cada alumno se tiene la siguiente información:
• SecBin: sección de la asignatura en la que está matriculado. 0: sección A, 1: sección B.

• IA: índice acumulado (nota media de las asignaturas cursadas por el alumno).
• Vez: número de veces que se ha matriculado en esta asignatura: 1,2,3,...
• ProgAc: programa académico en el que está matriculado: 1, 2 ó 3.
• P1: binaria. Vale 1 si el alumno pertenece al programa académico 1 y 0 en caso contrario.
• P2: binaria. Similar a P1 pero para el programa académico 2.
• P3: binaria. Similar a P1 y P2 pero para el programa académico 3.
A continuación se proporcionan los resultados de Minitab para un conjunto de modelos.
1-Análisis de regresión: IA vs. SecBin 2-Análisis de regresión: IA vs. ProgAc
Predictor Coef SE Coef T P Predictor Coef SE Coef T P

Constante 11,6990 0,1573 74,39 0,000 Constante 11,4465 0,2801 40,87 0,000
SecBin -0,6235 0,2224 -2,80 0,006 ProgAc -0,0337 0,1458 -0,23 0,817
3-Análisis de regresión: IA vs. P1; P3 4-Análisis de regresión: IA vs. Vez
Predictor Coef SE Coef T P Predictor Coef SE Coef T P

Constante 11,0202 0,4075 27,04 0,000 Constante 12,5920 0,2813 44,76 0,000
P1 0,4829 0,4682 1,67 0,198 Vez -1,0006 0,2009 -4,63 0,000
P3 0,9147 0,5261 1,74 0,036
Para cada una de las siguientes cuestiones, contesta si es verdadera o falsa, justificando la respuesta. (6p)
a) No hay diferencias significativas entre el IA de cada sección.

b) En la sección A tienen un IA medio de 11,6990.
c) No hay diferencias significativas en el IA de los distintos programas académicos.
d) El programa académico 3 es el que tiene mayor IA medio.
e) El programa académico 2 tiene un IA significativamente menor que el 1.
f) Por término medio los alumnos que se matriculan por primera vez en esta asignatura tienen un
punto de IA menos que los que lo hacen por segunda o tercera vez.
SOLUCIÓN:
a) FALSO. El modelo 1 tiene como variable explicativa SecBin, que es binaria. Cuando SecBin=0, el modelo
proporciona el IA medio de la sección A, que resulta ser 𝛽̂0 = 11.699. Cuando SecBin=1, e modelo
proporciona la media para la sección B, que resulta ser 𝛽̂0 + 𝛽̂1 = 11.699 − 0.6235 = 11.0755. El pvalor
del coeficiente 𝛽̂1 , correspondiente a la variable binaria SecBin es 0.006, que es muy bajo. Por lo tanto
rechazamos la 𝐻0 : 𝛽1 = 0. Por tanto, hay diferencias significativas en el IA medio de cada sección. Por
término medio, los alumnos de la sección B (SecBin=1) tienen 0.6235 puntos menos de IA. La diferencia es
lo suficientemente grande como para pensar que se deba al azar del muestreo.
b) VERDADERO. El IA de la sección A corresponde al caso SecBin=0, por lo que el resultado de la regresión,

que proporciona el valor medio de la variable respuesta, es 11.699.
• Valor medio cuando SecBin=0: 𝐼𝐼 ��0 = 𝐸� (𝐼𝐼|SecBin = 0) = 𝛽̂0 + 𝛽̂1 × 0 = 𝛽̂0 = 11.699
• Valor medio cuando SecBin=1: 𝐼𝐼 ��1 = 𝐸� (𝐼𝐼|SecBin = 1) = 𝛽̂0 + 𝛽̂1 × 1 = 𝛽̂0 + 𝛽̂1 =
11.699 − 0.6235 = 11.0755
c) FALSO. La regresión 3 tiene las variables binarias P1 y P3, y no tiene P2. Por tanto, el término constante
nos proporciona la media del grupo P2, mientras que los otros coeficientes nos muestran las diferencias
en la media de IA de los programas 1 y 3, respectivamente, respecto del programa 2. El pvalor del
4
coeficiente de P3 en la regresión 3 es muy bajo (0.036 < 0.05), por lo que hay diferencias significativas
entre el IA medio del programa académico 3 y el del programa académico 2. La diferencia es de casi un
punto a favor del programa 3. (La regresión 2 no es interpretable, pues la variable ProgAc es cualitativa. La
regresión 2 no tiene sentido).
d) VERDADERO. La media de cada programa académico dentro de la muestra analizada es:

• Programa académico 1: P1=1, P3=0
��𝑃1 = 11.0202 + 0.4829 × 1 + 0.9147 × 0 = 11.5031.
𝐼𝐼
��𝑃2 = 11.0202 + 0.4829 × 0 + 0.9147 × 0 = 11.0202.
𝐼𝐼
��𝑃3 = 11.0202 + 0.4829 × 0 + 0.9147 × 1 = 11.9349.
𝐼𝐼
Por tanto, en esta muestra, la media muestral del IA del programa académico 3 es la mayor.
e) FALSO. En la regresión 3, la diferencia entre el IA medio de los programas 1 y 2 no es significativa, pues el

pvalor de la variable P1 es muy alto (0.198 > 0.05). Por tanto, la diferencia de 0.4829 que se ha
encontrado en la muestra no es significativa, y puede explicarse por el azar del muestreo. No es
extrapolable a toda la población.
f) FALSO. Según el modelo 4, cada vez que se repite, el IA medio tiende a bajar un punto, y no a subir. Los
que repiten una vez tienen un punto menos, y los que repiten dos veces, dos puntos menos en el IA medio
respecto de los que se matriculan por primera vez.
3. Un proceso productivo consta de dos etapas, cuyas duraciones respectivas, X1 y X2 , son variables
aleatorias independientes, distribuidas según un modelo exponencial de parámetros λ y 2λ,
respectivamente. Es decir, X1 ∼ Exp(λ), X2 ∼ Exp(2λ). La duración total del proceso puede entonces
escribirse como la variable aleatoria T = X1 + X 2 . Se tiene una muestra de los tiempos totales T que se
invirtió en la fabricación de 5 artículos: t1 = 12; t 2 = 8; t 3 = 9; t 4 = 19; t 5 = 11. Se pide, razonando las
respuestas:
a) Obtén el estimador de λ por el método de los momentos, basado en una muestra aleatoria simple
𝑡1 , 𝑡2 , … , 𝑡𝑛 de T.
b) Usando este estimador y los datos del enunciado, calcula la estimación de λ.
SOLUCIÓN:
a. El método de los momentos obtiene estimadores de los parámetros a partir de estimar los
momentos poblacionales con los muestrales. El primer momento poblacional de 𝑇 es:
1 1 3
𝜇 𝑇 = 𝐸(𝑇) = 𝐸(𝑋1 + 𝑋2 ) = 𝐸(𝑋1 ) + 𝐸(𝑋2 ) = + = .
𝜆 2𝜆 2𝜆
Por tanto,
3
𝜆= .
2𝜇 𝑇
El estimador será:
3 3𝑛
⇒ 𝜆̂ = = .
2𝑡̅ 2 ∑𝑛𝑖=1 𝑡𝑖
b. La estimación es
3𝑛 3×5
𝜆̂ = 𝑛 = = 0.1271
2 ∑𝑖=1 𝑡𝑖 2(12 + 8 + 9 + 19 + 11)

Final EDB 2016 I Solucion

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Final EDB 2016 I Solucion

Cargado por

Copyright:

Formatos disponibles

ESTADÍSTICA BÁSICA

Por información histórica se conoce lo siguiente:

En base a estos datos, se le pide responder las siguientes cuestiones:

c) (2p) Un intervalo de confianza de nivel de confianza 1 − 𝛼 es equivalente a un contraste bilateral de

d) (1 p) Se tiene que reducir a la mitad el margen de error L:

Número de grados de libertad: 𝑔 = 𝑘 – 𝑣 – 1 = 5 – 1 – 1 = 3 𝑔𝑔𝑔𝑔𝑔𝑔 𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙. El valor crítico es

• SecBin: sección de la asignatura en la que está matriculado. 0: sección A, 1: sección B.

A continuación se proporcionan los resultados de Minitab para un conjunto de modelos.

1-Análisis de regresión: IA vs. SecBin 2-Análisis de regresión: IA vs. ProgAc

Predictor Coef SE Coef T P Predictor Coef SE Coef T P

Predictor Coef SE Coef T P Predictor Coef SE Coef T P

a) No hay diferencias significativas entre el IA de cada sección.

b) VERDADERO. El IA de la sección A corresponde al caso SecBin=0, por lo que el resultado de la regresión,

d) VERDADERO. La media de cada programa académico dentro de la muestra analizada es:

e) FALSO. En la regresión 3, la diferencia entre el IA medio de los programas 1 y 2 no es significativa, pues el

También podría gustarte