Está en la página 1de 9

PROBLEMAS DE ESTADISTICA

Nota: todos deben ser resuelto y con una breve explicación de cómo se resolvió el
problema

6-68: (se recomienda usar fórmula de probabilidad empírica)


fórmula de probabilidad empírica = Numero de veces el evento ocurre / total de números de
observación

Según la "teoría de enero", si el mercado de valores está al alza a finales de enero, también
estará "al alza" durante todo el año. Si está "bajo" a finales de enero, estará "bajo" durante todo
el año. En los últimos 34 años, esta teoría demostró ser cierta durante 29 años. Una teoría
diferente es que el cambio de mercado a finales de enero y el cambio de mercado a finales de
año no están relacionados. Específicamente, para cualquier cambio en el mercado en enero, la
probabilidad de que el mercado esté "al alza" o "a la baja" al final del año es igualmente
probable; es decir, la probabilidad es 0,5. Necesitará un paquete de software estadístico para
ayudarle a resolver este problema.
a. Con base en la historia, ¿cuál es la probabilidad de que un año termine con un mercado
"alcista" cuando enero termina con un mercado "alcista"?
b. Si el cambio de mercado de enero y el cambio de mercado de fin de año no están
relacionados, la probabilidad de que el mercado esté "al alza" con un enero "al alza" es 0,5.
Utilizando 0,5, ¿cuál es la probabilidad de que el mercado suba 29 años o más? ¿Cuál sería el
número medio de años que el mercado estará "al alza"?
C. Con base en el resultado del inciso (b), ¿cuál es su conclusión con respecto a la "teoría de
enero"?

a) La probabilidad de que un año termine con un mercado alcista cuando enero termina
con un mercado alcista es:
29
P(A)= ≈ 0.853
34
b) Dado que la probabilidad de que el mercado esté al alza con un enero al alza es de 0.5,
la probabilidad de que el mercado suba 29 años o más es la misma que la probabilidad
de que el mercado baje 29 años o más, que es:
P(B)=0.5
El número medio de años que el mercado estará al alza es:
Número medio de años=34×0.5=17
c) Basándonos en el resultado del inciso (b), la probabilidad de que el mercado suba 29
años o más (0.5) es mucho menor que la probabilidad histórica basada en la teoría de
enero (0.853). Esto sugiere que la teoría de enero tiene más credibilidad que la
suposición de que el cambio de mercado en enero y diciembre no están relacionados.
La conclusión es que la teoría de enero parece tener una base más sólida que la
suposición de independencia entre los cambios de mercado en enero y diciembre
7-50: Fast Service Truck Lines utiliza exclusivamente la Ford Super Duty F-750. La gerencia
hizo un estudio de los costos de mantenimiento y determinó que el número de millas recorridas
durante el año seguía la distribución normal. La media de la distribución fue de 60.000 millas y
la desviación estándar de 2.000 millas.
a. ¿Qué porcentaje de las Ford Super Duty F-750 registraron 65,200 millas o más?
b. ¿Qué porcentaje de los camiones recorrieron más de 57,060 pero menos de 58,280 millas?
C. ¿Qué porcentaje de los Ford recorrieron 62,000 millas o menos durante el año?
d. ¿Es razonable concluir que alguno de los camiones recorrió más de 70,000 millas? Explicar.

Dada una distribución normal con media μ=60 000 millas y desviación estándar σ=2 000 millas,
podemos calcular los valores z correspondientes para cada parte del problema y luego
consultar la tabla de la distribución normal estándar

a) Para calcular el porcentaje de camiones que registraron 65,200 millas o más, primero
calculamos el valor z correspondiente:

Consultando la tabla de la distribución normal estándar, encontramos que el área a la


derecha de z=2.6 es aproximadamente 0.0047. Por lo tanto, 0.47% de las Ford Super
Duty F-750 registraron 65 200 millas o más.

b) Para calcular el porcentaje de camiones que recorrieron más de 57 060 pero menos de
58 280 millas, primero calculamos los valores z correspondientes para ambos extremos:
Para 57 060 millas: Para 58 280 millas:

Luego, consultamos la tabla de la distribución normal estándar para obtener las áreas
correspondientes a z1 y z2. Después, calculamos la diferencia entre estos dos valores
para obtener el porcentaje de camiones que recorrieron más de 57 060 pero menos de
58 280 millas.
P(-1.47≤ Z ≤-0.86)= P(0.86≤ Z ≤1.47)=0.9292-0.8051= 0.1241

Por lo tanto, el porcentaje de camiones es 12.41%

c) Para calcular el porcentaje de camiones que recorrieron 62,000 millas o menos durante
el año, primero calculamos el valor z correspondiente:

Consultando la tabla de la distribución normal estándar, encontramos el área


correspondiente a z=1, que es aproximadamente 0.8413. Por lo tanto, el 84.13% de los
Ford Super Duty F-750 recorrieron 62 000 millas o menos durante el año.

d) Para determinar si es razonable concluir que alguno de los camiones recorrió más de
70,000 millas, podemos calcular el valor z correspondiente:
Consultando la tabla de la distribución normal estándar, el valor de z=5 indica una
probabilidad extremadamente baja, lo que sugiere que es muy poco probable que
alguno de los camiones haya recorrido más de 70,000 millas. Puesto que al calcular por
definición se obtiene la probabilidad casi nula.

8-22: Según todos los registros de los estudiantes de la Universidad de Camford, los
estudiantes pasan un promedio de 5.5 horas por semana practicando deportes organizados. La
desviación estándar de la población es de 2.2 horas semanales. Con base en una muestra de
121 estudiantes, Healthy Lifestyles Incorporated (HLI) quisiera aplicar el teorema del límite
central para hacer varias estimaciones.
a. Calcule la desviación estándar de la distribución muestral de las medias muestrales.
b. ¿Cuál es la probabilidad de que HLI encuentre una media muestral entre 5 y 6 horas?
C. ¿Calcule la probabilidad de que la media muestral esté entre 5,3 y 5,7 horas?
d. ¿Qué tan extraño sería obtener una media muestral mayor a 6,5 horas?

a) Desviación estándar de la distribución muestral de las medias muestrales:

b) Probabilidad de que la media muestral esté entre 5 y 6 horas: Calculamos los z

Consultamos la tabla de la distribución normal estándar para encontrar las


probabilidades correspondientes a z5 y z6. La probabilidad será la diferencia entre estas
dos probabilidades.

Para z5=−2.5:
Usando la tabla de la distribución normal estándar, encontramos que
P(z<−2.5)≈0.0062.
Para z6=2.5:
Usando la tabla de la distribución normal estándar, encontramos que
P(z<2.5)≈0.9938.
Por lo tanto, la probabilidad de que la media muestral esté entre 5 y 6 horas es
aproximadamente 0.9938−0.0062=0.9876 o 98.76%.

c) Probabilidad de que la media muestral esté entre 5.3 y 5.7 horas:


Calculamos los z
Consultamos la tabla de la distribución normal estándar para encontrar las
probabilidades correspondientes a z5.3 y z5.7. La probabilidad será la diferencia entre
estas dos probabilidades.

Para z5.3=−1:
Usando la tabla de la distribución normal estándar, encontramos que P(z<−1)≈0.1587.
Para z5.7=1
Usando la tabla de la distribución normal estándar, encontramos que
P(z<1)≈0.8413.
Por lo tanto, la probabilidad de que la media muestral esté entre 5.3 y 5.7 horas es
aproximadamente 0.8413−0.1587=0.6826 o 68.26%.

d) Probabilidad de obtener una media muestral mayor a 6.5 horas:


Calculamos el z6.

Consultamos la tabla de la distribución normal estándar para encontrar la probabilidad


correspondiente a z6.5. Esta probabilidad nos dará una idea de qué tan extraño sería
obtener una media muestral mayor a 6.5 horas.

Usando la tabla de la distribución normal estándar, encontramos que P(z>5)≈0.


Esto significa que la probabilidad de obtener una media muestral mayor a 6.5 horas es
extremadamente baja, prácticamente nula.
Estos resultados nos indican que es altamente improbable que la media muestral esté
fuera de los rangos especificados, y que una media muestral mayor a 6.5 horas sería
extremadamente rara.

9-34: Una encuesta reciente realizada a 50 ejecutivos que fueron despedidos durante una
recesión reciente reveló que les tomó una media de 26 semanas encontrar otro puesto. La
desviación estándar de la muestra fue de 6.2 semanas. Construya un intervalo de confianza del
95% para la media poblacional. ¿Es razonable que la media poblacional sea de 28 semanas?
Justifica tu respuesta.

Para construir un intervalo de confianza del 95% para la media poblacional, utilizaremos la
fórmula del intervalo de confianza para la media poblacional cuando conocemos la desviación
estándar de la muestra:

Límites del intervalo de confianza

Donde:
 x es la media muestral.
 Z es el valor crítico de la distribución normal estándar para el nivel de confianza
deseado (95% en este caso).
 σ es la desviación estándar de la muestra.
 n es el tamaño de la muestra.
Dado que se trata de un intervalo de confianza del 95%, el valor crítico Z es aproximadamente
1.96 (para un nivel de confianza del 95%).
Sustituyendo los valores proporcionados:
 x=26 semanas
 σ=6.2 semanas
 n=50

Calculamos los límites del interval de confianza:

Ahora, calculamos la parte dentro de los paréntesis:

Por lo tanto, los límites del intervalo de confianza es:

26±1.96×0.877

Intervalo de confianza=(24.28,27.72)
El intervalo de confianza del 95% para la media poblacional de la duración de la búsqueda de
empleo es de aproximadamente (24.28, 27.72) semanas.
Ahora, para determinar si es razonable que la media poblacional sea de 28 semanas,
observamos que 28 semanas está fuera del intervalo de confianza calculado. Esto sugiere que
no es razonable asumir que la media poblacional sea de 28 semanas, ya que la verdadera
media poblacional probablemente se encuentra dentro del intervalo de confianza calculado, que
es más estrecho que 28 semanas.

10.26: Rutter Nursery Company empaqueta su mantillo de corteza de pino en bolsas de 50


libras. Por una larga historia, la gerencia sabe que la distribución del peso de las bolsas se
distribuye normalmente con una desviación estándar poblacional de 3 libras por bolsa. Al final
de cada día, Jeff Rutter, el gerente de producción, pesa 10 bolsas y calcula el peso medio de la
muestra. Los pesos de 10 bolsas de la producción actual se encuentran en este archivo de
datos Descargar archivo y en la siguiente tabla.
a. ¿Puede el Sr. Rutter concluir que el peso medio de las bolsas es menos de 50 libras? Utilice
el nivel de significancia .01.
b. En un breve informe, indique por qué el Sr. Rutter puede utilizar la distribución z como
estadístico de prueba.
C. Calcule el valor p.

Primero, necesitamos calcular la media muestral (x) y el estadístico de prueba z utilizando la


fórmula del z:
Para este problema:
 μ=50 libras.
 σ=3 libras.
 n=10 (tamaño de la muestra).
Primero, calculemos la media muestral ( x́ ) de los pesos de las bolsas:

Ahora, calculemos el estadístico de prueba z:

El valor crítico de z para un nivel de significancia de 0.01 es aproximadamente -2.33.


Dado que nuestro valor de z (-1.92) no es menor que -2.33, no rechazamos la hipótesis nula.
Por lo tanto, no podemos concluir que el peso medio de las bolsas sea menos de 50 libras.
b) El Sr. Rutter puede utilizar la distribución z como estadístico de prueba porque estamos
asumiendo que la distribución del peso de las bolsas es normal y conocemos la desviación
estándar poblacional.
c) El valor p se determina observando la probabilidad de obtener un valor de prueba al menos
tan extremo como el observado, asumiendo que la hipótesis nula es verdadera. En este caso,
no se proporcionan los datos necesarios para calcular el valor p con precisión, pero basado en
el valor de z calculado, el valor p sería mayor que 0.01, ya que nuestro valor de z no es lo
suficientemente extremo como para estar en la cola de distribución correspondiente al nivel de
significancia de 0.01.
11-26 Un fabricante de computadoras ofrece soporte técnico disponible las 24 horas del día, los
7 días de la semana. La resolución oportuna de estas llamadas es importante para la imagen
de la empresa. Para 35 llamadas relacionadas con software, los técnicos resolvieron los
problemas en un tiempo promedio de 18 minutos con una desviación estándar de 4.2 minutos.
En 45 llamadas relacionadas con hardware, los técnicos resolvieron los problemas en un
tiempo medio de 15.5 minutos con una desviación estándar de 3.9 minutos. Con un nivel de
significancia de 0.05, ¿se necesita más tiempo para resolver los problemas de software?
a. ¿Cuáles son las hipótesis nula y alternativa?
b. Calcule el estadístico de prueba.
C. Calcule el valor p.
d. ¿Cuál es su decisión con respecto a la hipótesis nula?
e. Interpreta el resultado.
a) Hipótesis nula (H0): No se necesita más tiempo para resolver los problemas de software que
para los problemas de hardware. Es decir, el tiempo promedio de resolución para el software
(μs) es igual o menor que el tiempo promedio de resolución para el hardware (μh).
Hipótesis alternativa (H1): Se necesita más tiempo para resolver los problemas de software que
para los problemas de hardware. Es decir, el tiempo promedio de resolución para el software
(μs) es mayor que el tiempo promedio de resolución para el hardware (μh).
b) El estadístico de prueba que utilizaremos es la prueba t de Student para muestras
independientes, dada por la fórmula:

 x s y x h son las medias muestrales para software y hardware respectivamente.

 ss y sh son las desviaciones estándar muestrales para software y hardware


respectivamente.
 ns y nh son los tamaños de las muestras para software y hardware respectivamente.
Primero, definamos los valores dados:
Para el grupo de software:

 Media muestral ( x s) = 18 minutos

 Desviación estándar muestral (ss) = 4.2 minutos


 Tamaño de la muestra (ns) = 35
Para el grupo de hardware:

 Media muestral ( x h) = 15.5 minutos

 Desviación estándar muestral (sh) = 3.9 minutos


 Tamaño de la muestra (nh) = 45
Ahora, procedamos con los cálculos del estadístico t:
c) Calculemos el valor p utilizando la distribución t de Student para muestras independientes
con df =ns+nh−2=35+45−2=78. En este caso, estamos interesados en la cola derecha de la
distribución.
Consultando una tabla de la distribución, encontramos que el valor p correspondiente a t=2.726
es menor que 0.05 (nivel de significancia). Pues el valor de P es 1.665.
d) Dado que el valor p es menor que el nivel de significancia (α=0.05), rechazamos la hipótesis
nula H0.
e) Esto significa que hay evidencia suficiente para concluir que se necesita más tiempo para
resolver los problemas de software en comparación con los problemas de hardware. Es decir,
el tiempo promedio de resolución para problemas de software es significativamente mayor que
para problemas de hardware.

12-48: Robert Aloff es vicepresidente de ingeniería de un fabricante de lavadoras domésticas.


Como parte de un proyecto de desarrollo de un nuevo producto, desea determinar la duración
óptima del ciclo de lavado. El proyecto incluye un estudio de la relación entre el detergente
utilizado (cuatro marcas) y la duración del ciclo de lavado (18, 20, 22 o 24 minutos). Para
realizar el experimento, se asignan aleatoriamente 32 cargas de ropa doméstica estándar (que
tienen la misma cantidad de suciedad y el mismo peso total) a las 16 combinaciones de ciclos
de lavado y detergente. Los resultados (en libras de suciedad eliminada) se muestran aquí y se
proporcionan en esta tabla y archivo de Excel:
a. Dibuje una gráfica de interacción de las medias del detergente por tiempo de ciclo.

b. Calcule el ANOVA (Análisis de variación) con software estadístico y, utilizando el nivel de


significancia de 0.05, pruebe el efecto de interacción de la marca y el tiempo del ciclo sobre la
"suciedad eliminada".

C. Con base en los resultados del inciso (b), realice las pruebas apropiadas de hipótesis para
diferencias en las medias de los factores.
d. Interpretar los resultados en un breve informe.

También podría gustarte