Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GUIA DE TRABAJO
ESTADÍSTICA II
2020 – 01
1
SEMANA 1
b. Dentro del contexto de la parte a., se desea reducir el error de estimación (margen
de error) en un 25%, manteniendo el mismo nivel de confianza y las medidas de
resumen. Calcule el tamaño de muestra que se requiere en este caso.
Estadísticas descriptivas
Error estándar IC de _____%
N Media Desv.Est. de la media para μ
26 246.165 2.709 0.628 (244.803; _________)
μ: media de Peso
Desviación estándar conocida = 3.2
Por error se borró el valor del nivel de confianza y el límite superior. Con la
información obtenida del resultado del minitab. Determine dichos valores.
2
3. Se seleccionó una muestra de 20 bodegas de cierta zona de la ciudad con la finalidad
de estimar el nivel promedio de ventas por semana (en miles de soles). Los datos
obtenidos se procesaron mediante el programa MINITAB, y los resultados se
muestran a continuación:
Estadísticas descriptivas
Error estándar IC de _____%
N Media Desv.Est. de la media para μ
20 ________ 4.054 0.906 (59.575; 62.709)
4. La siguiente es una corrida del programa MINITAB, para una muestra de personas a
las que se les preguntó acerca de su gasto semanal en movilidad (en soles).
Estadísticas descriptivas
Error estándar IC de _______%
N Media Desv.Est. de la media para μ
25 _______ _______ 0.360 (43.981; 45.467)
5. El jefe de una casa comercial desea estimar el monto adeudado de los clientes con
cuenta de crédito. Para esto, se selecciona una muestra aleatoria de 25 clientes con
cuenta de crédito, obteniéndose el promedio del monto adeudado y la desviación
estándar del monto adeudado igual a 950 soles y 300 soles respectivamente. Con un
99% de confianza, estime el monto promedio adeudado de los clientes. Además, se
sabe que el monto adeudado por los clientes tiene una distribución normal.
3
6. Una empresa comercializa granos de café en bolsas de 460 gramos. Sin embargo,
INDECOPI ha recibido las quejas de un grupo de consumidores los cuales alegan que
el contenido de dichas bolsas es menor a lo indicado; para corroborar las quejas, un
funcionario de INDECOPI seleccionó una muestra aleatoria de diez unidades del
producto resultando los siguientes pesos en gramos:
448.4 462.7 448.5 450.4 449.6 451.0 450.9 449.2 460.3 463.3
a. Con un nivel de confianza del 98%, estime el contenido medio de las bolsas.
b. Al nivel de confianza del 98%, ¿puede el funcionario llegar a la conclusión que los
consumidores tienen la razón? Considere los resultados obtenidos en el ítem a.
a. Estime la proporción de personas que están a favor del cambio de envase. Use un
nivel de confianza del 98%.
b. Estime la proporción de personas del estrato socioeconómico B o C que están a
favor del cambio de envase. Use un nivel de confianza del 97%.
Agencia A Agencia B
Acciones Si son No son Si son No son
rentables rentables rentables rentables
Agrarias 15 25 20 20
Mineras 20 40 25 35
4
del 99%.
c. Con un nivel de confianza del 90%, estime la proporción de acciones que son
rentables.
Método
p: proporción de eventos
Para este análisis se utiliza el método de aproximación a la normal.
Estadísticas descriptivas
N Evento Muestra p IC de ____% para p
2100 1792 _________ (0.8334; 0.8732)
10. El director de la aseguradora del fondo de pensiones “AFP Neptuno” seleccionó una
muestra aleatoria de 1 200 afiliados que hicieron sus aportaciones en el último
trimestre, obteniéndose el monto promedio de las aportaciones igual a $ 850 y la
desviación estándar del monto de las aportaciones igual a $ 225. Además, 650 de
los 1 200 afiliados seleccionados tienen montos de aportaciones superiores a $ 1
250.
a. Con un 90% de confianza, estime el monto promedio de las aportaciones de los
afiliados de la AFP Neptuno en el último trimestre.
b. Con 98% de confianza, estime la proporción de afiliados que tienen montos de
aportaciones superior a $ 1 250 en el último trimestre.
11. En cierto distrito de la capital se está realizando un estudio mediante el cual se podría
tener la posibilidad de otorgar crédito monetario a los comerciantes de la zona y de
este modo se puedan formalizar. Para esto se quiere estimar el ingreso mensual de
un sector de comerciantes informales. Se seleccionó una muestra aleatoria de 120
comerciales informales y se encontró entre otros datos lo siguiente: un ingreso
5
promedio de 1 800 soles y una desviación estándar de 150 soles; y el 36% de los
comerciantes informales tienen ingresos superiores a 2 100 soles.
a. Construye un intervalo de confianza del 95% para estimar el ingreso promedio
mensual. Interprete los resultados.
b. Con un nivel de confianza del 90%, estime la proporción de comerciantes con
ingresos superiores a 2 100 soles.
Lo resultados: fueron:
1. Contestaron negativamente a la pregunta 1, un total de 24 alumnos.
2. De los que contestaron afirmativamente la pregunta 1, se obtuvo que el gasto
promedio diario es 12.2 soles con una desviación estándar de 3.48 soles.
13. El gerente comercial de una cadena de tiendas, que tiene un gran número de
establecimientos distribuidos en todo el país, desea estimar el nivel de ventas
promedio semanal de estos establecimientos, para lo cual se fija las siguientes
condiciones: está dispuesto a tolerar un error de a lo más 120 soles y desea estar
90% seguro de sus resultados. Si se tiene como información que la desviación
estándar en el nivel de ventas de dichos establecimientos es de 350 soles ¿Qué
tamaño de muestra debe utilizar este gerente?
6
14. El gerente de producción desea estimar el tiempo promedio de fabricación de un
artículo, en minutos; considerando un error máximo de 4 minutos. Además, por
experiencias anteriores, se sabe que la desviación estándar del tiempo de
fabricación del artículo es 10 minutos, ¿qué tamaño de muestra se debe de
considerar para el estudio, si se desea tener una seguridad del 95% para sus
resultados?
15. El jefe del área de Recursos Humanos de cierta institución educativa quiere estimar
el ingreso promedio de los administrativos que laboran en dicha institución. Si se
sabe que la varianza de los ingresos es 62 500 soles2; además se tiene un error de
65 soles y una confiabilidad de 97%. Determine el número de administrativos
necesario para realizar la estimación requerida por el jefe del área.
17. Para adquirir un lote de artículos de playa en un centro comercial, el gerente quiere
estimar el porcentaje de artículos defectuosos que contiene este lote, para lo cual
fija un error de estimación de a lo más 3% y un nivel de confianza del 90%. ¿Qué
número de artículos de playa será necesario para realizar la estimación, si por
experiencias anteriores, se sabe que aproximadamente este tipo de lotes tienen 5%
de artículos defectuosos?
18. ¿Qué tamaño de muestra se debe tomar con una confianza del 95% y con un error
de estimación no mayor a 0.005 para estimar la proporción de componentes
electrónicos que fallaron antes de cumplir su vida útil?
7
b. Utilizando un 95% de confianza, ¿se puede considerar que realmente el riesgo
es bajo? Justifique su respuesta.
21. Suponga que de una población se seleccionó una muestra aleatoria igual a 64
familias, con el objetivo de estimar la varianza del gasto mensual por alimentación
(en soles). Con el paquete estadístico minitab se ingresó la información recolectada
y se obtuvo el siguiente resultado:
Método
σ²: varianza de Muestra
El método de chi-cuadrada solo es válido para la distribución normal.
Estadísticas descriptivas
IC de 90% para σ²
usando
N Desv.Est. Varianza Chi-cuadrada
64 250 62500 (47711; 86082)
a. Con lo obtenido, diga ¿cuál es la estimación para la varianza del gasto mensual
por alimentación de las familias?
b. Con un 90% de confianza, ¿se puede afirmar que la varianza del gasto mensual
por alimentación no supera a los 87 mil soles.
22. El jefe de una casa comercial desea estimar la varianza del monto adeudado de los
clientes con cuenta de crédito. Para esto, se selecciona una muestra aleatoria de 25
clientes con cuenta de crédito, obteniendo la desviación estándar del monto
adeudado igual a 300 soles. Con un 99% de confianza, estime la varianza del monto
adeudado de los clientes. Además, se sabe que el monto adeudado por los clientes
tiene una distribución normal.
23. Se seleccionó una muestra de 20 bodegas de cierta zona de la ciudad con la finalidad
de estimar la desviación estándar del nivel de ventas por semana (en miles de soles).
Los datos obtenidos se procesaron mediante el programa MINITAB, y los resultados
se muestran a continuación:
Método
σ: desviación estándar de Muestra
El método de chi-cuadrada solo es válido para la distribución normal.
8
Estadísticas descriptivas
IC de _____% para σ
usando
N Desv.Est. Varianza Chi-cuadrada
20 4.05 16.4 (3.08; 5.92)
Método
σ: desviación estándar de Muestra
El método de chi-cuadrada solo es válido para la distribución normal.
Estadísticas descriptivas
IC de ____% para σ
usando
N Desv.Est. Varianza Chi-cuadrada
25 1.80 3.24 (1.46; 2.37)
25. Actualmente el costo promedio, por unidad producida, de un artículo es de 120 soles
con una desviación estándar de 10 soles. Se realizan ciertas medidas de reajuste en
el proceso de producción de este artículo con la finalidad de disminuir los costos de
producción. Luego de estas medidas se toma una muestra aleatoria de 9 artículos y
se registró los siguientes costos:
9
118,6 118,5 123,6 119,5 119,2 118,3 120,9 121,2 118,7
Con esta información, utilizando un nivel de confianza del 90%, ¿Es posible confirmar
que se logró el objetivo?
27. Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio,
en gramos, en cemento estándar y en cemento contaminado con plomo. Los niveles
bajos de calcio indican que el mecanismo de hidratación del cemento queda
bloqueado y esto permite que el agua ataque varias partes de una estructura de
cemento. Al tomar diez muestras de cemento estándar, se registró que el peso
promedio de calcio es de 90 gramos y los resultados obtenidos de 15 muestras de
cemento contaminado con plomo, el peso promedio fue de 87 gramos. Si se sabe,
que el peso de calcio está distribuido normalmente, estime mediante un intervalo de
confianza del 95% la diferencia entre medias de los dos tipos de cementos. Además,
se conoce que la varianza del peso de calcio en cemento estándar y en cemento
contaminado con plomo son: 27,5 gramos2 y 15,875 gramos2 respectivamente.
10
A 25 3.1
B 36 2.5
Con un 95% de confianza, ¿se puede estimar que el contenido promedio de nicotina
de los cigarrillos de la marca A es superior a los de la marca B?
29. El jefe de personal de una empresa de confecciones quiere comparar los tiempos
promedios, en minutos, que operarios varones y mujeres utilizan para confeccionar
una camisa. Por estudios realizados anteriormente, se sabe que las desviaciones
estándar en cada uno de los grupos son de 2,5 y 1,2 minutos respectivamente. Para
realizar el estudio, el jefe de personal selecciona dos muestras aleatorias de tamaño
64 en cada uno de los grupos dando como resultado una media muestral de 48 y 36
minutos respectivamente. Con un 97% de confianza, ¿se puede afirmar que las
mujeres confeccionan camisas en menos tiempo que los varones?
Además, se sabe que el monto de las aportaciones sigue una distribución normal.
Con un 95% de confianza, ¿a qué conclusión llegará el agente de aseguradoras de
fondo de pensiones?
11
NSE A 170 210 260 176
NSE B 203 250 188 120
a. Con una confianza del 90%, estime la diferencia de proporciones de las personas
que prefieren la gaseosa de sabor tradiciones en ambos niveles socioeconómicos.
Interprete el resultado.
b. Con una confianza del 98%, estime la diferencia de proporciones de los jóvenes
que prefieren la gaseosa light entre los niveles socioeconómicos A y B. Interprete
el resultado.
32. El jefe del área de marketing de una cadena televisiva realizó un estudio para
averiguar si existe alguna diferencia entre el contenido humorístico de los programas
peruanos y norteamericanos. En una muestra aleatoria independiente de 115
programas televisivos peruanos, 32 fueron humorísticos. En otra muestra aleatoria
de 135 programas televisivos norteamericanos, 29 fueron humorísticas. Con un 95%
de confianza, se puede afirmar que la proporción de contenido humorístico de los
programas televisivos peruanos supera a los programas televisivos
norteamericanos.
33. El gerente de una empresa financiera afirma que la proporción de clientes morosos
con préstamos de a lo más 5000 soles de la sucursal A es mayor a la proporción de
clientes morosos con la misma categoría de la sucursal B. Para esto, selecciona una
muestra aleatoria de 200 clientes de la sucursal A, y 58 de ellos aún no pagan el
préstamo con dicho monto; y de 190 clientes de la sucursal B, y 50 de ellos no pagan
el préstamo con dicho monto.
a. Con un nivel de confianza del 96%, estime la diferencia de proporciones de
clientes morosos con préstamos de a lo más 5 000 soles de ambas sucursales.
b. Con lo obtenido en a., ¿se puede concluir que la afirmación del gerente es
correcta?
12
Método
p₁: proporción donde Muestra 1 = Evento
p₂: proporción donde Muestra 2 = Evento
Diferencia: p₁ - p₂
Estadísticas descriptivas
Muestra N Evento Muestra p
Muestra 1 1200 250 0.208333
Muestra 2 1500 215 0.143333
Estimación de la diferencia
IC de ___% para la
Diferencia diferencia
_________ (0.035975; 0.094025)
IC basado en la aproximación a la normal
SEMANA 2
35. En cada uno de los siguientes casos se le pide plantear las hipótesis nula y
alternativa correspondientes:
a. El jefe de control de calidad de cierto producto desea determinar si el proceso de
envasado está bajo control, es decir: si el peso promedio envasado es de 450
gramos.
b. Las ventas semanales, en promedio, de cierto producto son de 4500 soles, se
realiza una campaña por TV y por radio. El jefe de ventas desea probar si la
campaña realizada fue efectiva.
c. Una máquina, actualmente utilizada por una empresa en la fabricación de un
determinado artículo, produce un 3% de artículos defectuosos. Al jefe de
producción se le ofrece un nuevo modelo de máquina argumentado que esta
produce menos porcentaje de artículos defectuosos. El jefe de producción desea
probar si tal afirmación es válida.
13
H0: El proceso de producción está bajo control.
H1: El proceso de producción no está bajo control y se debe detener para
reajustar.
Defina en términos de estas hipótesis el error tipo I y el error tipo II.
37. El gerente de control de calidad desea determinar si la máquina con la que embolsan
un cereal está bajo control, es decir si se está embolsando con un promedio de 500
gramos. Para determinar esto, el gerente selecciona una muestra aleatoria de 36
bolsas y encuentra un promedio de 496,5 gramos.
a. Plantee las hipótesis adecuadas. Indique, si es necesario, los supuestos bajo los
cuales se puede resolver este problema.
b. A que conclusión llegará el jefe de control de calidad, si sabe que el proceso
tiene una varianza de 81 gramos2 y utiliza una 5% de significancia.
c. Describa en que consiste los errores tipo I y error tipo II.
d. Calcule la probabilidad de aceptar la hipótesis nula cuando la verdadera media
es de 498 gramos y 502 gramos.
38. En una oficina de defensa del consumidor se han recibido quejas de los
consumidores con respecto a que una determinada marca de aceite vende botellas
que indican 850 c.c. pero que en realidad es menor a esa cantidad. Un funcionario
de esta oficina con la finalidad de determinar si los clientes tienen fundamento en
sus quejas decide tomar una muestra aleatoria de 49 botellas de aceite y encontró
que el promedio de esta muestra fue 848.3 c.c. y una desviación estándar de 10 c.c.
Usando un nivel de significancia del 5%, ¿a qué conclusión llegará el funcionario de
la oficina de defensa del consumidor?
39. El contenido de las cajas de avena instantánea por un proceso automático debe ser
igual a 160 gramos en promedio; si no es así, debe detenerse la producción para
regular la máquina. El contenido, en gramos, de las cajas de avena seleccionadas
aleatoriamente de la producción da los siguientes resultados:
28 28
∑ 𝑋𝑖 = 4470.3 𝑦 ∑ 𝑋𝑖 2 = 713713.89
𝑖=1 𝑖=1
a. Con un nivel de significancia del 1%, ¿es razonable detener la producción?
b. ¿Con qué probabilidad se debe rechazar la hipótesis nula si el verdadero valor
de la media es de 158 gramos?
14
40. Un especialista de educación universitaria afirma que la nota promedio de aprobar
el curso de Estadística General es mayor a 15.3 puntos. Seleccionó una muestra
aleatoria de estudiantes que llevaron el curso de Estadística General, con los datos
recolectados los ingresó al minitab y obtuvo los siguientes resultados:
T de una muestra
Estadísticas descriptivas
Error estándar Límite inferior
N Media Desv.Est. de la media de 95% para μ
25 17.209 0.936 0.187 16.889
μ: media de Muestra
Prueba
Hipótesis nula H₀: μ = 15.3
Hipótesis alterna H₁: μ > 15.3
Valor T Valor p
10.20 0.000
41. El jefe del área de marketing de una compañía que fabrica laptops ABC afirma que
el 20% de los jóvenes universitarios utiliza esta marca de laptop. Después de una
intensa campaña publicitaria, se tomó una muestra de 300 jóvenes universitarios, la
que indicó que el 86% de ellos usan esta marca. Al 5% de significación, ¿el jefe del
área de marketing, en base a los resultados de esta muestra, que la campaña fue
exitosa?
42. Una oficina relacionada con la cobranza de impuestos comprobó que el 5% de las
declaraciones juradas de impuestos eran inexactas. Después de un programa de
educación aplicado a los contribuyentes se comprobó que, de 1124 declaraciones
juradas, 45 eran inexactas. Con un nivel de significación de 2.5%, ¿existe suficiente
evidencia para concluir que el programa de educación ha rendido buenos resultados?
43. Una compañía telefónica está tratando de determinar si algunas líneas en una
determinada comunidad deben instalarse subterráneamente. Debido a que se hará
un pequeño cargo adicional en las cuentas telefónicas para pagar los costos extras
15
de la instalación, la compañía ha determinado hacer un estudio entre los clientes y
proceder con la instalación subterránea solo si el estudio indica que más del 60% de
todos los clientes están a favor de la instalación.
a. Defina el parámetro y el error tipo I y error tipo II en términos del problema.
b. Si 118 de 160 clientes entrevistados están a favor de esta instalación a pesar del
cargo adicional, ¿qué debe hacer la compañía? Use un = 0,01.
c. ¿Con qué probabilidad se debe rechazar la hipótesis nula si el verdadero valor de
la proporción es igual a 0,65?
44. “Fresquito”, es una nueva marca de gaseosas que entró al mercado y logró un nivel
de aceptación del 12%, es decir el 12% de consumidores de gaseosas prefieren esta
marca. Con la finalidad de tener una mayor participación del mercado, la Gerencia
de Producción de “Fresquito” decide realizar una agresiva campaña de publicidad
por televisión, radio y medios escritos.
a. Luego de la campaña de publicidad la gerencia desea, como es lógico, evaluar
los resultados de esta campaña de publicidad, para lo cual se toma una muestra
de 450 personas y se fija un nivel de significancia del 5%. Determine las hipótesis
de interés para la gerencia y establezca la regla de decisión correspondiente,
definiendo con claridad el parámetro que se está sometiendo a prueba.
b. Si luego de la campaña de publicidad, el porcentaje real de consumidores que
prefieren la marca “Fresquito” es del 14%, (pero lógicamente esto no lo sabe el
Gerente de producción). Determine, bajo estas condiciones, la probabilidad de
que el Gerente de Producción, concluya que la campaña no fue efectiva, cuando
utiliza la regla de decisión hallada anteriormente.
Agencia A Agencia B
Acciones Si son No son Si son No son
rentables rentables rentables rentables
Agrarias 15 25 20 20
Mineras 20 40 25 35
46. Al señor Juan Pérez le han propuesto participar en una lista para el congreso, en
representación de su provincia. Para aceptar la propuesta este señor quiere estar
seguro de que al menos el 75% de los votantes residentes de la provincia están a
16
favor de su candidatura. Para determinar esto, se selecciona una muestra aleatoria
de 450 residentes, encontrando que 350 están a favor de su candidatura. Con la
información registrada se analizó en minitab, obteniéndose los siguientes
resultados:
Método
p: proporción de eventos
Para este análisis se utiliza el método de aproximación a la normal.
Estadísticas descriptivas
Límite inferior
N Evento Muestra p de 98.5% para p
450 350 0.777778 0.735248
Prueba
Hipótesis nula H₀: p = 0.75
Hipótesis alterna H₁: p > 0.75
Valor Z Valor p
1.36 0.087
17
producción. El llenado automático debe dar un contenido medio de 320 cm 3. Para
el control del llenado promedio se tomó una muestra aleatoria de 36 unidades del
producto y se encontró un contenido medio de 317 cm3 con una desviación estándar
de 12cm3.
a. ¿Hay suficiente razón para creer que existe una baja en el promedio de los
contenidos? Realice la prueba al nivel de significación del 5%.
b. Calcule la probabilidad de cometer el error tipo II cuando la verdadera media es
de 312cm3.
c. Calcule la potencia de la prueba.
49. Se sabe que en una compañía de taxis el gasto diario promedio en combustible por
unidad es igual a 187,6 galones y la desviación estándar es igual a 1.2 galones. El
gerente de operaciones decide incluir un aditivo especial al combustible que le
permitirá un ahorro en ese rubro. Después de incluir el aditivo toma una muestra de
10 unidades y encontró los siguientes gastos en combustible expresado en galones
por día:
185.3 186.4 186.9 187.0 186.4 187.6 187.9 188.1 186.8 186.7
Además;
a. Con un nivel de significancia de 5%, ¿se puede afirmar que los datos de la
variable siguen una distribución normal?
b. Al 5% de significancia, ¿existe evidencia estadística para afirmar que después
18
de incluir el aditivo, el gasto diario promedio en combustible por unidad se
reducirá?
50. El gerente de ventas de una empresa industrial tiene que decidir si compra o no una
nueva máquina para reemplazar la que tienen en uso actualmente en el
departamento de producción. Se sabe que la máquina que está en uso tiene una
varianza, con respecto al tiempo que demora en producir una pieza, de 0,067
minutos2. Al tomar una muestra aleatoria de 20 piezas producidas por la máquina
que se desea comprar se encontró una desviación estándar de 0,15 minutos. Si se
utiliza un 5% de significancia y la decisión estará basada en la menor variabilidad,
¿cuál será la decisión del gerente de ventas?
51. Con cierto proceso de producción, el cual se utiliza en la actualidad, se sabe que el
costo promedio por unidad producida es de 66.4 soles y la desviación estándar de
5.6 soles. Se realizan ciertas medidas de reajuste en el proceso de producción con
la finalidad de verificar si el costo de producción ha disminuido y el costo sea más
homogéneo. Se tomó una muestra aleatoria de 12 unidades registrando los
siguientes costos por unidad:
19
52. El jefe de ventas de una empresa decidirá que su equipo de vendedores debe ser
recompuesto si la varianza de las ventas en la última semana es mayor a 10,15
dólares2. Si para esta semana recolecta datos de una muestra aleatoria de 25
ventas del equipo y encuentra una varianza de 18,03 dólares2. Con la información
obtenida, se analizó en minitab obteniéndose los siguientes resultados:
Estadísticas descriptivas
Límite inferior de 95%
para σ² usando
N Desv.Est. Varianza Chi-cuadrada
25 3.71 13.8 9.10
Prueba
Hipótesis nula H₀: σ² = 10.5
Hipótesis alterna H₁: σ² > 10.5
Estadística
Método de prueba GL Valor p
Chi-cuadrada 31.54 24 0.139
20
afirmar que la hipótesis planteada es correcta?
56. El jefe de logística de la compañía P&C quiere decidir la adquisición entre dos
marcas A y B de máquinas para su planta de producción. Se le permitió probar ambas
máquinas durante un período de prueba para luego escoger 10 tiempos
aleatoriamente para cada una de ellas, resultando los tiempos siguientes:
Máquina A 40 79 47 42 48 38 44 49 50 37
Máquina B 40 41 39 40 38 42 43 37 38 41
Si se sabe que el tiempo de producción en cada una de las máquinas sigue una
distribución normal, ¿se podría concluir que las variabilidades de los tiempos de
producción de A y B son iguales? Considere el nivel de significación del 5%.
57. Al Señor Juan Pérez le han ofrecido invertir en dos carteras de acciones A y B, las
que prometen ser rentables, pero este señor solo tiene capital para invertir en una
de las carteras y debe decidir en cuál de ellas invertirá. Al investigar en busca de
información encontró que la mayoría de empresarios considera que invertir en la
cartera A implica un menor riesgo, como el Sr. Juan Pérez quiere tener mayor
evidencia que le permita decidir, selecciona una muestra de ocho empresarios que
invirtieron en la cartera A y encontró un promedio de rentabilidad de $1 560 y una
desviación estándar de $180 y en otra muestra independiente de 10 empresarios
que invirtieron en la cartera B encontró una rentabilidad promedio de $1 515 y una
desviación estándar de $263, en ambos casos la rentabilidad tiene una distribución
normal. En base a esta información, con un nivel de significancia del 5% y
21
considerando que una de las características notables del Sr. Juan Pérez es su actitud
adversa al riesgo, plantee y resuelva adecuadamente y luego indique cual será la
decisión del Sr. Juan Pérez.
SEMANA 3
58. Se piensa que en el espesor de una película de plástico (en mili pulgadas) que se
coloca en un material de sustrato influye la temperatura a la que se aplica el
recubrimiento. Se lleva a cabo un experimento totalmente aleatorizado. Once
sustratos se recubren a 125 °F, dando como resultado un espesor medio muestral
del recubrimiento de 103.5°F y una desviación estándar de 10.2°F. Otros 13
sustratos se recubren a 150°F para los que se observa una media de 99.7°F y una
desviación estándar de 20.1°F. Se creía al principio que con el incremento de la
temperatura del proceso se reducirá el espesor medio del recubrimiento.
Si se sabe que el nivel de ventas con el envase nuevo y con el envase antiguo se
comporta según una distribución normal y que las muestras tomadas son
22
independientes. Con un nivel de significancia del 5%, ¿se tiene evidencia de que la
nueva forma de envase dio como resultado un mayor nivel de ventas?
60. Con la finalidad de comparar los costos promedios de producción de dos artículos
A y B, cuyas distribuciones son normales, se tomaron dos muestras aleatorias
independientes y se procesaron en el programa MINITAB, los resultados obtenidos
se muestran a continuación:
23
a. El gerente de la fábrica B afirma que las pilas que producen tienen un promedio
de duración mayor al de las pilas producidas por la fábrica A. En base a la
información muestral presentada, ¿se puede confirmar la afirmación del
gerente? Utilice α = 5%.
b. El gerente de producción de la fábrica B indica que la desviación estándar de la
duración de las pilas que fabrican supera las 35 horas y por lo tanto se debe
detener el proceso para realizar los reajustes necesarios. Si se utiliza un 5% de
significancia, ¿se puede concluir que el gerente de producción tiene razón, y que
por lo tanto se debe de detener el proceso?
c. Con respecto a las hipótesis planteadas en el inciso b., ¿cuál es la probabilidad
de que se decida no detener el proceso, cuando en realidad la desviación
estándar es de 38.5 horas?
62. La tabla siguiente resume algunos datos de un experimento realizado para estudiar
varias características de tornillos de anclaje, puesto que la empresa “Ferrito” desea
realizar la compra de un lote de estos tornillos:
24
Diámetro de Tamaño de Resistencia Desviación
tornillo la muestra promedio (kilo/ libra) Estándar
3/8 15 4.25 1.30
1/2 14 7.14 1.68
63. En la siguiente tabla se muestran los datos obtenidos al tomar una muestra de 23
establecimientos y medir el nivel de ventas de dos productos A y B (en miles de soles
por semana) de acuerdo con el tipo de establecimiento en el que se expenden
(Botica o Bodega):
Tipo de
Producto A Producto B
establecimiento
2.5; 3.0; 4.3; 5.1; 4.5;
Bodega 3.5; 4.3; 5.3; 7.1; 6.5
3.8; 4,2
5.4; 6.5; 8.1; 6.9;
Farmacia 4.6; 5.3; 6.7; 8.1; 7.9
7.3; 8.6
a. ¿Se puede decir que el nivel de ventas promedio del producto B es mayor al nivel
de ventas del producto A? Utilice un nivel de significancia del 5%.
b. Considerando ambos productos, y con un 5% de significancia, ¿se puede afirmar
que el nivel de ventas promedio en bodegas es igual al nivel de ventas promedio
en farmacia?
c. El gerente de producción afirma que el nivel de ventas promedio del producto B
es de 7,5 miles de soles semanales por lo que recomienda tomar las medidas
del caso con la finalidad de incrementar el consumo de dicho producto. Con un
5% de significancia, ¿se puede aceptar la recomendación del gerente de
producción?
d. Si la desviación estándar en el nivel de ventas del producto B es de 4 mil soles
o más se tendrá que tomar las medidas necesarias para homogenizar estos
niveles de venta. Tomando en cuenta los resultados observados en la muestra y
utilizando un 2,5% de significancia. ¿Considera que es necesario tomar dichas
medidas?
25
64. La siguiente información representa los datos obtenidos en una muestra aleatoria de
tiempos utilizados en la fabricación de un determinado artículo. La empresa que los
fabrica tiene dos líneas de producción, en dos turnos diferentes (el tiempo está en
minutos). Las muestras del cada uno de los turnos y de cada una de las líneas de
producción fueron extraídas aleatoriamente y en forma independiente.
Cerveza Tradicional
NSE
Jóvenes Adultos
NSE A 50, 64, 56, 52, 65 60, 48, 44, 50
NSE B 40, 48, 43, 40 40, 44, 28
Cerveza Light
NSE
Jóvenes Adultos
NSE A 80, 58, 60 76, 56, 48, 30
NSE B 45, 42, 35 40, 52, 65
26
publicitaria?
b. El gerente de ventas afirma que la nueva gaseosa light ha logrado un buen nivel
de aceptación en el mercado, tanto así que el gasto promedio en este tipo de
gaseosa es igual al gasto promedio en el consumo de la gaseosa tradicional.
Utilizando un nivel de significancia del 5% ¿Qué puede decir con respecto a la
afirmación hecha por el gerente de ventas?
c. En general se puede afirmar que ambos grupos de edad tienen el mismo gasto
promedio en el consumo de gaseosa utilice un 5% de significancia.
d. Lo afirmado en el inciso c) también se cumple cuando se especifica el tipo de
gaseosa, es decir se cumple tanto en el consumo de la gaseosa tradicional como
en el consumo de la gaseosa light. Utilice un 5% de significancia.
SEMANA 6
66. Los siguientes datos representan las calificaciones obtenidas en los exámenes de
medio semestre y de finales de semestre tomados de una muestra aleatoria de los
exámenes de 11 estudiantes del curso de Estadística II. Ambos exámenes tuvieron
una duración de dos horas y el examen final cubría el material visto después de la
aplicación del examen de medio semestre. Se sabe que las notas tienen una
distribución normal.
N° 1 2 3 4 5 6 7 8 9 10 11
EP 80 82 47 75 80 69 83 73 55 70 81
EF 81 85 40 75 83 79 91 72 66 76 79
Trabajo 1 2 3 4 5 6 7
Sistema antiguo 8 4 10 9 8 7 12
Sistema nuevo 6 3 7 8 5 8 9
Además, se supone que los tiempos tienen distribución normal y con un nivel de
significancia del 5%. ¿Qué decidirá el analista de sistemas?
27
68. En una empresa de software se está investigando la eficiencia de dos lenguajes
diferentes para mejorar la rapidez de programación, actualmente utiliza el lenguaje
de programación 1. A doce programadores, familiarizados con ambos lenguajes, se les pide
que programen un cierto algoritmo en ambos lenguajes, y se anota el tiempo que tardan,
produciendo los siguientes datos en minutos:
Programador 1 2 3 4 5 6 7 8 9 10 11 12
Lenguaje 1 17 16 21 14 18 24 16 14 21 23 13 18
Lenguaje 2 18 14 19 11 23 21 10 13 19 24 15 20
Vendedor 1 2 3 4 5 6 7 8 9 10 11 12
Antes 18 23 27 20 10 5 30 25 34 40 15 14
Después 24 28 26 30 18 15 29 25 35 38 21 25
70. Una fábrica produce dos tipos de productos en dos turnos diferentes y se desea
observar el número de productos defectuosos en ambos turnos. Para esto se toman
dos muestras independientes, una de cada turno de trabajo, y se determinó la
cantidad de artículos defectuosos y el tipo de producto producido, los resultados se
muestran en la siguiente tabla:
Producto A Producto B
Turno
Defectuosos Buenos Defectuosos Buenos
Mañana 20 200 50 300
Tarde 5 150 25 200
28
tarde se producen artículos con un menor porcentaje de unidades defectuosas
que en el turno de la mañana?
b. Con un nivel de significancia de 5%, ¿se puede afirmar que, en el turno de tarde,
la proporción de productos defectuosos del producto B es mayor que la
proporción de productos defectuosos del turno de la mañana en más de 0.04?
Tipo de Programa
Distrito Grupo de edad
Cómico Deportivo Musical
Adolescentes 40 50 20
Distrito A Jóvenes 45 30 60
Adultos 55 20 15
Adolescentes 35 60 15
Distrito B Jóvenes 30 40 40
Adultos 105 15 5
Adolescentes 25 40 15
Distrito C Jóvenes 25 30 20
Adultos 40 15 10
29
en conjunto, el porcentaje de personas que prefieren programas cómicos es
mayor al porcentaje de personas que prefieren un programa deportivo. Use un α
= 0,025 ¿Cuál será la decisión al respecto?
b. Se tiene evidencia de que, en la población adulta, considerando los tres distritos
en conjunto, el porcentaje de personas que prefieren programas cómicos es
mayor al porcentaje de personas que prefieren un programa musical. Use un α =
0,025 ¿Cuál será la decisión al respecto?
73. Cierta compañía comercializa sus productos mediante catálogos y ventas puerta por
puerta. Esta compañía ha decidido comprobar la eficacia de una campaña de TV,
para lo cual selecciona dos territorios semejantes. Uno recibió campaña por TV y en
la otra no. El porcentaje de visitas con éxito en el territorio con campaña fue de 18%,
mientras que en el otro territorio (sin campaña) fue 14%. Se hicieron 900 visitas en
cada territorio. Para justificar el costo de la campaña se requiere más de 3% de
aumento en la proporción de visitas con éxito. ¿Dan estos datos pruebas de que la
campaña por TV se justifica? Utilice un nivel de significancia del 5%.
74. El jefe de ventas de una gran cadena de tiendas debe decidir entre dos cursos
similares de capacitación para sus vendedores. Para esto decide comprobar la
eficacia de los cursos tomando una muestra de 350 vendedores para el curso A y
otra muestra de 400 vendedores para el curso B. Al final de cada curso, el 82% de
los vendedores mejoraron significativamente su desempeño con el curso A, mientras
que; con el curso B, el 74% de los vendedores mejoraron significativamente su
desempeño. Como el curso A es más costoso decidirá enviar a sus vendedores a
dicho curso siempre y cuando el porcentaje de vendedores que mejoran
significativamente su desempeño supere en más de 6% al porcentaje de vendedores
que mejoran significativamente su desempeño y que recibieron el curso B. Utilizando
un = 0.05, ¿cuál será la decisión del jefe de ventas de esta cadena de tiendas?
Modalidad de estudio
Ciclo Total
Presencial Virtual
Primer 65 185 250
Tercer 55 125 180
30
b. Con un nivel de significancia de 5%, ¿se puede afirmar que la proporción de
alumnos del primer ciclo que prefieren la modalidad virtual es mayor a la
proporción de alumnos del tercer ciclo que prefieren la modalidad virtual?
SEMANA 4
76. Con la finalidad de comparar los precios del producto “Escaso A1” se llevó a cabo un
experimento en tres zonas de Lima: Cono Sur, Cono Norte y Lima Centro. En cada
una de dichas zonas se tomaron muestras aleatorias de seis tiendas más grandes
y se consultó acerca del precio de dicho producto, los resultados se muestran en la
siguiente tabla:
a) Al nivel de significación del 5%, ¿existe suficiente evidencia que indique una
diferencia en el precio promedio del producto escaso A1 en las tiendas de las
tres zonas de Lima?
b) Si fuera necesario, realice las comparaciones múltiples de Tukey.
77. El jefe de producción de una fábrica desea determinar si las cuatro máquinas que
tiene utilizan el mismo tiempo promedio en la fabricación de un artículo. Para esto
selecciona muestras aleatorias de cada máquina de tamaños n1 = 6, n2 = 4, n3 = 4 y
n4 = 6 respectivamente, midiendo el tiempo que utilizan en la fabricación de un
artículo. Debido a un descuido de su ayudante la información obtenida se perdió
parcialmente, encontrándose sola la siguiente tabla incompleta:
31
Fuente de Grados de Suma de Cuadrados
F
variación libertad cuadrados medios
Factor 152,62
Error
Total 542,92
Con esta información, plantee las hipótesis adecuadas y diga cuál será la conclusión
del jefe de producción, interpretando adecuadamente sus resultados. Use = 0,05.
78. Existen cuatro estaciones de radio. Cada estación toca música rock durante cierto
número de minutos por hora y se desea determinar si el promedio que cada estación
toca esta música, por hora, es el mismo. Para esto se tomó muestras de 10 horas de
cada estación y se encontró los siguientes tiempos promedios en los cuales se toca
música rock (en minutos).
Además, se sabe que: SCT = 650,75 (suma de cuadrados del total). Aplique la
técnica estadística adecuada y haga un análisis al respecto.
79. Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan
con métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado,
el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el
gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Después de un
mes de entrenamiento se realiza un test de rendimiento consistente en un recorrido
cronometrado de nueve km. Los tiempos empleados fueron los siguientes:
Método 1 15 16 14 15 17
Método 2 14 13 15 16 14
Método 3 13 12 11 14 11
A un nivel de significación del 1%, ¿se puede considerar que los tres métodos
producen resultados equivalentes? O por el contrario ¿existe algún método superior
a los demás?
32
80. Los siguientes resultados fueron analizados para los tiempos (en minutos) que tardan
en procesar una pieza de cada una de las cuatro máquinas. El fin del estudio es
determinar si hay diferencia en el tiempo promedio de procesamiento. Se
seleccionaron de forma aleatoria e independiente siete piezas de cada una de las
máquinas; además, el gerente de producción tiene evidencia suficiente para asumir
que los tiempos siguen una distribución normal. Determine si se puede considerar
que los tiempos de procesamiento de utiliza cada máquina no son iguales, utilizando
un nivel de significancia del 5% y además si esto es cierto ¿qué máquina recomendaría
utilizar?
Fuente GL SC MC F
Factor 3 12,107 4,036 10,59
Error 24 9,144 0,381
Total 27 21,251
81. Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro
procedimientos diferentes (A, B, C Y D), asignados al azar a un grupo de sujetos.
Posteriormente se les realiza una prueba de recuerdo de dichas palabras,
obteniéndose los siguientes resultados:
A 5 7 6 3 9 7 4
B 9 11 8 7 7 4 4
C 8 6 9 5 7 4 5
D 1 3 4 5 1 2 3
33
a. ¿Qué conclusiones pueden sacarse acerca de las cuatro formas de
presentación, con un nivel de significación del 2,5%?
b. Realice un análisis más extenso con ayuda de la siguiente salida proporcionada
por el MINITAB.
82. Una socióloga estuvo investigando esta cuestión: ¿existe alguna relación entre el
nivel de Instrucción alcanzado y el nivel de actividad social de una persona? Decidió
manejar tres niveles de Instrucción: primaria, secundaria y universitaria o más. Cada
persona llevó un registro de sus actividades sociales, como jugar boliche en grupo,
asistir a bailes, eventos sociales, ceremonias religiosas, etc. La socióloga los dividió
en actividad social inferior al promedio, actividad social promedio y actividad social
superior al promedio. Los resultados de su muestra se dan en la siguiente tabla:
Actividad Social
Nivel de
Superior al Inferior al
Educación Promedio
promedio promedio
Universitaria 20 10 10
Secundaria 30 50 80
Primaria 10 60 130
a. Al nivel de significancia del 2,5%, ¿se puede inferir que existe relación entre el
tipo de especialidad y el rendimiento académico en los últimos ciclos?
34
b. Con lo obtenido en la parte a., ¿se puede afirmar que la relación encontrada
entre ambas variables es fuerte?
35
86. El rector de una universidad quiere determinar si existe relación entre el área de
interés de cada estudiante y su preferencia por algún sistema de calificación
(Aprobado-reprobado, Sistema vigesimal: 0 – 20, Sistema porcentual: 0% - 100%).
Para ello, realiza una encuesta seleccionando a 500 estudiantes de las tres áreas de
interés. Se preguntó a cada estudiante cuál de los tres sistemas de calificación
prefieren. Los resultados aparecen en la siguiente tabla:
87. Se afirma que el número de errores que comete una secretaria al transcribir un
documento es una variable aleatoria que tiene una distribución de Poisson con media
de tres errores por trascripción. Se revisó 440 transcripciones hechas por ella y se
obtuvo los siguientes resultados: Realice la prueba con un α = 0,01.
N° de errores 0 1 2 3 4 5 6 7 ≥8
Frecuencia 18 53 103 107 82 46 18 10 3
N° de días 54 70 50 21 4 1
N° de vehículos 0 1 2 3 4 5 o más
36
89. El jefe del área de Estadística e Informática de la municipalidad de Lima
Metropolitana cree que el número de accidentes automovilísticos diarios en el cruce
de la Av. Javier Prado y La Molina presenta una distribución de Poisson con un
promedio de un accidente diario. Para ello, seleccionó una muestra de 80 días y se
obtuvo los resultados en el siguiente gráfico de líneas:
Con un 1% de significancia, ¿se puede concluir que la afirmación del jefe del área
de Estadística es correcta?
91. Un psicólogo clínico visita a ocho pacientes por día. El psicólogo cree que el número
de pacientes atendidos con depresión leve es una variable aleatoria con distribución
binomial y se sabe que el 30% de los pacientes presentan este problema. Para ello,
registra el número de pacientes atendidos con depresión leve por un periodo de 100
días. Los resultados se muestran en el siguiente gráfico de líneas:
37
Además, la atención de los pacientes se realiza de manera independiente.
92. La solicitud de préstamo que presentan los clientes de un banco está compuesta por
cuatro rubros. El gerente de préstamos desea realizar un estudio sobre la distribución
de la cantidad de rubros que son rechazados por cada solicitud, para esto toma una
muestra de 60 solicitudes, obteniéndose los siguientes resultados:
N° de rubros rechazados 0 1 2 3 4
N° de solicitudes 20 15 7 10 8
¿Se puede afirmar que el número de rubros rechazados sigue una distribución
binomial con probabilidad igual a 0,4? Use un = 0,01.
SEMANA 5
38
a. ¿Cuál es la prueba que debe utilizarse en este caso? Explique
b. Con α = 0.05, ¿existe alguna razón para creer que el número de empleados
que asisten al consultorio médico, no se encuentra distribuido de forma
equitativa durante los días de la semana?
Distrito A B C D E
Porcentaje 21 18 30 17 14
Usted, quiere verificar estadísticamente esta afirmación y decide que una forma de
verificar la anterior hipótesis propuesta es seleccionando una muestra de las ventas
realizadas en los últimos tres meses (en miles de unidades) y obtiene lo siguiente:
Distrito A B C D E
Ventas realizadas 54 61 83 46 56
39
Lunes Martes Miércoles Jueves Viernes
49 35 32 39 45
Con un nivel de significación del 5%, ¿existe alguna razón para creer que el número
de empleados que asisten al consultorio médico, no se encuentra distribuido en forma
equitativa durante los días de trabajo de la semana?
97. El gerente de un banco afirma que los motivos de préstamos personales para auto,
casa y viaje están en la relación 4:2:1. Para corroborar su afirmación selecciona
aleatoriamente a 140 clientes que se les otorga un crédito y los clasifica en la
siguiente tabla:
Estos datos corroboran la afirmación del gerente del banco. Use un = 0,1.
98. Una compañía de seguros desea establecer el pago de la prima a cobrar por
asegurar un determinado modelo de auto. La información que tienen y que fue
obtenida en un estudio realizado al año pasado indica que el 30% de clientes
asegurados tienen un accidente, y que cuando este ocurre el accidente puede
considerarse leve el 60% de las veces, se puede considerar que el accidente es de
medianas proporciones el 30% de las veces y un accidente se considera grave el
10% de las veces. Para determinar si los resultados del estudio realizado el año
pasado aún permanecen vigentes se toma una muestra aleatoria de asegurados de
la compañía y se encontró los siguientes resultados:
Accidente de
Condición del No tiene Accidente Accidente
Asegurado Accidente Leve medianas Grave
proporciones
Número de veces 198 47 37 18
Determine si se puede tener en cuenta los resultados del estudio realizados el año
pasado para poder determinar el monto de la prima que debe cobrar. Justifique e intérprete
adecuadamente sus resultados. Utilice un nivel de significación el 2,5%.
40
Para una nueva temporada que se iniciará en breve, y con la finalidad de planificar
sus pedidos, este comerciante desea determinar si el comportamiento aleatorio de las
unidades excedentes continúa siendo la misma, para lo cual toma una muestra
aleatoria de 900 puntos de venta en la ciudad de Lima y encontró los siguientes
resultados:
Unidades Excedentes 1 2 3 4 5
Puntos de ventas 20 60 150 250 420
Con estos datos y usando un = 0,05. ¿Se puede concluir que el comportamiento
aleatorio en cuanto a las unidades excedentes aún continúa siendo determinado por
dicha distribución de probabilidad?
Para comprobar esto, toma una muestra aleatoria de 120 días y observa el número
de minicomponentes vendidos, los resultados se muestran en la siguiente tabla:
N° de minicomponentes vendidos 0 1 2 3 4 ≥5
N° de días 7 12 30 24 26 21
101. Un atleta efectúa 150 lanzamientos de disco durante una semana de práctica. En
la siguiente Tabla se muestran las distancias logradas en sus lanzamientos (en
pies).
41
Distancia: X Número de Lanzamientos
x 61 18
61 < x 63 30
63 < x 65 60
65 < x < 67 37
x 67 5
Demanda de
X< 5 [5 – 9> [9 – 13> [13 – 17> [17 – 21> X ≥ 21
celulares
Número de
4 8 13 21 9 5
meses
103. El gerente de un banco efectúa 150 solicitudes de crédito hipotecario durante una
semana. En la siguiente tabla se muestran los montos de los créditos hipotecarios
solicitados (en miles de dólares).
Si se utiliza un nivel de significación del = 0.05, ¿se puede tener evidencia suficiente
como para afirmar que los montos de los créditos hipotecarios se comportan como
una distribución normal con promedio = 85 miles de dólares y desviación estándar
= 5 miles de dólares?
42
Correlación lineal
104. El administrador del área de préstamo de una entidad bancaria quiere determinar
la relación entre los ingresos mensuales en miles de soles; y ahorros mensuales en
miles de soles, de sus clientes. Para esto, seleccionó una muestra aleatoria de seis
clientes y se obtuvo los siguientes resultados:
Número de unidades 1 3 5 10 12 15 24
Costo unitario 55 52 48 36 32 30 25
10 10 10 10 10
X = 765;
i=1 i=1
X = 69225; Y = 316 ;
i=1 i=1
Y = 12128 ; X Y = 28605
i=1
ii
43
ventas. El departamento de mercadotecnia ha estudiado una variedad de relaciones
y cree que los gastos mensuales en carteles pueden ser signifificativos. Se
muestreó 7 meses y se determinó lo siguiente:
108. Los datos del problema 107 han sido ingresados al MINITAB obteniendo la siguiente
salida para este ejercicio:
44
Basado en la salida de MINITAB proporcionada, conteste las siguientes preguntas:
a. Determine la línea de regresión que permita estimar los ingresos mensuales por
ventas en función de los gastos mensuales en carteles. Interprete el coeficiente
de regresión.
b. Con un nivel de significancia de 2.5%, ¿se puede afirmar que el modelo de
regresión lineal es significativo?
c. ¿Qué porcentaje de la variación de los ingresos mensuales por ventas está
explicado por los gastos mensuales en carteles?
d. Utilice el modelo de regresión lineal desarrollado para estimar los ingresos
mensuales por ventas si la empresa ha gastado 28 000 dólares en carteles.
e. Con un 95% de confianza, estime el ingreso promedio mensual por ventas si la
empresa ha gastado 30 000 dólares en carteles.
109. El administrador del área de préstamo de una entidad bancaria quiere determinar
la relación entre los ingresos mensuales en miles de soles; y ahorros mensuales en
miles de soles, de sus clientes. Para esto, seleccionó una muestra aleatoria de seis
clientes y se obtuvo los siguientes resultados:
45
Ingreso mensual 1.0 1.2 1.5 0.8 1.8 2.0
Ahorro mensual 0.20 0.22 0.25 0.18 0.30 0.35
110. A continuación, se muestran los gastos en publicidad (en ciento de dólares) y sus
ventas (en miles de artículos) que realiza una empresa. Los resultados registrados
se seleccionaron aleatoriamente en una muestra de diez semanas.
a. Determine la línea de regresión que permita estimar las ventas en función del
gasto en publicidad.
b. Interprete el coeficiente de regresión estimado.
c. Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo de
regresión lineal es significativo?
d. ¿Qué porcentaje de la variabilidad del gasto de publicidad está explicado por las
ventas?
46
e. Con un nivel de confianza de 95%, estime el nivel de ventas que se espera
obtener si se realiza un gasto de 17 mil dólares en publicidad.
Número de unidades 1 3 5 10 12 15 24
Costo unitario 55 52 48 36 32 30 25
112. El gerente de ventas permite que los agentes vendedores que tiene a su cargo
47
reciban capacitaciones motivacionales que se dan en diferentes horarios y se tiene
absoluta libertad para elegir el horario que crean conveniente. El gerente cree que
las capacitaciones motivacionales influyen en la eficiencia de las ventas. Para
verificar esto, se toma una muestra de 10 vendedores y registró el tiempo
acumulado de horas en las que estuvo presente en una o más capacitaciones
durante el último trimestre y la eficiencia de sus ventas (en porcentaje), los datos
encontrados fueron:
Tiempo acumulado en
27 45 41 19 35 39 19 49 15 31
capacitaciones
Eficiencia en las ventas 47 84 80 46 62 72 52 87 37 68
Los resultados obtenidos en con el MINITAB son los siguientes:
113. A continuación, se muestran los gastos en publicidad (en miles de dólares) y sus
ventas (en miles de artículos) que realiza una empresa. Los resultados registrados
se seleccionaron aleatoriamente en una muestra de diez semanas.
Gasto en publicidad 9 7 5 14 15 12 6 10 15 21
Ventas 10 6 5 12 10 15 5 12 17 20
48
a. Determine la línea de regresión que permita estimar el nivel de ventas en base
al gasto en propaganda. Interprete el coeficiente de regresión estimado.
b. Con un nivel de significancia de 0.05, ¿existe evidencia estadística para afirmar
que el modelo de regresión lineal es significativo?
c. Construya un intervalo de confianza del 95% para el nivel de ventas promedio
cuando se gasta en propaganda 17 mil dólares.
d. ¿Qué porcentaje de la variación total en la venta es explicada por el modelo de
regresión?
Semana 1 2 3 4 5 6 7 8 9 10
Precio 1.3 2.0 1.7 1.5 1.6 1.2 1.6 1.4 1.0 1.1
Venta 10 6 5 12 10 15 5 12 17 20
a. Estime la línea de regresión del nivel de ventas en base al precio del artículo.
Interprete el coeficiente de regresión estimado.
b. Con un nivel de significancia de 0.01, ¿existe evidencia estadística para afirmar
que el modelo de regresión lineal es significativo?
c. Estime el nivel de ventas que se espera obtener si el precio del artículo es de
$1.8.
d. Construya un intervalo de confianza del 99% para el nivel de ventas promedio
cuando el precio del artículo es de $1.8. Interprete.
e. ¿Qué porcentaje de la variabilidad del nivel de ventas no es explicado por el
modelo de regresión lineal simple?
49
116. El gerente de la empresa Carro S.A. dedicada a la compraventa de vehículos usados,
desea verificar si el precio de venta de este tipo de vehículos (miles de dólares) está
relacionado con el recorrido acumulado (decenas de miles de kilómetros). Con este fin,
se hace un estudio basado en una muestra aleatoria de vehículos vendidos durante el
año 2017 y se obtuvo la siguiente información:
SEMANA 6
Donde:
Y = Cantidad de calor desprendida (calorías / gramos)
X1 = Porcentaje de óxido de calcio
X2 = Porcentaje de dióxido de silicio
X3 = Porcentaje de óxido de hierro
50
a. Con un nivel de confianza de 5%, ¿se puede afirmar que las variables
independientes son significativas? Si alguna variable independiente no es
significativa, obtenga el nuevo modelo. Use las salidas del minitab.
51
e. Estime la cantidad de calor desprendida si los porcentajes de óxido de calcio,
dióxido de silicio y óxido de hierro son 10.8, 32.5 y 42.5 respectivamente.
52
a. Verifique los supuestos para un análisis de regresión lineal múltiple y la
multicolinealidad utilizando el Factor de Inflación de la variable (VIF)
b. Indique el modelo de regresión lineal múltiple. Interprete cada uno de los
coeficientes de regresión.
c. Con un nivel de significancia de 5%, ¿se puede afirmar que las variables
independientes son significativas?
d. ¿Se puede afirmar que el modelo de regresión lineal es significativo? Use un nivel
de significancia de 5%.
e. ¿Qué porcentaje de la variación total del tiempo de reparto no es explicada por el
modelo de regresión?
f. Determine el tiempo promedio de entrega del producto cuando se tienen que
entregar 18 cajas, para lo cual se tiene que recorrer una distancia de 35 km. Use
un nivel de confianza de 95%.
53
a. Verifique la no multicolinealidad y la no autocorrelación en los residuales. Use un
α = 0.05.
b. Indique el modelo de regresión lineal múltiple. Interprete el coeficiente de
regresión para la variable años de experiencia del colaborador.
c. Con un nivel de significancia de 0.05, ¿existe evidencia para afirmar que el modelo
con las dos variables es válido?
d. Con un nivel de significancia de 0.05, ¿existe evidencia para afirmar que las
variables independientes son significativas?
e. Determine e interprete el coeficiente de determinación correspondiente para este
análisis.
120. La compañía Aceros ha estado buscando los factores que influyen en la cantidad
de acero (en millones de toneladas) que es capaz de vender cada año. La
administración sospecha que los siguientes son los factores principales: La tasa
anual de inflación del país, el precio promedio por tonelada en dólares, mediante el
cual el acero importado acota los precios de la compañía y el número de
automóviles en millones que los fabricantes del país están planeando producir en
ese año. Se han recogido los datos correspondientes a los últimos siete años y se
analizó los datos con el MINITAB obteniéndose los siguientes resultados:
54
a. Verifique los supuestos de multicolinealidad y autocorrelación en los errores. Use
un α = 0,05.
b. Determine el modelo de regresión lineal múltiple. Interprete el coeficiente de
regresión para la variable tasa anual de inflación del país.
c. Con un nivel de significancia de 0,05, ¿al menos una de las variables es
significativa?
d. Con un nivel de significancia de 0,05, ¿qué variables deben quedarse en el
modelo?
e. Con lo obtenido en d), plantee el nuevo modelo de regresión lineal.
f. Determine e interprete el coeficiente de determinación ajustado.
121. Se desea estimar la variable Y en función a otras cuatro variables. Al tomar una
muestra de tamaño 10 se encontró los siguientes resultados con el MINITAB:
55
regresión lineal múltiple.
b. Con un 5% de significancia, ¿se puede afirmar que el modelo es significativo?
c. Con un nivel de significancia del 0.05, ¿existe evidencia estadística para afirmar
que las variables independientes son significativas? Utilizar un α = 0.05.
d. Asumiendo que todas las variables independientes se quedan en el modelo, ¿qué
porcentaje de la variabilidad de Y está explicada por el modelo de regresión
estimado?
122. El gerente de una empresa inmobiliaria tiene interés en realizar un estudio acerca
de los precios de las viviendas que posee la urbanización “El Sol de las Laderas”,
donde existe un solo centro comercial. La empresa ha decidido incluir en el análisis
las siguientes variables:
Se asume que los errores siguen una distribución normal y que no existe
autocorrelación entre ellos.
56
variable antigüedad.
c. Pruebe si el modelo de regresión múltiple que incluye las tres variables
independientes es significativo. Use un α = 5%
d. Pruebe si las variables independientes son significativas. Use un α = 5%.
123. El gerente de ventas de un centro comercial quiere conocer si las ventas anuales
en miles de dólares son afectadas por el número de trabajadores en cientos, el
número de acciones en miles ofrecidas por cada empresa y el valor del inventario
al principio del año en miles de dólares. Se selecciona una muestra de 16 empresas
hoteleras, los datos recolectados fueron procesados en el software del MINITAB y
se obtuvieron los siguientes resultados:
124. El gerente comercial de una cadena de tiendas desea estimar la Utilidad (UTIL)
mensual de una empresa comercial en miles de dólares, y considera que las
variables que pueden explicar las fluctuaciones de la utilidad son: el Nivel de ventas
(NV) en cientos de unidades mensuales, el Gasto en publicidad (GP) en miles de
soles, el Precio unitario (PU) en soles y el Monto de pago en impuestos (PI) en
cientos de soles. Se tomó una muestra de tamaño 20 y al procesar estos datos en
el programa MINITAB se observaron los siguientes resultados:
57
a. Interprete los coeficientes de regresión de las variables nivel de ventas y gasto en
publicidad.
b. Con un nivel de significancia de 5%, ¿existe evidencia estadística para afirmar
que el modelo de regresión es significativo?
c. ¿Se puede afirmar que todas las variables independientes del modelo son
significativas? Use = 5%. Luego indique que variable o que variables
independientes deben de salir del modelo.
d. De acuerdo con sus resultados obtenidos en la parte c., y con las siguientes
salidas del programa Minitab indique en forma clara el modelo final que le
recomendaría al Gerente Comercial de esta cadena de tiendas:
58
59
e. Con el modelo obtenido en el inciso d), ¿qué porcentaje de variación de la utilidad
es explicado por el modelo final?
SEMANA 7
125. En la liga nacional de fútbol americano de Estados Unidos (NFL) se evalúa a sus
prospectos con una escala que va del 5 al 9. Estas evaluaciones se interpretan
como sigue:
60
Ingresando los datos y analizando en el minitab se obtuvo los siguientes resultados:
61
las variables independientes y la variable dependiente.
c. ¿Es la posición un factor significativo en la evaluación de los jugadores? Use α =
0.05. Explique.
d. Suponga que hay un nuevo prospecto de tackle que pesa 300 libras y corre 40
yardas en 5.1 segundos. Utilice la ecuación de regresión estimada obtenida en el
inciso a) para estimar la evaluación de este jugador.
e. ¿Proporciona la ecuación de regresión estimada un buen ajuste a los datos
observados? Justifique su respuesta.
62
a. Con el modelo de regresión estimado, interprete el coeficiente de regresión
para meses transcurridos desde la última reparación.
b. Con un nivel de significancia 0.05, pruebe si la ecuación de regresión estimada
obtenida en el inciso a. indica que existe una relación significativa entre las
variables independientes y la variable dependiente.
c. Con un nivel de significancia de 5%, ¿se puede afirmar que tipo de reparación
es una variable significativa?
d. Estime el tiempo necesario de reparación mecánica si han transcurrido 7.5
meses desde la última reparación.
63
Donde:
X1 = Meses desde el último servicio
X2 = Tipo de reparación
→ X2 = 0: Tipo mecánico y X2 = 1: Tipo eléctrico
X3 = Persona que realiza la reparación
→ X3 = 0: Dave Newton y X3 = 1: Bob Jones
64
Si se asume que todas las variables permanecen en el modelo de regresión:
d. Estime el tiempo que se requiere una reparación si la han pasado 5 meses de la
última reparación, el tipo de reparación es eléctrico y la persona que realizó la
reparación fue Bob Jones.
e. ¿Qué porcentaje de variabilidad del tiempo de reparación está explicada por el
modelo de regresión?
SEMANA 7
128. En un centro clínico se realizó un estudio para determinar si los pacientes con algún
tipo de enfermedad cancerígena después de terminar el tratamiento respectivo se
logran curar. En una muestra seleccionada al azar de 40 pacientes, se registró los
datos de las siguientes variables:
65
a. Determine el modelo de regresión logística binaria para estimar la probabilidad de
que el paciente se cura de la enfermedad cancerígena.
b. Calcule la probabilidad de que el paciente se cure de la enfermedad cancerígena
si recibe tratamiento y se encuentre a inicios.
c. Interprete el odds ratio para la variable recibe tratamiento.
d. Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo es
significativo?
e. Con un nivel de significancia de 5%, ¿se puede afirmar que las variables
predictoras son significativas?
66
a. Determine el modelo de regresión logística binaria para estimar la probabilidad
de que el paciente padezca de diabetes mellitus.
b. Calcule la probabilidad de que el paciente no padezca de diabetes mellitus si
es mujer, no practica ejercicios físicos, no cumple una dieta alimenticia y no
frecuenta al médico mensualmente.
c. Interprete el odds ratio para la variable: practica ejercicios físicos
d. Con un nivel de significancia de 2.5%, ¿se puede afirmar que el modelo es
significativo considerando a todas las variables independientes?
67
e. Con un nivel de significancia de 2.5%, ¿se puede afirmar que la variable
independiente frecuenta al médico es significativa?
130. Los clientes de una gran empresa distribuidora se dividen en dos grupos, los que
compran a crédito y los que compran al contado. El gerente de compras desea
estimar la probabilidad de que una empresa pertenezca al grupo que compra al
contado (1). Para esto, se seleccionó una muestra aleatoria de 100 clientes y
además, para estimar la probabilidad se recolectó la información de las siguientes
variables predictoras:
68
d. Interprete el Odds ratio de la variable plazo de entrega.
69
a. Determine el modelo estimado de regresión logística binaria.
b. Interprete el cociente de posibilidades de la variable nota promedio.
c. ¿Se puede afirmar que la probabilidad de que un postulante ingrese a la
universidad con nota promedio de 12,8 es mayor a la probabilidad de que no
ingrese a la universidad?
d. Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo de regresión
logística estimado es significativo?
e. Con un nivel de significancia de 5%, ¿se puede afirmar que la variable predictora
es significativa?
132. El director del banco del sur se muestra preocupado por el aumento de clientes
morosos en los últimos años. Con objeto de reducir este problema, realiza un
estudio que permita identificar con la mayor precisión posible aquellas solicitudes
de préstamos que probablemente puedan llegar a convertirse en préstamos
morosos en el caso que se concedieran. Después de analizar la documentación
existente en el banco, el investigador solamente puede conseguir la información de
25 clientes a los que se la ha concedido préstamos en los tres últimos años. Algunos
de estos datos son los siguientes:
Ingreso
N° cliente Tipo de cliente mensual
1 1 4450
2 1 3100
3 1 3100
4 1 5200
5 1 4975
6 1 4250
: : :
70
Donde las variables son:
- Tipo de cliente: 1: cliente moroso 2: cliente cumplido
- Ingreso mensual en miles de soles
133. Consumer Report le realizó una prueba de sabor a 19 marcas de chocolates. En los
datos a continuación se da el precio por porción, en base al tamaño de porción de
la FDAque es de 1.4 onzas, así como una evaluación de la calidad de los 19
chocolates tomados para la prueba (Consumer Report, febrero 2002).
71
Suponga que desea determinar si los productos que son más caros son mejor
evaluados. Para los propósitos de este ejercicio, emplee la siguiente variable
binaria dependiente.
72
a. Determine el modelo de regresión logística estimado.
b. Estime la probabilidad de que la evaluación de un chocolate cuyo precio por
porción es $4.00 sea muy bueno o excelente.
c. Interprete el odds ratio para Precio.
d. Con un 5% de significancia, ¿se puede afirmar que el modelo de regresión
logística es significativo? Y ¿la variable predictora contribuye al modelo de
regresión logística?
73
Se pide:
a. Obtenga la ecuación de regresión logística que relaciona a las variables X 1 y X2
con Y.
74
b. Realice la prueba de significancia global empleando α = 0.05.
c. Empleando α = 0.05, determine si cada una de las variables independientes son
significativas.
d. Use el logit estimado del inciso a) para obtener una estimación de la probabilidad
de que un estudiante cuyo GPA es 2.5 y que no participó en el programa de
orientación permanezca en la escuela.
e. Interprete el cociente de posibilidades para el programa de orientación.
135. El Community Bank desea aumentar la cantidad de clientes a los que les depositan
directamente su nómina. El gerente está considerando una campaña que requerirá
que cada gerente de sucursal llame a cada cliente que no reciba directamente su
nómina. Como incentivo para aceptar recibir directamente su nómina, se les
ofrecerá revisión gratuita de su cuenta durante dos años. Debido al tiempo y a los
costos de esta campaña, el gerente desea que esta campaña se dirija a aquellos
clientes que tengan la mayor probabilidad de aceptar recibir directamente su
nómina. El gerente piensa que el saldo promedio mensual en la cuenta de cheques
del cliente puede ser un predictor útil para determinar si un cliente aceptará o no
recibir directamente su nómina. Para investigar la relación entre estas dos variables,
Community Bank prueba la nueva campaña utilizando una muestra de cuentas de
cheques de 50 clientes que actualmente no reciben directamente su nómina. En los
datos muestrales se presenta el saldo mensual promedio en la cuenta de cheques
(en miles de dólares) y si el cliente aceptó recibir directamente el depósito de su
nómina (1 significa aceptó el depósito directo de su nómina y 0 significa el cliente no aceptó
el depósito directo de su nómina).
75
a. Obtenga la ecuación de regresión logística estimada.
b. Realice una prueba de significancia empleando el estadístico de prueba G. Use
α = 0.05.
c. Estime la probabilidad de que los clientes cuyo saldo mensual promedio sea $1000
acepten recibir directamente el depósito de su nómina.
d. Supóngase que Community Bank desea contactar únicamente a los clientes para
los que la probabilidad de aceptar recibir directamente su nómina sea de 0.50 o
mayor. ¿Cuál es el saldo promedio requerido para tener esta probabilidad?
e. Dé la estimación del cociente de posibilidades. ¿Cuál es su interpretación?
76