Está en la página 1de 76

DIRECCIÓN DE ESTUDIOS GENERALES

GUIA DE TRABAJO

ESTADÍSTICA II

2020 – 01

1
SEMANA 1

Intervalos de confianza para la MEDIA POBLACIONAL (𝝁)

1. Se va a vender un nuevo cereal para desayuno como prueba de mercados durante un


mes en las tiendas de una cadena de autoservicio. Los resultados de una muestra de
26 tiendas indicaron una venta promedio de 1250.8 soles y una desviación estándar
de 210.4 soles. Si las ventas tienen distribución normal.

a. Con un 95% de confianza, calcule el margen de error.


b. Con un 95% de confianza, estime la venta promedio de este cereal en este mes de
prueba.

2. Responda las siguientes preguntas:

a. Suponga que de una población se seleccionó una muestra aleatoria igual a 64


familias, con el objetivo de estimar el gasto promedio mensual por alimentación (en
soles), el cual sigue una distribución normal. Con cierto nivel de confianza y
sabiendo que la varianza del gasto mensual por alimentación es igual a 62 500
soles2, se encontró el siguiente intervalo de confianza: 𝐼𝐶(𝜇) = 〈1148.6; 1251.4〉.
Calcule el valor de la media muestral utilizada, el margen de error y el nivel de
confianza usado en la estimación.

b. Dentro del contexto de la parte a., se desea reducir el error de estimación (margen
de error) en un 25%, manteniendo el mismo nivel de confianza y las medidas de
resumen. Calcule el tamaño de muestra que se requiere en este caso.

c. La siguiente información es una salida de MINITAB con respecto a una estimación


mediante intervalos de confianza para el promedio de peso de un artículo:

Z de una muestra: Peso

Estadísticas descriptivas
Error estándar IC de _____%
N Media Desv.Est. de la media para μ
26 246.165 2.709 0.628 (244.803; _________)

μ: media de Peso
Desviación estándar conocida = 3.2

Por error se borró el valor del nivel de confianza y el límite superior. Con la
información obtenida del resultado del minitab. Determine dichos valores.

d. En el problema anterior si el intervalo de confianza para la media es <244.548;


247.782>. ¿Qué nivel de confianza se utilizó?

2
3. Se seleccionó una muestra de 20 bodegas de cierta zona de la ciudad con la finalidad
de estimar el nivel promedio de ventas por semana (en miles de soles). Los datos
obtenidos se procesaron mediante el programa MINITAB, y los resultados se
muestran a continuación:

T de una muestra: Nivel de ventas

Estadísticas descriptivas
Error estándar IC de _____%
N Media Desv.Est. de la media para μ
20 ________ 4.054 0.906 (59.575; 62.709)

μ: media de Nivel de ventas

A partir de esta información responda las siguientes preguntas:

a. Calcule el nivel promedio de ventas por semana obtenido de las 20 bodegas.


b. Calcule el nivel de confianza usado en la estimación por intervalos para el nivel
promedio de ventas por semana.
c. Con el nivel de confianza obtenido en b, ¿se puede afirmar que el nivel de venta
promedio semanal es superior a los 59 500 soles?

4. La siguiente es una corrida del programa MINITAB, para una muestra de personas a
las que se les preguntó acerca de su gasto semanal en movilidad (en soles).

T de una muestra: Gasto semanal

Estadísticas descriptivas
Error estándar IC de _______%
N Media Desv.Est. de la media para μ
25 _______ _______ 0.360 (43.981; 45.467)

μ: media de Gasto semanal

Complete la información faltante, los resultados se obtuvieron para estimar el gasto


semanal promedio en movilidad.

5. El jefe de una casa comercial desea estimar el monto adeudado de los clientes con
cuenta de crédito. Para esto, se selecciona una muestra aleatoria de 25 clientes con
cuenta de crédito, obteniéndose el promedio del monto adeudado y la desviación
estándar del monto adeudado igual a 950 soles y 300 soles respectivamente. Con un
99% de confianza, estime el monto promedio adeudado de los clientes. Además, se
sabe que el monto adeudado por los clientes tiene una distribución normal.

3
6. Una empresa comercializa granos de café en bolsas de 460 gramos. Sin embargo,
INDECOPI ha recibido las quejas de un grupo de consumidores los cuales alegan que
el contenido de dichas bolsas es menor a lo indicado; para corroborar las quejas, un
funcionario de INDECOPI seleccionó una muestra aleatoria de diez unidades del
producto resultando los siguientes pesos en gramos:

448.4 462.7 448.5 450.4 449.6 451.0 450.9 449.2 460.3 463.3

a. Con un nivel de confianza del 98%, estime el contenido medio de las bolsas.
b. Al nivel de confianza del 98%, ¿puede el funcionario llegar a la conclusión que los
consumidores tienen la razón? Considere los resultados obtenidos en el ítem a.

Intervalos de confianza para la PROPORCIÓN POBLACIONAL (𝝅)

7. Una industria lechera ubicada en el departamento de Ica está estudiando la posibilidad


de cambiar sus botellas de vidrio para la leche a envases de plástico. Con esta finalidad,
se realizó el estudio considerando una muestra aleatoria de 450 personas, las cuales
fueron clasificadas por estrato socioeconómico. Los resultados se muestran en cuadro
adjunto:
A favor del Estrato socioeconómico
cambio A (Alto) B (Medio) C (Bajo)
Si 80 70 120
No 40 80 60

a. Estime la proporción de personas que están a favor del cambio de envase. Use un
nivel de confianza del 98%.
b. Estime la proporción de personas del estrato socioeconómico B o C que están a
favor del cambio de envase. Use un nivel de confianza del 97%.

8. Un inversionista desea analizar el comportamiento sobre la rentabilidad de dos tipos


de acciones asociadas a los fondos mutuos. Para ello, decide consultar a dos agencias
para averiguar cuál de las acciones es más rentable: agraria o minera. Se seleccionan
muestras aleatorias independientes por cada tipo de acción y los resultados se
muestran en cuadro adjunto:

Agencia A Agencia B
Acciones Si son No son Si son No son
rentables rentables rentables rentables
Agrarias 15 25 20 20
Mineras 20 40 25 35

a. Con un nivel de confianza del 95%, estime la proporción de acciones agrarias


rentables según la agencia A.
b. Estime la proporción de acciones mineras no rentables. Use un nivel de confianza

4
del 99%.
c. Con un nivel de confianza del 90%, estime la proporción de acciones que son
rentables.

9. En un estudio realizado a 2100 jóvenes encuestados con edades entre 17 a 22 años


en cierto distrito de la ciudad de Lima, se estimó la proporción de aquello que utilizan
la aplicación Instagram como red social; mostrándolo en el siguiente resultado
obtenido con minitab:

Prueba e IC para una proporción

Método
p: proporción de eventos
Para este análisis se utiliza el método de aproximación a la normal.

Estadísticas descriptivas
N Evento Muestra p IC de ____% para p
2100 1792 _________ (0.8334; 0.8732)

a. Calcule la información faltante.


b. Con el nivel de confianza usado en la estimación, ¿se puede afirmar que el
porcentaje de jóvenes que usan Instagram como red social es más del 80%?
Justifique su respuesta.
c. Calcule el error de estimación.

Intervalos de confianza para la media y proporción poblacional

10. El director de la aseguradora del fondo de pensiones “AFP Neptuno” seleccionó una
muestra aleatoria de 1 200 afiliados que hicieron sus aportaciones en el último
trimestre, obteniéndose el monto promedio de las aportaciones igual a $ 850 y la
desviación estándar del monto de las aportaciones igual a $ 225. Además, 650 de
los 1 200 afiliados seleccionados tienen montos de aportaciones superiores a $ 1
250.
a. Con un 90% de confianza, estime el monto promedio de las aportaciones de los
afiliados de la AFP Neptuno en el último trimestre.
b. Con 98% de confianza, estime la proporción de afiliados que tienen montos de
aportaciones superior a $ 1 250 en el último trimestre.

11. En cierto distrito de la capital se está realizando un estudio mediante el cual se podría
tener la posibilidad de otorgar crédito monetario a los comerciantes de la zona y de
este modo se puedan formalizar. Para esto se quiere estimar el ingreso mensual de
un sector de comerciantes informales. Se seleccionó una muestra aleatoria de 120
comerciales informales y se encontró entre otros datos lo siguiente: un ingreso

5
promedio de 1 800 soles y una desviación estándar de 150 soles; y el 36% de los
comerciantes informales tienen ingresos superiores a 2 100 soles.
a. Construye un intervalo de confianza del 95% para estimar el ingreso promedio
mensual. Interprete los resultados.
b. Con un nivel de confianza del 90%, estime la proporción de comerciantes con
ingresos superiores a 2 100 soles.

12. En un instituto de Enseñanza Superior tiene 800 estudiantes matriculados. Se tomó


una muestra aleatoria de estudiantes la cual representa el 15% del total, y se llevó a
cabo una pequeña encuesta con las siguientes preguntas:

Pregunta 1: ¿Utiliza la cafetería del instituto? Sí ___ No ____


Pregunta 2: Si la repuesta anterior es afirmativa, diga aproximadamente cuánto
dinero gasta al día en esta cafetería.

Lo resultados: fueron:
1. Contestaron negativamente a la pregunta 1, un total de 24 alumnos.
2. De los que contestaron afirmativamente la pregunta 1, se obtuvo que el gasto
promedio diario es 12.2 soles con una desviación estándar de 3.48 soles.

Considere estas características y resultados mostrados para responder las siguientes


preguntas:
a. Defina la población de interés en este caso, indique las variables y el tipo de
variable involucradas en esta situación.
b. Estime la proporción de alumnos que utilizan la cafetería con un 90% de confianza.
c. Determine, con un nivel de confianza del 97%, el máximo error de estimación
cometido con la estimación realizada en el inciso b.
d. Estime con un 97% de confianza, el monto promedio diario que gasta un
estudiante que utiliza la cafetería del instituto, suponiendo que el gasto diario que
realizan los alumnos que hacen uso de la cafetería del instituto se distribuye
normalmente.

Cálculo del TAMAÑO DE MUESTRA (𝒏)

13. El gerente comercial de una cadena de tiendas, que tiene un gran número de
establecimientos distribuidos en todo el país, desea estimar el nivel de ventas
promedio semanal de estos establecimientos, para lo cual se fija las siguientes
condiciones: está dispuesto a tolerar un error de a lo más 120 soles y desea estar
90% seguro de sus resultados. Si se tiene como información que la desviación
estándar en el nivel de ventas de dichos establecimientos es de 350 soles ¿Qué
tamaño de muestra debe utilizar este gerente?

6
14. El gerente de producción desea estimar el tiempo promedio de fabricación de un
artículo, en minutos; considerando un error máximo de 4 minutos. Además, por
experiencias anteriores, se sabe que la desviación estándar del tiempo de
fabricación del artículo es 10 minutos, ¿qué tamaño de muestra se debe de
considerar para el estudio, si se desea tener una seguridad del 95% para sus
resultados?

15. El jefe del área de Recursos Humanos de cierta institución educativa quiere estimar
el ingreso promedio de los administrativos que laboran en dicha institución. Si se
sabe que la varianza de los ingresos es 62 500 soles2; además se tiene un error de
65 soles y una confiabilidad de 97%. Determine el número de administrativos
necesario para realizar la estimación requerida por el jefe del área.

16. Un comerciante quiere estimar el porcentaje de personas que responden


favorablemente a una nueva campaña de publicidad televisiva, con un error máximo
de 2.5% y un nivel de confianza del 90%. Determine el tamaño de muestra necesario
para realizar dicha estimación. Además, de una muestra piloto se determinó que el
65% de las personas respondieron favorablemente a la campaña de publicidad
televisiva.

17. Para adquirir un lote de artículos de playa en un centro comercial, el gerente quiere
estimar el porcentaje de artículos defectuosos que contiene este lote, para lo cual
fija un error de estimación de a lo más 3% y un nivel de confianza del 90%. ¿Qué
número de artículos de playa será necesario para realizar la estimación, si por
experiencias anteriores, se sabe que aproximadamente este tipo de lotes tienen 5%
de artículos defectuosos?

18. ¿Qué tamaño de muestra se debe tomar con una confianza del 95% y con un error
de estimación no mayor a 0.005 para estimar la proporción de componentes
electrónicos que fallaron antes de cumplir su vida útil?

19. Un investigador quiere estimar la proporción de jóvenes entre 17 a 22 años que


utilizan como medio de mensajería rápida la aplicación WhatsApp en cierto distrito.
Determine el número de jóvenes necesarios para estimar dicha proporción si se
tiene como máximo un error del 2.4% y una seguridad del 90%; además de una
muestra piloto, el 83.1% de los jóvenes utilizan la aplicación WhatsApp como medio
de mensajería rápida.

Intervalo de confianza para la VARIANZA POBLACIONAL (𝝈𝟐 )

20. Un empresario afirma que el riesgo de una cartera de inversión es significativamente


pequeño; es decir que, la desviación estándar de la utilidad es menor a $500. Para
verificar esto, un investigador decide seleccionar una muestra aleatoria de tamaño
16 acciones y se obtuvo una varianza de 102 400 dólares2.
a. Defina adecuadamente el parámetro a estimar en este caso.

7
b. Utilizando un 95% de confianza, ¿se puede considerar que realmente el riesgo
es bajo? Justifique su respuesta.

21. Suponga que de una población se seleccionó una muestra aleatoria igual a 64
familias, con el objetivo de estimar la varianza del gasto mensual por alimentación
(en soles). Con el paquete estadístico minitab se ingresó la información recolectada
y se obtuvo el siguiente resultado:

Prueba y CI para una varianza

Método
σ²: varianza de Muestra
El método de chi-cuadrada solo es válido para la distribución normal.

Estadísticas descriptivas
IC de 90% para σ²
usando
N Desv.Est. Varianza Chi-cuadrada
64 250 62500 (47711; 86082)

a. Con lo obtenido, diga ¿cuál es la estimación para la varianza del gasto mensual
por alimentación de las familias?
b. Con un 90% de confianza, ¿se puede afirmar que la varianza del gasto mensual
por alimentación no supera a los 87 mil soles.

22. El jefe de una casa comercial desea estimar la varianza del monto adeudado de los
clientes con cuenta de crédito. Para esto, se selecciona una muestra aleatoria de 25
clientes con cuenta de crédito, obteniendo la desviación estándar del monto
adeudado igual a 300 soles. Con un 99% de confianza, estime la varianza del monto
adeudado de los clientes. Además, se sabe que el monto adeudado por los clientes
tiene una distribución normal.

23. Se seleccionó una muestra de 20 bodegas de cierta zona de la ciudad con la finalidad
de estimar la desviación estándar del nivel de ventas por semana (en miles de soles).
Los datos obtenidos se procesaron mediante el programa MINITAB, y los resultados
se muestran a continuación:

Prueba y CI para una varianza

Método
σ: desviación estándar de Muestra
El método de chi-cuadrada solo es válido para la distribución normal.

8
Estadísticas descriptivas
IC de _____% para σ
usando
N Desv.Est. Varianza Chi-cuadrada
20 4.05 16.4 (3.08; 5.92)

A partir de esta información responda las siguientes preguntas:

a. Calcule el nivel de confianza usado en la estimación por intervalos para la


desviación estándar del nivel de ventas por semana.
b. Con el nivel de confianza obtenido en a, ¿se puede afirmar que la desviación
estándar del nivel de venta semanal no supera a los 6 000 soles?

24. El siguiente resultado obtenido con minitab da la estimación para la desviación


estándar del gasto semanal en movilidad (en soles) para una muestra de 25
trabajadores de una empresa:

Prueba y CI para una varianza

Método
σ: desviación estándar de Muestra
El método de chi-cuadrada solo es válido para la distribución normal.

Estadísticas descriptivas
IC de ____% para σ
usando
N Desv.Est. Varianza Chi-cuadrada
25 1.80 3.24 (1.46; 2.37)

A partir de esta información responda las siguientes preguntas:

a. Calcule el nivel de confianza usado en la estimación por intervalos para la


desviación estándar del gasto semanal en movilidad de los trabajadores.
b. Con el nivel de confianza obtenido en a, ¿se puede afirmar que la varianza del
gasto semanal en movilidad de los trabajadores supera a 2 soles?

25. Actualmente el costo promedio, por unidad producida, de un artículo es de 120 soles
con una desviación estándar de 10 soles. Se realizan ciertas medidas de reajuste en
el proceso de producción de este artículo con la finalidad de disminuir los costos de
producción. Luego de estas medidas se toma una muestra aleatoria de 9 artículos y
se registró los siguientes costos:

9
118,6 118,5 123,6 119,5 119,2 118,3 120,9 121,2 118,7

Con esta información, utilizando un nivel de confianza del 90%, ¿Es posible confirmar
que se logró el objetivo?

Intervalo de confianza para la DIFERENCIA DE MEDIAS POBLACIONALES (𝝁𝟏 − 𝝁𝟐 )


26. Se llevó a cabo las pruebas de la resistencia a la tensión sobre dos diferentes clases
de barras de aluminio (A y B) utilizados en la fabricación de alas de aeroplanos
comerciales. Por experiencia pasada con el proceso de fabricación de las barras y
del procedimiento de prueba, se sabe que, las desviaciones estándar de las
resistencias a la tensión de las barras de aluminio son 1 y 1,5 kg/mm2
respectivamente. Los datos resultantes de la prueba realizada se presentan en la
siguiente tabla:

Clase de Tamaño de la Resistencia


barra muestra promedio (kg/mm2)
A 20 87.6
B 22 74.5

Calcule e interprete el intervalo de confianza del 90% para la diferencia de medias.

27. Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio,
en gramos, en cemento estándar y en cemento contaminado con plomo. Los niveles
bajos de calcio indican que el mecanismo de hidratación del cemento queda
bloqueado y esto permite que el agua ataque varias partes de una estructura de
cemento. Al tomar diez muestras de cemento estándar, se registró que el peso
promedio de calcio es de 90 gramos y los resultados obtenidos de 15 muestras de
cemento contaminado con plomo, el peso promedio fue de 87 gramos. Si se sabe,
que el peso de calcio está distribuido normalmente, estime mediante un intervalo de
confianza del 95% la diferencia entre medias de los dos tipos de cementos. Además,
se conoce que la varianza del peso de calcio en cemento estándar y en cemento
contaminado con plomo son: 27,5 gramos2 y 15,875 gramos2 respectivamente.

28. Se ha realizado un estudio para comparar el contenido de nicotina (en gramos) de


dos marcas de cigarrillo (A y B) en base a muestras de tamaño 25 y 36 cigarrillos
respectivamente. Se sabe que estas dos marcas de cigarrillos tienen la misma
varianza del contenido de nicotina de 0.36 gramos 2. Los resultados del estudio se
presentan a continuación:

Marca de Tamaño de Contenido promedio


cigarrillo muestra de nicotina

10
A 25 3.1
B 36 2.5

Con un 95% de confianza, ¿se puede estimar que el contenido promedio de nicotina
de los cigarrillos de la marca A es superior a los de la marca B?

29. El jefe de personal de una empresa de confecciones quiere comparar los tiempos
promedios, en minutos, que operarios varones y mujeres utilizan para confeccionar
una camisa. Por estudios realizados anteriormente, se sabe que las desviaciones
estándar en cada uno de los grupos son de 2,5 y 1,2 minutos respectivamente. Para
realizar el estudio, el jefe de personal selecciona dos muestras aleatorias de tamaño
64 en cada uno de los grupos dando como resultado una media muestral de 48 y 36
minutos respectivamente. Con un 97% de confianza, ¿se puede afirmar que las
mujeres confeccionan camisas en menos tiempo que los varones?

30. Un agente de aseguradoras de fondo de pensiones afirma que el monto promedio


de las aportaciones (en dólares) realizadas en la AFP Neptuno es menor a la AFP
Venus. Para comprobar la afirmación, se seleccionó por cada aseguradora un
tamaño de muestra y se obtuvo los siguientes resultados:

Medidas de resumen AFP Neptuno AFP Venus


Muestra 1 200 1 500
Monto promedio de las
850 1 020
aportaciones

Además, se sabe que el monto de las aportaciones sigue una distribución normal.
Con un 95% de confianza, ¿a qué conclusión llegará el agente de aseguradoras de
fondo de pensiones?

Intervalo de confianza para la DIFERENCIA DE PROPORCIONES POBLACIONALES


(𝝅𝟏 − 𝝅𝟐 )

31. Se realizó un estudio, con la finalidad de explorar la aceptación de la gaseosa light,


según el nivel socioeconómico (NSE A y NSE B) y el grupo de edad del público
consumidor (jóvenes y adultos). Para realizar el estudio se consideró muestras
aleatorias de personas mayores de 18 años del nivel socioeconómico A y otra del
nivel socioeconómico B y se consultó acerca de su preferencia por la gaseosa light
o tradicional, y los resultados obtenidos se muestran en la siguiente tabla:

Nivel Gaseosa Tradicional Gaseosa Light


Socioeconómico Jóvenes Adultos Jóvenes Adultos

11
NSE A 170 210 260 176
NSE B 203 250 188 120

a. Con una confianza del 90%, estime la diferencia de proporciones de las personas
que prefieren la gaseosa de sabor tradiciones en ambos niveles socioeconómicos.
Interprete el resultado.
b. Con una confianza del 98%, estime la diferencia de proporciones de los jóvenes
que prefieren la gaseosa light entre los niveles socioeconómicos A y B. Interprete
el resultado.

32. El jefe del área de marketing de una cadena televisiva realizó un estudio para
averiguar si existe alguna diferencia entre el contenido humorístico de los programas
peruanos y norteamericanos. En una muestra aleatoria independiente de 115
programas televisivos peruanos, 32 fueron humorísticos. En otra muestra aleatoria
de 135 programas televisivos norteamericanos, 29 fueron humorísticas. Con un 95%
de confianza, se puede afirmar que la proporción de contenido humorístico de los
programas televisivos peruanos supera a los programas televisivos
norteamericanos.

33. El gerente de una empresa financiera afirma que la proporción de clientes morosos
con préstamos de a lo más 5000 soles de la sucursal A es mayor a la proporción de
clientes morosos con la misma categoría de la sucursal B. Para esto, selecciona una
muestra aleatoria de 200 clientes de la sucursal A, y 58 de ellos aún no pagan el
préstamo con dicho monto; y de 190 clientes de la sucursal B, y 50 de ellos no pagan
el préstamo con dicho monto.
a. Con un nivel de confianza del 96%, estime la diferencia de proporciones de
clientes morosos con préstamos de a lo más 5 000 soles de ambas sucursales.
b. Con lo obtenido en a., ¿se puede concluir que la afirmación del gerente es
correcta?

34. Un agente de aseguradoras de fondo de pensiones afirma que la proporción de los


clientes con montos de aportaciones mayor a 950 $. realizadas en la AFP Neptuno
es mayor a la AFP Venus. Para comprobar la afirmación, se seleccionó por cada
aseguradora un tamaño de muestra y se obtuvo la siguiente información:

Medidas de resumen AFP Neptuno AFP Venus


Muestra 1 200 1 500
N° clientes con montos de
250 215
aportaciones mayor a 950 $

Con un nivel de confianza dado, la información dada se ingresó al minitab


consiguiendo los siguientes resultados:

Prueba e IC para dos proporciones

12
Método
p₁: proporción donde Muestra 1 = Evento
p₂: proporción donde Muestra 2 = Evento
Diferencia: p₁ - p₂

Estadísticas descriptivas
Muestra N Evento Muestra p
Muestra 1 1200 250 0.208333
Muestra 2 1500 215 0.143333

Estimación de la diferencia
IC de ___% para la
Diferencia diferencia
_________ (0.035975; 0.094025)
IC basado en la aproximación a la normal

a. ¿A qué conclusión llegará el agente de aseguradoras de fondo de pensiones?


b. Calcule el nivel de confianza que se usó para la estimación por intervalos.

SEMANA 2

Prueba de hipótesis para la MEDIA POBLACIONAL (𝝁)

35. En cada uno de los siguientes casos se le pide plantear las hipótesis nula y
alternativa correspondientes:
a. El jefe de control de calidad de cierto producto desea determinar si el proceso de
envasado está bajo control, es decir: si el peso promedio envasado es de 450
gramos.
b. Las ventas semanales, en promedio, de cierto producto son de 4500 soles, se
realiza una campaña por TV y por radio. El jefe de ventas desea probar si la
campaña realizada fue efectiva.
c. Una máquina, actualmente utilizada por una empresa en la fabricación de un
determinado artículo, produce un 3% de artículos defectuosos. Al jefe de
producción se le ofrece un nuevo modelo de máquina argumentado que esta
produce menos porcentaje de artículos defectuosos. El jefe de producción desea
probar si tal afirmación es válida.

36. Sean los siguientes enunciados:

a. Suponga que se plantean las siguientes hipótesis:

13
H0: El proceso de producción está bajo control.
H1: El proceso de producción no está bajo control y se debe detener para
reajustar.
Defina en términos de estas hipótesis el error tipo I y el error tipo II.

b. En la situación que se da a continuación, diga usted cual debe ser la hipótesis


nula (H0) de manera que el error tipo I sea el más grave: “El trabajo del operador
de un radar es detectar aeronaves enemigas, en un determinado momento el
tablero indica que algo invadió el espacio aéreo” el operador tiene las dos
siguientes hipótesis:
1. Está comenzando un ataque
2. No hay ataque solo es una interferencia.

37. El gerente de control de calidad desea determinar si la máquina con la que embolsan
un cereal está bajo control, es decir si se está embolsando con un promedio de 500
gramos. Para determinar esto, el gerente selecciona una muestra aleatoria de 36
bolsas y encuentra un promedio de 496,5 gramos.

a. Plantee las hipótesis adecuadas. Indique, si es necesario, los supuestos bajo los
cuales se puede resolver este problema.
b. A que conclusión llegará el jefe de control de calidad, si sabe que el proceso
tiene una varianza de 81 gramos2 y utiliza una 5% de significancia.
c. Describa en que consiste los errores tipo I y error tipo II.
d. Calcule la probabilidad de aceptar la hipótesis nula cuando la verdadera media
es de 498 gramos y 502 gramos.

38. En una oficina de defensa del consumidor se han recibido quejas de los
consumidores con respecto a que una determinada marca de aceite vende botellas
que indican 850 c.c. pero que en realidad es menor a esa cantidad. Un funcionario
de esta oficina con la finalidad de determinar si los clientes tienen fundamento en
sus quejas decide tomar una muestra aleatoria de 49 botellas de aceite y encontró
que el promedio de esta muestra fue 848.3 c.c. y una desviación estándar de 10 c.c.
Usando un nivel de significancia del 5%, ¿a qué conclusión llegará el funcionario de
la oficina de defensa del consumidor?

39. El contenido de las cajas de avena instantánea por un proceso automático debe ser
igual a 160 gramos en promedio; si no es así, debe detenerse la producción para
regular la máquina. El contenido, en gramos, de las cajas de avena seleccionadas
aleatoriamente de la producción da los siguientes resultados:
28 28
∑ 𝑋𝑖 = 4470.3 𝑦 ∑ 𝑋𝑖 2 = 713713.89
𝑖=1 𝑖=1
a. Con un nivel de significancia del 1%, ¿es razonable detener la producción?
b. ¿Con qué probabilidad se debe rechazar la hipótesis nula si el verdadero valor
de la media es de 158 gramos?

14
40. Un especialista de educación universitaria afirma que la nota promedio de aprobar
el curso de Estadística General es mayor a 15.3 puntos. Seleccionó una muestra
aleatoria de estudiantes que llevaron el curso de Estadística General, con los datos
recolectados los ingresó al minitab y obtuvo los siguientes resultados:

T de una muestra
Estadísticas descriptivas
Error estándar Límite inferior
N Media Desv.Est. de la media de 95% para μ
25 17.209 0.936 0.187 16.889
μ: media de Muestra

Prueba
Hipótesis nula H₀: μ = 15.3
Hipótesis alterna H₁: μ > 15.3
Valor T Valor p
10.20 0.000

Con un nivel de significancia de 5% se pide:


a. Plantee las hipótesis del estudio de forma literal.
b. Mencione el valor del estadístico de prueba.
c. Realice la decisión, busque el valor crítico a usar en el problema.
d. Realice la conclusión.

Prueba de hipótesis para la PROPORCIÓN POBLACIONAL (𝝅)

41. El jefe del área de marketing de una compañía que fabrica laptops ABC afirma que
el 20% de los jóvenes universitarios utiliza esta marca de laptop. Después de una
intensa campaña publicitaria, se tomó una muestra de 300 jóvenes universitarios, la
que indicó que el 86% de ellos usan esta marca. Al 5% de significación, ¿el jefe del
área de marketing, en base a los resultados de esta muestra, que la campaña fue
exitosa?

42. Una oficina relacionada con la cobranza de impuestos comprobó que el 5% de las
declaraciones juradas de impuestos eran inexactas. Después de un programa de
educación aplicado a los contribuyentes se comprobó que, de 1124 declaraciones
juradas, 45 eran inexactas. Con un nivel de significación de 2.5%, ¿existe suficiente
evidencia para concluir que el programa de educación ha rendido buenos resultados?
43. Una compañía telefónica está tratando de determinar si algunas líneas en una
determinada comunidad deben instalarse subterráneamente. Debido a que se hará
un pequeño cargo adicional en las cuentas telefónicas para pagar los costos extras

15
de la instalación, la compañía ha determinado hacer un estudio entre los clientes y
proceder con la instalación subterránea solo si el estudio indica que más del 60% de
todos los clientes están a favor de la instalación.
a. Defina el parámetro y el error tipo I y error tipo II en términos del problema.
b. Si 118 de 160 clientes entrevistados están a favor de esta instalación a pesar del
cargo adicional, ¿qué debe hacer la compañía? Use un  = 0,01.
c. ¿Con qué probabilidad se debe rechazar la hipótesis nula si el verdadero valor de
la proporción es igual a 0,65?

44. “Fresquito”, es una nueva marca de gaseosas que entró al mercado y logró un nivel
de aceptación del 12%, es decir el 12% de consumidores de gaseosas prefieren esta
marca. Con la finalidad de tener una mayor participación del mercado, la Gerencia
de Producción de “Fresquito” decide realizar una agresiva campaña de publicidad
por televisión, radio y medios escritos.
a. Luego de la campaña de publicidad la gerencia desea, como es lógico, evaluar
los resultados de esta campaña de publicidad, para lo cual se toma una muestra
de 450 personas y se fija un nivel de significancia del 5%. Determine las hipótesis
de interés para la gerencia y establezca la regla de decisión correspondiente,
definiendo con claridad el parámetro que se está sometiendo a prueba.
b. Si luego de la campaña de publicidad, el porcentaje real de consumidores que
prefieren la marca “Fresquito” es del 14%, (pero lógicamente esto no lo sabe el
Gerente de producción). Determine, bajo estas condiciones, la probabilidad de
que el Gerente de Producción, concluya que la campaña no fue efectiva, cuando
utiliza la regla de decisión hallada anteriormente.

45. Un inversionista desea analizar el comportamiento sobre la rentabilidad de dos tipos


de acciones asociadas a los fondos mutuos. Para ello, decide consultar a dos
agencias para averiguar cuál de las acciones es más rentable: agraria o minera. Se
seleccionan muestras aleatorias independientes por cada tipo de acción y los
resultados se muestran en cuadro adjunto:

Agencia A Agencia B
Acciones Si son No son Si son No son
rentables rentables rentables rentables
Agrarias 15 25 20 20
Mineras 20 40 25 35

a. Con un nivel de significación de 5%, ¿se puede afirmar que el porcentaje de


acciones agrarias rentables según la agencia A es mayor a 34.5%.
b. Con un nivel de significación de 1%, ¿se puede afirmar que el porcentaje de
acciones mineras no rentables es menor a 58.5%?

46. Al señor Juan Pérez le han propuesto participar en una lista para el congreso, en
representación de su provincia. Para aceptar la propuesta este señor quiere estar
seguro de que al menos el 75% de los votantes residentes de la provincia están a

16
favor de su candidatura. Para determinar esto, se selecciona una muestra aleatoria
de 450 residentes, encontrando que 350 están a favor de su candidatura. Con la
información registrada se analizó en minitab, obteniéndose los siguientes
resultados:

Prueba e IC para una proporción

Método
p: proporción de eventos
Para este análisis se utiliza el método de aproximación a la normal.

Estadísticas descriptivas
Límite inferior
N Evento Muestra p de 98.5% para p
450 350 0.777778 0.735248

Prueba
Hipótesis nula H₀: p = 0.75
Hipótesis alterna H₁: p > 0.75
Valor Z Valor p
1.36 0.087

Con un nivel de significación igual de 1.5%, ¿existe evidencia estadística para


afirmar que el Juan Pérez aceptará participar en la lista?
a. Plantee las hipótesis del estudio de forma literal.
b. Mencione el valor del estadístico de prueba.
c. Realice la decisión, busque el valor crítico a usar en el problema.
d. Realice la conclusión.

Prueba de Normalidad y Error tipo II

47. La cantidad promedio que se coloca en un recipiente en un proceso de llenado se


supone que es 20 onzas. En forma periódica se escogen al azar 25 recipientes y el
contenido de cada uno de ellos se pesa. Se juzga el proceso fuera de control cuando
𝑥̅ < 19.8 𝑜 𝑥̅ > 20.2 onzas. Se supone que la cantidad que se coloca en cada
recipiente es una variable aleatoria que sigue una distribución normal y una
desviación estándar de 0.5 onzas.
a. Formule H0 y H1 e indique en qué consisten los errores de tipo I y II.
b. Calcule la probabilidad de cometer error tipo I.
c. Para  = 0,05; calcule  cuando  = 20,1.

48. El gerente de producción de la compañía de cerveza Inca revisa su línea de

17
producción. El llenado automático debe dar un contenido medio de 320 cm 3. Para
el control del llenado promedio se tomó una muestra aleatoria de 36 unidades del
producto y se encontró un contenido medio de 317 cm3 con una desviación estándar
de 12cm3.
a. ¿Hay suficiente razón para creer que existe una baja en el promedio de los
contenidos? Realice la prueba al nivel de significación del 5%.
b. Calcule la probabilidad de cometer el error tipo II cuando la verdadera media es
de 312cm3.
c. Calcule la potencia de la prueba.

49. Se sabe que en una compañía de taxis el gasto diario promedio en combustible por
unidad es igual a 187,6 galones y la desviación estándar es igual a 1.2 galones. El
gerente de operaciones decide incluir un aditivo especial al combustible que le
permitirá un ahorro en ese rubro. Después de incluir el aditivo toma una muestra de
10 unidades y encontró los siguientes gastos en combustible expresado en galones
por día:

185.3 186.4 186.9 187.0 186.4 187.6 187.9 188.1 186.8 186.7

Además;

a. Con un nivel de significancia de 5%, ¿se puede afirmar que los datos de la
variable siguen una distribución normal?
b. Al 5% de significancia, ¿existe evidencia estadística para afirmar que después

18
de incluir el aditivo, el gasto diario promedio en combustible por unidad se
reducirá?

Prueba de hipótesis para la varianza y cociente de varianzas

50. El gerente de ventas de una empresa industrial tiene que decidir si compra o no una
nueva máquina para reemplazar la que tienen en uso actualmente en el
departamento de producción. Se sabe que la máquina que está en uso tiene una
varianza, con respecto al tiempo que demora en producir una pieza, de 0,067
minutos2. Al tomar una muestra aleatoria de 20 piezas producidas por la máquina
que se desea comprar se encontró una desviación estándar de 0,15 minutos. Si se
utiliza un 5% de significancia y la decisión estará basada en la menor variabilidad,
¿cuál será la decisión del gerente de ventas?

51. Con cierto proceso de producción, el cual se utiliza en la actualidad, se sabe que el
costo promedio por unidad producida es de 66.4 soles y la desviación estándar de
5.6 soles. Se realizan ciertas medidas de reajuste en el proceso de producción con
la finalidad de verificar si el costo de producción ha disminuido y el costo sea más
homogéneo. Se tomó una muestra aleatoria de 12 unidades registrando los
siguientes costos por unidad:

60.1 60.0 61.5 60.2 63.1 66.7 66.0


63.1 66.0 63.5 63.1 63.4 65.8 66.5
Además,

a. Con un 5% de significancia, verifique el supuesto de normalidad de los datos.


b. Con un 5% de significancia, ¿se puede concluir que se lograron los dos objetivos
establecidos para mejorar el proceso?

19
52. El jefe de ventas de una empresa decidirá que su equipo de vendedores debe ser
recompuesto si la varianza de las ventas en la última semana es mayor a 10,15
dólares2. Si para esta semana recolecta datos de una muestra aleatoria de 25
ventas del equipo y encuentra una varianza de 18,03 dólares2. Con la información
obtenida, se analizó en minitab obteniéndose los siguientes resultados:

Prueba y CI para una varianza


Método
σ²: varianza de Muestra
El método de chi-cuadrada solo es válido para la distribución normal.

Estadísticas descriptivas
Límite inferior de 95%
para σ² usando
N Desv.Est. Varianza Chi-cuadrada
25 3.71 13.8 9.10
Prueba
Hipótesis nula H₀: σ² = 10.5
Hipótesis alterna H₁: σ² > 10.5

Estadística
Método de prueba GL Valor p
Chi-cuadrada 31.54 24 0.139

a. Con un nivel de significancia de 5%, ¿indican los resultados que se debe


recomponer el equipo de ventas?
b. ¿Qué valor máximo debe tener la varianza muestral para no rechazar la hipótesis
nula?
c. Si se fija  = 0,05, determine la probabilidad del error de tipo II cuando la
desviación estándar real es de 3,8 dólares.

53. En un estudio acerca de las economías latinoamericanas, se plantea como hipótesis


principal lo siguiente: "Los países Latinoamericanos se han caracterizado por
presentar economías sumamente inestables productos de las diversas políticas
económicas aplicadas por los distintos gobiernos, este hecho se aprecia por las
fuertes fluctuaciones presentadas en el crecimiento de nivel de PBI de dichos países,
lo cual contrasta con las economías europeas caracterizada por una estabilidad en
el nivel de su PBI". Por estudios anteriores se conoce que la desviación estándar del
crecimiento del PBI generado por los países europeos es de 2,5235 (en millones de
dólares) y que está normalmente distribuido. Si en una muestra aleatoria de 10
países latinoamericanos se ha obtenido una varianza muestral de 10,758, ¿se puede

20
afirmar que la hipótesis planteada es correcta?

54. Se desea evaluar el desempeño del departamento de cobranzas de una sucursal


ubicada en Ica, de una determinada empresa crediticia. Según datos históricos
recopilados por la gerencia que lleva a cabo la investigación, el promedio mensual
de las captaciones por cobros asciende a 15000 millones de soles, con una
desviación estándar de 1540 millones de soles. Para efecto de la evaluación de la
sucursal en Ica se elige las captaciones logradas en año y medio de cobranzas,
obteniendo un promedio de 12000 y desviación estándar de 2500 millones de soles.
Se le pide a Ud., utilizando las herramientas estadísticas adecuadas que informe a
la gerencia sobre el desempeño de la sucursal en Ica, considerando el nivel promedio
de captaciones y sobre la estabilidad de estos, asimismo, señale los supuestos que
fueron necesarios para llevar a cabo la evaluación.

55. El ingreso promedio mensual, en soles, del personal de las compañías A y B se


distribuyen normalmente con medias iguales. Para determinar cuál de las dos
compañías tienen ingresos más homogéneos, se seleccionó muestras aleatorias de
10 y nueve empleados respectivamente de ambas compañías, la cual dio como
resultado las varianzas de 100 y 225 soles2 respectivamente. ¿Hay razón suficiente
para decir que las varianzas son iguales en ambas compañías? Use α = 0,10.

56. El jefe de logística de la compañía P&C quiere decidir la adquisición entre dos
marcas A y B de máquinas para su planta de producción. Se le permitió probar ambas
máquinas durante un período de prueba para luego escoger 10 tiempos
aleatoriamente para cada una de ellas, resultando los tiempos siguientes:

Máquina A 40 79 47 42 48 38 44 49 50 37
Máquina B 40 41 39 40 38 42 43 37 38 41

Si se sabe que el tiempo de producción en cada una de las máquinas sigue una
distribución normal, ¿se podría concluir que las variabilidades de los tiempos de
producción de A y B son iguales? Considere el nivel de significación del 5%.

57. Al Señor Juan Pérez le han ofrecido invertir en dos carteras de acciones A y B, las
que prometen ser rentables, pero este señor solo tiene capital para invertir en una
de las carteras y debe decidir en cuál de ellas invertirá. Al investigar en busca de
información encontró que la mayoría de empresarios considera que invertir en la
cartera A implica un menor riesgo, como el Sr. Juan Pérez quiere tener mayor
evidencia que le permita decidir, selecciona una muestra de ocho empresarios que
invirtieron en la cartera A y encontró un promedio de rentabilidad de $1 560 y una
desviación estándar de $180 y en otra muestra independiente de 10 empresarios
que invirtieron en la cartera B encontró una rentabilidad promedio de $1 515 y una
desviación estándar de $263, en ambos casos la rentabilidad tiene una distribución
normal. En base a esta información, con un nivel de significancia del 5% y

21
considerando que una de las características notables del Sr. Juan Pérez es su actitud
adversa al riesgo, plantee y resuelva adecuadamente y luego indique cual será la
decisión del Sr. Juan Pérez.

SEMANA 3

Prueba de hipótesis para la Diferencia de Medias Poblacionales con muestras


independientes (µ1 - µ2)

58. Se piensa que en el espesor de una película de plástico (en mili pulgadas) que se
coloca en un material de sustrato influye la temperatura a la que se aplica el
recubrimiento. Se lleva a cabo un experimento totalmente aleatorizado. Once
sustratos se recubren a 125 °F, dando como resultado un espesor medio muestral
del recubrimiento de 103.5°F y una desviación estándar de 10.2°F. Otros 13
sustratos se recubren a 150°F para los que se observa una media de 99.7°F y una
desviación estándar de 20.1°F. Se creía al principio que con el incremento de la
temperatura del proceso se reducirá el espesor medio del recubrimiento.

a. Defina claramente el o los parámetros que están involucrados en esta prueba.


b. Realice la prueba de hipótesis correspondiente ¿Qué se puede concluir con
respecto al espesor promedio luego de realizada la prueba? Use un  = 0,05.

Se considerará válida la solución si se indican claramente las hipótesis y el criterio


de decisión utilizado. Como información adicional para el desarrollo de este problema
se tiene la siguiente corrida del programa MINITAB:

Prueba para la igualdad de varianzas

Prueba F (normal distribución)


Estadístico de prueba = 0,26, p-valor = 0,039

59. El gerente de marketing de una compañía desea determinar si un nuevo envase


podría aumentar las ventas de su producto. Para probar la factibilidad de la nueva
forma de envase se seleccionó una muestra de 18 tiendas similares y se asignaron,
en forma aleatoria, 10 de ellas como mercado de prueba de la nueva forma de
envase, en tanto que las otras ocho continuarían recibiendo el envase antiguo. Las
ventas semanales durante el tiempo de estudio fueron las siguientes:

Medidas de resumen Envase nuevo Envase antiguo


Tamaño de muestra 10 tiendas 8 tiendas
Venta promedio 130 cajas 118 cajas
Desviación estándar de las ventas 10 cajas 12 cajas

Si se sabe que el nivel de ventas con el envase nuevo y con el envase antiguo se
comporta según una distribución normal y que las muestras tomadas son

22
independientes. Con un nivel de significancia del 5%, ¿se tiene evidencia de que la
nueva forma de envase dio como resultado un mayor nivel de ventas?

60. Con la finalidad de comparar los costos promedios de producción de dos artículos
A y B, cuyas distribuciones son normales, se tomaron dos muestras aleatorias
independientes y se procesaron en el programa MINITAB, los resultados obtenidos
se muestran a continuación:

Con un 5% de significancia, ¿se puede concluir que los costos promedios de


producción de ambos artículos son iguales? Se asume que los costos de producción
siguen una distribución normal y las varianzas son homogéneas.

61. Se supone que la duración en horas de pilas eléctricas para calculadoras de


escritorio tiene una distribución normal. Un fabricante desea comparar la durabilidad
de las pilas producidas por los proveedores A y B. Para ello prueba una muestra
aleatoria de 14 pilas de cada marca hasta el agotamiento. Los datos obtenidos fueron
procesados con el programa MINITAB, y algunos de los resultados se muestran en
el recuadro adjunto, en base a esta información y utilizando las pruebas
correspondientes responda las siguientes preguntas:

23
a. El gerente de la fábrica B afirma que las pilas que producen tienen un promedio
de duración mayor al de las pilas producidas por la fábrica A. En base a la
información muestral presentada, ¿se puede confirmar la afirmación del
gerente? Utilice α = 5%.
b. El gerente de producción de la fábrica B indica que la desviación estándar de la
duración de las pilas que fabrican supera las 35 horas y por lo tanto se debe
detener el proceso para realizar los reajustes necesarios. Si se utiliza un 5% de
significancia, ¿se puede concluir que el gerente de producción tiene razón, y que
por lo tanto se debe de detener el proceso?
c. Con respecto a las hipótesis planteadas en el inciso b., ¿cuál es la probabilidad
de que se decida no detener el proceso, cuando en realidad la desviación
estándar es de 38.5 horas?

62. La tabla siguiente resume algunos datos de un experimento realizado para estudiar
varias características de tornillos de anclaje, puesto que la empresa “Ferrito” desea
realizar la compra de un lote de estos tornillos:

24
Diámetro de Tamaño de Resistencia Desviación
tornillo la muestra promedio (kilo/ libra) Estándar
3/8 15 4.25 1.30
1/2 14 7.14 1.68

a. Un aspecto importante es la homogeneidad en cuanto a la resistencia de estas


dos marcas de tornillos, se puede concluir, en base a la información mostrada:
¿Las resistencias de los tornillos de ambos diámetros son homogéneas? Use un
nivel de significancia  = 0.05
b. Realice una prueba, con un  = 0.05 para decidir si el verdadero promedio de
resistencia para tornillos de media pulgada excede a la resistencia promedio de
los tornillos de 3/8 pulgadas.

63. En la siguiente tabla se muestran los datos obtenidos al tomar una muestra de 23
establecimientos y medir el nivel de ventas de dos productos A y B (en miles de soles
por semana) de acuerdo con el tipo de establecimiento en el que se expenden
(Botica o Bodega):

Tipo de
Producto A Producto B
establecimiento
2.5; 3.0; 4.3; 5.1; 4.5;
Bodega 3.5; 4.3; 5.3; 7.1; 6.5
3.8; 4,2
5.4; 6.5; 8.1; 6.9;
Farmacia 4.6; 5.3; 6.7; 8.1; 7.9
7.3; 8.6

a. ¿Se puede decir que el nivel de ventas promedio del producto B es mayor al nivel
de ventas del producto A? Utilice un nivel de significancia del 5%.
b. Considerando ambos productos, y con un 5% de significancia, ¿se puede afirmar
que el nivel de ventas promedio en bodegas es igual al nivel de ventas promedio
en farmacia?
c. El gerente de producción afirma que el nivel de ventas promedio del producto B
es de 7,5 miles de soles semanales por lo que recomienda tomar las medidas
del caso con la finalidad de incrementar el consumo de dicho producto. Con un
5% de significancia, ¿se puede aceptar la recomendación del gerente de
producción?
d. Si la desviación estándar en el nivel de ventas del producto B es de 4 mil soles
o más se tendrá que tomar las medidas necesarias para homogenizar estos
niveles de venta. Tomando en cuenta los resultados observados en la muestra y
utilizando un 2,5% de significancia. ¿Considera que es necesario tomar dichas
medidas?

25
64. La siguiente información representa los datos obtenidos en una muestra aleatoria de
tiempos utilizados en la fabricación de un determinado artículo. La empresa que los
fabrica tiene dos líneas de producción, en dos turnos diferentes (el tiempo está en
minutos). Las muestras del cada uno de los turnos y de cada una de las líneas de
producción fueron extraídas aleatoriamente y en forma independiente.

Turno Línea A Línea B


Mañana 2.5; 3.0; 4.3; 5.1; 4.5 3.5; 4.0; 5.3; 7.1; 6.5
Tarde 4.6; 5.3; 6.7; 8.0 5.0; 6.5; 8.1; 6.9

Plantee las hipótesis correspondientes, responda las siguientes interrogantes:


a. ¿Se puede decir que el promedio de tiempo en el turno de la mañana es diferente
al tiempo promedio en el turno de la tarde? Use un nivel de significancia del 10%.
b. El gerente de producción afirma que el tiempo promedio de producción en la
Línea A es de 7.5 minutos y por lo tanto se deben realizar reajustes pues es
necesario reducir ese tiempo. Con un 5% de significancia, ¿el gerente tiene la
razón?
c. Si la desviación estándar en el tiempo de producción del proceso B durante el
turno de la mañana es cuatro minutos o más se tendrá que detener el proceso
y reajustar la línea. Con un nivel de significancia de 1%, ¿será necesario el
reajuste?

65. En un estudio realizado con la finalidad de explorar la aceptación de una nueva


gaseosa light, según el nivel socioeconómico (NSE) y el grupo de edad del público
consumidor. Se seleccionó una muestra aleatoria de personas mayores de 18 años
y se consultó acerca del gasto mensual aproximado en el consumo de gaseosa, en
soles, de gaseosa tradicional y light. Los resultados obtenidos se muestran en la
siguiente tabla:

Cerveza Tradicional
NSE
Jóvenes Adultos
NSE A 50, 64, 56, 52, 65 60, 48, 44, 50
NSE B 40, 48, 43, 40 40, 44, 28

Cerveza Light
NSE
Jóvenes Adultos
NSE A 80, 58, 60 76, 56, 48, 30
NSE B 45, 42, 35 40, 52, 65

En base a esta información responda lo siguiente:


a. Se impulsará una agresiva campaña de publicidad orientada a inducir el
consumo de gaseosa, y esta campaña estará orientada al nivel socioeconómico
(NSE) que muestre un promedio de consumo menor. Utilizando un 5% de
significancia ¿A qué nivel socioeconómico se debería orientar dicha campaña

26
publicitaria?
b. El gerente de ventas afirma que la nueva gaseosa light ha logrado un buen nivel
de aceptación en el mercado, tanto así que el gasto promedio en este tipo de
gaseosa es igual al gasto promedio en el consumo de la gaseosa tradicional.
Utilizando un nivel de significancia del 5% ¿Qué puede decir con respecto a la
afirmación hecha por el gerente de ventas?
c. En general se puede afirmar que ambos grupos de edad tienen el mismo gasto
promedio en el consumo de gaseosa utilice un 5% de significancia.
d. Lo afirmado en el inciso c) también se cumple cuando se especifica el tipo de
gaseosa, es decir se cumple tanto en el consumo de la gaseosa tradicional como
en el consumo de la gaseosa light. Utilice un 5% de significancia.

SEMANA 6

Sesión 1: Prueba de hipótesis para la diferencia de medias poblacionales


con dos muestras relacionadas (µ1 - µ2)

66. Los siguientes datos representan las calificaciones obtenidas en los exámenes de
medio semestre y de finales de semestre tomados de una muestra aleatoria de los
exámenes de 11 estudiantes del curso de Estadística II. Ambos exámenes tuvieron
una duración de dos horas y el examen final cubría el material visto después de la
aplicación del examen de medio semestre. Se sabe que las notas tienen una
distribución normal.

N° 1 2 3 4 5 6 7 8 9 10 11
EP 80 82 47 75 80 69 83 73 55 70 81
EF 81 85 40 75 83 79 91 72 66 76 79

¿Existe evidencia de un aumento en el desempeño de los estudiantes en la segunda


mitad del semestre? Utilice un  = 0,05.

67. Un analista de sistemas está estudiando la posibilidad de usar un nuevo sistema de


cómputo, y decide que cambiará de sistema si tiene evidencia de que el nuevo
sistema utiliza menos tiempo en el procesamiento, para esto toma una muestra de
siete trabajos y se los encarga a siete trabajadores elegidos al azar, estos
trabajadores realizan dicho trabajo utilizando el nuevo sistema y utilizando al sistema
antiguo, los tiempos utilizados (en minutos) en cada caso fueron los siguientes:

Trabajo 1 2 3 4 5 6 7
Sistema antiguo 8 4 10 9 8 7 12
Sistema nuevo 6 3 7 8 5 8 9

Además, se supone que los tiempos tienen distribución normal y con un nivel de
significancia del 5%. ¿Qué decidirá el analista de sistemas?

27
68. En una empresa de software se está investigando la eficiencia de dos lenguajes
diferentes para mejorar la rapidez de programación, actualmente utiliza el lenguaje
de programación 1. A doce programadores, familiarizados con ambos lenguajes, se les pide
que programen un cierto algoritmo en ambos lenguajes, y se anota el tiempo que tardan,
produciendo los siguientes datos en minutos:

Programador 1 2 3 4 5 6 7 8 9 10 11 12
Lenguaje 1 17 16 21 14 18 24 16 14 21 23 13 18
Lenguaje 2 18 14 19 11 23 21 10 13 19 24 15 20

Con base en estos datos, y suponiendo que el tiempo de programación en


ambos casos tienen una distribución normal, responda lo siguiente:
a. Defina en forma clara los parámetros involucrados en esta prueba.
b. Con un nivel de significancia del 2,5%, ¿cuál será la conclusión en la empresa?
c. Defina en los términos de este problema el Error Tipo I y el Error tipo II.

69. Se desea determinar si un curso de capacitación a los operarios de cierto tipo de


maquinaria ha permitido que estos logren aumentar el número de unidades
producidas por hora. Para comprobar esto se seleccionaron 12 trabajadores y se
determinó el número de unidades producidas antes del curso y luego del curso de
capacitación, los resultados se muestran en la siguiente tabla.

Vendedor 1 2 3 4 5 6 7 8 9 10 11 12
Antes 18 23 27 20 10 5 30 25 34 40 15 14
Después 24 28 26 30 18 15 29 25 35 38 21 25

Si se considera que el número de unidades producidas se comporta según una


distribución normal y en base a estos datos, ¿se puede afirmar que el curso de
capacitación fue efectivo, utilizar un nivel de significancia del 5%?

Prueba de hipótesis para la Diferencia de Proporciones Poblacionales (𝝅1 - 𝝅2)

70. Una fábrica produce dos tipos de productos en dos turnos diferentes y se desea
observar el número de productos defectuosos en ambos turnos. Para esto se toman
dos muestras independientes, una de cada turno de trabajo, y se determinó la
cantidad de artículos defectuosos y el tipo de producto producido, los resultados se
muestran en la siguiente tabla:

Producto A Producto B
Turno
Defectuosos Buenos Defectuosos Buenos
Mañana 20 200 50 300
Tarde 5 150 25 200

a. Con un nivel de significancia de 5%, ¿se puede afirmar que en el turno de la

28
tarde se producen artículos con un menor porcentaje de unidades defectuosas
que en el turno de la mañana?
b. Con un nivel de significancia de 5%, ¿se puede afirmar que, en el turno de tarde,
la proporción de productos defectuosos del producto B es mayor que la
proporción de productos defectuosos del turno de la mañana en más de 0.04?

71. En la actualidad, la aseguradora de fondo de pensiones AFP “NEPTUNO” cuenta


con afiliados que hacen sus aportaciones con regularidad. En una muestra tomada
de los últimos aportes realizados por 850 afiliados durante el último trimestre, se
obtuvo el promedio de aportaciones trimestrales $480 y una desviación estándar
$225, además se encontró que 600 de los afiliados seleccionados hicieron
aportaciones superiores a los $1 250.

a. Se puede afirmar, con un 5% de significancia, que el promedio de aportaciones


de los afiliados de la AFP Neptuno es superior a los 465 dólares trimestrales.
b. En un mismo período y basado en una muestra de 1200 afiliados, la competencia
más cercana, AFP Venus indica que 778 afiliados hicieron aportaciones
superiores a los $1250 trimestrales. ¿Esta información evidencia que, en la AFP
Neptuno, el porcentaje de afiliados con aportaciones superiores a los $1 250
supera los de la AFP Venus en más de 2,5%? Utilice un nivel de significancia del
8%.

72. Se entrevistó a 900 personas y se les preguntó acerca de su preferencia con


respecto a tres tipos de programas de televisión, los entrevistados se clasificaron de
acuerdo con el distrito donde residían y de acuerdo con el grupo de edad. Los
resultados fueron los siguientes:

Tipo de Programa
Distrito Grupo de edad
Cómico Deportivo Musical
Adolescentes 40 50 20
Distrito A Jóvenes 45 30 60
Adultos 55 20 15
Adolescentes 35 60 15
Distrito B Jóvenes 30 40 40
Adultos 105 15 5
Adolescentes 25 40 15
Distrito C Jóvenes 25 30 20
Adultos 40 15 10

Se desea lanzar al aire un novedoso programa Cómico, y se realizará este


lanzamiento si:

a. Se tiene evidencia de que, en la población adulta, considerando los tres distritos

29
en conjunto, el porcentaje de personas que prefieren programas cómicos es
mayor al porcentaje de personas que prefieren un programa deportivo. Use un α
= 0,025 ¿Cuál será la decisión al respecto?
b. Se tiene evidencia de que, en la población adulta, considerando los tres distritos
en conjunto, el porcentaje de personas que prefieren programas cómicos es
mayor al porcentaje de personas que prefieren un programa musical. Use un α =
0,025 ¿Cuál será la decisión al respecto?

73. Cierta compañía comercializa sus productos mediante catálogos y ventas puerta por
puerta. Esta compañía ha decidido comprobar la eficacia de una campaña de TV,
para lo cual selecciona dos territorios semejantes. Uno recibió campaña por TV y en
la otra no. El porcentaje de visitas con éxito en el territorio con campaña fue de 18%,
mientras que en el otro territorio (sin campaña) fue 14%. Se hicieron 900 visitas en
cada territorio. Para justificar el costo de la campaña se requiere más de 3% de
aumento en la proporción de visitas con éxito. ¿Dan estos datos pruebas de que la
campaña por TV se justifica? Utilice un nivel de significancia del 5%.

74. El jefe de ventas de una gran cadena de tiendas debe decidir entre dos cursos
similares de capacitación para sus vendedores. Para esto decide comprobar la
eficacia de los cursos tomando una muestra de 350 vendedores para el curso A y
otra muestra de 400 vendedores para el curso B. Al final de cada curso, el 82% de
los vendedores mejoraron significativamente su desempeño con el curso A, mientras
que; con el curso B, el 74% de los vendedores mejoraron significativamente su
desempeño. Como el curso A es más costoso decidirá enviar a sus vendedores a
dicho curso siempre y cuando el porcentaje de vendedores que mejoran
significativamente su desempeño supere en más de 6% al porcentaje de vendedores
que mejoran significativamente su desempeño y que recibieron el curso B. Utilizando
un  = 0.05, ¿cuál será la decisión del jefe de ventas de esta cadena de tiendas?

75. Un funcionario de una universidad quiere comparar la preferencia sobre la modalidad


de estudios en alumnos de postgrado según el ciclo que están cursando. Para ello,
seleccionó dos muestras de alumnos que cursan el primer ciclo y el tercer ciclo A
cada uno de ellos se le preguntó sobre la modalidad que prefieren llevar el ciclo de
estudio. Los resultados se resumieron en la siguiente tabla:

Modalidad de estudio
Ciclo Total
Presencial Virtual
Primer 65 185 250
Tercer 55 125 180

a. Con un nivel de significancia de 5%, ¿existe evidencia estadística para concluir


que la proporción de alumnos del primer ciclo que prefieren la modalidad virtual
es mayor a los estudiantes del tercer ciclo que prefieren la modalidad virtual en
más de 1.5%?

30
b. Con un nivel de significancia de 5%, ¿se puede afirmar que la proporción de
alumnos del primer ciclo que prefieren la modalidad virtual es mayor a la
proporción de alumnos del tercer ciclo que prefieren la modalidad virtual?

SEMANA 4

ANÁLISIS DE VARIANZA para un factor y las comparaciones por pares de Tukey

76. Con la finalidad de comparar los precios del producto “Escaso A1” se llevó a cabo un
experimento en tres zonas de Lima: Cono Sur, Cono Norte y Lima Centro. En cada
una de dichas zonas se tomaron muestras aleatorias de seis tiendas más grandes
y se consultó acerca del precio de dicho producto, los resultados se muestran en la
siguiente tabla:

Precios del Producto escaso “A1”


ZONAS
Lima Centro Cono Norte Cono Sur
32 27 30
31 27 30
33 30 31
30 28 27
30 27 29
30 28 28

a) Al nivel de significación del 5%, ¿existe suficiente evidencia que indique una
diferencia en el precio promedio del producto escaso A1 en las tiendas de las
tres zonas de Lima?
b) Si fuera necesario, realice las comparaciones múltiples de Tukey.

Comparaciones en parejas de Tukey


Agrupar información utilizando el método de Tukey y una
confianza de 95%

Zona N Media Agrupación


Lima centro 6 31,000 A
Cono sur 6 29,167 A B
Cono norte 6 27,833 B

77. El jefe de producción de una fábrica desea determinar si las cuatro máquinas que
tiene utilizan el mismo tiempo promedio en la fabricación de un artículo. Para esto
selecciona muestras aleatorias de cada máquina de tamaños n1 = 6, n2 = 4, n3 = 4 y
n4 = 6 respectivamente, midiendo el tiempo que utilizan en la fabricación de un
artículo. Debido a un descuido de su ayudante la información obtenida se perdió
parcialmente, encontrándose sola la siguiente tabla incompleta:

31
Fuente de Grados de Suma de Cuadrados
F
variación libertad cuadrados medios
Factor 152,62
Error
Total 542,92

Con esta información, plantee las hipótesis adecuadas y diga cuál será la conclusión
del jefe de producción, interpretando adecuadamente sus resultados. Use  = 0,05.

78. Existen cuatro estaciones de radio. Cada estación toca música rock durante cierto
número de minutos por hora y se desea determinar si el promedio que cada estación
toca esta música, por hora, es el mismo. Para esto se tomó muestras de 10 horas de
cada estación y se encontró los siguientes tiempos promedios en los cuales se toca
música rock (en minutos).

𝑥̅1 = 51,43; 𝑥̅2 = 44,64; 𝑥̅3 = 47,2; 𝑥̅4 = 50,85

Además, se sabe que: SCT = 650,75 (suma de cuadrados del total). Aplique la
técnica estadística adecuada y haga un análisis al respecto.

79. Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan
con métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado,
el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el
gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Después de un
mes de entrenamiento se realiza un test de rendimiento consistente en un recorrido
cronometrado de nueve km. Los tiempos empleados fueron los siguientes:

Método 1 15 16 14 15 17
Método 2 14 13 15 16 14
Método 3 13 12 11 14 11

Comparaciones en parejas de Tukey

Agrupar información utilizando el método de Tukey y una


confianza de 99%

Método N Media Agrupación


Método 1 5 15,400 A
Método 2 5 14,400 A B
Método 3 5 12,200 B

A un nivel de significación del 1%, ¿se puede considerar que los tres métodos
producen resultados equivalentes? O por el contrario ¿existe algún método superior
a los demás?

32
80. Los siguientes resultados fueron analizados para los tiempos (en minutos) que tardan
en procesar una pieza de cada una de las cuatro máquinas. El fin del estudio es
determinar si hay diferencia en el tiempo promedio de procesamiento. Se
seleccionaron de forma aleatoria e independiente siete piezas de cada una de las
máquinas; además, el gerente de producción tiene evidencia suficiente para asumir
que los tiempos siguen una distribución normal. Determine si se puede considerar
que los tiempos de procesamiento de utiliza cada máquina no son iguales, utilizando
un nivel de significancia del 5% y además si esto es cierto ¿qué máquina recomendaría
utilizar?

ANOVA unidireccional: Máquina 1; Máquina 2; Máquina 3; Máquina4

Fuente GL SC MC F
Factor 3 12,107 4,036 10,59
Error 24 9,144 0,381
Total 27 21,251

Comparaciones en parejas de Tukey

Nivel N Media Agrupación


Máquina 1 7 4,1429 A
Máquina 2 7 2,4286 B
Máquina 3 7 3,5714 A C
Máquina 4 7 2,8571 B C

81. Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro
procedimientos diferentes (A, B, C Y D), asignados al azar a un grupo de sujetos.
Posteriormente se les realiza una prueba de recuerdo de dichas palabras,
obteniéndose los siguientes resultados:

A 5 7 6 3 9 7 4
B 9 11 8 7 7 4 4
C 8 6 9 5 7 4 5
D 1 3 4 5 1 2 3

Comparaciones en parejas de Tukey

Agrupar información utilizando el método de Tukey y una


confianza de 97.5%

Procedimiento N Media Agrupación


PROC B 7 7,143 A
PROC C 7 6,286 A
PROC A 7 5,857 A B
PROC D 7 2,714 B

33
a. ¿Qué conclusiones pueden sacarse acerca de las cuatro formas de
presentación, con un nivel de significación del 2,5%?
b. Realice un análisis más extenso con ayuda de la siguiente salida proporcionada
por el MINITAB.

Prueba de Independencia de dos variables cualitativas

82. Una socióloga estuvo investigando esta cuestión: ¿existe alguna relación entre el
nivel de Instrucción alcanzado y el nivel de actividad social de una persona? Decidió
manejar tres niveles de Instrucción: primaria, secundaria y universitaria o más. Cada
persona llevó un registro de sus actividades sociales, como jugar boliche en grupo,
asistir a bailes, eventos sociales, ceremonias religiosas, etc. La socióloga los dividió
en actividad social inferior al promedio, actividad social promedio y actividad social
superior al promedio. Los resultados de su muestra se dan en la siguiente tabla:

Actividad Social
Nivel de
Superior al Inferior al
Educación Promedio
promedio promedio
Universitaria 20 10 10
Secundaria 30 50 80
Primaria 10 60 130

a. ¿Cuál será la conclusión de esta socióloga, en base a esta muestra aleatoria y


un 5% de significación?
b. Calcule e interprete el grado de importancia de la relación encontrada.

83. Existe la controversia de que un estudiante universitario de las especialidades de


letras, ingeniería o ciencias básicas logra un mejor rendimiento académico en los
últimos ciclos. Un especialista en educación de una universidad realizó un estudio
para verificar la controversia y seleccionó una muestra aleatoria de estudiantes que
cursan los últimos ciclos (del séptimo ciclo a más). Los resultados se muestran en
cuadro adjunto:

Fila: Tipo de especialidad Columna: Rendimiento académico

Bueno Malo Regular Total


Ciencias básicas 9 100 320
5
Ingeniería 220 310 630
Letras 150 5 400
0
Total 495 245 610 1350

a. Al nivel de significancia del 2,5%, ¿se puede inferir que existe relación entre el
tipo de especialidad y el rendimiento académico en los últimos ciclos?

34
b. Con lo obtenido en la parte a., ¿se puede afirmar que la relación encontrada
entre ambas variables es fuerte?

84. Un editor de periódicos trata de determinar las características del mercado de su


periódico. Se pregunta si la costumbre de la gente de la comunidad de leer diarios
está relacionada con el nivel educativo de los lectores. Aplica una encuesta a los
adultos del área referente a su nivel educativo y la frecuencia con que leen el
periódico. Los resultados se muestran en la siguiente tabla:

Fila: Frecuencia con que leen el periódico


Columna: Nivel educativo de los lectores

Frec. Profesional Superior Terminó No terminó


leer o posgrado no Univ. Secundaria Secundaria Total
1 …… 17 11 21 59
2 12 23 ……………… 5 48
3 35 38 16 ……………… 96
4 28 ……………… 6 13 66
Total 85 97 41 46 269

a. Plantee y resuelva las hipótesis correspondientes, indicando claramente cuál


será la conclusión a la que llega el editor de periódicos. Use un nivel de
significación del 5%.
b. Calcule e interprete el grado de importancia de la relación encontrada.

85. Se entrevistó a 900 personas y se les preguntó acerca de su preferencia con


respecto a tres programas de televisión, los entrevistados se clasificaron de acuerdo
con el distrito donde residían, de acuerdo con el grupo de edad y el tipo de programa
de su preferencia. Los resultados se muestran en la siguiente tabla:

Grupo de Tipo de Programa


Distrito
edad Cómico Deportivo Musical
Adolescentes 40 50 20
Distrito A Jóvenes 45 30 60
Adultos 55 20 15
Adolescentes 35 60 15
Distrito B Jóvenes 30 40 40
Adultos 105 15 5
Adolescentes 25 40 15
Distrito C Jóvenes 25 30 20
Adultos 40 15 10

a. Usando un 5% de significancia se puede decir que el grupo de edad no influye en


el tipo de programa que prefiere la persona.
b. Calcule e interprete el grado de importancia de la relación encontrada.

35
86. El rector de una universidad quiere determinar si existe relación entre el área de
interés de cada estudiante y su preferencia por algún sistema de calificación
(Aprobado-reprobado, Sistema vigesimal: 0 – 20, Sistema porcentual: 0% - 100%).
Para ello, realiza una encuesta seleccionando a 500 estudiantes de las tres áreas de
interés. Se preguntó a cada estudiante cuál de los tres sistemas de calificación
prefieren. Los resultados aparecen en la siguiente tabla:

Filas: Área de interés Columnas: Sistema de calificación

Aprobado_ Sistema Sistema


desaprobado porcentual vigesimal Total
Artes y ciencias 24 58 118 200
Bellas artes 26 19 55 100
Ingeniería 20 68 112 200
Total 70 145 285 500

a. ¿Qué prueba de hipótesis realizaría? ¿Por qué?


b. Con un niel de significancia de 0,10, ¿existe relación entre el área de interés de
cada estudiante y su preferencia por algún sistema de calificación?
c. Calcule e interprete el grado de importancia de la relación encontrada.

Prueba de Bondad de ajuste: Distribución Poisson

87. Se afirma que el número de errores que comete una secretaria al transcribir un
documento es una variable aleatoria que tiene una distribución de Poisson con media
de tres errores por trascripción. Se revisó 440 transcripciones hechas por ella y se
obtuvo los siguientes resultados: Realice la prueba con un α = 0,01.

N° de errores 0 1 2 3 4 5 6 7 ≥8
Frecuencia 18 53 103 107 82 46 18 10 3

88. El responsable de servicio de mantenimiento de una empresa de transporte, quien


lleva el control desde los inicios de creación de la empresa, afirma que el número de
vehículos que necesitan reparación en un día sigue una distribución de Poisson. Se
hace estadísticas de 200 días sobre el número de vehículos que necesitan
reparación, los resultados fueron:

N° de días 54 70 50 21 4 1
N° de vehículos 0 1 2 3 4 5 o más

Realice la prueba necesaria para corroborar esta afirmación. Use un  = 0,1.

36
89. El jefe del área de Estadística e Informática de la municipalidad de Lima
Metropolitana cree que el número de accidentes automovilísticos diarios en el cruce
de la Av. Javier Prado y La Molina presenta una distribución de Poisson con un
promedio de un accidente diario. Para ello, seleccionó una muestra de 80 días y se
obtuvo los resultados en el siguiente gráfico de líneas:

Con un 1% de significancia, ¿se puede concluir que la afirmación del jefe del área
de Estadística es correcta?

Sesión 2: Prueba de Bondad de ajuste: Distribución Binomial

90. Un ingeniero de control de calidad del proceso de ensamblaje de llantas desea


verificar si el número de llantas con defectos sigue una distribución binomial con una
proporción de llantas defectuosas del 5%. Para esto tomó 200 muestras de 10
neumáticos cada una y encontró lo siguiente:

N° llantas defectuosas 0 1 ≥2 Total


Frecuencia 138 53 9 200

91. Un psicólogo clínico visita a ocho pacientes por día. El psicólogo cree que el número
de pacientes atendidos con depresión leve es una variable aleatoria con distribución
binomial y se sabe que el 30% de los pacientes presentan este problema. Para ello,
registra el número de pacientes atendidos con depresión leve por un periodo de 100
días. Los resultados se muestran en el siguiente gráfico de líneas:

37
Además, la atención de los pacientes se realiza de manera independiente.

a. Indique y clasifique la variable de estudio.


b. Con un 1% de significancia, ¿se puede concluir que la afirmación del psicólogo es
correcta?

92. La solicitud de préstamo que presentan los clientes de un banco está compuesta por
cuatro rubros. El gerente de préstamos desea realizar un estudio sobre la distribución
de la cantidad de rubros que son rechazados por cada solicitud, para esto toma una
muestra de 60 solicitudes, obteniéndose los siguientes resultados:

N° de rubros rechazados 0 1 2 3 4
N° de solicitudes 20 15 7 10 8

¿Se puede afirmar que el número de rubros rechazados sigue una distribución
binomial con probabilidad igual a 0,4? Use un  = 0,01.

SEMANA 5

Prueba de Bondad de ajuste: Otras distribuciones


93. El gerente de una planta industrial pretende determinar si el número de empleados
que asisten al consultorio médico de la planta se encuentra distribuido en forma
equitativa durante los 5 días de trabajo de la semana. Con base en una muestra
aleatoria de 4 semanas completas de trabajo, se observó el siguiente número de
consultas:

38
a. ¿Cuál es la prueba que debe utilizarse en este caso? Explique
b. Con α = 0.05, ¿existe alguna razón para creer que el número de empleados
que asisten al consultorio médico, no se encuentra distribuido de forma
equitativa durante los días de la semana?

94. El área de Matemática, basándose en informaciones de semestres anteriores sabe


que, el 43% de los alumnos aprobaron todas las materias inscritas, un 30% aprobó
la mitad, un 12% reprobó todas las materias y un 15% se retiró. Al final de este
semestre el coordinador selecciono a 400 alumnos y encontró que: 195 aprobaron
todas las asignaturas, 136 aprobaron la mitad, 41 reprobaron todas las asignaturas
y 28 se retiraron. ¿Podemos concluir, a raíz de los resultados, que en el último
semestre varió la estructura de los cursos aprobado y retirados con respecto a los
semestres anteriores? Use un α = 0.05.

95. Un egresado de la especialidad de Marketing es contratado por una empresa para


evaluar la distribución de ventas de gaseosa en la temporada de invierno. Según
sus estimaciones, considera los principales distritos a los cuales se distribuye la
gaseosa tienen los siguientes porcentajes de ventas:

Distrito A B C D E
Porcentaje 21 18 30 17 14

Usted, quiere verificar estadísticamente esta afirmación y decide que una forma de
verificar la anterior hipótesis propuesta es seleccionando una muestra de las ventas
realizadas en los últimos tres meses (en miles de unidades) y obtiene lo siguiente:

Distrito A B C D E
Ventas realizadas 54 61 83 46 56

¿Qué conclusión obtiene según sus conocimientos de estadística? Use  = 0,025.

96. El gerente de una planta industrial pretende determinar si el número de empleados


que asisten al consultorio médico de la planta se encuentra distribuido, en forma
equitativa, durante los cinco días de trabajo de la semana. Con base en una muestra
aleatoria de cuatro semanas completas de trabajo, se observó el siguiente número
de consultas:

39
Lunes Martes Miércoles Jueves Viernes
49 35 32 39 45

Con un nivel de significación del 5%, ¿existe alguna razón para creer que el número
de empleados que asisten al consultorio médico, no se encuentra distribuido en forma
equitativa durante los días de trabajo de la semana?

97. El gerente de un banco afirma que los motivos de préstamos personales para auto,
casa y viaje están en la relación 4:2:1. Para corroborar su afirmación selecciona
aleatoriamente a 140 clientes que se les otorga un crédito y los clasifica en la
siguiente tabla:

Motivo del préstamo Auto Casa Viaje


Nº de clientes 90 35 15

Estos datos corroboran la afirmación del gerente del banco. Use un  = 0,1.

98. Una compañía de seguros desea establecer el pago de la prima a cobrar por
asegurar un determinado modelo de auto. La información que tienen y que fue
obtenida en un estudio realizado al año pasado indica que el 30% de clientes
asegurados tienen un accidente, y que cuando este ocurre el accidente puede
considerarse leve el 60% de las veces, se puede considerar que el accidente es de
medianas proporciones el 30% de las veces y un accidente se considera grave el
10% de las veces. Para determinar si los resultados del estudio realizado el año
pasado aún permanecen vigentes se toma una muestra aleatoria de asegurados de
la compañía y se encontró los siguientes resultados:

Accidente de
Condición del No tiene Accidente Accidente
Asegurado Accidente Leve medianas Grave
proporciones
Número de veces 198 47 37 18

Determine si se puede tener en cuenta los resultados del estudio realizados el año
pasado para poder determinar el monto de la prima que debe cobrar. Justifique e intérprete
adecuadamente sus resultados. Utilice un nivel de significación el 2,5%.

99. Un distribuidor de revistas, que salen semanalmente, ha determinado que el número


de unidades excedentes por cada punto de venta a la semana (es decir el número
de diarios que no logra vender y por lo tanto debe de devolverlos) tiene un
comportamiento aleatorio que puede ser representado por la siguiente función de
probabilidad; donde, x: representa el número de unidades excedentes por cada
punto de venta.

40
Para una nueva temporada que se iniciará en breve, y con la finalidad de planificar
sus pedidos, este comerciante desea determinar si el comportamiento aleatorio de las
unidades excedentes continúa siendo la misma, para lo cual toma una muestra
aleatoria de 900 puntos de venta en la ciudad de Lima y encontró los siguientes
resultados:

Unidades Excedentes 1 2 3 4 5
Puntos de ventas 20 60 150 250 420

Con estos datos y usando un  = 0,05. ¿Se puede concluir que el comportamiento
aleatorio en cuanto a las unidades excedentes aún continúa siendo determinado por
dicha distribución de probabilidad?

100. Un comerciante vende minicomponentes, luego de una campaña de publicidad, el


comerciante cree que el número de minicomponentes que vende por día es una
variable aleatoria que se comporta según la siguiente función de probabilidad:

Para comprobar esto, toma una muestra aleatoria de 120 días y observa el número
de minicomponentes vendidos, los resultados se muestran en la siguiente tabla:

N° de minicomponentes vendidos 0 1 2 3 4 ≥5
N° de días 7 12 30 24 26 21

Con un nivel de significancia del 5% ¿A qué conclusiones llega este comerciante?

Prueba de Bondad de ajuste: Distribución Normal

101. Un atleta efectúa 150 lanzamientos de disco durante una semana de práctica. En
la siguiente Tabla se muestran las distancias logradas en sus lanzamientos (en
pies).

41
Distancia: X Número de Lanzamientos
x  61 18
61 < x  63 30
63 < x  65 60
65 < x < 67 37
x  67 5

Si se utiliza un nivel de significación del  = 0.01, ¿se puede tener evidencia


suficiente como para afirmar que las distancias a las cuales lanza el disco se
comportan como una distribución normal con promedio  = 63 pies y desviación
estándar  = 2 pies?

102. En la siguiente tabla se presenta la distribución de los datos sobre demanda de


teléfonos celulares (en millones de unidades) en una compañía telefónica durante 60
meses.

Demanda de
X< 5 [5 – 9> [9 – 13> [13 – 17> [17 – 21> X ≥ 21
celulares
Número de
4 8 13 21 9 5
meses

Al nivel de 5% de significancia, ¿se puede considerar que la demanda de teléfonos


celulares vendidos se ajusta a una distribución normal, si se sabe que la demanda
promedio y la desviación estándar es 15.5 y 5.2 millones de unidades
respectivamente?

103. El gerente de un banco efectúa 150 solicitudes de crédito hipotecario durante una
semana. En la siguiente tabla se muestran los montos de los créditos hipotecarios
solicitados (en miles de dólares).

Monto de los créditos


Número de solicitudes
hipotecarios
x  75 18
75 < x  80 30
80 < x  85 60
85 < x < 90 37
x  90 5

Si se utiliza un nivel de significación del  = 0.05, ¿se puede tener evidencia suficiente
como para afirmar que los montos de los créditos hipotecarios se comportan como
una distribución normal con promedio  = 85 miles de dólares y desviación estándar
 = 5 miles de dólares?

42
Correlación lineal

104. El administrador del área de préstamo de una entidad bancaria quiere determinar
la relación entre los ingresos mensuales en miles de soles; y ahorros mensuales en
miles de soles, de sus clientes. Para esto, seleccionó una muestra aleatoria de seis
clientes y se obtuvo los siguientes resultados:

Ingreso mensual 1.0 1.2 1.5 0.8 1.8 2.0


Ahorro mensual 0.20 0.22 0.25 0.18 0.30 0.35

a. Defina la variable respuesta y la variable predictora.


b. Realice el diagrama de dispersión, e interprételo.
c. Calcule e interprete la covarianza.
d. Calcule e interprete el coeficiente de correlación de Pearson.

105. En ocasiones es conveniente comprar la mayor cantidad posible de ciertos artículos.


Por lo general el precio unitario (en dólares) es menor al adquirir grandes cantidades.
Para contrastar esta teoría se obtuvieron los siguientes datos:

Número de unidades 1 3 5 10 12 15 24
Costo unitario 55 52 48 36 32 30 25

a. Defina la variable respuesta y la variable predictora.


b. Calcule e interprete la covarianza.
c. Calcule e interprete el coeficiente de correlación de Pearson.

106. La empresa comercializadora de productos agrícolas ECOPA está interesada en


precisar qué relación existe entre la distancia que una carga de fruta es transportada
por tierra y la cantidad en kilogramos de fruta malograda. Se obtuvieron los
siguientes resultados de un estudio de diez despachos de fruta:

10 10 10 10 10

 X = 765;
i=1 i=1
X = 69225; Y = 316 ;
i=1 i=1
Y = 12128 ;  X Y = 28605
i=1
ii

a. Defina la variable respuesta y la variable predictora.


b. Calcule e interprete la covarianza.
c. Calcule e interprete el coeficiente de correlación de Pearson.

107. Una cadena de restaurantes ha experimentado grandes fluctuaciones en sus


ingresos en los últimos años. Durante este tiempo se han empleado numerosos
platillos especiales, productos nuevos, y técnicas de publicidad, así que es difícil
determinar que estrategias son las que han tenido mayores influencias en las

43
ventas. El departamento de mercadotecnia ha estudiado una variedad de relaciones
y cree que los gastos mensuales en carteles pueden ser signifificativos. Se
muestreó 7 meses y se determinó lo siguiente:

VENTAS (Y): Ingresos mensuales de ventas (en 100 mil dólares)


GASTOS(X): Gastos mensuales en carteles (en miles de dólares)

a. Encuentre e interprete el coeficiente de correlación entre estas dos variables.


b. Encuentre e interprete la covarianza entre estas dos variables.
c. ¿Cuál es el objetivo del análisis de regresión lineal?
d. ¿Cuál es el objetivo del análisis de correlación?

Regresión lineal simple

108. Los datos del problema 107 han sido ingresados al MINITAB obteniendo la siguiente
salida para este ejercicio:

44
Basado en la salida de MINITAB proporcionada, conteste las siguientes preguntas:

a. Determine la línea de regresión que permita estimar los ingresos mensuales por
ventas en función de los gastos mensuales en carteles. Interprete el coeficiente
de regresión.
b. Con un nivel de significancia de 2.5%, ¿se puede afirmar que el modelo de
regresión lineal es significativo?
c. ¿Qué porcentaje de la variación de los ingresos mensuales por ventas está
explicado por los gastos mensuales en carteles?
d. Utilice el modelo de regresión lineal desarrollado para estimar los ingresos
mensuales por ventas si la empresa ha gastado 28 000 dólares en carteles.
e. Con un 95% de confianza, estime el ingreso promedio mensual por ventas si la
empresa ha gastado 30 000 dólares en carteles.

109. El administrador del área de préstamo de una entidad bancaria quiere determinar
la relación entre los ingresos mensuales en miles de soles; y ahorros mensuales en
miles de soles, de sus clientes. Para esto, seleccionó una muestra aleatoria de seis
clientes y se obtuvo los siguientes resultados:

45
Ingreso mensual 1.0 1.2 1.5 0.8 1.8 2.0
Ahorro mensual 0.20 0.22 0.25 0.18 0.30 0.35

Con la información dada, se pide:

a. Determine la línea de regresión que permita estimar el ahorro mensual en función


del ingreso mensual. Interprete el coeficiente de regresión estimado.
b. Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo de
regresión lineal es significativo?
c. ¿Qué porcentaje de la variabilidad del ahorro mensual no está explicado por el
ingreso mensual?
d. Utilice el modelo de regresión lineal desarrollado para estimar el ahorro mensual
si el cliente tiene un ingreso mensual igual a 1750 soles.
e. Con un 95% de confianza, estime el ahorro medio mensual si el cliente tiene un
ingreso mensual igual a 1750 soles.

110. A continuación, se muestran los gastos en publicidad (en ciento de dólares) y sus
ventas (en miles de artículos) que realiza una empresa. Los resultados registrados
se seleccionaron aleatoriamente en una muestra de diez semanas.

a. Determine la línea de regresión que permita estimar las ventas en función del
gasto en publicidad.
b. Interprete el coeficiente de regresión estimado.
c. Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo de
regresión lineal es significativo?
d. ¿Qué porcentaje de la variabilidad del gasto de publicidad está explicado por las
ventas?

46
e. Con un nivel de confianza de 95%, estime el nivel de ventas que se espera
obtener si se realiza un gasto de 17 mil dólares en publicidad.

111. En ocasiones es conveniente comprar la mayor cantidad posible de ciertos


artículos. Por lo general el precio unitario (en dólares) es menor al adquirir grandes
cantidades. Para contrastar esta teoría se obtuvieron los siguientes datos:

Número de unidades 1 3 5 10 12 15 24
Costo unitario 55 52 48 36 32 30 25

Los resultados obtenidos con el MINITAB son los siguientes:

Se asume que se cumple el supuesto de normalidad.

a. Con un nivel de significancia de 0.05, ¿se puede afirmar que no existe


autocorrelación entre los errores?
b. Determine la ecuación de regresión lineal simple. Interprete el coeficiente de
regresión estimado.
c. ¿Qué % de la variabilidad en el costo no es explicada por la recta de regresión?
d. ¿Es la pendiente de la recta diferente de cero significativamente? Use un α = 0.05.
e. Estime, mediante un intervalo de confianza del 95%, el costo promedio unitario
cuando se compran 40 unidades.

112. El gerente de ventas permite que los agentes vendedores que tiene a su cargo

47
reciban capacitaciones motivacionales que se dan en diferentes horarios y se tiene
absoluta libertad para elegir el horario que crean conveniente. El gerente cree que
las capacitaciones motivacionales influyen en la eficiencia de las ventas. Para
verificar esto, se toma una muestra de 10 vendedores y registró el tiempo
acumulado de horas en las que estuvo presente en una o más capacitaciones
durante el último trimestre y la eficiencia de sus ventas (en porcentaje), los datos
encontrados fueron:

Tiempo acumulado en
27 45 41 19 35 39 19 49 15 31
capacitaciones
Eficiencia en las ventas 47 84 80 46 62 72 52 87 37 68
Los resultados obtenidos en con el MINITAB son los siguientes:

a. Determine el modelo de regresión lineal. Interprete adecuadamente el


coeficiente de regresión.
b. ¿Se puede afirmar que el modelo de regresión es significativo?
c. El gerente afirma que teniendo 60 horas acumuladas de capacitación
motivacional, la eficiencia promedio de los trabajadores en las ventas es por lo
menos 90%. Con un 99% de confianza, ¿se puede concluir que la afirmación es
correcta?
d. Calcule e interprete el coeficiente de determinación.

113. A continuación, se muestran los gastos en publicidad (en miles de dólares) y sus
ventas (en miles de artículos) que realiza una empresa. Los resultados registrados
se seleccionaron aleatoriamente en una muestra de diez semanas.

Gasto en publicidad 9 7 5 14 15 12 6 10 15 21
Ventas 10 6 5 12 10 15 5 12 17 20

48
a. Determine la línea de regresión que permita estimar el nivel de ventas en base
al gasto en propaganda. Interprete el coeficiente de regresión estimado.
b. Con un nivel de significancia de 0.05, ¿existe evidencia estadística para afirmar
que el modelo de regresión lineal es significativo?
c. Construya un intervalo de confianza del 95% para el nivel de ventas promedio
cuando se gasta en propaganda 17 mil dólares.
d. ¿Qué porcentaje de la variación total en la venta es explicada por el modelo de
regresión?

114. El gerente de una empresa seleccionó al azar diez semanas de funcionamiento y


registró el nivel de ventas (en ciento de dólares) y el precio de venta (en dólares).
Los resultados se dan a continuación:

Semana 1 2 3 4 5 6 7 8 9 10
Precio 1.3 2.0 1.7 1.5 1.6 1.2 1.6 1.4 1.0 1.1
Venta 10 6 5 12 10 15 5 12 17 20

a. Estime la línea de regresión del nivel de ventas en base al precio del artículo.
Interprete el coeficiente de regresión estimado.
b. Con un nivel de significancia de 0.01, ¿existe evidencia estadística para afirmar
que el modelo de regresión lineal es significativo?
c. Estime el nivel de ventas que se espera obtener si el precio del artículo es de
$1.8.
d. Construya un intervalo de confianza del 99% para el nivel de ventas promedio
cuando el precio del artículo es de $1.8. Interprete.
e. ¿Qué porcentaje de la variabilidad del nivel de ventas no es explicado por el
modelo de regresión lineal simple?

115. La empresa comercializadora de productos agrícolas ECOPA está interesada en


precisar qué relación existe entre la distancia que una carga de fruta es transportada
(por tierra) y la cantidad de fruta malograda, medida en kilogramos (Y) al llegar a su
destino. Se obtuvieron los siguientes resultados de un estudio de diez despachos de
fruta:

a. Ajuste una recta de regresión para determinar la cantidad de fruta malograda en


función de la distancia recorrida. Interprete el coeficiente de regresión estimado.
b. ¿Existe evidencia estadística para afirmar que el ajuste de la recta de regresión
es significativo? Use un α = 0.05.
c. Estime un intervalo de confianza para la cantidad de fruta malograda cuando la
distancia recorrida fue de 95 Kilómetros, utilice un 95% de confianza.
d. Calcule e interprete el coeficiente de determinación.

49
116. El gerente de la empresa Carro S.A. dedicada a la compraventa de vehículos usados,
desea verificar si el precio de venta de este tipo de vehículos (miles de dólares) está
relacionado con el recorrido acumulado (decenas de miles de kilómetros). Con este fin,
se hace un estudio basado en una muestra aleatoria de vehículos vendidos durante el
año 2017 y se obtuvo la siguiente información:

a. Defina la variable respuesta y la variable predictora.


b. Calcule e interprete la covarianza.
c. Calcule e interprete el coeficiente de correlación de Pearson.

SEMANA 6

REGRESIÓN LINEAL MÚLTIPLE

117. Un estudio analiza la relación entre la composición de un tipo de cemento y el calor


desprendido durante la fase de fraguado. La muestra está formada por 13
cementos. Con la información obtenida se analizó con el minitab y se obtuvo los
siguientes resultados:

Donde:
Y = Cantidad de calor desprendida (calorías / gramos)
X1 = Porcentaje de óxido de calcio
X2 = Porcentaje de dióxido de silicio
X3 = Porcentaje de óxido de hierro

Con lo obtenido con el minitab, se quiere estimar la cantidad de calor desprendida


en función de los porcentajes de los componentes del tipo de cemento.

50
a. Con un nivel de confianza de 5%, ¿se puede afirmar que las variables
independientes son significativas? Si alguna variable independiente no es
significativa, obtenga el nuevo modelo. Use las salidas del minitab.

Con lo obtenido en a., se pide:

b. Verifique los supuestos de la no autocorrelación entre los errores y la no


multicolinealidad entre las variables independientes. Use un α = 0.05.
c. Con un 5% de significancia, ¿se puede afirmar que el modelo de regresión lineal
es significativo?
d. Determine e interprete el coeficiente de determinación.

51
e. Estime la cantidad de calor desprendida si los porcentajes de óxido de calcio,
dióxido de silicio y óxido de hierro son 10.8, 32.5 y 42.5 respectivamente.

118. Un distribuidor de helado está estudiando el sistema de reparto de su producto.


Específicamente, el distribuidor está interesado en estimar el tiempo de servicio en
minutos, a un expendio al menudeo. El ingeniero industrial a cargo del estudio ha
sugerido que los dos factores más importantes que intervienen en el tiempo de
reparto son el número de cajas de helados que se entregan y la distancia en miles
de kilómetros, que debe recorrer el repartidor. El ingeniero recopiló una muestra de
15 servicios de reparto y obtuvo los siguientes resultados en minitab:

52
a. Verifique los supuestos para un análisis de regresión lineal múltiple y la
multicolinealidad utilizando el Factor de Inflación de la variable (VIF)
b. Indique el modelo de regresión lineal múltiple. Interprete cada uno de los
coeficientes de regresión.
c. Con un nivel de significancia de 5%, ¿se puede afirmar que las variables
independientes son significativas?
d. ¿Se puede afirmar que el modelo de regresión lineal es significativo? Use un nivel
de significancia de 5%.
e. ¿Qué porcentaje de la variación total del tiempo de reparto no es explicada por el
modelo de regresión?
f. Determine el tiempo promedio de entrega del producto cuando se tienen que
entregar 18 cajas, para lo cual se tiene que recorrer una distancia de 35 km. Use
un nivel de confianza de 95%.

119. Se desea modelar la producción de los trabajadores de una fábrica en función de


una prueba de aptitud y los años de experiencia. Para realizar este estudio se
seleccionó una muestra de 10 colaboradores y se registró el número de unidades
que había producido por hora (Y), el puntaje que obtenido en una prueba de aptitud
(X1) y los años de experiencia del colaborador (X2).

53
a. Verifique la no multicolinealidad y la no autocorrelación en los residuales. Use un
α = 0.05.
b. Indique el modelo de regresión lineal múltiple. Interprete el coeficiente de
regresión para la variable años de experiencia del colaborador.
c. Con un nivel de significancia de 0.05, ¿existe evidencia para afirmar que el modelo
con las dos variables es válido?
d. Con un nivel de significancia de 0.05, ¿existe evidencia para afirmar que las
variables independientes son significativas?
e. Determine e interprete el coeficiente de determinación correspondiente para este
análisis.

120. La compañía Aceros ha estado buscando los factores que influyen en la cantidad
de acero (en millones de toneladas) que es capaz de vender cada año. La
administración sospecha que los siguientes son los factores principales: La tasa
anual de inflación del país, el precio promedio por tonelada en dólares, mediante el
cual el acero importado acota los precios de la compañía y el número de
automóviles en millones que los fabricantes del país están planeando producir en
ese año. Se han recogido los datos correspondientes a los últimos siete años y se
analizó los datos con el MINITAB obteniéndose los siguientes resultados:

54
a. Verifique los supuestos de multicolinealidad y autocorrelación en los errores. Use
un α = 0,05.
b. Determine el modelo de regresión lineal múltiple. Interprete el coeficiente de
regresión para la variable tasa anual de inflación del país.
c. Con un nivel de significancia de 0,05, ¿al menos una de las variables es
significativa?
d. Con un nivel de significancia de 0,05, ¿qué variables deben quedarse en el
modelo?
e. Con lo obtenido en d), plantee el nuevo modelo de regresión lineal.
f. Determine e interprete el coeficiente de determinación ajustado.

121. Se desea estimar la variable Y en función a otras cuatro variables. Al tomar una
muestra de tamaño 10 se encontró los siguientes resultados con el MINITAB:

a. Si se supone que no hay problemas de multicolinealidad. Determine el modelo de

55
regresión lineal múltiple.
b. Con un 5% de significancia, ¿se puede afirmar que el modelo es significativo?
c. Con un nivel de significancia del 0.05, ¿existe evidencia estadística para afirmar
que las variables independientes son significativas? Utilizar un α = 0.05.
d. Asumiendo que todas las variables independientes se quedan en el modelo, ¿qué
porcentaje de la variabilidad de Y está explicada por el modelo de regresión
estimado?

122. El gerente de una empresa inmobiliaria tiene interés en realizar un estudio acerca
de los precios de las viviendas que posee la urbanización “El Sol de las Laderas”,
donde existe un solo centro comercial. La empresa ha decidido incluir en el análisis
las siguientes variables:

Y = Precio de la vivienda en miles de dólares


X1 = Área construida de la vivienda en metros cuadrados
X2 = Distancia al centro comercial en metros
X3 = Antigüedad de la vivienda en años

Los resultados obtenidos en 21 viviendas elegidas al azar se muestran a


continuación:

Se asume que los errores siguen una distribución normal y que no existe
autocorrelación entre ellos.

a. Verifique el supuesto de multicolinealidad utilizando el Factor de Inflación de la


variable (VIF)
b. Determine la ecuación de regresión estimada e interprete el coeficiente de la

56
variable antigüedad.
c. Pruebe si el modelo de regresión múltiple que incluye las tres variables
independientes es significativo. Use un α = 5%
d. Pruebe si las variables independientes son significativas. Use un α = 5%.

123. El gerente de ventas de un centro comercial quiere conocer si las ventas anuales
en miles de dólares son afectadas por el número de trabajadores en cientos, el
número de acciones en miles ofrecidas por cada empresa y el valor del inventario
al principio del año en miles de dólares. Se selecciona una muestra de 16 empresas
hoteleras, los datos recolectados fueron procesados en el software del MINITAB y
se obtuvieron los siguientes resultados:

a. Verifique los supuestos de la multicolinealidad y la autocorrelación de los errores.


Use un α = 0.05.
b. Determine la ecuación de regresión lineal múltiple. Interprete el coeficiente de
regresión del número de acciones ofrecidas por cada empresa.
c. ¿El modelo de regresión lineal múltiple es significativo? Use un α = 0.05.
d. ¿Qué variables son significativas en el modelo? Use un α = 0.05.
e. Suponiendo que el modelo con las tres variables es significativo, se desea saber
la venta anual estimada cuando el número de trabajadores fue de 12000
empleados, el número de acciones es de 24000 acciones y el valor del inventario
inicial es de 15000 dólares.

124. El gerente comercial de una cadena de tiendas desea estimar la Utilidad (UTIL)
mensual de una empresa comercial en miles de dólares, y considera que las
variables que pueden explicar las fluctuaciones de la utilidad son: el Nivel de ventas
(NV) en cientos de unidades mensuales, el Gasto en publicidad (GP) en miles de
soles, el Precio unitario (PU) en soles y el Monto de pago en impuestos (PI) en
cientos de soles. Se tomó una muestra de tamaño 20 y al procesar estos datos en
el programa MINITAB se observaron los siguientes resultados:

57
a. Interprete los coeficientes de regresión de las variables nivel de ventas y gasto en
publicidad.
b. Con un nivel de significancia de 5%, ¿existe evidencia estadística para afirmar
que el modelo de regresión es significativo?
c. ¿Se puede afirmar que todas las variables independientes del modelo son
significativas? Use  = 5%. Luego indique que variable o que variables
independientes deben de salir del modelo.
d. De acuerdo con sus resultados obtenidos en la parte c., y con las siguientes
salidas del programa Minitab indique en forma clara el modelo final que le
recomendaría al Gerente Comercial de esta cadena de tiendas:

58
59
e. Con el modelo obtenido en el inciso d), ¿qué porcentaje de variación de la utilidad
es explicado por el modelo final?

SEMANA 7

Regresión lineal múltiple con variables independientes cualitativas

125. En la liga nacional de fútbol americano de Estados Unidos (NFL) se evalúa a sus
prospectos con una escala que va del 5 al 9. Estas evaluaciones se interpretan
como sigue:

• 8 – 9 deberá empezar el año próximo;


• 7.0 – 7.9 deberá empezar;
• 6.0 – 6.9 servirán de respaldo al equipo, y
• 5.0 – 5.9 pueden formar parte del club y contribuir.

En la tabla siguiente se da posición (0: Guardia; 1: Tackle), peso, tiempo en


segundos para correr 40 yardas y la evaluación dada por la NFL a 25 prospectos
(USA Today, 14 de abril de 2000).

60
Ingresando los datos y analizando en el minitab se obtuvo los siguientes resultados:

a. Obtenga una ecuación de regresión estimada que muestre la relación entre la


evaluación y posición, peso y tiempo requerido para correr 40 yardas. Interprete
los coeficientes estimados de Posición y Tiempo.
b. Empleando como nivel de significancia 0.05, pruebe si la ecuación de regresión
estimada obtenida en el inciso a. indica que existe una relación significativa entre

61
las variables independientes y la variable dependiente.
c. ¿Es la posición un factor significativo en la evaluación de los jugadores? Use α =
0.05. Explique.
d. Suponga que hay un nuevo prospecto de tackle que pesa 300 libras y corre 40
yardas en 5.1 segundos. Utilice la ecuación de regresión estimada obtenida en el
inciso a) para estimar la evaluación de este jugador.
e. ¿Proporciona la ecuación de regresión estimada un buen ajuste a los datos
observados? Justifique su respuesta.

126. Johnson Filtration Inc. da servicio de mantenimiento a los sistemas de filtración en


el sur de Florida. Los clientes solicitan un servicio de mantenimiento para sus
sistemas de filtración de agua y de esta manera, los administradores de Johnson
podrían estimar el tiempo que se requerirá para el servicio y el costo del mismo. Se
cree que el tiempo requerido para una reparación, en días; está relacionado con
dos factores, meses transcurridos desde el último servicio de mantenimiento y tipo
del problema (mecánico o eléctrico).

Donde, la variable X2: Tipo de reparación se codifica como:

Con la información recolecta se ingresó al minitab y se obtuvo los siguientes


resultados:

62
a. Con el modelo de regresión estimado, interprete el coeficiente de regresión
para meses transcurridos desde la última reparación.
b. Con un nivel de significancia 0.05, pruebe si la ecuación de regresión estimada
obtenida en el inciso a. indica que existe una relación significativa entre las
variables independientes y la variable dependiente.
c. Con un nivel de significancia de 5%, ¿se puede afirmar que tipo de reparación
es una variable significativa?
d. Estime el tiempo necesario de reparación mecánica si han transcurrido 7.5
meses desde la última reparación.

127. Del problema de la empresa de reparación de filtraciones. Supóngase que además


de la información sobre los meses transcurridos desde el último servicio y de si se
trata de una reparación mecánica o eléctrica, los administradores presentan una
lista con las personas que realizaron las reparaciones. A continuación, se presentan
los nuevos datos:

63
Donde:
X1 = Meses desde el último servicio
X2 = Tipo de reparación
→ X2 = 0: Tipo mecánico y X2 = 1: Tipo eléctrico
X3 = Persona que realiza la reparación
→ X3 = 0: Dave Newton y X3 = 1: Bob Jones

Ingresando los datos y analizando en el minitab se obtuvo los siguientes resultados:

a. Obtenga la ecuación de regresión estimada que permita predecir el tiempo que se


requiere para una reparación dados los meses transcurridos desde la última
reparación, el tipo de reparación y la persona que realizó la reparación. Interprete
el coeficiente de regresión para X1 y X3.
b. Empleando como nivel de significancia 0.05, realice una prueba para ver si la
ecuación de regresión estimada obtenida en el inciso a. representa una relación
significativa entre las variables independientes y la variable dependiente.
c. ¿Es estadísticamente significativo agregar la variable X3, la persona que realizó la
reparación? Use α = 0.05. ¿Qué explicación puede dar para los resultados
observados?

64
Si se asume que todas las variables permanecen en el modelo de regresión:
d. Estime el tiempo que se requiere una reparación si la han pasado 5 meses de la
última reparación, el tipo de reparación es eléctrico y la persona que realizó la
reparación fue Bob Jones.
e. ¿Qué porcentaje de variabilidad del tiempo de reparación está explicada por el
modelo de regresión?

SEMANA 7

Regresión logística binaria

128. En un centro clínico se realizó un estudio para determinar si los pacientes con algún
tipo de enfermedad cancerígena después de terminar el tratamiento respectivo se
logran curar. En una muestra seleccionada al azar de 40 pacientes, se registró los
datos de las siguientes variables:

Resultado: 1: Se cura 0: No se cura


Recibe tratamiento: 1: Recibe 0: No recibe
Enfermedad: 1: A inicios 0: En etapa avanzada

Con el uso del paquete estadístico minitab, se realizó el análisis de regresión


logística, obteniendo los siguientes resultados:

65
a. Determine el modelo de regresión logística binaria para estimar la probabilidad de
que el paciente se cura de la enfermedad cancerígena.
b. Calcule la probabilidad de que el paciente se cure de la enfermedad cancerígena
si recibe tratamiento y se encuentre a inicios.
c. Interprete el odds ratio para la variable recibe tratamiento.
d. Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo es
significativo?
e. Con un nivel de significancia de 5%, ¿se puede afirmar que las variables
predictoras son significativas?

129. En un policlínico se realizó un estudio para determinar si los pacientes padecen de


diabetes mellitus. De una muestra seleccionada al azar de 60 pacientes, se registró
los datos de las siguientes variables:

Diabetes mellitus: 1: Padece 0: No padece


Sexo del paciente: 1: Varón 0: Mujer
Practica ejercicios físicos: 1: No 0: Si
Cumple una dieta alimenticia: 1: No 0: Si
Frecuenta al médico mensual: 1: No 0: Si

Con el uso del paquete estadístico minitab, se realizó el análisis de regresión


logística, obteniendo los siguientes resultados:

66
a. Determine el modelo de regresión logística binaria para estimar la probabilidad
de que el paciente padezca de diabetes mellitus.
b. Calcule la probabilidad de que el paciente no padezca de diabetes mellitus si
es mujer, no practica ejercicios físicos, no cumple una dieta alimenticia y no
frecuenta al médico mensualmente.
c. Interprete el odds ratio para la variable: practica ejercicios físicos
d. Con un nivel de significancia de 2.5%, ¿se puede afirmar que el modelo es
significativo considerando a todas las variables independientes?

67
e. Con un nivel de significancia de 2.5%, ¿se puede afirmar que la variable
independiente frecuenta al médico es significativa?

130. Los clientes de una gran empresa distribuidora se dividen en dos grupos, los que
compran a crédito y los que compran al contado. El gerente de compras desea
estimar la probabilidad de que una empresa pertenezca al grupo que compra al
contado (1). Para esto, se seleccionó una muestra aleatoria de 100 clientes y
además, para estimar la probabilidad se recolectó la información de las siguientes
variables predictoras:

Plazo de entrega, en días


Nivel de precios, en miles de soles
Calidad del producto: 0: Buena y 1: Muy buena

a. ¿Qué análisis de regresión se realizaría para cumplir con el objetivo propuesto?


Justifique
b. Determine el modelo de regresión que permita estimar la probabilidad de que el
cliente compre al contado.
c. Con un 5% de significancia, ¿se puede afirmar que el modelo que permita estimar
la probabilidad de que el cliente compre al contado es significativo?

68
d. Interprete el Odds ratio de la variable plazo de entrega.

131. El área de admisión en cierta universidad desea predecir el ingreso o no a la


universidad de un alumno recién egresado de la secundaria. Para ello, el encargado
de dicha área tomó una muestra de 30 postulantes los cuales recién habían
terminado la secundaria el año anterior y se registró su nota promedio de todos sus
cinco años de estudios secundarios. Algunos de estos datos son los siguientes:

Alumno Situación Nota promedio


1 1 14.5
2 1 15.8
3 1 12.1
4 0 11.1
5 1 16.2
6 0 11.0
: : :

Donde las variables son:


- Situación: 1: Ingresó 2: No ingresó
- Nota promedio

Con la información recolectada se ingresó y analizó en minitab, obteniéndose los


siguientes resultados:

69
a. Determine el modelo estimado de regresión logística binaria.
b. Interprete el cociente de posibilidades de la variable nota promedio.
c. ¿Se puede afirmar que la probabilidad de que un postulante ingrese a la
universidad con nota promedio de 12,8 es mayor a la probabilidad de que no
ingrese a la universidad?
d. Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo de regresión
logística estimado es significativo?
e. Con un nivel de significancia de 5%, ¿se puede afirmar que la variable predictora
es significativa?

132. El director del banco del sur se muestra preocupado por el aumento de clientes
morosos en los últimos años. Con objeto de reducir este problema, realiza un
estudio que permita identificar con la mayor precisión posible aquellas solicitudes
de préstamos que probablemente puedan llegar a convertirse en préstamos
morosos en el caso que se concedieran. Después de analizar la documentación
existente en el banco, el investigador solamente puede conseguir la información de
25 clientes a los que se la ha concedido préstamos en los tres últimos años. Algunos
de estos datos son los siguientes:

Ingreso
N° cliente Tipo de cliente mensual
1 1 4450
2 1 3100
3 1 3100
4 1 5200
5 1 4975
6 1 4250
: : :

70
Donde las variables son:
- Tipo de cliente: 1: cliente moroso 2: cliente cumplido
- Ingreso mensual en miles de soles

a. Determine el modelo estimado de regresión logística binaria.


b. Interprete el cociente de posibilidades de ingreso mensual.
c. ¿Se puede afirmar que la probabilidad de que un cliente moroso con ingresos de
3250 soles es mayor a un cliente cumplido?
d. Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo de regresión
logística estimado es significativo?
e. Con un nivel de significancia de 5%, ¿se puede afirmar que la variable predictora
es significativa?

133. Consumer Report le realizó una prueba de sabor a 19 marcas de chocolates. En los
datos a continuación se da el precio por porción, en base al tamaño de porción de
la FDAque es de 1.4 onzas, así como una evaluación de la calidad de los 19
chocolates tomados para la prueba (Consumer Report, febrero 2002).

71
Suponga que desea determinar si los productos que son más caros son mejor
evaluados. Para los propósitos de este ejercicio, emplee la siguiente variable
binaria dependiente.

y = 1 si la evaluación de la calidad fue excelente o muy buena, y y = 0 si la


evaluación de la calidad fue buena o regular.

72
a. Determine el modelo de regresión logística estimado.
b. Estime la probabilidad de que la evaluación de un chocolate cuyo precio por
porción es $4.00 sea muy bueno o excelente.
c. Interprete el odds ratio para Precio.
d. Con un 5% de significancia, ¿se puede afirmar que el modelo de regresión
logística es significativo? Y ¿la variable predictora contribuye al modelo de
regresión logística?

134. En los últimos años en Lakeland Collage ha aumentado el porcentaje de estudiantes


que abandonan sus estudios después del primer año. El año pasado, Lakeland
Collage inició un programa voluntario de orientación para ayudar a los estudiantes
de primer año a que se adapten a la vida del campus. Si Lakeland Collage
demuestra que ese programa tiene resultados positivos, se considerará la
posibilidad de que el programa sea obligatorio para todos los estudiantes de primer
año. La administración de Lakeland Collage supone que los estudiantes que tienen
GPA bajo son los que tienen mayor probabilidad de abandonar los estudios al final
del primer año. Con objeto de investigar la relación de estas variables con la
permanencia de los estudiantes en la escuela, Lakeland Collage tomó una muestra
aleatoria de 100 estudiantes de primer año.
*La variable dependiente toma el valor y = 1 si el estudiante permanece en la
escuela y y = 0 si no es así. Las dos variables independientes son:

A continuación, se dan los resultados obtenidos usando el paquete estadístico


Minitab:

73
Se pide:
a. Obtenga la ecuación de regresión logística que relaciona a las variables X 1 y X2
con Y.

74
b. Realice la prueba de significancia global empleando α = 0.05.
c. Empleando α = 0.05, determine si cada una de las variables independientes son
significativas.
d. Use el logit estimado del inciso a) para obtener una estimación de la probabilidad
de que un estudiante cuyo GPA es 2.5 y que no participó en el programa de
orientación permanezca en la escuela.
e. Interprete el cociente de posibilidades para el programa de orientación.

135. El Community Bank desea aumentar la cantidad de clientes a los que les depositan
directamente su nómina. El gerente está considerando una campaña que requerirá
que cada gerente de sucursal llame a cada cliente que no reciba directamente su
nómina. Como incentivo para aceptar recibir directamente su nómina, se les
ofrecerá revisión gratuita de su cuenta durante dos años. Debido al tiempo y a los
costos de esta campaña, el gerente desea que esta campaña se dirija a aquellos
clientes que tengan la mayor probabilidad de aceptar recibir directamente su
nómina. El gerente piensa que el saldo promedio mensual en la cuenta de cheques
del cliente puede ser un predictor útil para determinar si un cliente aceptará o no
recibir directamente su nómina. Para investigar la relación entre estas dos variables,
Community Bank prueba la nueva campaña utilizando una muestra de cuentas de
cheques de 50 clientes que actualmente no reciben directamente su nómina. En los
datos muestrales se presenta el saldo mensual promedio en la cuenta de cheques
(en miles de dólares) y si el cliente aceptó recibir directamente el depósito de su
nómina (1 significa aceptó el depósito directo de su nómina y 0 significa el cliente no aceptó
el depósito directo de su nómina).

A continuación, se dan los resultados obtenidos usando el paquete estadístico


Minitab:

75
a. Obtenga la ecuación de regresión logística estimada.
b. Realice una prueba de significancia empleando el estadístico de prueba G. Use
α = 0.05.
c. Estime la probabilidad de que los clientes cuyo saldo mensual promedio sea $1000
acepten recibir directamente el depósito de su nómina.
d. Supóngase que Community Bank desea contactar únicamente a los clientes para
los que la probabilidad de aceptar recibir directamente su nómina sea de 0.50 o
mayor. ¿Cuál es el saldo promedio requerido para tener esta probabilidad?
e. Dé la estimación del cociente de posibilidades. ¿Cuál es su interpretación?

76

También podría gustarte