Está en la página 1de 43

DIRECCIÓN DE ESTUDIOS GENERALES

GUIA DE TRABAJO

ESTADÍSTICA II

2023 – 00

1
SEMANA 1
INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL (𝝁)

1. Se va a vender un nuevo cereal para desayuno como prueba de mercados durante un mes en las
tiendas de una cadena de autoservicio. Los resultados de una muestra de 26 tiendas indicaron una
venta promedio de 1250.8 soles con una desviación estándar de 210.4 soles. Si las ventas tienen
distribución normal.

a) Establezca una estimación por intervalo con un 95% de confianza para la venta promedio por
tienda de este cereal en este mes de prueba.
b) Si la cadena de autoservicios tiene 200 tiendas, estime con un 95% de confianza el monto de
las ventas que por concepto de este producto tendrían las 200 tiendas.

2. Responda las siguientes preguntas:

a) Suponga que de una población se seleccionó una muestra aleatoria de tamaño n = 64


personas, con el objetivo de estimar el gasto promedio (en soles) en consumo, por mes, el cual
tiene una distribución normal. A un nivel de confianza del 95% y sabiendo que la varianza (σ 2)
es de es de 62500 soles2, se encontró el siguiente intervalo de confianza para la media 𝐼𝐶(𝜇) =
〈1138.75; 1261.25〉. Halle el valor de la media muestral utilizada y el margen de error utilizado
en el problema.

b) Dentro del contexto de la parte a), se desea reducir el error de estimación (margen de error) en
un 40%, manteniendo el mismo nivel de confianza, calcule el tamaño de muestra que se
requiere en este caso.

c) La siguiente información es una salida de MINITAB con respecto a una estimación mediante
intervalos de confianza para el promedio de peso de un artículo:

One-Sample Z: PESO
The assumed sigma = 35
Variable N Mean StDev SE Mean _____% CI
PESO 11 246,2 21,3 _____ (228,8;_______)

Por error se borró el valor del nivel de confianza y el límite superior. Con la información obtenida
del resultado del minitab. Determine dichos valores.

d) En el problema anterior si el intervalo de confianza para la media es (226,4; 266,0). ¿Qué nivel
de confianza se utilizó?

3. Se seleccionó una muestra de 15 bodegas de cierta zona de la ciudad con la finalidad de estimar el
nivel promedio de ventas por semana (en miles de soles). Los datos obtenidos se procesaron
mediante el programa MINITAB, y los resultados se muestran a continuación:

One-Sample Z: VENTAS
The assumed sigma = 10
Variable N Mean StDev SE Mean ………………………………
VENTAS 15 ______ 10,21 _____ (56,21; 67,52)

2
A partir de esta información responda las siguientes preguntas:
a) Se afirma que el nivel de venta promedio semanal, de estas bodegas es superior a los 54500
soles. Con el reporte dado ¿Qué puede decir al respecto?
b) Halle el nivel promedio de las ventas.
c) ¿Qué nivel de confianza se utilizó en este reporte?

4. Resuelva las siguientes preguntas:

a) El gerente comercial de una cadena de tiendas, que tiene un gran número de establecimientos
distribuidos en todo el país, desea estimar el nivel de ventas promedio semanal de estos
establecimientos, para lo cual se fija las siguientes condiciones: está dispuesto a tolerar un
error de a lo más 120 soles y desea estar 90% seguro de sus resultados. Si se tiene como
información que la desviación estándar en el nivel de ventas de dichos establecimientos es
de 350 soles ¿Qué tamaño de muestra debe utilizar este gerente?

b) La siguiente es una corrida del programa MINITAB, para una muestra de personas a las que
se les preguntó acerca de su gasto semanal en movilidad (en soles).

One-Sample T
N Mean StDev SE Mean _______% CI
25 _____ 15,00 ____ 44,5235, _______)

Complete la información faltante, los resultados se obtuvieron para estimar el gasto semanal
promedio en movilidad.

5. Una casa comercial tiene 2500 clientes con cuenta de crédito. Para estimar el total adeudado por
estos clientes, se selecciona una muestra aleatoria de 25 cuentas la cual da los siguientes
resultados: una media de 950 soles y una desviación estándar de 300 soles. Construya un intervalo
de confianza del 99% para estimar la cantidad total adeudada por los clientes de esta casa
comercial, si se sabe que el monto adeudado por los clientes tiene una distribución normal.

6. Una empresa comercializa granos de café en bolsas de 150 gramos. Sin embargo, INDECOPI ha
recibido las quejas de un grupo de consumidores los cuales alegan que el contenido de dichas
bolsas es menor a lo indicado; para corroborar las quejas, un funcionario de INDECOPI seleccionó
una muestra aleatoria de diez unidades del producto resultando los siguientes pesos en gramos:

150.5 150.7 149.0 150.4 149.6 151.0 150.9 149.2 150.3 149.3

a) Con un nivel de confianza del 98%, estime el contenido medio de las bolsas.
b) Al nivel de confianza del 98%, ¿puede el funcionario llegar a la conclusión que los
consumidores tienen la razón? Considere los resultados obtenidos en el ítem (a).

INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN POBLACIONAL (𝝅)

7. En cierto distrito de la capital se está realizando un estudio mediante el cual se podría tener la
posibilidad de otorgar crédito monetario a los comerciantes de la zona y de este modo se puedan
formalizar. Para esto se quiere estimar el ingreso mensual de un sector de comerciantes informales.
Se seleccionó una muestra aleatoria de 120 comerciales informales y se encontró entre otros datos
lo siguiente: un ingreso promedio de 1800 soles y una desviación estándar de 150 soles; y sólo el
36% tienen ingresos superiores a 2100 soles.

3
a) Construye un intervalo de confianza del 95% para estimar el ingreso promedio mensual.
Interprete los resultados.
b) Con un nivel de confianza del 90%, estime la proporción de comerciantes con ingresos
superiores a 2100 soles.
c) Si la proporción de comerciantes con ingresos superiores a 2100 soles se estimó
puntualmente mediante una muestra piloto, en 0,3, ¿qué tan grande debe ser la muestra para
que el error de estimación no sea superior a 0,04 considerando un nivel de confianza del 95%?

8. Una industria lechera ubicada en el departamento de Ica está estudiando la posibilidad de cambiar
sus botellas de vidrio para la leche a envases de plástico. Con esta finalidad, se realizó el estudio
considerando una muestra aleatoria de 450 personas, las cuales fueron clasificadas por estrato
socioeconómico. Los resultados se muestran en cuadro adjunto:
A favor del Estrato socioeconómico
cambio A (Alto) B (Medio) C (Bajo)
Si 80 70 120
No 40 80 60

a) Estime la proporción de personas que están a favor del cambio. Use un nivel de confianza del
92%.
b) Si en la ciudad residen 36000 personas, estime el número de personas que están a favor del
cambio de envase. Use los resultados obtenidos en a).

9. Se desea realizar una encuesta de mercado para estimar la proporción de amas de casa que
prefieren un producto que vende la competencia. Asimismo se requiere que el error al estimar la
proporción poblacional no sea mayor de 4 puntos porcentuales con un nivel de confianza del 95%.
Si cuesta 10000 soles, poner en marcha el estudio además de 5 soles por cada entrevista. ¿Cuál
será el costo total de la encuesta?

10. Un inversionista desea analizar el comportamiento sobre la rentabilidad de dos tipos de acciones
asociadas a los fondos mutuos. Para ello, decide consultar a dos agencias para averiguar cuál de
las acciones es más rentable: agraria o minera. Se seleccionan muestras aleatorias
independientes por cada tipo de acción y los resultados se muestran en cuadro adjunto:

Agencia A Agencia B
Acciones Si son No son Si son No son
rentables rentables rentables rentables
Agrarias 15 25 20 20
Mineras 20 40 25 35

a) Con un nivel de confianza del 95%, estime la proporción de acciones agrarias rentables según
la agencia A.
b) Estime la proporción de acciones mineras no rentables. Use un nivel de confianza del 99%.
c) Apoye al inversionista en determinar el tamaño de muestra que deberá considerar en el
análisis, si se desea estimar con un 95% de confianza la proporción de acciones con
rentabilidad negativa y un margen de error del 4.5%. Considere que en una muestra piloto de
25 acciones, se encontraron 17 con rentabilidad positiva.

11. En la actualidad, la aseguradora del fondo de pensiones “AFP_NEPTUNO” cuenta con 145000
afiliados que hacen sus aportaciones con regularidad. En una muestra aleatoria de 1200 afiliados
que hicieron sus aportaciones en el último trimestre, se obtuvo un promedio $850 y una desviación
estándar de $225. Se conoce también que 650 de los 1200 afiliados seleccionados hicieron
aportaciones superiores a $1250.

4
a) Estime con 95% de confianza el monto total de aportaciones de los afiliados a esta AFP en el
último trimestre.
b) Con 98% de confianza estime el número de afiliados con aportaciones superiores a $1250 en
dicho trimestre.

12. En un instituto de Enseñanza Superior tiene 800 estudiantes matriculados. Se tomó una muestra
aleatoria de estudiantes la cual representa el 15% del total, y se llevó a cabo una pequeña
encuesta con las siguientes preguntas:

Pregunta 1: ¿Utiliza la cafetería del instituto? Sí_____ No____


Pregunta 2: Si la repuesta anterior es afirmativa, diga aproximadamente cuánto dinero gasta
al día en esta cafetería _________

Lo resultados: fueron:
1. Contestaron negativamente a la pregunta 1 un total de 24 alumnos.
2. De los que contestaron afirmativamente la pregunta 1, se obtuvo que el gasto promedio diario
es 12.2 soles con una desviación estándar de 3.48 soles.

Considere estas características y resultados mostrados para responder las siguientes preguntas:
a) Defina la población de interés en este caso, indique las variables y el tipo de variable
involucradas en esta situación.
b) Estime la proporción de alumnos que utilizan la cafetería con un 90% de confianza.
c) Determine, con un nivel de confianza del 97%, el máximo error de estimación cometido con la
estimación realizada en la parte b).
d) Estime con un 97% de confianza, el monto promedio diario que gasta un estudiante que utiliza
la cafetería del instituto, suponiendo que el gasto diario que realizan los alumnos que hacen
uso de la cafetería del instituto se distribuye normalmente. Para el cálculo no considere el factor
de corrección por poblaciones finitas.

CÁLCULO DEL TAMAÑO DE MUESTRA (n)

3. El gerente de producción desea estimar el tiempo promedio que demora cierto proceso, como el
tiempo se mide en minutos, este gerente desea tener un error máximo de estimación, del tiempo
promedio real, de a lo más 4 minutos, se sabe, por experiencias anteriores, que la desviación
estándar de los tiempos de procesamiento es de 10 minutos, ¿qué tamaño de muestra debe de
considerar para el estudio, si desea un nivel de confianza del 95% para sus resultados?

4. Un banquero desea estimar el porcentaje de gente que responde favorablemente a una nueva
campaña de publicidad televisiva. Este banquero desea realizar dicha estimación con un error
máximo de 2.5% y un nivel de confianza del 90%. Determine el tamaño de muestra necesario para
realizar dicha estimación. Una muestra piloto determinó que p=65%.

5. Para adquirir un lote que contiene artículos, un comerciante desea estimar el porcentaje de
artículos defectuosos que contiene este lote, para lo cual se fija un error de estimación de a lo más
3% y un nivel de confianza del 93%. ¿Qué tamaño de muestra deberá tomar?, este comerciante
sabe, por experiencias anteriores, que aproximadamente este tipo de lotes tienen 7.5% de
artículos defectuosos.

6. En una muestra piloto, un ingeniero electrónico seleccionó al azar 150 componentes y encontró
que 6 fallaron antes de cumplir su vida útil. ¿Qué tamaño de muestra se debe tomar con una
confianza del 95% y con un error de estimación no mayor a 0.005?

5
INTERVALO DE CONFIANZA PARA LA DESVIACIÓN ESTÁNDAR POBLACIONAL (σ)

7. Un empresario afirma que el riesgo de una cartera de inversión es significativamente pequeño (es
decir que, la desviación estándar de la utilidad es menor a $500). Para verificar esto un
investigador decide tomar una muestra aleatoria de tamaño n = 16 y encontró una varianza de 102
400 dólares2.
a) Defina adecuadamente el parámetro a estimar en este caso.
b) Utilizando un 95% de confianza, ¿se puede considerar que realmente el riesgo es bajo?
Justifique su respuesta.

8. Actualmente el costo promedio, por unidad producida, de un artículo es de 120 soles con una
desviación estándar de 10 soles. Se realizan ciertas medidas de reajuste en el proceso de
producción de este artículo con la finalidad de disminuir los costos de producción. Luego de estas
medidas se toma una muestra aleatoria de seis artículos y se registró los siguientes costos:
115.6 118.5 123.6 119.5 115.2 116.3

Con esta información, utilizando un nivel de confianza del 90%, ¿Es posible confirmar que se logró
el objetivo?

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS POBLACIONALES


(µ1 - µ2)

9. Se llevó a cabo las pruebas de la resistencia a la tensión sobre dos diferentes clases de barras de
aluminio utilizados en la fabricación de alas de aeroplanos comerciales. Por experiencia pasada
con el proceso de fabricación de las barras y del procedimiento de prueba, las desviaciones
estándar de las resistencias a la tensión de las barras de aluminio son 1 y 1.5 respectivamente.
Los datos resultantes de la prueba realizada se presentan en la siguiente tabla:

Tamaño de la Resistencia promedio


Clase de barra
muestra (kg/mm2)
1 10 87.6
2 12 74.5

Construya un intervalo de confianza del 90% para la diferencia de medias.

10. Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio (en gramos)
en cemento estándar y en cemento contaminado con plomo. Los niveles bajos de calcio indican
que el mecanismo de hidratación del cemento queda bloqueado y esto permite que el agua ataque
varias partes de una estructura de cemento. Al tomar diez muestras de cemento estándar, se
registró que el peso promedio de calcio es de 90 gramos y una desviación estándar de 5 gramos;
los resultados obtenidos de 15 muestras de cemento contaminado con plomo fueron de 87 gramos
en promedio y una desviación estándar de 4 gramos. Si se sabe, que el peso de calcio está
distribuido normalmente, estime mediante un intervalo de confianza del 95% la diferencia entre
medias de los dos tipos de cementos. Además, se conoce que la varianza del peso de calcio en
cemento estándar y en cemento contaminado con plomo son: 27.5 gramos2 y 15.875 gramos2
respectivamente.

11. Se ha realizado un estudio para comparar el contenido de nicotina (en gramos) de dos marcas de
cigarrillo (A y B) en base a muestras de tamaño diez y ocho cigarrillos respectivamente. Se sabe

6
que estas dos marcas de cigarrillos tienen la misma varianza del contenido de nicotina de 0.36
gramos2. Los resultados del estudio se presentan a continuación:

Marca Promedio Desviación Estándar


A 3.1 0.5
B 2.1 0.7

a) Indique claramente los supuestos necesarios bajo los cuales se puede desarrollar este
problema.
b) Bajo los supuestos que se indicó en la parte a), construya un intervalo de confianza del 95%
para estimar la diferencia en el contenido promedio de nicotina de las dos marcas de
cigarrillos, Analice los resultados y comente.

12. El jefe de personal de una empresa de confecciones quiere comparar las medias de los tiempos
en minutos que operarios varones y mujeres utilizan para confeccionar una camisa. Por estudios
realizados anteriormente se sabe que las desviaciones estándar en cada uno de los grupos son
de 2.5 y 1.2 minutos respectivamente. Para realizar el estudio, el jefe de personal selecciona dos
muestras aleatorias de tamaño 16 en cada uno de los grupos dando como resultado una media
muestral de 38 y 32 minutos respectivamente.

a) Determine un intervalo de confianza del 97% para la diferencia de medias entre los operarios
varones y mujeres.
b) Puede el Jefe de personal de la empresa indicar que las operarias mujeres demoran más en
confeccionar una camisa que los operarios varones. Justifique la respuesta.
c) Mencione los supuestos básicos para estimar un intervalo de confianza.

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES


POBLACIONALES (𝝅1 – 𝝅2)

13. Con respecto al problema 11, se tiene que en un mismo período y basado en una muestra de 1500
afiliados, la competencia más cercana, AFP “VENUS” indica que el promedio de aportaciones es
$1020 con desviación estándar $190, además 780 afiliados tuvieron aportaciones superiores a los
$1250.

a) Con esta información adicional, estime con un 98% de confianza la diferencia entre las
aportaciones promedios que realizan los afiliados de las dos aseguradoras. Interprete sus
resultados.
b) Con esta información adicional, estime con un 98% de confianza la diferencia entre las
proporciones de aportaciones superiores a $1250 que realizan los afiliados de las dos
aseguradoras. Interprete sus resultados.

14. Se realizó un estudio, con la finalidad de explorar la aceptación de la gaseosa light, según el nivel
socioeconómico (NSE A y NSE B) y el grupo de edad del público consumidor (jóvenes y adultos).
Para realizar el estudio se consideró muestras aleatorias de personas mayores de 18 años del
nivel socioeconómico A y otra del nivel socioeconómico B y se consultó acerca de su preferencia
por la gaseosa light o tradicional, y los resultados obtenidos se muestran en la siguiente tabla:

Gaseosa Tradicional Gaseosa Light

7
Nivel
Jóvenes Adultos Jóvenes Adultos
Socioeconómico
NSE A 170 210 260 176
NSE B 203 250 188 120

a) Estime con una confianza del 96% la diferencia de proporción de personas entre los estratos
A y B que prefieren la gaseosa tradicional. Interprete el resultado.
b) Estime con una confianza del 98% la diferencia de proporción de jóvenes que prefieren la
gaseosa light entre los niveles socioeconómicos A y B. Interprete el resultado.

15. El jefe del área de marketing de una cadena televisiva realizó un estudio para averiguar si existe
alguna diferencia entre el contenido humorístico de los programas peruanos y norteamericanos.
En una muestra aleatoria independiente de 115 programas televisivos peruanos, 32 fueron
humorísticos. En otra muestra aleatoria de 135 programas televisivos norteamericanos, 29 fueron
humorísticas.

a) Con un 95% de confianza, se puede afirmar que la proporción de contenido humorístico de


los programas televisivos peruanos supera a los programas televisivos norteamericanos.
b) Mencione el tipo de variable que está asociada al intervalo de confianza para la diferencia de
proporciones.

16. El gerente de una empresa financiera afirma que la proporción de clientes morosos con préstamos
de a lo más 5000 soles de la sucursal A es mayor a la proporción de clientes morosos con la
misma categoría de la sucursal B. Para esto, selecciona una muestra aleatoria de 200 clientes de
la sucursal A, y 58 de ellos aún no pagan el préstamo con dicho monto; y de 190 clientes de la
sucursal B, y 50 de ellos no pagan el préstamo con dicho monto.

a) Con un nivel de confianza del 96%, estime la diferencia de proporciones de clientes morosos
con préstamos de a lo más 5000 soles de ambas sucursales.
b) Con un nivel de confianza del 96%, ¿se puede concluir que la afirmación del gerente es
correcta?

SEMANA 02
PRUEBA DE HIPÓTESIS PARA ESTIMAR LA MEDIA POBLACIONAL (µ)

17. En cada uno de los siguientes casos se le pide plantear las hipótesis nula y alternativa
correspondientes:
a) El jefe de control de calidad de cierto producto desea determinar si el proceso de envasado
está bajo control, es decir: si el peso promedio envasado es de 450 gramos.
b) Las ventas semanales, en promedio, de cierto producto son de 4500 soles, se realiza una
campaña por TV y por radio. El Jefe de ventas desea probar si la campaña realizada fue
efectiva.
c) Una máquina, actualmente utilizada por una empresa en la fabricación de un determinado
artículo, produce un 3% de artículos defectuosos. Al jefe de producción se le ofrece un nuevo
modelo de máquina argumentado que esta produce menos porcentaje de artículos
defectuosos. El jefe de producción desea probar si tal afirmación es válida.

18. Sean los siguientes enunciados:


a) Suponga que se plantean las siguientes hipótesis:
H0: El proceso de producción está bajo control.
H1: El proceso de producción no está bajo control y se debe detener para reajustar.

8
Defina en términos de estas hipótesis el error tipo I y el error tipo II.

b) En la situación que se da a continuación, diga usted cual debe ser la hipótesis nula (H0) de
manera que el error tipo I sea el más grave: “El trabajo del operador de un radar es detectar
aeronaves enemigas, en un determinado momento el tablero indica que algo invadió el espacio
aéreo” el operador tiene las dos siguientes hipótesis:
1. Está comenzando un ataque
2. No hay ataque solo es una interferencia.

19. El gerente de control de calidad desea determinar si la máquina con la que embolsan un cereal
está bajo control, es decir si se está embolsando con un promedio de 500 gramos. Para determinar
esto, el gerente selecciona una muestra aleatoria de 36 bolsas y encuentra un promedio de 496.5
gramos.

a) Plantee las hipótesis adecuadas. Indique, si es necesario, los supuestos bajo los cuales se
puede resolver este problema.
b) Describa en que consiste los errores tipo I y error tipo II.
c) Indique la estadística apropiada de esta prueba.
d) A que conclusión llegará el jefe de control de calidad, si sabe que el proceso tiene una varianza
de 81 gramos2 y utiliza una 5% de significancia.
e) Calcule la probabilidad de aceptar la hipótesis nula cuando la verdadera media es de: 498
gramos y 502 gramos.

20. En una oficina de defensa del consumidor se han recibido quejas de los consumidores con
respecto a que una determinada marca de aceite vende botellas que indican 850 c.c. pero que en
realidad es menor a esa cantidad. Un funcionario de esta oficina con la finalidad de determinar si
los clientes tienen fundamento en sus quejas decide tomar una muestra aleatoria de 49 botellas
de aceite y encontró que el promedio de esta muestra fue 848.3 c.c. y una desviación estándar de
10 c.c. Usando un nivel de significancia del 5%, ¿a qué conclusión llegará el funcionario de la
oficina de defensa del consumidor?

21. Se sabe que en una compañía de taxis el gasto diario promedio en combustible por unidad es
igual a 187.6 galones y la desviación estándar es igual a 32.5 galones. El gerente de operaciones
decide incluir un aditivo especial al combustible que le permitirá un ahorro en ese rubro. Después
de incluir el aditivo toma una muestra de seis unidades y encontró los siguientes gastos en
combustible expresado en galones por día:

180.3 179.6 185.7 170.5 158.3 180.6

Además;

9
a) Con un nivel de significancia de 5%, ¿se puede afirmar que los datos de la variable siguen
una distribución normal?
b) Al 5% de significancia, ¿existe evidencia estadística para afirmar que después de incluir el
aditivo, el gasto diario promedio en combustible por unidad se reducirá?

22. La cantidad promedio que se coloca en un recipiente en un proceso de llenado se supone que es
20 onzas. En forma periódica se escogen al azar 25 recipientes y el contenido de cada uno de
ellos se pesa. Se juzga el proceso fuera de control cuando 𝑥̅ < 19.8 𝑜 𝑥̅ > 20.2 onzas. Se supone
que la cantidad que se coloca en cada recipiente es una variable aleatoria que sigue una
distribución normal y una desviación estándar de 0.5 onzas.

a) Formule H0 y H1 e indique en qué consisten los errores de tipo I y II.


b) Calcule la probabilidad de cometer error tipo I.
c) Para  = 0.05, calcular  cuando  = 20.1.

23. Considerando el reporte Minitab que se presenta líneas abajo, responda cada una de las
siguientes preguntas justificando brevemente su respuesta.

T de una muestra
Prueba de mu = 16 vs. > 16
Media del error 95% Límite
N Media Desv.Est. Estándar inferior T P
10 17.209 0.937 0.296 16.666 4.08 0.001

a) Plantee la hipótesis nula y alternativa.


b) Utilice el valor del estadístico de prueba y con un nivel de significancia del 5% ¿Cuál es la
decisión?

24. El gerente de producción de la compañía de cerveza Inca revisa su línea de producción. El llenado
automático debe dar un contenido medio de 320 cm3. Para el control del llenado promedio se tomó
una muestra aleatoria de 36 unidades del producto y se encontró un contenido medio de 317 cm3
con una desviación estándar de 12cm3.

a) ¿Hay suficiente razón para creer que existe una baja en el promedio de los contenidos?
Realice la prueba al nivel de significación del 5%.
b) Calcule la probabilidad de cometer el error tipo II cuando la verdadera media es de 312cm3.
c) Calcule la potencia de la prueba.
25. Las cajas de avena llenadas por un proceso automático deben tener un contenido de 160 gramos
en promedio, si no es así, debe detenerse la producción para regular la máquina. El peso en
gramos de cajas seleccionadas aleatoriamente de la producción da los siguientes resultados:

10 10

 Xi  1580 ;
i 1
X
i 1
2
i  249658

a) Con un nivel de significancia del 1%, ¿es razonable detener la producción?


b) Con que probabilidad se debe rechazar la hipótesis nula si el verdadero valor promedio de la
media es de 158 gramos.

10
PRUEBA DE HIPÓTESIS PARA ESTIMAR LA PROPORCIÓN (π)

26. El área de Marketing de una compañía que fabrica laptops ABC encontró en una muestra de 200
personas que el 20% utiliza esta marca de laptop. Después de una intensa campaña publicitaria,
se tomó otra muestra de 300 personas la que indicó que el 27% favorece esta marca. Al 5% de
significación, ¿el gerente puede concluir, en base a los resultados de esta muestra, que la
campaña fue exitosa?

27. Una oficina relacionada con la cobranza de impuestos comprobó que el 5% de las declaraciones
juradas de impuestos eran inexactas. Después de un programa de educación aplicado a los
contribuyentes se comprobó que de 1124 declaraciones juradas, 45 eran inexactas. ¿Existe
suficiente evidencia para concluir que el programa de educación ha rendido buenos resultados?

28. Al señor Juan Pérez le han propuesto participar en una lista para el congreso, en representación
de su provincia. Para aceptar la propuesta este señor quiere estar seguro de que al menos el 25%
de los votantes en la provincia que reside están a favor de su candidatura. Para determinar esto,
se selecciona una muestra aleatoria de tamaño de 450 personas encontrando que 90 están a favor
de su candidatura. Con un  = 5%, ¿aceptará el señor Juan Pérez participar en la lista?

29. Una compañía telefónica está tratando de determinar si algunas líneas en una determinada
comunidad deben instalarse subterráneamente. Debido a que se hará un pequeño cargo adicional
en las cuentas telefónicas para pagar los costos extras de la instalación, la compañía ha
determinado hacer un estudio entre los clientes y proceder con la instalación subterránea solo si
el estudio indica que más del 60% de todos los clientes están a favor de la instalación.
a) Defina el parámetro y el error tipo I y error tipo II en términos del problema.
b) Si 118 de 160 clientes entrevistados están a favor de esta instalación a pesar del cargo
adicional, ¿qué debe hacer la compañía? Use un  = 0.01.
c) ¿Cuáles son las conclusiones al respecto?

30. “Fresquito”, es una nueva marca de gaseosas que entró al mercado y logró un nivel de aceptación
del 12% (es decir el 12% de consumidores de gaseosas prefieren esta marca). Con la finalidad de
tener una mayor participación del mercado la Gerencia de Producción de “Fresquito” decide
realizar una agresiva campaña de publicidad por televisión, radio y medios escritos.
a) Luego de la campaña de publicidad la gerencia desea, como es lógico, evaluar los resultados
de esta campaña de publicidad, para lo cual se toma una muestra de 450 personas y se fija
un nivel de significancia del 5%. Determine las hipótesis de interés para la gerencia y
establezca la regla de decisión correspondiente, definiendo con claridad el parámetro que se
está sometiendo a prueba.
b) Si luego de la campaña de publicidad, el porcentaje real de consumidores que prefieren la
marca “Fresquito” es del 14%, (pero lógicamente esto no lo sabe el Gerente de producción).
Determine, bajo estas condiciones, la probabilidad de que el Gerente de Producción, concluya
de que la campaña no fue efectiva, cuando utiliza la regla de decisión hallada anteriormente.

PRUEBA DE HIPÓTESIS PARA ESTIMAR LA DESVIACIÓN ESTÁNDAR POBLACIONAL


(σ)
31. El gerente de ventas de una empresa industrial tiene que decidir si compra o no una nueva
máquina para reemplazar la que tienen en uso actualmente en el departamento de producción. Se
sabe que la máquina que está en uso tiene una varianza, con respecto al tiempo que demora en
producir una pieza, de 0.067 minutos2. Al tomar un muestra aleatoria de 20 piezas producidas por
la máquina que se desea comprar se encontró una desviación estándar de 0.15 minutos. Si se
utiliza un 5% de significancia y la decisión estará basada en la menor variabilidad, ¿cuál será la
decisión del gerente de ventas?

11
32. Con cierto proceso de producción, el cual se utiliza en la actualidad, se tiene que la utilidad
promedio por unidad producida es de 115 soles y la desviación estándar de 10 soles. Se realizan
ciertas medidas de reajuste en el proceso de producción de este artículo, con dos objetivos
principalmente, uno es el de mejorar el rendimiento del proceso, en términos de utilidad, y el otro
es hacer que las utilidades sean más homogéneas. Luego de estas medidas se toma una muestra
aleatoria de seis objetos y se determinó las siguientes utilidades:

115.6 118.5 123.6 119.5 114.2 116.3

Además,

a) Con un 5% de significancia, ¿se puede concluir que se lograron los dos objetivos establecidos
para mejorar el proceso?
b) Con un 5% de significancia, verifique el supuesto de normalidad de los datos.

33. El jefe de ventas de una empresa decidirá que su equipo de vendedores debe ser recompuesto si
la varianza de las ventas en la última semana es mayor a 10.15 dólares al cuadrado. Si para esta
semana recolecta datos de una muestra aleatoria de 25 ventas del equipo y encuentra una
varianza de 18.03 dólares2.

a) ¿Indican los resultados que se debe recomponer el equipo de ventas? Considere =0.05
b) ¿Qué valor máximo debe tener la varianza muestral para no rechazar la hipótesis nula?
c) Si se fija  = 0.05, determine la probabilidad del error de tipo II cuando la desviación estándar
real es de 3.8 dólares.
d) Indique que supuestos fueron necesarios para resolver este problema de aplicación.

34. En un estudio acerca de las economías latinoamericanas, se plantea como hipótesis principal lo
siguiente: "Los países Latinoamericanos se han caracterizado por presentar economías
sumamente inestables productos de las diversas políticas económicas aplicadas por los distintos
gobiernos, este hecho se aprecia por las fuertes fluctuaciones presentadas en el crecimiento de
nivel de PBI de dichos países, lo cual contrasta con las economías europeas caracterizada por
una estabilidad en el nivel de su PBI". Por estudios anteriores se conoce que la desviación
estándar del crecimiento del PBI generado por los países europeos es de 2.5235 (en millones de
dólares) y que está normalmente distribuido. Si en una muestra aleatoria de 10 países
latinoamericanos se ha obtenido una varianza muestral de 10.758, ¿se puede afirmar que la
hipótesis planteada es correcta?

12
35. Se desea evaluar el desempeño del departamento de cobranzas de una sucursal ubicada en Ica,
de una determinada empresa crediticia. Según datos históricos recopilados por la gerencia que
lleva a cabo la investigación, el promedio mensual de las captaciones por cobros asciende a 15000
millones de soles, con una desviación estándar de 1540 millones de soles. Para efecto de la
evaluación de la sucursal en Ica se elige las captaciones logradas en año y medio de cobranzas,
obteniendo un promedio de 12000 y desviación estándar de 2500 millones de soles. Se le pide a
Ud., utilizando las herramientas estadísticas adecuadas que informe a la gerencia sobre el
desempeño de la sucursal en Ica, considerando el nivel promedio de captaciones y sobre la
estabilidad de los mismos, asimismo, señale los supuestos que fueron necesarios para llevar a
cabo la evaluación.

PRUEBA DE HIPÓTESIS PARA LA COMPARACIÓN DE VARIANZAS DE DOS GRUPOS


𝝈𝟐
INDEPENDIENTES ( 𝟏⁄ 𝟐 )
𝝈𝟐

36. El ingreso promedio (en soles) mensual, del personal de las compañías A y B se distribuyen
normalmente con medias iguales. Para determinar cuál de las dos compañías tienen ingresos más
homogéneos, se seleccionó muestras aleatorias de 10 y nueve empleados respectivamente de
ambas compañías, la cual dio como resultado las varianzas de 100 y 225 soles2 respectivamente.
¿Hay razón suficiente para decir que las varianzas son iguales en ambas compañías? Use α =
0.10.

37. El jefe de logística de la compañía P&C quiere decidir la adquisición entre dos marcas A y B de
máquinas para su planta de producción. Se le permitió probar ambas máquinas durante un período
de prueba para luego escoger 10 tiempos aleatoriamente para cada una de ellas, resultando los
tiempos siguientes:

Máquina A 40 79 47 42 48 38 44 49 50 37
Máquina B 40 41 39 40 38 42 43 37 38 41

Si se sabe que el tiempo de producción en cada una de las máquinas sigue una distribución
normal, ¿se podría concluir que las variabilidades de los tiempos de producción de A y B son
iguales? Considere el nivel de significación del 5%.
38. Al Señor Juan Pérez le han ofrecido invertir en dos carteras de acciones A y B, las que prometen
ser rentables, pero este señor solo tiene capital para invertir en una de las carteras y debe decidir
en cuál de ellas invertirá. Al investigar en busca de información encontró que la mayoría de
empresarios considera que invertir en la cartera A implica un menor riesgo, como el Sr. Juan Pérez
quiere tener mayor evidencia que le permita decidir, selecciona una muestra de ocho empresarios
que invirtieron en la cartera A y encontró un promedio de rentabilidad de $1560 y una desviación
estándar de $180 y en otra muestra independiente de 10 empresarios que invirtieron en la cartera
B encontró una rentabilidad promedio de $1515 y una desviación estándar de $263, en ambos
casos la rentabilidad tiene una distribución normal. En base a esta información, con un nivel de
significancia del 5% y considerando que una de las características notables del Sr. Juan Pérez es
su actitud adversa al riesgo, plantee y resuelva adecuadamente y luego indique cual será la
decisión del Sr. Juan Pérez.

BIBLIOGRAFÍA:
1.- Anderson, S. (2010) Estadística para Administración y Economía. Cengage Learning 8va.
Edición. México.
2.- Mendehall, W. (2008) Introducción a la Probabilidad y Estadística. Thomson 12° Edición.
México.
13
3.- Alvarado, J., Obagi, J. (2008) Fundamentos de la Inferencia Estadística. Ed. Pontificia
Universidad Javeriana 1ra. Edición. Colombia.

SEMANA 3
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS POBLACIONALES (µ1 - µ2)

39. Se piensa que en el espesor de una película de plástico (en mili pulgadas) que se coloca en un
material de sustrato influye la temperatura a la que se aplica el recubrimiento. Se lleva a cabo un
experimento totalmente aleatorizado. Once sustratos se recubren a 125 °F, dando como resultado
un espesor medio muestral del recubrimiento de 103.5°F y una desviación estándar de 10.2°F.
Otros 13 sustratos se recubren a 150°F para los que se observa una media de 99.7°F y una
desviación estándar de 20.1°F. Se creía al principio que con el incremento de la temperatura del
proceso se reducirá el espesor medio del recubrimiento.

a) Defina claramente el o los parámetros que están involucrados en esta prueba.


b) Realice la prueba de hipótesis correspondiente ¿Qué se puede concluir con respecto al
espesor promedio luego de realizada la prueba? Use un  = 0.05.

40. Se considerará válida la solución si se indican claramente las hipótesis y el criterio de decisión
utilizado. Como información adicional para el desarrollo de este problema se tiene la siguiente
corrida del programa MINITAB:

Prueba para la igualdad de varianzas

Prueba F (normal distribution)


Estadístico de prueba = 0.26, p-valor = 0.039

41. El gerente de marketing de una compañía desea determinar si un nuevo envase podría aumentar
las ventas de su producto. Para probar la factibilidad de la nueva forma de envase se seleccionó
una muestra de 18 tiendas similares y se asignaron, en forma aleatoria, 10 de ellas como mercado
de prueba de la nueva forma de envase, en tanto que las otras ocho continuarían recibiendo el
envase antiguo. Las ventas semanales durante el tiempo de estudio fueron las siguientes:

Medidas de resumen Envase nuevo Envase antiguo


Tamaño de muestra 10 tiendas 8 tiendas
Venta promedio 130 cajas 118 cajas
Desviación estándar de las ventas 10 cajas 12 cajas

Si se sabe que el nivel de ventas con el envase nuevo y con el envase antiguo se comporta según
una distribución normal y que las muestras tomadas son independientes. Con un nivel de
significancia del 5%, ¿se tiene evidencia de que la nueva forma de envase dio como resultado un
mayor nivel de ventas?

42. La tabla siguiente resume algunos datos de un experimento realizado para estudiar varias
características de tornillos de anclaje, puesto que la empresa “Ferrito” desea realizar la compra de
un lote de estos tornillos:

14
Diámetro de Tamaño de la Resistencia promedio Desviación
tornillo muestra (kilo/ libra) Estándar
3/8 15 4.25 1.30
1/2 14 7.14 1.68

a) Un aspecto importante es la homogeneidad en cuanto a la resistencia de estas dos marcas


de tornillos, se puede concluir, en base a la información mostrada: ¿Las resistencias de los
tornillos de ambos diámetros son homogéneas? Use un nivel de significancia  = 0.05
b) Realice una prueba, con un  = 0.05 para decidir si el verdadero promedio de resistencia para
tornillos de media pulgada excede a la resistencia promedio de los tornillos de 3/8 pulgadas.

43. Con la finalidad de comparar los costos promedios de producción de dos artículos A y B, cuyas
distribuciones son normales, se tomaron dos muestras aleatorias independientes y se procesaron
en el programa MINITAB, los resultados obtenidos se muestran a continuación:

Two-Sample T-Test and CI

Sample N Mean StDev SE Mean


1 10 4.58 1.46 0.46
2 8 5.05 1.32 0.47

Difference = μ (1) - μ (2)


Estimate for difference: -0.470
95% CI for difference: (-1.878, 0.938)
T-Test of difference = 0 (vs ≠): T-Value = -0.71 P-Value = 0.489 DF = 16

Con un 5% de significancia, ¿se puede concluir que los costos promedios de producción de ambos
artículos son iguales? Se asume que los costos de producción siguen una distribución normal y
las varianzas son homogéneas.

44. En la siguiente tabla se muestran los datos obtenidos al tomar una muestra de 23 establecimientos
y medir el nivel de ventas de dos productos A y B (en miles de soles por semana) de acuerdo al
tipo de establecimiento en el que se expenden (Botica o Bodega):

Tipo de
Producto A Producto B
establecimiento
Bodega 2.5; 3.0; 4.3; 5.1; 4.5; 3.8; 4,2 3.5; 4.3; 5.3; 7.1; 6.5
Farmacia 4.6; 5.3; 6.7; 8.1; 7.9 5.4; 6.5; 8.1; 6.9; 7.3; 8.6

a) ¿Se puede decir que el nivel de ventas promedio del producto B es mayor al nivel de ventas
del producto A? Utilice un nivel de significancia del 5%.
b) Considerando ambos productos, y con un 5% de significancia, ¿se puede afirmar que el nivel
de ventas promedio en bodegas es igual al nivel de ventas promedio en farmacia?
c) El gerente de producción afirma que el nivel de ventas promedio del producto B es de 7.5
miles de soles semanales por lo que recomienda tomar las medidas del caso con la finalidad
de incrementar el consumo de dicho producto. Con un 5% de significancia, ¿se puede aceptar
la recomendación del gerente de producción?
d) Si la desviación estándar en el nivel de ventas del producto B es de 4 mil soles o más se
tendrá que tomar las medidas necesarias para homogenizar estos niveles de venta. Tomando
en cuenta los resultados observados en la muestra y utilizando un 2.5% de significancia.
¿Considera que es necesario tomar dichas medidas?

15
45. La siguiente información representa los datos obtenidos en una muestra aleatoria de tiempos
utilizados en la fabricación de un determinado artículo. La empresa que los fabrica tiene dos líneas
de producción, en dos turnos diferentes (el tiempo está en minutos). Las muestras del cada uno
de los turnos y de cada una de las líneas de producción fueron extraídas aleatoriamente y en forma
independiente.

Turno Línea A Línea B


Mañana 2.5; 3.0; 4.3; 5.1; 4.5 3.5; 4.0; 5.3; 7.1; 6.5
Tarde 4.6; 5.3; 6.7; 8.0 5.0; 6.5; 8.1; 6.9

Plantee las hipótesis correspondientes, responda las siguientes interrogantes:


a) ¿Se puede decir que el promedio de tiempo en el turno de la mañana es diferente al tiempo
promedio en el turno de la tarde? Use un nivel de significancia del 10%.
b) El gerente de producción afirma que el tiempo promedio de producción en la Línea A es de
7.5 minutos y por lo tanto se deben realizar reajustes pues es necesario reducir ese tiempo.
Con un 5% de significancia, ¿el gerente tiene la razón?
c) Si la desviación estándar en el tiempo de producción del proceso B durante el turno de la
mañana es cuatro minutos o más se tendrá que detener el proceso y reajustar la línea. Con
un nivel de significancia de 1%, ¿será necesario el reajuste?

46. Se supone que la duración en horas de pilas eléctricas para calculadoras de escritorio tiene una
distribución normal. Un fabricante desea comparar la durabilidad de las pilas producidas por los
proveedores A y B. Para ello prueba una muestra aleatoria de 14 pilas de cada marca hasta el
agotamiento. Los datos obtenidos fueron procesados con el programa MINITAB, y algunos de los
resultados se muestran en el recuadro adjunto, en base a esta información y utilizando las pruebas
correspondientes responda las siguientes preguntas:

16
a) El gerente de la fábrica B afirma que las pilas que producen tienen un promedio de duración
mayor al de las pilas producidas por la fábrica A. En base a la información muestral
presentada, ¿se puede confirmar la afirmación del gerente? Utilice α = 5%.
b) El gerente de producción de la fábrica B indica que la desviación estándar de la duración de
las pilas que fabrican supera las 35 horas y por lo tanto se debe detener el proceso para
realizar los reajustes necesarios. Si se utiliza un 5% de significancia, ¿se puede concluir que
el gerente de producción tiene razón, y que por lo tanto se debe de detener el proceso?
c) Con respecto a las hipótesis planteadas en la parte b), ¿cuál es la probabilidad de que se
decida no detener el proceso, cuando en realidad la desviación estándar es de 38.5 horas?

47. En un estudio realizado con la finalidad de explorar la aceptación de una nueva gaseosa light,
según el nivel socioeconómico (NSE) y el grupo de edad del público consumidor. Se seleccionó
una muestra aleatoria de personas mayores de 18 años y se consultó acerca del gasto mensual
aproximado en el consumo de gaseosa, en soles, de gaseosa tradicional y light. Los resultados
obtenidos se muestran en la siguiente tabla:

Cerveza Tradicional
NSE
Jóvenes Adultos
NSE A 50, 64, 56, 52, 58,65 60, 48, 40, 44, 50
NSE B 40, 48, 32, 40, 43, 40 40, 44, 28, 25

Cerveza Light
NSE
Jóvenes Adultos
NSE A 80, 56, 65, 58, 60 76, 56, 48, 74, 30
NSE B 40, 45, 42, 35 40, 52, 65

En base a esta información responda lo siguiente:

a) Se impulsará una agresiva campaña de publicidad orientada a inducir el consumo de gaseosa,


y esta campaña estará orientada al nivel socioeconómico (NSE) que muestre un promedio de
consumo menor. Utilizando un 5% de significancia ¿A qué nivel socioeconómico se debería
orientar dicha campaña publicitaria?
b) El gerente de ventas afirma que la nueva gaseosa light ha logrado un buen nivel de aceptación
en el mercado, tanto así que el gasto promedio en este tipo de gaseosa es igual al gasto
promedio en el consumo de la gaseosa tradicional. Utilizando un nivel de significancia del 5%
¿Qué puede decir con respecto a la afirmación hecha por el gerente de ventas?
c) En general se puede afirmar que ambos grupos de edad tienen el mismo gasto promedio en
el consumo de gaseosa utilice un 5% de significancia.
d) Lo afirmado en la parte c) también se cumple cuando se especifica el tipo de gaseosa, es
decir se cumple tanto en el consumo de la gaseosa tradicional como en el consumo de la
gaseosa light. Utilice un 5% de significancia.

PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS POBLACIONALES (µ1 - µ2)


CON DOS MUESTRAS RELACIONADAS (DATOS PAREADOS)

48. Los siguientes datos representan las calificaciones obtenidas en los exámenes de medio semestre
y de finales de semestre tomados de una muestra aleatoria de los exámenes de 11 estudiantes
del curso de Estadística II. Ambos exámenes tuvieron una duración de dos horas y el examen final
cubría el material visto después de la aplicación del examen de medio semestre. Se sabe que las
notas tienen una distribución normal.

N° 1 2 3 4 5 6 7 8 9 10 11

17
EP 80 82 47 75 80 69 83 73 55 70 81
EF 81 85 40 75 83 79 91 72 66 76 79

¿Existe evidencia de un aumento en el desempeño de los estudiantes en la segunda mitad del


semestre? Utilice un =0.05.

49. Un analista de sistemas está estudiando la posibilidad de usar un nuevo sistema de cómputo, y
decide que cambiará de sistema si tiene evidencia de que el nuevo sistema utiliza menos tiempo
en el procesamiento, para esto toma una muestra de siete trabajos y se los encarga a siete
trabajadores elegidos al azar, estos trabajadores realizan dicho trabajo utilizando el nuevo sistema
y utilizando al sistema antiguo, los tiempos utilizados (en minutos) en cada caso fueron los
siguientes:

Trabajo 1 2 3 4 5 6 7
Sistema antiguo 8 4 10 9 8 7 12
Sistema nuevo 6 3 7 8 5 8 9

Además, se supone que los tiempos tienen distribución normal y con un nivel de significancia del
5%. ¿Qué decidirá el analista de sistemas?

50. En una empresa de software se está investigando la eficiencia de dos lenguajes diferentes para
mejorar la rapidez de programación, actualmente utiliza el lenguaje de programación 1. A doce
programadores, familiarizados con ambos lenguajes, se les pide que programen un cierto
algoritmo en ambos lenguajes, y se anota el tiempo que tardan, produciendo los siguientes datos
en minutos:

Programador 1 2 3 4 5 6 7 8 9 10 11 12
Lenguaje 1 17 16 21 14 18 24 16 14 21 23 13 18
Lenguaje 2 18 14 19 11 23 21 10 13 19 24 15 20

Con base en estos datos, y suponiendo que el tiempo de programación en ambos casos tienen
una distribución normal, responda lo siguiente:

a) Defina en forma clara los parámetros involucrados en esta prueba.


b) Con un nivel de significancia del 2.5%, ¿cuál será la conclusión en la empresa?
c) Defina en los términos de este problema el Error Tipo I y el Error tipo II.

51. Se desea determinar si un curso de capacitación a los operarios de cierto tipo de maquinaria ha
permitido que estos logren aumentar el número de unidades producidas por hora. Para comprobar
esto se seleccionaron 12 trabajadores y se determinó el número de unidades producidas antes del
curso y luego del curso de capacitación, los resultados se muestra en la siguiente tabla:

Vendedor 1 2 3 4 5 6 7 8 9 10 11 12
Antes 18 23 27 20 10 5 30 25 34 40 15 14
Después 24 28 26 30 18 15 29 25 35 38 21 25

Si se considera que el número de unidades producidas se comporta según una distribución normal
y en base a estos datos, ¿se puede afirmar que el curso de capacitación fue efectivo, utilizar un
nivel de significancia del 5%?

18
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES
(𝝅1 - 𝝅2)

52. El jefe de ventas de una gran cadena de tiendas debe decidir entre dos cursos similares de
capacitación para sus vendedores. Para esto decide comprobar la eficacia de los cursos tomando
una muestra de 350 vendedores para el curso A y otra muestra de 400 vendedores para el curso
B. Al final de cada curso, el 82% de los vendedores mejoraron significativamente su desempeño
con el curso A, mientras que; con el curso B, el 74% de los vendedores mejoraron
significativamente su desempeño. Como el curso A es más costoso decidirá enviar a sus
vendedores a dicho curso siempre y cuando el porcentaje de vendedores que mejoran
significativamente su desempeño supere en más de 6% al porcentaje de vendedores que mejoran
significativamente su desempeño y que recibieron el curso B. Utilizando un  = 0.05, ¿cuál será la
decisión del jefe de ventas de esta cadena de tiendas?

53. Una fábrica produce dos tipos de productos en dos turnos diferentes y se desea observar el
número de productos defectuosos en ambos turnos. Para esto se toman dos muestras
independientes, una de cada turno de trabajo, y se determinó la cantidad de artículos defectuosos
y el tipo de producto producido, los resultados se muestran en la siguiente tabla:

Producto A Producto B
Turno
Defectuosos Buenos Defectuosos Buenos
Mañana 20 200 50 300
Tarde 5 150 25 200

Con un nivel de significancia de 0.05, ¿se puede afirmar que en el turno de la tarde se producen
artículos con un menor porcentaje de unidades defectuosas que en el turno de la mañana?
a) Defina los parámetros de interés en este caso.
b) Realice la prueba de hipótesis correspondiente y de sus conclusiones.

54. ¿se puede afirmar que en el turno de tarde, la proporción de productos defectuosos del producto
B es mayor que la proporción de productos defectuosos del turno de la mañana en más de 0.04?
a) Defina, en este caso, los parámetros involucrados.
b) Realice la prueba de hipótesis correspondiente e indique sus conclusiones al respecto.

55. En la actualidad, la aseguradora de fondo de pensiones AFP “NEPTUNO” cuenta con afiliados
que hacen sus aportaciones con regularidad. En una muestra tomada de los últimos aportes
realizados por 850 afiliados durante el último trimestre, se obtuvo el promedio de aportaciones
trimestrales $480 y una desviación estándar $225, además se encontró que 600 de los afiliados
seleccionados hicieron aportaciones superiores a los $1250.

a) Se puede afirmar, con un 5% de significancia, que el promedio de aportaciones de los afiliados


de la AFP Neptuno, es superior a los 465 dólares trimestrales.
b) En un mismo período y basado en una muestra de 1200 afiliados, la competencia más cercana,
AFP Venus indica que 778 afiliados hicieron aportaciones superiores a los $1250 trimestrales.
¿Esta información evidencia que en la AFP Neptuno, el porcentaje de afiliados con
aportaciones superiores a los $1250 supera los de la AFP Venus en más de 2.5%? Utilice un
nivel de significancia del 8%.

56. Cierta compañía comercializa sus productos mediante catálogos y ventas puerta por puerta. Esta
compañía ha decidido comprobar la eficacia de una campaña de TV, para lo cual selecciona dos

19
territorios semejantes. Uno recibió campaña por TV y en la otra no. El porcentaje de visitas con
éxito en el territorio con campaña fue de 18%, mientras que en el otro territorio (sin campaña) fue
14%. Se hicieron 900 visitas en cada territorio. Para justificar el costo de la campaña se requiere
más de 3% de aumento en la proporción de visitas con éxito. ¿Dan estos datos pruebas de que la
campaña por TV se justifica? Utilice un nivel de significancia del 5%.

57. Se entrevistó a 900 personas y se les preguntó acerca de su preferencia con respecto a tres tipos
de programas de televisión, los entrevistados se clasificaron de acuerdo al distrito donde residían
y de acuerdo al grupo de edad. Los resultados fueron los siguientes:

Tipo de Programa
Distrito Grupo de edad
Cómico Deportivo Musical
Adolescentes 40 50 20
Distrito A Jóvenes 45 30 60
Adultos 55 20 15
Adolescentes 35 60 15
Distrito B Jóvenes 30 40 40
Adultos 105 15 5
Adolescentes 25 40 15
Distrito C Jóvenes 25 30 20
Adultos 40 15 10

Se desea lanzar al aire un novedoso programa Cómico, y se realizará este lanzamiento si:

a) Se tiene evidencia de que en la población adulta, considerando los tres distritos en conjunto, el
porcentaje de personas que prefieren programas cómicos es mayor al porcentaje de personas
que prefieren un programa deportivo. Use un α = 0.025 ¿Cuál será la decisión al respecto?
b) Se tiene evidencia de que en la población adulta, considerando los tres distritos en conjunto, el
porcentaje de personas que prefieren programas cómicos es mayor al porcentaje de personas
que prefieren un programa musical. Use un α = 0.025 ¿Cuál será la decisión al respecto?

BIBLIOGRAFÍA:
1.- Anderson, S. (2010) Estadística para Administración y Economía. Cengage Learning 8va.
Edición. México.
2.- Mendehall, W. (2008) Introducción a la Probabilidad y Estadística. Thomson 12° Edición.
México.
3.- Alvarado, J., Obagi, J. (2008) Fundamentos de la Inferencia Estadística. Ed. Pontificia
Universidad Javeriana 1ra. Edición. Colombia.

SEMANA 4
PRUEBAS PARAMÉTRICAS. ANÁLISIS DE VARIANZA UNIDIRECCIONAL (ANOVA)

58. Con la finalidad de comparar los precios del producto “Escaso A1” se llevó a cabo un experimento
en tres zonas de Lima: Cono Sur, Cono Norte y Lima Centro. En cada una de dichas zonas se
tomaron muestras aleatorias de seis tiendas más grandes y se consultó acerca del precio de dicho
producto, los resultados se muestran en la siguiente tabla:
Precios del Producto escaso “A1”
ZONAS
Lima Centro Cono Norte Cono Sur
32 27 30
31 27 30
20
33 30 31
30 28 27
30 27 29
30 28 28

a) Al nivel de significación del 5%, ¿existe suficiente evidencia que indique una diferencia en el precio
promedio del producto escaso A1 en las tiendas de las tres zonas de Lima?
b) Si fuera necesario, realice las comparaciones múltiples de Tukey.

Comparaciones en parejas de Tukey


Agrupar información utilizando el método de Tukey y una confianza de
95%

Zona N Media Agrupación


Lima centro 6 31.000 A
Cono sur 6 29.167 A B
Cono norte 6 27.833 B

59. El jefe de producción de una fábrica desea determinar si las cuatro máquinas que tiene utilizan el
mismo tiempo promedio en la fabricación de un artículo. Para esto selecciona muestras aleatorias
de cada máquina de tamaños n1 = 6, n2 = 4, n3 = 4 y n4 = 6 respectivamente, midiendo el tiempo
que utilizan en la fabricación de un artículo. Debido a un descuido de su ayudante la información
obtenida se perdió parcialmente, encontrándose sola la siguiente tabla incompleta:
Fuente de Grados de Suma de Cuadrados
F
variación libertad cuadrados medios
Factor 152.62
Error
Total 542.92

Con esta información, plantee las hipótesis adecuadas y diga cuál será la conclusión del jefe de
producción, interpretando adecuadamente sus resultados. Use  = 0.05.

60. Existen cuatro estaciones de radio. Cada estación toca música rock durante cierto número de
minutos por hora y se desea determinar si el promedio que cada estación toca esta música, por
hora, es el mismo. Para esto se tomó muestras de 10 horas de cada estación y se encontró los
siguientes tiempos promedios en los cuales se toca música rock (en minutos).
𝑥̅1 = 51.43; 𝑥̅ 2 = 44.64; 𝑥̅3 = 47.2; 𝑥̅4 = 50.85

Además, se sabe que: SCT = 650.75 (suma de cuadrados del total). Aplique la técnica estadística
adecuada y haga un análisis al respecto.

61. Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con métodos
diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo grupo realiza
series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se ejercita en el
pedaleo de alta frecuencia. Después de un mes de entrenamiento se realiza un test de rendimiento
consistente en un recorrido cronometrado de nueve km. Los tiempos empleados fueron los
siguientes:

Método 1 15 16 14 15 17
Método 2 14 13 15 16 14
Método 3 13 12 11 14 11

21
Comparaciones en parejas de Tukey

Agrupar información utilizando el método de Tukey y una confianza de


99%

Método N Media Agrupación


Método 1 5 15.400 A
Método 2 5 14.400 A B
Método 3 5 12.200 B

A un nivel de significación del 1%, ¿se puede considerar que los tres métodos producen resultados
equivalentes? O por el contrario ¿existe algún método superior a los demás?

62. Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro
procedimientos diferentes (A, B, C Y D), asignados al azar a un grupo de sujetos. Posteriormente
se les realiza una prueba de recuerdo de dichas palabras, obteniéndose los siguientes resultados:
A 5 7 6 3 9 7 4
B 9 11 8 7 7 4 4
C 8 6 9 5 7 4 5
D 1 3 4 5 1 2 3

Comparaciones en parejas de Tukey

Agrupar información utilizando el método de Tukey y una confianza de


97.5%

Procedimiento N Media Agrupación


PROC B 7 7.143 A
PROC C 7 6.286 A
PROC A 7 5.857 A B
PROC D 7 2.714 B

a) ¿Qué conclusiones pueden sacarse acerca de las cuatro formas de presentación, con un nivel
de significación del 2.5%?
b) Realice un análisis más extenso con ayuda de la siguiente salida proporcionada por el
MINITAB.

63. Los siguientes resultados fueron analizados para los tiempos (en minutos) que tardan en procesar
una pieza de cada una de las cuatro máquinas. El fin del estudio es determinar si hay diferencia
en el tiempo promedio de procesamiento. Se seleccionaron de forma aleatoria e independiente
siete piezas de cada una de las máquinas; además, el gerente de producción tiene evidencia
suficiente para asumir que los tiempos siguen una distribución normal. Determine si se puede
considerar que los tiempos de procesamiento de utiliza cada máquina no son iguales, utilizando
un nivel de significancia del 5% y además si esto es cierto ¿qué máquina recomendaría utilizar?

ANOVA unidireccional: Máquina 1; Máquina 2; Máquina 3; Máquina4

Fuente GL SC MC F
Factor 3 12.107 4.036 10.59
Error 24 9.144 0.381
Total 27 21.251

22
Comparaciones en parejas de Tukey

Nivel N Media Agrupación


Máquina 1 7 4,1429 A
Máquina 2 7 2,4286 B
Máquina 3 7 3,5714 A C
Máquina 4 7 2,8571 B C

BIBLIOGRAFÍA:
1.- Anderson, S. (2010) Estadística para Administración y Economía. Cengage Learning 8va.
Edición. México.
2.- Mendehall, W. (2008) Introducción a la Probabilidad y Estadística. Thomson 12° Edición.
México.
3.- Alvarado, J., Obagi, J. (2008) Fundamentos de la Inferencia Estadística. Ed. Pontificia
Universidad Javeriana 1ra. Edición. Colombia.

SEMANA 5
PRUEBA DE INDEPENDENCIA: PRUEBA CHI – CUADRADO

64. Existe la controversia de que un estudiante universitario de las especialidades de letras, ingeniería
o ciencias básicas logra un mejor rendimiento académico en los últimos ciclos. Un especialista en
educación de una universidad realizó un estudio para verificar la controversia y seleccionó una
muestra aleatoria de estudiantes que cursan los últimos ciclos (del séptimo ciclo a más). Los
resultados se muestran en cuadro adjunto:

Fila: Tipo de especialidad Columna: Rendimiento académico

Bueno Malo Regular Total


Ciencias básicas ___ 95 100 320
Ingeniería 220 ___ 310 630
Letras 150 50 ___ 400
Total 495 245 610 1350

a) Al nivel de significancia del 2.5%, ¿se puede inferir que existe relación entre el tipo de
especialidad y el rendimiento académico en los últimos ciclos?
b) Con lo obtenido en la parte a), ¿se puede afirmar que la relación encontrada entre ambas
variables es fuerte?

65. Un editor de periódicos trata de determinar las características del mercado de su periódico. Se
pregunta si la costumbre de la gente de la comunidad de leer diarios está relacionada con el nivel
educativo de los lectores. Aplica una encuesta a los adultos del área referente a su nivel educativo
y la frecuencia con que leen el periódico. Los resultados se muestran en la siguiente tabla:

23
Fila: Frecuencia con que leen el periódico
Columna: Nivel educativo de los lectores

Frec. Profesional Superior Terminó No terminó


leer o posgrado no Univ. Secundaria Secundaria Total

1 ……………… 17 11 21 59
2 12 23 ……………… 5 48
3 35 38 16 ……………… 96
4 28 ……………… 6 13 66
Total 85 97 41 46 269

a) Plantee y resuelva las hipótesis correspondientes, indicando claramente cuál será la conclusión
a la que llega el editor de periódicos. Utilice un nivel de significación del 5%.
b) Calcule e interprete el grado de importancia de la relación encontrada.

66. El rector de una universidad quiere determinar si existe relación entre el área de interés de cada
estudiante y su preferencia por algún sistema de calificación (Aprobado-reprobado, Sistema
vigesimal: 0 – 20, Sistema porcentual: 0% - 100%). Para ello, realiza una encuesta seleccionando
a 500 estudiantes de las tres áreas de interés. Se preguntó a cada estudiante cuál de los tres
sistemas de calificación prefieren. Los resultados aparecen en la siguiente tabla:

Filas: Área de interés Columnas: Sistema de calificación

Aprobado_ Sistema Sistema


desaprobado porcentual vigesimal Total

Artes y ciencias 24 58 118 200


Bellas artes 26 19 55 100
Ingeniería 20 68 112 200
Total 70 145 285 500

a) ¿Qué prueba de hipótesis realizaría? ¿Por qué?


b) Con un niel de significancia de 0.10, ¿existe relación entre el área de interés de cada estudiante
y su preferencia por algún sistema de calificación?
c) Calcule e interprete el grado de importancia de la relación encontrada.

67. Una socióloga estuvo investigando esta cuestión: ¿existe alguna relación entre el nivel de
Instrucción alcanzado y el nivel de actividad social de una persona? Decidió manejar tres niveles
de Instrucción: primaria, secundaria y universitaria o más. Cada persona llevó un registro de sus
actividades sociales, como jugar boliche en grupo, asistir a bailes, eventos sociales, ceremonias
religiosas, etc. La socióloga los dividió en actividad social inferior al promedio, actividad social
promedio y actividad social superior al promedio. Los resultados de su muestra se dan en la
siguiente tabla:
Actividad Social
Nivel Educación Superior al promedio Promedio Inferior al promedio
Universitaria 20 10 10
Secundaria 30 50 80
Primaria 10 60 130

24
a) ¿Cuál será la conclusión de esta socióloga, en base a esta muestra aleatoria y un 5% de
significación?
b) Calcule e interprete el grado de importancia de la relación encontrada.

68. Se entrevistó a 900 personas y se les preguntó acerca de su preferencia con respecto a tres
programas de televisión, los entrevistados se clasificaron de acuerdo al distrito donde residían, de
acuerdo al grupo de edad y el tipo de programa de su preferencia. Los resultados se muestran en
la siguiente tabla:

Tipo de Programa
Distrito Grupo de edad
Cómico Deportivo Musical
Adolescentes 40 50 20
Distrito A Jóvenes 45 30 60
Adultos 55 20 15
Adolescentes 35 60 15
Distrito B Jóvenes 30 40 40
Adultos 105 15 5
Adolescentes 25 40 15
Distrito C Jóvenes 25 30 20
Adultos 40 15 10

a) Usando un 5% de significancia se puede decir que el grupo de edad no influye en el tipo de


programa que prefiere la persona.
b) Calcule e interprete el grado de importancia de la relación encontrada.

PRUEBA DE BONDAD DE AJUSTE

69. El área de Matemática, basándose en informaciones de semestres anteriores sabe que, el 43%
de los alumnos aprobaron todas las materias inscritas, un 30% aprobó la mitad, un 12% reprobó
todas las materias y un 15% se retiró. Al final de este semestre el coordinador selecciono a 400
alumnos y encontró que: 195 aprobaron todas las asignaturas, 136 aprobaron la mitad, 41
reprobaron todas las asignaturas y 28 se retiraron. ¿Podemos concluir, a raíz de los resultados,
que en el último semestre varió la estructura de los cursos aprobado y retirados con respecto a los
semestres anteriores? Use un α = 0.05.

70. Un egresado de la especialidad de Marketing es contratado por una empresa para evaluar la
distribución de ventas de gaseosa en la temporada de invierno. Según sus estimaciones,
considera los principales distritos a los cuales se distribuye la gaseosa tienen los siguientes
porcentajes de ventas:

Distrito A B C D E
Porcentaje 21 18 30 17 14

Usted, quiere verificar estadísticamente ésta afirmación y decide que una forma de verificar la
anterior hipótesis propuesta es seleccionando una muestra de las ventas realizadas en los últimos
tres meses (en miles de unidades) y obtiene lo siguiente:

Distrito A B C D E
Ventas realizadas 54 61 83 46 56

¿Qué conclusión obtiene según sus conocimientos de estadística? Use  = 0.025.

25
71. El gerente de una planta industrial pretende determinar si el número de empleados que asisten al
consultorio médico de la planta se encuentra distribuido, en forma equitativa, durante los cinco
días de trabajo de la semana. Con base en una muestra aleatoria de cuatro semanas completas
de trabajo, se observó el siguiente número de consultas:

Lunes Martes Miércoles Jueves Viernes


49 35 32 39 45

Con un nivel de significación del 5%, ¿existe alguna razón para creer que el número de empleados
que asisten al consultorio médico, no se encuentra distribuido en forma equitativa durante los días
de trabajo de la semana?

72. El gerente de un banco afirma que los motivos de préstamos personales para auto, casa y viaje
están en la relación 4:2:1. Para corroborar su afirmación selecciona aleatoriamente a 140 clientes
que se les otorga un crédito y los clasifica en la siguiente tabla:

Motivo del préstamo Auto Casa Viaje


Nº de clientes 90 35 15

Estos datos corroboran la afirmación del gerente del banco. Use un  = 0.1.

73. Una compañía de seguros desea establecer el pago de la prima a cobrar por asegurar un
determinado modelo de auto. La información que tienen y que fue obtenida en un estudio realizado
al año pasado indica que el 30% de clientes asegurados tienen un accidente, y que cuando este
ocurre el accidente puede considerarse leve el 60% de las veces, se puede considerar que el
accidente es de medianas proporciones el 30% de las veces y un accidente se considera grave el
10% de las veces. Para determinar si los resultados del estudio realizado el año pasado aún
permanecen vigentes se toma una muestra aleatoria de asegurados de la compañía y se encontró
los siguientes resultados:

Condición del No tiene Accidente Accidente de medianas Accidente


Asegurado Accidente Leve proporciones Grave
Número de veces 198 47 37 18

Determine si se puede tener en cuenta los resultados del estudio realizados el año pasado para
poder determinar el monto de la prima que debe cobrar. Justifique e intérprete adecuadamente sus
resultados. Utilice un nivel de significación el 2.5%.

74. Un distribuidor de revistas, que salen semanalmente, ha determinado que el número de unidades
excedentes por cada punto de venta a la semana (es decir el número de diarios que no logra
vender y por lo tanto debe de devolverlos) tiene un comportamiento aleatorio que puede ser
representado por la siguiente función de probabilidad; donde, x: representa el número de unidades
excedentes por cada punto de venta.

P(X  x)  k x 2 ; x  1,2,3,4,5

Para una nueva temporada que se iniciará en breve, y con la finalidad de planificar sus pedidos,
este comerciante desea determinar si el comportamiento aleatorio de las unidades excedentes
continúa siendo la misma, para lo cual toma una muestra aleatoria de 900 puntos de venta en la
ciudad de Lima y encontró los siguientes resultados:

26
Unidades Excedentes 1 2 3 4 5
Puntos de ventas 20 60 150 250 420

Con estos datos y usando un  = 0.05. ¿Se puede concluir que el comportamiento aleatorio en
cuanto a las unidades excedentes aún continúa siendo determinado por dicha distribución de
probabilidad?

75. Un comerciante vende minicomponentes, luego de una campaña de publicidad, el comerciante


cree que el número de minicomponentes que vende por día es una variable aleatoria que se
comporta según la siguiente función de probabilidad:

3X
PX  x   x  0, 1, 2, 3,.......
20.086x!

Para comprobar esto, toma una muestra aleatoria de 120 días y observa el número de
minicomponentes vendidos, los resultados se muestran en la siguiente tabla:

N° de minicomponentes vendidos 0 1 2 3 4 ≥5
N° de días 7 12 30 24 26 21

Con un nivel de significancia del 5% ¿A qué conclusiones llega este comerciante?

DISTRIBUCIÓN POISSON

76. Se afirma que el número de errores que comete una secretaria al transcribir un documento es una
variable aleatoria que tiene una distribución de Poisson con media de tres errores por trascripción.
Se revisó 440 transcripciones hechas por ella y se obtuvo los siguientes resultados: Realice la
prueba con un α = 0.01.

N° de errores 0 1 2 3 4 5 6 7 ≥8
Frecuencia 18 53 103 107 82 46 18 10 3

77. El responsable de servicio de mantenimiento de una empresa de transporte, quien lleva el control
desde los inicios de creación de la empresa, afirma que el número de vehículos que necesitan
reparación en un día, sigue una distribución de Poisson. Se hace estadísticas de 200 días sobre
el número de vehículos que necesitan reparación, los resultados fueron:

N° de días 54 70 50 21 4 1
N° de vehículos 0 1 2 3 4 5 o más

Realice la prueba necesaria para corroborar esta afirmación. Use un  = 0.1.

78. El jefe del área de Estadística e Informática de la municipalidad de Lima Metropolitana cree que el
número de accidentes automovilísticos diarios en el cruce de la Av. Javier Prado y La Molina

27
presenta una distribución de Poisson con un promedio de un accidente diario. Para ello, seleccionó
una muestra de 80 días y se obtuvo los resultados en el siguiente gráfico de líneas:

a) Indique que prueba de hipótesis utilizaría y los supuestos que se debe cumplir.
b) Con un 1% de significancia, ¿se puede concluir que la afirmación del jefe del área de Estadística
es correcta?

DISTRIBUCIÓN BINOMIAL

79. Un ingeniero de control de calidad del proceso de ensamblaje de llantas, desea verificar si el
número de llantas con defectos sigue una distribución binomial con una proporción de llantas
defectuosas del 5%. Para esto tomó 200 muestras de 10 neumáticos cada una y encontró lo
siguiente:

N° llantas defectuosas 0 1 ≥2 Total


Frecuencia 138 53 9 200

80. La solicitud de préstamo que presentan los clientes de un banco está compuesta por cuatro rubros.
El gerente de préstamos desea realizar un estudio sobre la distribución de la cantidad de rubros
que son rechazados por cada solicitud, para esto toma una muestra de 60 solicitudes,
obteniéndose los siguientes resultados:

N° de rubros rechazados 0 1 2 3 4
N° de solicitudes 20 15 7 10 8

¿Se puede afirmar que el número de rubros rechazados sigue una distribución binomial con
probabilidad igual a 0.4? Use un  = 0.01.

81. Un psicólogo clínico visita a ocho pacientes por día. El psicólogo cree que el número de pacientes
atendidos con depresión leve es una variable aleatoria con distribución binomial y se sabe que el
30% de los pacientes presentan este problema. Para ello, registra el número de pacientes
atendidos con depresión leve por un periodo de 100 días. Los resultados se muestran en el
siguiente gráfico de líneas:

28
Además, la atención de los pacientes se realiza de manera independiente.

a) Indique y clasifique la variable de estudio.


b) Con un 1% de significancia, ¿se puede concluir que la afirmación del psicólogo es correcta?

DISTRIBUCIÓN NORMAL

82. Un atleta efectúa 150 lanzamientos de disco durante una semana de práctica. En la siguiente
Tabla se muestran las distancias logradas en sus lanzamientos (en pies).

Distancia: X Número de Lanzamientos


x  61 18
61 < x  63 30
63 < x  65 60
65 < x < 67 37
x  67 5
Si se utiliza un nivel de significación del  = 0.01, ¿se puede tener evidencia suficiente como para
afirmar que las distancias a las cuales lanza el disco, se comportan como una distribución normal
con promedio  = 63 pies y desviación estándar  = 2 pies?

83. El gerente de un banco efectúa 150 solicitudes de crédito hipotecario durante una semana. En la
siguiente tabla se muestran los montos de los créditos hipotecarios solicitados (en miles de
dólares).

Monto de los créditos


Número de solicitudes
hipotecarios
x  75 18
75 < x  80 30
80 < x  85 60
85 < x < 90 37
x  90 5

29
Si se utiliza un nivel de significación del  = 0.05, ¿se puede tener evidencia suficiente como para
afirmar que los montos de los créditos hipotecarios, se comportan como una distribución normal con
promedio  = 85 miles de dólares y desviación estándar  = 5 miles de dólares?

84. En la siguiente tabla se presenta la distribución de los datos sobre demanda de teléfonos celulares
(en millones de unidades) en una compañía telefónica durante 50 meses.

Demanda de
[5 – 9> [9 – 13> [13 – 17> [17 – 21> ≥21
celulares
Número de
6 12 18 9 5
meses

Al nivel de 5% de significancia, ¿se puede considerar que la demanda de teléfonos celulares


vendidos se ajustan a una distribución normal, si se sabe que la demanda promedio y la desviación
estándar es 15.5 y 5.2 millones de unidades respectivamente?

BIBLIOGRAFÍA:
1.- Anderson, S. (2010) Estadística para Administración y Economía. Cengage Learning 8va.
Edición. México.
2.- Mendehall, W. (2008) Introducción a la Probabilidad y Estadística. Thomson 12° Edición.
México.
3.- Alvarado, J., Obagi, J. (2008) Fundamentos de la Inferencia Estadística. Ed. Pontificia
Universidad Javeriana 1ra. Edición. Colombia.

SEMANA 6
CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE

85. El administrador del área de préstamo de una entidad bancaria quiere determinar la relación entre
los ingresos mensuales en miles de soles; y ahorros mensuales en miles de soles, de sus clientes.
Para esto, seleccionó una muestra aleatoria de seis clientes y se obtuvo los siguientes resultados:

Ingreso mensual 1.0 1.2 1.5 0.8 1.8 2.0


Ahorro mensual 0.20 0.22 0.25 0.18 0.30 0.35

Si se sabe que los errores siguen una distribución normal y son independientes entre sí,
se pide:

a) Calcule e interprete la covarianza entre las variables de estudio.


b) Determine el grado de la relación lineal entre las variables de estudio.
c) Determine la línea de regresión que permita estimar el ahorro mensual en función del ingreso
mensual. Interprete el coeficiente de regresión estimado.
d) Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo de regresión lineal es
significativo?
e) ¿Qué porcentaje de la variabilidad del ahorro mensual no está explicado por el ingreso
mensual?
f) Utilice el modelo de regresión lineal desarrollado para estimar el ahorro mensual si el cliente
tiene un ingreso mensual igual a 1750 soles.
g) Con un 95% de confianza, estime el ahorro medio mensual si el cliente tiene un ingreso
mensual igual a 1750 soles.

30
86. A continuación, se muestran los gastos en publicidad (en ciento de dólares) y sus ventas (en miles
de artículos) que realiza una empresa. Los resultados registrados se seleccionaron aleatoriamente
en una muestra de diez semanas.

Regression Analysis: Ventas versus Gasto en publicidad

Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value
Regression 1 185.66 185.658 30.98 0.001
Error 8 47.94 5.993
Total 9 233.60

Model Summary
S R-sq R-sq(adj) R-sq(pred)
2.44802 79.48% 76.91% 71.95%

Coefficients
Term Coef SE Coef T-Value P-Value VIF
Constant 0.78 2.03 0.39 0.709
Gasto en publicidad 0.914 0.164 5.57 0.001 1.00

Durbin-Watson Statistic = 2.36249

N = 10
AD = 0.364
P_value 0.158

a) Calcule e interprete la covarianza entre las variables de estudio.


b) Determine el grado de la relación lineal entre las variables de estudio.
c) Verifique los supuestos para realizar una regresión lineal simple.
d) Determine la línea de regresión que permita estimar las ventas en función del gasto en
publicidad. Interprete el coeficiente de regresión estimado.
e) Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo de regresión lineal es
significativo?
f) ¿Qué porcentaje de la variabilidad del gasto de publicidad está explicado por las ventas?
g) Estime el nivel de ventas que se espera obtener si se realiza un gasto de 17 mil dólares en
publicidad.

87. En ocasiones es conveniente comprar la mayor cantidad posible de ciertos artículos. Por lo general
el precio unitario (en dólares) es menor al adquirir grandes cantidades. Para contrastar esta teoría
se obtuvieron los siguientes datos:

Número de unidades 1 3 5 10 12 15 24
Costo unitario 55 52 48 36 32 30 25

31
Además;
7 7 7 7 7

 xi  70;  xi2  1080;  yi  278;  y i2  11878;  xi yi  2245


x 1 x 1 y 1 y 1 x 1

Se sabe que no existe autocorrelación entre los errores y siguen una distribución normal. Se pide;
a) Calcule e interprete la covarianza entre las variables de estudio.
b) Determine el grado de la relación lineal entre las variables de estudio.
c) Determine la ecuación de regresión lineal simple. Interprete el coeficiente de regresión
estimado.
d) ¿Qué % de la variabilidad en el costo no es explicada por la recta de regresión?
e) ¿Es la pendiente de la recta diferente de cero significativamente? Use un α = 0.05.
f) Estime, mediante un intervalo de confianza del 95%, el costo promedio unitario cuando se
compran 40 unidades.

88. El gerente de ventas permite que los agentes vendedores que tiene a su cargo reciban
capacitaciones motivacionales que se dan en diferentes horarios y se tiene absoluta libertad para
elegir el horario que crean conveniente. El gerente cree que las capacitaciones motivacionales
influyen en la eficiencia de las ventas. Para verificar esto, se toma una muestra de 10 vendedores
y registró el tiempo acumulado de horas en las que estuvo presente en una o más capacitaciones
durante el último trimestre y la eficiencia de sus ventas (en porcentaje), los datos encontrados
fueron:

Tiempo acumulado en
27 45 41 19 35 39 19 49 15 31
capacitaciones
Eficiencia en las ventas 47 84 80 46 62 72 52 87 37 68

Además;

Estadístico de Durbin-Watson = 1.74557

10 10 10 10 10

x
x 1
i  320;  x i2  11490;  yi  635;  y i2  43075;  xi yi  22095
x 1 y 1 y 1 x 1

a) Calcule e interprete la covarianza entre las variables de estudio.


b) Determine el grado de la relación lineal entre las variables de estudio.
c) Con un nivel de significancia de 0.01, ¿se puede afirmar que no existe autocorrelación entre
los errores?
d) Determine el modelo de regresión lineal. Interprete adecuadamente el coeficiente de regresión.
e) ¿Se puede afirmar que el modelo de regresión es significativo?
f) ¿Existe evidencia estadística para afirmar que la variable tiempo acumulado en capacitaciones
es significativa?
g) El gerente afirma que teniendo 60 horas acumuladas de capacitación motivacional, la eficiencia
promedio de los trabajadores en las ventas es por lo menos 90%. Con un 99% de confianza,
¿se puede concluir que la afirmación es correcta?
h) Calcule e interprete el coeficiente de determinación.

32
REPASO EN MINITAB

89. A continuación se muestran los gastos en publicidad (en miles de dólares) y sus ventas (en miles
de artículos) que realiza una empresa. Los resultados registrados se seleccionaron aleatoriamente
en una muestra de diez semanas.

Gasto en publicidad 9 7 5 14 15 12 6 10 15 21
Ventas 10 6 5 12 10 15 5 12 17 20

a) Determine con la prueba de Durbin Watson si los residuales presentan autocorrelación. Use un
nivel de significancia de 0.05.
b) Determine la línea de regresión que permita estimar el nivel de ventas en base al gasto en
propaganda. Interprete el coeficiente de regresión estimado.
c) Con un nivel de significancia de 0.05, ¿existe evidencia estadística para afirmar que el modelo
de regresión lineal es significativo?
d) Estime el nivel de ventas que se espera obtener si se realiza un gasto de 17 mil dólares en
publicidad.
e) Construya un intervalo de confianza del 95% para el nivel de ventas promedio cuando se gasta
en propaganda 17 mil dólares.
f) ¿Qué porcentaje de la variación total en la venta es explicada por el modelo de regresión?

90. El gerente de una empresa seleccionó al azar diez semanas de funcionamiento y registró el nivel
de ventas (en ciento de dólares) y el precio de venta (en dólares). Los resultados se dan a
continuación:

Precio 1.3 2.0 1.7 1.5 1.6 1.2 1.6 1.4 1.0 1.1
Venta 10 6 5 12 10 15 5 12 17 20

a) Determine con la prueba de Durbin Watson si los residuales presentan autocorrelación. Use un
nivel de significancia de 0.01.
b) Estime la línea de regresión del nivel de ventas en base al precio del artículo. Interprete el
coeficiente de regresión estimado.
c) Con un nivel de significancia de 0.01, ¿existe evidencia estadística para afirmar que el modelo
de regresión lineal es significativo?
d) Estime el nivel de ventas que se espera obtener si el precio del artículo es de $1.8.
e) Construya un intervalo de confianza del 99% para el nivel de ventas promedio cuando el precio
del artículo es de $1.8. Interprete.
f) ¿Qué porcentaje de la variabilidad del nivel de ventas no es explicado por el modelo de
regresión lineal simple?

91. La empresa comercializadora de productos agrícolas ECOPA está interesada en precisar qué
relación existe entre la distancia que una carga de fruta es transportada (por tierra) y la cantidad
de fruta malograda, medida en kilogramos (Y) al llegar a su destino. Se obtuvieron los siguientes
resultados de un estudio de diez despachos de fruta:

10 10 10 10 10

 X i  765;  X i  69225;
2
 Yi  316 ;  Yi  12128; X Y  28605
2
i i
i 1 i 1 i 1 i 1 i 1

a) Ajuste una recta de regresión para determinar la cantidad de fruta malograda en función de la
distancia recorrida. Interprete el coeficiente de regresión estimado.
b) ¿Existe evidencia estadística para afirmar que el ajuste de la recta de regresión es significativo?
Use un α = 0.05.

33
c) Es posible afirmar que por cada kilómetro que recorre la carga de fruta hasta llegar a su destino
la cantidad de fruta malograda se incrementa en más de 300 gramos. Use un α = 0.05.
d) Estime un intervalo de confianza para la cantidad de fruta malograda cuando la distancia
recorrida fue de 95 Kilómetros, utilice un 95% de confianza.
e) Calcule e interprete el coeficiente de determinación.

BIBLIOGRAFÍA:
1.- Anderson, S. (2010) Estadística para Administración y Economía. Cengage Learning 8va.
Edición. México.
2.- Mendehall, W. (2008) Introducción a la Probabilidad y Estadística. Thomson 12° Edición.
México.
3.- Alvarado, J., Obagi, J. (2008) Fundamentos de la Inferencia Estadística. Ed. Pontificia
Universidad Javeriana 1ra. Edición. Colombia.

SEMANA 7
REGRESIÓN LINEAL MÚLTIPLE

92. Un distribuidor de helado está estudiando el sistema de reparto de su producto. Específicamente,


el distribuidor está interesado en estimar el tiempo de servicio en minutos, a un expendio al
menudeo. El ingeniero industrial a cargo del estudio ha sugerido que los dos factores más
importantes que intervienen en el tiempo de reparto son el número de cajas de helados que se
entregan y la distancia en miles de kilómetros, que debe recorrer el repartidor. El ingeniero recopiló
una muestra de 15 servicios de reparto y obtuvo los siguientes resultados en minitab:

N = 15
AD = 0.164
P_value 0.058

Regression Analysis: Tiempo versus N_cajas, Distancia

Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value


Regression 2 331.36 165.679 16.80 0.000
Error 12 118.37 9.865
Total 14 449.73

Model Summary

S R-sq R-sq(adj) R-sq(pred)


3.14079 73.68% 69.29% 58.46%

34
Coefficients

Term Coef SE Coef T-Value P-Value VIF


Constant 2.31 5.86 0.39 0.700
N_cajas 0.877 0.153 5.73 0.000 1.20
Distancia 0.456 0.147 3.11 0.009 1.20

Regression Equation

Tiempo = 2.31 + 0.877 N_cajas + 0.456 Distancia

Durbin-Watson Statistic = 2.61928

Prediction for Tiempo

Regression Equation
Tiempo = 2.31 + 0.877 N_cajas + 0.456 Distancia

Variable Setting
N_cajas 18
Distancia 35

Fit SE Fit 95% CI 95% PI


34.0581 1.30884 (31.2064, 36.9098) (26.6445, 41.4717)

a) Verifique los supuestos para un análisis de regresión lineal múltiple y la multicolinealidad


utilizando el Factor de Inflación de la variable (VIF)
b) Indique el modelo de regresión lineal múltiple. Interprete cada uno de los coeficientes de
regresión. Interprete los coeficientes de la ecuación de regresión estimada.
c) Con un nivel de significancia de 5%, ¿se puede afirmar que las variables independientes son
significativas?
d) ¿Se puede afirmar que el modelo de regresión lineal con las dos variables es válido? Use un α
= 0.05.
e) Estime el tiempo promedio de entrega del producto cuando se tienen que entregar 18 cajas,
para lo cual se tiene que recorrer una distancia de 35 km. Use un nivel de confianza de 95%.
f) ¿Qué porcentaje de la variación total del tiempo de reparto no es explicada por el modelo de
regresión?

93. Se desea modelar la producción de los trabajadores de una fábrica en función de una prueba de
aptitud y los años de experiencia. Para realizar este estudio se seleccionó una muestra de 10
colaboradores y se registró el número de unidades que había producido por hora (Y), el puntaje
que obtenido en una prueba de aptitud (X1) y los años de experiencia del colaborador (X2).

Análisis de regresión: Y vs. X1; X2

Coeficiente
Término Coef SE Coef T P VIF
Constante -13.825 1.795 -7.70 0.004
X1 0.212 0.013 16.76 0.000 2.77
X2 2.000 0.146 13.73 0.000 2.16

Resumen del modelo

35
S = 1.298 R-cuad. = 98.8% R-cuad.(ajustado) = 98.4%

Análisis de varianza
Fuente GL SC CM F P
Regresión 2 962.71 481.36 285.80 0.000
Error residual 7 11.79 1.68
Total 9 974.50

Estadístico de Durbin - Watson: 1.218

a) Verifique la no multicolinealidad y la no autocorrelación en los residuales. Use un α = 0.05.


b) Indique el modelo de regresión lineal múltiple. Interprete el coeficiente de regresión para la
variable años de experiencia del colaborador.
c) Con un nivel de significancia de 0.05, ¿existe evidencia para afirmar que el modelo con las dos
variables es válido?
d) Con un nivel de significancia de 0.05, ¿existe evidencia para afirmar que las variables
independientes son significativas?
e) Determine e interprete el coeficiente de determinación correspondiente para este análisis.

94. La compañía Aceros ha estado buscando los factores que influyen en la cantidad de acero (en
millones de toneladas) que es capaz de vender cada año. La administración sospecha que los
siguientes son los factores principales: La tasa anual de inflación del país, el precio promedio por
tonelada en dólares, mediante el cual el acero importado acota los precios de la compañía y el
número de automóviles en millones que los fabricantes del país están planeando producir en ese
año. Se han recogido los datos correspondientes a los últimos siete años y se analizó los datos
con el MINITAB obteniéndose los siguientes resultados:

Análisis Regresión: Venta versus Inflación, Importación, Producción

Coeficiente
Término Coef. SE Coef. T P VIF
Constante -0.9146 0.8376 -1.09 0.159
Inflación -0.0873 0.0426 -2.05 0.087 1.89
Importación 0.0408 0.0827 0.49 0.598 2.34
Producción 0.8497 0.1421 5.98 0.001 1.12

S = 0.2037 R-Sq = 92.82% R-Sq(adj) = 85.6%

Analysis of Variance
Source Gl SC CM F P
Regression 3 1.6098 0.5366 12.93 0.003
Residual Error 3 0.1245 0.0415
Total 6 1.7343

a) Verifique los supuestos de multicolinealidad y autocorrelación en los errores. Use un α = 0.05.


b) Determine el modelo de regresión lineal múltiple. Interprete el coeficiente de regresión para la
variable tasa anual de inflación del país.
c) Con un nivel de significancia de 0.05, ¿al menos una de las variables es significativa?
d) Con un nivel de significancia de 0.05, ¿qué variables deben quedarse en el modelo?
e) Con lo obtenido en d), plantee el nuevo modelo de regresión lineal.
f) Determine e interprete el coeficiente de determinación ajustado.

36
95. Se desea estimar la variable Y en función a otras cuatro variables. Al tomar una muestra de tamaño
10 se encontró los siguientes resultados con el MINITAB:

Regression Analysis: Y versus X1; X2; X3; X4

Predictor Coef SE Coef T P


Constant -15.398 3.289 -4.68 0.003
X1 0.2185 0.0181 12.07 0.000
X2 2.0008 0.1739 11.51 0.000
X3 0.0136 0.0223 0.61 0.268
X4 0.0012 0.0346 0.03 0.158

Resumen del modelo


S = 1.481 R-Sq = 98.9% R-Sq(adj) = 98.0%

Analysis of Variance
Source Gl SC CM F P
Regresión 4 963.52 240.88 109.79 0.000
Error 5 10.97 2.19
Total 9 974.49

a) Si se supone que no hay problemas de multicolinealidad. Determine el modelo de regresión


lineal múltiple.
b) Con un 5% de significancia, ¿se puede afirmar que el modelo es significativo?
c) Con un nivel de significancia del 0.05, ¿existe evidencia estadística para afirmar que las
variables independientes son significativas? Utilizar un α = 0.05.
d) Asumiendo que todas las variables independiente se quedan en el modelo, ¿qué porcentaje de
la variabilidad de Y está explicada por el modelo de regresión estimado?

96. El gerente de una empresa inmobiliaria tiene interés en realizar un estudio acerca de los precios
de las viviendas que posee la urbanización “El Sol de las Laderas”, donde existe un solo centro
comercial. La empresa ha decidido incluir en el análisis las siguientes variables:
Y  Precio de la vivienda en miles de dólares
X1 = Área construida de la vivienda en metros cuadrados
X2 = Distancia al centro comercial en metros
X3 = Antigüedad de la vivienda en años

Los resultados obtenidos en 21 viviendas elegidas al azar se muestran a continuación:

Análisis de regresión: Precio vs. Área, Distancia, Antigüedad

Coeficientes
Predictor Coef SE Coef T P VIF
Constante 75.73 16.77 4.52 0.004
Área 0.2849 0.0332 8.58 0.001 1.634
Distancia 0.0092 0.0134 0.69 0.057 1.426
Antigüedad -3.3770 1.4942 -2.26 0.024 2.578

Análisis de varianza
Fuente GL SC CM F P
Regresión 3 52578 17526 76.16 0.000
Error residual 17 3912 230.117
Total 20 56490

37
Se asume que los errores siguen una distribución normal y que no existe autocorrelación entre ellos.

a) Verifique el supuesto de multicolinealidad utilizando el Factor de Inflación de la variable (VIF)


b) Determine la ecuación de regresión estimada e interprete el coeficiente de la variable
antigüedad.
c) Pruebe si el modelo de regresión múltiple que incluye las tres variables independientes es
significativo. Use un α = 5%
d) Pruebe si las variables independientes son significativas. Use un α = 5%.

97. El gerente de ventas de un centro comercial quiere conocer si las ventas anuales en miles de
dólares es afectada por el número de trabajadores en cientos, el número de acciones en miles
ofrecidas por cada empresa y el valor del inventario al principio del año en miles de dólares. Se
selecciona una muestra de 16 empresas hoteleras, los datos recolectados fueron procesados en
el software del MINITAB y se obtuvieron los siguientes resultados:

Coeficiente

Término Coef SE Coef T P VIF


Constante 733.000 332.100 2.21
Nro_trabajadores 3.110 1.285 2.42 0.005 1.789
Nro_acciones 7.900 10.940 0.72 0.461 1.697
Valor_InvInicial 0.354 0.118 3.00 0.001 1.741

Análisis de varianza
F. Variación Gl SC CM F P
Regresión 3 1385.1 461.7 9.9 0.000
Error 12 559.4 46.6
Total 15 1944.5

Prueba de Durbin Watson: 1.124

a) Verifique los supuestos de la multicolinealidad y la autocorrelación de los errores. Use un α =


0.05.
b) Determine la ecuación de regresión lineal múltiple. Interprete el coeficiente de regresión de la
variable número de acciones ofrecidas por cada empresa.
c) ¿El modelo de regresión lineal múltiple es significativo? Use un α = 0.05.
d) ¿Qué variables son significativas en el modelo? Use un α = 0.05.
e) Suponiendo que el modelo con las tres variables es significativo, se desea saber la venta anual
estimada cuando el número de trabajadores fue de 12000 empleados, el número de acciones
es de 24000 acciones y el valor del inventario inicial es de 15000 dólares.

98. El gerente comercial de una cadena de tiendas desea estimar la Utilidad (UTIL) mensual de una
empresa comercial en miles de dólares, y considera que las variables que pueden explicar las
fluctuaciones de la utilidad son: el Nivel de ventas (NV) en cientos de unidades mensuales, el
Gasto en publicidad (GP) en miles de soles, el Precio unitario (PU) en soles y el Monto de pago
en impuestos (PI) en cientos de soles. Se tomó una muestra de tamaño 20 y al procesar estos
datos en el programa MINITAB se observaron los siguientes resultados:

Análisis de regresión: UTIL versus PI, PRECIO, NV, GP

38
La ecuación de regresión es:

UTIL = - 1.826 - 0.081 PI - 0.258 PU + 1.427 NV + 0.615 GP

Predictor Coef SE Coef T P VIF


Constante -1.826 5.045 -0.36 0.723
PI -0.081 0.1200 -0.68 0.509 2.148
PU -0.258 0.2622 -0.99 0.340 2.135
NV 1.427 0.5597 2.55 0.022 1.269
GP 0.615 0.1750 3.51 0.003 1.364

Análisis of Varianza

Fuente GL SC CM F P
Regresión 4 292.96 73.24 24.5 0.000
Residual Error 15 38.5 2.57
Total 19 331.460

a) Interprete los coeficientes de regresión de las variables nivel de ventas y gasto en publicidad.
b) Con un nivel de significancia de 5%, ¿existe evidencia estadística para afirmar que el modelo
de regresión es significativo?
c) ¿Se puede afirmar que todas las variables independientes del modelo son significativas? Use
 = 5%. Luego indique que variable o que variables independientes deben de salir del modelo.
d) De acuerdo a sus resultados obtenidos en la parte c) y con las siguientes salidas del programa
Minitab indique en forma clara el modelo final que le recomendaría al Gerente Comercial de
esta cadena de tiendas:

Análisis de regresión: UTIL versus PI, PRECIO

La ecuación de regresión es: UTIL = 11.8 + 0.384PI + 0.489PRECIO

Predictoras Coef SE Coef T P


Constante 11.823 6.012 1.97 0.066
PI 0.3840 0.1344 2.86 0.011
PRECIO 0.4886 0.2306 2.12 0.049

Resumen del modelo


S = 2.82434 R-Sq = 59.1% R-Sq(adj) = 54.3%

Análisis de regresión: UTIL versus NV, PI, GP

La ecuación de regresión es: UTIL = -0.15 + 0.954NV - 0.026PI + 0.673GP

Predictoras Coef SE Coef T P


Constante -0.151 4.746 -0.03 0.975
NV 0.9541 0.2866 3.33 0.004
PI -0.0264 0.1063 -0.25 0.807
GP 0.6728 0.1646 4.09 0.001

Resumen del modelo


S = 1.60059 R-Sq = 87.6% R-Sq(adj) = 85.3%

39
Análisis de regresión: UTIL versus PRECIO, NV, GP

La ecuación de regresión es: UTIL = 0.09 - 0.176PRECIO + 1.17NV + 0.616GP

Predictoras Coef SE Coef T P


Constante 0.095 4.098 0.02 0.982
PRECIO -0.1763 0.2285 -0.77 0.452
NV 1.1750 0.4095 2.87 0.011
GP 0.6155 0.1720 3.58 0.003

Resumen del modelo


S = 1.57465 R-Sq = 88.0% R-Sq(adj) = 85.8%

Análisis de regresión: UTIL versus PRECIO, NV

La ecuación de regresión es: UTIL = - 3.99 - 0.484PRECIO + 2.17NV

Predictoras Coef SE Coef T P


Constante -3.992 5.123 -0.78 0.447
PRECIO -0.4841 0.2755 -1.76 0.097
NV 2.1703 0.3913 5.55 0.000

Resumen del modelo


S = 2.04969 R-Sq = 78.5% R-Sq(adj) = 75.9%

Análisis de regresión: UTIL versus NV, GP

La ecuación de regresión es: UTIL = 0.42 + 0.912 NV + 0.666 GP

Predictoras Coef SE Coef T P


Constante 0.424 4.027 0.11 0.917
NV 0.9118 0.2240 4.07 0.001
GP 0.6655 0.1574 4.23 0.001

Resumen del modelo

S = 1.55579 R-Sq = 87.6% R-Sq(adj) = 86.1%

Análisis de regresión: UTIL versus NV, PI

La ecuación de regresión es: UTIL = - 2.79 + 1.49 NV + 0.051 PI

Predictoras Coef SE Coef T P


Constante -2.792 6.521 -0.43 0.674
NV 1.4903 0.3534 4.22 0.001
PI 0.0512 0.1451 0.35 0.729

Resumen del modelo

S = 2.21997 R-Sq = 74.7% R-Sq(adj) = 71.8%

e) Con el modelo obtenido en la parte d), ¿qué porcentaje de variación de la utilidad es explicado
por el modelo final?

40
BIBLIOGRAFÍA:

1.- Anderson, S. (2010) Estadística para Administración y Economía. Cengage Learning 8va.
Edición. México.
2.- Mendehall, W. (2008) Introducción a la Probabilidad y Estadística. Thomson 12° Edición.
México.
3.- Alvarado, J., Obagi, J. (2008) Fundamentos de la Inferencia Estadística. Ed. Pontificia
Universidad Javeriana 1ra. Edición. Colombia.

REGRESIÓN LOGISTICA BINARIA

99. El área de admisión en cierta universidad desea predecir el ingreso o no a la universidad de un


alumno recién egresado de la secundaria. Para ello, el encargado de dicha área tomó una muestra
de 30 postulantes los cuales recién habían terminado la secundaria el año anterior y se registró su
nota promedio de todos sus cinco años de estudios secundarios. Algunos de estos datos son los
siguientes:

Alumno Situación Nota promedio


1 1 14.5
2 1 15.8
3 1 12.1
4 0 11.1
5 1 16.2
6 0 11.0
: : :

Donde las variables son:


- Situación: 1: Ingresó 2: No ingresó
- Nota promedio

a) Determine el modelo estimado de regresión logística binaria. Interprete el coeficiente de regresión


estimado
b) Interprete el odds ratio.
c) ¿El modelo de regresión logística es el adecuado? Utilice los enfoques respectivos, (Deviance,
Pearson y Hosmer – Lemeshow).
d) Calcule la probabilidad de que un postulante que tiene de nota promedio 12,8; ingrese a la
universidad.
e) Con un 95% de confianza, estime la probabilidad que un alumno que tiene de nota promedio 11,6;
ingrese a la universidad

Binary Logistic Regression: Situación versus Nota promedio

Deviance Table

Source DF Adj Dev Adj Mean Chi-Square P-Value


Regression 1 8.660 8.660 8.66 0.003
Nota promedio 1 8.660 8.660 8.66 0.003
Error 28 32.795 1.171
41
Total 29 41.455

Coefficients

Term Coef SE Coef VIF


Constant -11.61 4.77
Nota promedio 0.892 0.362 1.00

Odds Ratios for Continuous Predictors

Odds Ratio 95% CI


Nota promedio 2.4411 (1.2002, 4.9649)

100. El director del banco del sur se muestra preocupado por el aumento de clientes morosos en los últimos
años. Con objeto de reducir este problema, realiza un estudio que permita identificar con la mayor
precisión posible aquellas solicitudes de préstamos que probablemente puedan llegar a convertirse en
préstamos morosos en el caso que se concedieran. Después de analizar la documentación existente
en el banco, el investigador solamente puede conseguir la información de 25 clientes a los que se la
ha concedido préstamos en los tres últimos años. Algunos de estos datos son los siguientes:

N° cliente Tipo de cliente Ingreso mensual


1 1 4450
2 1 3100
3 1 3100
4 1 5200
5 1 4975
6 1 4250
: : :

Donde las variables son:

- Tipo de cliente: 1: cliente moroso 2: cliente cumplido


- Ingreso mensual en miles de soles

a. Determine el modelo estimado de regresión logística binaria.


b. Interprete el odds ratio.
c. El modelo de regresión logística es el adecuado. Utilice el enfoque de Hosmer – Lemeshow.
d. Calcule la probabilidad que un cliente que tiene de ingresos 3250 soles sea moroso.
e. Con un 95% de confianza, estime la probabilidad que un cliente que tiene de ingresos 3250 soles
sea moroso.

Binary Logistic Regression: Tipo_cliente versus Ingreso_mensual

Deviance Table

Source DF Adj Dev Adj Mean Chi-Square P-Value


Regression 1 19.38 19.3817 19.38 0.000
Ingresos 1 19.38 19.3817 19.38 0.000
Error 23 15.24 0.6624
Total 24 34.62

42
Coefficients

Term Coef SE Coef VIF


Constant 6.25 2.48
Ingreso_mensual -0.001915 0.000744 1.00

Odds Ratios for Continuous Predictors

Odds Ratio 95% CI


Ingresos 0.9981 (0.9966, 0.9995)

BIBLIOGRAFÍA:
1.- Anderson, S. (2010) Estadística para Administración y Economía. Cengage Learning 8va. Edición.
México.
2.- Barreno, E. (2009) Estadística aplicada. Perú. Universidad de Lima.
3.- Webster, A. (2000) Estadística aplicada a los negocios y la Economía. Bogotá: Mc Graw Hill.

43

También podría gustarte