Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Profesora Titular:
Lic. María de los Angeles Morales
Profesoras Auxiliares:
Cra. Cristina E. Molnar
Cra. María Gabriela Perez
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
GENERO
LE GUSTA IR A COMPRAR
ROPA HOMBRE MUJER TOTAL
SI 238 276 514
NO 304 267 571
TOTAL 542 543 1085
Utilizando Excel,
a) Construya una gráfica circular determinando la proporción de hombres y mujeres que
gustan ir a comprar ropa
b) Construya una gráfica de barras agrupadas relacionada con el gusto por ir de compras
y con el género.
¿Qué concluye a partir de estas gráficas?
1.2. Con los datos del archivo Comportamiento del Consumidor (Comport.dyt) para DYANE,
correspondiente al cuestionario que se transcribe a continuación, identifique el tipo de variable
y la escala de medición que se utiliza y luego realice las tablas que muestren:
a) la variable clase social
b) nivel de estudios alcanzados para cada clase social,
c) que relacione el uso de tarjeta de crédito con la edad y con la clase social,
d) la posesión de automóviles con la edad y la clase social,
e) la posesión de vivienda con la clase social y la región
f) Preparar Cuadros y gráficos adecuados para mostrar la información de los puntos
anteriores.
g) Analice lo que observa en las tablas y gráficos realizados
Puede utilizar Dyane o Minitab para realizar las tabulaciones simples y cruzadas
Pregunta 1. Regíón donde vive
• 1. Norte
• 2. Este
• 3. Oeste
• 4. Sur
1
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
Pregunta 3. Sexo
• 1. Hombre
• 2. Mujer
1.3. Con el archivo Datos para tabla dinámica que se encuentra en el Aula virtual
trabajaremos con los datos de la hoja Ej1 para presentar distintas tablas dinámicas y sus
gráficos.
Los datos de la hoja Ej 2 corresponden al video que se encuentra en el aula virtual, para que
los ayude en la interpretación del mismo.
1.4. Un fabricante de fertilizantes para plantas desea desarrollar una fórmula de fertilizante
que produzca el mayor aumento en la altura de las plantas. Para probar las fórmulas de
fertilizantes se realiza un experimento y se preparan tres grupos de 50 plántulas idénticas: un
grupo de control sin ningún tipo de fertilizante, un grupo con el fertilizante del fabricante,
llamado GrowFast, y un grupo con un fertilizante llamado SuperPlant, de un fabricante de la
competencia. Después de que las plantas han permanecido tres meses en un ambiente de
invernadero controlado, se mide la altura de las plantas.
Como parte de la investigación inicial, usted debe crear una gráfica de caja de las alturas de
las plantas de los tres grupos para evaluar las diferencias en el crecimiento entre las plantas
que no recibieron fertilizante, las plantas tratadas con el fertilizante del fabricante y las plantas
2
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
Para evaluar la distribución de los datos, el gerente le solicita que confeccione un histograma
con la línea de ajuste del par de torsión, Luego confecciones histogramas para las dos
máquinas. Analice las gráficas y dé su opinión al respecto.
La información se encuentra en el archivo TorsiónTapa para Minitab.
1.6. El gerente de operaciones de una empresa que fabrica pistones le solicita que compare
los pistones de dos proveedores. Se midieron las longitudes de una muestra aleatoria de 100
pistones de cada proveedor.
Confeccione un histograma con ajuste y grupos para comparar las distribuciones de los datos
de las muestras y explique las conclusiones que extrae del gráfico.
3
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
2.4. Una fábrica compra piezas de dos proveedores. Sea A1 el evento piezas que provienen
del proveedor 1 y A2 el evento piezas que provienen del proveedor 2. De las piezas que
compra la fábrica 65% provienen del proveedor 1 y 35% restante proviene del proveedor 2.
La calidad de las piezas compradas varía de acuerdo con el proveedor. Por experiencia, sabe
que la calidad de los dos proveedores es como se muestra en la tabla siguiente. Expresamos
con B el evento la pieza está buena y con M el evento la pieza está mala.
P(B/A1) 0.98 P(M/A1) 0.02
P(B/A2) 0.95 P(M/A2) 0.05
4
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
Suponga ahora que las piezas de los dos proveedores se emplean en el proceso de
fabricación de esta empresa y que una máquina se descompone al tratar de procesar una
pieza mala.
Dada la información de que la pieza está mala, ¿cuál es la probabilidad de que sea del
proveedor 1 y cuál es la probabilidad de que sea del proveedor 2?
2.5. Un banco local revisa su política de tarjetas de crédito con objeto de retirar algunas de
ellas. En el pasado aproximadamente 5% de los tarjetahabientes incumplieron, dejando al
banco sin posibilidad de cobrar el saldo pendiente. De manera que el gerente estableció una
probabilidad previa de 0,05 de que un tarjetahabiente no cumpla. El banco encontró también
que la probabilidad de que un cliente que es cumplido no haga un pago mensual es 0,20. Por
supuesto la probabilidad de no hacer un pago mensual entre los que incumplen es 1.
a. Dado que un cliente no hizo el pago de uno o más meses, calcule la probabilidad posterior
de que el cliente no cumpla.
b. El banco deseará retirar sus tarjetas si la probabilidad de que un cliente no cumpla es mayor
que 0.20. ¿Debe retirar el banco una tarjeta si el cliente no hace un pago mensual?
3.1. Se desea estudiar las compras promedio mensuales de 2020 de los clientes de un gran
supermercado de Resistencia que operan con tarjetas de crédito provistas por el
establecimiento. Estas personas figuran en un fichero, numeradas desde 1 hasta 5.986. El
tamaño de la muestra es de 100 clientes.
Definir la población y la muestra. Utilizaremos la función de Excel para generar número
aleatorios y determinar los clientes que integrarán la muestra.
3.3. Se llevará a cabo en el mes de junio 2021 una encuesta cuyo objetivo es el de
establecer el monto que una familia destina mensualmente para gastos de salud, en un barrio
de la ciudad de Corrientes. Por investigaciones anteriores se conoce que este gasto está
relacionado con el ingreso mensual del jefe del hogar, por lo cual se decidió clasificar a las 50
5
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
familias teniendo en cuenta tres categorías de ingreso del jefe del hogar. A los fines del
muestreo se consideró conveniente tomar cada una de las categorías de ingreso conformando
un estrato. Luego, los estratos quedaron definidos del siguiente modo:
Estrato 1 = familias cuyo jefe tiene un ingreso menor a $ 20000
Estrato 2 = familias cuyo jefe tiene un ingreso entre $ 20000 y $ 50000
Estrato 3 = familias cuyo jefe tiene un ingreso superior a $ 50000
El listado quedó conformado del siguiente modo:
Fila N° cat. Ingreso Jefe Flia Fila N° cat. Ingreso Jefe Flia
1 3 26 2
2 3 27 2
3 1 28 3
4 3 29 2
5 2 30 2
6 2 31 1
7 3 32 1
8 1 33 1
9 2 34 1
10 1 35 2
11 2 36 2
12 2 37 2
13 3 38 1
14 1 39 3
15 2 40 1
16 2 41 1
17 1 42 3
18 2 43 3
19 2 44 3
20 1 45 1
21 1 46 1
22 1 47 1
23 2 48 1
24 2 49 1
25 2 50 1
a) Definir la población
b) Definir que familias conformarían cada estrato
c) Calcular el tamaño de cada estrato, teniendo en cuenta que se definió un tamaño de
muestra de 15 familias. El tamaño de la muestra en cada estrato será proporcional al
tamaño del estrato poblacional.
d) Utilizando números aleatorios defina cuales son las familias que se incluirán en la
muestra, en cada estrato
6
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
UNIDAD 4 ESTIMACIÓN
Estimación con Intervalos de Confianza
4.1. Un fabricante de papel tiene un proceso de producción que opera de manera continua
a través de un turno completo de producción.
Se espera que el papel tenga una longitud media de 11 pulgadas y que la desviación estándar
de la longitud sea 0.02 pulgadas.
A intervalos periódicos, se selecciona una muestra para determinar si la longitud media del
papel sigue siendo igual a 11 pulgadas o si el proceso ha fallado y se registra un cambio en
tal longitud.
Usted selecciona una muestra aleatoria de 100 hojas y encuentra que la longitud media del
papel es de 10.998 pulgadas.
Estime con un nivel de confianza del 95% la media poblacional de la longitud del papel.
4.2. Se seleccionó una muestra de 100 facturas de ventas en la población de facturas de
ventas del mes.
Se calculó la media muestral de las 100 facturas y es igual a 110,27 miles de $ No se conoce
la desviación estándar de la población, y la desviación estándar muestral es 28.95 miles de $.
Construya un intervalo de confianza del 95% para estimar la media poblacional de las ventas
4.3. Se desea analizar si las facturas de ventas del ejercicio anterior contienen errores (si o
no). De la muestra de 100 facturas mensuales hay 10 facturas con errores.
Estime la proporción de facturas con errores con un nivel de confianza del 95%
4.4. Un banco desea estimar con un 95% de confianza el promedio de los saldos deudores
en las tarjetas de créditos en la población de familias de una ciudad y para ello se tomó una
muestra de 70 familias. No se cuenta con una estimación previa de la desviación estándar
poblacional.
Saldos deudores en pesos en las tarjetas de créditos de 70 familias
9430 14661 7159 9071 9691 11032
7535 12195 8137 3603 11448 6525
4078 10544 9467 16804 8279 5239
5604 13659 12595 13479 5649 6195
5179 7061 7917 14044 11298 12584
4416 6245 11346 6817 4353 15415
10676 13021 12806 6845 3467 15917
1627 9719 4972 10493 6191 12591
10112 2200 11356 615 12851 9743
6567 10746 7117 13627 5337 10324
7
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
4.5. Se desea estimar la varianza población del proceso de llenado de refrescos en una
embotelladora. En una muestra de 20 envases se encontró que la varianza muestral es 0.0025
ml al cuadrado.
Calcular el intervalo de confianza del 95 % para la varianza y desviación estándar de la
población
4.6. Durante el verano pasado fueron visitados 30 restaurantes de comida rápida. Se
registró el tiempo que transcurría entre que el cliente hiciera su pedido y la recepción del
mismo. Los tiempos, expresados en minutos, en los 30 restaurantes visitados fueron los
siguientes:
8
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
a) Determine los límites de control superior e inferior de los gráficos de Media y Rango
4.10. El muestreo de 4 piezas cada hora de alambre cortado con precisión medidas en
pulgadas (para un ensamble de computadoras) generó los siguientes resultados durante las
últimas 24 horas:
4.11. La etiqueta de las cajas pequeñas de cereal NutraFlakes dice “peso neto 10 onzas”.
Cada hora se pesan muestras aleatorias de tamaño n = 4 para revisar el control del proceso.
Después de cinco horas de observaciones se obtuvieron los siguientes datos:
HORAS PESOS
CAJA 1 CAJA 2 CAJA 3 CAJA 4
9:00 a. m. 9,8 10,4 9,9 10,3
10:00 a. m. 10,1 10,2 9,9 9,8
11:00 a. m. 9,9 10,5 10,3 10,1
12:00 p. m. 9,7 9,8 10,3 10,2
1:00 p. m. 9,7 10,1 9,9 9,9
9
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
a) Con estos datos determine los límites para una gráfica de medias y una gráfica R .
b) ¿El proceso está bajo control?
4.12. La tabla da los resultados de la inspección de las muestras de ADN tomadas durante
los últimos 10 días. El tamaño de cada muestra es 100.
DIAS DEFECTUOSAS
1 7
2 6
3 6
4 9
5 5
6 6
7 0
8 8
9 9
10 1
4.13. Una Clínica busca mejorar su imagen proporcionando una experiencia positiva a sus
pacientes y familiares. Parte del programa de “imagen” incluye comidas sabrosas que inviten
a los pacientes a comer sanamente. Un cuestionario acompaña cada comida que se sirve y
pregunta, entre otras cosas, si están satisfechos o insatisfechos con la comida.
Los resultados de una muestra de 100 pacientes de la encuesta durante los pasados 7 días
arrojaron la siguiente información:
TAMAÑO
N° PACIENTES DE LA
DIAS INSATISFECHOS MUESTRA
1 24 100
2 22 100
3 8 100
4 15 100
5 10 100
6 26 100
7 17 100
10
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
4.14. Las peguntas por teléfono de 100 “clientes” de IRS se monitorean todos los días en
forma aleatoria. Además, se registran los incidentes de información incorrecta y otras fallas
(como la descortesía con los clientes). Los datos de la última semana son:
NÚMERO
DE
DIAS FALLAS
1 5
2 10
3 23
4 20
5 15
Construya una gráfica c para las fallas, con una desviación estándar de 3. ¿Qué indica la
gráfica de control sobre los operadores de teléfonos de IRS?
4.15. Modern Art SA examina una muestra aleatoria de 100 mesas de comedor que salieron
de la línea de ensamble de la empresa. Una cuidadosa inspección revela un total de 2 mil
imperfecciones.
a) Determinar los límites de control superior e inferior, con un 99.73% de probabilidad para
el número de imperfecciones
b) Si una mesa tiene 42 imperfecciones, ¿debe tomarse alguna acción especial?
4.16. Una empresa textil recibe un promedio de seis devoluciones al día. Con z = 3,
¿considera que debe llevarse a cabo alguna acción si el número de devoluciones diarias
aumenta a nueve?
5.2. Usted tiene un restaurante de comida rápida y desea determinar si el tiempo de espera
para realizar un pedido ha cambiado en el último mes a partir de su valor medio poblacional
anterior de 4,5 minutos. Por experiencia usted supone que la población se distribuye de
manera normal con una desviación estándar poblacional de 1.2 minutos.
Usted seleccionó una muestra de 25 pedidos durante un lapso de una hora. La media muestral
es de 5,1 minutos.
Determine con un nivel de significancia de 0.05 si existe evidencia de que el tiempo medio
poblacional de espera para realizar un pedido ha cambiado en el último mes a partir de su
valor poblacional anterior de 4.5 minutos
5.3. Usted trabaja en una empresa y le asignan la realización de un estudio para determinar
si la cantidad promedio de importes de ventas no ha variado de los $120 de los últimos cinco
años. Usted reúne los datos de una muestra de 12 facturas de ventas y decide utilizar un nivel
de significancia del 0.05. La población de facturas de ventas se distribuye normalmente y no
se conoce la desviación poblacional. La muestra está conformada con los siguientes importes
de ventas:
108,98 152,22 111,45 110,59 127,46 107,26
93,32 91,97 111,56 75,71 128,58 135,11
5.4. En un estudio previo una cadena de comidas rápidas tuvo un tiempo medio de servicio
de 174.22 segundos, siendo el noveno mejor en su sector. Su gerente está tratando de mejorar
la calidad reduciendo el tiempo de servicio mediante la implementación de un proceso de
servicio en el automóvil más rápido.
Tomó una muestra de prueba de 25 tiendas y de la muestra seleccionada el tiempo medio es
162.96 segundos y la desviación estándar muestral es 20.2 segundos. Se supone que el
tiempo de servicio en automóviles se distribuye de manera normal.
Sólo establecerá el nuevo proceso en todas las tiendas si prueba, con un nivel de significancia
del 5%, que hay una reducción en el tiempo de servicio en el automóvil.
5.5. Una empresa que fabrica barras de chocolates está interesada en que el peso medio
de una barra de chocolate no sea mayor a 6.03 onzas. Se selecciona una muestra de 50
barras de chocolate y la media muestral es de 6.034 onzas y la desviación estándar muestral
es de 0.02 onzas.
Con un nivel de significancia del 1% ¿existe evidencia de que el peso medio poblacional de
las barras de chocolates sea mayor que 6.03 onzas?
5.6. Un estudio buscaba determinar por qué los adultos desean tener acceso a Internet
cuando están de vacaciones. De 2000 adultos, 1540 dijeron que querían tener acceso a
Internet para revisar su correo electrónico personal mientras vacacionaban. Una encuesta
12
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
realizada en el año anterior indicó que 75% de los adultos querían tener acceso a Internet
para revisar su correo electrónico personal durante las vacaciones.
¿Existe evidencia significativa a un nivel del 5% de que el porcentaje de adultos que quieren
tener acceso a internet para revisar su correo electrónico personal durante las vacaciones
cambió respecto al año anterior?
5.7. Una cadena de comidas rápidas ha desarrollado un nuevo proceso para asegurarse de
que los pedidos del servicio al automóvil se procesen de manera correcta. Se desea
determinar si el nuevo proceso puede aumentar el porcentaje de pedidos procesados de forma
correcta. El proceso anterior procesaba los pedidos de manera correcta el 85% de las veces.
Se reúnen datos de una muestra de 100 pedidos utilizando el nuevo proceso. Los resultados
indican que 94 pedidos se procesaron correctamente.
Con un nivel de significancia de 0.01 ¿puede concluir que el nuevo proceso ha incrementado
la proporción de pedidos procesados correctamente?
6.1. Se desea determinar si las ventas medias semanales de la bebida gaseosa Crush cuando
se utiliza una góndola normal en la cadena de supermercado Maxim son iguales que cuando
se utiliza un exhibidor al final del pasillo.
Usted reúne los datos de dos muestras. Una de las ventas semanales de 10 supermercados
Maxim a los que se asignó una góndola normal a la bebida Crush y otra muestra de 10
supermercados a los que se le asignó un exhibidor al final del pasillo.
Pruebe con un nivel de significación del 5% si las ventas promedio semanales de las bebidas
colas son iguales si se utiliza una góndola normal o se exhibe al final del pasillo, suponiendo
que las poblaciones se distribuyen de manera normal, con varianzas iguales. Utilice
Excel y Minitab
La tabla siguiente reúne la información obtenida de las dos muestras sobre las ventas de la
bebida (en número de cajas de gaseosas vendidas):
6.2. Se desea probar la validez del anuncio de un restaurante local de pizzas, el cual afirma
que entrega el producto a la residencia universitaria con mayor rapidez que la sucursal local
de una cadena de comidas rápidas. Ambos locales están ubicados en la misma cuadra en la
calle principal. Usted define que quiere estudiar el tiempo de entrega en minutos desde que
se ordena la pizza hasta el momento en que se entrega.
13
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
Reúne los datos pidiendo 10 pizzas a cada uno de los negocios, en momentos diferentes.
Luego organiza y almacena los datos. En la tabla siguiente se presentan los tiempos de
entregas en minutos:
Restaurante local Cadena de comidas rápidas
16,8 18,1 22 19,5
11,7 14,1 15,2 17
15,6 21,8 18,7 19,5
16,7 13,9 15,6 16,5
17,5 20,8 20,8 24
Utilice un nivel de significación del 0.05 y determine si existe evidencia de que el tiempo medio
de entrega del restaurante local de pizzas es menor que el tiempo medio de entrega de la
cadena de comidas rápidas, suponiendo que las poblaciones se distribuyen de manera
normal, con varianzas iguales. Utilice Excel y Minitab
6.3. En el Ejercicio 1 ahora suponemos que las varianzas poblacionales no son iguales
y calculamos las diferencias entre las medias Utilice Excel y Minitab
14
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
14 88,25 197,1
15 210,25 168,71
16 199,75 91,69
17 45,5 83,69
18 89,95 147,3
19 66,75 55,16
6.7. Un profesor quiere saber si hay mayor variabilidad en las puntuaciones de los
exámenes finales de administración de los estudiantes que rindieron el curso introductorio de
administración de los que no lo hicieron.
De la lista de clase del profesor se seleccionan muestras aleatorias de 13 estudiantes que no
hicieron el curso introductorio y una muestra de 10 estudiantes que sí lo hicieron y se obtiene
la siguiente estadística:
- Estudiantes que no hicieron el curso introductorio n1: 13, S21 : 210,2 puntos al cuadrado
- Estudiantes que hicieron el curso introductorio n2: 10, S22 : 36.5 puntos al cuadrado
Con un nivel de significación de 0.05 ¿Existe evidencia de que hay mayor variabilidad en las
puntuaciones de los exámenes finales de los estudiantes que no hicieron el curso introductorio
que en las puntuaciones de los estudiantes que hicieron el curso introductorio de
administración? Suponga que la población de puntuaciones de los exámenes finales se
distribuye normalmente.
15
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
6.8. Un gerente de una cadena de hoteles turísticos de lujo ubicados en islas tropicales
desea saber si los huéspedes de dos de sus hoteles ubicados en la misma isla volverían a
hospedarse en éstos. El objetivo es mejorar la calidad del servicio.
Los huéspedes del hotel responden un cuestionario antes de irse y se les pregunta si es
probable que regresen al hotel. Se recolectaron las respuestas a ésta y otras preguntas de
227 huéspedes del hotel Beach y de 262 huéspedes del hotel Wind. Los resultados de esta
pregunta indicaron que 163 de los 227 huéspedes del hotel Beach y 154 de los 262 huéspedes
del hotel Wind respondieron que era posible que regresaran al hotel.
Con un nivel de significación del 0.05 ¿Existe evidencia de que el grado de satisfacción de los
huéspedes de un hotel (medido con la probabilidad de que regresen al mismo) difiere de
manera significativa del grado de satisfacción de los huéspedes del otro hotel?
6.9. Una creciente preocupación por la privacidad en Internet ha provocado que un mayor
número de personas vigilen su identidad en la web. Se realizó una encuesta que dió como
resultado que el 44 % de los usuarios de internet de entre 18 y 29 años han tomado medidas
para limitar la cantidad de información personal disponible en línea, a diferencia del 20% de
los usuarios de internet mayores de 65 años que han hecho lo mismo. La muestra fue de 100
individuos en cada grupo de edad.
Con un nivel de significación del 5% ¿la proporción de los usuarios de internet entre 18 y 29
años que han tomado medidas para limitar la cantidad de información personal disponible en
línea es mayor que la proporción de usuarios de internet mayores de 65 años que han hecho
lo mismo?
Utilice la prueba chi cuadrada para la diferencia entre dos proporciones para probar si la
proporción poblacional de los huéspedes que regresarían al hotel Beach es igual que la
proporción de los huéspedes que regresarían al hotel Wind, con un nivel de significación del
5%
6.11. Continuando con el ejercicio 8, ahora las encuestas se aplican a tres hoteles localizados
en una isla diferente. Se reúnen datos de encuestas sobre la satisfacción de los clientes en
estos tres hoteles y se organizan en la siguiente tabla de contingencia:
16
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
6.12. Suponga ahora que en la encuesta sobre la satisfacción de los huéspedes de los
hoteles se preguntó a los individuos que dijeron que probablemente no regresarían cuál era la
principal razón por la que no estarían dispuestos a regresar al hotel.
Se presenta la tabla de contingencia de 4 x3 resultante:
HOTELES
Razones para no regresar A B C TOTALES
precio 23 7 37 67
localizacion 39 13 8 60
condiciones de la habitación 13 5 13 31
otros 13 8 8 29
TOTALES 88 33 66 187
Pruebe con un nivel de significación del 5% de que hay relación entre las principales razones
para no regresar y el hotel.
6.13. Una empresa que fabrica paracaídas utiliza fibras sintéticas que compra a cuatro
proveedores diferentes. Desean saber si existen diferencias significativas en la fuerza de los
paracaídas tejidos con las fibras sintéticas adquiridas a cada uno de los cuatro proveedores,
La fuerza de los paracaídas se mide colocándolos en un apartado de prueba que tira de los
dos extremos hasta que se rompen. La fuerza requerida para romper el paracaídas se mide
en una escala de resistencia de tracción, donde un valor mayor representa un paracaídas más
fuerte.
Se fabrican 5 paracaídas utilizando las fibras proporcionadas por cada proveedor y se prueba
la fuerza reuniendo las mediciones de resistencia a la tracción de cada paracaídas. Los
resultados se organizan por grupos en la siguiente tabla:
PROVEEDOR PROVEEDOR PROVEEDOR PROVEEDOR
1 2 3 4
18,5 26,3 20,6 25,4
24 25,3 25,2 19,9
17,2 24 20,8 22,6
19,9 21,2 24,7 17,5
18 24,5 22,9 20,4
17
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
Pruebe con un nivel de significación del 5% si hay diferencias en la dureza de las diferentes
mezclas de pinturas.
Regresión Simple
7.1. En una Cadena de Tiendas se desea pronosticar las ventas anuales para todas las
tiendas nuevas con base en la dimensión del local. Para examinar la relación entre el tamaño
de la tienda, expresados en pies cuadrados, y sus ventas anuales, se reunieron datos de una
muestra de 14 tiendas. En la siguiente tabla se presentan los datos:
18
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
pies Ventas
cuadrados anuales (en
Tiendas (en miles) millones $)
1 1,7 3,7
2 1,6 3,9
3 2,8 6,7
4 5,6 9,5
5 1,3 3,4
6 2,2 5,6
7 1,3 3,7
8 1,1 2,7
9 3,2 5,5
10 1,5 2,9
11 5,2 10,7
12 4,6 7,6
13 5,8 11,8
14 3 4,1
7.2. Utilizando Microsoft Excel, con los datos del ejercicio anterior determine cuál es el
modelo no lineal que podría ocuparse y justifique su respuesta.
19
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
Ventas
Espacio gondola semanales
Tiendas (pies) (miles $)
1 5 160
2 5 220
3 5 140
4 10 190
5 10 240
6 10 260
7 15 230
8 15 270
9 15 280
10 20 260
11 20 290
12 20 310
a) Construya el diagrama de dispersión y determine la línea que mejor ajusta los datos
b) Interprete el significado de los coeficientes de regresión
c) Pronostique las ventas semanales de alimentos para mascotas en tiendas en las que
este producto ocupa 8 pies de espacio en la góndola
d) Calcule el coeficiente de correlación a partir de las variaciones
e) Determine el error estándar de la estimación
f) ¿Qué tan útil cree que es este modelo de regresión para estimar las ventas?
g) ¿Convendría usar un modelo no lineal? Cuál? ¿Por qué?
h) Si utiliza el modelo lineal, ¿puede hacer inferencias a la población? Pruebe con un nivel
de significación del 5%
i) Estime en Minitab las ventas para tiendas que tengan: 5 ,10 ,15 y 20 pies de espacio en
góndola
7.4. Los directivos de una empresa embotelladora de bebidas gaseosas tiene como objetivo
de negocio desarrollar un método para distribuir los costos de entrega entre los clientes. Uno
de los costos variables refleja el tiempo requerido para descargar las cajas de bebida gaseosa
en el punto de entrega. Para empezar, los directivos decidieron desarrollar un modelo de
regresión que permita estimar el tiempo de entrega con base en el número de cajas
entregadas.
20
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
a. Grafique los datos y determine la línea que mejor ajusta los datos
b. Interprete el significado de los coeficientes de regresión
c. Pronostique el tiempo de entrega para 150 cajas de bebidas gaseosas y para las
cantidades de cajas dadas
d. Calcule el coeficiente de determinación y explique
e. Realice un análisis de residuos ¿Existe alguna evidencia de un patrón de residuos?
f. Con un nivel de significación del 0.05 ¿existe evidencia de una relación lineal entre el
tiempo de entrega y el número de cajas entregadas?
Series de Tiempo
7.5. La siguiente tabla contiene información referida a unidades producidas (en miles de
unidades) por una empresa, por cuatrimestre
21
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
Unidades de
AÑOS Cuatrimestres
ventas (en miles)
I 50
1 II 55
III 60
I 52
2 II 58
III 61
I 53
3 II 56
III 63
Utilizando Minitab:
a) Graficar la serie
b) Realizar una suavización de la serie utilizando promedios móviles de orden 3
c) Hallar la ecuación de tendencia y graficar
d) Utilizando la ecuación obtenida en el punto anterior, calcular el valor de la tendencia
para cada uno de los períodos y pronosticar la tendencia para los siguientes tres
períodos
e) Descomponer la serie, identificando los índices estacionales y hallar la matriz de
datos "sin tendencia" y la matriz de datos "sin estacionalidad".
f) Pronosticar con el modelo multiplicativo las ventas para los tres cuatrimestres del
próximo año
Trimestres
Años I II III IV
1 3,1 3,9 4,4 4,1
2 3,4 4,7 5,4 4,8
3 3,7 5 5,5 4,9
Regresión Múltiple
7.7. El gerente de Marketing de una empresa que vende barras de cereales desea
desarrollar un modelo para pronosticar el volumen de ventas mensuales en cada tienda y
determinar cuáles variables afectan las ventas. Se consideran dos variables independientes:
el precio de la barra, medida en centavos (X1) y el presupuesto mensual para los gastos
promocionales dentro de las tiendas, medido en pesos (X2). Los gastos promocionales dentro
de las tiendas, por lo general, incluyen letreros y exhibidores, cupones dentro de las tiendas y
muestras gratuitas. La variable dependiente Y es el número de barras que se venden por mes.
Se reúnen datos de una muestra de 34 tiendas de una cadena de supermercados,
seleccionadas para un estudio de mercado de las barras de cereales. Todas las tiendas
elegidas tienen aproximadamente el mismo volumen de ventas mensuales.
Utilizando Minitab:
a) Determinar el modelo de regresión múltiple
b) Interprete los coeficientes de regresión neta
c) Determine e interprete el valor del coeficiente de determinación múltiple y el r2 ajustado.
d) Pronostique las ventas con el modelo encontrado para los valores de precio y
promoción dados
e) Pronostique las ventas para un precio de 79 centavos durante un mes en que los gastos
de promoción fueron de $ 600
f) Realice una prueba F para verificar si existe una relación significativa entre la variable
dependiente y el conjunto de variables independientes con un nivel de significación del
5%
Los datos se presentan en la siguiente tabla:
23
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
10 5120 59 600
11 4011 59 600
12 5015 59 600
13 1916 79 200
14 675 79 200
15 3636 79 200
16 3224 79 200
17 2295 79 400
18 2730 79 400
19 2618 79 400
20 4421 79 400
21 4113 79 600
22 3746 79 600
23 3532 79 600
24 3825 79 600
25 1096 99 200
26 761 99 200
27 2088 99 200
28 820 99 200
29 2114 99 400
30 1882 99 400
31 2159 99 400
32 1602 99 400
33 3354 99 600
34 2927 99 600
7.8. Se desea desarrollar un modelo de regresión múltiple para estimar el valor de casas
con base en su tamaño (en miles de pies cuadrados) y en el hecho de que tenga una
chimenea. Para incluir la variable categórica de la presencia de chimenea, la variable ficticia
X2 se define como
0 si la casa no tiene chimenea
1 si la casa tiene chimenea
Los datos fueron reunidos de una muestra de 15 casas. en la siguiente tabla se presentan los
datos
VALOR
ESTIMADO TAMAÑO CHIMENEA
234,4 2 SI
227,4 1,71 NO
225,7 1,45 NO
235,9 1,76 SI
24
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
229,1 1,93 NO
220,4 1,2 SI
225,8 1,55 SI
235,9 1,93 SI
228,5 1,59 SI
229,2 1,5 SI
236,7 1,9 SI
229,3 1,39 SI
224,5 1,54 NO
233,8 1,89 SI
226,8 1,59 NO
Utilizando Minitab
a) Encuentre el modelo de regresión múltiple
b) Interprete los coeficientes de regresión neta
c) Realice un pronóstico para los tamaños de casas dados con y sin chimenea
7.9. El gerente de marketing de la gran cadena de supermercados del ejercicio 7.3 enfrentó
el problema de determinar el efecto que el espacio en la góndola y la ubicación del producto
en la parte de frente (=1) o de atrás (= 0) del pasillo tienen sobre las ventas de alimento de
mascotas. Los resultados se presentan en la siguiente tabla
Espacio góndola Ventas
Tiendas (pies) semanales ($) Ubicación
1 5 160 atrás
2 5 220 frente
3 5 140 atrás
4 10 190 atrás
5 10 240 atrás
6 10 260 frente
7 15 230 atrás
8 15 270 atrás
9 15 280 frente
10 20 260 atrás
11 20 290 atrás
12 20 310 frente
a) Establezca la ecuación de regresión múltiple que pronostica las ventas semanales con
base en el espacio en la góndola y la ubicación
b) Interprete los coeficientes de regresión neta
c) Realice una estimación de las ventas semanales de alimentos para mascotas para una
tienda con 8 pies de espacio de góndola situado en la parte trasera del pasillo
25
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
8.3. Usted trabaja en una Universidad en la que le solicitan que determine cómo diez
disciplinas académicas se comparan entre sí en relación con cinco diferentes categorías de
fondos. Recopila datos de clasificación de 2 factores de 796 investigadores.
26
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
Para esta clasificación de dos factores, las disciplinas académicas están en filas y las
categorías de fondos están en columnas. A es la categoría de fondos más alta, D es la más
baja y la categoría E no tiene fondos. También le solicitan que examine datos complementarios
que no se incluyeron en el conjunto de datos principal. Los datos complementarios incluyen
una fila adicional para los investigadores de museos y una fila para las ciencias matemáticas,
que es la suma de matemáticas y estadística.
Realice un análisis de correspondencia simple para representar las asociaciones entre las filas
y columnas con los datos disponibles en hoja Fondos Investigación del archivo Minitab
Ejercicios Análisis de Correspondencia
Realice un análisis de correspondencia múltiple con Minitab para examinar cómo se relacionan
entre sí las categorías incluidas en las cuatro variables con los datos disponibles en Hoja
Accidentes del archivo Minitab Ejercicios Análisis de Correspondencia
8.5. Realice un análisis cluster con Minitab para agrupar a los estudiantes de acuerdo a las
materias en las que tienen mejor desempeño. Utilice los centroides de grupos y las
27
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
distancias euclideanas para agrupar a los estudiantes. Luego interprete como quedaron
conformados los grupos y en que materias se destaca cada grupo.
8.6. Un diseñador que trabaja para una empresa de artículos deportivos desea evaluar un
nuevo guante de portero de fútbol. El diseñador pide a 20 atletas que usen el nuevo guante y
recoge información sobre sexo, estatura, peso y lateralidad manual de los atletas. El diseñador
le solicita a usted que agrupe a los atletas por sus similitudes.
Realice un análisis cluster y describa como estarán conformados los grupos. Los datos se
encuentran en la Hoja Guantes del archivo Minitab Analisis Cluster
Columna
de la hoja Descripción
de trabajo
El sexo de cada atleta: 1=Masculino, 2=
Sexo
Femenino.
Altura La estatura en pulgadas de cada atleta.
Peso El peso en libras de cada atleta.
Pref La mano dominante de cada atleta: 0 =
mano Izquierda, 1 = Derecha.
Análisis Discriminante
8.7. El administrador de una escuela de idiomas desea crear un modelo para clasificar a los
futuros estudiantes de inglés en uno de los tres niveles educativos. El administrador selecciona
180 estudiantes de forma aleatoria y registra la puntuación de una prueba de logro, una
puntuación de motivación y el nivel actual de cada uno.
Con dichas variables realice un análisis discriminante para clasificar a los estudiantes y poder
predecir con el modelo encontrado, en función de una prueba de logro y una prueba de
28
Guía de Trabajos Prácticos de Inferencia Estadística- Licenciatura en Administración
motivación, el nivel que le correspondería a los nuevos estudiantes. Utilice los datos de la Hoja
Estudiantes inglés del archivo Minitab Analisis discriminante y en Dyane el archivo
INGLES.dyt
8.8. Una empresa vitivinícola le encarga realizar una clasificación de los segmentos de
consumidores en función de los atributos que poseen distintas variedades de vinos a fin de
poder realizar la promoción de futuras variedades de vinos, que salgan al mercado, al
segmento de consumidores correcto. Para ello usted realizará un análisis discriminante con
los datos que se encuentran en la Hoja Vinos del archivo Minitab Análisis discriminante y
en Dyane el archivo VINO.dyt
29