Está en la página 1de 11

Análisis Estadístico 2018-2

ANÁLISIS ESTADÍSTICO
GUÍA DE TRABAJO
(2018-2)

Prueba de Hipótesis dos promedios


Prueba de k-medias (Análisis de Varianza)
Problema 1:
El gerente de marketing de una compañía desea determinar si un nuevo envase podría aumentar las ventas de
su producto. Para probar la factibilidad de la nueva forma de envase se seleccionó una muestra de 18 tiendas
similares y se asignaron, en forma aleatoria, 10 de ellas como mercado de prueba de la nueva forma de envase,
en tanto que las otras 8 continuarían recibiendo el envase antiguo. Las ventas semanales durante el tiempo de
estudio fueron las siguientes:
Envase nuevo Envase antiguo
130 128
128 123
131 157
129 131
135 125
134 129
128 126
127 130
126
129

Si se sabe que el nivel de ventas con el envase nuevo y con el envase antiguo se comporta según una
distribución normal y que las muestras tomadas son independientes, ¿Tiene evidencia de que la nueva forma de
envase dio como resultado un mayor nivel de ventas? Utilizar un nivel de significancia del 5%

Problema 2:
La siguiente información representa los datos obtenidos en una m.a. de tiempos utilizados en la fabricación de un
determinado artículo. La empresa que los fabrica tiene dos líneas de producción, en dos turnos diferentes (el
tiempo está en minutos). Las muestras del cada uno de los turnos y de cada una de las líneas de producción
fueron extraídas aleatoriamente y en forma independiente:

Línea A Línea B
Mañana 2.5 3.5
3.0 4
4.3 5.3
5.1 7.1
4.5 6.5
Tarde 4.6 5
5.3 6.5
6.7 8.1
8 6.9

Planteando las hipótesis correspondientes, responda las siguientes interrogantes:


a) Se puede decir que el promedio de tiempo en el turno de la mañana es diferente al tiempo promedio en el
turno de la tarde. Usar un nivel de significancia del 10%
b) El gerente de producción afirma que el tiempo promedio de producción en la Línea A es de 7.5 minutos y
por lo tanto se deben realizar reajustes pues es necesario reducir ese tiempo. Con un 5% de significancia
¿Tiene razón el gerente?

P á g i n a 1 | 11
Análisis Estadístico 2018-2

c) Si la Desviación Estándar en el tiempo de producción del proceso B durante el turno de la mañana es 4


minutos o más se tendrá que detener el proceso y reajustar la línea. Usando un nivel de significancia de
1% ¿Será necesario el reajuste?

Problema 3:
El gerente de marketing de una compañía desea determinar si un nuevo envase podría aumentar las ventas de
su producto. Para probar la factibilidad de la nueva forma de envase se seleccionó una muestra de 18 tiendas
similares y se asignaron, en forma aleatoria, 10 de ellas como mercado de prueba de la nueva forma de envase,
en tanto que las otras 8 continuarían recibiendo el envase antiguo. Las ventas semanales durante el tiempo de
estudio fueron las siguientes:

Envase nuevo Envase antiguo


n1 = 10 n1 = 8
x̄ 1
= 130 cajas
x̄ 2 = 118 cajas
S1 = 10 cajas S2 = 12 cajas

Si se sabe que el nivel de ventas con el envase nuevo y con el envase antiguo se comporta según una
distribución normal y que las muestras tomadas son independientes, ¿Tiene evidencia de que la nueva forma de
envase dio como resultado un mayor nivel de ventas? Utilizar un nivel de significancia del 5%

Problema 4:
Un artículo reporta resultados de un experimento para comparar características de maniobra para dos
automóviles de diferentes longitudes, distancias entre ejes y radios de giro. Las observaciones son el tiempo en
segundos necesarios para estacionar cada automóvil en paralelo. Se sabe que los tiempos están
distribuidos en forma normal, Se selecciona una muestra aleatoria de 8 personas las que utilizaron el Auto A y el
auto B para realizar las maniobras respectivas. Los resultados se muestran a continuación:

Persona 1 2 3 4 5 6 7 8
Auto marca A 37.1 25.8 16.2 24.2 22 33.4 23.8 58.2
Auto marca B 17.8 20.2 16.8 41.4 21.4 38.4 16.8 65.7

¿Sugiere la información que en promedio una personas estaciona en paralelo más fácilmente el automóvil marca
B que el automóvil marca A?. Utilizar un nivel de significancia =0.10

Problema 5:
Una empresa farmacéutica está interesada en la investigación preliminar de un nuevo medicamento que parece
tener propiedades reductoras del colesterol en la sangre. A tal fin se toma una muestra al azar de 6 personas
con características similares, y se determina el contenido en colesterol antes y después del tratamiento. Los
resultados han sido los siguientes:

Antes 217 252 229 200 209 213


Después 209 241 230 208 206 208

Confirmar estadísticamente la bondad del tratamiento. Emplear  = 0.01

Problema 6:
Una compañía desea estudiar el efecto que tiene la pausa para el café, sobre la productividad de sus obreros. El
Gerente de RRHH sostiene que el otorgar una pausa adicional en la jornada laboral incidirá en un mejor
rendimiento de los operarios, con la finalidad de evaluar esta afirmación se selecciona en forma aleatoria una
muestra de 6 operarios y mide su productividad en un día corriente (sin la pausa adicional) y luego mide la
productividad de los mismos 6 obreros en un día que se concede la pausa para el café. Las cifras que miden la
productividad son las que siguen:

TRABAJADOR 1 2 3 4 5 6
Sin pausa 23 35 29 33 43 32
Con pausa 26 38 29 37 42 35

P á g i n a 2 | 11
Análisis Estadístico 2018-2

Con  = 0.05. ¿A qué conclusión llegará la compañía?

Prueba de k medias (Análisis de Varianza)


Prueba de Independencia

Problema 1:
Con la finalidad de comparar los precios del producto “Escaso A1” se llevo a cabo un experimento en tres zonas
de Lima: Cono Sur, Cono Norte y Lima Centro. En cada una de dichas zonas se tomaron muestras de las tiendas
más grandes: 6 tiendas de Lima Centro, 4 tiendas de Cono Norte y 5 tiendas del Cono Sur y se consultó acerca
del precio (en soles) de dicho producto, los resultados se muestran en la siguiente tabla:

Precios del Producto escaso “A1”


ZONAS
Lima Centro Cono Norte Cono Sur
29 27 30
27 27 30
31 30 31
29 28 27
32 29
30

¿Constituyen los datos anteriores suficiente evidencia que indique una diferencia en el precio promedio del producto
escaso A1 en las tiendas de las 3 zonas de Lima?

Problema 2:
Aunque el té es la bebida que más se consume en el
mundo, después del agua, poco se sabe acerca de A B C D
su valor nutritivo. La folacina es la única vitamina B
presente en cualquier cantidad importante de té, y 3.4 8.0 12.8 11.3
recientes avances en métodos de ensayo han hecho 7.8 11.0 10.5 12.8
una determinación precisa del contenido factible de 3.0 9.0 7.3 9.1
esta vitamina. Se eligieron 4 marcas de té con la
5.0 7.4 7.0 6.9
finalidad de comparar el contenido promedio de de
dicha vitamina en las 4 marcas mencionadas, los 3.5 9.7 8.3 5.8
resultados se muestran en la tabla adjunta. ¿Cuál es 3.8   8.8 9.4
la conclusión al respecto? utilizar un 5% de       3.6
significancia)

a) ¿Sugiere esta información que el verdadero promedio del contenido de folacina es el mismo para todas
las marcas? Detalle los pasos de la prueba que utilice con un nivel de significación del 5%.
b) Si la hipótesis nula es rechazada, realice las comparaciones múltiples y diga qué marca de té se
recomendaría por ser más nutritivo.

Problema 3:
El Gerente Administrativo de un Banco está interesado en probar si diferentes incentivos pueden producir
distintos niveles de captaciones en los depósitos de ahorros, para comprobar esto aplica 4 diferentes incentivos
en cuatro sucursales diferentes y luego observa el incremento en el nivel de captaciones (expresado en miles de
dólares), si consideramos que los incrementos en el nivel de captaciones tienen distribución normal, determine
Usted utilizando un nivel de significancia del 5% si el Gerente Administrativo de este Banco tiene razón y que
conclusiones adicionales puede obtener a partir de loa siguientes resultados mostrados en la siguiente tabla:
Para considerar válida la solución de este problema debe de mostrar adecuadamente las hipótesis planteadas y
el desarrollo de estas.
Incentivo A Incentivo B Incentivo C Incentivo D
1.3 1.9 3.6 5.1

P á g i n a 3 | 11
Análisis Estadístico 2018-2

1.5 1.9 4.2 4.9


0.9 2.1 4.5 5.6
1.0 2.4 4.8 4.8
1.9 2.1 3.9 3.8
1.5 3.1 4.1 5.1
2.1 2.5 5.1 4.8

FÓRMULAS. PRUEBAS DE HIPÓTESIS 2

PARAMETRO(S) RESTRICCIONES Y TIPOS DE ESTADÍSTICO DE PRUEBA


PRUEBAS

μ σ 2 desconocida x  μ0
TC 
S/ n

σ12 y σ 22  x1  x 2   μ 0
μ1  μ 2 TC 
desconocidas pero (n 1  1) S12  (n 2  1) S 22  1 1 
iguales
  
n1  n 2  2  n1 n 2 

2
 S12 S 22 
  
σ12 y σ 22
TC 
 x1  x 2   μ 0 g
 n1 n 2 
μ1  μ 2
2 2
desconocidas pero 2 2  S12   S 22 
S S    
n  n 
diferentes 
1 2
 1

 2
n1 n 2 n1 1 n 2 1
__
d
t c=
μd =μ 1−μ2 Muestras relacionadas Sd
(Datos pareados) √n

Análisis de Varianza (Prueba de k medias)


k
Ti2 T 2
SCTR    SCT=∑ ∑ x 2ij −
T2
i 1 ni n n SCE  SCT SCTR
Tabla de Análisis de varianza (Tabla ANOVA)
Suma de
Fuente de Grados de Cuadrado Medio
Cuadrados
Variación Libertad (GL) (CM) F
(SC)
Tratamiento SCTR CMTR
k -1 SCTR CMTR  FC 
s k 1 CME
SCE
Error n-k SCE CME 
nk
Total
n -1 SCT

Intervalos de confianza para la comparación de medias por pares:

P á g i n a 4 | 11
Análisis Estadístico 2018-2

__ __
1 1
(
IC (μ i−μ j )= x i − x j ±t( n−k ) CME) √ ( ) +
ni n j

ANÁLISIS ESTADÍSTICO
REPASO PARA EL EXAMEN FINAL

INDICACIONES

 El tiempo de duración del examen es de 120 minutos.


 El examen debe ser desarrollado con lapicero azul ó negro.
 La prueba desarrollada con lápiz no tiene lugar a reclamo.
 Está permitido el uso de tablas estadísticas, las cuales se le proporcionará
al inicio del examen.
 Está terminantemente prohibido prestarse materiales de trabajo durante el
desarrollo del examen.
 Desarrolle su respuesta en el espacio indicado para ello, de no ser así no
será calificado
 Escriba con claridad y orden.
 Durante la evaluación los celulares deben de permanecer apagados
 En el desarrollo de las preguntas indique adecuadamente el sustento
teórico empleado.
 Duración de la prueba 120 minutos
 Fecha de aplicación de la prueba:

CASO 1: “NIVEL DE ESTRÉS ANTE LA TOMA DE DECISIONES”


Un Psicólogo clínico aplica una terapia a los ejecutivos de una corporación con el objetivo de
disminuir el nivel de ansiedad de estos ante la toma de decisiones. Con la finalidad de
evaluar la eficacia de la terapia se selecciona aleatoriamente una muestra de 10 ejecutivos
que padecen ansiedad en estas situaciones, y se les aplica una escala que mide la ansiedad
ante la toma de decisiones, si conoce que el nivel de ansiedad promedio de todos los
ejecutivos de la corporación, antes de la terapia, era de 8.5. Los datos obtenidos se muestran
en la siguiente tabla, y se fija un nivel de significancia del 5%

Ejecutivo 1 2 3 4 5 6 7 8 9 10
Nivel de ansiedad 6 8 5 9 7 8 6 5 9 7

Defina el o los parámetro(s) de interés y plantee las respectiva hipótesis: (1 punto)

µ: Nivel promedio de ansiedad ante la toma de decisiones, de los ejecutivos de una


corporación, después de aplicada la terapia.
H0: µ = 8.5 La terapia no fue efectiva
H1: µ < 8.5 la terapia si fue efectiva

Desarrollo de la prueba: Muestre la fórmula y el valor Muestre las regiones críticas mostrando la distribución
numérico del estadístico de prueba. (1 punto) utilizada, sus grados de libertad y el punto crítico: (1 punto)

La varianza poblacional es desconocida:

P á g i n a 5 | 11
Análisis Estadístico 2018-2

x  μ0
TC 
S / n = -3.182

-1.833
Decisión e interpretación (1 punto)

TC =-3.182 está en la zona de rechazo, se decide rechazar H 0


Con un 5% de significancia concluimos a partir de la evidencia estadística, que la terapia si
fue efectiva, se logró disminuir el nivel de ansiedad de los ejecutivos ante la toma de
decisiones

CASO 2: “OFICINA DE BIENESTAR COMUNITARIO”

La oficina de bienestar comunitario de la municipalidad de cierto distrito ha implementado un plan


piloto para la aplicación de un programa de orientación y bienestar familiar; para tal finalidad, en
Octubre del 2017, se seleccionó a 12 hogares del distrito y se realizó una evaluación para medir el
nivel de integración familiar (escala del 1 al 100). Posteriormente, en Enero del 2018, al final del
programa se procedió nuevamente a medir el nivel de integración familiar en las familias de la muestra
inicial. Los resultados de la evaluación familiar de la aplicación del programa de orientación y bienestar
familiar se presentan a continuación:

Hogares
Aplicación del
programa 01 02 03 04 05 06 07 08 09 10 11 12

Octubre del 2017 87 78 91 64 70 63 77 72 86 67 80 69

Enero del 2018 89 78 90 65 71 65 80 75 85 69 79 71

Se espera que con la aplicación de este programa se eleve el nivel de integración familiar, de ser así
se procederá a implementar en forma definitiva este programa en la oficina de bienestar comunitario.
Haga la prueba estadística correspondiente usando un nivel de significación del 3%

Defina los parámetros de interés y plantee las respectivas hipótesis: (1 punto)

µ1: Nivel promedio de integración familiar, antes de la aplicación del programa


µ2: Nivel promedio de integración familiar, después de la aplicación del programa

H0: µ1 = µ2 El programa no fue efectivo


H1: µ1 < µ2 El programa si fue efectivo

Desarrollo de la prueba: Muestre la fórmula y el valor Muestre las regiones críticas mostrando la distribución
numérico del estadístico de prueba. (1 punto) utilizada, sus grados de libertad y el punto crítico: (1 punto)

Son dos muestras dependientes:


__
d
t c=
Sd
√n = -2.493
P á g i n a 6 | 11
Análisis Estadístico 2018-2

-2.096

Tc = -2.493 está en la zona de rechazo, por lo tanto se rechaza H 0


Con un 3% de significancia y en base a la evidencia muestral, concluimos que el programa
de orientación y bienestar familiar aplicado por la municipalidad si fue efectivo

Con EXCEL:

Con SPSS:

CASO 3: “ESTABLECIMIENTOS COMERCIALES”


Pregunta 1:
En un estudio económico de interés para algunos inversionistas se desea estudiar ciertas
características de los establecimientos comerciales de diferentes rubros a nivel de Lima
Metropolitana. Este estudio se encarga a una Empresa de Investigación de Mercados, la cual
es una muestra de establecimientos investigó acerca de las siguientes variables: gastos en
publicidad, el nivel de Ventas, el Rubro al que se dedican los establecimientos comerciales y
el sector de la ciudad donde está ubicado el establecimiento. Los datos obtenidos para las
variables mencionadas se encuentran en el archivo “Establecimientos”
Ventas: Es el nivel de ventas mensuales (en cientos de soles mensuales)
Gasto: Es el gasto en publicidad mensual (en cientos de soles mensuales)
Rubro: Es el rubro del establecimiento (Bodega, Botica, Ferretería y Restaurante)
Zona: Indica la zona de ubicación del establecimiento comercial.

P á g i n a 7 | 11
Análisis Estadístico 2018-2

Con respecto a este caso y con los datos mostrados responda las siguientes

a) Con respecto al Gasto en publicidad, diga usted si en promedio este gasto por mes es el mismo
en los diferentes Rubros considerados. Utilizar un nivel de significancia del 5% (3 puntos)

Plantee las respectivas hipótesis en términos del problema: (1 punto)


H0: El gasto promedio en publicidad, son iguales en los cuatro rubros de
establecimientos (Bodega, botica , ferretería y restaurante)
H1: En al menos uno de los rubros el gasto promedio en publicidad es diferente

Desarrollo de la prueba: Muestre el valor numérico del Muestre las regiones críticas mostrando la distribución
estadístico de prueba. (0.5 puntos) utilizada, sus grados de libertad y el punto crítico: (0.5 puntos)

Fc = 23.389

2.696

Decisión e interpretación (1 punto)


i. Decisión Estadística:
Fc = 23.389 está en la zona de rechazo, por lo tanto rechazamos H 0
ii. Conclusiones:
Entonces con un 5% de significancia concluimos que, en al menos uno de los rubros el
gasto promedio en publicidad es diferente

ANOVA
Gasto en publicidad
Sum of
Squares df Mean Square F Sig.
Between 1779987.846 3 593329.282 23.389 0.000
Groups
Within 2536790.000 100 25367.900
Groups
Total 4316777.846 103

Punto crítico: 2.696

b) De acuerdo a lo obtenido en la parte b, que se puede afirmar con respecto a los promedios del Gasto en
publicidad según el rubro de los establecimientos (Los siguientes espacios puedes ser no utilizados, puede
ser utilizados parcialmente o pueden ser totalmente utilizados. Si considera que no es necesario déjelos en
blanco) Justifique adecuadamente su respuesta (1 punto)

Conclusión
Intervalo de confianza (muestre los
Promedios comparados (respecto a la comparación entre estos dos
límites)
promedios)

P á g i n a 8 | 11
Análisis Estadístico 2018-2

µBodega y µBotica Forma [- ; -] µBodega < µBotica


µBodega y µFerretería Forma [+ ; +] µBodega > µFerretería
µBodega y µRestaurante Forma [- ; +] µBodega = µRestaurante

Conclusión Final: (ordene en forma ascendente los respectivos promedios) comente su resultado (1 punto)

Con un 9% de confianza concluimos que µFerretería < µBodega = µRestaurante < µBotica

Multiple Comparis ons


Dependent Variable:
LSD
Mean 95% Confidence Interval
(I) Rubro del Difference (I-
establecimiento J) Std. Error Sig. Lower Bound Upper Bound
Bodega Botica * 45.978 0.005 -224.55 -42.11
-133,333
Ferretería 218,583 * 43.009 0.000 133.26 303.91
Restaurante 32.000 45.978 0.488 -59.22 123.22
Botica Bodega 133,333 * 45.978 0.005 42.11 224.55
Ferretería 351,917 * 43.009 0.000 266.59 437.24
Restaurante * 45.978 0.001 74.11 256.55
165,333
Ferretería Bodega * 43.009 0.000 -303.91 -133.26
-218,583
Botica -351,917* 43.009 0.000 -437.24 -266.59
Restaurante * 43.009 0.000 -271.91 -101.26
-186,583
Restaurante Bodega -32.000 45.978 0.488 -123.22 59.22
Botica -165,333 * 45.978 0.001 -256.55 -74.11
Ferretería 186,583 * 43.009 0.000 101.26 271.91
*. The mean difference is significant at the 0.05 level.

Pregunta 2:
Considere los siguientes parámetros:

µ1: Nivel de ventas promedio de los establecimientos ubicados en la zona norte de la ciudad
µ2: Nivel de ventas promedio de los establecimientos ubicados en la zona centro de la ciudad

Resuelva la siguiente prueba de hipótesis, utilizando un nivel de significancia del 5% y considerando que existe
heteroscedasticidad (varianzas diferentes) con respecto al nivel de ventas en estas dos zonas.

H0: µ1 = µ2 No existe diferencia significativa entre los niveles promedios de ventas de los establecimientos
ubicados en la zona norte con los establecimientos ubicados en la zona centro
H1: µ1 ≠ µ2 Existe diferencia significativa entre los niveles promedios de ventas de los establecimientos
ubicados en la zona norte con los establecimientos ubicados en la zona centro

Desarrollo de la prueba: Muestre la fórmula y el valor Muestre las regiones críticas mostrando la distribución
numérico del estadístico de prueba, justificando por que utilizada, sus grados de libertad y el punto crítico: (1 punto)
utiliza dicha fórmula. (1 punto)

P á g i n a 9 | 11
Análisis Estadístico 2018-2

Tc = 0.909

Levene's Test for Equality Inde pe nde nt S ample s Te s t


of Variances t-test for Equality of Means 95% Confidence Interval of
Mean Std. Error the Difference
F Sig. t df Sig. (2-tailed) Difference Difference Lower Upper
Nivel de Equal 1.938 0.168 0.904 72 0.369 75.442 83.407 -90.828 241.711
ventas variances
mensuales assumed
Equal 0.909 70.504 0.366 75.442 82.952 -89.981 240.864
variances
not assumed

Punto crítico = -1.994 1.994

CASO 4: “RUBRO DEL ESTABLECIMIENTO VERSUS ZONA DE UBICACIÓN” (Este caso no se desarrolla, no es
temas del examen final)

Considerando la información muestral mostrada en la base de datos “Establecimientos” resuelva la siguiente prueba de
hipótesis utilizando un nivel de significancia del 5%:

H0: El rubro del establecimiento comercial y la zona de ubicación del


establecimiento son variables independientes
H1: El rubro del establecimiento comercial y la zona de ubicación del
establecimiento no son variables independientes

Desarrollo de la prueba: Muestre la fórmula y el valor Muestre las regiones críticas mostrando la distribución
numérico del estadístico de prueba. (1 punto) utilizada, sus grados de libertad y el punto crítico: (1 punto)

Tc =

Decisión e interpretación (1 punto)

iii. Decisión Estadística:

P á g i n a 10 | 11
Análisis Estadístico 2018-2

iv. Conclusiones:

P á g i n a 11 | 11

También podría gustarte