Está en la página 1de 21

TALLER DE REFORZAMIENTO FINAL DE ESTADISTICA APLICADA

PROBLEMA 1

Se cree que el tipo de boleto que un estudiante de USIL adquiere para realizar
un viaje en avión depende del tipo de vuelo (Nacional e Internacional). Para
probar si existe alguna relación entre estas variables, se toma una muestra de
150 estudiantes y se obtienen los siguientes resultados:

X: Tipo de boleto Y: Tipo de vuelo (cualitativa)


(cualitativa) Nacional Internacional total
Clase económica 30 25 55
Clase Ejecutiva 35 25 60
Primera clase 15 20 35
total 80 70 150
¿Cuál es su conclusión utilizando un nivel de significancia del 5%?
Ho: (2 variables) El tipo de boleto y el tipo de vuelo SON INDEPENDIENTES
(no existe alguna relación entre estas variables)
H1: El tipo de boleto y el tipo de vuelo NO son independientes (Si existe alguna
relación entre estas variables)
α=0.05
X: Tipo de boleto Y: Tipo de vuelo (c=2)
(r = 3) Nacional Internacional total
O11=30 25 55
E11=29.3333 25.6667
Clase económica Contribución=0.0152 0.0173
35 25 60
32 28
Clase Ejecutiva 0.2813 0.3214
15 20 35
18.6667 16.3333
Primera clase 0.7202 0.8231
total 80 70 150

𝑛. 𝑗 ∗ 𝑛𝑖. 80 ∗ 55 (30 − 29.3333)2


𝑒𝑖𝑗 = = = 29.3333 Cont1 = = 0.0153
𝑛. . 150 29.3333

No R Ho
(𝑂𝑖𝑗 − 𝐸𝑖𝑗)2 RR
𝑋𝑐2 = ∑ ∑ = 0.0152 + 0.2813 + ⋯ + 0.8231 = 2.1785 RA
𝐸𝑖𝑗 α

Gl=(r-1)*(c-1)= (3-1)*(2-1)=2*1=2 0.05


2.1785 < 5.991
X2(0.95,2 )
Como 𝑋𝑐2 se encuentra en la región de aceptación, no se rechaza Ho, con un
nivel de significancia del 5%, existe evidencia estadística para afirma que no
existe alguna relación entre el tipo de boleto y el tipo de vuelo.
NOTA:
V. Cuantitativa: Ejemplo: Edad: 25,32 ,47,52, etc
V. Cualitativa: Ejemplo: tipo de vuelo: clase económica, clase económica, clase ejecutiva,
etc.
PROBLEMA 2

En un estudio de mercado se tiene como objetivo establecer si las


preferencias acerca del tipo de envase de dulce de leche son similares
(homogeneidad/igualmente probables) para hombres y mujeres. Se ha
hecho una encuesta a 200 personas y se han obtenido los datos:
Grupos X: Tipo de envase (r=4)
(k=2) lata plástico cartón vidrio total
varones 27 30 19 24 100
mujeres 12 29 26 33 100
Total 39 59 45 57 200
Establecer un contrate de hipótesis entre las preferencias de envase entre
hombres y mujeres con nivel de significancia del 5%.
Ho: Las preferencias acerca del envase ( r=4 categorías) de dulce de leche son similares
(homogéneos) para hombres y mujeres (k=2 grupos) ¿?
H1: Al menos una de las preferencias acerca del envase de dulce de leche NO es similar (NO
son homogéneos) para hombres y mujeres
α=0.05
X: Tipo de envase Grupos (k=2)
( r= 4) varones mujeres total
Lata O11=27 12 39
E11=19.5 19.5
Contribución=2.8846 2.8846
Plástico 30 29 59
29.5 29.5
0.0085 0.0085
Cartón 19 26 45
22.5 22.5
0.5444 0.5444
vidrio 24 33 57
28.5 28.5
0.7105 0.7105
total 100 100 200

𝑛. 𝑗 ∗ 𝑎𝑖. 100 ∗ 39 (𝑂𝑖𝑗 − 𝐸𝑖𝑗)2 (27 − 19.5)2


𝑒𝑖𝑗 = = 𝐸11 = = 𝑐𝑜𝑛𝑡𝑟1 =
𝑛. . 200 𝐸𝑖𝑗 19.5

(𝑂𝑖𝑗 − 𝐸𝑖𝑗)2 RR
𝑋𝑐2 = ∑∑ = 2.8846 + 0.0085 + ⋯ + 0.7105 = 8.296 α
𝐸𝑖𝑗
0.05
Gl=(r-1)*(k-1)= (4-1)*(2-1)=3*1=3 7.815 8.296
X2(0.95,3)
Como 𝑋𝑐2 se encuentra en la región de rechazo, se rechaza Ho, con un nivel de
significancia del 5%, existe evidencia estadística para afirmar que las
preferencias acerca del envase de dulce de leche NO son similares (NO son
homogéneos) para hombres y mujeres (k=2 grupos).
PROBLEMA 3

Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con
métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el
segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio
con pesas y se ejercita en el pedaleo de alta frecuencia. Después de un mes de
entrenamiento se realiza un test de rendimiento consistente en un recorrido
cronometrado de 4 Km. Los tiempos (minutos) (cuantitativa) empleados fueron los
siguientes:
Método 1 Método 2 Método 3 K=3
15 14 13
16 13 12
14 15 11
15 16 14
17 14 11
T1=77 T2=72 T3=61 T=210
n1=5 ciclista n2=5 n3=5 n=15
A un nivel de significación del 5% ¿Puede considerarse que los tres métodos producen
resultados equivalentes (iguales)? Plantee las hipótesis y realice las pruebas
necesarias. (asumir que se cumplen los supuestos (gráfica y/o valor) para aplicar ANOVA)
Ho: u1=u2=u3 ¿? X
H1: al menos un ui es diferente (ui ≠ uj para un i, un j) (al menos un método presenta
tiempos diferentes)
α=0.05
𝑘 𝑟
2 𝑇2 2102 Rechazo Ho
𝑆𝐶𝑇 = ∑ ∑ 𝑦𝑖𝑗 − = (152 + 162 + ⋯ + 112 ) − = 44 RR
𝑛 15
𝑗=1 𝑖=1 α

0.05
𝑘 3.89 9.3491
𝑇.𝑗2 𝑇2
77 2
72 612 2
210 2
F(0.05,2,12)
𝑆𝐶𝑡𝑟 = ∑ − =( + + )− = 26.8
𝑛𝑗 𝑛 5 5 5 15
𝑗=1
FV gl SC CM Fc
Tr/factor 2 26.8 13.4 9.3491
Error 12 17.2 1.4333
Total 14 44
Como Fc se encuentra en la región de rechazo, se rechaza Ho, con un nivel de significancia del
5%, no existe evidencia estadística para considerar (afirmar) que los tres métodos producen
resultados equivalentes.
Problema 4
Para realizar un análisis del tiempo de ensamblaje de televisores de una fábrica
seleccionó tres líneas de producción de los que se recolectó los datos correspondientes
de una muestra aleatoria e independiente. ¿Qué línea de producción presenta mejor
tiempo promedio de ensamblaje? Utilice la salida del Minitab.

Tukey Pairwise Comparisons


Grouping Information Using the Tukey Method and 95% Confidence
Línea N Media Agrupación
2 5 63.74 A
1 5 59.26 B
3 5 56.62 B
Con un 95% de nivel de confianza se tiene que el tiempo de ensamblaje de los televisores de las
líneas de producción 1 y 3 pertenecen a la agrupación B, existe evidencia estadística para
afirmar que los tiempos promedios (poblacional) de ensamblaje de los televisores entre estas
dos líneas de producción son iguales: u1 = u3.
El tiempo de ensamblaje de los televisores de la línea de producción 2 pertenece a la
agrupación A.
Podemos concluir de acuerdo a las agrupaciones y medias muestrales que las líneas de
producción 1 y 3 presentan mejores tiempos promedios de ensamblaje, siendo valores menores
que línea de producción 2. (u1=u3) < u2
NOTA
LA LÍNEA 1 PRESENTA MEJOR TIEMPO (V o F) (…F….)
LA LÍNEA 1 y 3 PRESENTA MEJOR TIEMPO (V o F) (…V….)
Problema 5
Realice pruebas estadísticas de cada una de las siguientes gráficas de Minitab
(utilice un nivel de significancia del 5%)
TEORIA: P-VALOR < ALFA, RECHAZO HO
a) Prueba de Normalidad

Ho: Los errores siguen una distribución Normal


H1: Los errores NO siguen una distribución Normal
α=0.05
p-valor:0.463 > α=0.05, No se rechaza Ho, con un nivel de significancia del 5% existe
evidencia estadística para afirmar que los errores siguen una distribución Normal.

b)

.
Ho: Las varianzas poblacionales son iguales
H1: Al menos una varianza poblacional es diferente
α=0.05
p-valor=0.917> α=0.05, No rechazo Ho, con un nivel de significancia del 5%, existe
evidencia estadística para afirmar que las varianzas poblacionales son iguales.
PROBLEMA 6
El gerente de marketing de una compañía desea determinar si un nuevo envase podría aumentar
las ventas de su producto. Para probar la factibilidad de la nueva forma de envase se seleccionó
una muestra de 18 tiendas similares y se asignaron, en forma aleatoria, 10 de ellas como
mercado de prueba de la nueva forma de envase, en tanto que las otras 8 continuarían recibiendo
el envase antiguo. Las ventas semanales durante el tiempo de estudio fueron las siguientes:
Envase nuevo (1) Envase antiguo (2)
n1 = 10 n1 = 8
x 1 = 130 cajas x 2 = 118 cajas
S1 = 10 cajas S2 = 12 cajas
Si se sabe que el nivel de ventas con el envase nuevo y con el envase antiguo se comporta
según una distribución normal y que las muestras tomadas son independientes, ¿Tiene
evidencia de que la nueva forma de envase dio como resultado un mayor nivel de ventas?
Utilizar un nivel de significancia del 5%
(Asumir que las varianzas poblacionales (desconocidas) son iguales) u1 - u2 (caso 2)
Variable: Xi: Número de cajas de los envases nuevos (envases antiguos)
Parámetro: ui: Número promedio poblacional de cajas de los envases nuevos (envases antiguos)
Datos: u1 > u2 ¿? –> u1-u2 > 0 ¿? x1 − x2 − 0
Ho: u1-u2 ≤ 0 (uo) Tc =  Tn1 +n2 −2
 ( n1 −1) s12 + ( n2 −1) s22   1 1 
H1: u1-u2 > 0 ¿?     + 
α=0.05  n1 + n2 − 2   n1 n2  RR
130 − 118
𝒕𝒄 = = 2.3167 α
2 2
√(9 ∗ 10 ) + (7 ∗ 12 ) ∗ ( 1 + 1)
16 10 8 0.05
1.746 2.3167
Como tc se encuentra en la región de rechazo, se rechaza Ho, con un nivel de significancia del t(16, 0.95)
5%, existe evidencia estadística para afirmar que la nueva forma de envase dio como resultado
un mayor nivel de ventas.
PROBLEMA 7
El gerente de una compañía de fabricación de kits de productos de belleza, está supervisando el ultimo
lote de producción de las dos sedes, en la siguiente tabla se presenta el número de kits completos e
incompletos en muestras aleatorias de ambas sedes de fabricación:
Muestra Proporción
Sede completo Incompleto
incompletos
Casma (1) 523 64 n1=587 p1=64/587=0.1091
Lomas (2) 571 58 n2=629 p2=58/629=0.0922
El gerente quiere analizar si la proporción de kits incompletos en ambas sedes es diferente. (n.s. 5%)
a) Plantee las hipótesis correspondientes. p1 − p2
b) Calcule el estadístico de prueba y establezca la región de rechazo. Zc =
1 1
c) Concluya de acuerdo al enunciado del problema. p (1 − p)
 n + n 
Ho: π1 - π2 = 0 √  1 2 
x +x n  p + n  p2 R Ho
H1: π1- π2 ≠ 0 Gerente ¿? X p= 1 2 = 1 1 2 No
α=0.05 n1 + n2 n1 + n2 R Ho
α/2
64 + 58 R Ho
p̂ = = 0.1003 α/2
587 + 629
0.1091 − 0.0922
𝑍𝑐 = = 0.9803 -1.96<0.9803<1.96
√0.1003 ∗ (0.8997) ∗ ( 1 1 Z(0.025) Z(0.975)
+ )
587 629
Como Zc se encuentra entre los dos valores críticos, no rechazamos la hipotesis nula, con un
nivel de significancia del 5%, NO existe evidencia estadística para afirmar que la proporción de
kits incompletos de productos de belleza sean diferentes en ambas sedes.
MODELO DE EXAMEN FINAL DE ESTADÍSTICA APLICADA

1. El encargado de marketing de un banco de la ciudad sospecha que una persona


cuente con un ahorro está relacionado (no están relacionados) con el grupo de edad.
Para verificar esta relación, seleccionó aleatoriamente un grupo de clientes,
entrevistándolos, cuyos resultados se muestran a continuación:
X: Cuenta con Ahorro Y: Edad (cualitativas)
(Cualitativa) Menor de 30 De 30 a más total
Si 15 85 100
No 64 36 100
total 79 121 200
Utilice un nivel de significancia del 2.5%.
a) [CB/1P] Plantee las hipótesis correspondientes.
b) [RPM/3P] Calcule el estadístico de prueba y establezca la región de rechazo.
c) [CM/1P] Concluya de acuerdo al enunciado del problema.

Prueba estadística: Prueba de independencia

(Prueba de homogeneidad: categoría de una variable es homogénea en cada grupo)

2. El administrador de una empresa de productos de limpieza está interesado en


determinar las ventas (miles de soles) a través del monto de inversión en publicidad
(miles de soles). Por tal motivo, el investigador seleccionó 10 promociones
realizadas y registró la siguiente información:

Inversión en
8 10 5 7 11 6 13 9 12 14
publicidad (X)
Ventas (Y) 76 80 65 73 82 70 87 78 85 90

De donde:
∑ 𝑥 = 95 , ∑ 𝑦 = 786

Si la inversión en publicidad y las ventas se relacionan linealmente, se pide:

a) [RPM/3P] Calcule la recta de regresión. Muestre todos los cálculos.

y=bo+b1x → Ventas= 54.1879+2.5697 Inversión

b) [CM/1P] Explique el significado de la pendiente de la recta de regresión.

Si en la inversión (X) se adiciona mil soles, en promedio, las ventas (Y)


incrementa 2.5697 miles de soles
3. [RPM/5P] El dueño de una compañía de venta de bolsas de cemento (50 kg.) desea
comparar el número diario de bolsas de cemento (cuantitativa) de dos líneas de
producción, se recolecto información de un grupo de días, se muestran a
continuación:
Línea de producción
Resumen de resultados
A B
Tamaño de la muestra 13 15
Número diario promedio de
895 912
bolsas de cemento
Desviación estándar del
36 29
número diario de bolsas

Si se sabe que el número diario de bolsas de cemento de ambas líneas de


producción sigue una distribución normal y que las muestras tomadas son
independientes, ¿se tiene evidencia suficiente de que el número diario de bolsas de
cemento de la línea de producción A es mayor que el número diario de bolsas de
cemento de la línea de producción B? Utilice un nivel de significancia del 2.5%.
(Asuma que las varianzas poblacionales son homogéneas)

Prueba estadística: Prueba de hipótesis para la diferencia de medias (caso 2)

4. En una empresa de tiendas por departamento, el administrador está evaluando la


eficacia de los servicios de entrega de tres agencias, para este fin, se tomó
información del número de entregas realizadas de cuatros días de cada agencia, se
muestra a continuación:
Agencia 1 Agencia 2 Agencia 3
25 27 26
32 41 39
28 26 33
39 34 42
Suma 124 128 140
Sumatoria de cuadrados 3954 4242 5050

a) [RPM/4P] Con un nivel de significancia del 5%, ¿existe evidencia estadística para
concluir que hay diferencias significativas entre los números promedios de entregas
realizadas de las tres agencias?

b) [CM/2P] ¿Qué agencia(s) registra eficacia en el número entregas realizadas? Utilice


los siguientes resultados obtenidos con el Minitab:

Comparaciones en parejas de Tukey (95% de nivel de confianza)


Factor N Media Agrupación
Agencia 1 4 31.0 A
Agencia 2 4 32.0 A
Agencia 3 4 35.0 B
5. El dueño de una concesionaria de venta de autos está interesado en determinar las
ventas (miles de soles) a través del monto de inversión en marketing (miles de
soles). Por tal motivo, seleccionó 10 promociones realizadas y registró la siguiente
información:
Inversión en
12 11 14 17 10 15 18 13 16 19
marketing (X)
Ventas (Y) 83 81 86 92 80 89 93 85 90 97
De donde:
∑ 𝑥 = 145 , ∑ 𝑦 = 876
Si la inversión en marketing y las ventas se relacionan linealmente, se pide:
c) [RPM/3P] Calcule la recta de regresión. Muestre todos los cálculos.
d) [CM/1P] Explique el significado de la pendiente de la recta de regresión.

6. Un sociólogo sospecha que la condición laboral está relacionada con el grado de


estudio alcanzado. Para verificar esta relación, seleccionó aleatoriamente un grupo
de personas, entrevistándolos, cuyos resultados se muestran a continuación:

Grado de estudios alcanzados


Condición laboral
Secundaria Universitario total
Dependiente 54 89 143
Independiente 76 41 117
total 130 130 260

Utilice un nivel de significancia del 5%.


d) [CB/1P] Plantee las hipótesis correspondientes.
e) [RPM/3P] Calcule el estadístico de prueba y establezca la región de rechazo.
f) [CM/1P] Concluya de acuerdo al enunciado del problema.

7. [RPM/5P] En una cadena de tiendas por departamento, el administrador desea


comparar las ventas (miles de soles) de dos sedes, se recolecto información de las
ventas de un grupo de días, se muestran a continuación:

Sede
Resumen de resultados
Breña Lince
Tamaño de la muestra 11 13
Venta diaria promedio 38.4 41.6
Desviación estándar de las
10.2 8.7
ventas diarias

Si se sabe que las ventas de ambas sedes siguen una distribución normal y que las
muestras tomadas son independientes, ¿se tiene evidencia suficiente de que la
venta diaria promedio de la sede de Breña es menor que la venta diaria promedio
de la sede de Lince? Utilice un nivel de significancia del %.
(Asuma que las varianzas poblacionales son homogéneas)
8. El jefe de control de calidad está evaluando la eficacia de carga de baterías de
energía de tres modelos de batería (AB, EF y WZ), para este fin, se tomó información
del tiempo (horas) de carga completa de cuatro baterías de energía en cada modelo,
se muestra a continuación:
AB EF WZ
3 5 6
4 6 4
5 7 5
6 4 8
Suma 18 22 23
Sumatoria de cuadrados 86 126 141
c) [RPM/4P] Con un nivel de significancia del 5%, ¿existe evidencia estadística para
concluir que hay diferencias significativas entre los tiempos de carga completa de
los tres modelos de batería de energía?
d) [CM/2P] ¿Qué modelo(s) de batería de energía registra eficacia en tiempo de carga
completa? Utilice los siguientes resultados obtenidos con el Minitab:
Comparaciones en parejas de Tukey (95% de nivel de confianza)
Factor N Media Agrupación
Modelo AB 4 4.50 A
Modelo EF 4 5.50 B
Modelo WZ 4 5.75 B

FORMULARIO
R C (Oi j − Ei j) 2
Ri  C j
 2 =  Ei j =
n
i =1 j =1 Ei j
Tabla de análisis de varianza (ANOVA)
Fuente de Grados de Suma de Cuadrado Medio
F
Variación Libertad (GL) Cuadrados (SC) (CM)
SCF
Factor k -1 SCF CMF =
k −1 CMF
Fc =
SCE CME
Error n-k SCE CME =
n−k

Total n -1 SCT

k
T..2
n k T2
SCT =  y −
T. 2.
SCF =  − SCE = SCT − SC F
2 j
ij
i =1 j =1 n i =1 n j n
Regresión lineal
SPXY SPXY
b1 = ; r= 𝑺𝑪(𝑿) = ∑ 𝒙𝟐 − 𝒏𝒙
̅𝟐
SC X SC X SC Y
b0 = y − b1 x
𝑺𝑪(𝒀) = ∑ 𝒚𝟐 − 𝒏𝒚
̅𝟐
SC Re g
R2 = 𝑺𝑷(𝑿𝒀) = ∑ 𝒙𝒚 − 𝒏 𝒙̅ 𝒚
̅
SCT
Modelo examen final DE ESTADISTICA APLICADA

TEMAS:
- DIFERENCIA DE MEDIAS
- ANALISIS DE VARIANZA (ANOVA)
- PRUEBA DE INDEPENDENCIA

PROBLEMA 1
En la empresa DEFESA que se dedica a la venta de fotocopiadoras, el jefe de control de calidad
realizó un estudio con la finalidad de comparar la efectividad de tres modelos de fotocopiadoras
(alfa, beta y gamma); se registraron el número de copias erradas de un libro (de 500 páginas),
en 15 fotocopiadoras. Los resultados obtenidos son los siguientes:
Alfa Beta Gamma k n
T..2
34 76 64 SCT = i =1 j =1
yij −
2

n
56 73 23
35 64 71 k T2
T. 2.
75
45
55
23
32
56
SCF =  i =1 n
j

n
j
T1=245 T2=291 T3=246 T=782
n1=5 n1=5 n1=5 n=15
𝑘 𝑛

∑ ∑ 𝑋𝑖𝑗2 = 45748
𝑖=1 𝑗=1
a) (4 puntos) Con un nivel de significancia del 5%, ¿existe diferencia entre los tipos de modelos
de fotocopiadora? K=3
Ho: µ1= µ2= µ3
H1: al menos un µ1 es diferente
α=0.05
7822
𝑆𝐶𝑇 = 45748 − = 4979.73
15
2452 2912 2462 7822
𝑆𝐶𝐹 = ( + + )− = 276.13
5 5 5 15
Fuente de Grados de Suma de Cuadrado Medio
F
Variación Libertad (GL) Cuadrados (SC) (CM)
Factor 2 276.13 138.065
0.35
Error 12 4703.6 391.97
Total 14 4979.73

RHo

0.35 < 3.89


F(2,12,0.05)
No Rho con n.s. 5%, no existe evidencia estadística para afirmar que exista diferencia entre los
tipos de modelo de fotocopiadoras.
b) (2 puntos) ¿Qué formula presenta mejores resultados? Utilice los siguientes resultados
obtenidos con el Minitab:
Comparaciones en parejas de Tukey

Modelo N Media Agrupación


1Alfa 5 49.00 B
2Beta 5 58.20 A
3Gamma 5 49.20 B
µ2 > µ1= µ3
Las fotocopiadas de los modelos Alfa y Gamma presentan mejores resultados, en que en
promedio tienen menores número de copias erradas en el libro en comparación con el modelo
Beta. R C (O − E ) 2
2 =  ij ij

PROBLEMA 2 i =1 j =1 Ei j
(4 puntos) En el centro de salud de la ciudad, un médico investigador desea probar si existe
relación entre el tipo de paciente y las urgencias (heridas cortantes y quemaduras). Para esto,
se recolectó información de un grupo de pacientes del centro de salud registrados en el mes
anterior. Los resultados obtenidos son los siguientes:
Tipo de paciente Heridas cortantes quemaduras Total
Ri  C j
Ei j = Escolar 41 25 66
n trabajador 23 22 45
Ama de casa 25 34 59
Total 89 81 170

Al 5% de significancia, ¿se puede afirmar que el tipo de paciente está relacionado con la
urgencia? r=3, c=2 -→ (r-1)*(c-1)= (3-1)*(1-1)=2
Ho: Las variables tipo de paciente y urgencia son independientes (no existe relación)
H1: Las variables tipo de paciente y urgencia NO son independientes (SI existe relación)
α=0.05
Tipo de paciente Heridas cortantes quemaduras Total
Escolar 41 25 66
34.553 31.447
1.203 1.322
Trabajador 23 22 45
23.559 21.441
0.013 0.015
Ama de casa 25 34 59
30.889 28.112
1.123 1.233
Total 89 81 170

𝑿𝟐𝒄 = 𝟒. 𝟗𝟎𝟗

RHo

4.909 < 5.991


X2 (2,0.95)
No Rho con n.s. 5%, no existe evidencia estadística para afirmar que existe relación entre estas
dos variables.
PROBLEMA 3
(5 puntos) El administrador de la empresa de ventas de productos envasados (fideos, harinas,
menestras, arroz, etc.) desea comparar las ventas mensuales de los vendedores de dos zonas
de la ciudad. Para esto, el administrador tomó una muestra aleatoria de las ventas de los
vendedores de cada una de las zonas. Los resultados obtenidos, en miles de soles, se muestran
en la siguiente tabla:
Zona norte 12 15 18 20 22 14
Zona sur 16 12 21 18 19 25
Las desviaciones estándar para cada zona son:
S norte = 3.8166
S sur = 4.4159
¿Existe suficiente evidencia estadística para afirmar que existen diferencias entre las ventas de
las dos zonas? Use un nivel de significancia del 5%.
Asuma que las ventas mensuales siguen una distribución normal y que las varianzas de estas
ventas son homogéneas.
Ho: µ1 - µ2= 0
T =
( 1 − 2) − (
x x  
1

2
)
H1: µ1 - µ2 ≠0 c
(n1 − 1)S1 + (n2 − 1)S2
2 2
1 1 
 + 
α=0.05 n1 + n2 − 2
𝟏𝟔. 𝟖𝟑 − 𝟏𝟖. 𝟓  1
n n2 
𝑻𝒄 = = −𝟎. 𝟔𝟗𝟕
𝟐 𝟐
√(𝟓 ∗ 𝟑. 𝟖𝟏𝟔𝟔 ) + (𝟓 ∗ 𝟒. 𝟒𝟏𝟓𝟗 ) (𝟏 + 𝟏)
𝟏𝟎 𝟔 𝟔

RHo RHo

-2.228 < -0.697 < 2.228


T(10,0.975)
No Rho con n.s. 5%, no existe evidencia estadística para afirmar que existen diferencias entre las
ventas de las dos zonas.
FORMULARIO

Prueba Fórmula

R C (Oi j − Ei j ) 2 Ri  C j
Independencia  = 
2
Ei j =
i =1 j =1 Ei j n

Tc =
( x1 − x2) − (  − )
1 2

 −
1 2
(n1 − 1)S + (n2 − 1)S
2
1
2
2
1
 +
1 

n1 + n2 − 2  n1 n2 

Tabla de Análisis de Varianza (ANOVA)


Fuente de Grados de Suma de Cuadrado Medio
F
Variación Libertad (GL) Cuadrados (SC) (CM)
Factor k -1 SCF SCF
CMF = CMF
k −1 Fc =
SCE CME
Error n-k SCE CME =
n−k
Total n -1 SCT

k n
T..2 T j2 T. 2.
SCT =  y −
k
SCF =  −
2
ij SCE = SCT − SC F
i =1 j =1 n i =1 n j n
Variable: x: Resistencia del diametro de tornillo 3/8 (o 1/2)

Parámetro: µ: Resistencia promedio POBLACIONAL del diametro de tornillo 3/8 (o 1/2)

Parámetro: 𝜎 2 : Varianza POBLACIONAL de la resistencia del diametro de tornillo 3/8 (o 1/2)

Para evaluar si las varianzas poblacionales son homogéneas realizamos la prueba de hipotesis
del cociente de varianzas.

Ho: 𝜎12 = 𝜎22


s12
Fc =  Fn1−1,n2−1
H1: 𝜎12 ≠ 𝜎22 s22 R Ho No
R Ho
α = 0.05 R Ho

1.32 0.3356 < 0.5988 < 2.98


𝐹𝑐 = = 0.5988 1/ 2.98
1.682
1/F(0.025,14,14) F(0.025,14,14)
Como Fc se encuentra en la región de no rechazo, no rechazamos la hipótesis nula. Con un nivel de
significancia del 5%, existe evidencia estadística para afirmar que las varianzas son homogéneas.
Prueba
Hipótesis nula H₀: σ₁² / σ₂² = 1
Hipótesis alterna H₁: σ₁² / σ₂² ≠ 1
Nivel de significancia α = 0.05
Estadística
Método de prueba GL1 GL2 Valor p
F 0.60 14 14 0.348
p-valor=0.348 > α = 0.05, No rechazo Ho …..
Como se probó que las varianzas poblacionales son homogéneas, realizamos la prueba de
hipótesis de diferencia de medias caso 2. ¿ 𝜇1 < 𝜇2 + 𝟐?

Ho: 𝜇1 − 𝜇2 ≥ 2 No
R Ho
H1: 𝜇1 − 𝜇2 < 𝟐 ( la resistencia promedio de los tornillos de ½ excede
a la resistencia promedio de los tornillos de 3/8 en más de 2 kilos/libra) R Ho
α = 0.05
(4.25 − 7.14) − 2 -8.9156 < -1.701
𝑇𝑐 = = −8.9156 t(0.05, 28)
2 2
√(14 ∗ 1.3 ) + (14 ∗ 1.68 ) ∗ ( 1 + 1 )
28 15 15
Como tc se encuentra en región critica, rechazamos la hipótesis nula. Con un nivel de
significancia del 5%, SI existe evidencia estadística para pensar que la resistencia promedio de
los tornillos de ½ excede a la resistencia promedio de los tornillos de 3/8 en más de 2 kilos/libra.

Prueba
Hipótesis nula H₀: μ₁ - µ₂ = 2

Hipótesis alterna H₁: μ₁ - µ₂ < 2

Valor T GL Valor p

-8.92 28 0.000

p-valor=0 < α = 0.05, Rechazo Ho …..


Máquina A n1=10 𝑠1=12.0204
Máquina B n2=10 𝑠2=1.9120 No
R Ho R Ho
R Ho
Ho: 𝜎12 = 𝜎22 ¿? X 0.025 0.025
s12
2
H1: 𝜎1 ≠ 𝜎2 2 Fc =  Fn1−1,n2−1 0.248 4.03 < 39.5241
s22 1/4.03
α=0.05
1/F(0.025,9,9) F(0.025,9,9)
12.02042
𝐹𝑐 = = 39.5241
1.91202

Como Fc se encuentra en la región de rechazo, rechazamos la hipótesis nula. Con un nivel de


significancia del 5%, No existe evidencia estadística para afirmar que las variabilidades de los
tiempos de producción A y B son iguales, se evidencia que son diferentes.

Prueba
Hipótesis nula H₀: σ₁² / σ₂² = 1
Hipótesis alterna H₁: σ₁² / σ₂² ≠ 1
Nivel de significancia α = 0.05
Estadística
Método de prueba GL1 GL2 Valor p
F 39.53 9 9 0.000

p-valor=0 < α=0.05; Rechazo Ho …


Variable: x: Número de familias que ven el programa en la ciudad A (B)

Parámetro: π: Proporción POBLACIONAL de familias que ven el programa en la ciudad A (B)

Ho: 𝜋1 − 𝜋2 = 0
R Ho R Ho
H1: 𝜋1 − 𝜋2 ≠ 0 (porcentaje de familias que ven el programa en ambas ciudades es diferente) No
α = 0.03
R Ho
0.3 − 0.35
𝑍𝑐 = = −0.9639
√0.3273(0.6727) ( 1 1
+ ) -2.17 < -0.9639 < 2.17
150 180 Z(0.015) Z(0.985)

Como Zc NO se encuentra en región critica, NO rechazamos la hipótesis nula. Con un nivel de


significancia del 3%, NO existe evidencia estadística para afirmar que el porcentaje de familias
que ven el programa en ambas ciudades es diferente.

Prueba
Hipótesis nula H₀: p₁ - p₂ = 0
Hipótesis alterna H₁: p₁ - p₂ ≠ 0
Método Valor Z Valor p
Aproximación normal -0.96 0.335
Exacta de Fisher 0.348

La prueba basada en la aproximación a la normal utiliza la estimación agrupada de la


proporción (0.327273).

p-valor=0.335 > α = 0.03; No rechazo Ho ….


EJERCICIOS SEMANA 3 RESUELTOS

Variable: X: Ingreso mensual de los conductores de transporte público (cuantitiva)


Parámetro: u: Ingreso promedio (poblacional) mensual de los conductores de transporte
público
Ho: µ ≥ 3250 X Rechazo
H1: µ < 3250 ¿Gerente? √ Ho
No
α = 0.05 RR
n=36, 𝑥 =2950, s=75; CASO III R Ho
x − μ 2950 − 3250 0.05
𝐙𝐜   =   = = −24 -24 < -1.64
s/√n 75/√36
Como Zc=-24 se encuentra en la región de rechazo, se rechaza Ho. Z(0.05)
Con un nivel de significancia del 5%, Si existe evidencia estadística para afirmar la creencia del
gerente municipal de transporte de la ciudad de Lima de que el ingreso promedio mensual de
los conductores de transporte público es inferior a 3250 soles.

Ho: µ = 27.5 x−


H1: µ < 27.5 ¿Gerente? X Zc = No
/ n R Ho
α = 0.05
27.79 − 27.5 R Ho
𝑍𝑐 = = 1.906
0.9
√35 -1.64 <1.906
Como Zc=1.906 > Z(0.05)=-1.64, No rechazo la hipótesis nula. Con un nivel de significancia del
5%, NO existe evidencia estadística para apoyar las creencias del gerente de la empresa
distribuidora de agendas ARBY de que el ingreso semanal promedio es menor a 27 500 soles
(27.5 miles de soles).
Ho: π = 0.74
P −0 R Ho
H1: π > 0.74 ¿funcionario? Zc =
 0 (1 −  0 ) No R Ho
α = 0.02 RR
n
RA
0.7682 − 0.74 0.02
𝑍𝑐 = = 2.13
√0.74 ∗ 0.26 2.05 < 2.13
1100 Z(0.98)=Z(1-α)
Como Zc=2.13 > Z(0.98)=2.05, Rechazo la hipótesis nula. Con un nivel de significancia del 2%, SI
existe evidencia estadística para afirmar que la proporción (porcentaje) de usuarios que están
disconformes con el trato que reciben el servicio tributario supera el 0.74 (74%).

Ho: π = 0.35
P −0
Zc =
H1: π < 0.35 ¿?  0 (1 −  0 ) R Ho No
α = 0.02 n RR R Ho
0.32−0.35
𝑍= =-1.1767

0.35∗0.65 -2.05 < -1.1767
350

Como Zc=-1.1767 > Z(0.02)=-2.05, No Rechazo la hipótesis nula. (p=112/350=0.32)

Con un nivel de significancia del 2%, no existe evidencia estadística para afirmar que la
proporción de adultos que tienen algún tipo de seguro de pensión es menor a 0.35.
Ho: µ = 280
x−
Tc =  t( n−1 )
H1: µ < 280 ¿? s/ n R Ho No
α = 0.06 RR R Ho
279 − 280
𝑇= = −20 -20 < -1.612
0.25
√25
(CASO 2) Como Tc=-20 < t(0.06, 24)=-1.612, Rechazo la hipótesis nula.

Con un nivel de significancia del 6%, SI existe evidencia estadística para afirmar que el peso
promedio de los empaques de galletas es menor a 280 gr.

También podría gustarte