Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PROBLEMA 1
Se cree que el tipo de boleto que un estudiante de USIL adquiere para realizar
un viaje en avión depende del tipo de vuelo (Nacional e Internacional). Para
probar si existe alguna relación entre estas variables, se toma una muestra de
150 estudiantes y se obtienen los siguientes resultados:
No R Ho
(𝑂𝑖𝑗 − 𝐸𝑖𝑗)2 RR
𝑋𝑐2 = ∑ ∑ = 0.0152 + 0.2813 + ⋯ + 0.8231 = 2.1785 RA
𝐸𝑖𝑗 α
(𝑂𝑖𝑗 − 𝐸𝑖𝑗)2 RR
𝑋𝑐2 = ∑∑ = 2.8846 + 0.0085 + ⋯ + 0.7105 = 8.296 α
𝐸𝑖𝑗
0.05
Gl=(r-1)*(k-1)= (4-1)*(2-1)=3*1=3 7.815 8.296
X2(0.95,3)
Como 𝑋𝑐2 se encuentra en la región de rechazo, se rechaza Ho, con un nivel de
significancia del 5%, existe evidencia estadística para afirmar que las
preferencias acerca del envase de dulce de leche NO son similares (NO son
homogéneos) para hombres y mujeres (k=2 grupos).
PROBLEMA 3
Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con
métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el
segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio
con pesas y se ejercita en el pedaleo de alta frecuencia. Después de un mes de
entrenamiento se realiza un test de rendimiento consistente en un recorrido
cronometrado de 4 Km. Los tiempos (minutos) (cuantitativa) empleados fueron los
siguientes:
Método 1 Método 2 Método 3 K=3
15 14 13
16 13 12
14 15 11
15 16 14
17 14 11
T1=77 T2=72 T3=61 T=210
n1=5 ciclista n2=5 n3=5 n=15
A un nivel de significación del 5% ¿Puede considerarse que los tres métodos producen
resultados equivalentes (iguales)? Plantee las hipótesis y realice las pruebas
necesarias. (asumir que se cumplen los supuestos (gráfica y/o valor) para aplicar ANOVA)
Ho: u1=u2=u3 ¿? X
H1: al menos un ui es diferente (ui ≠ uj para un i, un j) (al menos un método presenta
tiempos diferentes)
α=0.05
𝑘 𝑟
2 𝑇2 2102 Rechazo Ho
𝑆𝐶𝑇 = ∑ ∑ 𝑦𝑖𝑗 − = (152 + 162 + ⋯ + 112 ) − = 44 RR
𝑛 15
𝑗=1 𝑖=1 α
0.05
𝑘 3.89 9.3491
𝑇.𝑗2 𝑇2
77 2
72 612 2
210 2
F(0.05,2,12)
𝑆𝐶𝑡𝑟 = ∑ − =( + + )− = 26.8
𝑛𝑗 𝑛 5 5 5 15
𝑗=1
FV gl SC CM Fc
Tr/factor 2 26.8 13.4 9.3491
Error 12 17.2 1.4333
Total 14 44
Como Fc se encuentra en la región de rechazo, se rechaza Ho, con un nivel de significancia del
5%, no existe evidencia estadística para considerar (afirmar) que los tres métodos producen
resultados equivalentes.
Problema 4
Para realizar un análisis del tiempo de ensamblaje de televisores de una fábrica
seleccionó tres líneas de producción de los que se recolectó los datos correspondientes
de una muestra aleatoria e independiente. ¿Qué línea de producción presenta mejor
tiempo promedio de ensamblaje? Utilice la salida del Minitab.
b)
.
Ho: Las varianzas poblacionales son iguales
H1: Al menos una varianza poblacional es diferente
α=0.05
p-valor=0.917> α=0.05, No rechazo Ho, con un nivel de significancia del 5%, existe
evidencia estadística para afirmar que las varianzas poblacionales son iguales.
PROBLEMA 6
El gerente de marketing de una compañía desea determinar si un nuevo envase podría aumentar
las ventas de su producto. Para probar la factibilidad de la nueva forma de envase se seleccionó
una muestra de 18 tiendas similares y se asignaron, en forma aleatoria, 10 de ellas como
mercado de prueba de la nueva forma de envase, en tanto que las otras 8 continuarían recibiendo
el envase antiguo. Las ventas semanales durante el tiempo de estudio fueron las siguientes:
Envase nuevo (1) Envase antiguo (2)
n1 = 10 n1 = 8
x 1 = 130 cajas x 2 = 118 cajas
S1 = 10 cajas S2 = 12 cajas
Si se sabe que el nivel de ventas con el envase nuevo y con el envase antiguo se comporta
según una distribución normal y que las muestras tomadas son independientes, ¿Tiene
evidencia de que la nueva forma de envase dio como resultado un mayor nivel de ventas?
Utilizar un nivel de significancia del 5%
(Asumir que las varianzas poblacionales (desconocidas) son iguales) u1 - u2 (caso 2)
Variable: Xi: Número de cajas de los envases nuevos (envases antiguos)
Parámetro: ui: Número promedio poblacional de cajas de los envases nuevos (envases antiguos)
Datos: u1 > u2 ¿? –> u1-u2 > 0 ¿? x1 − x2 − 0
Ho: u1-u2 ≤ 0 (uo) Tc = Tn1 +n2 −2
( n1 −1) s12 + ( n2 −1) s22 1 1
H1: u1-u2 > 0 ¿? +
α=0.05 n1 + n2 − 2 n1 n2 RR
130 − 118
𝒕𝒄 = = 2.3167 α
2 2
√(9 ∗ 10 ) + (7 ∗ 12 ) ∗ ( 1 + 1)
16 10 8 0.05
1.746 2.3167
Como tc se encuentra en la región de rechazo, se rechaza Ho, con un nivel de significancia del t(16, 0.95)
5%, existe evidencia estadística para afirmar que la nueva forma de envase dio como resultado
un mayor nivel de ventas.
PROBLEMA 7
El gerente de una compañía de fabricación de kits de productos de belleza, está supervisando el ultimo
lote de producción de las dos sedes, en la siguiente tabla se presenta el número de kits completos e
incompletos en muestras aleatorias de ambas sedes de fabricación:
Muestra Proporción
Sede completo Incompleto
incompletos
Casma (1) 523 64 n1=587 p1=64/587=0.1091
Lomas (2) 571 58 n2=629 p2=58/629=0.0922
El gerente quiere analizar si la proporción de kits incompletos en ambas sedes es diferente. (n.s. 5%)
a) Plantee las hipótesis correspondientes. p1 − p2
b) Calcule el estadístico de prueba y establezca la región de rechazo. Zc =
1 1
c) Concluya de acuerdo al enunciado del problema. p (1 − p)
n + n
Ho: π1 - π2 = 0 √ 1 2
x +x n p + n p2 R Ho
H1: π1- π2 ≠ 0 Gerente ¿? X p= 1 2 = 1 1 2 No
α=0.05 n1 + n2 n1 + n2 R Ho
α/2
64 + 58 R Ho
p̂ = = 0.1003 α/2
587 + 629
0.1091 − 0.0922
𝑍𝑐 = = 0.9803 -1.96<0.9803<1.96
√0.1003 ∗ (0.8997) ∗ ( 1 1 Z(0.025) Z(0.975)
+ )
587 629
Como Zc se encuentra entre los dos valores críticos, no rechazamos la hipotesis nula, con un
nivel de significancia del 5%, NO existe evidencia estadística para afirmar que la proporción de
kits incompletos de productos de belleza sean diferentes en ambas sedes.
MODELO DE EXAMEN FINAL DE ESTADÍSTICA APLICADA
Inversión en
8 10 5 7 11 6 13 9 12 14
publicidad (X)
Ventas (Y) 76 80 65 73 82 70 87 78 85 90
De donde:
∑ 𝑥 = 95 , ∑ 𝑦 = 786
a) [RPM/4P] Con un nivel de significancia del 5%, ¿existe evidencia estadística para
concluir que hay diferencias significativas entre los números promedios de entregas
realizadas de las tres agencias?
Sede
Resumen de resultados
Breña Lince
Tamaño de la muestra 11 13
Venta diaria promedio 38.4 41.6
Desviación estándar de las
10.2 8.7
ventas diarias
Si se sabe que las ventas de ambas sedes siguen una distribución normal y que las
muestras tomadas son independientes, ¿se tiene evidencia suficiente de que la
venta diaria promedio de la sede de Breña es menor que la venta diaria promedio
de la sede de Lince? Utilice un nivel de significancia del %.
(Asuma que las varianzas poblacionales son homogéneas)
8. El jefe de control de calidad está evaluando la eficacia de carga de baterías de
energía de tres modelos de batería (AB, EF y WZ), para este fin, se tomó información
del tiempo (horas) de carga completa de cuatro baterías de energía en cada modelo,
se muestra a continuación:
AB EF WZ
3 5 6
4 6 4
5 7 5
6 4 8
Suma 18 22 23
Sumatoria de cuadrados 86 126 141
c) [RPM/4P] Con un nivel de significancia del 5%, ¿existe evidencia estadística para
concluir que hay diferencias significativas entre los tiempos de carga completa de
los tres modelos de batería de energía?
d) [CM/2P] ¿Qué modelo(s) de batería de energía registra eficacia en tiempo de carga
completa? Utilice los siguientes resultados obtenidos con el Minitab:
Comparaciones en parejas de Tukey (95% de nivel de confianza)
Factor N Media Agrupación
Modelo AB 4 4.50 A
Modelo EF 4 5.50 B
Modelo WZ 4 5.75 B
FORMULARIO
R C (Oi j − Ei j) 2
Ri C j
2 = Ei j =
n
i =1 j =1 Ei j
Tabla de análisis de varianza (ANOVA)
Fuente de Grados de Suma de Cuadrado Medio
F
Variación Libertad (GL) Cuadrados (SC) (CM)
SCF
Factor k -1 SCF CMF =
k −1 CMF
Fc =
SCE CME
Error n-k SCE CME =
n−k
Total n -1 SCT
k
T..2
n k T2
SCT = y −
T. 2.
SCF = − SCE = SCT − SC F
2 j
ij
i =1 j =1 n i =1 n j n
Regresión lineal
SPXY SPXY
b1 = ; r= 𝑺𝑪(𝑿) = ∑ 𝒙𝟐 − 𝒏𝒙
̅𝟐
SC X SC X SC Y
b0 = y − b1 x
𝑺𝑪(𝒀) = ∑ 𝒚𝟐 − 𝒏𝒚
̅𝟐
SC Re g
R2 = 𝑺𝑷(𝑿𝒀) = ∑ 𝒙𝒚 − 𝒏 𝒙̅ 𝒚
̅
SCT
Modelo examen final DE ESTADISTICA APLICADA
TEMAS:
- DIFERENCIA DE MEDIAS
- ANALISIS DE VARIANZA (ANOVA)
- PRUEBA DE INDEPENDENCIA
PROBLEMA 1
En la empresa DEFESA que se dedica a la venta de fotocopiadoras, el jefe de control de calidad
realizó un estudio con la finalidad de comparar la efectividad de tres modelos de fotocopiadoras
(alfa, beta y gamma); se registraron el número de copias erradas de un libro (de 500 páginas),
en 15 fotocopiadoras. Los resultados obtenidos son los siguientes:
Alfa Beta Gamma k n
T..2
34 76 64 SCT = i =1 j =1
yij −
2
n
56 73 23
35 64 71 k T2
T. 2.
75
45
55
23
32
56
SCF = i =1 n
j
−
n
j
T1=245 T2=291 T3=246 T=782
n1=5 n1=5 n1=5 n=15
𝑘 𝑛
∑ ∑ 𝑋𝑖𝑗2 = 45748
𝑖=1 𝑗=1
a) (4 puntos) Con un nivel de significancia del 5%, ¿existe diferencia entre los tipos de modelos
de fotocopiadora? K=3
Ho: µ1= µ2= µ3
H1: al menos un µ1 es diferente
α=0.05
7822
𝑆𝐶𝑇 = 45748 − = 4979.73
15
2452 2912 2462 7822
𝑆𝐶𝐹 = ( + + )− = 276.13
5 5 5 15
Fuente de Grados de Suma de Cuadrado Medio
F
Variación Libertad (GL) Cuadrados (SC) (CM)
Factor 2 276.13 138.065
0.35
Error 12 4703.6 391.97
Total 14 4979.73
RHo
PROBLEMA 2 i =1 j =1 Ei j
(4 puntos) En el centro de salud de la ciudad, un médico investigador desea probar si existe
relación entre el tipo de paciente y las urgencias (heridas cortantes y quemaduras). Para esto,
se recolectó información de un grupo de pacientes del centro de salud registrados en el mes
anterior. Los resultados obtenidos son los siguientes:
Tipo de paciente Heridas cortantes quemaduras Total
Ri C j
Ei j = Escolar 41 25 66
n trabajador 23 22 45
Ama de casa 25 34 59
Total 89 81 170
Al 5% de significancia, ¿se puede afirmar que el tipo de paciente está relacionado con la
urgencia? r=3, c=2 -→ (r-1)*(c-1)= (3-1)*(1-1)=2
Ho: Las variables tipo de paciente y urgencia son independientes (no existe relación)
H1: Las variables tipo de paciente y urgencia NO son independientes (SI existe relación)
α=0.05
Tipo de paciente Heridas cortantes quemaduras Total
Escolar 41 25 66
34.553 31.447
1.203 1.322
Trabajador 23 22 45
23.559 21.441
0.013 0.015
Ama de casa 25 34 59
30.889 28.112
1.123 1.233
Total 89 81 170
𝑿𝟐𝒄 = 𝟒. 𝟗𝟎𝟗
RHo
RHo RHo
Prueba Fórmula
R C (Oi j − Ei j ) 2 Ri C j
Independencia =
2
Ei j =
i =1 j =1 Ei j n
Tc =
( x1 − x2) − ( − )
1 2
−
1 2
(n1 − 1)S + (n2 − 1)S
2
1
2
2
1
+
1
n1 + n2 − 2 n1 n2
k n
T..2 T j2 T. 2.
SCT = y −
k
SCF = −
2
ij SCE = SCT − SC F
i =1 j =1 n i =1 n j n
Variable: x: Resistencia del diametro de tornillo 3/8 (o 1/2)
Para evaluar si las varianzas poblacionales son homogéneas realizamos la prueba de hipotesis
del cociente de varianzas.
Ho: 𝜇1 − 𝜇2 ≥ 2 No
R Ho
H1: 𝜇1 − 𝜇2 < 𝟐 ( la resistencia promedio de los tornillos de ½ excede
a la resistencia promedio de los tornillos de 3/8 en más de 2 kilos/libra) R Ho
α = 0.05
(4.25 − 7.14) − 2 -8.9156 < -1.701
𝑇𝑐 = = −8.9156 t(0.05, 28)
2 2
√(14 ∗ 1.3 ) + (14 ∗ 1.68 ) ∗ ( 1 + 1 )
28 15 15
Como tc se encuentra en región critica, rechazamos la hipótesis nula. Con un nivel de
significancia del 5%, SI existe evidencia estadística para pensar que la resistencia promedio de
los tornillos de ½ excede a la resistencia promedio de los tornillos de 3/8 en más de 2 kilos/libra.
Prueba
Hipótesis nula H₀: μ₁ - µ₂ = 2
Valor T GL Valor p
-8.92 28 0.000
Prueba
Hipótesis nula H₀: σ₁² / σ₂² = 1
Hipótesis alterna H₁: σ₁² / σ₂² ≠ 1
Nivel de significancia α = 0.05
Estadística
Método de prueba GL1 GL2 Valor p
F 39.53 9 9 0.000
Ho: 𝜋1 − 𝜋2 = 0
R Ho R Ho
H1: 𝜋1 − 𝜋2 ≠ 0 (porcentaje de familias que ven el programa en ambas ciudades es diferente) No
α = 0.03
R Ho
0.3 − 0.35
𝑍𝑐 = = −0.9639
√0.3273(0.6727) ( 1 1
+ ) -2.17 < -0.9639 < 2.17
150 180 Z(0.015) Z(0.985)
Prueba
Hipótesis nula H₀: p₁ - p₂ = 0
Hipótesis alterna H₁: p₁ - p₂ ≠ 0
Método Valor Z Valor p
Aproximación normal -0.96 0.335
Exacta de Fisher 0.348
Ho: π = 0.35
P −0
Zc =
H1: π < 0.35 ¿? 0 (1 − 0 ) R Ho No
α = 0.02 n RR R Ho
0.32−0.35
𝑍= =-1.1767
√
0.35∗0.65 -2.05 < -1.1767
350
Con un nivel de significancia del 2%, no existe evidencia estadística para afirmar que la
proporción de adultos que tienen algún tipo de seguro de pensión es menor a 0.35.
Ho: µ = 280
x−
Tc = t( n−1 )
H1: µ < 280 ¿? s/ n R Ho No
α = 0.06 RR R Ho
279 − 280
𝑇= = −20 -20 < -1.612
0.25
√25
(CASO 2) Como Tc=-20 < t(0.06, 24)=-1.612, Rechazo la hipótesis nula.
Con un nivel de significancia del 6%, SI existe evidencia estadística para afirmar que el peso
promedio de los empaques de galletas es menor a 280 gr.