Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1) ¿Cuál es tu objetivo?
Podemos distinguir entre dos objetivos principales para las técnicas
explicativas: Asociar o Comparar.
Ver si tus datos cumplen o no con los supuestos de las pruebas estadísticas
clásicas (normalidad, homogeneidad, independencia).
Esto te permitirá elegir entre pruebas PARAMÉTRICAS, pruebas NO PARAMÉTRICAS y
pruebas ROBUSTAS.
Para ello tienes que responder a las siguientes preguntas: ¿Las variables tienen
distribución normal)?, ¿Los grupos tienen dispersión similar (son homogéneos)?.
𝜎12 𝜎22
𝑥ҧ1 −𝑥ҧ2 ± 𝑍𝛼/2 +
𝑛1 𝑛2
Material de Clases © G:P.P 15/12/2022
Prueba de Hipótesis e I.C. para la diferencia de medias 𝜇1 − 𝜇2
b) Desconociendo σ21 y σ22 pero asumiendo σ21 = σ22
Si 𝑋ത1 y 𝑋ത2 son las medias de dos muestras aleatoria independientes de tamaño 𝑛1 y 𝑛2
respectivamente de poblaciones aproximadamente normales con varianzas iguales pero
desconocidas. La distribución muestral de 𝑋ത1 − 𝑋ത2 , esta dado por la estadística de prueba.
𝑋ത1 − 𝑋ത2 − 𝜇1 − 𝜇2
𝑡=
1 1
𝑆𝑝 𝑛 + 𝑛
1 2
𝑋ത1 − 𝑋ത2 − 𝜇1 − 𝜇2
𝑡=
𝑆12 𝑆22
+
𝑛1 𝑛2
Se conoce 𝜎 entonces Z
2) Nivel de significación: = 0,01
3) Como se conoce 𝜎 entonces Z
Estadística de Prueba
𝑥ҧ1 − 𝑥ҧ2 − (𝜇1 − 𝜇2 )
𝑍=
𝜎12 𝜎22
𝑛1 + 𝑛2
75 − 65 − 0
𝑧𝑐 = = 3,12
202 252 Hallar el intervalo de confianza al 99%
+
100 100
𝜎12 𝜎22
𝑥ҧ1 −𝑥ҧ2 ± 𝑍𝛼/2 +
𝑛1 𝑛2
4) Valor crítico:
202 252
z1- = 2,33 (75-65)±2.576 + 100
100
Regla de Decisión:
1.75 ≤ 𝜇1 − 𝜇2 ≤18.25
Si zc > z1- se rechaza H0
Existen diferencias significativas entre las
5) Decisión de la Prueba: Rechazar H0 resistencias medias de la maquina nueva y
la antigua
6) Se comprar la máquina nueva
Ejemplo2: Los siguientes datos muestrales representan, los tiempos de duración en años,
de un tipo de pintura, con y sin aditivo de secado.
1=Con aditivo 2.1 5.3 1.4 4.6 0.9
2=Sin aditivo 1.9 0.5 2.8 3.1
a) Calcule un intervalo de confianza del 95% para las diferencias entre los tiempos de
duración promedio de la pintura con y sin aditivo
Como p>α entonces los datos tienen Como p=0.416>α =0.05entonces los datos
distribución NORMAL tienen igual varianza
5 − 1 1.9712 + (4 − 1)1.1672
𝑆𝑝 = 1 1
5+4−2 2.86 − 2.075 ± 2.365 × 1.6742 +
5 4
3) Estadística de Prueba
𝑥ҧ𝑐 − 𝑥ҧ𝑠 − (𝜇𝑐 − 𝜇𝑠 )
𝑡=
1 1
𝑆𝑝 +
𝑛𝑐 𝑛𝑠
2.86 − 2.07 − 0
= = 0.70
1 1
1.6742 +
5 4
4) Valores críticos
Gráfica de distribución
T; df=7
0.4
0.3
5) Como 0.70<1.89 Luego no rechazamos H0
6) Con un 95% de confianza, decimos que
Densidad
0.2
1 1
F0.025(9,15) = = = 0.265
F0.975(15,9) 3.77
242−239
𝑡= = 1.39
10 40
+
16 10
(370.22 − 327.44)
3) 𝐶𝑜𝑚𝑜 𝑡𝑖𝑒𝑛𝑒 𝑡 = = 7.82
6.512 15.072
+
9 9
2 5) Como 7.82>1.812 entonces se rechaza Ho.
𝑆12ൗ 𝑆22ൗ
𝑛1 + 𝑛2
𝑣= 6) Es decir la Implementación de un Sistema de
2 2
𝑆12ൗ 𝑆22ൗ Células de Fabricación Incrementa la
𝑛1 𝑛2
+ Producción de la Compañía Ford Motor
𝑛1 − 1 𝑛2 − 1
2
42.44 227.03
9 + 9
𝑣= = 10.9
2 2
42.44 227.03
9 9 Este valor se redondea
+ al próximo menor que
9−1 9−1
sería 10
Material de Clases © G:P.P 15/12/2022
Ejemplo4: En el campo de la informática, se hace un experimento en el que se miden las
velocidades de los procesadores de Intel frente a los correspondientes AMD. Los resultados
obtenidos son los tiempos en segundos en bajar de Internet un determinado programa
Intel 100 125 135 128 140 142 128 137 156 142
AMD 105 128 128 135 115 150 125 122
a) ¿Hallar el intervalo de confianza del 95% para la diferencia entre los tiempos medios de
estos dos procesadores?
b) ¿Podría decirse que el procesador Intel es mas veloz que el AMD si alfa es 5%?
Ejemplo5: Queremos estudiar la influencia que puede tener el tabaco con el peso de los niños
al nacer. Para ello se consideran dos grupos de mujeres embarazadas (unas que fuman un
paquete al día y otras que no) y se obtienen los siguientes datos sobre el peso X, de sus hijos:
0.2
0.1
0.05
0.0
-1.943 0
X
( p1 − p2 ) − ( p1 − p2 )
x1 + x2 Z=
donde, p es estimado por p = pq pq
+
n1 + n2
n1 n2
Material de Clases © G:P.P 15/12/2022
Ejemplo1: Un médico de una zona minera, ha sugerido que un ataque cardíaco es menos
probable que ocurra en hombres que practican alguna clase de deporte. Se elige una
muestra al azar de 300 hombres, de los cuales 100 practican alguna clase de deporte y de
ellos sólo 10 han sufrido un ataque cardíaco. De los 200 que no practican deportes, 25 han
sufrido ataques cardíacos.
a) Hallar un intervalo de confianza del 95% para la diferencia de las dos proporciones
Practican deporte No practican deporte Interpretación: Como el
𝑛1 = 100 𝑛2 = 200 intervalo contiene al cero,
podemos concluir que no
𝑥1 = 10 𝑥2 = 25
existen diferencias entre las
𝑥 10 𝑥 25
𝑝1ҧ = 𝑛1 = 100 = 0.10 𝑝2ҧ = 𝑛2 = 200 = 0.125 proporciones poblacionales de
1 2
los hombres que han tendido
𝑝1ҧ 𝑞ത1 𝑝2ҧ 𝑞ത2 ataque cardiaco con los que
𝑝1ҧ − 𝑝2ҧ ± 𝑍𝛼/2 + practican deporte o no.
𝑛1 𝑛2
(0.1)(0.9) (0.125)(0.875)
0.1−0.125 ± 1.96 +
100 200
−0.09955 ≤ 𝑝1 − 𝑝2 ≤ 0.049553
x1 + x2 10 + 25
p= = = 0.1167
n1 + n2 100 + 200
(0.10 − 0.125) − (0 − 0)
Z= = −0.6357
(0.1167)(0.8833) (0.1167)(0.8833)
+
100 200
Ejemplo.4: Una semana antes de las elecciones municipales para Lima Metropolitana, dos
compañías encuestadoras publican los resultados las encuestas por encargo, realizadas de
forma independiente.
• Encuestadora Apoyo: para un n = 1800, los votos al partido ZYX =42 %.
• Encuestadora Datum: para un n = 6800, votos al partido ZYX = 36 %.
¿Estos resultados dispares, se puede atribuir al tamaño de la muestra respectiva?.
Razone su respuesta.
Nota: Si el I.C. contiene el valor uno se concluye que las varianzas son iguales, en caso
contrario se dice que son diferentes.
𝑆12
൘ 2
El estadístico de prueba es 𝜎1 𝑆12
𝐹= 2 = 2
𝑆2 𝑆2
൘ 2
𝜎2
donde 𝑆12 es la más grande de las dos varianzas muestrales
50 𝜎12 50
< 2<
24(1,94) 𝜎2 24(0,530)
𝜎12
1,074 < < 3,932
𝜎22
Densidad
0.6
2.083>1.672 0.2