Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA INFERENCIAL
TRABAJO FINAL.
PRIMERA PARTE DEL CURSO
Pruebas paramétricas
Estadistica: La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis de un
conjunto de datos con el fin de obtener explicaciones y predicciones sobre fenómenos observados.
Estadistica descriptiva: La estadística descriptiva es un conjunto de técnicas numéricas y gráficas para describir y analizar
un grupo de datos, sin extraer conclusiones (inferencias) sobre la población a la que pertenecen.
Estadistica inferencial: También llamada estadística inductiva, inferencia estadística o teoría de muestras. Abarca un
conjunto de procedimientos estadísticos que se utilizan para hacer generalizaciones sobre una población a partir de los
datos obtenidos de una muestra.
Pruebas paramétricas: Las pruebas paramétricas son una herramienta estadística que se utiliza para el análisis de
los factores de la población.
Pruebas no paramétricas: Las pruebas no paramétricas, también conocidas como pruebas de distribución libre, son las que
se basan en determinadas hipótesis, pero lo datos observados no tienen un organización normal.
Pruebas de hipótesis: Una prueba de hipótesis es una regla que especifica cuando se puede aceptar o rechazar una
afirmación sobre una población dependiendo de la evidencia proporcionada por una muestra de datos.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis nula y
la hipótesis alternativa
Desviacion diferencial: Por puntuación diferencial entendemos el resultado de restar la directa menos la media aritmética.
La puntuación típica es la diferencial dividida por la desviación típica, medida abstracta que podemos interpretar como
distancia expresada en desviaciones típicas de un elemento con respecto a la media aritmética.
Varianza: En teoría de probabilidad, la varianza o variancia de una variable aleatoria es una medida de dispersión
definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media.
Desviacion estándar: La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están
los datos con respecto a la media. Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos.
Tabla de regiones
criticas
x= Media de la muestra
µ= Media de la
población
σ= Desviación estándar de la
muestra n= Tamaño de la muestra
α= Nivel de
significancia n ≥ 30
muestra grande n ≤
a)Prueba de hipótesis
para una media
muestra grande
Problema 1
Grafica:
H0: μ = 400 ❌
Rechazo
Aceptación
Ho
Ho
VC= Z=
2.41
b)Prueba de hipótesis para
dos medias muestra grande
Problema 1
Grafica
H0: μ = $400 ❌
H1: μ ≠ $400 ✔
Rechazo
Rechazo
Aceptación
Aceptación
CONCLUSION
H0
H0
H1
H1
Z=2.4
VC=- VC=1.9 1
1.96 6
Prueba de hipótesis
para una media
muestra pequeña
Problema 1
Prueba de hipótesis para una media muestra pequeña
Un fabricante de focos afirma que su producto durará un promedio de 500 horas de trabajo. Para
conservar este promedio esta persona verifica 25 focos cada mes. Si el valor y calculado cae entre –t
0.05 y t 0.05, él se encuentra satisfecho con esta afirmación. ¿Qué conclusión deberá él sacar de una muestra de
25 focos cuya duración fue?:
Datos Formulas
520 521 511 530 510
513 522 500 521 495 H0 : μ=500
H1 : 𝑥−𝜇
496 488 500 502 512 μ≠500 μ= 𝑡= 𝑠
510 510 475 505 521 500
α = 0.1 𝑛
406 503 487 493 500 S=12.07
n=25 (∑𝑥𝑖)2 = (𝑋1 + 𝑋
𝑋=505.36 + ⋯ 𝑋𝑛)2
𝑛∑ 𝑋 2 − (∑𝑋1)2
𝒾
𝑠= 𝑛(𝑛 − 1)
𝑋1 + 𝑋2 + ⋯ 𝑋𝑛
�
Sustitución
520+521+511+513+510+…500
𝑋= = 505.36
25 ∑𝑋𝑖2 = 5202 + 5212 + ⋯ 5002 = =6496812
505.36 − 500
𝑡= = 2.22
12.07
25
Tabla de alores Grafica
críticos
de la distribución
T 𝛼
= 0.0
2
5
24 1.7
7
−∞ -2.2 - 1.7 2. ∞
Conclusión 1.77 7 2
Para encontrar si un nuevo suero detiene la leucemia, se seleccionan nueve ratones, todos con una etapa avanzada
de la enfermedad. Cinco ratones reciben el tratamiento y cuatro no. Los tiempos de sobrevivencia en años, a partir
del momento en que comienza el experimento son los siguientes:
¿Se puede decir en el nivel de significancia del 0.05 que el suero es efectivo? Suponga que las dos
poblaciones se distribuyen normalmente con varianzas iguales.
Datos
H0 : μ 1 – μ
2=0 H 1 : μ 1
– μ 2>0
α = 0.05
n1= 5
n2=4
Formulas
𝑛 1 −1 𝑆 2 + 𝑛 2 −1 𝑆 2
𝑆𝑝2 = 1 ഥ1 = X 1 +X 2 +⋯X n
2 n1
𝑛 1 +𝑛 2 −2 X2
n1 ∑ Xi 2 − (∑Xi )2
ഥX 2 X1 + Xn
2 2+ ⋯ X n S1 = n1(n1 − 1)
= 2 n2 ∑ Xi 2 − (∑Xi )2
S2 = n2 (n 2 − 1)
X 1 − X2 − (μ1 − μ2 )
y=
S 2p Sp2
n1 + n2
∑ 𝑋 2 = 𝑋 2 +𝑋 2 + ⋯ 𝑋 2
γ = n1 + n 2 − 2 𝑖 1
𝑛
2
(∑ 𝑋𝑖 )2 = (𝑋1 +𝑋1 +…
𝑋𝑛 )2
Solución
Xഥ1 =
2.1+5.3+1.4+4.6+0.9 =2.86
5
1.9+0.5+2.8+3.1 =2.075
Xഥ2 =
4
(∑ X1 )2 = (2.12+5.32+…0.92)2=204.49
∑ X 2 = 1.92 +0.52 +…3.12 = 21.31 (∑ X2 )2 =
2
(1.9+0.5+…3.1)2= 8.3
2 2 2 −(1.92+0.52+…3.12)2 2= 5−1 3.88+ 4−1 1.34
2= 4 1.9 +0.5 +…3.1 4(4−1)
S2 =1.34 Sp
5+4−2
=2.79
2.86−2.075 −(0)
t= =0.7442
2.79 1 + 1
5 4
γ=5+4−2=7
VALO RES CRÍTIC O S DE LA Grafica
DISTRIBUCION
y 1-a
0.9
7= 5
1.89
𝐻0=1.8
9
−∞ H1 ∞
Conclusión
0 0.74
Como el valor critico es mayor que el valor calculado t, se 4
rechaza la H1 y se acepta H0 ya que en el nivel de
significancia del 0.05 que el suero no es efectivo.
Pruebas de hipótesis para
dos medias muestras
pequeñas considerando
varianzas diferentes.
Problema 1
Se analizan dos catalizadores para determinar la forma en que afectan el rendimiento promedio de un proceso químico.
De manera específica, el catalizador 1 es el que está empleado en este momento, pero el catalizador también es aceptable. Debido a que el
catalizador 2 es más económico, este puede adoptarse siempre y cuando no cambie el rendimiento del proceso. Se hace una prueba en
una planta piloto; los resultados obtenidos son los siguientes.
Existe alguna diferencia entre los rendimientos promedio y cuál sería su conclusión.
X 1 +X 2 +X 3 +X 4 +… X 1 +X 2 +X 3 +X 4 +…
Xഥ1= Xഥ2= t= X1−X2 −(μ1−μ2)
n1 n2
S2 S2
1 2
n1 + n2
∑ 𝑋 2 = 𝑋 2 +𝑋 2 + ⋯ 𝑋 2
𝑖 1 2
𝑛
S2 S2
1+ 2
2 n1 ∑ Xi − (∑X i )2
2 2 n2 ∑ X i − (∑Xi )2
2 n1 2n2
γ= 2 ( 𝑋𝑖 )
S1 = n1 (n 1 − 1) S2 = n2(n2 − 1) 2
=
2
S21 S2
2
n1 n2
91.5+94.18+92.18+…89.21
Xഥ1= =92.2
8
5
5.69 +8.94 2
89.15+90.95+90.46+…92.75 8
Xഥ2= =92.75 γ= 2 =7.29
8
5.69
8 2
8.94
87 87
+
2
∑𝑋 𝑖 = 91.52+94.182+…89.212 = 68125.86 (∑ 𝑋𝑖 )2 =
2
91.5 +94.18 +…89.21 =544703.04
2 2 2 2
2 8 91.5 +94.18 +…89.21 − 91.5 +94.18 +…89.21 =5.69 t=
|92.25−92.75|
=0.369
S1 = 8(8−1) −(0)5.69
+
8
8.94
8
2 2 2 2 2 2 2
2 8 89.15 +90.95 +…92.75 − 89.15 +90.95 +…92.75 =
S2 = 8(8−1)
Y a
0.0
7= 5
1.89
𝐻0=1.89
Conclusión
−∞ H1 ∞
Los resultados sugieren que se rechaza la H1 y nos 0.36
quedamos con la H0 , dado que los catalizadores tienen un 9
rendimiento parecido, se recomienda utilizar el
catalizador 2 por ser más económico.
Pruebas de hipótesis para
dos medias muestras
pequeñas utilizando el
método de la W .
Problema 1
Se hizo un estudio para definirse si los ejercicios aeróbicos reducen el ritmo cardiaco de una persona durante el
descanso y al examinar a los voluntarios antes y después de seguir un programa de ese tipo durante seis meses, sus
pulsaciones, en latidos por minuto, dieron los siguientes registros. Use α =0.05 para calcular si los ejercicios aeróbicos
reducen el ritmo cardiaco durante el reposo.
Voluntario 1 2 3 4 5 6 7 8 9 10
Antes 73 77 68 62 72 80 76 64 70 72
Despues 68 72 64 60 71 77 74 60 64 68
Formulas
𝑡= 𝑋ഥ ₁−𝑋ഥ ₂ −
2
datos (𝜇 ₁−𝜇𝑆 1₂) 𝑆 2 ²
𝑛₁
+ 𝑛₂
𝐻0 : 𝜇 1 − 𝜇2 = 0
ഥ1 = x₁ + x₂ + x₃ + 𝑥 𝑛
X ഥ₂ = x₁ + x₂ + x₃ + 𝑥 𝑛
X
n₁ n₂
𝐻1 : 𝜇 1 − 𝜇2 > 0
𝑛₁Ʃ𝑋 2 − (Ʃ Xᵢ)² n₂Ʃ𝑋 2 − (Ʃ Xᵢ)²
𝑛1 = 𝑛2 = 10 𝑠12 = 𝑖
𝑠 22 = 𝑖
𝑛₁(𝑛₁ − 1) n₂(n₂ − 1)
𝖺 = 0.05
𝑤₁𝑇₁+𝑊₂𝑇₂ 𝑠2 𝑠2
T= 𝛾1 = 𝑛1-1 𝛾2 = 𝑛2-
𝑊₁+𝑊 w₁ = 1
n₁ w₂ = n₂2
1 ₂
Solucion
ഥ 73+77+⋯+72 68+72+⋯+68
𝑋₁ = 10 = 71.4 Xഥ ₂ = 10 =
67.8
2
10 732 + 772 + ⋯ + 72² − 73 + 77 + ⋯ + 72
𝑠1 =
2 = 31.8222
10(10 − 1)
2
10 68 2 + 722 + ⋯ + 68² − 68 + 72 + ⋯ +
𝑠22 = 68 = 33.5111
10(10 − 1)
71.4−67.8 − 0
𝑡= = 𝟏. 𝟏
31.8222 33.5111
+ 𝟒𝟎𝟖𝟒: 𝑯
10 10
𝑤₁ = 31.8222
10
= 3.18222 w2 = 33.511
10
= 3.3511
(Valores críticos de la distribución t).
𝖺 = 0.05
𝜸𝟏 = 𝒏𝟏 − 𝟏 = 𝟏𝟎 − 𝟏 = 𝟗 𝜸𝟐 = 𝒏𝟐 − 𝟏 = 𝟏𝟎 − 𝟏 = 𝟗 Grafica
𝑻𝟏 = 𝟏. 𝟖𝟑𝟑 𝑻𝟐 = 𝟏. 𝟖𝟑𝟑
H1 H2
T=1.8329 :
1.4 1.832
𝑯𝟎
0 9
Conclusión
Se acepta la hipótesis nula 𝐻0 y se concluye que los
ejercicios
aeróbicos disminuyen
PRUEBA D E HIPÓTESIS PARA UNA
PROPORCION
Problema
1
El director de una universidad nueva afirma que solamente el 18% de los estudiantes
no están de acuerdo con su actual gestión. En una encuesta aplicada a los
estudiantes, 90 de 450 manifestaron estar en desacuerdo. ¿Se podría afirmar con una
significancia del 5% que la proporción en desacuerdo es mayor al 18%?
Procedimiento
D atos Formul
a
ത
𝑋 90
H 0: = 𝑃= 𝑃= = 0.20
𝑛 450
H 1: 0.18
0.18
= 0.5 𝑃 − P0
N = 450 𝑧= 0.2
𝑋ത = 90
P0 (1 − P ) 𝑧= =
0 𝑛 −0.18 1.104
0.1845𝑜
(0.82 )
Tabla
Area bajo la
curva Grafica
Conclusión
z = 0.05
El valor de la hipótesis nula
0.05
resultó mayor al de la hipótesis
alternativa, por lo tanto se
1.6 0.0505 𝑯𝟏 𝑯𝟎 acepta 𝐻0 y se rechaza 𝐻0, por lo
tanto con una significación del
5% la proporción en desacuerdo
es mayor al 18%
Prueba de hipótesis para dos
proporciones
Problema 1
Una muestra de 50 familias de una comunidad muestra que 10 de ellas están viendo un programa especial de
televisión sobre la economía nacional. En una segunda comunidad 15 familias de una muestra aleatoria de 50
están viendo el programa especial de la televisión, a continuación se prueba la hipótesis de que la proporción
general de televidentes en las dos comunidades no difiere, usando el nivel de significancia de 0.05
Formulas Procedimiento
Datos
H0 = 1 - 2 = 0 𝑍= 𝑃₁ − 10 15
1 𝑃₁ = 50 = 0.20 𝑃₂ = 30 = 0.30
H1 = 1 - 2 0 𝑝Ƹ𝑃₂
= 0.05 1
� 𝑛 +𝑛 10+15
𝑝Ƹ =50+50 = 0.25 ��ො = 1 −
𝑥1 = 10 �
1 2
0.25 =
𝑥2 = 15 0.75
𝑃₁ = 𝑛 1 ො 𝑃₂ = 𝑛 2
𝑛1 = 50 𝑥 1 𝑥 2
0.20−0.30
𝑛2 = 50 𝑍= Z= -
𝑝Ƹ =𝑛 1 +𝑛 2 ��ො Ƹ
0.25 0.75 1 1 1.15 :
𝑥1+𝑥2 =1−𝑝 50+ 50
𝑯₁
Grafica
Tabla
𝖺
= 0.05 = 0.025
2 2
1−𝖺 =1 0.05
2 = 0.975
− 2
z 0.05 z 0.06
-1.9 0.025 1.9 0.9750 - -1.96 -1.15 1.15 1.96
𝐻0 𝐻1 𝐻1
𝐻0
𝑯𝟎 : −𝟏. 𝟗𝟔 𝑯𝟎 : 𝟏. 𝟗𝟔
Conclusión
H0 : σ2=5 2 (n−1)S2
X = (16−1)7.89 = 23.73
σ2 X2 = 5
H1 :
γ=n−1
σ2>5 α = γ=16−1=15
0.05
Xത=45.43
S= 2.81
n=16
Grafica Conclusión
Tabla de distribución
de chi cuadrada
Dos fuentes de materias primas están siendo consideradas. Ambas fuentes parecen tener características similares, pero no se
está seguro de su homogeneidad.
Una muestra de 10 grupos de la fuente A produce una varianza de 250 y una muestra de 11 grupos de la fuente B
produce una varianza de 195.
Con base en ésta información se puede concluir que la varianza de la fuente A es significativamente mayor que la de la
fuente B? Asuma un nivel de significancia de .01
2
H :𝜎 2 = 𝜎2 𝑓 = 195=1.28
250
0 1 𝑓= 𝑆12
H :𝜎 2 > 𝜎22 𝑆22
1
𝑓1−𝛼(𝛾1, 𝛾2)= 5.26 =0.190
1 1
1
𝑆12 = 250 𝑓1−𝛼 (𝛾1 , 𝛾2)= 𝑓 , 𝛾 1)
𝛼 (𝛾 2
𝛾1 = 10 − 1=9
𝑆22= 195 𝛾1 = 𝑛1 − 1
α = 0.01 𝛾2 = 11 − 1=10
𝛾2 = 𝑛2 − 1
𝑛1=10
𝑛2=11
Tabla Grafica Conclusión
0.190 4.94
𝐻0 𝐻0
Prueba de Bondad de Ajuste
Prueba de Bondad de Ajuste
El gerente de una planta industrial pretende determinar si el número de empleados que asisten al consultorio médico
de la planta se encuentran distribuido en forma equitativa durante los 5 días de trabajo de la semana. Con base en
una muestra aleatoria de 4 semanas completas de trabajo, se observó el siguiente número de consultas:
Con a=0,05 ¿Existe alguna razón para creer que el número de empleados que asisten al consultorio médico, no se
encuentra distribuido de forma equitativa durante los días de la semana?
Formulas
Datos Procedimiento
𝐾
H0 : D istribución equitativa (𝑂𝑖 − 𝑒𝑖 )2
H1 : D istribución no equitativa 𝑋2 = 2 2
2
𝑒𝑖 𝑋2 =
(49−40) (35−40)
+ …
(45−40)
=4.9
α= 0.05 𝑖=1
40 40
40
γ= K-1
γ= 5-1=4
Tabla Grafica C onclusión
Se acepta H0 , es una
y a y a distribución equitativa
0.0 0.9 de empleados
5 5
4 9.488 0.71
4 1
7.91 -7 +
6.85 – 7 -
8.01 – 7 +
Ho =μ=7.0 X −nP 8−(10)(0.5) 3
H1 =μ≠ 7.0 Z= Z= = =1.898 7.46 – 7 +
npq (10)(0.5)(0.5) 1.58
n=10 6.95 – 7 -
P = 0.5 q= 1-0.5 = 0.5
α =0.05 q= 1-p 7.05 – 7 +
7.35 - 7 +
7.25 - 7 +
7.42 - 7 +
Grafica
Condición:
Conclusion:
Los siguientes datos representan el número de horas que funciona una desbrozadora antes de requerir una recarga:
1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0, 1.2, 1.7.
A un nivel de signifi cancia de 0.05 utilice la prueba de signo para probar la hipótesis de que esta desbrozadora
específi ca
funciona con una mediana de 1.8 horas antes de requerir una recarga
1. Formulas
D atos
2. H0: μ = p=
1.8. 1/2 .
3. H1: μ ≠
1.8.
4. 𝛼 = 0.05.
5. Cálculos: Al reemplazar cada valor con el símbolo “+” si excede 1.8, con el símbolo “–” si es menor que 1.8 y
descartar las
mediciones que sean iguales a 1.8, obtenemos la siguiente secuencia
-+--+--+--
para la cual n = 10, x = 3 y n/2 = 5. Por lo tanto, el valor P que se obtiene de la tabla A.1 es
5. Cálculos: Al reemplazar cada valor con el símbolo “+” si excede 1.8, con el símbolo “–” si es menor que 1.8 y
descartar las
mediciones que sean iguales a 1.8, obtenemos la siguiente secuencia
-+--+--+--
para la cual n = 10, x = 3 y n/2 = 5. Por lo tanto, el valor P que se obtiene de la tabla
A.1 es
3 𝑏 (x ; 10, ½) = 0.3438 >
𝑃 = 2𝑃(𝑥≤3 cuando p = ½) =
𝑥=0 0.05.
2
6. Decisión: No se rechaza la hipótesis nula y se concluye que la mediana del tiempo de funcionamiento no difi ere
signifi cativamente de 1.8 horas.
Prueba de rango con signo
para dos medias
Problema 1
Se afirma que, si se le proporcionan ejemplos de problemas con antelación, un estudiante universitario de último
año puede aumentar en al menos 50 puntos su calificación en el área de especialidad del examen para ingresar a
posgrado. Para probar esta afirmación se divide a un grupo de 20 estudiantes del último año en 10 pares, de
manera que cada par tenga casi la misma calificación promedio durante sus 3 primeros años en la universidad.
Los ejemplos de problemas y las respuestas se proporcionan al azar a un miembro de cada par una semana antes
del examen.
presentan en la tabla 16.3.
A un nivel de significancia de 0.05 pruebe la hipótesis nula de que los ejemplos de problemas aumentan las calificaciones
en 50 puntos, en comparación con la hipótesis alternativa de que aumentan menos de 50 puntos.
Datos Formulas
1. H0: ˜μ1 −μ̃ 2 = 50. 𝖦 += ∑+ 𝑟𝑎𝑛𝑔𝑜𝑠
2. H1: ˜μ1 −μ̃ 2 < 50. 𝖦 −= ∑− 𝑟𝑎𝑛𝑔𝑜𝑠
3. α = 0.05. 𝖦 = 𝑣𝑎𝑙𝑜𝑟 𝑚𝑎𝑠 𝑝𝑒𝑞𝑢𝑒ñ𝑜
𝑒𝑛𝑡𝑒 𝑤 + 𝑦 𝑤 −
n Unitaleral α =0.5 w+ ≤ 11.
Bilateral α =0.1
10 11
5. Cálculos:
1 2 3 4 5 6 7 8 9 10
Di 22 81 -25 77 27 -23 23 -29 13 51
Di- -28 31 -75 27 -23 -73 -27 -79 -37 1
di0
5 6 9 3.5 2 8 3.5 10 7 1
w+ = 6 + 3.5 + 1 = 10.5.
6. Condicion: La H0 se rechaza si el valor calculado w+,w- o w, es menor o igual que el obtenido por tablas
Referencia
A un nivel de significancia de 0.05 pruebe la hipótesis de que las medianas del contenido de nicotina de las dos marcas son
iguales, en comparación con la hipótesis alternativa de que son diferentes.
Datos Formula
s 𝑛1 𝑛1 + 1
1. H0: μ˜ 1 = μ˜ 𝑢1 = 𝑤1 − [ ]
2
2
2. H1: μ˜ 1 ≠ μ˜ 𝑛2 𝑛2 + 1
𝑢2 = 𝑤2 − [ ]
2 2
3. α = 0.05
Marca Rango Marca Rango 4.0 4.0
A B
2.1 4 4.1 12 10 + 11
2 𝑢𝐶𝑎𝑙 = 23 (valor mas pequeño de
4.0 10.5 0.6 1 las dos 𝑢)
3.3 8 2.2 5
17
1.9 3 8 𝑢α 𝑑𝑒
10 10 + 1
𝑡𝑎𝑏𝑙𝑎𝑠
5.4 14.5 2
𝑛1 = 8 𝑤1=93 𝑛2 𝑤2=78
= 10
Condició Conclusió
n n
𝑢𝐶𝑎𝑙 > 𝑢α Se acepta Se acepta la hipotesis H0 y se concluye que no hay
H0 diferencia significativa en las medianas del
𝑢𝐶𝑎𝑙 ≥ 𝑢α Se rechaza contenido de nicotina en las dos marcas de
H0 cigarrillos.
23 > 17 𝑆𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻0
Referencia