Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Solucionario - Libro-Probabilidad-y-Estadstica-Para-Ingenieros-6-ed. MiguelSanchez14 PDF
Solucionario - Libro-Probabilidad-y-Estadstica-Para-Ingenieros-6-ed. MiguelSanchez14 PDF
Datos:
Variable aleatoria X: cantidad de bebida que sirve una máquina (en mililitros).
Tamaño de la muestra n = 40 bebidas.
Desviación estándar poblacional σx = 15 mililitros.
Media poblacional μx = 240 mililitros.
Media muestral x = μ x = 240 mililitros.
σ
Desviación estándar muestral σ x = x ≃2.3717 mililitros.
n
Incógnita:
μ x − 2σ x ≤ x ≤ μ x + 2σ x
Solución:
Respuesta:
Esta fue una decisión razonable puesto que 236 ml., que es la media encontrada se encuentra dentro del
intervalo definido.
Datos:
Variable aleatoria X: vida útil de una máquina de hacer pasta (en años).
Media poblacional μx = 7 años.
Desviación estándar poblacional σx = 1 año.
Tamaño de la muestra n = 9 máquinas.
X ~ N( μ x , σ x ) ⇒ μ x = μ x = 7 (años)
σ 1 1
σx = x = = (años )
n 9 3
a) Incógnita:
P(6.4 ≤ x ≤ 7.2)
Solución:
6.4 − 7 X − μx 7.2 − 7
P ≤ ≤ = P( −1.8 ≤ z ≤ 0.6 ) = P( z ≤ 0.6 ) − P( z ≤ −1.8) =⇒
13 σx 1
3
n
Aplicando Tabla A.3. = 0.7257 – 0.0359 = 0.6898 = 68.98%.
Respuesta:
La probabilidad de que la vida media de una muestra de 9 de esas máquinas caiga entre 6.4 años y 7.2 años es
del 68.98%.
b) Incógnita:
Un valor de x que deje a su derecha un área del 15% y por lo tanto un área del 85% a su izquierda.
Solución:
_
x −7 1 _
Zα = Z 0.85 = 1.04 ⇒ Z 0.85 = ⇒ (1.04) * + 7 = x = 7.346667 Años
1 3
3
x = 7.35 años
Respuesta:
El valor de x que deja a su derecha un área del 15% es 7.35 años.
Datos:
X ~ N( μ x , σ x ) ⇒ μ x = μ x = 3.2 (años)
σx 1.6 1 .6
σx = = = (años )
n 64 8
a) Incógnita:
P( x ≤ 2.7)
Solución:
X − μx 2.7 − 3.2
P ≤ = P( z ≤ −2.5) = Aplicando Tabla A.3. = 0.0062 = 0.62%
σx 1.6
8
n
Respuesta:
La probabilidad de que el tiempo promedio de los cliente con el cajero sea a lo más 2.7 minutos es de 0.62%.
b) Incógnita:
P( x > 3.5)
Solución:
X − μx 3.5 − 3.2
P > = P( z >1.5) =1 − P( z ≤ .5) =1 − 0.9332 = Aplicando Tabla A.3. = 0.0668 =
σx 1.6
n 64
6.68%.
Respuesta:
La probabilidad de que el tiempo promedio de los cliente con el cajero sea más 3.5 minutos es de 6.68%.
c) Incógnita:
P(3.2 ≤ x ≤ 3.4)
Solución:
3.2 − 3.2 X − μx 3.4 − 3.2
P ≤ ≤ = P( 0 ≤ z ≤ 1) = P( z ≤ 1) − P( z ≤ 0 ) =⇒
1.6 σx 1.6
64 n 64
Aplicando Tabla A.3 = 0.8413 – 0.5000 = 0.3413 = 34.13%.
Respuesta:
La probabilidad de que el tiempo promedio de los cliente con el cajero este entre 3.2 y 3.4 minutos es de
34.13%.
Problema 4 (Ref: Pág. 224 - Ej. 12)
Se toma una muestra aleatoria de tamaño 25 de una población normal que tiene una media de 80 y una
desviación estándar de 5. Una segunda muestra aleatoria de tamaño 36 se toma de una población
normal diferente que tiene una media de 75 y una desviación estándar de 3. Encuentre la probabilidad
de que la media muestral calculada de las 25 mediciones exceda de media muestral calculada de las 36
mediciones por al menos 3.4 pero en menos de 5.9. Suponga que las medias se miden al décimo más
cercano.
Datos:
Incógnita:
P( 3.4 ≤ ( X1 − X 2 ) ≤ 5.9 )
Solución:
σ 12 σ 22
μ x1 - x1 = μ 1 − μ 2 y σ 2x1 - x 2 = + .
n1 n 2
De aquí
Z=
(X − X ) − (μ
1 2 1 − μ2 )
(σ n ) + (σ
2
1 1
2
2 n2 )
μ x1 - x 2 = 80 – 75 = 5 25 9
y σ x1 - x 2 = + = 1.118
25 36
( (
3.4 −5
P 3.4 ≤ X1 −X 2 ≤5.9 =P ) ≤)
X −X
1 2 1
(
− μ −μ
2 ≤
) (
5.9 −5 )
=P(−1.4311 ≤z ≤0.8050 ) =
1.118034 σ 2 σ 2 1.118034
1 2
+
n
n
1 2
= P(z ≤ 0.8050) − P( z ≤ −1.4311) =⇒Aplicando Tabla A.3. = 0.7896 – 0.0762 = 0.7134 = 71.34%.
Respuesta:
La probabilidad de que la media muestral calculada de las 25 mediciones exceda de media muestral calculada
de las 36 mediciones por al menos 3.4 pero en menos de 5.9 es de 71.34%.
2
a) Según Tabla A.5 χ 0.025 cuando υ = 15 => 27.488
Respuesta:
El valor χ2 con 15 grados de libertad, que deja un área de 0.025 a su derecha es 27.488.
Gráfica:
2
b) Según Tabla A.5 χ 0.01 cuando υ = 7 => 18.475
Respuesta:
El valor χ2 con 7 grados de libertad, que deja un área de 0.01 a su derecha es 18.475.
Gráfica:
2
c) Según Tabla A.5 χ 0.05 cuando υ = 24 => 36.415
Respuesta:
El valor χ2 con 24 grados de libertad, que deja un área de 0.05 a su derecha es 36.415.
Gráfica:
Respuesta:
El valor de χ2 que deja a su derecha una probabilidad igual a 0.99 es decir 99 %, con 4 grados de libertad es
0.297.
Respuesta:
El valor de χ2 que deja a su derecha una probabilidad igual a 0.025 es decir 2.5 %, con 19 grados de libertad
es 32.852.
Gráfica:
Respuesta:
El valor de χ2 debe ser igual a 46.928 para que la probabilidad entre 37.652 y dicho valor calculado sea igual a
0.045, es decir 4.5%, con 25 grados de libertad.
Gráfica:
Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal
con varianza σ2 = 6, tenga una varianza s2
a) mayor que 9.1;
b) entre 3.462 y 10.745.
Suponga que las varianzas muestrales son mediciones continuas.
Datos:
a) Incógnita:
P (s2 > 9.1)
Solución:
χ 2
=
( n − 1) s 2
con (n – 1) grados de libertad
σ2
Respuesta:
La probabilidad de que la varianza de esa muestra sea mayor que 9.1 es del 5%.
b) Incógnita:
P (3.462 ≤ s2 ≤ 10.745)
Solución:
χ2 =
( n − 1)s 2 con (n – 1) grados de libertad
σ2
χ2 =
( 25 − 1) ×10.745 = 24 ×10.745 = 257.88 = 42.98
6 6 6
Según Tabla A.5 χ 2 = 42.98 cuando υ = 24 =>0.01
Respuesta:
La probabilidad de que la varianza de esa muestra se encuentre entre 3.462 y 10.745 es del 94%.
Datos:
P: estudiantes de primer año de licenciatura.
X: calificación de un examen de colocación.
(
X ~ N μ x = 74, σ x = 8 )
Incógnita:
Considerar si es válida σ 2x = 8
Solución:
χ2 =
( n − 1)s 2 con (n – 1) grados de libertad
σ2
χ2 =
( 20 − 1)( 20) = (19)( 20) = 380 = 47.5
8 8 8
2 2
χ 0..975 = 8.907 χ 0.025 = 32.852
Respuesta:
Es un valor de una distribución ji cuadrada con 19 grados de libertad.
Como 95% de los valores χ2 con 19 grados de libertad caen entre 8.907 y 32.852, el valor calculado con σ 2 = 8
no es razonable y por lo tanto se tiene razón suficiente para sospechar que la varianza es diferente a ocho.
Es muy probable que el valor supuesto de σ2 sea un error.
Respuesta:
El valor t con 14 grados de libertad, que deja un área de 0.025 a su derecha es 2.145.
Gráfica:
Respuesta:
El valor t con 10 grados de libertad, que deja un área de 0.10 a su izquierda es -1.372.
Gráfica:
Respuesta:
El valor t con 7 grados de libertad, que deja un área de 0.995 a su derecha y por lo tanto un área de 0.005 a su
izquierda es -3.499.
Gráfica:
Respuesta:
La probabilidad de que un valor t sea menor que 2.365 con 7 grados de libertad es del 97.5%.
Gráfica:
Respuesta:
La probabilidad de que un valor t sea mayor que 1.318 con 24 grados de libertad es del 10%.
Gráfica:
Respuesta:
La probabilidad de que un valor t se encuentre entre -1.356 y 2.179 con 12 grados de libertad es del 87.5%.
Gráfica:
Respuesta:
La probabilidad de que un valor t sea mayor que -2.567 con 17 grados de libertad es del 99%.
Gráfica:
Una empresa manufacturera afirma que las baterías que utiliza en sus juegos electrónicos duran un
promedio de 30 horas. Para mantener este promedio se prueban 16 baterías cada mes. Si el valor t que
se calcula cae entre –t0.025 y t0.025, la empresa queda satisfecha con su afirmación.¿Qué conclusiones
extraería la empresa de una muestra que tiene una media de x = 27.5 horas y una desviación estándar
de s = 5 horas? Suponga que la distribución de las duraciones de las baterías es aproximadamente
normal.
Datos:
Solución:
De la tabla A.4 encontramos que t0.025 = 2.131 para 15 grados de libertad. Por tanto, la empresa queda
satisfecha con esta afirmación si una muestra de 16 baterías rinde un valor t entre –2.131 y 2.131. si μ = 30,
entonces
X −μ
T= con (n – 1) grados de libertad
s
n
27.5 − 30
T= = −2 ,
5 16
Respuesta:
La empresa estaría satisfecha con su afirmación ya que el valor hallado de t pertenece al intervalo establecido
como parámetro para poder afirmar que sus baterías promedian las 30 horas de duración.
Una población normal con varianza desconocida tiene una media de 20. ¿Se tiene posibilidad de
obtener una muestra aleatoria de tamaño 9 de esta población con una media de 24 y una desviación
estándar de 4.1? Si no, ¿qué conclusión sacaría?
Datos:
Solución:
X −μ
T= con (n – 1) grados de libertad
s
n
= 1 – P (│ X - 20│ ≤ 4) =
= 1 – P (-4 ≤ X - 20 ≤ 4) =
−4 4
=1–P ≤ X − 20 ≤ =
4.1 4.1
3 3
= 1 – P (-2.92 ≤ t8 ≤ 2.92) =
Respuesta:
Si se tiene la posibilidad de obtener una muestra de tamaño 9 con esas condiciones, con una probabilidad del
1.918%
Un fabricante de cierta marca de barras de cereal bajo de grasa afirma que su contenido promedio de
grasa saturada es 0.5 gramos. En una muestra aleatoria de 8 barras de cereal de esta marca el
contenido de grasa saturada fue 0.6, 0.7, 0.7, 0.3, 0.4, 0.5, 0.4 y 0.2. ¿Estaría de acuerdo con la
afirmación?
Datos:
Media muestral ∑X
i =1
i
=
0.6 + 0.7 + 0.7 + 0.3 + 0.4 + 0.5 + 0.4 + 0.2 3.8
= = 0.475 gramos
x= 8 8
n
n
∑ (X − X)
2
i
Desviación estándar muestral i =1
s=
n −1
s=
( 0.6 −0.475) 2 +(0.7 −0.475) 2 +(0.7 −0.475) 2 +(0.3−0.475) 2 +(0.4 −0.475) 2 +(0.5 −0.475) 2 +(0.4 −0.475) 2 +(0.2 −0.475
7
=
( 0.125) 2 + ( 0.225) 2 + ( 0.225) 2 + ( − 0.175) 2 + ( − 0.075) 2 + ( 0.025) 2 + ( − 0.075) 2 + ( − 0.275) 2 = 0.26
= 0.037 ≈ 0.18
7 7
Incógnita:
μx = 0.5
Solución:
X −μ
T= con (n – 1) grados de libertad
s
n
X −μ X −μ0
P ≥
s s
n n
con nuestros datos
Respuesta:
Hay razones suficiente (75,08%) para considerar que la afirmación es cierta.
b) ƒ0.05 con υ1 = 15 y υ2 = 7;
c) ƒ0.01 con υ1 = 24 y υ2 = 19;
d) ƒ0.95 con υ1 = 19 y υ2 = 24;
e) ƒ0.99 con υ1 = 28 y υ2 = 12.
Respuesta:
El valor f con 7 y 15 grados de libertad, que deja un área de 0.05 a su derecha es 2.71.
Gráfica:
Respuesta:
El valor f con 15 y 7 grados de libertad, que deja un área de 0.05 a su derecha es 3.51.
Gráfica:
Respuesta:
El valor f con 24 y 19 grados de libertad, que deja un área de 0.01 a su derecha es 2.92.
Gráfica:
d) ƒ0.95 con υ1 = 19 y υ2 = 24
1
f 1−α ( υ1, υ2 ) =
fα (υ
Lafata Desio Fernando, Warlet Iván υ1 )
2 , Lautaro
Página 26 de 104
Cátedra: Probabilidad y Estadística Trabajo Final
UADER 6 de Agosto de 2008
Respuesta:
El valor f con 19 y 24 grados de libertad, que deja un área de 0.95 a su derecha es 0.4739.
Gráfica:
e) ƒ0.99 con υ1 = 28 y υ2 = 12
1
f 1−α ( υ1, υ2 ) =
f α ( υ 2 , υ1 )
Respuesta:
El valor f con 28 y 12 grados de libertad, que deja un área de 0.99 a su derecha es 0.3448.
Gráfica:
Datos:
Media muestral ∑X
i =1
i
x=
n
163000 + 148000 + 152000 + 135000 + 141000 739000
= = = 147800 $
5 5
Incógnita:
Varianza muestral s2
Solución:
∑(X )
n
2
i −X
i =1
s2 =
n −1
con nuestros datos
s2 =
(163000 − 147800) 2 + (148000 − 147800) 2 + (152000 − 147800) 2 + (135000 − 147800) 2 + (141000 − 147800) 2 =
4
=
(15200 ) 2 + ( 200) 2 + ( 4200) 2 + ( − 12800) 2 + ( − 6800) 2 =
458800000
= 114700000 $
4 4
Respuesta:
La varianza de este conjunto es 114700000 $.
Incógnita:
(
P S12 S 22 > 1.26 )
Solución:
s12 σ 22 s12 σ 22
F= 2 2 = 2 2
σ1 s 2 s 2 σ 1
Respuesta:
La probabilidad de que F con 24 y 30 grados de libertad sea mayor que 1.26 es de 0.05, es decir, 5%.
Datos:
X ~ N( μ x = 780, σ x = 40)
Incógnita:
Intervalo de confianza para la media poblacional, μ x, con 96% de confianza.
Solución:
σ σ
X − z 1−α 2 ≤ μ ≤ X + z 1−α 2
n n
100γ% =100(1-α)% = 96% =>α = 0.04 => z1−α 2 => z0.98 = 2.054
40 40
780 − ( 2.054 ) ≤ μ x ≤ 780 + ( 2.054)
30 30
765 hs. ≤ μ x ≤ 795 hs.
Respuesta:
Podemos afirmar con un nivel de confianza del 96% que la media poblacional se encuentra entre 765 y 795
horas.
¿De que tamaño se necesita una muestra en el ejercicio 4 si deseamos tener 96% de confianza que
nuestra media muestral esté dentro de 10 horas de la media real?
Datos:
n ∈Ζ+
2
z 1−α 2 σ
n ≥
e
n ∈Ζ+
2
2.054.40
n ≥ = 67.5 → n = 68
10
Respuesta:
Por lo tanto, podemos tener una confianza 96% de que una muestra aleatoria de tamaño 68 proporcionara una
estimación x que difiere de μ por una cantidad menor que 0.04.
Las estaturas de una muestra aleatoria de 50 estudiantes universitarios muestra una media de 174.5
centímetros y una desviación estándar de 6.9 centímetros.
a) Construya un intervalo de confianza de 98% para la estatura media de todos los estudiantes de la
universidad;
b) ¿Qué podemos afirmar con 98% de confianza sobre el tamaño posible de nuestro error si estimamos
que la estatura media de todos los estudiantes de la universidad de 174.5 centímetros?.
Datos:
P: estudiantes universitarios.
Variable aleatoria X: medidas de esos estudiantes universitarios (en centímetros)
Tamaño de la muestra n = 50 estudiantes.
Media muestral x = 174.5 centímetros.
Desviación estándar muestral s = 6.9 centímetros.
a) Incógnita:
Intervalo de confianza para la media poblacional, μ x, con 98% de confianza.
Solución:
s s
X − tα 2 ≤ μ ≤ X + tα 2
n n
6.9 6.9
174.5 − ( 2.4048) ≤ µ ≤174.5 + ( 2.4048)
50 50
172.15 cm. ≤ μ ≤176.85 cm.
Respuesta:
Podemos afirmar con 98% de confianza que la media poblacional se encuentra entre 172.15 y 176.85
centímetros.
b) Incógnita:
Posible error de estimación.
Solución:
Respuesta:
Podemos afirmar con 98% de confianza que el error de estimación es igual a 2.35 cm.
Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de las piezas y los
diámetros son 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01 y 1.03 centímetros. Encuentre un intervalo de
confianza de 99% para el diámetro medio de las piezas de esta máquina, suponga una distribución
aproximadamente normal.
Datos:
Media muestral ∑X
i =1
i
=
1.01 + 0.97 + 1.03 + 1.04 + 0.99 + 0.98 + 0.99 + 1.01 + 1.03
= 1.0055
x= 9
n
cm.
n
∑ (X − X)
2
i
Desviación estándar muestral i =1
s=
n −1
s=
(1.01 −1.0055) 2 + (0.97 −1.0055) 2 + (1.03 −1.0055) 2 + (1.04 −1.0055) 2 + (0.99 −1.0055) 2 + (0.98 −1.0055) 2 + (0
8
Incógnita:
Intervalo de confianza para la media poblacional, μ x, con 99% de confianza.
Solución:
s s
X − tα 2 ≤ μ ≤ X + tα 2
n n
0.0245 0.0245
1.0055 − ( 3.355) ≤ μ ≤ 1.0055 + ( 3.355)
9 9
0.9781 cm. ≤ μ ≤1.0329 cm.
Respuesta:
Podemos afirmar con 99% de confianza que la media poblacional se encuentra entre 0.9781 y 1.0329
centímetros.
Datos:
P: botellas de aspirinas.
X: cantidad de aspirina que contienen las botellas de aspirina (en miligramos).
Tamaño de la muestra n = 25 botellas de aspirina.
Media muestral x = 325.05 mg. de aspirina.
Incógnita:
Limites de tolerancia del 95% que contendrán 90% de aspirina.
Solución:
x ± ks
Respuesta:
Los límites de tolerancia del 95% que contendrán 90% de aspirina para esta marca son 323.946 mg y 326.154
mg,
Datos:
Incógnita:
Intervalo de confianza para la diferencia de las medias poblacionales, μ 1 – μ2, con 95% de confianza.
Solución:
σ12 σ 22
μ x1 − x 2 = μ 1 − μ 2 y σ x1 − x 2 = +
n1 n 2
σ12 σ 22 σ2 σ2
( x1 − x 2 ) − z α . + < μ1 − μ 2 < ( x1 − x 2 ) + z α . 1 + 2
2 n1 n 2 2 n1 n 2
Respuesta:
Podemos afirmar con 95% de confianza que la diferencia entre las medias poblacionales se encuentra entre
2.80 y 7.19.
Calcule un intervalo de confianza de 95% para μ1 – μ2,suponga que las poblaciones se distribuyen de
forma aproximadamente normal. Puede no suponer que las varianzas son iguales.
Datos:
P1 : neumáticos de la marca A.
P2 : neumáticos de la marca B.
X1 : duración en kilómetros de un neumático de la marca A.
X2 : duración en kilómetros de un neumáticos de la marca B.
Tamaño de la primer muestra n1 = 12 neumáticos.
Tamaño de la segunda muestra n2 = 12 neumáticos.
Media de la primer muestra x 1 = 36300 Km.
Media de la segunda muestra x 2 = 38100 Km.
Desviación estándar de la primer muestra s 1 = 5000 Km.
Desviación estándar de la segunda muestra s 2 = 6100 Km.
Solución:
s12 s 22 s12 s 22
( x1 − x 2 ) − t α + < μ1 − μ 2 < ( x1 − x 2 ) + t α + donde t α 2 es el valor t con
2 n1 n 2 2 n1 n2
υ=
(s12
n1 + s 2
2 2n
2
=
)
( 25000000 12 + 37210000 12 ) 2 = ( 2083333.3 + 3100833.3) 2 = 21.18
(
s12 n1
2
+
) (
s22 n2
2
)
( 25000000 12 ) 2 + ( 37210000 12 ) 2 ( 2083333.3) 2 + ( 3100833.3) 2
12 − 1 12 − 1 11 11
n1 − 1 n 2 −1
Medicamento 1 Medicamento 2
n1 = 14 n 2 = 16
x 1 = 17 x 2 = 19
s 12 = 1.5 s 22 = 1.8
Encuentre un intervalo de confianza de 99% para la diferencia μ2 – μ1 en el tiempo promedio de
recuperación para los dos medicamentos, suponga poblaciones normales con varianzas iguales.
Datos:
P1 : pacientes que se tratan con el medicamento 1.
X 1 : tiempo de recuperación en días para un paciente tratado con el medicamento 1.
Tamaño de la primer muestra n1 = 14 días.
Primer media muestral x 1 = 17 días.
Primer varianza muestral s 12 = 1.5 días.
Incógnita:
Intervalo de confianza para la diferencia de las medias poblacionales, μ 2 − μ1 , con 99% de confianza.
Solución:
1 1
μ x 2 − x1 = μ 2 − μ 1 y σ x 2 − x1 = +
n 2 n1
( n 1 − 1) * ( s12 ) + ( n 2 − 1) * ( s 22 )
s 2p =
n1 + n 2 − 2
s 2p =
(14 −1) * (1.5) + (16 −1) * (1.8) = 1.6607 ⇒ s p ≅ 1.2886
14 +16 − 2
luego,
1 1 1 1
( x 2 − x1 ) − t α sp + < μ 2 - μ1 < ( x 2 − x1 ) + t α s p +
2 n 2 n1 2 n 2 n1
Respuesta:
Podemos afirmar con 99% de confianza que la diferencia entre las medias ( μ 2 - μ1 ) poblacionales se
encuentra entre 0.70 y 3.30.
a) Se selecciona una muestra aleatoria de 200 votantes y se encuentra que 114 apoyan un convenio de
anexión. Encuentre un intervalo de confianza de 96% para la fracción de la población votante que
favorece el convenio.
b) ¿Qué podemos asegurar con 96% de confianza acerca de la posible magnitud de nuestro error si
estimamos que la fracción de votantes que favorecen la anexión es 0.57?
Datos:
a) Incógnita:
Intervalo de confianza de 96% para la fracción de la población que favorece el convenio.
Solución:
p̂ * q̂
=
( 0.57 ) * ( 0.43) =
0.2451
= 0,0012255 ≅ 0.035
n 200 200
p̂ * q̂ p̂ * q̂
p̂ − z α * < p < p̂ + z α *
2 n 2 n
Respuesta:
Podemos afirmar con 96% de confianza que la fracción que favorece el convenio se encuentra entre 0.49811
y 0.64189, es decir, 49.81% y 64.19% respectivamente.
b) Incógnita:
Posible error de estimación.
Solución:
Respuesta:
Podemos afirmar con 96% de confianza que le error de estimación no superará el 7.2 %.
Datos:
Sabemos que:
p̂ ≅ 0.57
Y que q̂ ≅ 0.43
Incógnita:
Solución:
Con
Intervalo de error e = 0.02.
z α2 2 p̂q̂
n=
e2
n=
( 2.054) 2 ( 0.57 )( 0.43) =
1.030
≅ 2575 votantes
( 0.02) 2 0.0004
Respuesta:
Si basamos nuestra estimación de p sobre una muestra aleatoria de tamaño 2575, podemos tener una
confianza de 96% de que nuestra proporción muestral no diferirá de la proporción real por más de 0.02.
intervalo de confianza de 95% para la diferencia entre la proporción de hombres y mujeres que
padecen el trastorno sanguíneo.
Datos:
P1 : hombres
P2 : mujeres
p1 : proporción de hombres que tienen cierto trastorno sanguíneo menor.
p2 : proporción de mujeres que tienen cierto trastorno sanguíneo menor.
Tamaño de la primer muestra n1 = 1000 hombres.
Tamaño de la segunda muestra n2 = 1000 mujeres.
Número de éxitos de la primer muestra x1 = 250.
Número de éxitos de la segunda muestra x2 = 275.
x 250
Proporción de éxitos de la primer muestra p̂1 = = = 0.25
n 1000
x 275
Proporción de éxito de la segunda muestra p̂ 2 = = = 0.275
n 1000
Proporción de fracasos de la primer muestra q̂ 1 = 1 − p̂1 = 1 − 0.25 = 0.75
Proporción de fracasos de la segunda muestra q̂ 2 = 1 − p̂ 2 = 1 − 0.275 = 0.725
Diferencia entre proporciones de éxitos p̂ 1 − p̂ 2 = 0.25 − 0.275 = −0.025
Incógnita:
Intervalo de confianza de 96% para la diferencia de las fracciones de población que favorece el convenio.
Solución:
p̂1 * q̂ 1 p̂ 2 * q̂ 2 p̂ * q̂ p̂ * q̂
( p̂ 2 − p̂1 ) − z α * + < p 2 − p1 < ( p̂ 2 − p̂1 ) + z α * 1 1 + 2 2
2 n1 n2 2 n1 n2
Respuesta:
Podemos afirmar con 95% de confianza que la diferencia entre la proporción de hombres y mujeres que
padecen el trastorno sanguíneo se encuentra entre – 0.01355 y 0.06355.
b) Calcule un intervalo de confianza de 95% para ver si hay evidencia de que la proporción de mujeres
contratadas como personal editorial en 1994 fue mayor que la proporción contratada en 1990.
Datos:
Tamaño de la muestra n = 20 empleados.
6.74
Proporción de éxitos en 1990 las mujeres constituían 33,7 % de 20 empleados Pˆ1 = = 0.337
20
7.24
Proporción de éxitos en 1994 las mujeres constituían 36,2 % de 20 empleados Pˆ2 = = 0.362
20
Proporción de fracasos de la muestra en 1990 q̂ 1 = 1 − p̂1 = 1 − 0.337 = 0.663
Proporción de fracasos de la muestra en 1994 q̂ 2 = 1 − p̂ 2 = 1 − 0.362 = 0.638
Intervalo de confianza IC = 95%
100γ = 100(1 - α) % = 95% =>α =0.05 => z1−α 2 => z0.025 ≅ 1.96 .
a) Incógnita:
Estimar el número que habrían sido mujeres en cada año.
Solución:
En 1990 el 33.7% de 20
n * Pˆ1 = 20 * 0.337 = 6.74 ≈ 7 mujeres
En 1994 el 36.2% de 20
n * Pˆ2 = 20 * 0.362 = 7.24 ≈ 7 mujeres
Respuesta:
Estimamos que en 1990 habría sido de 6.74 ≈ 7 mujeres, y en 1994 la estimación habría sido de 7.24 ≈ 7
mujeres.
b) Incógnita:
Intervalo de confianza de 95% para ver si hay evidencia de que la proporción de mujeres contratadas
como personal editorial en 1994 fue mayor que la proporción contratada en 1990.
Solución:
( Pˆ − Pˆ ) − Z
2 1 α /2 *
pˆ 1 * qˆ1 pˆ 2 * qˆ 2
n1
+
n2
( )
< p 2 − p1 < Pˆ2 − Pˆ1 + Z α / 2 *
pˆ 1 * qˆ1 pˆ 2 * qˆ 2
n1
+
n2
Datos:
P: baterías de automóvil.
X: tiempo de duración en años de una batería.
Media poblacional μx = 3 años.
Desviación estándar poblacional σx = 1 año. X ~ N( μ x = 3, σ x = 1)
Intervalo de varianza IC = 95%.
Tamaño de la muestra n = 5 baterías.
Incógnita:
σ2 = 1 año 2
Solución:
Se desea estimar el valor de la varianza utilizando S 2 como estimador.
2
n
n
n ∑ x i2 − ∑ x i
s 2 = i =1 i =1
n ( n − 1)
s2 =
( 5) * ( 48.26 ) − (15) 2 =
241.3 − 225
= 0.815 año 2
( 5)( 4) 20
S = 0.902774 años
( n − 1) s 2 <σ 2
<
( n − 1) s 2
χ α2 χ 12− α
2 2
( 5 − 1)( 0.815) < σ 2 < ( 5 − 1)( 0.815) ⇒ ( 4)( 0.815) < σ 2 < ( 4)( 0.815)
11.113 0.484 11.113 0.484
3.26 3.26
<σ2 <
11.113 0.484
0.292639 < σ 2 < 6.735537 ( año 2 )
Respuesta:
Podemos afirmar con 95% de confianza que, ya que este intervalo 0.292639 < σ 2 < 6.735537 contiene a 1,
que la afirmación del fabricante, de que σ2 = 1, es válida.
a) Calcule un intervalo de confianza de 95% para μ1 – μ2, suponga que las poblaciones se distribuyen de
forma aproximadamente normal. Puede no suponer que las varianzas son iguales.
Datos:
P1 : neumáticos de la marca A.
P2 : neumáticos de la marca B.
X1 : duración en kilómetros de un neumático de la marca A.
X2 : duración en kilómetros de un neumáticos de la marca B.
Tamaño de la primer muestra n1 = 12 neumáticos.
Tamaño de la segunda muestra n2 = 12 neumáticos.
Media de la primer muestra x 1 = 36300 Km.
Media de la segunda muestra x 2 = 38100 Km.
Desviación estándar de la primer muestra s 1 = 5000 Km.
Desviación estándar de la segunda muestra s 2 = 6100 Km.
a) Incógnita:
Intervalo de confianza para la diferencia de las medias poblacionales, μ 1 – μ2, con 95% de confianza.
Solución:
s12 s 22 s12 s 22
( x1 − x 2 ) − t α + < μ1 − μ 2 < ( x1 − x 2 ) + t α + donde t α 2 es el valor t con
2 n1 n 2 2 n1 n2
υ=
(s12
n1 + s 2
2 n2
2
)
(
s12 n1
2
+
) (
s22 n2
2
)
n1 −1 n 2 −1
Respuesta:
Podemos afirmar con un 95% de confianza que la diferencia entre las medias poblacionales se encuentra entre
–6533.4 y 2933.4.
b) Incógnita:
Intervalo de confianza de 90% para σ 21/ σ22.
Solución:
2
25000000 1 σ 1 25000000
< 2 < ( 2.80 )
37210000 2.80 σ 2 37210000
σ 12
0.238249 < < 1.894652
σ 22
Respuesta:
Podemos afirmar con 90% de confianza que σ 12 σ 22 se encuentra entre 0.238249 y 1.894652, ya que el
intervalo contiene a 1 es razonable asumir que σ21 = σ22.
Solución:
En símbolos:
H 0 ) p ≥ 0.30
H 1 ) p < 0.30
a) Cuando concluye que al menos de 30% del público es alérgico a algunos productos de queso cuando, de
hecho, el 30% o más son alérgicos.
b) Cuando concluye que al menos el 30% del público es alérgico a algunos productos de queso cuando, de
hecho, menos del 30% son alérgicos.
Datos:
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Proporción de adultos graduados universitarios p = 0.6 graduados universitarios.
Respuesta:
La probabilidad de cometer un error tipo I con p = 0.6 es del 6.09%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
Proporción de adultos graduados universitarios p = 0.5 graduados universitarios.
i =12
β = P(error tipo II) =P(6 ≤ x ≤ 12 | p = 0.5) = ∑b( x;15;0.5) = Aplicando Tabla A.1 = 0.8464 =
i =6
84.64%.
c) Incógnita:
Es este un buen procedimiento de prueba?
Solución:
El procedimiento empleado para este ejercicio no es un buen procedimiento de prueba ya que la probabilidad
β es muy alta.
Problema 33 (Ref: Pág. 304 – Ej. 5)
Repita el ejercicio 4 cuando se seleccionan 200 adultos y la región de aceptación se define como 110 ≤
x ≤ 130 donde x es el número de graduados universitarios en nuestra muestra. Utilice la
aproximación normal.
Datos:
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Proporción de adultos graduados universitarios p = 0.6 graduados universitarios.
y −µ
Z=
σ
α = P(error tipo I) = P(110 > x > 130 | p = 0.6) = P( x < 110 | p = 0.6) + P( x > 130 | p = 0.6) =
= P(z < -1.52) + P(z < 1.52) = (2)*(0.0643) = 0.1286 = 12.86%.
Respuesta:
La probabilidad de cometer un error tipo I con p = 0.6 es del 12.86%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
y −µ
Z=
σ
β = P(error tipo II) =P(110 < x < 130 | p = 0.5) =P(1.34 < z < 4.31) = P(z ≤ 4.31) – P(z ≤ 1.34) =
= 1 – 0.9099 = 0.0901 = 9.01%.
y −µ
Z=
σ
β = P(error tipo II) =P(110 < x < 130 | p = 0.7) = P(-4.71< z < -1.47) = P(z ≤ -1.47) – P(z ≤ -4.71) =
= 0.0708 – 0 = 0.0708 = 7.08%.
Respuesta:
c) Incógnita:
Es este un buen procedimiento de prueba?
Solución:
Para este procedimiento la probabilidad de cometer un error Tipo I es algo alto, aunque se reduce
dramáticamente la probabilidad de cometer un error Tipo II.
Datos:
P : votantes de una cierta ciudad.
p : proporción de votantes a favor del impuesto.
X : un votante de esa ciudad.
Tamaño de la muestra n = 400 votantes.
Región de aceptación 220 < x < 260 → 221 ≤ x ≤ 259 votantes que favorecen el impuesto.
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Proporción de votantes a favor del impuesto p = 0.6 votantes a favor del impuesto.
y −µ
Z=
σ
α = P(error tipo I) = P(221 > x > 259 | p = 0.6) = P( x < 221 | p = 0.6) + P( x > 259 | p = 0.6) =
=P(z < -1.99) + P(z < 1.99) = (2)*(0.0233) = 0.0466 = 4.66%.
Respuesta:
La probabilidad de cometer un error tipo I con p = 0.6 es del 4.66%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
y −µ
Z=
σ
β = P(error tipo II) =P(221 < x < 259 | p = 0.48) = P(2.85< z < 6.75) = P(z ≤ 6.75) – P(z ≤ 2.85) =
=1 – 0.9978 = 0.0022 = 0.22%.
Respuesta:
La probabilidad de cometer un error tipo II con p = 0.48 es del 0.22%.
Datos:
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Proporción de votantes a favor del impuesto p = 0.6 votantes a favor del impuesto.
Media μ = n*p = (400)*(0.6) = 240.
Desviación estándar σ = n * p * q = ( 400 ) * ( 0.6 ) * ( 0.4) ≅ 9.79
Necesitamos conocer el área bajo la curva normal entre
215 ≤ x ≤ 265 → 215 - 0.5 ≤ y ≤ 265 + 0.5 → 214.5 ≤ y ≤ 265.5
α = P(error tipo I) = P(214 > x > 266, cuando p = 0.6) = (2)*P(z < -2.60) = (2)*(0.0047) = 0.0094 = 0.94%.
Respuesta:
La probabilidad de cometer un error tipo I con p = 0.6 es del 0.94%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
Proporción de adultos graduados universitarios p = 0.48 graduados universitarios.
Media μ = n*p = (400)*(0.48) = 192.
Desviación estándar σ = n * p * q = ( 400 ) * ( 0.48) * ( 0.52 ) ≅ 9.99
Necesitamos conocer el área bajo la curva normal entre 214.5 y 265.5
215 ≤ x ≤ 265 → 215 - 0.5 ≤ y ≤ 265 + 0.5 → 214.5 ≤ y ≤ 265.5
β = P(error tipo II) =P(214 < x < 266, cuando p = 0.48) =P(2.25≤ z ≤ 7.35) = P(z ≤ 7.35) – P(z ≤ 2.25) =
= 1 – 0.9878 = 0.0122 = 1.22%.
Respuesta:
La probabilidad de cometer un error tipo II con p = 0.48 es del 1.22%.
Problema 36 (Ref: Pág. 305 – Ej. 15)
Una máquina de refrescos en un restaurante de carnes asadas se ajusta de modo que la cantidad de
bebida que sirva esté distribuida de forma aproximadamente normal con una media de 200 mililitros y
una desviación estándar de 15 mililitros. La máquina se verifica periódicamente con una muestra de
nueve bebidas y con el cálculo del contenido promedio. Si x cae en el intervalo 191 < x < 209, se
considera que la máquina opera de manera satisfactoria: de otro modo, concluimos que μ ≠ 200
mililitros.
a) Encuentre la probabilidad de cometer un error tipo I cuando μ = 200 mililitros.
Datos:
P : bebida que sirve cierta maquina de refresco.
X : medida en mililitros de esa maquina de refresco.
Tamaño de la muestra n = 9 bebidas.
Desviación estándar poblacional σ = 15 mililitros.
σ 15 15
Desviación estándar muestral σx = x = = = 5 mililitros.
n 9 3
Región de aceptación 191 < x < 209.
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Media μ = 200 mililitros. X ~ N( μ x = 200, σ x = 15)
Necesitamos conocer el área bajo la curva normal entre 191 y 209
α = P(error tipo I) = P(191 > x > 209) = (2)*P(z < -1.80) = (2)*(0.0359) = 0.0718 = 7.18%.
Respuesta:
La probabilidad de cometer un error tipo I con es del 7.18%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
Media μ = 215 mililitros. X ~ N( μ x = 200, σ x = 15)
Necesitamos conocer el área bajo la curva normal entre 191 y 209
β = P(error tipo II) =P(191 < x < 209) =P(-4.80 ≤ z ≤ -1.20) = P(z ≤ -1.20) – P(z ≤ -4.80) =
= 0.1151 – 0 = 0.1151 = 11.51%.
Respuesta:
La probabilidad de cometer un error tipo II es del 11.51%.
Datos:
P : focos fabricados en cierta empresa eléctrica.
X ~ N ( μ x = 788, σ x = 40 )
Incógnita:
Rechazo o aceptación de la hipótesis nula.
Solución:
Es conveniente estandarizar X e incluir de manera formal la variable aleatoria normal estándar Z, donde
X −μ
z=
σ
n
788 − 800
z= =-1.64
7.30
Respuesta:
No rechazamos la hipótesis nula ya que el valor de z hallado se encuentra dentro de la región de no rechazo.
Datos:
Incógnita:
Rechazo o aceptación de la hipótesis nula.
Solución:
Es conveniente estandarizar X e incluir de manera formal la variable aleatoria normal estándar Z, donde
X −μ
z=
σ
n
23500 − 20000
z= = 8.97.
3900 / 100
Respuesta:
Se sabe que el volumen de los envases de un lubricante particular se distribuye normalmente con una
varianza de 0.03 litros. Pruebe la hipótesis de que σ2 = 0.03 contra la alternativa de que σ2 ≠ 0.03 para la
muestra aleatoria de 10 envases del ejercicio 7 de la página 326. Use un nivel de significancía de 0.01.
Datos:
P : envases de un lubricante.
X : contenido en litros de un envase de ese lubricante.
Tamaño de la muestra n = 10 envases.
n
Media muestral ∑X
i =1
i
x=
n
10.2 + 9.7 + 10.1 + 10.3 + 10.1 + 9.8 + 9.9 + 10.4 + 10.3 + 9.8
= = 10.06 litros.
10
n
∑ (X − X)
2
i
Desviación estándar muestral i =1
s=
n −1
s=
(10.2 −10.06 )2 + (9.7 −10.06) 2 + (10.1 −10.06) 2 + (10.3 −10.06) 2 + (10.1 −10.06) 2 + (9.8 −10.06) 2 + (9.9 −10.06
9
(0.14 )2 + ( −0.36 )2 + ( 0.04 )2 + ( 0.24 )2 + (0.04)2 + ( − 0.26 )2 + ( − 0.16 )2 + (0.34)2 + ( 0.24 ) 2 + ( − 0.26 )2
= =
9
Nivel de significancia α = 0.01
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
10.06 −10
X −μ t= = 0.7722 .
t= 0.0777
s
n
Si − t α , n −1
< t < tα , n −1 , no se rechaza H0.
2 2
− t 0.01 ,9
< t < t 0.01 ,9
2 2
− t 0.005,9 < t < t 0.005,9 Aplicando Tabla A.4.
- 3.250 < t < 3.250
Respuesta:
No rechazamos la hipótesis nula ya que el valor de t hallado se encuentra dentro de la región de No Rechazo.
b) Ref. Pág. 339 – Ej.1
Datos:
Media muestral ∑X
i =1
i
=
10.2 + 9.7 + 10.1 + 10.3 + 10.1 + 9.8 + 9.9 + 10.4 + 10.3 + 9.8
= 10.06
x= 10
n
litros.
n
∑ (X − X)
2
i
Desviación estándar muestral i =1
s=
n −1
(10.2 −10.06 ) 2
+ (9.7 −10.06)
2
+ (10.1 −10.06)
2
+ (10.3 −10.06)
2
+ (10.1 −10.06)
2
+ (9.8 −10.06)
2
+ (9.9 −10.06
s =
9
(0.14 )2 + ( − 0.36 )2 + ( 0.04 )2 + ( 0.24 )2 + (0.04 )2 + ( − 0.26 )2 + ( − 0.16 )2 + ( 0.34 )2 + ( 0.24 ) 2 + ( − 0.26 )2
= =
9
Nivel de significancia α = 0.01
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
( n −1) * s 2
x2 =
σ2
Según Tabla A.5 => 0.025 < P(χ2 >18.13) < 0.05
Respuesta:
No rechazamos la hipótesis nula ya que la muestra de 10 envases no es suficiente para mostrar que σ2 no es
igual a 0.03.
toma de una población normal diferente con una desviación estándar σ2 = 3.4, tiene una media x 2 =
76. Pruebe la hipótesis de que μ1 = μ2 contra la alternativa μ1 ≠ μ2. Cite un valor P en su conclusión.
Datos:
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
z=
(X 1 − X 2 ) − ( μ1 − μ 2 )
σ12 σ 22
+
n1 n 2
z=
( 81 − 76) − ( 0) =
5
≅ 4.222
27.04 11.56 1.184
+
25 36
Respuesta:
Rechazamos la hipótesis nula ya que la probabilidad de que ocurra es aproximadamente del 0%.
Una compañía armadora de automóviles trata de decidir si compra llantas de la marca A o de la B para
sus modelos nuevos. Se lleva a cabo un experimento, para ayudar a llegar a una decisión, en el que se
usan 12 llantas de cada marca. Las llantas se utilizan hasta que se acaban. Los resultados son:
Prueba la hipótesis de que no hay diferencias en las dos marcas de llantas con un nivel de significancia
de 0.05. Suponga que las poblaciones se distribuyen de forma aproximadamente normal con varianzas
iguales.
Datos:
Tamaño de la primer muestra n1 = 12 llantas.
Tamaño de la segunda muestra n2 = 12 llantas.
Desviación estándar de la primer muestra s1= 5100 Km.
Desviación estándar de la segunda muestra s2 = 5900 Km.
Media de la primer muestra x 1 = 37900 Km.
Media de la segunda muestra x 2 = 39800 Km.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
sp =
( s ) * ( n − 1) + ( s ) * ( n
2
1 1
2
2 2 − 1)
n1 + n2 − 2
sp =
( 26010000) * (11) + ( 34810000) * (11) =
286110000 + 382910000
=
669020000
= 5514.52 Km.
12 + 12 − 2 22 22
t=
(X 1− X 2 ) − ( μ1 − μ 2 )
1 1
sp +
n1 Warlet
Lafata Desio Fernando,
n 2 Iván Lautaro Página 60 de 104
Cátedra: Probabilidad y Estadística Trabajo Final
UADER 6 de Agosto de 2008
t=
( 37900 − 39800) − ( 0) =
− 1900
=
− 1900
≅ −0.84
1 1 ( 5514.52 )( 0.408) 2249.92
5514.52 +
12 12
Si − t α , n1 + n 2 − 2
< t < tα ,n1 + n 2 − 2 , no se rechaza H0.
2 2
− t 0.05 ,12 +12 − 2
< t < t 0.05 ,12 +12 − 2
2 2
− t 0.025, 22 < t < t 0.025, 22 Aplicando Tabla A.4.
− 2.074 < t < 2.074
Respuesta:
No rechazamos la hipótesis nula ya que el valor de t hallado se encuentra dentro de la región crítica.
Datos:
Tamaño de la primer muestra n1 = 12 llantas.
Tamaño de la segunda muestra n2 = 12 llantas.
Desviación estándar de la primer muestra s1= 5100 Km.
Desviación estándar de la segunda muestra s2 = 5900 Km.
Media de la primer muestra x 1 = 37900 Km.
Media de la segunda muestra x 2 = 39800 Km.
Hipótesis nula H 0: σ 1 = σ 2
Hipótesis alternativa H 1: σ 1 < σ 2
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Sabemos que:
1
f 1−α ( υ1, υ2 ) = con v1 = n1 −1 y v2 = n2 −1 grados de libertad
f α ( υ 2 , υ1 )
Lafata Desio Fernando, Warlet Iván Lautaro Página 61 de 104
Cátedra: Probabilidad y Estadística Trabajo Final
UADER 6 de Agosto de 2008
1 1
f 0.95 (11,11) = = ≅ 0.35
f 0.05 (11,11) 2.82
Gráficamente:
2
La hipótesis nula se rechaza cuando f > 2.82 ó f < 0.35 , donde f = s1 , con v1 = 11 y v1 = 11
s 22
grados de libertad.
23010000
y por ello f = = 0.7472
34810000
Respuesta:
Rechazamos la hipótesis nula, para σ12 = σ22 , ya que el valor de f hallado es f < 0.35, 0.7472 < 0.35.
Pruebe la hipótesis de que el tiempo de duración promedio de las películas producidas por la compañía
2 excede el tiempo promedio de duración de la que produce la compañía 1 en 10 minutos, contra la
alternativa unilateral de que la diferencia es de más de 10 minutos. Utilice un nivel de significancia de
0.1 y suponga que las distribuciones de los tiempos son aproximadamente normales con varianzas
iguales.
Datos:
X1 : tiempo de duración en minutos de una película producida por la compañía 1.
X2 : tiempo de duración en minutos de una película producida por la compañía 2.
Tamaño de la primer muestra n1 = 5 películas.
Tamaño de la segunda muestra n2 = 7 películas.
n
(
X 1 ~ N μ x1 = 97.4, σ x1 = 19.86 ) (
X 2 ~ N μ x 2 = 110, σ x 2 = 79.95 )
∑ (X − X)
2
i
Desviación estándar de la primer muestra i =1
s1 =
n1 − 1
s1 =
(102 − 97.4) 2 + (86 − 97.4) 2 + (98 − 97.4) 2 + (109 − 97.4) 2 + (92 − 97.4) 2 =
4
∑ (X − X)
n
2
i
Desviación estándar de la segunda muestra
s2 = i =1
n2 −1
s2 =
( 81 − 110 ) 2 + (165 − 110)2 + (97 − 110) 2 + (134 − 110)2 + (92 − 110)2 + (87 − 110)2 + (114 − 110) 2 =
6
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
t=
(X 2 − X1 ) − ( μ 2 − μ1 )
s 22 s12
+
n 2 n1
t=
(110 − 97.4) − (10 ) =
12.6 − 10
=
2.6
=
2.6
≈ 0.22
913.24 78.67 130.46 + 15.73 146.19 12.09
+
7 5
Si − t α ,υ
< t < tα ,υ , no se rechaza H0.
2 2
Con
υ≅
( s1 n1 + s 2 n 2 )
2 2 2
=
( 78.68 5 + 913.25 7 )
2
=
( 15.74 + 130.46 )
2
=
( s1 n1 ) + ( s2 n2 )
2 2 2 2
( 78 . 68 5 ) 2
+
( 913 . 25 7 ) 2
( 15 . 74 ) 2
+
( 130 . 46 ) 2
n1 − 1 n2 − 1 5−1 7−1 4 6
=
( 146.2) 2 =
21374.44
=
21374.44
≈ 7.38 → υ = 7
247.75 17019.81 61.90 + 2836.75 2898.65
+
4 6
entonces: − t 0.1 ,7
< t < t 0.1 ,7
2 2
−t 0.05, 7 < t < t 0.05, 7 Aplicando Tabla A.4.
− 2.998 < t < 2.998
Respuesta:
No rechazamos la hipótesis nula ya que el valor de t hallado se encuentra dentro de la región crítica.
b) Ref. Pág. 340 – Ej. 10
Datos:
Tamaño de la primer muestra n1 = 5 películas.
Tamaño de la segunda muestra n2 = 7 películas.
n
∑ (X − X)
2
i
Desviación estándar de la primer muestra i =1
s1 =
n1 − 1
s1 =
(102 − 97.4) 2 + (86 − 97.4) 2 + (98 − 97.4) 2 + (109 − 97.4) 2 + (92 − 97.4) 2 =
4
∑ (X − X)
n
2
i
Desviación estándar de la segunda muestra
s2 = i =1
n2 −1
s2 =
( 81 − 110 ) 2 + (165 − 110) 2 + (97 − 110) 2 + (134 − 110)2 + (92 − 110)2 + (87 − 110)2 + (114 − 110) 2 =
6
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Sabemos que:
1
f 1−α ( υ1, υ2 ) = con v1 = n1 −1 y v2 = n2 −1 grados de libertad
f α ( υ 2 , υ1 )
1 1
f 0.95 ( 4,6 ) = = ≅ 0.16
f 0.05 ( 6,4 ) 6.16
Gráficamente:
2
f = s
La hipótesis nula se rechaza cuando f > 4.53 ó f < 0.16 , donde 1 , con v1 = 4 y v1 = 6
s 22
grados de libertad.
78.7
y por ello f = = 0.09
913.25
Respuesta:
Rechazamos la hipótesis nula, para σ12 = σ22 , ya que el valor de f hallado es f < 0.16, 0.09 < 0.16.
Datos:
X ~ N( μ x = 22.5, σ x = 4.10)
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
x −μ
Z=
σ
28 − 22.5
Z = = 1.338877 ≈ 1.34
4.107919
Respuesta:
No rechazamos la hipótesis nula ya que no hay suficiente evidencia para concluir que P> 0.25.
Datos:
P1 : residentes urbanos de cierta ciudad.
P2 : residentes suburbanos de cierta ciudad.
p1 : proporción de residentes urbanos a favor de la construcción de una planta de energía nuclear.
p2 : proporción de residentes suburbanos a favor de la construcción de una planta de energía nuclear.
Tamaño de la primer muestra n1 = 100 residentes urbanos.
Tamaño de la segunda muestra n2 = 125 residentes suburbanos.
Cantidad de urbanos a favor x1 = 63 residentes urbanos.
Cantidad de suburbanos a favor x2 = 59 residentes suburbanos.
x 63
Proporción de urbanos a favor p̂1 = 1 = = 0.63
n 1 100
x2 59
Proporción de suburbanos a favor p̂ 2 =
= = 0.472
n 2 125
x + x2 63 + 59 122
Combinación de las proporciones p̂ = 1 = = = 0.542
n 1 + n 2 100 + 125 225
Hipótesis nula H0: p1 = p2.
Hipótesis alternativa H1: p1 ≠ p2.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
pˆ 1 − pˆ 2
z=
pˆ qˆ[ (1 n1 ) + (1 n2 ) ]
P(z > 2.36 ) = 2* P(z > 2.36) = 2*(1 – 0.9909) = 0.0182 = 1.82%
Respuesta:
Rechazamos la hipótesis nula ya que hay una probabilidad de que ocurra del 1.82%. La proporción de los
residentes urbanos a favor de la construcción de una planta de energía nuclear es mayor que la proporción de
los residentes suburbanos a favor de la construcción de dicha planta.
Datos:
P1 : mujeres con menos de dos años de casada.
P2 : mujeres con cinco años de casadas.
p1 : proporción de mujeres con menos de dos años de casadas.
p2 : proporción de mujeres con cinco años de casadas.
Tamaño de la primer muestra n1 = 300 mujeres con menos de dos años de casadas.
Tamaño de la segunda muestra n2 = 400 mujeres con cinco años de casadas.
Cantidad con menos de dos años de casadas x1 = 240 mujeres.
Cantidad con cinco años de casadas x2 = 288 mujeres.
x 240
Proporción con menos de dos años p̂1 = 1 = = 0.80
n 1 300
x 2 288
Proporción con cinco años p̂ 2 = = = 0.72
n 2 400
x + x 2 240 + 288 528
Combinación de las proporciones pˆ = 1 = = = 0.754
n1 + n 2 300 + 400 700
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Utilizamos la aproximación normal
pˆ 1 − pˆ 2
z=
pˆ qˆ[ (1 n1 ) + (1 n2 ) ]
Respuesta:
Rechazamos la hipótesis nula. La proporción de mujeres con menos de 2 años de casadas que planean tener
hijos es considerablemente más alta que la proporción de mujeres con 5 años de casadas que planean tener
hijos.
Muestra
Análisis 1 2 3 4 5
Rayos X 2,0 2,0 2,3 2,1 2,4
Químico 2,2 1,9 2,5 2,3 2,4
Suponga que las poblaciones son normales, pruebe con un nivel de signficancia de 0.05 si los dos
métodos de análisis dan, en promedio, el mismo resultado.
Datos:
Tamaño de la muestra n = 5 muestras.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
_
d=
( − 0.2) + ( 0.1) + ( − 0.2) + ( − 0.2) + ( 0.0) = −0.1
5
la desviación estándar
2
n
n
n * ∑ d i2 - ∑ d i
i =1 i =1
sd =
n * ( n − 1)
sd =
[ 2 2 2
]
5 * ( - 0.2 ) + ( 0.1) + ( - 0.2 ) + ( - 0.2 ) + ( 0.0 ) - [ ( − 0.2) + ( 0.1) + ( − 0.2) + ( − 0.2) + ( 0.0 ) ]
2 2 2
5 * ( 5 − 1)
5 * [ ( 0.13) ] - [ ( − 0.5) ]
2
0.4
sd = = = 0.1414
5 * ( 4) 20
_
d− d 0
Calculamos t = s con nuestros datos
d
n
− 0.1
t= = −1.58
0.1414
5
Respuesta:
No rechazamos la hipótesis nula. Concluimos que ambos métodos no son considerablemente diferentes.
¿ Podemos concluir que los autos equipados con llantas radianes dan una economía de combustible
mejor que los equipados con llantas de cinturón?. Suponga que las poblaciones se distribuyen
normalmente. Utilice un valor P en su conclusión.
Datos:
Tamaño de la muestra n = 12 autos.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
_
d− d 0
Donde t = s con v = n-1 grados de libertad
d
n
Calculando:
n
∑d
La media muestral _ i =1 i
d=
n
_
d=
( 0.1) + ( − 0.2) + ( 0.4) + ( 0.1) + ( − 0.1) + ( 0.1) + ( 0.0 ) + ( 0.2) + ( 0.5) + ( 0.2 ) + ( 0.1) + ( 0.3) = 0.1417 Km
12
la desviación estándar
2
n
n
n * ∑ d i2 - ∑ d i
i =1 i =1
sd =
n * ( n − 1)
12 * [ ( 0.67 ) ] - [1.7 ]
2
5.15
sd = = = 0.198 Km
12 * (11) 132
_
d− d 0
Calculamos t = s con nuestros datos
d
n
0.1417
t= = 2.48
0.198
12
Y P = P( t > 2.48) = 0.02 con 11 grados de libertad
Respuesta:
Rechazamos hipótesis nula ya que el nivel de significancia esta por encima del 0.02.
Datos:
Tamaño de la muestra n = 7 mujeres.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
_
d− d 0
Donde t = s con v = n-1 grados de libertad
d
n
Calculando:
n
∑d
La media muestral _ i =1 i
d=
n
Mujeres
Peso 1 2 3 4 5 6 7
58, 60, 61, 69, 64, 62,
Antes 5 3 7 0 0 6 56,7
60, 54, 58, 62, 58, 59,
Después 0 9 1 1 5 9 54,4
di -1,5 5,4 3,6 6,9 5,5 2,7 2,3
_
d=
( − 1.5) + ( 5.4) + ( 3.6) + ( 6.9) + ( 5.5) + ( 2.7 ) + ( 2.3) = 3.557 Kilogramos
7
la desviación estándar
2
n
n
n * ∑ d i2 - ∑ d i
i =1 i =1
sd =
n * ( n − 1)
7 * [ (134.81) ] - [24.9 ]
2
323.66
sd = = = 2.776 Kilogramos
7 * (6 ) 42
_
d− d 0 3.557 − 4.5
t= = −0.896
Calculamos t = s con nuestros datos 2.776
d
n 7
Respuesta:
No rechazamos la hipótesis nula.
Si se supone que las poblaciones se distribuyen normalmente, ¿ hay suficiente evidencia, al nivel de
significancia de 0.05, para decir que la duración del almacenamiento influye en las concentraciones
residuales de ácido sórbico?
Datos:
Tamaño de la muestra n = 8 rebanadas.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
_
d− d 0
Donde t = s con v = n-1 grados de libertad
d
n
Calculando:
n
∑d
La media muestral _ i =1 i
d=
n
_
d=
(108) + (174) + (161) + (115) + (153) + ( 63) + ( 711) + (104) = 198.625
Millón/partes
8
la desviación estándar
2
n
n
n * ∑ d i2 - ∑ d i
i =1 i =1
sd =
n * ( n − 1)
8 * [ (624801) ] - [1589 ]
2
2473487
sd = = = 210.165 Millón/partes
8 * (7 ) 56
_
d− d 0
Calculamos t = s con nuestros datos
d
n
198.625
t= = 2.67
210.165
8
Respuesta:
Rechazamos la hipótesis nula. La duración de almacenamiento influye en las concentraciones residuales de
ácido sórbico.
x 0 1 2 3
3 5
f 1 1 5 25
Pruebe la hipótesis con un nivel de significancia de 0.05 de que los datos registrados se pueden ajustar
con una distribución hipergeométrica h (x; 8, 3, 5), x = 0, 1, 2, 3.
Datos:
Variable aleatoria X: números de canicas rojas.
Repeticiones del experimento m = 112 veces.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
k N − k
Aplicando la distribución hipergeométrica a nuestros datos:
N
Lafata Desio Fernando, Warlet Iván Lautaro n Página 78 de 104
Cátedra: Probabilidad y Estadística Trabajo Final
UADER 6 de Agosto de 2008
5 8 − 3
03− (1)
P(x = 0)=
= = ≅0.1786 e0 = (112)*(0.01786) = 2.
8 56
3
Lafata Desio Fernando, Warlet Iván Lautaro Página 79 de 104
Cátedra: Probabilidad y Estadística Trabajo Final
UADER 6 de Agosto de 2008
5 8 − 3
13− 2(5)31
P(x = 1)=
8 56
3
Lafata Desio Fernando, Warlet Iván Lautaro Página 80 de 104
Cátedra: Probabilidad y Estadística Trabajo Final
UADER 6 de Agosto de 2008
5 8− 3
23− 1(0)3
P(x = 2)=
8 56
3
Lafata Desio Fernando, Warlet Iván Lautaro Página 81 de 104
Cátedra: Probabilidad y Estadística Trabajo Final
UADER 6 de Agosto de 2008
5 8 − 3
3− 0(1)
P(x = 3)=
8 56
3
I xi P(x = xi) ei = mpi oi j
1 0 0.01786 2 1 1
2 1 0.26786 30 31
3 2 0.53571 60 55 2
4 3 0.17857 20 25 3
Totales ~1 112 112
Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia,
el numero total de intervalos se reduce de cuatro a tres, lo que tiene como resultado υ = 2 grados de libertad.
Una prueba de la bondad de ajuste entre las frecuencias observadas y esperadas se basa en la cantidad
2 (
n o i − ei )2
χ = ∑
i =1 ei
Donde χ2 es un valor de una variable aleatoria cuya distribución muestral se aproxima muy de cerca con la
distribución ji cuadrada con υ = k – 1grados de libertad. Los símbolos oi y ei representan las frecuencias
observada y esperada, respectivamente, para la i-ésima celda.
2 (
n o i − ei ) 2 ( 32 − 32 ) 2 ( 55 − 60) 2 ( 25 − 20 ) 2 25 25
χ = ∑ = + + =0+ + = 1.667
i =1 ei 32 60 20 60 20
2
Para un nivel de significancia igual a α, encontramos el valor crítico χα de la tabla A.5., y entonces
χ 2 > χ α2 constituye la región critica.
Con el uso de la tabla A.5., encontramos χ02.05 = 5.991 con υ = 2 grados de libertad.
Respuesta:
Como χ 2 < χ α2 , 1.667 < 5.991, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia
para sospechar que la distribución no es hipergeométrica.
x 1 2 3 4 5 6 7 8
13 6 3 1
f 6 0 4 2 9 1 3 1
Prueba la hipótesis con un nivel de significancia de 0.05 de que la distribución observada de X se puede
ajustar por una distribución geométrica g (x; 1/2), x = 1, 2, 3,......
Datos:
Variable aleatoria X: números de lanzamientos hasta que sale una cara.
Repeticiones del experimento m = 256 veces.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
8 8 0.00390625 2 1
Totales ~1 256 256
Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia,
el numero total de intervalos se reduce de ocho a seis, lo que tiene como resultado υ = 5 grados de libertad.
2 (
n oi − ei ) 2 (136 − 128) 2 ( 60 − 64) 2 ( 34 − 32 ) 2 (12 − 16 ) 2 ( 9 − 8) 2 ( 5 − 8) 2 64 16 4 16 1 9 25
χ = ∑ = + + + + + = + + + + + = =
i =1 ei 128 64 32 16 8 8 128 64 32 16 8 8 8
2
Para un nivel de significancia igual a α, encontramos el valor critico χα de la tabla A.5., y entonces
χ 2 > χ α2 constituye la región critica.
Con el uso de la tabla A.5., encontramos χ02.05 = 11.070 con υ = 5 grados de libertad.
Respuesta:
Como χ 2 < χ α2 , 3.125 < 11.070, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia
para sospechar que la distribución no es geométrica.
Datos:
Calificaciones m = 60.
Intervalos i = 9.
Media μ = 65.
Desviación estándar σ = 21.
De acuerdo con el ejercicio 1 de la página 68, los intervalos y las frecuencias que se observan son
i Limite de oi
clases
1 - ∞ – 19.5 3
2 19.5 – 29.5 2
3 29.5 – 39.5 3
4 39.5 – 49.5 4
5 49.5 – 59.5 5
6 59.5 – 69.5 11
7 69.5 – 79.5 14
8 79.5 – 89.5 14
9 89.5 – + ∞ 4
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Los valores z que corresponden a los límites de las clases son:
− ∞ − 65 − ∞ 19.5 − 65 − 45.5
z11 = = = −∞ z12 = = ≅ −2.17
21 21 21 21
de la tabla A.3. encontramos que el área entre z 11 y z12 es
P(- ∞< z < -2.17) = P(z < -2.17) – P(z < - ∞) = 0.0150 – 0 = 0.0150
De aquí, la frecuencia esperada para la primer clase es
e1 = (60)*(0.0150) = 0.9
e4 = (60)*(0.1165) = 6.99
89.5 − 65 24.5 + ∞ − 65 + ∞
z 91 = = ≅ 1.17 z 92 = = = +∞
21 21 21 21
de la tabla A.3. encontramos que el área entre z 91 y z92 es
P(1.17 < z < +∞) = P(z < +∞) – P(z < 1.17) = 1 – 0.8790 = 0.121
De aquí, la frecuencia esperada para la novena clase es
e9 = (60)*(0.121) = 7.26
Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia,
el numero total de intervalos se reduce de nueve a seis, lo que tiene como resultado υ = 5 grados de libertad.
2
Para un nivel de significancia igual a α, encontramos el valor critico χα de la tabla A.5., y entonces
χ 2 > χ α2 constituye la región critica.
Con el uso de la tabla A.5., encontramos χ02.05 = 11.070 con υ = 5 grados de libertad.
Respuesta:
Como χ 2 < χ α2 , 6.11 < 11.070, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia
para sospechar que la distribución no es normal.
Datos:
Calificaciones m = 40.
Intervalos i = 10.
Media μ = 1.8.
Desviación estándar σ = 0.4.
De acuerdo con el ejercicio 5 de la página 69, los intervalos y las frecuencias que se observan son
i Limite de oi
clases
1 - ∞ – 0.795 1
2 0.795 – 0.995 1
3 0.995 – 1.195 1
4 1.195 – 1.395 2
5 1.395 – 1.595 4
6 1.595 – 1.795 13
7 1.795 – 1.995 8
8 1.995 – 2.195 5
9 2.195 – 2.395 3
10 2.395 – + ∞ 2
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Los valores z que corresponden a los límites de las clases son:
10 0,0681 2,724 2
Totales ~1 40 40
Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia,
el numero total de intervalos se reduce de diez a seis, lo que tiene como resultado υ = 5 grados de libertad.
(
n oi − ei
2
)( 5 − 6.248) 2 + ( 4 − 5.952) 2 + (13 − 7.64) 2 + ( 8 − 7.676) 2 + ( 5 − 6.04 ) 2 + ( 5 − 6.444 ) 2 =
χ2 = ∑ =
i =1 ei 6.248 5.952 7.64 7.676 6.04 6.444
1.56 3.81 28.73 0.10 1.08
= + + + + + 2.08 ≅ 5.166
6.248 5.952 7.64 7.676 6.04 6.444
2
Para un nivel de significancia igual a α, encontramos el valor critico χα de la tabla A.5., y entonces
χ 2 > χ α2 constituye la región critica.
Con el uso de la tabla A.5., encontramos χ02.01 = 15.086 con υ = 5 grados de libertad.
Respuesta:
Como χ 2 < χ α2 , 5.166 < 15.086, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia
para sospechar que la distribución no es normal.
No Fumadores Fumadores
fumadores modernos empedernidos
Con hipertensión 21 36 30
Sin hipertensión 48 26 19
Datos:
Incógnita:
Dependencia o no de la hipertensión de los hábitos de fumar.
Solución:
Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 2 × 3 y definimos los
siguientes eventos.
N: Un individuo seleccionado es no fumador.
M: Un individuo seleccionado es fumador moderado.
E: Un individuo seleccionado es fumador empedernido.
S: Un individuo seleccionado tiene hipertensión.
C: Un individuo seleccionado no tiene hipertensión.
Tabla de contingencia 2 X 3:
N M E Total
C 2 3 3 87
1 6 0
S 4 2 1 93
8 6 9
Total 6 6 4 180
9 2 9
Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad:
69
P( N ) = ≃ 0.383
180
62
P( M ) = ≃ 0.344
180
49
P( E ) = ≃ 0.272
180
87
P( C ) = ≃ 0.483
180
93
P ( S) = ≃ 0.517
180
Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias
esperadas:
P( N C ) = P( N ) P( C ) =
( 69)( 87 )
≃ 33.35
180
P ( N S) = P ( N ) P ( S) =
( 69)( 93)
≃ 35.65
180
P ( M C ) = P( M ) P( C ) =
( 62)( 87 )
≃ 29.97
180
P ( M S) = P ( M ) P ( S) =
( 62 )( 93)
≃ 32.03
180
P( E C ) = P ( E ) P( C ) =
( 49)( 87 )
≃ 23.68
180
P ( E S) = P ( E ) P ( S) =
( 49 )( 93)
≃25.32
180
N M E Total
C 33.3 29.9 23.6 87
5 7 8
S 35.6 32.0 25.3 93
5 3 2
Total 69 62 49 180
Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, que dice:
Calcular
2 ( o i − ei ) 2
χ =∑
i ei
Donde la suma se extiende a todas las celdas rc en la tabla de contingencia r X c. Si χ 2 > χ α2 con
υ = (r - 1)(c - 1) grados de libertad, rechazar la hipótesis nula de independencia al nivel de significancia α;
en cualquier otro caso, aceptar la hipótesis nula.
(
n o − ei ) 2 ( 21 − 33.35) 2 ( 36 − 29.97) 2 ( 30 − 23.68) 2 ( 48 − 35.65) 2 ( 26 − 32.03) 2 (19 − 25.32) 2
χ2 = ∑ i = + + + + + =
i =1 ei 33.35 29.97 23.68 35.65 32.03 25.32
152.52 36.36 39.94 152.52 36.36 39.94
= + + + + + = 14.46
33.35 29.97 23.68 35.65 32.03 25.32
Si χ 2 > χ α2 con υ =(r – 1)(c – 1) grados de libertad, rechazar la hipótesis nula de independencia.
De la tabla A.5. encontramos que χ02.05 = 5.991 para υ = (2 – 1)(3 – 1) = 2 grados de libertad.
Respuesta:
Como χ 2 > χ α2 , 14.46 > 5.991, se rechaza la hipótesis nula. Concluimos que la presencia o ausencia de
hipertensión y el hábito de fumar no son independientes.
Número de hijos
Educación 0-1 2-3 Over 3
Elemental 14 37 32
Secundaria 19 42 17
Universidad 12 17 10
Datos:
Incógnita:
Dependencia o no del tamaño de la familia del nivel de instrucción del padre.
Solución:
Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 3 × 3 y definimos los
siguientes eventos.
E: Un hombre seleccionado tiene un nivel de educación elemental.
S: Un hombre seleccionado tiene un nivel de educación secundaria.
U: Un hombre seleccionado tiene un nivel de educación universitaria.
0: Un hombre seleccionado tiene a lo más un hijo.
2: Un hombre seleccionado tiene entre dos y tres hijos.
3: Un hombre seleccionado tiene más de tres hijos.
Tabla de contingencia 3 X 3:
0 2 3 Total
E 1 3 3 83
4 7 2
S 1 4 1 78
9 2 7
U 1 1 1 39
2 7 0
Total 4 9 5 200
5 6 9
Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad:
83
P( E ) = ≃ 0.415
200
78
P ( S) = ≃ 0.39
200
39
P( U ) = ≃0.195
200
45
P( 0 ) = ≃ 0.225
200
96
P( 2 ) = ≃ 0.48
200
59
P ( 3) = ≃ 0.295
200
Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias
esperadas:
P ( E 0 ) = P ( E ) P( 0 ) =
( 83)( 45)
≃ 18.675
200
P( E 2 ) = P( E ) P( 2 ) =
( 83)( 96)
≃ 39.84
200
P( E 3) = P( E ) P( 3) =
( 83)( 59)
≃ 24.485
200
P ( S 0 ) = P ( S) P ( 0 ) =
( 78)( 45)
≃ 17.55
200
P ( S 2 ) = P ( S) P ( 2 ) =
( 78)( 96)
≃ 37.44
200
P( S 3) = P( S) P( 3) =
( 78)( 59)
≃ 23.01
200
P ( U 0 ) = P( U ) P( 0 ) =
( 39)( 45)
≃ 8.775
200
P ( U 2 ) = P( U ) P( 2 ) =
( 39)( 96)
≃18.72
200
P ( U 3) = P ( U ) P ( 3) =
( 39)( 59 )
≃ 11.505
200
0 2 3 Total
E 18.67 39.8 24.48 83
5 4 5
S 17.55 37.4 23.01 78
4
U 8.775 18.7 11.50 39
2 5
Total 45 96 59 180
Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, con nuestros datos:
2 (
n oi − ei )2 (14 − 18.675 ) 2 ( 37 − 39.84 ) 2 ( 32 − 24.485 ) 2 (19 − 17.55 ) 2 ( 42 − 37.44 ) 2 (17 − 23.01) 2 (12 − 8.775 ) 2
χ = ∑ = + + + + + +
i =1 ei 18.675 39.84 24.485 17.55 37.44 23.01 8.775
Si χ 2 > χ α2 con υ =(r – 1)(c – 1) grados de libertad, rechazar la hipótesis nula de independencia.
De la tabla A.5. encontramos que χ02.05 = 9.488 para υ = (3 – 1)(3 – 1) = 4 grados de libertad.
Respuesta:
Como χ 2 < χ α2 , 7.46 < 9.488, no se rechaza la hipótesis nula. Concluimos que el tamaño de la familia es
independiente del nivel de instrucción del padre.
Tipo de crimen
Distrito Asalto Robo Hurto Homicidio
1 162 118 451 18
2 310 196 996 25
3 258 193 458 10
Datos:
Incógnita:
Dependencia o no del tamaño de la familia del nivel de instrucción del padre.
Solución:
Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 4 × 4 y definimos los
siguientes eventos.
A: El tipo de crimen es asalto.
R: El tipo de crimen es robo.
U: El tipo de crimen es hurto
H: El tipo de crimen es homicidio
1: El distrito seleccionado es el 1.
2: El distrito seleccionado es el 2.
3: El distrito seleccionado es el 3.
4: El distrito seleccionado es el 4
Tabla de contingencia 4 X 4:
A R U H Total
1 162 11 451 1 749
8 8
2 310 19 996 2 1527
6 5
3 358 19 458 1 1019
3 0
4 280 17 390 1 864
5 9
Total 111 68 229 7 4159
0 2 5 2
Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad:
1110
P( A ) = ≃ 0.27
4159
682
P( R ) = ≃ 0.16
4159
2295
P( U ) = ≃0.55
4159
72
P( H ) = ≃0.02
4159
749
P(1) = ≃ 0.18
4159
1527
P( 2 ) = ≃ 0.37
4159
1019
P( 3) = ≃ 0.24
4159
864
P( 4 ) = ≃ 0.21
4159
Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias
esperadas:
P( A 1) = P( A ) P (1) =
(1110 )( 749)
≃ 199.90
4159
P( U 1) = P( U ) P(1) =
( 2295)( 749)
≃ 413.31
4159
P( A 2 ) = P( A ) P( 2 ) =
(1110)(1527 )
≃ 407.55
4159
P ( U 2 ) = P( U ) P ( 2 ) =
( 2295)(1527 )
≃ 842.62
4159
P( A 3) = P( A ) P( 3) =
(1110)(1019)
≃ 271.96
4159
P( U 3) = P( U ) P( 3) =
( 2295)(1019)
≃ 562.30
4159
P( A 4 ) = P( A ) P ( 4 ) =
(1110)( 864)
≃ 230.59
4159
P( U 4 ) = P( U ) P( 4 ) =
( 2295)( 864)
≃ 476.77
4159
P( R 1) = P( R ) P(1) =
( 682)( 749)
≃ 122.82
4159
P( H 1) = P( H ) P(1) =
( 72)( 749)
≃ 12.97
4159
P( R 2 ) = P( R ) P ( 2 ) =
( 682 )(1527 )
≃ 250.40
4159
P ( H 2 ) = P( H ) P( 2 ) =
( 72)(1527 )
≃ 26.43
4159
P( R 3) = P( R ) P( 3) =
( 682 )(1019)
≃ 167.10
4159
P( H 3) = P( H ) P( 3) =
( 72)(1019)
≃ 17.64
4159
P( R 4 ) = P( R ) P ( 4 ) =
( 682)( 864)
≃ 141.68
4159
P ( H 4 ) = P( H ) P ( 4 ) =
( 72)( 864)
≃ 14.96
4159
A R U H Total
1 199.9 122.8 413.3 12.9 749
2 1 7
2 407.5 250.4 842.6 26.4 1527
5 2 3
3 271.9 167.1 562.3 17.6 1019
6 0 0 4
4 230.5 141.6 476.7 14.9 864
9 8 7 6
Total 1110 682 2295 72 4159
Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, con nuestros datos:
(
n o − ei
2
)
(162 −199.9 ) 2 + (118 −122.82 ) 2 + ( 451 − 413.31) 2 + (18 −12.96 ) 2 + ( 310 − 407.54 ) 2 + (196
χ2 = ∑ i =
i =1 ei 199.9 122.82 413.31 12.96 407.54
+
( 25 − 26.43) 2 + ( 358 − 271.96 ) 2 + (193 −167.09 ) 2 + ( 458 − 562.3) 2 + (10 −17.64 ) 2 + ( 280 − 230.59 ) 2 + (175 −
26.43 271.96 167.09 562.3 17.64 230.59 14
+
(19 −14.96 ) = 1436.41 + 23.23 + 1420.53 + 25.40 + 9514.05 + 2959.36 + 23525.42 + 2.04 + 7402.88 + 671.3
2
14.96 199.9 122.82 413.31 12.96 407.54 250.4 842.62 26.43 271.96 167.09
1096.27 7527.29 16.32
+ + =165.01
141.89 476.76 14.96
Si χ 2 > χ α2 con υ =(r – 1)(c – 1) grados de libertad, rechazar la hipótesis nula de independencia.
De la tabla A.5. encontramos que χ02.01 = 21.666 para υ = (4 – 1)(4 – 1) = 9 grados de libertad.
Respuesta:
Como χ 2 > χ α2 , 165.01 > 21.666, se rechaza la hipótesis nula. Concluimos que el tipo de crimen no es
independiente del distrito de la ciudad.
Pruebe la hipótesis, con un nivel de significancia de 0.05, de que los tres remedios para la tos son
igualmente efectivos.
Datos:
Incógnita:
Homogeneidad o no entre los remedios.
Solución:
Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 3 × 3 y definimos los
siguientes eventos.
S: El remedio no proporciona alivio.
A: El remedio proporciona cierto alivio.
C: El remedio proporciona alivio completo.
N: El remedio seleccionado es NyQuil.
R: El remedio seleccionado es Robitussin.
T: El remedio seleccionado es Triaminic.
Tabla de contingencia 3 X 3:
N R T Total
S 1 1 9 33
1 3
A 3 2 2 87
2 8 7
C 7 9 1 30
4
Total 5 5 5 150
0 0 0
Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad.
33
P ( S) = = 0.22
150
87
P( A ) = ≃ 0.053
150
30
P( C ) = = 0.2
150
50
P( N ) = ≃ 0.33
150
50
P( R ) = ≃ 0.33
150
50
P( T ) = ≃ 0.34
150
Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias
esperadas:
P ( S N ) = P ( S) P ( N ) =
( 33)( 50)
= 11
150
P ( S R ) = P ( S) P ( R ) =
( 33)( 50 )
= 11
150
P ( S T ) = P ( S) P ( T ) =
( 33)( 5)
= 11
150
P( A N ) = P( A ) P( N ) =
( 87 )( 50)
= 29
150
P( A R ) = P( A ) P( R ) =
( 87 )( 50)
= 29
150
P( A R ) = P( A ) P( R ) =
( 87 )( 50)
= 29
150
P( C N ) = P( C ) P( N ) =
( 30)( 50)
= 10
150
P( C R ) = P ( C ) P ( R ) =
( 30)( 50)
=10
150
P( C R ) = P ( C ) P ( R ) =
( 30)( 50)
= 10
150
N R T Total
S 1 1 1 33
1 1 1
A 2 2 2 87
9 9 9
C 1 1 1 30
0 0 0
Total 5 5 5 150
0 0 0
Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, con nuestros datos:
2 (
n oi − ei ) 2 ( 11 − 11) 2 ( 13 − 11) 2 ( 9 − 11) 2 ( 32 − 29 ) 2 ( 28 − 29 ) 2 ( 27 − 29 ) 2 ( 7 − 10 ) 2 ( 9 − 10 ) 2 ( 14 − 10 ) 2
χ = ∑ = + + + + + + + + =
i =1 ei 11 11 11 29 29 29 10 10 10
4 4 9 1 4 9 1 16
=0+ + + + + + + + = 3.81
11 11 29 29 29 10 10 10
Respuesta:
Como χ 2 < χ α2 , 3.81 < 9.488, no se rechaza la hipótesis nula. Concluimos que los tres remedios son
igualmente efectivos.
Bibliografías:
Walpole, Myers y Myers, “Probabilidad y Estadística para Ingenieros”, sexta
edición.
Apuntes de la cátedra.