Está en la página 1de 24

4.

1 Los siguientes datos representan el número de días de ausencia al año de una población de
seis empleados de una empresa pequeña:

1 ,3 ,6 , 7 , 9 , 10
a) Suponga que muestrea sin remplazo, selecciona todas las muestras de n=2 posibles y
construye la distribución muestral de la media. Calcule la media de todas las medias
muestrales y la media poblacional. ¿Cómo se denomina a esta propiedad?

Obtenemos las muestras sin remplazo y sus respectivas medias:

Muestras Media muestral


m 1=1 , 3 2
m 2=1 , 6 3.5
m 3=1 , 7 4
m4 =1 ,9 5
m 5=1 , 10 5.5
m6=3 , 6 4.5
m 7=3 , 7 5
m8=3 , 9 6
m 9=3 , 10 6.5
m10=6 , 7 6.5
m 11=6 , 9 7.5
m12=6 , 10 8
m 13=7 , 9 8
m14=7 , 10 8.5
m 15=9 , 10 9.8
Su distribución seria:
La media de todas las medias muestrales seria:

μ x́ =
∑ x́ i = 90 =6 dias
n 15
La propiedad que nos dice que la media poblacional es igual a la suma de todas las medias
muestrales se llama propiedad de imparcialidad.

b) Responda al inciso a) considerando todas las muestras posibles con n=3

Obtenemos las muestras con n=3 y sus respectivas medias

Muestras Media muestral


m 1=1 , 3 ,6 3.33
m2=1 , 3 ,7 3.66
m 3=1 , 3 , 9 4.33
m4 =1 ,3 , 10 4.66
m 5=1 , 6 ,7 4.66
m 6=1 , 6 , 9 5.33
m 7=1 , 6 , 10 5.66
m 8=1 , 7 , 9 5.66
m 9=1 , 7 10 6.00
m 10=1 , 9 ,10 6.66
m 11=3 ,6 , 7 5.33
m 12=3 , 6 , 9 6.00
m 13=3 , 6 , 10 6.33
m14=3 , 7 , 9 6.33
m15=3 , 7 ,10 6.66
m 16=3 , 9 , 10 7.33
m17=6 , 7 , 9 7.33
m 18=6 , 7 , 10 7.66
m19=6,9,10 8.33
m 20=7 , 9 , 10 8.66
La distribución muestral seria:

Y la media de todas las muestras seria:

μ x́ =
∑ x́ i = 120 =6 dias
n 20
c) Compare la forma de la distribución muestral de la media de los incisos a) y b). ¿Cuál
distribución muestral tiene menor variabilidad? ¿Por qué?

La muestra con n=3 sin remplazo tiene menos variabilidad que la muestra con n=2 sin remplazo ya
que genera mayor cantidad de muestras, y de acuerdo con el teorema del limite central, a mayor
cantidad de muestras mayor es la cercanía con la distribución normal.

d) Suponga ahora que la muestrea con reemplazo, responda los incisos de a) a c). ¿Cuáles
distribuciones muestrales tienen menor variabilidad? ¿Por qué?

Obtenemos las muestras con remplazo para n=2

No Muestra x́ No Muestra x́
1 19 4
1 1 1 7 1
2 1 3 2 20 7 3 5
3 1 6 3.5 21 7 6 6.5
4 1 7 4 22 7 7 7
5 1 9 5 23 7 9 8
6 1 10 5.5 24 7 10 8.5
7 3 1 2 25 9 1 5
8 3 3 3 26 9 3 6
9 3 6 4.5 27 9 6 7.5
10 3 7 5 28 9 7 8
11 3 9 6 29 9 9 9
12 3 10 6.5 30 9 10 9.5
13 6 1 3.5 31 10 1 5.5
14 6 3 4.5 32 10 3 6.5
15 6 6 6 33 10 6 8
16 6 7 6.5 34 10 7 8.5
17 6 9 7.5 35 10 9 9.5
18 6 10 8 36 10 10 10

Cuya distribución muestral seria:


La media seria:

μ x́ =
∑ x́ i = 216 =6 dias
n 36

Para n=3 tenemos:


N Muestras Media N Muestras Media No Muestras Media
o o
1 1 1 1 1.0 37 3 1 1 1.7 73 6 1 1 2.7
2 1 1 3 1.7 38 3 1 3 2.3 74 6 1 3 3.3
3 1 1 6 2.7 39 3 1 6 3.3 75 6 1 6 4.3
4 1 1 7 3.0 40 3 1 7 3.7 76 6 1 7 4.7
5 1 1 9 3.7 41 3 1 9 4.3 77 6 1 9 5.3
6 1 1 10 4.0 42 3 1 10 4.7 78 6 1 10 5.7
7 1 3 1 1.7 43 3 3 1 2.3 79 6 3 1 3.3
8 1 3 3 2.3 44 3 3 3 3.0 80 6 3 3 4.0
9 1 3 6 3.3 45 3 3 6 4.0 81 6 3 6 5.0
10 1 3 7 3.7 46 3 3 7 4.3 82 6 3 7 5.3
11 1 3 9 4.3 47 3 3 9 5.0 83 6 3 9 6.0
12 1 3 10 4.7 48 3 3 10 5.3 84 6 3 10 6.3
13 1 6 1 2.7 49 3 6 1 3.3 85 6 6 1 4.3
14 1 6 3 3.3 50 3 6 3 4.0 86 6 6 3 5.0
15 1 6 6 4.3 51 3 6 6 5.0 87 6 6 6 6.0
16 1 6 7 4.7 52 3 6 7 5.3 88 6 6 7 6.3
17 1 6 9 5.3 53 3 6 9 6.0 89 6 6 9 7.0
18 1 6 10 5.7 54 3 6 10 6.3 90 6 6 10 7.3
19 1 7 1 3.0 55 3 7 1 3.7 91 6 7 1 4.7
20 1 7 3 3.7 56 3 7 3 4.3 92 6 7 3 5.3
21 1 7 6 4.7 57 3 7 6 5.3 93 6 7 6 6.3
22 1 7 7 5.0 58 3 7 7 5.7 94 6 7 7 6.7
23 1 7 9 5.7 59 3 7 9 6.3 95 6 7 9 7.3
24 1 7 10 6.0 60 3 7 10 6.7 96 6 7 10 7.7
25 1 9 1 3.7 61 3 9 1 4.3 97 6 9 1 5.3
26 1 9 3 4.3 62 3 9 3 5.0 98 6 9 3 6.0
27 1 9 6 5.3 63 3 9 6 6.0 99 6 9 6 7.0
28 1 9 7 5.7 64 3 9 7 6.3 100 6 9 7 7.3
29 1 9 9 6.3 65 3 9 9 7.0 101 6 9 9 8.0
30 1 9 10 6.7 66 3 9 10 7.3 102 6 9 10 8.3
31 1 10 1 4.0 67 3 10 1 4.7 103 6 10 1 5.7
32 1 10 3 4.7 68 3 10 3 5.3 104 6 10 3 6.3
33 1 10 6 5.7 69 3 10 6 6.3 105 6 10 6 7.3
34 1 10 7 6.0 70 3 10 7 6.7 106 6 10 7 7.7
35 1 10 9 6.7 71 3 10 9 7.3 107 6 10 9 8.3
36 1 10 10 7.0 72 3 10 10 7.7 108 6 10 10 8.7

No Muestra Medi No Muestra Medi No Muestra Media


a a
10 7 1 1 3.0 14 9 1 1 3.7 181 10 1 1 4.0
9 5
11 7 1 3 3.7 14 9 1 3 4.3 182 10 1 3 4.7
0 6
11 7 1 6 4.7 14 9 1 6 5.3 183 10 1 6 5.7
1 7
11 7 1 7 5.0 14 9 1 7 5.7 184 10 1 7 6.0
2 8
11 7 1 9 5.7 14 9 1 9 6.3 185 10 1 9 6.7
3 9
11 7 1 10 6.0 15 9 1 10 6.7 186 10 1 10 7.0
4 0
11 7 3 1 3.7 15 9 3 1 4.3 187 10 3 1 4.7
5 1
11 7 3 3 4.3 15 9 3 3 5.0 188 10 3 3 5.3
6 2
11 7 3 6 5.3 15 9 3 6 6.0 189 10 3 6 6.3
7 3
11 7 3 7 5.7 15 9 3 7 6.3 190 10 3 7 6.7
8 4
11 7 3 9 6.3 15 9 3 9 7.0 191 10 3 9 7.3
9 5
12 7 3 10 6.7 15 9 3 10 7.3 192 10 3 10 7.7
0 6
12 7 6 1 4.7 15 9 6 1 5.3 193 10 6 1 5.7
1 7
12 7 6 3 5.3 15 9 6 3 6.0 194 10 6 3 6.3
2 8
12 7 6 6 6.3 15 9 6 6 7.0 195 10 6 6 7.3
3 9
12 7 6 7 6.7 16 9 6 7 7.3 196 10 6 7 7.7
4 0
12 7 6 9 7.3 16 9 6 9 8.0 197 10 6 9 8.3
5 1
12 7 6 10 7.7 16 9 6 10 8.3 198 10 6 10 8.7
6 2
12 7 7 1 5.0 16 9 7 1 5.7 199 10 7 1 6.0
7 3
12 7 7 3 5.7 16 9 7 3 6.3 200 10 7 3 6.7
8 4
12 7 7 6 6.7 16 9 7 6 7.3 201 10 7 6 7.7
9 5
13 7 7 7 7.0 16 9 7 7 7.7 202 10 7 7 8.0
0 6
13 7 7 9 7.7 16 9 7 9 8.3 203 10 7 9 8.7
1 7
13 7 7 10 8.0 16 9 7 10 8.7 204 10 7 10 9.0
2 8
13 7 9 1 5.7 16 9 9 1 6.3 205 10 9 1 6.7
3 9
13 7 9 3 6.3 17 9 9 3 7.0 206 10 9 3 7.3
4 0
13 7 9 6 7.3 17 9 9 6 8.0 207 10 9 6 8.3
5 1
13 7 9 7 7.7 17 9 9 7 8.3 208 10 9 7 8.7
6 2
13 7 9 9 8.3 17 9 9 9 9.0 209 10 9 9 9.3
7 3
13 7 9 10 8.7 17 9 9 10 9.3 210 10 9 10 9.7
8 4
13 7 10 1 6.0 17 9 10 1 6.7 211 10 10 1 7.0
9 5
14 7 10 3 6.7 17 9 10 3 7.3 212 10 10 3 7.7
0 6
14 7 10 6 7.7 17 9 10 6 8.3 213 10 10 6 8.7
1 7
14 7 10 7 8.0 17 9 10 7 8.7 214 10 10 7 9.0
2 8
14 7 10 9 8.7 17 9 10 9 9.3 215 10 10 9 9.7
3 9
14 7 10 10 9.0 18 9 10 10 9.7 216 10 10 10 10.0
4 0

Su distribución de probabilidad seria:


Y su media:

μ x́ =
∑ x́ i = 1,296 =6 dias
n 216
La muestra con n=3 con remplazo tiene menos variabilidad que la muestra con n=2 con remplazo
por lo mencionado anteriormente en relación al teorema del límite central.

4.2 La presencia de carbonatos en la arcilla para cerámica resulta perjudicial. En una explotación
de arcilla que se toman cinco muestras brutas de P=2 kg , se muelen y dividen para obtener cinco
muestras analíticas de 1 g que se analizan por separado. El contenido medio de carbonato resulta
ser del ( 8 ± 6 % ). Puesto que este resultado es excesivamente disperso, se piensa repetir el estudio
aumentando la cantidad de arcilla tomada de cada muestra bruta. ¿Qué peso mínimo de arcilla
debe tomarse cada vez para que la dispersión del resultado sea menor que ± 3 %?

Solución.

De acuerdo a la distribución muestral de medias muestrales, la varianza muestral se define a partir


de la varianza poblacional de la siguiente manera:

2 σ2
σ x́ =
n

n σ 2x́ =σ 2
Para varias muestras esto sería:

σ 2=n1 σ 2x́ =n2 σ 2x́ =…=n n σ 2x́


1 2 n

Para poder sacar el mínimo de arcilla que debe tomarse para que la dispersión sea menor que
± 3 % utilizaremos dos muestras, la primera es la que ya se obtuvo con P=n1=2 kg y σ 2x́ =36. 1

2
Para la segunda muestra tenemos σ x́ =± 9, entonces:
2

( 2 ) ( 36 )=n 2 ( 9 )
n2 =8

Es decir que la segunda muestra deberá ser de por lo menos 8 kg si queremos una desviación
estándar de ± 3 %
4.3 Dos aleaciones A y B se utilizan en la fabricación de cierto producto de acero. Se necesita
diseñar un experimento para comparar las dos aleaciones en términos de la capacidad de carga
máxima en toneladas, es decir, el máximo que pueden soportar sin romperse. Se sabe que las dos
desviaciones estándar de la capacidad de carga son iguales a 5 toneladas cada una. Se realiza un
experimento en el que se prueban 30 muestras de cada aleación y los resultados son:

x́ A=49.5 , x́ B=45.5 , x́ A −x́ B=4

Los fabricantes de la aleación A están convencidos de que esta evidencia demuestra de forma
concluyente que μ A > μ A y que apoya solidamente su aleación. Los fabricantes de la aleación B
afirman que el experimento fácilmente podría haber dado x́ A− x́ B=4 incluso si las dos
poblaciones son iguales. En otras palabras, “¡los resultados no son concluyentes!”.

a) Argumente que los fabricantes de la aleación B están equivocados. Para ello, calcule la
P ( x́ A− x́ B ≥ 4|μ A =μ A )

Primero convertimos las probabilidades a la variable estándar Z , esto con la siguiente formula:

( x́ A −x́ B ) −( μ A −μB )
Z=
σ 21 σ 22
√ +
n1 n 2

Es decir que:

( 49.5−45.5 )−( μ A−μ B )


Z=
25 25
√ +
30 30
Como μ A =μ A tenemos que μ A −μB =0 entonces:

4
Z= =3.09
5
√ 3
Ahora calculamos P ( Z ≥3.09 ) , esto es:

P ( Z ≥3.09 ) =1−P ( Z ≤3.09 )=1−0.9990=0.001


Es decir que la probabilidad de que la diferencia entre las medias de las aleaciones A y B sea mayor
o igual a 4, cuando sus medias poblacionales son iguales, es de 0.1%, lo cual desestima la
afirmación de los fabricantes de la aleación B.

b) ¿Considera que estos datos apoyan fuertemente la aleación A?

Totalmente, ya que, al obtener una probabilidad tan baja, asegura que μ A > μ B cuando la
diferencia entre las medias muestrales es de 4 o más.
4.4 Para una distribución ji-cuadrada encuentre X 2a tal que:
2 2
a) P ( X > X a , v ) =0.98 cuando v=n−1=4

Estamos buscando un valor que nos dé un área a la izquierda de 0.98, es decir:

Para esto nos vamos a la tabla A.5 del Walpole y buscamos el valor de α que de un área de 0.98
con v=4 , esto es:

Es decir que X 2a ,v =0.429


2 2
b) P ( X > X a , v ) =0.025 cuando v=n−1=55

Estamos buscando un valor que nos dé un área a la izquierda de 0.025, es decir:

Como en la tabla A.5 del Walpole no viene una v=55 utilizaremos el software STATDISK:
El valor que estamos buscando es el de Chi Sq Value que es 77.3805 es decir que X 2a ,v =77.3805

4.5 Dada una muestra aleatoria de tamaño 24 de una distribución normal, encuentre k tal que:

a) P (−2.069<t< k )=0.966

Esta probabilidad la podemos escribir como:

P (−2.069<t< k )=P ( t <k )−P ( t <2.069 )=0.966


Buscamos el valor de P ( t<2.069 ) con v=n−1=23 en la tabla A.4 del Walpole y tenemos que es
0.025

Es decir que:

P ( t< k )−0.025=0.966
P ( t< k )=0.991
Para encontrar el valor que genere un área a la izquierda de 0.991 utilizamos STADISK:
Es decir que k =2.547

b) P ( k <t <2.807 )=0.095

Esta probabilidad la podemos escribir como:

P ( k <t <2.807 )=P ( t <2.807 )−P ( t <k ) =0.095


Utilizamos STADISK para obtener el área a la izquierda de 2.807

Es decir que P ( t<2.807 )=0.9949 , entonces:

0.9949−P ( t <k ) =0.095


P ( t< k )=0.8999
Utilizando STADISK buscamos el valor de k que produzca un área a la izquierda de 0.8999.
Es decir que k =1.3188

c) P (−k <t <k ) =0.90

Como el área total bajo la curva es igual a 1, quiere decir que a la izquierda de −k hay un área de
0.05 y a la derecha de k hay un área de 0.05. Entonces buscamos un valor de que de un área a la
derecha de 0.05 con 23 grados de libertad, esto lo hacemos con STADISK.

Es decir que k =1.7138


4.6 Para pacientes tratados debidamente, los medicamentos prescritos pro médicos deben tener
una potencia que se defina con precisión. En consecuencia, los valores de la distribución de
potencia para la entrega de medicamento no solo deben tener un valor medio como se especifica
en el envase de medicamento, sino también la variación en potencia debe ser pequeña. De otro
modo, los farmacéuticos distribuirían recetas que serian peligrosamente potentes o tendrían una
baja potencia y serian ineficaces. Un fabricante de medicinas dice que su medicina está marcada
con una potencia de 5 mg y una desviación de la potencia de 0.0063 mg . Una muestra aleatoria
de cuatro envases dio lecturas de potencia iguales 4.94, 5.09, 5.03 y 4.90 mg. Suponga que la
muestra proviene de una distribución normal.

a) Considera usted que la variación de la potencia es pequeña.

Si, ya que una variación de 0.0063 mg es apenas un 0.126% del valor de la media.

b) ¿Los datos presentan suficiente evidencia para indicar que la potencia media difiere de 5 mg?

La media de los datos seria:

4.94 +5.09+5.03+4.90
x́= =4.99
4
Y su desviación estándar:

2 ( 4.94−4.99 )2+ ( 5.09−4.99 )2+ (5.03−4.99 )2 + ( 4.90−4.99 )2 0.022


s= = =0.0073
3 3
Si convertimos estos valores a la variable t tenemos:
x́−μ 4.99−5 −0.01
t= = = =−0.1643
S 0.0 854 0.0 608
√n √2
Ahora bien, un buen nivel de confianza sería de 95%, es decir que analizaremos si este valor de t
cae entre los valores críticos de −t 0.025 y t 0.025. Con STADISK calculamos estos valores críticos, que
son aquellos valores que arrojen un área a la derecha e izquierda de 0.025 respectivamente.

Con esto nos damos cuenta que −t 0.025=−3.1824 y t 0.025=3.1824. Es decir que:

Como se observa el valor t calculado si cae dentro de esta región por lo que se puede decir con un
95% de certeza que la media si es igual a 5.

c) ¿Los datos presentan suficiente evidencia para indicar que la variación de potencia difiere de
0.063 mg?

Analizaremos a la varianza a partir de la ji-cuadrada, para esto convertimos a su estadístico:

( n−1 ) s 2 ( 3 ) ( 0.0 073 )2


X2= = =4.027
σ2 2
( 0.0063 )
Nuevamente utilizamos un valor de confianza de 95% y buscamos los valores críticos de −X 20.025 y
X 20.025, esto lo hacemos con STADISK.

2 2
Es decir que −X 0.025=0.2115 y X 0.025=9.34. hubicamos estor valores críticos y verificamos si
nuestro estadístico cae dentro o fuera.

Comprobamos que nuestro estadístico cae dentro de esta región, por lo cual se puede decir con
un 95% de certeza que la desviación es igual a 0.0063.

d) Discuta los datos.

Los datos sugieren que el fabricante de medicina esta en lo correcto, ya que, realizando las
pruebas para la media y la varianza de las muestras, concluimos con un 95% de certeza en ambos
casos que son iguales a las que sugiere el fabricante.
4.7 Para una distribución F encuentre F α, v 1 , v2 :

a) P ( F> F α , v , v )=0.05 cuando v1 =17 y v 2=37


1 2

Buscamos en STADISK un valor de F α, 17 ,37 que de un área a la derecha de 0,05.


Entonces F α , v 1 , v2 =1.9645

b) P ( F< F α , v , v )=0.73 cuando v1 =27 y v 2=52


1 2

Buscamos en STADISK un valor de F α , 27 ,52 que de un área a la izquierda de 0.73.

Es decir que F α , v 1 , v2 =1.2130

c) P F1− α , v , v < F< F α ,v


( 1 2 1 , v2 )=0.95 cuando v =15 y v =10
1 2
2 2

Buscamos dos valores de F tal que uno tenga un área a la derecha de 0.025 y el otro un área a la
izquierda de 0.025, esto con ayuda de STATDISK

Es decir que F 1−α , v 1


,v 2
=0.3267 y F α,v 1
,v 2
=3.5216
2 2
4.8 Pruebas de resistencia a la tracción sobre 10 cables conductores a la tracción sobre 10 cables
soldados para un dispositivo semiconductor dan los siguientes resultados en libra-fuerza
requeridas para romper la unión.

19.8 , 12.7 ,13.2 , 16.9 ,10.6 , 18.8 , 11.1 ,14.3 , 17.0 , 12.5
Otro conjunto de ocho cables conductores se probó después del encapsulado para determinar si la
resistencia a la tracción había aumentado debido al encapsulado del dispositivo, con los siguientes
resultados.

24.9 , 22.8 ,23.6 , 22.1 , 20.4 , 21.6 ,21.8 , 22.5


Haga comentarios sobre la evidencia disponible con respecto a la igualdad de las dos varianzas de
la población.

Solución

Comenzamos calculando la media y la varianza de cada una de las muestras:

∑ xi x −x́ 1 )2
2 ∑( i
x́ =
1 =14.69 , s = 1 =10.441
n n−1
2
∑ xi 2 ∑ ( x i− x́ 2 )
x́ =
2 =22.46 , s =
2 =1.846
n n−1
Utilizaremos da distribución F ya que es la mas adecuada para comparar varianzas. El estadístico F
se calcula con la siguiente formula:

s21
σ 21
F=
s22
σ 22

Pero si queremos hacer comentarios sobre la igualdad de las varianzas poblacionales σ 12=σ 22
entonces:
2
s 10.441
F= 12 = =5.656
s 2 1.846

Por conveniencia la varianza mas grande se divide entre la más pequeña. Si analizamos el
estadístico con una confiabilidad del 95%, tendremos dos valores críticos, uno en F 0.025,9,7 y otro

en

F 0.975,7,9 los cuales los encontramos utilizando


STATDISK

Es decir que F 0.025,9,7=4.197 y F 0.975,7,9=0.2382, ahora comprobamos si el estadístico cae dentro


de la zona critica.
Podemos observar que el estadístico cae fuera de la zona critica, por lo tanto con un 95% de
confianza podemos decir que las varianzas son diferentes.