Está en la página 1de 44

Capítulo 2 Distribuciones Muestrales

Capítulo 2
DISTRIBUCIONES MUESTRALES
2.1 VARIABLES ALEATORIAS MUESTRALES Y SUS
DISTRIBUCIONES DE PROBABILIDAD

A
l estudiar las variables aleatorias sean discretas ó continuas, desde los
cursos de probabilidad, se sabe que tienen su distribución de
probabilidades, valor esperado  X , varianza  X2 y desviación estándar
 X . En esta unidad estudiaremos variables aleatorias, que se obtienen de
muestras aleatorias a partir de una población o bien de dos poblaciones. Las
principales variables serán la suma muestral W  , la media muestral  X  , la
diferencia de medias muestrales X 1  
 X 2  , la proporción muestral P̂ , la

 
diferencia de proporciones muestrales Pˆ1  Pˆ2 , la T de Student, la  2 ji o
chi-cuadrada y la F. Estas dos últimas son usadas cuando se trabaja con la
S2 
varianza muestral  S 2  y la división de varianzas  1 2  , respectivamente.
 S2 
Las letras mayúsculas se utilizarán para referirnos a estas variables, ya que de
una muestra a otra, asumen diferentes valores y a cada valor específico de
ellas lo simbolizaremos con letras minúsculas, es decir w es el valor que toma
la variable W en una muestra aleatoria de tamaño n, x es valor que toma la
variable media muestral X en una muestra aleatoria de tamaño n, etc. Solo la
variable ji- cuadrada la denotaremos con el símbolo  2 .
Cuando realiza un muestreo de una población finita se presentan dos tipos,
con reemplazamiento, en donde cada elemento seleccionado se puede volver a
elegir y sin reemplazamiento, en el que un elemento que fue seleccionado, ya
no puede volver a ser elegido. Para construir una distribución muestral, se
tendrían que seleccionar todas las muestras de tamaño n de la población y
conocer el comportamiento de alguna variable de interés, esta labor se puede
realizar si la población es finita y no grande. Por ejemplo si una población es
de tamaño N=10 y se quieren todas las muestras de tamaño n=2 con
reemplazamiento, se tendrían un total de 102=100 muestras y si fuera sin
reemplazamiento se tendrían 45 muestras. Sin embargo en la práctica las
poblaciones no son pequeñas, ya que entonces se trabajaría con ellas en su
totalidad, lo más común es que las poblaciones sean grandes o incluso
infinitas, por lo que obtener todas las muestras resulta demasiado complejo o
imposible.

32
Capítulo 2 Distribuciones Muestrales

Desde la perspectiva matemática las poblaciones pueden ser infinitas y cuando


son finitas pero muy grandes, se llegan a considerar como próximas a las
infinitas y con ello justificar algunos resultados teóricos importantes. De hecho
cuando se habla de variable continua se esta asumiendo que la cantidad de
valores que puede tomar esta, es infinita.
Cuando el muestreo es con reemplazamiento se considera que es equivalente
a suponer que la población es infinita o muy grande, como se apreciará en los
ejemplos que ilustran la construcción de algunas distribuciones muestrales.
El capítulo servirá como enlace entre la estadística descriptiva y la inferencial,
permitiendo comprender la importancia práctica de esta última.
Los conceptos de parámetro y estadístico o estimador se manejan de aquí
en adelante, y recordemos que en principio los definimos como medidas que se
obtienen de una población y una muestra, respectivamente. Ahora
extenderemos sobretodo la definición de estadístico o estimador, al de una
variable aleatoria, ya que de muestra en muestra presenta diferentes valores
para dicho estadístico o en general como una función de las variables
aleatorias que constituyen una muestra aleatoria.
A la distribución de probabilidades para un estadístico o estimador le
llamaremos distribución muestral.

2.1.1 DISTRIBUCIÓN MUESTRAL PARA UNA SUMA DE


VARIABLES

La primera variable muestral que vamos a considerar es llamada suma de


variables y la denotamos por (W ) , se presenta en problemas donde nos
interesa estudiar el peso total de n personas u objetos, la suma total de horas
de trabajo en una empresa y en general de cantidades o variables como
W  X1  X 2  X 3   X n , donde cada X i representa una variable aleatoria.

Para ilustrar la construcción de esta distribución muestral, es decir del


estadístico W  suma de variables, W  X1  X 2  X 3   X n que nos ayudará
a conocer algunas características de las distribuciones muestrales, las cuales
podremos extender a otras variables, por simplicidad, supondremos que
tenemos una población finita de tamaño N  5 , cuyos elementos son
 1, 3, 5, 7, 9  de la que seleccionamos todas las muestras de tamaño n  2 con
reemplazamiento.

Primero obtenemos la media y varianza de la población de acuerdo a las


definiciones que dimos en el capítulo anterior.

1  3  5  7  9 25
   5 , es la media poblacional.
5 5
1  5   3  5   5  5   7  5  9  5
2 2 2 2 2
16  4  0  4  16 40
 
2
   8 , es la
5 5 5
varianza poblacional.

33
Capítulo 2 Distribuciones Muestrales

Ahora construimos todas las muestras de tamaño n  2 con reemplazamiento.


En la tabla siguiente aparecen en forma de parejas ordenadas las 52  25
muestras.

(1,1) (1,3) (1,5) (1,7) (1,9)


2 4 6 8 10
(3,1) (3,3) (3,5) (3,7) (3,9)
4 6 8 10 12
(5,1) (5,3) (5,5) (5,7) (5,9)
6 8 10 12 14
(7,1) (7,3) (7,5) (7,7) (7,9)
8 10 12 14 16
(9,1) (9,3) (9,5) (9,7) (9,9)
10 12 14 16 18

En la parte inferior de cada pareja al centro y en negrillas está el valor de la


variable suma W  , se puede observar que asume diferentes valores
dependiendo de la muestra correspondiente, es claro que W  se comporta
como una variable aleatoria discreta y entonces podemos anotar sus tres
características fundamentales (distribución de probabilidades, valor esperado y
varianza).
Su distribución de probabilidades se presenta como una correspondencia de
probabilidades o un histograma de frecuencias relativas como aparecen en la
figura 1.

W p(W )
2 1  0.04
25
4 2  0.08
25
6 3  0.12
25 p(W )
8 4  0.16
25
10 5  0.20
25
0.20
12 4  0.16 .
25 .
14 .
3  0.12 0.04
25 W
2 4 6 8 10 12 14 16 18
16 2  0.08
25
18 1  0.04
25 Figura 1

El valor esperado de W , es el promedio de todos los valores que toma la


variable suma y lo podemos denotar como E (W )  W , para el ejemplo
tendremos que:
2  4  4  6  6  6   14  14  14  16  16  18 250
E (W )  W    10  2  5
25 25

34
Capítulo 2 Distribuciones Muestrales

La varianza de W , la denotamos por V (W )   W 2 y es la varianza de todas las


sumas, es decir, para este ejemplo se tiene que:
 2  10    4  10    4  10    16  10   16  10   18  10 
2 2 2 2 2 2

V (W )   W 
2

25
400
V W    W2   16  2  8 
25
En el ejemplo, podemos observar que el valor esperado de W es igual a dos
veces la media poblacional  , esto es, E (W )  W  10  2  5  n
Por otro lado, la varianza de W es dos veces la varianza poblacional y se debe
a que las muestras fueron de tamaño n  2 , así V (W )   W2  16  2 8  n 2 .

Las dos observaciones anteriores se pueden justificar matemáticamente y no


son producto de la casualidad. Se demostrarán estos resultados a través de un
teorema, que podemos enunciar de la siguiente manera.

Teorema1: Si de una población normal con media  y varianza  2 , se


selecciona una muestra aleatoria de tamaño n X1 , X 2 , X 3 , , X n , entonces la
variable suma, definida como W  X1  X 2  X 3   X n , es normal con valor
esperado o media E W   W  n y varianza V W    W2  n 2 .
En forma resumida se puede decir que:
1) W  X1  X 2  X 3   X n , es una variable normal.
2) E W   W  n , es la media de W .
3) V W    W2  n 2 , es la varianza de W . De este inciso se tiene que la
desviación estándar de la variable suma W es  W  n , donde  es la
desviación estándar poblacional.

Demostración: Dado que X1 , X 2 , X 3 , , X n se consideran variables aleatorias


normales, ya que provienen de una población normal y E  X i    , V  X i    2
para toda i  1, 2,3, , n .
El inciso 1 se justifica por la propiedad reproductiva de la variable normal, la
cual asegura que, la suma de variables normales independientes es una
variable normal.
Los incisos 2 y 3 se desprenden de las propiedades del valor esperado y la
varianza para una combinación lineal de variables aleatorias independientes.
 E  a1 X1  a2 X 2   an X n   a1E  X1   a2 E  X 2    an E  X n  .
Así E W   E  X1  X 2  X 3   X n            n , ya que ai  1
Para el inciso 3, usamos la propiedad de la varianza que asegura lo siguiente:
V  a1 X1  a2 X 2   an X n   a12V  X1   a22V  X 2    an2V  X n 
Así V W   V  X1  X 2  X 3   Xn    2  2  2    2  n 2 .
Con lo cual, queda demostrado.

35
Capítulo 2 Distribuciones Muestrales

La importancia del teorema, estriba en que contamos con una variable aleatoria
llamada suma W , que es normal y podemos obtener probabilidades de ella
conociendo alguna información de la población, a través de la variable normal
estándar Z .
Basta que recordemos de los cursos de probabilidad, que toda variable normal
X con media  X y desviación estándar  X , se puede llevar o transformar a la
variable normal estándar Z , cuya media es igual a cero y desviación estándar
X  X
igual a uno    0 ,   1 , mediante la relación Z  , donde  X es el
X
valor esperado o media de X y  X la desviación estándar de X .
Si la variable es W (suma de variables), entonces tendremos que la variable

W  W W  n
normal estándar queda como: Z 
W n

Con la variable Z , podemos llevar a cabo la estandarización de cualquier


variable normal, lo que permitirá calcular probabilidades de esta última.

Proceso de estandarización de una variable normal


X  X
Z
X
X  normal   X ,  X    Z  normal    0,   1 

En el apéndice al final del libro, aparece la tabla 2 de valores para la variable


normal estándar Z más usuales desde 0.00 hasta 3.59, así como sus
probabilidades o áreas bajo la curva, en las columnas    z  ,   z  y D  z  .

La columna    z  nos da la probabilidad acumulada hasta  z o bien la


probabilidad de que la variable normal estándar Z sea menor o igual al valor
negativo  z , es decir    z   P  Z   z 
En la figura 2, se ilustra la curva normal estándar y la interpretación de la
probabilidad o área bajo la curva a la izquierda de  z , que proporciona
 z  .

36
Capítulo 2 Distribuciones Muestrales

Curva normal estándar

  z   P  Z  z 

z
Figura 2
La columna   z  nos da la probabilidad de que la variable normal estándar
sea menor o igual al valor positivo z , es decir   z   P  Z  z 
En la figura 3, se muestra el área bajo la curva normal a la izquierda de z ,
como una probabilidad acumulada, que proporciona   z 

Curva normal estándar

 z  PZ  z

z
Figura 3
La columna D  z  nos da la probabilidad de que la variable normal estándar Z ,
se encuentre entre los valores de  z y de z , D  z   P   z  Z  z  , es decir el
área comprendida bajo la curva normal estándar entre los valores de  z y z .
La figura 4 ilustra la probabilidad que representa D  z  .

Curva normal estándar

D  z   P  z  Z  z 

z z
Figura 4

37
Capítulo 2 Distribuciones Muestrales

Nota: es importante mencionar que en las variables continuas, las


probabilidades son la mismas si utilizamos los símbolos de orden > y < (mayor
que y menor que) en lugar de los símbolos  y  (mayor o igual que y menor o
igual que).
También en la tabla 2 del apéndice, aparece una tabla de porcentajes, que
nos permite obtener los valores de la variable normal estándar a partir de las
probabilidades o áreas bajo la curva y se podrán usar en el momento que sea
necesario.

Ejemplo 1: Un elevador tiene una capacidad máxima para una tonelada, los
pesos de las personas que lo usan cotidianamente se distribuyen normalmente
con un promedio de 74 kg y desviación estándar de 10 kg. ¿Cual es la
probabilidad de que al subirse 15 personas en un momento dado, se rebase la
capacidad del elevador?

Respuesta: Aquí tenemos un problema de suma de variables, es decir


podemos suponer que W  X1  X 2  X 3   X15 , representa el peso total de
las quince personas, tal que, es normal con   74 ,   10 para cada X i .
Como se pregunta por la posibilidad de que se rebase la capacidad del
elevador, entonces debemos calcular la probabilidad de que el peso total sea
mayor que 1000 kg.
 W  n 1000  n 
P W  1000   P   
 n n 
 1000  15  74    1000  1110 
 PZ 

  PZ 
   P  Z  2.84 
 15 10    38.7298 

Para obtener la probabilidad usamos de la tabla normal la columna   z  , ya


que, por la simetría de la curva normal se asegura que:
P  Z  2.84  P  Z  2.84    2.84  0.9977
En la figura 5 se ilustra el porque podemos usar la columna   z  , para hallar
dicha probabilidad

P  Z  2.84  P  Z  2.84    2.84  0.9977


2.84 Figura 5 2.84
Observemos que también podríamos apoyarnos de la propiedad del
complemento para probabilidades, es decir,
P  Z  2.84  1  P  Z  2.84  1    2.84   1  0.0023  0.9977 .
Por lo tanto, la probabilidad de que la capacidad del elevador sea rebasada por
quince personas es del 0.9977. Lo que significa que es muy grande la
probabilidad de rebasar la capacidad del elevador.

38
Capítulo 2 Distribuciones Muestrales

Ejemplo 2: Los tiempos de duración de dos tipos A y B de focos se distribuyen


normalmente, de modo que, los del tipo A tiene un promedio de duración de
700 horas, con una desviación de 25 horas y del tipo B un promedio de 650
horas y desviación de 20 horas. En una granja se usan 5 focos tipo A y 4 tipo
B, de forma que cuando uno se funde se enciende otro inmediatamente.
Calcular la probabilidad de que la duración de los 9 focos exceda a las 6200
horas.

Respuesta: En este problema tenemos que la variable es la suma de los


tiempos de duración para los 9 focos, luego entonces, definimos a W como:
W  X A  X A  X A  X A  X A  X B  X B  X B  X B , donde X A y X B representan
los tiempos de duración del tipo A y B respectivamente, con
 A  700 ; B  650
 A  25 ;  B  20

La media de W , queda así, W  5 A  4B  5  700   4  650   6100


La varianza de W , es,  W2  5 A2  4 B2  5  25  4  20 
2 2

La desviación estándar de W es,  W  5  25  4  20   68.74


2 2

La probabilidad de la duración total exceda a 6200 horas se obtiene de la


siguiente manera.
 6200  6100 
P W  6200   P  Z    P  Z  1.45    1.45  0.0735 , de la tabla
 68.74 
normal.
En la figura 6 se muestra que las probabilidades P  Z  1.45 y P  Z  1.45 
son iguales, de nueva cuenta por la simetría de la normal

P  Z  1.45  P  Z  1.45    1.45

1.45 Figura 6 1.45

La probabilidad de que los 9 focos excedan a las 6200 horas es de 0.0735.

39
Capítulo 2 Distribuciones Muestrales

2.1.2 DISTRIBUCIÓN MUESTRAL PARA UNA MEDIA

Ahora veremos la construcción de la distribución muestral para el promedio o


media, es decir, consideraremos el estadístico  X  media muestral y
trabajaremos con el mismo ejemplo utilizado en la distribución para la suma.
La población tiene cinco elementos  1, 3, 5, 7, 9  , seleccionamos todas las
muestras de tamaño n  2 con reemplazamiento.

La media y varianza poblacional son   5 y  2  8 respectivamente.


Ahora construimos todas las muestras de tamaño n  2 con reemplazamiento.
En la tabla siguiente aparecen en forma de parejas ordenadas, las 52  25
muestras.

(1,1) (1,3) (1,5) (1,7) (1,9)


1 2 3 4 5
(3,1) (3,3) (3,5) (3,7) (3,9)
2 3 4 5 6
(5,1) (5,3) (5,5) (5,7) (5,9)
3 4 5 6 7
(7,1) (7,3) (7,5) (7,7) (7,9)
4 5 6 7 8
(9,1) (9,3) (9,5) (9,7) (9,9)
5 6 7 8 9

En la parte inferior de cada pareja al centro en negrillas está el valor de la


media muestral  X  y de nuevo se observa que asume diferentes valores
dependiendo de la muestra correspondiente, por lo que  X  se comporta como
una variable aleatoria discreta y podemos anotar sus tres características
fundamentales (distribución de probabilidades, valor esperado y varianza).

Su distribución de probabilidades la presentamos como una correspondencia


de probabilidades o un histograma de frecuencias relativas como aparecen en
la figura 7.

40
Capítulo 2 Distribuciones Muestrales

X p( X )
1 1  0.04
25
2 2  0.08
25
3 3  0.12
25 p( X )
4 4  0.16
25
5 5  0.20
25 0.20
6 4  0.16 .
25 .
.
7 3  0.12 0.04
25 1 2 3 4 5 6 7 8 9 X
8 2  0.08
25
9 1  0.04
25 Figura 7

El valor esperado de X , es el promedio de todos los valores que toma la media


X y lo podemos denotar como E ( X )   X , para el ejemplo tendremos que:
1  2  2  3  3  3   7  7  7  8  8  9 125
E( X )  X   5
25 25
La varianza de X , la denotamos por V ( X )   X 2 y es la varianza de todos los
valores que toma X , es decir, para este caso se tiene que:
1  5   2  5   2  5   8  5   8  5    9  5 
2 2 2 2 2 2
100
V (X )   X 
2
4 
25 25
Algo que se puede sacar como una primera observación del ejemplo, es que el
valor esperado de X es igual la media poblacional, esto es E ( X )   X   .
Por otro lado, la varianza de X es la mitad de la varianza poblacional y se debe
8 2
a que las muestras fueron de tamaño n  2 , así V ( X )   X 2  4   .
2 2
Además de la distribución de probabilidades tiene forma simétrica, aproximada
a una forma acampanada, es decir, aunque la variable X es discreta, su
distribución de probabilidades se parece vagamente a una curva normal.
Las observaciones que se acaban de dar, se pueden justificar
matemáticamente y no solo por que aparecieron en este ejemplo, como más
adelante se demostrará, cuando se establezcan los resultados a través del
teorema 2.
Por el momento, veremos que ocurre cuando el muestreo se realiza sin
reemplazamiento, tomando el mismo ejemplo de la población de tamaño N  5
y las muestras de tamaño n  2 .

41
Capítulo 2 Distribuciones Muestrales

5!
En la tabla se dan las 5 C 2   10 muestras posibles que se pueden extraer
3!2!
de la población sin reemplazamiento.

(1,3) (1,5) (1,7)(1,9)


2 3 4 5
(3,5) (3,7)(3,9)
4 5 6
(5,7)(5,9)
6 7
(7,9)
8
Tabla de las 10 muestras sin reemplazamiento

El valor esperado de X es
2  3  4  4  5  5  6  6  7  8 50
E( X )  X    5 , el cual coincide con la
10 10
media poblacional.
La varianza de X es
 2  5   3  5   2  4  5   2  5  5   2  6  5    7  5   8  5 
2 2 2 2 2 2 2

V (X )   X 
2

10
V X  X2 
30
3
10
Donde se puede ver que ahora la varianza de X , no es igual a la varianza
poblacional  2 dividida por el tamaño de las muestras ( n  2 ). Sin embargo si
N n 2
se agrega el factor a , obtenemos la siguiente igualdad
N 1 n
 5  2  8   3 
V X  X2  3        4  .
 5  1  2   4 
Para el muestreo sin reemplazamiento podemos concluir que:
1) E  X    X  
N n2
2) V  X    X 2 
N 1 n
N n
Al factor se conoce como corrección por población finita y puede
N 1
ignorarse cuando el tamaño de las muestras es pequeño en comparación con
el tamaño de la población, ya que cuando la población es mucho más grande
2 2 N n
que la muestra, la diferencia entre y es despreciable.
n n N 1
Por ello conviene aclarar que el factor de corrección por población finita no se
utiliza cuando trabajamos con poblaciones o variables normales, por
considerarse infinitas.
De modo que cuando se trabaje una población finita y la muestra sea menor
que el 5% de la población, se podrá ignorar dicho factor de corrección.

42
Capítulo 2 Distribuciones Muestrales

Ahora ya estamos en condiciones de generalizar algunos de los resultados que


se obtuvieron en el ejemplo anterior, especialmente cuando el muestreo es con
reemplazamiento o la población es normal, con el siguiente teorema que afirma
lo siguiente.

DISTRIBUCIÓN MUESTRAL PARA UNA MEDIA

Teorema 2: Si se toma una muestra aleatoria de tamaño n de una población


normal con media  y varianza  2 , entonces la media muestral X tiene las
siguientes características.

1) La media de X es igual a la media poblacional  , es decir,


E  X   X  
2) La varianza de X es igual a la varianza poblacional  2 dividida por el
2
tamaño de la muestra n , es decir, V  X    X 2 
n
3) X es una variable normal.

Demostración: De la definición de la media muestral X , de algunas


propiedades del valor esperado y de la varianza para variables aleatorias se
desprenden las tres características.
Dado que las observaciones X1 , X 2 , X 3 , , X n provienen de una población con
media  y varianza  2 , se tiene que
E  X i    ; V  X i    2 , para toda i  1, 2,3, , n luego se tiene que

 n 
  Xi  X  X2   Xn  1
E  X   E  i 1   E  1    E  X 1   E  X 2    E  X n  
1)  n   n  n
 
 
E  X            n  
1 1
n n
Lo que demuestra que la media de X o el valor esperado de X , es igual a la
media poblacional  .

 n 
  Xi  X  X2   Xn  1
V  X   V  i 1   V  1   2 V  X 1   V  X 2    V  X n  
 n   n  n
2)  
 
2
V  X   2  2   2    2   2 n 2 
1 1
n n n

43
Capítulo 2 Distribuciones Muestrales

Lo que demuestra que la varianza de X es igual a la varianza poblacional


 2 dividida por el tamaño de la muestra n .

3) La normalidad de X se desprende la propiedad reproductiva de la normal,


que asegura que si se tienen variables normales, entonces la suma de estas es
también es normal.
1
Dado que X se define como el producto del factor con la suma de las X i y
n
cada X i se considera normal, por el hecho de que la población de donde se
toman es normal. Se puede concluir que la media muestral X es una variable
normal.

Si la variable es la media muestral X , entonces tendremos que la variable

X  X X  n X  
Z  
normal estándar queda como X  
n

Ahora veamos algunos ejemplos en donde se hace uso de la distribución


muestral para una media X y su estandarización.

Ejemplo 3: Los diámetros de los tornillos producidos por una fabrica con
determinadas especificaciones se distribuyen normalmente con una media de
50 milímetros y una desviación estándar de 5 milímetros.
Si se selecciona una muestra aleatoria de 16 de estos tornillos, ¿cuál será la
probabilidad de que la media muestral no exceda a los 53 milímetros?

Respuesta: Dado que la población de diámetros es normal, con   50 y   5


queremos la probabilidad de X sea menor o igual que 53, es decir, P  X  53
Para obtener esta probabilidad aplicamos los resultados del teorema 2 y la
estandarización de X , como de indica a continuación.
   
 X   53     53  50   3 
P  X  53  P     PZ    PZ    P  Z  2.40 
     5   1.25 
   
 n n   16 
Luego entonces, P  X  53  P  Z  2.40     2.40   0.9918 de la tabla 2 para
la variable normal estándar.

44
Capítulo 2 Distribuciones Muestrales

En la figura 8, se ilustra la
probabilidad de que la media
muestral X sea menor o
P  Z  2.40    2.40  0.9918
igual que 53 y es la misma
probabilidad de que la
variable Z sea menor o igual
a 2.40, como resultado de
haber realizado la
estandarización.
2.40
Figura 8
Por lo tanto, la probabilidad de que la media muestral X sea menor o igual a 53
milímetros es de 0.9918 o del (99.18)%

Ejemplo 4: Los pesos de los tornillos se distribuyen normalmente con una


media de 15.5 gramos y una varianza de 9 gramos cuadrados, si se toma una
muestra aleatoria de 16 tornillos, ¿cuál será la posibilidad de que la media de
esta muestra sea mayor o igual a 16 gramos?

Respuesta: aplicando el teorema 2, tenemos que   15.5 ;  2  9 y   3 .


 

P  X  16   P  Z 
16  15.5    0.5 4   P Z  0.67
3
  PZ    
Luego    3 
 
 16 
P  Z  0.67   1    0.67   1  0.7486  0.2514

Se observa que para obtener la probabilidad de la tabla 2 de la curva normal,


utilizamos la columna de   z  y la propiedad del complemento, ya que como
se quiere el área bajo la curva que aparece a la derecha del valor 0.67 y la
tabla proporciona el complemento, debemos restar al número uno la
probabilidad 0.7486, como se ilustra en la figura 9.

  0.67   0.7486

P  Z  0.67   1    0.67   0.2514

Figura 9 0.67
O bien por la simetría se tiene P  Z  0.67   P  Z  0.67     0.67   0.2514

Ejemplo 5: Se ha determinado que el tiempo de vida útil para un producto A,


es una variable normal con una desviación estándar de 4.5 años. Si se
selecciona una muestra de 10 productos. ¿Cuál será la probabilidad de que la
media muestral se aleje de la media poblacional en a lo más 5 años?

45
Capítulo 2 Distribuciones Muestrales

Respuesta: Aunque no conocemos la media poblacional  , nos están


pidiendo la probabilidad de que la media muestral X se encuentre alejada de
la media poblacional  , en a lo más 5 años, esto significa que debemos
obtener la probabilidad de que el valor absoluto de X   sea menor o igual a 5,
es decir

P X  5 
n  10
  4.5
 5 10 5 10 
 
P X    5  P  5  X    5   P  Z   P  3.51  Z  3.51
4.5 
 4.5
P  3.51  Z  3.51  D  3.51  0.9996

La probabilidad se obtiene de la tabla 2, utilizando la columna para D  z  , ya


que se desea el área bajo la curva entre los valores -3.51 y 3.51, como se
ilustra en la figura 10.

D  3.51  0.9996

-3.51 3.51
Figura 10
Ejemplo 6: En referencia al ejemplo anterior, si se desea que la media
muestral este alejada de la media poblacional en a lo más un año, con una
probabilidad del 95%, ¿de que tamaño tendría que ser la muestra para
alcanzar dicha probabilidad?

Respuesta: En este ejemplo, ya conocemos la probabilidad de que X    1 ,

 
luego podemos escribir que, P X    1  0.95 lo significa que:
 n n
 
P X    1  P  1  X    1  P  Z   0.95
4.5 
 4.5
Por otro lado, de la tabla 2 para porcentajes de la variable normal estándar, se
tiene que cuando z  1.96 , P  1.96  Z  1.96  0.95 (ver figura 11).
n
Así podemos igualar con 1.96 , para encontrar el tamaño de la muestra
4.5
como se índica.
n
n  1.96  4.5  n  1.96  4.5   77.79
2
 1.96 
4.5

46
Capítulo 2 Distribuciones Muestrales

Si tomamos n  78 podemos asegurar la precisión deseada. Por lo que la


muestra será de 78 productos.

Figura 11

D 1.96   P  1.96  Z  1.96   0.95

-1.96 1.96

Nota:
El tamaño de la muestra, se podría obtener de manera análoga igualando
 n
con 1.96 .
4.5

2.1.3 DISTRIBUCIÓN MUESTRAL PARA UNA DIFERENCIA DE


MEDIAS.
Consideremos ahora que se tienen dos poblaciones normales, la primera con
media 1 y varianza  12 , y la segunda con media  2 y varianza  22 . La variable
X 1 representa la media de una muestra aleatoria de tamaño n1 tomada de la
primera población y X 2 representa la media de una muestra aleatoria de
tamaño n2 seleccionada de la segunda población, de manera independiente.
Si queremos hacer una comparación de estas dos variables, podemos
establecerla mediante la diferencia de ellas, es decir, X1  X 2 o bien X 2  X1 .
Por ejemplo que beneficios propicia un medicamento A con respecto a otro
medicamento B que atacan una misma enfermedad, cuando se tiene
información suficiente sobre ellos, en cuanto su efectividad para curar una
determinada enfermedad.
O bien para comparar la calidad de dos tipos de concreto, en donde sabemos
de ante mano, lo que pasa con las dos poblaciones.
Cabe recordar que este capítulo, aun nos es parte propiamente de la
estadística inferencial, ya que de la o las poblaciones, calculamos
probabilidades de lo que le puede ocurrir a una o varias variables aleatorias
muestrales.

47
Capítulo 2 Distribuciones Muestrales

Como consecuencia de los teoremas 1 y 2, podemos asegurar que tanto X 1 y


X 2 son variables normales, tales que la media y varianza de X 1 son:
2
E  X1    X1  1 y V  X1     2
X1 .
n1
Para X 2 la media y varianza serán
 22
E  X 2    X 2  2 y V  X 2    
2
X2 .
n2

Luego para la variable diferencia de medias, afirmamos que X1  X 2 es normal


por la propiedad reproductiva de variables normales, además.

E  X 1  X 2    X1  X 2  1  2
 12  22
V  X1  X 2    2
X1  X 2
 
n1 n2
 12  22
 X X  
1 2
n1 n2

Por las propiedades del valor esperado y varianza de una combinación lineal
de variables.
E  a1Y1  a2Y2   a1E Y1   a2 E Y2  ; V  a1Y1  a2Y2   a12V Y1   a22V Y2  , tomando
a1  1 y a2  1

La estandarización de la variable diferencia de medias X1  X 2 estará dada por

Z
X 1  X 2    1  2 
 12  22

n1 n2

48
Capítulo 2 Distribuciones Muestrales

Ejemplo 7: En una compañía (I), el tiempo promedio para producir un artículo


es de 12 minutos con una desviación estándar de 2 minutos, mientras que otra
compañía (II) tarda en promedio 10 minutos para producir este tipo de artículo,
con una desviación estándar de 1.5 minutos. Suponiendo que las poblaciones
en los tiempos de producción son normales, se seleccionan aleatoriamente e
independiente los tiempos de producción para 20 y 30 artículos para la
compañía I y II respectivamente. Determine la probabilidad de que el tiempo
promedio muestral de producción de los 20 artículos, exceda al tiempo
promedio muestral de los 30 artículos en un minuto, pero no rebase a los tres
minutos.

Respuesta: Tenemos la siguiente información.


Compañia I Compañia II
1  12 2  10
1  2  2  1.5
n1  20 n2  30
Se quiere la probabilidad P 1  X1  X 2  3 , al estandarizar tememos que:
 
 
 1   1  2   X 1  X 2    1  2  3   1  2  
P 1  X 1  X 2  3  P   
  2
 2
 2
 2
 12  22 
 n
1
 2 1
 2

 1 n2 n1 n2 n1 n2 
   
  
1   1  2  3   1  2   1  12  10  3  12  10  
 P  Z   P   Z  
2 
 
 1   2 1  2 
2 2 2
4 2.25 4 2.25
    
 n n2 n1 n2   20 30 20 30 
 1

P  1.91  Z  1.91  D 1.91  0.9439


De la tabla 2 para la normal estándar y la columna D  z  obtenemos la
probabilidad.
La figura 12 ilustra la probabilidad encontrada de 0.9439.

P  1.91  Z  1.91  D 1.91  0.9439

1.91 1.91
Figura 12

49
Capítulo 2 Distribuciones Muestrales

Ejemplo 8: Se sabe que los pesos de los hombres (H) y mujeres (M) con
edades de veinte a treinta años, se distribuyen normalmente.
El peso medio y la varianza para los hombres son H  80 y  H2  16 .
En el caso de la mujeres se tiene que M  72 y  M2  9 .
Si se seleccionan muestras aleatorias e independientes de nH  nM  9 de
hombres y mujeres respectivamente, obtenga la probabilidad de que el peso
promedio muestral de hombres sea mayor a el peso promedio muestral de
mujeres, en por lo menos 10 kilogramos.

Respuesta: Queremos la probabilidad P  X H  X M  10 


Luego al estandarizar tenemos que.
   
   
10    H   M   10  8
P  X H  X M  10   P  Z   P Z    p  Z  1.20 
  H2  M2   16 9


   
 nH nM   9 9 
P  Z  1.20     1.20   0.1151

Figura 13

1.20 – 1.20
La figura 13 nos indica la simetría de la curva normal y por ello las dos áreas
bajo la curva representan el mismo valor de la probabilidad.

2.1.4 DISTRIBUCIÓN MUESTRAL PARA UNA PROPORCIÓN.

El cuarto estadístico que estudiaremos esta directamente ligado a la variable


binomial, es decir al número de éxitos en una muestra aleatoria. La
construcción de esta distribución muestral es similar a las ilustradas en el caso
de la suma de variables W y la media X .
X
Definimos la proporción muestral como Pˆ  , donde X es el número de
n
éxitos y n el tamaño de la muestra o el número de veces que se repite el
experimento de Bernoulli.

50
Capítulo 2 Distribuciones Muestrales

En este caso la variable P̂ se distribuye como una binomial y en consecuencia


hay que recordar que su distribución de probabilidades esta dada por la
expresión:

b  X  x, n, p   Cxn p x q n x
Donde x  0,1, 2,3, , n .
p , es la probabilidad de éxito o la proporción poblacional.
q  1  p , es la probabilidad de fracaso.
n!
Cxn  , es número de combinaciones posibles que se forman tomando
 n  x ! x !
x de n objetos.

El valor esperado y varianza de P̂ son:


pq p 1  p 
 
E Pˆ  Pˆ  p y  
V Pˆ   P2ˆ 
n

n
La justificación de estos resultados se desprende del valor esperado y varianza
para la variable binomial X  E  X   np ; V  X   npq  .

  X 1 1 X 1
  1
E Pˆ  E    E  X   np  p ; V Pˆ  V    2 V  X   2 npq 
n n n n n n
pq
n
Con cual queda demostrado.

Ejemplo 9: La probabilidad de una cierta raza de animales sobreviva de una


enfermedad es de 0.70. Si se toma una muestra de 5 de estos animales, ¿cuál
el la probabilidad de que sobrevivan a lo más 2 de ellos?

Respuesta: En este problema no usamos la curva normal, ya que se trata de


una variable discreta binomial.
Queremos la siguiente probabilidad P  X  2  P  x  0  P  x  1  P  x  2 .
Cada probabilidad se puede obtener usando la distribución o función de
probabilidades binomial.

P  x  0   C05  0.7   0.3  0.00243


0 5

P  x  1  C15  0.7   0.3  0.02835


1 4

P  x  2   C25  0.7   0.3  0.1323


2 3

Por lo que la probabilidad de que sobrevivan a lo más 2 animales es.


P  X  2  0.00243  0.02835  0.1323  0.16308
Esta probabilidad se puede interpretar también como la probabilidad de que la
proporción muestral sea menor o igual que 0.40.
 X 2
 5 5


2

Ya que, P  X  2   P     P  Pˆ    P Pˆ  0.40  0.16308
5

51
Capítulo 2 Distribuciones Muestrales

En esta distribución muestral podemos darnos cuenta de que, si no


garantizamos la normalidad de la población, no podemos asegurar que la
variable en estudio se comporte en forma normal y por tanto no podemos
recurrir a la curva normal estándar. Dicho de otra manera nos enfrentamos al
problema que las variables muestrales no son normales debido a que la
población es de naturaleza diferente o incluso desconocida.
Afortunadamente existe uno de los teoremas considerados como más
importantes en la estadística, conocido como del límite central o central del
límite.

2.1.5 DISTRIBUCIÓN MUESTRAL PARA UNA DIFERENCIA DE


PROPORCIONES

Cuando tenemos dos variables o poblaciones binomiales y tomamos muestras


aleatorias e independientes de tamaños n1 y n2 respectivamente. Si se desea
hacer una comparación, debemos considerar las proporciones de éxitos, no el
número de éxitos, a menos que ambas muestras sean del mismo tamaño. Por
ejemplo en las elecciones para presidente, se toma una muestra de 150
electores en un estado y se encuentra que 60 están a favor de candidato A,
otra muestra tomada de un segundo estado de 200 electores arroja que 80
están a favor del candidato A. Claramente estás cifras no pueden se evaluadas
y peor aún comparadas, a menos que se lleven a proporciones. Esto quiere
decir, que requerimos de un modelo o distribución de probabilidades especifico
para la diferencia de proporciones muestrales.
A continuación presentamos las principales características de esta variable.
Sean dos poblaciones I y II, con probabilidades de éxito p1 y p2
respectivamente, se obtienen dos muestras aleatorias independientes, la
primera muestra de tamaño n1 tomada de la población I y la segunda de
tamaño n2 tomada de la población II, entonces la diferencia de proporciones
X X
muestrales la definimos como Pˆ1  Pˆ2  1  2 , donde X 1 es el número de
n1 n2
éxitos en la primera muestra y X 2 es el número de éxitos de la segunda
muestra.
Por el momento, diremos que el valor esperado de Pˆ1  Pˆ2 es
 2 
E Pˆ  Pˆ  p  p , dado que
1 1 2  
1 1  
E Pˆ  p y E Pˆ  p por lo visto en la
2 2

distribución muestral para una proporción.

La varianza de Pˆ1  Pˆ2 es


p 1  p1  p2 1  p2  p1q1 p2 q2

V Pˆ1  Pˆ2  1 
n1

n2

n1

n2
, donde q1  1  p1 , q2  1  p2 y

recordando que las varianzas de P̂1 y P̂2 son:

52
Capítulo 2 Distribuciones Muestrales

p 1  p1  p1q1 p 1  p2  p2 q2
 
V Pˆ1  1
n1

n1
 
; V Pˆ2  2
n2

n2
, respectivamente.

p1 1  p1  p2 1  p2 
La desviación estándar de Pˆ1  Pˆ2 es  Pˆ  Pˆ   .
1 2
n1 n2

Para poder trabajar con esta diferencia resulta todavía más indispensable el
teorema del límite central que enunciamos en la siguiente sección.
Acabamos de analizar cinco variables muestrales que fueron la suma de
variables W , la media muestral X , la diferencia de medias muestrales
X1  X 2 , la proporción muestral P̂ y la diferencia de de proporciones Pˆ1  Pˆ2 .
En la tres primeras se suponía que la o las poblaciones tenían que ser
normales para garantizar que las variables en estudio fueran normales y en las
dos últimas (proporciones) no podemos hablar de normalidad, entonces surge
una pregunta a este respecto, cuándo la población no es normal o no
conocemos su naturaleza, ¿qué podemos decir de la variable muestral?
La respuesta a esta pregunta la encontramos en el siguiente teorema.

2.2 TEOREMA DEL LÍMITE CENTRAL (T L C) Y SUS


APLICACIONES
El nombre le fue dado por G. Polya en 1920 y su valor tanto teórico como
práctico es que no requiere virtualmente de condiciones para las poblaciones o
las distribuciones de probabilidades de las variables aleatorias, sino que más
bien al tamaño de la muestra o muestras aleatorias sacadas de la población.
Se dice que De Moivre lo introdujo por vez primera en el siglo XVIII y ha sido
expresado de muchas formas dicho teorema. Por cuestiones de mero orden lo
enunciaremos para la variable suma W , aunque se podrá generalizar a
prácticamente a cualquier variable bajo las condiciones que se establecen.

Teorema del Límite Central: Dada una población con media  y varianza  2 .
Si W  X1  X 2  X 3   X n es la suma de variables aleatorias independientes
W  n
con misma distribución, entonces la variable es normal estándar
n
cuando el tamaño de la muestra n se hace infinito.

Lo que dice en otras palabras el teorema, es que, sin importar como sea la
población, la variable suma W será aproximadamente normal cuando el
tamaño de la muestra n sea suficientemente grande. Además no se reduce a
la suma, sino que podemos extender está afirmación a la media X , a la
diferencia de medias X1  X 2 , a la proporción P̂ , a la diferencia de
proporciones Pˆ  Pˆ , etcétera.
1 2

53
Capítulo 2 Distribuciones Muestrales

La utilidad práctica del teorema es que podemos llevar la variable suma W a la


variable normal estándar Z, como ya lo habíamos indicado en la distribución
muestral para la suma W , es decir,

 
W n , n Normal  Z  0,1 Normal estándar
W  n
Z
n
En cuanto, a cuán grande debe ser el tamaño de la muestra n para poder
aplicar el teorema, se tiene una respuesta determinada. Esto depende de la
precisión de la aproximación requerida y la población. Si la población es normal
la variable será normal sin importar el valor n . Si no se sabe nada acerca de la
población, podemos usar como convención que cuando n sea mayor o igual a
treinta  n  30  la variable muestral es prácticamente normal. Diciendo que si n
aumenta, las aproximaciones serán cada vez mejores.
Ahora veremos algunas aplicaciones del teorema en las distribuciones
muestrales, principalmente en la de una proporción y una diferencia de
proporciones.
Cuando se pasa de una variable aleatoria discreta a una continua como la
normal, por lo regular se agrega un factor de corrección por continuidad
 1 
  para obtener una mejor aproximación en el calculo de las probabilidades,
 2n 
sin embargo, cuando se aplique el teorema del límite central ignoraremos dicho
factor de corrección, a menos que se indique lo contrario.

APLICACIONES DEL TEOREMA DEL LÍMITE CENTRAL (T L C)


Ejemplo 10: Un barco carguero tiene capacidad para 10 000 toneladas. Se
sabe que el peso promedio de los contenedores es aproximadamente de 49
toneladas, con una desviación estándar de 7 toneladas. Se van a transportar
200 de estos contenedores, ¿cuál es la probabilidad de que no sea rebasada la
capacidad del barco?

Respuesta: Observemos que en este problema no sabemos como es la


población y estamos hablando de la variable suma de pesos para los 200
contenedores, como la muestra es suficientemente grande  n  200  , por el
teorema de limite central podemos decir que W  X1  X 2   X 200 es normal,
con
W  n  200  49   9800
 W  n  200  7   98.99

54
Capítulo 2 Distribuciones Muestrales

Ya que,   48 y   7 es el peso promedio y desviación estándar


poblacionales respectivamente.
Luego, la probabilidad que se quiere calcular es P W  10000  , al estandarizar
la variable W , nos queda lo siguiente:
 10000  9800 
P W  10000   P  Z    P  Z  2.02     2.02   0.9783
 98.99 
De la tabla 2 para la curva normal estándar.
Por lo tanto la probabilidad de que la capacidad del barco no sea rebasada es
de 0.9783 o (97.83)%

Ejemplo 11: Los tiempos “muertos” en una empresa en promedio son de 1.6
horas con una desviación de 0.5 horas. Si se selecciona una muestra de 100
empleados de dicha empresa, ¿cuál es la probabilidad de que la media
muestral sea inferior a 1.65 horas?

Respuesta: Aquí tenemos como variable a la media muestral X y queremos


la probabilidad de que la media X sea menor que 1.65.
De nuevo por el teorema del límite central, dado que la muestra es grande,
X es normal y entonces la podemos estandarizar, para obtener la probabilidad
requerida.
 
 1.65  1.6 
P  X  1.65   P  Z    P  Z  1   1  0.8413
 0.5 
 
 100 
  100
  0.5
n  100

Por lo tanto la probabilidad de que la media muestral sea inferior a 1.65 horas
es de 0.8413 o (84.13)%

Ejemplo 12: El tiempo de duración promedio de los refrigeradores en un


modelo particular es de   6 años, con una varianza  2  9 . Al tomar una
muestra aleatoria de 36 de estos refrigeradores, ¿cuál será la probabilidad de
que la media muestral se encuentre entre 5.5 y 7.1 años inclusive?

Respuesta: Como la muestra es suficientemente grande, podemos usar el


teorema del límite central para garantizar la normalidad de la media muestral.
 6
  9 3
n  36

55
Capítulo 2 Distribuciones Muestrales

 
 5.5  6 7.1  6 
P  5.5  X  7.1  P  Z   P  1  Z  2.2     2.2     1
 3 3 
 
 36 36 
 0.9861  0.1587  0.8274

Ejemplo 13: Se tiene una población uniforme discreta, tal que,


1
 si x  2, 4, 6
f  x  3
 0 en otro caso

Obtenga la probabilidad de que una muestra aleatoria de tamaño 54, dé una


media muestral mayor a 4.1 pero menor que 4.4 (ignorar el factor de corrección
por continuidad)

Respuesta: La variable X uniforme tiene como valor esperado y varianza:


EX       1   1   1  12
xi f  xi  2    4    6     4
3  3 3 3

  x f  x    
1 1 1
V X  2  22    42    62     4  2.67
2 2 2
i i
3  3  3
La desviación estándar es   2.67  1.634
Luego la probabilidad de la media muestral X sea mayor a 4.1 y menor que 4.4
por el T. L. C. queda como:

   
 4.1   X   4.4   4.1  4 4.4  4 
P  4.1  X  4.4   P      P Z 
      1.634 1.634 
   
 n n n  54 54 
 P  0.45  Z  1.80    1.80     0.45   0.9641  0.6736  0.2905
Por lo tanto la probabilidad requerida es 0.2905 aproximadamente.

Ejemplo 14: Supóngase que se ha establecido, que para cierto tipo de cliente,
la duración media de una visita domiciliaria realizada por una enfermera es de
38 minutos, con una desviación estándar de 10 minutos, y que, para un
segundo tipo de cliente, la visita domiciliaria media dura 20 minutos, con una
desviación estándar 8 minutos. Si una enfermera visita aleatoriamente 35
clientes del primer tipo y 40 del segundo tipo de manera independiente, ¿cuál
es la probabilidad que la duración media de la visita difiera entre los dos grupos
en 20 más minutos?

56
Capítulo 2 Distribuciones Muestrales

Respuesta: En este ejemplo se trata de una diferencia de medias y no se


hace mención de la forma de las poblaciones, es decir suponemos que las
poblaciones no son normales, sin embargo como las muestras son grandes
(mayores de 30) la diferencia de las medias muestrales es aproximadamente
normal con media y varianza siguientes.

 X  X  1  2  38  20  18
1 2

10  8
2 2
 12  22
 2
X1  X 2
   4.457 
n1 n2 35 40
Al estandarizar, tenemos la probabilidad de que la diferencia de medias sea
mayor o igual a 20 minutos.
 20  18 
P  X1  X 2  20   P  Z    P  Z  0.95  1    0.95  1  0.8289  0.1711
 4.457 

En los siguientes ejemplos se presentan las distribuciones muestrales para una


proporción y una diferencia de proporciones, en donde nos apoyaremos del
teorema del límite central para poder trabajar con la variable normal. Por
cuestiones meramente practicas, muestras grandes se consideran cuando son
mayores o iguales a 30, como se dijo anteriormente, o bien, se puede usar el
criterio de que si tanto np como np(1-p) son mayores que 5, la aproximación a
la normal es bastante aceptable sin necesidad de recurrir al factor de
corrección por continuidad.

Ejemplo 15: En base a muchos años de experiencia se sabe que el


60%(p=0.60) de la población en edad adulta, tiene problemas de hipertensión
arterial. Se selecciona una muestra aleatoria de 100 adultos. Determine la
probabilidad que al menos 70 de ellos tengan hipertensión arterial.

X
Respuesta: Recordemos que para una proporción muestral Pˆ  su media
n
(valor esperado) y varianza son:
p 1  p 
 
E Pˆ  Pˆ  p y V Pˆ   P2ˆ 
n
 
p 1  p 
La desviación estándar es  Pˆ 
n
Donde, p es la proporción poblacional o la probabilidad de éxito y n el tamaño
de la muestra.

X
El teorema del límite central (T L C), permite asegurar que la proporción Pˆ 
n
es aproximadamente normal dado que la muestra es grande  n  100  30 
O bien np  60  5 y np 1  p   24  5 , ya que p  0.60 .

57
Capítulo 2 Distribuciones Muestrales

Para estandarizar contamos con la expresión

Pˆ   Pˆ Pˆ  p
Z 
 Pˆ p 1  p 
n
Luego entonces la probabilidad de que al menos 70 adultos tengan problemas
de hipertensión es.
   
   
Pˆ  p 0.70  p  0.70  0.60 
ˆ 
P P  0.70  P 
 p 1  p 

p 1  p  

P Z
 0.60  0.40  
 P  Z  2.04 
   
 n n   100 
De la tabla normal, se tiene que P  Z  2.04    2.04  0.0207
Por lo que, la probabilidad de que al menos 70 adultos de 100, padezcan
hipertensión arterial es de 0.0207.

Ejemplo 16: Si uno de cada cinco tornillos producidos en una fabrica presentan
un defecto ligero, ¿cuál será la probabilidad de en una muestra de 1000
tornillos menos de 185 tengan algún defecto ligero?

1
Respuesta: La proporción de tornillos con defectos ligeros es p   0.20 y
5
por el (T L C), la proporción muestral P̂ es aproximadamente normal, debido a
que la muestra es grande.
Se quiere la probabilidad P  
 X 185 
 n 1000 
 ˆ 
  P P  0.185 y al estandarizar
   
   
Pˆ  p 0.185  p  0.185  0.20 
 ˆ
P P  0.185  P  
 p 1  p 

p 1  p  

P Z
 0.20  0.80  
   
 n n   1000 
P  Z  1.19     1.19   0.1170

Ejemplo 17: En una prueba de opción múltiple con 130 preguntas, cada una de
ellas tiene 4 opciones (de las que exactamente una es la correcta), es decir, la
probabilidad de éxito es de uno de cuatro. Un aspirante realiza la prueba y
1
contesta las todas las preguntas al azar ( p   0.25 ), ¿cuál la posibilidad de
4
que pase la prueba?

58
Capítulo 2 Distribuciones Muestrales

Respuesta: Para que pase la prueba debe obtener el 60% de aciertos, lo cual
significa que debe obtener 0.60 (130) = 78 respuestas correctas de las 130
que consta la prueba.
Así, La posibilidad de que pase es P  X  78  P 
 X

78 
 ˆ 
  P P  0.60
 130 130 
Al estandarizar tenemos que
 
 
0.60  0.25 
 
P Pˆ  0.60  P  Z 
 0.25  0.75  
 P  Z  9.22   0
 
 130 
En la tabla 2, no aparece el valor de 9.22, debido a que prácticamente el 100%
del área bajo la curva normal se localiza entre el – 3.59 y el 3.59.
Como el valor 9.22 está fuera del intervalo y se quiere que la variable normal
estándar sea mayor o igual, se concluye que prácticamente es igual a cero la
probabilidad requerida.

Para LA DIFERENCIA DE PROPORCIONES MUESTRALES Pˆ1  Pˆ2 , si las


muestras son suficientemente grandes  n1 p1 , n1q1 , n2 p2 y n2q2  5 e
independientes, podemos estandarizar la variable mediante la expresión

Z
 Pˆ  Pˆ    p  p 
1 2 1 2

 Pˆ  Pˆ    p  p 
1 2 1 2

p1 1  p1  p2 1  p2  p1q1 p2 q2
 
n1 n2 n1 n2

Donde p1 y p2 son las proporciones poblacionales.

Ejemplo 17: En dos ciudades A y B se sabe que la proporción de personas que


están en contra de una nueva ley es de 0.40 y 0.31 respectivamente. Se
seleccionan muestras aleatorias e independientes de 60 y 70 personas de las
ciudades A y B en forma respectiva.
Obtenga la probabilidad de que la diferencia de proporciones de estas
muestras sea superior al 12%, pero menor del 18%.

Respuesta: De nueva cuenta por el (T L C), dado que las muestras son
grandes, podemos trabajar con la variable normal estándar.
Se nos dice que p1  0.40 y p2  0.31  p1  p2  0.09  , además n1  60 y n2  70
Luego, la probabilidad pedida queda como:

59
Capítulo 2 Distribuciones Muestrales


P 0.12  Pˆ1  Pˆ2  0.18 
 

 P

 0.12   p1  p2 

 
Pˆ1  Pˆ2   p1  p2 

0.18   p1  p2 



 p1 1  p1   p2 1  p2  p1 1  p1  p2 1  p2 

p1 1  p1  p2 1  p2 
 
 n1 n2 n1 n2 n1 n2 
 
 
 
0.12  0.09 0.18  0.09
 P Z 
 0.4  0.6  0.31 0.69  0.4  0.6  0.31 0.69  
   
 60 70 60 70 
 P  0.36  Z  1.07    1.07     0.36   0.8577  0.6406  0.2171

Ejemplo 18: Con referencia al ejemplo anterior, supóngase que se quiere


obtener la probabilidad de que la diferencia de proporciones muestrales sea de
a lo más 12% y de al menos 18%.

Respuesta: Se quiere la probabilidad del complemento, es decir


 1 2   1 2  
P Pˆ  Pˆ  0.12  P Pˆ  Pˆ  0.18  1  P 0.12  Pˆ  Pˆ  0.18  1  0.2171
1 2 
 0.7829

2.3 DISTRIBUCIÓN T DE STUDENT

Las variables estudiadas en las secciones anteriores, prácticamente tienen


una característica común y es que se reducen a variables normales, sea por
que el comportamiento de las poblaciones son normales o por el teorema del
límite central. En la segunda distribución muestral que se analizo, es decir la de
la media muestral X considerábamos que la población era normal con media
 y varianza  2 (la desviación estándar es  ) y por consecuencia la variable
normal estándar quedaba como:

Z
X 

X   n
 
n
Una pregunta que se plantea ahora es ¿qué pasa cuando la varianza
poblacional  2 es desconocida?
Si la muestra es grande, podemos utilizar la varianza muestral
n

 X X
2
i
S2  i 1
para aproximar a la varianza poblacional  2 .
n 1

60
Capítulo 2 Distribuciones Muestrales

 X X
2
i
O bien la desviación muestral S  i 1
como aproximación de la
n 1
desviación poblacional  y aún podríamos trabajar con la variable normal Z .
Pero si la muestra es pequeña  n  30  , a pesar de que la población fuese
normal, no podemos asegurar que la variable sea normal, es decir la variable
X   X   n

S S
n
tiene una distribución de probabilidades diferente a la distribución normal, a la
que se le llamó distribución T de Student y fue dada a conocer por W.S.
Gosset en 1908, cuando trabajaba en una empresa cervecera, que les prohibía
a sus empleados hacer investigaciones dentro de las jornadas laborales, por
ello sus publicaciones las presentaba bajo el seudónimo de Student. Una
variable T de student se escribe como

X   X   n
T 
S S
n
Como se aprecia es muy similar a la variable normal, la justificación teórica
queda fuera de los alcances del libro, a cambio de ello mencionaremos sus
principales propiedades que nos permitan poder trabajar principalmente las
tablas probabilísticas de ella, su distribución de probabilidades de esta variable
comúnmente reconoce como distribución t .

PROPIEDADES DE LA DISTRIBUCIÓN T
1) Tiene una media o valor esperado de 0.
2) Es simétrica con respecto a la media.
3) Es asintótica con respecto al eje horizontal.
4) La varianza es mayor que 1 y se aproxima a 1 cuando el tamaño de la
muestra se hace grande.
5) La variable T toma valores desde  hasta  .
6) En realidad, la distribución T es una familia de distribuciones de
probabilidades, ya que se tiene una distribución diferente para cada
valor de n  1 , el divisor usado al calcular la varianza muestral S 2 .
7) Comparada con la distribución normal, la distribución T es menos alta
en el centro y sus extremos son más altos.

La figura 14 ilustra la comparación de la distribución T con la normal


estándar.

61
Capítulo 2 Distribuciones Muestrales

Distribución normal

Distribución T

0
Figura 14
La distribución T , como la normal estándar tiene su tabla de valores para
T y las áreas bajo la curva a la derecha de ellos, correspondientes a los
grados de libertad.
Como ya se dijo, para cada n  1 , está cantidad recibe el nombre de grados de
libertad y tendremos diferentes distribuciones de probabilidad, por
consecuencia diferentes valores de la variable T por cada valor que tome
n  1 , a pesar de que la probabilidad sea la misma.
La noción de grados de libertad, en forma intuitiva puede entenderse, para el
caso de la varianza muestral S 2 de la siguiente manera. Supongamos que se
toma una muestra de tamaño 1 de una población, si tratamos de calcular la
varianza de la muestra sería igual a cero, ya que solo se tiene una observación
y no proporciona información sobre la varianza. En otras palabras para conocer
algo de la varianza por lo menos la muestra debe ser mayor o igual a 2 .
Ahora, si n  2 , uno u otro de los valores no nos dice algo acerca de la
varianza; solo un segundo valor proporciona alguna información. Así, la
varianza se basa en un solo dato de los dos de la muestra. En este caso,
decimos que solo hay 2 1  1 grados de libertad en el cálculo de la varianza
muestral, por lo que en una muestra de tamaño n se pierde un grado de
libertad, luego entonces el número de grados de libertad es n  1 .
Otra forma de explicar el concepto de grados de libertad, es, el de suponer que
se tiene una muestra de n personas y n sillas para sentarse en un salón.
Estas personas se forman para entrar una por una, al salón y tomar una silla, la
primera tiene libertad de elegir cualquiera de las sillas, la segunda también
tiene libertad de escoger, así sucesivamente, hasta llegar a la penúltima, la
cual todavía tiene libertad de seleccionar una de las dos sillas que quedan sin
ocuparse. La última ya no tiene libertad de elección, es decir solo le queda
sentarse el la silla sobrante, ello significa que de las n personas solo n  1
tienen libertad de escoger alguna silla.

En la tabla 3 del apéndice, aparecen las probabilidades o porcentajes más


usuales de la función inversa acumulada y sus correspondientes valores de la
variable, es decir las áreas bajo la curva T a la derecha de cada t , donde

62
Capítulo 2 Distribuciones Muestrales

t es un valor que toma la variable y  es la probabilidad de que la variable


T sea mayor o igual que dicho valor t , así P T  t   
En la figura 15 se muestra la probabilidad que representa  .

Distribución T
  P T  t 

t
Figura 15
Aunque en la tabla aparecen solo valores positivos de t , se pueden
considerar valores negativos ( t ), de acuerdo a la simetría de la
distribución T , así como probabilidades diversas apoyándonos de esta
propiedad.
Los ejemplos que siguen buscan, ilustrar el uso y manejo de la tabla 3 para
distribución T .

Ejemplo 18: Realizar lo que se pide en cada inciso.


1) Con 15 grados de libertad obtener P T  1.812  .
2) Con 15 grados de libertad obtener P T  1.4415 .
3) Con 22 grados de libertad obtener P T  1.0614 .
4) Con 17 grados de libertad obtener P T  2.567  .
5) Con 8 grados de libertad calcule P  1.928  T  1.928
6) Con 25 grados de libertad encuentre P  1.893  T  1.3472 

Respuesta:

1) P T  1.812  0.045 , ya que al ir a la tabla localizamos en la primera


columna los 15 grados de libertad y sobre el renglón hacia la derecha
encontramos el valor de 1.812 corresponde un valor de   0.045 , este
valor lo proporciona directamente la tabla, por queremos que T  1.812 .
2) Para esta probabilidad, recordemos que la distribución t es simétrica,
por lo que, P T  1.4415  P T  1.4415  0.085 con 15 grados de
libertad.

63
Capítulo 2 Distribuciones Muestrales

P T  1.4415  P T  1.4415  0.085

Distribución t

1.4415 Figura 16 1.4415


En la figura 16 se observa por que las probabilidades para valores
recíprocos son iguales.

3) Como la variable T es continua, entonces P T  1.0614  P T  1.0614


con 22 grados de libertad, luego P T  1.0614  0.15 .

4) Por señalado en el inciso 2), la simetría permite decir con 17 grados de


libertad que P T  2.567   P T  2.567   0.010 .

5) Para esta probabilidad P  1.928  T  1.928 con 8 grados de libertad,


buscamos el valor de   0.045 para 1.928 y como queremos el área
bajo la curva desde 1.928 hasta 1.928 tenemos que:
P  1.928  T  1.928  1 2  1 2  0.045  0.91

P  1.928  T  1.928  0.91

  0.045   0.045

1.928 1.928
Figura 17
En la figura 17 se muestra la probabilidad de que T este entre los valores
dados

6) Para esta probabilidad usamos dos valores de  , debido a que no son


recíprocos, es decir con 25 grados de libertad para 1.3472 tenemos
0.095 y para 1.893 se tiene 0.035 .
Por lo tanto P  1.893  T  1.3472  1  0.095  0.035  0.87 , como se
aprecia en la figura 18

64
Capítulo 2 Distribuciones Muestrales

Figura 18

P  1.893  T  1.3472  0.87

  0.035   0.095

1.893 1.3472

Ejemplo 19: Encuentre los valores de a y b según el caso.

1) P T  a   0.090 con 11 grados de libertad.


2) P T  a   0.005 con 4 g. l.
3) P T  b   0.025 con 10 g. l.
4) P  a  T  a   0.90 con 23 g. l.
5) P  a  T  a   0.95 con 12 g. l.
6) P  a  T  a   0.99 con 7 g. l.

Respuesta: De la tabla para la distribución t de Student.

1) Como   0.090 , entonces con 11 g. l. el valor es a  1.4318 .

2) Dado que   0.005 , con 4 g. l. el valor es a  4.604 .

3)   0.025 , con 10 g. l. como P T  b    , b es negativo, b  2.228

4) Aquí 1  2  0.90 , luego   0.05 con 23 g. l., por lo que a  1.714 .

5) 1  2  0.95 , entonces   0.025 con 12 g. l. así a  2.179 .

6) 1  2  0.99 , entonces   0.005 con 7 g. l. luego a  3.499 .

65
Capítulo 2 Distribuciones Muestrales

2.4 DISTRIBUCIÓN JI O CHI- CUADRADA

Otra variable que se presenta sobre todo cuando tenemos muestras pequeñas
tomadas de una población normal, es la chi-cuadrada o ji-cuadrada y el
símbolo que se usa para denotarla es  2 . Del mismo modo que la variable T
de Student, no daremos su justificación teórica, ya que nos interesa más el
aspecto utilitario de su distribución de probabilidades, por lo que
mencionaremos algunas de sus principales características, así como una
variable muestral en especial que se comporta de acuerdo a la chi-cuadrada.

Si S 2 es la varianza de una muestra aleatoria de tamaño n tomada de una


población normal con varianza  2 , entonces el estadístico

 
2  n  1 S 2
2

tiene una distribución chi-cuadrada con   n  1 grados de libertad.

Las principales propiedades de la distribución chi-cuadrada son:

 La variable  2 toma solamente valores mayores o iguales a cero.


 La distribución chi-cuadrada no es simétrica, en la figura 19 aparece
una curva que describe a esta distribución.

Distribución chi-cuadrada

2

Figura 19
 Es asintótica con respecto al eje horizontal

 Se tiene una distribución de probabilidades chi-cuadrada diferente, para


cada valor de n  1

 La probabilidad de que una muestra aleatoria produzca un valor de  2


mayor que algún valor especificado, es igual al área bajo la curva a la
derecha de este valor. Se acostumbra que 2 represente el valor de  2
adelante del cual se halla un área igual a  . En la figura 20 se ilustra el
área sombreada que representa a dicha probabilidad P   2  2  .

66
Capítulo 2 Distribuciones Muestrales

Figura 20

1
  P   2  2 

2

La tabla 4 en el apéndice, se proporcionan valores de  2 para diversos valores


de  y  grados de libertad. Los encabezados de las columnas son las áreas
 , la columna de la izquierda los grados de libertad  y el resto de la tabla los
valores de  2 .Por lo tanto, el valor de  2 con 14 grados de libertad que deja
un área de 0.025 a la derecha, es 2  26.1189 .

Aunque la curva no es simétrica, la tabla también nos da los valores de  2


para los complementos de cada  , es decir para 1   , por ejemplo con 14
grados de libertad y un área a la derecha de 0.975 el valor de  2 es
2  5.5287 . Esto facilita el uso y manejo de la tabla chi-cuadrada.
La figura 21 ilustra lo anterior.

Figura 21

P   2  26.1189   0.025 P   2  5.6287   0.975

2 2
26.1189 5.6287

Ejemplo 20: Mediante la tabla 4 para distribución chi-cuadrada obtenga el valor


requerido de acuerdo a los grados de libertad  y la probabilidad o área  .

a) Obtener el valor de  2 , con   8 g.l. y   0.100


b) Obtener el valor de  2 , con   23 g.l. y   0.150
c) Hallar el valor de  2 , con   17 g.l. y   0.990

67
Capítulo 2 Distribuciones Muestrales

Respuesta: De la tabla 4 de la distribución chi- cuadrada tenemos que.

a) 2  13.3616 con 8 g. l.


b) 2  29.9792 con 23 g. l.
c) 2  6.4077 con 17 g. l.

2.4 DISTRIBUCIÓN F

Otra distribución muestral importante en la estadística es la distribución F. El


estadístico F se define como una razón de dos variables aleatorias
independientes con distribución chi-cuadrado, dividida cada una por sus grados
de libertad y puede expresar como
U 1
F ,
V 2
donde U y V son variables aleatorias independientes que tienen distribución
chi-cuadrada, con  1 y  2 grados de libertad, respectivamente.
El número de grados de libertad asociado a la variable con distribución chi-
cuadrada que aparece en el numerador de F se escribe siempre en primer
lugar, seguido del número de grados de libertad asignado a la variable con
distribución chi-cuadrada que se encuentra en el denominador. Esto quiere
decir que, la curva de la distribución F no solo depende de los grados de
libertad  1 y  2 , sino del orden en que se enuncian.
La figura 22 ilustra a f como el valor de F , para el cual la probabilidad de
que la variable F sea mayor a f es igual a  y  es el área bajo la curva a la
derecha de f .

Figura 22

  P  F  f 
1

F
f

En la tabla 5 del apéndice se proporcionan valores de f para las


probabilidades   0.005 ,   0.01 ,   0.02 ,   0.025 ,   0.05 y   0.10 para
grados de libertad del numerador y del denominador desde 1 a 30.
Así por ejemplo el valor que toma la variable F con 12 grados de libertad para
el numerador y 7 para el denominador que produce un área a la derecha de
  0.01 es f  6.469 , es decir

68
Capítulo 2 Distribuciones Muestrales

P  F  6.469   0.01 , con  1  12 y  2  7 con grados de libertad para el


numerador y denominador respectivamente.
La notación que usaremos para escribir el valor de la variable F con un área 
a la derecha de él con  1 y  2 grados de libertad para el numerador y
denominador respectivamente será f  1 , 2  .
Por lo tanto, escribiremos el valor anterior como sigue f 0.01 12,7   6.469 .
Otros valores de la tabla 5 son:
f 0.005  6, 21  4.393 ; f 0.025  9,14   3.209
f 0.01 18,15   3.423 ; f 0.05 12, 27   2.132
f 0.02  24, 26   2.306 ; f 0.10 10,15   2.059

Para hallar valores de f1 , es decir de:


f0.995 , f0.99 , f0.98 , f0.975 , f 0.95 y f 0.90 , usamos la siguiente propiedad que asegura

1
f1  1 , 2  
f  2 , 1 
En consecuencia, el valor de la variable F que produce un área de 0.99 a la
derecha con 7 y 12 grados de libertad para el numerador y denominador
respectivamente, queda determinado como:
1 1
f 0.99  7,12     0.155
f 0.01 12, 7  6.469
De manera análoga, para los valores que siguen
1 1
f 0.995  21, 6     0.228
f 0.005  6, 21 4.393
1 1
f 0.99 15,18     0.292
f 0.01 18,15  3.423
1 1
f 0.98  26, 24     0.434
f 0.02  24, 26  2.306
1 1
f 0.975 14,9     0.312
f 0.025  9,14  3.209
1 1
f 0.95  27,12     0.469
f 0.05 12, 27  2.132
1 1
f 0.90 15,10     0.486
f 0.10 10,15  2.059

Ahora si suponemos que se seleccionan muestras aleatorias de tamaño n1 y n2


de poblaciones normales con varianzas  12 y  22 , respectivamente.
Tenemos que
 n  1 S 2 y  2   n2  1 S22
12  1 2 1
12 2
2

69
Capítulo 2 Distribuciones Muestrales

Son variables aleatorias independientes que tienen distribuciones chi- cuadrada


con  1  n1  1 y  2  n2  1 grados de libertad. De modo que si U  12 y V   22 ,
podemos enunciar la siguiente distribución muestral.

Si S12 y S 22 son las varianzas de muestras aleatorias independientes de


tamaños n1 y n2 , tomadas de poblaciones normales con varianzas  12 y  22 ,
respectivamente, entonces

S12
 12  22 S12
F 
S 22  12 S22
 22

Tiene distribución F con  1  n1  1 y  2  n2  1 grados de libertad para el


numerador y el denominador respectivamente.

Esta variable se usará en los intervalos de confianza y pruebas de hipótesis


para una razón de varianzas en los siguientes capítulos.

RESUMEN:

Las distribuciones muestrales que se estudiaron en el capítulo 2, las


podemos resumir escribiendo cada variable y su estandarización
respectiva, sea por el teorema del límite central o por que las poblaciones
son normales para el caso de las cinco primeras variables.

Suma de variables W

W  W W  n
Z 
W n

Media muestral X

X  X X  n X  
Z  
X  
n

70
Capítulo 2 Distribuciones Muestrales

Diferencia de medias muestrales X1  X 2

Z
X 1  X 2    1  2 
 12  22

n1 n2

Proporción muestral P̂

Pˆ   Pˆ Pˆ  p
Z 
 Pˆ p 1  p 
n

Diferencia de proporciones Pˆ1  Pˆ2

Z
 Pˆ  Pˆ    p  p 
1 2 1 2

 Pˆ  Pˆ    p  p 
1 2 1 2

p1 1  p1  p2 1  p2  p1q1 p2 q2
 
n1 n2 n1 n2

Variable T de Student

X   X   n
T 
S S
n
Variable Ji o chi- cuadrada

 
 n  1 S 2
2
2

Variable F

S12
 12  22 S12
F 
S 22  12 S22
 22

71
Capítulo 2 Distribuciones Muestrales

Ejercicios del Capítulo II


1) Los pesos de los sacos con azúcar se distribuyen normalmente con una
media 50 kg y una desviación de 2 kg. Si colocan 10 de estos sacos en
una bascula, ¿cuál es la probabilidad de que el peso total no exceda los
515 kg?, ¿de que exceda los 490 kg?

2) Un camión transporta cajas de dos clases de manzanas Golden y


Delicius, los pesos promedio son de 30 kg y 25 kg, con desviaciones
estándar de 3 kg y 1 kg respectivamente. Si se van a transportar 100
cajas de manzanas Golden y 75 cajas de manzanas Delicius, obtener la
probabilidad de que el peso total rebase las 5 toneladas.

3) La duración media de cierta marca de lámpara ahorradora de energía es


de 6000 horas, con una desviación estándar de 100 horas. Si se
probarán 40 lámparas de esta marca, ¿cuál será la probabilidad de que
la duración combinada de estas lámparas se encuentre dentro las
239000 y 241000 horas inclusive?

4) En una prueba de aprendizaje la media es de 50 puntos con una


desviación estándar de 10 puntos. Se supone que las calificaciones de
este tipo de prueba se distribuyen normalmente. Obtenga la
probabilidad de que de una muestra aleatoria de 25 calificaciones la
media muestral sea mayor a 55 puntos.

5) Los obreros de una gran empresa tienen una edad promedio de 35 años
con una desviación típica de 6 años. Si se selecciona una muestra
aleatoria de 35 obreros, ¿cual es la probabilidad de la edad promedio de
la muestra sea
a) de más de 37.5 años
b) de menos de 33 años
c) de entre 34.25 y 34.75 años
d) de entre 36 y 37.75 años?

6) En un país el ingreso familiar mensual tiene una media de $10 000 y una
desviación estándar de $ 3 000. Se selecciona una muestra aleatoria de
100 familias, obtenga la probabilidad de que el promedio X sea
a)menor o igual que $11 200
b) mayor o igual que $10 450
c) mayor que $10 150 pero menor que $13 000.

72
Capítulo 2 Distribuciones Muestrales

 1 cuando x  3, 6,9
7) Se tiene la distribución de probabilidades f ( x)   3 se
0 en otro caso
obtiene una muestra de 36 observaciones, calcular la probabilidad de
que la media X sea mayor a 7.

8) El tiempo de vida útil de cierta marca de lavadoras es una variable


exponencial con un promedio de 5.5 años.
Si una tienda departamental compra un lote de 80 de estas lavadoras,
¿Cuál será la probabilidad de el promedio muestral sea al menos 5.58
años?

9) Para una variable aleatoria geométrica se sabe que p  0.6 . Si se toma


una muestra de tamaño n  75 . Obtenga la probabilidad P( X  1.71)

10) El tiempo (horas) para resolver un examen de matemáticas tiene una


función de densidad de probabilidades dada por:

 3 x  103 si 1  x  2
f ( x)   10
0 en otro caso

Si se aplica el examen a 60 alumnos, ¿cuál es la probabilidad de que el


tiempo promedio de esta muestra
a) Sea menor a 1.6 horas?
b) Sea superior a 1.55 horas?
c) Se encuentre entre 1.54 y 1.62 horas inclusive?

11) Las alturas de los pinos en los bosques de los alpes se distribuyen
normalmente con una desviación estándar de 1.5 metros, si se toma una
muestra aleatoria de 12 de estos pinos, ¿cuál es la probabilidad de que
la media muestral X se desvíe de la media poblacional  en a lo más
0.5 metros?

12) En referencia al ejercicio 10) si se quiere que la probabilidad de que la


media muestral de desvíe de la media poblacional en a lo más 0.2
metros, sea igual a 0.95 ¿de que tamaño deberá ser la muestra para
alcanzar tal precisión?

13) Un fabricante de llantas para automóvil asegura que la duración media


es de 40 000 km y una desviación 5000 km. Si se toma una muestra
aleatoria de 36 llantas. ¿Cuál será la probabilidad de que la media de la
muestra sea inferior a 39 220 km?

73
Capítulo 2 Distribuciones Muestrales

14) Un investigador ha determinado que los niveles de vitamina A en el


hígado de las mujeres y hombres se distribuyen normalmente con
varianzas  M2  19600 y  H2  8100 . Se seleccionan muestras aleatorias
de 15 mujeres y de 10 hombres, ¿cual es la probabilidad de que
X M  X H sea mayor o igual a 50, si no existe diferencia entre las medias
poblacionales?

15) Se sabe que la raza pastor alemán vive en promedio 12 años con una
desviación estándar de 2 años y la raza terrier tiene una vida media de
10 años con una desviación de 3 años. Se toman muestras aleatorias
independientes de tamaño 100 de estas razas. Obtener la probabilidad
de que la diferencia de vidas medias muestrales sea menor o igual que
un año.

16) Una compañía quiere comparar el promedio de días de incapacidad por


año de dos clases de empleados: los que tienen menos de cinco años
de servicio, y los que diez o más. Para ello toma muestras 100
empleados de cada clase. Se sabe que las desviaciones estándares de
las dos poblaciones son 1  8.2 días y  2  5.7 días, respectivamente.
Obtenga la probabilidad de que la diferencia ( X1  X 2 ) entre las medias
muestrales difiera de la diferencia de medias poblacionales para días de
incapacidad por más de un día.

17) Una cierta medicina tiene un 80% de efectividad para curar una
enfermedad común. Si se les suministra el medicamento a 100
pacientes con tal enfermedad ¿Cuál es la probabilidad de que más de
80 se recuperen? ¿de que entre 70 y 90 se recuperen?

18) Se considera que el 65% de las mujeres se someten a una dieta para
bajar de peso. Si se toma una muestra de 60 mujeres, hallar la
probabilidad de que la proporción muestral sea menor que 0.68.

19) Por estudios realizados durante muchos años, se asegura que el


porcentaje de mujeres que al menos en alguna ocasión han realizado un
acto de corrupción es del 56%, mientras que para los hombres es del
82%. Si se seleccionan muestras aleatorias independientes de 112
mujeres y 140 hombres. Obtenga la probabilidad de que la diferencia de
proporciones muestrales de hombres y mujeres se desvíe de la
diferencia de proporciones poblacionales en más del 26%

20) El 55% de los enfermos con cáncer de mama se recuperan. ¿Cuál es la


probabilidad de que 75 personas con la enfermedad menos del 50% se
recuperen?

74
Capítulo 2 Distribuciones Muestrales

21) En estudios realizados, se observado que los desempleados duran por


lo menos un año sin trabajo en un 20%. Supóngase que se toma una
muestra de 320 desempleados ¿cual será la probabilidad de que la
proporción muestral de desempleados difiera de la proporción real en
5% o más?

22) En cierta población de adolescentes se sabe que el 10 % de hombres


son obesos. Si la misma proporción de mujeres son obesas, ¿cual es la
probabilidad de que una muestra aleatoria de 250 hombres y de 200
mujeres den una diferencia de proporciones mayor o igual a 0.06?

23) La proporción de ciudadanos que están a favor de una nueva ley en un


estado A es de 65%, mientras que en otro estado B es el 55%, si se
toma una muestra aleatoria de 90 ciudadanos de cada estado. Hallar la
probabilidad de que la diferencia de proporciones muestrales entre los
ciudadanos del estado A y el estado B que están a favor de la nueva ley
sea mayor o igual a 0.12.

24) Usando la tabla 3 de la distribución T de Student, obtenga


a) t0.025 con 15 grados de libertad

b) t0.01 con 9 grados de libertad

c) t0.995 con 23 grados de libertad


d) P T  1.315 con 26 grados de libertad

25) Mediante la tabla de la distribución chi-cuadrada, obtenga


a)  0.01
2
con 17 g. l.

b)  0.01
2
con 28 g. l.

c)  0.995
2
con 7 g. l.
d) Si P   2  2   0.99 con 4 g. l. calcular 2

26) Con la distribución F obtenga


a) f 0.05  6,12 
b) f 0.01 18,9 
c) f 0.99 11,19 
d) f 0.975  6,14 

75

También podría gustarte