Está en la página 1de 31

CAPÍTULO IV

DISTRIBUCIONES DE PROBABILIDAD.

Variable aleatoria: El concepto de variable aleatoria no es muy sencillo; sin embargo


daremos algunas definiciones de las más sencillas con el fin de que el concepto quede claro.

Definción 1: La función cuyo valor es un número real determinado por cada elemento en el
espacio muestral, se llama variable aleatoria.

Definición 2: Una variable aleatoria X es una función de valor real de los elementos de un
espacio muestral S. Aquí se nota que el dominio es S y su rango R.

Definición 3: Sea un experimento E y S el espacio muestral asociado con el experimento.


Una función x que se asigna a cada uno de los elementos s  S un número real X(S) se
llama variable aleatoria. Las variables aleatorias pueden ser de dos tipos a saber:

Definción: Se llama discreta a una variable aleatoria X si su rango es un conjunto discreto


de números reales. Se llama continua a una variable aleatoria X si su rango RX es un
intervalo o unión de intervalos sobre la línea de los reales y si tiene probabilidad cero de
igualar a cualquier valor aislado en RX.

Ejemplo 1.- Se tira una vez un par de dados. Sea X la suma de los dos números que
aparecen. El espacio muestral es:

S = ( X1, X 2 ) : X1 = 1,26; X 2 = 1,26 y se ha definido

X = X1 + X 2 para ( X1 , X 2 ) S
El rango de X es RX = 2,3,12 de manera que X es una variable aleatoria discreta.

Ejemplo 2.- Supóngase que una persona sale de su casa a su trabajo entre las 8:00 y las
8:30, sea t el tiempo desde las 8:00 hasta que sale; de acuerdo con lo anterior se tiene
S = t / 0  t  30 con este espacio muestral se puede escribir la variable aleatoria
Z en notación funcional como: Z (t ) = 30 − t para todo t  S entonces:

RZ = t / 0  t  30 de manera que Z puede ser una variable aleatoria continua.


Funciones de probabilidad.

Definición: Sea X una variable aleatoria discreta. Por tanto rx, el recorrido de X consta a lo
más de un número de valores x1 , x2 ,  infinito numerable. Con cada resultado posible
xi asociamos un número P(xi ) o f (xi ) = P( X = xi ) llamado la probabilidad de xi . Los
números P(xi ) donde i = 1,2, deben satisfacer las condiciones siguientes:

a) P( xi )  0 para toda i

b)  P( x ) = 1
i =1
i

La función P definida anteriormente se llama función de probabilidad (o función de


probabilidad puntual) de la variable aleatoria X. La colección de parejas
(xi , P(xi )) i = 1,2 , se llama algunas veces “distribución de probabilidades” de X.

Para el ejemplo en que se lanzan dos dados, la distribución de probabilidad podría


escribirse como:

xi 2 3 4 5 6 7 8 9 10 11 12

P ( xi )
1 2 3 4 5 6 5 4 3 2 1
36 36 36 36 36 36 36 36 36 36 36

Ejemplo: Escribir la distribución de probabilidades de la variable aleatoria X que indica que


el número de águilas que ocurren cuando se lanzan dos monedas.

S = ( AA) , ( AS ) , (SA) , (SS )

xi 0 1 2

P ( xi )
1 1 1
4 2 4

Función de la distribución de una variable aleatoria.

Si X es una variable aleatoria, entonces, para cualquier número real x existe la probabilidad
P( X  x ) del evento:

X x (X toma cualquier valor menor o igual de x).


Claro que P( X  x ) depende de la elección de x; esta es una función de x que se llama
función de distribución de X (también llamada función de distribución acumulativa) y se
representa por F (x) .

Así F ( x) = P( X  x )

Es importante distinguir entre P(x) y F (x) mientras que P(x) denota la probabilidad del
evento X = x ; F(x ) denota la probabilidad del evento X  x .

Función de distribución correspondiente a una distribución discreta.

En general P ( X  x ) =  P(x ) i o F ( x) =  P( x )i
X1  x Xi x

Finalmente examinaremos las gráficas de las funciones correspondientes al ejemplo del


experimento en que se lanzan dos dados y X= suma de los números de sus caras. Véanse las
figuras 4.1 y 4.2.

p(x)

2 3 4 5 6 7 8 9 10 11 12 x

Figura 4.1. Función de probabilidad.


X 2 3 4 5 6 7 8 9 10 11 12

1 3 6 10 15 21 26 30 33 35 36
F(x)
36 36 36 36 36 36 36 36 36 36 36

F(x)

0 1 2 3 4 5 6 7 8 9 10 11 12 x13

Figura 4.2. Función de distribución.

Distribuciones Continuas.

Se dice que una variable aleatoria X y la distribución correspondiente son de tipo continuo
o, más brevemente, continuas, si la función de distribución correspondiente:
F ( X ) = P( X  x)
se puede presentar según una integral de la forma:

x
F ( x) =  f (v)dv
−
(4.1)

donde el integrando es continuo, excepto quizá por un número finito de valores de v .

Al integrando f (v) se le llama “densidad de probabilidades” o más brevemente, la


“densidad” de la distribución que está bajo consideración. Derivando (4.1) vemos que:

F ' (x ) = f (x )

para cualquier x tal que f (x) es continua. De esta manera, la densidad es la derivada de la
función de distribución.

Por otra parte hay que recordar la propiedad


 f (v)dv = 1
−

Además P(a  X  b ) = F (b ) − F (a ) =  f (v )dv


a

Esto significa que la probabilidad del evento a  X  b es igual al área que hay bajo la
curva de la densidad f (x) entre x = a y x = b , como se ve en la figura 4.3.

P(a < x < b)

f(x)

a b

Figura 4.3. Área bajo la curva de la densidad f (x) .

De esto se deduce que la probabilidad correspondiente a un pequeño intervalo de longitud


X , con punto medio x = c es aproximadamente igual a:
f (c ) X
Ya que esta es el área de un rectángulo de ancho X y altura f (c ) . Se observa que si
hacemos X → 0 , puesto que F (x) es continua P ( X = c) = 0 , c arbitrario. De hecho esto no
significa que el evento X = c no pueda suceder, puesto que entonces ninguno de los
eventos sucedería. Además, como F (x) es continua, se observa que:

P (a  X  b) = P (a  X  b) = P (a  X  b)

Media y Varianza de una distribución.

Valor medio: El valor medio o media de una distribución se representa por  . En el caso
de una distribución discreta se define como:

 =  x j f (x j ) (4.2)
j

y en el caso de una distribución continua por:



 =  xf (x )dx (4.3)
−

En estas fórmulas f (x) es la función de la probabilidad ó la densidad respectivamente, de


la variable x que se considera.

Ejemplo: En el caso del lanzamiento de un dado supongamos que X es la variable aleatoria


que indica el número que cae hacia arriba. La función de probabilidades f (x) es:

f (x ) =
1
si x = 1, 2, , 6
6

y f (x) = 0 para cualquier otra x.

1 1 1 1 1 1


 =  x f (x ) = 1  + 2  + 3  + 4  + 5  + 6  = 3.5
6 6 6 6 6 6

Ejemplo: Considérese una distribución con densidad:

f (x )
1
cuando 0  X  b y 0 para todas las demás x.
b−a

Esta distribución se llama uniforme o rectangular en el intervalo a  X b ; su media será:


2b
1  x 1  b2 a 2  a + b
b b
 =  x f (x ) dx = 
x
dx =   =  − =
a a
b−a b−a 2 b − a  2 2  2
a

Es importante hacer notar que la media  es conocida por el nombre de esperanza


matemática o esperanza y se representa por E ( X ) .

Varianza de una distribución.

La varianza de una distribución se representa por  2 . En el caso discreto se define según


la fórmula:
 2 =  (x j −  ) f (x j )
2
(4.4)
j

y en el caso continuo mediante la fórmula:



 =  (x −  ) f (x )dx
2 2
(4.5)
−

La raíz cuadrada positiva de la varianza se llama desviación estándar y se representa por  .

Distribuciones discretas

Distribución binominal

En algunos casos, una población consta de dos clases de elementos, por ejemplo, seres
animados o inanimados, objetos pares o impares anversos o reversos de monedas, o
simplemente poseedores o no poseedores de cierta característica (ejemplo un defecto).

Cuando se lleva a cabo un ensayo para determinar si un elemento de la población posee o


carece de una característica, estaremos frente a dos resultados posibles, a uno de ellos se le
llama “éxito” y al otro “fracaso”. Lo anterior no significa que un éxito sea el mejor
resultado; simplemente sucede un éxito cuando aparece el resultado que buscamos.

Los experimentos de este tipo se conocen como experimentos binomiales si se cumplen las
siguientes características:

1. Hay solamente dos resultados posibles en cada caso; éxito (e) y fracaso (f).

2. La probabilidad de un éxito en un ensayo es constante P(e) = P , P( f ) = 1 − P = q


3. El experimento consta de n intentos, n constante dada.

4. Las repeticiones del ensayo son independientes.

Al número X de éxitos en n ensayos de un experimento binomial se le llama variable


aleatoria binomial.

La distribución de probabilidades de la variable aleatoria binomial X se llama Distribución


Binomial y la indicaremos por: b(x; n, p ) , ya que sus valores dependen del número de
ensayos y de la probabilidad de un éxito en un ensayo.

Para encontrar la expresión que nos proporcione la probabilidad de que ocurran x éxitos en
n ensayos de un experimento binomial, razonamos como sigue:

La variable X puede tomar los valores 0, 1, 2,n y se desea determinar las probabilidades
correspondientes; con este propósito consideramos el evento X = x , que significa que en x
de los n ensayos ocurre “éxito” y en los n − x ocurre “fracaso”. Esto se puede ver como
sigue:

eee e fff  f (a)

x veces n-x veces

En esta expresión f = ec (esto es “e” no ocurre), puesto que P(e) = P y P( f ) = q y como


los n ensayos son independientes, (a) tiene la probabilidad:

ppp p qqq q = px qn-x

x veces n-x veces

Es obvio que (a) es un arreglo en un solo orden de las x resultados “e” y las n − x
resultados “f”; entonces la probabilidad de x es igual a P x q n− x veces el número de arreglos
diferentes de los x resultados “e” y las n − x resultados “f” esto es:

n
b( x; n, p ) =   p x q n − x x = 0,1,2n (4.6)
 x

y b(x; n, p) = 0 para cualquier otro valor de x.


Función de distribución.

x x
n
B( x; n, p ) =  b(k , n, p ) =    p k q n − k (4.7)
k =0 k =0  k 

Valores de B(x; n, p) se encuentran tabulados para diferentes valores de n. Tabla I.

Ejemplo: Supóngase que la tasa de mortalidad para cierta enfermedad es de 0.10 y


supóngase también que la contraen 10 personas de la comunidad.

Calcular la probabilidad de que:

a) Mueran tres personas.

Solución: b(3; 10, 0.10) = B(3; 10, 0.10) − B(2; 10, 0.10) = 0.9872 − 0.9298
b(3; 10, 0.10) = 0.0574

b) Mueran a lo más 2 personas.

Solución: B(2, 10, 0.10) = 0.9298

c) Mueran 3 o más personas.

Solución: B(10; 10, 0.10) − B(2; 10, 0.10) = 1 − 0.9298 = 0.0702

d) Mueran de 2 a 5 personas.

5
Solución:  b(k , n, p ) = B(5; 10, 0.10 ) − B(1; 10, 0.10 )
k =2
= 0.9999 − 0.7361 = 0.2638

Cuando p > 0.5 y debido a que algunas tablas no tienen valores mayores que ( p = 0.5)
se usa lo siguiente:

Teorema:
b(x; n, p ) = B(n − x; n, 1 − p ) − B(n − x − 1; n, 1 − p )
B(x; n, p ) = 1 − B(n − x − 1; n, 1 − p )
Media y varianza de la distribución binominal

n
 x = E ( x ) =  x f ( x ) =  ( x )   ( p x q n − x ) =  x
n n n
n!
p x q n− x
x =0 x =0  x x =0 x ! (n − x )!

= np
n
(n − 1)! p x −1 (1 − p )
n− x
= np( p + q )
n −1
= np
x =1 ( x − 1) ! (n − x ) !

 x = np

n n
 x2 = E (x −  )2 =  (x −  )2 f (x ) =  x 2 f (x ) − 2 ( ) +  2
x =0 x =0

n n
=  x 2 f (x ) − (np) =
x =0
2
 x(x − 1) + x 
x =0
f ( x ) − (np )
2

n n
=  x( x − 1) p x (1 − p ) +  x f ( x ) − (np)
n! n− x 2

x =2 x ! (n − x )! x =0

= n (n − 1) p 2
n
(n − 2)! (1 − p )n − x + np − (np)
 (x − 2)! (n − x )! p
x=2
x−2 2

= n (n − 1) p 2 ( p + q )n−2 + np − (np)
2

= n (n − 1) p 2 + np − (np) = n p(1 − p ) = npq


2

 x2 = n p q

Distribución de Poisson

El proceso de Poisson. Se ha visto que se obtiene la distribución binomial a partir de un


conjunto de suposiciones acerca de un proceso fundamental que proporciona un
conjunto de observaciones numéricas.

Este también es el caso con la distribución de Poisson.

Las proposiciones siguientes describen lo que se conoce como proceso de Poisson.

1o. Las ocurrencias de los eventos son independientes.


2o. Teóricamente debe ser posible un número infinito de ocurrencias del evento en
el intervalo.
3o. La probabilidad de la ocurrencia única del evento en un intervalo dado es
proporcional a la magnitud del intervalo.
4o. En cualquier porción infinitesimalmente pequeña del intervalo se desprecia la
probabilidad de más de una ocurrencia del evento.

Si X es el número de ocurrencias de algún evento aleatorio en un intervalo de tiempo o


espacio (o algún volumen de materia), la probabilidad de que ocurra x esta dado por:

e−   x
f (x,  ) = x = 0, 1, 2 (4.8)
x!

Demostración:

Si en la función de probabilidades binomial:

n
b( x; n, p ) =   p x q n − x para x fija, hacemos que n →  y p → 0 a través de
 x
sucesiones de valores en donde np =  , entonces el límite de:

e−  x
b(x; n, p ) es f ( x;  )
x!

Partimos de  = np p = /n y px =  x / nx

n− x −x
   
n
 
= (1 − p )
n− x n− x
de igual manera q = 1 −  = 1 −  1 − 
 n  n  n

Entonces b(x; n, p ) se puede escribir como:

 x n (n − 1) (n − x + 1) 
−x
  
n

b( x; n, p ) =  1 −  1 − 
x! nx  n  n

cuando n →  la expresión:

n (n − 1) n − x + 1  n   n − 1   n − x + 1 
=    →1
nx n n   n 
−x
 
n
 − 
1 −  → e ; 1 −  →1
 n  n

En esta distribución  =  2 .

Función de distribución

x
F ( x,  ) =  f (k ,  ) ; esta función se encuentra tabulada para diferentes valores de .
k =0
Tabla II.

Ejemplo: En la inspección de una placa de estaño producida por un proceso electrolítico


continuo, la probabilidad de picaduras e imperfecciones en un intervalo de tiempo muy
pequeño t es 0.2t midiéndose el tiempo en minutos.

¿Cuáles son las probabilidades de que en 5 minutos se produzcan?

a) Exactamente 2 imperfecciones.

 = 0.2(5) = 1min

Solución:
f (2; 1) = F (2; 1) − F (1; 1) = 0.920 − 0.736 = 0.184

b) A lo más 2 imperfecciones.

Solución:
F (2; 1) = 0.920

c) Por lo menos 3 imperfecciones.

Solución:
1 − F (2; 1) = 1 − 0.920 = 0.080

d) De 2 a 4 imperfecciones.

Solución:
4

 f (k , 1) = F (4; 1) − F (1; 1) = 0.996 − 0.736 = 0.260


k =2
Distribución de Poisson como aproximación a la distribución binomial

La distribución de Poisson puede emplearse como aproximación a la binomial, cuando el


tamaño n de la muestra es grande, y la probabilidad p de tener éxito es pequeña, esto es,
cuando la distribución es muy sesgada. Como guía cabría decir que se obtiene una
aproximación satisfactoria cuando n  20 y p  0.05 y tal aproximación se incrementa a
medida que disminuye p.

Distribuciones continuas

Distribución normal

La distribución normal es la distribución continua más importante por las siguientes


razones:

1) Muchas variables aleatorias que aparecen en relación con experimentos u


observaciones prácticas están distribuidas normalmente.
2) Otras variables están distribuidas normalmente en forma aproximada.
3) Algunas veces una variable no esta distribuida normalmente ni siquiera en forma
aproximada, pero se puede convertir en una variable con distribución normal por
medio de una transformación sencilla.
4) Ciertas distribuciones más complicadas se pueden aproximar mediante la
Distribución Normal.
5) Ciertas variables que son básicas para justificar pruebas estadísticas están
distribuidas normalmente.

A la distribución continua que tiene densidad:

1  x− 
2
−  
f (x ) =
1
e 2  
 0
 2

Se le llama distribución normal ó Gaussiana. Se dice que una variable aleatoria que tiene
esta distribución es normal o está distribuida normalmente.

La curva que representa f (x) se denomina curva acampanada y es simétrica con respecto a
X =  . Véase la figura 4.4.
μ=0 x

Figura 4.4. Curva acampanada.

Densidad de la distribución normal con  = 0 para diferentes  .

Función de distribución de la distribución normal.

1  v− 
2
−  
F (x ) =
1

X
2  
e dv (4.10)
 2 −

Dado que cuando X es una variable aleatoria continúa. p ( X = c ) = 0 , solo tiene sentido el
cálculo de probabilidades de que la variable se encuentre dentro de un cierto intervalo, así:

1  v− 
2
−  
P(a  X  b ) = F (b ) − F (a ) =
1

b
2  
e dv (4.10.a)
 2 a

como la integral que aparece en la ecuación (4.10) no se puede evaluar por métodos
elementales, se transforma en la integral:


1
( r )2
 (Z ) =
1 Z

2 −
e 2
dr (4.10.b)
cuyos valores se encuentran tabulados para diferentes valores de Z (tabla III). Esta función
de distribución corresponde al caso en que  = 0 y  = 1 . Esta situación difícilmente
ocurre en la práctica. Sin embargo, como este es un caso muy particular, la expresión 4.10
se puede transformar en 4.11 mediante un cambio de variable sencillo:

v−
r= dv = dr

A la integración sobre v de −  a x corresponde la integración sobre r desde −  a


v−
z=

Por lo que de 4.10 obtenemos:

− ( r )2
1
F (x ) =
1

x
2
e dr donde la expresión de la derecha es igual que en
2 − 

v−
4.10.a con r = por lo tanto tenemos la relación básica.

 x− 
P( X  x ) = F ( x ) =   
  

De las expresiones 4.10 y 4.10.a obtenemos:

a− 
P( X  a ) = F (a ) =   
  

a− 
P ( X  a ) = 1 − P ( X  a ) = 1 − F (a ) = 1 −   
  

b−  a− 
P (a  X  b ) = F (b ) − F (a ) =    −  
     

Son muy interesantes los tres casos siguientes:

  + −     − −  
a) P( −   X   +  ) =    −   =  (1) −  (− 1) = 0.6827
     
  + 2 −     − 2 −  
b) P ( − 2  X   + 2 ) =    −   =  (2) −  (− 2) = 0.9545
     
  + 3 −     − 3 −  
c) P ( − 3  X   + 3 ) =    −   =  (3) −  (− 3) = 0.9973
     

Ejemplo: Supóngase que el tiempo que dura cierta marca de baterías para automóvil se
distribuye normalmente con una media  = 600 días y una desviación estándar de 30 días;
calcular el porcentaje de baterías que duran:

a) 660 días o menos.

 660 − 600 
Solución: P ( X  660 ) = F (660 ) =    =  (2) = 0.9772
 30 

b) Más de 550 días.

 550 − 600 
Solución: 1 − P ( X  550 ) = 1 − F (550 ) = 1 −    = 1 −  (− 1.67 )
 30 

= 1 − 0.0475 = 0.9525

c) De 540 a 660 días.

Solución:
 660 − 600   540 − 600 
P (540  X  660 ) = F (660 ) − F (540 ) =    −  
 30   30 

=  (2) −  (− 2) = 0.9545

d) ¿Cuál deberá ser la garantía si el fabricante solo está dispuesto a reparar o cambiar
el 10% de las baterías?

Solución: P( X  G) = 0.10

F (G ) = 0.10
G − 600 
   = 0.10
 30 
 G − 600 
  = −1.282
 30 
G = Garantía = 600 − 30(1.282 ) = 561.54días
Aproximación de la distribución binomial mediante la distribución normal.

Ahora veremos que de la distribución normal se obtiene una aproximación útil de la


distribución binomial cuando n es grande. Como ya vimos la función de probabilidades
de la distribución binomial es:

 n  x n− x
b( x; n, p ) = 
 x p q
 

Con media  = np

y varianza  2 = n p q

Teorema

Sea 0  p  1 . Entonces, para n grande, la distribución binomial se puede aproximar por


medio de la distribución normal con media  = np y varianza  2 = n p q , esto es:

z2
 n  x n− x 1 − x − np
  p q  e 2
; z=
 x npq 2 npq

Además.
b
n
P(a  x  b ) =    p x q n − x =  ( ) −  ( )
x=a  x 

a − np − 0.05 b − np + 0.05
=  =
npq npq

el teorema anterior se llama teorema de límite de Moivre y Laplace.


PROBLEMAS

4.1. Dada la función de probabilidad.


X -2 -1 0 1 2 3

f (x ) 0.1 0.1 0.2 0.3 0.2 0.1

a) Calcule  y  2 .
b) Construya su función de distribución acumulativa F ( X ) .

4.2. Una persona lanza dos monedas y recibirá N$4.00 si aparecen dos “caras” perderá
N$2.00 si aparecen dos “cruces” y perderá N$1.00 si en una moneda aparece “ cara “y
en la otra “cruz ”. ¿Cuál es la ganancia o pérdida por persona?

4.3. Supóngase que el 20% de cierta población tiene el grupo sanguíneo B. Para una
muestra de tamaño 20 extraída de esa población, calcule la probabilidad de encontrar:

a) Exactamente 3 personas con grupo sanguíneo B.


b) Más de 4 personas con esa característica.
c) Por lo menos 5 personas con esa característica.
d) Entre 2 y 6 personas con ese tipo de sangre.

4.4. El 10% del total de un gran lote de producción son defectuosos. Si se toma una muestra
aleatoria de 15 artículos, calcular la probabilidad de encontrar:

a) Menos de 4 defectuosos.
b) Por lo menos 2 defectuosos.
c) A lo más 5 defectuosos.
d) Entre 2 y 5 defectuosos.
e) Más de 6 no defectuosos.

4.5. En el estudio sobre la efectividad de un insecticida contra cierto insecto, se roció un


área grande de tierra. Posteriormente, se examinó el área en relación con los insectos
vivos, seleccionando lotes cuadrados al azar y contando el número de insectos vivos por
lote cuadrado. Experiencias anteriores han demostrado que el número promedio de
insectos vivos por lote cuadrado, después de haber rociado es de 1.5. Si el número de
insectos vivos por lote cuadrado se distribuye según Poisson. ¿Cuál es la probabilidad
de que un lote cuadrado cualquiera contenga?:
a) Exactamente un insecto vivo.
b) Ningún insecto vivo.
c) Uno o más insectos vivos.
d) A lo más 2 insectos vivos.
e) Entre 2 y 6 insectos vivos.

4.6. Supóngase que en la inspección de una lámina metálica producida en rollos continuos
el número de imperfecciones localizadas por un inspector durante un periodo de 10
minutos sea una variable aleatoria con distribución de Poisson de  = 1.4 . Hallar las
probabilidades de que durante un periodo de 10 minutos un inspector encuentre:

a) Ninguna imperfección.
b) Dos imperfecciones.
c) Más de dos imperfecciones.
d) Menos de 4 imperfecciones.

4.7. Si la probabilidad de que una persona sufra una reacción nociva debido a una inyección
de cierto suero es 0.001. Cuál es la probabilidad de que entre 1,000 personas
inyectadas:

a) 2 o más sufran esa reacción.


b) Menos de 3 sufran esa reacción.
c) Entre 2 y 4 sufran esa reacción.

4.8. Las capacidades de la cavidad craneana de cierta población, están distribuidas en forma
normal, con una media de 1,400 CC. Y una varianza de 14 400, encontrar la
probabilidad de que una persona elegida al azar de esta población tenga una capacidad
de la cavidad craneana:

a) Mayor que 1450 CC.


b) Menor de 1350 CC.
c) Entre 1300 y 1500 CC.

4.9. Para los gatos, la dosis letal media de cierta tintura es 13.4 CC y  = 0.945 . ¿Qué
porcentaje de los gatos se estimará que mueran con una dosis menor que 12.00 CC?

4.10. El tiempo de vida de cierto tipo de baterías para automóvil es una variable aleatoria
normal con media de 1760 días y desviación estándar de 60 días.
a. ¿Qué porcentaje de las baterías durará menos de 1740 días?
b. ¿Qué porcentaje durará entre 1750 y 1875 días?
c. ¿Cuál deberá ser la garantía para que el 95% de las baterías la resista?

4.11. Si la estatura media de las mujeres universitarias es de 5 pies 6 pulgadas y la


desviación estándar es de 2.4 pulgadas. ¿Qué porcentaje de estas estudiantes tiene
una estatura comprendida entre 5 pies 2 pulgadas y 5 pies 8 pulgadas?
CAPÍTULO V

MUESTREO

El problema fundamental de la inferencia Estadística es utilizar muestras para hacer


estimaciones o inferencias relativas a parámetros poblacionales.

En términos generales existen dos tipos de muestreo, muestreo probabilístico y muestro no


probabilístico, aquí solo nos ocuparemos del primero. La razón es que solo para el muestreo
probabilístico existen procedimientos estadísticamente seguros que nos permiten inferir a
partir de la muestra extraída a la población de interés.

Definición: Una muestra probabilística es una muestra extraída de tal manera que todo
miembro de la población tenga una probabilidad conocida de ser incluido en la muestra.

Definición: Si se extrae una muestra de tamaño n de una población de tamaño N de tal


manera que toda muestra posible de tamaño n tenga la misma probabilidad de ser
seleccionada, la muestra recibe el nombre de “muestra aleatoria simple”.

El muestreo puede ser con reemplazo o sin reemplazo. El muestreo es con reemplazo si
todo miembro de la población después de medir la característica que interesa se regresa a la
población y es sin reemplazo si los miembros escogidos no son regresados a la población.

El seleccionar una muestra aleatoria de una población no es tarea simple. Cuando la


población es discreta y pequeña, se pueden numerar sus elementos y escoger la muestra
utilizando una tabla de dígitos al azar, en este caso se procede de manera similar al caso en
que se utiliza una urna, solo que con la tabla de dígitos al azar se escogen los elementos de
esta tabla.

En general lo que se debe tener presente al seleccionar una muestra aleatoria es eliminar al
máximo cualquier tipo de discriminación.

Distribuciones muestrales.

Distribución Muestral: La distribución de todos los valores posibles que pueden ser
tomados por alguna estadística, calculados a partir de muestras del mismo tamaño extraídas
aleatoriamente de la misma población se llama distribución muestral de esa estadística.

Las distribuciones maestrales pueden construirse empíricamente; cuando se obtienen de una


población normal se procede como sigue:

1. De una población finita, discreta de tamaño N , se extraen aleatoriamente todas


las muestras posibles de tamaño n .
2. Se calcula la estadística de interés para cada muestra.
3. Se enumeran en una columna los diferentes valores observados de la estadística y,
en otra columna, la frecuencia correspondiente de la ocurrencia de cada uno de
esos valores.

Si la población es muy grande o infinita este procedimiento no es adecuado. Tampoco


funciona para poblaciones continuas. En esos casos, las distribuciones muestrales pueden
deducirse matemáticamente por procedimientos que quedan fuera del nivel de un curso
elemental de Estadística.

Distribución de la media de la muestra.

Considere la población finita: 1, 3, 5, 7, 9 cuya media es  = 5 y varianza


n 2

 (x − ) = 8 .
1
2 = i
n i =1

Considérese todas las muestras posibles de tamaño n = 2

a) Sin reemplazo:

Muestra X
(1,3) 2
( 1 ,5 ) 3 X f f relativa
(1,7) 4 2 1 1/10
(1,9) 5 3 1 1/10
(3,5) 4 4 2 2/10
(3,7) 5 5 2 2/10
(3,9) 6 6 2 2/10
(5,7) 6 7 1 1/10
(5,9) 7 8 1 1/10
(7,9) 8
Representación gráfica.

_
f  x
 
2
10

1
10

_
0 2 3 4 5 6 7 8 x
Figura 5.1. Distribución de la media de la muestra sin reemplazo.

_
Función de probabilidad de x .

_
2 3 4 5 6 7 8
x
_ 1 1 2 2 2 1 1
f  x
  10 10 10 10 10 10 10

_
Cálculo de la media y la varianza de x .

_ _ 
 = E  x  =  x i f  x i  = 2
n _
1   1   2   1 
_  + 3  + 4  +  + 8 =5
x   i =1    10   10   10   10 
2
_
n
 _   1   1   1 
 _ =   x i −   f  x i  = (2 − 5)2   + (3 − 5)2   +  + (8 − 5)2   = 3
2
x i =1      10   10   10 

De los cálculos anteriores se desprenden dos observaciones.


1o.  _ = 
x

2o.  _2   2
x
b) Con reemplazo.

En este caso el número de muestras posibles de tamaño n = 2 será mayor ya que después de
tomar un elemento de la población éste es regresado una vez que se registra su valor; por lo
tanto en la siguiente extracción puede volver a aparecer. Esto no sucede en el muestreo sin
reemplazo. Esta población por lo tanto siempre permanece del mismo tamaño y su
comportamiento es similar al de una población infinita para fines de muestreo.

Una manera sencilla de escribir todas las muestras posibles es utilizar el siguiente
procedimiento

Primera extracción
1 3 5 7 9
1 (11) (13) (15) (17) (19)
1 2 3 4 5

3 (31) (33) (35) (37) (39)

2 3 4 5 6

Segunda 5 (51) (53) (55) (57) (59)


extracción 3 4 5 6 7

7 (71) (73) (75) (77) (79)

4 5 6 7 8

9 (91) (93) (95) (97) (99)

5 6 7 8 9

Muestra entre paréntesis. Media en círculo.


Distribución de frecuencias

x f f relativa

1 1 1/25
2 2 2/25
3 3 3/25
4 4 4/25
5 5 5/25
6 4 4/25
7 3 3/25
8 2 2/25
9 1 1/25

Representación gráfica.

_

_
f  x
 

f  x
 

1 2 3 4 5 6 7 8 9 x _
x

Figura 5.2. Distribución de la media de la muestra con reemplazo.


Función de probabilidad.

_
1 2 3 4 5 6 7 8 9
x
_ 1 2 3 4 5 4 3 2 1
f  x
  25 25 25 25 25 25 25 25 25

_
Cálculo de la media y varianza de x .

_ _
 = E  x  =  x f  x  = 1 
_
1   2   1 
_ +2  ++ 9  =5
x      25   25   25 

2
_  _ 2  1  2  2  2 1 
 2
_ =   x −   f  x  = (1 − 5)   + (2 − 5)   +  + (9 − 5)  =4
x      25   25   25 

Nuevamente observamos que;


 =_
x

2 2
_
x

Resumiendo estos resultados diremos que:

Cuando el muestreo es a partir de una población distribuida normalmente, la distribución de


la media de la muestra poseerá las siguientes propiedades:

_
1. La distribución de x será normal.
_
2. La media  _ de la distribución de x será igual a la media de la población de la cual
x
se extrajeron las muestras.
_
3. La varianza,  _2 de la distribución de x será:
x

 2 N p − n
 n N − 1 Si la población es finita (N p = tamaño poblacional)

_ = 
2 p
x
 2

 n Si la población es infinita.
Para el caso en el que el muestreo se realiza a partir de una población no normal se aplica el
teorema del límite central.
Teorema: Dado una población de cualquier forma funcional, con una media  y una
_
varianza finita  2 , la distribución muestral de x , calculada a partir de muestras de tamaño
n de esta población, estará distribuida aproximadamente en forma normal con media  y
2
varianza cuando el tamaño de la muestra es grande.
n

Ejemplo:

Si las concentraciones de ácido úrico en los adultos del sexo masculino normales están
distribuidas aproximadamente en forma normal con una media de 5.7 miligramos por
ciento y una desviación estándar de 1; encontrar la probabilidad de que una muestra de
tamaño 9 tenga una media:

a) Menor que 5.2


b) Mayor que 6
c) Entre 5 y 6

Solución:
 = 5.7 y  =  = 5.7
_
x

 1 1
 =
_ = =
x n 9 3
 
_   5.2 − 5.7 
a) P x  5.2  = F (5.2 ) =    =  (− 1.5) = 0.0668
   1 
 
 3 
 
 6 − 5.7 
   
b) P x  6  = 1 − P x  6  = 1 − F (6) = 1 −    = 1 −  (0.9) = 1 − 0.8159 = 0.1841
_ _

     1 
 
 3 
   
 _
  6 − 5.7   5 − 5.7 
c) P 5  x  6  = F (6) − F (5) =    −   =  (0.9) −  (− 2.1)
   1   1 
   
 3   3 

= 0.8159 − 0.0179 = 0.7980


_
Es importante hacer notar que cuando el cálculo de probabilidades se refiere a x se debe
usar  _ y  _ .
x x

Distribución de la diferencia entre dos medias de muestras.

Ahora consideremos dos poblaciones distribuidas normalmente. Supóngase que de la


población (1) obtenemos todas las muestras posibles de tamaño n1 y de la población (2)
extraemos todas las muestras posibles de tamaño n2 . Para cada muestra de cada población
_
calculamos x y obtenemos todas las diferencias posibles entre las medias de muestras de la
población (1) y las medias de muestras de la población (2). Hacer esto de manera similar al
caso de una sola población resultaría demasiado laborioso pero llegaríamos a las siguientes
conclusiones:

Teorema.

Dadas dos poblaciones normalmente distribuidas, con medias 1 y 2 y varianzas  12 y


_ _
 22 respectivamente, la distribución muestral de la diferencia x1 − x 2 entre las medias de
muestras independientes, de tamaño n1 y n2 extraídas de estas poblaciones está distribuida
2 2
normalmente con media 1 − 2 y varianza 1 + 2 o sea:
n1 n2

 _ _  = 1 − 2 y
 x1 − x 2 
 

 12  22
 2 _ _  = +
 x1 − x 2  n1 n2
 

Cuando nos enfrentamos con poblaciones que no están distribuidas normalmente, la


solución es tomar muestras de tamaño grande para poder aplicar el teorema del límite
central.

Una muestra de tamaño n  30 se considera grande.

Ejemplo:

Dadas dos poblaciones normalmente distribuidas con medias iguales y varianzas  12 = 100
y  22 = 80 . ¿Cuál es la probabilidad de que muestras de tamaño n1 = 25 y n2 = 16
_ _
proporcionen un valor de x1 − x 2 mayor o igual a 8?
Datos:

 _ _  = 1 − 2 = 0 por que 1 = 2
 x1 − x 2 
 

 12  22 100 80
 2 _ _ 
= + = + =9
 x1 − x 2  n1 n2 25 16
 

 2 _ _  =3

 x1 − x 2 

 

 _ _
   _ _
 
P  x1 − x 2   8 = 1 − P  x1 − x 2   8
     

8−0
= 1 − F (8) = 1 −    = 1 −  (2.67 )
 3 

= 1 − 0.9962 = 0.0038
PROBLEMAS

5.1. Dada la población: 4, 9, 5, 2, 3, 7


a) Encontrar  y  2 .
b) Encontrar todas las muestras posibles de tamaño 2 sin reemplazo y calcular la media
de la distribución muestral   _  .
 x
c) Encontrar todas las muestras posibles de tamaño 2 con reemplazo y calcular la
media de la distribución muestral   _  .
 x
d) Expresar la relación que hay entre  _ y  .
x

e) Calcular la varianza (Var( X )) de las distribuciones encontradas tanto en el caso b)


como en el c) y expresar la relación que hay entre  _2 y  2 en ambos casos.
x

5.2. Si los pesos de todas las personas que viajan por avión en vuelos regulares que parten
de un aeropuerto tienen una media de 65 kg. y una desviación estándar de 8 kg. ¿Cuál
es la probabilidad de que una muestra aleatoria de 36 personas tomadas de un vuelo,
tenga un peso medio:

a) Menor que 67 kg.


b) Mayor que 62 kg.
c) Entre 63 y 68 kg.

5.3. Las estadísticas pecuarias que abarcan un extenso período de tiempo, muestran que en
una cierta región los pesos de todas las reses traídas al mercado se pueden aproximar
muy bien por una curva normal de media 1900 lb., y desviación estándar de 400 lb.
Cuál es la probabilidad de que el peso de una muestra aleatoria de 400 reses sea:

a) Inferior a 1870 lb.


b) Superior a 1950 lb.
c) Entre 1660 y 1910 lb.
d) Inferior a 1640 lb., o superior a 1900 lb.

5.4. Un investigador se siente inclinado a creer que los niveles de vitamina A en los
hígados de dos poblaciones humanas están, en cada una, distribuidos normalmente. Se
supone que las varianzas para las dos poblaciones son como sigue:
Población 1:  12 = 19600
Población 2:  22 = 8100

¿Cuál es la probabilidad de que una muestra aleatoria de tamaño 15 de la primera


_ _
población y de 10 de la segunda, proporcionen un valor de x1 − x 2 mayor que o igual a
50, si no existen diferencia en las medias de las poblaciones?

5.5. Dadas dos poblaciones no distribuidas normalmente, con medias iguales y varianzas
 12 = 240 y  22 = 350 . ¿Cuál es la probabilidad de que muestras de tamaño n1 = 40 y
_ _
n2 = 35 proporcionen un valor de x1 − x 2 menor o igual a 12?

También podría gustarte