Está en la página 1de 15

Distribuciones

MUESTRALES

SEMANA 2

[ ESTADSTICA INFERENCIAL ]

DISTRIBUCIONES MUESTRALES

CONTENIDO SEMANA DOS:

TEOREMA DEL LMITE CENTRAL


DISTRIBUCIN MUESTRAL DE LA MEDIA
DISTRIBUCIN MUESTRAL DE LA PROPORCIN
DISTRIBUCIN MUESTRAL DE LAS DIFERENCIAS.


Palabras clave:
Distribucin muestral, error estndar de la media, error estndar de la proporcin, factor de
correccin.

INTRODUCCIN
El propsito del muestreo es indagar algo sobre la poblacin de estudio. Cuando se disea
una muestra, es importante considerar la informacin que se va a obtener y el grado de
exactitud de lo que se encuentre acerca de la poblacin. Con este propsito es importante
que se analice claramente la obtencin de la muestra y los resultados obtenidos a partir de
ella, utilizando los conceptos probabilsticos ya vistos.

Una distribucin muestral es una distribucin de probabilidad de un estadstico muestral
calculado a partir de todas las muestras posibles de tamao n, elegidas al azar en una
poblacin determinada. En trminos generales estamos interesados en conocer una o ms
de las siguientes caractersticas:

Su forma funcional
Su media
Su desviacin estndar.


Antes de comprender la inferencia estadstica, tenemos que entender claramente el
concepto de distribucin muestral. Con esto se pretende dar a conocer la naturaleza de tales
distribuciones y su papel en la inferencia estadstica, sin detenernos mucho en este tema, ya
que por regla general en las aplicaciones estadsticas no se construyen distribuciones
muestrales. Para emplear los mtodos de la inferencia estadstica, necesitamos conocer


[ POLITCNICO GRANCOLOMBIANO ]

solamente las caractersticas de la distribucin muestral del estadstico apropiado al


problema que se est resolviendo.
A partir de las distribuciones muestrales es importante diferenciar si estamos hablando de
elementos de la poblacin o de la muestra y esto lo haremos teniendo en cuenta la siguiente
notacin:
Caracterstica

Total de elementos.
Media o promedio.
Varianza.
!!
Proporcin o probabilidad
de xito.

Poblacin

Muestra

n
!
S2
P


Vamos a construir una distribucin muestral experimental de medias calculadas a partir de
todas las muestras posibles que se pueden obtener de una poblacin pequea, con el fin de
comprender la naturaleza de la distribucin muestral y esto lo haremos con el siguiente
ejemplo:
Consideremos una poblacin conformada por cuatro personas (N=4). La variable de inters
es el gasto mensual en transporte (en miles de pesos). Los datos de la poblacin son: {78, 67,
83, 56} y vamos a responder a cada literal teniendo en cuenta la notacin utilizada:
a. Calcular la media y la desviacin estndar de la poblacin
La media poblacional se obtiene con:
!=
Y la desviacin estndar es:! =

!"
!

78 + 67 + 83 + 56 284
=
= 71
4
4

(!!!)!
!

(78 71)2 + (67 71)2 + (83 71)2 + (56 71)2


=
10.4163
4
Tenemos entonces una poblacin con media = 71 y desviacin estndar = 10,4163.
b. De la poblacin vamos a seleccionar todas las muestras posibles de tamao n =2 sin
orden y sin repeticin. Cuntas muestras de dos elementos de la poblacin pueden
formarse?
Como hay cuatro elementos en la poblacin y queremos formar grupos de dos sin importar
su orden tenernos que calcular una combinacin:


[ ESTADSTICA INFERENCIAL ]

4
4!
= 6
=
2 2!(4 2)!
Es decir que podemos formar seis grupos de dos elementos cada uno. Observmoslos:

X 1 : (78,67)

X 2 : (78,83)

X 4 : (67,83)

X 5 : (67,56)

X 3 : (78,56)


X 6 : (83,56) .

c. Dichas muestras son de tipo aleatorio simple para poblacin finita o infinita?
Como cada una de estas muestras tiene la misma probabilidad de ser elegida entonces la
probabilidad de escoger una muestra estara dada por:
Muestra

X 1

X 2

X 3

X 4

X 5

X 6

Probabilidad

1
1
1
1
1
1






6
6
6
6
6
6
Y por ende estamos en presencia de muestreo aleatorio simple para poblacin finita.

Como X es una variable aleatoria, vamos a calcular la media en cada muestra, entonces
X 1 : el promedio de la primera muestra, X 2 : el promedio de la segunda muestra, etc.,
Veamos:

78 + 67
= 72.5
2
67 + 83
X4 =
= 75
2
X1 =

78 + 83
= 80.5
2
67 + 56
X5 =
= 61.5
2

X2 =

78 + 56
= 67
2

83 + 56
X6 =
= 69.5
2

X3 =

d. Ahora vamos a calcular la media de estas medias es decir:


1
1
1
1
1
1
E ( X ) = X1 + X 2 + X 3 + X 4 + X 5 + X 6
6
6
6
6
6
6

X 1 + X 2 + X 3 + X 4 + X 5 + X 6 72.5 + 80.5 + 67 + 75 + 61.5 + 69.5 426
=
=
=
= 71
6
6
6
Ntese que el promedio de las medias muestrales es igual a la media poblacional, entonces
podemos decir que ! es una buena estimacin de .


! ! =!

Calculamos ahora la desviacin estndar de ! para las seis muestras posibles:


[ POLITCNICO GRANCOLOMBIANO ]

(72.5 71) 2 + (80.5 71) 2 + (67 71) 2 + (75 71) 2 + (61.5 71) 2 + (69.5 71) 2
X =

6
6.013
Observamos que la varianza poblacional es diferente a la varianza de !, por lo tanto es
necesario trabajar con una varianza corregida, esto se logra de la siguiente forma:
!!!

!! ! !

! !1

Con los datos del ejemplo se tiene que:


!!! =

(10,4163)! 4 2

2
41

!!! = 36,1664
!! = 6,013
Podemos decir entonces que si se seleccionan todas las muestras posibles de tamao n de
una poblacin dada entonces se tiene:

!(!)=

!! ! !
!!! =

y !
! 1

!!!

El factor !!! se denomina factor de correccin por finitud y en los casos de poblaciones
infinitas este factor se hace igual a 1 es decir que queda como: !!! =

!!
!


[ ESTADSTICA INFERENCIAL ]

TEORA DEL LMITE CENTRAL


Al seleccionar muestras simples de tamao de una poblacin, la


distribucin muestral de la media muestral se puede aproximar con una
distribucin de probabilidad normal, cuando el tamao de la muestra es
grande: de tamao mayor que treinta.

Otra manera de presentar el teorema es la siguiente:

Si
son un conjunto de variables aleatorias independientes que se
distribuyen idnticamente con media y varianza , entonces la variable
aleatoria:
!! =

!!
!!
!


Para la cual

es la suma de dichas variables aleatorias y

es el promedio

de las mismas, se distribuye normal estndar cuando n tiende a aumentar


significativamente.


Con lo anterior estamos preparados para estudiar las distribuciones muestrales y las
caractersticas de los estimadores puntuales ms usados en la inferencia estadstica. A
continuacin se expondrn las variables aleatorias (con sus distribuciones de probabilidad)
que ms se utilizan para estimar los parmetros poblacionales media, varianza y proporcin y
hacer inferencias de los mismos.

Distribucin muestral de ! en una poblacin normal


X
Si es la media de una muestra aleatoria de tamao n sacada de una
poblacin distribuida normalmente con media y desviacin X =
estandarizacin !! es:
!! =


[ POLITCNICO GRANCOLOMBIANO ]

!!

!!

y por lo tanto la



Ejemplo:
Se realiz una prueba a un grupo de ochenta aspirantes al cargo de administrador de cierta
empresa y se obtuvo que las calificaciones siguen una distribucin normal con calificacin
promedio de 300 puntos y desviacin estndar de 20. Cuando se toma una muestra de diez y
seis calificaciones de las pruebas:
a. Cul es el error tpico de la media de muestral?
b. Cul es la probabilidad de que la media muestral sea superior a 280 puntos?
Para responder cada literal utilizaremos la teora dada:
a. La varianza muestral es ( X )2 , luego el error tpico de la media muestral es:
!
!! =

!
!! =

20
16

= 5

b. Con base al enunciado debemos calcular P ( X > 280) y esto lo logramos estandarizando
la variable aleatoria X :

X 280

280
280 300
20

P
>
= P Z >
= P Z >
= P Z >

= P ( Z > 4 )

5
5

X
X

Veamos la representacin grfica de la probabilidad solicitada.



Cabe resaltar que como la normal estndar es una distribucin para la cual los valores de la
probabilidad de una cantidad negativa son igual al valor de la probabilidad de la cantidad
pero positiva, es decir:

P( Z > 4) = 1 P( Z < 4) 1 0.9999 = 0.0001


[ ESTADSTICA INFERENCIAL ]

Con lo cual decimos que la probabilidad de que la media muestral sea superior a 280 en una
muestra de tamao 16 es casi nula. En otras palabras no es muy probable que en una muestra
de diez y seis calificaciones la media muestral sea mayor a 280 puntos.
Ejemplo
En cierta ciudad los gastos semanales en transporte para los habitantes, estn distribuidos
normalmente con media de $16.500 y una desviacin estndar de $1.500. Cul es la
probabilidad de que una muestra de veinticinco personas tengan un gasto promedio
semanal superior a $15.750.
Vamos a identificar los datos que nos dan en el problema y a plantear la probabilidad
X: Gastos semanales en transporte:
=$16.500 =$1.500 n = 25
P (!>15760) = P

!! !
!
!

>

!"#$%!!"#$$
!"##
!"

= P !! > 2.47 = 1- P !! 2.47


= 1-0.0068
=0.9832

Distribucin muestral de ! cuando se desconoce la


distribucin de la poblacin.

Cuando la muestra no proviene de una distribucin


normal, el tamao de la muestra

desempea un papel muy importante. Cuando n es pequea, la forma de la distribucin
depende principalmente de la forma de la poblacin. Sin embargo cuando n crece, uno de los
teoremas ms importantes de la inferencia estadstica establece que la forma de la
distribucin muestral se aproxima a una distribucin normal, independientemente de la
distribucin que tenga la poblacin de origen.
(Teorema del lmite central).
La diferencia entre este enunciado y el anterior est en que no se requiere que la poblacin
de origen tenga distribucin normal cuando n es grande (n se considera grande si es mayor o
igual a treinta).


[ POLITCNICO GRANCOLOMBIANO ]

Ejemplo:
La duracin de cierta marca de bombillas tiene una media de 900 horas y la desviacin
estndar de setenta horas. Si se selecciona una muestra de 36 bombillas, determine la
probabilidad de que dure entre 870 y 925 horas.
Observe que no se hace ninguna mencin de la forma funcional de la distribucin, pero como
el tamao de muestra es grande (n30), por el teorema del lmite central entonces la
distribucin es aproximadamente normal:
X: tiempo de duracin de las bombillas
=900 = 70 n = 36

P (870! 925) = P

!"#!!""
!"
!"

!! !
!
!

!"#!!""
!"
!"

= P 2.57 !! 2.14 = 0.9838-0.0051=0.9787



Distribucin muestral de ! en una poblacin normal con varianza

poblacional desconocida.


Es muy comn el hecho de que en la prctica de que la varianza de la poblacin ! ! es
desconocida. En estos casos se trabaja con la varianza de la muestra ! ! como una
estimacin de ! ! , dando lugar a una variable T tal que:
!=

!!

!/ !

Conocida como la distribucin t Student o simplemente con el nombre de la distribucin t.


Esto quiere decir que para hacer inferencias sobre medias poblacionales cuando no se
conoce la varianza de la poblacin, se utiliza la distribucin t en lugar de la distribucin
normal.
La distribucin t, de la misma manera que la distribucin normal estandarizada, tiene forma
de campana y tiene media igual a 0, alrededor de la cual es simtrica. La varianza de la
distribucin t, en cambio, es mayor que 1, es por esto que la distribucin es ms aguda en el
centro y ms alta en las colas, como lo muestra la siguiente figura.


[ ESTADSTICA INFERENCIAL ]

El rea total bajo la distribucin t es igual a 1 y esta distribucin se encuentra tabulada para
cada valor (n-1) o grados de libertad denominados gl:
La tabla de la distribucin t tiene la siguiente tabla:



La columna de la izquierda de la tabla contiene diversos valores de (n 1) grados de libertad.
Cada encabezamiento en las columnas indica la proporcin del rea superior bajo la curva de
la distribucin t. Si estamos interesados por ejemplo, en la distribucin t para 10 grados de
libertad, para un rea superior de 0,05 el valor es t = 1,8125.

Distribucin de la proporcin de una muestra


En la prctica, son muy utilizadas las inferencias sobre proporciones poblacionales. Por lo
tanto la distribucin muestral de una proporcin es de gran inters. En un estudio de
mercados se puede estar interesado en la proporcin o porcentaje de consumidores que
estaran dispuestos a comprar algn producto nuevo que se piensa lanzar al mercado. El jefe
de personal puede estar interesado en conocer el porcentaje de empleados que se ausentan
en horas de trabajo.


10


[ POLITCNICO GRANCOLOMBIANO ]

Sea A el nmero total de elementos que presentan cierta caracterstica en una poblacin,
entonces la proporcin de aquellos que cumplen y no cumplen con dicha caracterstica est
A
NA
dada por la expresin P = y 1 P =
respectivamente.
N
N

Si P es la variable aleatoria proporcin de individuos de una poblacin que
presentan determinada caracterstica, entonces la proporcin muestral se
distribuye de la siguiente manera:
!(1 !)
!~! !!, !
!
!

proporcin poblacional y !

!(!!!)
!

es el error estndar de la proporcin.


Obsrvese que cada observacin de este experimento es de tipo Bernoulli xito (cumple con
la caracterstica) y fracaso (no cumple con la caracterstica) y como se repite cierto nmero
de veces se convierte en una Binomial para la cual el valor esperado de la variable aleatoria
proporcin de individuos con la caracterstica es P y la varianza es P (1 P ) . Si el tamao de
muestra es grande por el teorema del lmite central esta binomial puede aproximarse a una
normal con media P y varianza P (1 P ) .
Para tamao de muestra pequeo es decir que cumpla que np < 5 o n(1 p ) < 5 se tiene que
la varianza y desviacin estndar estn definidas de la siguiente manera

) = N n P(1 P) respectivamente a N n se le
) = N n P(1 P) y Var ( P
Var ( P
N 1
n
N 1
n
N 1
conoce como factor de correccin de poblaciones finitas:
Ejemplo
Se sabe que el 60% de los adultos de una zona del pas compran determinado producto. Se
obtiene una muestra de 150 adultos de esta rea. Cul es la probabilidad de que la
proporcin muestral este entre el 50% y el 70%?


[ ESTADSTICA INFERENCIAL ]

11

!! = ! = 0,6 !! =

(!,!)(!,!)
!"#

= 0,04

Recordemos que como P es aproximadamente normal se requiere estandarizar la variable


aleatoria para poder utilizar las tablas de probabilidades:
P(0,5 < P < 0,7) = !

!,!"!!,!
!,!"

<

!!!
!!

<

!,!!!,!
!,!"

= ! 2,5 < !! < 2,5

= !, !!"# !, !!"# = !, !"#$


Distribucin Muestral para la Diferencia entre dos Medias


muestrales(!! !! ) :

Muchas veces el inters se centra en dos poblaciones de las cuales vamos a ver si las medias
poblacionales no son iguales, o podemos estar interesados en la magnitud de cualquier
diferencia que se pueda presentar, por ejemplo se podra estar interesado en conocer si dos
lneas de produccin sacan en promedio el mismo nmero de unidades, o si son diferentes
dos mtodos de entrenamiento utilizados en el personal de produccin.
Como una generalizacin de la distribucin muestral para la media se puede decir lo
siguiente:
1. La diferencia muestral para la diferencia entre dos medias muestrales a partir de muestras
independientes de tamao n1 y n2, extradas de dos poblaciones distribuidas normalmente,
estar distribuida normalmente y tendr una media igual a (1 - 2) y una varianza igual a
!!

!!

(!! + !! ).
2. Si n1y n2 son grandes la distribucin muestral de la diferencia entre las dos medias
muestrales ser aproximadamente normal sin tener en cuenta la forma funcional de las
poblaciones originales.
Para encontrar las posibilidades asociadas a (!! !! ) se deben transformar los valores de
(!! !! ) en los valores de la distribucin normal estandarizada, mediante la frmula:
!=

!! !! (! ! )
!!!

!!!

!! + !!

12


[ POLITCNICO GRANCOLOMBIANO ]

EJEMPLOS:
1. La produccin diaria de una primera fbrica de envases de plstico tiene una distribucin
normal con una media de 50 unidades y una desviacin estndar de 8 unidades. La
produccin de una segunda fbrica esta distribuida normalmente con una media de cuarenta
unidades y una desviacin estndar de doce. Para comparar el rendimiento en el trabajo en
dos fbricas de envases plsticos se saca de la primera fbrica, una muestra aleatoria de 100
obreros y de la segunda una muestra de 400. Encontrar la probabilidad de que los obreros de
la primera fbrica produzcan ocho unidades ms que los de la segunda.
Solucin:
Primera
Fbrica.
Segunda
Fbrica.

n1 = 10

! = 50

!! = !

n2 = 400 ! = 40 !! = !"

! !! !! > 8 =?

!=

!! !! (! ! )
!!!

!!!

!! + !!

!=

8 (50 40 )
64
144
100 + 400

! = 2


P[Z > -2] = 1 P[Z -2] = 1 0,0228 = 0,9772



2. El rendimiento de los autos la marca. A es de 20 kilmetros por galn de gasolina
(k.p.g.), con una desviacin estn darde 6k.p.g. las cifras comparables para los autos
Bsonde 25 y5,5k. p.g. respectivamentes supone que el rendimiento dcada una de


[ ESTADSTICA INFERENCIAL ]

13

ambas marcas est norma mente distribuido. Cules probabilidad de que en un


concurso, el rendimiento medio para 10 autos de la marca A sea mayor que el de 9
autos de la marca B?

Solucin:

MARCA A MARCA B

Muestra.

n1 = 10

n2 = 9

Media.

1 = 20

2 = 25

Desviacin Estndar.

1 = 6

2 = 5,5


La probabilidad que se busca se plantea de la siguiente forma:

! !! !! > 0 =?

!=

!! !! (! ! )
!!! !!!
!! + !!

!=

0 (20 25 )
36
30,25
10 + 9

! = 1,81


P [Z > 1,81] = 1 P [Z 1,81] = 1 0,9649 = 0,0351

14


[ POLITCNICO GRANCOLOMBIANO ]

La probabilidad de que el rendimiento medio para 10 autos de la marca A sea mayor que el de
9 autos de la marca B es de 0,0351

BIBLIOGRAFA

FREUND, John E., MILLER, Irwin y MILLER, Marylees. Estadstica Matemtica con
aplicaciones. 6ed. Madrid Prentice Hall, 2000.
GUTIERREZ, Humberto y DE LA VARA, Romn. Control estadstico de Calidad y Seis Sigma
(6s). Mxico: McGraw-Hill, 2005.
KENNET, Ron S., y ZACKS, Shelemyahu. Estadstica Industrial Moderna. Barcelona, Thomson,
2000.
MONTGOMERY, Douglas C. y RUNGER, George C. Probabilidad y Estadstica aplicadas a la
Ingeniera. 2ed. Mxico: Limusa, 2002.
NEWBOLD. Paul. Estadstica para los Negocios y la Economa. 4ed. Madrid Prentice Hall, 1988.
WALPOLE Ronal, E., MYERS, Raymond H. y MYERS, Sharon L. Probabilidad y Estadstica para
Ingenieros. 6ed. Madrid Prentice Hall, 1998.


[ ESTADSTICA INFERENCIAL ]

15