Está en la página 1de 6

Captulo 7.

Distribuciones muestrales
En este captulo entraremos al final del ciclo del mtodo cientfico, usando la informacin de la muestra
para generalizar y llegar a conclusiones acerca de la poblacin de inters.
Recordemos algunas definiciones:
Parmetro es una medida de resumen numrica que se calculara usando todas las unidades de la
poblacin. Es un nmero fijo. Generalmente no lo conocemos.
Estadstica es una medida de resumen numrica que se calcula de las unidades de la muestra. El valor
de la estadstica se conoce cuando tomamos una muestra, pero varia de muestra en muestra variacin
muestral
Inferencia estadstica: es el proceso de sacar conclusiones acerca de la poblacin basados en la
informacin de una muestra de esa poblacin
Objetivos de la inferencia: estimacin de parmetros, intervalos de confianza y docimasia, prueba o test
de hiptesis (o prueba de significacin estadstica)
Supongamos que se conocen las estaturas de todos los individuos de una poblacin. Una medida
que describa la posicin central de esta poblacin sera el promedio de todas las estaturas el parmetro
.
Si slo tuviramos informacin sobre las estaturas de una muestra extrada de esta poblacin, el promedio
x calculado en la muestra sera la estadstica correspondiente.
Si nos interesa la dispersin de los valores individuales de las estaturas, calcularamos la desviacin
estndar, que para la poblacin se simbolizar por y para la muestra por S.
La estimacin de parmetros consiste en el clculo de estadsticas en muestras, con el fin de obtener
informacin sobre el valor de los parmetros de la poblacin. Esta induccin se basa en la teora de
probabilidades y slo es posible cuando se conoce la conducta o "distribucin muestral" de las estadsticas.
La docimasia de hiptesis consiste en conocer la probabilidad de ocurrencia, bajo la hiptesis nula, del
resultado obtenido en la investigacin, basndose en la distribucin muestral de la estadstica utilizada para
medir tal resultado.
Distribuciones muestrales
Una estadstica muestral proveniente de una muestra aleatoria simple tiene un patrn de comportamiento
(predecible) en repetidas muestras. Este patrn es llamado la distribucin muestral de la estadstica.
Si conocemos la distribucin muestral podemos hacer inferencia. Las distribuciones muestrales adoptan
diferentes formas segn las estadsticas investigadas y las caractersticas de la poblacin estudiada.
7.1 Distribucin muestral de una proporcin muestral
La distribucin muestral de la proporcin muestral es la distribucin de los valores de las
proporciones muestrales de todas las posibles muestras del mismo tamao n tomadas de la misma
poblacin.
Suponga que estamos interesados en conocer la proporcin de mujeres en Chile. Nuestro parmetro
de inters es:
P

nmero de mujeres en Chile


nmero de habitantes en Chile

La poblacin es demasiado grande. Hacer un censo sera demasiado caro. Decidimos estimar el verdadero
parmetro a partir de una muestra.
La proporcin muestral es: p

nmero de mujeres en la muestra


tamao de la muestra

Supongamos que sabemos que P 0,5 Qu pasa si tomamos una muestra tamao n 20 ?
Muestra #1: H M H H H M M M H H H M H M M H H M H M
Muestra #2: M M H M H M M H H H H M H H M M M H M M
Muestra #3: H H M M M H H M H M H M H M M H H M M H

Proporcin de mujeres
Proporcin de mujeres
Proporcin de mujeres

p = 9/20 = 0,45
p = 11/20 = 0,55
p = 10/20 = 0,50

En la prctica el investigador toma una muestra. El conocimiento de la distribucin muestral nos servir de
base terica para hacer inferencia estadstica.
Para conocer la distribucin muestral de una estadstica deberamos considerar todas las posibles
muestras de un tamao n, de una poblacin. En la prctica, podemos simular la distribucin muestral
aproximada o emprica, de la siguiente manera:
1.
2.
3.

Seleccione "muchas" muestras aleatorias de mismo tamao de una poblacin.


En cada muestra calcule la estadstica muestral
Determine la distribucin muestral aproximada

Recuerden que al analizar una distribucin nos interesa:


1.
2.
3.

Forma (simtrica o sesgada)


Posicin central - la media de una distribucin muestral nos dice si la estadstica es un "buen"
(insesgado) estimador del parmetro o es sesgado.
Dispersin - nos da una idea del error de muestreo.

Cul es la proporcin de nmeros pares de la tabla de nmeros aleatorios?


Usando tabla de nmeros aleatorios. Asumamos que el 50% de la poblacin es par, es decir P 0,5 .
Vamos a tomar 50 muestras de tamao n 4 de esta poblacin. Seleccionamos un punto de partida y
elegimos 4 nmeros.
Tabla:
Nmero de pares
0
1
2
3
4
Total

Proporcin muestral
0/4 = 0,00
1/4 = 0,25
2/4 = 0,50
3/4 = 0,75
4/4 = 1,00

Frecuencia Proporcin de todas las muestras

50

a) Cul fue la proporcin ms frecuente?


b) Dibuje la distribucin muestral emprica. Qu forma tiene?
Cada vez que tomamos una muestra tenemos una estimacin para el parmetro P . Estas estimaciones
varan entre muestras variacin muestral.

Se puede demostrar que si tomamos una m.a.s. de tamao n de una poblacin con parmetro P , la
p

P(1 P)
n

es:
desviacin estndar de p

que depende de la verdadera proporcin P y del tamao muestral

n.

Si el tamao muestral es n 4 y la proporcin en la poblacin es P 0,5 entonces la desviacin estndar


p

de p es:

P (1 P )

0,5(1 0,5)
0,25
4

Que pasa si aumentamos el tamao muestral?


Que pasa con P ? Cmo afecta el valor de P en la desviacin estndar?
Sesgo y Precision
Cuando estimamos un parmetro de la poblacin a partir de una estadstica muestral, nos va a interesar

que la estimacin no tenga sesgo y sea precisa.


La figura adjunta ilustra la diferencia entre sesgo y precisin. El grfico de la izquierda arriba muestra
una estadstica precisa pero sesgada. El grfico a la derecha arriba muestra una estadstica insesgada,
pero imprecisa. El grfico de la izquierda abajo muestra una estadstica sesgada e imprecisa. Por ltimo,
el grfico de la derecha abajo muestra una estadstica insesgada y precisa.
Distribucin muestral de una proporcin (recapitulacin)
Si P representa la proporcin de elementos en una poblacin con cierta caracterstica de inters, es decir, la
proporcin de xitos, donde xito corresponde a tener la caracterstica. Si sacamos muestras aleatorias
simples de tamao n de la poblacin donde la proporcin de xitos es P, entonces la distribucin muestral
de la proporcin muestral tiene las siguientes propiedades:

1. El promedio de todos los valores posibles de p es igual al parmetroP. En otras palabras, p es un


estimador insesgado deP: p = P
2. Error estndar de la proporcin muestral: Es la desviacin estndar de las posibles proporciones
muestrales y mide la dispersin de la proporcin muestral:
p

P (1 P)
n

Si analizamos la frmula, vemos que la desviacin estndar de p disminuye si el tamao de la muestra


aumenta.
3. Si n es suficientemente grande, la distribucin de la proporcin muestral es aproximadamente
Normal:
p ~ N ( P,

P (1 P )
) cuando nP 5 y nP(1-P) 5
n

Sangre
En Chile el 5,3% de la poblacin tiene sangre factor Rh(-). En una muestra aleatoria de 400 sujetos de
esa poblacin, se encuentra que un 8,8% tiene factor Rh(-).
a) cul es el valor del parmetro?
b) cul es el valor de la estadstica?
c) Cul es la probabilidad de que en una nueva muestra aleatoria de tamao 400 de esa poblacin
contenga al menos un 8,8% de personas con sangre factor Rh(-)?
d) Suponga que se toma una muestra aleatoria simple de tamao 10 de la misma poblacin. Queremos
calcular la probabilidad de que 8,8% o ms tenga sangre factor Rh(-).
7.2 Distribucin muestral de la media muestral
La distribucin muestral de la media muestral es la distribucin de los valores de las medias
muestrales de todas las posibles muestras del mismo tamao n tomadas de la misma poblacin.
Considere una poblacin cuya variable aleatoria X es discreta y con la siguiente distribucin:

La media de la poblacin es
Suponga que no conocemos la poblacin o el valor de
esta poblacin.

. Podemos tomar una m.a.s. de tamao n=2 de

Cul sera una muestra de tamao n=2 de esta poblacin?


Cul sera la media muestral?
Es igual a la media de la poblacin?
Si tomamos otra muestra de tamao n=2,

obtendramos la misma media muestral?

Distribucin muestral de la media muestral (resumen)


Si sacamos muestras aleatorias de tamao n de una poblacin con media y desviacin estndar ,
entonces la distribucin muestral de la media muestral tiene las siguientes propiedades:
1. El promedio de todos los valores posibles de medias muestrales es igual al parmetro . En otras
palabras, la media muestral x es un estimador insesgado de .
=
x

2. Error estndar de la media muestral: Es la desviacin estndar de las posibles medias muestrales.
=
x

El error estndar disminuye si el tamao de la muestra aumenta.


3. Si la poblacin original tiene distribucin Normal, entonces para cualquier tamao muestral n la
distribucin de la media muestral es tambin Normal
Si X ~ N ( , ) x ~ N ( ,

4. Si la poblacin de origen no es Normal pero podemos calcular su media y desviacin estndar y el


tamao muestral (n) es suficientemente grande la distribucin de la media muestral es
aproximadamente Normal
An si X no es N ( , ) x ~
N ( ,

Notas:
- Un tamao muestral de 30 es considerado suficiente.
- El resultado en (4) se conoce como el Teorema del Lmite Central.

Suponga que X = peso de carga de camionetas en kilos, tiene distribucin normal con media = 300 k
y desviacin estndar = 25 kilos.
Se toma una muestra aleatoria de 40 camionetas cargadas y se calcula la media muestral. Haga un
esquema de las distribuciones de la variable aleatoria X y de la media muestral
Suponga que X = la edad de las madres en los nacimientos en Chile el ao 1995, tiene distribucin
normal con media = 26,5 aos y desviacin estndar 6,3 aos.
a) Dibuje la curva que representa la distribucin de la edad de la madre.
b) Cul es la probabilidad de que una madre elegida al azar tenga ms de 30 aos?
c) Suponga que tomamos una muestra aleatoria de n=25 madres cul es la probabilidad de que la
media muestral sea mayor a 30?
d) porqu las respuestas en (b) y (c) son distintas?

También podría gustarte