Está en la página 1de 14

INTRODUCCION AL MUESTREO Y DISTRIBUCION DE

LA MEDIA MUESTRAL
1. Definiciones Bsicas:
Poblacin: es un grupo de unidades que tienen alguna caracterstica cuantificable en
comn. Las unidades pueden ser personas, rboles, bacterias, compuestos qumicos,
etc.. Pueden ser finitas o infinitas en nmero. La caracterstica cuantificable puede ser
una variable continua o discreta.
Poblacin finita: es posible fsicamente enumerarla o contar sus elementos
Poblacin Infinita
Unidad muestral. Corresponde a personas, objetos u otros elementos que
constituyen la poblacin, pueden ser sujetos o individuos, pero en algunos casos
podran ser escuelas, cursos o familias, unidades territoriales como manzanas de una
ciudad, calles o casas.
Error sistemtico. Error de medicin o de seleccin que se produce reiteradamente
en una misma direccin. Sus fuentes principales son equipos defectuosos o la
intervencin humana. Ejemplo: Pesar las unidades en una balanza descalibrada que
indica 10 gr ms en la medicin.
Muestra: un subconjunto de la poblacin, seleccionada de manera tal que representa
a una poblacin mayor.
Estadistica Inferencial:. Procedimientos mediante los cuales es posible
hacer
inferencias (conclusiones) para una poblacin adecuada poblacin a partir de lo
averiguado en un subconjunto llamado muestra. Por ejemplo, si queremos saber cul
ser la intencin de voto en las prximas elecciones, se selecciona una muetra aletoria
de la poblacin de potenciales votantes y se les indaga por su preferencia electoral,
una vez recolectados los datos, se calcula la proporcin muestral y segn sea su valor
se toma como un referente para toda la poblacin. .
Las conclusiones as obtenidas dependen de la muestra, si se selecciona otra muestra
puede que las conclusiones se vean afectadas drsticamente.
2. Razones para muestrear:
1. Economizar tiempo
2. Reducir costos
3. Imposibilidad de estudiar la poblacin

4. Los resultados de una muestra pueden ser ms precisos por la calidad de la


informacin recolectada.
5. Si las muestras se seleccionan de manera adecuada, es posible utilizar
mtodos de probabilidad para estimar el error en los parmetros estadsticos
resultantes.
6. Las muestras pueden seleccionarse para reducir la heterogeneidad.
Notacin:

x , x ,..., x

n
Observaciones de una muestra de tamao n: 1 2
N: tamao de la poblacin
n:tamao de muestra
X , Y , Z o cualquier letra en mayscula: variables aleatoria

3. Parmetros y Estimadores
Una caracterstica descriptiva global de una poblacin de observaciones se llama
parmetro.
Una caracterstica descriptiva global de una muestra de observaciones se llama
estadstica.

Muestra

^
P

Parmetros

: Media poblacional o verdadera media

s2

Estimadores

2: Varianza poblacional o verdadera varianza


P : Proporcin poblacional o verdadera proporcin.

: media muestral
s : varianza muestral
2

^
P : proporcin muestral,

^p=

X de xitos en lasn repeticiones


=
n
nmero total de repeticiones

Ejemplos: Escriba al frente de las siguientes variables, cul sera el parmetro a


estudiar:
Variable
Parmetro a estudiar
Ingreso
Gnero
Estrato socioeconmico
Edad
Consumo de energa
Gnero del coyuge cabeza de familia
Cantidad de artculos defectuosos de un
lote

Ingresos percibidos por trabajo en el


hogar

Otros ejemplos de parmetros: La mediana,


coeficientes de regresin, etc.

la varianza, los percentiles o los

4. Mtodos de muestreo:
La mejor manera de asegurarse que una muestra conducir a inferencias confiables y
vlidas, es usar muestras de probabilidad. El modelo general de muestreo establece
resultados generales acerca del papel de las probabilidades de seleccin de la
muestra y de los valores observados para determinar los intervalos de estimacin.
Definiciones:
Marco Muestral: dispositivo que permita identificar y ubicar a cada uno de los
elementos de la poblacin.
Diseo Muestral: Los dos elementos bsicos que determinan el resultado de un
estudio de muestreo son las probabilidades de seleccin de la muestra, p(s) y el
tratamiento de los datos muestrales observados. El conjunto de probabilidades de
seleccin se conoce con el nombre de diseo muestral, el tratamiento de los datos
observados se conocer como el estimador. El conjunto de diseo, estimador y las
consideraciones de tipo econmico y operativo conforman el plan muestral.
_____________________________________________________________________
Como se ve, un diseo muestral es una funcin de probabilidad p(s), en la prctica y
puesto que ciertos mecanismos de seleccin originan funciones p(s) especficas y
conocidas, son esos mecanismos de seleccin los que reciben este mismo nombre.
Ejemplo: MAS, Sistemtico, Muestro con reemplazamiento, etc.
_____________________________________________________________________

4.I. Muestreo Probabilstico


La base matemtica para el desarrollo del modelo de muestreo se encuentra en la
teora de la inferencia estadstica y de manera ms directa en la aplicacin de los
principios bsicos de la teora de probabilidad.
Los resultados del modelo de muestreo son vlidos, slo si se parte de la certeza de
contar con una muestra que satisfaga las condiciones exigidas por la inferencia
estadstica. Un proceso especfico de seleccin de muestra se denomina muestreo
probabilstico, si cumple los siguientes cuatro requerimientos:
1. Se puede definir el conjunto de muestras posibles que se derivan del proceso
de seleccin propuesto. (Disponer de un marco muestral)
2. A cada muestra posible le corresponde una probabilidad de seleccin p(s)
conocida. (Es adecuado aplicar la teora de inferencia estadstica que se en el
uso de muestras aleatorias simples?)

3. El proceso de seleccin garantiza que todo elemento del poblacin tiene una
probabilidad mayor a cero de ser incluido en alguna muestra (Tener en cuenta
que la estimacin se hace expandiendo por el inverso multiplicativo de la
probabilidad de inclusin, por eso a veces se debe hacer un recorte al marco
muestral eliminando a quienes tengan probabilidad de inclusin nula).
4. El proceso de seleccin propuesto consiste en un mecanismo aleatorio que
garantiza que cada muestra s recibe exactamente la probabilidad p(s) de ser
seleccionada.
Si el muestreo contempla la aplicacin de varias etapas,
condiciones planteadas en cada una de ellas.

deben cumplirse las 4

Para obtener muestras de probabilidad puede utilizar mtodos como:


1. Muestreo Aleatorio Simple: cada unidad muestral tiene igual probabilidad de
ser seleccionada. Aqu la seleccin de la muestra es con reemplazo de no
ser as el orden de la seleccin debe ser tomado en cuenta (en la probabilidad
de seleccin de la muestra).
2. Muestreo Sistemtico: Teniendo una lista sin seguir orden alguno, se
selecciona cada k-simo objeto, k se determina dividiendo el nmero de
objetos o individuos en el marco muestral entre el tamao de muestra
deseado(k=N/n). Se aconseja no usarlo si hay una repeticin cclica inherente
en el marco muestral. Ejemplo: para seleccionar meses del ao en un estudio
de las frecuencias de clases diferentes de accidentes, debido a que algunos de
stos suceden con mayor frecuencia en ciertas pocas del ao.
3. Muestreo Estratificado: antes de seleccionar la muestra se divide en estratos
pertinentes (subgrupos) y luego de cada estrato se selecciona una muestra
aleatoria. Ejemplo: diferenciar los estudiantes que estudian en escuela pblica
o privada y determinar el tamao de muestra en cada estrato en tal forma que
se preserven las proporciones poblaciones. Al extrapolar las resultados a la
poblacin hay que tener en cuenta el tamao relativo del estrato con respecto
al total de la poblacin.
4. Muestreo de Conglomerados: consta de dos etapas, primero la poblacin se
divide en conglomerados y de estos se selecciona un subconjunto, la muestra
est compuesta por todas las unidades de los conglomerados elegidos.
Ejemplo: en una ciudad las manzanas pueden ser los conglomerados.
Tambin, los estudios multicentro utilizan esta figura. Generalmente es un
poco menos preciso y requiere de mayor tamao de muestra. Al extrapolar las
resultados a la poblacin hay que tener en cuenta el tamao relativo de los
conglomerados.
Otros:
5. Muestreo por etapas o multietpico: combina el muestreo aleatorio simple y el
muestreo por conglomerados.
Primero se realiza un muestreo por
conglomerados y luego en lugar de seleccionar todo el conglomerado se
escoge una muestra aleatoria simple.
6. Muestreo de importancia: propio en ambientes de simulacin estadstica.
4. II Muestreo no probabilstico
Se desconoce la probabilidad de un sujeto de ser seleccionado. Se llaman Muestras
por conveniencia o muestra intencional. Estas muestras con frecuencia presentan
desviaciones o sesgos de seleccin y no cumple con los requisitos para calcular

errores de muestreo. Ejemplo: los sondeos de opinin, muestras obtenidas para el


estudio de enfermedades raras o para probar nuevos tratamientos, etc.
4.3 Tcnicas elementales de Seleccin de Muestras
Para el MAS: usar tabla de nmeros aleatorios o generarlos con la calculadora o con
software.
Un ejemplo de una tabla de nmeros aleatorios consiste en la lista de los nmeros de
una Lotera premiados a lo largo de su historia, pues se caracterizan por que cada
dgito tiene la misma probabilidad de ser elegido, y su eleccin es independiente de las
dems extracciones.
Observacin: En general los ejemplos y problemas de los textos de estadstica bsica
desarrollan lo referente a inferencia estadstica a partir de datos datos provenientes
de un muestreo aleatorio simple ya que una vez desarrollados su extensin a otros
mtodos de muestreo puede ser muy sencilla conceptualmente, aunque algo
elaborada matemticamente.
4.4 Leer y realizar las actividades programadas en el archivo Prctica Muestreo.
5. Muestreo y Distribuciones de probabilidad
Sea ahora S ser el conjunto de todas las muestras posibles que se pueden obtener
de una poblacin cuando se aplica un procedimiento especfico de seleccin. La
probabilidad de seleccin de cada una de las muestras de S debe ser conocida. El
proceso de muestreo consiste entonces en seleccionar una muestra del conjunto S y
con base en su probabilidad de seleccin y en los valores observados se establece un
intervalo, en el cual se encuentra con muy alta probabilidad, el parmetro desconocido
que se desea estimar. Aunque existen diversas manera de entregar los resultados de
un estudio muestral, en principio, el resultado es siempre el mismo, se sealan los
lmites inferior y superior del intervalo y la probabilidad de acierto.
5.1 Ejemplo: Las estadsticas y sus distribuciones:
Antes de hacer un muestreo o de experimentar, cualquier observacin en particular
est sujeta a incertidumbre. Por ejemplo la edad de la primera persona seleccionada
en la muestra puede ser 20 aos o 32 aos o cualquier otro valor posible. Debido a
esta incertidumbre, antes de que se disponga de datos consideramos las n
observaciones como variables aleatorias (va) y entonces las denotamos por letras

X , X ,... X

1
2
n.
maysculas
Observe que cualquier funcin (media, mediana,
desviacin estndar, etc) de las observaciones debe verse tambin como una
variable aleatoria y por ende debe tener una distribucin de probabilidades.

Muestra Aleatoria: Se dice que


tamao n si:

X 1 , X 2 ,... X n forman una muestra aleatoria (simple) de

X i son va independientes
X
Toda i tiene la misma distribucin de probabilidad
Las

iid
5

Definiciones:
Estadstico:
maestrales.

es cualquier cantidad cuyo valor se pueda calcular a partir de datos

Un estimador es un valor que puede calcularse a partir de los datos muestrales y que
proporciona informacin sobre el valor del parmetro.
2
Ejemplos la media, varianza y coeficiente de correlacin muestral, es decir, X , S , R
respectivamente, cuando se tiene dos muestras un estadstico de inters puede ser

Y la diferencia de medias.
X
Cualquier estadstica al ser calculada a partir de datos muestrales se convierte en
variable aleatoria y por lo tanto deber tener una distribucin de probabilidades
asociada.
Observaciones
Si el muestreo es con reemplazo o de una poblacin infinita las dos condiciones para
ser muestra aleatoria se satisfacen exactamente. En la prctica, si n/N < 0.05

podemos suponer que las i formen una muestra aleatoria.


La bondad de este mtodo de muestreo es que la distribucin de probabilidad de
cualquier estadstica puede obtenerse con ms facilidad que para cualquier otro
mtodo. Hay otros dos mtodos ms generales para obtener informacin acerca de la
distribucin de muestral de una estadstica: analticamente basndose en reglas de
probabilidad o realizando un experimento por simulacin.

Derivacin de la distribucin muestral de una estadstica


6

.0
0
5
.0
4
.0
3
.0
2
.0
1
.4
0E
4
5
d
a
(x
)50

En cierto hospital la variable X: edad del paciente que viene a tomarse la presin
arterial tiene la siguiente distribucin:
40
0.2

E[X]= = 46.5

45
0.3

V[X]= X = 15.25
2

50
0.5

P
(x
)

X
P(x)

Supongamos que en un da en particular slo dos pacientes solicitan el servicio. Sea


X1: edad del primer paciente y X 2: edad del segundo paciente, suponga que X1 y X2
son independientes, cada una con la distribucin de probabilidades de la tabla. Es
decir X1 y X2 constituyen una muestra aleatoria de esta distribucin. En la siguiente
tabla enumeramos todas las posibles pares (x1,x2) con su respectiva probabilidad de
ser observado, as como la media y la varianza de cada muestra.
x1
40
40
40
45
45
45
50
50
50

x2
40
45
50
40
45
50
40
45
50

P(x1,x2)
0.04
0.06
0.10
0.06
0.09
0.15
0.10
0.15
0.25

40
42.5
45
42.5
45
47.5
45
47.5
50

s2
0
12.5
50
12.5
0
12.5
50
Ejemplo:12.5
P(X1=40, X2=45)= 0.2*0.3=0.06
0

.0
0
3
.0
2
5
..4
0
2
.0
5
.0
0
1
5
.0
0
1
.0
3
..2
5
.0
0
4
0
,
4
2
,
5
4
5
,
0
4
7
,
5
5
0
,
m
e
d
i
a
.1

y S2 respectivamente:
Ahora podemos calcular la distribucin de probabilidades de X
P( x )

40
0.04

42.5
0.12

IMPORTANTE !

E[ X ] 46.5

s2

X2
7.625
2
2
x

45
0.29

47.5
0.30

p
(s
2
)p
(x
-b
a
r)

12.5

50
0.25

50

0
. ,01
2
,5
05
0
,
7

P(s2)

0.38

0.42

0.20

Qu pasa si tomamos muestras de mayor tamao? Cmo es la distribucin de


probabilidades de X ?
x2
4
0
4
0
4
0
4
5
4
5
4
5
5
0
5
0
5
0
4
0
4
0
4
0
4
5
4
5
4
5
5
0
5
0
5

X3
4
0
4
5
5
0
4
0
4
5
5
0
4
0
4
5
5
0
4
0
4
5
5
0
4
0
4
5
5
0
4
0
4
5
5

P(x1,x2,x3)

P(

0.008

40

0.012

41.67

0.02

43.33

0.012

41.67

0.018

43.33

0.03

45

0.02

43.33

0.03

45

0.05

46.67

0.012

41.67

0.018

43.33

0.03

45

0.018

43.33

0.027

45

0.045

46.67

0.03

45

0.045
0.075

46.67
48.33

.0
0
3
.0
2
5
.0
2
.0
1
5
.0
1
.0
5
.4
0
,4
1
,6
04
3
,0m
4
5
,0
e
d
ia46,048,3050,

X x

40

0.00
8

41.6
6
0.03
6

43.3
3
0.11
4

45

0.20
7

46.
66
0.2
85

48.3
3
0.22
5

50

0.12
5

p
ro
b

x1
4
0
4
0
4
0
4
0
4
0
4
0
4
0
4
0
4
0
4
5
4
5
4
5
4
5
4
5
4
5
4
5
4
5
4

5
5
0
5
0
5
0
5
0
5
0
5
0
5
0
5
0
5
0

0
4
0
4
0
4
0
4
5
4
5
4
5
5
0
5
0
5
0

0
4
0
4
5
5
0
4
0
4
5
5
0
4
0
4
5
5
0

0.02

43.33

0.03

45

0.05

46.67

0.03

45

0.045

46.67

0.075

48.33

0.05

46.67

0.075

48.33

0.125

50

5.2 La distribucin de la media muestral

X , X ,... X

1
2
n una muestra aleatoria de una distribucin con media
Proposicin: Sea
y desviacin estndar . Entonces:

1.
2.

E[ X ] X

V [ X ] x2

2
n

5.3 El caso de una poblacin con distribucin normal


Proposicin: Sea

X 1 , X 2 ,... X n una muestra aleatoria de una distribucin normal con

2
,

media y desviacin estndar

. Entonces para cualquier n,

~N

5.4 Teorema del lmite central (TLC)

Sea

X 1 , X 2 ,... X n una muestra aleatoria de una distribucin

con

media y

desviacin estndar . Entonces si n es suficientemente grande, X se distribuye

en forma aproximada N

Note que si el parmetro de inters es un total, T se distribuye en forma aproximada N

n , n .
2

5.5. Cmo saber si n es suficientemente grande?


Regla de dedo: Si n > 30, se puede usar el TLC.

Ejercicio 1: El Coeficiente intelectual (CI) de una poblacin se distribuye con media 95 y


desviacin estndar 10.
a)Si se selecciona un individuo de esa poblacin, cul es la probabilidad que tenga un CI
superior a 75?
Si extrajramos una muestra de 25 personas de esa poblacin,
b) Cul es la probabilidad que el CI promedio sea superior a 75?
Si extrajramos una muestra de 100 personas de esa poblacin,
c) Cul es la probabilidad que el CI promedio sea superior a 75?
Ejercicio 2. Una empresa productora de refrescos utiliza una mquina para llenar las botellas. El
contenido indicado en la etiqueta es 300 ml. En efecto, basados en millones de medidas de
botellas que la empresa ha producido, se sabe que el contenido de las botellas vara acorde a
una distribucin normal con media 298 y varianza 9.
a) Cul es la probabilidad que una botella individual contenga menos de 295 ml?
b) Cul es la probabilidad que el contenido promedio de las botellas en un six-pack sea
menos de 295 ml
c) Cul es la probabilidad que menos del 10% de las botella en un grupo de 100 botellas
tengan un contenido menor de 295 ml?
d) Cul es el 99th percentil para el nmero de mililitros de una botella individual (es decir, el
nmero tal que el 99% de todos los contenidos son inferiores a l)
10

Ejercicio 3. La renta media de los habitantes de un pas se distribuye uniformemente entre 4,0
millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que al seleccionar al azar a 100
personas el promedio de sus rentas supere los 7.25 millones ptas.
Cada renta personal es una variable independiente que se distribuye segn una funcin
uniforme. Por ello, el promedio de las rentas de 100 personas se le puede aplicar el Teorema
Central del Lmite.
Ejercicio 4. El tiempo que un cajero de un banco con servicio en el automvil atiende a un cliente
es una variable aleatoria con media 3.2 minutos y desviacin estndar de 1.6 minutos. Si se
observa una muestra aleatoria de 64 clientes, encuentre la probabilidad de que su tiempo medio
con el cajero sea: a) a lo ms 2.7 minutos b) ms de 3.5 minutos c) al menos 3.2 minutos pero
menos de 3.4 minutos.
5.5 Distribucin de la proporcin Muestral
Recordemos :
________________________________________
Distribucin Bernoulli
1 si hay xito
Xi
0 si hay fracaso
x
P(X=x)
E[X] = P V[X]= p(1-p)

1
p

Si tomamos X = X1 +X2 + + Xn
Ahora si consideramos

0
1-p

X:# de xitos

X ~b(n,p) E[X]= np V[X]=npq

X
n

Tenemos dos hechos importantes:


1)
2)

X
n
X
n

es un promedio
es la proporcin muestral, es decir es

X
^
P=
n

_________________________________

Si de una poblacin que se distribuye binomialmente con proporcin xito p, se extrae


una muestra aleatoria de tamao n, sabemos que la media de X: # de xitos en la
muestra

2
es np y su varianza es np (1 p ) .

X
p
n se tiene que la media es
muestral

Si tomamos la proporcin

p (1 p)
n
y la varianza
al aplicar el

11

Teorema del Lmite central, es decir que cuando n es suficientemente grande se


tiene:

X
p
n

p(1 p)
n

p p
p (1 p)
n

Aproximacin de la Binomial por la Normal (Teorema de De


Moivre) :
Demostr que bajo determinadas condiciones (para n grande y tanto p
como q no estn prximos a cero) la distribucin Binomial b(n, p) se puede
aproximar mediante una distribucin normal

Debemos tener en cuenta que cuanto mayor sea el valor de n, y cuanto ms


prximo sea p a 0.5, tanto mejor ser la aproximacin realizada. Es decir,
basta con que se verifique

gracias a esta aproximacin es fcil hallar probabilidades binomiales, que


para valores grandes de n resulten muy dispendioso de calcular.
Hay que tener en cuenta que para realizar correctamente esta
transformacin de una variable discreta (binomial) en una variable continua
(normal) es necesario hacer una correccin de continuidad.

12

Ejercicio 5. Completar la siguiente tabla.


Distribucin
Calcular usando la binomial
X ~B(25, 0,45)

P(X < 20)

Calcular
usando
aproximacin normal
P(X < 20)

X ~B(50, 0,45)

P(X < 20)

P(X < 20)

X ~B(200, 0,45)

P(X < 20)

P(X < 20)

la

13

14

También podría gustarte