Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3. A medida que n crece, la distribucin de p se aproxima a la normal,
siempre que p no se acerque ni a 0 ni a 1.
b) Distribucin en el muestreo de la media
Supongamos que se desea saber la altura media de los nios de 11 aos de
una ciudad. La altura media poblacional la representaremos por , y por la
desviacin tpica poblacional.
Con el fin de hacernos una idea de cmo puede ser , elegimos una muestra
aleatoria formada por 40 nios, y se obtiene que:
* La altura media muestral es:
1
x =140 cms.
* La desviacin tpica muestral es:
1
s =16,5 cms.
Si elegimos otras muestras de tamao 40 y calculamos sus medias y sus
desviaciones tpicas, obtendremos:
2
x ,
3
x ,,
n
x y
2
s ,
3
s ,,
n
s .
Los distintos valores de dan lugar a una variable aleatoria que representamos
por X . La distribucin de los valores de X se llama distribucin de las medias
muestrales por depender de las muestras o distribucin en el muestreo de la
media, y se demuestra que:
La variable aleatoria X tiene las siguientes caractersticas:
1. Media:
2. Desviacin tpica:
n
o
3. A medida que n crece, la distribucin de X se aproxima a una normal.
As X
, N
n
o
| |
|
\ .
* Si es desconocida y n 30, la sustituiremos por
( )
2
1
i
x x
s
n
(desviacin
tpica muestral)
* Si es desconocida y n<30 los valores de s varan considerablemente de
muestra en muestra, pues s disminuye a medida que n aumenta, y la
distribucin de X ya no sera normal. "Si (
1 2
, ,...
n
X X X ) es una muestra
aleatoria simple de tamao n, procedente de una poblacin N(,) con
desconocida, entonces:
X t-Student con n-1 grados de libertad"
c) Distribucin de las sumas muestrales
El encargado del registro civil de una ciudad quiere saber cunto suman las
tallas de las parejas que van all a inscribirse. Supongamos que la suma de las
tallas de la poblacin tiene por media y desviacin tpica .
Con el fin de hacernos una idea de cmo puede ser , elegimos una muestra
aleatoria formada por 35 parejas, y se obtiene que:
* la talla suma media es:
1
t = 2,35 m.
* la desviacin tpica de la muestra es:
1
s = 0,15 m.
Si elegimos otras muestras de tamao 35 y calculamos sus medias y sus
desviaciones tpicas, obtendremos:
2 3
, ,...,
n
t t t y
2 3
, ,...,
n
s s s .
Los distintos valores de
i
t dan lugar a una variable aleatoria que
representamos por T. La distribucin de los valores de T se llama distribucin
de las sumas muestrales, por depender de las muestras, o distribucin en el
muestreo de las sumas, y se demuestra que:
La variable aleatoria T tiene las siguientes caractersticas:
1. Media: n
2. Desviacin tpica: n
3. A medida que n crece, la distribucin de T se aproxima a la normal.
d) Distribucin en el muestreo de la diferencia de medias.
Supongamos que la medida de los esprragos de La Rioja tienen de media
1
y desviacin tipica
1
o y que los esprragos de Aranjuez tienen de media
2
y
desviacin tpica
2
o . Supongamos tambin que ambas poblaciones se
distribuyen normalmente y de forma independiente.
Tomamos una muestra de tamao
1
n de esprragos de La Rioja y una muestra
de tamao
2
n de esprragos de Aranjuez. Sean
1
x y
2
x sus longitudes medias
respectivas.
Si elegimos otras muestras de tamaos
1
n y
2
n , respectivamente, y calculamos
sus medias y las diferencias de medias, se obtiene:
1 2 1 2 1 2
' ' ; " " ;x '" '",... x x x x x
Estos distintos valores dan lugar a una variable aleatoria que representamos
por
1 2
X X . La distribucin de
1 2
X X se llama distribucin en el muestreo de
la diferencia de medias, y se demuestra que:
La variable aleatoria
1 2
X X tiene las siguientes caractersticas:
1. Media:
1 2
2. Desviacin tpica:
2
1
2
1
2
1
n n
o o
+
3. A medida que
1 2
y n n crecen, la distribucin de
1 2
X X se aproxima a la
normal.
Si las desviaciones tpicas son desconocidas y las muestras son grandes,
sustituiremos
1 2
y o o por
1
s y
2
s , respectivamente.
de obtener conclusiones vlidas para la poblacin a partir de los datos de una
muestra es el objetivo principal de la inferencia estadstica.
Para introducir el concepto de distribucin muestral, elaboraremos la de la
media de una muestra aleatoria de tamao n=2 tomada sin remplazo de la
poblacin finita de tamao N=5, cuyos elementos son: 3,5,7,9,11.
La media de esta poblacin es: =
+ + + +
=
3 5 7 9 11
5
7 y su desviacin tpica
es:
o =
+ + + +
=
2 2 2 2 2
3 7 5 7 7 7 9 7 11 7
5
8
( ) ( ) ( ) ( ) ( )
Ahora si tomamos una muestra aleatoria de tamao n = 2 de esta poblacin
hay
5
2
10
|
\
|
.
| = posibilidades:
n
nuestra
Muestras
x
1 3 5 4
2 3 7 5
3 3 9 6
4 3 11 7
5 5 7 6
6 5 9 7
7 5 11 8
8 7 9 8
9 7 11 9
10 9 11 10
Media Probabilidad
4 1/10
5 1/10
6 2/10
7 2/10
8 2/10
9 1/10
10 1/10
Un anlisis de esta distribucin muestral revela cierta informacin relacionada
con el problema de la estimacin de la media de la poblacin de referencia con
una muestra aleatoria de tamao n=2. Por ejemplo para x = 6,7 u 8 la
probabilidad de que la media poblacin ( 7) no difiera por ms de 1 de la
muestral es de 6/10. Sin embargo para x = 5,6,7,8 0 9 la media de una
muestra no difiera en mas de 2 unidades es 8/10. Por consiguiente si no
conociramos la media de la poblacin de referencia y quisiramos estimarla
con la media de una muestra aleatoria de tamao n=2, el procedimiento
anterior nos da alguna idea del posible tamao del error.
Si calculamos la media y la desviacin tpica de la distribucin de las medias
obtenemos que:
x
= 7 y o
x
= 3, luego la media
x
coincide con la media
de la poblacin y la desviacin tpica ha disminuido.
Evidentemente este proceso realizado con una muestra pequea no es lo
suficientemente explicativo. si tomsemos para n=10 y N=100 sera necesario
una lista de mas de 17 billones de muestras.. por lo que para realizar el
proceso sera necesario hacer una simulacin por computadora.
Ejemplo:
1.-En un lote de frascos para medicina, con una poblacin de 8000 unidades, se
desea estimar la media de la capacidad en centmetros cbicos de los mismos.
A travs de un premuestreo de tamao 35 se ha estimado que la desviacin
estndar es de 2 centmetros cbicos. Si queremos tener una precisin 0.25
cms
3
, y un nivel de significancia del 5% . De que tamao debe de ser la muestra
?.
DATOS:
S = 2 cms
3
; N = 8000 ; d = 0.25 cms
3
; a = 0.05 (5%)
Z
a/2
= 1.96
N Z
a/2
S 8000(1.96)(2)
n = -------------- = --------------------------- = 238 frascos
Nd + Z
a/2
S 8000(0.25) + (1.96)(2)
Solo faltara muestrear 203 frascos, pues los datos de los 35 frascos del
premuestreo siguen siendo vlidos.
2.- En un estudio, se desea determinar en que proporcin los nios de una regin
toman nenerina en el desayuno. Si se sabe que existen 1,500 nios y deseamos
tener una precisin del 10 porciento, con un nivel de significancia del 5% . De
que tamao debe de ser la muestra?.
DATOS:
N = 1500 ; d = 10 % = 0.1 ; a = 5 %
p = 0.5 y q = 0.5 (asumiendo varianza mxima).
Z
a/2
= 1.96
N Z
a/2
pq 1500 (1.96)(0.5)(0.5)
n = ----------------- = -------------------------------- = 91
d + Z
a/2
pq 1500(0.1) + (1.96)(0.5)(0.5)
Se deben de muestrear 91 nios.
Conclusin
Es importante entender o profundizar un poco sobre el tamao de la
muestra en el que vemos que existe una relacin natural entre el tamao de la
muestra y la confiabilidad de las estimaciones que se pueden hacer en base a
ellas. A mayor tamao de la muestra mayor confiabilidad. Al aplicar las
formulas para determinar el tamao de la muestra el valor que se obtiene es el
tamao mnimo, si el investigador desea puede escoger un tamao mayor pero
nunca menor.
Para realizar un estudio de muestreo es imprescindible dejar bien definido
cul es la poblacin a trabajar, porque de la misma es que ser seleccionada la
muestra, constituyendo sta un subconjunto de la poblacin y por consiguiente
contendr las mismas propiedades de la primera.