Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. INTRODUCCIÓN AL MUESTREO
__ 2
Var X __2 X
X
n
Si la muestra se toma sin remplazo de una población finita de
tamaño N, la ecuación de la varianza debe modificarse como sigue:
N n X2
__
2
N, tamaño de la población
X N 1 n n, tamaño de la muestra
2X, varianza poblacional
X, media poblacional
Teorema central del límite
Sea X1, X2, …, Xn una muestra aleatoria de una función de
probabilidades
__
f X(x), con media X y varianza 2 . Sea
X
X X 1 X 2 ... X n la media aritmética de las variables
1
n
aleatorias que integran la muestra. Para un tamaño de
muestra
__ (n) grande, la distribución de la variable aleatoria
X es aproximadamente normal con media X y varianza
2X/n. En símbolos esto se escribe:
__
2
X N X , X
n
El símbolo debe leerse “se distribuye aproximadamente.
Alternativamente de__
acuerdo con el resultado anterior, y estandarizando la
variable aleatoria X , la expresión anterior puede escribirse como:
__
n X X
N (0,1)
X
Teorema Central del Límite
Lo sorprendente es que establece__que para un tamaño de
muestra grande la distribución X es aproximadamente
normal, independientemente de que la variable aleatoria X,
de cuya función de probabilidades se muestra, sea discreta
o continua, de que fX(x) sea simétrica o asimétrica, o de la
forma que ésta tenga.
X X X n
Teorema central del límite (versión
alternativa)
Sea X1, X2, …, Xn una muestra aleatoria de una función
de distribución de probabilidades fX(x), con media X y
varianza 2X. Entonces, para n grande, la variable
n
__
X
LI X Z *
2 n
__
X
LS X Z *
2 n
Ejemplo de cálculo de intervalo de
confianza
Suponiendo que el peso de 7 personas de un salón de clases
de 100 estudiantes es de 67.57 Kg y la desviación estándar
poblacional es de 8.667 Kg, encuentre un intervalo de
confianza de 95 % para la media poblacional.
La muestra aleatoria es X1, X2, …, X7, es decir n = 7
Valor medio 67.57 Kg y desviación estandar 8,667 Kg
=1-0.95 = 0.05
__
X 8.667
LI X Z * 67.57 1.96 65.758
2 n 7
__
8.667
LS X Z * X 67.57 1.96 74.541
2 n 7
Tamaño de una muestra aleatoria
Se selecciona una muestra aleatoria de tamaño n por el
procedimiento de muestreo aleatorio simple y la media
muestral tiene una distribución normal con media X y
varianza 2X/n y si además:
__
P X X d 1
Entonces:
X
d Z *
1
2 n
Es el error máximo permisible y 1 - expresa el nivel
de confiabilidad
Tamaño de muestra
En el muestreo aleatorio simple el tamaño de muestra
se calcula mediante la siguiente expresión:
Z * X
2
1 2
n
d
Donde:
X es la desviación estándar poblacional
Z1-/2 expresa la confiabilidad
Comentarios
Para obtener el tamaño de muestra se requiere conocer el valor de σ
ó tener una estimación de su valor usando una muestra preliminar.
Z * X
2
1 2 1 – = o.9426 entonces
n = 0.0574 esta área
d debe repartirse en los
dos extremos.
Dividiendo entre dos
2 se tiene 0.0287.
1.9 * 20 Por lo tanto Z1-0.0287 =
n 23 Z0.9713 que se busca en
8 el cuerpo de la tabla y
el resultado es 1.9
Distribución de la media muestral en
muestras aleatorias de la distribución normal
Sean X1, X2, …, Xn variables aleatorias independientes,
todas con la misma distribución N(, 2), es decir, que
X1, …, Xn es una muestra aleatoria de fX(x), donde
XN(, 2). La media aritmética de la muestra es tal
que: __
X2
X N X ,
n
__
Equivalente, estandarizado X ,
__
n X
N (0,1)
Distribución de la media muestral
y el teorema central del límite
La principal diferencia del anterior resultado con respecto al
Teorema Central del Límite consiste en que si la muestra
aleatoria es de una distribución normal, la distribución de la
media muestral también es Normal, y esto se cumple para
cualquier tamaño de muestra.
__
n X
__
__
255
P X 30 5 P X 5 P P( Z 2.78) 0.0027
9
Distribución de la media muestral en
muestras aleatorias de la distribución normal
Es evidente que el efecto de aumentar
__
el tamaño de
muestra es disminuir la varianza de X . En este caso se
dice que se tiene más información sobre el parámetro
, como es razonable esperar si se toma una muestra
de mayor tamaño.
Para el ejemplo anterior. Con n = 25 se tiene que:
__ 81
Var X 3.24
25
Para n = 4
__ 81
Var X 20.25
4
Intervalo de confianza para la
media
El hecho de conocer que:
__
2
X N X , X
n
2
tiene distribución Ji-cuadrada con n-1 grados de
libertad. En símbolos:
n 1S 2 2
n 1
2
Intervalo de confianza para la
varianza
El hecho de conocer: n 1S 2 2
n 1
2
__
n X
t
n 1
S
Distribución de una razón de varianzas muestrales
(dos muestras de distribuciones normales)
Sea X1, …, Xm una muestra aleatoria de tamaño m de
N(X, 2X), y Y1, …, Yn una muestra aleatoria de tamaño
n de N(Y, 2Y), y sean S2X y S2Y las varianzas
muestrales correspondientes. Entonces, si las muestras
son independientes:
S X2 X2 m 1
Fn 1
SY2 Y2
S X2 m 1
Fn 1
SY2
Ejemplo
Un laboratorista dispone de un equipo de calibración que le da
resultados satisfactorios desde el punto de vista de la variabilidad de
sus determinaciones. Se le ofrece un equipo nuevo que se supone tiene
la misma varianza que el que usa. Para comparar las dos varianzas
realiza 61 determinaciones con el equipo bueno y 41 con el equipo
propio. ¿Cuál es la probabilidad de que la varianza muestral con el
nuevo equipo sea el doble o mayor que la de las determinaciones con el
equipo propio, suponiendo que la afirmación de igualdad de varianzas
en los equipos sea cierta?
S X2
P S X2 2SY2
P 2 2 P F4060 2 0.01
SY
El valor de 0.01 se obtuvo de la tabla correspondiente
Aproximación normal a la binomial (una
aplicación del teorema central del límite)
Sea X una variable aleatoria distribuida Bin(n, p). La
probabilidad de que X tome un valor mayor o igual que a, y
menor o igual que b, puede aproximarse usando la distribución
normal estándar mediante la siguiente expresión:
a np b np
Pa X b P Z
npq npq
Una mejor aproximación se obtiene usando la corrección por
continuidad. En ese caso utilizamos la ecuación:
a 0.5 np b 0.5 np
Pa X b P Z
npq npq
En ambas ecuaciones Z N(0, 1).
Tamaño de muestra
El tamaño de una muestra depende de la variabilidad
de las unidades de la población con respecto a la
característica que se está investigando (en otras
palabras de la varianza de la población), de cuan cerca
se desea que las estimaciones de la media muestral se
encuentren de la media poblacional, es decir de la
confiabilidad que se requiere para las estimaciones y
del error de muestreo que se espere.
Cálculo del tamaño adecuado de
muestra considerando infinita a la
población.
1. Realizar una prueba piloto. Tomar una premuestra de al
menos 30 elementos.
2. Elaborar el instrumento preliminar. Que parámetros se
va a medir y como se va a realizar la medición.
3. Recopilar los datos de la premuestra. Para contar con
datos, observaciones preliminares para el estudio.
4. Aplicar una de las ecuaciones:
2
z pq z2s2
n 2 n 2
e e
Cálculo del tamaño adecuado de muestra
considerando infinita a la población.
2
z pq 2 2
z s
n 2 n 2
e e
Donde:
n= el tamaño adecuado de la muestra que se busca.
z= el nivel de confianza (1 - alpha) que se quiere que tengan los resultados de la
investigación, es válido en ciencias naturales desde 85% hasta 99.99% y en ciencias
sociales desde un 95% hasta 99.99%, pero estos valores debemos traducirlos en
términos de Z. En caso de no tener certeza del valor, elegir el 95 %.
p= el porcentaje de casos positivos. (Se obtiene de la premuestra). En caso de no
tener el dato, se sugiere p=0.5
q= el porcentaje de casos negativos. (Se obtiene de la premuestra). 1-p
e= el error estándar o de muestreo, es decir, el error que consideramos vamos a tener
al realizar nuestra investigación, dado que no existe el muestreo perfecto. En ciencias
naturales es adecuado definir un error desde 1% hasta 5% y en ciencias sociales desde
1% hasta 10%. También se conoce como precisión o error máximo permisible..
s2 = Varianza de la premuestra
Gramos que perdió al
Número del ave Murió
final de las 2 semanas
EJEMPLO 01
02
100
99
No
No
2 03 101 No
z pq
n 2
04
05
99
98
Si
Si
e 06 100 No
(1.64) 2 (0.56)(0.44) (2.6896)(0.2464) 07 100 Si
n 414 08 100 No
(0.04) 2 (0.0016)
09 98 Si
2 2 10 99 No
z s
n 2
11
12
101
100
Si
No
e 13 100 Si
X
x
99.52
14
15
101
99
Si
Si
n 16 98 Si
17 100 Si
( x X ) 2
24.12
s2 0.9648 18 100 No
n 25 19 99 No
20 101 Si
(2.6896)(0.9648) 21 101 No
n 1,622 22 99 Si
(0.0016) 23 98 Si
24 100 No
25 100 Si
EJEMPLO
Nz s 2 2
n 2
e (N 1) z 2 s 2
Algunos programas informáticos para calcular el
tamaño de la muestra a partir del error estándar o de
muestreo y el nivel de confianza deseado
Ene2.0 (http://www.e-biometria.com/ene-ctm/index.htm)
G*Power (http://www.psycho.uni-
duesseldorf.de/aap/projects/gpower/index.html)
MorePower Calculator 4.0
(http://homepage.usask.ca/~jic956/work/MorePower.html)
Power and Sample Size
(http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/Pow
erSampleSize)
StudySize2.0 (http://www.studysize.com/)
MÉTODOS PARA OBTENER EL TAMAÑO MUESTRA
¿Cuál es el menor número de unidades muestrales que necesito para conformar
una muestra que me asegure un error estándar (relación entre promedio de la
variable determinada de la población y en la muestra) menor de 0.01?
n
n N – Tamaño de la población
1 n n - Tamaño de la muestra
N
34703 93445 82051 53437 53717 48719 71858 11230 26076 44018
01556 58563 36828 85053 39025 16688 69524 81885 31911 13098
22211 86468 76293 16663 39489 18400 53155 92087 63942 99827
01534 70128 14111 77065 99358 28443 68135 61696 55241 61867
09647 32348 56909 40951 00440 10305 58160 62235 89455 73095
Ventajas:
Sencillo y de fácil comprensión..
Cálculo rápido de medias y varianzas.
Desventajas:
Requiere que se posea de antemano un listado completo de toda
la población (marco muestral).
Cuando se trabaja con muestras pequeñas es posible que no
represente a la población adecuadamente.
PROCEDIMIENTO DE SELECCIÓN DE LA MUESTRA
(Muestreo estratificado)
Muestra estratificada: Estriba en cómo y de dónde
seleccionar el tamaño de la muestra. Lo que se hace es dividir
a la población en subpoblaciones o estratos, atendiendo a
criterios que pueden ser importantes en el estudio y se
selecciona una muestra por cada estrato. Los elementos
dentro del estrato deben ser homogéneos, así como entre
estratos. (La estratificación aumenta la precisión de la
muestra e implica el uso deliberado de diferentes tamaños de
muestra por cada estrato, a fin de reducir la varianza de cada
unidad de la media muestral).
Ej: Tractores Total de la población Muestra
John Deere 5000 345
Case 8900 765
Masey 2400 100
TOTAL 16300 1210
Muestreo estratificado
Una vez definido el tamaño de muestra total n, este debe ser
dividido entre los k estratos en tamaños n1,n2,…,nk. Esta
división se efectúa principalmente mediante dos técnicas:
Asignación proporcional.
Asignación óptima.
Desventajas
Se ha de conocer la distribución en la población de las
variables utilizadas para la estratificación.
Ejemplo de muestreo estratificado
Suponga que 6500 estudiantes están divididos de
acuerdo con la procedencia de su lugar de origen, de la
siguiente manera:
Región del Norte = 750
Región del Centro = 2600
Región del Sur = 3150
Una muestra de 50 estudiantes, seleccionados desde los
3 estratos con asignación proporcional daría los
siguientes tamaños:
Ejemplo de muestreo estratificado
Nh
Empleando la asignación proporcional nh n *
N
Región Norte = 50*750/6500 = 5.769 ~ 6
Región Centro = 50*2600/6500 = 20.0
Región Sur= 50*3150/6500 = 24.231 ~ 24
6+20+24 = 50 alumnos
Desventaja
La desviación estándar es mayor que en el muestreo
aleatorio simple y estratificado.
El cálculo de la desviación estándar es complejo.
Ejemplo de muestreo por
conglomerados en tres etapas
Si se desea obtener una muestra de 1000 agricultores
de los estados más productivos, el muestreo aleatorio
simple implicaría enviar a los encuestadores a 1000
lugares distintos de los estados.
Un muestreo por conglomerados podría consistir en
seleccionar aleatoriamente 20 uniones de ejidos del
estado, luego seleccionar 25 ejidos de cada unión y por
último seleccionar 2 productores de cada ejido.
De hecho el muestreo aleatorio simple cubrirá mejor
los estados más productivos que el muestreo por
conglomerados, pero a un costo mayor.
MÉTODOS PARA OBTENER EL TAMAÑO MUESTRA
Muestra probabilística por racimos o
conglomerados: El tamaño de la muestra se realiza
siguiendo el procedimiento para muestra probabilística
simple y el tamaño de muestra para cada racimo es
similar al procedimiento estratificado.
PROCEDIMIENTO DE SELECCIÓN DE LA MUESTRA
(Muestreo sistemático)
3. Selección sistemática de elementos
muestrales: Implica seleccionar dentro de una
población un número de elementos a partir de un
intervalo que se determina por el tamaño de la
población y el tamaño de la muestra.
Se calcula el tamaño de muestra según el procedimiento descrito para muestreo
probabilístico simple y posteriormente se calcula el intervalo (K) como:
N Donde: N, es tamaño de la población
K
n n, es tamaño de la muestra
Ventajas
Fácil de aplicar.
Cuando la población está ordenada siguiendo una tendencia
conocida, asegura una cobertura de unidades de todos los tipos.
Desventajas
Si la constante de muestreo está asociada con el fenómeno de
interés, las estimaciones obtenidas a partir de la muestra pueden
contener sesgo de selección.
Ejemplo de muestreo sistemático
Población = 6500 alumnos que se encuentran inscritos
en la Universidad Autónoma Chapingo en el año 2006
registrados en un marco muestral.
Tamaño de la muestra = 10 alumnos.
Definir el tamaño del salto sistemático: k = 6500/10=
650
Elegir un número aleatorio r, entre 1 y 6500. Utilizando
la TI se tiene: rand(650) =64 => r=64.
Seleccionar los elementos de la lista: 64, 714, 1364,
2014, 2664, 3314, 3964, 4614, 5264, 5914.