Está en la página 1de 71

TEMAS:

1. INTRODUCCIÓN AL MUESTREO

Dr. Gilberto López Canteñs


Muestra de variables aleatorias
 Muestra: Conjunto de resultados que se colectan en
una investigación.

 La definición de muestra se inscribe en el contexto de


un experimento aleatorio y repeticiones del mismo.

 Para obtener los datos en una investigación realizamos


repeticiones de un experimento aleatorio, teniendo un
espacio muestral para cada repetición.
Muestra de variables aleatorias
 Si en cada uno de esos espacios muestrales definimos una
variable aleatoria, se tendrá que la colección de variables
aleatorias así definidas constituyen lo que llamaremos una
muestra.

 Los números sobre los que operan los métodos estadísticos


son los valores específicos que toman esas variables
aleatorias, una vez que se han realizado las repeticiones del
experimento. Ej: antes de realizar el experimento se tiene
variable aleatoria X1, X2, X3, X4; si se efectúan las
repeticiones y se obtienen valores 0, 1, 1, 0, se habla
entonces de observaciones.
Muestra de variables aleatorias
Población Muestra aleatoria de
tamaño n
1 15
(Es una muestra aleatoria
20
porque todavía no se sabe
60 los valores que tomara cada
300 variable). Se representa por
800 X1, X2, X3,…, X20000
1000 12000
18000
20000
Realización de la muestra
Ej: Un extensionista agrícola desea investigar el No. de aleatoria
veces por año que los agricultores de una comunidad (se tiene un valor en cada una
acuden a la oficina de extensión agrícola a solicitar de las variables aleatorias y
asesoría técnica. Supongase No. de agricultores 20000 constituyen la muestra
y la variable aleatoria X número de veces que va a la aleatoria). Se representa por x1,
oficina. Interes tomar una muestra de 40 agricultores y x2,…, x40
registrar el No. de consultas al año de cada uno.
Muestra de variables aleatorias
 La realización de una muestra aleatoria no es única y
en general existe una infinidad de muestras aleatorias
que dependen por una parte del tamaño de la
población y del tamaño de la muestra que se desea
obtener.

 Existen dos tipos de muestreo: con remplazo y sin


remplazo.
Muestra de variables aleatorias
 Definición Muestra aleatoria: Sea X una variable
aleatoria con función de distribución de probabilidades
fX(x), que sirve como modelo probabilístico para una
situación dada. Una muestra aleatoria de fX(x) es una
colección de variables aleatorias independientes X1, X2, …,
Xn, cada una con función de probabilidades fX(x).

 Si las variables aleatorias que integran la muestra son


independientes (la población es infinita ó el muestreo es
con reemplazo) se dice que se tiene una muestra aleatoria.
Estadística
 En una investigación normalmente se toma una sola
muestra y, por lo tanto, medidas como la media y la
varianza tienen un valor determinado para la misma.

 Lo anterior varia al menos conceptualmente, siempre es


posible tomar diferentes muestras que darían lugar a otras
medias y varianzas

 Para una muestra aleatoria, los posibles valores de variables


aleatorias como media y varianza tienen una distribución
probabilística que depende de la función de distribución de
probabilidades fX(x) que sirve de modelo para la
característica bajo estudio.
Estadística
 Definición: Sea X1, X2, …, Xn una
muestra de una función de distribución
de probabilidades fX(x). Una estadística
es una función de X1, X2, …, Xn, que no
involucra parámetros desconocidos.
Distribución de la media y
varianza muestrales
 Media y varianza de la media muestral
Sea X1, X2, …, Xn una muestra aleatoria de una función de
distribución de probabilidades fX(x), con media X y varianza 2X.
La media y la varianza de la media muestral X para muestreo con
remplazo son:  __ 
E X  
  __ X
  X

 __   2
Var X   __2 X
  X
n
Si la muestra se toma sin remplazo de una población finita de
tamaño N, la ecuación de la varianza debe modificarse como sigue:

 N  n   X2
 __  
2

N, tamaño de la población
X  N 1  n n, tamaño de la muestra
2X, varianza poblacional
X, media poblacional
Teorema central del límite
 Sea X1, X2, …, Xn una muestra aleatoria de una función de
probabilidades
__
f X(x), con media X y varianza  2 . Sea
X
X   X 1 X 2  ...  X n  la media aritmética de las variables
1
n
aleatorias que integran la muestra. Para un tamaño de
muestra
__ (n) grande, la distribución de la variable aleatoria
X es aproximadamente normal con media X y varianza
2X/n. En símbolos esto se escribe:
__
  2

X  N X , X

 n 
El símbolo  debe leerse “se distribuye aproximadamente.
Alternativamente de__
acuerdo con el resultado anterior, y estandarizando la
variable aleatoria X , la expresión anterior puede escribirse como:
 __ 
n X  X 
   N (0,1)
X
Teorema Central del Límite
 Lo sorprendente es que establece__que para un tamaño de
muestra grande la distribución X es aproximadamente
normal, independientemente de que la variable aleatoria X,
de cuya función de probabilidades se muestra, sea discreta
o continua, de que fX(x) sea simétrica o asimétrica, o de la
forma que ésta tenga.

 La expresión tamaño grande de muestra es ambigua y este


para el cual la aproximación es buena depende de la forma
de fX(x). SE CONSIDERA N GRANDE PARA N MAYOR O
IGUAL A 30
Teorema central del límite
 Una forma alternativa de presentar este teorema
consiste en considerar suma de variables alternativas,
en vez de medias de las mismas. En efecto, obsérvese
que:
 n 
  Xi 
n  i 1  X 
 __
  n  n
n X  X 
 




X
i 1
i  n X

X X X n
Teorema central del límite (versión
alternativa)
 Sea X1, X2, …, Xn una muestra aleatoria de una función
de distribución de probabilidades fX(x), con media X y
varianza 2X. Entonces, para n grande, la variable
n

aleatoria S   X tiene una distribución que se aproxima


n
i 1
i

a la Normal, con media nX y varianza n2X. En


símbolos:

Sn  N n X , n X
2

De aquí es evidente, estandarizando Sn, que:
S n  n X
 N 0,1
X n
Intervalo de confianza
__
  2

 El hecho de conocer que 
permite establecer
X  N X , X
n 

un intervalo de confianza dentro del cual se espera
encontrar el valor verdadero o poblacional X con una
probabilidad asociada:

__
X
LI  X  Z *
2 n
__
X
LS  X  Z *
2 n
Ejemplo de cálculo de intervalo de
confianza
Suponiendo que el peso de 7 personas de un salón de clases
de 100 estudiantes es de 67.57 Kg y la desviación estándar
poblacional es de 8.667 Kg, encuentre un intervalo de
confianza de 95 % para la media poblacional.
 La muestra aleatoria es X1, X2, …, X7, es decir n = 7
 Valor medio 67.57 Kg y desviación estandar 8,667 Kg
 =1-0.95 = 0.05
__
X 8.667
LI  X  Z *  67.57  1.96  65.758
2 n 7
__
 8.667
LS  X  Z * X  67.57  1.96  74.541
2 n 7
Tamaño de una muestra aleatoria
 Se selecciona una muestra aleatoria de tamaño n por el
procedimiento de muestreo aleatorio simple y la media
muestral tiene una distribución normal con media X y
varianza 2X/n y si además:
 __ 
P X   X  d   1  
 
Entonces:
X
d Z  *
1
2 n
Es el error máximo permisible y 1 -  expresa el nivel
de confiabilidad
Tamaño de muestra
 En el muestreo aleatorio simple el tamaño de muestra
se calcula mediante la siguiente expresión:

 Z  * X
2

 1 2 
n 
 d 
 

Donde:
X es la desviación estándar poblacional
Z1-/2 expresa la confiabilidad
Comentarios
 Para obtener el tamaño de muestra se requiere conocer el valor de σ
ó tener una estimación de su valor usando una muestra preliminar.

 Se debe fijar el máximo error permisible (d) que se desea cometer y


expresa la diferencia en valor absoluto entre la media muestral y la
media poblacional, es decir __
X d

 El grado de confiabilidad se expresa a través del valor de α e indica


el porcentaje o la probabilidad (1-α)*100% de que realmente ese
error máximo permisible ocurra.

 Por la expresión obtenida anteriormente no influye el tamaño de la


población sobre el tamaño de la muestra solo se considera la
variabilidad presente en toda la población a través del valor de la
varianza σ2 o desviación estándar σ.
Ejemplo de cálculo de tamaño de
muestra
 En una población con desviación estándar 20 ¿De qué tamaño debe
tomarse una muestra aleatoria si se requiere que la diferencia en valor
absoluto entre la media muestral y la media poblacional sea menor de
8 con una probabilidad de 0.9426?. Suponga distribución normal

 Z  * X
2

 1 2  1 –  = o.9426 entonces
n   = 0.0574 esta área
 d  debe repartirse en los
  dos extremos.
Dividiendo entre dos
2 se tiene 0.0287.
 1.9 * 20  Por lo tanto Z1-0.0287 =
n   23 Z0.9713 que se busca en
 8  el cuerpo de la tabla y
el resultado es 1.9
Distribución de la media muestral en
muestras aleatorias de la distribución normal
 Sean X1, X2, …, Xn variables aleatorias independientes,
todas con la misma distribución N(, 2), es decir, que
X1, …, Xn es una muestra aleatoria de fX(x), donde
XN(, 2). La media aritmética de la muestra es tal
que: __
  X2 
X  N X ,
 n 
__
Equivalente, estandarizado X ,

 __ 
n X   
   N (0,1)

Distribución de la media muestral
y el teorema central del límite
 La principal diferencia del anterior resultado con respecto al
Teorema Central del Límite consiste en que si la muestra
aleatoria es de una distribución normal, la distribución de la
media muestral también es Normal, y esto se cumple para
cualquier tamaño de muestra.

 Resultado que es muy importante en los trabajos de


investigación ya que en numerosos casos por cuestiones prácticas
o sobre todo económicas es imposible tener un tamaño de
muestra grande, pero sabiendo que el fenómeno bajo estudio
tiene un comportamiento de acuerdo con la distribución de
probabilidades normal bastará con tener un menor tamaño de
muestra de n = 2 ó 3, como ocurre en las repeticiones de los
trabajos realizados en la mayoría de los diseños experimentales.
Ejemplo Distribución de la media muestral en
muestras aleatorias de la distribución normal
 Suponga que XN(30, 81). Encuentre la probabilidad
de que la media aritmética de una muestra de tamaño
25 sea mayor que la media poblacional ( = 30) por
más de 5 unidades.
 La probabilidad buscada es:

  __  
 n X   
 __
  __
   255
P X  30  5   P X    5   P     P( Z  2.78)  0.0027
      9 
 
 
Distribución de la media muestral en
muestras aleatorias de la distribución normal
 Es evidente que el efecto de aumentar
__
el tamaño de
muestra es disminuir la varianza de X . En este caso se
dice que se tiene más información sobre el parámetro
, como es razonable esperar si se toma una muestra
de mayor tamaño.
 Para el ejemplo anterior. Con n = 25 se tiene que:
 __  81
Var  X    3.24
  25
 Para n = 4

 __  81
Var X    20.25
  4
Intervalo de confianza para la
media
 El hecho de conocer que:
__
  2

X  N X , X

 n 

 Permite establecer un intervalo de confianza dentro


del cual se espera encontrar el valor de μ con una
probabilidad asociada al aplicar la siguiente expresión.
Ejemplo de cálculo de intervalo de
confianza
Ejemplo de cálculo de intervalo de
confianza
Tabla resumen para la estimación por
intervalo de la media poblacional
Población Tamaño de Se conoce  No se conoce 
muestra
Con distribución Grande (n  30)
__
X
X  Z / 2
__
SX
n X  Z / 2
normal n
__
Pequeño (n < 30) __
X X  t / 2
SX
X  Z / 2 n
n
Sin distribución Grande (n  30) __
X __
SX
X  Z / 2 X  Z / 2
normal n n
Pequeño (n < 30) Por lo general se usan procedimientos
no paramétricos basados en la mediana
Propiedades de la varianza muestral (S2) y su
distribución en muestras aleatorias de una normal
 Sea X1, …, Xn una muestra aleatoria de una función de
distribución de probabilidades fX(x), con E(X) =  y
Var(X) =2. Sea:
2
1  __

S2  
n 1 
 i
X  X 

La varianza muestral. Entonces:

E(S2) = 2 Aquí 4to 5

Con lo cual se dice que s2 es un estimador insesgado de σ2.


Propiedades de la varianza muestral (S2) y su
distribución en muestras aleatorias de una normal
 Sean X1, X2, …, Xn variables aleatorias independientes,
cada una con distribución N(, 2). Sea S2 la varianza
muestral. Entonces, la variable aleatoria n  1S 2

2
tiene distribución Ji-cuadrada con n-1 grados de
libertad. En símbolos:

n  1S 2   2
n 1
 2
Intervalo de confianza para la
varianza
 El hecho de conocer: n  1S 2   2
n 1
 2

 Permite establecer un intervalo de confianza (IC) dentro del cual


se espera encontrar el valor de σ2 con una probabilidad asociada
al aplicar la siguiente expresión.

 O bien para obtener un intervalo de confianza para σ con una


probabilidad asociada al aplicar la siguiente expresión.
Ejemplo de cálculo de intervalo de
confianza de la varianza
Ejemplo de cálculo de intervalo de
confianza de la varianza
 __ 
Distribución de en n X    S
 
muestras aleatorias de una normal
__
Sea X1, …, Xn una muestra aleatoria de N(, 2), y sean X y
S2 la media y la varianza muestrales, respectivamente. La
variable aleatoria n  X    S
__
tiene una distribución t de
 
Student con n – 1 grados de libertad. En símbolos:

 __ 
n X   
  t
 n 1
S
Distribución de una razón de varianzas muestrales
(dos muestras de distribuciones normales)
 Sea X1, …, Xm una muestra aleatoria de tamaño m de
N(X, 2X), y Y1, …, Yn una muestra aleatoria de tamaño
n de N(Y, 2Y), y sean S2X y S2Y las varianzas
muestrales correspondientes. Entonces, si las muestras
son independientes:
S X2  X2 m 1
 Fn 1
SY2  Y2

 En el caso particular 2X = 2Y, se tiene:

S X2 m 1
 Fn 1
SY2
Ejemplo
 Un laboratorista dispone de un equipo de calibración que le da
resultados satisfactorios desde el punto de vista de la variabilidad de
sus determinaciones. Se le ofrece un equipo nuevo que se supone tiene
la misma varianza que el que usa. Para comparar las dos varianzas
realiza 61 determinaciones con el equipo bueno y 41 con el equipo
propio. ¿Cuál es la probabilidad de que la varianza muestral con el
nuevo equipo sea el doble o mayor que la de las determinaciones con el
equipo propio, suponiendo que la afirmación de igualdad de varianzas
en los equipos sea cierta?
 S X2 

P S X2  2SY2   
 P 2  2   P F4060  2  0.01
 SY 
 El valor de 0.01 se obtuvo de la tabla correspondiente
Aproximación normal a la binomial (una
aplicación del teorema central del límite)
 Sea X una variable aleatoria distribuida Bin(n, p). La
probabilidad de que X tome un valor mayor o igual que a, y
menor o igual que b, puede aproximarse usando la distribución
normal estándar mediante la siguiente expresión:
 a  np b  np 
Pa  X  b   P  Z 
 npq npq 
 Una mejor aproximación se obtiene usando la corrección por
continuidad. En ese caso utilizamos la ecuación:
 a  0.5  np b  0.5  np 
Pa  X  b   P  Z  
 npq npq 
 En ambas ecuaciones Z  N(0, 1).
Tamaño de muestra
 El tamaño de una muestra depende de la variabilidad
de las unidades de la población con respecto a la
característica que se está investigando (en otras
palabras de la varianza de la población), de cuan cerca
se desea que las estimaciones de la media muestral se
encuentren de la media poblacional, es decir de la
confiabilidad que se requiere para las estimaciones y
del error de muestreo que se espere.
Cálculo del tamaño adecuado de
muestra considerando infinita a la
población.
1. Realizar una prueba piloto. Tomar una premuestra de al
menos 30 elementos.
2. Elaborar el instrumento preliminar. Que parámetros se
va a medir y como se va a realizar la medición.
3. Recopilar los datos de la premuestra. Para contar con
datos, observaciones preliminares para el estudio.
4. Aplicar una de las ecuaciones:
2
z pq z2s2
n 2 n 2
e e
Cálculo del tamaño adecuado de muestra
considerando infinita a la población.
2
z pq 2 2
z s
n 2 n 2
e e
Donde:
n= el tamaño adecuado de la muestra que se busca.
z= el nivel de confianza (1 - alpha) que se quiere que tengan los resultados de la
investigación, es válido en ciencias naturales desde 85% hasta 99.99% y en ciencias
sociales desde un 95% hasta 99.99%, pero estos valores debemos traducirlos en
términos de Z. En caso de no tener certeza del valor, elegir el 95 %.
p= el porcentaje de casos positivos. (Se obtiene de la premuestra). En caso de no
tener el dato, se sugiere p=0.5
q= el porcentaje de casos negativos. (Se obtiene de la premuestra). 1-p
e= el error estándar o de muestreo, es decir, el error que consideramos vamos a tener
al realizar nuestra investigación, dado que no existe el muestreo perfecto. En ciencias
naturales es adecuado definir un error desde 1% hasta 5% y en ciencias sociales desde
1% hasta 10%. También se conoce como precisión o error máximo permisible..
s2 = Varianza de la premuestra
Gramos que perdió al
Número del ave Murió
final de las 2 semanas
EJEMPLO 01
02
100
99
No
No
2 03 101 No
z pq
n 2
04
05
99
98
Si
Si
e 06 100 No
(1.64) 2 (0.56)(0.44) (2.6896)(0.2464) 07 100 Si
n   414 08 100 No
(0.04) 2 (0.0016)
09 98 Si
2 2 10 99 No
z s
n 2
11
12
101
100
Si
No
e 13 100 Si

X
 x
 99.52
14
15
101
99
Si
Si
n 16 98 Si


17 100 Si
( x  X ) 2
24.12
s2    0.9648 18 100 No
n 25 19 99 No
20 101 Si
(2.6896)(0.9648) 21 101 No
n  1,622 22 99 Si
(0.0016) 23 98 Si
24 100 No
25 100 Si
EJEMPLO

El nivel de confianza elegido


es de 90 % que equivale al
área bajo la curva, como es
simétrica es 2*0.44950,
siendo el valor de z = 1.64.

Otro ejemplo: Para la


seguridad del 95 %, el
valor de z= 1.96
COMENTARIOS
 La diferencia es cualitativamente tenue, con los datos
obtenidos a través de la varianza estamos siendo más
finos en el análisis de la variable peso, y al utilizar la
fórmula de proporciones solamente estamos
observando los vivos y los muertos, es decir un
resultado final, no del proceso, sin embargo,
supongamos que la variable más adecuada para este
estudio no sea el peso sino otra, entonces tal vez en la
prueba piloto deberíamos probar con más variables
registradas.
COMENTARIOS
Según diferentes seguridades el coeficiente de z varía, así:

 Si la seguridad z fuese del 90% el coeficiente sería 1.645


 Si la seguridad z fuese del 95% el coeficiente sería 1.96
 Si la seguridad z fuese del 97.5% el coeficiente sería 2.24
 Si la seguridad z fuese del 99% el coeficiente sería 2.576
Si la población es finita, es decir
conocemos el total de la población y
deseásemos calcular la muestra
Nz pq 2
n 2
e (N  1)  z pq
2

¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes


para conocer la prevalencia de diabetes?
Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede
ser próxima al 5% ; si no tuviese ninguna idea de dicha proporción utilizaríamos
el valor p = 0.5 (50%) que maximiza el tamaño muestral.
Si la población es finita, es decir
conocemos el total de la población y
deseásemos calcular la muestra
Para el caso en que se utiliza la varianza

Nz s 2 2
n 2
e (N  1)  z 2 s 2
Algunos programas informáticos para calcular el
tamaño de la muestra a partir del error estándar o de
muestreo y el nivel de confianza deseado
 Ene2.0 (http://www.e-biometria.com/ene-ctm/index.htm)
 G*Power (http://www.psycho.uni-
duesseldorf.de/aap/projects/gpower/index.html)
 MorePower Calculator 4.0
(http://homepage.usask.ca/~jic956/work/MorePower.html)
 Power and Sample Size
(http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/Pow
erSampleSize)
 StudySize2.0 (http://www.studysize.com/)
MÉTODOS PARA OBTENER EL TAMAÑO MUESTRA
¿Cuál es el menor número de unidades muestrales que necesito para conformar
una muestra que me asegure un error estándar (relación entre promedio de la
variable determinada de la población y en la muestra) menor de 0.01?

Muestra probabilístico simple: Se determina el


tamaño de la muestra (n) con base en estimados de
la población (varianza de la población).
s2 var ianza de la muestra
n  2  Tamaño provisional de la muestra* 
V var ianza de la población

n
n N – Tamaño de la población
1  n n - Tamaño de la muestra
N

s 2  p(1  p) p- Probabilidad de ocurrencia del valor


promedio de la variable determinada
PROCEDIMIENTO DE SELECCIÓN DE
LA MUESTRA
Las unidades de análisis o los elementos
muestrales se eligen siempre aleatoriamente
para asegurarnos de que cada elemento tenga la
misma probabilidad de ser elegido.

Métodos de muestreo empleados en los


trabajos de investigación
•Muestreo Aleatorio simple.
•Muestreo sistemático.
•Muestreo Estratificado.
•Muestreo por Conglomerados.
PROCEDIMIENTO DE SELECCIÓN DE LA
MUESTRA (Muestreo aleatorio simple)
1. Tómbola: Consiste en numerar todos los elementos
muestrales del 1 al n. Hacer fichas, una por cada
elemento, revolverlas en una caja, e ir sacando n
fichas, según el tamaño de la muestra. Los números
elegidos al azar conformarán la muestra.

2. Números aleatorios: No significa la selección


azarosa, sino la utilización de un cuadro de números
que implica un mecanismo de probabilidad muy
bien diseñado. (El cuadro tiene un millón de números
generados por una ruleta electrónica).
PROCEDIMIENTO DE SELECCIÓN DE
LA MUESTRA
Números aleatorios:

34703 93445 82051 53437 53717 48719 71858 11230 26076 44018
01556 58563 36828 85053 39025 16688 69524 81885 31911 13098
22211 86468 76293 16663 39489 18400 53155 92087 63942 99827
01534 70128 14111 77065 99358 28443 68135 61696 55241 61867
09647 32348 56909 40951 00440 10305 58160 62235 89455 73095

A partir del tamaño de la población, se seleccionan los


elementos que van a formar la muestra. Se eligen aquellos
casos que se dictaminen en el cuadro de números random,
hasta completar el tamaño de la muestra. El recorrido
puede ser hacia arriba ,abajo, horizontal, etc.
Muestreo aleatorio simple
Consiste en seleccionar una muestra de tamaño n de una población
que contiene un total de N elementos. Cada elemento tiene la
misma probabilidad de ser seleccionado (n/N).

Ventajas:
 Sencillo y de fácil comprensión..
 Cálculo rápido de medias y varianzas.

Desventajas:
 Requiere que se posea de antemano un listado completo de toda
la población (marco muestral).
 Cuando se trabaja con muestras pequeñas es posible que no
represente a la población adecuadamente.
PROCEDIMIENTO DE SELECCIÓN DE LA MUESTRA
(Muestreo estratificado)
Muestra estratificada: Estriba en cómo y de dónde
seleccionar el tamaño de la muestra. Lo que se hace es dividir
a la población en subpoblaciones o estratos, atendiendo a
criterios que pueden ser importantes en el estudio y se
selecciona una muestra por cada estrato. Los elementos
dentro del estrato deben ser homogéneos, así como entre
estratos. (La estratificación aumenta la precisión de la
muestra e implica el uso deliberado de diferentes tamaños de
muestra por cada estrato, a fin de reducir la varianza de cada
unidad de la media muestral).
Ej: Tractores Total de la población Muestra
John Deere 5000 345
Case 8900 765
Masey 2400 100
TOTAL 16300 1210
Muestreo estratificado
Una vez definido el tamaño de muestra total n, este debe ser
dividido entre los k estratos en tamaños n1,n2,…,nk. Esta
división se efectúa principalmente mediante dos técnicas:

 Asignación proporcional.
 Asignación óptima.

Cada muestra nh es seleccionada desde su respectiva


población de tamaño Nh siguiendo el procedimiento de un
muestreo aleatorio simple.
MÉTODOS PARA OBTENER EL TAMAÑO MUESTRA
Determinación de la muestra estratificada
mediante asignación proporcional:
En un número determinado de elementos muestrales (n = sumatoria de
la muestra de cada estrato), la varianza de la muestra puede reducirse al
mínimo, si el tamaño de la muestra para cada estrato es proporcional a
la desviación estándar dentro del estrato.
1. El tamaño de la muestra (n) se calcula como si fuera una muestra
probabilística simple.
2. La desviación estándar de cada elemento en un determinado estrato (ksh), se
calcula como: n
ksh  Donde: n, es el tamaño de la muestra total
N N, es el tamaño de la población
3. El total de la subpoblación se multiplicará por la fracción constante (ksh) para
obtener el tamaño de la muestra para el estrato.
Muestreo estratificado asignación
óptima
Consiste en asignar el tamaño de muestra a los estratos
de modo que:
 Se minimice la varianza del estimador, para un costo
especificado.
 Se minimice el costo del muestreo, para una varianza
del estimador especificado (la máxima varianza que se
pueda admitir).
 Con este método, los estratos que presentan más
variabilidad o menor costo recibirán un mayor tamaño
de muestra.
Bajo una función de costo lineal,
el tamaño de muestra para los
estratos estará dado por:
Muestreo estratificado
Ventajas
 Tiende a asegurar que la muestra represente
adecuadamente a la población en función de los
criterios de estratificación.
 Se obtienen estimaciones más precisas que con el
muestreo aleatorio simple.

 Desventajas
 Se ha de conocer la distribución en la población de las
variables utilizadas para la estratificación.
Ejemplo de muestreo estratificado
Suponga que 6500 estudiantes están divididos de
acuerdo con la procedencia de su lugar de origen, de la
siguiente manera:
 Región del Norte = 750
 Región del Centro = 2600
 Región del Sur = 3150
Una muestra de 50 estudiantes, seleccionados desde los
3 estratos con asignación proporcional daría los
siguientes tamaños:
Ejemplo de muestreo estratificado
Nh
Empleando la asignación proporcional nh  n *
N
 Región Norte = 50*750/6500 = 5.769 ~ 6
 Región Centro = 50*2600/6500 = 20.0
 Región Sur= 50*3150/6500 = 24.231 ~ 24

De tal manera, que la muestra se compone de las siguientes cantidades


provenientes de cada estrato y que son asignados de manera proporcional al
tamaño de cada estrato:

6+20+24 = 50 alumnos

 Dentro de cada estrato se generan los números aleatorios empleando el MAS


para obtener la muestra aleatoria que será estudiada.
PROCEDIMIENTO DE SELECCIÓN DE LA MUESTRA
(Muestreo por racimos o conglomerados)
Muestra por racimos o conglomerados: Considera
que las unidades de análisis se encuentran encapsuladas
o encerradas en determinados lugares físicos o
geográficos, a los que se denominan racimos. Muestrear
por racimos implica diferenciar entre la unidad de análisis
(indica quienes van a ser medidos) y la unidad muestral (se
refiere al racimo a través del cual se logra el acceso a la unidad de
análisis).

Ej: Unidad de análisis Posibles racimos


Tomate con riego Áreas con regadío
Nivel freático Zonas bajas con suelos pesados
Muestreo por conglomerado
 En algunos casos, el muestreo aleatorio simple puede
resultar muy costoso (por ejemplo si se desea muestrear
una gran ciudad, una muestra aleatoria simple de tamaño n
implicaría mandar a los encuestadores a n puntos
distintos), o inaplicable si no se cuenta con el marco
muestral.
 En esta situación es más económico realizar el denominado
muestreo por conglomerados.
 A diferencia de la formación de estratos, en este caso se
trata de que los elementos dentro de un conglomerado sean
heterogéneos, y los conglomerados homogéneos entre sí.
Muestreo por conglomerado
En un muestreo por conglomerados, se debe tener en
cuenta los siguientes factores para el cálculo de los
estimadores:

 El muestreo por conglomerados puede ser en varias etapas.


 El tamaño de los conglomerados: conglomerados de igual o
diferente tamaño.
 Dentro de un conglomerado se pueden tomar todas las
unidades o solo una muestra de ellas.
 El muestreo de conglomerados o sus subunidades (en
cualquiera de sus etapas) puede efectuarse por muestreo
aleatorio simple, muestreo sistemático o muestreo
estratificado.
Muestreo por conglomerado
Ventajas
 Es muy eficiente cuando la población es muy grande y
dispersa.
 No es preciso tener un listado de toda la población,
sólo de las unidades primarias de muestreo.

Desventaja
 La desviación estándar es mayor que en el muestreo
aleatorio simple y estratificado.
 El cálculo de la desviación estándar es complejo.
Ejemplo de muestreo por
conglomerados en tres etapas
 Si se desea obtener una muestra de 1000 agricultores
de los estados más productivos, el muestreo aleatorio
simple implicaría enviar a los encuestadores a 1000
lugares distintos de los estados.
 Un muestreo por conglomerados podría consistir en
seleccionar aleatoriamente 20 uniones de ejidos del
estado, luego seleccionar 25 ejidos de cada unión y por
último seleccionar 2 productores de cada ejido.
 De hecho el muestreo aleatorio simple cubrirá mejor
los estados más productivos que el muestreo por
conglomerados, pero a un costo mayor.
MÉTODOS PARA OBTENER EL TAMAÑO MUESTRA
Muestra probabilística por racimos o
conglomerados: El tamaño de la muestra se realiza
siguiendo el procedimiento para muestra probabilística
simple y el tamaño de muestra para cada racimo es
similar al procedimiento estratificado.
PROCEDIMIENTO DE SELECCIÓN DE LA MUESTRA
(Muestreo sistemático)
3. Selección sistemática de elementos
muestrales: Implica seleccionar dentro de una
población un número de elementos a partir de un
intervalo que se determina por el tamaño de la
población y el tamaño de la muestra.
Se calcula el tamaño de muestra según el procedimiento descrito para muestreo
probabilístico simple y posteriormente se calcula el intervalo (K) como:
N Donde: N, es tamaño de la población
K 
n n, es tamaño de la muestra

El intervalo obtenido indica: que para cada K valor se seleccionará un elemento


muestral hasta completar el tamaño de la muestra. El intervalo se comenzará a
aplicar en el elemento muestral determinado al azar y a partir de éste se irá
sumando el intervalo.
Selección sistemática
 Problema: El método anteriormente es sesgado si k no es
entero.
 Solución: Consiste en considerar la lista como si fuese
circular (el elemento N+1 coincide con el elemento 1).

 En este caso el procedimiento varia de la siguiente manera:


1. Definir el tamaño del salto sistemático, k, como el entero
más cercano a N/n.
2. Elegir un número aleatorio, r, entre 1 y N.
3. Seleccionar los elementos de la lista: r, r + k, r + 2 * k, …..,
r + (n - 1) * k, teniendo en cuenta que la lista es circular.
Selección sistemática
Aplicable cuando los elementos de una población están ordenados.

Ventajas
 Fácil de aplicar.
 Cuando la población está ordenada siguiendo una tendencia
conocida, asegura una cobertura de unidades de todos los tipos.

Desventajas
 Si la constante de muestreo está asociada con el fenómeno de
interés, las estimaciones obtenidas a partir de la muestra pueden
contener sesgo de selección.
Ejemplo de muestreo sistemático
 Población = 6500 alumnos que se encuentran inscritos
en la Universidad Autónoma Chapingo en el año 2006
registrados en un marco muestral.
 Tamaño de la muestra = 10 alumnos.
 Definir el tamaño del salto sistemático: k = 6500/10=
650
 Elegir un número aleatorio r, entre 1 y 6500. Utilizando
la TI se tiene: rand(650) =64 => r=64.
 Seleccionar los elementos de la lista: 64, 714, 1364,
2014, 2664, 3314, 3964, 4614, 5264, 5914.

También podría gustarte