Está en la página 1de 38

UNIVERSIDAD DEL ATLÁNTICO

ESPECIALIZACIÓN EN ESTADÍSTICA

MUESTRO SISTEMATICA LINEAL Y


CONGLOMERADO

Kennedy Hurtado Ibarra


MSc. En Estadística aplicada
Barranquilla- Colombia
Referencia: David Ospina Botero, Introducción al muestreo. Universidad
Nacional De Colombia.
MUESTREO SISTEMATICO LINEAL

En el Muestreo sistemático lineal los N elementos de la


población se enumeran de 1 a N en una secuencia ordenada,
la selección de la muestra de tamaño n; se realiza tomando
una unidad aleatoriamente dentro de los primeros k
elementos y las siguientes elementos a intervalos de tamaño
k: La selección de la primera unidad determina toda la
muestra. Como en general N no es múltiplo de k, las
diferentes muestras sistemáticas de la misma población
finita pueden resultar en diferentes tamaños, así por
ejemplo: Si N = 25; n = 7; y k = 4; existen 4 muestras
sistemáticas posibles dependiendo del punto de inicio de la
muestra.
El valor k se puede calcular con el cociente N/n: Si este
cociente no da un número entero se elige k como el
entero más próximo. Este hecho resulta despreciable si el
tamaño de la muestra es mayor de 50.

ESTIMACION DE LA MEDIA POBLACIONAL


Una vez han sido seleccionado los elementos de la
muestra, la media muestral en el muestreo sistemático
lineal, , se calcula de la manera tradicional.

=
Si N = nk, es un estimador insesgado de la media
poblacional,
La varianza de la media de una muestra sistemática es:
VAR( = ,
Donde =
= , la media de la r-ésima muestra sistemática.

El error estándar está dado por:


EE( =

=
 
Un estimador insesgado de la varianza puede definirse
de la forma tradicional.
var() = ,

Con error estándar estimado.

ee() =

La varianza de la media, que es menor que la varianza


muestral se define: var() = )
 
.
ESTIMACIÓN DEL TOTAL POBLACIONAL.
Una estimación del total poblacional está dado por:
=N
Esta estimación es insegada si N =nk.
La varianza y el error estándar de este estimador son:
VAR() =
EE()=NEE()

Unos estimadores insesgados de los anteriores parámetros


son:
Var()= y ee()= N (
 
INTERVALOS DE CONFIANZA.
Los intervalos de confianza, tanto para la media como el
total,se establecen en la forma tradicional.
Para Y.
[ - ee() ; - ee() ]

Para

[- EE() ; [- EE()]
  EJEMPLO:
Una de las variables de mayor interés en el estudio de los
pacientes de un centro de rehabilitación física es el tiempo
de permanencia medidos en días. Supongamos que en un
periodo de un mes se registro la salida de 2000 pacientes.
Se desea seleccionar con base al MSL, 1 de cada 20
pacientes con el fin de estimar el tiempo promedio de
permanencia de los pacientes en el centro. Los registros
están ordenados por fechas de salidas.
Solución:
 
SOLUCIÓN:
n = = 100
Se selecciona un número aleatorio entre 1 y 20. Suponemos
que el número aleatorio es el 10, lo que implica que se debe
seleccionar como punto de partida la observación 10 y, a
partir de ella, todas las demás aumentando sucesivamente
20 al orden de las observaciones 10, 30, 50……

La muestra seleccionada aparece en la tabla siguiente:


Pacientes 1 2 3 4 5 6 7 8 9 10
Días de permanencia 32 36 13 26 5 10 2 8 28 34
 
Pacientes 11 12 13 14 15 16 17 18 19 20
Días de permanencia 7 22 6 22 35 28 22 34 32 36
Pacientes 21 22 23 24 25 26 27 28 29 30
Días de permanencia 3 11 14 15 28 34 4 7 4 6
Pacientes 31 32 33 34 35 36 37 38 39 40
Días de permanencia 10 30 30 6 11 35 30 5 20 28
Pacientes 41 42 43 44 45 46 47 48 49 50
Días de permanencia 18 34 7 36 30 19 29 28 31 23
Pacientes 51 52 53 54 55 56 57 58 59 60
Días de permanencia 4 10 14 10 20 15 18 35 31 32
Pacientes 61 62 63 64 65 66 67 68 69 70
Días de permanencia 36 11 6 2 19 15 31 31 21 27
Pacientes 71 72 73 74 75 76 77 78 79 80
Días de permanencia 6 1 18 30 25 27 5 17 9 11
Pacientes 81 82 83 84 85 86 87 88 89 90
Días de permanencia 23 28 4 22 33 36 15 30 11 8
Pacientes 91 92 93 94 95 96 97 98 99 100
Días de permanencia 28 25 5 6 12 22 27 34 21 25
 

= = 19,74 días.

Un estimador insesgado de la varianza puede definirse de la


forma tradicional.
var() =

Con error estándar estimado.

ee() = = 1,0659
Los
  intervalos de confianza, tanto para la media como el total, se
establecen en la forma tradicional.

Para

[ - ee() ; + ee() ]

[19,74 – 1,984(1,0659) ; 19,74+1,984(1,0659) ]

[17,63 ; 21,85] días.


  ESTIMACION DE LA PROPORCION POBLACIONAL.

El procedimiento en la estimación de la proporción


poblacional es el mismo que el utilizado en el MAS, siempre
que se pueda asumir aleatoriedad en el ordenamiento de la
población.
, donde a es el número de elementos con atributos
deseado.
La varianza y el error estándar de estimadores pueden
obtenerse con:
VAR(= y, EE(=
 

Estimadores de estos parámetros son:

var(= y ee(=
TAMAÑO DE LA MUESTRA.
El principal inconveniente para determinar el tamaño de
muestra es el desconocimiento que se tenga acerca del patrón
de ordenamiento de la variable de estudio. Si el orden es
aleatorio, el problema se reduce a estimar un tamaño de la
muestra en el MAS.
El procedimiento consiste en seleccionar m muestras pilotos
sistemáticas , repetidas del marco muestral para obtener
estimaciones iniciales de los parámetros. Con base a esta
estimación, se determina el número m de muestras
definitivas, para estimar los parámetros con la precisión y
confiabilidad requerida.
Generalmente
  el tamaño de la muestra piloto así como su número debe
ser pequeño (entre 5 y 10 elementos o 6 muestras es suficiente).
El valor m se obtiene a través de la siguiente formula:

m=

Siendo la media de la i-ésima muestra piloto sistemática, la media de


estas medias y var(su correspondiente varianza, esto es:

=
S  e desea determinar un tamaño de muestra que permita
estimar la permanencia promedio por paciente con un error
relativo no mayor al 5% (ε = 0,05)una confiabilidad mínima
de 90%. ( Tabla de permanencia de pacientes)

Se toman 5 muestras pilotos m= 5 de tamaño n= 8.


El tamaño del intervalo aleatorio es k = 250.
Supongamos que las observaciones son::
Muestra 1: 10, 17, 33, 25, 4, 28, 10, y 10
Muestra 2: 6, 8, 5, 17, 30, 27, 25 y 7
Muestra 3: 34, 3, 29, 17, 19, 17, 14 y 13
Muestra 4: 10, 17, 10, 9, 15, 24, 23 y 13
Muestra 5: 13, 15, 29, 31, 29, 30, 34 y 1.
= 17,125
 
= 15,625
= 18,250
= 15,125
= 22,750

La media de las media = = 17,775


Var() = 9,26
m= , entonces m, = = 28,25 se aproxima 29 se debe
tomar 24 muestras sistemáticas adicionales.
MUESTREO POR CONGLOMERADO
Los métodos de muestreo descritos anteriormente, en
donde el proceso de selección se lleva a cabo para
unidades individuales, no siempre son los mas
convenientes debido a los altos costos económicos (dinero,
tiempo, recurso) que generalmente conlleva, a dificultades
en algunos casos de identificar con anterioridad las
unidades de estudio. Cuando ello ocurre es conveniente
recurrir a otras técnicas como el muestreo por
conglomerados.
Si selecciona el muestreo por conglomerado MCON, es
necesario considerar los siguientes factores:
 
 Los conglomerados deben estar bien definidos de manera
que todo elemento de la población pertenezca a uno y solo
un conglomerado.
 Debe existir una estimación razonable acerca del número
de elemento de cada conglomerado.
 Los conglomerados deben ser suficientemente pequeños
para que sea posible algún ahorro en los costos
 Los conglomerados deben escogerse de manera que se
minimice el incremento en el error de muestreo debido el
agrupamiento.
DEFINICION DE MUESTREO POR CONGLOMERADO MCON.
El muestreo por conglomerado en una etapa simple es un plan de muestro
  en el cual se seleccionan los conglomerados haciendo uso del MAS sin
reemplazo y, dentro de cada conglomerado seleccionado, se escogen todas
las unidades elementales que lo componen.
Se supone que la población consta de N conglomerados, de los cuales se
seleccionan n.
Cuando los conglomerados son de igual tamaños, la selección se lleva a cabo
haciendo uso del MAS sin reemplazo y aplicando todas las teorías referentes
a este diseño.
Cuando los conglomerados son de diferentes tamaños, existen varias
alternativas, de las cuales la más comunes son la selección de conglomerados
mediante el MAS sin reemplazo o la selección de ellos con probabilidad
proporcional al tamaño.
CONGLOMERADOS DE IGUAL TAMAÑOS
 La población está compuesta de N conglomerados, cada una
comprende M unidades elementales .
 
 El número total de unidades en la población, es por tanto,
 El proceso de muestreo consiste en seleccionar un MAS sin
reemplazo de tamaño n.
ESTIMACIÓN DE LA MEDIA Y EL TOTAL POBLACIONAL
Cuando se trabaja con conglomerados generalmente se necesita
estimar la media por conglomerado y por unidad elemental y el total
poblacional.
: Valor de la j- ésima unidad en el i-ésimo conglomerado.
i=1,2…..N, Total de la variable y para el i-ésimo conglomerado.
Y = = , Total poblacional.
= , Media poblacional por conglomerado.

 
= =, Media poblacional por unidad.

Los estimadores para la media poblacional por conglomerados


es:
= , media muestral por conglomerado.

= , Media muestral por unidad.

El estimador de es y no, como se podría pensar,


El total poblacional se estima con:

  = N==

La varianza de está dada por:


VAR() =

Donde. = , es la varianza entre los totales de los


conglomerados.

El error estándar se define entonces.


EE() =
Se puede estimar haciendo el uso del MAS sin reemplazo.
 
var() =

ee () =

La varianza y el error de son:


VAR()= = =

EE ()=
  Con estimadores dados por:

var()= =

ee(()=
  INTERVALOS DE CONFIANZA

Los intervalos de confianza, tanto para las medias (por


conglomerados o elementos) como para el total pueden
establecerse en forma tradicional. En este caso los grados de
libertad para la distribución t están dados por el número de
conglomerado seleccionados menos uno (y no por el número
de unidades muestreadas)
Ejercicio
Se
  desea estimar el contenido neto de liquido promedio en
40 canastas de gaseosas. Para ello se selecciona una muestra
aleatoria simple de seis canastas de y se rgistra el contenido
de todas las botellas de esta canastas. Las canastas
seleccionadas son: 10; 11; 28; 33; 38y 40.
CANASTA 10 993 985 955 965 989 1004
CANASTA 11 965 1007 973 1012 1018 1016
CANASTA 28 1017 970 977 1005 1015 985
CANASTA 33 1018 982 1005 953 995 982
CANASTA 38 955 1020 981 996 1011 997
CANASTA 40 971 951 984 1004 985 1014
  TAMAÑO DE LA MUESTRA

Cuando se hace selección de la muestra a través del MAS, se


pueden usar el mismo procedimiento tradicional para
determinar el tamaño de muestra mínimo que garantice una
precisión y confiabilidad dadas (garantizadas por las
cantidades Z y δ), para la estimación de la media poblacional
por unidad,
Recordando que la varianza del estimador esta expresada por:
var() =
El tamaño de muestra estará dado por:
n=

Ejemplo:
Supóngase que se seleccionaron seis cajas de gaseosas que
corresponden a una muestra aleatoria simple (piloto) de una
población de 2000 canastas. Se desea determinar el número
de canastas adicionales que se deben seleccionar para estimar
el contenido medio por botella con una confiabilidad del 90%
y un error máximo absoluto de 2cy varianza estimada
=1417,8668.
PROPORCIÓN Y TOTAL DE ELEMENTOS EN LA POBLACIÓN
CON ATRIBUTOS EPECIFICOS.
 

Cuando se seleccionan conglomerados y se desea estimar la


proporción, P, o el número total de elementos, A, en la
población con un atributo especifico , se pueden derivar
formulas, basadas en el caso general para la variable y
estudiada anteriormente.
El estimador de la proporción de elementos con atributos
específicos en el i-ésimo conglomerado.
, donde es el número d elementos en el i-ésimo
conglomerado que posee el atributo deseado.
El estimador de es =
 
Donde corresponde a la proporción de los conglomerados
seleccionados en la muestra.

La varianza y el error estándar de estos estimadores están


dados por:

VAR() =

EE () =
 
Los estimadores son:
var() =
ee () =

Para el número total de elementos, el estimador, su varianza y


su error son:
=N

VAR() = )

EE () =
 
Tiene como estimador:

var() = )

EE () =
 
MUESTREOS NO PROBABILISTICOS.
No permiten generalizar sus resultados a toda la población, no
obstante, son muy útiles para estudios exploratorios y en
general para estudios de corte cualitativo.

Existen diversos métodos en éste tipo de muestreo:


 Muestreo por cuota:
Se asemeja al muestreo estratificado en el sentido que busca
representatividad de diferentes categorías o estratos de la
población objeto de estudio, sin embargo, para la selección de
esas unidades no usa el azar:  Es uno de los más usados en la
práctica. 
 Muestreo a conveniencia o intencional
 
Su principal debilidad es el nombre, ya que, para muchas
personas el nombre da a entender que se está haciendo la
selección de las unidades de análisis amañando las
respuestas, situación que  no es cierta, toma su nombre,
debido a que se busca obtener una representatividad de la
población consultando o midiendo unidades de análisis que
pueden ser accesadas con relativa facilidad. Es otro de los
muestreos con mayor uso, dado esa particularidad.
 Muestreo a juicio:
 
En cuanto al "Muestreo a juicio", se busca seleccionar a
individuos que se juzga de antemano tienen un conocimiento
profundo del tema bajo estudio, por lo tanto, se considera que
la información aportada por esas personas es vital para la
toma de decisiones.

 Muestreos con fines especiales:


El cual pretende llegar a grupos muy específicos, tal es el caso,
de personas con preferencias y/o gustos similares, por
ejemplo, los que gustan de la música metálica, es facil
abordarlos en un concierto de ese tipo de musica, los
constructores se pueden abordar en un congreso para tal fin.
 

GRACIAS

También podría gustarte