Está en la página 1de 30

MUESTREO II

UNIDAD I:

MUESTREO SISTEMATICO Y MUESTREO POR CONGLOMERADOS EN 1 ETAPA

Clase 1:

A: MUESTREO SISTEMÁTICO ORDINARIO (MS)

I. INTRODUCCION

En muchas ocasiones el muestreo aleatorio simple requiere un trabajo muy


detallado en el proceso de selección de la muestra. Las unidades de
muestreo en un marco adecuado deben ser numeradas (o identificadas de
alguna manera) de modo que un mecanismo de aleatorización, tal como una
tabla de números aleatorios, pueden utilizarse para seleccionar las unidades
específicas para la muestra. Un diseño de encuesta por muestreo que es
ampliamente usado debido principalmente a que simplifica el proceso de
selección de la muestra se denomina "Muestreo Sistemático".
Para el muestreo sistemático se requiere que las unidades de muestreo
estén colocadas en espacios constantes o de manera ordenada o que sean
factibles de ordenarse.
Pueden usarse en muchas situaciones tales como en:
- Archivos de expedientes
- Viviendas de una ciudad
- Tarjetas o historias clínicas
- Clientes que llegan a un centro comercial
- Vehículos que llegan a cierta estación
- Producción en serie de una maquinaria
Una muestra sistemática es una forma de seleccionar "n" elementos de
una población de tamaño N, eligiendo aleatoriamente el primer elemento de
los k primeros elementos o espacios constantes, y después cada k
elementos.
N
En el Muestreo Sistemático k  n . No podemos obtener exactamente a k

cuando el tamaño de la población es desconocido. Podemos determinar un


tamaño de muestra n aproximado, pero debemos suponer el valor de k
necesario para obtener un tamaño de muestra n. Si se selecciona un valor de
k muy grande el tamaño de muestra requerido no se obtendrá usando una
muestra sistemática de 1 en k de la población. Este resultado no presenta
problema si el experimentador puede volver a la población y realiza otra
muestra sistemática de 1 en k hasta obtener el tamaño de muestra requerido.
Sin embargo, en algunas situaciones obtener una segunda muestra
sistemática es imposible; por ejemplo, tomar una muestra sistemática de 1
en 20 de compradores es imposible, si el tamaño requerido de n = 50
compradores no es obtenido en el tiempo que los compradores pasan por la
esquina.
Aunque la aplicación del muestreo sistemático es simple de aplicar,
especialmente en la captura de los elementos que van a conformar la
muestra, sin embargo, es necesario que el investigador pueda distinguir,
para usar este muestreo sistemático, los tipos de población.
Población aleatoria: Una población se considera aleatoria cuando se
percibe que los elementos están distribuidos al azar, sin tendencia alguna;
así, por ejemplo:
-Los recién nacidos en la evaluación del peso al nacer.
-Los naranjos en un campo homogéneo para evaluar el peso por frutos de
planta.
-El rendimiento académico de los estudiantes según apellido.

En este caso el coeficiente de correlación intramuestral ρ  0

Población ordenada: Una población se considera ordenada cuando la


variable respuesta reportan una tendencia creciente o decreciente en sus
elementos. así, por ejemplo:
-Número de fallas en una producción en serie cuando se sospecha que el
número de fallas se incrementa a medida que la máquina calienta.
- El rendimiento medio en un registro de notas por orden de méritos.
-El colesterol medio de las gallinas cuando están distribuidas por edad.
En este caso el coeficiente de correlación intramuestral ρ < 0
Población periódica: Una población se considera periódica o cíclica si los
elementos de la población reportan en sus respuestas incrementos o
decrementos por tramos; así, por ejemplo:
-Las ventas diarias en las tiendas
-Viviendas de una urbanización cuando el interés es evaluar el peso de los
residuos sólidos, sospechando que las viviendas de las esquinas tienen

mayor área.
En este caso el coeficiente de correlación intramuestral ρ > 0

Nota:

 Se recomienda usar la selección de una muestra sistemática cuando:


-La población es aleatoria (si los elementos están distribuidos al azar)
- La población es ordenada (si los elementos dentro de la población están
distribuidos en magnitud de acuerdo con algún esquema) .
 No se recomienda si la población es periódica (si los elementos de la
población tienen variación cíclica). Se puede prevenir esta situación tomando
un valor k diferente a la longitud del ciclo o aplicando un muestreo replicado.

II. SELECCIÓN DE UNA MUESTRA SISTEMÁTICA (ordinario)


De manera general para elegir el orden de los n elementos que
conforman la muestra se puede seguir el procedimiento que se da a
continuación:
 Identificar los elementos de la población:

Xi : X1 , X2 , X3 , . . .i , XN

 Elegir el orden primer elemento de la población que va a conformar la

muestra (arranque)

1  k0  k k = N/n menor entero

 Identificar el orden de la totalidad de los elementos de la población que

van a conformar la muestra:

k0 , k0 + k , k0 + 2k, . . . , k0 + (n-1)k → población

   

1º 2º 3º n → muestra

De donde los elementos o datos que conforman la muestra son:


x ,
k0 x k0 + K
, x k0 + 2 K
, . . . , x k0 + ( n - 1 ) K

Finalmente, las medidas estadísticas de interés pueden obtenerse a partir de


estos elementos.
Nota: La distribución de los N elementos de la población X ij puede
representarse en k grupos o k muestras sistemáticas (i:1, 2,..k) con
elementos j para cada i (j:1, 2, …n), con arranque k 0 para cada muestra y
cada una de ellas de tamaño n, con N=kn. En la práctica solo se capta a una
(1) sola muestra.
K0

1 2 3 … k
1 X11 X21 X31 … Xk1
2 X12 X22 X32 … Xk2
3 X13 X23 X33 … Xk3
… … … …
n X1n X21 X3n … Xkn
Xi. X1. X2. X3 . Xk. X..
Xi X1 . X2 . X3 . Xk . X ..

III. ESTIMACIÓN DE PARAMETROS

1. Estimación de la media poblacional

La media poblacional puede estimarse cuando la variable es cuantitativa, así

por ejemplo peso, talla, hemoglobina, proteínas, ingreso familiar.

N k ni

∑ Xi ∑ ∑ X ij
i =1 i=1 j =1
μ=
Parámetro : N N

i) Estimador puntual de la media poblacional

El estimador de la media poblacional es la media muestral sistemática de la i-

ésima muestra
n
∑ X ij
i =1
X SY= Xi =
n

ii) Varianza del estimador de la media poblacional

( )
− 2
σ
V X sy = ( 1+(n−1 ) ρ)
n
σ 2 : Varianza poblacional

n : Tamaño muestra

ρ : Coeficiente de correlación intramuestral poblacional

2
Nota: En la práctica esta varianza es un parámetro desconocido ya que σ

es desconocida y ρ es obtenido considerando todas las posibles muestras

sistemáticas de la población.

iii) Estimador de la varianza del estimador de la media poblacional

Cuando solamente se tiene una muestra para estimar la varianza del

estimador se puede usar como aproximación a la varianza del muestreo

aleatorio simple.

(X ) ( )
− 2
¿
S N - n
V sy =
n N-1

S 2 = Varianza muestral

iv) Intervalo confidencial para la media poblacional

 :
X sy ± t V √ ¿
(X )

sy

v) Tamaño de muestra

Puede usarse la fórmula del muestreo aleatorio simple.

2 2
Nt S
n=
( N-1) d 2 +t 2 S2

o también en dos pasos


2 2
t S
n0 = 2
1° d ,

reajustándose aproximadamente a

n0
n =
n0
1 +
2° N (mayor entero)

n0 : Tamaño preliminar de muestra

t : Valor de la distribución t asociado a un nivel de

confianza.

S2 : Varianza muestral de estudio piloto

d: Error de muestreo (%  ).Debe ser un valor adecuado

N : Tamaño de población

n : Tamaño de muestra (mayor entero)

2. Estimación del Total Poblacional

N k ni

∑ X i ∑ ∑ X ij
Parámetro : X = i=1 = i=1 j=1

X = N

i) Estimador puntual

El estimador base es la media muestral sistemática, conociendo el tamaño N

de la población.
¿
X sy = N X SY
ii) Varianza del estimador

( )

¿
V X sy
V( X sy ) = N2

iii) Estimador de la Varianza del estimador

V ( X sy ) = N2 V X sy
¿ ¿
( )
¿ −

iv) Intervalo confidencial para el Total poblacional

X :
X
N sy
± tN V √ ¿
(X )

sy Con un nivel de confianza (1-)%

v) Tamaño de muestra

3 2 2
N t S
n=
( N-1) d 2 + N 2 t 2 S2 o también en dos pasos
2 2 2
N t S
n0 =
1° d2 S2: Varianza piloto t = tn-1

n0
n =
n0
1 +
2° N

n0 : Tamaño preliminar de muestra

t : Valor asociado a un nivel de confianza.

S2 : Varianza muestral de estudio piloto

d : Error de muestreo (%  ).Debe ser un valor adecuado


N : Tamaño de población

n : Tamaño de muestra (mayor entero)

3. Estimación de la Proporción Poblacional

La proporción poblacional puede usarse cuando la variable es cuantitativa

o cualitativa, pero para efectos de la estimación de la proporción se configura

como una variable cualitativa dicotómica: Éxito y fracaso. El éxito se refiere

cuando el resultado es de interés para el investigador y el fracaso en caso

contrario. Se le asigna valor de x=1 para el éxito y x= 0 para el fracaso.

Ejemplos:

-Hemoglobina:

anémicos (Hb<11.0); No anémicos (Hb≥11.0).

Si el interés es estimar la proporción de anémicos, entonces

x=1 anémico y x= 0 no anémico

-Satisfacción laboral: si y no.

Si el interés es estimar la proporción de trabajadores en una empresa con

satisfacción. De donde x=1 con satisfacción; x=0 sin satisfacción.

Parámetro:

N k ni

∑ Xi ∑ ∑ X ij
i=1 i=1 j=1
P= =
N N

i) Estimador puntual
n
∑ X ij
i=1
pSY= Xi =
n

ii) Varianza del estimador

PQ
V ( psy ) = ( 1+(n−1 ) ρ)
n

iii) Estimador de la Varianza del estimador de la proporción

poblacional

Cuando solamente se tiene una muestra para estimar la varianza del

estimador se puede usar como aproximación a la varianza del muestreo

aleatorio simple.

pSY qSY N - n
( )
¿
V ( psy ) =
n N-1

pSY : proporción de éxito en la muestra

qSY = 1 - pSY

iv) Intervalo confidencial para P


¿
psy ± z V ( psy )
P=

v) Tamaño de muestra.

La fórmula a usarse es la misma que la del muestreo aleatorio simple.

2
N z PQ
n=
( N-1) d 2 + z 2 PQ o también en dos pasos
2
z PQ
n0 = 2
1° d

n0
n =
n0
1 +
2° N ,

donde :

n0 : Tamaño preliminar de muestra

PQ : Varianza para variable cualitativa; puede ser de estudio piloto

d : error de muestreo.- Generalmente se usa : 0,01  d  0,12

N : tamaño de población

n : tamaño de muestra (mayor entero)

PQ  pSY qSY Se puede asumir el criterio de varianza máxima(PQ=0.25)

4. Estimación del número total de elementos de interés en la población.

Debe usarse cuando el interés es estimar para la población el número total

de elementos que presentan la característica de interés que se puede

denotar como A. Al igual que para la proporción se les puede asignar a la

variable X ij =1 o X ij =0 Así por ejemplo:

- A=Total de personas anémicas en la población.

- A=Total de trabajadores con satisfacción laboral en la empresa

N k ni

Parámetro : A= ∑ X
i=1
i
=
∑ ∑ X ij
i=1 j =1 = NP
i) Estimador puntual

El estimador base es la proporción muestral sistemática, conociendo el

tamaño N de la población.

 SY = N pSY Puntual

ii) Varianza del estimador

V ( Â sy ) = N2 V ( psy )

iii) Estimador de la varianza del estimador

¿ ¿
2
V ( Â sy ) = N V ( psy )

iv) Intervalo confidencial para el número total de elementos de interés

en la población

√V
¿

A : N pSY ± ZN ( psy )
iv) Tamaño de muestra.

La fórmula a usarse es la misma que la del muestreo aleatorio simple

3 2
N z PQ
n=
( N-1) d 2 + N 2 z 2 PQ o también en dos pasos

N 2 Z 2 PQ
n0 =
1° d2 , d ≤ 0.10 Â sy
n0
n =
n0
1 +
2° N

n0 : Tamaño preliminar de muestra

PQ : Varianza para variable cualitativa; puede ser de estudio piloto

d : error de muestreo.- Generalmente se usa :

0,01 Â sy  d  0,12 Â sy

N : tamaño de población

n : tamaño de muestra (mayor entero)

PQ  pSY qSY Se puede usar el criterio de varianza máxima PQ=0.25 y d≤

0.10N psy

Ejemplo

1.Considere a la tabla adjunta como una población de N=500 medianas tiendas donde se
reporta la información de las ventas de unidades de yogurt “Mi preferido” durante el mes
pasado con el objetivo de evaluar posteriormente la evolución de ventas de dicho
producto. Se desea realizar la investigación mediante un muestreo sistemático. Se tiene el
croquis de distribución de las tiendas.
a) Obtenga una muestra de tamaño 50 y estime la media muestral y la varianza muestral
s2.
b) Con los datos de la parte a) estime en un intervalo de confianza al 95% el número
medio de unidades vendidas.
67 67 10 74 15 57 20 73 25 77 30 62 35 70 40 70 45 79
1 4 51 1 1 0 1 0 1 4 1 4 1 1 1 9 1 3 1 4
70 69 10 72 15 70 20 76 25 75 30 75 35 78 40 70 45 65
2 8 52 1 2 5 2 8 2 7 2 1 2 3 2 5 2 8 2 6
64 72 10 70 15 72 20 70 25 75 30 75 35 64 40 62 45 62
3 3 53 4 3 3 3 0 3 6 3 6 3 8 3 4 3 3 3 2
77 73 10 57 15 72 20 84 25 69 30 69 35 58 40 70 45 70
4 0 54 6 4 1 4 0 4 6 4 3 4 8 4 1 4 0 4 5
70 66 10 70 15 77 20 68 25 65 30 66 35 78 40 68 45 70
5 8 55 1 5 5 5 4 5 9 5 5 5 1 5 2 5 9 5 4
68 76 10 67 15 75 20 63 25 71 30 72 35 71 40 69 45 76
6 7 56 3 6 6 6 3 6 8 6 2 6 4 6 4 6 1 6 5
75 74 10 68 15 68 20 61 25 68 30 69 35 65 40 67 45 68
7 7 57 5 7 9 7 3 7 9 7 3 7 2 7 4 7 5 7 8
69 69 10 66 15 69 20 70 25 71 30 67 35 66 40 69 45 75
8 8 58 0 8 2 8 7 8 0 8 4 8 4 8 8 8 1 8 0
73 74 10 76 15 72 20 60 25 68 30 66 35 78 40 64 45 69
9 9 59 2 9 1 9 5 9 3 9 1 9 9 9 9 9 7 9 9
1 67 71 11 69 16 65 21 71 26 78 31 74 36 63 41 71 46 76
0 5 60 9 0 7 0 8 0 3 0 9 0 7 0 8 0 9 0 8
1 64 65 11 66 16 71 21 65 26 74 31 68 36 73 41 72 46 57
1 0 61 6 1 7 1 5 1 0 1 1 1 4 1 2 1 3 1 3
1 74 72 11 71 16 75 21 75 26 76 31 69 36 74 41 71 46 65
2 0 62 4 2 0 2 0 2 3 2 5 2 7 2 3 2 7 2 0
1 73 73 11 74 16 71 21 68 26 67 31 79 36 75 41 64 46 77
3 3 63 7 3 3 3 8 3 7 3 9 3 6 3 6 3 1 3 6
1 64 69 11 75 16 68 21 62 26 71 31 68 36 68 41 68 46 63
4 8 64 5 4 9 4 0 4 7 4 3 4 3 4 4 4 9 4 7
1 73 75 11 69 16 69 21 74 26 71 31 68 36 66 41 61 46 71
5 2 65 5 5 5 5 0 5 4 5 0 5 1 5 5 5 9 5 4
1 72 65 11 67 16 68 21 77 26 74 31 72 36 64 41 74 46 79
6 0 66 6 6 0 6 3 6 7 6 9 6 3 6 8 6 9 6 1
1 61 71 11 72 16 71 21 69 26 70 31 73 36 68 41 76 46 71
7 1 67 1 7 7 7 5 7 3 7 4 7 0 7 8 7 9 7 3
1 62 72 11 72 16 77 21 73 26 72 31 65 36 64 41 73 46 72
8 5 68 3 8 4 8 2 8 5 8 7 8 3 8 7 8 9 8 3
1 71 68 11 70 16 66 21 75 26 72 31 72 36 69 41 68 46 70
9 9 69 3 9 7 9 6 9 0 9 3 9 9 9 5 9 3 9 4
2 66 83 12 76 17 71 22 64 27 72 32 75 37 71 42 82 47 69
0 5 70 4 0 3 0 5 0 4 0 0 0 0 0 4 0 8 0 4
2 69 70 12 64 17 69 22 65 27 59 32 71 37 62 42 72 47 66
1 8 71 3 1 5 1 2 1 7 1 8 1 8 1 6 1 9 1 9
2 68 61 12 72 17 72 22 65 27 75 32 68 37 68 42 80 47 73
2 7 72 0 2 1 2 9 2 5 2 1 2 9 2 8 2 3 2 8
2 75 79 12 70 17 68 22 68 27 72 32 64 37 74 42 74 47 62
3 4 73 9 3 1 3 9 3 6 3 5 3 3 3 3 3 5 3 2
2 63 68 12 63 17 68 22 65 27 72 32 67 37 79 42 71 47 64
4 4 74 9 4 7 4 4 4 3 4 7 4 1 4 3 4 0 4 8
2 80 75 12 72 17 80 22 75 27 79 32 73 37 85 42 69 47 73
5 3 75 5 5 1 5 2 5 1 5 8 5 0 5 3 5 3 5 0
2 67 80 12 61 17 72 22 66 27 67 32 66 37 64 42 70 47 78
6 6 76 5 6 4 6 9 6 8 6 7 6 4 6 4 6 7 6 2
2 61 69 12 61 17 71 22 72 27 62 32 63 37 75 42 64 47 69
7 6 77 2 7 3 7 2 7 2 7 2 7 1 7 6 7 7 7 7
2 76 74 12 78 17 64 22 64 27 77 32 73 37 70 42 69 47 60
8 4 78 6 8 7 8 6 8 6 8 7 8 5 8 3 8 0 8 0
2 68 79 12 63 17 69 22 62 27 70 32 58 37 68 42 62 47 73
9 0 79 4 9 6 9 5 9 7 9 4 9 2 9 3 9 9 9 1
3 67 64 13 66 18 68 23 66 28 71 33 69 38 64 43 69 48 62
0 8 80 1 0 2 0 5 0 5 0 7 0 8 0 3 0 6 0 2
3 73 68 13 74 18 76 23 62 28 73 33 73 38 69 43 76 48 74
1 1 81 0 1 0 1 7 1 9 1 4 1 7 1 4 1 3 1 9
3 71 69 13 65 18 69 23 75 28 73 33 65 38 77 43 63 48 69
2 0 82 3 2 4 2 6 2 0 2 5 2 7 2 3 2 9 2 1
3 74 66 13 69 18 64 23 64 28 67 33 66 38 76 43 71 48 67
3 6 83 8 3 6 3 6 3 5 3 4 3 5 3 9 3 6 3 0
3 75 67 13 74 18 65 23 66 28 68 33 66 38 73 43 72 48 66
4 6 84 8 4 7 4 6 4 2 4 7 4 6 4 6 4 1 4 7
3 72 69 13 76 18 75 23 74 28 61 33 64 38 61 43 80 48 73
5 0 85 1 5 4 5 6 5 2 5 5 5 3 5 1 5 5 5 1
3 73 71 13 75 18 63 23 68 28 61 33 68 38 83 43 66 48 67
6 6 86 5 6 0 6 0 6 1 6 7 6 3 6 5 6 3 6 5
3 68 69 13 75 18 70 23 63 28 73 33 63 38 60 43 69 48 71
7 2 87 6 7 0 7 9 7 5 7 6 7 0 7 3 7 8 7 5
3 64 71 13 71 18 65 23 61 28 72 33 73 38 63 43 75 48 80
8 0 88 1 8 4 8 9 8 0 8 3 8 3 8 3 8 3 8 5
3 62 73 13 69 18 83 23 66 28 69 33 67 38 76 43 64 48 64
9 4 89 7 9 8 9 2 9 8 9 6 9 7 9 0 9 8 9 3
4 68 66 14 67 19 70 24 64 29 76 34 68 39 67 44 80 49 65
0 9 90 4 0 1 0 7 0 4 0 6 0 6 0 8 0 5 0 8
4 60 72 14 65 19 68 24 84 29 75 34 75 39 66 44 62 49 71
1 8 91 7 1 7 1 8 1 7 1 9 1 0 1 1 1 5 1 8
4 73 66 14 60 19 76 24 65 29 73 34 75 39 68 44 65 49 72
2 8 92 5 2 0 2 7 2 8 2 4 2 1 2 8 2 0 2 3
4 74 72 14 68 19 75 24 71 29 67 34 71 39 61 44 71 49 65
3 3 93 5 3 9 3 0 3 6 3 3 3 6 3 0 3 8 3 0
4 68 52 14 67 19 73 24 63 29 75 34 81 39 62 44 77 49 67
4 4 94 3 4 3 4 5 4 7 4 0 4 8 4 8 4 4 4 1
4 70 70 14 63 19 64 24 67 29 76 34 70 39 69 44 71 49 71
5 5 95 7 5 7 5 1 5 1 5 9 5 5 5 6 5 1 5 7
4 60 61 14 67 19 69 24 67 29 78 34 65 39 70 44 75 49 78
6 5 96 8 6 6 6 6 6 6 6 8 6 8 6 8 6 6 6 2
4 73 66 14 74 19 70 24 72 29 72 34 63 39 70 44 73 49 69
7 5 97 6 7 9 7 9 7 8 7 2 7 0 7 6 7 4 7 6
4 67 61 14 74 19 69 24 73 29 71 34 65 39 64 44 73 49 67
8 3 98 4 8 2 8 4 8 1 8 8 8 2 8 1 8 4 8 5
4 66 63 14 70 19 74 24 68 29 71 34 69 39 65 44 68 49 64
9 5 99 3 9 7 9 0 9 2 9 5 9 9 9 6 9 6 9 3
5 66 10 73 15 79 20 77 25 69 30 59 35 68 40 74 45 78 50 81
0 8 0 9 0 3 0 9 0 7 0 9 0 1 0 9 0 4 0 0
B. MUESTREO SISTEMATICO REPLICADO (MSR)

El muestreo sistemático replicado requiere de réplica es decir de la selección

de más de una muestra sistemática denominadas submuestras sistemáticas.

Para seleccionar ns submuestras sistemáticas de tamaño n, se deben

separar más los elementos de cada muestra con un salto de tamaño k '

K ' = k*ns donde

N
k=
n y

ns es el número de submuestras sistemáticas

sugiriéndose 5 ≤ ns ≤ 10

El procedimiento tiene una ligera variante ya que se van a elegir

aleatoriamente ns arranques, cada uno de los arranques entre

1  k0  k' sin reemplazo.

Un procedimiento puede ser.

i) Enumerar el orden de los elementos de la población

Xi: 1, 2, 3 , .., N

ii) Determinar el tamaño de muestra n y el número de submuestras n s

(5 ≤ ns≤ 10)
iii) Calcular el valor del salto sistemático para cada submuestra

k' ≤ k*ns (menor entero) donde k=N/n

iv) Se elige de manera aleatoria sin reemplazo para cada submuestra

sistemática el orden del arranque correspondiente k o , donde 1≤ ko≤ k' (ns

arranques)

v) Se identifican los elementos correspondientes de cada submuestra i. Se

deben realizar, de ser el caso, reajustes para que ∑ni = n i:1, 2, …, ns

vi) A partir de cada submuestra sistemática se pueden obtener los


indicadores básicos como las medias y proporciones muestrales.

Ejemplo.

Suponga que una población tiene 300 viviendas distribuidas aleatoriamente

en manzanas, y se desea tomar una muestra de tamaño n=30, con cinco

submuestras sistemáticas ns=5, siendo el interés estimar el consumo medio

mensual de azúcar

N=300, n=30 y fijando n s=5 submuestras sistemáticas, para estimar la media

poblacional (variable cuantitativa):

K =300/30= 10 tamaño de salto para un muestreo sistemático ordinario

300
k' = 30 * ( 5) = 50 tamaño de salto de cada submuestra para un muestreo

sistemático replicado.
1  k0  50. Eligiendo cinco arranques de manera aleatoria, es decir elegir
el primer elemento de cada submuestra sistemática entre 1 y 50 y luego cada
k' =50 elementos.
En cada submuestra sistemática obtener la media muestral.

Elemento de cada submuestra sistemática



Sub- 1º 2º 3º 4º 5º 6º Xi
muestr
a

1 X30 X80 X130 X180 X230 X280 X1


2 X24 X74 … … X2


3 X05 X3


4 X18 X4


5=ns X45 … X295 X5

1. Estimación de la media poblacional

N k ni

∑ Xi ∑ ∑ X ij
i =1 i=1 j=1
μ= =
Parámetro : N N

i) Estimador puntual
ns
− −¿

X syR =
∑ Xi −
Xi : Media muestral de la submuestra sistemática i
i=1
¿
ns

ii) Varianza del estimador


2
σ

( 1+( n−1 ) ρ)
V( X syR )= n
iii) Varianza estimada del estimador

SX
¿ −
V ( X syR ) = ns
i2
( N-1
N - n
) SX

i2 = S2( X 1 , X 2 , … X ns )

iv) Intervalo confidencial

 : X syR ± tn-ns
V √ ¿
(X )

syR

2. Estimación del total poblacional

N k ni

∑ X i ∑ ∑ X ij
Parámetro: X = i=1 = i=1 j=1

i) Estimador puntual

El estimador base es la media muestral sistemática replicada, debiéndose

conocer el tamaño de la población N.


n −

¿ ∑ Xi
− i=1
X syR

=N X syR = N ns Xi : Media muestral de la submuestra sistemática i

ii) Varianza del estimador


2
¿ σ
( 1+( n−1 ) ρ)

V( X syR ) =N2 V( X syR ) = N2 n

iii) Varianza estimada del estimador



S Xi N - n
( )
¿ ¿
X syR
2

V ( X syR ) = N V(
2
)=N
2
n s N-1

iv) Intervalo confidencial


√V ( X )
¿ ¿
¿

X: X syR ± tn-ns syR

3. Estimación de la proporción poblacional

N k ni

∑ X i ∑ ∑ X ij
i=1 i=1 j =1
P= Xi = 1 Xi = 0
Parámetro : N N o

i) Estimador puntual
ns

psyR = ∑ pi pi : Proporción muestral de la submuestra sistemática i


i=1
ns

ii) Varianza del estimador

PQ
V ( psyR ) = ( 1+(n−1 ) ρ)
n

PQ: Varianza poblacional

ρ : Coeficiente de correlación intramuestral poblacional.

iii) Estimador de la varianza del estimador


Spi N - n
( )
2
¿
V Sp i
( psyR ) = n s N-1 = S2( p1 , p2 , … pns )
2

iv) Intervalo confidencial para la proporcional poblacional


¿
V ( P syR )
P: PsyR ± Z

4. Estimación del número total de elementos de interés en la población

N k ni

Parámetro : A= ∑ X i=1
i
=
∑ ∑ X ij
i =1 j=1 = NP Xi = 1 o Xi = 0

i) Estimador puntual

El estimador base es la proporción muestral sistemática, conociendo el

tamaño N de la población.

 SYR = N pSYR

ii)Varianza del estimador

V ( Â syR ) = N2 V ( psyR )

iii) Estimador de la varianza del estimador

¿ ¿
V ( Â syR ) = N2 V ( p syR )

iv) Intervalo confidencial para el número total de elementos de interés

en la población

¿
V ( p syR )
A : N pSYR ± ZN

Ejemplo
En un huerto de paltos Hass con N=1450 plantas, se desea evaluar la
presencia de una bacteria en los paltos, usando un muestreo sistemático;
Dado el declive del terreno se puede sospechar de una distribución de las
plantas con variación cíclica, por lo que se usa un muestreo sistemático
replicado con cinco submuestras para una muestra global de tamaño n=204.
N=1450 n=204 n s=5
N 1450
k ,= ∗ns = ∗5 = 35.5 = 35
n 204

1≤ k0≤ 35 para cada submuestra i


Es decir se debe empezar la toma de datos a partir de los arranques elegidos
aleatoriamente, sin reemplazo, entre 1 y 35 para cada submuestra;
suponiendo:

Sub- m. 1° 2° … ni ni(aj) Xij ∑ Xij pi


1 X30 X65 … 41 40 1 0 1 ... 16 0.400

2 X20 X55 … 41 41 0 1 0… 14 0.341

3 X18 41 41 0 0 0 ... 16 0.390

4 X6 42 41 10 0.244

5=ns X24 41 41 15 0.366

206 204 1.741


n
∑ pi 1 . 741
i=1
psyR = ns = 5 = 0.348

( )
Spi N - n 2

( )
0. 06256 1 450 - 204
2
¿
V ( psyR ) n s N-1 = 5 1449 = (0.026)2
Sp i 2
=S2(0.400, 0.341, …) = (0.06256)2

La proporción estimada de paltos con la bacteria en un intervalo al 95% de


confianza:

P: 0.348 ± 1.96 √ (0.06256) 2


P: 0.348 ± 0.051

Prob (0.297< P < 0.399) = 0.95 d = 0.051

La estimación del número total de paltos con la bacteria en un intervalo al


95% de confianza:

A : 1450*0348 ± 1.96*1450 √ (0.026) 2

A : 505 ± 74  A : 431 ; 579 d = 74 d%= 14.6%

Prob (431< A < 579) = 0.95

OBTENCIÓN DEL COEFICIENTE DE CORRELACIÓN INTRAMUESTRAL


El coeficiente de correlación intramuestral es un parámetro que requiere distribuir a los N
elementos de la población en todas las posibles muestras sistemáticas (k) de tamaño n.
La distribución de los N elementos de la población X ij puede representarse en k grupos o k
muestras sistemáticas (i:1, 2,..k) con n elementos para cada i (j:1, 2, …n), con arranque
k0 para cada muestra. N=kn.
En la práctica solo se capta a una (1) sola muestra.

Muestra i (según K0)

Element 1 2 3 … k
oj
1 X11 X21 X31 … Xk1
2 X12 X22 X32 … Xk2
3 X13 X23 X33 … Xk3
… … … …
n X1n X21 X3n … Xkn
Xi. X1. X2. X3. Xk. X..
Xi X1 . X2 . X3. Xk . X ..

Xij : Dato

i: muestra o grupo

j: elemento de la muestra i

Xi.: suma de los datos de grupo i

X..: suma total de los N datos.

A partir de esta tabla se puede obtener el coeficiente de correlación intramuestral ro (ρ)

que permitirá identificar al tipo de población.

n(k −1)B−Wxx 1
− ≤
ρ= (n-1 )Wxx n-1 ρ ≤ 1.0

B, Wxx  son obtenidos a partir de la tabla de análisis de varianza.

1
− ≤
n-1 ρ ≤ 1.0

Pob. Aleatoria : ρ  0 Pob. Ordenada : ρ < 0 Pob. cíclica : ρ > 0

Tabla de análisis de varianza: ANAVA, ANOVA, ANVA

Fuente de Grados de libertad Suma de Cuadrado


variación (gl) cuadrados (SC) medio

(FV) (CM=sc/gl)

Entre grupos k-1 Bxx B

Error N-k Exx E

experimental

total N-1 Wxx

k
2
∑ X i. k n 2
∑ ∑ ij . − X ..
2
i=1 X2 . . X

Bxx = n N Wxx = i=1 j=1 N Exx= Wxx - Bxx

N= nk

n: Tamaño de cada grupo de estudio

Ejemplo

Sea una población de tamaño N=40 , n=10  el salto de tamaño k=4

Xi: 24, 26, 29, 32, 28, 40, 33, 26, 29, 35, 38, 28, 24, 36, 35, 38, 30, 28, 23, 29,36, 24, 33,

29, 37, 27, 26, 30, 26, 29, 27, 34, 36, 39, 30, 27, 24, 28, 23, 32.

A partir de esta población

=30.2 σ 2
= 22.76

Esta población puede distribuirse en todas las k muestras posibles sistemáticas de

tamaño n.
Muestra ko

j i 1 2 3 4

1 24 26 29 32
2 28 40 33 26
3 29 35 38 28
4 24 36 35 38
5 30 28 23 29
6 36 24 33 29
7 37 27 26 30
8 26 29 27 34
9 36 39 30 27
10 24 28 23 32
Xi. 294 312 297 305 1208
Xi 29.4 31.2 29.7 30.5 30.2
¿ 1176 1248 1188 1220
Xi = X
N i

( ) ∑ ( X i −X )2

V X sy i=1
k
= = 0.495 V (29.4, 31.2, 29.7, 30.5)
X i = X sys

Para obtener el coeficiente de correlación intramuestral ρ construimos el análisis de

varianza con datos de la población.

ANOVA.

Fuente de Grados de libertad Suma de Cuadrado


variación (gl) cuadrados (SC) medio
(CM=sc/gl)

Entre grupos 3 19.8 B=6.6

Error 36 890.6 24.738


experimental

total 39 910.4

k
2
∑ X i. 2 2 2
294 +312 +297 +305 1208
2 2
i=1 X2 . . −

Bxx = n N = 10 40 = 19.8

2
1208

Wxx = 242+282+292+ … + 322 40 = 910.4

n(k −1)B−Wxx 10(4−1 )(6 .6 )−910. 4


=−0 .086946=−0 .087
ρ= (n-1 )Wxx = (10-1)910. 4

ρ < 0 la población tiende a ser ordenada, sin embargo como está cerca al cero

puede configurar una población aleatoria.

Nota
1

Si ρ  n-1 = - 0.111  la población tiende a ser ordenada creciente o decreciente

ya que se acerca al valor mínimo ( al revisar los promedios parece ser creciente)

1

valor mínimo para n=10  n-1 = - 0.111

También podría gustarte