Está en la página 1de 11

Muestreo aleatorio simple

Caso 1: para cuando no se conoce el tamaño de la población

z 2 pq
n= 2
E

S e va a estudiar la preferencia e un nuevo partido politico en una poblacion sobre la cual


no se ha hecho ningun estudio anterior , se acepto un margen de error maximo de 2%.
Determine el tamaño de la muestra con un nivel de confianza del 90%

0.45

90%
5% 5%

0.5

p = 0.90/2 = 0.45

p ( z< z2 ) =0.5+ p(0< z< z 2 )

p ( z< z2 ) =0.5+0.45

p ( z< z2 ) =0.95

Z=1.65

Error = 2%= 0.02

q=1− p=1−0.45=0.55

z 2 pq 1.652 ×0.45 × 0.55


n= =
E2 0.022
n=1684.54

Caso 2: para cuando se conoce el tamaño de la población

z 2 pqN
n=
N E2 + z 2 pq

Se desean saber las proporciones de artículos defectuosos en una población de 25000. Para
un estudio con un nivel de confianza del 95% y un error de 0.2, suponiendo que en un
estudio anterior produjo 18 artículos defectuosos de cada 100 ¿de qué tamaño debe ser la
muestra?,

Donde:

E = 0.2

P ( z<z1) = 0.025

Z = 1.96 (nivel de confianza del 95%)

P = 100-18= 82 unidades no
defectuosas de cada 100 = 0.82

q = 1- p = 1-0.82 = 0.18

N= 25000

2
z pqN
n=
N E2 + z 2 pq

1.96 2 × 0.82× 0.18× 25000


n=
25000 × 0.22+1.96 2 × 0.82× 0.18

n=14.1674
Por lo tanto la muestra para realizar un estudio del nivel de confianza de 95% y margen de
error de 20 % en una población de 25000 artículos, debe componerse de 14 artículos.

Muestreo aleatorio sistemático

Caso 1: Aplicar un muestreo sistemático para poder seleccionar una muestra de 11 personas
desparecidas. Elabore un listado con el número de puntos seleccionados y su valor
respectivo para la variable lugar de procedencia, utilice como columna de arranque la c6.

Además con la muestra seleccionada estimemos la proporción de desaparecidos en el


departamento de Ayacucho.

Total de la base de datos: 150 desaparecidos

TABLA N°1:

C1 C2 C3 C4 C5 C6 C7
4 8 2 4 6 6 3
9 3 9 4 1 4 4
9 2 3 3 3 8 1
1 6 0 8 3 9 6
1 6 6 1 6 4 2
1 9 0 5 5 0 8
6 1 2 9 5 0 4

Solución:

 determinamos el valor de K

N ( poblacion)
K=
n(muestra)

150
K= =13.64
11

K=13

 valor de arranque

1≤ A≤ K
1 ≤ A ≤ 13

 Se le adiciona tantas columnas como dígitos tenga el valor de K

C6, C7 = 0.8 (primer valor de arranque estará entre 1 y trece)


8, 21, 34, 47, 60, 73
(AYACUCHO)
Valores de Lugar de
arranque procedencia 86, 99, 112, 125 ( H)
8 A
21 A
34 A 138 (SH)
47 A
60 A
73 A
86 H
99 H 8+13= 21 +13= 34……
112 H
125 H
138 SH

6
Ayacucho = = 0.545
11

Caso 2: La tabla anexa muestra el número de nacimientos y la tasa de natalidad por cada
1000 individuos para Estados Unidos durante seis años seleccionados sistemáticamente.

AÑO NAC. NAC. TOTAL DE NATALIDAD


MASCULINOS FEMENINOS NACIMIENTOS
1955 2073,719 1973,576 4147,295 26,0
1960 2179,708 2078,142 4257,850 23,7
1965 1927,054 1833,304 3760,358 19,4
1970 1915,378 1816,008 3731,386 18,4
1975 1613,135 1531,063 3144,198 14,6
1980 1852,616 1759,642 3612,258 15,9
Estime el número medio de varones nacidos por año para el periodo 1995-1980, y
establezca un límite para el error de estimación.

Solución:

n
1 1
^μ= y´sy = ∑ y i= 11,561.610=1,926.935.
n i=l 6
2
^ ( y sy )= s N −n
V (n N )
↓ N =26 a ñ os

↓ S 2=37,913,412,871.20
^ ( ý sy )=4,860,693,957.85
V

B=139,437.35

Muestreo aleatorio por conglomerado:

Una industria está considerando la revisión de su política de jubilación y quiere estimar la


proporción de empleados que apoyan la nueva política. La industria consta de 57 plantas.
Se selecciona una muestra aleatoria simple de 5 plantas y se obtienen las opiniones de los
empleados en estas plantas a través de un cuestionario. Los resultados se presentan en esta
tabla:
PLANTA N° EMPLEADOS N° EMPLEADOS QUE APOYAN LA NUEVA
POLITICA

1 51 42

2 62 53

3 49 40

4 73 45

5 101 63

A. estime la proporción de empleados en la industria que apoyan la nueva política de


jubilación y establezca un límite para el error de estimación.
B. la industria modifico su política de jubilación después de obtener los resultados de
la encuesta. ahora se quiere estimar la proporción de empleados a favor de la
política modificada. Ahora se quiere estimar la proporción de empleados a favor de
la política modificada ¿Cuántas plantas deben ser muestreadas para tener un límite
del 5% para el error de estimación? Use los datos anteriores para aproximar los
resultados de la nueva encuesta.
Solución:

A) N=57 N=5

m1 y1 m 21 y 21 m1 y 1
51 42 2601 1764 2142
62 53 3844 2809 3286
49 40 2401 1600 1960
73 45 5329 2025 3285
101 63 10201 3969 6363

336 243 24376 12167 17036

∑ yi 243
^p= i=1
n
= =0.7232⇒ ^p =72,32 %
336
∑ mi
i=1

n n n n
1 1
2
S=
c ∑
n−1 i=1
2
( [ y 1−^p mi ] )=
n−1 (∑
i=1
2
y i−2 ^p ∑
i=1
y i mi + ^
i=1
)
p2 ∑ mi2 =68,7

336 2
M 2 ≈ m 2= ( )
5
=4515,84

2
1 N −n S c
V ( ^p )= 2
^ =0,00278
M N n

√ V^ ( ^p )=0,1054 ⇒ 10.54 %
B2 M 2 0.052 × 4515,84
B) D= = =2,8224
4 4

Muestreo aleatorio estratificado:

Una población de 6000 personas se ha dividido en tres estados uno con 1000 personas, otro
con 3500 y otro con 1500. En esa población se ha realizado un muestreo estratificado con
afijación proporcional, en el que se ha elegido al azar 15 personas del tercer estrato.
Determine el tamaño total de la muestra obtenida con ese muestreo y su composición.

b) dada la población {1, 4, 7}construya las muestras posibles de tamaño 2 que pueden
formare mediante muestras aleatorio simples y hallle la varianza de las medias muestrales
de todas esas muestras.

SOLUCION:

a. Total = 6000

 1000 n1= 10
 3500 n2= 35
 1500 n3= 15

n3 1500
=
N 6000

15 1500
=
N 6000

N=60

b. {1,4,7}
n =2
σ2

1,1 (1) 1,4 (2,5) 1,7 (4)


4,1 (2,5) 4,4 (4) 4,7 (5.5)
7,1 (4) 7,4 (5.5) 7,7 (7)
1+2.5+4 +2.5+ 4+5.5+ 4+5.5+7
x́= =4
9

2 12 +2.52 + 42 +2.52 +4 2 +5.52 +4 2+ 5.52+ 72 2


σ = −4 =3
9

{1,4,7}

N (u , σ )= N ( 4 , √ 3)

σ
N (u , )
√n

1+ 4+7
u= =4
3

2 12 + 42 +72 2
σ = −4 =6
3
σ
N (u , )
√n
6
N (4, √ )
√2

Muestreo por etapas o muestreo polietápico

El coste del muestreo se incrementa mucho por la dispersión geográfica de las unidades,
siendo más deseable obtener la muestra de un modo menos disperso. Cuando ocurre esto, se
recomienda el uso del muestreo polietápico, que se caracteriza por obtener la muestra en
sucesivas etapas. Para un ejemplo de esta técnica de muestreo, veamos la 4 siguiente ficha
técnica de la "Encuesta sobre la opinión respecto a la intervención militar contra Irak"
(publicada por EL PAÍS 2-2-2003):

Ámbito geográfico: España

Recogida de información: mediante entrevista telefónica.

Universo de análisis: población mayor de 18 años residente en hogares con teléfono.

Tamaño de la muestra: 1000 entrevistas proporcionales.

Error muestral: el margen de error para el total de la muestra es de ±2,78% para un


margen de confianza del 95% y bajo el supuesto de máxima indeterminación (p=q=50%).
Procedimiento de muestreo: selección polietápica del entrevistado:

-Unidades primarias de muestreo (MUNICIPIOS) seleccionadas de forma aleatoria


proporcional para cada provincia.

-Unidades secundarias (HOGARES) mediante la selección aleatoria de números de


teléfono.

-Unidades últimas (INDIVIDUOS) según cuotas cruzadas de sexo, edad y recuerdo de voto
de las elecciones generales de 2000.

Estimador: En estadística, un estimador es un estadístico (esto es, una función de la


muestra) usado para estimar un parámetro desconocido de la población. Por ejemplo, si se
desea conocer el precio medio de un artículo (el parámetro desconocido) se recogerán
observaciones del precio de dicho artículo en diversos establecimientos (la muestra) y
la media aritmética de las observaciones puede utilizarse como estimador del precio medio.

Para cada parámetro pueden existir varios estimadores diferentes. En general, escogeremos
el estimador que posea mejores propiedades que los restantes,
como insesgadez, eficiencia, convergencia y robustez (consistencia).

Estadístico muestral: En estadística un estadístico (muestral) es una medida cuantitativa,


derivada de un conjunto de datos de una muestra, con el objetivo de estimar o inferir
características de una población o modelo estadístico.

Más formalmente un estadístico es una función medible T que, dada una muestra estadística
de valores  , les asigna un número,  , que sirve para
estimar determinado parámetro de la distribución de la que procede la muestra..

Teorema del límite central:

Imagina que tienes una población con media µ y desviación típica s. y que extraes
aleatoriamente todas las posibles muestras, todas ellas de tamaño n. Si obtuvieras las
medias de todas estas muestras, y las consideras una distribución de datos (la distribución
muestral de medias), comprobarías que:

a) La media de los datos, es la media µ de la población , es decir la media de las medias de


las muestras, es igual que la media de la población.

b) Estas medias se distribuyen alrededor de la media de la población, con una desviación


típica (llamada desviación típica de la media) igual a la de la población dividida por la raíz
de n, es decir, la d.t. de la media es:
c) La distribución de las medias muestrales, es una distribución  de tipo "normal", siempre que la
población de procedencia lo sea, o incluso si no lo es, siempre que el tamaño de las muestras sea
30 o mayor.

En consecuencia, "si una población tiene media m  y d.t. s , y tomamos muestras de tamaño n  ( de

tamaño al menos 30,  o cualquier tamaño, si la población es "normal"), las medias de estas
muestras siguen aproximadamente la distribución:

Hemos nombrado un concepto importante: la d.t. de la media , que es el grado de variabilidad


de las medias muestrales.

Cuanto menor sea, más ajustadas a la media de la población serán las medias que obtengamos de
una muestra. De su propia definición, es fácil darse cuenta de que cuanto mayor es el tamaño de
la muestra, menor es este grado de variabilidad, y por tanto más similar a la media de la población
será la media obtenida de la muestra.

Formulas y uso de tablas teorema del limite central

Formula de la estimación puntual:

X̄−μ
z=
σ /√n

Distribución (normal) muestras de medias:

También podría gustarte