Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Técnicas de Muestreo Estadistico
Técnicas de Muestreo Estadistico
T
CNICASDEMUESTREOI
CNICASDEMUESTREOI
Profesor:Ing.CelsoGonzalesCh
Ch.Mg.Sc
DEFINICIONES
DEFINICIONES
CONTENIDO
Introduccin
Tiposdemuestreo:ProbabilisticoyNoProbabilistico.
ConceptosbsicosConceptosbsicosenlainvestigacinpor
muestreo:PoblacinObjetivoyMuestreada
Muestra,muestrapiloto.
Unidaddeanlisis,unidaddemuestreo
Marcodemuestreo
Instrumentosdemedicin
Margendeerrorpermisible
Niveldeconfianza
INTRODUCCION
Lainvestigacinpuedeser:
Lainvestigacinpuedeser:
Prospectivaoretrospectiva
Prospectivaoretrospectiva
Transversalylongitudinal
Transversalylongitudinal
DescriptivaoComparativa
DescriptivaoComparativa
Observacinoexperimentacin
Observacinoexperimentacin
VENTAJASDELMUESTREOENCOMPARACINCONLA
ENUMERACINCOMPLETA.
Costoreducido
Costoreducido
Mayorrapidez
Mayorrapidez
Msposibilidades
Msposibilidades
MayorExactitud
MayorExactitud
DESVENTAJASDELMUESTREOENCOMPARACINCONLA
ENUMERACINCOMPLETA
Errordemuestreo
Errordemuestreo
Personalespecializado
Personalespecializado
Objetivofundamental
Objetivofundamental
delaEstadistica
delaEstadistica
Hacer
Hacer inferencias
inferencias acerca
acerca de
de una
una
poblacin.
poblacin.
Objetivodela
Objetivodela
inferencia
inferencia
Describir
Describir
mediciones
mediciones
conjunto
conjunto
de
de
Considerar
Considerarla
laforma
formaen
enque
quese
se
puedehacerlainferenciaacerca
puedehacerlainferenciaacerca
delapoblacin.
delapoblacin.
MUESTREO
Proceso que nos permite la extraccin de una muestra a partir de una
poblacin.
Haydostiposbsicosdemuestreo:
MUESTREOPROBABILSTICO.
MUESTREONOPROBABILSTICO.
MUESTREOPROBABILSTICO.
MUESTREONOPROBABILSTICO.
Es
Esaquel
aquelen
enel
elquela
quelaseleccin
seleccinde
de
En
En este
este tipo
tipo de
de muestreo,
muestreo, la
la
los
loselementos
elementosde
dela
lamuestra
muestrano
nose
se
probabilidad
probabilidad de
de aparicin
aparicin en
en
hacenalazar
hacenalazar
una
una muestra
muestra de
de cualquier
cualquier
elemento
elemento de
de la
la poblacin
poblacin es
es
conocida.
conocida. Es
Es el
el nico
nico
cientficamentevlido.
cientficamentevlido.
CONCEPTOSBSICOSENLAINVESTIGACINPORMUESTREO
INSTRUMENTOSDEMEDICION
Cuestionario
Guadeentrevista
Hojaderegistrodeobservaciones
Guademoderadordelgrupofocal,
Guadeanlisisdecontenido,etc
NIVELDECONFIANZA:
MARGENDEERRORPERMISIBLEOPRECISION
Eslavariabilidadentreestadsticoscalculadosapartirdemuestras
aleatoriasdelmismotamao.
d = t
a
y
1- , n-1
2
EJEMPLO
DelaEncuestaDemogrficaydeSaludFamiliarENDES
2004:
HogaresdelaciudaddeLima.
LosHogaresparticularesysusmiembros:
Residenteshabituales
Personasquepernoctaronenlaviviendalanocheanterior
aldadelaentrevista.
Todas las mujeres de 15 a 49 aos de edad, sus hijos
menoresde5aos
CuestionariodelHogar
CuestionariodelHogar
TamaoyComposicindelhogar
TamaoyComposicindelhogar
CoberturadeSeguro
CoberturadeSeguro
CondicindeActividad
CondicindeActividad
NivelEducativo
NivelEducativo
Supervivenciayresidenciadepadres
Supervivenciayresidenciadepadres
Caractersticasdelasviviendas
Caractersticasdelasviviendas
Tenenciadelhogar
Tenenciadelhogar
CuestionarioIndividual
CuestionarioIndividual
AntecedentesdelaMEF
AntecedentesdelaMEF
Reproduccin(HistoriadeNacimientos)
Reproduccin(HistoriadeNacimientos)
Anticoncepcin
Anticoncepcin
Embarazo,Parto,PuerperioyLactancia
Embarazo,Parto,PuerperioyLactancia
InmunizacinySalud
InmunizacinySalud
Nupcialidad
Nupcialidad
PreferenciasdeFecundidad
PreferenciasdeFecundidad
AntecedentesdeCnyugeyTrabajodelaMEF
AntecedentesdeCnyugeyTrabajodelaMEF
SIDAyotrasETS
SIDAyotrasETS
MortalidadMaterna
MortalidadMaterna
ViolenciaDomstica
ViolenciaDomstica
Ejercicio
Ejercicio
Sequiereestimarelconsumopromediodeaguaen
Sequiereestimarelconsumopromediodeaguaen
un distrito.
distrito. Analice
Analice las
las siguientes
siguientes unidades
unidades de
de
un
muestreo:
muestreo:
Familiasindividuales
Familiasindividuales
Unidades habitacionales(casas
habitacionales(casas para
para una
una sola
sola
Unidades
familia,edificiosdeapartamentos,etc.)
familia,edificiosdeapartamentos,etc.)
Manzanasdeldistrito.
Manzanasdeldistrito.
Quusaraustedcomomarcademuestreo?
Quusaraustedcomomarcademuestreo?
Ejercicio
Launidad
unidadagraria
agrariade
deuna
unaregin
reginde
dela
lacosta
costadesea
desea
La
estimarel
elrea
reasembrada
sembradacon
conmaz
mazamarillo
amarilloduro
duro
estimar
dentrodelaregin.
dentrodelaregin.
Sugieraposiblesunidadesdemuestreoymarcode
Sugieraposiblesunidadesdemuestreoymarcode
muestreo.
muestreo.
TIPO DE MUESTREO
Probabilstico,autoponderado,estratificado,multietpicoe
independienteparacadadepartamento.
MARCO MUESTRAL
Diseomultietpico:marcoparacadaetapa
UPM:CensodePoblacinyViviendade1993
USM: y UTM: y Actualizacin Cartogrfica y el Directorio de
ViviendasyEstablecimientosde1999.
USODELADISTRIBUCIONNORMAL
USODELADISTRIBUCIONNORMAL
S2
Sealapoblacin{Yi:Y1,Y2,....YN}secalcula ,Y
Y:promediopoblacional.
S2:varianciapoblacionalfinita.
Conelfindeestimarelpromediopoblacional,se
extraenmuestrasposiblesdetamaon.
E(Yj ) =Y
N -n S2
V(Yj )= (
)
N n
Distribucinmuestraldelamedia
Veremos primero elcasodequeladistribucinsubyacenteseanormal ,
m
conmediayvarianza
s2
Lamediadeladistribucinmuestraldemediases
Lavarianzadeladistribucinmuestraldemediases
s2 / n
Laformadeladistribucinmuestraldelamediaesnormal.
Nota:Ladesviacinestndardeladistribucinmuestralsueleserdenominada:
Nota:Ladesviacinestndardeladistribucinmuestralsueleserdenominada:
errorestndar
errorestndardetalestadstico:porejemplo,errorestndardelamedia,
detalestadstico:porejemplo,errorestndardelamedia,
etc.)
etc.)
EJEMPLO1
Distribucinmuestraldelamedia.
Lalnea(enesteysucesivosejemplos)esunacurva
normal
Freecuencias
200
Distribucindela poblacion
(dist.Normal):N=3600
Media=100
100
Varianza=225
Desv.estndar=15
0
50
100
mediciones
150
EJEMPLO2
Distribucinmuestraldelamedia.
8
7
Frequency
6
5
4
3
2
1
0
90
95
100
105
110
Muestras
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Promedio
109.15
94.27
101.59
99.86
103.86
92.34
108.54
95.16
104.07
103.60
92.41
97.18
98.40
101.36
98.63
98.24
102.89
97.90
100.33
97.08
Distribucinmuestraldela
media:
m
m
uestral
Tamaodemuestra=10
Media=100
(Varianza=22,4375)
Errorestandar= 22.4375 = 4.74
EJEMPLO3
EJEMPLO3
Distribucinmuestraldelamedia.
700
Distribucinpoblacional
subyacente(dist.Normal):
600
Media=100
Desv.estndar=15
500
400
Distribucinmuestraldela
media:
300
200
Tamaodemuestra=50
Desv.tp.=2.12
100
Media=99.95
N=3600.00
25
25
9.
10
7.
10
25
25
25
5.
10
3.
10
1.
10
.2
99
.2
97
.2
95
.2
93
N50
Media=100
(Varianza=225/50=4.5)
Desv.estndar=2.12
Distribucinmuestraldelamedia.
LadistribucinGAMMAtiene2parmetros:
Distribucinpoblacional
subyacente(dist.GAMMA):
Media=100=
l queesunparmetrodeescala(1)
p 100
=
=100
l
1
Varianza=100=
pqueesunparmetrodeforma(100)
p 100
=
= 100
l 2 12
0.045
0.04
0.035
0.03
0.025
0.02
0.015
0.01
0.005
0
80
85
90
95
100
105
110
115
120
EJEMPLO4
EJEMPLO4
Distribucinmuestraldelamedia.
Distribucinpoblacional
subyacente(dist.GAMMA):
500
Media=100
Varianza=100
400
300
Distribucinmuestraldela
media:
200
Tamaodemuestra=10
100
Desv.tp.=3.12
Media=100.0
N=3600.00
0
0.
11
0
8.
10
0
6.
10
0
4.
10
0
2.
10
0
0.
10
.0
98
.0
96
.0
94
.0
92
.0
90
DISGAMMA
Media=100
Errorestandar=
Distribucinmuestraldelamedia.
Distribucinpoblacional(dist.
EXPONENCIAL):
LadistribucinEXPONENCIALtiene1
parmetro: l (enelejemplo:10)
Media=0.1=1/l
Varianza=0.01=1/l2
12
10
8
6
4
2
0
0
0.1
0.2
0.3
0.4
0.5
0.6
EJEMPLO5a
EJEMPLO5a
Distribucinmuestraldelamedia.
Distribucinpoblacional(dist.
EXPONENCIAL):
400
Media=0.1=1/l
300
Varianza=0.01=1/l2
200
Distribucinmuestraldela
media:
Tamaodemuestra=10
100
Desv.tp.=.03
Media=.100
Media=.100
N=3600.00
44
.2
31
.2
19
.2
06
.2
94
.1
81
.1
69
.1
56
.1
44
.1
31
.1
19
.1
06
.1
94
.0
81
.0
69
.0
56
.0
44
.0
31
.0
EXPON10
Errorestndar=
EJEMPLO5b
EJEMPLO5b
Distribucinmuestraldelamedia.
500
Distribucinpoblacional(dist.
EXPONENCIAL):
400
Media=0.1=1/l
Varianza=0.01=1/l2
300
200
Distribucinmuestraldela
media:
100
Desv.tp.=.02
Media=.099
N=3600.00
94
.1
81
.1
69
.1
56
.1
44
.1
31
.1
19
.1
06
.1
94
.0
81
.0
69
.0
56
.0
44
.0
EXPON20
Observadqueladistribucinmuestralseaproximams
alanormal(alelevareltamaomuestral).
Tamaodemuestra=20
Media=.100
(Varianza=0.01/20=.0005)
Desv.Estndar=.022
TRABAJODECAMPO:OBTENCI
TRABAJODECAMPO:OBTENCI
NDEINFORMACI
NDEINFORMACI
N
Probarlashiptesis
Responderlaspreguntasformuladas
Lograrlosobjetivospropuestos
PROCEDIMIENTODERECOLECCIONDEINFORMACION
PROCEDIMIENTODERECOLECCIONDEINFORMACION
Escribirlosprocedimientosqueutilizar:
Encuestaapoblacin,
Entrevistasaprofundidad
Dinmicadegruposfocales
Anlisisdecontenido,etc.
Cmoycundolosaplicarylosinstrumentosqueutilizarpararecopilar
la informacin (cuestionario, gua de entrevista, hoja de registro de
observaciones, gua de moderador del grupo focal, gua de anlisis de
contenido,etc.).
ERRORDEMUESTREO
Esladiferenciaentreelvalorobservadoyelvalordesconocidode
lacaractersticapoblacional,quetratamosdeestimar.
FormasdeControl:
Usoadecuadodeldiseomuestral.
Aumentandon
Supervisin
NO
NO
RESPUESTA
RESPUESTA
ERRORESDE
ERRORESDE
NOMUESTREO
NOMUESTREO
RESPUESTA
RESPUESTA
INEXACTA
INEXACTA
SESGO
SESGODE
DE
SELECCION
SELECCION
CONFIABILIDADYVALIDEZ:REQUISITOSDELAMEDICI
DELAMEDICI
N
Confiabilidad
Validez
El instrumento utilizado El instrumento utilizado
para
medir
produce
para medir, es adecuado
resultados similares en
para medir lo que se
diferentes oportunidades
desea medir (para medir
calidadsepreguntasobrecalidad
demedicin
de los productos, limpieza,
rapidez,cortesa y no la fachada
deloscomercios)
CUESTIONARIOS
Recomendacin
Determinarlaspreguntasimportantes.
Esbozarlosdetallesdelcuestionario.
Disearelcuestionario.
Hacer una prueba preliminar del
cuestionario.
Desarrollar una estrategia para la
recoleccindedatos.
Elaborar una carta introductoria y
enviarcuestionarios.
Controlarlasrespuestas.
Analizarlosdatosdelaencuesta
CUESTIONARIO
CUESTIONARIO:GUAPARALAELABORACIN
Tenerclaridaddelproblema,objetivosehiptesis
Conocerlascaractersticasdelapoblacin,objetodeestudio
Buscarcuestionariospreviossobreelmismotema
Elegirlaspreguntas,ordenarlas,
probarelcuestionario(pruebapiloto)
redactarelcuestionariodefinitivo(previendoelprocesamiento)
FACTORESQUEAFECTANLACONFIABILIDADYVALIDEZ
Laimprovisacin
La utilizacin de instrumentos utilizados en otros contextos
yaplicadossinadaptacin
Inadecuacin del instrumento para las personas a las que
estdirigido
Condicionesenqueseaplica
Instruccionesdeficientes
Escasacapacitacindequienesaplicanelinstrumento
PROCESAMIENTODEDATOS
Codificacin:asignaracadacategoraunnmero.
Tabulacin: sistematizar resultados cuantitativos en
tablas,cuadros,grficos,mapas.
Programasparaprocesamientodelosdatos.
CUADROS
Cuadro1:Evolucindelapobreza
TipodeHogares Ao1980
Ao1991
Ao2000
Nopobres
80.2%
73.6%
76.1%
SloNBI
12.2%
10.1%
3.1%
SloLP
3.9%
10.6%
15.2%
NBIyLP
3.7%
5.7%
5.6%
Total
100%
100%
100%
Fuente:INEI
TABLAS,CUADROSYGR
TABLAS,CUADROSYGR
FICOS
ElTtulo(precisindeloquecontiene)
Ladisposicindelasvariables
Encabezadosdecolumnasyfilas(cortosyprecisos)
Las unidades que representan las cifras (absolutos,
porcentajes/nuevossoles,euros,dls,etc)
Columnasdetotales
Notasoexplicacionesanexas.
Fuentedelosdatos
LECTURADETABLAS,CUADROSYGR
LECTURADETABLAS,CUADROSYGR
FICOS
Ttulo,notas,fuente,unidadesenqueseexpresa,
promedios totales, variabilidad entre distintos
datos,asociacionesentrevariables.
CUADROS
Cuadro1:Evolucindelapobreza
TipodeHogares Ao1980
Ao1991
Ao2000
Nopobres
80.2%
73.6%
76.1%
SloNBI
12.2%
10.1%
3.1%
SloLP
3.9%
10.6%
15.2%
NBIyLP
3.7%
5.7%
5.6%
Total
100%
100%
100%
Fuente:INEI
Variable
dependiente
TOTALES
Medida
utilizada
($,%,absolutos)
Dedndefueextrado?
Ttulo
Variable
independiente
GRFICOS
Evolucindelapobreza
(enporcentajes)
Ttulo
100.0%
50.0%
0.0%
Ao1980
Ao1991
Nopobres
SloNBI
SloLP
NBIyLP
Ao2000
Fuente:INEI
Medida
utilizada
(S/,%,absolutos)
Dedndefueextrado?
Referencias
delasvariables
utilizadas
REDACCI
REDACCI
NDELINFORME
Elproblemaalqueserefiereelestudio.
Procedimientosdeinvestigacin
Resultadosalcanzados.
Conclusiones
Recomendaciones
Reflexionespersonales
PRINCIPIOS
TICOS
Objetividad
Integridad
Respetoyproteccindelossujetos
Confidencialidad
Compromisoconlaverdad
Reconocimientoaloscolaboradores
Transparenciaeconmica
FICHATECNICA
mbito
Nacional.
Universo
Poblacindeambossexosde18aosyms
Marcomuestral
Padrndehabitantesde2006
Tamao
muestral
Diseada:1501entrevistas
Errormuestral
Diseo
Realizada:1490entrevistas
Paraunniveldeconfianzadel95,5%(dossigmas),yP=Q,elerroresde2,58%paraelconjuntodelamuestraenelsupuestode
muestreoaleatoriosimple.
Polietpico, estratificado por conglomerados, con seleccinde las unidades primarias de muestreo (municipios) y de las unidades
secundarias (secciones) con probabilidad proporcional a su tamao, y de las unidades ltimas (individuos) por rutas aleatorias y
cuotas
de
sexo
y
edad.
Losestratossehanformadoporelcrucedelas17localidadesautnomasconeltamaodehbitat,divididoen7categoras:menor
o igual a 2.000 habitantes de 2.001 a 10.000 de 10.001 a 50.000 de 50.001 a 100.000 de 100.001 a 400.000 de 400.0001 a
1.000.000ymsde1.000.000habitantes.
Loscuestionariossehanaplicadomedianteentrevistapersonalenlosdomicilios.
fechade
realizacin
Del21al31demayode2006.
Trabajode
campo
CentrodeInvestigacionesSociolgicas(CIS)
VICIOOSESGOENELMUESTREO(B)
B= E (q$) -q
Causas
Erroresdemedicin
Faltaderespuesta
ERRORCUADRATICOMEDIO
E C M ( q$) = E ( q$ - q )
E C M ( q$ ) = V ( q$ ) + B
EXACTITUDYPRECISION
TiposdeMuestreoprobabilstico
TiposdeMuestreoprobabilstico
1.
1. Muestreoaleatoriosimple
Muestreoaleatoriosimple
2.
2. Muestreosistemtico
Muestreosistemtico
3.
3. Muestreoestratificado
Muestreoestratificado
4.
4. Muestreoporconglomerados
Muestreoporconglomerados
MUESTREOALEATORIOSIMPLE
EsunmtododeseleccindenunidadesenunconjuntodeNdetal
modo que cada uno de las muestras distintas tenga la misma
probabilidaddeserseleccionadas.
VENTAJAS:
Sencilloyfcilcomprensin
Clculodemedidasestadsticas.
DESVENTAJAS
Requieredeunmarcodemuestreo.
Requieredemuestragrande.
USODELOSNUMEROSALEATORIOS.
El
El requisito
requisito fundamental
fundamental de
de una
una tabla
tabla de
de nmero
nmero
aleatoriosesquecadaunodelosdgitos(0,1,2,3,4,5,6,7,
aleatoriosesquecadaunodelosdgitos(0,1,2,3,4,5,6,7,
8,9)tengalamismaprobabilidaddeaparecerenlatabla,es
8,9)tengalamismaprobabilidaddeaparecerenlatabla,es
p=1/10
p=1/10
Tablas
FuncinRandom
Registrosdepacientesqueseranincluidosenla
muestra
54
70
105
115
134
229
241
246
264
309
335
349
352
387
402
408
416
439
483
487
493
516
531
535
539
558
588
627
641
670
672
688
743
766
767
779
814
818
821
828
835
856
880
883
901
918
934
960
964
985
b) Cmodecidiraendndeempezarlatabla?
c) Qu efectos, de hacerlo, provocara en su planteamiento el
hechodequelossolicitantesdecrditofueronnumeradosslo
porpares(2,4,.....)?
d) Realice la seleccin de los 40 solicitantes haciendo uso del
muestreo aleatorio simple. Usando la tabla de nmeros
aleatoriosdelacolumna7.
Propiedadesdelosestimadores
T.1:lamediamuestralesunestimadorinsesgadodeY
Esdecir:
E ( y)=Y
Corolario1:esunestimadorinsesgadodeltotaldelapoblacion
Y
T.2:Lavarianzadelamediamuestraldeunamuestraaleatoria
simplees:
S 2 N - n
V ( y)=
n N
Propsitosdelerrorestndar
i.
Compararlaprecisin
ii. Estimareltamaodemuetra
iii. Estimarlaprecisin.
Estimacindelerrorestndarapartirdeunamuestra
Estimacindelerrorestndarapartirdeunamuestra
2
T.:Enunamuestraaleatoriasimpleesunaestimacininsesgadade
T.:Enunamuestraaleatoriasimpleesunaestimacininsesgadade
$
S
22
S
S
DONDE:
2
( yi - y)2
$
S =
n - 1
(Yi - Y)2
2
S =
N - 1
ErrorestndardelPromedio
(
y
y
)
1- f
i
$
Sy =
n -1 n
ErrorestndardelTotal
(
y
y
)
1- f
i
$
SY = N
n -1 n
Intervalosdeconfianza
Promedio
Total
IC (Y)= y ts y
IC (Y)= N y Nts y
DONDE:
yi
y=
n
(
y
y
)
i
S2 =
N - 1
( yi - y)2 1- f
Sy =
n -1 n
EJEMPLO6
1593
1674
1734
1854
1902
1997
2706
2744
3131
3322
3376
3748
4245
4340
4786
EJEMPLO7
Setomunamuestraaleatoriasimplede20usuariosdeundistritode
Lima,paradeterminarelconsumopromediodeenergaelctrica(kwh).
EJEMPLO8
Para estudiar la densidad de
siembra de un cultivo (nmero
deplantasporhectrea)deuna
poblacin compuesta por mil
parcelasseelaboraelmarcode
muestreo y se elige una
muestra simple aleatoria de 15
parcelas a partir de la columna
22yfila2delatabladenmero
aleatorios.
MARCODE
MUESTREO:
21
41
22
961
981
42
962
982
23
43
963
983
24
44
964
984
25
45
965
985
26
46
966
986
27
47
967
987
28
48
968
988
29
49
969
989
10
30
50
970
990
11
31
51
971
991
12
32
52
972
992
13
33
53
973
993
14
34
54
974
994
15
35
55
975
995
16
36
56
976
996
17
37
57
977
997
18
38
58
978
998
19
39
59
979
999
20
40
60
980
1000
TABLADENUMEROSALEATORIOS
TABLADENUMEROSALEATORIOS
Columna
1234
5678
9012
3456
7890
1234
5678
9012
3456
7890
1089
8719
2272
1359
3328
14
6773
1278
2761
3550
9385
7902
5034
6723
3835
6978
7084
3992
5857
2377
6934
8660
311
2979
95
2647
8299
5163
73
7788
52
1007
4866
6497
4138
8144
294
2906
316
4810
Lasvariablesainvestigarson:
Xi:
Parcela
Xi
Yi
073
52
084
125
095
12
163
581
299
858
311
16
377
747
647
806
660
762
788
770
857
546
934
132
978
228
979
311
992
932
EJEMPLO9
El auditor de una compaa esta interesado en estimar el
porcentaje de facturas con error en la facturacin, para lo cual se toma
unamuestraaleatoriade50usuariosyseobservelnmerodefacturas
conerrorenlafacturacinde10.Determinareltamaodemuestraconun
errordeestimacindel5%.Supongaqueelnmerodeusuarioses10000