Está en la página 1de 105

""~

, t
,
t

. '; .

,-,",
~

- ~'~

e mos . M" "IJ F-L V!V"NCO

l" s.:(ipcin 1\0 151 ti>lI, Santia go de Chile

Manuel Vivanco

Dnech05 de edici n re'~rv,ldo, para tod,,, los pa~ por

ED iTORI AL 1J " [ Vf: R SrrA ~ J", S."

Avda Bernardo 0 '1liAAi", lOSO, S. lltiago de Chile.


edi tor@uni'-ersitara.d
Nin(tL na part e de est e libro, incluido el disen o de la po rt. da,
pllede ser reprod ucida, transm it ida O . 1,n'cena da, se" por
procedimient os mecnicos, peos, quimico, o
..I" 'i rnicos, inclu idas 13-, fotoco pias,
s;n per miso escrito dd ed itor.
ISBN 956 11-1801 _3
T""to comp"c s{o cn tipografja Berl,t J JI! 3
Se (,,, min de imprimir ".<ld

Muestreo Estadstico

I' RrM ER.A EDlC10 N

d.. L OOO ejemplares,


en los taH" n: s de Impre nta Sdle' ;Jnos S.A.
G\",..ral G dna 148 6, S. ntiago de Ch ile,
en diciemf:,re de 2005.

. Diseo y Aplicaciones

D I5FJ\lO D E l'(l~l""[)"" Y DI....CR /\ MA CI( N

Pauld Diaz RoJrigttt"~


Yenny 1,1. Rod rigtLe?,
l'(ll(l A D/\

Re" M a ~ritte
G ak (Jnde, 1953 (Fragmen to)
O leo sobre li,nw, SI " IOOcm
Hou,ton [I"",s), "'h e Menil C ollecno n

ww w .univ e rsita ri a .cl

IMPRESO EN CH ILE I PRJI'i'TED IN CHILE

EDITOR IAL U NI VERSITAR IA

ndice

A la Rama de Monta a de la Uni versidad de C h ile


A concagua . Oju;; del Salado
TOlllamju - Vallu1/a mjll
Placa Roja de Lo ValJs
Cas cada Clsica de Yerba Loca
Tupungalo - Maipo
Exponencial - Constelaciones

Introduccin

13

C ...rlTUI.O I

La e ncu esta por m ue streo


l. I . T ipos de encuest a
1.2. Etapas de 1:1 e ncuesta
1.2.1. D ecisiones previas al m uest reo
1.2.2. Decisiones propi as del m uestreo
1.3.
1.4 .

1.5.
1.6.

1. 2.3 . Decisiones posteriores al m uest reo


Poblacn y muestra
Errores siste mt icos
l A . I . Errores por no ob se rvacin
1.4 .2. Erro res de m edicin
Rcpresen t atvded
Resu men histri co

15
15
16
16
17
17

19
19

20
20
20
21

C APtnJI.O 2

Conceptos bsicos
2. 1. Glosario de diseo de muestras
2.2. G losa rio de inferen cia estadtsttca
C APITULO

23
ZJ
25

Tipos de muestreo p rchabilist ico

27

C Af1ru L.O 4

Estim adores del parmetro poblactonal


4.1. Propiedades de los est imadores
4. l . 1. Estimador tnsesgad o
4.1 .2 . Esti mad or consistente
4.1. 3. Esti mador eficiente

4. 1.3.1. Eficiencia absoluta


4 .1 .3.2. Eficiencia relativa
4. 1.4. Estim ador suficiente
4 .1.5. Est imador resistente

31
JI

31
33

34
34
34
35
35

4.2.

Procedimientos para generar est imadores

35

CAPiTU LO 5

Distribucin muestral de estadsticos


S.l . Distribucin de la media
5.1. 1. Distribucin en la poblacin
5. 1.2 . Distribucin en la muestra
5. 1.3. Distribucin del estadstico media m ues t ral
5.2. D istr ibucin de la proporcin
5.2. 1. D ist rib ucin en la po blacin
5.2.2 . D ist ribuc in en la muestra
5.2.3. D istribucin del est adstico p ro po rci n m uest ral
C APiT ULO

CAJ'l"llJl.O

38

40
41
42
42

45
45
46
47
48
48
48

49
50
50
51
52

El er ro r total y sus componentes


7.1. Error total
7.2 . Err or po r sesgo no muestra!
7.3 . Error po r sesgo m uestra !
7.4 . Error por variaci n de la m uestra
C Al't l"UI.O 8
Tamao de la muest ra
8.1 . Factores que cond icionan el tama o de la muestra
8.1.1. Recursos econ m icos
8.1.2 . Proce-dimientos de ana lisis
8. 1.3. H et erogeneidad de la poblac in
8 .2. Precisin de la estimacin
8.3 . Tam ao de la muestra y tamao de la poblacin
~.4 . Tamao de la m u est ra y pa rmetros
8.S . frmula del ta m ao de la muestra

D ecisiones su bjetivas en clculo del tamao mucstral

9
Notaci n y frmul as
9.1. Notacin general
9 .2 . N otaci n de m ed ias. Poblacin
9.3. Notaci n de proporciones. Poblacin
9.4 . Notacin de m edias. M ues tra
9 .5. Notacin de pr oporciones. Muestra

C APIT ULO

37
37
37
37

Int e rva lo de confianza


6 .1. Qu es un inte rvalo de confianza?
6.2 . Confianza en la est im aci n
6.3 . Valores sigma
6.4 . Nivel de confianza y t ama o de la m uestra
6.5 . Errores asociados al in tervalo de co nfianza
6.5. 1. Pro bab ilid ad de e rror u
6 .5 .2 . Erro r mximo admisible
6.5 .3. Err or tpico
6.5.3. 1. Erro r tpico de la m edia
6.5 .3.2 . Erro r tpico de pro po rcio nes
6.6. Co nstruccin del intervalo de confi anza

8.6.

55
55
56
57

58
59
59
59

59
60
60
61

62
62

CW[T ULO

10

\-Iuestreo alea torio simple


10 .1. Sel eccin de unidades de muestreo
10.2. Varianza y cuasivarianza
10.3 . Correccin para poblaciones finitas
10 .4 , Esti macin de la m edia
10.4.1. Error tpico
10.4.2. Tamao de la muestra
10 .4.3. Int ervalo de confia nza
10.5. Estimaci n de- la proporci n
10 .5. 1. Error t pico
10.5 .2. Tamao de la m uest ra
10.5 .3. Intervalo de confi anza
CAPITULO

1I

Muestreo estratificado
11.1 . Precisin de la esti m ac i n
11.2. Tamao de los estratos
1 1.3. Nmero de estratos
11 .4 . Seleccin aleatoria de elementos
11.5. Afijecn
11.6 . Not acin
1 1.6 . \. Pob laci n
11 .6 .2. Muest ra
11.7. T ipos de afijac n
11.7.1 . A fijocn igual
11 .7.2 . Atijacin proporcio nal
1 1.7.3 . Afijacin pti m a
CAPITU l. O 12
Mu estreo estrati ficado de medias
12 .1. Est im acin de la m edia
12 .1.1 . Med ia aritmtica
12.1. 2. Med ia aritm tica po nderada

62
65

65
66
67
68
68
69

69
70
71
71
71
72

74
76
76
77
79

81

82
82
82
83
83

84
85
86
88
88

89
89
93
93
93
94

12.Z. Varia nz a gen rica del est imador de la media


l Z.3. Ta m a o genrico de la muestra
l ZA. Ahjeci n p roporcional
12.4 .1. Estimacin d e la media
12.4 .2. Error tpico
12.4 .J . Tamao de la muestra
12.4.4. Intervalo de confianza
12.5 . Afijacn ptima de varianza
12.5 .1. Est imaci n de la me dia
12.5 .2. Erro r upi co
12.5 .J . Tam a o de la m uestra
12.5.4 . Inte rvalo d<.' confianza
IZ .6 Afijacin ptima de costo
12.6 .1. Estimacin de la media
12.6.2. Error tpico
12.6 .3 . Tam ao de la m ues tra
12 .6.4 ., Inter valo de confianza

95
96

97
97
97
97

l OO
10Z
102

IOZ

103
106
108
108
108
109
11Z

errur.o

lJ
restreo estratificado de proporciones
I J .l . Esti macin de la proporcin
13.2. Varianza gen rfca del esti mador de la proporcin
13.3. Tamao de la m uestra gen rico
13.4 . Atiject n p roporcional
IJ .4 . 1. Estimacin de la proporcin
13A.Z. Error tpico
13.4.3. Tamao de la muestra
13.4.4. Intervalo de confianza
13.5. Afijaci n ptima de var ianza
13 .5. l . Estimacin de la p roporci n
13.5 .2 . Error tpico
13.5 .3. Tamao de la muestra
lJ .s.4. Intervalo de confianza
13 .6 . Afijac n ptima de costo
13 .6 .1 . Estimacin de la proporcin
13 .6.2. Error t pico
13 .6.3 . Ta m ao de la m uestr a
13 .6 .4 . Intervalo de co nfianza

115

CAPITULO 15
. .
_
:-'luestr CO po r con glome rados sin sobrnues trco . D lst mto tamano
15.1. Estim acin de !J. m edia
15 .1.1. Error tpico
15.\ .2. Tamao de la muest ra
15. 1.3 . Int ervalo de co nfianza
15.2. Estimacin de la p ropo rcin
15.2.1. Errortipico
15 .2 .2. Inte rvalo deo con fianza

139
139
140
140
14 1
142
142

144
1-15

145
149
149
150
I SO
151
154
154

155

115
116
116
117
117

l iS
118

1ZI
I ZZ

I ZZ
I Z3
I Z3
126
128
I Z8
128
128

13Z

1TULO 14

est rco por conglome rado s sin sub m uesrreo. Igual tamao
14. 1. Selecci n de las unidades de muestreo
14.2. Pre cisin de la estimacin
14.3 . Congl omerados de igual tam ao

14.4. Notaci n
14.4 . 1. Notacin poblacin
14.4.2. Notacin muestra
\4.5 . Esurnacn de la media
14 .5 .1. Error tpico
14.5 .2 . Tama o de la m uestra
14 .5.3 . Intervalo de confianza
14.6 . Est im acin de la p roporcin
14 .G.l . Error tip ico
14 .6 .Z. Inter valo de confianza

C.. . rn1JLO 16
Muest ro p or conglomerados co n submucs t rco
16 .1. Est imacin de la m edia
16 .1.1. Error tpico
16 .1.2 . Tam ao de la m uestra
16 .1 .3 . Int ervalo de confianza
16 .2 . Estimacin de la proporcin
16 .2 .1. Error t pico
16 .2.2. Inte rvalo de confianza
. . .
16 .3 . Seleccin de u nidad es de muestreo e n r;'u est reo pol ietpico
16 .3 .1. COIli!;lo me rado de tamao granee
16 .3 .2. Co nglome rado de t amao peque o
CArhu LO 17
Otros dise o s proh abi\stkos
17.1. Muest reo siste mtico
17.2. Mu estreo pol ifsico
17.3 . Muestr eo con r pli cas
17.4 . Mu estr eo po r re as

150
162
16 2

163
163
166

166
166

169
170
170
171
171

173
174

174

135

136

C APITULO 18

138

Prob ab ilidad de sele cci n p ropo rcional al ta m ao


18 .1. Estimacin de la m ed ia

139

177
177

18.2. Erro r tpico


18.3 . Interval o dt= co nfian za
C...ernno 19
M todos indirectos de est imad n
19.1. Estimador de raz n
19.2. Estadstico muestra!
19.3 . Error tpi co del estimador de
19.4 . Inte rvalo de confia nza

177
178

cxnuroiar y medir la amfiabilidad de la iflJormcuin estudstca


ril a travs de la teora sle la probob lidad.

x
I

CAPITuLO 20
D iseos no probahilist i..:os
20 . 1. Mu estreo por cuotas
2\ ).2. Muestreo cuasiproblbilstico
20 .2 . 1. Muestreo aleat orio po r cuotas
20.2.2. Mu est reo de rutas aleatorias
20.3 . Otros dise os no probabilsticos
20.3 . 1. Mu estreo enatico
20.3.2. Muestrto op in tico

181
182
183
183
184

187
187

190
190
190
19 1

191
19 1

C',f'11UI.O 2 1

Funciones de cost o

193
C""!TIJLO 22
Tasa de no respuesta
195

Comno 23
Efecto de d ise o

201
CAPITU l.O 24
Error absoluto y error relativo :

203
CAI'ITULO 25
Pond eracin y elevacin
2~ . 1. C oe ficiente d e pon deracin
2:::1 .2. Coeficiente d e el evacin

El m u estreo no es una simple sus riturujn de Ulla cobmura


tocal por WUI porcoi. El mues Creo es la cinlria y a rte de

205

206
207

B IMIJOCltAFlA

209

w. E. D eming
Sorne Theory of Sarnplmg. New York: Dover; 1950 .

Introduccin
El p resent e te xto tiene dos orgenes. A saber, las lecciones sob re teora de muestr as
que me ha correspondido impa rtir durante los ltimos anos e n el Dep art amento
de Sociologa de la Universidad de Chile y, por otra parte, la practi ca en diseno de
mu estras consec ue ncia de asesoras real izadas a instituciones pblicas y privadas.
H a sido escrito con el propsito de satisfacer los inte reses de dist intos lectores.
En efecto, estudiantes que aspiren a una formacin rigurosa e n el mbito de
diseno de m uestr as y, srnult neamente, p rofesionales de las C ie ncias Humanas
que realice n investigacio nes empric as mediante e-ncuesta por m uest reo.
Como text o de estud io res ulta adecu ado en una asignatura de p rcgrado de
carc te r anual. Sin e mb argo, el igiendo los captulos pe rtinentes p uede ut ilizarse
en un cu rso de duracin semest ral. El uso del libro supone co noc imi entos de
estadstica b sica .
La teoria de muestras se sustenta en el clculo de probabilidades. Desd e una
perspectiva estric tamente teri ca, co noci mie ntos de lgebra y clculo infinitesimal
resulta n necesarios para comprender los fundam entos de la inferencia estadstica.
Sin obv iar las e xigencias tericas inherentes a la infe re nc ia, se ha enfatizado el
aspecto instru me ntal y ap licado de la t co r ta de m uestr as.
Este libro no se hab ra escrito sin la estimulante for m acin otorg ada por el
profesor Rafael Pro Bermejo dd Instituto de Estadistica e Investigacin Operativa
de la Universidad Compluten se de Madrid . Tampoco h ubie ra sido posible sin
un sabe r acumulado durante dcadas plasmado en el texto inic i tico d e Yates
(194 9) 'j los lib ros que nos nutrieron como est udiante Kish ( 1972), Coc hran
(1980) y Azorn Poch (1 9 72) .
Las habilid ades de M nica Gerber han sido relevantes para generar esta obra .
Supo descifrar f rmu las imposibles y escribirlas en fo rmato d igit al, y resol v los
problemas que ilustran cad a u na de las aplicaciones
El propsito de esta s p ginas es t em atizar los problemas centrales y sus
solucio nes. Si bien no es un texto ex ha ustivo trata los aspectos fundamentales
del diseo d e m uest ras segu n el desarr ollo a la fecha .
No es un ma nual ni una acum ulaci n sistem tica de rec et as. Facilita los conocim ientos para resolver e n una situ acin concre ta la seleccin de u na mu estra
rep resent ativa de la poblaci n obj eto de estudio.

C~pitulo

La encuesta por m uestreo

La investigacin cuantit ativa por antonomasia es la en cu esta por m uestreo. Se


caracte riza po r utilizar informaci n de una m uestra representativa par a explorar,
describir o explic ar las propiedades de la po blacin or igen de la m uestra.
Los suste ntos tericos de la enc uesta son la infer encia esta dstica clsica y
la teora pscosoctal de la com unic acin con entre vistas. La inferencia se nutre
de la teora de la estim acin. sta se basa en el calculo d e probabili dades y, e n
particular, en las funciones de distribucin, el teorema del limite centra! y la le y
de los grandes n me ros. La tcorfa psicosocial de la comunicaci n con entrevistas
com pre nde comportamiento s verbales denominados speech events. En este contexto la entrevista es una com unic aci n in terpersona] orientada a un fin donde
trmsrnisor y rece ptor vchiculizan el mensaje a tra v s del habl a. La entrevista
media nte c uestionario es un modo de entrevista utiliza do desde una perspectiva
metodolgica para medir u n objeto de estudio.

1.1. Tipos de enc uest a


1.3 encuesta pu ede ser ente ndida de dos modos difere ntes. La visin amplia em ula encuesta con toda investigacin en la que se produce infor macin mediant e
procedimientos qu e no sean experim en tales. La perspecti va res tr ingida concibe
la encuest a como un procedimcnto que consider a informacin de una mu estra
con el objeto de infe rir a la poblacin origen de la mu est ra. La segu nda defini cin
corresponde a la encuest a por mues tr eo y ser uti lizada en est e te xto.
La b ibliografa distingue tres tipos de investigacin a propsto de l uso de la
encues ta por mccstreoA saber;est udi os exploratorios realizados panl identificar
una materia de la q m.' no se tienen antecede ntes. En es te con tex to la encuesta
permi te generar hip tesis y lineas de investigacin. Encuestas descriptivas con
ti propsito de ob ten er informacin que pe rmita carac teri zar un ob jeto de estudio en fun cin de divers os atribu tos, a fin de describir cmo so n las cosas. Las
encuest as analticas t ienen como obj eto el est udio de rela ciones e ntre variables,
con el fin de explicar por qu las cosas son de ese modo.
Naturalmente qu e una e ncuest a por muestreo pu ed e se r clasificada segn la
naturaleza de la in vesti gacin en que esta se e nmarque. Asi, por eje mplo, segun
su finalidad se distin gue e ncuesta bsica o aplicada, de acu erdo a la medici n en

el t iempo; encuesta d iacrni ca o sincrn ica en f ..


.
'
.
to de estudio atomsticas o e ,
J
' . u ncron de la am plitud del o bjeo
n
ext
ua
es,
Sl'''' U
1
J
1
I
d
"
tnteviruentes de campo o ' lb
'
gun e gral o e e centro l' variables
ue a or atono,
Cualquiera sea la te xo nornt a el t
po r mues treo es represe ntar la realtd ~ma~~ntral del diseo de una enc ue sta
La muestra es una maquet d I
~. rante un modelo reducido de est a.
atributos a una escala me a Ee a po 1acron en la que estn reprod ucidos sus
muestra como un ('SP'" d"O'" ""'bite ~.ontexto, KIsh ( 1972) usa la im agen de la
JO e a po acron
El problem a de la e ncuesta po r mu .
.
.
paso de lo pa rticular a lo gc
J P
estre~ es el de la Injerencia. Es dec ir, el
nerar. ara estos erectos d fi
"""
no, est rategias de sel..cccn d e e1cm en tos y post - se e nen, en pnme
- . r te rrr uJ'
error-mente, procedi mientos de
estimacin de los pa r metros blact
po anona es.

1:

1.2. Etapas de la e ncu esta


Se ha produ cido una variada nom enclat ura
hl
en la ejec ucin de la encuesta
p. 'Ara. esta ecer las etapas a considerar
~"
po r- m uest reo juic I H
( 19)
de una encuesta po r m uestreo irn li
d IlC.l ~ (e enry
~ O), el diseo
efec to, cabe distingui r decisi ones r .c~ ~ol7ar eCI~ I?neS en tres mo me ntos. En
p ropi as del muestreo y decs " ~revlas .a a selecci n dt' la mu est ra, decisiones
slOm s postcnores a la sel eccin de la mu estra.

Plan de ,m lisis. Est able ce r los procedim ientos de procesam iento esta dstico
de la infor ma cin.

1.2.2 , Decisiones propias del muestreo

El momento del m uestreo se caracteriza por decision es tc nicas, e ntre las que
cabe destacar las siguientes:
prvu dimierlto de seleccWn de e/eme7ltos. Se t rat a de elegi r entre las opciones
de muestreos probabilsticos y no probabilsticos.
Tmn..l rlo de la muestra. Bsicamente se tra ta de aplicar la frm ula co rrespondie nte seg n el procedimiento de seleccin elegido.
Nivel de amfianza y pmbabilLld de error: Se t rata de tom ar decisiones respecto
a la precis in de- las estimaciones.
Probabilidad de seleccin (le las unrlllrles de muestreo. Establ ece r si toda s las
unidade s tendrn la mi sma pro babilidad de ser elegidas o probabilid3des
distint as de seleccin . A sabe r, decid ir si el diseno ser autopondcradc o no
autopomkrado
1.2.3. Decisiones posteriores al muestreo
El momen to po steri or al m uest reo co nte m pla materias del siguie nte o rde n.
Coliicoc wy digitacilI. Princip alm e nt e cerrar pr egun t as abiertas y generar

1.2,1. Decisiones previas al mu estreo

un a base de datos,

El momento previo al m uestreo d'


1'
_ Objeto de estudio F d
'Ice re acin con las siguie ntes ma terias.
.
un
me
nt
a
mente
es tablec er C Ud1es son 1as pregunt as de
investigaci n.

pesquisando er ro res de rango y consistencia.


1huam iellto de no respu esta. Se tra ta de identificar los tipo s de no respuesta
'i ap licar los procedim ientos de co rreccin co rrespo nd ientes.
PmuleTlu in y elevaci/!. Se pondera asignando pesos di ferentes a las un idades
r nucstrales. a fin de que no h aya elementos subrepresentados o sobrerrepresentados 'i se eleva m ult iplicando las un idades m uestrales po r un coefic ien te
pa ra obtener desde la muestra los valores qu e corresponderan a la poblaci n
origen de la muest ra.

Variabilizar:
Establecer definiciones no mi nal es )o' operacionales de los conce
ptos.
Poblaci/m. Definir cuales son los elementos
..
la que se realizaran infer encias
qu e componen la pob lacin de

Marco muestrol. Disponer del ma terial en ue f


I
.
Y q ue permitir su selecc in .
q
gu ran as unidades mu estrales
Ins tr umento de medida. mbito d . ,
.
..
..
d accton de las hiptesis e n t . . e a ~onstrucClon de Ind tces y escalas. Recuestio nario.
enmnos e pregun t as seg n el forma to de un

Recogida de i ntormaaon
{
.. , 1. as a1tcrnauvas a e t
personal , postal o telefnc El , '.
l' I s e respecto son e ntrevista
co m putador.
a. registro (e os da tos pu ede ser con lpi z o
Arlb'rramiento a encuestadores. Hsicamente f il ,
.
aplicacin del instrum t J > :xf d. e I ami lanz~r a los entre vistadores
Encuesta piloto. Se eva lan f~lco J"d' md'd ' I~ y a estrat egia de seleccin de casos.

a 1 a e instrum en to de m d' J J
d
'
e I ( J , a tasa e
no respuesta s, la var ianza J I " tabl
t
.
.
l
e
as
liana
es
marcado
ras
j' la organz "" d 1
fa b aj o ue ca mpo.
rzacton e
COti la

l fi

Depuraci1l de la base de datos: Bsicam e nte e valuar la calidad de los datos

La definicin de las et apas implicadas en la e ncuesta por m uestr eo evide nci a q ue


la realizacin de una encuesta es un pro yec to complejo, do nde concurren diversos
saberes y habilidades con el propsito de gene rar UII prod ucto cor rect o. En algunas
de estas tareas nada tiene qu e decir la teora de m uest ras, por ejemplo, elaboracin
del instrumento de medida o realiz acin del trabajo de cam pe. Sin emhu rgo, un
cum plim iento Insatisfactorio de IJS tar eas anexas inva lida el rcsuu ado, au nqu e
se utilicen procedimientos sofisticados para la sele ccin de ele mentos.

17

G rfico l . Etapas de la encuesta por muestreo

1.3. Poblacin y muest ra

rrl"gUl1t~ deI

Cebe preguntarse por q u una muestra y no un o-nso en el que se mid en todos


105 dcment0s de la poblaci n. Dos razo nes justifican la pe rtinenci a del uso de
mues trJs. La pri me ra es obvia y dice relaci n co n el menor costo co m parativo de
una e ncuest a. La segunda razn es menos evdentc. La e xper iencia ensea quc
ur.a m uestra es m s precisa en b estimacin de los valo res poblaco ncles que u n
censo Para explicar esta paradoja es preciso diferenciar er rores de m uestreo y
er,ores ajenos al muestreo.
Error de muesrrev. Se produce co mo res ult ado de me dir infor ma ci n de un
subco njunto - m ue st ra-, co n d objeto de esti ma r valor es correspo dcrues al
c,njunto - pohlacin. En conSKUenC13, es un e rro r p roducido por la naturalez a
misma de la infe rencia.
El nmero de muestras de tam ao n posibles de se [eccionar en una poblacin de

lnv~ti~~ci~ I
'---r----l
I

0""

"i~,""'"I

Ma rco mu estral

Cuestionario

Di$C'oo muestra]

tamao .N corresponde a la

ApliucOn de
la encuesta

I
I

Plan de an;ilisis

Digiucin

I
Depuracin base de datosl--

Tratamiento> estadisticcs 1_
I

Proc('Samiento
computacional

~~I'J(in y elevaoon

y-

Proccd;~nit'ntos d-... no
r"i~..!~

I
I

Sald os
complIt:ociona!t'S

inves tigacin

Pregun ta de

I
Informe

I
I

co mbinacin[~'.

El erro r de m uestreo se produce por q ue se infi er e a la pob lacin desde slo


una muestra de tam ao n
La magn itu d de l error de m uestree varia e n funcin de un conju nto de- [a crores, Por ejemplo, el er ror de muestreo disminu ye." cuando la muestra es grande,
y ste aumenta cuando la dispersin de las variables som et id as a m edici n es
grande. Los ce nsos no presen ta n error de m uestr eo.
Error oieno al muestreo. Se origina en el co njun to de o pe raciones que se realizan en el p roceso de recogida y alm acenami ento de informacin .
La magnitud del e rror ajeno al m uestr eo d e pe nde b sicamente del n mero
de observaciones regtstradas. En co nsecuencia, el er ror ajeno al muestr eo es im porta nte en un ce nso y m eno r e n una m uest ra. Son fuen te de e rro r la aplicacin
del instr ume nto, la codificacin y la dgit acin de los dat os.
Los e rro res de muestreo)' ajenos al muestreo so n una dificu ltad p :lra co nocer
el. valor exacto del parm e tro en la poblaci n. La e xperiencia ensea qu e los
errores de m uestr eo son m en ores a los err o res ajenos al m uestr eo. En co nsecuencia, u na m uestra bien dis eada permite estim ar el parmetro pobl acio nal co n
en err or asociado me nor qu e el producido e n un censo . En ste se acu m ulan
errores debido a la ca ntidad de info rmaci n m anipulad a. Paradjicam ente las
oficinas ce nsales utilizan muestras pa ra est imar los valo res de la po blaci n, a fin
de m ejo rar los result ados producidos por el censo.

l A. Erro res siste m t icos


La calidad de la info rma cin generada m ediante la e ncues ta po r muestreo es decisiva po rq ue condiciona la efICacia de la infe-ren cia . En efec to, la sofisticacin de
los procedimcntos estadsticos ut ilizados para generaliza r los dat os de la mues tra
a la poblacin resulta n In tiles si la infor m acin es sesg ada y no re prese nt ativ a.

."

Cabe des taca r que el ter mino e rror e n di seno de muestras no siempre es
sinni mo de falla o deficienci a. Por ejemplo, el e rro r de muestr eo es in her en te a
la inferencia y gene ra la inevitabl e imprecisi n e n la est imacin.
En el mb ito de e rro res sistemticos o ajenos al muestree cabe disti nguir
Jos fuentes de error. A sabe r, errore-s po r no observacin y errores de m ed icin .
En ambos casos la m uestra es con formada lesion an do la e xigencia de rep resen rat vldad.

1.4 .1. Errores por no observacin


La observacin incompleta de las unidades q ue componen la poblacin objetivo
es una fue nte de e rro r que incide e n la injer encia. Los e rro res por no obse rvacin
tie ne n diversos o rge nes. Cabe desta car e rro res ori ginados en el marco muestral
y errores de 110 respuesta .
El marco muestral gene ra errores ele no cobe rtura cu ando no incluye a tod a
la poblacin m arco por deficiencias de act ualizac in ti ot ras.
Los error es de no respuesta se produce n cuando elementos seleccionados
respo nden parcialme nte o estn inhabilitados po r razo nes de salu d u otras para
contesta r un cues tio na rio.

representati va cuando reproduce parcialmente la dist ribuci n de frecuencias de


cierta s variab les selcc conadas ad hoc.
Las caractersticas de la poblacin que sirven para contrastar la representa nctdad de la m u es tra se denominan variables marcadoras. En gene rallas var iables
marcador as so n variables so... odemogrficas que tienen valor es co noc idos en la
pobla cin or igen de la muestra . Se asume que la re presen tativ ided de la m ues tra
vale pa ra las variab les marcadoras y nada se asegura e n relacin a otras variables
de investigacin .
Nt ese que la representatvidad en una muestra seleccio nada al azar no puede
ser co nocida. El azar no es garanta de rep rescnrauvtdad.
El azar; sin embargo, es la piedra angul ar de la infere-ncia estad stica . Los
sesgos se an ula rn mutuam ent e cuando se selec cion a alca to riam ente un numero
grande de e le me ntos ind epe ndi ent es
Nada garan tiza q ue una m ues tra sea representat iva. El aza r slo pe rmite tener
esperanza que esta eventualidad oc urra.

1.6. Resumen histrico

La representat tvdad es una propiedad qu e debe carac te rizar a toda m uest ra. Se
trata de una cualid ad de las m uestras qu e permite reproducir a esca la los atributos de la poblacin y, en cons ecuencia. perm ite inferir a la poblacin ori gen
de la muestra .
No existe una definicin formal de q ue es 10 qu e se entiende por represt'n
tativdad y tampoco se pu ede establ ece r con exact itud cuando una muestra es
represen tat iva y en que mome nt o J eja de serlo.
La prctica e nse a qu e es m uy dificil q ue u na m uest ra reproduzca exactamente los atributos de la pobla cin . En gene ral, se asume que la m uestra es

Los orgenes de la encu est a po r muestreo se remontan a las inves tigacio nes
empricas reali zadas en el siglo XIX en el contexto de las m on ografas soc iales
medi ant e enc uesta realizada.. por precursores com o Charles Booth y Sidney
\ Vebb. Existen antecedentes remotos de es tudios mediante en cue- ra. sin embargo son ajenos al m odo en que est os se realizan e n la act ualidad . Ntese q ue
los trabajos ernpiricos realtzados e n Ingla t err a a fines del siglo XIX coincide n
temporalm ente co n los desa rrollos estadsticos im plem e ntados por Galton,
Pea rso n y Spearm an.
Cabe des tac ar q ue el Instituto Internacional de Estadistica e n la reunin de
Berln en 1903 m anifest su apoyo a los desarrollos incipientes de lo q ue llam
mtodo represe ntativo. Sin embargo, slo e n la re unin de Roma en 1926 se
elabo ra un inform e en que se reconocen las ventaj as de la infe rencia estadstica
como procedimiento para la estimacin de pa rmetros poblaconales.
El uso de encuestas por m uest reo se populari za e n las primer as dcadas del
siglo xx a part ir de los estudios de intenci n de voto real izados en Estados Unidos
por age ndas e..pccat zada s e n est udios de opinin . Ca be m e ncio nar a George
Ga llup, Elm o Roper y Archi vald Crosslcy
El inicio de los procedimientos modernos de selec cin de elementos y estim acin de par m etros es el art culo publicado po r .lcr zy N eyman ( 19~4) en la
revista de la n aya l Statstica Suci!'/}' de Londres con el titu lo O tt '/l O Different
Aspl'Cts 01 the Represer uatve A,fetllOds. En este articulo Neyman fu ndament a qu e
la seleccin aleat oria es la ha:..e para formular u na teo ra cie ntfica que permite la
inferencia de datos muestrales a valo res poblaconales En particu lar, demuestra
que es pos ible co noce r la precisin en la est imac in de valores poblacic nales a
part ir de datos de la m uestra.

20

21

1.4.2. Errores de m edicin


Cabe m encionar Jos fuentes de erro r: instrumento de m edida y efecto entrevistador.
El instru mento d e me dida es fuente de erro r a raz de la opereco nahza ct n
de lus nociones qu e so n sometidas a m edi cin. H ab it ualme nte se trata de con ce ptos abstractos y vago s que no so n rncdtbles directamente y pa ra los cuales se
deben elaborar Indlces y escalas.
El efec to de l entrevistado r es de d ificil tratamie nt o, por q ue se prod uce lnd epen dentemen te de la voluntad y sin co noc imie nto del sujeto qu e lleva a ca bo
la entrevista.

1.5. Rep resentatividad

El reco noc im iento en el mbito universitario de la madurez de la teora de


mu estras se evidencia co n la implemen taci n de las primeras ctedras univ ersita rias en la d cada del 40 del siglo pasado. Particula r rele vancia tuvo e l Instit uto
de Investiga cin Social Aplicada de la Universidad de Columbia dtngtdc por
Paul Lazarsfeld
En el tra nscurso del siglo xx, desde varias latit udes se impuls el desarroll o
terico y la ap lica cin de la teora de m uestras. En la India se forma una escuela
bajo la tuicin de P. C. Mah alan obs. en Ingla terra Sir Ronald Fsher fo menta e l
030 de los pr ocedim ientos de muestreo, la escuela sueca se desarrolla impulsada por T. Dalenius, en la Un in So vitica el desa rro llo d e la teora de m uest ras
crece influen ciad a por A . A . T schuprow, los Estados Unidos particip an en este
desarrollo con el im p ulso de W. E. D em ing y W. G. Cochran
A juicio de Azortn ( 1972), durante los aos 19 49- 1954 se co nsolid a el proceso iniciad o con la p ublica cin del articulo de Jerzy Ne yruan co n la edicin de
textos hoy cl sicos. Los m s im portantes y au n vigentes son los libros de F. Yates
(1949 ), W_E. D em ing (1 9 50 ), ~:1. H . Ha nsen, W. N. Hurwitz y W. G. M adows
(1953) y P.V. Sukt hame (1 954) .
Un indicad or del desa rrollo instituc ional del diseo de muestr as es la fun dacin en 19 71 de la lruerncuional A sociatio'l o[ Sampl ing Statisricums. C ebe
d..stacar que a principi os del siglo XXI co ntaba co n cerca de 2.000 mie mbros de
m as de 100 paises.

Captu lo 2

Con ceptos b sicos

La nom en clatura asociada a la encuesta por muestreo ha sido pr esentada en


diversos t extos. La relativa juve ntud de la d isciplina ex plica que no exista a la
fech a una terminol oga n ica y universa lmente aceptada.
A fin de estab lecer bases co nceptuales ineq uvocas se definirn dos glosarios. A
saber, uno referido a disen o de muestr as y otro re lativo a Infere ncia estadstica.

2.1. G losario de diseo de muestras


Diseno de muestras. Saber relativo a u n conj un to de materias que permiten inferir
de una muestra a la poblacin or igen de la muestra . Cabe destacar a t.-ste resp ecto
el pr ocedimiento de seleccin de ele me ntos, clculo del tama o de la muestra,
decisin respecto al er ror de estim aci n y tratamien to de la no respuesta .
Poblacin. Corresponde al agregado de ele mentos resp ect o de l cu al se rec aba
ir.form acin. Los elementos. son un idades e lementales somet idas a medici n.
La bibliografa ut iliza indistintamente los termina s poblacin y universo. A
juicio de Kish ( 1972) y Tang (1 951) , am erita distin guir e nt re uno y otro. Tang
denomina poblaci n a un conjunto de n meros y uni vers o al conjunto de e nt es
que son medidos pa ra su n um eraci n
Poblacin objetivo. Corresponde a una parte de la poblacin . La poblacin
objeti vo excluye de la pob lacin ele ment os que son el.. difi cil acceso o muy
onerosos de encuestar. Por ejem plo, siendo la poblacin los ciudadanos m ayores
de 18 aos, se de fine como poblacin o bjetivo aq uello s Ciudad anos que vivan en
entidades co n ms de 2.000 hab it antes.
Poblacion marco. La poblacin marco es una par te de la poblaci n objet ivo.
Se e xcluyen de la poblaci n objetivo los elementos que no so n encuestados po r
marco insufi ciente o falta de cobertura. Po r eje m plo, siendo la pobl acin objeti vo los suscri ptores de una revis ta, la poblacin marco se define co mp uesta po r
suscriptores que se han susc rito 10 das antes de disear la muestra.
Poblacin de encuesta. La poblaci n de encuesta es un a parte de la pob lacin
marco. Se excluyen de la poblacin marco los d istintos tipo s de no respuesta. A saber,
a.rsenca de domicilio, enfermed ades nhabiltantcs, negacin a responder, et ctera.
M a rco m uestra]. Los insum a s utili zados para ide nt ificar cada una de las un idades de muestreo componen el m arco muestr a!' El marco muestra ! permite

enumerar las unidades de mu estreo para su po sterio r selecctn. Se entie nde


po r m arco mu estra] el ordenamien to de 13s un idades de muestreo, sean st as
e lem entos o grupos de elementos.
Los insume s q ue hab itualm ent e se utiliz an para co nform ar e! marco de la muest ra son listados de indiv iduos (clientes de un ban co, abon ados a telfo nos, re-gistros
elec to rales), listados de m anzanas, listados de di stritos censa les, map as y planos.
Mu esrrtl. Corresponde a una colecci n de unidades seleccionadas de un a
poblac in con el fin de est imar los valores q ue caracterizan a la poblacin . Los
diferentes di seos muestrales refieren a dsuntos m odos de orde nar y selecciona r
los elementos.
Oomillios y subclases. Se util iza el t rm ino dominio para refe rirse a subdivisiones de la poblaci n y el t rm ino subclase p ara indicar subdivisiones de la
muestra
Un dominio es una subpobladn para la q ue se disea una muestra independiente. La muestra de la po blacin co rrespond e al conjunto de las muestras de
los do minios. Ejemplos de do m in ios son subd ivisiones de la poblaci n en reas
- urbana y ru ral- o re gio nes - norte, centro, su r.
Un a subclase es u na divisin de la muest ra en fun cin de ca tegoras de variables. En general las subclase; se establecen en func in de variab les de clasificacin .
k, por eje mplo, subclase segn las categoras de se xo o estado civil.
Elemento. Un demento co rresponde a una observacin q ue forma pa rte de la
poblacin y q ue puede ser medido para par tici pa r e n la m uestra. Es una unidad
ele me nta l no div isible.
Unukt d de mulisis. La unidad q ue es objeto de estudio es la u nidad de an lisis. Las unidades do' an lisis pu eden ser individ uos o grupos. Co m nme nte so n
ind ividuos, sin e mbargo p ueden ser agrupaciones de individ uos, como fam ilias,
sindica tos, clu bes o co m unas.
UniJwJ de observaci n. Los elem en tos o gru pos de ele me nt os de los cuales
se recoge inform aci n son las unida des de observacin . No rm alme nte unidad
de obse rvacin y un idad de an lisis coi ncide n, sin em bargo no necesariam ent e
es as. Por eje mplo, la unidad de ob servaci n puede ser el je fe de hogar del c ual
se recaha in fo rm aci n de todos los m iembros del hogar, y unidades de anlisis
pu ede n ser los miembros del hogar q ue votar n en la prxima clcccn .
Unidad tle muestreo. $(' e ntie nde co mo unidad de muestreo al elem ento o
co njunto de ele me ntos qu e se selecc io nan en una etapa del mu estreo. En los d isea s simples - slo u na et apa- j Ia unidad de muestreo y el elemento coinci den,
y en los dise os co mplejos - m s de una et ap a- las unidades de muestreo est n
com puest as de m s de u n elem ento.
La disti ncin unida d de muest reo y elem en to propia de dise os complejos se
puede ilustrar co nlus siguientes ejemplos. A las unidades de muestreo vivienda y
sindicato le correspon de n los elem entos habi tante s de la vivienda y t rahajador es
sindi calizados.
N tese qu e en m ue streo aleatorio sim ple coinciden unidad de muestreo y
ele me nto.

24

2.2. Glo sario de inferencia estad stica


Inferencia estadstica. La inferen cia d ice relacin co n el paso de lo particular a
lo general. La inferencia estadstica co mprende al con jun to de p rocedimien tos
estadisticos qu e per m it en generalizar los resultados de la muestra a la pobla cin
origen de la muestra.
A leatorio. Se d e fine como aleato ria la se-leccin de elementos en la que c ada
uno de stos tien e una prob ab ilidad conocida y di stinto de O de ser selecc ionado.
En este context o aleator io se usa como sinnimo d e probeb ilisnc o.
Variable. Se entie nd e como variable a un a m agnitud que asume distin tos
valores. En particular, varia e n un ra ngo de valo res conocidos. Una variab le
aleat oria est defi nida po r u n conjunto de valor es y, adems, po r una funcin de
prob abilidad que exp resa pa ra cada valor la pro babi lidad de ocurrencia.
Distribucin de probabilidnd. Co rresponde a la distribucin de valores de
una variable aleatoria que tien e asociada la prob abili dad de ocurrencia de cad a
suceso x. N tese que el suceso pu ede se r un valor de la muestra o u n estadstico
muest ral.
Disrribucin muestrol. Se e ntiende como dist r ibucin muest ra! a la distribucin ter ica de un estadstico e n tod as las m uestr as de tamao n posibles de
obtener en una poblaci n de ta mao N (n< N) . La distribucin m u estra] de- un
estadstico permite conocer la proba bilidad asoci ada al valo r que asume el est adstico m uvstra l en cada una de las muestras de ta mao 11
Teorema del limite central. En los teo rem as de lim ites subyace la perspecti "a frecuencialista de probabilidad . En particula r, el teorem a del lmi te central
hace refer encia a la distribucin de las medi as muestrales. Permite co noce r la
dist rib uci n de las medias rn uestrales y est ab lecer grficame nte el modo en que
stas se dist rib uye n. Se puede enunciar se alando que la distribucin de m edias
muestr ales extra das de forma aleato ria, independien temente de la distribucin
de la poblac in, se aproxima a la di stribuci n no rm al a medida qu e au me nta el
tamao de la muestra.
Ley de losgrandes numerosoLa ley dbil de los grand...s n me ros establece que
la dife rencia entre el estadist tco rnucstrul y ('1 pa rmetro po blacion al tiende a
O cua ndo el tamao de la m ue stra tiende a infinito. La ley fue rt e de los grandes
n mer os est ablece que c ualq uie ra sea la dist ribuc in de una variable en la po blacin, la distribucin m uestra] de m edi as de la varlahlc en m uestras de tamao
n se distribuye segn la ley normal.
Parmetro. Un parmetro corr esponde a UIl valor descono cido de la poblacin
que es estim ado por un valor conocido de la m uestra .
Estadstico. Se define CO ntO cst adtsuco a un valor calculado a partir de los
valore s muestrales con el propsito de esti mar el valo r de un para metro de: la
pob lacin.
Estimacin. La esti ma ci n dice relac in co n el p rocedi m iento de inferenci a
que utili za datos mucstrales para estima r un par m et ro poblacona l. Co rrespo nde
a la regla mediante la cual los valores poblcc o nalcs son est im ados.

25

Estimador: El estimado r es un valor m uestra] u tilizado para estimar el valor


de .un parmetro poblactonal, Ea es te contexto la media muestra! es un bue n
est im ado r de la media po blacion al.
Err,or de muest reo. Correspondo:' a la diferencia entre el valor del p ar metro
poblaco nal y el valor del est adst ico muestra! utilizado co mo est im ador. Error
que no es co nocido y es gen erado como Consecuencia de las f1uetua~-iones del
m~estr~~. Se utilizan equivocadamente como silloni mo'> los t munos e rror de
estimaci n y e rror de precisin .

E~r ~pil."'O de estimacin. Mate m til.:arnl'nte es la raiz cuadrada de la varianza


de ,la ~l~tflbucin terica form ada por los distintos valor es que puede asumir el
estadlstlco,.D ado el es tadstico medi a muestral el error tipico mide la dispersin
de las m edia s m uestral es.
~rr?r mximo adm isible. Valor decidido por el investigado r q ue define la
precisron de la inferencia .
.
Imervalo de confianza. Int ervalo acotado por un valor infe rior y superio r
do:'nt ro.d d cual se esuma q ue est tnclutdo co n ciert a p rob abilidad el pa rm etro
p oblaciona] ,

~ilJel de con~nza [1-0). El ni vel de confianza expresa en trm inos de probabll,ldad q.ue e! inter valo de confi anz a incluir el parmetro poblacional.
} robdb7.lI~ad de error (n). Cor responde a la prob ab ilidad que el inte rvalo de
co nfian za no incluya el valor del parmetro poblacic na].
C::oefuiente de cQlljWnza. Valor en la abe isa de la curva norm a! estandarizad ...
asoc iado a un determinado nive] de confian1.a.

Captulo 3

Tip os de m uest reo probabilsti co

1.3 disti ncin fun dame ntal en re laci n con los procedimientos u tilizados pa ra
selecciona r muestras dc e relaci n con la probabilidad de selecc ionar a los el, 'mentos q ue constituirn la muestra. As, se dist ingue entre muestr eo pr obabilstico,
no prob ebtltstco y cuasi prcbebtlsuco,
Los m uestreos probabils ticos son estrategias de selecc in de ele mentos q ue
se suste ntan e n el principio de selecci n aleatoria . En la prct ica esto signi fica qu~'
todos los elem en tos de la poblacin tienen un a probabilidad co nocida y distin ta
de O de pe rte nece r a la muestra. La aleato riedad no es a tribu to de un a muestra,
sino del proceso de se leccin utilizado.
Exist en diversos proced imi entos de m ues treo probabilistico. Las diferencias
tienen q ue ver con el mojo en q ue se seleccionan los e lementos y co n la precisin de las est im aciones. N tese qu e un d iseo muestral pu ede incluir mas de
un procedim ien to de seleccin de ele me ntos.
Los muestr eos probabilsti cos de uso co m n se rese an bre veme nte a continuacin.
MW'srreoA leatotio Simple (MAS) . Proced imien to de m uestreo bsico y fundame nt o de otras est rategias de seleccin de m uestra . Se carac teriza porq ue la
selecc in se rea liza de un list ado de la po blacin asign ndole igu al proba bilidad
a cada elemento, Adems cada muestra de tamao n tien e igual probabilidad de
ser seleccionada. Es el prototi po del muestreo equprobable y autopond erado
Se di st ingu e entre MAS sin reposicin y co n repo sici n. M uestr eo sin reposicin porque una vez seleccionado un elem ento no se puede selecc ion ar
. nuevam ente. Muestreo con reposici n porque un elem ento selecc ionado puede
ser selecc ionado posteriormente.
Normalm ente M' usa MAS sin reposici n Las frmul as so n rn s sencillas y
en la prctica los res ultados no difieren . En efecto, ambas alte rn ativas producen
resultados casi iguales cuando la muestra es un a fracc in pe q uea del ta ma o
de la poblacin.
En la b ibliogra fia se utiliza n distintas denominaciones: muestreo rrestnctamcnte aleato rio, muestr eo equtprobabilistico y, lt im ame nte, diseo muestra]
simple como opuesto a d iseo mcestral com plejo.
M uestreo Sistem tico (MS) . Se trata de una variante del ~IAS. El propsito es
facilitar la selecci n de element os cu ando la poblacin es un list ado de mo chos
casos y la seleccin se realiza mediante tabla de n m er os ale ato rios. En este

27

contexto se elige un p unto de arran que aleatorio y se seleccio nan casos e n fo rm a


su cesiva segun un intervalo num rico convenci onal.
Muestreo Estratificado (ME). Procedi m iento m uestra! q ue se car act eriza por
la utilizacin de inform ac i n auxiliar para mejorar la eficien cia e n la seleccin
de e le mentos y mejorar la precisin de las est im acio nes. La infor m acin aux iliar
co rres pon de a varia bles de estratificaci n-sexo, regi n, estado civil- qu e div de n
a la poblaci n en estratos. Los est ratos son grupos homogneos de elementos por
lo que no es preciso selec cionar un n me ro elev ado de casos para represent ar al
estrato. Mie ntr as mas hom ogneo sea el estr ato ms p rec isa sera la estima cin.
M uestreo por Conglomerados ('vIC). Procedim ient o de muest reo q ue ab re
un abanico de posibilidades relacionadas con los muestreos por etapas y muestr eos complejos. Este procedimiento se ca racteriza por constituir unidades de
muestreo co m puest as por un agregado de eh-mentes. Cada grupo de elementos
constituye un conglome rado.Todo conglomerado est co nstitu ido por un conjun to
de ele m entos con valor es diferentes en tre s en la variable med ida para for m ar
cong lome rados. Un a pe culi arid ad del m uest reo por conglom erados es que no se
requi ere el listado de todos los elementos de la poblacin para disear la muestra .
Muestrro Polietpico (MPE). El procedimie nto polietpico es un diseo complejc caract erizado por la seleccin de muestra s en etapas sucesivas. Las unid ades
de la primera Na pa - unid ades pri marias de m uestreo (UI'M)- S('n potenci alme nte
divisibles en la segu nda e tapa - umdades secundaria s de muestreo (USM)- y en
etapas posterio res
La selec ci n de cada et apa requiere de un ma rco muestral propio. El marco
de la primera etapa pe rmite la selecci n de las UPM. En cada UPl\1seleccionada
se requie re de un marco para seleccionar las US ~1. El ma rco m uestral de cada
US M perm it e seleccionar elementos de la te rcera etapa, y as sucesivame nte.
Muestrea Polifsico (MPlJ El uso de este procedi m iento sv jus tifica cuando
se req uiere d istinta informaci n de una m isma m uestra y el costo de los tipos
de informacin requerida es sustancialmente distinto. Se caracteriza por una
primera fase con ta m ao de muest ra ma yor y una segunda fase de recogida de
informadn adicional que corresponde a una fraccin de la muestra mayor.
Muesrreo am r robalJilidaJ Proporxional ol 1Cmwo (1'1'1]. Los procedimientos
de m uestreo prob abi lstico permiten q ue a cada elemento se le asignen probab ilidades iguales o des iguales de sele ccin. En MA S y MS las probabilida des de
selec ci n so n igu ales.
El muestreo PPT considera informacin auxiliar, a fin de realizar con m as
eficacia la estimacin de l parmetro poblacional . En particular, se considera el
tama o de las un ida des m aestrales cuando estas va ran en tam aos y stos son
con ocidos Se justifica el uso del proced imient o PI'T cuando existe relacin en tre
el tamao de las u nida des muestrales y la mate ria q ue es som et ida a'medicin .
Por ejem plo, estudio de ingresos con em presas de distinto t am ao y salario asoci ado co n el tamao de sta s
Muestrearon Rplil:a.s (MR) . Se caracterza este proced imien to por IJ seleccin
de m as de u na muest ra e n una m isma pobl acin. En particula r, se seleccionan

28

- - nde~ndientes entre si que e n co njunto suman el t amao


muestra s pequenas I
.- .
.
des u
d na sola muestra mayor.Cada muestra pequea e,s una r plica ~'.to .15 tl~nen
e u _ d arn crrce
t e eel m ismo ta ma o Dos razo nes just ifican esta opere n: necestdad
aproXln1a
de resu ltados prelimin ares y mejorar el err or uprco de la estimacin.
.
Muestreo Longinulinal (ML) . Proc ed imiento de muestreo qm.,: .se c:l r~c te fl Z a
- -- d e una
na misma
m po rales isuccs
por 1ame d reten
... poblacin en pe riodos
. .te.
d _ . VO $. Se
ha utilizado el anglic ismo punei para identificarla . El t.ermmo ~ane e5lg n J a un
ru o d... personas seleccionadas co n e-l propsito qu e sirvan de Jurad o. La ~~estra
ron~itudinal se usa co mnme nte en est udios de m ercado pa r<l ha cer seguunwnto
en la pe rcepcin de servi cios o produ ctos.
J

"

,.._.

Captu lo 4

Estimadores del parm etro poblaconal

Los esteds ncos m uestrales son valores q ue nos perm ite n esti m ar los par metros
pcbbcionales. Se tr ata de valores calculad os en la m uestra q ue operan corn o rcfe re:lcia em prica del valo r desco nocido co rrespond iente a la poblacin.
En virt ud de la fun ci n q ue cumpl en, los estadsticos maestrales son conocidos
como estimadores. En principio pueden obtenerse infinitos valores para est imar un
parmetro p obleco n al.As t, por ejem plo, para estima r la m echa de una poblacin se
pued en usar divers as combinacio nes d e valo res de una m uestra. Sin e mb argo, para
cada parmetro poblacicnal existir un estadstico rnuestral q ue es su mejor estimado r.
Ntese que un estim ador es un suceso aleatorio q ue asume diversos valores co n
proba bilidad~s distintas. En efec to, en C.I..:L muestra de tama o n ex tra ida de una
poblacin de tam ao N, d estim ado r asum id un valor di fe rente, En co nsecuencia,
un estim ad or vara en form a aleator ia en to rno al parmetro po blc co n al. As, por
e jemplo, la m edia mu estral de cada una de las m uestras se ap ro xima en d istinto
grado al valor pa rmetro poblacional.

4.1 . Propiedades de los estimadores


Cabe p regu ntarse, po r q ue se util izan c ie-rtos estadstico para estimar los co rrespondientes par metros poblacicnales? En pa rt icular, po r qu e se ut iliza la
media mucsrral para esti ma r la med ia poblacio nal? La re spuesta es q ut' la media
maestral es el mejor estim ador de la m edi.r pobl aco nal .
Los estimad ore s prese ntan un conjunto de propiedades qUl' perm iten evaluar su pertinen cia en la estimacin de l parmetro pobleconal. La teo ra de la
estimacin ha estab lecido cules son los atributos que ca ract eriz an a un buen
estimador. En par ticu lar, se se ala que un buen estimador deb e ser tnsesgado,
consiste nte, c~ch:'ntl', suficiente y resiste nte.

4.1.1. Estimador insesgiuo


Un estimador es nsesgad o cuando la espe ranza m atemtica del estima dor coincide
COn el valo r del parmetro poblaconal. Es deci r, cu an do el valor pro medio de la
distribucin de pr obabilidades gen era da por los estadsticos muestrales asu m e
el m ismo valor que el valor de la pobl aci n.

31

Se demuestra que la media m uestra] y la proporcin muestral son estimadores


tnscgados de los co rres pondientes pa rmetros pobl ac tonal cs.

E(')

="

E (P) = a
E (P) =

(4. 1)
=

(f"]
q.,;-

(4.4)

~ di",)

t,

=-'- E(i:XJ
TI

.~ I

=![ exJ]
TI

.~,

E
(4.2)

eaJ = Na

L ~=

(4.5 )

... 1

llevando (4.5 ) a (4.4)

Llevando (4.2) a (4.1)

E (P ) : -l

eO

'

~)t : - T1Jt ::: 11:

TI i ~1

(4 .6)

ti

Respecto a estimadores sesgados, se demuestra q ue la varianza mue-stra] es un


estimado r sesgado de la varianza de la poblacin . Asi tambi n el coeficie nte r
de Pearson es un estimador sesgado del coeficie nte en la poblacin -excepto
cuando el p ar metr o es: O.

4.1.2. Estimador consistente


Un estimador es co nsist en te si el valor de la es tim acin tie nde a coin cidi r co n
el valor del parmetro, cuando el tamao de la muestra t iende a aproximarse
al tamao de la poblacin . En un estimado r consistente la probab hdad ( 1\l C' el
estimador coin cida con el parmetro poblacioual es 1 c uan do el tamao de la
muest ra aum ent a h ast a coi ncidi r co n el ta m ao de la poblacin . Se demuestra

32

33

qu e la media 'f la pro porcin muest ra] son est im ado res consi stentes de los respect fvcs p ar m eu 'J S poblaconales. Ambos esta dsticos so n consiste ntes en virtud
de 1.... ley de los gra nd es n me ros.
Se puede formalizar la propiedad de consiste ncia de la m edia (x) est im ado r
de un parmetr o (~) en los siguien tes trminos.

P (Ix-

~l

1> ;;) -- O c uando n ..... 00

(4. 7)

La p robabilidad que la di fe renci a entre la m ed ia m uestra! y el parm etro pobl acio nal sea m ayor que un nm ero cualqucra j; tie nde a O c uando el tamao de
la muestra tiende al tamao de la poblacin .

4. 1.3. Estimador ejiciente


Un est im ador es eficie nte en terminas absolutos cu ando es el estimador de menor
dispersi n entre todos los estim ado res msesgado s del par m et ro. Por otra parte,
un estim ador es eficiente e n t rm inos re lativos cuando, com parado con otro
estimador, se establece q ue presenta menor dispersin respecto al pa rmetro
po blacional. En general, un est imador se ca ract eriza como relativamente m as
eficiente cuando sus estimaciones son m s prximas al parmetro pobl aci on al
qu e las de otro estima do r.

4.1.3.1. EFICIENCIA AII SOl.trrA


P... ra est udiar la eficiencia absol ut a se compara la cfic enc a de cualquie r estimador en relacin al d e m nima dispersin . As, po r ejemplo, siendo e",,,, y e"...
est im ado res de varianza mnima y varian za otro la expres in de la eficiencia
abso luta es la siguien te.

fj (lb = var (e )
var (e )

(48)

Se pu ede conocer el estima dor de varianza mnima utiliza ndo la desigualdad de


Cramcr -R eo. Se demuestra m edia nt e este proce dim ie nto q ue la m eda mu estra!
es un esti mador eficiente de la media pc blact ona l.
4.1.3 .2 . EFI CI ENCIA REI.A"IlVA

Para verificar la eficien cia rela tiva se comparan las varianzas de dos est im adores.
As, po r eje m plo, los estimadores e J y el con varianzas 2 y 4, respect ivame nte,
permiten la siguiente conclusin a este respecto.

(4.9)
Se d.:=duce que para el mism o ta ma o de m ues tra la eficcnca relativa de
respecto a e l es <\(.,150%. Es dec ir, el es la m itad de efictentc.

el con

4.1.4. Estima dor suficiente


Un estimadllr es suficie nte si utiliza la info rm acin muestra] en forma exte nsa,
de modo qut' ning n otro estimador logra con la m isma muestr a una mejor estimacin del parm et ro poblacional l .a media aritmt ica ruu cstral es un estim ado r
suficiente de la m edia aritm tica pobla cional , porqu e otros posibles estima dores
-media geom trica, media arm nica- no utilizan toda la inform aci n rnu r-stral
como la media ar itm t ica para estim ar el parmetro poblacional. Se de m uestra
que la pro porcin m uestra] es un estim ado r suficie nt e del valor de la proporcin
en la poblacin origen de la muestra.
Para evalu ar Id sufi ciencia de un csurnador se utiliza el teorema de fa..- torizacin.

4.1.5. Estimador resistente


Un estimador es resisten te si no se ve afectado por la presencia de valores an malos. Los valores an malo s in cide n nega tiv am ente e n la calidad de la inferenci a.
Se usa el trm ino anmalo para designar valores aberran tes y valores contami-

nantes. U n valor aberrante es un valor discor dante co n los dato s q ue co mponen


la muestra. Por ejemplo, un valor extremo. Un valor es co ntaminante cuando es t
presente en la mu est ra no siendo pa rte de la poblacin objetivo.

4.2. Procedim ientos para generar estimadores


U teora de la est imaci n ha est ablecido que las propiedades antes mencio nadas
caracteri zan a un bu en estima do r.
Establecid as las propiedades cabe plant earse c mo se co nstruye n estimad or es
que satisfagan tale s pro piedades . Los desarrollos de las ltim as d cadas perm iten en um erar div ersos mojos de co nst rucci n de estimadores. Procedim ie ntos
clsicos son h mxima verosimilitud, el m todo de los momentos, los mnimos
cuadr ados y el mn imo X~ cuadrado,
El procedimiento de m xima veros imilitud desarrollado por Fisher es el ms
popular, El estimador seleccionado pa ra estimar el parm et ro poblacionnl debe
SE'r el ms ver osmil, es decir, aqu el que maximice la ver osim ilitud. La veros imilitud es una probabilidad
Los parm etr os poblacionales son te ricos y los estadsticos muestrales cmp.ricos. Si un valor te rico conv ierte en poco probable un valor e mp rico ame-

rita d uda r del valo r teri co. En la disyuntiva de dferenca ent re el valor terico
y el valor emprico se duda del valo r terico. Los valores te ricos se su pon en
ve rdaderos slo si son refre nd ados po r da tos empricos. El estimado r mximo
verosmil sera aq uel q ue hace m xima la probabi lidad de coincidencia entre el
p arm etro poblaciona! y el estadstico muest ra\.
El carcte r poco intuitivo del procedimiento mximo ve rosm il im pone
ilustrar su lgica me diante un ejem plo sencillo que el uda las operaci ones ma temticas.
Supngase qu e el propsito de la Invesrigactn es estima r el C I. promedio
e n la poblacin de est udiantes de una Facultad. Para estos efect os se obtiene una
muestra de 60 estudi antes calcul ndose u n valor muestra! promedio de 115.
Ntese qu e si la selecci n es aleatoria las muestras ms sim ilares a la distribu ci n de CI. e n la poblacin t ienen ma yor prob abilidad de ser elegid as. Enfrentado
a la disyuntiva de decidir si la media poblaccnal es 100 115 130 , el investigador puede argumen tar q ue lo m s verosmil es que el prom edio sea 115.
En efecto, el pcrruetro poblacional mas pro bable o ve rosm il es 115 si el azar
ha facilita do q ue e n la m uestr a se reproduzca la di stribucin de C l. e xiste nte
e n la poblacin.
.
Se demuestra qu e la media y la proporcin son estim adores m ximos verosm iles. El procedimiento de m xima ve rosimi litu d perm ite ob te ne r est ima dores
co nsistentes, eficient es y suficien tes. No necesariamente in sesgados.

Capitu lo 5

Distr ibucin m uest ral de estadsticos

El concep to d e dist rib ucin d ice relacin co n los distintos valores que asume una
variable y la frec uencia o probabilidad que corresponde a cada valor.
Cabe distinguir distri bucin de una variab le e n la poblacin, d ist ribucin de
una variab le e n la muest ra y distribucin maestral de un est adstico.

5. L Distribucin de la med ia
5.1.1. DisrribucWlI e11 la poblaci n
La distribucin de una variable en la poblaci n se obtie ne m idie ndo cada elemento y estab leciendo para cada valor una frecuencia de ocurre ncia . Mediante
este procedimiento se puede establece r para la variable m edida una funcin
de distribucin . La funcin de distribucin se caracte rizar por los valores que
asume la variab le y la frecue ncia asociad a a cada uno de ellos.
En general las medi das realizadas en la poblacin se identifican con letras griegas
Si se tra ta de m edir la m edia dela poblacin la nom encla tu ra es la siguiente.
N ;::: Tam ao de la poblacin
J.l ;::: Media de la poblaci n

o ! = Varian za de la poblacin

5 1.2. DisrribucWlI en la muesrra


La distri b ucin de un a variab le en la m uest ra se obt iene del mismo m od o q ue
en la poblaci n. El res ultado de la medici n ser una funcin de di stribucin
que replicara la fu nci n d t ' di stri bu cin de la variable en la pobl acin . La replicacin no se r e xacta como co nsec uencia del sesgo de muestreo. C ada valor de
la m uestra te-ndr asociado una frecoenca de ocurr encia.
En gcoernl las m edidas realizad as en la muestra se ide ntifi can co n letras
latinas mi nsculas . \ propsito de la media de un a m uest ra la nomenclatura se
presenta a co nt inuacin.
n
x
sl

Tama o de la mu estra
Medi a de la muestra
Va rianza de la m uest ra

37

5.1.3. Distribucin del estadstico media muestral

Tabla l.

Media~

La distribucin m uestra] de un estadstico es una distribucin de probabilidad


constitu ida por cada uno de los valo res que puede asumir el esta d stico en todas
las muestras de t am ao n posibles de extraer sin reposicin en una poblacin de
tamao N. Da dos los valores d e la poblacin y la m uestra el n mero de muestras
posibles a extraer se calcula com o combinacin (~

j.

muestrales y probabilidaes asociadas

VJlorde :r

Probabilidad de x

1,0

1
25

1,S

2
25

2,0

Para ilustrar la idea se prese nta el siguiente gr fico.

2S

Grfico 2. Distribucin muestra] de medias.

2,5

Poblacin

3,0

5
25

3.5

4
25

I
muestra 1

[::J I

muestra 2

==:J

muestra h

C:"'",

2S

x,

X,

de medias

4,5

2
2S

5,0

1
25

Grfico 3 Histograma de medias mucstrales

D istrihudn rnuest rai

4,0

X,

25

P(')~------------,

La m ed ia es un est ad stico que se dist ribuye segn la ley normal. Se ve rifica


emprtccmente q ue los valor es de las m edias maestrales se distribuyen normal.
m en te.
A modo de eje mplo, su pngase que la po blacin esta com puesta de 5 d em entas:x;=(I ...S). Se extraen t odas las m uest ras pos ibles de tamao 2. El nmero
de m uestras posibles con reposicin es N":=S2",, 2S. C ada m uestra tendr un valor
de medid y una probabilidad asociada.
En la Tabla 1 se presentan los valo r" , que puede asumir el est adstico medi a
y la probabilidad asociada a cada valor. Una Tabla en que figure esta infor m acin
present a la distribucin m uest ra! de la media.
Para ilustrar grficamente la distribucin de la media se presenta el histograma
generado a partir de la info rmacin de la Tabla l . El histograma se ase meja a una
curva en forma de campa na . La curva de distribucin de m edias tiende a replicar
una campana de C auss a m edida que el tamao de la muestra aumenta.

"

1,0

1,5

2.0 2,5

3,0

3,5

4,0

4.5

5,0

La dstribucin rnues tral de la media puede conocerse em pricamente, segu.n


se ha visto, efec tuando do s operaciones. A sabe r, extrayendo toda.. las m uest ras
posibles de ta mao 11 de u na poblacin de tamao N y calculando Jlara cada
m uest ra la m edia y probabilidad asociada .
Sin embargo la misma conclusin puede obtenerse por procedimientos rnate mticos sin te ner que extraer todas las muestras de una poblacin determina,
da. Ejercicio ste imposible e n virtud que la m uestra es relativam ente pequea
respecto al ta ma o de la po blacin.
En efect o, Lapla ce demostr qu e las medias muestralcs se distribuyen segn
una curva en form a de campan a. Liap unov, mediante el teorem a del ln itc ceno
t ral, de most r que la dis tribucin muestral de medias de un a variable alea toria
se d istribuye segun la ley normal indepe nd iente me nte' de' la d istribucin que
asuma la variable de la cua l las medias muestrales son extradas. l.a condicin
para q ue se cumpla la distr ibucin normal de las m edias es q ue la m uestra sea
suficientemente gra nd e. Conve ncionalmente 1l>3 .
Asum ien do qu e las me dias m uest rales so n una variable aleato ria que se
distri buye segun la ley no rmal, am erita definir la curva normal asocia da a Id.
distribuc in muestra! de medias. Para estos efectos es; preciso conocer la media
y la desviacin tipica de la distribu cin.
La distr ibu ci n muestra! de m edi as m uest rales asume como m eda el valor
12,stral
del p ar~metro pob.lacio nal p y la.desviacin tpica d e la distrilll1cil'{ff
de m edi as -deoomtnad o erro r estndar o er ro r tipico- asu me el valor
( J . En

;*)

co nsecuencia, la media m uestra] se distribuye seg n una curva norm al de finida


en los siguientes t rm inos

N(lt

Se denomina tot al de clase al nmero total de elementos que present an el


atributo. La pro pN cin es el cuocente entre el to tal de clase A y el nmero de
observaciones N .

p_
Total d~_~
~_ = ~ _
- N m ero de observaciones
N

(5. 1)

El total de clase se puede exp resar en t rminos de sum ator ia de dementas.


N

(5.2)

A = }:ai

En virtud de lo cual la p rop orci n asum e la sigu iente ex presin.

(53)

La proporcin y la media m iden lo m ismo y tie nen la misma es truc tura algebraica.
En efect o, la pro porci n y la m edia son sum ato rios de los valores q ue asumen
las observaciones d iv.id idcs po r el total de observaciones.

0 + 0 +1 + 1 + 0

5.2 . Di str ibucin de la pro porcin


La p rop orcin es un a m edia en el co ntexto de variables dicotmicas. Una variab le dicot m ica se carac teriza por asu m ir valores O y 1. La variable asume el
valor 1 si se presenta el atributo m edi do y O si no se presenta . Slo exi sten dos
valo res excl uyen tes pa ra cu alquier e nsayo qu e se realice. A saber, ocurre o no
ocurre el suceso.
La presentacin formal de una variable dicotmica es la siguiente.

Variable dicotmica
con valores a,

a, = 1 si el elem ento i presenta el atri b uto

5.2. 1. Distribucin en la poblacin


La dist ribucin de una variable dicotmica e n una poblacin p resen ta las m ism as
caracte ns tcas qut.' la distribucin de una variable cuan t itativa. A saber, se mide
cada e lemento y se establece p ara cada valo r una frec uencia de ocurrencia. D e
este modo se obtiene la func in de distr ibuci n.
En general las m edi das re alizadas en la poblacin St' ide nt ifican co n letras
griegas.
N

a, = O si el elem e nt o i no prese nta el atributo

40

-.: Tamao de la poblacin


Pro porcin de la poblacin
... Varianza de la po blacin

41

....... '"

5.2 .2. Distribuci rl en la mu estra


La distribucin di~ proporcin en una muestra responde al mismo m odelo que

la d ist ribucin de un a med ia. En general las medidas realizadas en la m uestra se


identifican co n let ras launas m in sculas.
=o: Tam ao de la pobl acin
=o: Me dia de la poblaci n
p (l -p) =o: Varianza de la pob lacin

n
p

5.2 .3 . D istribucin del estadstico proporci n mu estral


U na variabl e dicotmica es un a variab le discreta que se distribuye segn la ley
bin omia l. La distribucin binomial co nve rge a la distrib uci n normal. La distribuci n normal puede sustituir a la distribu ci n de proba bilidad binom ial cu ando
se cumplen dos condiciones . A sab er, la proba bil idad p que ocurra el suceso debe
ser cercana a 0,5 y el nm e ro de veces qu e se reali za el e nsayo debe ser suficien t em en te gran de. Convenc ionalment e se asume un valor superior a 30 .
Se dem uestra em pric am ente q ue las proporciones muestral es se distribuy en
segn la ley norm al. El exper imento de lan zar 10 veces una moneda al aire con
probabilidad cara=o:sello =O, 5 da lugar a una probabhdad pa ra cada un o de los sucesos y una distribu cin de probabilidades p ara el conjun to de ellos. El histo grama
pr esentado en la Gr fico 4 evide ncia que el su ceso mis probable es 5 ca ras con
probabilidad 0,24 6. El suceso mas improbable e s O 10 caras con pr obabilidad
asociada O/ X)}. El histo gram a se asemeja a una curva en form a de cam pand
G r fico 4 . H istogra ma de proporciones muestralcs
r(.,,;) r

0.246

0,205

0,111

0/)44

0.010

o.en
0,00

0:0 1,0 2.0 J,O ~,O 5.0 6,0 1.0 8,0 9,0 10.0

Nmtro<J""",

El senti do co m n indica q ue si se lanza 100 veces la moneda al aire [a p robabilidad de obtener 50 ca ras ser u n valo r pr ximo a 0,5 . Na turalmen te q ue
si se re3\iza el experimento 1.000 veces la pr ob abtldad de 50 0 caras sera un
nU' mero an ms cercano a O,S.
. En ambos cases e l histograma de- la distribu ci n
de prob abilid"des te ndr la for ma de la curva de Ge uss.
No slo se evidencia empricamen te que las proporciones son una variable
aleatori3 qu e se distribuye s egn la ley 1\On n 31. Se d emuestra que como COIIsecuen cia de la co nvergencia de- ley bi no mial a la ley no rm al las pro po rciones
muestrah~s bajo ciertas condiciones se d istribuyen form ando una curva en forma
de camp ana.
La dist ribuci n muestra! de proporciones muestrales se define co nociendo el
valor del parme tro poblaciona l n y la des viaci n tpic a de la dist ribu cin rnuc stral
de pr oporcio nes - crro r estndar o error tpico- que asume el valo rV" (l - n).
n

En consecuenci a, la pro porc in muestra!sedistribuye segn una curva normal definda


en los siguient es trmin os

N(Jt; y "i!-

(l n-

~ ).

Capitulo 6

Intervalo de confi anza

El int ervalo de co nfianza ha rec ib ido varios nombres evidenciando la nom enclatura eq uivoc a aun presente en teora de m uestras. Las dist intas denomin ac io nes
ut ilizadas a este respecto com o e n rela cin a otros aspectos revela la relati va inmadu rez del saber acu m ulado e n di seo de muestras. Cuesti n qu e dice relacin
con un desarrollo intenso en un perodo breve.
El intervalo de confianza ha sido llamado error rnucstral o error de muestreo
cuando m ayoritariamente se denomina error m uestra! a la difer encia entre el
estimador y el pa r met ro. Confusin grave po rqu e el int er valo de confi anza es un
valor conocido y el er ror muestra ] es una magnitud que no se con oce. Tambi n
ha sido denominado como e rror de estim acin y error de precisi n. N"ltese que
esta ltima denominacin result a lgica en el sentido que el rango de amplitud
del intervalo esta relacionada con div erso s grados de precisin .

6.1. Que es un intervalo de confianza?


Para estimar el valo r del par metro poblacional e xiste n dos alte rnativas. A sabe r,
definir un estadstico como la estim acin del par metro poblacio nal o est ablec er
en tomo a un estadstico un int erval o de confianza para est ima r en trminos
probabilisticos el par metro.
El primer procedimient o se conoce co m o estimacin puntual y no se utiliza.
Tiene co mo limitacin el desco noci miento del error asociado a la es ti maci n del
par met ro.
La form a habitu al de est imar el valor poblaco nal es mediante un inter valo
compuesto de una cota superior e inferior q ue per mite in ferir co n una probabilidad conocida respecto al valo r del parmetro. El intervalo de co nfianza es un
interv alo numrico co nstruido en to rno al est adstico rnu cstral .
La frmula genrica del inte rvalo de confianza se la siguien te.

(6. 1)

e Ka,

El intervalo de confianza co nsta de tr es t rmi nos ind ependi ent es e ntre s. A


saber, el estads tico e q ue ce ntra el int e rvalo, el nivel de confianza k q ue grad a

45

.la am plitud del int ervalo y e l er ror tpico {l que mide la variabilidad de la dis.
tribucin muestra! del estad stico c .
~

6.3 , Valores sigma


.veI de confia nza te ricamente se sustenta en la di stribucin norma l. Los
El fll de los coeficie ntes d e con f an za d Icen
cen re
relacc
iados
acron COII reas asoc ia
os a estos
I
vaores
1
h
b
I
'"
1"
curva normal. En este co ntex to resu t a a rtua rer e nr se a ruve Id e conen Ia
.
3 sigm a. La lerra gnega
"
"
h ace rerere
t:
"
sigma
(J
ncra
fi)nza en t ,......
. ... inos de 2 sigma o .
. . .
.
I d sviacin tipica de un a variable distribuida normalmente.
a a E~ la curva normal, las reas corresponden a pro?ab.llida des. El rea d:- probldad comprendida entre dos inte rvalos puede Indica rse seg un el n umero
~ ~~viaciones tpicas q ue comprende. La figura siguiente ilustra e l nex o entre
t-eas de la curva y valores o .

6.2. Confian za en la estimacin


En la infe rencia no ha y certezas. En co nsecuencia, es p reciso co nocer la preci_
sin con q ue se estima el valo r poblactonal. Para co nocer la prec isin se util iza
el nivel de confi anza y el co eficie nte de confianza. La probabilidad de error n es
co m ple me ntario al n ivc..1d e confi anza
El nivel de co nfianza es elegido por el m uestnsra en fun ci n de la pr ecisin
qut' exi ge la inferen cia JI par metro pobla conal . El nivel de co nfianza e legido
tiene asoci ad o un valor de coeficiente de confianza. Un nivel de co nfianza alto
implica un coefic iente de confianza grande y, por el contrario, un nivel de confianz a bajo t iene asociado un coeficiente de co nfianza. pequeo,
Para ilustrar la asoc iaci n e ntr e nivel de confianza y coeficiente de co nfiJn za
se prese nta n los valores correspond ientes a una distribucin normal.

."

Grfico 5. Valores sigma y reas de la cu rva normal

Tabla 2. Nivel de confi anza asociado a coeficiente de confianza

Coeficiente de C(ltI6an13

1,64

'"

1,96

95,5%

99,7%

2,58

Un nivel de con fianza de 95% asignado a un intervalo de confianza se entiende


como q ue la ex traccin de sucesiv as m uestras da lugar a q ue el 95% de tos pa
r metrc s se encue nt re e n el intervalo definido.
Un a interp ret acin co loq uial se ala ra q ue ex iste el 95% de co nfianz a q ue
el intervalo incl uya al parme tro de la pobla ci n o que la proba bilidad q ue el
p ar me t ro est e n el inte rvalo es 0,95. En rigor, si el p armet ro esta e n el intervalo la probab ilidad de pe rtenecer a este es 1, y si no est la probabilidad de
estar es O.
N tese q ue int ervalos anch os est n asociados a niveles de con fianza altos y
q ue int ervalos an gostos est n asociados a niveles de confianza peq ue os.
En efecto, resulta razo nabl e q ue se t eng a m ucha co nfianza e n q ue el pa r metro poblacional per ten ezca a un int e rva lo anc ho co n co tas 20% y 80% y, por el
contrario, es lgico qu<.' se t enga poc a confianza en q ue pI pa rm et ro poblacional
pertenezca a un Inter valo an gost o co n co tas 48% y 52% .
Cabe destacar q ue el nivcl de con fianza en la estima cin pr esen ta como
com pleme nta rio la probabilidad de error e n la estim aci n. 'Convencionalm ente
esta prob abilidad se designa co n la let ra griega a. D esde esta per spect iva, elnivel
de co nfianza es 1- a.

I
-3" -i"I
I

'H
95,S ~.

"1

3t

9~.1 ""

En particu lar, 1 desviacin t pica incluye un re a correspondiente al 68,3% de la


curva, 2 desviaciones tpicas incluye n un re a cor respo nd ie nte aI95,5% del .tota l
y 3 desviacio nes t picas incluyen e1 99,7% del total del rea de la c urva. La figura
siguiente es un resumen de q ue vincula valores (J y la p robabilidad asociada
Tabla 3. Valores sigma asociados a prcbablldades
Valores (J en la

Probabilidad comprendida

~~in normal

en d intervalo

,lo

0,683

:1: 2 0

0,955
0,997

--1

6.4. Ni vel de confianza y tamao de la muest ra


La eleccin del nivel de confianza es decisin del investigador. Los niveles de
confianza mas utilizados son 95,5% a 9~ , 7% de confianza. Resulta evidente plan.
tearsc por qu no se elige siempre el m;yor nivel de confianza. La respuesta dice
relacin con el tamao de la muestra. La Tabla siguiente ilustri el cambio del
tamao de la muestra para dos niveles de confianza y distintos niveles de error.
Se supone que se aplic a el m ismo procedim iento de seleccin y se mantit:ne
constante la varianza de la poblacin, Po r ejemplo, para un error convencional.
mente ut ilizado de 3% y para niveles de confianza de 95,5% y 99,7% el tamao
de la muestra aumenta de 1.111 a 2.500. El aumento del nivel de confianza en
4,2% (95,5 a 99,7J d a lugar a un aumento en el tamaii.o de la muestra de 2,25
veces (1.1 11 a 2.500). El bcuehco en la precisin no es sustantivo, sin embargo,
los costos en trabajo de campo m s que se duplican.
Tabla 4. N ivel de confianza asociado a tamao de la muestra.
Distintos porcentajes de error
Error (%)

Nivel de Confianza (%)

"

1,0

95,5
99,7

10.000

de errar. El e rror ( l es una magnitud que expresa la probabilidad de equivocars e


en la estimacin. Asum e valores entre O y l .
La asociacin entre error a y coeficiente de confianza en el contexto de
distribuci n normal es la siguiente.
Tabla 5. Probabilidad de error a asociado a coeficiente de confianza
Error (l

0,1%

O,O~ %

0,045%

0,01%

0,003%

Coeficiente de confiao'lJ

1,64

1,96

2,58

El intervalo de confianza se interpreta desde la perspectiva del error a como la


probabilidad a de equivocarse al asumir que un intervalo contendra al parmetro
poblaonal si se obtuviesen m uestras sucesivas de t am ao 11 en una poblacin
de tamao N (n<N).

6.5.2 . Error mximo ad misible

El niv el de confianza es un indicador numrico del grado de confianza con que


se realiza la estimacin. C om plem ent aria a esa confianza existe una probabilidad

El error m x im o admisible es una decisin del invest igador. Se puede leer de dos
modos distintos segun se estime la pro porcin o la m edia poblacional . Cuando
se estim a la proporcin el error mxi m o admisible asume valores entre Oy l . En
consecuencia, ste se puede leer en trminos de po rce nt aje de error asociado a la
estimacin. Sin emb argo, cu ando se estima la m edia poblaciona l el valor del error
mximo admisible de pe nde de la unidad de m edida de la variable en estudio
Asi, por ejemplo, si la variable a estimar es el peso de una poblacin este po d r
ser 5 kilos y si la variable es ingreso el e rro r m x imo admisible ser en decenas
de miles de unidades.
En principio resulta lgico elegi r el minimo de e rro r asoc iado a la estimacin.
Por q u no se hace siempre de este modo? Po rque el error m ximo ad m isible
est asociado al t am ao de la muestra.
La Figura p resent ada a continuacin perm ite cuanti ficar la relac in entre
error en la estimacin y el tamao de la muestra. Se asume que la estimacin se
realiza con 95,5% de confianza correspondiente a 2 o ,
Se verifica en la Tabla que errores grandes se asocian a muestras pequeas
y a errores pequeos le corresponden muestras grandes. Po r ejemplo, un error
de 5% requiere una m uest ra de 400 casos y un error l % exige 1.000 casos. En
consecuencia, para u n e rror cinco veces menor se requiere de 9 .60 0 casos ms
o una muestra 25 veces ms grande.
Los tamaos de er ror utilizados habitualmente son en torno a 3%. Ntese,
sin embargo, que un unidad porcentual de dife rencia en el error genera diferen cias im portantes en el tamao de la muestra . Por ejemplo, un error de 2% est
asociado a 2.500 casos y un error de 3% a l l l casos.

4R

49

2,0
2,5
], 0

4,0

22.500

95,5

2500

99,7

5.627

95,5
99,7

3.600

95,5
99,7

1.600

1.111
2500

95,5

625

99,7

1.406

6.5. Errores asociados al intervalo de confian za


La construccin de un intervalo de confianza incluye t res er rores. Resulta imprescindible diferenciarlos sab iendo a qu refiere cada un o de ellos. En la bibliografa
no hay consenso respecto al nombre de stos. A continuacin los nominamos y
establecemos sus atributos.

6 .5.1. Probabilidad de error (I

Tabla 6. Error mximo admisible asociado a tamao de la muestra


Error rnhimo Idmisihlc

(%J

0,1

1,000 (00

05

40,(0)

1,0

10.000

1,5

4A4 ~

2,0

2,500

Error tipico

25

1.600

de 11 media

J ,O

l.lll

J5

816

, ,O

625

5,0

400

En virtud del nexo entre tamao del error y tama o de la muestra la dec isin
respecto al e rror m ximo admisible est ar condicionada por la cantidad de recursos disp onibles.

6.5.3. Error t pico

Pcblacin inlinita

~
-

'

Poblacin tilUU

_y'!'-

N -n
n N _1

0. -

La medici n emprica del erro r tipicn se ~ fe< t J desde la nica m uest ra q ue se


obtiene para estim ar el parmetro poblacional.
Se demuestra que el esti mado r del e rro r tpico t eri co obtenido de una
muestra co ncreta puede expresarse en la siguiente e xp resi n .
Tabla 8. Error tpico emp rico de distribucin de medias
Publ....:On infinih

Pobbn

lini!,)

&ror upk c

En la literatura SI" usa indisti nta me nte error tpico y e rror estndar para de signar
la desviaci n t pica de la distribu cin m uest ra] del est adst ico El error tip ico es
una medida de disp ersin . Mide la variaci n de l es tadst ico muestra]. La variacin
de l estadstico rnucs tral se explica por las fluctu aciones del muestreo.
La m uest ra selecc io nada es slo una de las posibles muestras q ue se pueden
obtene r de la poblac in . En cada una de las muestras pos ibles se- po dra calcu lar
un estadstico para esti ma r el pa rmetro poblacio nal. En consecuencia, cada
m uestr a extraida darla lugar a un valo r pa ra la m edi a o la proporcin. En este
co ntexto el es tad stico es una va riable aleator ia q ue p uede asumir t antos valores
distintos como el n mero de m uestras pu eden extraerse de la poblacin .
Las m ed ias y proporciones m ucstrales - u ot ro est adstic o- p rese nt an una
dis persin que es descon ocida . En rigor, para conocer la disper sin del estadstico
se ria necesario e xtraer todas las m uestras po sibles de la pobl acin y calcula r la
varianz a de la distribu ci n de estad sticos.
6.5.3 . 1. ERROII. r usco

El valo r del error tpico no es posi ble de calcularse po rque ~unca se extraen
uest ras posibles y porque no se cono ce el valor del param etro a estimar.
~ 1a 'm
- entre error upr
." co teonco
. - y e rnpmco.
..
onte xto cabe d-st in guir
En este e
Tabla 7. Error tpico terico de distribucin de medias

m: LA

MEDIA

El er ror t p ico es !:J. raz cuad rada de la varianza de la d ist ribuci n muestrul de
m edias.
La varianza de las medias rnuestrales respecto al par metro poblaconel se
calcula promediando las k diferencias, medidas com o dferenctas de cuadrados,
e nt re las medras rnue st rales y el pa rmetro po blaconal.

de 1.1 meda

6.5.3.2. E RROR n eco

DE PROPORCIOSES

Respecto a proporciones, la referencia a error tipi co es anloga a la reali zada a


props ito de medias
Tabla 9. Error tpico ter ico de distribucin de proporciones
Poblacin nniu

Poblacin finitl

nJN - n

Error tpico

N- l

de la proporcin

Tabla 10. Error tpico emprico de distnbucin


Pohb cin infinitJ
Error tipico

de 11 propo rcin

d~

proporciones

Pobb cin finitl

El erro r tpico incluye en su frmula el tam ao de la muestra . Resulta eviden t('


que existe relacin entre tamao de la m uestr a y valor del error tpico.
En particular, muestras grandes dan lugar a er ror tp ico pequeo -mayor pre.
cisin en la infe rencia- y muestras peq ueas generan valor de error t pico grande
- m eno r precisin. La Tab la 11 evidencia esta relacin. Ntese que manteniendo
el nivel de confianza const ante para red ucir el er ro r tpico a la mitad es necesario
cuadruplicar el tamao de la muestra . Dado e19S,5% de confi anza y una varianza
p eqefl.S una muestra de 1.000 casos est asociada a un er ro r tpico de 3,2 y en
una m uestra de 4.000 casos este valo r disminuye a 1,6 .
Tabla 11. Errores tpicos asociados a distintos tamaos muestrales
Nivel de confianza 95,5%.
Nm ~r()

de el~ment()~ de la muestra

la frmu la bsica se puede escribir en los siguientes trm inos.

(6.2)

El interv alo de confia nz a para una m uestra de tamao n definido un nivel de


confianza del 95% asume la siguiente expresin .

{X - l,96 ~ ;x+

~l

(63)

1,96 ..

Valor de p x q C%)
10/90

30/70

50/50

200

4,3

6,5

7,1

500

2,7

4,1

4,5

1.000

1,9

2,9

3,2

2.000

1,3

2,0

2,2

3.000

1,1

1,7

1,8

4.000

1,0

1,4

1,6

1000:1

0,6

1,0

1,0

Cabe destaca r que la e xpresin (6.2) se refiere a la probabilidad de confianza en


un intervalo terico y que la expresin (6.3) tiene incorporado el nivel de con fia nza segn los valores t abulados de la ley normal en una muestra emprica .
El interv alo (6.3) ind ica q ue en sucesiv as muestras de tamao 11 el 95% de
intervalos de esta amplitud contienen el valor de l parm etr o poblacional.
La amplitud de l intervalo de confianza es un indicador de la precisin de
la estim acin . En este sentido, la amplitud del inte rvalo -dtfercncia entre las
cotas- corre sp onde a la precisin de la estimacin .
Las cot as co rrespondient es al int ervalo de confian za ser an las siguientes.
.

cota superior: x + zoJ2 ~

6 .6. Construccin del interva lo de co nfianz a


La mayora de lo s intervalos se establecen median te la mis ma metodologa. El
teorema o desigualdad de Chebychc v pe rm ite formalizar la construccin del int ervalo para cualquier estadstico. El teorema puede enunctarse en los siguientes
t rm inos: la probabilidad q ue una variab le aleatoria asuma un valor q ue difiera
en valo r absoluto de su esperanza m atemtica menos que k veces la desviacin
tpica es mayor que l menos el cociente de 1 pa rtido por el cuadrado de k
Teorem a que respecto a la media muestra] se p uede formalizar en la siguiente
expresin.

cota inferior:

El valo r del in tervalo de confianza genrico es fund am en talm ente terico. Para
hacerlo operativo es necesari o asum ir info rm ac in complementaria. Asumiendo
distribucin normal de las medias maestrales despu s de operar algebraicamen te,

Elintervalo de confianza puede o no incluir al parmetro de la poblacin. Ntese


que en ceda muestra obtenida de la poblaci n se puede construir un intervalo y
generalmente tendrn rangos diferentes. El int ervalo de co nfianza es un suceso
aleatorio resulta do de una e xperiencia aleatoria. En consecuencia, el intervalo se
interpreta en trm inos que en un porcentaje de m uestras - habtualm e nre 95%
o 99%- el intervalo incluir el parmetro. O t am bi n que en suces ivos experimentos de ex traccin de m uestras el 95% o 99% de stos incluir el valor del
parmetro pobleco nal.
La construccin del intervalo permite confiar q ue dado un proceso de seleccin aleatorio es poc o probable q ue precisamente el inte rvalo empirico obtenido
no contenga el valor del parmetro poblacional. En este entendido se concluye
~ue el parmetro poblacional pod ra estar entre la cota superior e inferior dd
tntervalo segun cierto nivel de confianza.

52

53

(6.1)

...-- '"

Capitulo 7

El error total y Sll S compon entes

La p r~ cisin y el error son dos ele m entos qu e refieren a la calidad de


r~a l i za d a de la m uestra a la pobl aci n.

la inje rencia

La revisin bibliogr fi ca evidencia distintas acepciones para referirse a la


precisin y el error.As, por ejemplo, la precisi n hl sido llam ada equvocamente
nivel de co nfianza y error est ndar. Respecto al error se h an realizado distinciones
dicotm icas como error de muest reo y ajeno al m uestreo o er ro r de proceso y
error
proced imi ento.
Para una co mprensin apropiada de la precisin y el e rror es nec esario cousi .
ierarlos como dos ca ras d e una m isma moneda. En efecto, la p rec isi n aumenta
cuando el error disminuye y viceversa. La precisin es mxi ma cu ando e l er ror
es mnimo.
La va m s exped ita de abo rda r el te m a precisin y error es analizan do los
distintos elementos que conforma n el e rro r. Para estos efectos acu aremos la
expresin error total que incluye todos las fuentes de error.
Erro r por sesgo no muest ra]
Error por sesgo muest ral
Err or por variacin de la muestra

de

La descom po sicin del e rror en sus compo nentes pe rm itir dar luz respecto a los
condicionantes de la precisin en la estimacin del pa r metro poblacional

7.1. Error tot al


El erro r total o e rror de m uestr eo correspo nde a la d iscr epancia e nt re el estad s:ico y el para met ro. La precisin dice relaci n co n el grado de coi ncidencia entre
estadstico y parmetro. El e rror total y la pre cisi n so n valor es desco nocidos. El
propsi to del d iseo es m inimizar el e rro r y m aximiza r la precisin.
Para ilust rar el concepto de error total se presen ta el e rror total de la medi a.
Error total e p - X
J.1 = Meda de la poblacin
x = Meda de la m uest ra

Reducir la discrepancia ent re parmetro y estadstico es la ta rea central del


d iseo de muestras. La mejor gara nta de la reduccin del erro r total es un diseo
que resuelva apropiadamente con dicio nantes como marco m uestral, estrategia de
seleccin, tam ao de m uest ra y distnb ucn de recursos. La reduccin absoluta del
e rror total es un pro psito que, sin embargo, no pu ede ser verificad o c mpiricamente.
La ilustracin co n el error total desagregado en sus co m ponentes se p resenta
en el Grfi co 6.
Grfico 6 . Error tota l y sus componen tes

PobIa.ci6n ob",,vo

l-:

Error por ....

,0

no muc; !,.1

I\>bl,.-in ~""'t.

E,fO< po< ""C'>


m~"

f.rro< touI

7.3. Error po r sesgo mu estral

D;"triboc in munu.l

--

cuad a operacionalizaci n de la poblacin obj etivo. No siempre es fcil definjos elementos q ue componen la poblacin objetivo. As, po r ejemplo, siendo la
poblaci n de cesantes el uni verso a estudia r ste puede ser entendido de distintOS modos. Se pueden co nsiderar cesa ntes a quienes no h an tra bajado el l timo
mes o tambin se incluy e :1 quienes t ienen trabajo informal o s610 se con sideran
cesante s a qui en es no tien en y no buscan trabajo.
Di fic ultades que in ciden am plian do el sesgo so n el c arcter din mico de la
poblacin objetivo donde suelen ingresa r y egresar nue vos elementos pe rmanentemente. Po r ejem plo, la poblacin de cesantes. Una tasa de no respuesta elevada
puede ser fuente de sesgo no muestra]. Ntese que si la no respuesta es aleatoria
no es una fuente de sesgo, sin embargo, no rmalmente se genera respecto a algunas
pregu ntas especficas e n un gru po identificable de la muestra .
Los error es q ue se p roducen en la manipulaci n de los instrumen tos de
medida son Fuente de sesgo que aument a proporcional mente al t amao de la
muestra . La codific aci n y dg ttacn de la in forma cin son proc esos mec nicos
que por acumulacin dan lugar ine vitablem ente a e rro r.

f-

lOrro,PO' u,"n

dc l. m u,. t..

Muo"""

7.2. Error po r sesgo no mu estral


El error producido por sesgo no m ues t ra! tiene su or ige n e n fact or es ajenos a
la seleccin de los elementos q ue co m ponen la muestra . Un a fuen te de sesgo '
no muestra ] es la difere ncia entre poblaci n objeti vo y poblacin e ncu esta. La
poblacin objetivo puede incluir elementos que han q ueda do al ma rgen e n la
poblac in de encuesta . La m argin aci n de ele me ntos genera sesgo en 13 tnfcrc noa
a la pobl aci n objetivo.
La e xpresin fo rmal del error por sesgo no mues t ra}se pr esenta a co nti nuacin.

El sesgo rnu cstr al es un com po nente de e rro r form ado por la d iferencia entre el
valor del estadstico y el valo r esperado del parmet ro pobl acio nal.
La esp eranza matemtica de la m edi a corresponde al valo r promedio de todas
las medias ex t radas en m ues tras de tama o 11 en una poblacin de tam a o N.
El valor de la esperanz a ma tem t ica de la media mue str a] es el valor de la media
poblaconal si la muestra no es sesgada .
Error po r S(:sgo rnuestr al
x::=

::= i

E()

Media de la m uest ra

lo: (x)

::=

Esperanza matemtica de la m edia

La difere ncia entre la media de la poblaci n objet ivo y la media de la en cuesta


puede tener dive rsos o r genes. B sica men te se produce sesgo por una inad e-

Los componentes q ue part icipan en la generaci n del sesgo muestra! son sesgo
por seleccin y S5g 0 por estimacin .
El sesgo po r selecc in R' produce cuando no ex iste igu.il probabili dad de
seleccin para todos los elem entos de la poblacin. Para ev it ar la gene raci n de
sesgo se utilizan procedim ient os de ponderacin. Se han desarrollado di versos
modos de po nd erar, a fin de compen sar la scbrerr epre scntuc t n y sub re pre se ntac n de e le mentos ge ne rada po r la probabil id ad desigual de seleccin de
elementos de la poblac in .
El sesgo por esti m aci n se genera cuando se utiliza un estimador inapropiado
pa ra estimar el pa rmetro poblaconal . En particular, cuando el valor d o' la esperanza matem tica del estadstico es d isti nt o al valo r del pa r.imct ro poblacional.

56

57

Error por sesgo no muest ra] = X~ X .


X~

::=

Med ia de la poblaci n o bjetivo

X.

::=

Media de la poblacin encues ta

7.4 . Error por variacin de la m uest ra


El erro r generado por variacin de la muestra se explica por la fl uctuacin d~
muestreo. Este erro r se produce porque el esradistico es una variable alea toria
q ue en las distintas m ues tras posibles p uede asu mi r un valo r diferente. En consecuencia, en cada muestra se prod uce una discrepa ncia desconocida entre el
valor del estadtsuco y el valor de! parm e tro.
La teora de muestras pe rmite conocer en t rm inos de probabil idad el grado de coincidencia ent re estadstico y p armet ro. Es decir, facilit a info rm acin
respecto a la p recisi n de la informaci n. El intervalo de confianza calcula en
t rminos prob abilsticos el error po r variacin de la m uest ra.

Capitu lo 8

Tamao de la m uestra

El tamao de la muestra corresponde al nmero mnimo necesario pa ra estimar

el parmetro poblaconal con la restriccin que la dife re ncia e ntre el estadstico


yel parmetro sea menor que u na cantidad convencionalmente aceptada.
La pregunta respecto a cul es el tamao de muestra adecuado tie ne co mo
respuesta qu exigencia de precisin existe en rela cin con la estimacin. En
t'mnos de diseo de muestras el tamao de la muestra de pende de la precisin
asociada a la estimacin del parmetro poblaconal.

8.1. Factores que condicionan el tama o de la muest ra


Dive rsos factores inciden en el tamao de la m uestra. Cabe destacar el e rro r
m ximo admisible y el nivel de confianza por su importancia y porque ambos
valores son dec isiones del rnuestrist a. Tambin influyen en el tamao de la
muestr a los recursos econmicos, los procedimientos de an lisis a ut ilizar y la
heterogeneidad de la poblacin.

8. 1. 1. Recursos econmicos
Respecto a la incidencia de los recursos ame rita se alar que el costo de cada uni dad de m uestreo pu ede ser incl uido como infor m aci n en el clc ulo del tam ao
de la m uestra. En efect o, distin tas funcio nes de costo se h an desarrollado con el
propsito de considera r la variable econmica e n el t ama o de la muestra. Las
funciones de costo su ele n se r muy espec ficas en los gastos y ser poc o apl icables
en casos concret os 0 , por el co ntrario, inclu ir iternes de gastos muy generales
y aportar poca informacin para e l clculo del t am ao de la muestra en una
situ aci n con creta .

8. 1.2. Procedimientos de a nlisis


La relaci n del t ama o de la mu est ra y los procedi mie ntos de a n lisis es di recta.
J.os procedim ientos de anlisis univa riables no presentan en genera l exige ncias espedales respecto al nmero de observactoncs necesarias para su implementacin
Sin embargo, los procedimientos bivanablcs y mult ivariab les s610son aplicables

a partir de u n nmero m nimo de obse rvaciones. As, por ejemplo, e n el mbito


biv ariab le el uso de coeficientes d e correlacin pararn trt cos req uier en al menos
d e treint a c aso s y en anlisis multivariable las exi gencias pueden ser tan amplias
co mo 1"0 anlisis factorial, q ue seg n Co m rey ( 1985) req uiere de trescie ntos casos
para ser fiable: o como 1"0 regresi n mltipl e procedimient o slepwise, q ue segun
Tabach nik el al- (19 89) nec es ita u n numero de casos cuarenta veces supe rior al
nm ero de variables independientes incluidas en el modelo.

S. 1.3. Heterogeneidad de la poblaci n

confianza co nst ante 95,5% y varianza co nsta nte, un a mu estra asocia da a un error
del 2% necesita 2.500 casos pa ra infe rir a la poblaci n. Bajo los mismos su puestos,
una m uestra con un error de 1% req uiere de 10.(X)() casos y una muestra asoc iada
a un erro r de 0 ,5 % necesita de 40 .00 0 observaciones. Se eviden cia q ue se nece sitan mu estra" sust antivamcnte ma yo res para un nivel de con fianz a co nstante
y el mismo procedimiento de seleccin de c asos. Para ilustrar est a cues tin se
presenta la cu rva q ue relaciona tama o de muestra y porce nt aje de er ro r.

8.3. Tamao de la muestra y tamao de la poblacin

El ta ma o de la muestra es p articul arm ente sensible a la het erogeneidad de la pobl acln . El sentido comn inJica que en pob laciones het ero gn eas se requi ere de
ma yor nmero de caso s para e st ima r el parmetro poblacion al que e n poblaciones
co n valores homogneos. La di sp ersin se mide co n la var ianza, lo que perm ite
concluir que poblaciones co n var ianzas grandes requ ieren muestr as mayores que
pobla cio nes con var ian zas peque as para inferen cias co n igual precisin.

8.2 . Precisin de la estimacin


La relacin del tam ao de la m uest ra y la precisin JI" la estimacin es intu iti va.
Resulta inm ed iato concluir que a um entos en el tamao de la muestra generan
incremento en la precisin de las est imac iones Po r el contrario, mu estras pequeas
dan lugar a estimaciones imprecisas asociadas a un error mx imo admisible grande.
Ca be destacar que no e xiste una rela cin direct am en te pro porcional entre
e rro r m ximo admisibl e y tamao de la muestra . En e fecto, dados un nivel de

. ..- ----- - --- - - ----------,

Contr a lo q ue su giere el sent ido com n, el tamao de la m uestra no se ve susuntivam ente influenciado por el tamao de la poblacin or igen de la muestra.
No ex iste un aumento de la muestra proporcional al aum ento del tamao de la
poblacin. En poblaciones grandes - sup eriores a 100.000 casos- la influ encia
del tamao de la poblacin es nfima e n el clculo del ta mao de la muestra. Sin
embargo en poblacio nes de tamao medio la influencia es moderada y en poblacionrs pequeas -nfencres a 5.000- el t ama o de la muestra se ve influenciado
por el tamao de la poblacin . En poblaciones peque as es necesario m uest rear
a una parte importan te de la poblacin para obtener la pr ecisin dese ada. Normalrrwnte es preferible realizar un censo de la po b laci n.
A modo de ejem plo, pard po blaciones con 100.000 y 10.000 .000 de casos
una m uestra de 1.100 un idad es pe rm ite infer encias con precisin sat isfacto ria.
Se demuestra que la relacin de n co n N da lu gar a un a curva q ue p'lS..! por
el o rigen y tien e una asnto ta par alel a al eje de abscisas. La curva e vide ncia que
a part ir de cierto valor de n increme nto s de N no inciden e n e l tamao de n . El
Grfico 8 figura la re laci n de JI con N.

Grfico 7. Tamao d e b muestra asociado a porcentaje de error

..

Grifico 8- Relaci n tam ao de muestra)" tamao de poblacin


n

'--

-------------- - - --------

'.1 _

2uguW

l.O - . - 1.~

l oO

::

---4,----------- ,
t-------------~ -----------------------------__-

-- -

~~-+-4) .000

10 .00J

60

61

8.4 . Tamao de la muestra y p armetros


Un a e ncuest a por muestreo indaga respec to a un aspecto de la realidad utilizando
no rm al m e nte un cuestionario estructurado q ue incluye un sin n mero de preguntas, Para e l clcu lo del tam ao de la m uestra no se pu eden considerar todas
y oda u na de LIS preguntas incluidas en el instrumento d", medi da . Por exceso
se genera el absurdo de clcu lo de tamao de mu estra para cada pregunta . En la
pra ct ica se calcu la la muestra consid erand o an tecedentes - verauxa- y c xpec tauva s - n vel de con fianza- referidos a una o algunas pregun tas que se consideren
rele va nt es e n relacin al tema de cstudo.

8.5. Frm ula del tamao de la muest ra


El clc u lo del t am ao de la mu estra se- rea liza median te una frmula qu t' es una
ecuacin q ue relac ion a dos t rmi nos. La incgnita es e l numero de ele mentos a
encu es tar y el trmi no q ue permi te de spejar la incgnit a est a compuesto po r los
factores que condicionan el tamao de la muestra. Entre esto s factores cab e des tacar el nivel de confia nza, la probab ilidad de e rro r, un a me dida de la d ispersin
de los datos, el cos to de la unidad de muestr eo y el tam ao dela poblacin .
La frm ula a utilizar ser d istinta segun el p rocedimiento de selecci n de
element o s y el resultado de la apl icacin de la fr mula variar seg n los valores
q ue asuman los factores qu e co ndic io nan el tamao de la muestra .

8.6, Decision es subjet ivas e n clc ulo del tam ao muest ra!
El calc u lo del tamao de la muestra involucra aspectos tcnicos y subje tivos.
Los aspectos t cnicos dicen rela cin con el procedimient o de sele cci n y, por
ex te nsi n , con la viabilidad de acceder a las unidade s de muestreo segun cos tos
y cro nograma. Los aspectos subjetivos tie nen q ue ver con o pciones decid idas
segun c rit er io del mucstrista .
En e l mbito de decisio nes del muest rista cabe dest acar el nivel de co nfianz a
asoc ad o a la estimacin y el e rror m ximo admi sible. Los valores qu e asuman
incid ir n e n el tam ao de la muestra.
Res p e cto al nivd de con fianza exi ste la pra ctica convencional de asumir co rno
valores a propiados 95 % y 99% de conhanva. En relacin con el error m xim o adnusible se utilizan valores en torno a 3% de error. El suste nt o es ms uso consuetndinario qu e razones sustantivas. De hecho, en ciertos contextos los valores sealados
pu eden resultar una imposici n exces iva y en ot ros ser claram ent e insuficientes.
La difi cultad de una decisi n aprop iada para cada caso dice relacin con la
falt a d e claridad respec to a las consecue ncias practicas de un nivel de co nfianza
de ter m in ado . En general es un a m ater ia abie rta a la subjet ividad de q uien calc ula
el tamao de la muestra

A fin de Ilustrar 13 influe ncia e n el ta ma o J~ la m uest ra de d ecisiones distinrespec to al nivel de confianza y el erro r mximo adm isihl~ se prese.ntan des
~j ell1p los. La. Tabla 12 ilustra el tam a o de mu estra 4ue: se obtiene co nside rando
lternativas d istinta s y razon ables.

taS

Tabla 12. Tam ao de muestras seg n opc ion es


Decisiones
Propon:i(.'n ~ignida

luestrista I

0)5

"'luestri<ta 2

O,"

Errorm.L-cimo adm~lb l('

0,0') ..... 15

O.02- t:2'llo

Nivd de coo~anlJ

95.5\0 - 20

99,7% - 3u

JOO

3 soo

Las dife rencias en el tamao muest ra] son significativas e im plicaran diferencias
de recursos y tiempo importan te. Los resu ltad os se ob tie nen a par tir de decisiones disp ares pe ro jusnficables en rel acin co n erro r m xi mo adrn ..blc y nivel
de confianza. En consecue ncia, la exactitud qu e distingue a las frmula s se ve
:)p.tcadd por la subj etividad inh er e nt e a decision es q ue so n de te rm inantes en el
tamao de muestra calculado.
El calcul o del tamao de la muest ra no t iene una solu cin ni ca 'j verdadera
El clculo del nme ro de elem en tos a muestrear tien e un a dim ensin tcnica
y otra im precisa q ue dice rel acin con la experien cia. capacidad e intuicin del
mucstrista.

Capitulo 9

Notacin y frm ulas

La teora de m uestr as pe rmite realizar infe rencias a la po blacin uti lizando diversos estadsticos muestrales. Naturalmente las fr mulas son distintas, pero la
lgica es la misma.
El desarrollo de la teo ra d.... muestras ha d ado lu gar a variac iones en las
frmulas a aplicar para calc ular el ta mao de la mu est ra o es timar el par met ro
pobladon a\. En efect o, sencillas op er acio nes algebra icas pe rm iten prese ntar de
variadas maner as la misma frmu la. Un au tor pu ede ade cuar las frmulas segun
criterios de exha ustividad, cla ridad o aplicabilidad. A fin de homoge neizar la
produccin en castella no de t eo r a de m ues tra s se ha seguido la nomenclat ura
utilizada por A zor n ( 1976) o Azorn y Snc hez C respo ( 1986) .

9.1. Nota cin general


Nmero de ele me ntos de la poblacin
N

N =X,

,.,

Nme ro de elementos de la muestra

n=i:;.,

X,

Nume ro de muestras posibles. Extraccin con reem plazo

Numero de mu estr as posihles. Ext raccin sin reem pla zo

) N'
[N
n = n!(N ~ n)!

65

Prob abilidad de seleccin de u na m uestra de ta mao n. Ext raccin sin renp lazo.

raccin de m uestren Probab ilidad que un ele mento de la poblacin sea sclec tonado para la m ues tra

Varianza en la po blacin

Cuasi varianza de la poblacin

f= -~

actor de ele vacin o e xp ansi n. Inverso de 13 fraccin de m uestreo. N mero de


lemcntos de la poblaci n qu e rcpo- se nra cada ele men to de [a muestra.

e =-.1. =

0 =

1:!....
"

"orrecon p ara poblacion es fintas

cpf(cu asi vari anza)

epf (varianza) =

Desviacin tpica dI' la po blac in

=H 'l.-

~ ='}

9.3. Notacin de proporciones. Poblacin


Valor de la variable dicotmica para el i- slmo elemento de la poblacin

Total de clase de la poblacin. Numero total de elementos qu e presentan el


atribut o

),2. No tacin de medias. Poblacin


Valor de la vari able X pa ra el i-esimo elem ento de la poblacin

x,
r.k dia de la pohlocin para los elementos de la variab le X

A
Proporci n de la poblaci n p ara los elem ento s de la variable d icot m ica
N

~a,

l'I = ~ = --

Varianza de la poblaci n
o; =)"[( I -l'I)

Desviacin t p ica de la poblacin

.; ( 1
(; 7

9.4. Notacin d e medias. Muest ra

Captulo 10

Media de la muestr a pa ra los elem entos de la variable X

Muestreo aleatorio simple

Varianza de la muest ra
El muestreo aleatorio sim ple es un procedimiento de seleccin basado en la libre
actuacin del aza r, Es el p rocedimiento de muest reo m s elemental y es referencia
de los dem s tipos de d ise o. Muestreo elem ental porque como procedimiento
de seleccin es intuitivo y sus frmulas son sencillas. Es refere ncia para evalua r la
eficiencia de diseos que seleccio nan los elem en tos seg n una lgica qu e bu sca
ordenar el azar.
El muestreo aleat orio simple es u n procedi m iento monoe tipico q ue puede
realizarse co n o sin reposicin. Teri camente la difer encia dice relacin con la
independencia o dependen cia e n la probabilidad de selecci n. En virt ud qu e el
muestreo sin reposicin resu lta m s sencillo desde el punto de vista te rico y
prctico los desa rrollos siguie ntes se re alizan a partir del su pues to de no reposicin de los elementos seleccio nados.
Nt ese qu e ambos tienden a resu ltados sim ilares cuando la m uestr a es una
parte pequea de la po blaci n. Se verifica qu e cua ndo la poblaci n tiende a
infinito la probabi hdad de repet ici n en la se-lecci n tiend e a o.

C uasi varianza de la muest ra

"_(x,""
"-

x}2
-;-

n - 1

Desviaci n tp ica de la m uestra

t (x.- xl'_

s = .!:.L.

9.5 . Notacin de proporciones. Muest ra

10.1. Selecci n de uni dades de m uest reo

Propo rcin de la muest ra para los elementos de la variable di cot m ica

El procedi mien to de seleccin de los ele me ntos se real iza en for m a independiente
y sucesiva para cada unidad segn un listado que pe rm ite la selecc in al aza r de
los elem ent os qu e componen la poblacin. Se tra ta de un mues treo probabilistico
donde todos los elem e nt os tien en la misma pr ob abilidad de ser parte de la m uestra
y cada un a de las muestras posibles t iene la mivrua probabdtdad de ser elegida. En
consecuencia es un procedimiento aleatorio eq uip rohable. Particula ridad que la
distingue d e los diseos p robabil sticos no equiprobables en los cu ales los e lerne-ntos tien en una probabilidad co nocida y distinto J e O de ser parte de la muestra.
Com nm ent e se confunde muestreo alea torio simple y muestreo cqcnp robol-le,
sin embargo, ste es slo uno de los modos del muestreo cq uprobable.
En virtud de la naturaleza equprobable del muestr eo aleatoro sim ple se le
califica de m uestreo autoponderudo. T rm ino ste q ue hace refe rencia a q ue el
peso de tod os [os individuos en la muestra es d m ism o.
Histricam ente la seleccin de unidad es de muest reo se ha realizado mediante
una tabla de nmeros aleatorios. Un ejemplo a este respecto es la tabla generada

Varia nza de la m uest ra

D esviacin tpi ca muestra!

s, = ,[ji""iti

68

69

por la Rand COl'J'(!Tu.t1un d(' 1.()(X).OCO de d gitos. Los programas com putacionales
facilita n la Urca dI' seleccin. En efecto, permiten asignar un n mero a cada uno
~le los elementos de la poblacin mar co, gene ran una serie de n meros aleatorios,
seleccionan el nm ero de eleme ntos previamente establecido e imprimen elli.~t a do
de elem entos q ue co mponen la muestra. La serie de numer as aleatorios podra ser
prcticament e infillita y el azar e n la serie de nmeros puede ser evaluada m ed.i allt~
pruebas de aleatoriedad. En pa rticular la distrihucin de frecuencias y la prueba serial
El muestreo aleatorio simple presenta do s inconv en ientes de aplicacin. A
saber, necesidad ele dispon er del lista do de la poblaci n m..reo y aumen to de
cos to po r dispersi n geog r fica de las uni dades de muestr eo selecc ionadas. Su
aplicaci n no es Frecuente en la p rct ica del diseo de muestras, sin em bargo, los
un procedim ie nto de selecci n habitua l en co mbinacin con dise os complejos
La principal ventaja es la sencillez de las frmulas pa ra calcula r el t ama o de la
muestra y la prec isin de la estimacin .
La senci llez de las fr mulas se explica por el ca rct er m on oer pico del
m uestreo y la cqu probabihdad de las unidad es de muest reo. Los elementos son
las unidades de m uestreo )' todos los ele mentos ti enen la misma probabilid ad
de ser seleccionados.
La estimacin de los par metros en m uestreo aleatorio simple se rea liza
seg n los cnones de la in fere ncia estad stica clsica. En particular, de la teora
de la estim aci n. En rigor, el m uest reo alea tori o simple es el nexo entre teora
de la estimacin y los diseos de muest ras probabilsticos qu e re gul an la scleccin alea tori a de e leme ntos. Las frmula s de estos diseos son variaciones del
muestr eo aleatorio simple.

10 .2 . Varian za y cuasiva rianz a


La frmula del e rro r npco incluye la cuasivarianza y la correccin para poblaciones finitas. V ase Tablas 8 y 10.
A propsito del uso de la cuasivarianza amerita sea lar q ue e n diseo de
m uestr as se d isti ngue ent re varianz a y cuasivarianza
La dist incin se explica porque la varianza muest ra] no es un estimador
insesg ado de la varian za po blacton al. En efecto, se demuestra qu e la esperanza
ma tem tica de la varianza m uestra! no coincide con el valor de la varianza poblaciona\. En consecuencia, no se utili za la varianza muestral en las frm ulas pJra
co nocer la precisin de la estirn ncln.
Se demuest ra que la cu asivarian za rnucst ral es un estimador nsesgado de la
ccasvana nza poblaconal. En virtud de lo cu al se utiliza la cuasivarianza de la
muestra pa ra esti mar 1<1 cuaslvarian za de la poblacin.
La d ifere nca entr e varianza y cuasi varianza consis te en q ue est a l t im a uti liza como denom inador 11- ] y no 11. La distincin tiene m s inter s t er ico que
practico. Se dem uestra q ue en m ue-stras grandes la cuasivarianza es un estimador
insesgado de la varianza .

10J. Correccin p ara poblaciones finitas


La correccin pa ra poblacio nes finit as (qlf) es u n factor d e co rreccin que rel aciona el tamao de la pobla ci n y el ta m aiio de la muest ra.

epi =!:I~"
N

(10.1)

Elnombre se explica porq ue en poblacio nes injinitas asume el valo r consta nte 1
y su funcin como multiplicador de la varianza del estimado r pier de sen tido. En
[a prct ica se trabaja co n po bl acio nes finit as; en consecue ncia, el valor es dis tin to
de I }' se ju stifica su uso Sin embargo, en gene ral, el valor de la co rrecci n es
cercano a 1 po rque norma lm ente la poblacin es m ucho mayo r que la muestra.
En la pr ct ica se p ued e presci nd ir de la cpf cuan do su valo r es m ayor a 0,9 5,
dado q ue su efecto en la amp litud del intervalo sera irrel evante.
La cpfcu mple la func in de h acer m s precisas las estim aciones realizadas con
muestras relativam ent e gran des respecto al tam ao de la poblaci n y hace m i s
imprecisas 1.Js estima ciones efectuadas co n m uestras rela tivamen te peq ue as.

lOA . Estimacin de la m edia


La medi a es una medida de te ndencia ce ntral que informa respecto al valo r
promed io de una variable. Su comprensin es int uitiv a y su uso e xte ndi do. En
virtud de sus propi edades y aplica ciones es com n la neces idad de est im ar el
va'or del parmetro po blacional a partir del estadstico rn uestral .
La estimacin de l par metro poblac ona l se real iza ca lculando el valor de la
media muestra!. Procedim iento q ue se justifica, dado q u e la m edia muestra] es
un buen estimado r de la medi a poblacional.
En consecuencia se justifica para estimar la m edia de la poblacin utili zar
como es timador la media de la muestra.

1004 . 1. Error tpico


La precisin de las estimaciones est rela cionada co n 1.1 disper-o n de los estadsticos mues t rales. A ma yor dispersin de los estudtstcos muestr ales menor ser
la precisin . Para con ocer la dispersin de los estadtsucos se utiliza la varian za
del estim ado r en el m uestreo o su raz cua dr ada q ue es la desviacin tpica del
estimador. Este ult imo co nocido como error tpico o e rro r est nd ar.
Se demuestra que la frmula del e rror tpico del csttrnador e n muestro alea torio simple es la siguiente.

71

. ~

(102)

Despejando la ecuacin respecto a n

L=N-2' . "
N

rol1

Donde;

(x,- x)'

1"

(l 0.3J

[NN- n11

;.1

(IO.G)

[ NN -. nn l~ o ..i-n _ ~
N

l .a f rmula (10.2) evidencia q ue la varia nz a del estimador ser grande si el


valor de la varianza de la variable e n la poblaci n m edi da med ia nte 52 es
grande. Se co ncluye tambin qu e la var ianz a de l est imador disminuye c uando
au men ta el ta m ao de la m uest ra. Por o tra part e, q ue da en evidencia q ue el
tam aii.o de la poblac in no tien e una in flue ncia significativa en la precisin de
la es tim aci n.

10.4 .2. Tama o de la muestra


El clculo del tamao de la muestra es cro nolgicame nte anter ior a la const ruccin del int erv alo de co nfianza. Durante el muestreo la primera et apa es calcular
cu ntos elementos d e la poblacin van a co m pone r la muestra .
El tama o de la muestra est co ndicionado por dos valores qu e son definidos
por el mucstnsta . En co nsecue ncia, el resultado depender del punto de vista
ut ilizado en la toma de decisiones. En efecto, es necesario es tablece r el valor del
m ximo erro r dispuesto a ad mi tir y definir el ni vel de confia nza que se asumid.
e n la infe rencia.
La frmu la del tamao de la m uestr a se ob tiene a partir de U n3 ecuacin q ue
relaciona el tamao de la muestra con el error mximo admisible.
N tese q ue el e rro r m xim o ad m isible es el p roducto de dos terminas. En
rigor dos valores que son. la abcisa de la fu ncin de densidad de la ley nor mal
para u n determi nado nivel de confianza y la desviacin t pica de la di strib ucin
m uesr ral del est im ado r.
Ut ilizando ex presiones co rrie ntes se t rad uce a los siguiente trminos.
Error m xim o ad ms blee coe ficientc de confi anz a er ro r tpico.
A con t inuacin figura n los t res t rmi nos en nom en clatura de muestr eo
alea tor io simple.
(10.4)

(10.5)

72

despejado n
( 10.7)

Donde:

= Erro r m ximo ad m isible


Zol1 = Valor tabulado de l coeficiente de confi anza
N = Tamao de la poblacin
52 = Varian za de la poblacin
e

Todos los tr m inos de la ecuacin son conocidos ex ce pto la varianza de la poblacin. En la practica es te valo r es reempla zado po r un indicador de la variabil idad
en la mu estra . Este indicador normalmente es un a varianza calcula da al aplicar
una encues t a piloto para e valuar la validez del instrumento de med ida .
PIIOIlI. EMA 1

Una muncpaldad estudia hbi tos de estudio en estudiantes de- 10 bsico a 4"
medi o en liceos de la co m una. Se aplicar u na e ncuesta po r m uestreo. Co ndici n
es calcula r el t amao de m uestra . El tota l de estudia ntes qu e asiste n a los liceos
de est a comuna es de 2 1.524 . Se ut iliza la varianza de est udios an te rio res, 122.
El e rror m xim o adm isible se fija en 1 y el nivel d e co nfianz a en 99%.

73

Reem plazando en coe ficie nte de confianza y e rror tp ico

SOLUClON

A partir del enunciado obtenemos los siguientes datos:


j

N = 21.524

s:

1, 96

,,t-n"
--

-'--

N- J

( 10.9)

122

= 1
Z " 2 = 2,58

Donde:
1,96 = Valor del coeficiente de co nfianza asociado al nivel de co nfianza de 95%
S1 = Varianza de la m uest ra
N = Tamao de la pobl acin
n
= Tamao de la m uestra

PJr.l. los clculos utili zamos la sigu iente frmula :

L-+_ "_
z~

La inte rpret aci n del intervalo de co nfianza es en te rmi nas probabilsticos. El


intervalo ob ten ido puede o no con te ner el valor del pa rm etro poblaconal. En
rigor el int e rvalo es u na ex periencia alea toria e n Id que se pu ede concl uir qu e
un porcentaje de m edia s m a estrales -porce n taje dado por el coe ficiente de confia nza asociado a zGI2- est n incluidas e n el intervalo est able cido. La apuesta del
investigador es qu e la nica muestra seleccionada da lugar a un intervalo q ul:'
por gracia del azar incluye al p armet ro pob lacicnal.

N- l

Reemplazando:

122

_ " _ + __
1~__
2,58 1
2 1.524 - 1
n = 770

2
Calculado el tamao de la muestra se q uiere esti m ar el pro medio hor as do: estudio
al d a. Para infe rir los resultados a la po blaci n se crea un intervalo de co nfianza.
Segun probl em a anterior 2 1.524 estudiantes asisten a liceos de la co muna y se
encuest a n o. El promedio de horas calculado en la m ues tra es de 0,72, con
una varianza de 0,7. Se establece un in te rvalo asociado a 99% de confianza .
PRO RLEMA

C ONCLUSi N

Para hacer un a estimacin con un er ro r mximo admisible de I y un nivel de


co nfianza del 99%, la municipalidad requiere una m uestra de 770 estudiantes.

So LUCION

A partir del enunciado obtenemos los siguientes datos:

10 .4.3. ntervo lo de confianza


La elaboraci n del intervalo de confia nza para m edias en m uestro aleatorio simple
se realiza segn el procedim iento cl sico. Tres son los valo res a considerar segun
la frm ula gen rica.
X Z..n "Oj

(10 .8)

x = Valor de la media muestra!


Z..n = Valor tabulado del coefici ente de co nfianz a asociado a la est ima cin
lJi = Error t pico

TI

:=

Sl

= 1,5

o:c

21.524

no

0,72

Z..n = 2,58

Para los clculos utilizamos la sigu iente frmul a:

. ,,r-n"
x z..n

N - l ' -;;-

Dado que a, puede asumir valor es O y 1

Reemplazando

0, 72

2,58

( 10.11)

i=p (p- l )=pq


0,72 0, 14

(0,58; 0,86)

La frmula de la desviacin tpica del estimador o error tpico ~ la sigu ien te.

CONCLU::iON

Con 95% de co nfianz a, pode mos afirmar qu e el p romed io de horas q ue los estudi.mtes de los liceos de esta comun a estudian al d a est comprendido en el
inter valo 0, 58 a 0,86 ho ras.

10 .5. Estimacin d e la proporcin


La p ro porci n es ex pres in de un pro medio e n una variable dicotmica . El parmet ro poblacio nal se est ima usa ndo como estimador la proporcin m uestra!'
La proporcin muestra] es un estimador nscsgad o, eficiente y co nsistente. V ase
a este respect o 4. 1.

II
I

=V- N- n . J -.i..
N- 1

(10 . 12)

En la frmula de la desviacin tpi ca del esti m ado r figuran p y q, cu yos valores


son desco nocidos. Que valores asignar? No d ispo niendo de informacin se
suele estab lecer el valor de varianza m xima y se real izan las estimaciones con
ese valor. La varianza m xima co rresponde a p =q =O,S. N tese que p+ q= 1 y q ue
el produ cto 0,5 0,5 =0,2 5. En virt ud de lo anterior, para la varianza se pued e
estab l..cer la siguie nt e desigualdad.

(10.\3)

10.5. I. Error tpico


La varianza de la d istribuc in muestral de proporcio nes cump le la misma [unc i n q ue la varianza del es tim ado r de la media . Mide dispersin y,e n particular,
la d ispersin do: las p roporcion es muest rales. En definitiva, es un indic ado r de la
precisin de las esti m acio nes.
Se dem ues tra que la varia nza de las p ro por cio nes correspo nde al p rod uct o
p q. Sien do P la propo rcin q ue presenta del at rib uto y q su complementario.
N

s:

L (a. - p)' a 2
.el_ ' _
=.~""-' ~N
"-

p'

(10 .10)

Cuando se utiliza la varianz a m xim a la amplit ud del intervalo puede ser m ayor
que el necesario en fu ncin de la varianza real de los datos. Considrese que la
imp reci sin por exceso de varianza es me nos perjudicial que inferir con un valo r
de varianza menor al realm ente existente.

10.5.2. Tama o de"fil t;lUestra


El t ama o de la m uest ra de p roporciones prese nta las mismas caract ertstces
analticas qu e el tamao de muestra de medas. La frmula se obtiene fijando el
error m ximo admisible y el nivel de confianza asoci ado a la estim aci n.

(10. 14)
Ntese que

e z Y J:N:.l --n
. P~
1

( 10.15)

0/2

76

11

77

D espejan do la ecuaci n respecto a n

Zca/l = 2,58
para los calculas uti liza mos la sigu ie-nte frm ula:

(_1'-. ~) _(_"-.J'<l)=(VVJ'L
-1 . PE)_(J'L)

N- l

_ f'!L
N- l

~- l

~ pq

N~ l

"

---.!:i.- .P!L
N- l

L +_J:'!1_

ron

N- 1

Reem pla7.ando:
Despejando n

2 83 :? 30 o 25
58 4.23 0 - 1 '
(10 16)

"

_0,03] + -----'.9_
.2, 58 1
58 4 .230 - 1
n = 1.923

Co;-'CI.US IO ~

Donde:
= Tam ao d e la po b laci n
pq = Varian za de la muestra
el = Error m xim o ad misible
Z~ = Valor del coe ficie nte de co nfianza

Todos los trm inos de la frm ula son co noc idos. El tama o de la m uestra depe nde
de los valo res q ue asu ma n los trmino s que la co mponen.
P RO fll.EM A

Se ind aga e n una regin la proporcin de estudi antes q ue real izan actividades
de po rt ivas. Para este fin se ap licara una e ncuesta, por lo que se req uiere calcu lar
el ta m a o de muestra. El to tal de es tudiantes de liceos de la regi n es 58 4.230.
Se fij co mo error m ximo ad misible 3%, y nivel de con fianz a 99% . Se asume
un a varianza mxima de 0,2 5.
SOLU CION

A partir del enunci ado ob te nemos los sigui entes datos:

N = 584.230
pq = 0,25
e = 0,03

Para hace r una estimaci n co n un e rror m ximo admisib le de 0 ,03 y un nivel de


confianza de1 99 %, se req uiere encuesta r a 1.9 23 est udia ntes.

10.5.3 . lmervalo de confianza


La est ructura del intervalo de co nfianza de propo rcio nes es anlogo al intervalo
estableci do para medias. Los valo res que lo const it uye n son los m ism os. A sabe r,
el estim ador, el coeficiente de confi anza y el e rro r tpico.
La expresin del inte rvalo se pr esen t a a co nt inuacin.

P l ,oI1 up

( 10.17)

Don de:

= Pro porcional muestra]


Z"12 = Valor del coefici e nte de con fi anza
u, = Error t pico

Reem plazando en coeficie nte de co nfianza y e rror tp ico

p 1 9ct IN - n_. PH_

, uV N_ I n

( 10 18)

Dnde:

p
N
n
pq

Capitulo 11

Muestreo estratificado

= Propo rcin m uestra]


= Tam ao de la poblaci n

= Tamao de la muestra
= Varian za de la m uest ra

P ROBLEMA 4

Realizada la encu esta a los estudiantes se quiere est imar la proporcin de est os
que realizan act ividad deportiva. Segun problema anteri or, el to tal de estudiant es
es 584 .230 y se encuest a 1923 . La proporcin de estudiantes qu e afirm aro n
pract icar alguna actividad depo rt iva fue 0,35. A partir de esta informacin se
q uiere crear un intervalo con 95% de con fianza para inferir a todos los estu diantes
de la regin.
SOLUCIN

A pa rt ir del enunciado obtenemos [os siguientes datos:

N = 584.230
= 1923
P = 0,35
q = 0,65
Zun = 1,96
11

Para los clculos util izamos la sigui ente frmula:

p s: ' ,96V:'J - n . pq
N- J

Reemplazando:
0,3 5 1,96

584.230 - 1.9 23 . 0,35 ' 0,65

584.230 - I

1.923

0,35 . 0,02
(0,33; 0,37)
C ONCLUSION

Con 95% de confi anza podem os afirm ar qu e la proporcin de est ud iantes q ue


practican alguna activ idad deporti va e xt raprogram tica se encuent ra e ntre 33%
y

37%.

80

El muest reo estratificado se ca rac te riza por usar informacin auxiliar que
per mi te agrupar a los elementos que componen la muestra e n es tra tos diferenciaJos. Los estra tos estn conformados po r eleme nt os qu e tie nen p untuacin homog nea en la vari abl e e n estudio. Los elementos que componen
un estrato son pa recidos dentro de l estrato y los est ratos son agrupaciones
distinta$ entre si.
La vari able de estrati ficaci n es auxiliar y permit e const itui r grupos ho mogneos de elementos. Condici n par:! q ue est o ocurra es que la varia ble
de est rat ificacin est rel acio nad a co n la variable a medi r. ASI, po r ejemplo,
para estudiar satis faccin labo ral se puede es tablecer estra tos seg n nivel de
ingreso e n e l e ntend ido que el ingreso est relac ion ado co n la sat isfacc i n
labor al.
Se suele usar m s d e una variab le de est ratificaci n, a fin de asegurar m ayor
hom oge neid ad en los estratos. En ta l caso se aconseja que ambas vari ables
estn rel acion adas con la variable a m edir, pero no rela cionadas e nt re si. Si
existe rela cin entre ellas su uso no se just ifica porque no mejoran el resultado
de la estratificacin . Se aconseja usar aquella que este ma s rela cion ada co n la
variable en estudio. a fin de gene rar estratos ms homog neos.
La lgi ca que subyace al m uestr eo estratificado es que agrupando los
elementos en es t rat os homogn eos es posib le m ejo rar la precisi n y m inimizar el costo respect o a sele ccin mediante muestreo aleatorio simple.
Un a bue na estratificacin se prod uce cu ando se gen eran estratos altamente
homog neos. Estratos homog neos so n condici n ne cesa ria para una buena
est imacin . En el limite, si cada estra to est co mp uesto po r e le mentos co n
la misma puntuacin la seleccn de un elemento po r estrato se ria ad ecu ada
para in fer ir sin error.
Cabe destaca r que cada estr at o es una agrupacin independ iente de las
dem s, lo c ual per m it e infer ir los resulta dos a la pobla cin orige n de cada
estrat o en for ma au tnoma . Conside rados todos los estratos en fo rma con junt a
Se infie re a la po blac in or igen de la m ues tra .
A m enudo se preci sa de result ados p ara subd ivision es de la muestra. A
saber, regiones, nivel socoecon mtco, grupos et reos, et c. Si esta s subdivisiones
co nfo rman estratos se pu ede inferi r pa ra cad a s ubdivisi n po r se parado

81

1.1. Precisin de la estim acin


del m uest reo estrat ificado da lugar a qu e la varianza del esti mador de
muestr a en cada estrato es igualo meno r al valor qu e se ob tendra mediante
ucstreo aleato rio simp le. En consecuencia, el m uestreo est ratific ado es siempre
.ral o mas preciso que el mu est reo aleat or io simple. La precisin es igual e n
lhos procedim ientos cu ando la variable de estratificacin no genera est rat os
cuando cada estrato presenta la misma di spe rsi n que la generada mediante
leccin alea to ria simple.
El xito del m uestreo estra tificado esta suj eto a dos condic ion es. Por una
rte, co nfo rm ar est rato s co n medias heterog neas que se m anifiesta e n varangrande en tre las m edi as de los estratos. En segundo lugar, conforma r est ratos
ntro de los cuales exi sta hom ogen eidad de p unt uaciones cuy a expres in es
rianza pequea de ntro de los estratos.
El efecto de diseo en un m uestreo est ratificado con est ratos homogneos
inferio r a l . Un efecto de di se o infe rior a I significa qu e el muestreo est racado es m s preciso q ue el muest reo alea tor io sim ple o. en otros t rmi nos,
te para una precisin prefi j.lda se req uie re n m enos observaciones en muestreo
rratificad o que e n muestreo aleatorio simp le.
1 lgica

1.2. Tamao de est ratos


el mbi to del muestreo est rat ificado el primer p aso es gen erar est ratos, a fin
asignar cada ele ment o a su est rato de pert ene nci a. Existen dive rsos procedcotos para esta blec er la amplitud de un estrato : equiparticin , igu alaci n de
:ales e igualacin de tamaos relativos . El m ejor criterio para discernir respec to
amao de los est ratos y generacin de estr atos ho mogn eos es la e xperienc ia
a intuicin .
1

l.3. Nu mero de estratos


sentid o comn seala q ue e n genera l los estra tos no deb en ser pocos o muchos
rque en ambos casos se desvi rt a la ventaj a qu e ofrec e e l agrup amiento de
.rnentos. Un nmero re-d ucido de est ratos no perm ite aprovecha r las ventajas
la estratificacin y m uch os es tratos gener a agrupaciones p eq ue as y compli~in e-n los clculos. Kish ( 19 72) establece com o referencia un rango de 3 a
e- tratos.
Para est ablece r el nm ero p tim o de estra tos ap ropiado se puede ut ilizar e-l
ocedun ento desarrol lado po r D alenius (1957). El clculo implica m ini m izar
siguien te fun cin .

4J

(11.1 )

o'

== -;u: + l. (Le, + IIc. -

e)

Donde:

cr == Varianza de la muest ra
l. = N Ume ro de estr atos
11 = Tam ao de [a muestr a

c. = Costo por un idad


e, = Costo por est rato
c = Costo gener al
El result ado generado despus de aplicar el mtodo de Lagrange p ara min imizar
unJ funcin es el siguiente.

.
N" de estratos

=s
b lc

(112)

Donde:
ti

= Tam ao de la muestra

e = Costo po r unidad
c = Cos to por est rato

11.4. Seleccin aleatoria de elem entos


Conocido el nmero de est ratos es preciso seleccio nar una mu estr a d~ element~s
al int erior de cada uno de ellos. Para estos efectos se ejecuta una sel~Clon aleat or ia
. 1 S u-le d -norninar a este procedimiento muestreo aleatorio estratlfic ll\'_'.
simpreoe sue
t:
d 1
blaci
.
La selecci n aleatoria de eleme ntos e n cada est rato e a po ~71On ~ Xlb<'
dispon er del list ado de to do s los ele m entos perten ecientes a la poblacin . Notese
que cada estrato de la muestra est co mpuesto de elementos q ue pe rten ecen al
mismo estrato en la poblacin orige n de la m uestra.

11.5. Afijaci n
La asignaci n de los elementos de la m uestra a cada uno ~e los .t'st ratos q .ue
com ponen la muestra recibe el nomb re de afijaci n. I.a asrgna cto n sd rcall/.~
seg n crite rios q ue e mprica y tericame~te ~e ha n m O'itrado adecua os. l .os
principales cr iterios de asignacin son los siguientes:

Numero de elementos qu e compone cada est rato


Varian za de los elementos dentro de oda estrato
Costo de cada elemento en los es tratos considerados
En funcin de los criterios sealados cabe distinguir cuatro tipos de ahjaci n
En afijAcin igual se asigna el mismo num ero de elementos en cada estrato. La
afijaci n igual no ti e n e uso en la pr cti ca . Raras veces se justifica d~fin ir para
todos los estratos el mismo tama o. No parece pertine nte d..sde el pu nto de vista
lgico ni es be neficioso con side rando la precisin de la est imaci n.
La af ijact n proporcional es de uso co m n y justificacin int uitiva. La idea
es que el t amao de cad.i estrato en la muestra sea propo rcional al tamao de l
co rrespondiente estrato de la poblacin. Presenta como ventaja ad icional que
se genera una mu est ra au tcponder ada caract erizada por la mis ma fracci n de
mue-treo en tod os los estratos.
La afijaci n ptima de varianza tie ne el prop sito de considerar la lgica de
la ahjaci n proporciona ! y simul tne amente el valor de la varianza e n cada estrat o. La idea que suby ace a esta asignacin es que los estratos de mayor varianza
t engan ms elementos que aqu ellos que son ms homog neos - respe rando la
prop orcionalidad en la asignacin.
La a fija ci n ptima de costos considera sim ultneame nte los criterios de proporcionalidad, varianza y costo. Se induye la variab le costo a fin que los estratos
m s caros tengan menos elemen tos que los est ratos baratos pa ra minimi zar el
costo de la invest igaci n.
Cabe desta car que en los procedimientos de ahja ci n no autcponderados
- lgual. p tima de varia nza)" ptima de costo- ~ utilizan factores de po nderacin
a fin de igualar la suma d e los pesos de.' todos los elementos y elimina r el sesgo
generado por la sele ccin desproporcionada de ele mentos.
Se demuestra que la relacin e nt re la varianza del estimador e n los muestr eos aleatorio simple, estratificado proporcional y es tratificado pt imo es la
siguiente.

11.6.1. Poblacin
Los estrat os se dist ribuyen del siguien te modo en la poblacin .
Primer estrato de tamao NI
Segundo est rato de tamao N 1

Estrato gen rico H de tamao N H


Estrato ltimo L de tamao N L
Los elementos se distribuyen en los estratos de la poblacin . El ele-me nto genrico
"",correspo nde a la pu ntuacin del elemento i e n el estrato h
Primer estra to

X II

Segundo estrato

x n xl] ...x l ;

Estr ato genrico H

xm

Estrato ultimo L

X LI X u

xl l
X H1

" , x/ i

x/N I

" ,X~l

",x H.. x1'J

", x Li

xtN t

Tamao de la pob lacin

.,

.,

N = roN. = N + N 1 + ...N H + ... NI.

Tamao del estrato h-smo

PeSO de cada est rato


Siemp re la varianza del est imador del m uestreo aleatorio simple es mayo r qu e la
del mu estree est ratificado, excep to cuando la variable de estratificacin no est
relacionada con la variable e n estudio y no se form an est ratos. Siempre la varianza
del mu estr eo con af ij acn proporcional es mayor que la varian za del muestreo con
ahjncin ptim a, excep to cuando todos los estra tos t ienen la misma varianza.

Med ia de la pobl aci n

( 11.3)

11 .6. Notacin
Para caracte rizar la est ruc tura del m uest reo estratificado cabe d istinguir estra tos
y elementos en la poblacin , y en la mu estra

84

85

Media del est rato h-esimo


Media de la muestra. Diseo no auto po ndcrado

(1 l.4 )

i= ,.,
LWi o

(1 1.7)

Media del est rat o h- smo

Varianza del est rato h- smo

(1 1.5)

AA

x,;

i=~

( 11.8)

",

Varianza del estrato h- simo

11.6 .2. M uestra


(11. 9)

:"':1. muest ra es una replica e n tamao red ucido de la pobl aci n. Presen ta la mi sma
estruct ura q ue la pob laci n difer cnc t ndose en el tam ao de los est ratos.
El eleme nto gen{'rico x", corresp ond e a la puntuacin del ele mento i e n el
-strato h.

El siguien te esquema permite visualizar la es truc tura caracte rst ica del m uestreo
estr atficado.

(a m ao de la muestra

.,

n = I n. = n' + "J + ' "

+",, +... +",

G rfico 9 Estructura del diseo estra tificado

Famac del estrato h- simo

Poblaci n

",

no = LX..

'"'

Subdivisin d.. estr atos

'eso de estrato h-simo

Subdivisin ele cst rHilS

.I x",

-ledia de la muestra. D ise o autoponderado

X=!~

( 11.6)

"

oc

11. 7. Tipos de atijaci n

11.7.2 . A fijacin proporcional

11.7. l . A fijacin igual

La afijacin pro po rcio nal h a sido co noc ida co mo afijaci n de Bowley. La caracterstica distintiva de la afiactcn propo rc io nal es q ue el t am ao de los est ratos
muestrales es proporc ional al ta ma o de los est ratos poblacion ales
L:1 af ij ac n proporcional da lug ar a un muestreo autoponderado. En efecto,
al mantene r la fraccin de m uestreo propor cional en todos los estratos asegura
que todos los elem entos de la pob lacin t ienen la m ism a probabilidad de pertenecer a la muestra.
La est ruc tura de la muest ra co n afijac n proporciona l es la sigu ien te.

El tamao de todos los estrat os en afi," acin iguales el m!


E
.
,1
d
..
..... '- m Ismo. :0 conseClle nCla
e peso
.c cada estrato
se ra Igua l para tod os los. estra tosacr
El cal
] doer1 pcso du;'
I
bt
carcuro
cal a estrato se o tiene segn el siguiente cuo cien te.

w,

=t

L = Nme ro de est ratos

Grafico 11. D ise o est ratificado. Afijac n proporcional


El tamao de cada es trato se o btie ne dividi endo dos t rmin os

n :: Tam ao de la muestr a

Tam ao d e estr atos

:fi.af:j~cin

igual. p ara efectos de frmu la presenta los mi smo s termina s' q ue la


ObJl~clOn proxorCl~n~l. No e.s un muestreo au topo nderado. La media m uestra! se
H,'OC po~ er~ n o a media de cada estra to por su peso. En consec ue ncia
ara
real~zar e~timacl()nes med iant.e afijac n igu al se calcula el tamao de la m~~tra
el mt~r. ~Io ?d<dconfi anza segun las frmulas utilizadas en afiiac n p roporcional
. 3 p arncu an a es qu e los estratos tienen el mismo peso.
.
La est ruc tu ra de la muestr~ co n afijaci n igual es la siguien te.

Estadstico s

.,
r x"
X =.hl.., ",

I1I -

n w,

.,, "

x)='7t,
1

11, - 1I

w, I

r x
x=-"''-

.".

o.

LL I..
i =~

Media muestra

.,x-,
Pj=':t.,l.-

G rfico 10 . D iseo estratificado. Afijacill igual


MlIt'st n"

11'1 ,- 11 ' W ,

"
.,

I ",

p/ =':t-

~._,o-

,"

r" ....

P. = "n)~

LL -,
p= ..Mcl-

Proporcin muestra

"

Subdivi'lin en es tratos

11.7 .3. Afijacin p tinu

Estildisticos

M..J ia muestra

Proporcin mUCl;tra

P= !WJJ.

"

88

La afijaci n ptima S~ realiza con el pro psito de mejo rar la precisi n de las
esti maciones respecto a la a fijaci n proporcio nal. Se distin gue afijaci n ptima
de varianza y afijaci n pti ma de cos to.
La ahjacin ptima de varianza co nocida com o afi jaci n de Ncymon tiene
el prop sito de minimizar la varianza del est im ado r p.lra un tama o de estratos
p redefinido. En particula r; los estratos de m eno r varianza sern m s peq ueos y los
de varianza m ayor sern m as grandes. La lugil";l que subyace a esta afijecin es q ue
en est ratos de ele mentos sim ilares no es necesa rio muestrear muchos element os
y slo cabe sacar muestras grandes en est ratos con valo res het e rog neos.

89

1.:1 ahja ci n pti ma J ~ costo es una variacin de la afijaci n pti ma de varan,


za que considera ade ms el costo en la seleccin de elementos. Presen t a como
alternativas minimizar la varianza del estimador para un costo dado o m inim izar
el cost o para un a varianza del esti ma do r preestablecida. Se consideran costos
diferenc iados en cad a uno de los est ratos, a fin de q ue los estratos rn s caros Sean
de menor tamao,
La ahjaci n p tima, sea de varianz a o costo, plantea la neces idad de m inimizar
.sna Funci n dada una restricci n. Para estos efectos se su ele ut iliz ar el m tod o
1<.: multiplicado res de Lagrang e.
La estruct ura d e la muest ra con afijacin p tim a do.' vari anza es la sigu iente.

Grfico 13. Diseo e5tratiicado. Afijacin ptima de costo

Media

T.m~o J~

los estratos

-; ,

K
11= " - -

, ,

i ,= W, x-,J

"
n = n "'1,

'

",...
.,
X, =

w, ,

xl =

.,

.,r, "',',

n =n "' '

W 1 Xl

I X;,= W. i:

,
X=L
. ,W.

M,-dia muestra!

r "'.s,
"

proporcin

Tamao de los estm to s

x"
Propcrcjn muestral

Pro porci n

Tama o de los estra to .

Pro porc in estratos

Propo rci n muestral

estruc tur a de la muestra co n afijacin ptima d e cos to es la siguiente.

90

n-,K_

r "',J.
".-.re:

x1-wlx1 l l x~=u'.i~ 1
i =L
,-, w~ i~

Med ia
,

"7i:

n~=

--

Tamao de lo >estratos

! ......

7i:

Gr fico 12. Dsr-o estrettficado. Afijacn ptima de vananza

n = n "'! ,

n1= n- -

I "',J
.,

~-

"','.

- ,

-:-:

-, .'l..

Capitulo 12

Muestr eo est ratifi cado de med ias

12.1. Estimacin de la m edia


En mu estreo est ratificado la frmula del clculo de la media mu estral varia segn
npo de afijacin. A saber, m edia aritm tica pa ra afijac n proporciona l y me dia
aritmtica ponderada pa ra afijacin igua l y p t im a.
Cebe destaca r q ue la afijaci n proporciona l t am bin pe rm ite clcu lo de la
media n~ llest ral utiliza ndo m edia aritm tica po nderada.

12.1.1. Media aritmtica


En d iseos e n los que el t amao de lo s es tratos m uestra les (' S p roporc ional al
tam ao de los est rato s poblacionales el esti mador de la media poblacio nal es la
media aritmtica de la m uest ra .
El d iseo es autopo nderado y cu m ple con las siguientes co ndicio nes:

Los estratos de la muestra tienen las misma s razones qu e sus co rrespondientes


estr atos en la poblacin n. = N '!.,. .

"

La fracc in de muestreo d e cada es trato es igu al a la fraccin de muestreo


de la poblacin ~ = ~ .

N. N

El peso relativo de cada estrato en la pobl acin y en la muestra cum ple con
la igualdad w,,=\V~.

"
"

En d i.~ l' os autoponderados se asigna autom ticamente la ponderacin 2 de


cada est rato a cada me-dia cstratal x.' En consecuencia, no es preciso efectuar la
mult iplicaci n de pesos y media s estratalcs. El dise o aotopondcrado no requiere de ponderadores, ya que la nat uralez a m isma del d iseo genera u na media
pond e rada.
El estadst ico muestral se presenta a continuacin.

,.
r I x.;

=A<ll. L....-...

"
93

En este contexto la media ponderada no t ie ne restricciones respecto a la


relacin tamao del estrato muestra] y el tamao del estrato poblecooal. A
diferenci a de la ofijacn proporcion al e-que es au topooderada-. los pesos w h no
deben mantener neces ariamente la proporcin en tre no y N h , La muestra ser
despropor cionada can la restr iccin que la suma de los pesos es l .

h es indicador del h-simo estrat o


i es indicador de t-csrnc elemento

2. 1.2. M edia aritmtica ponderada


uscos no autopondemdos requi er en ponderar la media ar it m tica p ara estimar
l pa rmetro po blacional. Un a media po nd erada asocia el peso de cad a uno de
is estratos con las respectivas m edias estratales. Ntese q ue en cada es trat o
- obtiene media y peso independenre de la m ed ia y peso de otro est rato. Se
er.nuestra. q ue la suma ponderada de medias por pesos per m ite obtener un
nimador nscsgado de la me d ia poblaconal.

(12.1)

12.2. Varianza genrica del estimador de la m edia


La varianza del estimador de la media sin especificar abjacin tiene una f rm ula
genrica de la cual se extraen las frmulas especficas q u e se aplica en efijaci n
propon:ional u ptima . La varianza genrica es una variaci n de la varianza de l
estimador de m uestreo aleatorio simple.
Los dos componen tes de la frmul a son los pesos de los estratos y la varianza del estimador en cada est rato . La expresin de la varianza del estimador en
muest reo estratificado es la siguiente

::: L E(WhXh)::: L W,E (x, )


'~ I

hl

(12.3 )

Donde:
N

Sustit uyend o

(12.2)

(Ji,==

'-

LUr;; -----.L-h=/

~.l

!!. . - L
N ,
n ll

O perando algeb racamente

ende:
N ::: Tamao de la poblacin
N
}V, ==
== Peso del estrato h -simo

-ri-

01 == - 12
N

1.

:,N, (NI. hl

nJ .-nI.s''

(12.4)

Donde:

XI. == Media del estrato h -stmo


NI. == Tamao del estrat o h- stmo e n la poblacin
asum e qu e si las muestras de cada est rato son independientes y la m ed ia muesI de .cad a es tr ato es un estim ador insesgado del correspondiente parm etr o
blaconal, la m ed ia pon derada es un estimador insesgado indep en diente del
o de afijac in .

94

(J ;~:::
S~'='

Varianza del est imador de la m edia en el estrato h- smo

Varianz a del estrato h-stmo

95

Ntese que los pes os de los estratos se elevan al cuadrado, dado qu e rnulti,
plcan varianzas y no medias.

12.4. Afijaci n proporcional


12.4. 1. Estimacin de la media

12.3. Tamao gen rico de la muestra


El tamao de la muestra de la medi a sin es peci fica r afi ec n es una frm ula
gen rica de la cual S<' extraen las frmulas especi ficas que se aplica en afijacn
proporcional u ptima. La frmula gen rica se obtiene despej ando sob re el e rro r
mximo admi sible. El procedimiento es id n tico a muestreo aleatorio simple,
slo cambi an los terminas del algorit mo.

( 12.5)

La media m ucstra l es un estimador autoponclcrado de la media pobla conal. En


afijacin proporcional se obtiene un estimador tnscsgado de la media po blactonal
utilizando como esti mador la medi a aritm tica de la muestr a.

X"

LLx,
hr_

"
Donde:
x"," Puntuacin en el est ado h -simo d el elemento i-si mc
11 = Tam a o de la muest ra

12.4 .2. Error tpico


La varianza del estima dor de la media par a ahjacin proporcional se dedu ce de la
frmu la gen r ica de varianza del est imador e n mu estreo estr at ificado. Operando
algebrai camente en la frm ula (12.4) se ob t ie ne la frmula de la varianza de
estimador de la media en mu estr eo estratificad o con afijact n propor cional.

)
(~~'"I w11','~ w,'
N

= z?n

Dado que n~ ..

.'::L IL _ ..::A:.l

IIW

y d ividie ndo por Z'~l

(12.7)

El error tpi co utilizado e n el inte rvalo de confianza se obtien e como raiz cu adrada de la varia n za.

12.4.3. Tamao de la mu estra


La frmula del tamao de la mues tra se' ob t iene despej ando los terminas de
la ecua cin bsica que relacion a e rror m ximo con coeficiente de confianza
y error tipico. Operand o algcbracame nte se deduce la frmula para a fijaci n
propor cional .

(12.6)

( 12.8)

e = z.,n 0 """
..1

N -n- ,1"
.2
",::" Wh~-h
N n '~I

e- = Z..n - -

96

97

SOLUCI N

r)esr ejando n

"

A partir del enunciado ob te nem os los slgutcntes datos:

~ w~si
,.,

( 129)

N = 560 .450
e = l
%<>12 =1 ,96
Para los clculos u tilizamos las sigu ientes frmulas:

'" Error m x i m o admisible

z~ '" Coeficiente

de co nfianza asoc iado a nivel d o:" confianza

N .. "'" Tamao de los estratos


S ~ "'" Variab ilidad

de cada estrato

l V. "'" N

:J tamao de cada estra to

So:"

calc ula segun la siguiente expresin.

5
j e investiga nivel de intolerancia en mayores de 18 aos habitantes de una regin
.ivid id a en 5 com unas. Estud ios anteri ores se alan que la intoler ancia es distinta
-n cada una de estas co m unas (probableme nte debido a difere ncias en el nivel
-ocioccon mico ]. Se decde utilizar mu est reo estr atificado, y d ado que se quiere
presen ta r cada com una proporcionalme nte al t amao de su poblacin, se utiizar ahj aci n proporcional. Para pode r apl icar la encuest a es necesario definir
.arna o de la mu estra y efijac n para cada est rato. La regin en su conju nto
.ucnt a con 56 0 .450 habitantes ma yores de edad . El e rror mx imo ad misible fue
ljado en 1 y el nivel de con fianza en 9 5%. En la Tabla siguiente se observan los
.aruaos de cada estrato y sus respect ivas varianz as:

Para reem plazar los valores e n la frmula, debernos primero calcular los d atos
para llenar est a Tabla-

>ROBLD,fA

Comuna

N,

S'

128.230
59.78 1
142JtJ6
ISO.3ZO
49.753
560.450

144
49
81
100

3
4

5
Total

G4

",

w11.

0,23

14,72

Comuna 2

0,11

15,84

Comuna 3

0,25

12,25

Comuna 4

0,32

25,92

Comuna S

0,09

Comuna I

Tot.1

Calculo del peso de cada estrato :

.230- = O 23
w = .128
_.. ~-I
560 .450
'

LWI = 1

Ir '

L wi. =77,73
.',

Donde:

w = 142 .366 = O 25
] 560.4 50
'

w = 49 .753 =
5

560.450

= Estim ador muestral


= Coeficiente de confianza asociado a nivel de confianza

o . = Erro r tpico del est imador


0'
N = Tamao de la poblacin
11 = Tamao de la muestra
W
= Peso del estrato h-smo
h
= Varianza de estr ato h- smo

'

x
Z0/2

09

Ckulo del t amao de la m u estra:

6
Luego de apli car la en cuesta sobre intolerancia se p rocede a inferir mediante
intervalo de confian za. Se mide intolerancia con esca la de rango I a 6. En es ta
regin viven 128.230 personas mayores de 18 aos, de las cua les fueron encuestad as 299 .'5e ob tuvo un a media m uestra] de 3,9. Se genera intervalo para estimar
con 95% de confi anza.
En la Tabla siguiente se observan los pesos de cada estra to, 'sus respectivas
var ianzas y el peso multiplicado por las varianzas (calc ulado en el ejercicio anterior) :

PROBLEM;\

11

= 299

Ahora distribuimos el tot al de la mues tra en los estratos:


TI

= 299 0,23 = 69

n ]

= 299 0,11 = 33

TI]

= 299 ' 0,25 = 75

= 299 0,32 = 96
"s = 299 0,09 = 27

Com una
Comuna
Comu na
Com una
Comuna

n4

CONCLUSION

Para hace r una estimacin co n un error mximo admisib le de I y un nivel de


confianza del 95%, se requiere una mues tra de 29 9 pe rsonas : 69 de la comuna 1;
33 de la comun a 2; 75 de la comuna 3; 96 de la comuna 4 y 27 de la comuna 5.

Total

1
2
3
4
5

w,

0,23
0,11
0,25
0,32

64
144
49

0,09

100

,
2: wh =

W,S
14,72
15,84
12,25
25,92
9

81

,
L
ws
",, 77,73
l. '
~ 1
l

'~ J

SOLl/CION

12 .4.4. Intervalo de confianza


La elaboracin dd in tervalo de confianza se realiza segn una adaptacin de la
frmula gen rica (12A) al muestreo estr atificado con afijaci n proporcional.
Reem plazando en la frmula se construye d inte rvalo de la estim acin.

A partir del enunciado obtenemos los siguientes da tos '

N = 5604 50
11

(12.10)

=
0=

Z"-' 2

(12.11)

100

299
3,9
= 1,96

Para los clculos utilizamos la siguie nte frmula:

JO I

(12.13)
ceernplazando :

3,9 1,96

Elerror tpico es la raz cuadrad a de la varianza.

56Q,'ISO -?SL'L 77 73
560.450 299

'

12.5.3. Tamao de la muestra

3,9 1

El clculo de l t am ao de la muestra en afijaci n ptima de varia nza se realiza

(2,9; 4,9)
'~ON C LUS 1 0 N
:011

95% de confianza podemos afirmar que el promedio de intolerancia segn

-scala 1 a 6 se encuentra entre 2,9 y 4,9 en los sujetos estudiados.

minimizand o un a funcin a fin de encontrar los valores de nh que h acen mnima


la varianza del estimador prefijado e! tamao n de la m uestra.
La af ij aci n de varianza m nima para un n dado implica cumplir con las dos
condiciones siguientes
mio dL.,

12..5. A hja cin ptim a de varianza


:2. 5. 1. Estimacin de la media
.a esti m ac i n de la media en efitac ptima de varianza mnima desarrollada
aor Neyman ( 1934) se realiza con la frm ula general de la me dia pon derada. En
carticular; en cada estra to se pond era la m edia con el p ('~o relativo del estrato.

Para enc ontrar el mnimo de una fu ncin se ut iliza e! mtodo de mu lt iplicado res de Lagrange. En particula r se t rat a de e ncontrar el mnimo de la siguient e
expresin.

(12 14)

(12.12)

Jonde:
w~

El mnimo se obtiene deriva ndo la exp resin respecto a los O h estra tos e igualando
a ecad a una de las de rivadas. O perando algebrai camen tc se obtienen la fr m ula
del tamao de cada estrato nh que sat isface la restriccin preestablecida.

= Peso de l est rato h-stmo

xh = Med ia del est rat o h - sirno


(1215)

12.5.2. Error tpico


:.a varian za de! estimado r de la media p ara afijacin ptim a es un a variacin de
J frmula genri ca presentada e n (12.4) . En efecto, la var ianza de la me di a en
rhj acin ptima utiliza como valores de n h aquellos que minimizan el t amao
le la m uestr a considerando la varianza de cada estrato. Sust ituyendo los valores
-n la frmula gen rica

Razones de exposicin aconsejan presentar la frmula del t am a o n de la mues tra


a partir de la ecuacin b sica. A saber, despejando el e rror mximo adm isible.

(12.16)

SOLUCi N

A partir del e nunciado obte ne rnos los siguientes datos'

N = 1.430
despejando n

=o

zo/1

=o

2,58

( 12. 17)
Para los clculos utilizamos las siguientes frm ulas:

l~w~s~r

, ,

L W~s~

Do nde:

'.1

-el-+ - - z~

= Error mximo admisible

z..n = Coeficiente de confianza asociado a nivel de confianza

w.si

'1, =0'1

N, = Tamao del est rato h -smc


~ = Variabilidad del est rato h-stmc

,r...w~s:

W = N~

( 12.15)

w =!:!.L
N

PROIl I.EM A 7

S(' mi de nivel de sex ism o en estudiantes. Sabido qu e estos pun tajes son m uy
dist intos segn sexo, se opt por estratificar a los est udiantes por esta variable ,
A su vez, a partir de informac in de otros estudios, se puede asumir que )IS
muj er es tie nde n a ser mas sim ilares en c uanto al sexismo que los hombres. Por
estas razones se decidi hace r un m uestr eo estrat ificado co n efija c n ptima de
varia nza . Para llevar a cabo el estudio es necesario calc ular el tamao de muestra
adec uado. El to tal de estudiant es de este colegio asciende a 1.430. Se fij como
error mx imo admisible 1, y 99 % de confian za.
En la sigu iente Tabl a se presenta el tamao de cada estrato y su varianza
respectiva :

Hom bres
Mujeres

Tlllal

N,

r.

705

225
100

725
1430

Para reem plazar los valo res en la frm ula, debemos p rime ro calcular los da tos
para llenar est a Tabla :

Hombres
Mujnn

-,

w.r.

0.'49
0,51

1I0,Z5
51

Tobl

,.,1:1t'. : I

,
.,~IU.~ : 161,Z5

Clcul o del peso de cada estrato:

w = _Z /)5 ;; O 49
, 1.430
'
w = 725_ = 05 1
1

104

1.430

'

105

"

11',1.

"

7~5

5,1

10

'l,W,i, = 12,45

,. -- "

zeemplazando :

"

12,45 '

~..l:.- +
2,582

llill

wA

'.

ws.

Hombres

0,49

15

7,35

4,3

O,5!

22S
100

110,25

Ml.ljeres

51

10

5,1

3,1

lA J a

.,
,

Lw,s=161,25

L w=1

Total

00'

n = 584

\ hora distribuimos el total de la m ue stra en los estra tos:

So LUCION

A partir del enunciado ob tenemos los siguientes dat os:

N = 1.430
11 = 584
ZoJ2 ;;; 2,58

=584 T6,1s=185

Para los clcul os utilizarn os las siguie ntes fr mu las:

~ONC\.USION

'ara hacer una estimac in con un err or mximo adm isible de 1 y un nivel de
onfianza del 99%, se requiere una muestra de 584 estudiantes, 399 hom br es y
85 mujeres.

..,

i= L Wh X,

2.5 .4. Intervalo de confianza


:1 intervalo de confianza se obtiene co mo consecuencia de la aplicaci n de la
rm ula genrica al caso especfico de la est im acin mediante afij aci n ptima
le varianzas. Reemp lazando en la frmu la bsica se obt iene para afijacin ptima
I siguiente int e rvalo.

(12.18)

x z<l/2

(12.19 )

Prime ro calc ulamos el promedio muestra] :


x ~0,49 '4 ,3+0 , 5 1' 3, I =J ,7

Reemplazando:

3,7 2,58
' f{O BLEM A

.plicada la encuesta sobre sexismo en el colegio anteriorm ente nom b rado, se


ucre est ablece r un int ervalo de confianza para estimar el promedio de sexismo
cgn escala 1 a 6, El nivel de confianza se fij en 99%.
En la siguiente Tabla se presenta el peso de cada est rato, varian za, p rom edio
btenido en la escala de sexismo y datos calcul ados en el ejercicio ante rior neesanos pa ra calcu lar el inte rvalo :

w.

3,7

(2,7; 4,7)

!1_L'ti':

lEil,25

584

1.430

,
Lw,=12,45
,.,

Con 99% de con fianza podemos afirm ar que el promedio de sexismo, en una
e-scala de J a 6, se encu e ntra e nt re 2,7 y 4,7 .

proporcio nal. Lgico si se cons idera que ~a afijac n ptim a de costo inclu ye
adems del costo simultneamente los atri butos de la ahjaci n p roporcion al y
la afijacin p tima de varianza. Eliminadas las diferencias en varianza y costo se
reduce a una afijs ci n p rop orcional.

12.6 . Afijaci n p tima de costo

12.6 .3. Tamao de la muescra

12.6 . 1. Estimaci n de la media

El tamao de la m uest ra e n afijaci n ptima de costos se ob tiene aplicando el m todo de mu ltiplicadores de Lagrange. En particular se tra ta de encontrar los valores

C Q.\lCllISION

La af ijaci n pt ima de costo conside ra como insumo el costo diferencia l en cada


estrato. Para el calc ulo de la med ia m uestra! esta informacin no es relevante.
Natura lm e nte corresponde utilizar el criterio de la afijaci n p tima de costo
cuando se calcula lJ varian za de l est imador y el tama o de la m uestr a.
La frmula del est imador de la media poblacional es una media mu estral ponderada. La medias estratales se po nde ran po r el peso de los disti ntos est ratos.

x '=

que hacen mnima la var ianz a del esti mador con la restri ccin
A saber, varianza mnima para un coste fijo.

L C. J1, .

h~ 1

min aL...-

t,

~ w. lo

(1 Z.ZO)

0 .0

Donde:
Do nde:

w. '=

n 10

'11 = Peso del es trato h -smo

x. = Media del estra to h-simo

= costo t otal

c.

'=

"..

'=

costo del est rato h-smo


ta ma o del estra to h -simo.

En particular, se de be encon tra r el minimo de la siguiente expresin.


" = - 11 I' N,

] 2.6.2. Error tpico

La varia nza de estimador de la media cua ndo se plantean costos variables en los
distin tos estratos se obtiene como variacin de la frmula gen rica del m uestreo
estratificado. La difer encia en tre ambas frmu las se explica po rque en mu est re-o en ahjaci n de costos se consideran simultneamente t amao, varianza y
costo.

hJ

s' +
(N. - '11.) _/0_

"lo

).

[ L' c."..- e

( 1z.zz)

Se deriva la expresin respect o a n I' ... ,"' y se igu ala a O. O pe rando algebraica mente en el result ado ob ten ido se ded uce las fr mul as de nh y n que cu m plen
con la restriccin establecida.

(12.23)

(1Z.ZI)

N tese q ue si la variacin e n los dife rentes e-stratos es la misma y los costos son
iguales en cada est rato, la frm ula anterior se reduce a la frmu la de la afijaci n

La ecua cin del clculo de n e videncia qu e el ta ma o de un est rat o h ser mayor


si se dan las siguiente condi ciones:
su tama o relativo es grande
la variabilidad del est rato es grande
el costo por unidad mu estr al e n el estrato es pequ e o

108

109

La raz cuad rada de

(Ji- es el e rror

tp ico.

Razone s de e xpo sicin aco nse jan gene r r la frm ula del tamao de la mu estra a
part ir de la ec uacin bsica. En particular; a pa rtir de la iguald ad del error m aximo
admisib le co n el coefictente de co nfianza y el error t p ico.

e = zu/2

0 ,-

i,

N,

Urb ano
Ru ral

(1 2.24)

To tal

758 .230
291.959

100
6'

10.0l10

14.; 00

1.050 .1R9

ti = .ni! o:...,
SOLUCI~

A part ir del e nunciado obtenemos los siguiente s datus:


N = 1 050.189
e == 0,5
z..n = 1,96

(12 .25)

Donde:

= Error m ximo admisible

z..n = Coeficiente de co nfianza asoci ado a nivel de confi anz a


N~

= Tama o del est rato h- simo

si

Vanabhdad del estr ato hssirnc

W = ~
N
9
Se invest iga racism o e n una regi n co n imp or tant e po blaci n indgena. D ado
qu e e n esta regi n e xiste n much as zo nas rurales y sabiendo q ue el costo para
realizar u na enc ues ta en reas ru rales es mucho mayor al de r eas urb anas, se
decidi llevar a cabo u n muest reo est rati ficado co n af ijacn pti ma de cost o.
Para lle var a cabo la e ncuest a se req uiere calcular el tam ao dIO' muestra necesario. En la regin vive n 1.050 . 189 pe rso nas. Se quier e hace r u na esti m acin
co n un err or m xim o ad m isible de 0,5 y un ni vel d e co nfian za del 95%. En la
siguie nte Tab la se p rese nta el t am ao de m ues tra de cada estrato, sus varianzas
y costos resp ectivos:
PRO RLEM A

=!:!l!

Para reemplazar los valores en la form ule. debernos primero calcular los datos
para llen ar est a Tabla:
l.

W'S I

W,

U'~r.

Urbano

0,72

72

10

100

720

0,072

Rur.l

0,28

17,92

12O

268,8

0,0 19

Total

,
r,.,. .l = 1

,
r,.,uS:: = 89,92

wsl K

Lws.JC;= 981:1,8
,.,

..

l. F.
,
el

~~= 0,09 1

l "f7!;

Clc ulo del peso de cada estrato ;

=-.l?V30

ur
1

1.050 .189

10
Aplicada la e ncuest a de racismo se q uiere calcular un intervalo de co nfianza
para est imar el p rom edio de racism o regional, se gn escala I a 6. De 1.050 .189
pe rsonas que habitan e n la re gin se enc ues ta ron 1.381 ,
En la siguient e Tahla se p resen ta el tamao de m uestr a de cada estrato, sus
varianzas)' costos respect ivos, el peso de cada estr ato (calculado en el ejercicio
anterior) y los promedios obtenidos e n la esca la de racismo.

PROBLEMA

= 0 72
'

w = 291.959 - O 28
1
1.050. 189 - ,

Reemplaza ndo ;

n-

988 ,8 ' 0 ,09 1

.Q,52

1,96 2

U rb~no

+ ~~

758.230
291.959

Rural

1.050. I89

100

w.

<

'

0,12
0,2 8

10,000

3.,
3.9

101.400

..,
t,

I W,=1

1381

Ahora distribuimos el total de la muestr a en los es trat os:

SOL UCIN

A pa rt ir del e nunciado ob ten e mos los sigu ientes d at os:

0,072

ni

r.

) ,050,189

l bt _1
'1 =

= 138 1 O09f = 1093

N = 1.0 50 .189
= 1.38 1
=
an 1,96

71

0,019

n 2 = 1381 ' 0 091 = 288

7.

Para los calculas utilizamos las siguientes frm ulas:

:mJCI.USION

'ara hacer un a est im aci n con u n e rro r m ximo adm isible de 0,5 y un nivel de
on fianza del 9 5%, se req uier e un a m uestr a de 1.381 perso nas, 1.093 de zona
rbana y 288 de zona rural.

2.6.4 . Intervalo de confianza

..,

i'= Iw~j,

xc

Z""

.1 intervalo de co nfianza para la afijact n ptim a de costos se deduce de la frmula


lsica de interva lo de confianza. V ase 12.4. st a permite obten er la frm ula
spec tfica para el interv alo en ahjaci n pt ima de m ed ias.

( 12.26)

(12.27)

112

Prim ero calculam os el pr om ed io de la po blacin'

x=0,72 3,4 + 0,2 8 ' 3,9 = 3,5


Para reemplazar los valore s e n la fr m ul a, debemos p rim er o ca lcu lar los datos
llenand o est a Tabla :

113

.,

'.

'.

100
110

10

Urbano

Rural

Nlr.

N.s {E;

75.823000
18.685.3 76

753.2JO.COJ
230.280.640

,
Total

;':,N.r:94.508.376

..,

r N. S .c;;. 1.038.510540

N,s,

.fe:

zs.sn

Capitulo 13

Mu estreo est ratificado de proporcion es

19.403,93
~N,s.
6
..VC:",
c. 95.23 ,93

0-,

Clculo del peso de cad a estra to:

758.230
Wl

1.050.189 =0,72

Wz

= I .OSQl89- = 0,28

291.959

Reem plazando :
3,5:i: 1,96

1.038.510.640 9528693 94.5Q8.3 76


138 \ ' 1.050 .\ 89'
.
.
1.050.\89'

3,5 :t 0,5

13 .1. Estimacin de la proporcin


La estim acin del par metro en mb ito propo rciones prese nta las mismas caracte risticas que la esti m acin de [a media po blacional .
En m ue streo con efijaci n proporcion al el esti mador del parmetro rob laconal es la propo rci n m uestra ] :-':0 es necesari o ponder ar la proporcin de
cada est rato por el peso de stos, da do que es un m uestreo autoponderado. Se
demuestra que la siguiente frmul a genera un estimador insesgado del pa r met ro
pobl aciooal.

( 13.1)

(3; 4)

h es indicador del h -simo est rato


C O NCLU SI N

C on 9 5% de confianza podemos afirmar que en promedio la poblacin o bt uvo


un punt aje en tre 3 y 4 en la escala de racismo.

i es indicado r de i-esimo ele mento

La ahjacl n igual y p tim a exigen gene rar un estadtstlco ponderado para est im ar
el parm etro poblaconal. En particular, se po nde ra la propo rcin de cada estrato
por el pe so de stos. Se asume que si las mu estras de ntro de cada est rato son independientes y la media de cada estrato es un esti mador insesgado del pa rmetro
del estrato, el estimador ponderado es un est im ado r apropi ado. Se dem uestra
que la frmula presenta da a continuacin es un es tim ado r de 11.

( 13.2)
D ond e:
Wk

= Peso del estrato h-csimo

Pk = Proporcin del estrat o h -simo

13 .2. Varian za genrica del estimador de la proporcin


La varianza de! estimador de la proporcin para las distintas afijaciones se obtiene
segu n e! mismo procedimiento utilizado para medias. A sabe r,se deducen de una
frmula genrica que es una variacin de la frmula de la varianza de! estimador
en muestreo aleatorio sim ple.
La frm ula genrica de la varianza del estimador de la proporcin en muest reo estratificado es la siguiente.

Dado Que " ..nw. y d ividiendo por Zlo/J

..,

{~= ~wla~

( 133)

Donde:

l_ Nh - nh .__
phqh
a,._
N~

(IJ.4)

n~

w~ p,~

n= ' . . /

w,
f wh phqh
e: - ,

S ustituyendo:

0,;= l ul. N~ -

zk =---;N~-

n~ . ~q~

N~

....., .

(IJ .7)

n~

Donde:
Operando algebraicam ente:
0 2

,.

=_!.-. N i .
NJ h

"

N~.:...!!_~_
N~ - l

Z,v J

p"q"

(13.5)

" lo

El valo r Pbq~ no se conoce y es sustit uido por un valo r conocido o po r la varianza


m xima que corresponde a p =q=O,5.

N" = Tama o del est rato h-sirno


si == Variab ilidad d el estrato h - smo

=!'N!.!.

13.4. Afijacin proporcional

13 .3 . Tamao de la m uestra genr ico


El tamao de la muestra sin especificar e l t ipo de afijacl n se obtiene despejando sobre e! error mximo admisible. El procedim iento es id nt ico a m uestreo
aleatorio simple, slo cam b ian los tr m inos de l algoritmo.

e = z,~ a ~

= Coeficie nte de con fian za asociado a nivel de con fianza

13.4.1. Estimaci n de la proporci n


La afijaci n proporcional da lugar a una m uest ra autoponderada donde el estimador de la prop orcin poblaconal se obtiene d irectamente de la propo rci n
de la muestra.

( 13.6)
(13.8)

11 6

117

N tese qu e todos los estratos de la muestr a tien en las mismas razones que su,>
correspon dientes estr ato s eu la poblaci n ~ _:::::
La fraccin de m uestree de

%_.

cada est r..to es igual a la frac cin de muestreo de la poblacin ~~ =.!:. . El


n, N
peso relanvo de caj a estrato en 1.1 poblaci n y en la m uestra mant iene la igual.
dad Wk=tVk.

Donde:
t
z"n

= Error m ximo admisible


= Coefici ente de confianz., asociado a nivel de confianza

N k = Tam.1odel est rato h -estmo


Pkq~

= Variabilidad del estrato h- sirno

N.
Wk ::::: -N-

13 .4.2 . Error tpico


La f rmu la gen rica de varianza de l estima dor presentada e n (13.5) permite
ded ucir la expresin apropia da para afiect n pro porcional.
01
/><fP

N-=J1_
w
N .n
k.

PIlOB t. E ~ A 1I
k

p q
lo

lo

(13.9 )

El erro r t pico utilizado en el inte rvalo de confianza se obtiene como raiz cuadrad a de la varianza.

n A.3. Tamao de la muestra


El tamao de la m uestra se ob tie ne operando algebraicarnente sobre la ec uaci n
que relaciona erro r mximo admisible co n nivel de co nfianza y er ror tipico. La
expresin del ta ma o de la m uestra es la siguie nte .
e

= 'Z"n 0,..

".

w, =-

Se m ide auto ritarismo en una regi n . Se sabe que existe n difer t"ncias significat ivas con resp ecto a esta variable seg n hab itant es de zonas rurales o urbanas. En
virtud ele lo cual se uti liza m uestr eo estratificado. A su vez, se qui ere represe ntar
proporcionalmente a cad a estrato, por lo q ue se opt por una afijac n proporcional. En la regin viven 8 79. 502 personas ma yores de 18 aos. Condiciones
p.lra la estim acin son e rror m ximo admi sible de 2% y n ivel de confianza del
95%. No se tie ne informaci n so bre la varianza en cad a est rato, se asumir la
varianza mayor, esto es, varianza igua l a 0,25 .
En la Tabla siguiente se observan los ta maos de cad a estra to y sus respectivas
varianzas:
N,

P,

q.

623.1 00

0.5

0.5

Rural

Z56.4OZ

0.5

0,5

Tolal

879.502

(13.10)
Urbano

SOWCION

A part ir del e nunciado obte ne mos los siguien tes datos:


Despeja ndo n

N = 879 .502
e = 0,02
( 13.11)

La frm ula pa ra calcular el tamao de cada estrato se presen ta a cont inuaci n.

%""1 =1 ,96

,
"--+
"'~'-..--z
N
""
}; wh ph qh

1110

0=

13.4 .4. Intervalo de confianza

nw ~

iv = . -!.....

Para ree mplazar los valo res e n la frmula, d ebem os prim ero calcu lar los d atos
para lle nar es ta Ta bla:

El intervalo de confianza para estimar el p ar metro poblacional se obtiene ada ptan do la frm ula genrica de int ervalo de co n fianza El intervalo de estimacin
es el siguien te.

(13 .12)
Urbm,

w.

w. p. q.

0,71

0.1775

0,29

RUf'1

~1lI. "

.,

Donde:

0=

Estimador muestra]

:: Tamao de la poblacin

:::: Tamao de la muestra


:::: Peso del est rato h-esimo

w~

P RO BLEM A

12

Ap licada la encuesta del ejercicio anterior se q uiere estim ar la proporcin de


acuerdo con la instauracin de gobk-rnos au to rit arios en caso de crisis econmicas. Se c rea un inte rvalo de co nfianza para inferir los resultados a la poblacin .
La poblacin t otal de personas ma yore s de 18 a os de la regi n es 8 79 .502, de
las cuales se encu esta ron 865 .
En la Tabla siguie nte se observan los tamaos de cada estrato, los pesos (q ue
ya se haban calc ulado en el ejerci cio anterior] y las proporciones observadas.

Reemplazando :

0,09
0,09
_0,_
03_
' + _ ""'''--_
1
1,96
879.502

11 :::: 86 5

N.

w.

p.

Urbano

623.100

0,7 1

0,3

0,7

Rural

25G,40l

0,29

0,311

0,62

Ahora distribui mos el t otal de la muestra en los estratos:


11, :::: 865

0,71 :::: 6 14

1-n I ::::

( 13 13)

~~

z.,n :::: C oeficiente de co nfianza asoci ado a nivel de confi an za


P.q. :::: Varianza del est rato h- smo

= 623.1QO_ =0 71
879.502
'

11 ::::

}:w. p. q. '" 0,9025

Clculo del peso de cada estr ato:

w,

N n~":i

0,0725

,
Toul

- - "wp q

N- n

p Zun.

Tulal

865 0,29 :::: 25 1

879,502

,
1:w
, ."I

..

C O N CU JSI() N

SO LU CiN

Para ha cer un a estim acin con un e rror m xim o admisible del 3% y un nivel de
confianza del 95%, se req uiere una muestra de 865 person as, 614 reside ntes en
zonas urbanas y 25 I de zo nas rura les.

A part ir del enunci ado obtenemos los siguientes datos:

120

N = 879.502
n :::: 865
ZO/2 =: 1,96

121

13.5.2. Error tpico

n a los clculos utiliza rnos la siguiente frmula:

La varianza del estimador de la propo rcin se obtiene como variaci n d e la


frmula genrica de varancla del estim ado r (13 .S) . La lgica de la afilacon p tim a -mayor representacin a los estr atos m as hete rc g ncos- alte ra la frmula
genrica .

. zun

.';). llamas primero la proporcin d e la poblacin:

" =0,7 1 0,3 + 0,29 ' 0,38 =0,32


U""'"

(13 .15)
N

ree m plaz ar los valores en la frm ula, debemos primero calcular los datos

irallen ar cost a Tab la:

La raz cu adrada de la varianza es el error t ipico.


W.P~q.

Vrb. nl

0,149

13.5.3 . Tam aiio de la m uestra

R'Jnl

0,. ...

El calculo del t ama o de la muestra en afijaci n ptima de varianza se realiz a


minimizando una fun cin tal que los valores de n~ hagan mnima la varianza del
esti m ado r prefijado el ta m a o n de la m uestra.
La af ij aci n de varian za m nima pJra un n dado implica cu mplir con las dos
condicio nes siguie n tes.

TOlal

..r,. ..p.q . "' 0.217

iplazan do :

min(~

11,32 1,96
32 0,03

( ,J ,29; 0,35)
~l.US10 N

) 15% de co nfianza pod emos afirmar qu e el po rcentaje de personas di spuesta s


w--ptar u n gobiern o autoritario en caso de crisis ec on mic a esta compre nd ido
e,c 29% y 3 5%.

LJ . Afija ci n ptima de varianza


o:

Para encontrar el mn imo se utiliza el m tod o de m ult iplicadores de Legrange.


Operando elgebratcamente e n la siguien te expresin se pu ede ca lcular e l tamao
del estrato h .

(13 16)
El min imo se obtiene der ivando la expresin respect o a los n h estratos e igualando
a O cada una de las derivad as. Operando algebraicamcnte se obt ie ne la frmula
del tam ao de cada estra to fl h que satisface la rest ricc i n preestableci da

1. Estimacin de la proporci n

porcin rnuestral se calcula como una proporcin ponderada. Corresponde


suma po nderada de las medias de los est ratos por sus respectivos pesos.

(13 .17)

..,

( = ,w, P,

l.

= Pro po rcin del est rato h-sirno

= Peso del est rato h- slm c

(13. 14)
Razones de exposici n aconsejan presentar la frm ula del tamao n de la muestra
a partir de la ec uaci n b sica. A sabe r, despejand o el e-rror m ximo ad m isible.

e=

zofl o~

(13 .16)

SoLUCIOS

A partir de l e nunciado obten em os los datos:

N = 104 .335
e = 0,03
%0/1 = 1,96
Para los clculos u t ilizamos las siguie ntes frmulas:
despej ando n

( 13.19)

D onde :
= Error m ximo admisible

= Coeficien te de co nfianza asoci ado

a nivel de confianza

= Tam ao del estra to hesi mo


= Varianza

Para reem plazar los valor es en la frmula, debe mos primero calcular los datos

del estr ato h-sim o

y llenar esta Tabla :

N.

-.

IV
Se quiere m edir in tolera ncia religiosa en tre escol ares. D ado q ue se espe ran resultados distintos para est udiantes de colegios cat licos de aq uellos qu e asisten
a colegios laicos, se utiliz ar una m uestra est ratificada. A su vez, tomando en
c uenta q ue en estudios anterio res se ha observ ado una ma yor homogeneidad
e nt re est ud iantes de colegios cat licos q ue entre est udiantes de colegios laicos,
se decidi utiliza r u na afijacin ptima de varianza. Se fij co mo e rro r mximo
admisible 3% y nivel d e co nfianz a 95%.
En la Tabla sigui ente se observan los tamaos de cada est rato y sus respect ivas
varianzas {o btenidas st as de en cuesta piloto):
N.
CoI~'gim carhc os

CoI"giosIicos

Tat. 1

w"r;;

O.'"

0,16

0,34

CoI"gios Oltlicos

P ROBLEMA 13

"'P1q

0,66

CoI"gios l icos

,
V ", = /
,

..- . ..,

Tobl

L III, P. 'l . = O,N

Clculo del pe so de cada est rato:


1lJ
I

= ~5. 2 1O = O 34
104 .335

'

q.

35.210

P.
0,35

0,65

69.125

0,45

0,55

104.335

124

0,16

125

..,

0,33

L III. ~ .. 0,49

-.

N.

0, 24

104.335

ColegIOS catlicos

35.ZIO

Colegiosla;cos

69.125

Tonl

IOU 35

0,55

0,66

0,39

0,61

,
~ ",. =I
.,

n = 101 5

'.

0,3 ~

P.
0,45

SOLUCi N

'ro ra distribuimos el total de la m uest ra en los estra tos:

A partir del enunciado obtenemos los siguie ntes datos:

N = 104.335
n =1.01 5
Zon = 1,96
Para los clc ulo s utilizamos las siguientes formulas:

~ O .J C I.US I () :-l

A <I hacer

un a esti macin con error mximo admisible de 3% y nivel de confianza


95%, se requier e un a muestra de 1.01 5 estudiantes: 338 de co legios catlicos
.' 677 de colegios laicos.

,.:

..,

P = r.wJ\

,J .SA. lnterva o de confianza


~ .. frmula del intervalo de conf ianza es un a variacin de la frmula genrica

apeada al caso espec ifico de la esti macin de proporciones med iante a fijeci n
"o ti m a de var ianzas.

Reemp lazando en la frm ula se obti e ne para afijactn p tima de propo rciones
siguiente expresin.

p z..n 0_:=-

(13.20)

Primero calc ulamos la propor cin de la po blacin:

p = 0,34 ' 0,45 + 0,66 ' 0,39 = 0,4 1


Para ree mplazar los valores en la frmula, debemos primero calcular los datos

para llenar e-sta Tabla:

-.

( 13.21)

P :t: Zt]

O,H

Col egios catlicos


Colegios lsicos

14
"oltcada la encuest a sobre intoleran cia religiosa en colegios, se qui er e est ima r
a proporcin de est udiantes qu e opina n q ue no se puede con fiar e n una perna atea . Para esto se construye un int ervalo de confi anza qu e p ermita inferir
'a poblacin . En total son 104.33 5 los estudiantes de colegios de la regin,
le los cu ales 1.0 15 fueron enc ues tados . Se fij pa ra el inte rvalo un 9 5% de
nfianz a.
En la Tabla siguiente se observan los ta maos de cada est rato, los pesos (calui ados en el eje rcic io anteri or) y las prop orciones observadas:
OHl.EMA

126

w,""

Tohl
.

Ree m plazan do:


0,4 1 1,96
0,41 0 ,03

(0,3 8; 0,44)

0,66

s-r

..,

",. p,q.

w.vP.q.

0,08

0,17

0,16

L wP. q. = 0)4

..,

0,32

L w.';P. q. ", 0,49

CoN CLUSION

Donde :

Co n 95% de co n fianz a podem os afirm ar q ue el porce ntaje de estudia nte s que


opinan que no se puede confiar en una persona ate a est comprendido entre
38% y 44%.

:=

n~

l 3.6. Afijacin ptima de costo

costo total

c~:= costo del estrato

h-esmo
= tamao del est rato h- simo.

La expresin a minimiza r se present a a continuacin .

D.G.1. Estimacin de la proporcin


(13 .24)

~ I clculo del estimador de la pro porcin po blacto nal se ob tien e co mo res ulta do

ponderar las p ro porc iones estrat alcs po r e l peso de los est ratos. La frm u la
c rrespoode al procedimiento de pon deracin en muest reo estrati ficado.

1("

p -=

..,

L WJ'~

(13.22)

n~ = n

p~ "" Proporci n del es trato h- smo


w~

El mnimo se obt iene derivando e igual ando a O. Resolviendo algebratcam cn te


se obtiene la frmula de n h que satisfa ce la restricci n dcfinda

"" Peso del estrato h- si mo

w,r, a,
~~

(13 .25)

L~!k -'!~hl

"fC

1.6 .2 . Error tpico


var ianza del es timador de la propor cin e n afijaci n de costos es una ad ap -i n de la frmu la gen ri ca a la lgica de incluir el costo como n ue vo dat o.
em p lazando en la frmula genrica se obtiene la sigu ien te expres i n .

d
P'"''

~, Nk,p;r"yc;
/IN]

-<.

-..!!.~,,!~qk

(:,..7;

Pkq~

Nk
N)

Result a ilustrativo deducir la frm ula del tamao de la muestra a parti r de la


ecuaci n b sica y ejecutando las operacion es algeb n cas co rre spondie ntes.
(13.26)

(13 .23)

-rro r t pico es la raz cuad rad a de la varianza .

5.3 . Tama o de la muestra


una o de la muestra en afijaci n ptima de costos se obtiene aplic ando el
odo de multiplicadores de Lagrange. El pro psit o es en contra r los valores

[ 1327)

,
hacen m nim a la varianza del estimador co n la rest riccin e "" Lc~n~ .
,..

Donde:
e

='

Error mximo admisible

Zun. = Cocficlentc de co nfianza asociado a nivel de confi anza

N,
128

:=

Ta m ao del estrato h -simo

"a

Ph (ji,

::

Varianza del estrato h-stmo

iV :: -N. N

15
. estudia homo foba en una regin. D ado que en la regin existen com unas
-n niveles econ micos muy variados y con costos di sm iles en la ap licacin
e las encuestas, se ha decidido utilizar un muestreo estratifi cado co n ahja cidn
,.tim a de costo. Antes de aplicar la encuesta es necesario definir el tamao
'total de pe rsonas mayores de 18 anos que habitan en la regin a estudiar
; 540.3 48 . Se fij co mo error mxi mo ad m isible 4% y nivel de confianza de
J%. Dado que no se conoce la varianza de estos est ratos, se asume la mxima
)sibk esto es 0, 25.
En la Tabla siguiente se observan los tam aos de cada est rato, sus respectivas
rrianzas (obte nidas de estudios anteriores) y cost os:
" OllLEMA

Para reemplazar los valores en la frmul a, debemos primero calcular para llen ar
esta Tabla:
w,

p.q.

sao

0,1

C1

0,36
0,42
0,12

0,25
0,25
0,25
0,25

e3
DE

-..1M" .c;

WJ!.'ll

0,\

11)()

0,025

0,5
0,5
0,5

90
90
95

O,1O5

0,09

"'J.q,

.c; -

0,00025
0,001
0,0012

vc:

Wl'';

5
16,2
1 ~,9

o,oom

l ~'

0,03

Clculo del pe-o de cada estrato:

::
1

IV
J

_ 194 .5Z.L = O 36
540 .348
'

= ~P05'L

540 .348

:: O42
'

OLUClN

. part ir del enunciado obtenemos los datos:

N :: 540 .348
e :: 0,04
Z'.J 2 :: 1,96

Reem plazand o:

45 8 O0055
J..;: _ . _ _
004 2
o' 2S
- '- - +
2
1,96
540.3 48

:: ~

ara los clculos utilizamos las siguientes frmulas:

n :: 604
Ahora distr ibu im os el t ot al de la m uestra en los estratos:

000025
0,00277

n :: 604 - '- -- :: 55
I

I1n

;~~

0,0005
0,002
0.00233
O,O::O J2

SJ
,
2) !J'lq.=O,25 i*?~ o ooJ77 w,r;q;.c;= 4S8 r5.~ 0005'
." c.
, "i:) . 'l '
' .-,.r,
, .,'

ro'" Lw.-"l

IV

w.v'P. ~.

-604 '

'1

1-

SOLUCION

0, OO L:::: 2 18
0,00277

A p artir del enunciado obtenemos los siguien tes datos:

n - 604 -il.OCn 2_ :::: 262


n
4

N = 540.348
n = 604
znn = 1,96

0,00277

J -

= 604 . _O~}l = 70
0,00277

Para los clculos utilizamos las siguientes frm ulas:

C ON CLUSION

Para hacer una estimacin con 95 % de confianza y error de 4%, se necesita una
muestra de 604 personas, SS ABe 1,2 18 C2 , 262 C 3 y 70 DE .

p=

...

~ w.

p.

13 .6 .4 . Intervalo de confia nza


La frmu la genrica de in te rvalo de con fianza es el origen de la frmu la utilizada
para const ru ir el intervalo en afije c i n de costos. Operando algebrac em ente en
(n.5) se obtiene la siguiente expresin.

Pan reem plazar los valores en la frmu la. debemos primero calc ular los da tos
para llen ar est a Tabla:

(13.28)

(13 .29)

ABCl

C2
O

DE
PRO BLEM A

P.<J,

v'Ni:

0,13
0,16
0,18
0,21

0,36
0,<
0,42
0,46

Luego de aplicada la e ncuesta sobre homofob ia se quiere sabe r la p roporcin


de pe rsonas mayores de 18 aos q ue est a de acue rdo con la prohibicin a homosexuales pan contrae r matrimonio. El total de personas de esta regin es de
540.348, de las cuales 60 4 fue ron encuest adas. Se quie re crear un intervalo de
confianza al 95%.
En la Tabla siguiente se obse rvan los ta maos de cada estrato, sus propo rciones obse rvadas y costos:

'.

'.

N.

P.

55.420

0,15

0,85

IO.CXXl

C2

194.577

0,2

0,8

8.1 00

C3

227.06-4

0,23

0,71

8.100

DE

6] 287

0,3

0,7

9.025

ABCI

Total

540.34 ~

132

'.;

N./f

~ K-

1.995.1 20
7000 72
85 81019,2
2.765.64 1,9

I N,..1flf. V'.:2QJ4gm,1

Total

16

100
00
00

ss

N,.,p;a;:

N.';;~

7~,6

\':19,51
864,79
1.059,63
306,44

t..'

31. 132)2
40871 ,52
13.290,27

YM : 2.430,37 l.,.,N,M .: 9H :l8,71


.r;

Ree m plazando:

p = (0, 1 0,1 5) + (0,36' 0,2) + (0,42 ' 0,23) + (0,1 2 ' 0,3)
p = 0,22
20.348. 553 , 1 ' 2 430 37
022
1 9 '"
, ,
o -604 . 540 .34Sf .
, -

92.498, 7 1
540 .348l

0 ,22 0,03
(0, 19;0,25)
C ONCLUSION

Con 9 5% de confia nza pode rnos afirma r que el po rcentaje de pe rsonas mayo res
de 18 aos que esta de acue rdo con la prohibicin a homosexuales para cont raer
matrimonio se en cue ntra entre 19% y 25 %.

l:n

Capitu lo 14

Muest reo por conglomerados sin sub muest reo.


Igual tamao

El muestreo por conglomerados presenta dist incion es im port antes respecto a los
dise os aleatori o sim ple y est ratficado. Un a caracte rstic a distintiva dice relaci n
con la naturalez a de los conglomerados.
Un conglomerado es una unidad de mu estreo compues ta po r dos o mas
ele mentos de la pohlacin . En mu estreo por conglome rado s la inferencia 110
se realiza a partir tic la observa cin directa de los elementos q ue co m pone n
la poblacin. En efec to, la un idad de muestreo es el conglomerado y ste est.i
com puesto de d0S O ms elem entos.
Los ele mentos q ue componen los conglome rados so n heterog neos y los
c.:mglomerados son unidades de muestreo parec idas entre si
Para generar co nglome rados se requiere de una varia ble que agrupe los eleme ntos en grupos compuestos por ele m entos con p untu aciones di stintas. Por
ejem plo, para estu diar con sum o de sustancias stcoac t tvas en una un iversidad se
puede establecer qu e cada cu rso es un conglomer ado e n el e nt endido qu e en
cada uno de ello s h ay di stintos valo re-s en el indicador de co nsumo.
Nt ese q ue el r37.onam it"nto para la co nstitucin de co nglomer ados es inverso
al utilizado para generar est ratos. Los estratos est n co mpuestos po r eleme ntos
parecidos y los conglome rados por elem entos disti ntos en la variable medida. La
lgica que subya ce al m ue streo por co nglom erados se suste nta en el hecho que
todo s los cong lomerados son pareci do s y, en consecu enci a, resulta razonab le elegir
slo algun os de ellos para obtener los valores qu e permitan inferir a la poblacin .
En el limi te, si todos los conglome rados son igual es es suficie nte sef ..ccionar slo
uno para est im ar el parm etro poblad ona!.
Una ventaj a del m uestreo por conglome rados es q ue no se requiere de un
mar co muestra ! q ue incluya a todos los elementos de la pobl acin . En efecto, slo
es nece sario disponer de l Hstado de elementos qu e cornponeu cada co nglo merado
seleccio nado para conform ar la muestra.
En el mbito del mues treo po r co nglome rado s cabe diferenciar e nt re conglom erados sin submuestreo y co n subm ucstreo. Est a distincin es relev ante, dado
que la realizaci n de subrnuestreos en los conglo me rados da luga r al muest reo
po r et ap as. El conglomerado sin submuestreo se conoce como co nglomf"nldo
e n una e ta pa y se ca racteri za porqu e se seleccionan t odos los eleme ntos fluC
componen el conglomerado elegid o.

IVi

Seg n el nume ro de eleme ntos cabe distin guir e nt re co nglom e rados de igual
Isunto tamao. N orm alme nte los co nglomerados ser n de d istinto tamao.
r -je m plo, sern conglomerados de distin to tam ao las ciudades de un pas,
n -anz anas de un a ciudad o las vivien das de las manzanas. Los conglo m erados
igual nme ro de eleme n tos no son com unes, sin embargo, pe rmiten ilustrar
uso de las f rm ulas e introducir en la com plej idad del m uest re o po r co nglo erados de di stinto t am ao. U n eje mplo de co nglo merados co n m ism o n mero
ele mentos so n los cig arrillos en cajet illas.
Desde ot ra perspectiva se distingue e nt re co nglo merados na tu rales y de re as.
1 conglom era do na tural p uede ser la su cursal de u n banco en la q m~ se est udia
isfaccin laboral y co nglomerado por rea es un a zo na censal do nde se inda ga
pe cto a co nsumo de t e le visin .
El presen te captulo t ra tar del dise o po r conglome rad os sin submuestreo
co nglomerados de igu al ta ma o.
"

Para eje m plificar gr fica m en te lo q ue se e nt ien de por unidad d e m uestr eo


se prese nta e n prime r tr m ino una poblacin o rdenada en co nglo me rados y,
po steriorm e nt e, un subconjunto de conglome rados elegidos. N tese que no se
re aliza sub mues treo, dado que se seleccio nan todos los ele m entos en cada con glome rado ele gido.

Grfico 12. Seleccin de conglomerados- Tama os iguales. Sin sc bmcestreo


Poblacin de K '" 9 conglomerados

L1. Seleccin de las un idades de muestreo


m uestreo por co nglome rados puede ser la nica alte rnativa via b le de selecci n
obabil..tica e n co nd icio ne s de m arco muest ra] defectuoso. Por ej em plo, q ue
incluya el listad o de t odos los elementos de la poblaci n.
La divisin de la poblac i n e n conglo merados de elementos d e los cuales ..e
cccio nan slo alguno ..de stos perm ite disponer de un marco m uest ra! referido
o a los co nglomerados e leg idos.
En cada co nglom erado q ue com po ne la muestra la selec cin de el ementos
realin mediante muest reo aleatorio sim ple.
Establec er el nmero ade cu ado de conglomer ado s para m a xi m izar la prein y mi nim izar el costo no es tarea fcil. Lo, experiencia e nse a que pocos
rglomcradcs co mpu es tos d e muchas un idades presenta n la ventaja d e la sencoz y el costo, sin emba rgo, res ultan m e nos p recisos qu e un n m e ro mayor de
rglomcrados mas peque os.
D efinir en forma inequvoca n mero y t ama o de los co nglom erados e n una
raci n co ncret a no siem pre es sencillo. Eleme nt o centr al p ara una adecuada
i nic ln es co nsta ta r qu e la vari anza dent ro de los co nglo merados es alt a y la
la n za e nt re conglom er ados es pequea.
N t.. "e q ue e n m uest reo por conglom e rados una u nidad pued e SN un con mer ado y e n otr a aplicaci n est a puede se r un elem ent o. Por eje mplo, una
ienda en Ull est udio sobre consum o de televisi n pu ede ser un conglo merado
-dc los elem en tos son las pcr vunas y la m ism a viviend a en U1I es t ud io de caad de los co nd uctos de gas p uede ser un ele m e nt o dond e los conglome rados
L las ma nza nas.
En gene ral las un idades d e m uestreo asum e n distintos p apel es en funcin
dise o de muestras en ej ecucin . Una ciudad pue de ser e nte ndida co mo un
rglom e rado de ma nzanas o como un elemento e n una muestr a de ciudades.

136

Muestra de 11 '" 3 co nglome rados

13 7

14.2. Precisin de la estimacin


general el muest reo por conglomerados es ma s econmi co respecto al muesaleat orio simple por ah orro en la configura cin del marco o en la sele ccin
le las un idades ultimas de muestreo. Sin emba rgo, la precisin normalmente es
.nor por la tende-ncia nat ural a ma yor homogen eidad de los elementos de ntro
' cad a conglomerado. La pr ese ncia de homogeneida d de elementos dentro
Ie cada cong lomerado da lugar a una varianz a del estimador superior a la que
__ _respo nde al muestreo aleato rio simple.
. Para medi r la homogeneidad den tro de los conglomerados se utiliza el coefi-v-r.re de correlacin int racon vlorne rado rho (p). Un valor positivo expresa que
L., e~e meJltos den~ro del conglomerado son similares. En t r m inos de varia nza
)!lea que la varianza dentro de los conglomerados es menor que la varian za
-vre con glom erados. En virtud del proceso de agrupacin en con glomerados el
'e.or de p ser normalment e positivo.
El coe ficiente intrac onglomerado p ser negativo cuando los elementos dentro
1" cad a conglomerado presenten mayor dispersin que la obtenida median te
11 ' 1~~streo aleatorio simpl e. En tal caso las medias de los conglomerados ser n
rilares ent re si. En t rminos de varianza implica que la varianza dentro de
-glo merados es mayor que la varianza entre conglomerados.
l;a varianza dent ro de conglomerados m ide la dispersin de los valores del
gtorner ado respecto a la me dia del conglomerado corres pondiente. Se designa

'0

10

La pob lacin 1 presenta mayor dispersin de ntro de los con glomerado - y


menor variaci n eutre las me di as de los con glomerados. Ntese qu e los eleruontos den tro de cada co nglomer ado son mas distintos que la heterogeoe dad de
elementos que se obtendra me d iante selec cin alea toria . En cons ecue ncia, el
diseno por conglomerados resulta ms cficcnte que el mu estreo aleator o sim ple.
Los valores del coefici e nte p correspondientes a este ejemplo se rn neganvos.
La poblacin 2 presenta may or d ispersin en tre los conglomer ado s. dado que
los conglomerados de nt ro de s son relati vamente homogneos. Los elemen tos
de cada conglomerado son ms parecidos que los que se obtendran mediante
seleccin aleatoria. En consecuencia, el diseo po r conglomerado resul ta menos
preciso que el mu estreo aleatorio sim ple. Los valores del coe ficiente p obtenidos
de estos datos sern posi tivos.
El coeficie nte p puede asumir diversas expresiones siendo una de las ms
sencillas la q ue se presenta a continuacin.

[(11 - 1) \-IS - nS':]


p =-.
. _ - _.
(n -l) vtSb+ n (M -l) S ~

(1 4.3 )

A modo de refer encia se pueden est ablece r las siguient es desigualdades.


p > O ms preciso el muestreo aleatorio simple
p < O ms preciso el m uestreo de conglomerados
p ::: O igual p recisin amhos muestreos

S; .

14.3. Conglomerad os de igual ta mao


(14 .1)
.. varianza ente conglomerados m ide la dispersin de las m edias de los conglodos respecto a la media general. Se designa como si.

(14.2)
Ira ilustrar el com portamiento del coeficiente p se presentan dos poblaciones
- tres conglomerado s cada uno.
Poblacin 1
Conglom.:rado 1

150

Conglomerado 2

130

Co nglomerado 3

160

300

Todos los conglomerados pueden tene r el mismo nmero de elementos. No es


comn en la investig acin mediante encuesta. Si ade m s no hay sub mc cst rec se
trat a del m uestreo por cong lomerados ms simp le. Cabe d esta car qu e los conglomerado s que participan en 1:J mu estra son seleccionados e n form a aleatoria.
Los elementos dentro de cada conglomerado ta m bin .

14.4. Notacin
Para caracterizar la es truct ura del muestreo por cong lome rados sin submuesrreo
es prec iso est ahlecer una nomenclatura de identificacin.

14 .4 . 1. N otaci n poblaci n

Poblacin 2

500

148

150

152

290

480

l37

140

143

310

510

153

155

158

Los conglomerados se distribuyen del siguiente modo e n la poblacin .


Primer conglomerado de tamao M I
Segundo conglomerado de t am ao M!

Conglomerado genrico I [ de tama o M


H
C onglomerado ltimo de ta mao M L
Los demen t a s se distribuyen del siguiente mo do en los conglomerados de la
pob lacin
Elemento s del p rime r conglo me rado XII X l l ", x li ",x
l
Elementos del segu ndo conglomerado x j l ...x , " ,xl

Elementos del conglomerado H


Elementos del conglomerado L

XIII

xm . "

,vI I

Media del conglomerado h -sirnc

,v12

X lli . "X I I

u X u . . ,xl. i

El calculo de la meda se obtiene como variacin de la media arirnetica utilizada en muestreo uleatoro simple. La medi a muestra] corresponde a un promedio
de medias. En particular, el promedio de las medias de los conglomerados
La expresin de la media de cada conglomerado y de Id med ia muestra] se
present a a continuacin.

,'vIlI

(14 .4)

Media de la media de los n conglomerados

,,,x L A1L

(1 4.5)

K= Nume ro de conglomerados
= Elemento genrico i del con glomerado genrico h

X l.i

}v1h

'"

N m ero de elementos del conglome rado h - simo

M= ,M, '" Tam ao de la poblaci n


hl

__ ,MI.
M ::O~K-- = Tamao med io d e conglomerado

14 .4. 2. N otacin muestra

14.5.\. Errortipico
La est ructura de la frmu la es anloga a la frmula utilizada en mu estreo aleatorio
sim ple con corre cci n par:! poblaciones finitas. Las diferenci as son consecuenci a
de la nat uraleza distint a de las unidades de obse rvaci n. A saber, en mu estreo
aleato rio sim ple se miden elementos y en muestreo po r conglomerados se m iden elementos agrupados en conglomerados. Para evide nciar las similitudes y
diferencias se presen ta n ambas f rmulas.
Varianza del esti mador MAS

n = N mero de cong lomerados de la muestra

m=

Im

10 ,1

m I.

(14. 6)

= Tamao de la m u estra

= Tamao del conglome rado h-simo

Varianza del esti m ador Me

tm,

= ~~_
,

_=Tamao

(14.7)
m edi o d e cong lo m e rados
Ntese que S2 mide dispe rsin de las pu ntuaciones respecto a la media y S2 c mide
la dispersin de las medi as de los cong lomerados respecto a la media muestra].
Las frm ulas siguientes lo ponen en evidencia.

14 .5 . Estimacin de la m edia
La media muestra! es el m ejor es timado r de la me dia p oblacic nal . Se dem uestr a que posee los atrib u t os de u n bu en estimador: Insesgado, con sistente y
eficiente.

140

h x,-x)'

i:I'---.__
n - 1

(14.8)

141

;;. .

P RORl B 4..... 1 7

(14.9)

').2. Tar'l..:lo de la muestra


le te rminacin del tam ao de la m uestra dic e relacin con dos factores
mdictonantes A saber, nmero de elementos y nmero de co nglome rado a
. .ccionar. Cuantos elementos y cua ntos co nglomerados?
~ I mod o mas scnctllo es calcular el numero de ele mentos y utilizar el result ado
lr<l calc ular el nm ero de conglomerado s. El clculo del n mero de eleme ntos
7;3 tina frm ula que incluye d coeficiente de correla cin n traconglomerado p.
'v rcse qu e el coeficiente r mide similit ud entre elemenro -. Incluido en la
-r-iula genera mu est ras grande s cuando los elemen tos son similares dentro de
...... . conglomerado y m uestras pequeas cuando los cong lomerado s so n heteneos,

", =n[ I+ (M- I)p]

Se pesquc,a grado de identihcaci n de em pleados co n un a institucin . D ado


que sta se divide en 6S de part amentos similares ent re ellos, se opt por realizar
muestr eo por conglo me rados . Para esto se seleccion a 8 dep art am entos encuest ndosc a tod os sus empleados . Ap licada un a escala de 1 a 10 se construye un
intervalo de confianza para inferi r ide ntificaci n a Id poblacin . Se fij un nive l
de confia nza de l 95 %.
En la siguie nte Tabla se presenta n los promedios obtenidos e n la escala e n
cada departamento selecciona do:

"

( 14. 10)

= Tamao de m uestr a aleat oria sim ple co n precisin definida


Ve = Tamao medio de cong lom er ado s
.' = Co eficiente tntracong fome rado

Dep artamento 1

4,3

Dep artamento 2

4,\

Dep artament o S

3,9

[)"lwum<mto 4

4,5

Deparummto 5

Departamento 6

4.2

Departamen to 7

4, \

Dep artamen to 8

' ,7

'1

SOI.UClQN

A pa rtir del enun ciado obtene mos los datos:


- calcul ar el numero de conglomerados sim plemente se d ivide

n< po r

M.
K

~ .3.

Intervalo de confianza

= 65

=8
z"l2 = 1,96

11

-ervalo de confianza se est ablece segn el mi smo modo u t ilizado en los deproced imientos pro babil sticos. En co nsec ue ncia, la expresin del inter valo
~ comp uest a de tres t rm inos. A sabe r, d estadstico m ucst rai, el coe f icente
nfianza asociado al nivel de confianz a de finido y el error t ipico.
o

Para los clculos utilizam os las siguientes f rmulas:

(14.1 1)

.A. z , / K_rJ s?.


<

".I2 V K .

tl

'""

t . Yla S:corre!oponde n

(14.12)

a las frmulas presentadas en los pr rafos ante rio res. Se


la med ia muestra! es una media de medias y la varianza es la dispe rsin
medias de los conglom erados respecto a la m edia muest ra].
.1 que

si-

H(x. - x.)'
;'l l d

Primero calculamos el es tadstico maest ral:


-x' _ 4,3 + 4, 1 + 3,9 + 4,5+ 4,0 +4,2+ 4, 1 + 4,7 - 4,2

,-

Proporcin promedio de los co nglom erados

A continuacin se calc ula s~:

-.

D.

1 _ (4,3 - 4,2 )Z + (4,1 - 4,2)2 + (3,9 - 4,2) 2 + (4,5 - 4,2)2

Su -

14.6.1. Error tpico


El err or t pico de la d istribuci n muestra! de proporcio nes cum ple la misma
func in que la establecida a props ito de la m edia. A saber, es un indicador num rtco de la precisi n de las est imacio nes. En virt ud de q ue la proporcin es una
media en el cont exto de variables dicotmicas se de fine el err or dd est im ado r de
la proporcin con los m ismos t rminos utilizados a prop sito de la m edia .

0,03 57

4,2 1,96

y65-8
S'
65 .

0,035 7

s2,.= 0,0357
4,2 1,96

"

+ (4,0 - 4,2)2 + (4,2 - 4,2)2 + (4,1 - 4, 2)Z + (4,7 - 4,2)2


8 1
s~=

(1 4.14)

p =~

y65-8

65 ' 8 ' 0,0357

( l"

4,20,12

V~-: ~~ . s';.

( 14. 15)

Donde:

(4,08; 4,32 )
(14 .16)
CmolCLUSION

Co n 95% de confia nza podemos afirmar qu e la m edia de ide ntificacin co n la


inst it uci n, segu n esca la 1 a 10, se encuen tra e ntre 4,08 y 4,32.

14.6.2. Intervalo de confianza


La generacin de un inte rvalo de confianza para est imar el parmetro poblacional se realiza segun la frmula deducida de la desigualdad de Chcbychcv. La
expresin del intervalo de confianza se p resen ta a conti nuacin .

14.6 . Estim acin de la p roporcin


La proporcin es la expresi n de u n promedio en el contexto de va riables
di cot micas. El clc ulo de la proporci n m uestral se rea liza segun la mism a
lg ica uti lizada para calcular la media muestra] . Se veri fica -que la proporcin
muestra! corresponde a una media de las proporciones de cada con glo me rado.
En consecuencia, el estimador de la proporcin poblacional es una media de
proporciones.
El clculo de la proporcin de cada conglo me rado y de la proporcin m uestra!
se presentan a con ti nua cin .
Propo rcin del conglomerado h-sirno

(14.13)

( 14.17)

(14.1 8)

s;..

5:(P.- p,)'

,.,

(141 9)

. 1

n
PRO BI_F. MA 18

Una em pres a cre ar un a guardera infantil y necesit a co noce r la proporc in


de eventuale s usuarios. D ado qu e la empresa se divide en departam entos
sim ilares ent re s respecto a lo q ue se m id e, se opt por llev ar a cabo un
muest reo po r co nglomerados . D e los 3 2 de par t am en tos qu e tiene la empres a,
se encuest a 6. A pa rt ir de los result ados se qu iere crea r un intervalo de

144

145

co nfian za par a pode r inferir a t odos los empleados de la e mp resa. Se fij un


nivel de confianza de 95 %.
En la siguien te Tabla se prese ntan las proporcion es obse rvadas en cada departamen to:

0,5 5

[Jcp ut. rneoto 3

0,36

I D"ll Hta rnento 4

O,SS

D!opw,; umnto 5

0,'> 7

t Departamento 6

0,56

s~=

0,5]

lkparurTlffito 2

_
'\ / 32 - 6
0,) 6 1,96 -32 ' 6 . 0,(X)(}25
0,56

P.
Departamento 1

s:.c = 0,00025

0, 0 1

0 ,000 25

0,56

1 ,96V~~ ~~, 0,000 25

0,5 6 0,0 1
(0,56; 0,57 )

iOl.UClON

'. partir del enunciado ob te ne mos los datos:

C O::'CLUSIO N

Co n 95 % de confianza podemos afirmar qu e la proporcin de emp leados que


utilizaran guarde ra infantil est a comp rendida en tre 55%y e\57% .

K = 32
11 = 6 .
ZuIl = 1,96
'ara los clculos utilizamos las siguie ntes frm ulas:

.\'.

D.

p< = ~-'
n

s;.

n(p. - pJ'

. ' 1""'_ ;:-_ _

-imero calculamos la proporcin de la poblacin:

P. _ 0,5 3 + 0,55 + 0,56 ~ 0,58 + 0,57 + 0,56

0,56

") segundo lugar calculamos S2

"

(0,53 - 0,56)' + (0,55 - 0,56) ' + (0,56 - 0,56)'

+ (0,58 - 0, 56)' + (0,57 - 0,56)' + (0,56 - 0,56) '

Captul o 15

Muest reo por conglome rados sin sub muest reo.


D isti nto tamao

Los conglome rados sean stos natu rales o po r reas norm almente tendr n distinto
nmero de ele me ntos. As, por ejem plo, co nglomerados natu rales como salas de
clase tiene n disti nto nm ero de alum nos, y conglo me rados de reas como zonas
censales tienen di stinto nmero de viviendas.
Co nglomerados de dist into tamao suponen variaciones respecto a las frmu las utilizadas a propsito de co nglo me rados de igual tamao. La d iferen cia que
no es concep tual dice relacin co n la mayor co m plejidad de clc ulos al incluirse
tam aos diferentes.
As, por ejemplo, e n el mbito de la infer enc ia las frmulas del estimador
de la med ia y el er ro r tpico del estimador son m as co m plejas al considerar para
cada conglomerado un tam ao distinto . En rel aci n co n el costo se generan
incert idumbres relativas al tam ao de la m uestra , da do q ue sta dep ender del
t am ao de los co nglo me rados que la com po nga n.
La nom enclatura se m antien e adquiriendo relevanci a el tamao de cada
conglo merado ffi h y el t am ao promedio de los co nglo me rados -m.

15.1. Estimacin de la media


La m ed ia muestral es una variac in de la m edi a aritm tica adapt ad a a unidades
de m uestree de disti nto ta mao. r) iversas propuestas respect o al estadstico
m s apro piado para estimar el pa rmetro pobladona!. La bibliografa perm ite
p rese ntar hasta cinco opci on es. A nuestro juicio el esta dstico que resulta se r
el m ejo r est im ado r es el ultimo de la list a ( 15.5). Se ut ilizar e n lus problemas
ilustrativos.

(15 .1)

( 15.2)

149

x,.,
x,..

r.\ i.

(1 5.3)

Donde:

=~~

L (x~ - -xm , ) -'

.
LX,

Sl

( 15.4)

= i-1-

n_ 1

I m;
.l

(1 5.9)

IM~ f.

J:c ..

( 15.8)

( 15.5)

"-'- tA.f~
,.,

K == N mero de conglomerados en la poblacin


z<>/1 = C oeficie nte de confianza
el == Error mx imo adm isible
m == Ta mao prom edio de- los cong lomerados

15.1. 1. Error tpico

IS.1.2 ..Intervalo de coniianza

r.a medicin de la dispersin se realiza med iante el error t pico. La frmula es


similar a la utilizada en muest reo po r con glomerados del m ismo tamao. Ntese
{ue la difer encia dice relacin con la inclusin del tama o de cada uno de los
-onglom erados q ue compon en la m uestra

La construccin del interva lo de confianza se realiza segn la norma propia de


los m uest reos probabilsticos. En p artic ular, se utiliza el esta dstico m uestral, el
coehcente de confianza y el e rro r tpico del estadstico.
La expresin del intervalo de con fianza se preseu r. a con tinuacin.
(15 .10)

( 15.6]

Ree mplazand o:

Wpuede se r esti mado por msi no se conoce M .


( 15. 11)

(5.1.2. Tamao de la muestra


: 1 calculo del tamao de la m uestr a e n conglomerados de distin to tamao LOS
rna ope racin ms comp leja que la efect uad a a propsito de conglomerados del
nisrno ta m ao, En virtud que no se conoce el ta mao de cada uno de los distintos
-o nglom erados no se puede utilizar la fr mu la basa da en el coeficiente p.
Un a alternat iva es calcular el numero de conglo merados. Se presenta la frnula utilizad a para estos efectos .

"

K'

51

( 15 .7)

(1 5 .1 2)

Dond e:
K :::: Nmero de conglomerados
= N mero de cong lo me rados e n la m uest ra

TI

fM~

M == ..~

"1

= Tamao promedio de los conglome rados

,.,.Lx, == Tot al de todas las observaciones del h-stmo conglom erado

PR.08lE~IA 19

Se est udia satisfaccin labo ral en un a empresa. Se opt po r un m uestr ee por


co nglomerados do: distint o ta mao, ya que la e-m p resa se divide en oficina s con
desigual numero de person as. Para inferir al total de los emplead os el promedio de
satisfaccin laboral se const ruye un intervalo de con fianza. La e mpresa est confor_
rnada por 52 oficinas, para la muestra se seleccionan 10 . Nivel de confianza 9 5%.
A continuacin se presenta una Tabla co n la informacin de numero de
e m pleados y la puntuacin promedio para cada oficina:
Olicin.a

N" de empleados

Puntua<i.;n SillisfKll

M,

laboral total por


co nglome rado

Pu nlu K i!l promedio


Silti~fKcin

i,

"

ubol'lll

(x

)'

K _ " ) ~t.,,-._--;m_,_
( KtlMl
11 - 1

m~

m ::o ~I--

"
Se calcul a:
Oficina

.\.1.i .

.',

167

4,79

1
. 2

95

5,9-1

39

4,33

21

108

21

91

:e. .....

mj

27.889

4 676

78'

"

2.025

5'0

67

H S9

918

OS

9.025

UZO

5,14

39

1.52]

351

81

3,79

108

11,(,(;4

2.268

441

91

8 281

2.184

576

40

1.600

300

81

39

1.521

J-l(l

100

)O

'O

1.600

3:!O

34

i:.M.~.
,., = 7Jl

i r. =69.615
,.,

i:>.m., 13.547
,.,

i:~ = 2.723
,.,

Z8

167

5,96

12

"

"

3,75

67

16

40

4,44

10

39

3,90

)O

'O

5,00

f Mo '" 151
.,

.,

x. =7J ]

SO LU C iN

A partir del e nu nciado obtenemos los datos:

Cal culamos la proporci n de la poblacin:

K = 52
= 10

1f

: ..n ::O 1,96

Para los clculos utilizamos las sigu ient es frmulas:


Reemplazando:

i: (x..- xm~) ! = 69.6 15 - 2 ' 4,8 ' 13.547 + 4,8


,.,

r (x.. ~j;mi = 2.30 1,72


,.,
152

153

2.723

".
196

256

1"':_."

. '

4,3 :t 1,96

15.2.2. lntl!1Valo de conjionza

2.30 1.72
10 - 1

El int ervalo de co nfianza perm ite in ferir a la po blac in o rigen de Id mu estra


de acuerdo al nivel de confianza est ablecido para estos efectos. La fr m ula se
presenta a co ntinuacin.

4,8 0,59
(4.2 1; 5,39)

(15.17)

C;-~NCLUS I N

Co n ~5% de con fianza podemos afirmar que el pun taje de satisfac ci n labo ral,
una escala 1 a 10, se encuentra en tre 4,2 1 y 5,39 puntos.

e..

(15.1 8)

1-,.2. Estimacin de la proporc in

K -n
Kn,'\P

Fl orcced im iento utiliz ado a propsito de u na variable c uantit ativa funciona con
uu a variable dico t mic a que genera proporcion es. En rigo r, la gene ralizacin del
t'. am ie nto realizado con medias a proporcion es es inmediato. De hecho, la est- vctura de la meda muestra es anloga a la de 1.. pr oporci n mu estra! y la media
d~ cada co nglomerado se replica en la proporcin de cad a co nglomerado.
( , L:lSfrmulas para la ~ropo~~n muest ra! y la proporcin de los conglomer[ 'J S se presentan a conun uacion.

" p,
LM,

P = _'.'J_~
,., ~ M,

.,

( 15.13)

f(",P,-,".)'
,./
n -

( 15. 19)

tm~

m=-,.1n-

( 15.20)

Donde:
K = Nmero de co nglomerados
n = N mero de conglomerados en la m uestra

_ i>v,

M = -~ "k- = Tamao promedio de los co nglomera dos

0;

(1 5.14)

..

I ,:a, = Total

de t0035 las observaciones del h-simo co nglomerado

o.

~a ~,

= ~ l_

m.

20
En una empresa se encuesta p ara conocer la proporcin de empleados qu e cam biara de empleo. Se o pt po r muest reo po r co nglom e rados de di sti nt o tama o,
ya que la e mpresa cuenta con oficinas co n distin ta ca ntidad de funcio narios. Se
dese a crear un inte rvalo con 99% de co nfianza p ara poder estim ar la proporcin
a nivel poblacional. La empresa t ien e 3S oficinas, de las cuales se selecc io nan 8.
A continuac in se presenta una Tab la con info rm aci n acerca del tamao de cada
ofici na, y la proporcin de personas que conte st afirmativamente:
P RO BLE.\ l A

(15 .15)

,
1), 2. 1. Error tp ico
(

~ l er ror t pico es una m edi da de la dispersin de las proporciones m ucstrales. El

.c. cccpto es el mismo cid error tpi co del es tim ado r de la m edia . Se prese nta la
' un...a del es timador, El e rro r tpi co es su faz cuad rad a.

(15 .16)

~"Ik empleados

Oti<iJl~

S.tisf~L-cin

m.

,' 00 d ~mplo:o

Proporcin

~tisf('Chos con el emplee

P.

Se calculan :

\O

0,40

l'

0,43

r,

Ofi1\a

12

0,50

0,38

15

0,47

0,43

22

0,36

l'

a l;

",m.

16

'0

100

6,02

36

8'

1%

36

72

144

3,04

24

64

7,05

49

105

225

3,01

21

49

0,57

7,92

64

17.

48'

7,98

64

112

1%

0,43

\O

11

0,45

3,01

21

49

\O .

4,95

25

55

121

D."'~ '" 52,9g

..: '" 317

.,d,m.'" 710

ma1.628

.tlll."
o., 120

d. " 5)

",

",

\ part ir del e nunciado obtenemos los datos:


K

"" 35

11

""

.,

"'

Reem plazand o:

10

z,.q "" 2,58


;~

uti lizan las siguientes frmulas:

(a, - p,,,,,m.) l = 31 7 .,

2 ' 4,44 ' 710 + 4,44 2 1.628

fCa,p" ro)l = 7,3808


j./
0,44 2,58

V :-w:-i2T '
35 -10
35

7,38
10- 1

0,44 0,05
(0,39; 0,49)
C ONCLUSION

Se infiere con 99 % de confianza qu e la proporcin de empleados que ca mbiara


de tr abajo corres ponde al intervalo 39% a 49%.

156

157

Capitulo 16

Muestreo por conglomerados con submues t reo

En est e cap it ulo se presentan los muest reos polier pcos. C aracters tica de estos
procedtmtentos es real izar en form a sucesiva seleccin de elementos dentro de
cada u no de los conglo me rados q ue co m pone n la m uestra . En efecto, puede
gene rarse una segunda seleccin de ntro do:" cad a co nglo merado y una tercera
seleccin dentro de las unidades de m uestreo que componen la segunda seleccin y as sucesivam ente. En virt ud de lo anterior, se de no m inan muestreos co n
submuestro y seg n las etapas reciben (,1 nombre de bict pico, trie t pico, etc. El
submuestreo pu ede efectuarse den tro de cong lomerados naturales o dentro de
reas. En ambos casos la lgica es la mi sma .
La d ijer en cia entre el muestreo mon oet picc y po liet pico se pu ede ilustrar
grficam ente presentando las nni dudes pr ima rias y sec undarias de mu estreo.

G rfico \3. Muestreo de ccnclcmerados. Monocta ptco y biet ulco

Muestreo por conglomerados I etapa

::.mri"'....;i(.. l""fi ro 13
Muestreo po r con glomerado s 1 eta pa

M uest reo por conglomerados 2 etapa.\


Mu estra d~ '1 = 3 conglomerado s

--;'lut"Stra de " == 3 co nglo me rados

ttEBIE

8IEEHE

Med ici n de todos los e lementos Jo" las


unidades secundarias seleccionadas

18IE EHE

el co ntex to del muestreo por conglomerados se jus tfica la realizacin d~


ornuc st rec cua ndo un conglomerado contiene mu chos ele mentos o cuando los
-me ntos del conglomerado son similares e ntre si. La obtencin de sub.mlles~
s se real iza en cada un o de los conglo me rados que constituye n las unidades
marias de- mu estreo.
, .
Los d iseos com plejos pu ede n conjugar e n un m ismo diseo polet.ipico
tintos proced imie ntos de muestreo. Por ejemplo, p rime ra e tap a co nglome ra; y segunda e tap a estratos en cada cong lomerado seleccionado. y, ~n al m t'nte,
ecci n de elementos en los es t ratos mediante mu estreo alea ton o simpl e. Para

160

refer irse a las un idades de muestreo de cada e tapa se uti lizan los te rm inas uni dad
primaria de m uestreo (UPM), un idad secundaria de mu estreo (USf\I), unidad
terciaria de m ue str eo ( UT M) y scc estvame nr-,
La seleccin de la mu est ra polierjplca im plica disponer de un marco muestra!
apr opiado pa ra cada una de las unidades de mu estreo. El muestreo es jerrquico,
de modo que la unidad primaria de m uestr eo contiene a la un idad secundari a
de m uestreo y st a a la unidad tercia ra de mu estre o. Carta cter istica disti ntiva
del mu estr eo por e tapas es que el ma rco muestra] de un a etapa posterior se
limita solame nte a aquellas unidade s de m uest reo seleccionadas en la eta pa que
le ante ced e. Los marco s mu estrales de las sucesivas et apas son independien tes
entre si.
A modo de eje mp lo, considrese un est ud io de opinin de est udiantes u niversitarios. Las unida des primarias de mu estreo sern las uni versidades del pais.
Se seleccionan como un idad es sec undarias las facultades en cada un a de las
unive rsidades elegidas. Las unidades terciarias se rn los cursos de cada facultad
y, finalmente, las unidad es ltimas de muestreo so n los estudiantes de los c ursos
elegidos. En este ejem plo el proceso poliet pco h a est ado com puesto de cu atro
et ap as. Nt ese que se requerir de marco mu est ral pa ra seleccionar estudiantes
de los cursos elegidos en la ltima e ta pa y no se necesitara el list ado de tod os los
est udiantes del un iverso de uni versidades.
El diseo de u na m uestra polie t pica implica tornar cuatro de cisiones de
importancia. A, saber, qu p recisin se requie re, cu ntas unidades primari as amerita seleccionar, cu l es el t ama o ap ropiado de las unidades primarias y cuntas
unidad es sec undarias am eri ta seleccionar en cada un idad primaria. Respecto a
la seleccin de unidades primarias, sec unda rles, tercia rias, etc., ca be realizar las
siguie ntes ap reciacio nes.
El nmero de un idad es prim arias a seleccionar dice relacin con la precisin
requerida y con la varianza que se conjet ura corresponde al d ise o en ejec u cin .
Las unidades primarias de m uestreo sue len se-r un idad es natura les y en tal
caso d tamao est p reviame nte defin ido - u nve rstdades, com unas, sucursales
de un ban co. Cuand o se t rata de reas el criterio es definir un idades primarias de
tamao medio, dado que grandes reas generan dispersin en la seleccin posterior
pe rdindose la vent aja de costo qu e otorga la formacin de conglomerados.
El nme ro de unidades sec u nd ari as a seleccionar dep end e de la variacin
de ntro de los conglomerados . Si se verifican conglomerados homogn eos pocos
elementos sern suficien tes para una satisfact ori a infe re ncia y, po r el contrario,
heterogeneidad dent ro de los conglomerados imp lica m ayor nm ero de elementos a seleccionar. Para medir la homoge neidad de los conglomerados se utiliza
el coeficiente Rl . ste ind ica la p ropor cin de dispersin total ex plicada por la
d ispe rsin intraconglomerados. La frm ula del coeficien te es la siguiente.

Me D

"

(16.1)

" =1 - - -

1 ; 1

rio ndc:

Varianza en tre conglom erados

i'.C D ""i'.1edia cuadrtica dentro del conglo m erado


S2 = Varianza to ta l

( 164)

los co nglomerados son homogneos la variac in nte rconglornerados sera


- -oe rior a la variaci n ntracongtomerado y, en consecuencia, el valo r de R2
~~al~

Se puede seal ar q ue el sub muesrreo prese nta como ven tajas la necesidad de
lfCOS muestrales acotados e n cada etapa y el meno r coste de seleccin de las
.inidadcs ltimas -que corresponden a las unidades de anllsis. Las desventajas
.ce n re lacin co n menor p recisi n po r acumulaci n de errores en las sucesivas
lpa s y la co mplejidad de calcular las fuentes de variaci n asociadas a oda
-tapa.

16. 1. Estimacin de la med ia


media muest ra! estimador de la media poblacional se obtiene como promedio
las medas de los co nglo me rad os. Se han desarrollado diversas opciones lomo
estimado res del parmetro poblacional. La siguiente exp resi n es un estimador
sesgado, eficiente y ptimo de J .
1

l~

-M-- l"
I M.X:~
- (K
n

:t, ::O

( 16.2)

~. ,

'5. 1. 1. Error tpico


1 varianza de la d istribucin m uest ra] de medias co nside ra dos varianzas como
-om pon e ntes de la varianza total.
La distincin t er ica fundame nt al ent re m uest reo poliet pico y los dem s
'ocedimientov de muestreo dice relaci n con las dos fue nt es de variacin qu e
' .. gene ran e n los diseos polict pcos. Las frmulas referidas a la variacin del
. su mador inc-luyen dos t rminos q ue miden cada una de las dos fue ntes de varc n. La prim era co rrespo nde a la disper sin q ue existe en tre las medias de los
-ttstintos co nglom e rados q ue componen la m uest ra. Se co noce como dispersin
. ntr c co nglo merados, I,a segunda fuente de variaci n co rre sp onde a la d ispe rsin
.sc se produ ce en los disti ntos elementos que com ponen cada co nglomera.lo.
" '~ con oce como disper sin d..-ntro de cong lom erados.

( 16 .3)

,c,

Varia nza de ntro de cada conglom er ado

m. - 1

(16.5)

La raz cuadrada do.' la varia nza es el e rror tpico del estadstico.

16 .1 .2 . Tama iio di? la m uestra


El clculo del tamao de la muestra en muestreo polie t pico presenta dificultades
especiales. El origen de estas d ice relacin con las dos fuentes de variac in que
se presenta en muestreo co n su brnuestreo. A saber, variacin entre los conglome rados qu e compone n la m uestra y dentro de- los elementos q ue componen
cada conglo merado,
El nme ro 11 de co nglomerados a elegir y el tamao m de cada co nglomerado
seleccionado depende de los valore, que asu man las varianzas entre y dentro de
co nglomerados.
La norm a es asignar ma yo res recu rsos a aquella compone nte de la variaci n
q ue sea ma yor. As, po r ejemplo, si la dispersin ent re conglomerados es men o r
porqu e las medas de los co nglomerados son pareci das e nt re si se seleccionan
pocos conglome rados y se asignan m ayor es recursos a la seleccin de ele me ntos
dentro de cada cong lom erado. Po r el contra rio, si la disp er si n dentro de cada
co nglome rado es baja porque los elementos en cad a conglomerado son sim ilares
ent re si se asignan ma yores rec urs os a la selecc in de vanos co nglomerados.

16 . 1.3 . Interva lo de confia nza


El inte rvalo de confianza se est ablece segun la frmula de lo'> tres trm ino '>. A
saber: estad st ico, coc hcicnte de co nfianza y e rror tpico

( 16 6)
Reem plazando:

K~
(-M O
"

l"
. -

LM~x~
1

Z0/1

(I<.K=!.j(-L),
11M2

+ _]~_ 2; MI

" KlvF Jo.,

('!'.c"m,)(",,-)
M.

(! 67)

Se calculan:

PROIIU::MA 11

En una empresa se mide nivel de motivacin . Se apli c un a encuesta con mu estr eo po r conglomerados en do s e tapas. En la e m presa trabajan 4.200 person as,
repartidas en 15 oficinas. Se m uestrearon 7 oficin as. Para inferir a los empleados
se fij 95 % de con fianza .
En la siguien te Tabla se pu ede observar la cantidad de empleados por oficina, cuntos de estos fueron seleccionados, el promedio de cada oficin a, y su
respectiva varianza:
06ci na

~ de empleados

T~nt. oo drl conglomendo

Promedio de

M.

en la mu estra '" .

motiv acin i:~

100

220

20

42

Olicin~

S'

5,3

3S

7,5

130

"30

37

10

345

69

40

500

100

45

12

' 30

30

31

4,7

155

JI

30

6,'

i M.'" 1.720
.,

~M'.(" :~. )( ,!)

Mli l

(M'%I- ,"1,i.1l

4200

659.344

2120

7700

60.712,96

6600

5530

2190 24

6lXXl

])800

4458 .009,96

11 040

22500

30.913.600

24000

800(1

220.900

4700

4650

361.681,96

4278

I
__

'"'.1 [M__)[")
a " SS.738

~M.i. = 66400

..:.,.M

:..::.i-_ Jo

mi

"' ,

Reem plazando:

:t',j.

15

= 4.200 " 7 " 6.400 ;: 33 ,88

J\1 =l).2 = 246


A partir del enunciado podemos obtene r los d atos:

'i o 36.~9!} 72~ o 6,148.878,82

M o 4.200
o 15
n =7
zQ/7. = 1,96

33,88 1,96

1 J,6. 148.878,82 .
15 7 ,246,
(~)(

_
7 ' 15'1 246" >8.738

33 ,88 5,46

ara hacer los clculos:


Utiliza mos las siguientes f0 ,'!m
""u~I!"LC","'-""",",-!illCSJ!!f!ililL

1i: i . Zon

- K
_
( ,\ 1 n ~'" M

(28,42; 39,34)
C ON CLU510:-:

Con 95% de confian za podem os afirmar que en la pobla cin la mo tivacin de los
empleado s, e n una escala de 1 a lOO, est compren dida entre 28,42 y 39,34 .
n

164

165

r. 2. Estim acin de la proporci n

PROII I.EMA 12

.\ "ropo rcin muestra] com o estimador co rresponde a un p romedi o de las


~ -vor c io nes de los n conglo m erad os q ue com pone n la m uestra. La sigu it2nt e
jn nula es un estim ador tnscsgado de l par m et ro poblacional .

I
( 16.8)

\
(

L z.r. Error tpico

t
\

varianz a del est im ador de la proporcin incluye las varia nzas entre y den tro
. J~ co nglo me rados co mo comp on entes de la varianza total.

( n' =
pi>

lvllJe

(K K~ nl(_I~\~r- _J~>Mi [~ - m.)(NiL]


nM

s~

lIKi\{-

~~ I

MI.

mI. - 1

(16.9)

es la varianza e ntr e conglo merados

En la mism a encuesta del ejercicio anterior se ind ag respec to a la pro porcin


de em pleados q ue se sient en va l ()~a dos po r la em presa. En la em presa trabajan
4 .200 pe rsona s, repart idas en 15 oficinas. De st as se seleccionaro n 7 como pa rte
de la muestra. Se qui e re crear un inte rvalo de co nfianza para infer ir lo s resultados
a todos los emplea dos. Se fij 95 % de co nfianza.
En la signente Tsbla se puede observar la cantidad de empleado s por ofici na,
cuantos de est os fueron selec cio nados. y la proporci n de ellos q ue afirm sentirse
valorado dentro de la empresa:
Oficina

N" d.. . emp leados


M,

Tamao <id congl"mer~dn


~ I ' la muestra m.

100

220

-,

P,

r.q.

20

10

0,50

0050

0.25

05 7

O/IJ

0.25

150

"

25

0,-1)

0,25

) 45

69

"

0,57

36

0,51

O,4>J

0,25

0,41

0,24

30

500

100

ss

0,59

150

so

20

0,40

0,60

0.24

155

31

18

O,51l

O,41

O.14

.,

( 15.10)

}:M. '" U 20

I e rro r tpico es la raz cuadrada de la varia nza del esti m ado r.


A pa rtir del e nunciado podem os ob te ner los siguien tes datos:

( 1..2. Intervalo de confianza

( .ucrvelo de confianza para estimar el para met ro poblacooal se co nform a


~ " 1\ las normas conocidas. Reemplazando e n la f rmula gen r ica se obtiene la
',jt' llte exp resi n.

=;

4.200

K = 15
/1
:::; 7
z<J? = 1,96

I
(

) .10

zun,.

( 16.11)

[-M~-]i:.'\I,P,
/1

K ).
F - --

Pa. = [Xi-;; t:~I~ p~

Lm p lazando en p :
( (la. =

Util izam os las siguientes fr mulas para h acer los clc ulos:

(16 .12)

(K-n]( I l ~'
- -K

.. 1

- -
nM

~~- + - l'~2'}; \f

"KM ~~I

(MM~-"J[p"
)
m.. - l
.:.:.:11.--.:.:..;'

_ A !JI .

{'-mplazendo en f rm uiJ del intervalo :

( l6 "~ (K K n]( n~l'l, + nK~w2;~\, (M',~.m](~~i)

(16.13)

se ca cu
Al' (...

-m'l['.,. )

Ofidn3

M,p.

M~(P.- P..j1

50

105,6

l2.5,4

43'

224.58

SS,S

22S

154,8

179,4

Z97,56

352,3 1

295

3600

'00

100

306,25

245

89,9

290,7

1S3,76

i M, r. ; 925,2:

..l M:P, - P..f" 5.2: 12,52

...

A-f
101

16.3 . Selecci n de unidad es de muestreo en muestreo


pol let pi co

,\-r;- '".- 1

r~
)(J:"1L
)'" 1.719,13
MI
,". -1

Reemplaz ando:

15

4.200 ' 7

' 92 5 2 ~ O.4 7
'

52 12,52 _ 86875
7- 1
'

i;'1 "" 1.720


7

= 245,7

0,47 . 1,96

(15

-))(_
1__
s

7 .245,7

. 1 7 19,13
, ) . 868,75 + 7 ' )5 1'245,72

0,47.0,07
(0,4; 0,54)
C O:-JCLU510N

Con 95% de co nfianza podemos afirma r q ue el po n.:entaje.de los empleado: q ue


se siente n valorados dentro de la empresa est a co m pr end ido en tre 40 % y ) 4%.

Cabe plantearse el problema de la probabil id ad de inclu si n de las u nida des


de muestreo en cada un a de las etapas de un m ue streo co n su brnoestreo. Que
probabilidad d e seleccin se asigna a cada un idad p rim a ria de m uest reo? L.a
mi sma probabil idad qu e se asigna a las un idades secu ndar ias y siguien tes ?
En ge ne ral se presen ta n do s alternativas e n el m bito del muest reo eq niprobabi lstico. A sa be r, muestreo aleato rio sim ple p.. l AS) con prob abi lidad es
igu ales d e seleccin e n cada una de la s etap as del mu est reo y, p or otra p ar te,
u na varian te del muestreo con probahldadcs de selecci n proporci onal al
t am ao de cada co nglomerad o (PPT) .
Lgic ame nt e se ded uce q ue el p roced im iento l'P'F gen era u na muest ra
ms rep rese nta tiva que el MAS. As, por ejem plo, en un estud io de op ini n
siendo unidad es prim arias el e mu estreo las co m unas del pa s la seleccin
mediant e m uestreo aleator io simple puede e xcl uir de la muestra comunas
grand es e im portan tes e incl uir slo co munas p eq ue as que segur ame nte son
un n me ro ma yor.
En virtud de lo ant erior no rmalmente se seleccionan las u nidad es p rtmarias de m uestreo con probab ilid ad proporcional al tamao y las un ida des
secun darias d e m ues t reo asume n valores cons ta ntes. As, por eje mplo, en un
m u estreo bi et pco se asigna a cad a comuna que es un idad primaria de muest reo un a probabilidad de selec cin pr op o rcional al num ero de el em e ntos q ue
10 co m pone n y e n la seg unda e tapa se sele cciona aleatoriamente el mismo
numero de en tr evista dos e n cad a comu na elegida . El uso conju nto ti"" es tos dos
p roced imi entos de selecci n per mi te igualar la s prob abdades dt: sel eccin
de las unidades secu nd arias. Es decir, gen e ra u n m uestr eo equprobabtltstco
de las u nidad es sec un da rias q ue son las uni dad es de an lisis.
N tese que en principio los el em entos de los co nglome rados gra ndes
presenta n mayor p rob abilida d de sel ecci n que los elementos de los {"o nglomendas peque os, pero en la seg und a etapa se eq u ilibra esta desproporcin .
A modo de ejempl o, una com una que co ntenga cien mil vivie ndas te nd r d iez
veces ma s probab ilidad d e seleccin qu e un a com una de di ez mil viviend as
Sin e mb a rgo, si ("11 cada comuna se sele ccion a alea toriame nte el mism o n me ro de viviendas, e n la com una grande stas te nd r n 1/ 10 de probabilidad
de sel ecc in resp ect o a la probabilidad de incl u sin de las vivien d as de la
com un a pe q ue a. G e nerndose como consecue nci a de ambos pas os un mu estreo cq uip rcb abilisnco.
Se presenta a con tinuaci n la probabilidad de seleccin de una unidad 51:' cundaria como prod uct o de tres trminos.
Prob~h ihdad

N,'m"'m de

.k 011 dtmento" ronglom.:raJos

168

l(

Tamao de eoo~!orn('fm
-T,;lTLIo de poblxin

l(

EI"mento :i<'!eiooado por CtVlg!nmerados


- - - Tlm..oode CQngiOfl"le(J."

Seg u la frmula prese ntada, cada ele mento tiene la m ism a probabhdad de
-ccin indepe ndie nte del tamao del conglomerado de pe rtenenci a.
\ Resulta evide nte consi derando q ue en la f nOl " .l el t am ao del conglornc .-lo figura simultneame nte en el numerador y denominador. En definitiva, la
;olm uld es una expresin de IJ. fracci n de m uest reo, es dec ir, el cocie nte en tre
~ amao de la m uestra y el t am ao de la poblaci n.
\ A modo de ejem plo, supngace que se des...a una mu estra eq upr ob abl.... en una
comun a q ue tiene 500 m anza nas y 50.000 vivie ndas Se decide selec cio nar 100
~ oz anas con probabilidad de seleccin proporcional al ta m a o y 10 viviendas
i cad a manzana elegida.
>'::...

Capitul o 17

Otros diseos probabilsticos

17.1. Mu estreo sistemtico

l u.Ll . Conglomerado de tamao grande


(

J 'la ma nza na con edificios esta co mpuesta de 200 viviendas. La probabilidad de


L :'-cci n de cad a unidad primari a y sec unda ria se calcula a co ntin uacin.
t "idJJ prim aria de muestreo

100 (numero de co nglome rados ) ' 200 (t amao del conglomerado)


j
50.QlX) [t amao de la poblacin)
.

0,4

~ llidad sec undaria de m uestreo


10 (viviendas por con glom e rado ] 200 [tamao del conglomera do) = O,OS
t )bah ilidad seleccin de unidad secu ndaria

0,4 ' 0,05 = 0,02

1_.3.2. CotlglomeraJa de tamao pequeo

~ a ma nz ana de casas est co m puesta de 40 viviendas. Se calcula probabilidad


( seleccin de un ida d primaria y secundaria.

~llidad primaria de m uest reo


/00 (nmero de co.~gl om erad05) ' 40 (tam~~o del co nglome rado) _ OOS
50.000 [tarnao de la poblacin]
,
idad secundaria de muestreo

10 (vivie ndas por ("onglorne rado) ' 40 [t amao del conglom erado) = 0,25
( " babilidad selecc in de unidad secundaria

O,OS ' 0,25 = 0,02

;... verifica q ue en las ma nza nas de edificios y casas la prob abil idad de seleccin

k vivien das es igual.

El muestreo sistem tico es una variante del mu est reo aleator io sim ple q ue se
rem onta a mediado s de los aos -t0. Desa rrollad o por L.H . Madow y M. G.
Madow ( 1944) y WG. Coc hran ( 1946), tien e el m e rito de permitir un a senci lla
selecci n de los elem entos que componen la muestr a. Se simplifica la seleccin
po rque siendo est a aleatoria es t am b in sistemtica. El azar opera e n la selecci n
segn un modo predefinido.
El procedim iento de seleccin es siste mtico a pa rt ir de un element o elegido
al azar qu e o pera com o arra nque aleatorio para la selecc in autom t ica del conju nto de elem entos que co m po ne n la muestra. El primer elemento selecc io nado
condiciona los siguien tes, que son elegidos a pa rti r del arra nq ue aleatorio y seg n
un salto de amplitucl cons tan te . La seleccin sistemtica implica UII nm ero de
arranque y un in tervalo de muestreo. De fi nidos ambos la muestra queda au tomticam ent e establecida .
Desde el punto de vista operati vo se procede s..gn las sigu ie nt es etapa s.
G e ner ar un nmero de arra nque aleator io. El num ero de arranqu e sera un
valor i q ue est ad co ntenido en el intervalo con co ta inferior 1 y su pe rior igua l
al valor del coeficien te de elevacin (N/n). Este elemen to ser \., primero
q ue compo ndr la m uestra.
Seleccionar de modo sistem tic o los siguien tes elementos a k distancia del
punt o de arranque aleato rio. El valor k co rresponde N/n .
En consecuenc ia, se establece la siguiente sucesi n a part ir del primer eleme nt o i , i-ek, i+2k, i+3k, ... .i+( n-l }k. El procedimie nt o es sistem tico porque se
van selecc iona ndo elementos que estn a k lugares del i- simo de la lista
Por ejemplo, sea N= l ,000 Yn= 100 el valor de k co rresponde a 1.000/ 100== 10. El
p unto de ar ranq ue aleato rio se r un valor comprendido en t re 1 y 10, Su p ngase
q ue al azar se: selecciona el num ero yLos valores que com prende 1;1 mu estra sern
los siguie ntes: S, 15, 25, 35, 45, 55, 65, 75, 85, 9 5. N tese q ue se hall seleccionado
10 n m eros q ue correspo nde e xactamente al tamao de la muestra.
C abe destac ar q ue en c iertas circunsta ncias e l m uestreo sis te mtico puede
ser mas represen tativo qu e el m uestreo alea torio simple. En efecto, el muestreo
sistemtico asegu ra saltos sistemticos, de m odo q ue ningn in tervalo amplio

le eleme ntos q ueda sin re presentacin. C uando e n el listado de la poblacin


.xs ten sucesion es de ele mentos ho mogneos en relaci n co n un at ributo, la
pl ccci n de muestreo sistemtico gene ra muestras m s represe ntativas q ue el
ISO de muestre o ale ato rio simple. Su p ngase una poblaci n de 50 elemen tos
. un a mu estra ale atori a de 5 e lem entos. Un resultado ale atorio es 33, 42, 28,
O, 30 . En esta muestra las dos primeras decen as no tie nen representaci n. Sin
mb argu, mediante selec cin siste m t ica co n k= 10 Yarran q ue aleat o rio i"A, los
alores que co mponen la muestra seran 4, 14 , 24, 34 ,44 . Se evide ncia que en
cdes las decenas u n elemento p art icipa en la muestra .
Sin em barg o, cuando en el list ado de elem en tos existe un a racha y sta tiende
coi ncid ir co n el valor de k, el muestreo sist em tic o genera sesgo, result and o
renos represent at ivo que el muestr eo alea torio sim ple. En defini tiva, c uando
I perioJicidad es igua l al valo r de k el m uestreo siste mtico es prcticamente
uplcablc. Supngase una poblacin de N=60 elem entos co nst it uidos por valores
ue conforman un periodo de cuatro. A sabe r, 2, 5, 1, 7 .... 2, S, 1, 7. Una muestra
stern uca n=15 ele mentos da lu gar a un valor k=N /n=601l 5 =4, lo que genera
na muestra const ituida por el m ismo n mero repetido 11 veces. Un ejemplo
-al sucede si se dese a estimar el nm ero de visitantes a un museo e n un m es.
Ha estos efec tos se m uestrea n ciertos das. Si los d as sele ccionados tie nen un
atrn que res pond e a u n interv alo de siete d tas siempre se m uestrear el mis mo
la generando una m uest ra sesgada
En general si la d istribucin de los ele mentos de la pob lacin es al aza r, la
-ectst n de la selecci n sistematica es similar a la seleccin aleatoria sim ple.
En muestreo siste mt ico puede suceder que N sea m ltiplo de n o que no
sea. C uando no 10 es las mu estras no tendr n tod as el m ism o tam ao. El valor
~ 1\ co rresponde r al nmer o menor q ue m ultiplicado po r k sea m ayor q ue N .
) f ejemplo, sea N= IOO y k=9 h abr de las nueve m ues tras posibles ucho de
mao 11 y una mayor de 12 elem entos.
El nmero de m uestr as posibles es mucho m en or qu e las q ue gene ra el m ues-o aleatorio simpl e. En el ejemplo slo hay 100 pun to s de arr anq ue aleato rio, en
nsecuencia. slo I00 muestras posibles.Valor este m uy injcrior a la combinacin

~:1qtle es el nmero de muestras generado en la selecci n aleator ia sim ple.

C abe destacar que el muestreo sistem tico se suele utilizar en el conte xto
diseos por etapas donde este es slo un a e tapa de la selecci n de la m ue stra.
;i, por eje mplo, siendo las unidades primarias ciudades se puede generar un a
cccin sistem tica de zo nas ce nsa les dentro de las ciudades y,pos te rio rme nte ,
ec ci n siste mtica de viviendas en las zon as ce nsales eleg idas.
En m uest reo sistem t ico e l es ti ma dor d e la m ed ia y la proporcin es un
.imadc r nsesgado del par ametro poblacional. Sin e m bargo, f'1clculo de la
-innza del estimad o r re sulta t ericamente probl emt ic a. En e fec t o. a dfcica de otros muestreos no es posible estima r tnsesgademente la va rianza
m ed ias y pro porc iones a part ir de una sola mue stra . 'Iukey )' Jones ( 19 56 )
mtean como so lucin seleccionar vari as muestras siste m at icas generadas

172

al to ma r ale atori amente y sin re em p lazo varios puntos de ar ranq ue e ntre 1


y k, am bos inclusive.
Por lo dems la construccin de intervalos de confianza vel calcule del tama o
de la muest ra se re alizan e n la misma lgica que los ot ros' d iseos de muestra.

17.2. Muestreo polifsico


El mues t reo poli fsico se caracteriza porque la informacin se recoge en dos
o m s fases sucesivas. C ad a fase es una submue st ra de la fase an te rio r. La realizaci n d e las fases puede se r en for m a airuultnea o sucesiva . Normalmente
se apli can dos fases y se d en o m ina m u estreo doble.
El desa rrollo del mue st reo poli fsico se vi ncula a sit uaciones en las cuales
la infor ma ci n req ue rida no es homognea de sde el punto de vista del c ost o.
Po r ejem plo, se in da ga respec to al estado de salud e n la poblacin de mayoTes de 65 a os e n una co m una det erm inada. Para estos efectos se est ahlece n
dos t ipos de info rmaci n necesaria. A saber, datos re ferid os a hahitos de vid a
como nu trici n, t ab aquismo o int er acc in social e in formacin relacionada
co n p red isposici n a enferm edades, p ara lo que se re-q u ie re m ed ir pr esin
sangu nea , coleste rol .,. o t ros sim ilares. Para la primera informacin se aplica
u n cuestio nario a la m uestra seleccionada. Sin emhargo, P;U; la info r m ac i n
q ue requ ier e de perso nal y eq uipo especializad o se o btiene una segunda
muest ra en una nu eva fase. La m uest ra de la segunda fase co rresponde a una
parte se lecciona da aleatoriamente de la muestra p rim e ra .
Tamb in se uti liza e n el co ntexto de ex igencias de p recisin distintas pa ra
difer e nt es submuestras . En pa rti cula r, la ma yor preci sin se asocia a la p rime ra
fase, que es de m a yor tamao , y para exi ge nci as de menor p rec isi n se genera
una seg u nda fase obt en ida de un a seleccin aleatora de la prim era.
El dise o polif sico permite obte ne r en p oblacio nes que conform an grupos m ino ritarios muest ras que repre sen te n a tal e s grupos. La prime ra fase
de una m uestra m ayo r se uti liza pa ra ide nti ficar a los mi e mbros de l gru po
obje to de est udio. Post eriorme nt e mediante un inst rum e nt o de medida mas
porm en or izad o se enc ue sta al grupo de elem entos poco co m un es pr e viamente
id entificado.
Un a ve ntaja del m uestreo polifsico es que pe r m ite ge ne rar u na m uestra pa tr n e n la p rimera fase a part ir de la cual se pueden genera r sucesivas
sub muestras o nuevas fases. Las fases post e rio res se ve n enriquecid as por la
info rm ac i n q ue o to rga la m uest ra p at r n. En particu lar, se pue de disponer
de in fo rm acin para es tratificar o estima r la t asa de no respuesta.
C ab e pre cisar la d istinci n entre los muestreos polifsico y polietptco.
El dise o polifsico en cada fase m ide la mi sm a un idad de muestreo)" en el
pohet ptco cada e t apa co rresponde a unida des rnuest rales d istin ta s

'"

17.3 _Muestreo con r plicas


El d iseo de m uestras replic ada s o interpenetrante hace referenci a al precedmiento de d ividir una muestra e n dos o mas submuestras independientes en tre
si. La generacin de muest ras replicadas es posible de efectuar e n cua lquiera de
los d ise os clsicos: aleatorio simple, estratificado o con glo me rados
Las m uestras rep licadas son reprod uccion es en peque o generadas a pa rt ir
del mi smo d iseo muestr a] y ca da una de e llas del m ismo ta mao.
La ge ne raci n de muestras replicad as per mite realiz ar anlisis por separado
para cad a un a. Resulta til cu ando el t amai o de la muestr a es gra nde y se requieren resultados de avance, da do q ue posi b ilita el procesam ien to adelan tado
de una de las divisiones de la m uestra . En el e ntendido q ue cada submocst ra es
una seleccin ale ato ria de la m ues tra m ayo r.
Tericamente, la princ ipal vent aja de la d ivisin de la muestra en submuestras
dice n-ladn co n el calcu lo de la varia nza del estima dor. No rmalme nt e la varianza
del esti m ado r se calcula a partir de la n ica muestr a seleccionada de la combinacin

'!e{~) m uestras pos ibles. La replicaci n de la muestra permite re alizar el clculo


de todas las m uest ras posibles, pe ro s de numerosas muestras m s peque as
rue la nica m uestra m ayo r. As, po r ejem plo, no se calcu la la varianza de l estimado r de un a nic a muestra de tamao 10 .000 sino de 10 muestr as indepen di en te s
de ta ma o 1.000. En general, la estimacin de la varianza del estimador mejora
uando a um enta el numero de muest ras re plicadas.
En la pr ct ica tambi n se utilizan m uestr as re plicad as pa ra el estudio de
errores ajenos al muestreo. Po r ejem plo, p:lra comparar la act ividad desarrollada
)or d istint os equi pos de entrevistado res o codi ficadores. S up ngase q ue e n una
-nucsrra de 50 0 elem entos el levanta mie nto de datos es realizado por 10 entrevistadore-s. El efecto de los entrevistadores p odra ser co nocido si la muestra
. .? di vide en 10 m uestras indep endientes de tama o 50 asigna da cada una a un
-nt revistador distinto. Considerando que las m uestras replicada s son co mpa-eblcs, un pat rn de d iferenci as entre st as - al ma rgen de las fluct uacio nes del
.iuest reo- pu ede n se r at ribuidas a sesgo de los en t rev istado res.
.10

_7.4. M uestreo por reas


:1 m uestreo por re as es un procedimiento de selecc in aleat orio que se caracc rin po rq ue el m arco muest rallo constit uye informa cin cart ogr fica.
El uso de m uestreo por reas resulta til cuando slo ex iste ma rco cartogr fico
. cuando la poblaci n se en cuentra di spe rsa e n gran des espacios con elevados
estos de acceso.
El procedim iento co ns iste en div idir una ciudad o co m una en un co njunto de
-eas pequeas, entre las cua les algunas so n seleccionadas al aza r. Normalm ente

de ntro de cad a arca seleccionada se selecci ona una submuestra de los elementos
que la compon<~n. Se suelen ut ilizar dos alternativas de submuestrcc dependiendo
de la info rm acin disponible. A saber, subm uest re ar el arca selecctoneda en rea s
ms peque as si la cartografa lo permite o enumerar todos los elementos del
rea seleccionada para elegir un subconjunto aleatc riarncnt e.
Los lm ites de las reas p ueden dehnirse a parti r de hitos na turales como
a,vcrudas o ros y segun divisiones politico-administrati\as como comunas o
zo nas censales. En los sectores ru rales sude ser eficaz el uso de h itos na turales
para establ ece r re as.
En encuestas urbanas las arcas pe rm iten seleccionar a bajo costo viviendas
Para estos e fectos se precisan m apas q ue co ntengan las m anzanas de la d uda d,
a fin de enumerar todas ellas. En umer adas las m anzan as se podran empadronar las m anzanas seleccionadas para elaborar un list ado de las viviendas que
las componen. Posteriorme nte selecc in ale ato ria de VI viendas y, por lt imo,
seleccin de pe rson as en cada vivien da. El proc edim ien to SC' puede simplificar
evita ndo el lista do de vivie ndas y realizando la seleccin segun salto sistemtico
o, sim plemente, se leccio nando al azar una de las c uatro calles de la m anzana
)" encuesta ndo todas las v...rendas qUt.' la componen. Se aconseja, sin embargo,
que el n me ro de viviendas seleccionadas e n cada m anzana sea propo rcio nal al
t ama o de la m anzana
La seleccin de viviendas puede presentar problemas inesperados que se
resuelven segn criterios p re viame nte establ ecidos. Entre estos cabe dest acar
un sitio donde se espera e xista un a vivienda, hayan efectivamente dos; o una
vivienda donde se su pone vive una familia, co nvivan dos, constituyendo dos
hogares independien tes.
En ge ne ral, el m uestreo por reas se asoci a a dise os po r conglomerados y
poliet pcos

Captulo 18

Probabi lidad de seleccin proporcion al al ta m a o

La seleccin COIl probabilidad proporcional al tama o es una adap t acin de la lgica del m uest reo estratificado co n af ijaci n proporcional a dise os m uest rales no
estratificad os. Se tr ata de una superaci n del muestreo aleato rio simple en la q ue
se incluye co mo in for macin au xiliar el tamao de las unidades de m uestreo.
El muest reo con probabilidades pro po rcio nales al ta mao puede rea lizarse en
di se os sin eta pa s y polietpicos. Subyace la lgica de diferenci ar en la m uestr a
unida des de muest reo peq ue as y grande s y, poster iorm e nte, asigna r a las un dudes probabilidad d e selecci n proporcional a su ta ma o. En particula r, m ayo r
probab ilidad de selecc in a las unid ades grandes y m enor a las un idades pequeas.

18 .1. Est im acin de la media


El est adst ico estim ador de la m ed ia pobleco nal en muestreo probabilstico con
probabilidades proporcionales al tamao asume la siguie nte e xp resin.

".

(x
P,

1- ~----'..

= --

N ' n

,.

( 18. 1)

D onde:
N = Tama o de la pob lacin
= Tama o de la muestra
x = N me ro de elementos en q ue apa rece el suceso
p', = Pro babilidad del intervalo asoc iado al suceso
11

18.2. Erro r tpico


La varianza del est im ado r de la media permite calcu lar el error t fpico.
,

0 (.

' (X,
i ; - N <;)

1
~ N 1n (n=I ) ~,

La raiz c uad rada es el error tpico

177

( 18.2)

Q.3. Intervalo de confianza


inte rvalo de confianza est compuesto por tres t rminos. Est adstic o, coeficiente
co nfianza y error tpico

(18.3)

-ernplaze ndo:

- --/ -"2:
" (_Xi - Nx )

f'PIl(n -l) ,. P,

[ /8.4)

PP'

13
indaga res pec to a la disponibilidad de tecnologa computac ion al en establenentos de educaci n m edi a, En la ciudad existen m uchos esta blecimientos
}tam ao pequeo, algunos medianos y poc os est ableci mientos grandes. Se
-oone que la infraestructura computacional y su utili zac in esta relacionada
.>11 el t ama o del estableci miento,
La seleccin de elem entos media nte m uestr eo aleatorio simple dada lugar a
' a proporci n ma yor de es tablecim ien tos peq ue os sesgando el result ado del
stud o. Sin emb argo, consi de rand o el tam ao del est ablec imie nto y selcc ctondo en forma proporcional al t ama o de sto s se obtien e una m uestra ms
.irescn ta rve que m edi ante la selecci n aleatoria sim ple. D e hecho, un diseo
'Iuip robahilistico podr a dejar fuera de la muestra a los pocos establecimientos
.J nLles exis te ntes.
Sup ngansc los siguientes valores num ricos para el ejemplo rese ad o.
OIl I EM A

/~

Probah,lidad
81100

9- 15

11100

16-2 1

61100

22<)0

wrcc

10

3 140

10/1 011

41-0

9/ 100

10

50- 59

10/100

13

6072

IJ Il UO

13

nss

13/ 100

10

'5

l((). IOO

15/ 100

Establec tmien to

Ntiml"fo de com r utadores

Intervalo i<."'lmllloo

100
. u ntos co mputa dores en promedio es tn conec tados a In te rnet ?

Se a'>umeque el nm..ro de co mputador>:,> por establecimiento esta aseociado


con el num ero de computadores conectados a Int ernet. Se utiliza 'SI'T tal que
la probabilidad de selecconar un est.lblec im iento es proporcional al nmero de
computadores del establecimlenro,
Se selecciona un a muestra n:=:5 de los N:=:IO establecimientos. Para que la
selec cin sea proporcio nal al tam ao de l establecimiento, mediante una t abla
de nmeros aleator ios elegi mos cinco nm eros e n el rango 1 a 100. Se obtienen
los nmeros 26, 35, 6 5, 76 Y94.
En la colum na intervalo acumulado -asumc valore s entre 1 y lOO- sE.' local znn
los cinc o nm eros elegidos al azar. Los establecimientos asociados a los nmeros
aleatorios so n los elegidos para fo rm ar parte de la muestra. As, por eje mplo, el
nmero alcatono 26 indica q ue el est ablecimiento cu atro sera sometido a medicin . La m uestra consta de los establecimientos 4, 5, 8 , 9 Y 10.
La seleccin se ha hec ho co n probabilidad pro po rcio nal al tamao del esta biecim ie nto. En efecto, establecimientos con mas computadores han tenido
m ayor probabilidad de pertenecer a la m uest ra.
Se m ide en los esta blecimientos muestreados y se verifica el num ero de
computadores conect ados a Int e rnet: 6,7,9,9 y 10.
Conocida esta informacin se procede a estimar el promedio de computadores
co nec tados a Int ernet en la poblacin o rigen de la muestra.
l'a ra facilita r los clculos se define la variable n me ro de co m putadores
con ect ados a Internet y la pr obabilidad del intervalo asociado al respectivo est ableci mien to. Esta ltim a d e la colum na Probabilidad en t abla ant erior.
N compllt..dor~ um inte rfld

P,

6
0,09

0, 1

0,13

SO l u a N

En prim er ter m ino calc ulamos el esta d stico muestral .

x _

"_( x, )

"" -N ' n ~ ~

Donde:
N = Nmero de establecimientos
:=: Tamao de la muest ra de establecimien tos
x, = Nmero de computador es conec tados a Internet por establecimiento
p, = Probabilidad del in ter valo asociado al es tablecimien to
'1

1 [6

x". = j(j-:T 009


, +

7 9 9 10 ):=: 6,8

oT
" + O 13 + 01.3
, + 015
,

'ara de finir el intervalo d e confianza se calcu la la varianza del estimador segun


rm ula ( 18.4).

_- _ (l0 ' 6.8)f ,


( 009
J
'

[_7__(10'6'8))', [ l _ (10'6,8)l',
0.1

0,13

'~- IO" S(5 -1 ) ( ~ __ (10 ' 6,8))', (Jo._(1O ' 6.8)1 '
0.13

~I

0,13

Captulo 19

Mtodos indirectos de est imaci n

=33

'

intervalo se presenta a con tinuaci n

6,8 3,6
(3,2; 10,4]
:ONCl.USION

:on 95 ,5% de con fianza podem os afirm ar q ue el prome di o de com putadores


onec tados a Internet por est ablecimiento esta co mprend ido e n el inter valo 3

10.

Los m todos direc tos de est im aci n so n senci llos y si el aza r funcio na adec uadam e nte dan b ue nos resultados. Sin em bargo la eficacia de la est im acin PU1.'<il'
m ejorar si se u tiliza una variable auxiliar co rrelaci o nada co n la variable de estudio. La variab le au xiliar p uede ob te nerse de m e dic iones an te rio res resu ltado
de un es tudio d istinto, pero rela cionado co n el te m a in vest igado . Tam bin se
ut iliza co mo in formac in au xiliar el resultado obte nido al aplicar una enc uest a
piloto pa ra evaluar el inst rum e nto de m ed ida. La variabl e en estudio y la variable
au xiliar deben ser m edi das e n cada elemento de la mu estra.
Tres 'procedim ien tos de esti m aci n indir ectos so n de uso com n . A saber;
est imado r de ra zn . d e diferencias y de regresi n. El est imador de productos
ha sido ela borado, pe ro su ut ilizacin es poco h abi tua l.
En rigor, los est im adores ind irec tos son variaciones de una mism a lgica .
Dad a la ex ist en cia de rel aci n e ntre la variabl e en est ud io y la variable auxiliar
se asume qu e es ta rel acin es linea l. En virtud de lo cual los est imador es ind irectos supone n e l ajuste de un a rect a a los puntos obser vados. El estimador de
raz n asume q ue la recta pa sa por el o rige n d el plano cartesiano. El est im ado r
de regresin incluye el clculo del coeficie nte d e regresin p ara m ejorar la
calidad del est im ador. En e l est im ador d e dife rencias se asum e qu e el valo r J....J
coeficiente de regresin es l .
Los esti madores indirectos sern m s o menos preci sos segn el tipo de
re lacin ent re las vari ables.
Si los datos resp onden a una linea re cta q ue pasa po r el o rige n, d mejor
estimador es el est im ado r de ra zn.
Si la relacin entre los valores de la variable de estudio y la auxiliar es lineal,
pero la rect a no pasa por el or igen , cabe calc ula r la pe nd ie nte de un a recta
qu e es definida por el coe ficiente de regresin, y el es tim ado r correspon diente se r el esti mador d... regresi n.
Si los da tos se ajust an a tilla pendie nt e definida por u n coefi cc nte dI' rcgresin de valor ] el es t im ado r de di fer encias es el mus ap ropiado.
Los estim adores ind irect os p ueden ser usados en div e rsos oiseo:-. rnunst rales
co n el fin de re alizar est imacio nes de la rucd a o la p ro porci n po blcciona l. A
fin de ilu st rar la lgica de los est im adores indirectos se t rata r el es timador de
raz n en co ntexto de muest reo aleatorio sim ple.

18 1

J .1. Estimador de razn

19. 2 . Estad stico mu estra}

se sustenta en la existencia de re-laci n lineal e nt re do s


.riables susceptibles de medici n. El propsito es mejo rar la es tim aci n al utiar m s informacin que [a otorgada por la selecc in aleatoria de ele mentos
una sola v anable.
El estimador de razn es u n esti m ado r sesgado del parmet ro poblacon al.
.\ e-mbargo, el sesgo disminuye en mu estra s grandes, asumcndose en la p r ct ica
'e st e es inhmo.
Res ulta un est imador insesgado cuando la relacin ent re X e Y es una recta
.e pasa por el orig en del plan o cartes iano. En este co nte xto se le co nsidera
. est ima do r lineal, insesgado y ptimo. Cumplida la condicin anterior es un
timador mas preciso que JI: y que otr os estim ado res indi rectos.
Gr ficamente se puede verificar si el est im ado r de raz n es un buen estimar de l p arme tro pobla cto nal . El G rfico 14 es un plano de coo rdenadas con
j a rect a ajustada a la nube de puntos qut' evidcncia q ue el estimado r de raz n
un est imado r lineal, insesgado y ptimo. En efecto, se cumplen las siguiente
lJidones.
Re laci n lineal entre amba s variables
La recta p..lsa por el o rigen
La varian za se Incrementa a med ida que aume ntan los valo res de X e Y.
Exp resin de het e rocedasticidad .

d
El estadstico del esti m ador de razn esta co m
en tr e la variabh- X en estudo y la varia-ble auxif~re~o e ~os tderm inos: la raz~n
de la variable auxiliar y .
' en segu n o ugar, l media

1 e- tim ado r de razn

G r fi co 14. Re-cta Y nube- d e: puntos

La ra zn en tre ambas variables es un cociente


Razn entre X e Y
.

.-fx,

, =- ,-

(19.1 )

Lv'
.,

Respecto a la me dia de la variab le au xiliar se usa el pa r metro o en


d f
se ree m plaza por la media m uestra] y.
J.l,
su e ecto

(19.2)

o en t rminos de raz n.

'

.: ..
.

..

.
..
"

"
..
.. ..
.. . .
...... ...
'

'

"

( 19.3)

19.3. Error tpico del estimador de

La varianza del estim ado r es una variacin de la frm ula util izada e n
t
. na I.
.
. m ues reo
est ratific ado ...con , fi,, e,
... o" P" iporcro
(J~ =_N- n . ~

'.

N .n

( 19.4)

Do nde :

i:(x,- ry,)'

.s1 '" t-_,


,

n- 1

El e rror tpi co co rresponde a la raz cuadr ada de la varianza.

182

(195)

Media po blacona l aos de afiliacin

19.4. Intervalo de confianza


El intervalo de confianza se cons truye con tos t rm inos conocidos. A saber, estadstico, coe ficiente de confianza y err or tpico.

~y

= 5,5

Sumato rios cuad rados de las variables med ida y aux iliar

(19.6)
Reem plazando:

r oy,

V-

.t
on

N .- tI

(19 .7)

.L;Y.

N _n .j.,(x; - ryj1
N.n

D~ = 15.000
.,

Prod uctos cuadra dos de las variables medida y auxi liar

; -:""";-'-.,..,-

~ . Y c.,

L X; " 29 .400
,.,
~

sf

Reemplazando con ( 2.5.2)

}:x,

11 - 1

L x,Y. =. 21.000

-,

S O LUCiN

14
Se e-st udia identidad sindical en afiliados a un a fede racin campesina . Se supone que esta variable est rela cion ada con los aos de afiliacin . Conociendo la
relacin e ntre amb as variables se usa estimado r de razn que sera ms preciso
que la est imacin directa. Los valores pa ra ide nt idad sindica l se m iden aplica n.
do una escala tul hoc. Los valores de la variable aos de afiliacin se encuent ran
debidamente regist rados. Se ob t iene un a mu estr a aleatoria de 300 casos de una
po bl aci n de 5.000 afiliados. Los valores de amb as variables en la muestra seleccionada se presentan a continuacin. Los datos obteni dos pe rm ite n estimar
el parmetro poblacional de la variable X ide nt idad sindical seg n info rm acin
aportada por la variable Y aos de afiliacin.
PRO BLEMA

Estimador de razn de XI
~

LX
x = . .y = 4 200 . 5 5 = 7 7
".....
- )' 3 000

,.,Y,

Razn XIY

N " 50 .000
n=

600

x = ide ntidad sindica l

Varian za estimado r x.

y =. aos de afiliaci n
>

0 -

"

Total en escala de iden tidad


eo

N - n

= --- -

Nn

x,l - r ~ - 2r2:~; Y;

L X, " 4.200

;~l

;_/

1./

Total en aos de afiliacin


,~

LY." 3.00 0

;~l

184

18 5

-Capitu lo 20

Jl ecmplazando:

); =
s~ =

29.400 _1 ,4 zIS. OOO _2

-6 00 - 1

01

,4 21 .000

Di seos no prob abil sticos

98

o ?= SO .Q90 --- o9 8 =O, 16

"

50.000 600
o

tervalo de confianza

Reemplazando

7,7 . 2 ' {U,Tb


(6,9; 8,5)
:J~:CI.USIO~

-; t'~t i mJ con 9 5,5% de co nfianza q ue el valor del parm etro poblacional est
co mp re ndido en e l inte rvalo 6,9 a 8,5.

Los m uestr eos no probabilst icos son procedimientos de seleccin q ue se caracteri zan por q ue los elementos de la po blacin no ti enen una probabi lidad co nocida de seleccin. El hec ho de no conocer la pro babilidad de selecci n anu la el
uso de las he-rramie ntas ela boradas r ara inferir de la muestra a la poblaci n. En
co nsecuenca, en el muestreo no probabilstico es im posible conocer la magni tud
del error asociado a la estimaci n del par me tro poblact onal.
Las dos ven tajas eviden tes del m uest reo no probabilstico son la facilidad del
diseno - no se precis a ma rco rnucstral- y la dismin ucin de costos.
Se disti nguen diversos proced imien tos de muestreo no probabilstico. La diferencia e ntre uno y ot ro d tcc relac in co n el modo de seleccin de los elementos.
Se presen tan a continuacin bre vemen te los procedimientos m s utilizados.
D esde la teor a de la estimaci n son diseos impropios po rq ue no pe rmi ten
in jerir probabilisticarn ente rt'speno al valor del parm etro po blacio nal. En efect o,
dad o qu e los ele me ntos de la po blaci n no tie ne n una probab ilidad conocid a de
perten ecer a la muestra , es im posible co nocer la di str ibucin de probabilidades
de la muest ra y estab lecer un inte rvalo de co nfianza para la injerencia
Ter icam ente la d iferencia p rincipa l ent re ambos dise os di ce relacin co n la
distribucin Cilla pob laci n de las variable s q ue se miden . Los dise os probubtlsricos no necesitan del supu esto de distribu cin norma l de las vartablcs somcttd as
a est ud io. La seleccin aleatoria de ele me ntos seg n el teo rema del lim ite cen tral
asegura la distribucin normal de las m edias m uest rales. Sin e mbargo, los diseos .
no probabilsticos dependen JeI supuesto de distrib ucin no rm al de las variable,
para rea lizar un a est imacin sat isfactoria.
Una paradoja que emerge de los precep tos funda ntes de la inferencia estadstica.
Se sude jus tificar e-l uso de m uestreo no prohabiltst ico porq ue e n la pr cti ca
no siempre resul ta posible la selecci n es tricta mente alea toria de todos los elem entos qu e compon en la muest ra. A menudo muestras diseadas probabilisficas
pie rden esa pro piedad d urante la fase de t rabajo de cam po

20 .1. Muestreo por cuotas


Se trata de un d iseo rnuestral po lmico. En sus versiones ms sofist icadas se le
de nomina cuasiprobabhs nco. Se han n -ahzadoestudios empricos para comparar

.alidad de la estimacin respect o a diseo s prcbebtlst cos. H ist ricame nte su


gen se rem on ta a los estudios de opi nin pub lica e investigaci n de m ercados
llzados por agenci as no rt eamer i__ anas e n los aos t reinta.
El muestreo por cuotas no es un procedim iento q ue asu m a una moda lidad
ca . Existe n vari aciones que ha cen de est e proced im iento una creacin especa s~'R n la naturaleza de la In vest igaci n.
La caracreristica mas pro pia d el muestreo por cuo tas es q ue la responsabilidad
elegir q u element os co m po ndr n la muestr a es asu mi da po r el ent re vistador.
t are a del muestrsta es establecer q u variables de cuo ta s se usar n. de qu
lao ser a cada cuota y c unt as c uot as comprende la muestra . El entre vistador
ndc qu elem entos compon en cada cuota segn la hoja q ue indica un nmepara sexo y tramo de edad . El m uest rista genera la estructura de cuot as q ue
n poncn la muestra y el entre vistador de cid e q ue e lementos cum pone n cada
1 de las c uot as q ue le co rre spon de co m pletar.
El m uestreo po r cu otas es u n modo de muestreo estrat ificado e n el q ue la
xct n de eleme ntos q ue componen los estratos no es aleato rio. Si el ent reviso r fue ra un d ispo sitivo rigurosam ent e aleato rio, el m uestreo po r cuotas sera
lla go al muestreo estra tificado co n afijac n propo rcional.
Para lm itar el campo de o pc iones del entre vista dor se estab lecen co nt roles,
-do 1.1 va ma s usada el uso de variables que restringen la po sib ilid ad de libre
: cin del entrevistador. C abe se alar qu e el nmero de variables de cuota no
-dc ser ilim itado, pues hace in viable el cum plimie nto de las c uotas.
Su p ngase q ue se estab lece n c uot as co n las variables sex o, eda d y nivel soeconmico cada una con las siguientes altern ativas: S('XO en Jos categoras, edad
Idida en c uat ro tramos y nivel socioecon mico cod ificado en cinco grupos. La
-uctura de cuotas est ablecida ge nera una m uestra con 2x4x 5 =40 modalidades
cuo ta di fere ntes. Se comprende que la inclusin sucesiv a de variables facilit a
c presc nte nvi dad de la mues tr a pe ro difi culta la selecci n de los elem ent os
a cada una de las m od alid ades definidas. No rmalmente no se ut ilizan m as de
; variables para establecer las cuo tas.
En principio las variabl es de cuota de ben estar relacionadas COIl el objeto
estudio, sin em ba rgo, es habitual generar cuotas seg n se xo y edad, y evcn [ment e nivel soc toecon mco. Las dos pri meras pu eden se r utilizadas co mo
Iables de clas ificaci n y el nivel socoeconmico suele di scrim inar respecto a
niones y co nsumo.
l'ara ilustrar el procedim ient o se presenta ra un eje-mplo. En prime r term ino
iefincn Lis variables de c uota. No rmalmente variables con d istribucin coid a segn fuentes sec undunas. Por ejempl o, 5/' XO y edad disponibles como
o ce nsal a nivel com un al. Cono cida la informaci n a nivel de la poblucon se
rblcce un a d istri bu cin e n la m uestra pro por cion a] a los valor es de las celdas
a poblaci n. Las Tabl as siguie ntes info rm an co n datos fict icios la dist ribuci n
a poblaci n yen la m uestra.

188

Tabla 13.- Distribucin en la poblacin. N = 1,000.000


~"(O-

E.a.f

Hombres

Mujo:rn

r",,1

1524
2539
4054

1SO.OOO
ISO.OOO
105,000

130.(0)
]SO.OO)

330.(00

115.COO

220.000

55 Ymis

SO.OOO

90.000

170.000

Tot,!

51S-Cll'Xl

485.000

1000.000

280.00)

Tabla 14. Distribucin en la muestra. n = 1.000


Sexo-Edad
1524

Hombres

M \lj,'rr~

150

2539

ISO

130
150

<0-,.

10;

55 ym~

80

11 5
90

Tob!

SI>

" 5

Total

2SO
3JO

220
170
1.000

l.a vida ense a qu e a cada en trevistador no se le debe asignar una cuo ta grande
de elem en tos. Si est e no ope ra aleatoria mente generar sesgo en la m ues t ra. Las
cuo ta s se form an proporcionales a la distribuci n de las variables en la muestra.
La Tabla 15 presenta los ele mentos quc co rresponde n a un entrevistador.
Tabla 15.- Cu otas asignadas a un e nt revistado r. n = 50
Sexo-Edad

H"mb r~

Mujrre-s

Total

1524
25)9

13

40.54

SSYmi..

Tut,l

11

5
5

11

"

26

9
50

En la pract ica de los estudios de o pinin e invest igacin de mer cado s se ha extend ido el uso de un diseo muestr a] q ue co mbin a procedi m ien tos probabilsticos
co n selecci n m edi ante cuo tas.
Cabe destaca r dos lim itacio nes pro pias del diseo de cuotas.A sabe r, tem a de
las no respuesta y c umplim iento falaz de las cuotas asignadas. En efec to, el diseo
de cuotas no considera el proble m a de la no respuesta . Las cuot as se co m plet an
sin conside rar a los elem entos q ue no respond en, po rq ue est e n b lgica del
procedimie nto qu e est os sea n rem pla zados por otros cualquiera q ue cum plan con
las co ndic ion es exigidas po r la cuota. En con secuen cia est n subreprese nt ados
los elem entos que no son fciles de co ntacta r o ret icen tes a contes tar.

189

P""r otra part e, el cu m plimie nto de las cuotas no asegu ra la represen taci n de
p....olaci n. A saber, se pueden completar cuotas for ma lm ent e co rrectas pero
~1 ente inadecuadas. Po r ejemplo, se establece para la var iab le edad u na Cuota
" -eut a aos y ms, y se entrevista slo a personas prximas a sesenta aos,
L('ti,m do subrepresentadas 13<; p... rsonas mayores de setenta. Desde el punto
.4 del pr oced imien to se ha cumplido; sin embargo, la cuota generada dara
~~ 1. sesgo.. e n la infe rencia.
e.abe destacar que el m uestreo po r cuotas puede ser el nico p rocedimiento
! ccc n cua ndo no se dispo ne de un m arco apropiado p ara ge nerar una se:q" n p robabili stica de elementos. Ntese que para su ap licacin no se precisa
m arco muesrral.
: m uestr eo por cuotas e~ u na especie de m uestreo estratificado no p robab hs( ' " los en tre vistadores se transfor man e n un dispositivo alea torio en la seleccin
I~ r-cota asignada result a un p rocedi miento pot encialmente represent ativo.
\

) tJ .

cada e ntrevistador seleccion a segn una co nvenci n las vivi.. ndas que componen
la muestra . El entre...istador es un disposi tivo aleato rio y 1J. seleccin de viviendas
es al aza r. Sin embargo no es probabtltsnco porque normalmente no to das las
viviendas tienen la misma probabilidad de se r parte de la muestra. En particular,
cuando no se efect a un empadr on am iento previo d... la rut a a reali zar.
En este contexto se suel e distinguir en el mb ito del muestreo po r etapas
entre muestreo serniprobabilistico superior e inferior. El m uestreo sem iprobabil stco superior se caracteriza por que s.". conoce la probabilidad de selecci n d e
un con glomerado de la poblacin pero no de un eleme nto de ntro del conglomerado, y e l muestreo scmprobabsnco inferior se produce cua ndo se conoce
la probabilidad de seleccin de un ele-mento dent ro de un co nglo merado pero
no la prob abilidad de selecc in de ste. Un muest reo probabilistico debe se r
s i muhan ~~mentt:' semiprobab tlistico superio r e infe rior.

20.3 . Otros diseos no probab ilsticos


Mu estreo cuasiprobabilstico
20 .3.1. M uestreo errrco

ues treos cu asp robahls ttc os son procedim ien tos de seleccin qu e incluyen
,t' -ccin pr obabilsti ca y no pr obabilstic a en form a simult nea. En virt ud que
prcbabihd ad de seleccin de cada demento no ('S co nocida, resulta Inviable
c. culo de los errores de mues t reo y la infe ren cia a la po b lacin or igen de la
j~ ' ra. En su ve rsin m as so fistica da se le suele denomi nar mu estreo proba -uc o de cuotas o alguna varian te que incluya el t rmin o probabilstico. Se
~~J_ltan a co ntinuacin muestreos cuasprobabhstcos.
,<1.

20.3.2 . M uestreo opinnco

\
l."

La caracte rstica de este procedim iento es la se ncillez. Con sist e en la selecci n


de una pa rte de la poblaci n sin la aplicaci n de ningn cr iterio. Res ulta un
procedimien to posible cuando se sabe q ue en la poblaci n los at ributos a m edir
se distri buyen de modo uniforme o cuando sta es homognea respecto a las
mediciones a realizar.

l . Muestreo alearorio por cuoras

~ dimicnro de muestreo mixto frecu e nte e n los estu dio s de opinin y de-r- udo. Se caracteriza por la selecc in aleatoria de- las unidad es primeras de
",_.,(.feo y la selecc in por cuotas de las unida des ltimas q ue norm almen te
}' rd adanos o co nsum idores. Una c uota es un con jun to de e ntrev istados q ue
l h rm J.n grupos excluyente s segn sus valores en las variables de clasihcaci n.
i, tlOr eje m plo, se seleccio nan aleato riam ente distr itos ce nsales y e n cada ds.elccc io nado se elige n al azar m anzan as y, por ltimo, e n cada m anzan a se
e-v-tonan person as seg n una hoja de cuot as.
....11 rigor, no corresponde utili zar los procedi mient os de inferencia, sin eml ,d(' modo im propi o se su ele inferir a la pob laci n me diant e intervalo dI:'
lC ~n za .

.<... .2. Muestreo de nlt(lS aleatorias


procedimie nto de ru t as ale at orias se caracte riza po r la seleccin d e vivien das
un tr ayec to azaroso esta blecid o pa ra cada entr evist ador. En el recorr ido

La seleccin de los elementos SI:" realiza en fu ncin del juicio que respec t o a
la obtencin de un a muestra tiene q uien disea la muestra. El fundame nto de
selecc in es subje tivo y result a adec uado si quien define la selecci n dispo ne
de criterios que le pe rmitan reprod ucir la poblacin e n la muestra . C uando la
poblacin es pequea y los elementos se pued en ordenar segn un criterio o son
fcilme nte d istinguibles los result ados p ueden ser sat isfactorios.

Captulo 21

Funciones de costo

El diseo muestra] ti ene como prop sito maxi miza r la prec isin de la estimacin
minimizando el cos to asoc iado al muest reo. El te ma de la preci si n d ice relaci n
co n la co nst ruccin de int ervalos de co nfianza. El costo es una res triccin que se
trata mediant e el establec imie nto de funcion es de costo.
No ex iste una expresin m atemtica que sea funcin de costo ptimo a todo
evento. sta debera conside rar tod os los e rnes q ue inciden en maxim izar la
precisin y m in imi za r el costo para cada estrateg ia de diseo. Una solucin prac tica es esta blecer una expresin gene ral qu e conside re el facto r costo y permita
su uso en t odas las estrateg ias muestr ales pos ibles.
La fun cin el abo rada po r Kish ( 19 72) pa ra estos efec tos consider a qu e el
cos to total es fun cin de cu atro componentes. Cada diseo muestral se comporta
de m odo distinto en los componentes establecidos. Se trata en consecuencia de
asignar para cada co mponente los valor es que se estimen segu n el diseo utilizado.
La funcin para el costo total T se pr esenta a co ntinuaci n.

K incluye factores de costo co nst ante. Se trata de insumas q ue no vartan seg n el


tama o de la m uestra o tipo de disee. Por ejemplo, co nstr ucci n del instrumento
de m edda , elaboracin del plan de anlisis de da tos, realizacin del procesamiento
de la inform acin, impresin de inform es y resul ta dos.
Kd conside ra factores de cost o que se ve n influidos po r el t ipo de diseo
y qu e son ind ependientes del tama o de la muestra . Cabe se alar clc ulo del
intervalo de confi anz a, c lcul o dl' coeficientes de ponderacin y de expansin,
adiest ramien to de encuestad ores.
nIncluye factores que varan e n form a p rop or cional al tamao de la muestra
y q u~ son invariantes al tipo de diseo. En particu lar, codificacin y digitacio
de la in formacin.
n,~ contiene factores que varan segun el tam ao ele la mu estra y tambi nsegun el
tipo de diseo. Por ejemplo, ob te ncin del marco mucstrul, gastos en viticos para viajes
La funci n de Kish, pe se a su esq ue matis m o, req uie re de suposiciones pa r:!
aquellos te m cs incluidos en los cu atro co m po ne nte s de los qu e no se dispon e
de informaci n exa cta. En la prct ica habr q lle asignar a alguno de los cuat ro
componente s todos los tre mes que co m po ngan la e ncuesta po r m uest reo.

193

f ' mi funcin alternativa considera slo tr es fact ores . Perm it e en forma rpi da
c.eccr el pres up uesto aproxi m ado de un a e ncuesta por muestreo. Desde
erspecuva, la fu ncin para el costo to tal T esta definida en los siguientes

Capitulo 22

Tasa de no respuesta

\o.~

= horas hom br e de trabao " salario por hora .. gast os


-rmino gastos se desagrega en gastos fijos y variables sigu iendo c riterio s an _ a los propuestos po r Kish .

mo delo de cos tos es un a simplificaci n de la re alid ad que pe rmite estaer co mp araciones ent re d ise os y optar por el dise o ms apropi ado. Presenta
~ ventaja la sencillez y un iversalidad d e su ap licaci n, sin embargo, resu lta
na ap ro ximacin al costo rea l de la en cuesta .
:-.ra rr nar el terna cos to y pr ec isin se han elaborado procedi mientos espeos par J. d iseos estratificad os y de co nglomerados. En efec to, para optim izar
uilo de la muestr a dos alternati vas se prese nt an en rela cin con ('1 costo.
al.lecc mediante m ult iplicador es de Lagrange un cost o fijo y se calcula el
de n co n la condic in de que la varianza sea minirna o, p or el co nt rario, se
e ne la varianz a co nstante y se c alcula el valor de ti co n la restr icci n de
mnimo.
.' obtencin de un mini mo condicionado es una buena solucin mntern ti ca,
rbargo, pr esen ta la desventaja que rara vez se d ispo ne de in formacin pa ra
tir Sil uso rea l y prct ico.
'na funci n general per m ite un a ap ro xim ac i n til al t em a del costo, a fin
Ina r un a decisin m s informada respecto al d iseo apropiad o.
. . '1

La no respuest a a una pa rte o todo el cuestionar io utilizado como instrumento


de m ed ida es un problema ine vitable en la e nc ues ta por m ues treo. Pro blem a que
debe ser t ratado ap ropiadamente pa ra no ge ne rar sesgos e n los resultados.
Para ejemplificar el sesgo de no resp uest a supngase la poblacin d ividida
en dos grupos excl uyentes. Un grupo q ue responder las preguntas fo rmuladas
y otro que no lo har . Su p ngase que el pro psito de la investigacin es estimar
el par m etro pobla con al. En particu lar, estima r la m edia de la poblacin . Considerando ambos grupos, la expresi n de la media es la siguiente.

x = W)( .. W....X~,

(22 . 1)

A sabe r, una co mbinacin lineal de los pesos por las respectiv as medias. Siendo
\V el peso o proporcin de cad a gru po y los sub ndices a la d istincin responden
y no respo nden.
El sesgo d e no respuesta se produce si ~l' ut iliza s lo la m ed ia de los rcspo ndentes pa ra estimar el parm et ro pobl acio nal. En el entendido qu e el ~w ( fi l de
grupo que no respon de es difere nte al de los q ue si respond e n. En con sec uencia,
el mod. , de re alizar u na buena estimacin de l parmetro es haciendo peque o el
peso de los que no responden . Es decir, dismi nuyen do la tasa de no respuesta.
Las no respuestas son los cu estionarios en blanco. Si hubiera que establecer
el or igen de las no respuestas cabria mencionar los siguientes asp ectos.
(AU) = Ausencia del sujeto seleccion ado, ya sea por cambio de di reccin , viaje u
ot ra razn que se p rolonga m s all del pe rodo de trabajo de campo.
( R) = Rech azo a resp onder por prejuicios respecto a las encuestas.
(1)
Im posibilidad pa ra co ntestar por an alfabe tismo o enfermedad inca pacita nte.
[N'C] = N o co ntacto p or vis itar al entrevistado fuera del horario de cs tac]a en
su domicilio.

La t asa de no respuesta corresponde al coci ente fo rm ado por nmero de cuestionarios no respon didos respecto a n m ero de elementos selecctonados para
for mar la m ues tra. Ut iliza ndo la no mencl atu ra del prrafo an te rior, el coc iente
se expresa en los siguie nte term ina s.

(AU + R+ 1 + N.5;L]
rNR =o 1 - (AV + R + 1 + NC + E)

(22.2)

~ = E l t: me n tos efecti\"amt'nte entrevistados..

/ alores de TNR cer canos a 1 indica Que el sesgo por no respuesta es peque~o.
-10 hay un valor convencional a partir del cual se conside re la no respuesta In -

dmsble.

Azorin (1 974) presenta U 1I cociente de no respuesta q~le relacio na as resruestas y no respuestas producidas por los elementos elegidos para componer
a muestra.

CNR

(nmero de no res r uesus)2


nm ero de e nt rev istas intent adas

: oc h ran et al. ( 195 4) uti lizan este coeficiente para evaluar el tamao aproria~o
le la m uestra. El valor de CNR debe ser peq ueo, para asu mir q ue el t arnano
le la muestra es satis facto rio
Los diferentes com pone ntes que forman la t asa de no respuesta pe rmite.con:luir que no hay un factor pr~ponder:mte. Mas b ien confluyen de modo an~logo
hversos fact ores explicativos. Mosc r (1965) presenta un a Tab la q u:, COSC O? \Ias
uent es de no resp uesta e n dos encuestas realizadas e n G ran Bret aa. L3 1 a ila
-s la sigui ente:
Tabla 16 Fuente de no respuesta en dos encuestas probabiltsricas
E IKUM-U

de mncaJo
~

EnC\K'SU social
~

lllvi.ble p. n ... ntr.....i.ltar

\,7

1,7

Rechazos

6,2

2,'

Fuera de casa

2,_

2,0

\,6

3,9

t.!iKel.ine<J

O,,

O,S

Total

12:,3

10,9

A\ll;~nt e en hora

de visita

:.os datos de la Tabla deben co nsiderarse slo com o una referencia. La .tas~ ~e
10 respuesta depende de modo importante de la nat urale za de ~a ,tnvt'stIgaClon
'\s por ejemplo un estudio di rigido a profesores co n el propostto de tndegor
, to a sus aspir
' . aciones
.
..
, en dra
que
-cspec
econonucas
ra meno
'-" r t asa
.' de no. respuesta
.
..
.ma encuesta enfocada a dueas de casa p ara conocer hbitos tele visivos.Tamb len
t: rnaci n Las encuestas
cond iciona la no respuesta el me d10 d e recogrid a dce mtor
.

196

postales y va co rreo electr nico present an una alta t asa de no respuesta . Sin
e mb argo, las en cuestas telefnicas tienen tasas de no resp uesta solo algo menores
qu e las realizadas cara a cara.
La experiencia p erm ite establecer el perfil de los mas reti centes a participar
en enc uestas, Es t il como expresin de te ndenci as po rqu e e xiste n dife rencias
segn tipo de encuesta. En partic ular, los siguientes rasgos caracterizan a los
generadores de no respuesta : soc loeco n mico alto, adulto mayor, nivel cultural
bajo, hombres, nivel de urbani zacin alto, hogares de pocos miembros.
Estudios realizado s en Gran Breta a po r D urbin y Stu art ( 195 1), co n el
pro psito de de tec t ar diferencias e n tasa de no respuesta segn experiencia del
entrevistador, per miti establecer importantes diferencias. En efecto, para un
m ismo estudio e ncuest ado res profesionales y circunstanciales obtienen rechazos
de 4 y 13 po r cie nto, respect ivam ente.
Una prc tica ha bitual para dism inuir la tas a de no respuesta son las visita s
sucesivas.Se asume como un est ndar qce es necesario realizar tres visitas antes de
asumir el caso com o no respuest a. Investigacio nes realizadas por Edwards ( 1963)
evide~cian un aume nto significa tivo de respuesta s cuando se realiza un a segu nda
visita y un c rec imien to cua ndo despu s de la segund a se realiza una tercera visita .
Sin e mbargo, visitas pos te riores -cua rta, quinta- generan un aumento m argina l
de respuestas, por lo qu e en la practica no se justifica su realizacin.
El primer paso e n el t ratamiento de las no respuestas es co nt arlas y clasficarlas en categoras excluyentes. Dimens ionar el t ama o de la no respuesta es
una primera aproximacin respecto a su eventual sesgo. La clasificaci n de la
no respuesta permite distingu ir los rechazos de las ausencia... de domicilio. Est ablecida la naturaleza de la no respuesta cabe plant earse proced im ientos que
sirvan p ara paliar el sesgo generado por no resp uesta . La gam a de alterna tivas
ut ilizadas es am plia.
Los sesgos de no respuesta han recibido un tratamiento porrnenor ixado, a
fin de conocer sus causas, controlar su incidencia }' red ucir su ocurrencia . Para
estos efectos se han p ropues to diversas o pcion es: mejo rar ru tinas, ejec uta~ sultm ues treos, efect uar sustituciones o realizar ree m plazos.
El procedimiento m s evidente es mejorar las ruti nas. No e xiste una receta
general, dada la naturaleza ni ca de cada encuesta. Sin embargo, se pueden
o pti mizar resu ltados asegurando el anonim ato del e ntrev ist ado, indic ando la
insti tucin respo nsable del estudio, acudiendo a los domicilios en las ho ras ade cua das, explicando cmo se seleccion el domicilio, se alando el propsito del
estudio o entrega ndo un regalo por cooperaci n.
La sustituciou del en trevista do es un a pr ctica com n que no controla el
sesgo po r \l O repuest a, Respecto a la no resp uesta la sustitucin es una opcin
simpl e e intil . Ntese que los seleccionados como sustitutos tien en un perfi l
ma s parecido a los qu e s han respondido qu e a aquellos qu e no lo han hec ho,
La sustitucin no impide el sesgo generado por no respuesta. Simplemente
elim ina las no respuestas. En consecuencia no evala p robable diferencia existente
entre aqu ellos que s responden y quien es no lo hacen .

19 7

Sim ilar proceso a la sustituci n es de finir un ta m ao de m uest ra abultado,


l . . d o que absorba las eventuales no respuest as y pe rmita acceder al t amao
\ cstra predefinido.
t\~, po r ejemplo, un a muestra inicialmente estimada en 1.1 11 casos puede
lw.St' a un a muestr a defin itiva de 1.46 1 casos. Dos supuestos a priori : 95%
: con co ndicin para ser entrevist ado -5% de no elegibles por deficiencia
r- vrco- y 80% ta sa de respuesta espe rada -20% de elegibles no respo nde n.
tu mula de ajuste de la mu estra se presenta a co nti nuacin .
n

(223)

~-=
1

ta m ao de mues tra ajustado


= tamao de muestra o riginal

-" proporcin de elegibles en e l m arco ruucstral


proporcin de respuesta esperada

ilazando:

1.111

(22.4)

= 0,95 ' 0,8 = 1.461

unen to del tamao de la muestra es una soluci n de uso comn en el tr atade la no respuesta. Resulta de fcil aplicaci n. sin e mba rgo, es de dudosa
' ' 1 . La no respu esta es un problema ma yor qu e puede da r o rigen a im por: sesgo en la muest ra. En part icular, cuando las no respuest as responde n a
ron ide ntificable.
' l YN eficacia para el tratamie nt o de las no respues tas es el procedimi ento
no ut acio nes. Se im puta un valor c uando se realiza una predicci n razonada
.0( ausente. Para predecir e l valor omitido se utili za info rm acin secundaparticul ar se detectan variables co rrel acion adas co n la variable del valor
ido y se infiere el valor m s probable para el valor ausente.
nhicn es eficaz ponderar de dis tinto m odo las res puest as recogidas. En
se es tablecen los rasgos de los no respo nden tes y se asigna m s peso a
restas de sujetos de ca racte rstic as parecidas a los no respon dcm es. Ent re los
,--,i mk ntos de ponderac in de uso co m n cabe desta car los sustentados en
abtldad de respuesta y en la distribu c in de la poblacin .
" S correcciones qu e se sustentan en la probabilidad de las respuestas fueron
.olladas po r Hartl ey (19 56) y suge ridas por Polit z y Simmons ( 194 9) . Cocomo el mtodo Politz-Sim m ons, se utiliza para tr ata r el sesgo produ cido
'.~ no contactos. La probabilidad de resp uesta se mide seg n la disponibilidad
) e nt revistados a ser ent revistad os. La resp uesta y no respuest a se e nt iende es
) de la di sponibilidad a responder el cuestionario. Para eval uar la disponiI

.no

bldad ~e. ~st ab lece p ~ra cad~ e nt revista do el n mero de das de pe rtnancnc ., en
su domicilio e n los dios pre vios a la VISIt a realizada para aplica r el cuest ion ario
Para cada entre vistad o se calcu la un coeficie nte de dispon ibilidad. Este valor depende de cuantos das pr evios a la e ntrevista se e ncontraba el elem ento
~1~ciollaJo en su domicilio. El coeficiente permite ponderar las respuestas
en funci n de la disponibilidad de los sujetos. As, por ejemplo. los sujetos que
no pe rmanecan en su do micil io los d as previos a la visita se co nsideran poco
dispon ibles y reciben alt a po nd eracin y, por el co ntrario, los suje tos que pe rm anectan todos los dia s rec iben baja ponderacin. Se asu me q ue los sujetos poco
dispo nibles t ienen un pe rfil sim ilar a los no respon den tes

Capitulo 23

Efecto de diseo

Se calcula el efecto de di seo para evaluar la prec isin respec to a muestr eo aleatorio simple. Se utiliza co mo patrn de referencia el muestreo aleatorio simple
pOHlue es un m ues treo m o noe t pico y equi pro bable do nd e el azar o pera sin
rest ricciones.
En general en muestreo por conglome rado - mo noe tpico o poli et pico-la
varianz a de la estimacin es m ayor q ue la obtenida para el mismo numero de
casos en muest reo aleatorio simple. En m uestreo por conglomerado mon oet pico
se ge nera cierta homogeneidad dentro de cada conglomerado y en mu estr eos
complejos pol ietpicos cada etapa gene ra un sesgo agregado, dado q ue se seleccionan slo algunos elementos de la eta pa an teri or.
El efecto de dise o se obtiene comparando la varianza de la estim aci n del
d ise o en uso - est rau ficado o por cong lo merados- respe cto a la varianza de la
estimacin del m uestr eo alea torio simple,
l .a frmula del efec to de diseo co rrespo nde al coci en te entre la var ianza del
esti m ador del diseo a test ear respecto a la varianza del diseo aleato rio sim ple. El
efecto de di se o norm almente sera mayor que 1 en muestreo po r co nglo me rado
y menor q ue I e n muestreo estratificado.
El muestreo est rat ificado es un di seo rnonoet pico do nde el azar opera restr ingido, Normal mente la varian za del estimador sera me nor a la del muestreo
alea to rio simple.
Para ejem plificar la uti lizacin del efecto de diseo se acudir a un eje m plo
numr ico.
Tahla 17. Efecto de dise o

V~rianl~

Varimu delestimador '" 36

del estum dor .. 14

El efecto de diseo asoci ado a estos valores corres po nde al siguien te guarismo :

36- = 1 5
d,fj =-24
.

(23. 1)

20 1

)eff es acrni m o de design effect. Se interpreta qu e hay 50% de au mento de la


" .an za del estim ador en el di se o por etap as respecto al aleat or io simple.
Un uso co m pleme nta rio al clculo del efect o de diseo es el calculo del ta o
f!"o de [a muestra propio al diseo aleatorio simple mante nien do co nst ante el
~ .Ir m ximo adm isible y nivel de co nfianza Supngase una muestr a po r cong lot -ados de 1.600 C hOS. El ta mao co rrespo ndiente a muestr eo alea torio sim ple
(" lis paribus es 1,067. Para estos efec tos se rea liza el siguiente coci ente:
(

n
.\lAS

=~ == 1.600 o: I 067
deff

1,5

Capitulo 24

Error absoluto y e rror relativo

(23.2)

I
( .hfcrenca de 1.600 respec to a 1.06 7 se explica por la naturaleza de am bos
; " :00 5. El mu est reo aleatorio simpl e req uier e de menos e lem entos porque la
a rianz n del estim ador es m enor.
Ca lcular el efecto de dise-o no es siemp re po sible. Los valo res req uerid os
( 1 su calculo a m enudo no es tn dispon blcs . En la practica se util iza un rango
e- fluct uacin q ue dicta la e xpe riencia. Valores entre 1,5 Y3 result an apropiados
( .1 la ma yora de los casos. En part icular, el valor sera cerc ano a 1,5 cuando se
( (m e qu e los conglomerados est n co nstitu idos por ele me ntos heterog neos
[1 las variabl es principales de investigacin y, por el co ntrario, se asu m e un valo r
\ . xtmo a 3 cuando se conjetura que los conglome rados son homogneo s respecto
, ~' a riables en estudio. Es decir; se o pta por valores bajos cuando la varianza del
vr mador no es demasiado d ife ren te a la varianza obtenida medi ante mu estreo
~ " torio sim ple y se eligen valores altos cuando la varianza serta superio r a la
( co rrespo ndera co n seleccin aleatoria sim ple.
C abe se alar q ue ambos d iseos m uestra les ser ian igual de precisos si los
)"glomerados fueran ta n heter og neos co mo una seleccin aleatoria sim ple.
El coefic iente de correlacin rho (p) se util iza para medir la correlaci n e nt re
r- -lementos de los distintos co nglome rados. Si el valo r del coeficien te es igual a
Implica qu e no hay co rrelaci n entre los e le men tos de los co nglo me rados. En
, -ec uencia, un valor O significa q ue stos presen tan una dist ribucin anloga .1 la
, -rada medi ante selecci n aleatoria sim ple. Por tanto la varia nza del estim ado r
ra la m ism a y la precisi n de la es ti maci n igual en ambos diseos.

El erro r en la estimaci n pued e entende rse en t rm inos relativos. El error relat ivo
es ad imensional y puede ex presarse en trm inos de po rce ntaje de e l ro r, Resulta
de ms fcil inte rpretac i n y permite la com paraci n de errores en m uestr as
cuyas variables t iene n distint as unid ades de me d ida.
La ventaja de leer el error en t rmi nos de po rcentaje es evidente. Permi te
definir que erro res relativos de m uestr eo superio res a 10% son excesivos.Trtese
de medias o proporciones.
La frmul a del err or relat ivo anu la la uni dad de me dida al p resen ta r el err o r
mximo ad m isible ponderado po r la m edi a o proporcin respectiva . En general, (1
er ror relati vo se obtiene co mo Inform aci n ane xa al calc ulo de! error absoluto
Se presenta a continuac in e l e rro r relativo de m ed ias y p ro po rciones.
_.J'
Error re lat
anv o m eora

Error absol uto


Media

= - ~--

Error relati vo pro po rcin = Err_o r ab_~l.uto


Proporci n
D onde e rro r absol uto es el erro r mximo adm isible en la estimacin de Id m ed ia
o pro porcin.
A m odo de eje m plo se establecer una Tab la co n e rro res absolutos y relativ os
de pro porci ones Se define n dos ta m aos de muestra y dos valo res del estadstico
muestral
Tabla Il:). Error absolu to y er ror relativo
b lilJ i'l ico

,, ~2S0

" ,,250

" " 400Cl

1I,,4.CXX)

Muesrral p

Error ~h<ol " to

Error rd Jtivo

Error absoluto

Error relativo

0,1

0,0037

0,37 37%

O,CX.19

0,090 9"

0,001

0,15 15%

0,015

0,04 4%

0,9
0,4
0,6

Se verific a que una muest ra de 250 elem en tos presenta errores relativos de
restrco muy ele vados. En ambos casos superiores a 10%, Un a,mue-stra de 4JX)()
'mentas p ara los mismos est adst icos genera errores re lau,vos ?e muestreo
eriorcs al valor conven cio nal 10%. Co mo e ra de esp erar, esnmacroncs m uc ho
is precisas que las obtenidas c on una muestra 16 veces m enor.

C apitulo 2 5

Pon deracin y eleva cin

La pon dera ci n y elevacin de la muestra son proce dimi e nt os ut iliz ados pa ra


resol ve r dos problemas que se prese ntan en cier tas c o nd ici o nes. En efec to,
se ponde ra n m uestras no aut opondc-rad as, a fin de asignar a los e lemen tos
pesos en la mue st ra co ncordantes con los pe sos de s to s en la pohlaci n. Por
o t ra parte, se e levan muestras c uand o co noc ido el tamaio de la pob laci n
Se busca co nocer e l valor e n la poblacin d e los re su ltados o bte nidos e n la
mue st ra -se infie re m ed ian t e in te rvalos de confianza y se e leva mediant e
c oeficien tes d e elev aci n. La p onderaci n es u n pro cedimien to ms co m n
que la el e vaci n.
Ntese q ue las m uestras a utopo ndera das no requie re n de clcu lo de
coeficien tes de pon der acin porque e n st as se respeta el princip io de cqutp ro b abilidad en la sele cc i n de los ele mentos. L3 pro bab ilid ad de selecci n
de cada ele m e nt o es fun ci n de la fraccin de mue st reo. En la s m uestr as aut o ponde radas la fracci n d e muest re e es u n valor co ns t ante y e n las muestra s
no autoponderadas la fracci n de muest reo asum e distin t os valores
La m ues tra se despro po rc io na c uando se m anipula asig na ndo a los ele rnentos una impor ta nci a desigual resp ect o a la im po rt ancia que estos t ien e n
en la pob lacin . En p artic ular, se d ism inu ye el peso de los elementos con
m ayo r probabi lidad de selecci n y se aumenta el peso en aque llos con meno r
proba bilid ad de selecci n. En este contexto se pondera pa ra asignarle a cada
uno de los e lemen tos el pe so q ue corresponde segn su im po rt ancia e n la
p obl ac in .
C abe destaca r que se vio la el principio d e equprobabtldad e n diseos
rn uest rales est ratifica dos co n ahjac in no propo rc ional y en di seos de domin os donde aq uellos de menor tamao so n sobrer rcprescntados en desmedro
de los dominios de tamao mayor que son subrep resentados
En un d iseo c q oip rob ab lc o ac topondcrado el pe so a soci ad o <1 ,ad;]
ele m e nt o es ig\13 1 a l. Se po ndera cua ndo el p eso asociado a oda elemento
es inferior -subrepresentac t n- o superior -sobrcrrcprcscutactn- a l. El
pro psito es otorgar a cada demento de cada un o de los grupos m ucstralcs
e l pe so co rres pondient e a su incid e nci a <'JI la p o b laci n.

l.

Coeficiente de ponderacin

.cedi miento de ponderacin puede aplicarse respecto a elementos agregados


: '~'h.k"S mucstralcs colectivas como ciudades, comunas, zonas censales, ctc., y en

En general los resultados no


seg n se pondere n elementos agregados en colectivos o elemen tos ind iv... Para ilus tr ar el uso Je ponderado res se simula un eje mplo con d atos fict icios.
a Tabla prese nta da a continuacin e nse a informacin poblecio nal y m ues...:',rida :J dos reas de di stinto tamao. En e!1:J se evide nci a qu e el ta ma o
nuestra de cada rea no es proporcional al ta mao de cada una de stas e n
-tilaci n. En efecto, las muest ras son desproporcionadas respecto al tamao
..Ja rea de la poblacin.
'In con cada elemento qu e co m po ne la muestra.
:0

Tabla 19.1'obbcin y muestr a. Valores absolutos y porcentajes


r

,.

A(~.,

N pobbuoo~1

n muestt;1

\(~. Ch,C~

50.000

500

14.,....grande

4;0000

500

de ~t:\l.:: a r

.. pobbcirl

,,,,,
.,.

,,,,, I

muestf~
50%

q ue si se trata de inferir los result ados a cada rea en form a indo -

" -:ntt' ,],1 despro porcin entre poblacin y muest ra no incid e en la calidad
i n ~' -ren ca. Nat uralm ente la infe rencia a Area chic a ser m s precisa que a

.;r.lnde en virtud del mayor t am ao relativo de esa muestra.


cons ide racin de las dos reas en form a co njunta para inferir a la poblacin
." de la muestra requiere la combi nacin de resultados obtenidos en ambas
. En este contexto se im pone el calculo de ponderadores, a fin de devolver
uestra el peso diferencial q ue tienen am bas reas en la poblaci n. Ntese
as fracciones de mu est reo so n distintas en cad a una de las dos rea s.
,: h.m desarrollado diversos procedim ie ntos pa ra pon der ar. Se presenta a
.uaci n un coeficiente sencllode calcular e intuit ivo de com prender. El
<en t e de ponderacin se obtiene co mo cocien te del porcent aje de elem en tos
tb lacio n respec to al porcentaje de e leme ntos de la muestra . En particula r,
.~ rea s chica y grande los porcentajes de ponderacin son los sgu tentes.
Tabla 2U Coe ficientes de ponderacin
Arca

Coeficiente de ponderacin

Ar~~ chic~

10I50=O.Z

CO MPUT E PO ND ERA = 1.
lF (AREA EQ IjPONDERA = 0 .2.
IF (AREA EQ 2JI'ONDERA = L B.
W EIG HT BY PO ND ERA.
Acti vada la instr ucci n se oto rga a cada una de las reas de la muestra el peso que
le co rresponde segu n su ta m ao rela tivo en la po blacin orige n de la muestra. En
co nsec uencia, el clculo de la estimacin de l parmetro poblacional se rea liza.ra
a partir de un est adst ico que se ob tien e co nside rando los pesos dife rencales de
cada u na de las reas en la poblacin. Respec to a la tabul aci n conj unta de [a
informa cin, cabe dest acar que sta se efecta despu s de eje cutada la instrucci n de po nd eraci n.

25 .2. Coeficiente de elevac in


La e1~vacin se utiliza cua ndo se desea conocer el valor en la poblacin de un
resultado obtenido en la muestra. Asi, por ejemplo, sabido que 600 personas en
la muestra opinan S se elevan lo, datos para co ncluir q ue en la poblacin origen
de la muestra 800.000 pt' rsonas optan po r la altern ativa Si.
La fr m ula para el calc ulo de los coeficie ntes de elevacin es anloga seg un
se trate de m uest ra auto pon derad a o desproporc io nada.
En muestras desproporcionadas co n unidades de muestreo agregadas -cjemplo rea chi ca y rea grande- se obtiene un coeficiente para cada submuestra
y se procede e n cada una de ellas co mo si fue ra independiente una de la otra. El
mism o res ultado se obtiene multiplicando la suma tot al de elementos qu e e n la
m uestra presentan el atributo - por ejemplo, responder Si- por e l co rrespondie nte
coeficie nte de ele vaci n.
Para ilustrar el uso del coeficiente de elevaci n se presen ta en la siguiente Tabla
informacin referida a dos subm uestras. N tese que se conoce la respuesta a la
alternativa Si en cada sobmuestra y se q uie re conocer e l valor cor respo ndiente
a la opcin Si en la poblaci n origen de la muestra .
Tabla 21. Poblacin y muestra, Valores absolutos y porcentajes
r~a~

N poblacional

N mu~ual

ResponJ..n Si

rea chica

50,000

5W

60%

Ar~~ grande

450.000
500.000

5W
1 1)) )

'"

Total

9IVSO= 1,8

el pu nto de vista prctico, la po nderacin de la m uestra se realiza computa[mente. En el programa SPSS/PC versin Windows se po ndera co n la instru c,'1'iKhr. La sint axis co rrespondiente a este ejem plo se presenta a continuacin .

Se verifica qu e en r ea ch ica y Ar ea grande IJ. distribuci n de la opcin Si


es la siguie nte.

T abla 22 . Nmero d e entrevistas por re a


A rca

BlBLlOGRAFIA

chica

Nm e ro de resp u~t as

Si 0,6 5{)(}.:) OO entre vist ad os

eva la muestra para conocer el num ero de respuestas Si e n la poblacin de


una de las subrnuestras. Para estos efect os se m ultiplica el coefici ente de
cin de cada suhm uestr a por el valor de l total de personas que respo nden S
snb rnuesrra.
',lrJ Arca chica y Area grande el coeficiente de elevacin respectivo es elsiguiente.
T abla

23. Coeficien te de elevacin por rea

Area chica
Coc ficie ll!e de elevacin = l/n/N = N/n :: 50.000/500 = 100

Area gra nd e
CllE:ficif:nte de elt:vacin = I/nIN = Nln = 450_0001500 = 900

se q ue t'1coeficiente de ele vaci n es el inverso de la fraccin de muestr eo .


o r del coeficiente de elevaci n se interpreta como el nume ro de elementos
po blacin q ue rep resent a cada eleme nto de la mu estra.
ara obte ner el valor del atributo Si e n la poblacin origen de la mu estra se
de en los siguientes trminos.

AM OA_ Y SERV1~ L , In t rod u cci n ~1 Mut"<t reo. L1MUSA, M jico. 199 3.


Az OR1N F.. Cur-so d e M u estre o y Apl icac ion es, Agudar, Ma J rid . 1974 .
AZOR IN 1'. y SAN CHEZ,C ~ f.SPO J., M tod os }' Ap lic acio ne.> d el Muestr eo, Alianza, Madri d, 1986.

CAURIN R. y BRION P., Manual J" Muestreo, I.~ Muralla, M..drid, 2()111.
CooJRAN

\V., Tcmc as de M u~trt''O. CECSA. M o!j icu, 1995.

CocH~ \V., Rt'iariv A<X1<T<U)' ofS}<f<'r7Ulric .-.",1SfTan/fiI'J Rwuiom S","pk.- fur '1 ('.mai" C/as.. 01
PopI./mivns, Annals of Math e matic al Sraus acs . 17, 194 6

D ALfr-;IJS T " Sampliugin SwednJ. Almkvst and WikSt'll, St o<:kholm. 1957.


D EMli..;(; \V., Sorne T heo ry of Sam p ling, D o ver, Ne w Yo rk, 19 50 .

DVRBI" 1 y SllJ,Uf A_, Diffl'm.us i.. Rbpmts<-s Raus off & pnir>tcd ""J lnnpeoV>r.." lnfonvU-Wl'JT5.
Jcurnal of the Rop l Sta ti.stic~1 Society, 114. 195 1.
E Dw~R DS

F. , A spe'l:.fs 01R" ...lvm Sa...I'Plg IOT a CO"''''l'rrial Sllrtry Th.. ncorporated Stati,ticiaan.
4. 196 3

t 'ERNNOf Z

F. y

M AVO~ 1, M uestreo en Pobla cio nes Fillitas: Curro Bsico, EUB, Bar<:<:'!on a. I99S.

H ...." "EN M _, H uswrrz W_y MAI)O'WS \V.,


~('W York, 1953

S~mpl e

Sur..(')'5 Me th od and Theorj; Vol. 1 y 11. W ilcy.

1:I", Iffi.[Y H ., A RMew of Renf Sra fisriaJ fkwl<>r ......w in $ampliPlga ...1Stl",plml: SIItw)'$. Journa l

u f th... Royal Statisucal Society, 109, 19 56 .

Tabla 24 Valores rnuestra les exp and ido,

K ENDAl.L M. y B UC KJ.AM) W., Dic cion aro de htadi~ ti( ", Pirmide, M adrid , 19 7fi .

A rea chica
A rt!a grande

% S n > Nzn '" 0,6 * 500 100 = 30.000


% Si n N/n = 0, 44 500 ' 900 '" 19 8.000

cuc n computacional de la ele vacin de la m uestra se realiza mu lti plicando


fi cie nte de elevacin con cada elemento que compone la m uestr a. La sintaxis
nst rucc in del paquete SPSSf}'C+ para el eje mplo utilizado es Id siguiente.

l.EGUn

S_, lntroduce i"'n ~ l lI.luelitfC'O en Poblacio nes Finitas, Nu...V3S Estructura~. ~ladrid .I999 _

lI f.DAV"'T A. y SII<ItA B. . Design and lnferen ce in Fintte Pop ul atio ns Samplin g. Wiky. 1'\.w Y('lrk,
199 1.
Il Er-o RY G ,

Pracucal Sam plinl':. Sagc, California, 19 90

K"1'ON G , lntroduc to n to SUTVey Saml' lin,E:. Sage, C3 Iiforn i~, 19 83 .

KISH L., MU6 tr eo de En euestas, Trillas" M ~li co, 1972.


LOtu

So, Muestreo: l),,..- i'1Oy A n ilisis, Thom.<on, Mt'jico, 2eO:l.

MADOWS W. y MAI'lOWS 1.., lI rlre nl/~ory QISy...em<ltin Sa",p/iPlg Ann al, of II.hthenlati c.1 St .l'
ti' til's. 15, 19 44

8MPUTE EL EVA " 1.


(AREA EQ I ) ELEVA " 100 .
(AREA EQ 2) ELEVA " 900 .
E1GHT BY ELEVA.

M IRAs

Ida la inst ruccin se dispo ne de info rmacin amphada de los valores de


eswa a los valores correspond ientes a la poblaci n para toda s las variables
e radas en el estu dio.

20S

J., Elem ...ntcs de Muestreo pa ra Po bla ciones Finitas, INE, M adrid , 1985.

NEYM.,,:'oI 1 , Oa rheTWll ViII........' A 5pt$ 01rhe RepresmrtJfil~ Merlro.b. Joumal of the Royal Sta n stical Society. 9 7, 193"
Mosu C. A _, Sur.. ey Methods in Soct ellnvesnganon, H einern ann , London, 1965.
OS~INA

1'~ ~ f.Z

D., Introdu "",n al ~lu"strt'O, Universidad Nacicn ul d e C"lo",'i ~ . Bog ot . 2001

c., Tcnscas de Muestreo

Esra.hsnco, Alfao mq: a, Mcjil'o. 2000.

209

S;''''ON~

\V., AJ1 A lu ,..,!'r ft> ';~r r},.. ~nol a / hame" J11O 1M Sam ple 1I, ;hQll r C..libwIu.

f the Am eri.;:au Statist1Cal ,'Usoc ia ton, 44, 19 49.


, ' . de l Muest ree, Fondo Cultu ra Eco n rrnca, Mjico, 19 79 .

"1-

.. " Iing: MdhoJo:ogics: wit h apphc ations, Chal'man ti.. Hall, N_ York. 2{)(X)
J., Met ud os de Muestr eo, C !S. ~bdrid. 199 1.
( .>1'01., MuctTeO de PoblAciones Fmtas Aplicado al DiY-o de Encuo:-st:o.s" IN E. Mad rid,

t. Mf N()fNlI.\(l \V., Y OrT , L , Elem entos d.. Mu (";treo. ~l j1Co O. E, Grupo

Editorial

iria. 19 87.

"leona de Encue stas por Muest reo con Aplicaciones, Fondo C ultura Econmce,
~.

19 5(,_
. 'U IAr ME B. , SU~H Arr.lE S. y A SOK

-' ty

f' r".~,

c., Sarnphng Theory ofSurveys Applic ~tion s, lowa

lowa, 19 H4

Iccs treo par a IJ Invt"stilolalin e n Ciencia s de la Salud, D iH. de San tos, Mad rid , 19 9 3
_" pIid Sa m pling , Acaderuc

P r~'.I5,

N ('w York, 19 76.

y FIDn L L., U~ i n g :\l ultiv" riate Sta tistks, Harpl'r Co llins, Nt'w York. 1989.
...., T1,,,.,,ry of Samplc Su rveys, Londco, Chapma'l & Hall, l.andon, 19 9 7.

arnr ling M<'lhod s for Ce nsuses and Su rveys, Mc:\l i1lA n, Nc w York, ]9 ~1.

.
i-

También podría gustarte