Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Resumen terico
2. Mtodos de muestreo
3.2. El seccionado.
3.3. Estratificacin
1. RESUMEN TERICO
La teora del muestreo tiene como objetivo suministrar la metodologa que gue los problemas
de recogida de informacin. Aunque la prctica nunca es igual a los modelos tericos, estos
son indispensables como gua para establecer las condiciones adecuadas en la eleccin de
las unidades ltimas a encuestar. El muestreo es la herramienta para seleccionar la parte de la
poblacin cuya observacin permitir extender la informacin obtenida al conjunto de la
poblacin objetivo del estudio. Para que las conclusiones sobre la poblacin sean adecuadas
es necesario que la seleccin de las unidades se realice de tal manera que las unidades
escogidas sean lo ms representativa posible de la poblacin total y, para esto, es
fundamental planificar adecuadamente el mtodo usado para la seleccin.
El estudio que se desea realizar sobre la poblacin, se manifiesta travs de una serie de
caractersticas, desconocidas de antemano, que pueden ser de muy diversa naturaleza. Por
ejemplo, en la poblacin de alumnos matriculados en una universidad, una caracterstica
posible de estudio podra ser el nmero de cursos que cada uno lleva estudiando, al menos
matriculado, en la misma, contando con el actual. Esta sera una caracterstica
intrnsecamente cuantitativa numrica. Un alumno puede llevar matriculado un curso, dos
cursos, ocho cursos, etc. Otra caracterstica podra ser si disfruta no de algn tipo de beca
durante el presente curso. Esta sera una caracterstica de tipo cualitativo, S o NO,
intrnsicamente no numrica.
Una caracterstica cualquiera bajo estudio ser representada matemticamente por una
variable, Y, que llamaremos variable de estudio. Los valores que toma dicha variable sobre
las unidades poblacionales son desconocidos de antemano. Para denotarlos emplearemos la
siguiente notacin,
X = (x1,x2,...,xN )
siendo yi el valor de la variable de estudio para la unidad poblacional i. As, para el ejemplo
anterior, denotando por el nmero de cursos cada alumno lleva matriculado, si x567=4, esto
quiere decir que el alumno nmero 567 lleva matriculado en la universidad 4 cursos,
incluyendo el presente.
Para elegir las unidades que van a formar la muestra es necesario disponer de un conjunto
real de unidades que se ajuste lo mejor posible al conjunto que forma la poblacin objetivo. A
la lista de estas unidades a partir de las cuales es posible seleccionar la muestra la
denominaremos marco.
Tamao muestral: es el nmero de elementos que constituyen la muestra. Los elementos que
componen la muestra se seleccionarn de la poblacin generalmente de forma aleatoria, por
tanto una muestra de tamao n puede interpretarse como una variable aleatoria n-
dimensional cuya distribucin de probabilidad depender de la distribucin de probabilidad
F(X) de la poblacin y del tamao muestral n.
Llamamos espacio muestral al conjunto de todas las muestras posibles extradas por un
procedimiento de muestreo. Al procedimiento mediante el cual se extrae la muestra se
denomina muestreo.
Algunos de los estadsticos principales son: la media muestral, la varianza muestral, el total
muestral y la cuasivarianza muestral, la proporcin muestral, el mximo y mnimo de la
muestra. Un estadstico que se utiliza para estimar un parmetro desconocido de la poblacin
recibe el nombre de estimador.
El estimador media muestral que denotaremos normalmente como (en lugar de ) es:
y verifica:
Cualquier encuesta por muestreo tiene asociados una serie de errores que se pueden
clasificar en dos tipos: errores debidos al muestreo y errores ajenos al muestreo.
Al extraer la muestra, los datos obtenidos a partir de la muestra nos permiten inferir unos
valores aproximados de la poblacin total. A estos valores se les denomina estimaciones
estas estimaciones llevan unido un error, el error debido al muestreo. Cuanto menor sea
este error mayor es la precisin de las estimaciones.
Existe un procedimiento que permite obtener la muestra estableciendo a priori el error que
estamos dispuestos a tolerar, este hecho nos permitir afirmar con certeza que las
Este procedimiento consiste, en primer lugar, en elegir el estimador de forma que tenga la
mayor precisin posible, es decir, que se comporte de la misma forma que el parmetro
poblacional. Para esto es deseable que cumpla las propiedades de insesgadez y mnima
varianza.
Para controlar la precisin de un estimador hay que estudiar su error cuadrtico medio. As,
dado un parmetro poblacional, que denotaremos por , buscamos un estimador ~. Se define
el error cuadrtico medio de un estimador como:
A partir del ECM vamos a definir dos tipos de errores, el error de muestreo y el error de
muestreo relativo:
Existen procedimientos estadsticos que nos permiten establecer a priori el error de muestreo
que estaramos dispuestos a tolerar y elegir la muestra estableciendo este lmite. Esto nos
llevara a poder afirmar que las conclusiones que realicemos sobre la poblacin conllevaran
un alto grado de certeza.
Adems de los errores de muestreo existen otros tipos de error, los errores ajenos al
muestreo. Estos errores no se asocian al proceso de muestreo. Se dividen en dos grupos:
Hay ocasiones en que la seleccin de las unidades no es aleatoria, sino que la persona que
realiza la seleccin procura encontrar esa representatividad, aunque esta depende de su
intencin u opinin. Este tipo de muestreo, llamado muestreo intencional u opintico, aplicado
bajo condiciones correctas, puede dar resultados tiles, pero carece de base terica y, por
tanto, imposibilita el clculo de su error.
Otro tipo de muestreo muy utilizado en la prctica es el muestreo por cuotas: en una primera
etapa se descompone la poblacin en grupos de elementos (excluyentes y exhaustivos) con
caractersticas comunes definidas previamente. Cada grupo definido representar un
determinado porcentaje en la poblacin, dicho porcentaje es a lo que se acostumbra a
denominar cuota. La segunda etapa consiste en elegir una muestra que refleje exactamente
esa proporcin. Normalmente, las cuotas ms utilizadas son el sexo y la edad.
Hay que sealar que el muestreo probabilstico es el ms adecuado siempre que sea posible
utilizarlo, ya que sobre l hay una teora cientfica que permite elevar los resultados obtenidos
para la muestra al conjunto de la poblacin. Adems, en este tipo de muestreo se pueden
calcular errores de estimacin asociados a las estimaciones.
planeamiento se deben fijar cules son sus objetivos, qu informacin se necesita para
cumplirlos y de qu medios se dispone.
Se debe comenzar por establecer las necesidades a las que debe responder la encuesta,
normalmente estn son superiores a las posibilidades del estudio y por tanto, deben reducirse
estudiando si se pueden obtener de otros estudios. El paso fundamental es delimitar la
poblacin objeto de estudio y ver qu informacin se desea obtener, sta esta ligada a la
medida de un carcter cuantitativo o cualitativo y estos deben definirse perfectamente y de
forma sencilla. Adems se ha de establecer si la encuesta ser o no peridica, y en caso
afirmativo conservar el sistema de definiciones para posteriores encuestas.
Una encuesta por muestreo cuenta con una serie de limitaciones a tener en cuenta, entre esta
limitaciones estn lo medios econmicos y medios humanos y materiales disponibles.
Facilitar la labor de los entrevistados, evitando preguntas en las que tengan que
hacer algn trabajo de investigacin o reflexin
La longitud del cuestionario es una cuestin importante ya que se ha demostrado que a mayor
longitud menor fiabilidad en la respuesta, por tanto, se debe evitar incluir preguntas que no
sean necesarias. Los tipos de preguntas de un cuestionario se clasifican en dos: abiertas y
cerradas. Las preguntas abiertas son de respuesta libre y las cerradas tienen diferentes
opciones de respuesta y deben ser exhaustivas y excluyentes. Las primeras son ms difciles
de codificar que las segundas. Una vez delimitada la informacin que se pretende recoger
mediante el cuestionario, el tipo de preguntas, suele llevarse a cabo una prueba piloto
denominada pretest, con el fin de comprobar su funcionamiento. Hay ocasiones en las que es
necesario modificar algunas preguntas, modificar su enunciado,
2. Diseo de la muestra:
La recogida de datos debe hacerse dentro de un sistema coordinado para la gestin de los
mismos. A este sistema se le denomina genricamente Red de Campo, est formado por un
conjunto de personas que facilitan la recogida de informacin. La estructura de la red de
campo puede variar dependiendo del tipo de encuesta o del organismo que la realice, pero
bsicamente podemos sealar las siguientes:
4. Proceso de datos
La codificacin consiste en representar las posibles respuestas por un cdigo (un nmero)
para facilitar el tratamiento informtico. No debe ser ambigua y se deben codificar las
respuestas comunes a todas las preguntas con el mismo cdigo (Por ejemplo NS: 888, NC:
999).
Respecto a la depuracin es una fase del procesamiento de datos que se mezcla con la
anterior ya que muchas veces los codificadores detectan y corrigen errores antes de ser
grabados.
El anlisis de los resultados consiste en aplicar las tcnicas estadsticas posibles y necesarias
para poder extraer conclusiones fiables y significativas de los datos obtenidos. El anlisis ir
en funcin de los objetivos que se marquen.
La mera publicacin de los resultados de una encuesta, no informa sobre la complejidad de las
operaciones necesarias para llevarse a cabo. La descripcin de las operaciones que han sido
necesarias para llevarla a cabo es la nica forma de conocer la calidad de la encuesta y sus
estimaciones. Con este fin es necesario presentar dos tipos de informe, el informe tcnico y el
informe resumido.
El informe tcnico debe contener informacin detallada sobre fuente de datos, conceptos,
clasificaciones, metodologa, etc
Una vez seleccionado el individuo objeto de la entrevista, esta se podr realizar sobre diversos
mtodos.
Dentro de las entrevistas, una vez seleccionado el individuo objeto de la misma, esta se puede
realizar mediante diversos mtodos:
Introduccin
El muestreo aleatorio simple es el tipo de muestreo en el que se basan todos los dems tipos
de muestreo. Consiste en numerar las unidades de 1 a N (siendo N el tamao de la
poblacin), y extraer una serie de n nmeros aleatorios. Las unidades correspondientes a esos
nmeros sern las que formen parte de la muestra.
Estimadores
n
1
El estimador de la media poblacional es la media muestral, y =
n
y
i =1
i
s
El estimador del error estndar de la media es s y = 1 f
n
1 f
El estimador del error estndar de una proporcin es: s p = p(1 p)
n 1
Intervalos de confianza
alrededor de y en el cual el verdadero valor del parmetro poblacional y se situar con una
probabilidad 1-.
Para calcular el intervalo de confianza hace falta tener en cuenta la distribucin muestral del
estimador. En el caso de la media muestral, el teorema central del lmite nos permite utilizar
t s y
La expresin se denomina habitualmente nivel de error de la estimacin, y es la que
suele aparecer en las fichas tcnicas de las encuestas.
Esta aproximacin no es buena cuando las muestras son pequeas y las distribuciones son
muy asimtricas, por lo que en estas circunstancias debe buscarse otras tcnicas de clculo
de intervalos de confianza.
El intervalo de confianza para una proporcin p al nivel de confianza (1- ) se calcula de forma
p t s p
similar, siendo la aproximacin normal .
Cuando la proporcin es muy desigual por ejemplo, mayor que 0,7 o menor que 0,3, estamos
ante un caso claro de distribucin muy asimtrica, por lo que en este caso solo se recomienda
utilizar esta aproximacin con muestras muy grandes (al menos mayores que 1.000), ya que
de lo contrario el sesgo puede ser muy importante.
t = 1,96 , y
El nivel de confianza ms utilizado en las ciencias sociales es el 95%, resultando
p 1,96 s p
quedando la expresin
Tamao de la muestra
Cuando se realiza un muestreo habitualmente surge la cuestin de cual debe ser el tamao de
la muestra que se va a realizar. Para ello es necesario saber qu precisin necesitamos, y con
qu probabilidad queremos que nuestro estimador est dentro del intervalo de confianza que
se obtenga con esa precisin.
t2 S 2
n=
estimacin de la media muestral en poblaciones grandes es 2 .
t2 p (1 p )
n=
En el caso de una proporcin la expresin sera 2 .
Algunos de los tamaos muestrales que se deducen de esta expresin para el nivel de
confianza del 95% son los siguientes.
1% 9.604
2% 2.401
3% 1.067
4% 600
5% 384
Introduccin
Sirve cuando se quiere obtener una precisin distinta para cada subpoblacin. De esta
forma se puede controlar qu muestra pertenece a cada estrato, y as controlar su
precisin.
Si los estratos que se utilizan son ms homogneos que la poblacin, la utilizacin del
muestreo estratificado permite ganar precisin frente al aleatorio simple.
Afijacin
Afijacin es la forma de realizar el reparto de la muestra en cada uno de los estratos. Algunos
tipos de afijacin son:
ptima: Tiene en cuenta para calcular los tamaos de los estratos las varianzas de los
estratos, y los costes de realizacin de la muestra en cada uno de ellos. Es til tenerla
en cuenta si las varianzas son muy distintas de unos estratos a otros, y si los costes de
realizar el estudio son muy distintos de unos estratos a otros.
Estimadores
s h2 2
El estimador del error estndar de la media es: s st = n Wh (1 f h ) .
h
En esa expresin f h es la fraccin de muestreo del estrato h, que en estratos con poblacin
Tamao muestral
Para el clculo del tamao muestral en un muestreo estratificado es necesario tener en cuenta
el tipo de afijacin y los objetivos de error.
Este muestreo consiste en ordenar a la poblacin de acuerdo con una variable. Tomamos una
N
muestra aleatoria entre las primeras k = unidades, y tomamos las n siguientes a intervalos
n
de amplitud k.
El muestreo sistemtico es ms preciso que el m.a.s. si la variable por la que se ordena est
relacionada con la que nos interesa, pero se pueden presentar sesgos si la variable de
ordenacin tiene comportamientos secuenciales.
Introduccin
Este tipo de muestreo consiste en usar unas unidades intermedias, llamadas conglomerados,
y muestrearlos. Dentro de cada conglomerado existe una parte de las unidades finales. Se
puede incluir en la muestra a todas las unidades de los conglomeradas elegidas, o solo a una
muestra de ellas, tratndose en el segundo de los casos de un muestreo por conglomerados
con submuestreo, o muestreo en dos fases.
En el muestreo por conglomerados es conveniente, salvo una razn poderosa en contra, que
la probabilidad de eleccin de la unidad ltima sea la misma siempre, ya que simplifica la
forma de los estimadores. Hay dos formas de conseguir esto:
Estimadores y errores
Las expresiones en muestreo por conglomerados con submuestreo son complejas, por lo que
se escapa a los objetivos de este documento introductoria. Sin embargo, si las probabilidades
de las unidades ltimas son las mismas, los estimadores son los mismos del m.a.s.
Para el clculo de errores se hace necesario utilizar mtodos complejos, por lo que es
preferible acudir a programas adecuados para realizarlo (SPSS Muestras Complejas, WesVar,
STATA, SAS,).
Como ejemplo, vamos a mostrar el proceso de decisiones que se ha tomado en el IESA para
la realizacin de una muestra concreta, dirigida a la poblacin residente en Andaluca mayor
de 18 aos.
Formas de administracin
En primer lugar tenemos que decidir la forma de administracin. En principio se considera solo
la administracin presencial o telefnica. Consideramos la duracin del cuestionario (la
telefnica debe usarse solo en cuestionarios cortos), el coste, y el tiempo que se tiene para
realizar el trabajo de campo (en estos dos aspectos es mejor la telefnica).
Tambin hay que considerar la importancia que le vamos a dar a los posibles sesgos
introducidos por el marco muestral de las encuestas telefnicas.
En las encuestas telefnicas los marcos maestrales existentes son solo de telfonos fijos (las
bases de datos procedentes de los listines telefnicos). En estos momentos, se constata que
hay una parte importante de la poblacin, sobre todo jvenes, donde se ha sustituido el
telfono fijo por el mvil, por lo que el sesgo producido en este tipo de encuestas puede ser
importante.
Se estn realizando ya encuestas a telfonos mviles para solucionar este problema, pero
tiene el inconveniente de que no existe un listado de nmeros, y tampoco hay forma de saber
a qu lugar de Espaa pertenece cada nmero, lo que complica el muestreo si no es a la
poblacin nacional, en caso de realizarse con eleccin aleatoria de nmeros de telfono.
Para la poblacin general el nico marco muestral existente es el Padrn de Habitantes, que
realiza el INE en colaboracin con los ayuntamientos. Por desgracia, es difcil poder utilizar
este marco para realizar encuestas, ya que las condiciones de acceso son bastante estrictas
por motivos de confidencialidad.
Decisin
El punto de partida para el entrevistador ser la calle de la seccin electoral que se le seale
en las instrucciones de cada estudio. De la calle seleccionada, se partir del nmero de
portal/vivienda ms bajo que aparezca y, dentro de ste, del 1er. Piso y 1 letra.
A. Para edificios de ms de una vivienda, un portal cada tres (uno s, dos no). En edificios
con dos o ms escaleras se tomarn como portales cada una de ellas. Dentro del
portal seleccionado se podr realizar una entrevista cada 12 hogares o fraccin.
B. Para viviendas unifamiliares, un portal de cada 5 (uno s, cuatro no). En este caso, el
segmento para la seleccin de la vivienda es de 5 hogares.
La ruta es el itinerario que debe seguir el encuestador/a para realizar un nmero determinado
de entrevistas y tiene como lmites una seccin electoral.
Para poder realizar la ruta, se proporciona a los encuestadores/as el listado de calles que
componen esa seccin electoral.
Ejemplo de recorrido
de una ruta
Para controlar los sesgos que puede llevar implcita la utilizacin de este tipo de muestreo en
esta fase ltima se suelen utilizar cuotas en las que se seala el nmero de personas que se
pueden entrevistar en cada seccin de acuerdo a una serie de variables que pensamos que
pueden estar relacionadas con nuestro estudio. Las ms utilizadas son la edad y el sexo.
18 A 29 1 2
30 A 44 1 1
45 A 59 1
60 O MS 1 1
A menudo se suele utilizar las provincias como estrato, sobre todo si se requiere una precisin
determinada para ellas.
En nuestro caso los requisitos que nos planteaban era la obtencin de un error de estimacin
mximo para las proporciones del 5% para cada provincia y 1,7% para el total de Andaluca.
Por tanto, se decide realizar una afijacin de compromiso, donde el mnimo de entrevistas por
estrato va a ser de 384, aumentando en las provincias mayores el nmero de entrevistas para
obtener la precisin requerida para el total 1 .
Provincia Muestra
Almera 384
Cdiz 430
Crdoba 384
Granada 384
Huelva 384
Jan 384
Mlaga 540
Sevilla 650
Total 3540
Como se ha dicho en cada estrato se elegirn las secciones que formarn parte de la muestra.
Hay que decidir el nmero de unidades maestrales finales (personas) que se van a incluir en
cada seccin. Como se ha dicho, es conveniente seleccionar cuantos ms conglomerados
mejor, para aumentar la dispersin y as diminuir el error muestral. La limitacin de coste ms
importante es que para seccin ser necesario un desplazamiento. Por tanto se decide ajustar
el nmero de unidades en cada seccin al nmero de entrevistas que se supone que ser
posible que un entrevistador realice en una jornada de trabajo. En nuestro caso se fijar en 7
entrevistas. Por tanto, tendremos que seleccionar 3540 entrevistas entre 7 igual a 505,7.
Redondeando por exceso, quedan 506 secciones.
3.7. Cuotas
Como se ha dicho, es conveniente utilizar cuotas para asegurar un cierto control en la eleccion
de las personas entrevistadas. Las cuotas que se utilizarn sern el grupo de edad y el sexo,
1
En realidad hay que tener en cuenta el efecto del diseo derivado del uso de
conglomerados, que escapa a los contenidos de este curso
INSTITUTO DE ESTUDIOS SOCIALES AVANZADOS (IESA-CSIC)
25
INTRODUCCIN A LOS MTODOS DE ENCUESTACIN Y MUESTREO ESTADSTICO
por considerarse que son las ms fciles de responder por los entrevistados, que guardan
relacin con nuestros objetivos, y adems se dispone de informacin sobre ellas en la
poblacin.
Queda la labor de repartir las cuotas entre las secciones elegidas. Esto se realiza siguiendo
los siguientes criterios:
a) El reparto en cada seccin debe ser lo ms parecido posible a la proporcin que existe
realmente en la poblacin.
b) En cada estrato el reparto por cuotas de la muestra debe ser igual al de la poblacin.
Bibliografa:
Rueda Garca, M.M. y Arcos Cebrin, A., (1998) Problemas de Muestreo en Poblaciones Finitas, Grupo
Editorial Universitario.
Azorn, F. y Snchez-Crespo J.L., (1994) Mtodos y Aplicaciones del muestreo, Alianza Universidad
Textos, Madrid
Fernndez Garca, F.R. y Mayor Gallego, J.A., (1994) Muestreo en Poblaciones Finitas: Curso Bsico,
PPU, Barcelona
Cochran, W. G., (1963) Sampling Techniques, John Wiley & Sons, EEUU