Está en la página 1de 24

Estadstica Inferencial

Estudio de grupos pequeos (muestras), a fin de sacar conclusiones


respecto a grandes grupos de personas (poblaciones)
La utilidad de la muestra viene de la imposibilidad de acceder al total
de la poblacin.
El objeto de la sociologa es el estudio de colectivos humanos, desde
su observacin, hasta el conocimiento de sus caractersticas y leyes
de distribucin, incluyendo la interdependencia y conexiones entre
ellos y dentro de ellos as como del valor de la inferencia que se haga
acerca de ese colectivo, basndose en las muestras observadas.
Vamos a hablar de estimaciones de valores de las poblaciones
(parmetros poblacionales) a travs de datos obtenidos mediante
muestras (estadsticos o estimadores).
Tambien hablaremos de la fiabilidad o confianza de estos
estadsticos a la hora de estimar los parmetros.
Tcnicas inferenciales:
Estimacin por parmetros para los distintos niveles de
medicin
Nominal y ordinal: porcentaje
Intervalo: medias
Pruebas de hiptesis para los diferentes niveles de medicin.
Las mismas, mediante anlisis univariable o bivariable.
Elementos bsicos:
Teora de las probabilidades
Teora del muestreo
Probabilidad
Fenmeno aleatorio: Un fenmeno es aleatorio si puede dar lugar a
varios resultados, sin que pueda ser posible enunciar con certeza real
cual va a ser el resultado del fenmeno.
Espacio muestral :conjunto de los posibles resultados de ese
fenmeno. El suceso de un experimento aleatorio ser un
subconjunto del espacio muestral.
Caractersticas de un fenmeno aleatorio:

Probabilidad de repeticin indefinida de un


fenmeno en condiciones similares.
Imposibilidad de predecir exactamente el
resultado de cada experimento particular.
Variable aleatorio
En una magnitud que puede aparecer en un experimento aleatorio.
Asigna un nmero al resultado de cada experimento aleatorio. Los
valores que toma son nmeros reales.
Cada variable puede tomar diversos valores dependiendo del azar. As
pues, no basta con conocer los posibles valores que puede tomar,
sino la probabilidad de que estos ocurran.
Tipos de variables aleatorias
Discreta: puede tomar determinado n de valores.
Continua: Puede tomar un conjunto continuo de valores

Probabilidad apriorstica
En una poblacin cada uno de sus elementos tiene las mismas
opciones de ser seleccionado en una muestra. Todos tienen la misma
probabilidad individual, son equiprobables.
Probabilidad a priori de eleccin de un elemento con una
caracterstica determinada es igual a la frecuencia relativa de esa
caracterstica.
P(A)= a/n = casos favorables/casos posibles
La probabilidad al igual que la frecuencia relativa, oscila entre 0 y 1.
Si P=1 ocurrir seguro, si P=0 no ocurrir nunca.
Probabilidad emprica
Se basa en el supuesto de que la proporcin de apariciones de los
sucesos observada en el pasado, persistir en el futuro. Son tan solo
estimaciones de las probabilidades verdaderas,`pero cuanto sea
mayor sea el nmero de casos total observados ms precisa ser la
estimacin.
Apoyndonos en la experiencia previa, es posible obtener buenas
estimaciones de los sucesos
Sucesos que se excluyen mutuamente

Dos sucesos A y B se excluyen mutuamente si no tienen elementos


en comn. A y B no pueden acontecer juntos.
Vamos a introducir los trminos unin () e interseccin ().

A B : Ocurrencia de A B

A B : Ocurrencia de A y B

Propiedades de las probabilidades


1. La probabilidad oscila entre 0 y 1.
0 P(A) 1

2. Regla de la adicin.

1. Si los sucesos A y B son mutuamente excluyentes, la


probabilidad de obtener A o B es igual a la suma de sus
probabilidades. P(A o B) = P(AB)= P(A)+P(B) P(AB C)=
P(A)+P(B) +P(C)
2. Fenmenos no mutuamente excluyentes.

P(AB)= P(A)+P(B)-P(AB)
3. Regla de la multiplicacin
a. Fenmenos mutuamente excluyentes
P(AB)=0

Fenmenos no mutuamente excluyentes


1) Sucesos independientes

P(AB)= P(A) P(B)


1) Sucesos dependientes
P(AB)= P(A) P(B/A) *(probabilidad condicionada)
P(B/A)= P(BA)/ P(A)
Puede ampliarse a ms sucesos, A, B, C, D...

Combinatoria
El anlisis combinatorio se utiliza para la obtencin de probabilidades
de sucesos complejos cuando la enumeracin de los casos es difcil y
laboriosa. Se refiere a la forma en que pueden asociarse un conjunto
de elementos.

Vamos a ver la variaciones, permutaciones y combinaciones.

Variaciones
Se refiere a los distintos grupos que pueden formarse con m
elementos tomados de n en n. Siendo n<m
Ej: V3,2 =3*2/1= 6 [(1,2) (2,1) (1,3) (3,1) (2,3) (3,2)]
Dos grupos son distintos si difieren en el orden o la naturaleza de sus
elementos
Permutaciones
Los grupos varan solo en el orden de los elementos que lo integran.
Puede considerarse como un caso particular de las variaciones
cuando m=n.
Pmn= n!
P3 =6 [(123) (132) (312) (321) (231) (213)]
Combinaciones
Cuando los grupos varan por la naturaleza de sus elementos, sin
tener en cuenta el orden.

C3,2 =3 (1,2) (1,3) (2,3)


Muestreo
La teora del muestreo es el estudio de las relaciones existentes entre
una poblacin y las muestras extradas de la misma.
Poblacin es el conjunto de casos o unidades que tienen en comn
una serie determinada de caractersticas (fumadores, trabajadores
del sector servicios, propietarios de olivares) sobre las que se desea
obtener cierta informacin. Esta informacin puede consistir en la
proporcin de personas con ingresos superiores a una cantidad, la
extensin media de cultivos dedicados al olivo, etc. Estos valores que
se pretenden conocer y que se expresarn mediante medidas de
frecuencia, tendencia central o variacin, tales como proporciones,

razones, medias, desviaciones tpicas, etc. se les denomina valores


verdaderos o parmetros.
Normalmente dichos valores no se pueden calcular directamente
porque las poblaciones no son directamente asequibles. As hay que
recurrir al muestreo, que es un procedimiento por el que se infieren
los valores verdaderos de una poblacin, a travs de la experiencia
obtenida con un grupo que contiene un nmero menor de casos que
la poblacin. Una muestra ser el grupo de elementos seleccionados
con la intencin de estimar los valores verdaderos de la poblacin.
Deber procurarse que el nmero de elementos sea lo
suficientemente representativo para que puedan realizarse
generalizaciones seguras sobre la poblacin. Los valores hallados en
la muestra son llamados estadsticos o estimadores.
Los procedimientos de muestreo son unos medios para desarrollar
una adecuada validez externa.
La muestra
Una muestra es simplemente, en general, una parte representativa
de un conjunto, poblacin. o universo, cuyas caractersticas debe
reproducir en pequeo lo ms exactamente posible.
De modo ms cientfico, se pueden definir las muestras como una
parte de un conjunto o poblacin debidamente elegida, que se
somete a observacin cientfica en representacin del conjunto, con
el propsito de obtener resultados vlidos, tambin para el universo
total investigado.
Las muestras tienen un fundamento matemtico estadstico. Este
consiste en que obtenidos de una muestra, elegida correctamente y
en proporcin. Adecuada, unos determinados resultados, se puede
hacer la inferencia o generalizacin, fundada matemticamente, de
que dichos resultados son vlidos para el universo del que se ha
extrado la muestra, dentro de unos lmites de error y probabilidad,
que se pueden determinar estadsticamente en cada caso.
Muestro y probabilidad
Al hablar de muestreo debemos mencionar la teora de las
probabilidades. Las muestras obtenidas son muestras
probabilsticas: en ellas cada elemento del universo tiene una
probabilidad igual e independiente de figurar en la muestra. En este
supuesto, las estimaciones son insesgadas y se pueden calcular
los errores de muestreo que permiten determinar la precisin de
las estimaciones.
Un estimador es insesgado si, en promedio, los valores del estadstico
obtenidos del muestreo realmente son iguales al parmetro

Para que el muestreo sea probabilstico, es necesario que se respete


la aleatoriedad:

Al elegir y aplicar el mtodo de seleccin

A la hora de recoger la informacin (evitar sesgos por


sustituciones)

La precisin de un estimador va ligado al tamao de la muestra.


(no se puede llegar a niveles de desagregacin grandes) y a los
procesos de seleccin y estimacin que se apliquen.
Caso especial del muestreo por cuotas: No es estrictamente
probabilstico per puede dar lugar a estimaciones muy precisas. La
cuota suele ser introducida, solamente en la ltima fase del
muestreo.
La muestra, ventajas
Las muestras presentan las siguientes ventajas, en las ciencias sociales:
1. Mediante ellas, con una muestra relativamente reducida con
relacin al universo, se pueden encuestar las grandes poblaciones y
ncleos humanos, que de otra manera seria muy difcil o
prcticamente imposible investigar.
2. En todo caso las muestras suponen una gran economa en las
encuestas y la posibilidad de mayor rapidez en su ejecucin.
3.- La adquisicin de unos datos ms comprensivos. A veces un buen
plan de muestreo obtiene unas mejores estimaciones de los valores
de la poblacin que un censo. (de hecho, hasta el ltimo censo de
poblacin, los datos de los censos, eran datos de una muestra). Un
censo produce mas errores no muestrales y de mayor magnitud
que el propio error de muestreo.
Condiciones de las muestras
Las condiciones fundamentales de las muestras son cuatro:
1. Que comprendan parte del universo y no la totalidad de este.
2. Que su amplitud sea estadsticamente proporcionada a la magnitud
del universo. Esta condicin. Se halla en relacin con el punto
prctico de determinacin del tamao de la muestra y sirve para
decidir si, segn las unidades que comprende respecto al universo,
una muestra es o no admisible.
3. La ausencia de distorsin en la eleccin de los elementos de la
muestra. Si esta eleccin presenta alguna anomala, la muestra
resultar por este mismo hecho viciada.

4. Que sea representativa o reflejo fiel del universo, de tal modo que reproduzca
sus caractersticas bsicas en orden a la investigacin
El Marco Muestral
Los elementos principales de la muestra, son la base y la unidad de la
misma.
La base de la muestra es, en todo caso, la poblacin de la que se
obtiene o saca la muestra. Esta poblacin puede no estar censada o
puede estarlo. En el primer caso, existe la base de la muestra en
sentido real o material, pero no en sentido formal, mientras que en el
segundo caso hay base de la muestra tanto material, la poblacin real
a investigar, como formal, el censo de todos los individuos que la
componen. Precisamente con el trmino de base de la muestra se
suele designar de manera especfica este censo o registro.
La importancia de la base de la muestra, tomada especficamente o
en sentido estricto, se deriva de que la muestra, operativamente, es
el resultado de la eleccin de unidades dentro de una poblacin o
conjunto previamente determinado de aqullas. Por ello, fundamento
bsico de la muestra, es la existencia de un registro de dicho
conjunto, en el que aparezcan individualizadas todas sus unidades, y
permita realizar la eleccin mediante un sorteo riguroso.
Esta puede consistir en un censo, un registro, una lista, un fichero, un
catlogo, un mapa, un plano, etc. Se debe dar normalmente un
nmero a cada ficha o elemento del catlogo,
En la base de la muestra deben figurar individualizadas todas las
unidades que forman la poblacin con expresin de su nmero en el
universo, nombre, domicilio en su caso, etc. Por ello, la base de la
muestra hace posible la identificacin de los elementos que se hayan
seleccionado mediante la muestra y su encuesta posterior.
La base de la muestra en este sentido estricto, no siempre existe.
Hay muchos universos que no estn censados o catalogados y que es
prcticamente imposible catalogar. Por ejemplo, no lo estn el pblico
que circula por las calles ni los asistentes a un espectculo. La
solucin que se adopta entonces es practicar la eleccin de la
muestra por algn procedimiento aleatorio imperfecto, como v.g.
encuestar uno de cada cinco que se encuentren por la calle
Lo ideal seria formar una base de muestra especfica para la
encuesta. Pero esto no es posible, por lo general, en las
investigaciones sociales. Supondra casi tanta dificultad como
efectuar la encuesta a toda la poblacin.

Por eso, normalmente, se utilizan bases ya formadas. En este caso es


preciso asegurarse de que la base est actualizada, pues si no nos
exponemos a dejar fuera de la muestra, por ejemplo, a la poblacin
ms joven de ella.
Adems hay que verificar si la poblacin que queremos encuestar
(universo terico) y aquella de la que se toma de hecho la muestra
(universo de trabajo) o a la que se refiere la base de la muestra,
coinciden, porque podra haber discrepancias ms o menos extensas
entre ellas.
En el orden prctico, respecto a la base de la muestra, hay que
buscarla, analizarla y prepararla a efectos del muestreo si existe. Si
no existe, y ello es posible, hay que formarla. En este caso se debe
cuidar, de modo especial, segn lo indicado, que no resulte ordenada
de alguna forma que pueda determinar una eleccin distorsionada o
no representativa de la muestra.
La unidad muestral
La unidad de la muestra es cada uno de los elementos que
comprende su base y figuran, numerados e individualizados, en el
registro de la misma cuando existe.
Las unidades de este registro representan y remiten a las unidades de
observacin que forman el universo a investigar.
Las unidades de la muestra no solo pueden ser simples, sino
tambin colectivas, como cuando estn constituidas por familias,
grupos, sectores de ciudades, pueblos, etc. El nmero de individuos
que comprende la unidad de la muestra cuando es colectiva se llama
talla de la muestra.
Esta talla de las unidades de la base de la muestra o poblacin es lo
que determina lo que se suele llamar el nivel de agregacin en la
investigacin. Este nivel puede presentar grados de agregacin
diversos, bien de carcter espacial, social, econmico, segn los
colectivos que se elijan como agregados.
As, por ejemplo, para estudiar las compras de TV en color se puede
operar al nivel de agregacin de individuos o de colectivos y, dentro
de los colectivos, especialmente, estos pueden ser municipios,
distritos, regiones, naciones. Desde un punto de vista social los
agregados pueden ser familias, establecimientos de venta, empresas,
organismos y asociaciones determinados.
Relacin Universo-Muestra

La muestra, como se ve, es una parte reducida de una determinada


poblacin o universo, con relacin a la cual representa
cuantitativamente una fraccin.
Pero tambin la muestra tiene la misma forma circular que el
universo. Ello pretende indicar que, cualitativamente, la muestra
debe tener las mismas caractersticas que la poblacin que
representa.
El universo est formado por toda la poblacin o conjunto de
unidades que se quiere estudiar y que podran ser observadas
individualmente en el estudio (el universo de trabajo).
Sin embargo, por razones de economa se investiga en su
representacin la muestra.
UNIVERSO TEORICO-----
UNIVERSO DE TRABAJO ----
MUESTRA ------------------------ (de menos a ms)
el universo o poblacin forma parte tambin de un conjunto ms
amplio al que se llama universo terico. Este universo hipottico est
constituido por todas las poblaciones existentes en las que se podra
tambin efectuar la investigacin proyectada
Universo del muestreo
Para realizar un buen diseo muestral, debe tenerse muy claro que es
lo que se est muestreando. Se evitan muchos problemas si se
conceptualizan claramente los objetos que han de servir como base
para las generalizaciones de una investigacin.
Aqu deberamos diferenciar entre lo que se denomina universo
general y universo de trabajo.
Universo general es la poblacin abstracta y terica a la que el
investigador desea generalizar sus resultados, en tanto que universo
de trabajo es la operacionalizacin concreta de ese universo general
del que se va a obtener una muestra. Es importante realizar esta
distincin, porque en la investigacin sociolgica, raramente se
pueden obtener muestras directamente del universo general.
Tipos de muestreo
Probabilstico

Aleatorio simple
Con reemplazamiento

Sin reemplazamiento

Sistemtico

Estratificado

Por conglomerados

Polietpico

No probabilstico

De conveniencia o Accidental

Mas similar/diferente

Caso tpico

Caso crtico

Bola de nieve

Cuotas

Muestreo no probabilstico
Es usado en muchas investigaciones.
En la seleccin de los individuos juega un papel importante la
subjetividad del investigador.
En muchas ocasiones, es el nico mtodo posible de muestreo.
En ocasiones cuando el investigador est interesado en un grupo
concreto de la poblacin, es el mejor mtodo (ej: madres con nios
menores de 2 aos).
En estudios exploratorios, cuando el investigador debe determinar si
un problema existe o n (estudio piloto).
Problema: la subjetividad del investigador.
Muestreo de conveniencia
Una muestra de conveniencia es un grupo de individuos fcilmente
accesibles y dispuestos a participar en un estudio. Son voluntarios.
El caso tpico de los experimentos: asignamos los individuos a un
grupo de tratamiento y a otro de control.
La generalizacin est muy afectada por los sesgos en la seleccin y
el desconocimiento de la poblacin real.
Mas similar/ ms diferente

Utilizado en estudios gubernamentales. Se utiliza para comparar


determinadas caractersticas sociales, econmicas o polticas entre
diferentes pases. La seleccin de casos marca los mejores y los
peores para hacer comparaciones.
Estos estudios son tiles dado que se comparan pocos casos,
necesita pocos recursos y sirve a las necesidades de comparacin.
Pero su capacidad de generalizacin queda limitada a los casos
estudiados.
Caso tpico
Cuando hay limitaciones de tiempo o presupuesto, el investigador
selecciona una muestra de individuos que, a su juicio, son los ms
tpicos o usuales. Aquellos que son considerados nicos o especiales
no se seleccionan.
Es importante que el investigador tenga un profundo conocimiento de
las caractersticas de la poblacin que quiere analizar.
Su problema principal es el error producido por la subjetividad del
investigador. (son los casos los ms tpicos, o los que le han sido ms
fciles de contactar). Todos y cada uno de los casos deben ser
cuidadosamente seleccionados.
Caso crtico
El investigador selecciona aquellos casos que, por la experiencia
anterior, permitan hacer una generalizacin a la poblacin.
La seleccin de determinados distritos electorales para predecir el
resultado de las elecciones es una de sus aplicaciones ms comunes.
Bola de nieve
Una vez seleccionados los primeros individuos para una muestra,
estos se ocupan a su vez de seleccionar a otros individuos de la
poblacin. Estos a su vez seleccionan a otros, etc..
Se utiliza cuando no se puede disponer de un listado de los individuos
de una poblacin y es muy difcil su confeccin por parte de los
investigadores.
Se aplica en grupos de consumidores de drogas, poblaciones
marginales, inmigrantes o miembros de elites polticas, econmicas
o sociales.
Muestreo aleatorio simple
Es el muestreo probabilstico ms sencillo. Se parte de un listado
(exhaustivo) de los elementos de la poblacin y se seleccionan

aleatoriamente n elementos de la poblacin para formar con ellos la


muestra. La seleccin aleatoria se lleva a cabo de tal forma que:

Cada elemento de la poblacin tenga idntica


probabilidad de ser incluido en la muestra

Cada posible combinacin de n elementos tenga la


misma probabilidad de constituir la muestra.

De tal forma que si el nmero de elementos de la poblacin es M, la


probabilidad de cada elemento dentro de la muestra es 1/M. Y el nmero
posible de muestras de tamao n es igual a Mn
En este muestreo la seleccin de los elementos de la muestra se hace
en una sola etapa, directamente y sin reemplazamiento. Equivale a
censar o utilizar el censo de la poblacin en estudio, para sacar
despus, al azar, los elementos que van a formar parte de la muestra.
Inconveniente: En universos con gran nmero de elementos, es muy
costoso hacer una relacin individualizada.
Es el muestreo terico ms deseable, pero de muy difcil realizacin
en la prctica, debido fundamentalmente a los altos costes de tiempo
y econmicos que conlleva su realizacin.
Se utiliza como prototipo para el clculo de los tamaos muestrales y
los errores de muestreo, y como patrn para medir la eficacia de los
muestreos estratificados y por conglomerados.
Teorema del lmite central
Si se extraen repetidas muestras aleatorias simples de tamao N a
partir de una poblacin distribuida normalmente, de media y de
desviacin tpica , las medias de tales muestras se distribuyen
normalmente con media y desviacin tpica / N
Las medias de las muestras aleatorias simples extradas de una
poblacin que se distribuye normalmente, dan lugar a una
distribucin muestral que es tambin normal, aunque el tamao N
sea mas pequeo. Cada una de las muestras tiene una media X, que
variar ligeramente de un muestra a otra, pero que tendern a
agruparse en torno a y con desviacin tpica /N. De aqu que
cuanto mayor sea N, menor ser la desviacin tpica y mayor el
agrupamiento de las medias muestrales (estimadores) alrededor de
la media poblacional (parmetro).
Existe pues tres tipos de distribuciones:
1.- La de la poblacin

2.- La de los valores dentro de cada una de las muestras


3.- La distribucin muestral de un estadstico. En ella los casos, son las
medias de las diferentes muestras.
Ley de los grandes nmeros
La segunda parte del teorema del lmite central, establece que, al
extraer repetidas muestras aleatorias de tamao N de una poblacin
de cualquier forma, de media y con desviacin tpica , cuando N
es suficientemente grande, la distribucin muestral de las medias
tiende a distribuirse normalmente con media y con desviacin
tpica / N.
Lo importante es que cuando N es grande, no tenemos que
preocuparnos de la normalidad de la poblacin. . Dado que la
distribucin de probabilidades suele ser conocido (distribucin
normal), en este tipo de muestras es posible proceder a la inferencia
estadstica, trasladando los datos muestrales a la poblacin. Haciendo
las correspondientes estimaciones en base a los datos muestrales.
Muestreo sistemtico
Similar al anterior pero difiere la forma de seleccin de las unidades
muestrales. Se halla el coeficiente de elevacin N/n y se elige al azar
un nmero no superior a l que sirva de arranque de la seleccin. A
partir de ah se suma el coeficiente de elevacin para hacer la
seleccin.
Se simplifica la eleccin pero se introduce un sesgo al elegir los
elementos de forma peridica, caso de que el universo est ordenado
por criterios que puedan influir en la seleccin sistemtica.
Se emplea en la seleccin de miembros de un club, alumnos de una
escuela, etc.
Tambin se le llama muestreo por conglomerados en una etapa.
Problema: que el listado de la poblacin est repartido de manera
cclica, de tal forma que al hacer la seleccin el ciclo coincida con la
seleccin interval.
Si existe periodicidad, debe eliminarse del marco muestral,
cambiando el orden de los elementos o seleccionar otro tipo de
muestreo.
Ventaja sobre el muestreo aleatorio: (1) no se necesita un marco
muestral completo.(2) Si el marco est ordenado respecto a una
variable de estratificacin, la seleccin sistemtica proporciona una
muestra estratificada.

Muestreo estratificado
La poblacin marco se subdivide en fracciones o estratos
mutuamente excluyentes y exhaustivos, de tal forma que cada
unidad solo pertenezca a uno de los estratos. As pues cada estrato
puede ser tratado de forma independiente.
Se selecciona una muestra aleatoria, simple e independiente en cada
uno de los estratos.
Con este mtodo:

se pueden reducir las varianzas de las estimaciones muestrales. Es


tanto en cuanto cada estrato rena unidades homogneas entre s y
heterogneas en relacin a las de otros estratos, con ello aumenta la
precisin de las estimaciones y disminuye el error de muestreo.

Facilita la coordinacin del trabajo de campo. Cada Estrato puede


formar reas operativas distintas.

Posibilita la utilizacin simultanea, en una misma muestra de diversos


mtodos de muestreo, en funcin de las necesidades del diseo y de
la informacin disponible de cada estrato.

Facilita la estimacin por separado de los distintos estratos, siempre


que la muestra est adecuadamente dimensionada.

Si se conoce la varianza por estrato (difcil, pero se pueden conocer


indicadores, como renta, tamao de viviendas, tamao poblacional
etc.), se pueden aplicar fracciones de muestreo distintas en cada
estrato, de acuerdo con el valor de la varianza. En estratos ms
homogneos, se pueden utilizar fracciones muestrales ms pequeas.

En general para estratificas se suele recurrir a variables espaciales:


CC.AA., Provincias, municipios, etc. o a subdivisiones inherentes al
universo del estudio (especialidades mdicas, etc.).

Ejemplo de muestreo estratificado: pgs. 29-31 Rodrguez Osuna.

Muestreo por conglomerados


Muestreo en el que la unidad muestral no son los individuos, sino un
conjunto de ellos que, bajo determinados aspectos, se puede
considerar que forman una unidad. (Hospitales, secciones censales...)
Los conglomerados son definidos tambin como reas o partes bien
delimitadas del terreno, de modo que todas las unidades
correspondientes al rea son las que constituyen el conglomerado.
(muestreo por reas).

Si los conglomerados son muy grandes deberamos recurrir al


submuestreo.
Muestreo polietpico
El submuestreo consiste en subdividir en unidades ms pequeas las
unidades de poblacin utilizadas en el diseo muestral.
Se utiliza cuando el nmero de elementos del conglomerado es
elevado y, no solo por la dificultad de entrevistar a todos y cada uno
de los elementos del mismo, sino , sobre todo por la necesidad de
obtener estimaciones ms precisas.
Etapas del muestreo
La seleccin de las unidades ltimas a las que ha de aplicarse la
muestra, se realiza por etapas sucesivas. El muestreo polietpico
consiste en una jerarqua de diferentes tipos de unidades.
La importancia de la estructura del conglomerado: Cuando son
homogneos, basta con tomar en primera etapa, pocas unidades de
cada uno de ellos, por lo que hay que aumentar el nmero de
conglomerados seleccionados. Si, por el contrario, los conglomerados
de 1 etapa son heterogneos, se pueden tomar mas elementos por
conglomerado y, por consiguiente, se puede tomar un nmero menor
de conglomerados.
Interesa que las unidades primeras sean altamente heterogneas
respecto a las caractersticas en estudio.
Tamao de los conglomerados y proporcionalidad
Los conglomerados no siempre tienen un tamao similar y eso afecta
al proceso de seleccin de la muestra, pues no tienen la misma
probabilidad de formar parte de ella.
La seleccin suele entonces hacerse de forma que cada uno de ellos
tenga probabilidad proporcional a su tamao. (ejemplo muestra pg.
35-38)
A veces puede ser deseable que los tamaos de los estratos sea
desproporcionado.
Seleccin ltima de las unidades de muestreo
El ltimo paso sera elegir, aleatoriamente y con probabilidades
iguales, a los individuos dentro de las secciones censales. Los
sistemas utilizados para ello son mltiples y variados.
1.- El que realiza el INE en las encuestas de la EPA, EPF, etc. La
seleccin de las unidades ltimas de muestreo se hace mediante

listados sobre la composicin de la seccin: viviendas, hogares,


individuos. Permite utilizar mtodos de seleccin ms rigurosos, ya
que se tiene mayor informacin sobre el marco muestra. Este sistema
solo puede ser utilizado por el INE y los servicios estadsticos de las
CCAA ya que solo ellos pueden disponer de los listados completos del
censo y padrn de habitantes.
2.- Otros institutos se basan en las secciones censales como
unidades de segunda etapa, y a partir de ellas se hace la seleccin de
los elementos de la muestra, fundamentalmente de dos formas:
Rutas aleatorias dentro de la seccin. Donde se elige
aleatoriamente el punto de partida y posteriormente se
siguen todas las instrucciones tanto en los
desplazamientos como en la seleccin de portales, pisos,
puertas e individuo a entrevistar (explicar el mtodo de
kish).
Conseguir un plano de la seccin, calcular
aproximadamente el numero de viviendas y a partir de
ah se fija la ruta y la frecuencia de seleccin de cada
vivienda. Se saca al azar un nmero aleatorio y se
comienza la ruta por ese punto.
En estos dos sistemas de eleccin se fija aproximadamente un
nmero de 10 entrevistas por seccin.
Estos sistemas son aleatorios y no precisan un conocimiento tan
preciso del marco muestral, pero tienen dificultades porque, la
persona elegida aleatoriamente para ser entrevistada impone una
gran rigidez: est de viaje, no est en casa y volver tarde. No quiere
responder, etc. Debe evitarse el recurso fcil de las sustituciones
(aunque en la realidad se practica) para ello se contempla la
obligacin de realizar hasta tres visitas al domicilio para hablar con la
persona seleccionada.
3.- Otra forma mas sencilla es, una vez elegidos los municipios donde
van a hacerse las entrevistas, se define el numero de rutas, tantas
como sean necesarias para que en cada una de ellas haya de 8 a 10
entrevistas. Sobre mapas se eligen aleatoriamente los puntos de
partida y se procede a la realizacin de igual forma que en las
anteriores.
Muestreo por cuotas
Para evitar las rigideces de los sistemas anteriores, se recurre muchas
veces al muestreo por cuotas.
El ms utilizado por los institutos de investigacin de mercados y
opinin. Se emplea en la ltima etapa y consiste en proporcionar al

entrevistador el perfil de la persona que tiene que entrevistar en cada


una de las secciones en las que va a trabajar.
La seleccin aleatoria del ultimo estrato se deja, en parte al criterio
del entrevistador, siempre que recoja la informacin de aquellos
individuos que se le asignan. La distribucin total de los individuos de
la muestra, reproduce la composicin del censo, y reflejan, por tanto
perfectamente el universo de la muestra.
A la hora de disear la muestra deben tenerse en cuenta los criterios
que se van a utilizar para la clasificacin de los individuos. Lo mas
usual es utilizar cuotas de sexo y edad, que en la mayora de las
veces no tiene demasiado que ver con las variables de la encuesta,
pero que son fciles de obtener.
La seleccin por cuotas slo debe aplicarse en la unidades ltimas del
muestreo.
La composicin de las cuotas viene dada por el conocimiento,
normalmente de los censos de poblacin de la proporcin de
individuos que poseen las caractersticas de cada categora de una
variable. Ej Sexo.
Para que el proceso se acerque ms a la aleatoriedad, se suelen dar
instrucciones concretas a los entrevistadores como:
Las entrevistas solo se harn en las viviendas.
Cuando en las viviendas hay ms de una persona que pueda
ser entrevistada, se selecciona a la ms joven.
Las entrevistas solo se pueden realizar en las secciones o reas
previstas en la muestra.
No se pueden hacer entrevistas a los amigos, primos, etc.
Se utiliza mucho porque agiliza y simplifica el trabajo de campo.
Sabes que las sustituciones no deformarn el diseo muestral.
En grandes investigaciones de carcter estatal, nunca se utiliza este
tipo de investigacin
Tamao de la muestra
Universos pequeos
Media
NK22
n=

Ne2+K2 2
Proporcin
NK2 P(1-P)
n=
(N-1)e2+K2 P(1-P)
Total
N2K22
n=
e2+NK2 2
n= Tamao muestral
N= Tamao poblacional
K= Nivel de confianza
2= Cuasivarianza poblacional
e= Error del muestreo
P= Proporcin
P(1-P)= Varianza
Total
N2K22
n=
e2+NK2 2
n= Tamao muestral
N= Tamao poblacional
K= Nivel de confianza
2= Cuasivarianza poblacional
e= Eerror del muestreo
P= Proporcin
P(1-P)= Varianza

Tamao de la muestra y precisin de los estimadores son conceptos


inseparables. Cuando uno vara, el otro tambin en el mismo sentido.

A medida que aumenta la precisin del estimador,el intervalo de


confianza se hace menor, y por tanto, las diferencias entre los
parmetros poblacionales y los estimadores se hace menor. Esta
precisin se mide por el error de muestreo, que no es mas que la
desviacin tpica del estimador.
En funcin del objetivo de nuestra investigacin, admitiremos un
margen mayor o menor de error, y en funcin de ello el tamao de la
muestra variar.
Factores que intervienen
Varianza poblacional
El conocimiento de la homogeneidad o heterogeneidad en el aspecto
que se quiere analizar, es determinante a la hora de calcular el
tamao de la muestra, cuanto mas homogneos son los elementos de
una poblacin, mayor es la precisin de sus estimadores para un
numero determinado de entrevistas.
Debera intentarse el conocimiento aproximado de la varianza: (1) La
experiencia en estudios que se repiten peridicamente o (2) mediante
estudios piloto. No obstante, como se suelen preguntar muchas
cosas, lo normal es tomar la opcin ms desfavorable p=q=0,5 exige
un tamao muestral mayor, pero garantiza que no nos
equivocaremos.
El tipo de muestreo
Tambin influye en el tamao de la muestra. En relacin al muestreo
aleatorio simple, el muestreo por conglomerados es menos preciso y el
estratificado lo es ms. De ah que siempre que se pueda, sea deseable
realizar un muestreo estratificado.
Nivel de confianza
A la hora de disear la muestra, se debe fijar el nivel de confianza, de
acuerdo con los objetivos de la investigacin. En general en CC.SS. se
utilza un nivel de confianza del 95,5% .
Afijacin de la muestra
Es la distribucin de la muestra entre los diferentes subconjuntos en que
se puede dividir el universo.
Tipos de afijacin

Simple: asignar a cada estrato un numero igual de entrevistas

Proporcional: de acuerdo con el peso relativo de la poblacin de


cada estrato.

Optima: tiene en cuenta la homo o heterogeneidad de la


poblacin bajo determinados aspectos.

Afijacin
Simple
Se pretende que la muestra, para un determinado nivel de error, sea
representativa para cada uno de los estratos, y por tanto puedan sacarse
conclusiones a ese nivel. En la prctica, y para conseguir este objetivo,
se suele utilizar la proporcional, cargando la muestra en los estratos en
los que interesa obtener estimaciones mas prximas a la realidad.
Optima
Estratos homogneos( pequea) --> Muestra pequea
Estratos heterogneos( grande) --> Muestra mayor
Desagregacin
A veces es preciso disear muestras para estimas no solo la
poblacin tomada como un todo sino tambin de diferentes partes del
universo de estudio.
Segn analizamos grupos mas pequeos de la muestra, el grado de
error en las estimaciones aumenta. Para resolver esto se pueden
adoptar varias decisiones:

Aumentar el tamao de la muestra total, hasta que el de la


submuestra sea el adecuado. Es muy costoso y poco eficiente.

Afijacin no proporcional tratando cada subdivisin como si


fuera un universo diferente. Solo se incrementa la muestra en
aquellas reas que interesa estudiar. Ejemplo de la EPA.

Ponderacin de la muestra
Las tcnicas de afijacin no proporcional hacen que las fracciones de
muestreo sean distintas y, por lo tanto, si se quieren tabular
conjuntamente las diferentes submuestras, hay que proceder a su
ponderacin, si no quieren deformarse las estimaciones. Se pretende
devolver a cada subpoblacin o estrato, la proporcionalidad que tiene
en la realidad con el objeto de poder agregarlas.
Elevadores: otra forma de homogeneizar las sumbuestras, para
poder agregarlas es recurrir al sistema de elevadores (la inversa de la
fraccin de muestreo), con lo que se consigue trasladar los resultados
al universo total. Para utilizarlos hay que conocer el tamao real del
universo, sino se falsearan los datos del estudio.

Estimaciones de parmetros
En el diseo de la muestra se determinan el tamao de la misma, la
afijacin, el tipo de muestreo y el proceso de seleccin de los
individuos, conjugando las tcnicas de muestreo y el conocimiento
del universo. Posteriormente, y en base a la muestra diseada, se
realiza la recogida de la informacin mediante el trabajo de campo, al
que se le aplican los correspondientes controles para que no se
distorsione la muestra proyectada. Mas tarde se graba la informacin,
se somete a procesos de control y verificacin y, finalmente se realiza
la tabulacin que dar como resultado la estimacin de los
parmetros poblacionales.
Entre el diseo de la muestra y la estimacin de parmetros, est el
proceso de muestreo y tabulacin, pasndose de los supuestos a la
realidad de los datos y de la aproximacin a la concrecin de los
datos.
De la formula del tamao muestral, el tamao n y el nivel de
confianza K se mantienen invariables, pero seguramente los valores
reales de P no tiene porque ser 0,5, lo que supone que el error de
muestreo e ha variado y, por tanto el nivel de precisin de las
estimaciones. Por ello una vez realizada la encuesta, hay que pasar
de las aproximaciones efectuadas en el diseo a concreciones
individualizadas.
Hay que pasar de la estimacin puntual a la estimacin por intervalo.
La estimacin
Supongamos que siguiendo el procedimiento aleatorio simple, hemos
a La expresin
obtenido una muestra de n unidades.
es un
p
n
estimador de la proporcin P.
a es el total de individuos que tiene una caracterstica.
El estimador ha sido calculado en base a las n unidades de la
muestra, en lugar de las N unidades que constituyen la poblacin. As
cometemos un error que llamaremos error tpico de muestreo. La
estimacin del error tpico de muestreo se hace mediante la frmula:
N n p * (1 p )
es
*
N
n 1

Error tpico de muestreo


Universos pequeos
Media
es

N n 2
*
N
n

Proporcin
es

N n p * (1 p )
*
N
n 1

Universos grandes
Media
es

Como

2
n

Proporcin

( 2= s2 )

N n
n
1
N
N

es

p * (1 p )
n 1

es

p * (1 p )
n

En muestras grandes n/N=0

Con la estimacin de parmetros, deseamos estimar el valor de un


parmetro a travs de un estadstico calculado en la muestra. Ej:
edad media de una poblacin o el % de abstencin en una votacin.
Estimacin puntual: Se estima un parmetro poblacional a travs
de la media o la proporcin calculados en la muestra. Un problema es
que no podemos establecer la probabilidad de que el estimador sea
igual al parmetro.
Estimacin por intervalo: Dado que la estimacin del parmetro
poblacional depende del error y del nivel de confianza, el valor
estimado no ser nico, sino que estar comprendido en un intervalo
cuyos lmites sern el estimador nivel de confianza por error tpico
del muestreo. El tamao de la muestra determina la amplitud del
intervalo.
Intervalo de confianza
A partir de la estimacin del error tpico del muestreo se pueden
determinar los intervalos de confianza, que son del tipo (p-ks, p+ks).
El valor que se trata de estimar se encuentra dentro de ese intervalo
con una confianza medida en trminos de probabilidad.
Determinada por el valor que tome k.
As, para la proporcin a un nivel de confianza del 95,5% el intervalo
ser
p2

pq
pq
P p2
n
n

Para le media ser

x2

2
2
X x2
n
n

Ejemplo
Supongamos que hacemos una encuesta para estimar el nivel de
parados. La muestra es de 1.000 entrevistas. con un margen de error
de 3,16% para un nivel de confianza del 95,5%=2 sigma y para
P=Q=50%.
Una vez realizada la encuesta el porcentaje de parados es del 12%.
Entre que valores oscilar el parmetro poblacional?
12 2

12 * 88
12 * 88
P 12 2
1000
1000

12 2,06(9,94) P 12 2,06(14,06)

Significado del intervalo


Como P es un valor fijo, la probabilidad de encontrarse entre 9,94 y
14,06 es 1 o 0. Es decir, o bien est dentro de esos limites o no est.
Lo que vara de muestra a muestra es el estadstico p, dado que al no
conocer P, se construye el intervalo alrededor de p, la posicin del
intervalo en relacin al parmetro depende de la localizacin del valor
particular de p que se ha utilizado a partir de la distribucin muestral.
Dado que el 95,5% de las proporciones p se encuentran dentro de 2
unidades de desviacion de la proporcin de la poblacin y como
hemos utilizado 2 sp para construir el intervalo alrededor de p,
cualquier p dentro de dichos lmites dar lugar a un intervalo de
confianza que incluir a P.

Z=-2

Z=2
Las proporciones p1, p2, p3, p4 y p6 se encuentran dentro del
intervalo 2 sp, mientras que la proporcin p5 se encuentra fuera de

dicho intervalo. La probabilidad del 95,5 por 100 utilizada en nuestro


ejemplo significa que si se realizara un gran nmero de estimaciones
por intervalo, tales como las que aparecen en el grfico anterior, y
cada una de ellas basada en una muestra p, el 95,5 por 100 de los
intervalos de confianza incluiran el parmetro y slo el 4,5 por 100
de ellos lo dejaran fuera.
Adems de servir como indicacin del grado de exactitud de una
estimacin, la colocacin de un intervalo de confianza alrededor de
una estimacin puede servir, implcitamente, para contrastar una
serie de hiptesis. En efecto, en un intervalo de confianza se contiene
una prueba implcita para cada posible valor del parmetro, por
ejemplo la media, que se desea contrastar. La hiptesis alternativa se
establece de forma que el valor del parmetro que se desea estimar
quede dentro del intervalo de confianza para el nivel de probabilidad
elegido. As, por ejemplo, si establecemos un nivel de significacin del
0,05, sabemos que el intervalo de confianza, en el caso de estimacin
de una media, tendr como lmites 1,96 error de la media. Pues
bien, si la media muestral queda dentro de dichos lmites se aceptar
la hiptesis, mientras que si se obtiene un valor que queda fuera se
rechazar la hiptesis.