Está en la página 1de 9

TEMA 2 TEORÍA DE MUESTREO

El muestreo estadístico es la herramienta que la Matemática utiliza para el


estudio de las características de una población a través de una determinada
parte de la misma.

2.1 Términos usuales en un estudio estadístico:

Población: Es todo conjunto de elementos, finito o infinito, definido por una o


más características, de las que gozan todos los elementos que lo componen.
Es la totalidad del universo que interesa considerar, y que es necesario que
esté bien definido para que se sepa en todo momento que elementos lo
componen.
Pero además, cuando se realiza un trabajo puntual, conviene distinguir entre
población teórica: que es el conjunto de elementos para los cuales se
requiere los resultados, y población estudiada: que es el conjunto de
elementos accesibles en nuestro estudio.
Censo: En ocasiones resulta posible estudiar cada uno de los elementos que
componen la población, en este caso se realiza un censo, es decir, el estudio
de todos los elementos que componen la población.
La realización de un censo no siempre es posible, por diferentes motivos, los
cuáles son:
Economía: el estudio de todos los elementos que componen una población,
sobre todo si esta es grande, suele ser un problema costoso en tiempo, dinero.
Las pruebas a las que hay que someter a los sujetos sean destructivas.
La población sea infinita o demasiado grande.
Cuando la numeración de elementos, se realiza sobre la población accesible
o estudiada, y no sobre la población teórica, entonces el proceso recibe el
nombre de marco o espacio muestral.
Muestra: Cuando no se realiza un censo se trabaja con una muestra, que es la
representativa de la población. Así cuando decimos que una muestra es
representativa, reúne aproximadamente las características de la población que
son importantes para la investigación
Para determinar el tamaño que debe tener una muestra hay que tomar en
cuenta varios factores como son:
el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la
varianza poblacional y el nivel de confianza.
El Parámetro a estimar. Son las medidas o datos que se obtienen sobre la
población.
Estadístico. Son los datos o medidas que se obtienen sobre una muestra y por
lo tanto una estimación de los parámetros.
Error Muestral. de estimación o estándar. Es la diferencia entre un estadístico
y su parámetro correspondiente. Es una medida de la variabilidad de las
estimaciones de muestras repetidas en torno al valor de la población, nos da
una noción clara de hasta dónde y con qué probabilidad una estimación basada
en una muestra se aleja del valor que se hubiera obtenido por medio de un
censo completo. Siempre se comete un error, pero la naturaleza de la
investigación nos indicará hasta qué medida podemos cometerlo. Podríamos
decir que es la desviación de la distribución muestral de un estadístico y su
fiabilidad.
Varianza Poblacional. Cuando una población es más homogénea la varianza
es menor y el número de entrevistas que se necesitan para construir un modelo
será más pequeño. Generalmente es un valor desconocido y hay que
estimarlo a partir de datos de estudios previos.
Nivel de Confianza. Probabilidad que la estimación efectuada se ajuste a la
realidad. Cualquier información que queremos recoger está distribuida según
una ley de probabilidad (normal o Student), así llamamos nivel de confianza a
la probabilidad de que el intervalo construido en torno a un estadístico capte el
verdadero valor del parámetro.

Ahora bien, el tamaño de la muestra que debemos escoger para hacer una
estimación del parámetro con las características especificadas (de nivel de
confianza y error de estimación.) es un problema de gran importancia ya que:
1. Si tomamos una muestra más grande de la indicada para alcanzar los
resultados propuestos, constituye un desperdicio de recursos (tiempo, dinero,
etc.); mientras que una muestra demasiado pequeña conduce a menudo a
resultados poco confiables.
2. Cuando elegimos una muestra de tamaño n sólo revisamos una fracción o
parte de la población y con base en ella tomamos decisiones que afectan a
toda la población. Es evidente que por este procedimiento se abre la posibilidad
de que nos equivoquemos en nuestras decisiones, pero esta posibilidad
depende en gran medida del tamaño de la muestra o fracción de población que
se haya analizado.
El tamaño que debe tener la muestra depende del nivel de confianza
propuesto, así como del máximo error que estemos dispuestos a admitir entre
el valor estimado y el valor real del parámetro que corresponde al error de
estimación.

Para determinar el tamaño de la muestra a partir de la consideración del nivel


de confianza y del error de estimación cuando hacemos muestreo con
repetición o en poblaciones infinitas, es necesario tener en cuenta dos
supuestos:
1. El nivel de confianza al que queremos trabajar.
2. Cual es el error máximo que estamos dispuestos a admitir en nuestra
estimación.

Existen diferentes tipos de muestreo, que pueden dividirse en dos grandes


grupos: métodos de muestreo probabilísticos y métodos de muestreo no
probabilísticos.

2.2 Métodos de muestreo probabilísticos:

Son aquellos en los que todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra y todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de
muestreo probabilísticos nos aseguran la representatividad de la muestra
extraída y son los más recomendables. Dentro de los métodos de muestreo
probabilísticos encontramos los siguientes tipos:

Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se


asigna un número a cada individuo de la población y 2) a través de algún medio
mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números
aleatorios generados con una calculadora u ordenador, etc) se eligen tantos
sujetos como sea necesario para completar el tamaño de muestra requerido.

Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior,


numerar todos los elementos de la población, pero en lugar de extraer n
números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que
es un número elegido al azar, y los elementos que integran la muestra son los
que ocupan los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los
individuos de k en k, siendo k el resultado de dividir el tamaño de la población
entre el tamaño de la muestra: k=N/n. El número i que empleamos como punto
de partida será un número al azar entre 1 y k.
El riesgo se este tipo de muestreo está en los casos en que se dan
periodicidades en la población ya que al elegir a los miembros de la muestra
con una periodicidad constante (k) podemos introducir una homogeneidad que
no se da en la población.

Muestreo aleatorio estratificado: Trata de obviar las dificultades que


presentan los anteriores ya que simplifican los procesos y suelen reducir el
error muestral para un tamaño dado de la muestra. Consiste en considerar
categorías típicas diferentes entre sí (estratos) que tienen gran homogeneidad
respecto a alguna característica.

Muestreo aleatorio por conglomerados: Los métodos presentados hasta


ahora están pensados para seleccionar directamente los elementos de la
población, es decir, que las unidades muestrales son los elementos de la
población. En el muestreo por conglomerados la unidad muestral es un grupo
de elementos de la población que forman una unidad, a la que llamamos
conglomerado. Las unidades hospitalarias, los departamentos universitarios,
una caja de determinado producto, etc, son conglomerados naturales. En otras
ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo,
las urnas electorales. Cuando los conglomerados son área geográficas suele
hablarse de "muestreo por áreas".

2.3 Métodos de muestreo no probabilísticos


A veces, para estudios exploratorios, el muestreo probabilístico resulta
excesivamente costoso y se acude a métodos no probabilísticos, aun siendo
conscientes de que no sirven para realizar generalizaciones, pues no se tiene
certeza de que la muestra extraída sea representativa, ya que no todos los
sujetos de la población tienen la misma probabilidad de se elegidos. En general
se seleccionan a los sujetos siguiendo determinados criterios procurando que
la muestra sea representativa.

Muestreo por cuotas: También denominado en ocasiones "accidental". Se


asienta generalmente sobre la base de un buen conocimiento de los estratos
de la población y/o de los individuos más "representativos" o "adecuados" para
los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo
aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de
individuos que reúnen unas determinadas condiciones, por ejemplo: 20
individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
esas características. Este método se utiliza mucho en las encuestas de opinión.

Muestreo opinático o intencional: Este tipo de muestreo se caracteriza por


un esfuerzo deliberado de obtener muestras "representativas" mediante la
inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su
utilización en sondeos preelectorales de zonas que en anteriores votaciones
han marcado tendencias de voto.

Muestreo casual o incidental: Se trata de un proceso en el que el


investigador selecciona directa e intencionadamente los individuos de la
población. El caso más frecuente de este procedimiento es utilizar como
muestra los individuos a los que se tiene fácil acceso (los profesores de
universidad emplean con mucha frecuencia a sus propios alumnos). Un caso
particular es el de los voluntarios.

Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y


estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se
emplea muy frecuentemente cuando se hacen estudios con poblaciones
"marginales", delincuentes, sectas, determinados tipos de enfermos, etc

2.4 Procedimiento para calcular el tamaño de la muestra


Para determinar el tamaño de la muestra es necesario identificar los siguientes
componentes o elementos técnicos:

Nivel de confianza: Generalmente se emplea el 95 y 99 por ciento de


confianza, es decir, se acepta un error entre el 5 y 1 por ciento
respectivamente, esto significa que si un tamaña de muestra se calcula
utilizando el 95% de confianza, la probabilidad de que los datos de la muestra
resulten idénticos en la población será igual al 95% o sea que habrá un 5% de
probabilidad de que difiera.

Para el cálculo de proporciones: Para calcular pq se debe tener en cuenta lo


siguiente:

Si se ha realizado otro estudio similar, el valor de pq utilizado puede servir para


el estudio.

De lo contrario se realiza un estudio piloto con una muestra reducida (no


probabilística) realizando preguntas sobre temas básicos de la investigación
con respuestas posible de solo2 alternativas (Sí, No o Buena , Malo, etc.). En
este caso p significa porcentaje de respuestas afirmativas o buenas y q
porcentaje de respuestas negativas o malas.

Otra variante es otorgar a p y q la misma variabilidad posible, es decir p = 0,5


y q = 0,5, esto supone que existe una total heterogeneidad.

Nivel de precisión (E): Significa la precisión con la que se generalizaran los


resultados. El nivel de precisión (E) no es el complemento del nivel de
confianza . Se puede trabajar con un nivel de confianza de 95% y un E = 5% a
8%. Debe tenerse en cuenta que al igual que sucede con el nivel de confianza,
al aumentar el termino E se eleva el tamaño muestral, siendo el nivel mínimo
generalmente aceptado del 5% (0,05)

Calculo de n en poblaciones infinitas

Z 2 2
n (1) en la variable
E2
Z 2 pq
n (2) en la proporción
E2

 x2 es la Varianza y corresponde al grado de variabilidad que presentan


las unidades de la población. Mientras más grande sea  2 mayor será el
tamaño de la muestra.

Calculo de n en poblaciones finitas

Z 2 N 2
n
NE 2  Z 2 2
no
n
n
1 o
N
Z 2 2
Donde no 
E2
Cuando se calculan proporciones es así:

Z 2 Npq
n
NE 2  Z 2 pq

no
n (6)
no
1
N
Z 2 pq
Donde no 
E2
no se considera como primera aproximación, dado que algunos
investigadores utilizan su valor, por considerarlo que económicamente,
al igual que el tiempo y los recursos humanos disponible lo permiten.

Ejemplo:

Se desea estimar el costo promedio de matricula de los estudiantes


universitario de la ciudad de Montería. Por estudios anteriores y a
precios actuales, se sabe que la desviación típica es de 18000.

1. Calcular el tamaño muestral fijando para ello un error de  3000 y


una confianza del 99%

2. Si se considera la población estudiantil que se desea que se desea


investigar es de 12000, ¿Cuál será el valor de n ?

Solución parte 1

 = 18000
E =  3000
Z = 2,57

Z 2 2
n
E2

n
2,57 2 18000 2
3000 2
n  237 ,77
La aproximamos a 238 ya que n es un número entero, es decir que el
tamaño de la muestra n = 238 estudiantes.

Solución parte 2

N = 12000
 = 18000
E =  3000
Z = 2,57

no
n donde:
no
1
N
Z 
2 2
n0 
E2

n0 
2,57 2 180002
30002
n0  237,78
Entonces
no
n
n
1 o
N
237,78
n
237,78
1
12000
n  233,15

La aproximamos a 234 ó 233 a criterio del investigador ya que n es


un número entero, es decir que el tamaño de la muestra n = 233
estudiantes ó n = 234.

Ejemplo

Una encuesta con 100 agentes de compras produjo una estimación de la


proporción de comerciantes mayoristas de tubos polivinílicos, que planean
incrementar sus compras en el próximo año la cota para el error de estimación
0.096, era relativamente grande. Su póngase que se pide a la empresa de
investigación de mercados que realizo la encuesta, que realice una nueva para
obtener una estimación, exacta hasta 0.04, con un nivel de confianza del 90%.
¿Cuántos comerciantes habría que incluir, aproximadamente en la encuesta?

Solución

Para este ejemplo de la práctica, el error de estimación es 0.04. Como el


coeficiente de confianza es 1  =0.90,  tiene que ser igual a 0.10 y
 , es 0.05 ,el valor de z, que corresponde a un área de 0.05 en el extremo de
2
valores superiores de la distribución z, es, z 0.05  1.645 entonces se requiere que
1.645 p  0.04, obien
pq
1.645  0.04
n

Para despejar n de esta ecuación, hay que sustituir un valor aproximado para p
es la misma. Podríamos usar la estimación p = 0.59, basada en la muestra de n
= 100, o si queremos estar seguros de que el tamaño muestral es
suficientemente grande, podría utilizarse p = 0.5 (al sustituir p = 0.5,
obtendremos la mayor solución posible para n) sustituiremos p = 0.5. Entonces.

1.645
0.50.5  0.04
n
n
1.6450.5  20.56
0.04
n  20.56  422.7
2

Por lo tanto, la organización de estudio de mercado tiene que incluir


aproximadamente 423 comerciantes en su encuesta si quiere estimar la
proporción p con un error menor que 0.04.

También podría gustarte