Está en la página 1de 4

Facultad de Formación del Profesorado METODOLOGÍA DE INVESTIGACIÓN

y Educación EN EDUCACIÓN
Universidad de Oviedo Curso 2013-2014

Población y muestra.
Cálculo del tamaño de la muestra y técnicas de muestreo.
José Miguel Arias Blanco
Universidad de Oviedo

La investigación científica suele acudir a la utilización de subconjuntos (muestras) de los grupos a los que
hace referencia (población). La utilización de muestras se hace bajo el supuesto de que es posible realizar
inferencias sobre la población objeto de estudio a partir de la información obtenida a partir de las
muestras. Para que se cumpla este supuesto debemos garantizar que las muestras son modelos reducidos
de la población, es decir, que se trata de muestras representativas y no sesgadas de la población de la que
han sido extraídas y que tienen un tamaño adecuado.

Las etapas del proceso de muestreo se pueden resumir en las siguientes:


1. Determinación de la población, es decir, del conjunto de casos (objetos, personas, eventos, etc.) a
los que se va a referir la investigación. En algunas ocasiones será necesario identificar
completamente cada uno de los casos.
2. Selección de la técnica de muestreo, es decir, del procedimiento concreto que se utilizará para la
selección de los casos.
3. Determinación, en su caso, del número de casos que van a formar parte de la muestra.

El tamaño de la muestra es uno de los dos aspectos cruciales a la hora de efectuar una selección que
permita generalizar los resultados obtenidos en la muestra al conjunto de la población. Es necesario tener
en cuenta que el tamaño de la muestra y la precisión de las estimaciones son conceptos íntimamente
ligados, ya que la variación en uno de ellos afecta al otro y viceversa. Los factores más relevantes que
intervienen en la determinación del tamaño de muestra son (Rodríguez Osuna, 1991; Cean D’Ancona y
Valles, 1992): varianza poblacional, tipo de muestreo y nivel de confianza.

Existe toda una formulación que permite calcular tamaños de muestra bajo el supuesto de que se emplea
algún tipo de muestreo aleatorio (Azorín y Sánchez-Crespo, 1986; Maciá, 1989a, 1989b; Rodríguez Osuna,
1991; Martínez Arias, 1995), sin embargo, este es un tema conflictivo en la investigación social. Para una
revisión de esta problemática véase Mandujano (1998) y Manzano (1998).

Como introducción al tema nos basta con indicar que se relacionan tres conceptos: el nivel de confianza, la
homogeneidad de la población y el error muestral máximo.

El nivel de confianza suele establecerse a priori por parte del investigador en uno de los dos valores
habituales: 95,5% ó 99,7% (en ocasiones la literatura recoge los valores 95% y 99%).

El error muestral es la diferencia entre el valor calculado en la muestra (estadístico) para una determinada
característica o variable y el verdadero valor de esa variable en la población (parámetro). Puesto que los
valores de los parámetros no son conocidos sólo cabe la posibilidad de establecer, a priori, un valor máximo
de error permitido. En la investigación en Ciencias Sociales suele ser admitido que el error no debe
sobrepasar el 5% por lo que, a efectos de cálculo a priori, suele tomarse como referencia un valor del 3%.

La homogeneidad de la población es la tercera de las características. Evidentemente, si la homogeneidad


es alta serían necesarios menos casos en la muestra que si la población es muy heterogénea. Puesto que
tampoco suele ser conocida se utiliza, como medida de la heterogeneidad, la variabilidad en una
característica dicotómica. En este caso, la variabilidad máxima es el resultado de producto de proporciones
iguales de individuos de cada categoría, es decir, p=q=0,5. p·q=0,25

1
METODOLOGÍA DE INVESTIGACIÓN EN EDUCACIÓN
Grado en Pedagogía

En estas condiciones la fórmula que permite calcular el tamaño de la muestra es:

z2 p q
n
E2
z2 Puntuación correspondiente al riesgo
Para n.c. 95,5% z 2
Para n.c. 99,7% z 3

p q Variablidad. Máximo p=q=0,5.

E2 Error máximo. Habitualmente se fija E entre el


3% y 5%

Si la población es poco numerosa (menor de 100.000 elementos), es necesario incluir en la fórmula su


tamaño. En este caso, la fórmula queda como sigue:

z2 p q N
n
E 2 ( N 1) z 2 p q

Estas fórmulas permiten calcular el tamaño de muestra teórica. En ocasiones el investigador tiene que
prever que podría obtener datos de menos casos por lo que se hace necesario aumentar el número de
casos de los que intentará recoger información (muestra invitada). Al conjunto de casos de los que se
recoge información suele denominarse muestra aceptante y al que finalmente proporciona información y
constituye la muestra real del estudio se la denomina muestra productora de datos.

Población
Muestra invitada

Muestra aceptante

Muestra productora
de datos

2
METODOLOGÍA DE INVESTIGACIÓN EN EDUCACIÓN
Grado en Pedagogía

Ejemplo

Si queremos calcular el tamaño necesario para obtener una muestra que pueda ser representativa en el
caso de una población muy numerosa nos podemos encontrar con lo siguiente:
el nivel de confianza decidimos que sea el 95,5%
como no conocemos la homogeneidad de la población nos ponemos en el caso más desfavorable
y tomamos p=q=0,5
el error máximo lo fijamos en un 3%.

Por tanto, sustituyendo en la fórmula correspondiente tenemos que son necesarios 1111 individuos.

z2 p q 2 2 0,5 0,5
n 1.111
E2 (0,03) 2
n.c. 95,5% z 2
p q 0,5
E 3%

En cuanto a la selección de los casos que formarán parte de la muestra es necesario tener en cuenta que
verificar si una muestra es representativa es imposible con sólo observarla. Para ello sería necesario
conocer aquellos aspectos de la población que estamos tratando de estimar, lo que nos encierra en un
círculo vicioso. Por ello, se hace imprescindible analizar cómo ha sido seleccionada dicha muestra.

Para la selección de los individuos que formarán parte de una muestra se han definido diferentes técnicas
de muestreo. La clasificación inicial las divide en técnicas probabilístcas y no probabilísticas. Cuando
llevamos a cabo una inferencia de la muestra a la población no tenemos certeza de acertar en nuestra
afirmación, tan sólo una cierta probabilidad. La fortaleza principal del muestreo probabilístico es que es
posible estimar el error muestral, es decir, la diferencia entre el resultado obtenido en la muestra y el que
se habría obtenido en el caso de emplear toda la población. Cuando la muestra es aleatoria podemos
establecer una distribución de probabilidad de los errores o un coeficiente de fiabilidad de los resultados
asociados a esas muestras. En cambio, si la muestra no es aleatoria, las estimaciones pueden ser muy
buenas, pero nunca tendremos garantías pues no es posible calcular ninguna medida de bondad asociada a
la muestra. Por este motivo todos los análisis planteados desde la estadística inferencial parten del
supuesto, más o menos explícito, de que las muestras empleadas han sido obtenidas por un método
probabilístico (Pérez Suárez y López Menéndez, 1997).

3
METODOLOGÍA DE INVESTIGACIÓN EN EDUCACIÓN
Grado en Pedagogía

En la Tabla 1 recogemos una descripción de las técnicas de muestreo más habituales.

Se numeran los individuos de la población y se extraen


Aleatorio simple aletoriamente tantos números como sujetos sean
necesarios
Se numeran los individuos de la población y se selecciona
aleatoriamente un número de 1 a k, siendo k=N/n
Probabilísticas

Aleatorio sistemático k=coeficiente de elevación


N=tamaño población
n=tamaño de la muestra
La población está dividida en estratos y se realiza el
Aleatorio estratificado
muestreo en cada uno de los estratos.
Si la población está agrupada en conglomerados o grupos
Aleatorio por
se pueden utilizar como unidad muestral el grupo y no el
conglomerados
individuo
Accidental, casual o
Se utilizan los individuos disponibles o voluntarios.
voluntarios
No probabilísticas

Se fijan unas cuotas o número de individuos que cumplen


Por cuotas
unas determinadas características.
El propio investigador determina unos criterios y
Intencional selecciona a los individuos que considera representativos
de la población
Se localizan unos pocos sujetos que conducen a otros y
Bola de nieve éstos a otros, de modo que la muestra va creciendo en
tamaño.
Tabla 1. Técnicas de muestreo

Referencias.
AZORÍN F. y SÁNCHEZ CRESPO, J.L. (1986). Métodos y Aplicaciones del Muestreo. Madrid: Alianza
Universidad.
CEAN D’ANCONA, M.A. y VALLES MARTÍNEZ, M. S. (1992). La muestra psicosocial (2). En C. Díaz (Coord.),
Psicología Social. Métodos y Técnicas de Investigación. Madrid: Eudema.
MACIÁ, A. (1989a). Muestreo aleatorio simple I. En R. Martínez Arias; A. Maciá y J.A. Pérez Ruy-Díaz,
Psicología Matemática II. Madrid: UNED.
MACIÁ, A. (1989b). Muestreo aleatorio simple II. En R. Martínez Arias; A. Maciá y J.A. Pérez Ruy-Díaz,
Psicología Matemática II. Madrid: UNED.
MANDUJANO, F. (1998). Teoría del muestreo: particularidades del diseño muestral en estudios de la
conducta social. Revista Electrónica de Metodología Aplicada, 3 (1), 1-15.
MANZANO, V. (1998). La calidad del muestreo en las investigaciones sociales. Revista Electrónica de
Metodología Aplicada, 3 (1), 16-29.
MARTÍNEZ ARIAS, R. (1995). Diseños muestrales probabilísticos. En M.T. Anguera; J. Arnau; M. Ato; R.
Martínez Arias; J. Pascual y G. Vallejo (Eds.), Métodos de Investigación en Psicología. Madrid: Síntesis.
PÉREZ SUÁREZ, R. y LÓPEZ MENÉNDEZ, A.J. (1997). Análisis de Datos Económicos II. Métodos Inferenciales.
Madrid: Pirámide.
RODRÍGUEZ OSUNA, J. (1991). Métodos de Muestreo. Madrid: CIS.

También podría gustarte