Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Planilla Milicianos
Planilla Milicianos
POBLACIÓN Y MUESTRA.
Una vez definido el problema a investigar, formulados los objetivos y delimitadas las
variables se hace necesario determinar los elementos o individuos con quienes se va a llevar a
cabo el estudio o investigación. Esta consideración nos conduce a delimitar el ámbito de la
investigación definiendo una población y seleccionando la muestra. Cualquier característica
medible de la población se denomina parámetro, los valores de los parámetros calculados
sobre muestras se conocen como estadísticos o estadígrafos, utilizan letras latinas (, s2, r...,
media, varianza, coeficiente de correlación) y describen a las citadas muestras.
3. POBLACIÓN Y UNIVERSO:
El diccionario de la RAE (2001) define la población,
en su acepción sociológica, como “Conjunto de los individuos o cosas sometido a una
evaluación estadística mediante muestreo”. En cualquier investigación, el primer problema
que aparece, relacionado con este punto, es la frecuente imposibilidad de recoger datos de
todos los sujetos o elementos que interesen a la misma.
“El término universo designa a todos los posibles sujetos o medidas de un cierto tipo... La
parte del universo a la que el investigador tiene acceso se denomina población”. (Fox, 1981: 368)
“Población es un conjunto definido, limitado y accesible del universo que forma el referente
para la elección de la muestra. Es el grupo al que se intenta generalizar los resultados ”. (Buendía,
Colás y Hernández, 1998: 28)
Etapas del Proceso Investigador: Población y Muestra. 2
Marín Ibáñez (1985: 167) señala las diferencias entre ‘población’ o ‘universo general’
y ‘universo de trabajo. El primero hace referencia a toda la población a la que queremos
extender las conclusiones de la muestra, mientras que el universo de trabajo “son los casos
que de alguna manera tenemos consignados y de los que podemos extraer la muestra”. Sierra
Bravo (1988) se refiere al universo de trabajo como ‘base de la muestra. Latorre, Rincón y
Arnal (2003) también distinguen entre población y universo, haciendo sinónimo a este ultimo
de ‘colectivo’ o ‘colectivo hipotético’. Paralelamente, Lohr (1999) habla de “población
muestreada” para referirse a la población de la que se extrae la muestra y de “población
objetivo”, entendida como la colección completa de observaciones que deseamos estudiar.
2. MUESTREO.
Habitualmente, el investigador no trabaja con todos los elementos de
la población que estudia sino sólo con una parte o fracción de ella; a veces, por que es muy
grande y no es fácil abarcarla en su totalidad.. Por ello, se elige una muestra representativa y
los datos obtenidos en ella se utilizan para realizar pronósticos en poblaciones futuras de las
mismas características.
Entre las ventajas que proporciona el muestreo (Latorre, Rincón y Arnal, 2003) suele
señalarse: el ahorro de tiempo en la realización de la investigación, la reducción de costos y
la posibilidad de mayor profundidad y exactitud en los resultados. Los inconvenientes más
comunes suelen ser: dificultad de utilización de la técnica de muestreo, una muestra mal
seleccionada o sesgada distorsiona los resultados, las limitaciones propias del tipo de
muestreo y tener que extraer una muestra de poblaciones que poseen pocos individuos con la
característica que hay que estudiar.
La importancia del muestreo radica en que no es necesario trabajar con los ‘N’
Etapas del Proceso Investigador: Población y Muestra. 3
“Aunque la razón esencial por la que se muestrea es la imposibilidad de estudiar todos los
sujetos, es un proceso lógico, porque en la práctica no es necesario obtener datos de todos los posibles
sujetos para comprender con exactitud la naturaleza del fenómeno que se estudia, sino que, en general,
se puede alcanzar esa comprensión con una parte de los sujetos. Debido a esto, se pueden aprovechar
las ventajas del muestreo, que son la reducción del coste de la investigación en tiempo y en dinero... El
ahorro de tiempo o dinero mediante el muestreo sólo es lógico cuando se puede justificar el hecho de
que los datos obtenidos a partir de la muestra proporcionarán una base firme para determinar con
exactitud las características del fenómeno que se estudia”. (Fox, 1981: 367)
Etapas del Proceso Investigador: Población y Muestra. 4
2.1. Muestra.
El Diccionario de la Lengua Española (RAE, 2001) define la muestra,
en su segunda acepción, como “parte o porción extraída de un conjunto por métodos que
permiten considerarla como representativa de él”.
“... es una parte o subconjunto de una población normalmente seleccionada de tal modo que
ponga de manifiesto las propiedades de la población. Su característica más importante es la
representatividad, es decir, que sea una parte típica de la población en la o las características que son
relevantes para la investigación”. (Jiménez Fernández, 1983: 237)
“... una parte representativa de un conjunto o población debidamente elegida, que se somete a
observación científica en representación del conjunto, con el propósito de obtener resultados válidos,
también para el universo total investigado”. (Sierra Bravo, 1988: 174)
Las muestras presentan evidentes ventajas, respecto del estudio de poblaciones. Con
una muestra relativamente reducida en relación a la población, se pueden encuestar grandes
poblaciones y núcleos humanos, que de otra manera sería muy difícil o prácticamente
imposible investigar. Suponen una gran economía en las encuestas y la posibilidad de mayor
rapidez en su ejecución. A veces, “... una muestra puede ofrecer resultados más precisos que
una encuesta total, aunque esté afectada del error que resulta de limitar el todo a una parte”.
(Sierra Bravo, 1988: 175)
2.3.
Condiciones que ha de cumplir la muestra.
Las condiciones fundamentales
que ha de cumplir una muestra son, para Sierra Bravo, cuatro:
2
Para Sierra Bravo población y universo son sinónimos.
5
Etapas del Proceso Investigador: Población y Muestra. 6
La muestra quedará formada por los ‘n’ elementos obtenidos mediante sorteo de la
población. Los procedimientos más comunes de extracción de los elementos en este tipo de
muestreo son: las tablas de números aleatorios, incluidas en los manuales de estadística; los
clásicos sistemas de lotería y otros procedimientos de extracción al azar, incluidos las
aplicaciones informáticas.
Algunos autores exigen que todos los elementos tengan la misma probabilidad de ser
seleccionados. En la práctica real puede haber diversos grados de probabilidad, lo importante
es que la conozcamos. De hecho si de un listado de papeletas con cien personas
seleccionamos uno, éste tiene 1/100 de posibilidad de ser elegido, el segundo 1/99, y así
sucesivamente... Para que esto no hubiera ocurrido tendríamos que haber empleado el
procedimiento que se conoce de obtención de la muestra con reemplazo, es decir volviendo a
colocar los que salen, para que se mantuviera la proporción del 1/100. Este último caso puede
tener interés en determinadas circunstancias, pero no en el caso de consultar, por ejemplo,
varias veces a un mismo alumno. Lo importante, para Marín Ibáñez (1985) es que
conozcamos el grado de probabilidad y, en lo posible, procurar que sea la misma.
6
Etapas del Proceso Investigador: Población y Muestra. 7
Cuando se trata de poblaciones numerosas, por ejemplo la guía telefónica o los censos
electorales, se seleccionan el primer y/o el último nombre de cada página o columna. Aunque
es un procedimiento más rudimentario, por razón de economía y tiempo suele utilizarse.
C) MUESTREO ESTRATIFICADO.
Este muestreo se utiliza cuando la población esta
constituida en estratos o conjuntos de la población homogéneos con respecto a la
característica que se estudia. Dentro de cada estrato se puede aplicar el muestreo aleatorio o
sistemático. Consiste en subdividir la población en subgrupos o estratos con arreglo a la/s
característica/s que se consideren y en elegir la muestra de modo que estén representados los
diferentes estratos.
7
Etapas del Proceso Investigador: Población y Muestra. 8
Por ejemplo, para estudiar las actitudes hacia la política de los universitarios
españoles podemos dividir el total de alumnos en estratos para asegurarnos que estarán
representadas las características que nos interesan. Posibles estratos podrían ser facultades,
titulación cursada, curso, etc. Suponiendo que se estratifica la población por titulaciones, si
del total de alumnos matriculados en las facultades españolas seleccionamos a cincuenta de
cada titulación, el muestreo ha sido estratificado constante. Para esa muestra seleccionamos el
mismo número, pero de forma proporcional al número de alumnos matriculados en cada
titulación, estamos ante una muestra estratificada proporcional.
“En la película Magic Town, el investigador de opinión pública interpretado por James Stwart,
descubrió un pueblo que tenía exactamente las mismas características que todo Estados Unidos.
Grandview poseía exactamente la misma proporción de personas que votaban por los republicanos, la
misma proporción de personas bajo la línea de la pobreza, igual proporción de mecánicos automotrices,
etcétera, que Estados Unidos visto como un todo. El personaje de Stewart sólo tenía que entrevistar a
las personas de Grandview para saber cuál era la opinión pública en la Unión Americana”. (Lohr, 1999:
2-3)
correspondientes a la población real y así mismo procuraremos que haya el mismo tanto por
ciento en la muestra que en la realidad de quienes viven en poblaciones de menos de 2.000
habitantes,de 2.001 a 5.000 habitantes, etc. El investigador ha fijado ‘n’ para la muestra y
elige libremente los individuos hasta alcanzar esa cifra.
El riesgo radica en que seleccione a personas a quienes resulta más fácil, por razones
de localización. De hecho, cuando se trabaja con entrevistas, hay una resistencia a consultar a
población dispersa en caseríos distantes o a la que está en pisos elevados sin ascensor.
Por último, Marín (1985) señala un riesgo muy generalizado, común al muestreo
probabilístico y no probabilístico, y es el del rechazo a participar en la investigación. En este
caso no hay más remedio que sustituir la población que no desea colaborar o a la que no
tenemos acceso por otra de condiciones similares, pero hay que tener mucho cuidado para
evitar el sesgo de la muestra, porque puede ocurrir que precisamente la población no
participante tenga alguna característica por la que no desee contestar, con lo cual queda
excluida de la muestra y comprensiblemente mantendrá su rechazo en los nuevos casos que
los sustituyan.
A) MUESTRAS SUPERPUESTAS.
Se seleccionan dos muestras distintas obtenidas de la
misma base de la muestra mediante la realización de dos sorteos o dos sistemas de muestreo
distintos. Es un procedimiento muy útil cuando se quiere lograr una valiosa corroboración o
verificación de los resultados obtenidos en una encuesta.
B) MUESTRAS SUCESIVAS.
Cuando interesa conocer la evolución del fenómeno
estudiado con el paso del tiempo (estudios de mercardo, electorales...), la solución es repetir
la encuesta a nuevas muestras cada cierto período de tiempo.
C) MUESTRAS COMPUESTAS.
Se conoce con este nombre al sistema de muestreo que
comprenden dos o más muestras distintas, según las diferentes partes del fenómeno
estudiado. En un estudio que abarque población de hábitats urbanos y rurales, se podría
aplicar un muestreo aleatorio simple para el primero y el de clusters para zonas rurales.
D) MUESTRAS COMPENSADAS.
Esta técnica es aplicable cuando se conoce el valor
medio que alcanza una de las características estudiadas en el universo, por ejemplo, la talla, el
peso, etc. Una vez obtenida la muestra, sería poco probable que su media coincidiera con la
de la población. La compensación consiste en sustituir unidades de la muestra por otras
nuevas elegidas también al azar, en el caso de que sus valores acerquen más la media de la
11
Etapas del Proceso Investigador: Población y Muestra. 12
E) MUESTRAS DE VOLUNTARIOS.
En algunas investigaciones el autor se ve obligado a
pedir voluntarios que quieran participar en su estudio, dado que por razones éticas o morales
no pueden utilizar ninguno de los demás procedimientos. Estas muestras presentan ciertos
sesgos y suelen presentar determinadas características, como por ejemplo: son sujetos con un
mayor nivel cultural, tienen mejor estatus social, suelen ser más inteligentes, son más
sociables, son menos convencionales, son menos conformistas, etc.
4. REPRESENTATIVIDAD DE LA MUESTRA.
Uno de los problemas fundamentales
que se le plantea al investigador en relación con el muestreo consiste en saber si el grupo
elegido es verdaderamente representativo del conjunto; para que lo sea, los rasgos de los
elementos o individuos elegidos para la muestra deben ser similares a los de toda la población
(Marín Ibáñez, 1985).
Fox (1981) señala que para lograr la representatividad se requiere: 1. Conocer qué
características (variables) están relacionadas con el problema que se estudia; 2. Capacidad
para medir esas variables, y 3. Poseer datos de la población sobre estas características o
variables para usarlos como variable de comparación. El mismo autor señala que si no se
cumple alguna de estas condiciones, para algunas de las características, se pierde la capacidad
de buscar deliberadamente la representatividad en cuanto a ella.
Por último, es necesario preguntarse qué pérdida puede tolerarse desde la selección de
la muestra inicial hasta llegar a la que proporciona los datos. Al mismo tiempo, hay que tener
en cuenta que se tiene constancia probada de que las personas que no responden tienen
opiniones o patrones de conducta distintos de las que responden; y que el porcentaje de la
pérdida también depende, para su representatividad, de cómo se distribuyan las respuestas en
la diferentes categorías de la variable. No es igual un 48% de “sí” y un “52% de “no” ante
determinada pregunta que un 16% y un 84% (Jiménez Fernández, 1983: 249). En cualquier
caso, no existe una única respuesta cuantitativa. Se suele considerar que una pérdida del 25%
debe preocupar, aún cuando no existan diferencias estadísticamente significativas; “cuando
sea inferior al 50% «se debe leer y escribir con cuidado»; y cuando la proporción es menor
del 40% no se deberían dar a conocer los datos, ni considerarlos como conclusiones válidas.
Son útiles como estudios pilotos, pero no se pueden aceptar sin hacer un estudio posterior
más exhaustivo” (Latorre, Rincón y Arnal, 2003: 83).
5. TAMAÑO DE LA MUESTRA.
13
Etapas del Proceso Investigador: Población y Muestra. 14
El tipo de datos que se desea recoger y el medio que para ello se va a emplear son
condicionantes que influyen en la menor o mayor reducción de la muestra seleccionada
(Jiménez Fernández, 1983). No es igual seleccionar, por ejemplo, aulas ya organizadas y
recoger la información en días y horas lectivos que hacerlo a través de un cuestionario
enviado por correo.
El nivel de confianza que queramos que alcancen nuestros resultados también influye
en el tamaño que debamos dar a la muestra. Entre +2 y -2 sigmas de la curva de distribución
14
Etapas del Proceso Investigador: Población y Muestra. 15
normal de Gauss4, a partir de la media, está incluido el 95.5% de la población. Esto quiere
decir que tenemos una probabilidad de que 955/1000 coincidan con los de la población total.
Si queremos alcanzar una mayor certidumbre hemos de abarcar entre +3 y -3 sigmas, en cuyo
caso el riesgo de que exista diferencia entre los estadísticos de la muestra y los parámetros de
la población sean distintos será de 997/100, pero naturalmente tendremos que elevar el
numero de elementos de la muestra. Para determinar el volumen de la muestra, de acuerdo
con el nivel de confianza, existen tablas. Bugeda (1974) recoge tablas que permiten
determinar el volumen de la muestra y el nivel de estimación para los niveles de confianza
del 99.7% y del 95%.
p = % estimado
q = 100-p
e = error permitido.
32*50*50
N = ------------------- = 5625 elementos.
22
4 * 50 * 50 * 60.000
N = ---------------------------------- = 1091 individuos.
9 (60.000-1) + 4 * 50 * 50
Como conclusión de este apartado hemos de señalar que las fórmulas anteriores
varían con el tipo de muestreo y con el sistema de afijación de la muestra (Sierra Bravo,
1988: 226)
6. ERROR MUESTRAL
Cuando se extrae una muestra de una población es frecuente
que los resultados obtenidos de la muestra no sean exactamente los valores reales de la
población. El error de muestreo ocurre al estudiar una muestra en lugar de la población total.
La diferencia entre el valor del parámetro de una población y el estadístico de una muestra
recibe el nombre de error muestral.
17
Etapas del Proceso Investigador: Población y Muestra. 18
hecho de que no hay jamás dos muestras que sean exactamente iguales” (Garret, 1976: 238).
Los estadísticos obtenidos en estas muestras al azar son estimaciones de los parámetros y sus
errores típicos miden la bondad de la estimación.
Tomando estos referentes, el error muestral o ‘error típico’ 7, sería la desviación típica
de las distintas medias obtenidas alrededor de la media de la población, suele designarse por
y mide la importancia de las variaciones de las o medias muestrales en torno a la de la
población. La fórmula que expresa esta relación es:
s = desviación típica de la muestra
e = ---------- e= error típico de la media o error muestral.
n n = tamaño de la muestra.
Los errores de medición se refieren a los fallos de los instrumentos de medida, así
como del que los aplica y corrige. Estos errores, que actúan de modo incontrolado, pueden
aumentar considerablemente el error típico de un estadístico. Por ello, un error muestral
grande no implica necesariamente falta de representatividad de la muestra, pues la variación
puede estar causada por los errores de medición. Si éstos son pequeños, un error típico grande
sí indica un considerable error de muestreo..
Los errores muestrales son debidos a dos causas principales. El primero, denominado
error de sesgo, es debido a que la muestra no es representativa de la población; el segundo,
debido al azar, se conoce como error aleatorio. Ambos se relacionan matemáticamente
mediante la siguiente expresión:
De entre las técnicas de submuestreo señalaremos como las más usuales, las
7
El error típico se define en estadística como la desviación típica de la distribución muestral de un estadístico. (Jiménez
Fernández, 1983)
18
Etapas del Proceso Investigador: Población y Muestra. 19
b) Técnica del jakknife (‘navaja’), que consiste en cortar la muestra en varias partes no
mutuamente excluyentes, es decir, con reposición.
c) Replicación repetida
e
n i p i ( 1 p i ) balanceada.
n
Las fórmulas generales que nos permiten estimar el
error muestral son:
s p (1 p )
e = ---------- e
n
n
( n isi ) 2
Estas fórmulas generales e presentan modalidades diversas según
n2
se trate de muestras con desviación típica o muestras con
proporciones, o poblaciones finitas / infinitas:
p * q
ni = elementos del estrato “i”. pi = e proporción del atributo muestral en el estrato “i”
n = número total de elementos de la muestra. n = sumatorio de todos los estratos.
En el caso de medias:
19
Etapas del Proceso Investigador: Población y Muestra. 20
El tamaño de la muestra es, en las fórmulas del error muestral, un dato que nos dan o
elegimos. No obstante, si al calcular el error éste resulta demasiado elevado -por ejemplo,
superior al 6%-, entonces estamos obligado a aumentar el tamaño de la muestra para reducir
el error. Hay una relación inversa entre tamaño de la muestra y error muestral.
El nivel de confianza adoptado es también otro dato que nos puede venir dado o que
podemos elegir. Las pruebas empíricas realizadas muestran que las distribución muestral de
medias de diferentes muestras se ajusta generalmente a una distribución normal o curva de
Gauss. Supuesto esto, el nivel de confianza será la proporción de las medias muestrales que
forman el área de esta curva de distribución normal del universo que se piensa abarcar. El
área abarcada por ± 1 sigma (68%), por ± 2 (95.5%) ó por ± 3 (99.7), que nosotros
adoptemos, recibe el nombre de nivel de confianza, porque representa el % de seguridad o
probabilidad que elegimos. Es decir, que de las medias de todas las muestras posibles que
forman en su conjunto la curva muestral, sólo consideramos como probables el 95.5%, por
ejemplo, por lo que prescindimos del otro 4.5%, por estimar que es muy improbable su
obtención, y por creer que el indicativo 95.5% nos proporciona una seguridad no total pero
suficiente en la práctica. En consecuencia, con esta elección adoptamos un riesgo razonable
de equivocarnos.
Respecto a la desviación típica hay que distinguir las muestras referentes a variables
cuantitativas (con escalas de intervalos o de razón), de las que se refieren a variables
20
Etapas del Proceso Investigador: Población y Muestra. 21
cualitativas (con escalas nominales u ordinales, de las que son tipo la variables dicotómicas
del tipo Sí/No)
Los datos obtenidos por una u otra fórmula se refieren a la varianza del universo a la
que representan. Cuando ésta no es conocida, como suele ocurrir, se utiliza en su lugar la
‘cuasivarianza’, o sea la varianza estimada mediante una pequeña muestra tomada de la
población, ya que está comprobado que éste parámetro es muy estable. Por ello, en las
muestras referidas a variables cualitativas, para hallar la desviación típica es necesario hallar,
si no se conoce ‘p’, la proporción o porcentaje que expresa el nivel estimado de la extensión
en el universo de la característica sobre la que se desea obtener información. Así, en una
encuesta sobre la extensión del consumo de una determinada marca de tabaco se deberá
estimar con anterioridad, aunque sea de manera aproximada, a través de un sondeo previo, la
proporción de fumadores y no fumadores dentro del total de la población. Cuando el sondeo
sea imposible habrá que partir de la suposición del 50%, que es el caso más desfavorable; es
decir, en que la muestra deberá ser mayor.
p * (1 p )
6.4 Error sistemático.
Los errores se clasifican, según su carácter, en
sistemáticos, aleatorios y muestrales. El error aleatorio no se suele ajustar a ninguna pauta,
varía normalmente, en cada caso distinto, en su sentido y magnitud, y por ello tiende a
anularse cuando se trata de un ( x i x ) 2 n i número elevado de casos. El
error muestral, visto más arriba, es
un error de tipo aleatorio
s i
estadístico, que tiene lugar cuando n 1 se utilizan muestras y se basa en
las fluctuaciones aleatorias del muestreo.
Para Bugeda (1974; en Sierra Bravo, 1988: 213) las principales vías de penetración
del error sistemático o de distorsión son las siguientes:
1. Modo de elección defectuoso de una muestra que hace que ésta no sea representativa.
2. La dependencia del método de muestreo de una característica de las unidades del
universo a elegir. Ello puede llevar a una hiper/sub-representatividad de la muestra.
Este sería el caso de un muestreo aleatorio sistemático realizado cada cinco
elementos, cuando en la base de la muestra también uno de cada cinco son individuos
con una característica determinada.
3. Las tendencias subjetivas conscientes o inconscientes del investigador.
21
Etapas del Proceso Investigador: Población y Muestra. 22
7. BIBLIOGRAFÍA.
BUENDÍA EISMAN, L.; COLÁS BRAVO, M.P. y HERNÁNDEZ PINA, F. (1998): Métodos
de investigación en Psicopedagogía. McGraw-Hill, Madrid.
BUGEDA, J. (1974): Manual de técnicas de investigación social. Instituto de Estudios
Políticos, Madrid.
FOX, D. J. (1981): El proceso de investigación en Educación. Eunsa, Pamplona.
GARCÍA HOZ, V. y PÉREZ JUSTE, R. (1984): La investigación del profesor en el aula.
Escuela Española, Madrid.
GARRET, H. E. (1976): Estadística en Psicología y Educación. Paidós, Buenos Aires.
GIL PASCUAL, J. A. (2004): Bases Metodológicas de la Investigación Educativa. (Análisis
de datos). UNED, Madrid.
JIMENEZ FERNÁNDEZ, C. (1983): “Población y muestra. El muestreo”. En JIMÉNEZ
FERNÁNDEZ, C., LÓPEZ-BARAJAS ZAYAS, E. y PÉREZ JUSTE, R. : Pedagogía
Experimental II. Tomo I. UNED. Madrid. pp. 229-258.
KERLINGER, F. N. (1975): Investigación del comportamiento.Técnicas y Metodología.
Interamericana, México.
22
Etapas del Proceso Investigador: Población y Muestra. 23
Esquema:
POBLACIÓN Y MUESTRA.
1. Población y Universo.
2. Muestreo.
2.1. Muestra.
2.2. Etapas del proceso de muestreo.
2.3. Condiciones que ha de cumplir la muestra.
A) Accidental o casual.
B) Intencional u opinativo.
C) Muestreo por cuotas.
3.3 Otros tipos de muestreo.
B) Muestras superpuestas.
C) M. sucesivas.
D) M. compuestas.
E) M. compensadas.
F) M. de voluntarios.
4. Representavidad de la muestra.
5. Tamaño de la muestra.
5.1 Determinación estadística del tamaño de la muestra.
5.2 Afijación de la muestra.
6. Error muestral.
6.1 Fundamento estadístico del error muestral.
6.2 Estimación del error muestral en las muestras estratificadas y de clusters.
6.3 Factores que intervienen en el error muestral.
6.4 Error sistemático.
7. Bibliografía.
© Tomás García Muñoz.
Almendralejo, 2005
24