Está en la página 1de 37

Etapas del Proceso Investigador: Poblacin y Muestra.

POBLACIN Y MUESTRA.
Una vez definido el problema a investigar, formulados los objetivos y delimitadas las variables se hace necesario determinar los elementos o individuos con quienes se va a llevar a cabo el estudio o investigacin. Esta consideracin nos conduce a delimitar el mbito de la investigacin definiendo una poblacin y seleccionando la muestra. Cualquier caracterstica medible dela poblacin se denomina parmetro, los valores de los parmetros calculados sobre muestras seconocen como estadsticos o estadgrafos, utilizan letras latinas (0, s2, r..., media, varianza, coeficiente de correlacin) y describen a las citadas muestras. Se define tradicionalmente la poblacin como el conjunto de todos los individuos (objetos, personas, eventos, etc.) en los que se desea estudiar el fenmeno. stos deben reunir las caractersticas de lo que es objeto de estudio(Latorre, Rincn y Arnal, 2003). El individuo, en esta acepcin, hace referencia a cada uno de los elementos de los que se obtiene la informacin. Los individuos pueden ser personas, objetos o acontecimientos. Hoy se prefiere hablar de unidad de observacin o elemento para referirse al objeto sobre el cual se realiza una medicin. En los estudios con poblaciones humanas, con frecuencia ocurre que la unidad de observacin son los individuos.

3.

POBLACIN Y UNIVERSO:

El diccionario de la RAE (2001) define la poblacin, en su acepcin sociolgica, como Conjunto de los individuos o cosas sometido a una evaluacin estadstica mediante muestreo. En cualquier investigacin, el primer problema que aparece, relacionado con este punto, es la frecuente imposibilidad de recoger datos de todos los sujetos o elementos que interesen a la misma. Los manuales clsicos de epistemologa suelen definir la poblacin como el conjunto de todas las medidas o personas de un cierto tipo, y la hacen sinnima del concepto ms antiguo de universo (Jimnez Fernndez, 1983; Sierra Bravo, 1988; Gil Pascual, 2004). Otros autores distinguen entre universo y poblacin (Fox, 1981; Marn Ibez, 1985; Buenda, Cols y Hernndez, 1998; Latorre, Rincn y Arnal, 2003). Estos autores consideran que el investigador casi nunca, o nunca, tiene acceso a todas las posibles medidas, elementos o personas y, por tanto, utilizan el trmino universo para designar esa entidad que lo incluye todo, reservando el concepto de poblacin a la parte del universo de la que se selecciona la muestra y sobre la que deseamos hacer inferencia o aplicacin de las generalizaciones que obtengamos de la investigacin.
El trmino universo designa a todos los posibles sujetos o medidas de un cierto tipo... La parte del universo a la que el investigador tiene acceso se denomina poblacin. (Fox, 1981: 368) Poblacin es un conjunto definido, limitado y accesible del universo que forma el referente para la eleccin de la muestra. Es el grupo al que se intenta generalizar los resultados . (Buenda, Cols y Hernndez,

Etapas del Proceso Investigador: Poblacin y Muestra. 1998: 28)

Marn Ibez (1985: 167) seala las diferencias entre poblacin o universo general y universo de trabajo. El primero hace referencia a toda la poblacin a la que queremos extender las conclusiones de la muestra, mientras que el universo de trabajo son los casos que de alguna manera tenemos consignados y de los que podemos extraer la muestra. Sierra Bravo (1988) se refiere al universo de trabajo como base de la muestra. Latorre, Rincn y Arnal (2003) tambin distinguen entre poblacin y universo, haciendo sinnimo a este ultimo de colectivo o colectivo hipottico. Paralelamente, Lohr (1999) habla de poblacin muestreada para referirse a la poblacin de la que se extrae la muestra y de poblacin objetivo, entendida como la coleccin completa de observaciones que deseamos estudiar. La definicin de la poblacin es una parte importante, y con frecuencia difcil, del estudio. Lohr, (1999: 3) advierte: Por ejemplo, en una encuesta poltica, la poblacin objetivo deberan ser todos los adultos que pueden votar? Todos los votantes registrados? Todas las personas que votaron en la ltima eleccin?. En cualquier caso, la eleccin de esta poblacin objetivo afectar profundamente al resultado de la investigacin

2.

MUESTREO.

Habitualmente, el investigador no trabaja con todos los elementos de la poblacin que estudia sino slo con una parte o fraccin de ella; a veces, por que es muy grande y no es fcil abarcarla en su totalidad.. Por ello, se elige una muestra representativa y los datos obtenidos en ella se utilizan para realizar pronsticos en poblaciones futuras de las mismas caractersticas. Salvo en el caso de poblaciones pequeas, pocas veces en una investigacin se cuenta con el tiempo, los recursos y los medios para estudiar una poblacin completa. A veces ni siquiera podemos delimitar exactamente una poblacin, otras veces la poblacin total an no existe como sucede en los estudios sobre prediccin Estos motivos de tiempo, coste, accesibilidad a los individuos y complejidad de las operaciones de recogida, clasificacin y anlisis de los datos hacen que la gran mayora de los proyectos de investigacin no estudien ms que una parte representativa de la poblacin, denominada muestra. Esto se puede hacer as porque, si se selecciona correctamente la muestra, sta puede aportarnos informacin representativa y exacta de toda la poblacin. Se conoce con el nombre de muestreo al proceso de extraccin de una muestra a partir de la poblacin. El proceso esencial del muestreo consiste en identificar la poblacin que estar representada en el estudio. Entre las ventajas que proporciona el muestreo (Latorre, Rincn y Arnal, 2003) suele sealarse: el ahorro de tiempo en la realizacin de la investigacin, la reduccin de costos y la posibilidad de mayor profundidad y exactitud en los resultados. Los inconvenientes ms comunes suelen ser: dificultad de utilizacin de la tcnica de muestreo, una muestra mal seleccionada o sesgada distorsiona los resultados, las limitaciones propias del tipo de muestreo y tener que extraer una muestra de poblaciones que poseen pocos individuos con la caracterstica que hay que estudiar. La importancia del muestreo radica en que no es necesario trabajar con los N elementos de

Etapas del Proceso Investigador: Poblacin y Muestra.

una poblacin para comprender con un nivel razonable de exactitud la naturaleza del fenmeno estudiado. Este conocimiento se puede obtener a partir de una muestra que se considere representativa de aquella poblacin.
Aunque la razn esencial por la que se muestrea es la imposibilidad de estudiar todos los sujetos, es un proceso lgico, porque en la prctica no es necesario obtener datos de todos los posibles sujetos para comprender con exactitud la naturaleza del fenmeno que se estudia, sino que, en general, se puede alcanzar esa comprensin con una parte de los sujetos. Debido a esto, se pueden aprovechar las ventajas del muestreo, que son la reduccin del coste de la investigacin en tiempo y en dinero... El ahorro de tiempo o dinero mediante el muestreo slo es lgico cuando se puede justificar el hecho de que los datos obtenidos a partir de la muestra proporcionarn una base firme para determinar con exactitud las caractersticas del fenmeno que se estudia. (Fox, 1981: 367)

4 El Diccionario de la Lengua Espaola (RAE, 2001) define la muestra, en su segunda acepcin, como parte o porcin extrada de un conjunto por mtodos que permiten considerarla como representativa de l. En el terreno epistemolgico, Jimnez Fernndez (1983) destaca la condicin de representatividad que ha de tener la muestra:
... es una parte o subconjunto de una poblacin normalmente seleccionada de tal modo que ponga de manifiesto las propiedades de la poblacin. Su caracterstica ms importante es la representatividad, es decir, que sea una parte tpica de la poblacin en la o las caractersticas que son relevantes para la investigacin. (Jimnez Fernndez, 1983: 237)

2.1. Muestra.

Sierra Bravo hace hincapi en la generalizacin de resultados:


... una parte representativa de un conjunto o poblacin debidamente elegida, que se somete a observacin cientfica en representacin del conjunto, con el propsito de obtener resultados vlidos, tambin para el universo total investigado. (Sierra Bravo, 1988: 174)

Latorre, Rincn y Arnal ponen especial nfasis en la metodologa del muestreo:


Conjunto de casos extrados de una poblacin, seleccionados por algn mtodo de muestreo. (Latorre, Rincn y Arnal, 2003: 78)

Las muestras tienen un fundamento matemtico estadstico. ste consiste en que obtenidos unos determinados resultados, de una muestra elegida correctamente y en proporcin adecuada, se puede hacer la inferencia o generalizacin fundada matemticamente de que dichos resultados son vlidos para la poblacin de la que se ha extrado la muestra, dentro de unos limites de error y probabilidad, que se pueden determinar estadsticamente en cada caso. Las muestras presentan evidentes ventajas, respecto del estudio de poblaciones. Con una muestra relativamente reducida en relacin a la poblacin, se pueden encuestar grandes poblaciones y ncleos humanos, que de otra manera sera muy difcil o prcticamente imposible investigar. Suponen una gran economa en las encuestas y la posibilidad de mayor rapidez en su ejecucin. A veces, ... una muestra puede ofrecer resultados ms precisos que una encuesta total, aunque est afectada del error que resulta de limitar el todo a una parte. (Sierra Bravo, 1988: 175) La seleccin correcta de la muestra implica crear una que represente a la poblacin con la mayor fidelidad posible. Esto conlleva utilizar unas tcnicas especficas de seleccin de la muestra, as como la necesidad de determinar su tamao ptimo. En este proceso de seleccin hemos de distinguir entre elemento muestral, unidad de muestreo1 y marco de muestreo. El elemento o individuo (muestral) es un
1 Se considera unidad de muestreo a la unidad, o elementos, con los que confeccionamos la muestra: personas,
familias, centros, empresas...

objeto en el cual se toman las mediciones, la unidad ms pequea en que podemos 5 descomponer la muestra. La unidad de muestreo hace referencia a la unidad donde realizamos la muestra, est constituida por grupos excluyentes de elementos de la poblacin que completan la misma. Por ejemplo, podramos desear estudiar a un grupo de personas (una ciudad, una barriada, un grupo de estudiantes de un determinado nivel educativo, los trabajadores de un sector de produccin, etc.), pero no tenemos una lista de todos los individuos que pertenecen a la poblacin. En su lugar las familias, los centros educativos, las empresas... podran servir como unidades de muestreo. Las unidades de observacin o elementos muestrales seran los individuos que viven en una familia o que trabajan en una determinada empresa... La lista de las unidades de muestreo (familias, centros educativos, empresas...) constituyen el marco de muestreo. 2.2 Etapas del proceso de muestreo.

Fox (1981: 367-369) seala cinco etapas en el proceso de muestreo: 1) Definicin o seleccin del universo o especificacin de los posibles sujetos o elementos de un determinado tipo; 2) Determinacin de la poblacin o parte de ella a la que el investigador tiene acceso; 3) Seleccin de la muestra invitada o conjunto de elementos de la poblacin a los que se pide que participen en la investigacin; 4) Muestra aceptante o parte de la muestra invitada que acepta participar; 5) Muestra productora de datos; la parte que acept y que realmente produce datos. Condiciones que ha de cumplir la muestra. Las condiciones fundamentales que ha de cumplir una muestra son, para Sierra Bravo, cuatro: 1. 2.
Que comprendan parte del universo2 y no la totalidad de ste. Que su amplitud sea estadsticamente proporcionada a la magnitud del universo. Esta condicin se halla en relacin con el punto prctico de determinacin del tamao de la muestra y sirve para decidir si, segn las unidades que comprende respecto al universo, una muestra es o no admisible. La ausencia de distorsin en la eleccin de los elementos de la muestra. Si esta eleccin presenta alguna anomala, la muestra resultar por este mismo hecho viciada. Que sea representativa o reflejo fiel del universo, de tal modo que reproduzca sus caractersticas bsicas en orden a la investigacin. Esto quiere decir que si hay sectores diferenciados en la poblacin que se supone ofrecen caractersticas especiales, a efectos de los objetivos de la investigacin, la muestra tambin deber comprenderlos y precisamente en la misma proporcin, es decir, deber estar estratificada como el universo. (Sierra Bravo, 1988: 175)

2.3.

3. 4.

2 Para Sierra Bravo poblacin y universo son sinnimos.

Para cumplir estas condiciones es necesario aplicar unas determinadas tcnicas de 6 seleccin de la muestra que garanticen su representatividad, determinar el tamao ptimo de la muestra y tener en cuenta el error muestral. En los apartados siguientes desarrollaremos estos aspectos.

TIPOS O TCNICAS DE MUESTREO.

Aunque no existe una nica forma de clasificar las tcnicas de muestreo, es frecuente clasificarlas en probabilsticas y no probabilsticas. 3.1 Muestreo probabilstico. Conocido tambin como muestreo de seleccin aleatoria, utiliza el azar como instrumento de seleccin, pudindose calcular de antemano la probabilidad de que cada elemento sea incluido en la muestra. Para Marn Ibaez (1985) este tipo de muestreo es el que alcanza mayor rigor cientfico, y se caracteriza porque se cumple el principio de la equiprobabilidad, segn el cual todos los elementos de la poblacin tienen la misma probabilidad de salir elegidos en una muestra. El muestreo por azar o probabilstico presenta varias modalidades:
A) MUESTREO ALEATORIO SIMPLE.

Es la modalidad de muestreo ms conocida y que alcanza mayor rigor cientfico. Garantiza la equiprobabilidad de eleccin de cualquier elemento y la independencia de seleccin de cualquier otro. En este procedimiento se extraen al azar un nmero determinado de elementos, n, del conjunto mayor N o poblacin, procediendo segn la siguiente secuencia: a) definir la poblacin, confeccionar una lista de todos los elementos, asignndoles nmeros consecutivos desde 1 hasta n; b) la unidad de base de la muestra debe ser la misma; c) definir el tamao de la muestra, y d) extraer al azar los elementos. La muestra quedar formada por los n elementos obtenidos mediante sorteo de la poblacin. Los procedimientos ms comunes de extraccin de los elementos en este tipo de muestreo son: las tablas de nmeros aleatorios, incluidas en los manuales de estadstica; los clsicos sistemas de lotera y otros procedimientos de extraccin al azar, incluidos las aplicaciones informticas. Algunos autores exigen que todos los elementos tengan la misma probabilidad de ser seleccionados. En la prctica real puede haber diversos grados de probabilidad, lo importante es que la conozcamos. De hecho si de un listado de papeletas con cien personas seleccionamos uno, ste tiene 1/100 de posibilidad de ser elegido, el segundo 1/99, y as sucesivamente... Para que esto no hubiera ocurrido tendramos que haber empleado el procedimiento que se conoce de obtencin de la muestra con reemplazo, es decir volviendo a colocar los que salen, para que se mantuviera la proporcin del 1/100. Este ltimo caso puede tener inters en determinadas circunstancias, pero no en el caso

de consultar, por ejemplo, varias veces a un mismo alumno. Lo importante, para Marn 7 Ibez (1985) es que conozcamos el grado de probabilidad y, en lo posible, procurar que sea la misma. La sencillez del procedimiento se complica cuando la poblacin es muy grande y las ayudas mecanizadas no siempre se pueden o se deben utilizar. Pensemos la dificultad que tendra, por este procedimiento, obtener una muestra de la poblacin de Madrid. B)
MUESTREO ALEATORIO SISTEMTICO.

El empleo de muestras sistemticas consiste en una variante del anterior tipo de muestreo. Primero se calcula I (frecuencia de los casos) mediante la frmula I= N/n. Despus se elige un nmero menor o igual que I, es decir, que cumpla la condicin: 1#a#I. Por ltimo se seleccionan los nmeros en la tabla de nmero aleatorios, que sern: a, a+I, a+2I, a +3I, etc. Si tenemos la poblacin a estudiar, previamente inscrita en unas listas numeradas, obtenida la frecuencia de los casos iremos eligiendo saltando los nmeros que indique la frecuencia. Si queremos obtener una muestra de 20 sobre una poblacin de 100 (I = 100/20 = 5), podramos partir el muestreo del n 5, el 10, el 15; o el 3, 8, 13... El primer elemento (a) suele elegirse al azar usando las tablas de probabilidad y, a continuacin, se le suma la frecuencia. Si el azar hizo que se partiera de un elemento de la lista mayor que I, al llegar a N, se vuelve al principio de la lista hasta completar n casos. Cuando se trata de poblaciones numerosas, por ejemplo la gua telefnica o los censos electorales, se seleccionan el primer y/o el ltimo nombre de cada pgina o columna. Aunque es un procedimiento ms rudimentario, por razn de economa y tiempo suele utilizarse. La eleccin sistemtica partiendo de listas es vlida si el orden no ha sido establecido teniendo en cuenta la caracterstica que estudiamos. No pueden servir, por ejemplo, listas en orden de calificaciones acadmicas si sta es una de las variables de investigacin. Un peligro de este mtodo es el que se den periodicidades en la poblacin que anulen la representatividad de la muestra. Supongamos que I = 10 y trabajamos con empleados de una empresa agrupados en Departamentos en los que el personal est listado segn categoras profesionales, por este orden: 1 directivo, 14 profesionales especializados, 5 administrativos. Al elegir la muestra por este mtodo, sta quedar sesgada porque elegir siempre, por ejemplo, un directivo por cada departamento o bien porque no lo elegir nunca. Este procedimiento es ms rpido que el anterior, sobre todo si la poblacin es numerosa y est previamente ordenada. Es muy utilizado en los sondeos de opinin y de puerta a puerta. A los entrevistadores se les indica que paren a cada I personas o llamen a cada I puertas.

8 C)
MUESTREO ESTRATIFICADO.

Este muestreo se utiliza cuando la poblacin esta constituida en estratos o conjuntos de la poblacin homogneos con respecto a la caracterstica que se estudia. Dentro de cada estrato se puede aplicar el muestreo aleatorio o sistemtico. Consiste en subdividir la poblacin en subgrupos o estratos con arreglo a la/s caracterstica/s que se consideren y en elegir la muestra de modo que estn representados los diferentes estratos. Para la obtencin de la muestra estratificada se siguen los siguientes pasos: a) se divide la poblacin en estratos; b) de cada estrato se extrae una muestra por algn procedimiento de muestreo; c) el nmero de individuos de cada estrato se puede decidir por paridad o proporcionalidad; y d) la suma de las muestras de cada estrato forman la muestra total n. (Latorre, Rincn y Arnal, 2003) Dentro del muestreo estratificado suele distinguirse: 0* SMuestreo estratificado constante. En este caso, tambin conocido como afijacin simple3, la muestra se obtiene seleccionando un nmero igual de individuos de cada estrato en que se ha dividido la poblacin, con independencia del tamao y variabilidad de los mismos dentro de la poblacin. M. Estratificado proporcional. En este caso se selecciona de cada estrato un nmero de elementos proporcional a su tamao en el conjunto de la poblacin (afijacin proporcional). Jimnez Fernndez (1983) considera que un criterio ms til para fijar la proporcin de la muestra es atender a la variabilidad de los estratos en la caracterstica que interesa ( afijacin ptima). Si sus varianzas son aproximadamente homogneas, el muestreo estratificado proporcional es el aconsejado; si por el contrario difieren mucho entre s, debe tomarse un porcentaje mayor de elementos de los estratos que mayor varianza experimentan.

0*

Por ejemplo, para estudiar las actitudes hacia la poltica de los universitarios espaoles podemos dividir el total de alumnos en estratos para asegurarnos que estarn representadas las caractersticas que nos interesan. Posibles estratos podran ser facultades, titulacin cursada, curso, etc. Suponiendo que se estratifica la poblacin por titulaciones, si del total de alumnos matriculados en las facultades espaolas seleccionamos a cincuenta de cada titulacin, el muestreo ha sido estratificado constante. Para esa muestra seleccionamos el mismo nmero, pero de forma proporcional al nmero de alumnos matriculados en cada titulacin, estamos ante una muestra estratificada proporcional.
MUESTREO POR CONGLOMERADOS (CLUSTERS) O GRUPOS.

3 Cfr. apdo. 5.2 de este captulo.

El muestreo 9 individual resulta muchas veces inaplicable y hay que recurrir no a los elementos, sino a seleccionar por el sistema del azar determinados colectivos. Podramos hacer una encuesta, por ejemplo, mediante el sistema de muestreo aleatorio simple, a todos los alumnos de Bachillerato de una determinada ciudad. Las complicaciones y dificultades seran mucho menores estableciendo una muestra al azar que tomara como unidades base del muestreo las aulas. La muestra de grupos o racimos tambin se denomina conglomerados o clusters, en terminologa sajona. Este tipo de muestreo se utiliza cuando los individuos de la poblacin constituyen grupos naturales o conglomerados (distrito, centros escolares, aulas, empresas, etc.) En el muestreo por grupos el proceso sigue estos pasos: la poblacin se divide previamente en grupos o conglomerados que contienen diversos elementos y, a continuacin, se seleccionan aleatoriamente el nmero de conglomerados y se trabaja con el total de elementos pertenecientes a los conglomerados elegidos. La unidad muestral es el conglomerado (cluster) o grupo y el proceso de seleccin aleatoria se aplica a la seleccin de stos y no a los elementos menores que componen el conglomerado. Una ventaja de esta tcnica de muestreo radica en que no es necesario identificar ni tener un listado de todos los elementos de la poblacin para seleccionarlos aleatoriamente, sino que despus de seleccionados los conglomerados, se procede a elaborar dicho listado slo para los elementos que componen los conglomerados elegidos. D)
MUESTREO POR ETAPAS O POLIETPICO.

Relacionado con el tipo anterior. Se procede dividiendo la poblacin en varios conglomerados y se selecciona un nmero de ellos, que constituyen las unidades muestrales primarias. En una segunda etapa se obtiene una submuestra a partir de las anteriores, que constituyen las unidades muestrales secundarias, y as sucesivamente. Se submuestrean las unidades anteriores hasta llegar a la muestra final. El proceso sigue una secuencia de etapas de seleccin de unidades muestrales de mayor rango a otras de menor, hasta llegar a los individuos o elementos que constituyen la muestra: Comunidad Autnoma, distrito escolar, centros, aulas, alumnos. Este tipo de muestreo slo necesita conocer los individuos que integran los conglomerados de la ltima etapa. En cada etapa puede aplicarse un muestreo aleatorio.

3.2

Muestreo no probabilstico.

En estas tcnicas no se utiliza el muestreo al azar sino que la muestra se obtiene atendiendo al criterio o criterios del investigador o bien por razones de economa, comodidad, etc. Consecuentemente, estas tcnicas no utilizan el criterio de equiprobabilidad, sino que siguen otros criterios, procurando que la

muestra obtenida sea lo ms representativa posible. Estas muestras, al no utilizar 10 el muestreo al azar, no tienen la garanta de las muestras probabilsticas, pero en la prctica son a menudo necesarias e inevitables, en opinin de Kerlinger (1975). Dentro de este tipo de muestreo se suele distinguir entre muestreo accidental, intencional o deliberado y por cuotas.

A)

11 Este tipo de muestreo se caracteriza por utilizar las muestras que tiene a su alcance. Se denominan accidentales porque no responden a una planificacin previa en cuanto a los sujetos a elegir. De hecho, toma las muestras disponibles sin introducir seleccin o modificacin alguna. Por ejemplo, empresas, centros completos, cursos o grupos dentro de un nivel, etc.
MUESTREO ACCIDENTAL O CASUAL.

El criterio de seleccin de los individuos depende de la posibilidad de acceder a ellos. Es frecuente utilizar sujetos que las condiciones nos permiten (muestras que proporcionan los amigos). Por ejemplo, entrevistar a la salida del metro, o a las personas que pasan por un calle. Desde el punto de vista de la investigacin este tipo de muestreo es ms dbil. No obstante, puede usarse en estudios exploratorios cuando no se disponen de otras, cuidando mucho el anlisis y la interpretacin de resultados.

B)

12 En esta tcnica, el investigador selecciona de modo directo los elementos de la muestra que desea participen en su estudio. Se eligen los individuos o elementos que se estima que son representativos o tpicos de la poblacin. Se sigue un criterio establecido por el experto o investigador. Se suelen seleccionar los sujetos que se estima que pueden facilitar la informacin necesaria.
MUESTREO INTENCIONAL U OPINATIVO.

Este mtodo, que Jimnez Fernndez (1983) califica de deliberado, se justifica cuando se quieren estudiar elementos excepcionales de cierta poblacin, ya que la forma de asegurarse de que se incluirn en dicho estudio, es elegirlos intencionalmente. No dudando de su utilidad, se presta a crticas porque las muestras obtenidas resultan inevitablemente sesgadas en el sentido del criterio que se ha usado para seleccionarla. En estas muestras opinticas (Latorre, Rincn y Arnal; 2003), buscamos deliberadamente los elementos de la muestra porque nos parece que pueden facilitarnos una informacin ms vlida. Si queremos datos sobre la poblacin delincuente ser interesante recurrir a los servicios policiales, a los centros penitenciarios o de rehabilitacin social o a los propios reclusos, que no son naturalmente toda la poblacin delincuente. Hay que convenir con Marn (1985) que no todas las opiniones son igualmente cualificadas, y cuando nos interesa una informacin ms vlida, la experiencia y la preparacin pueden inducirnos a seleccionar deliberadamente la muestra de acuerdo con unas caractersticas no aleatorias. Hay muestras intencionadas que parten de elementos tpicos o representativos a los que ya pblicamente se les ha reconocido tal rango. En Espaa, en las Elecciones Generales se sabe que el escrutinio de apenas ocho decenas de mesas electorales, ya determinadas, tienen un valor extrapolable al resultado global de las citadas elecciones. Este tipo de muestras han sido ampliamente divulgado por los medios de comunicacin:
En la pelcula Magic Town, el investigador de opinin pblica interpretado por James Stwart, descubri un pueblo que tena exactamente las mismas caractersticas que todo Estados Unidos. Grandview posea exactamente la misma proporcin de personas que votaban por los republicanos, la misma proporcin de personas bajo la lnea de la pobreza, igual proporcin de mecnicos automotrices, etctera, que Estados Unidos visto como un todo. El personaje de Stewart slo tena que entrevistar a las personas de Grandview para saber cul era la opinin pblica en la Unin Americana. (Lohr, 1999: 2-3)

C)

MUESTREO POR CUOTAS.

El sistema de cuotas consiste en fijar unas cuotas. Cada cuota consiste en un nmero de elementos que renen unas determinadas condiciones. La seleccin de las cuotas suele hacerse mediante rutas o itinerarios. En este procedimiento se parte de una muestra estratificada cuyas proporciones debe conservar el investigador, pero cada uno de los casos queda a su arbitrio elegirlos. Supongamos que queremos averiguar el nivel cultural de unos determinados profesionales de un rea geogrfica o de un sector productivo. Como el sexo, la edad y el

lugar de residencia, parecen factores condicionantes, deberemos establecer que haya un 13 50% de varones y de mujeres, un tanto por ciento aproximado por grupos de edad correspondientes a la poblacin real y as mismo procuraremos que haya el mismo tanto por ciento en la muestra que en la realidad de quienes viven en poblaciones de menos de 2.000 habitantes,de 2.001 a 5.000 habitantes, etc. El investigador ha fijado n para la muestra y elige libremente los individuos hasta alcanzar esa cifra. El riesgo radica en que seleccione a personas a quienes resulta ms fcil, por razones de localizacin. De hecho, cuando se trabaja con entrevistas, hay una resistencia a consultar a poblacin dispersa en caseros distantes o a la que est en pisos elevados sin ascensor. Por ltimo, Marn (1985) seala un riesgo muy generalizado, comn al muestreo probabilstico y no probabilstico, y es el del rechazo a participar en la investigacin. En este caso no hay ms remedio que sustituir la poblacin que no desea colaborar o a la que no tenemos acceso por otra de condiciones similares, pero hay que tener mucho cuidado para evitar el sesgo de la muestra, porque puede ocurrir que precisamente la poblacin no participante tenga alguna caracterstica por la que no desee contestar, con lo cual queda excluida de la muestra y comprensiblemente mantendr su rechazo en los nuevos casos que los sustituyan.

3.3

Otros tipos de muestreo. Sierra Bravo (1988: 197 ss.) presenta otros

mtodos menos utilizados.

A)

14 Se seleccionan dos muestras distintas obtenidas de la misma base de la muestra mediante la realizacin de dos sorteos o dos sistemas de muestreo distintos. Es un procedimiento muy til cuando se quiere lograr una valiosa corroboracin o verificacin de los resultados obtenidos en una encuesta.
MUESTRAS SUPERPUESTAS.

B)

MUESTRAS SUCESIVAS.

Cuando interesa conocer la evolucin del fenmeno estudiado con el paso del tiempo (estudios de mercardo, electorales...), la solucin es repetir la encuesta a nuevas muestras cada cierto perodo de tiempo. C)
MUESTRAS COMPUESTAS.

Se conoce con este nombre al sistema de muestreo que comprenden dos o ms muestras distintas, segn las diferentes partes del fenmeno estudiado. En un estudio que abarque poblacin de hbitats urbanos y rurales, se podra aplicar un muestreo aleatorio simple para el primero y el de clusters para zonas rurales. D)
MUESTRAS COMPENSADAS.

Esta tcnica es aplicable cuando se conoce el valor medio que alcanza una de las caractersticas estudiadas en el universo, por ejemplo, la talla, el peso, etc. Una vez obtenida la muestra, sera poco probable que su media coincidiera con la de la poblacin. La compensacin consiste en sustituir unidades de la muestra por otras nuevas elegidas tambin al azar, en el caso de que sus valores acerquen ms la media de la muestra a la del universo. E)
MUESTRAS DE VOLUNTARIOS.

En algunas investigaciones el autor se ve obligado a pedir voluntarios que quieran participar en su estudio, dado que por razones ticas o morales no pueden utilizar ninguno de los dems procedimientos. Estas muestras presentan ciertos sesgos y suelen presentar determinadas caractersticas, como por ejemplo: son sujetos con un mayor nivel cultural, tienen mejor estatus social, suelen ser ms inteligentes, son ms sociables, son menos convencionales, son menos conformistas, etc. 4. REPRESENTATIVIDAD DE LA MUESTRA.

Uno de los problemas fundamentales que se le plantea al investigador en relacin con el muestreo consiste en saber si el grupo elegido es verdaderamente representativo del conjunto; para que lo sea, los rasgos de los elementos o individuos elegidos para la muestra deben ser similares a los de toda la poblacin (Marn Ibez, 1985). La representatividad es la caracterstica ms importante de una muestra. El

muestreo adquiere todo su sentido en cuanto que garantiza que las caractersticas que 15 se quieren observar en la poblacin quedan reflejadas adecuadamente en la muestra. Generalizar a la poblacin a partir de la muestra slo est justificado si sta representa realmente a la poblacin.
Preservar la representatividad es el atributo ms importante que debe reunir el muestreo, lo que nos permitir generalizar a la poblacin los resultados obtenidos en la muestra. (Latorre, Rincn y Arnal, 2003: 82)

Fox (1981) seala que para lograr la representatividad se requiere: 1. Conocer qu caractersticas (variables) estn relacionadas con el problema que se estudia; 2. Capacidad para medir esas variables, y 3. Poseer datos de la poblacin sobre estas caractersticas o variables para usarlos como variable de comparacin. El mismo autor seala que si no se cumple alguna de estas condiciones, para algunas de las caractersticas, se pierde la capacidad de buscar deliberadamente la representatividad en cuanto a ella. La seleccin aleatoria de la muestra garantiza la ausencia de sesgo en el proceso de seleccin de la misma, ayuda a garantizar su representatividad, pero esta circunstancia no es garanta total para que estemos seguros de que la muestra al azar es representativa de la poblacin de la que se ha extrado (Kerlinger, 1985). Se espera que sea representativa de las caractersticas relevantes de la poblacin, pero pudiera no serlo. Lo normal es que lo sea, ya que lo tpico, lo representativo de la poblacin, es lo que aparece con ms frecuencia, pero no hay seguridad total. El muestreo estratificado proporcional asegura, en cambio, la representatividad en cuanto a una o dos caractersticas (Jimnez Fernndez, 1983). Para Fox (1981) otra forma de analizar el problema de la representatividad de la muestra consiste en distinguir entre la muestra invitada, la muestra aceptante y la muestra productora de datos. La primera corresponde al conjunto de individuos invitados del conjunto de la poblacin, la segunda hace referencia al grupo de individuos que aceptan participar y la muestra productora de datos coincide con la muestra real del estudio. Si se poseen datos sobre la poblacin se pueden comparar con ellos la muestra invitada y/o la aceptante y, mediante algn contraste de significacin adecuado (por ejemplo chi-cuadrado), determinar si difieren de ella en las caractersticas que interesa en una investigacin dada. Si el contraste indica que no hay diferencias significativas en las variables consideradas, se puede admitir la representatividad de la muestra para las caractersticas en cuestin, pero nada se puede afirmar sobre la representatividad de la muestra respecto de cualquier otra variable Si, por el contrario, no se ha logrado representatividad en una o varias variables, el investigador tiene dos opciones: a) trabajar con la muestra no representativa y contar con ese lmite; b) seleccionar ms elementos de la poblacin, con la esperanza de que una muestra mayor s sea representativa, aunque el estudio tenga una muestra mayor de buscada inicialmente.

16 Para realizar el contraste de representatividad de las muestras respecto de la poblacin, hemos supuesto que se tienen datos sobre ella. Si no se tuvieran datos de la poblacin, no se puede realizar el contraste de la muestra invitada y/o aceptante con respecto a la poblacin. Entonces se recurre a contrastar la muestra aceptante con la invitada. Sobre la muestra productora de datos siempre posee valores el investigador, ya que su referente comparativo es la muestra aceptante. Un informe sobre los elementos que se negaron a participar, de los que aceptaron participar pero luego no pudieron y de los que aceptando, en un primer momento, se negaron a hacerlo al conocer ms profundamente la investigacin; orientar al investigador y al destinatario de la investigacin sobre la posibilidades de sesgo en esta etapa del muestreo. Una prueba de significacin adecuada entre estas dos muestras (aceptante y final) servira para ver si difieren significativamente en algunas de las variables bsicas o si, por el contrario, la muestra productora de datos sigue siendo representativa de la muestra aceptante, lo que demuestra que esa/s caracterstica/s no han sido consideradas para no participar. Por ltimo, es necesario preguntarse qu prdida puede tolerarse desde la seleccin de la muestra inicial hasta llegar a la que proporciona los datos. Al mismo tiempo, hay que tener en cuenta que se tiene constancia probada de que las personas que no responden tienen opiniones o patrones de conducta distintos de las que responden; y que el porcentaje de la prdida tambin depende, para su representatividad, de cmo se distribuyan las respuestas en la diferentes categoras de la variable. No es igual un 48% de s y un 52% de no ante determinada pregunta que un 16% y un 84% (Jimnez Fernndez, 1983: 249). En cualquier caso, no existe una nica respuesta cuantitativa. Se suele considerar que una prdida del 25% debe preocupar, an cuando no existan diferencias estadsticamente significativas; cuando sea inferior al 50% se debe leer y escribir con cuidado; y cuando la proporcin es menor del 40% no se deberan dar a conocer los datos, ni considerarlos como conclusiones vlidas. Son tiles como estudios pilotos, pero no se pueden aceptar sin hacer un estudio posterior ms exhaustivo (Latorre, Rincn y Arnal, 2003: 83).

5.

TAMAO DE LA MUESTRA.

El tamao de la muestra, un tema que siempre preocupa, no tiene fcil solucin y va estrechamente unido a la representatividad. En principio hay que rechazar la idea, demasiado extendida, de que la muestra debe ser proporcional a la poblacin. De hecho, a medida que aumenta sta, con una menor proporcin podemos alcanzar la representatividad. No obstante, en igualdad de otras condiciones, los estadsticos calculados con muestras grandes son ms precisos que los calculados con muestras pequeas, pero una muestra representativa de 50 elementos es preferible a otra no representativa de 100 (Jimnez Fernndez, 1983). No existe un tamao ideal de la muestra. A efectos descriptivos, se considera una muestra grande cuando n > 30. Una muestra debe ser lo suficientemente grande como

para ser representativa, pero el nmero de elementos necesarios para lograr 17 la representatividad vara de una investigacin a otra. Cuanto ms homognea es una poblacin en la/s caracterstica/s objeto de estudio, ms fcil resulta obtener muestras representativas sin necesidad de que sean grandes. Es decir, el tamao de la muestra est en relacin directa con la desviacin tpica de las puntuaciones en la/s caractersticas de la variable a investigar. El tamao de la muestra viene condicionado por el tanto por ciento de la caracterstica que estamos estudiando. Cuando no se conoce es conveniente hacer algn pequeo estudio inicial con una muestra mucho menor para tener alguna idea de ese porcentaje. Por ejemplo, alumnos que se matriculan en los programas de formacin y despus no asisten o abandonan. Cuando tenemos una proporcin de la caracterstica del 50% estamos ante lo que se designa como el caso ms desfavorable porque exige la muestra mayor. Si no conocemos la proporcin se asigna el 50% como la opcin ms segura en los clculos de la muestra. El tipo de datos que se desea recoger y el medio que para ello se va a emplear son condicionantes que influyen en la menor o mayor reduccin de la muestra seleccionada (Jimnez Fernndez, 1983). No es igual seleccionar, por ejemplo, aulas ya organizadas y recoger la informacin en das y horas lectivos que hacerlo a travs de un cuestionario enviado por correo.

El tamao de la muestra tambin depende del tipo de muestreo que se ha llevado 18 a cabo. Por ejemplo, en las muestras estratificadas, el error es menor que en las no estratificadas, y tambin lo es el tamao de la muestra necesario. (Sierra Bravo, 1988: 226) El tamao de la muestra puede dilucidarse en parte preguntndose por la cuanta del error que es probable cometer al calcular diversos estadsticos partiendo de muestras de diferente tamao. Se considera clsica la curva de error de Kerlinger (1975) en la que el error aumenta a medida que disminuye el tamao de la muestra y a la inversa, entendiendo por error la desviacin con respecto a los parmetros de la poblacin. Consecuentemente este autor recomienda usar muestras grandes, no porque sean buenas en s mismas sino para dar al principio de distribucin al azar una probabilidad de actuar. As, por ejemplo, seleccionada al azar una muestra de personas es ms fcil, a medida que aumenta el nmero de personas de la muestra, que el porcentaje de mujeres y de hombres se equilibre. El nivel de confianza que queramos que alcancen nuestros resultados tambin influye en el tamao que debamos dar a la muestra. Entre +2 y -2 sigmas de la curva de distribucin normal de Gauss4, a partir de la media, est incluido el 95.5% de la poblacin. Esto quiere decir que tenemos una probabilidad de que 955/1000 coincidan con los de la poblacin total. Si queremos alcanzar una mayor certidumbre hemos de abarcar entre +3 y -3 sigmas, en cuyo caso el riesgo de que exista diferencia entre los estadsticos de la muestra y los parmetros de la poblacin sean distintos ser de 997/100, pero naturalmente tendremos que elevar el numero de elementos de la muestra. Para determinar el volumen de la muestra, de acuerdo con el nivel de confianza, existen tablas. Bugeda (1974) recoge tablas que permiten determinar el volumen de la muestra y el nivel de estimacin para los niveles de confianza del 99.7% y del 95%. Otro dato determinante del tamao de la muestra es el error de estimacin. Es lgico pensar que no haya una coincidencia total entre los datos de la poblacin y los de la muestra. Hemos de indicar el mximo error tolerable, que suele establecerse en el 5%. Pero si queremos rebajar ese error tendremos que aumentar el volumen de la muestra. Concluimos que determinar el tamao de la muestra es un tema complejo. Por tanto, el investigador habr de tener en cuenta: la amplitud del universo (infinito o no), representatividad, las variables (tipo de datos, valores de la misma, homogeneidad/variabilidad de los datos), el tipo de muestreo, el proceso y medios de recogida de datos, los anlisis estadsticos que se planifiquen, el error muestral, el error de estimacin y el nivel de confianza con el que deseemos trabajar entre otras consideraciones. Con esta base se tendrn los referentes necesarios para determinar el tamao de la muestra. Para seleccionar el tamao de la muestra se suelen utilizar tcnicas de tres tipos. Ya hemos hablado del uso de tablas, pero tambin se pueden determinar mediante otros 4 Cfr. apdo. 6.3 de este captulo.

procedimientos: las curvas de error del tipo de las definidas por Kerlinger (1975: 132) 19 o mediante clculos estadsticos. A continuacin desarrollamos este ltimo procedimiento. Determinacin estadstica del tamao de la muestra. Conociendo el nivel de confianza que queremos que alcancen los datos se puede aplicar una ecuacin matemtica para estimar el tamao de la muestra5. Segn se trate de poblaciones infinitas o finitas, la determinacin variar, segn las siguientes ecuaciones: A) Determinacin del tamao de la muestra para poblaciones infinitas .6 En este caso pueden presentarse dos situaciones: A.1) Que conozcamos la proporcin de elementos que posee la caracterstica a travs de estudios previos. En este caso se aplica la frmula: Z" * p * q n = --------------------e 22
n = nmero de elementos que debe poseer la muestra " = riesgo o nivel de significacin. z" = puntuacin correspondiente al riesgo " que se haya elegido. Por ejemplo, para un riesgo del 5%; " = 0.05 (Z" = 1.96) p = % estimado q = 100-p e = error permitido.

5.1.

A.2. Si desconocemos la proporcin de individuos que poseen la caracterstica, se toma p = 50% y q = 50%. De este modo, el nmero de elementos ptimo de una muestra, estimando qu proporcin de sujetos poseen una caracterstica al nivel de confianza del 99.7% (3 F) y un error de estimacin admitido del 2%, ser: 32*50*50 N = ------------------- = 5625 elementos. 22 En el caso de que la investigacin requiera estimar una media se utiliza la siguiente frmula: Z2" * s2 s2 = Varianza. n = --------------------e2 5 Frecuentemente se opta por un nivel de confianza del 95% 99.7%, y un error de estimacin mximo del un 5% 6 Se consideran muestras infinitas las que superan los 100.000 elementos.

B)

Determinacin del tamao de la muestra para poblaciones finitas. En este caso 20 se emplea la siguiente frmula: Z"2 * p * q * N n = ----------------------------e2 (N-1) + Z"2 p * q De este modo, el nmero ptimo para un estudio de 60.000 personas inscritas en cursos de formacin, estableciendo un nivel de confianza de 2 F (95.5%), y el margen de error en el 3%, sera. Suponemos que la opcin por inscribirse en cursos de formacin, o no, es del 50%. 4 * 50 * 50 * 60.000 N = ---------------------------------- = 1091 individuos. 9 (60.000-1) + 4 * 50 * 50

En el caso de que la investigacin requiera estimar una media la frmula a utilizar quedara as: N * Z"2 * s2 n = ----------------------------Z"2 * s2 + e2 * (N-1) Como conclusin de este apartado hemos de sealar que las frmulas anteriores varan con el tipo de muestreo y con el sistema de afijacin de la muestra (Sierra Bravo, 1988: 226) 5.2 Afijacin de la muestra.

Cuando se trata de muestras estratificadas la determinacin del tamao de la muestra plantea un problema especial. Adems de la determinacin del tamao general de la muestra hay que especificar el volumen de cada estrato de la muestra. Este proceso, denominado afijacin de la muestra, debe tener en cuenta que para garantizar la representatividad de la poblacin, en la muestra debern figurar los estratos segn su proporcin en el universo. La forma ms utilizada y directa de realizar esta operacin ( afijacin proporcional) consiste en aplicar el porcentaje, que representa cada estrato dentro del universo, al tamao general de la muestra, con lo que se obtendr el nmero de elementos de la muestra que se debe asignar a cada estrato. Para Snchez Crespo (1976) este sistema, que es el ms utilizado, rene las siguientes ventajas: permite una moderada ganancia global en precisin y mantiene la igualdad de probabilidad de eleccin de todas las unidades del universo. Si se conocieran las desviaciones tpicas o las proporciones de cada estrato en el universo, o se han calculado ex-profeso , mediante un sondeo previo con relacin al objeto de estudio de la muestra; se suele utilizar otro procedimiento de afijar la muestra

que consiste en multiplicar el porcentaje de cada estrato en el universo por su proporcin 21 o su desviacin tpica y repartir el tamao de la muestra entre los estratos proporcionalmente a dichos productos. Este procedimiento se denomina afijacin ptima, y su aplicacin est justificada por razones econmicas en el caso de que con su empleo se pueda reducir sensiblemente, por tener una varianza ms reducida, el tamao de estratos que resulte ms caro investigar. (Sierra Bravo, 1988) 6. ERROR MUESTRAL

Cuando se extrae una muestra de una poblacin es frecuente que los resultados obtenidos de la muestra no sean exactamente los valores reales de la poblacin. El error de muestreo ocurre al estudiar una muestra en lugar de la poblacin total. La diferencia entre el valor del parmetro de una poblacin y el estadstico de una muestra recibe el nombre de error muestral. La nica forma de poder conocer el error muestral real consiste en realizar paralelamente la investigacin con la muestra y, a la vez, con toda la poblacin. Esta realidad, a todas luces descartable en la prctica, nos advierte acerca de la imposibilidad de conocer el error muestral real. En primer lugar, la muestra perdera su razn de ser. Por tanto, cuando nos referimos a error muestral no nos referimos al concepto sealado en el prrafo anterior, no conocido, sino a un error muestral determinado estadsticamente, de tipo genrico, vlido para todas las muestras posibles, del mismo tamao. Este error muestral, estadstico, sirve para darnos no un error especfico y determinado, sino nicamente para establecer el intervalo de confianza dentro del que nos movemos en la muestra; para sealarnos los lmites formados por la media de la muestra, mas o menos el error en cuestin, dentro del que se debe encontrar la media del universo, con el grado de probabilidad con que se trabaje, dos o tres sigmas. (Sierra Bravo, 1988: 207) Los errores de muestreo o fluctuaciones de muestra a muestra son aleatorios y no han de considerarse como equivocaciones, fallos, etc., sino como variaciones debidas al hecho de que no hay jams dos muestras que sean exactamente iguales (Garret, 1976: 238). Los estadsticos obtenidos en estas muestras al azar son estimaciones de los parmetros y sus errores tpicos miden la bondad de la estimacin. Fundamento estadstico del error muestral. La base estadstica del error muestral es la siguiente. Denominemos 0 a la media de la muestra y a la media de la poblacin. Supongamos que se obtuvieran todas las muestras posibles de, n unidades cada una, de la misma poblacin y se calculasen las para cada una de ellas. Entonces las estimaciones de variarn en torno a en la forma de la curva de distribucin normal. Esa curva de distribucin muestral expresara grfica y matemticamente la distribucin de todas las medias de las muestras obtenidas del universo. En ella se pondra de manifiesto que habra muchas medidas de iguales o muy cercanas a la 6.1

poblacin y muy pocas alejadas de , siguiendo una distribucin normal.

22

Tomando estos referentes, el error muestral o error tpico7, sera la desviacin tpica de las distintas medias obtenidas alrededor de la media de la poblacin, suele designarse por F y mide la importancia de las variaciones de las o medias muestrales en torno a la de la poblacin. La frmula que expresa esta relacin es:
s e = ---------muestral. F = desviacin tpica de la muestra e= error tpico de la media o error n = tamao de la muestra.

/n

Los errores de medicin se refieren a los fallos de los instrumentos de medida, as como del que los aplica y corrige. Estos errores, que actan de modo incontrolado, pueden aumentar considerablemente el error tpico de un estadstico. Por ello, un error muestral grande no implica necesariamente falta de representatividad de la muestra, pues la variacin puede estar causada por los errores de medicin. Si stos son pequeos, un error tpico grande s indica un considerable error de muestreo.. Los errores muestrales son debidos a dos causas principales. El primero, denominado error de sesgo, es debido a que la muestra no es representativa de la poblacin; el segundo, debido al azar, se conoce como error aleatorio. Ambos se relacionan matemticamente mediante la siguiente expresin:
(Error total) = (error por sesgo)22 + (error de muestreo)2

Para estimar el error muestral existen varias tcnicas denominadas de submuestreo (subsample) o remuestreo (resample) que se basan en dividir la muestra total en dos o ms submuestras aleatorias y a partir de ellas estimar los estadsticos y determinar las propiedades del estimador (Wilson, 1988). De entre las tcnicas de submuestreo sealaremos como las ms usuales, las siguientes (Ross, 1988; en Latorre, Rincn y Arnal, 2003: 83):
a) La tcnica de la replicacin independiente, que consiste en que la muestra se divide en dos submuestras independientes. Tcnica del jakknife (navaja), que consiste en cortar la muestra en varias partes no mutuamente excluyentes, es decir, con reposicin. c) Replicacin repetida balanceada.

b)

Las frmulas generales que nos permiten estimar el error muestral son:

El error tpico se define en estadstica como la desviacin tpica de la distribucin muestral de un estadstico. (Jimnez Fernndez, 1983)

23

e =

e =

p (1 p ) n

s e = ---------/n

24

Estas frmulas generales presentan modalidades diversas segn se trate de muestras con desviacin tpica o muestras con proporciones, o poblaciones finitas / infinitas:
Muestras Frmulas del error muestral para:. Poblaciones infinitas. Poblaciones finitas.

s2 N n e = e = n N1

s2 N n e = n n N 1 De intervalo:
2

e =

s2 n

25

e =

p*q N n p * q e e= = n N1 n

26

De proporciones:
s2 = varianza (cuadrado de la desviacin tpica) n = tamao de la muestra. N = el tamao de la poblacin (N-n/ N-1) trmino de correccin utilizado para poblaciones finitas y muestras sin reemplazamiento. p = proporcin de elementos que posee la caracterstica investigada: (q = 1 - p) Nota: Al numerador [s2] o al [p * q] hay que multiplicarlos por el cuadrado de nivel de confianza elegido: 2 2 32 para 2 3 F (sigmas), respectivamente.

6.2

Estimacin del error muestral en las muestras estratificadas y de clusters.

e=

n p (1 p )
ii i

e =

En las muestras estratificadas habr que considerar que, normalmente, el % de la caracterstica o la desviacin tpica, en su caso, sern distintas para cada estrato. Consecuentemente, la formula a utilizar ser:

27
ni = elementos del estrato i. pi = proporcin del atributo muestral en el estrato i

n = nmero total de elementos de la muestra.

3 = sumatorio de todos los estratos.

( ni s ) 2 e= 2 e = n

( n isi )2 n2

En el caso de medias:

En las muestras de clusters la frmula del error muestral es:

s2 m e = e = (1 ) mN

s2 m (1 ) m N

m = nmero de clusters de la muestra M = nmero de clusters del universo. s = desviacin tpica de las medias de los clusters de la muestra.

6.3

Factores que intervienen en el error muestral.

De acuerdo con las expresiones matemticas que calculan el error muestral, los factores que intervienen en l son (Sierra Bravo, 1988: 209):

28 A) B) C) D) La amplitud del universo, finito o infinito. El tamao, n, de la muestra. El nivel de confianza adoptado. La desviacin tpica.

El hecho de que se estime el universo como infinito supone que su amplitud no influye para nada en la frmula a aplicar. El tamao de la muestra es, en las frmulas del error muestral, un dato que nos dan o elegimos. No obstante, si al calcular el error ste resulta demasiado elevado -por ejemplo, superior al 6%-, entonces estamos obligado a aumentar el tamao de la muestra para reducir el error. Hay una relacin inversa entre tamao de la muestra y error muestral. El nivel de confianza adoptado es tambin otro dato que nos puede venir dado o que podemos elegir. Las pruebas empricas realizadas muestran que las distribucin muestral de medias de diferentes muestras se ajusta generalmente a una distribucin normal o curva de Gauss. Supuesto esto, el nivel de confianza ser la proporcin de las medias muestrales que forman el rea de esta curva de distribucin normal del universo que se piensa abarcar. El rea abarcada por 1 sigma (68%), por 2 (95.5%) por 3 (99.7), que nosotros adoptemos, recibe el nombre de nivel de confianza, porque representa el % de seguridad o probabilidad que elegimos. Es decir, que de las medias de todas las muestras posibles que forman en su conjunto la curva muestral, slo consideramos como probables el 95.5%, por ejemplo, por lo que prescindimos del otro 4.5%, por estimar que es muy improbable su obtencin, y por creer que el indicativo 95.5% nos proporciona una seguridad no total pero suficiente en la prctica. En consecuencia, con esta eleccin adoptamos un riesgo razonable de equivocarnos. El nivel de confianza ms corriente con el que se trabaja en muestras de investigaciones educativas es el de dos sigmas. Respecto a la desviacin tpica hay que distinguir las muestras referentes a variables cuantitativas (con escalas de intervalos o de razn), de las que se refieren a variables cualitativas (con escalas nominales u ordinales, de las que son tipo la variables dicotmicas del tipo S/No)

p * (1 p )

29

p * (
Estas ltimas variables es posible cuantificarlas, en cierto modo, recurriendo al lgebra de Boole, asignndole los valores 1/0 (positiva/negativa; aparece/no aparece...). En este caso la media es igual a p (proporcin en que se da el atributo en cuestin en la poblacin). En ese caso la desviacin tpica es igual a

n 1 En las muestras con variables cuantitativas la desviacin tpica ( s ) se calcula segn:


Los datos obtenidos por una u otra frmula se refieren a la varianza del universo a la que representan. Cuando sta no es conocida, como suele ocurrir, se utiliza en su lugar la cuasivarianza, o sea la varianza estimada mediante una pequea muestra tomada de la poblacin, ya que est comprobado que ste parmetro es muy estable. Por ello, en las

s=

(x x) n
2 i i

n1

s =

(x i x )2 n

muestras referidas a variables cualitativas, para hallar la desviacin tpica es necesario 30 hallar, si no se conoce p, la proporcin o porcentaje que expresa el nivel estimado de la extensin en el universo de la caracterstica sobre la que se desea obtener informacin. As, en una encuesta sobre la extensin del consumo de una determinada marca de tabaco se deber estimar con anterioridad, aunque sea de manera aproximada, a travs de un sondeo previo, la proporcin de fumadores y no fumadores dentro del total de la poblacin. Cuando el sondeo sea imposible habr que partir de la suposicin del 50%, que es el caso ms desfavorable; es decir, en que la muestra deber ser mayor. Error sistemtico. Los errores se clasifican, segn su carcter, en sistemticos, aleatorios y muestrales. El error aleatorio no se suele ajustar a ninguna pauta, vara normalmente, en cada caso distinto, en su sentido y magnitud, y por ello tiende a anularse cuando se trata de un nmero elevado de casos. El error muestral, visto ms arriba, es un error de tipo aleatorio estadstico, que tiene lugar cuando se utilizan muestras y se basa en las fluctuaciones aleatorias del muestreo. El error sistemtico se suele ajustar a una pauta determinada en su sentido y magnitud, y por lo tanto, al repetirse los casos, su magnitud aumenta acumulativamente. Para Bugeda (1974; en Sierra Bravo, 1988: 213) las principales vas de penetracin del error sistemtico o de distorsin son las siguientes: 6.4

1. 2.

3. 4. 5.

31 Modo de eleccin defectuoso de una muestra que hace que sta no sea representativa. La dependencia del mtodo de muestreo de una caracterstica de las unidades del universo a elegir. Ello puede llevar a una hiper/sub-representatividad de la muestra. Este sera el caso de un muestreo aleatorio sistemtico realizado cada cinco elementos, cuando en la base de la muestra tambin uno de cada cinco son individuos con una caracterstica determinada. Las tendencias subjetivas conscientes o inconscientes del investigador. Sustituciones, segn criterio propio del investigador, de unidades de la muestra que haban sido elegidas al azar. Insuficiente observacin del conjunto de la muestra, que lleva a atenerse a los primeros resultados. Respecto de este motivo, especialmente presente en las encuestas por cuestionario escrito, se ha constatado que los que contestan primero son los ms interesados en la encuesta. Por ello, en las encuestas por correo se estima necesario reiterarlas hasta tres veces, pues de otro modo ademas de quedar modificado el tamao de la muestra, la encuesta slo abarcara un tipo de gente, los rpidos en contestar, y quedaran fuera los menos rpidos, que seguramente constituyen un grupo de caractersticas diferentes de los primeros.

7.

BIBLIOGRAFA.

BUENDA EISMAN, L.; COLS BRAVO, M.P. y HERNNDEZ PINA, F. (1998): Mtodos de investigacin en Psicopedagoga. McGraw-Hill, Madrid. BUGEDA, J. (1974): Manual de tcnicas de investigacin social. Instituto de Estudios Polticos, Madrid.

FOX, D. J. (1981): El proceso de investigacin en Educacin. Eunsa, Pamplona. 32 GARCA HOZ, V. y PREZ JUSTE, R. (1984): La investigacin del profesor en el aula . Escuela Espaola, Madrid. GARRET, H. E. (1976): Estadstica en Psicologa y Educacin. Paids, Buenos Aires. GIL PASCUAL, J. A. (2004): Bases Metodolgicas de la Investigacin Educativa. (Anlisis de datos). UNED, Madrid. JIMENEZ FERNNDEZ, C. (1983): Poblacin y muestra. El muestreo. En JIMNEZ FERNNDEZ, C., LPEZ-BARAJAS ZAYAS, E. y PREZ JUSTE, R. : Pedagoga Experimental II. Tomo I. UNED. Madrid. pp. 229-258. KERLINGER, F. N. (1975): Investigacin del comportamiento.Tcnicas y Metodologa. Interamericana, Mxico. - (1985): Enfoque conceptual de la investigacin del comportamiento . Interamericana, Mxico. LOHR, S. L. (1999): Muestreo: Diseo y Anlisis. International. Thomson Editores, Madrid. MARN IBEZ, R. (1985): El muestreo. Tema 6. En MARN IBEZ y PREZ SERRANO, G.: Pedagoga Social y Sociologa de la Educacin. Unidades Didcticas 1, 2 y 3. UNED, Madrid. pp. 161-186 LATORRE, A., RINCN D. del y ARNAL, J. (2003): Bases Metodolgicas de la Investigacin Educativa. Experiencia S.L., Barcelona. RAE (2001): Poblacin / Muestra [en linea]. Diccionario de la Lengua Espaola, 22 Edicin. Disponible en: http://www.rae.es/ [consulta 2005,29 de septiembre] ROSS, K. N. (1988): Sampling errors. En KEEVES, J. P. (ed.). Educational research, methodology, and measurement. An international handbook. Pergamon Press, Oxford. SIERRA BRAVO, R. (1988): Tcnicas de investigacin Social. Teora y Ejercicios. Paraninfo, Madrid.

Toms Garca Muoz. Almendralejo, 2005

Esquema:

33 POBLACIN Y MUESTRA.

34 1. 2.
Poblacin y Universo. Muestreo. 2.1. 2.2. 2.3.

Muestra. Etapas del proceso de muestreo. Condiciones que ha de cumplir la muestra.

3.

Tipos o tcnicas de muestreo. 3.1 Probabilstico. A) Aleatorio simple.

B) C) 1* 2* D) E)
3.2.

Aleatorio sistemtico. Muestreo estratificado. M. estratificado proporcional M. estratificado constante. Muestreo por conglomerados o grupos. Muestreo por etapas o polietpico. Muestreo no probabilstico.

35

36 A) B) C)
3.3 Accidental o casual. Intencional u opinativo. Muestreo por cuotas. Otros tipos de muestreo. B) Muestras superpuestas. C) M. sucesivas. D) M. compuestas. E) M. compensadas. F) M. de voluntarios.

4. 5.

Representavidad de la muestra. Tamao de la muestra. 5.1 Determinacin estadstica del tamao de la muestra. 5.2 Afijacin de la muestra. Error muestral. 6.1 6.2 6.3 6.4 Bibliografa.

37

6.

Fundamento estadstico del error muestral. Estimacin del error muestral en las muestras estratificadas y de clusters. Factores que intervienen en el error muestral. Error sistemtico.

7.

Toms Garca Muoz. Almendralejo, 2005

También podría gustarte