Documentos de Académico
Documentos de Profesional
Documentos de Cultura
y muestra
ÍNDICE
INTRODUCCIÓN..................................................................................................................................................................................... 3
1. LA UNIDAD DE ANÁLISIS................................................................................................................................................................. 4
1.1 Clasificación...................................................................................................................................................................... 4
2. POBLACIÓN......................................................................................................................................................................................... 6
2.1. Caracterización............................................................................................................................................................... 6
3. LA MUESTRA ....................................................................................................................................................................................... 8
Probabilística........................................................................................................................................................ 11
No probabilística.................................................................................................................................................. 13
2
POBLACIÓN Y MUESTRA
Contenidos
Objetivos
INTRODUCCIÓN
Sin embargo, es imperioso determinar sobre qué o quiénes se va a realizar la investigación. Es por
eso que se trata específicamente en esta unidad acerca de la unidad de análisis, la población y un
subconjunto de ella: la muestra.
Al respecto, es menester aclarar que los metodólogos, muchos de ellos, no distinguen entre
universo y población y que, cuando se refieren indistintamente tanto a uno como a otro, lo hacen
como la totalidad de un grupo de elementos, objetos o personas que se quiere investigar, o como
aquel conjunto de todos los casos que concuerdan con lo que se pretende investigar.
3
Gráfico 1: Marco Metodológico
En el caso de este Seminario, se mostrará una diferencia entre la unidad de análisis y la población.
Luego, se abordará la noción de muestra, el tipo de muestreo que se puede realizar y, por último,
de qué modo se puede calcular la misma.
1. LA UNIDAD DE ANÁLISIS
1.1 Clasificación
Concepto
Se denomina unidad de análisis a la entidad mayor o representativa
de aquello que será el objeto específico de estudio. Es decir que se
refiere al qué o quién es objeto de interés y estudio en una determi-
nada investigación, al valor de alguno de los atributos observados
en ella.
4
La unidad de análisis debe estar correctamente definida en el protocolo de investigación y el
investigador debe adquirir la información desde la unidad que haya sido definida como tal, aun
cuando, para acceder a ella, haya debido recorrer pasos intermedios. Las unidades de análisis
pueden pertenecer a las siguientes categorías:
•• Personas
•• Grupos humanos
•• Poblaciones completas
•• Unidades geográficas determinadas
•• Eventos o interacciones sociales (accidentes, crisis organizacional)
Para ejemplificar, se usará un ejemplo del área de las ciencias de la salud: si se pretende estudiar,
en un enfoque clínico, el comportamiento de las infecciones hospitalarias de un establecimiento,
la unidad de análisis podría pertenecer al evento “infección hospitalaria” o a “paciente con infec-
ción intrahospitalaria”. Es indudable que la cifra en ambos casos puede ser diferente: un “pacien-
te” con infección intrahospitalaria puede tener más de un “evento” de infección intrahospitalaria.
A continuación, se muestra una imagen con otra clasificación de las Unidades de análisis.
Las Unidades de análisis, al referirse a los objetos, eventos o personas sobre los que se quiere in-
vestigar, suponen las variables a investigar. Es decir, aquellas que formaban parte de la hipótesis y
que debían ser observadas, medidas y contrastadas con la realidad.
Las variables se relacionan directamente con este tema, dado que ambas están consideradas por
el objeto de investigación.
5
Tabla 1: Esquema de unidades de análisis y variables ejemplificadas:
Es necesario recordar que las variables siempre están contenidas en algún elemento, cosa o
situación. A estos elementos, como bien se mencionó, se los denomina unidades de análisis y el
conjunto de ellos es conocido como población.
2. POBLACIÓN
2.1. Caracterización
Concepto
La población (denotada como “N”) hace alusión al conjunto total
de individuos, objetos o medidas en los que, por un lado, se preten-
de investigar algunas propiedades y, por otro, presentan ciertas
características en común, observables en un lugar y en un momento
específico que varían en el transcurso del tiempo.
6
Cabe destacar que este concepto antes definido, no debe confundirse con el significado atribuido
en otras disciplinas, donde lo definen como el grupo de individuos de una especie habitantes de
una región específica.
Metodólogos también lo han conceptualizado como aquel conjunto de entidades a partir de las
cuales se formula la pregunta de la investigación, o el conjunto de las entidades a las cuales se
refieren las conclusiones de la investigación.
Concepto
Población o universo: conjunto de todos los casos que concuerdan
con determinadas especificaciones.
No obstante, cuando se decida emprender alguna investigación, se deben tener en cuenta ciertas
características al seleccionar la población que se pretende estudiar.
A su vez, en una investigación puede existir más de una población, lo cual depende de la com-
plejidad y variedad de los objetivos del estudio. En ciertas ocasiones, cada objetivo requiere
una población distinta. Por lo que, si se tiene más de una, esta debe ser especificada y descripta
detalladamente.
Por otra parte, la población es delimitada conceptualmente a través de la formulación de sus pro-
piedades por medio de la definición conceptual. El proyecto de investigación debe proporcionar
dos cosas: la definición conceptual y operacional de la población. Si bien el tema de las definiciones
7
conceptuales y operacionales se mencionaron referidas a las variables, en este caso, se especifica
que tiene otra connotación en lo referido a la población.
En efecto, los criterios de inclusión se refieren al conjunto de propiedades cuyo cumplimiento iden-
tifica a un individuo que pertenece a la población que está siendo estudiada. Su objetivo radica en
demarcar a la población o universo de discurso.
Por el contrario, los criterios de exclusión, indican un conjunto de propiedades cuyo cumplimiento
identifica a un individuo que, por sus características, podría llegar a crear sesgo en la estimación
de la relación entre variables, aumento de la varianza de las mismas o presentar un riesgo en su
integridad física por su participación en el estudio. Aquí el objetivo principal consiste en aumen-
tar la seguridad de los participantes y la eficiencia en la estimación, reduciendo los sesgos.
3. LA MUESTRA
3.1. Requisitos
Importante
La muestra (“n”) es el conjunto de casos extraídos de una población,
que han sido seleccionados por algún método de muestreo. Es siem-
pre una parte de la población.
La unidad de muestreo concierne a la entidad básica por medio de la cual se accederá a la unidad
de análisis. En algunos casos, ambas se corresponden. El siguiente ejemplo lo brinda Gabriel Rada
(2007), de la Universidad Católica de Chile: “Si se pretende evaluar la prevalencia de daño audi-
8
tivo en relación con niveles de ruido ambiental en una muestra de trabajadores de una fábrica, la
unidad de muestreo correspondería a la entidad “sujeto”, si se dispone de un registro detallado de
cada uno. La unidad de análisis es el trabajador de la compañía”.
En cuanto a las encuestas de morbilidad, una preferencia clásica es trabajar con hogares como
unidad de muestreo e individuos de dichos hogares, como unidad de análisis.
I) Delimitar una cantidad de unidades de análisis posibles de ser medidas con los recursos dispo-
nibles. Esto se efectúa a través del Cálculo del Tamaño Muestral.
II) Que dicho conjunto de unidades de análisis sea representativo de la población, según determi-
nadas propiedades bajo la perspectiva del objetivo. Esto significa que idealmente se espera que
la distribución de dicha propiedad en la muestra, sea similar a la distribución de la misma en la
población. Esto es alcanzado por medio de la Estrategia de Selección de la Muestra.
1. En primer lugar debe definirse la unidad de análisis, es decir, “quiénes van a ser estu-
diados”, lo cual dependerá del problema a investigar y de los objetivos de la investiga-
ción.
2. Una vez definido esto, se procede con la delimitación de la población que se pretende
estudiar y sobre la cual se buscará generalizar los resultados. También se determina si
se realizará muestreo o si se trabajará con toda la población.
Esto dependerá del tamaño de la misma, ya que si esta es pequeña y se puede acceder
a ella sin restricciones, entonces se trabajará con toda la población. Si, en cambio, es
muy grande o es demasiado costoso, entonces conviene utilizar una muestra.
9
4. Seguidamente se calcula el tamaño de la muestra. Utilizando fórmulas estadísticas o
cualitativas, se calcula el tamaño mínimo de la muestra requerido para el estudio.
10
Gráfico 4: Ejemplo de tipos de muestras
Probabilística
Recuerda
El muestro probabilístico indica que todos los elementos de la po-
blación tienen la misma posibilidad de ser escogidos. Puede medirse
el tamaño de error en las predicciones, el objetivo es reducir al
mínimo este error.
Asimismo, es llamado muestreo aleatorizado. Este asegura estimaciones insesgadas de los pará-
metros poblacionales. Insesgado quiere decir que el promedio de las estimaciones muestrales, a
través de todas las muestras posibles, es equivalente al parámetro poblacional. Se comprenderá
que el no sesgo no garantiza que una muestra definida sea representativa, sino que es una propie-
dad de las sucesivas extracciones al largo plazo.
1. Simple
• Es un método de selección de una muestra de tamaño n, de un conjunto de N unidades,
donde n ≤ N, de manera tal que cada una de ellas, poseen la misma probabilidad de
selección.
• Es útil en poblaciones pequeñas. Se requiere marco muestral.
• Puede utilizarse una tabla de números aleatorios o por sorteo.
• Su implementación reside en la numeración de las unidades de 1 a N. Luego, se extrae
en forma aleatoria una serie de entre estos números. Por lo tanto, esta estrategia,
demanda la identificación de todos los elementos pertenecientes a la población en
estudio.
11
2. Sistemático
• Es cuando se establece un patrón o criterio al seleccionar la muestra. Ejemplo: se
entrevistará una familia por cada diez que se detecten.
• Es útil en poblaciones grandes. No requiere marco muestral.
3. Estratificado
• Cuando la población en estudio está compuesta por distintos grupos de elementos y se
desea que cada uno esté proporcionalmente representado dentro de la muestra. Por
lo tanto, se divide a la población en estratos (sub grupos) según las variables o carac-
terísticas que se pretenden investigar. Cada estrato debe corresponder proporcional-
mente a la población.
• Puede estratificarse por edad, sexo, gravedad, servicios hospitalarios, grupos profesio-
nales, etc.
• En el muestreo estratificado, la población de N unidades se divide primero en sub
poblaciones de N1, N2, …, NL unidades, respectivamente. Estas, son excluyentes entre
sí y en su conjunto comprenden a toda la población, de tal forma que: N1 + N2 + … + NL
= N y se las denomina como estratos a los que se identificará con el subíndice h.
4. Conglomerados
• Esta es frecuente en investigaciones comunitarias donde un área geográfica debe
separarse en áreas o conglomerados.
• Puede conglomerarse por región, provincia, distrito, comunidades, manzanas, familias,
etc.
• Sólo puede ser utilizada cuando todas las entidades que forman parte de la población
pueden ser identificadas y enumeradas, si no esto no es posible. Puede implementarse otra
estrategia probabilística siempre y cuando se presenten las siguientes condiciones:
o Se pueden identificar subconjuntos de individuos de la Población
Blanco agrupados en diferentes clases por algún criterio. A cada una de
estas clases se las llamará Unidad de primera Etapa (UPE)
o Todos los individuos de la Población Blanco pertenecen a alguna UPE .
o No existe ningún individuo que pertenezca a dos o más UPE simul-
táneamente. Entonces, dada una población finita de N elementos
(unidades de análisis) dividida en M conglomerados (UPE), cada uno de
tamaño N1, N2, ..., NM, de forma tal que si ahora se extrae una muestra
aleatoria simple de m UPE, la muestra final esta compuesta por todas
las unidades de análisis contenidas en ellas, dicha muestra se denomina
muestra por conglomerados monoetápicas.
12
Dos propiedades de este método son: en primer lugar, que el mismo es equipo probabilístico, ya
que cada conglomerado tiene la misma probabilidad de ser seleccionado y con él, todas las unida-
des que contiene; en segundo lugar, que si N1 ≠ N2 ≠ ... ≠ NM, el tamaño muestral es aleatorio.
Ejemplo
Se pretende realizar una encuesta sobre adicciones en niños de escuela primaria
de capital federal. Se calculó que la muestra necesaria corresponde a un 10% del
total de los alumnos, de los cuales no se dispone de un padrón unificado, a dife-
rencia de la totalidad de las escuelas y el número de estudiantes que cursan en las
mismas, de los cuales para ambos se disponen de datos que se encuentran en un
registro único. Por lo tanto, se realiza una muestra aleatoria simple del 10% de las
escuelas, en las que en una segunda etapa se entrevistará a los alumnos.
No probabilística
Recuerda
El muestreo no probabilístico hace referencia a que la elección de los elementos
no depende de la probabilidad, sino de causas relacionadas con el investigador o
del que hace la muestra. Es decir que las unidades de análisis no tienen la misma
posibilidad de ser elegidas, ya que no interviene el azar, sino algún criterio deter-
minado que permite realizar el muestreo, el cual generalmente es informal.
Aquí, los individuos pertenecientes a la población tienen diferente probabilidad de ser seleccio-
nados y la misma es desconocida. Por ello, no pueden incluirse modelos de probabilidad. Es por
esta misma razón que tienden a producir estimaciones sesgadas y tienden a la no representativi-
dad de la población.
Uno de los métodos más utilizados es el muestreo de conveniencia o incidental. El criterio para la
selección de los sujetos es la accesibilidad a los mismos o la comodidad.
1. Accidental
2. Voluntario
3. Intencional (por conveniencia)
Existen diversas razones para estudiar muestras en lugar de poblaciones. Entre ellas se pueden
señalar:
•• Economizar tiempo, ya que estudiar a una menor cantidad de individuos, implica
menos tiempo.
•• Como consecuencia del punto anterior, ahorro de costes.
13
•• Estudiar la totalidad de las personas con una característica determinada, la mayo-
ría de las veces, es una tarea inaccesible o imposible de realizar.
•• Incrementar la calidad del estudio. Al poseer una mayor cantidad de tiempo y
recursos, las observaciones y mediciones realizadas a un reducido número de
individuos pueden ser más exactas y plurales que si se las tuviera que realizar a
una población.
•• La selección de muestras específicas, permitirá reducir la heterogeneidad de una
población al indicar los criterios de inclusión y/o exclusión.
Por un lado, depende de la precisión con que el investigador desea llevar a cabo su estudio, pero
generalmente debe utilizarse una muestra tan grande como sea posible de acuerdo a la disponibi-
lidad de recursos. Esto es debido a que se considera que mientras más grande sea, mayor posibili-
dad de ser más representativa de la población.
Recuerda
En investigaciones experimentales, por su naturaleza y la necesidad de tener
control sobre las variables, es recomendable emplear muestras pequeñas (por
lo menos 30 sujetos). Mientras que en investigaciones descriptivas, se utilizan
muestras grandes y algunas veces se recomienda seleccionar de un 10 a un 20 por
ciento de la población accesible.
Y, por otro lado, el tamaño muestral dependerá de aquellos parámetros que regulan la distri-
bución de probabilidad de la variable en estudio (ya sea esta una magnitud poblacional o una
medida de efecto entre dos variables) y la precisión esperada en la estimación.
La información requerida para calcular el tamaño muestral está determinada por la hipótesis del
estudio. Para las investigaciones de una hipótesis atribucional, se deberá seleccionar un tamaño
esperado para dicho parámetro, mientras que en aquellas de una hipótesis causal, se necesitará
formular una magnitud esperada para dicho efecto.
14
Complementariamente, en las investigaciones clínicas basadas en hipótesis causales pueden de-
tectarse diferentes alcances en el objetivo partiendo de la relación de las diferencias observadas
entre los tratamientos.
El cálculo del tamaño de la muestra es uno de los aspectos a concretar en las fases previas de la
investigación comercial y determina el grado de credibilidad que se concederán a los resultados
obtenidos.
Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la muestra para datos
globales es la siguiente:
k: es una constante que depende del nivel de confianza que se le asigne. El nivel de confianza in-
dica la probabilidad de que los resultados de la investigación sean ciertos: un 95,5 % de confianza
es lo mismo que decir que se pueden equivocar con una probabilidad del 4,5%.
Los valores k más utilizados y sus niveles de confianza son:
k 1,15 1,28 1,44 1,65 1,96 2 2,58
Nivel de 75% 80% 85% 90% 95% 95,5% 99%
confianza
e: es el error muestral deseado. Este es la diferencia que puede haber entre el resultado que se
obtiene preguntando a una muestra de la población y el que se obtendría si se le preguntara al
total de ella. Ejemplos:
•• Ejemplo 1: si los resultados de una encuesta dicen que 100 personas comprarían
un producto y se tiene un error muestral del 5% comprarán entre 95 y 105 perso-
nas.
•• Ejemplo 2: si se realiza una encuesta de satisfacción a los empleados con un error
muestral del 3% y el 60% de los encuestados se muestran satisfechos, significa que
entre el 57% y el 63% (60% +/- 3%) del total de los trabajadores de la empresa lo
estarán.
•• Ejemplo 3: si los resultados de una encuesta electoral indicaran que un partido iba
a obtener el 55% de los votos y el error estimado fuera del 3%, se estima que el
porcentaje real de votos estará en el intervalo 52-58% (55% +/- 3%).
15
p: es la proporción de individuos que poseen en la población la característica de estudio. Este
dato es generalmente desconocido y se suele suponer que p=q=0.5 es la opción más segura.
Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:
1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra
hacia la población total.
2. El porcentaje de error que se pretende aceptar al momento de hacer la generalización.
3. El nivel de variabilidad que se calcula para comprobar la hipótesis.
Recuerda
La confianza o el porcentaje de confianza es el porcentaje de se-
guridad que existe para generalizar los resultados obtenidos. Esto
quiere decir que un porcentaje del 100% equivale a decir que no
existe ninguna duda para generalizar tales resultados, pero también
implica estudiar a la totalidad de los casos de la población.
Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser prácticamen-
te imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menor.
Comúnmente, en las investigaciones sociales se busca un 95%.
El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipótesis que sea
falsa como si fuera verdadera, o la inversa: rechazar a una hipótesis verdadera por considerarla
falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y conside-
rarlo como 0%, entonces la muestra es del mismo tamaño que la población, por lo que conviene
correr un cierto riesgo de equivocarse. Generalmente, se aceptan entre el 4% y el 6% como error,
tomando en cuenta de que no son complementarios la confianza y el error.
Recuerda
La variabilidad es la probabilidad (o porcentaje) con el que se aceptó
y se rechazó la hipótesis que se quiere investigar en algún estudio
anterior o en un ensayo previo a la investigación actual. El porcenta-
je con que se aceptó tal hipótesis se denomina variabilidad positiva
y se denota por p, y el porcentaje con el que se rechazó se la hipóte-
sis es la variabilidad negativa, denotada por q.
16
Hay que considerar que p y q son complementarios, es decir, que su suma es igual a la unidad:
p+q=1. Asimismo, cuando se habla de la máxima variabilidad, en el caso de no existir anteceden-
tes sobre la investigación (no hay otras o no se pudo aplicar una prueba previa), el valores de
variabilidad es p=q=0.5.
Una vez que se han determinado estos tres factores, entonces se puede calcular el tamaño de la
muestra como a continuación se expone.
De una población de alrededor de 10,000 casos, o mínimamente esa cantidad, se puede pensar
en la manera de calcular el tamaño de la muestra a través de las siguientes fórmulas. Hay que
mencionar que estas se pueden aplicar de manera aceptable pensando en instrumentos que no
incluyan preguntas abiertas y que sean un total de alrededor de 30.
Se van a presentar dos fórmulas, siendo la primera la que se aplica en el caso de que no se
conozca con precisión el tamaño de la población, y es:
Donde:
n es el tamaño de la muestra;
Z es el nivel de confianza;
p es la variabilidad positiva;
q es la variabilidad negativa;
E es la precisión o error.
Hay que tomar nota de que debido a que la variabilidad y el error se pueden expresar por medio
de porcentajes, hay que convertir todos esos valores a proporciones en el caso necesario.
También hay que tener en cuenta que el nivel de confianza no es ni un porcentaje ni la proporción
que le correspondería, a pesar de que se expresa en términos de porcentajes. El nivel de confian-
za se obtiene a partir de la distribución normal estándar pues la proporción correspondiente al
porcentaje de confianza es el área simétrica bajo la curva normal que se toma como la confianza,
y la intención es buscar el valor Z de la variable aleatoria que corresponda a tal área.
Ejemplo
Si se quiere un porcentaje de confianza del 95%, entonces hay que considerar la
proporción correspondiente que es 0.95. Lo que se buscaría en seguida es el valor
Z para la variable aleatoria z tal que el área simétrica bajo la curva normal desde -Z
hasta Z sea igual a 0.95, es decir, P(-Z<z<Z)=0.95.
17
En el caso de que sí se conozca el tamaño de la población, se debe aplicar la siguiente fórmula:
Donde:
n es el tamaño de la muestra;
Z es el nivel de confianza;
p es la variabilidad positiva;
q es la variabilidad negativa;
N es el tamaño de la población;
E es la precisión o el error.
Para finalizar, resulta necesario rescatar los conceptos más importantes: Para que una muestra
posea validez técnico estadística es necesario que cumpla con los siguientes requisitos:
18