Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MUESTREO
duos (N = 4) en la que los que la compo- rés real son de tamaños notoriamente
nen tienen los siguientes datos “numéri- mayores.
cos” para una determinada variable: a = 4; Para seleccionar en forma aleatoria dos
b = 3; c = 3; d = 2. Esos valores se inclu- unidades de las cuatro de la población,
yen en la primera fila del cuadro 7-1. La podrían colocarse cuatro bolillas identifica-
media aritmética (μ) en ese conjunto es 3. das con las respectivas letras en un bolille-
Si se supone que alguien está interesado ro y, por sorteo, retirar dos.
en el valor de ese parámetro, aunque no Debe destacarse que en este caso no se
tiene acceso a la población sino solo a algu- está cumpliendo en su totalidad el requisi-
nos de sus integrantes, necesitaría trabajar to de aleatoriedad. En efecto, la posibilidad
a partir de una muestra. Se verá a conti- de selección de la primera bolilla ha sido de
nuación la situación que se plantearía al uno en cuatro (P = 1/4) mientras que en
utilizar para la tarea una muestra de tama- la segunda, de uno en tres (P = 1/3).
ño 2 (n = 2). Se entenderá que esta situa- Para trabajar de manera realmente alea-
ción se presenta a manera de ejemplo, ya toria es necesario obtener la muestra “con
que las poblaciones que presentan un inte- reemplazo”. Esto significa que cada uni-
CUADRO 7-1. RESULTADOS EN LAS MUESTRAS TOMADAS DE UNA POBLACIÓN HIPOTÉTICA DE DATOS
“NUMÉRICOS”
b=3 b=3
c=3 a=4
d=2 d=2
c=3 c=3
d=2 b=3
d=2 d=2
1
dad se debe seleccionar, registrar el dato en media aritmética de una muestra. Esto no
ella y luego incorporarla nuevamente a la depende de una forma de trabajar correcta,
población para mantener constantes las po- sino tan solo de la mayor o menor “suerte”
2
sibilidades de selección. Este mecanismo, que se tenga en la selección aleatoria de la
que hace posible que una misma unidad muestra.
sea seleccionada más de una vez, no es el
3
que se aplica en las situaciones reales y La media aritmética de las mues-
obliga a algunas modificaciones en los pro- tras tomada de una población
cedimientos que se describirán más ade- varía.
4
lante. No obstante, esas modificaciones tie-
nen un peso significativo en los resultados Por otro lado, en la última fila del cuadro
solo cuando el tamaño de la muestra supe- puede verse que la media aritmética, el
5
ra el 10% del tamaño de la población, lo promedio, de las medias aritméticas de las
que rara vez sucede en las investigaciones muestras obtenidas es 3 (el valor de su
reales. Por este motivo, se trabajará aquí suma, 18, dividido por la cantidad de mues-
asumiendo aleatoriedad aun cuando no tras totales, 5), valor que corresponde al del
6
sea real, por seleccionar una muestra que, parámetro de la población (μ = 3).
en el ejemplo, tiene un tamaño (2), que Una segunda conclusión es que, debido a
representa la mitad del tamaño de la po- que el valor de la media aritmética de la
7
blación (4). muestra tomada de una población varía,
Según el ejemplo, puede verse en la prime- aunque a veces se lo estima bien, y otras se
ra columna del cuadro 7-1 la composición sobreestima o se subestima el parámetro,
8
de las seis posibles muestras que pueden ob- en promedio se lo estima bien.
tenerse en las condiciones planteadas.
Al calcularse en cada una de esas mues- Puede expresarse que, en prome-
9
tras el estadístico de tendencia central dio, la media aritmética del con-
media aritmética (recuérdese que un esta- junto de medias aritméticas de
dístico se calcula en una muestra, mientras muestras de una población es
10
que un parámetro lo es en una población), igual a la media aritmética – pará-
se obtienen los resultados que se muestran metro– de la población de la cual
en la segunda de las columnas del cuadro. se tomaron las muestras.
De esos resultados surge que en dos de
11
las muestras el valor del estadístico (x–) Véase ahora en las columnas tercera y
coincide con el parámetro de la población cuarta del cuadro lo que sucede al tomar
(μ = 3); en otras dos al estadístico le co- muestras de tamaño tres (n = 3) de la
12
CUADRO 7-2. RESULTADOS EN LAS MUESTRAS TOMADAS DE UNA POBLACIÓN HIPOTÉTICA DE DATOS
“NUMÉRICOS”
b=3 b=3
c=3
c=3 b=3
d=2
d=1 c=3
d=2
d=2
c=3 2,00
d=1
Suma 18,00
Media 3,00
1
muestra la magnitud del error que puede ca (recuérdese lo analizado en el cap. 5) por
cometerse en la estimación es mayor en lo que es útil extraer la correspondiente
este caso. raíz cuadrada y así llegar al valor de lo que
2
Una cuarta conclusión es, por lo tanto, se denomina error estándar.
que la magnitud del error que puede come- En fórmula:
terse al estimar la media aritmética de una
3
población a partir del correspondiente Error estándar = σ / 冪n
estadístico aumenta al aumentar la disper-
sión de la población de la que se toma la Es decir, el error estándar puede calcular-
4
muestra. se al dividir el valor de la desviación están-
dar de la población por la raíz cuadrada del
ERROR ESTÁNDAR tamaño de la muestra utilizada.
5
Obsérvese que existen dos situaciones en
Los resultados de la supuesta experiencia las cuales la posibilidad de error es nula
descrita en los ejemplos planteados lleva a (error estándar igual a 0).
expresar que:
6
Una de ellas se produce cuando en la
población original no existe dispersión, o
La magnitud del “error” posible al sea, que todos sus datos son iguales. Al ser
estimar la media aritmética de una
el numerador 0, el cociente también es 0,
7
población a partir de la media arit-
ya que este valor divido por cualquier otro
mética de una muestra tomada
aleatoriamente de ella aumenta al arroja ese resultado.
La segunda situación se verifica cuando
8
incrementar la dispersión de la
población y al disminuir el tamaño la muestra tomada es infinitamente grande,
de la muestra, y disminuye al redu- es decir, cuando se evaúa a la totalidad de
cir la dispersión de la población y la población; en este caso, el denominador
9
aumentar el tamaño de la muestra. es infinito y el resultado de dividir cual-
quier valor por infinito es 0.
Expresado en términos matemáticos, Como se comprenderá, se trata de dos
puede decirse que la magnitud del error es situaciones inexistentes en la realidad de la 10
directamente proporcional a la dispersión investigación. En los datos numéricos es
de la población de origen de la muestra e prácticamente imposible evitar alguna dis-
11
este enunciado mediante la siguiente fór- Por otro lado, las poblaciones de interés
mula: son de tamaño demasiado grande como
para que sea posible trabajar con todos sus
13
1
MUESTRAS CON DATOS NOMINALES mente proporcional al tamaño de la mues-
tra: a mayor tamaño de muestra menor
Al tomar muestras de poblaciones de da- error posible.
2
tos nominales, la situación es equivalente a La diferencia estriba en que la distribu-
la ya descrita para los datos “numéricos”. ción no es en este caso gaussiana, sino que
Considérese una población hipotética de puede ser descrita con otro tipo de ecua-
3
8 individuos de los cuales 4 (P = 0,5 o ción, conocida como binomial, y el valor
50%) están en la categoría “enfermos”. del error estándar es la raíz cuadrada del
Los resultados posibles al tomar mues- valor obtenido de:
4
tras de tamaño cuatro (n = 4) se mues-
tran en el cuadro 7-3. Tal como en los P (1 – P) / n
casos anteriores, al estimar el parámetro
5
con el valor del estadístico en ocasiones se Esto es la raíz cuadrada del resultado del
“acierta” y en otras se sobreestima o subes- producto de la proporción en una categoría
tima, aunque, “en promedio”, se estima (0,5 en la categoría “enfermos” en el ejem-
bien. plo) por la que no está en la categoría (1 – P;
6
También en este caso la magnitud del 0,5 en el ejemplo) dividido por el tamaño
error posible en la estimación es inversa- de la muestra (4 en el ejemplo).
7
CUADRO 7-3. RESULTADOS EN LAS MUESTRAS TOMADAS DE UNA POBLACIÓN HIPOTÉTICA DE DATOS
NOMINALES
8
Población: Enfermos = 4 Sanos = 4 P = 0,5 Tasa = 50%
Muestra % enfermos
9
A 100,0
4 enfermos
0 sanos
B 75,0
3 enfermos 10
1 sano
C 50,0
11
2 enfermos
2 sanos
D 25,0
12
1 enfermo
3 sanos
E 0,0
0 enfermo
13
4 sanos
Suma 250,0
% promedio 50,0
14
Nótese que, también en este caso, el ta- en saliva tiene un valor de media aritméti-
maño de la muestra es el denominador pa- ca de 5,6 mg/100 mL, con una desviación
ra el cálculo del error estándar. Por ello, al estándar de 0,9 mg/100 mL.
igual que con las muestras de datos nu- ¿Es “poco probable” o no (P < 0,05) que
méricos, la magnitud del error posible au- la media aritmética de una muestra
menta al disminuir el tamaño de la muestra de tamaño 100 tenga un valor de
o disminuye con su aumento. 5,3 mg/100 ml? Es poco probable, ya que
este valor está alejado de la media de la
SÍNTESIS CONCEPTUAL población, 0,30, más de dos errores están-
dar. El error estándar en este caso es 0,09
• Cuando se toman muestras de un con- (0,9 dividido raíz cuadrada de 100), que
junto de datos numéricos, la media arit- multiplicado por 2 es 0,18.
mética varía entre las muestras, aunque ¿Y si la muestra hubiera tenido un tama-
el dato estadístico del conjunto de todas ño igual a 20? El valor obtenido no sería
las posibles es, en promedio, igual al “poco probable”, ya que en este caso el
parámetro de la población de la que fue- error estándar sería de 0,20 (0,9 dividido
ron obtenidas. raíz cuadrada de 20), que multiplicado por
• La distribución de las medias aritméticas 2 es 0,40, valor menor que 0,30.
de esas muestras toma una forma asimi-
lable a la distribución gaussiana, con una 7.2
medida dispersión cuantificable median-
te el error estándar. En una población de adultos jóvenes
• Los valores estadísticos de muestras de la estatura media (media aritmética) es
conjuntos de datos nominales varían con 1,70 m y la desviación estándar 0,24 m.
una distribución descrita por la denomi- ¿Menor o mayor a qué valor debe ser la
nada distribución binomial. media aritmética de una muestra de tama-
• Tanto en el caso de datos numéricos ño 64 tomada de esa población para poder
como en el de datos nominales, el valor considerarse que se está frente a una situa-
del error estándar es inversamente pro- ción “poco probable” (P < 0,05)?
porcional al tamaño de las muestras. El error estándar de la distribución de las
medias de muestras de ese tamaño tomadas
EJEMPLOS de esa población es 0,03 (0,24 dividido raíz
cuadrada de 64). Los valores 1,64 y 1,76
7.1 están dos errores estándar alejados de la
media. Por lo tanto, cuando la media de la
En una población de adultos sin manifes- muestra obtenida sea menor o mayor, res-
taciones de presencia de cálculos sobre sus pectivamente, que esos dos valores, se esta-
superficies dentarias el contenido de calcio rá frente a una situación “poco probable”.