Está en la página 1de 8

7

MUESTREO

La manera usual de realizar un es- tro de un estrato o subconjunto de ella, la


tudio del comportamiento de va- selección se realice en forma aleatoria. Esta
riables en una población es to- condición significa que, durante el procedi-
mando muestras de individuos o miento, cada uno de los integrantes de la
unidades experimentales pertene- población tiene la misma probabilidad de
cientes a ella. ser seleccionado.
A lo largo de este capítulo se analizará el
A partir de los datos registrados en estas
comportamiento de las muestras tomadas
unidades es posible, luego, realizar inferen-
en esas condiciones en su relación con los
cias sobre el conjunto total, la población.
parámetros de la población de origen. En
Una condición que debe reunir una
primer lugar, se examinará la situación para
muestra para realizar esas inferencias es ser
variables descritas mediante datos “numéri-
“representativa”. Esto significa que en ella
cos” y luego se harán algunas apreciaciones
deben estar representadas todas las condi-
para el caso de los datos nominales. Al igual
ciones presentes en la población y que pue-
que frente a otras situaciones, los datos or-
den influir en el dato a partir del cual se
dinales pueden considerarse como categó-
evalúa la variable de interés.
ricos, al igual que los nominales, o, cuando
La representatividad de una muestra se
se trata de puntajes o índices razonable-
garantiza por la forma de selección de sus
mente estandarizados, tratarlos como nu-
componentes. Este tema se trata en el estu-
méricos, aun cuando en realidad no lo sean.
dio de las técnicas de investigación; la apli-
cación de las técnicas estadísticas presupo-
ne que la muestra es representativa. MUESTRAS CON DATOS “NUMÉRICOS”
Una vez decidido cómo se va a asegurar
la representatividad, se debe garantizar Supóngase que se está frente a una pobla-
que, dentro de la población definida o den- ción hipotética y pequeña de cuatro indivi-
Introducción a la Estadística en Ciencias de la Salud. Macchi. ©2013. Editorial Médica Panamericana.
48 INTRODUCCIÓN A LA ESTADÍSTICA EN CIENCIAS DE LA SALUD

duos (N = 4) en la que los que la compo- rés real son de tamaños notoriamente
nen tienen los siguientes datos “numéri- mayores.
cos” para una determinada variable: a = 4; Para seleccionar en forma aleatoria dos
b = 3; c = 3; d = 2. Esos valores se inclu- unidades de las cuatro de la población,
yen en la primera fila del cuadro 7-1. La podrían colocarse cuatro bolillas identifica-
media aritmética (μ) en ese conjunto es 3. das con las respectivas letras en un bolille-
Si se supone que alguien está interesado ro y, por sorteo, retirar dos.
en el valor de ese parámetro, aunque no Debe destacarse que en este caso no se
tiene acceso a la población sino solo a algu- está cumpliendo en su totalidad el requisi-
nos de sus integrantes, necesitaría trabajar to de aleatoriedad. En efecto, la posibilidad
a partir de una muestra. Se verá a conti- de selección de la primera bolilla ha sido de
nuación la situación que se plantearía al uno en cuatro (P = 1/4) mientras que en
utilizar para la tarea una muestra de tama- la segunda, de uno en tres (P = 1/3).
ño 2 (n = 2). Se entenderá que esta situa- Para trabajar de manera realmente alea-
ción se presenta a manera de ejemplo, ya toria es necesario obtener la muestra “con
que las poblaciones que presentan un inte- reemplazo”. Esto significa que cada uni-

CUADRO 7-1. RESULTADOS EN LAS MUESTRAS TOMADAS DE UNA POBLACIÓN HIPOTÉTICA DE DATOS
“NUMÉRICOS”

Población: a=4 b=3 c=3 d=2 μ=3

Muestra (n = 2) Media Muestra (n = 3) Media

a=4 3,50 a=4 3,33

b=3 b=3

a=4 3,00 c=3 3,00

c=3 a=4

a=4 3,00 b=3 3,00

d=2 d=2

b=3 3,00 a=4 2,67

c=3 c=3

b=3 2,50 d=2 12,00

d=2 b=3

c=3 2,50 c=3 3,00

d=2 d=2

Suma 18,00 Suma

Media 3,00 Media

Introducción a la Estadística en Ciencias de la Salud. Macchi. ©2013. Editorial Médica Panamericana.


CAPÍTULO 7 | MUESTREO 49

1
dad se debe seleccionar, registrar el dato en media aritmética de una muestra. Esto no
ella y luego incorporarla nuevamente a la depende de una forma de trabajar correcta,
población para mantener constantes las po- sino tan solo de la mayor o menor “suerte”

2
sibilidades de selección. Este mecanismo, que se tenga en la selección aleatoria de la
que hace posible que una misma unidad muestra.
sea seleccionada más de una vez, no es el

3
que se aplica en las situaciones reales y La media aritmética de las mues-
obliga a algunas modificaciones en los pro- tras tomada de una población
cedimientos que se describirán más ade- varía.

4
lante. No obstante, esas modificaciones tie-
nen un peso significativo en los resultados Por otro lado, en la última fila del cuadro
solo cuando el tamaño de la muestra supe- puede verse que la media aritmética, el

5
ra el 10% del tamaño de la población, lo promedio, de las medias aritméticas de las
que rara vez sucede en las investigaciones muestras obtenidas es 3 (el valor de su
reales. Por este motivo, se trabajará aquí suma, 18, dividido por la cantidad de mues-
asumiendo aleatoriedad aun cuando no tras totales, 5), valor que corresponde al del

6
sea real, por seleccionar una muestra que, parámetro de la población (μ = 3).
en el ejemplo, tiene un tamaño (2), que Una segunda conclusión es que, debido a
representa la mitad del tamaño de la po- que el valor de la media aritmética de la

7
blación (4). muestra tomada de una población varía,
Según el ejemplo, puede verse en la prime- aunque a veces se lo estima bien, y otras se
ra columna del cuadro 7-1 la composición sobreestima o se subestima el parámetro,

8
de las seis posibles muestras que pueden ob- en promedio se lo estima bien.
tenerse en las condiciones planteadas.
Al calcularse en cada una de esas mues- Puede expresarse que, en prome-

9
tras el estadístico de tendencia central dio, la media aritmética del con-
media aritmética (recuérdese que un esta- junto de medias aritméticas de
dístico se calcula en una muestra, mientras muestras de una población es
10
que un parámetro lo es en una población), igual a la media aritmética – pará-
se obtienen los resultados que se muestran metro– de la población de la cual
en la segunda de las columnas del cuadro. se tomaron las muestras.
De esos resultados surge que en dos de
11

las muestras el valor del estadístico (x–) Véase ahora en las columnas tercera y
coincide con el parámetro de la población cuarta del cuadro lo que sucede al tomar
(μ = 3); en otras dos al estadístico le co- muestras de tamaño tres (n = 3) de la
12

rrespondió un valor mayor que el del pará- misma población hipotética.


metro; y en otras dos un valor menor. También en este caso, en promedio, se
Una primera conclusión que puede estima bien, pero la magnitud de la sobre-
13

extraerse es que puede producirse una esti- estimación o de la subestimación es menor


mación correcta, una sobreestimación o que cuando las muestras son de menor
una subestimación, al estimar la media tamaño. En efecto, cuando n = 2 el error
14

aritmética de una población a través de la de estimación fue de 0,50 en más o en

Introducción a la Estadística en Ciencias de la Salud. Macchi. ©2013. Editorial Médica Panamericana.


50 INTRODUCCIÓN A LA ESTADÍSTICA EN CIENCIAS DE LA SALUD

menos, mientras que cuando n = 3 fue de integrantes: a = 5; b = 3; c = 3; d = 1.


0,33. La media aritmética (μ) en este conjunto es
Una tercera conclusión es que la magni- también 3, aunque su dispersión es mayor.
tud del error que puede cometerse al esti- Esto puede visualizarse a partir del rango o
mar la media aritmética de una población a recorrido que es 4 (5 – 1), mientras que es
partir del correspondiente estadístico dis- 2 (4 – 2) en la población del primer ejem-
minuye al aumentar el tamaño de la mues- plo de este capítulo.
tra utilizada. Las conclusiones ya extraídas se aplican a
Por último, véanse en el cuadro 7-2 los esta nueva situación, aunque, al comparar
resultados de repetir el procedimiento en los resultados de las dos tablas, puede
otra población de tamaño 4, aunque con observarse que para un mismo tamaño de

CUADRO 7-2. RESULTADOS EN LAS MUESTRAS TOMADAS DE UNA POBLACIÓN HIPOTÉTICA DE DATOS
“NUMÉRICOS”

Población: a=5 b=3 c=3 d=1 μ=3

Muestra (n = 2) Media Muestra (n = 3) Media

a=5 4,00 a=4 3,67

b=3 b=3

c=3

a=5 4,00 a=4 3,00

c=3 b=3

d=2

a=5 3,00 a=4 3,00

d=1 c=3

d=2

b=3 3,00 b=3 2,33


c=3 c=3

d=2

b=3 2,00 Suma 12,00

d=1 Media 3,00

c=3 2,00

d=1

Suma 18,00

Media 3,00

Introducción a la Estadística en Ciencias de la Salud. Macchi. ©2013. Editorial Médica Panamericana.


CAPÍTULO 7 | MUESTREO 51

1
muestra la magnitud del error que puede ca (recuérdese lo analizado en el cap. 5) por
cometerse en la estimación es mayor en lo que es útil extraer la correspondiente
este caso. raíz cuadrada y así llegar al valor de lo que

2
Una cuarta conclusión es, por lo tanto, se denomina error estándar.
que la magnitud del error que puede come- En fórmula:
terse al estimar la media aritmética de una

3
población a partir del correspondiente Error estándar = σ / 冪n
estadístico aumenta al aumentar la disper-
sión de la población de la que se toma la Es decir, el error estándar puede calcular-

4
muestra. se al dividir el valor de la desviación están-
dar de la población por la raíz cuadrada del
ERROR ESTÁNDAR tamaño de la muestra utilizada.

5
Obsérvese que existen dos situaciones en
Los resultados de la supuesta experiencia las cuales la posibilidad de error es nula
descrita en los ejemplos planteados lleva a (error estándar igual a 0).
expresar que:

6
Una de ellas se produce cuando en la
población original no existe dispersión, o
La magnitud del “error” posible al sea, que todos sus datos son iguales. Al ser
estimar la media aritmética de una
el numerador 0, el cociente también es 0,

7
población a partir de la media arit-
ya que este valor divido por cualquier otro
mética de una muestra tomada
aleatoriamente de ella aumenta al arroja ese resultado.
La segunda situación se verifica cuando

8
incrementar la dispersión de la
población y al disminuir el tamaño la muestra tomada es infinitamente grande,
de la muestra, y disminuye al redu- es decir, cuando se evaúa a la totalidad de
cir la dispersión de la población y la población; en este caso, el denominador

9
aumentar el tamaño de la muestra. es infinito y el resultado de dividir cual-
quier valor por infinito es 0.
Expresado en términos matemáticos, Como se comprenderá, se trata de dos
puede decirse que la magnitud del error es situaciones inexistentes en la realidad de la 10
directamente proporcional a la dispersión investigación. En los datos numéricos es
de la población de origen de la muestra e prácticamente imposible evitar alguna dis-
11

inversamente proporcional al tamaño de persión, porque no todos los individuos de


esta. una población se comportan exactamente
Así, al ser la variancia la medida “demo- igual, o porque es casi imposible no come-
crática” de la dispersión, puede resumirse ter algún error en la recolección de datos.
12

este enunciado mediante la siguiente fór- Por otro lado, las poblaciones de interés
mula: son de tamaño demasiado grande como
para que sea posible trabajar con todos sus
13

Magnitud del error = σ2 / n integrantes.


Debe hacerse una consideración adicio-
El resultado de la fórmula está en una nal. Cuando, como en los ejemplos con que
14

escala diferente de la de la media aritméti- se ha trabajado, las muestras se obtuvieron

Introducción a la Estadística en Ciencias de la Salud. Macchi. ©2013. Editorial Médica Panamericana.


52 INTRODUCCIÓN A LA ESTADÍSTICA EN CIENCIAS DE LA SALUD

sin reemplazo, la fórmula para el cálculo procedimientos basados en la ecuación


del error estándar debe modificarse al mul- correspondiente a esa distribución, anali-
tiplicarla por un factor de corrección. Sin zados en el capítulo anterior, con la salve-
embargo, ese factor de corrección genera dad de que en lugar del valor de la desvia-
un valor de error estándar que puede con- ción estándar debe tenerse en cuenta el del
siderarse que afecta los resultados de análi- error estándar.
sis posteriores solo cuando el tamaño de la En función de lo enunciado, puede
muestra supera alrededor del 10% del volu- decirse que, de todas las muestras toma-
men de la población respectiva. Esta situa- das aleatoriamente a partir de una pobla-
ción es casi inexistente en las investigacio- ción, el 95% tiene valores de media arit-
nes en las ciencias de la salud, por lo que, mética comprendidos entre poco menos
en el trabajo habitual, no se tiene en cuen- de dos errores estándar (exactamente,
ta y se aplican la técnicas estadísticas como 1,96) por debajo y por encima de la media
si las muestras hubieran sido obtenidas con aritmética de la correspondiente pobla-
reemplazo. ción.
Por ejemplo, si de una población con
DISTRIBUCIÓN DE MEDIAS ARITMÉTICAS μ = 1.000 y σ = 40 se toman muestras
DE MUESTRAS con n = 25, puede esperarse que de modo
aproximado el 95% de ellas tengan valores
El error estándar representa una medida para su estadístico media aritmética entre
de la dispersión de la distribución de los 984 y 1.016. Esto es porque el error están-
valores de las medias de muestras tomadas dar en esta situación es 8 (40 dividido raíz
de una población, de la misma manera que cuadrada de 25) y dos veces 8 es 16.
la desviación estándar lo es de la dispersión
de los datos originales.
Para que este valor adquiera significado Se puede también decir que, al
en su relación con la medida de tendencia tomar una muestra al azar, es
central –la media aritmética– es necesario “poco probable” (P < 0,05) que su
establecer, empírica o matemáticamente, media aritmética esté alejada de la
media de la población más de dos
cuál es la forma de distribución de la varia-
errores estándar.
ble: en el caso que nos ocupa, el valor de la
media aritmética de las distintas muestras
tomadas de la población.
Ténganse presente estos conceptos para
encarar la tarea que se plantea en los capí-
La distribución de los valores de las
tulos siguientes. Asimismo, manténgase
medias aritméticas de las muestras
tomadas en una población es presente que, desde la ecuación matemáti-
gaussiana, aun cuando la distribu- ca, cualquier valor de media aritmética de
ción de los datos de la población una muestra es posible, ya que la ecuación
no tenga esa característica. gaussiana genera una línea –en forma de
campana– que cubre un área que se extien-
Esto permite aplicar a la distribución de de desde el valor de infinito negativo hasta
las medias de muestras los conceptos y el infinito positivo.
Introducción a la Estadística en Ciencias de la Salud. Macchi. ©2013. Editorial Médica Panamericana.
CAPÍTULO 7 | MUESTREO 53

1
MUESTRAS CON DATOS NOMINALES mente proporcional al tamaño de la mues-
tra: a mayor tamaño de muestra menor
Al tomar muestras de poblaciones de da- error posible.

2
tos nominales, la situación es equivalente a La diferencia estriba en que la distribu-
la ya descrita para los datos “numéricos”. ción no es en este caso gaussiana, sino que
Considérese una población hipotética de puede ser descrita con otro tipo de ecua-

3
8 individuos de los cuales 4 (P = 0,5 o ción, conocida como binomial, y el valor
50%) están en la categoría “enfermos”. del error estándar es la raíz cuadrada del
Los resultados posibles al tomar mues- valor obtenido de:

4
tras de tamaño cuatro (n = 4) se mues-
tran en el cuadro 7-3. Tal como en los P (1 – P) / n
casos anteriores, al estimar el parámetro

5
con el valor del estadístico en ocasiones se Esto es la raíz cuadrada del resultado del
“acierta” y en otras se sobreestima o subes- producto de la proporción en una categoría
tima, aunque, “en promedio”, se estima (0,5 en la categoría “enfermos” en el ejem-
bien. plo) por la que no está en la categoría (1 – P;

6
También en este caso la magnitud del 0,5 en el ejemplo) dividido por el tamaño
error posible en la estimación es inversa- de la muestra (4 en el ejemplo).

7
CUADRO 7-3. RESULTADOS EN LAS MUESTRAS TOMADAS DE UNA POBLACIÓN HIPOTÉTICA DE DATOS
NOMINALES

8
Población: Enfermos = 4 Sanos = 4 P = 0,5 Tasa = 50%

Muestra % enfermos

9
A 100,0
4 enfermos
0 sanos

B 75,0
3 enfermos 10
1 sano

C 50,0
11

2 enfermos
2 sanos

D 25,0
12

1 enfermo
3 sanos

E 0,0
0 enfermo
13

4 sanos

Suma 250,0

% promedio 50,0
14

Introducción a la Estadística en Ciencias de la Salud. Macchi. ©2013. Editorial Médica Panamericana.


54 INTRODUCCIÓN A LA ESTADÍSTICA EN CIENCIAS DE LA SALUD

Nótese que, también en este caso, el ta- en saliva tiene un valor de media aritméti-
maño de la muestra es el denominador pa- ca de 5,6 mg/100 mL, con una desviación
ra el cálculo del error estándar. Por ello, al estándar de 0,9 mg/100 mL.
igual que con las muestras de datos nu- ¿Es “poco probable” o no (P < 0,05) que
méricos, la magnitud del error posible au- la media aritmética de una muestra
menta al disminuir el tamaño de la muestra de tamaño 100 tenga un valor de
o disminuye con su aumento. 5,3 mg/100 ml? Es poco probable, ya que
este valor está alejado de la media de la
SÍNTESIS CONCEPTUAL población, 0,30, más de dos errores están-
dar. El error estándar en este caso es 0,09
• Cuando se toman muestras de un con- (0,9 dividido raíz cuadrada de 100), que
junto de datos numéricos, la media arit- multiplicado por 2 es 0,18.
mética varía entre las muestras, aunque ¿Y si la muestra hubiera tenido un tama-
el dato estadístico del conjunto de todas ño igual a 20? El valor obtenido no sería
las posibles es, en promedio, igual al “poco probable”, ya que en este caso el
parámetro de la población de la que fue- error estándar sería de 0,20 (0,9 dividido
ron obtenidas. raíz cuadrada de 20), que multiplicado por
• La distribución de las medias aritméticas 2 es 0,40, valor menor que 0,30.
de esas muestras toma una forma asimi-
lable a la distribución gaussiana, con una 7.2
medida dispersión cuantificable median-
te el error estándar. En una población de adultos jóvenes
• Los valores estadísticos de muestras de la estatura media (media aritmética) es
conjuntos de datos nominales varían con 1,70 m y la desviación estándar 0,24 m.
una distribución descrita por la denomi- ¿Menor o mayor a qué valor debe ser la
nada distribución binomial. media aritmética de una muestra de tama-
• Tanto en el caso de datos numéricos ño 64 tomada de esa población para poder
como en el de datos nominales, el valor considerarse que se está frente a una situa-
del error estándar es inversamente pro- ción “poco probable” (P < 0,05)?
porcional al tamaño de las muestras. El error estándar de la distribución de las
medias de muestras de ese tamaño tomadas
EJEMPLOS de esa población es 0,03 (0,24 dividido raíz
cuadrada de 64). Los valores 1,64 y 1,76
7.1 están dos errores estándar alejados de la
media. Por lo tanto, cuando la media de la
En una población de adultos sin manifes- muestra obtenida sea menor o mayor, res-
taciones de presencia de cálculos sobre sus pectivamente, que esos dos valores, se esta-
superficies dentarias el contenido de calcio rá frente a una situación “poco probable”.

Introducción a la Estadística en Ciencias de la Salud. Macchi. ©2013. Editorial Médica Panamericana.

También podría gustarte