Está en la página 1de 6

Nociones bsicas para el clculo del tamao de la muestra

Anlisis de Datos en Psicologa I


Vicente Manzano
Decidir cul es el mejor tamao para una muestra es una de las preocupaciones principales
relativas al muestreo. El primer principio es que no existe un tamao bueno para todo. Segn el
tipo de muestreo que se vaya a realizar, los objetivos que se persigan, las caractersticas de la
poblaci!n y las condiciones en las que se van a realizar las estimaciones, sern aconsejables
unos tamaos u otros. "odra parecer que una muestra es mejor cuanto ms grande. "ues s,
podra parecerlo, pero no es cierto. #uanto ms grande las estimaciones sern ms precisas y
con menos riesgo de error. "ero tambi$n saldrn ms caras y tal vez se reduzca el control en la
recogida de datos, por lo que, repito, no exite un tamao bueno para todo.
Este documento tampoco es bueno para toda decisi!n de tamaos de muestra. Se %a pensado
para unas situaciones y no para cualesquiera. "ero no nos preocupemos en exceso. &i
experiencia es que buena parte de las investigaciones cient'icas publicadas en revistas de
prestigio %acen muestreos que dejan bastante que desear. (ntentaremos no ser peores sino
mejorar un poco en panorama.
Principios generales
1. El tamao de la muestra suele simbolizarse con la letra minscula n.
2. n depende del tipo o modelo de muestro. #ada uno requiere sus propias expresiones de
clculo. )qu partimos del muestreo aleatorio simple.
3. n depende del objetivo de anlisis. )qu vamos a suponer que estimamos una media
aritm$tica o una proporci!n.
*. En una investigaci!n se busca responder a varios objetivos. #ada objetivo requiere su
propio clculo de tamao de muestra. "ero la muestra es nica para todos. +,u$ %acer-
.ablaremos de ello ms adelante /ver apartado 01amao y objetivos23.
4. )unque cada objetivo y modelo de muestreo cuentan con sus propias expresiones de
clculo, siempre existen cuatro variables bsicas5 tamao de la poblaci!n, variaci!n de la
poblaci!n, precisi!n de la estimaci!n y riesgo de error. En cuatro apartados del mismo
nombre vamos a tratar estos conceptos.
6. n es una apuesta. "ara calcularlo %emos de suponer cosas que no sabemos con exactitud.
"odemos %aber supuesto bien o menos bien o, incluso, mal. "or eso solemos ponernos en
la peor de las situaciones, como vers en el ejemplo sobre la in'luencia de la variaci!n de
la poblaci!n en el tamao de la muestra.
Tamao de la poblacin
"arece l!gico suponer que con'orme aumenta el tamao de la poblaci!n, tambi$n debe %acerlo el
de la muestra. En cierta medida es as. "ero la relaci!n entre ambos no es lineal, sino logartmica.
6ale, es un palabrejo. ,uiero decir que con'orme la poblaci!n es ms grande tambi$n debe serlo
la muestra, pero menos. El objetivo de la muestra es permitirnos realizar estimaciones sobre
valores de la poblaci!n. Es necesario partir de un tamao mnimo. Estaremos de acuerdo en que
una muestra de n 7 8 no sirve para generalizar nada cuando medimos variables que tienen alguna
variaci!n en la poblaci!n. Si lo que queremos medir es si la gente se muere al quitarle la cabeza,
no %ace 'alta obtener ninguna muestra, pues ya sabemos que la cabeza es 'undamental para
mantener la vida /aunque la utilicemos s!lo un poco3. "ero para averiguar qu$ piensan las
personas sobre el precio de la remolac%a o en qu$ medida estn de acuerdo con la gesti!n de un
personaje poltico, ya sabemos que las opiniones di'ieren y que no %ay que jugrsela con una
muestra de n 7 8. +9 n 7 :- ;o %emos mejorado muc%o.
1amao de muestra < 8 <
=o siento, no existe un tamao mnimo. "ero s un tamao mximo.
#on'orme aumenta el nmero de elementos de la poblaci!n /personas, %ogares, 'bricas o lo que
sea que estemos investigando3, es l!gico que deba ser mayor la muestra, pero cada nuevo
elemento en la poblaci!n aade menos cuanto $sta es ms grande. Esto tambi$n es l!gico. De 8
a : %emos duplicado el nmero, pero de 8>? a 8>@ no %ay muc%a di'erencia, mientras que
AAAAAAAAA4 ! AAAAAAAAAB son la misma cosa, y no admito discusiones tontas al respecto.
"or ejemplo, vamos a realizar una estimaci!n por intervalo de una proporci!n. Suponemos que la
varianza poblacional es >,:4. Ctilizamos un error de precisi!n de >,>D. 9 el riesgo de error es >,>4.
6amos a ir considerando tamaos de poblaci!n como potencias de 8>. 6ers c!mo la muestra no
se multiplica del mismo modo5
N 10 100 1000 10000 100000 1000000 10000000 100000000 1000000000
n 10 92 517 965 1056 1066 1067 1068 1068
Esta circunstancia es trascendente. (magina que queremos realizar estimaciones en una regi!n
con diez provincias. #ada provincia cuenta con 8> mil %abitantes. "ara %acer estimaciones con el
error de precisi!n y el riesgo de error considerados, necesitamos una muestra de 8>4B personas
para toda la regi!n. "ero si queremos %acer estimaciones por provincia, necesitamos AB4 para
cada unaE es decir, AB4> /FA veces msG3 en total.
Variacin en la poblacin
1ambi$n es l!gico pensar que con'orme vare ms lo que queremos conocer, ser necesario
indagar en ms unidades. Si la gente opina de 'orma muy similar con respecto a algo, bastar con
preguntar a unas pocas. Si queremos %acer un estudio sobre el gasto de los %ogares andaluces
en alimentaci!n, tal vez necesitemos una muestra grande porque sospec%amos que %ay muc%as
'ormas di'erentes de organizar la economa 'amiliar y muc%as peculiaridades.
6amos a ver esta in'luencia con otra tabla, esta vez partimos de un tamao de poblaci!n
constante /diez mil unidades3 para estimar una proporci!n con un error de precisi!n de >,>DE
riesgo de equivocaci!n de >,>4E y una varianza que vamos a considerar entre >,8> y >,:4E
utilizando intervalos de >,>D.

2
0,10 0,13 0,16 0,19 0,22 0,25
n 410 526 640 751 859 965
.e dic%o que este documento se escribe suponiendo que vamos a realizar estimaciones de
medias aritm$ticas o de proporciones. ;o %e dic%o nada de varianzas o desviaciones tipo. Se
supone tambi$n que si no conocemos la media o la proporci!n poblacional +c!mo vamos a
conocer su desviaci!n- +,u$ %acemos entonces-
#uando ocurre lo %abitual, es decir, cuando no sabemos qu$ valor tiene la variaci!n poblacional,
adoptamos lo que se llama una 0postura conservadora2. 9a %emos visto que con'orme es mayor la
variaci!n, tambi$n es mayor el tamao de la muestra. (magina que in'ravaloramos la variaci!n,
que es >,:: en lugar de >,8D como pensamos. =a muestra va a ser ms pequea de lo que
debera ser /calcularemos 4:B en lugar de @4A que es lo que deberamos %aber %ec%o3. Despu$s,
a la %ora de %acer las estimaciones a partir de los datos de la muestra que %emos obtenido, nos
tropezaremos con las consecuencias del error5 por culpa de un tamao de muestra demasiado
pequeo, nuestras estimaciones sern ms err!neas o ms imprecisas o ambas cosas a un
mismo tiempo.
1amao de muestra < : <
"ara evitar ese e'ecto indeseable, nos ponemos en la peor de las situaciones5 la de la mxima
varianza que pueda ocurrir desde la in'ormaci!n con que contamos. ) esto se le llama 0postura
conservadora2. Si nos equivocamos ser por exceso. .abremos implicado ms dinero o ms
tiempo de lo necesario, pero conseguiremos estimaciones tanto o ms precisas como lo deseado
y tanto o ms seguras de lo diseado. &ejor eso que lo contrario.
+,u$ valor tiene la varianza entonces, desde una perspectiva conservadora- .emos de pensar
en una situaci!n lmite5 la mxima varianza que se pueda obtener. En el caso de las proporciones
es 'cil. =a varianza de proporciones es p/8<p3. .az todas las pruebas que quieras, la varianza
mxima ocurre cuando p7>,4, lo que lleva a S
:
7>,4/8<>,437>,:4. )si que si no sabemos qu$ valor
tiene la varianza poblacional cuando estamos estimando proporciones, vale con la postura
conservadora de que S
:
7>,:4.
En las medias aritm$ticas es ms complicado. Es muy di'cil que el valor de la desviaci!n tipo
llegue a igualar el valor de la media aritm$tica. #omo la varianza es el cuadrado de la desviaci!n
tipo, lo que podemos %acer es imaginar un intervalo de valores esperables para la media de la
poblaci!n. 1omamos el lmite superior del intervalo y lo elevamos al cuadrado. .e a% una
estimaci!n conservadora para la varianza poblacional. "or ejemplo, vamos a estimar el nmero de
peines que compra una persona en una poblaci!n, cada ao. ;o s$ nada sobre ello, pero dudara
que la media sea superior a D. Entonces, podemos utilizar D
:
7A como estimaci!n conservadora de
la varianza.
Error de precisin
=lamamos error de precisi!n al radio del intervalo de estimaci!n. "odemos pensar en ello con dos
'ormas di'erentes para re'erirse a lo mismo5
=a cantidad que se resta y se suma al estadstico o estimador para construir el intervalo de
con'ianza en cuyo interior esperamos que se encuentre el parmetro.
=a mxima di'erencia que cabe esperar que exista entre el estadstico y el parmetro.
=uego, a mayor error de precisi!n, menos precisi!n /ms imprecisi!n3. El ideal es buscar la
mxima precisi!n posible /el mnimo valor para el error de precisi!n3. "ero es l!gico pensar que
con'orme %acemos el intervalo ms pequeo, %aya que exigir un tamao de muestra ms grande
o correr ms riesgo de equivocarse al suponer que el parmetro se encuentra dentro del intervalo.
#omo el riesgo es algo que pre'erimos no tocas, est claro que la aspiraci!n de un error de
precisi!n mnimo debe buscarse mediante un tamao de muestra mximo, en las circunstancias
concretas donde se de'ina tal cosa.
#on'orme aumenta el tamao de la muestra se obtienen valores de los estadsticos que deben
parecerse ms al valor del parmetro, si todo lo dems sigue igual. =a tabla siguiente muestra
esta relaci!n, partiendo de una estimaci!n por intervalo de una proporci!n, mediante un riesgo de
error de >,>4 y una poblaci!n de tamao 8> mil y varianza de >,:4.
ep 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
n 4900 1937 965 567 370 260 193 148 118 96
Hbserva con qu$ velocidad se reduce el tamao de la muestra al aumentar el error de precisi!n.
Sin duda es una variable con gran sensibilidad. Entre otras razones, por esto mismo es la que
suele utilizarse para variar las consecuencias de un tamao de muestra di'erente. (magina que
aunque deseamos un error de precisi!n de valor >,>B, no tenemos dinero para :B> entrevistas. De
%ec%o, s!lo podramos costear :>>. "ues no es muy grave si aceptamos igualmente un error de
precisi!n de valor >,>?.
1amao de muestra < D <
+#!mo decidir un valor concreto para e
p
- En principio %ay que considerar la escala en la que se
mueve el parmetro. Si vamos a estimar una proporci!n y $sta creemos que ronda el 4>I,
podramos considerar un buen intervalo, por ejemplo, de *4I a 44I /un error de precisi!n de
4I3. "ero si la proporci!n ronda un DI, no tiene sentido sumarle y restarle 4I. )lgo admisible en
este caso podra ser un error de precisi!n de valor 8I, que construye un intervalo del :I al *I,
entre otras posibilidades.
#omo eso de plantearse 0la sensaci!n positiva2 de la amplitud de un intervalo es algo que roza lo
asombroso para muc%as mentes y muc%os corazones, podemos pensar en estrategias
aparentemente menos sentimentales. Cna de ellas es considera un error de precisi!n que no vaya
ms all de un 8>I del valor supuesto para el parmetro. "ara una proporci!n del 4>I, un error
de precisi!n del 4I. "ara una proporci!n del DI, un error de precisi!n de >,DI. Si estimamos
una media aritm$tica, pongamos que el nmero medio de litros de bebida alco%!lica que se
consumen en una 'amilia espaola durante las vacaciones de ;avidad, y creemos que ese valor
debe encontrarse entre los 84 y :4 litros, utilizamos el centro /:> litros3 como re'erencia y un error
de precisi!n de la d$cima parte, es decir, de : litros.
=a sugerencia del prra'o anterior s!lo tiene sentido en situaciones de p$rdida total de re'erentes,
que es lo que suele ocurrir, por ejemplo, cuando %ay que %acer un trabajo para una asignatura. En
una situaci!n prctica se utilizan los re'erentes %abituales. )s, por ejemplo, si vamos a estimar el
nmero de escaos que va a ocupar un partido en el #ongreso de los Diputados tras unas
elecciones generales, lo %abitual es procurar un error de precisi!n no superior a : escaos.
Riesgo de error
#omo ya sabemos, lo que llamamos 'amiliarmente con 0riesgo de error2 es la expresi!n abreviada
de otra ms larga5 0riesgo de equivocarse al a'irmar que el parmetro se encuentra en el intervalo
de con'ianza que se propone2. Es un valor de probabilidad que, como todos los valores de
probabilidad, debe encontrarse entre > y 8.
#omo ocurre con el error de precisi!n, es el equipo investigador quien decide un valor para el
riesgo de error. +#!mo escogerlo- Sabemos que a mayor riesgo, menor tamao de muestra,
puesto que somos menos exigentes con la situaci!n. =o ideal es no equivocarse, lo que es
imposible de garantizar. )s que aspiramos al mnimo error en la prctica, lo que aconseja el
mximo tamao de muestra. Hbserva la relaci!n en la siguiente tabla, para estimaci!n de una
proporci!n con una poblaci!n de 8> mil unidades, una varianza poblacional de >,:4 y un error de
precisi!n de >,>D.
riesgo 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10
n 1557 1307 1157 1049 965 895 836 785 740 700
9a ves que su e'ecto no es tan drstico como el del error de precisi!n. "ero, volvamos a la
pregunta +#!mo escoger un valor para el riesgo de error-
=o suyo sera pensar en cules son las consecuencias que se derivan de equivocarse. #uanto
ms graves o indeseables sean, menor tendr que ser el riesgo de llegar a ello. (magina cul es el
valor de riesgo que consideraras en las siguientes ocasiones5 83 si te equivocas mueres pues
%ablamos del riesgo de tener un accidente de tr'ico, :3 si te equivocas no tendrs el yogurt gratis,
pues %ablamos de tomar una decisi!n sobre qu$ calle tomar para ir a la universidad sabiendo que
en las inmediaciones estn repartiendo yogurt.
En muc%as ocasiones /como trabajos de asignaturas, como siempre3, es di'cil ponerse en
situaci!n y decidir un valor para el riesgo que sea adecuado a la conciencia de las consecuencias.
En estos casos acudimos a Jis%er. #omo sabes, Jis%er 'ue un agr!nomo que le complic! la vida a
1amao de muestra < * <
todos los estudiantes de estadstica desde que irrumpi! en escena en el primer tercio del siglo KK.
Cna de las ocurrencias que tuvo 'ue pensar c!mo saber si una viejecita deca la verdad o no.
)quella viejecita a'irmaba que era capaz de distinguir si en un vaso de t$ con lec%e se %aba
ec%ado antes el t$ o la lec%e. Jis%er pens! que podra acertar por casualidad, pero que
demasiados aciertos seran indicador de verdad en la a'irmaci!n. Jinalmente decidi! cuntas
tazas deba poner ante la seora y le sala, en el clculo, que con una probabilidad de
equivocarse del 4I podra rec%azar la %ip!tesis de que la viejecita %aba acertado por azar.
Desde entonces, nadie %a abierto la boca para decir otra cosa. Se considera que un riesgo de
>,>4 es vlido por de'ecto. Si alguien osa tomar otra decisi!n se le preguntar por qu$. #omo no
queremos dar explicaciones, todo el mundo coge >,>4. Se admiten dos excepciones ms5 >,>8
para mostrar que uno es muy exigente y LMLL, es decir, el nmero de asteriscos que suministra
S"SS, un programa de ordenador que se est utilizando como re'erente desde %ace tiempo.
Sabemos que muc%as personas deciden dejar de pensar cuando se les presenta la oportunidad
para ello. S"SS, un programa tonto de ordenador /como todos los programas de ordenador, por
de'inici!n, desprovistos de inteligencia3, suministra esa oportunidad. Nealmente no es cierto, pero
muc%a gente %a llegado a cre$rselo y si a'irmas 0me lo dijo S"SS2, suelen dejarte en paz.
Tamao y objetivos
=os estudios tienen varios objetivos de anlisis. En principio, %abra que calcular un tamao de
muestra para cada objetivo. (magina este caso5 tenemos dos proporciones que estimar. Cna
consideramos que ronda el valor *>I /es decir, una varianza de O>,*P/8<>,*37Q >,:*E y un error de
precisi!n de O>,*M8>7Q >,>*3. En una poblaci!n de tamao prcticamente in'inito y un riesgo de
>,>4, el tamao de muestra es n 7 4??. De la otra proporci!n suponemos que tiene un valor en
torno al 8>I /es decir, una varianza de O>,8P/8<>,837Q >,>AE y un error de precisi!n de O>,8M8>7Q
>,>83. En una poblaci!n de tamao prcticamente in'inito y un riesgo de >,>4, el tamao de
muestra es n 7 D*4@. +,u$ %acemos-
Cna postura conservadora aconseja tomar el tamao ms grande de entre todos los calculados.
En este caso es D*4@. ;o obstante, puede ser muy exagerado. En tales situaciones, podemos
prescindir de los tamaos extremos, sabiendo que las estimaciones que realizaremos despu$s
para esos objetivos tendrn menos precisi!n o seguridad.
#omo es temporalmente costoso calcular un tamao de muestra para cada objetivo, es raro que
se lleve a la prctica. .ay dos soluciones. Cna es considerar el objetivo estrella o ms importante.
=a otra es considerar que no tenemos ni idea de nada y adoptar una postura conservadora que
llevar %acia un tamao mximo de muestra.
lculo de n con !"#
Existen varias utilidades que permiten calcular el tamao de una muestra. .ay de pago y gratis.
=as %ay de (nternet y de puesto local. =as %ay en RindoSs y en otros sistemas. =as %ay ms
claras y ms oscuras, con ms o menos situaciones de consideraci!n, etc.
Cna de las utilidades de libre distribuci!n, pensadas para cubrir todas las situaciones expuestas
aqu, es &)S. Se puede bajar de
%ttp5MMSSS.personal.us.esMvmanzanoMdistribuyeMprogramas.%tm
=a siguiente 'igura muestra una pantalla tpica para &)S. #omo observars, se encuentran todas
las variables consideradas5 varianza de la poblaci!n, riesgo de error, error de precisi!n, tamao de
la poblaci!n y tamao de la muestra.
.ay dos aspectos interesantes para resaltar. El primero es que &)S sirve tambi$n para poner
cualquiera de las variables en 'unci!n de las otras. Hbserva el recuadro de la derec%a de la
1amao de muestra < 4 <
ventana. )l marcar sobre la variable, $sta se trans'orma en dependiente, su recuadro queda
marcado de amarillo y recibir los resultados de clculo que se establezcan sobre todas las
dems.
=a segunda caracterstica de inter$s a resaltar es que &)S genera un in'orme donde consta la
situaci!n de partida, los valores de las variables independientes, la '!rmula de clculo y el
resultado. Se accede a esta generaci!n pulsando el bot!n 0=eer M Escribir2 y escogiendo la opci!n
0Tenerar2.
En el ejemplo que se muestra en la pantalla, el resultado de la generaci!n del in'orme es el que
sigue5
MAS: Informacin de contexto y resultados
* Contexto:
Muestreo Aleatorio Simple desde una poblacin de tamao infinito.
Estimacin de una media o proporcin.
Supuesta una distribucin muestral normal.
Tiempo de interaccin: !:"#:!".
* $ariables:
$ariable dependiente: Tamao de la muestra %n&
$ariables independientes:
$arian'a poblacional %$& : ()
*istancia estandari'ada %+&: !(),
-robabilidad de error %p& : (.
Error de precisin %E& : (!
* Expresin de c/lculo:
n 0 $*+12E1
* 3esultado: #".4
1amao de muestra < B <

También podría gustarte