Documentos de Académico
Documentos de Profesional
Documentos de Cultura
www.elsevier.es/medicinaclinica
Artculo especial
N D E L A R T I C U L O
INFORMACIO
Introduccion
Una de las primeras disyuntivas que debe abordar un
investigador es decidir el numero de elementos a partir los que
se recogeran los datos que constituiran la muestra para el estudio.
Estudiar a toda la poblacion (representada con N), que sera la
manera mas exacta de conocer lo que se pretende estudiar, es casi
imposible en la practica (o al menos muy caro). A partir de los
datos observados en la muestra, se deben realizar pruebas
estadsticas que permitan generalizar los resultados a la poblacion
de la que proceden, con una mnima probabilidad de error (por lo
general, ap5%).
La introduccion del azar en el acto de seleccion muestral es un
elemento de maxima importancia, pues los procedimientos
probabilsticos (que necesariamente involucran al azar) satisfacen
la exigencia intuitiva de eliminar, o por lo menos de mitigar, la
carga subjetiva que podra influir en la eleccion de los elementos
que se van a examinar y, por tanto, en las conclusiones a que estos
dan lugar.
Una pregunta que frecuentemente se plantean los investigadores es la siguiente: Es representativo el estudio (o la muestra)?
Las muestras tienen un fundamento matematico estadstico. Este
consiste en que, cuando se obtiene cierta cantidad de informacion
de una muestra seleccionada )cientficamente*, se puede hacer la
inferencia estadstica de los resultados fundada matematicamente
en que estos resultados son validos para la poblacion de la que se
ha extrado la muestra y que corresponden al objetivo del estudio,
dentro de los lmites de error y probabilidad. El muestreo
probabilstico permite calcular de antemano la probabilidad de
que cada elemento sea incluido en la muestra y, de esta manera,
de que todos los elementos de la poblacion tengan una
probabilidad conocida (pero no nula) de ser elegidos para una
o de la muestra
Factores determinantes del taman
En principio, hay que rechazar la idea demasiado extendida de
o de la poblacion. El
que la muestra debe ser proporcional al taman
o de la muestra (representada con n) esta en relacion
taman
directa con la desviacion tpica de las puntuaciones en las
caractersticas de la variable que se investiga. Cuanto mas se
agrupen los valores individuales de la variable estudiada alrede o de la
dor de un valor central, se requerira un menor taman
o
muestra. La cuestion mas controvertida en el calculo del taman
de la muestra es que es necesario conocer de antemano el valor de
uno o mas parametros que solo pueden estimarse una vez
realizado el estudio. Una posibilidad es realizar un estudio piloto
a fin de obtener un valor aproximado del parametro desconocido;
la alternativa mas frecuente consiste en utilizar valores obtenidos
de estudios previos similares. Un caso particular y que se
utiliza regularmente es la desviacion tpica de una proporcion
pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
(representada con p) cuyo valor es
p1 p y que frecuentepffiffiffiffiffi
mente se representa como
pq. La maxima dispersion esta
asociada a una proporcion del 0,50; p 0,5 y pq 0,25 que
o de la muestra mayor. La decision muy
implica un taman
ARTICLE IN PRESS
C. Araya Alpzar, M.P. Galindo Villardon / Med Clin (Barc). 2009;133(1):2630
o de la muestra
Determinacion del taman
A continuacion, se detalla la notacion que se utilizara para
facilitar la comprension de las formulas. La media poblacional se
denominara m; se denominara m1 a la media de referencia o a la
media del grupo control y m2 a la media de la hipotesis alternativa
que se desea detectar como estadsticamente significativa; se
denominara Za al valor de la distribucion normal estandara
asociado al grado de significacion y Zb al valor correspondiente
al error b aceptado, y se denominara s a la desviacion estandar
(DE) de la distribucion teorica y d a la magnitud del error de
muestreo. Para variables categoricas, se denominara P a la
a
La curva normal tiene en su eje x el valor estandarizado de la variable (valor
Z) y el area bajo la curva representa la probabilidad asociada a ese valor (p. ej. valor
a o b). Los riesgos a fijados suelen ser 0,01, 0,05 y 0,01 y los valores Z son 1,64; 1,96,
y 2,57, respectivamente.
27
2
124.
n 1;9617
3
n de una proporcio
n poblacional
Estimacio
ARTICLE IN PRESS
C. Araya Alpzar, M.P. Galindo Villardon / Med Clin (Barc). 2009;133(1):2630
28
Z 1a=2 Z b s 2
jm1 m0 j
n de 2 proporciones independientes
Comparacio
Sea por definicion a Px4c=H0 el valor del percentil de
la distribucion normal estandar, se restringe la solucion a que
n1 n2 n y se recuerda que el error tipo I es la probabilidad de
rechazar la hipotesis nula: es verdadero que P1 P2, donde
2
P P1 P
2 . De forma similar, b Pxoc=H 1 es la especificacion
ARTICLE IN PRESS
C. Araya Alpzar, M.P. Galindo Villardon / Med Clin (Barc). 2009;133(1):2630
Tabla 1
Comparacion de 2 proporciones independientes (a 0,05 y b 0,20)
P1
0,10
0,20
0,30
0,40
0,50
0,60
0,70
0,80
P2
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
157
48
231
25
64
280
15
30
73
305
10
17
33
76
305
7
11
18
33
73
280
5
7
11
17
30
64
231
4
5
7
10
15
25
48
157
del riesgo del error tipo II. Si d (P1P2) e iguala ambos terminos
con respecto al valor crtico y finalmente se despeja la igualdad
o de la muestra, se obtiene lo siguiente:
respecto al taman
qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffip
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi32
2 pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
Z a 2P1 P Z b P1 1 P1 P 2 1 P 2
5
n4
d
29
p1 1 p2
wp2
) p1
1 p2 wp2
p2 1 p1
o de la muestra puede
As, el problema del calculo del taman
obtenerse con la formula de comparacion de 2 proporciones. Por
ejemplo, supongase que se desea estudiar la existencia de una
asociacion entre el consumo de tabaco y el hecho de experimentar
un infarto de miocardio. Para poner en evidencia esta asociacion y
a un estudio de casos y controles,
cuantificar su magnitud, se disen
en el que se investigara el consumo de tabaco de una serie de
sujetos que han experimentado un infarto de miocardio (casos) y
una serie de sujetos sanos (controles)5. Se cree que alrededor de
un 40% de los casos no expuestos son fumadores y se considera
como diferencia importante entre ambos grupos un OR de 4. Con
o necesario de la muestra
estos datos, se puede calcular el taman
en cada grupo para detectar un OR de 4 como significativamente
diferente de un grupo con un IC del 95% y una potencia de la
prueba del 80%. Se necesitaran 35 sujetos por grupo.
n de curvas de supervivencia
Comparacio
Para la comparacion de curvas de supervivencia, se contrasta la
diferencia entre tasas de mortalidad (o tasas de riesgo) de los
o de la muestra
2 grupos, o sea, su RR. Si se desea calcular el taman
para encontrar un determinado valor de RR, se debe conocer lo
siguiente: una idea del valor aproximado del RR que se desea
detectar, la proporcion de expuestos al factor de estudio, el
porcentaje de observaciones censuradas (este se denominara c)
que se espera en el total de la muestra, el IC (1a) con el que se
desea trabajar, y, finalmente, la potencia (1b) que se quiere para
o de la muestra
el estudio. Con estos datos, el calculo del taman
puede abordarse mediante la formula:
n
Z 1a=2 Z 1b
logRR2 1 c1 pp
ARTICLE IN PRESS
C. Araya Alpzar, M.P. Galindo Villardon / Med Clin (Barc). 2009;133(1):2630
30
8.000
RR = 15
7.000
Tamao de muestra
6.000
5.000
4.000
3.000
RR = 2,5
2.000
RR = 2,5
1.000
0
1
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Nmero de genes candidatos
Figura 1.
Consideraciones finales
nE
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi#2
"
m
2r 1
1 1
4
mrP1 P2
donde: m
2
Z a
pffiffiffiffiffiffiffiffiffiffiffiffiffi
r1P Q Z 1b
pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi 2
rP 1 Q 1 P2 Q 2
rP1 P2 2
rP 2
, P P1r1
) Q 1 P,
1p
(razon entre los grupos no expuestos y los grupos
r p2 2p1p
b
Se realiza el ajuste del calculo de la muestra utilizando el criterio de error de
Bonferroni (a* a/k). El metodo de Bonferroni enuncia que, cuando se quiere
comparar 2 poblaciones a traves de k caractersticas medidas en estas, cada
comparacion individual ha de hacerse a un error de a/k, si se desea obtener un
error global de a.
Bibliografa
o muestral. Manual programa Ene 2.0.
1. Badiella BL, Marino PA. Calculo del taman
Madrid, GlaxoSmithKline, S.A. Madrid, 2006.
2. Belfer MD, Wu T, Kigman A, Raj KK, Goldman MD, Max BM. Candidate gene
studies of human pain mechanisms. Am Soc of Anesthesiol. 2004;100:156272.
o de la muestra. Matronas Profesion (Barc).
3. Gallego CF. Calculo del taman
2004;5:513.
o de muestra en la
4. Marrugat J, Vila J, Pavesi J, Sanz F. Estimacion del taman
investigacion clnica y epidemiologica. Med Clin (Barc). 1998;111:26776.
o muestral para la determinacion de
5. Pertegas DS, Fernandez PS. Calculo del taman
factores pronosticos. Unidad de Epidemiologa Clnica y Bioestadstica. Complexo
a). 2002(9):303.
Hospitalario Juan Canalejo. Cad Aten Primaria (Corun
6. Organizacion Panamericana de la Salud. El efecto placebo en los estudios sobre
la depresion mayor. Rev Panam Salud Publica [revista electronica]. 2002;12(3):
[consultado 24-10-2008]: Disponible en: URL: http://www.scielosp.org/scielo.php?script=sci_arttext&pid=S1020-49892002000900011.