Está en la página 1de 25

CURSO

INFERENCIA ESTADSTICA

CLCULO DEL TAMAO MUESTRAL


Introduccin .......................................................................................................... 2
Empecemos... .................................................................................................. 2
Relacin con la estadstica inferencial ........................................................................ 2
Apliquemos los conceptos a un ejemplo................................................................ 3
Las cinco preguntas claves....................................................................................... 4
Los dos mtodos para hacer el clculo del tamao muestral ......................................... 5
Clculo muestral para obtener una precisin adecuada.............................................. 5
Precisin para una proporcin ............................................................................. 6
Precisin para una media ..................................................................................11
De donde sacar los datos ..................................................................................12
Precisin para una tasa.....................................................................................12
Clculo muestral para obtener un poder adecuado...................................................14
Poder para dos proporciones..............................................................................15
Poder para dos medias .....................................................................................17
Nomograma..........................................................................................................17
Uso del nomograma para la comparacin de dos medias ..........................................18
Uso del nomograma para la comparacin de dos proporciones ..................................19
Consejos prcticos.................................................................................................21
Muestreo probabilstico...........................................................................................21
Resumiendo: ........................................................................................................23
Respuestas de los ejercicios ....................................................................................24

Ausencia de Evidencia, no es Evidencia de la Ausencia


(Absence of evidence is not evidence of absence)

INTRODUCCIN
Una parte esencial al planificar un estudio es decidir cuntas personas sern necesarias
incluir para contestar el objetivo principal, con una alta probabilidad de detectar como
estadsticamente significativo un efecto, si este existe, y por lo tanto, estar razonablemente
seguro que ese beneficio no existe si no se encuentra en el estudio.
Esta unidad versar sobre los conceptos y consideraciones necesarias a la hora de hacer
los clculos.
Aprenderemos a obtener el tamao muestral necesario para:

encontrar la proporcin de individuos de una poblacin que poseen una caracterstica


determinada con una precisin deseada. (Por ej la proporcin de diabticos).
encontrar el valor promedio de una variable continua (por ej presin arterial) que tiene
la poblacin con una precisin deseada.
comparar dos grupos en sus proporciones y medias.

Finalmente describiremos un mtodo grafico fcil y practico para obtener tanto el tamao
muestral como el poder de un estudio.
Esperamos que esta unidad les resulte comprensible, amena y sobre todo til en la diaria
que desarrollan.

Empecemos...
Por qu es importante definir de antemano el tamao necesario de la muestra?
Es importante conocer el tamao muestral para garantizarnos que el objetivo del estudio
puede ser adecuadamente respondido con la real cantidad de personas que se necesitan. Es
comn ver trabajos que no refieren el tamao muestral para contestar la hiptesis pudiendo
ocurrir:

En el caso en que la muestra sea pequea que no podamos detectar una diferencia o
que obtengamos un estimador impreciso. Este escenario nos conducir a una prdida
de recursos debido a que los resultados no son concluyentes.
En el caso de que la muestra sea grande por dems, tambin perderemos tiempo,
dinero y otros recursos, por sobre utilizacin.

RELACIN CON LA ESTADSTICA INFERENCIAL


En la unidad previa, dijimos que para concluir sobre la poblacin podamos calcular el
intervalo de confianza o hacer un test de hiptesis.
Si miran las formulas siguientes para el clculo del Intervalo de Confianza y del test de
hiptesis para inferir sobre una proporcin, vern que ambas consideran el tamao de la muestra
(n) en su frmula. Esto es porque ambas frmulas consideran el error de muestreo que est muy
relacionado al tamao muestral.

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

a) Frmula del error estndar para una proporcin:

b) Frmula del Intervalo de confianza del 95% para una proporcin:

c) frmula para el test de hiptesis para una proporcin:

Donde P es la proporcin obtenida en la muestra, y Po es la proporcin especificada en la


hiptesis nula y n es el tamao de nuestra muestra.
qu ocurre con el intervalo de confianza cuando el tamao muestral aumenta?
Respuesta 1:___________
Qu pasa con el test estadstico Z cuando el tamao muestral aumenta?
Respuesta 2:___________

Apliquemos los conceptos a un ejemplo


En un estudio se compar una nueva droga contra la malaria con la Cloroquina en su
capacidad de eliminar la parasitemia a las 36 hs.
Los resultados se muestran en la tabla 1
Tabla 1: Respuesta al tratamiento con Droga Nueva y con Cloroquina
Total de personas
tratadas

Nmero de
personas sin
parasitemia a las
36 hs

Tasa de
respuesta

Cloroquina

184

129

70%

Droga Nueva

103

80

78%

Droga

La diferencia en la tasa de respuesta es: 78%-70%= 8%


El intervalo de confianza del 95% para esta diferencia es= -3% a 18%
El test de hiptesis para la no diferencia es p=0.17
Respondan las siguientes preguntas:
1- Cmo interpreta el intervalo de confianza de este ejemplo?
2- Cmo interpreta el p valor de este ejemplo?

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

3- Cul de las siguientes dos conclusiones sobre el efecto de la nueva droga se


desprende de estos resultados?
a) La tasa de respuesta fue similar para ambas drogas?
b) La nueva droga tiene una tasa de respuesta mayor?
Respuestas 3:____________________

LAS CINCO PREGUNTAS CLAVES


1234-

Cul es el principal objetivo del estudio?


Cul es el principal resultado (evento) a medir del estudio?
Qu mtodo estadstico que se requiere usar en el anlisis?
Con que frecuencia aproximada espera que ocurra el evento en el grupo expuesto, y
en el grupo de no expuestos?.

5- Cul es la menor diferencia entre los grupos que se quiere detectar?


Responda las 5 preguntas en relacin al estudio sobre la malaria.
Respuestas 4:____________________
Como bien saben, los resultados de un estudio pueden ser proporciones, promedios,
diferencias de tasas, diferencias de odds, etc y cada uno de esos resultados tendr una frmula
para calcular el nmero necesario de personas que permitan llegar a resultados validos por el
hecho de que controlamos el azar de muestreo.
La frmula para el clculo del tamao muestral ser distinta segn las siguientes
variables:

Tipo de estudio
Una sola muestra
Comparacin de dos o ms muestras
Estudio longitudinal
Outcome primario
Media
Proporcin
Tiempo de sobrevida
Datos ordinales, etc

El nmero de personas ser distinto segn varen las siguientes variables:

el tamao del efecto considerado clnicamente significativo.


El nivel de significancia.
El poder del estudio.

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

Veamos en el siguiente cuadro el tamao muestral requerido segn la magnitud de cada


uno de estos tres factores.
Factor

Magnitud

Tamao de
muestra
requerido

Pequeo

Difcil de obtener
significancia

Grande

Grande

Fcil de obtener
significancia

Pequea

Bajo

Identificacin poco
probable

Pequea

Alto

Identificacin del
impacto ms
probable

Grande

Pequeo

Dificil de detectar

Grande

Grande

Fcil de identificar

pequea

Valor de p

Poder

Efecto

Impacto

Las formulas sern ms o menos complejas pero siempre requeriremos preguntar los
cinco puntos que definimos arriba y siempre podrn calcularse con alguno de los mtodos
que describiremos a continuacin.

LOS DOS MTODOS PARA HACER EL CLCULO DEL


TAMAO MUESTRAL
Todos los clculos muestrales, ya sea para una proporcin, una media, dos proporciones,
etc, se pueden obtener con cualquiera de los dos mtodos siguientes.

1- Clculo muestral basado en la precisin del estudio.


2- Clculo muestral basado en el poder del estudio.
Si quisieran estimar la tasa de mortalidad infantil en una regin, con una precisin del
10%, Qu mtodo usaran?
Si quisieran comparar la tasa de internacin en asmticos tratados con una nueva droga y
en asmticos con tratamiento habitual? Qu mtodo usaran?
En esta unidad veremos los clculos ms usados por el mtodo de precisin y los ms usados por
el mtodo poder.

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

Clculo muestral para obtener una precisin adecuada


En el ejemplo de estimar la tasa de desnutricin infantil en una regin, con una precisin
del 10%, estamos decidiendo de antemano que queremos inferir con nuestra muestra el
verdadero valor en la poblacin con una precisin del 10%.
Supongamos que estamos trabajamos en un hospital regional y nuestra impresin es que
la tasa de desnutricin es mayor que la ultima reportada de 14 por ciento por el organismo oficial.
Queremos calcular una muestra que nos permita inferir el verdadero valor con una precisin del
10%, es decir que el IC 95% de nuestro estimador incluya valores no ms altos ni ms bajos que
el 10% de lo estimado.
Ejemplo: Si estimamos que la tasa en el Hospital Regional es 16%, queremos que el
intervalo vaya de 14.4 a 17.6 por 100. (Es decir sumamos y restamos el 10% de 16= 1.6% a
16%).

El clculo muestral basado en la precisin utiliza entonces la frmula del Intervalo de


Confianza y requiere que de alguna manera definamos de antemano la precisin deseada de
nuestro estimador y el valor puntual que creemos tiene el parmetro en la poblacin
(generalmente obtenido de estudios previos).

Como este es un curso destinado a personas relacionadas con la salud, vamos a aprender
primero qu nos pide el Epi Info para hacer este clculo y luego detallaremos la frmula que hay
por detrs.
Puede ocurrir que no sepamos cul es el tamao del total de la poblacin que queremos
muestrear, pero por suerte, esto no es un gran problema, se dice que la poblacin es infinita (el
Epi Info por default deja 999.999) si por el contrario sabemos cul es nuestro universo a
muestrear entonces la poblacin se considera finita. En el Epi Info debern ingresar el nmero
correspondiente al tamao de esa poblacin.
Las formulas que veremos ms adelante son levemente distintas si la poblaciones es finita
a si no lo es.

Precisin para una proporcin


Obtencin del tamao muestral para una precisin dada de una proporcin
con el epiinfo:
En el ejemplo anterior queremos saber cuntos nios debemos incluir en nuestra muestra
para evaluar si la prevalencia de desnutricin infantil es del 16%, con una precisin del 10%. Esto
significa que queremos que el intervalo vaya de 14.4% a 17.6%.

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

En el men desplegable Utilidades hagan Clik en StatCal

En la siguiente pantalla elijan la opcin Simple size & power apretando la letra S del
teclado o bajando con la flecha abajo del teclado y apretando ENTER.

En la siguiente pantalla seleccionen la opcin Population survery apretando la letra P del


teclado.

Luego en la siguiente pantalla debemos poner en el punto:


1-

n total de la poblacin de la que vamos a seleccionar la muestra. Si no


sabemos el n dejamos el 999.999. Luego presionen ENTER para pasar al
siguiente punto.

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

2-

La frecuencia esperada del factor a medir: En este caso el factor a medir es


la prevalencia de desnutricin infantil de 16%. Presionen ENTER para pasar al
siguiente punto.

3-

Uno de los limites del Intervalo de confianza (el superior o el inferior) que
aceptan en su estudio: en este caso vamos a poner el inferior: 14.4%. Presionen
ENTER para pasar al siguiente punto)

4-

Luego presionamos F4 en el teclado para ver el clculo del tamao de la muestra.

Y obtenemos la pantalla con el clculo del tamao muestral para los distintos intervalos de
confianza.

En la imagen, hemos remarcado el valor que corresponde a un error alfa del 5%= 2013
personas.
Veamos qu pasa si escriben como peor escenario al lmite superior del IC del 95%:
Apretamos F10 para volver a la pantalla anterior y cambiar en el punto 3 al lmite superior
de 17,60.

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

Presionen F4 en el teclado para ver el nuevo clculo del tamao de la muestra.

Como ven con cualquiera de los dos lmites del Intervalo de Confianza que escriban, el
clculo arroja el mismo nmero de personas. Esto es as porque la amplitud del error de una
proporcin es simtrica tanto para arriba como para abajo del estimador.

Precisin para una proporcin con frmula


Veamos qu clculos hacemos para obtener el mismo valor que tan fcilmente obtuvimos
con el Epi Info:

Por favor, no se intimiden con la primera impresin, es fcil!

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

Tamao de la poblacin infinito o desconocido

Tamao de la poblacin finito

Tamao muestral

Tamao de la poblacin.

Valor correspondiente en la distribucin de Gauss a 1,96 para =0,05 y 2,58 para =0,01.

Prevalencia esperada del parmetro a evaluar en proporcin: 0.16

Error de estimacin que se acepta cometer. Por ejemplo, para un precisin absoluta del 10%, que
corresponde a cometer un error del 1.6% en la prevalencia introduciremos en la frmula el valor 0,016.

Despejemos la segunda frmula, que es la que parece ms compleja:

Si queremos hacer el clculo rpidamente, por ejemplo durante la consulta de algn amigo
que sabe que estn avanzados en este curso, utilicen la frmula simplificada (la primera):
n = 3.8416 x0.1344 /0.0162 = 2013
3.8416 es 1.96 al cuadrado, y es un dato que deben recordar,
0.1344 es p x (1-p) y el dato de p deber decirlo su amigo.
El error de estimacin tambin lo deber decir su amigo, luego lo debers llevar a
proporcin y elevar al cuadrado.

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

10

Ejercicio:
El ministro de salud quiere conocer la prevalencia de tuberculosis en una regin.

Cuntos individuos deber incluir la muestra para encontrar una prevalencia


esperada de un 1.5% aceptando que el valor se encuentre entre el 1 y el 2%?
Usted no pregunta con qu nivel de confianza quiere el ministro el dato, porque seguro va
a tener que dar explicaciones que van a enredar la conversacin, as que Usted asume un
nivel alfa del 5%.

Respuesta 5:_____________

Precisin para una media


Tambin es posible calcular la media de una poblacin con una cierta precisin.
Veamos con un ejemplo cundo es til hacer el clculo del tamao muestral con este
mtodo:
En el ministerio de Trabajo estn interesados en conocer el promedio de horas semanales
trabajadas por las mujeres del servicio domstico. La muestra ser extrada de una poblacin de
mujeres que figuran en los registros de la Seguridad Social y de las cuales se conoce a travs de
un estudio piloto que el desvo estndar es 3.106. Trabajando con un nivel de confianza de 0.95 y
estando dispuestos a admitir un error mximo de 0,5 horas, cul debe ser el tamao muestral
que empleemos?.
Buscamos en las tablas de la curva normal el valor de z para alpha 0.05 (que a esta altura
lo dicen solitos1.96) y despejamos la frmula tambin conocida por Uds:
Indica la precisin absoluta (e) que estamos interesados en tener
X + 1.96 x ES
Recuerden que ES= sd/ n

Frmula para el clculo del n conociendo el desvi estndar:

La frmula anterior sale de:


Precisin absoluta deseada (e): 0.5 = 1.96 x ES
e

=1.96 x sd/ n

e x n =1.96 x sd
n

=1.96 x sd /e

=1.962 x sd2 / e2

Respondamos el enunciado con la frmula:


N= 1.962 x 3.1062 / 0.52
N= 148

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

11

Como pueden observar en esta frmula, (y en todas las que encuentren con clculo por
precisin) NO necesitan incluir el tamao del efecto buscado, en el ejemplo descrito, no es
necesario indicar las horas promedio que suponen que trabajan las mujeres de tareas domsticas.
Esto es as por que lo que define el numero necesario que van a necesitar es justamente el ms
menos con el que se pretende tener el dato. Sin embargo, el valor promedio de las horas que
trabajan estas mujeres es necesario conocerlo para decidir la precisin absoluta o relativa.

Ejercicio:
La unidad de nutricin esta interesada en poder determinar con una buena precisin el consumo
calrico promedio de la poblacin mayor de 80 aos. Tienen datos de una muestra de poblacin
general en donde se reporto un consumo promedio de 2300 kcal y un desvio estndar de los
datos de 250 kcal/da. Consideran que la precisin de estimacin de la media debe ser de +- 50
kcal/da.
Calcule el tamao muestral necesario para que el intervalo de confianza del 95% del
estimador muestral tenga una precisin de ms menos 50 kcal/da.
Respuesta 6:_____________

De donde sacar los datos


Usualmente la informaion necesaria para planear algn estudio puede obtenerse de
estudios anteriores de la literatura. El dato mas importante, y generalmente mas difcil de
obtener de los trabajos publicados es el desvio estndar. Aca van algunas formulitas que pueden
ayudarlos en esos casos:
Cuando les dan el error estadard el desvio estandar se calcula simplemente: ES * raiz
cuadrada de n
Cuando les dan los intervalos de confianza se puede utilizar: ES=4 * (limiyr superior
limite inferior).
Si estas trabajando en un area nueva y no hay ninguna informacin puede ser necesario
realizar un estudio piloto!!!.

Precisin para una tasa


Tambin es muy frecuente que estemos interesados en conocer la tasa (densidad de
incidencia) de una enfermedad.
A continuacin les mostramos una tabla muy til porque posee los tamaos necesarios
para cualquier tasa, lo nico que debern decidir ustedes es con qu precisin relativa esperan
encontrar la tasa.

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

12

Precisin absoluta vs relativa:


Veamos un ejemplo usando la tabla para entender la diferencia de estos conceptos:
Para una tasa de 10 x mil persona-aos de ocurrencia de un evento con una precisin
relativa de 0.10, con un nivel de confianza del 95% necesitarn 385 personas.
El mismo numero que se requiere para una tasa de 5 x mil persona-aos con la misma
precisin relativa del 10%.
En el primer caso aceptan que el parmetro se encuentre entre 9 por mil y 11 por mil.
Precisin absoluta de ms menos 1.

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

13

En el segundo caso aceptan que el parmetro se encuentre entre 4.5 por mil a 5.5 por mil.
Precisin absoluta de ms menos 0.5.

Ambas tasas tienen la misma precisin relativa pero distinta absoluta.

La frmula para el clculo del nmero necesario para cualquier tasa, indicando la precisin
relativa es:
N = Z 2 / e2
Para el ejemplo, recuerden que dijimos un error del 5% y una precisin relativa de 0.1
(en proporcin) o 10% (en porcentaje):
N= 1.962 x 0.12
N= 3.8416 x 0.01
N= 384

La utilidad de estas tablas con la precisin relativa es que nos evita de indicar cul es el
desvo estndar esperado. Para la tabla del ejemplo bastante cuesta suponer la tasa
como para que nos pidan el desvo estndar de la tasa!!.

Clculo muestral para obtener un poder adecuado


Para calcular el tamao de un estudio en funcin del poder que queremos que ese estudio
tenga para encontrar una diferencia nos basamos en los conceptos aprendidos para las pruebas
de hiptesis:

1234-

Definir cul es la mnima diferencia que es importante detectar.


El poder que queremos tener. (1-beta)
El nivel de significancia para la diferencia entre los dos grupos. (valor de )
Una idea del valor del resultado a medir.

El principal concepto del clculo muestral por este mtodo es que se pretende tener alta chance
de detectar, como estadsticamente significativa, un efecto clnicamente significativo cuando ste
realmente exista, y a la vez se pretende concluir con una alta certeza que este efecto no existe si
no lo encontramos con el tamao muestral calculado.

Puesto en trminos conocidos:

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

14

El principal concepto del clculo muestral por este mtodo es que se pretende tener poder de
detectar, como estadsticamente significativa a un nivel de significancia predeterminado (error
alpha), una mnima diferencia cuando sta realmente exista (hiptesis alternativa
verdadera), y a la vez se pretende un bajo error beta de que esta diferencia no existe si no la
encontramos con el tamao muestral calculado.
El clculo muestral basado en el poder de un estudio utiliza entonces la frmula del test de
hiptesis y a diferencia del mtodo anterior que peda la precisin deseada, en este mtodo se
requiere definir de antemano el error beta.
A mayor poder del estudio, ms seguros estaremos pero requeriremos mayor nmero de
personas, como veremos ms adelante. Para poder hacer concordar la significancia clnica con la
estadstica necesitaremos un poder por encima del 80%.

Poder para dos proporciones


Clculo del tamao muestral para alcanzar un poder dado de un estudio con
2 proporciones
Trabajaremos
proporciones.

estos

conceptos

utilizando

como

ejemplo

la

comparacin

de

dos

Este seria el caso de querer estudiar una droga que previene la tuberculosis en paciente
con HIV. En el estudio lo que se pretende comprar es el porcentaje de pacientes que desarrollaron
la tuberculosis comparando pacientes tratados vs. Placebo.
Primero que nada debern poder definir cul es la menor diferencia que consideran
clnicamente importante entre ambos tratamientos. Esto es a veces muy difcil de definir en la
prctica. Los expertos en el tema debern decir de alguna manera cuando el beneficio otorgado
por una nueva droga justifique su uso frente a la vieja. Supongamos que para el ejemplo anterior
la proporcin de pacientes con TBC en el grupo placebo esta estimada en 0.15 y en el grupo
tratado en 0.05. Calcularemos el tamao necesario para tener un poder del 90% de detectar un
efecto que sea significativo aceptando un 5% de error.
En los clculos del tamao muestral basados en el poder, necesitamos incluir los valores de
z1 y z2 que corresponden al nivel de significancia de alpha y de 1-poder (beta) requeridos.
Utilizamos la siguiente frmula:
N = 2 x(Z1+Z2)2 x P x (1-P)
(p1-p2)2
Siendo:
Z1: valor de z que corresponde al nivel de significancia alpha
Z2: valor de z que corresponde a beta
P: el promedio de ambas proporciones
P1: el valor de la proporcin de uno de los grupos.
P2: el valor de la proporcin del otro grupo.

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

15

La siguiente tabla muestra los valores ya calculados para (z1+ z2)2 que se usan en los
clculos basados en el poder. Durantes los ejercicios esta tabla les ser de utilidad.
Tabla de valores de la distribucin normal para (z1+ z2)2 para uso en las formulas de
clculo muestral basadas en el poder. En el interior de la tabla esta el valor de: (z1+ z2)2
para los valores de z1 y de z2 indicados en la fila y columna respectivamente
Beta

0.05

0.1

0.2

0.5

(z2)

(1.96)

(1.64)

(0.84)

(0.00)

0.1
(1.64)

10.75

8.53

6.15

2.69

0.05
(1.96)

12.96

10.50

7.84

3.84

0.02
(2.33)

15.76

13.03

10.04

5.43

0.01
(2.58)

17.81

14.90

11.70

6.66

Alfa (z1)

Despejemos la frmula con nuestro ejemplo:


P = (0.15+0.05) / 2= 0.10
N = 2 x 10.5 x 0.1 x(1-0.1) =189
(0.15-0.05)2
Quiere decir que se necesitan seguir 189 personas por rama del estudio. Total 378
Pueden intentar hacer el clculo con el Epi Info, seleccionando en lugar de population
survey cohort or cross-sectional. Es posible que el valor que obtengan con el Epi Info
sea similar aunque no exacto al calculado con esta frmula.

Ejercicio:
Tabla 1

Total de personas
tratadas

Nmero de personas
sin parasitemia a las
36 hs

Tasa de respuesta

Cloroquina

184

129

70%

Droga Nueva

103

80

78%

Droga

Los investigadores del estudio de la Tabla 1, donde se compar una nueva droga contra la malaria
con la Cloroquina, luego de ver que la diferencia encontrada les resulta clnicamente significativa
pero no alcanzaron significancia estadstica, pretenden continuar el estudio. Le preguntan a Ud:

cul sera el tamao muestral necesario para encontrar que esa diferencia es
estadsticamente significativa con un poder de 0.8 y un nivel del significancia del
5%?

Respuesta 7:_____________

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

16

Poder para dos medias


Obtencin del clculo para dos medias con frmula
Para calcular el tamao muestral requerido para alcanzar un poder especfico en la
comparacin de dos medias necesitamos saber:

La media de cada grupo.


El desvo estndar de cada grupo. (se asume que el desvi estndar es el mismo para
ambos grupos).
Por supuesto el poder y el error alpha. Pueden usar la Tabla de valores de la
distribucin normal para (z1+ z2)2.

Trabajemos con el siguiente ejemplo: En el grupo tratado con la droga A se espera que la
presin final promedio del grupo sea de 135 mm Hg mientras que la tratada con la droga B se
espera que sea 140 mm Hg. El desvo estndar es de 10 mm Hg. Pretendemos que nuestro
estudio tenga un poder del 80% y un nivel de confianza del 95%.
Despejemos la siguiente frmula:
N = (Z1+Z2)2 x (sd2+sd2)
(X1 X2)2
N = 7.84 x (102 +102) = 63
(140-135)2
Se necesitarn 63 pacientes por grupo.

NOMOGRAMA
El nomograma es una forma grfica y simple de obtener tanto el nmero muestral
necesario como el poder que alcanz un estudio con un determinado nmero de personas. Es
muy simple de usar, todos los clculos estn basados en la diferencia estandarizada.

La diferencia estandarizada se calcula en forma distinta dependiendo si la variable


dependiente es continua o categrica.
En el nomograma que les presentamos es el eje de y de la izquierda.

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

17

Uso del nomograma para la comparacin de dos medias


Planeamos un estudio de alimentacin con leche en chicos de 5 aos para ver si con este
suplemento diario crecen ms que los controles en un ao.
Media de crecimiento: 6 cm DS: 2 cm.
Efecto clnicamente significativo: 0,5 cm
Poder: 90 % (0,9)
Alfa: 0,05

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

18

Diferencia estandarizada para medias = Diferencia clnicamente significativa


Desvo estandard
Diferencia estandarizada: 0,5/ 2 = 0,25

La lnea roja cruza la diagonal por el valor de 700 personas, esto es el total requerido, es
decir 350 nios en cada rama debern seguirse un ao.

Uso del nomograma para la comparacin de dos proporciones


Comparamos dos mtodos para dejar de fumar: Administrar medicacin (chicle) vs consejo
mdico para dejar de fumar.
Literatura: 15% fumadores dejarn de fumar a 6 meses. Nos interesa llegar al 30 % con el
grupo que recibe medicacin (chicle). Poder del 85 % y una significancia del 5 %

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

19

Diferencia estandarizada (proporciones) = p1 p2


P x (1 P)
Donde P = (p1 + p2)/2

En el ejemplo:
p1= 0,30; p2=0,15; P = (0,30 + 0,15)/2 = 0,225
diferencia estandarizada=

0,30 0,15

=0.36

0,225 (1- 0,225)

Se necesitarn 280 personas es decir 140 en cada grupo.

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

20

CONSEJOS PRCTICOS
En esta unidad describimos una introduccin a cmo calcular el tamao de los estudios que
requieran conocer una determinada proporcin o media, y de los que requieran comparar dos
proporciones o dos medias.
Aplica para cualquier tipo de clculo que los mismos deban realizarse varias veces,
variando a distintos escenarios, esto es cambiando el poder, el nivel de confianza o la estimacin
del resultado, para poder decidir finalmente la factibilidad del estudio en funcin de los recursos.
Adems deben considerar qu otros factores pueden influenciar y para controlarlos es
necesario mayor nmero a muestrear por ejemplo:

la tasa de respuesta esperada


la tasa de perdida en el seguimiento esperada

Estos dos aspectos podrn considerarse a la hora del diseo y sobremuestrar por ejemplo
un 10% si es lo que esperamos que ser nuestra tasa de no respuesta, PERO hacer esto SI nos
garantizar que nuestro resultado tendr el poder que deseamos y NO garantizar el control de
los sesgos de seleccin que podamos introducir.

mltiples resultados
confundidores e interacciones que debamos medir.
diseo de clusters
diseos macheados.

Estos son otros ejemplos en donde el tamao muestral ser mayor, y est fuera del
alcance de esta unidad conocer las frmulas correspondientes de ajuste.

MUESTREO PROBABILSTICO
Daremos una breve introduccin a los tipos de muestreo probabilsticos, sin entrar en
las distintas tcnicas de muestreo.
Un mtodo de seleccin es considerado probabilstico cuando otorga una probabilidad
conocida de integrar la muestra a cada elemento de la poblacin, y dicha probabilidad no es nula
para ningn elemento.
Los mtodos de muestreo no probabilsticos no garantizan la representatividad de la
muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la poblacin.
Entre los mtodos de muestreo probabilsticos ms utilizados en investigacin
encontramos:

Muestreo aleatorio simple


Muestreo estratificado
Muestreo sistemtico
Muestreo polietpico o por conglomerados

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

21

Veremos una taba con las caractersticas, sus ventajas e inconvenientes de los
distintos tipos de muestreo probabilstico

CARACTERISTICAS

VENTAJAS

o
Sencillo y de fcil
comprensin.
Clculo rpido de medias
o
y varianzas.
Se basa en la teora
estadstica, y por tanto
existen paquetes
informticos para analizar
los datos

Requiere que se
posea de antemano un
listado completo de
toda la poblacin.
Cuando se trabaja con
muestras pequeas es
posible que no
represente a la
poblacin
adecuadamente.

o
Conseguir un listado de los N
o
elementos de la poblacin
Determinar tamao muestral n.
Definir un intervalo k=N/n.
o
Elegir un nmero aleatorio, r,
entre 1 y k (r=arranque
aleatorio).
Seleccionar los elementos de la
lista.

o
Fcil de aplicar.
No siempre es necesario
tener un listado de toda
la poblacin.
Cuando la poblacin est
ordenada siguiendo una
tendencia conocida,
asegura una cobertura de
unidades de todos los
tipos.

Si la constante de
muestreo est
asociada con el
fenmeno de inters,
las estimaciones
obtenidas a partir de
la muestra pueden
contener sesgo de
seleccin

o
En ciertas ocasiones resultar
conveniente estratificar la muestra
segn ciertas variables de inters.
Para ello debemos conocer la
composicin estratificada de la
poblacin objetivo a muestrear.
o
Una vez calculado el tamao
muestral apropiado, este se
o
reparte de manera proporcional
entre los distintos estratos
definidos en la poblacin usando
una simple regla de tres.

Tiende a asegurar que la


muestra represente
adecuadamente a la
poblacin en funcin de
o
unas variables
seleccionadas.
Se obtienen estimaciones
ms precisa
Su objetivo es conseguir o
una muestra lo ms
semejante posible a la
poblacin en lo que a la o
las variables
estratificadoras se refiere.

Aleatorio simple

Se selecciona una muestra de o


tamao n de una poblacin de N
unidades, cada elemento tiene una o
probabilidad de inclusin igual y
conocida de n/N.

Sistemtico

o
o
o

Estratificado

Conglomerados

INCONVENIENTES

Se realizan varias fases de


o
muestreo sucesivas
(polietpico)
La necesidad de listados de las o
unidades de una etapa se limita
a aquellas unidades de
muestreo seleccionadas en la
etapa anterior.

MDULO: ESTADSTICA INFERENCIAL

Es muy eficiente cuando


la poblacin es muy
grande y dispersa.
No es preciso tener un
listado de toda la
poblacin, slo de las
unidades primarias de
muestreo.

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

Se ha de conocer la
distribucin en la
poblacin de las
variables utilizadas
para la estratificacin.

El error estndar es
mayor que en el
muestreo aleatorio
simple o estratificado.
El clculo del error
estndar es complejo.

22

RESUMIENDO:
Hay muchas formas de calcular el tamao de una muestra, como hemos visto a lo largo de
esta clases. Pueden utilizar:

Tablas hechas (ready made tables).


Nomogramas.
Software de computadoras.
Formulas.

Lo ms habitual es que utilicen los software de computadoras. Sin embargo siempre


tendrn que tener en cuenta los mismos datos para obtener un valor que les sea de utilidad.
Hemos intentado en esta clase que comprendan cules son esos datos y por qu es importante
que piensen en ellos. Estos datos, como hemos visto, tienen ligeras variaciones segn el mtodo
elegido (preescisin o test de hiptesis): sin embargo: conceptualmente son los mismos.
Estos son:

La frecuencia esperada o valor esperado de la variable a medir.


Frecuencia conocida o esperada del parmetro o del grupo de comparacin.
Diferencia que Uds. Consideran clnicamente importante.
Valor elegido de alpha.
Poder que pretenden tenga el estudio.

Segn el tipo de estudio y objetivo del mismo utilizaran todos o algunas de estos datos.
Comprendiendo esto podrn calcular los tamaos de las muestras necesarias para la gran mayora
de los estudios que Uds. Planeen; o cuando se trate de diseos muy complicados sabrn que
datos darle al Sper experto en estadstica para que el lo calcule!!!

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

23

RESPUESTAS DE LOS EJERCICIOS


Respuesta 1:
El ancho del Intervalo de Confianza disminuye a medida que aumenta el tamao muestral.

Respuesta 2:
El test estadstico aumenta a medida que el tamao muestral aumenta, correspondiendo
entonces a un nivel de significancia ms alto. (es ms significante y su correspondiente p-valor es
ms bajo).

Respuestas 3:
1- 1 El IC del 95% va entre -3% y 18% y puede ser interpretado como que la tasa de

respuesta con la nueva droga puede ser 3% ms baja que la de la cloroquina o un 18%
mayor. El cero puede ser un valor probable, lo que sugiere que ambas tasas de
respuesta pueden ser iguales, no existiendo diferencia de efecto en la poblacin.

2- 2 El p valor muestra que no hay diferencia en el porcentaje de respuesta entre las dos

drogas a un nivel de significancia del 5%. La diferencia observada del 8% pudo ser
obtenida por azar de muestreo.

3- 3 Las conclusiones acerca de la nueva droga son:


a) En base a este estudio, la conclusin es que las dos drogas tienen similar tasa de
respuesta. La diferencia observada del 8% es una diferencia pequea. Si la magnitud de esa
diferencia es importante desde un punto de vista clnico, este estudio no puede detectarlo y se
requiere uno de mayor tamao.
b) El estudio provee evidencia insuficiente para contestar que la nueva droga tiene
mayor tasa de respuesta. Sin embargo, el tamao de este estudio es chico para detectar si una
diferencia observada de 8% es estadsticamente significativa. Nuevamente se requiere de un
estudio ms grande para demostrar que la diferencia encontrada es estadsticamente significativa.
Con este tamao no podemos descartar que la diferencia sea debida al azar de muestreo.

Respuestas 4:
1- El principal objetivo es determinar si la nueva droga es mejor que la cloroquina.
2- El principal resultado a medir es la eliminacin de la parasitemia a las 36 hs.
3- El mtodo estadstico es la comparacin de dos proporciones.
4- Una estimacin aproximada de los resultados es que un 70% de los pacientes en el
grupo cloroquina eliminarn la parasitemia a las 36 hs.

5- El menor efecto que se pretende detectar es una diferencia entre las drogas del 5%,
porque se asume que una diferencia de esa magnitud es clnicamente importante.

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

24

Respuesta 5:
Ejercicio:
El ministro de salud quiere conocer la prevalencia de tuberculosis en una regin.

Cuntos individuos deber incluir la muestra para encontrar una prevalencia


esperada de un 1.5% aceptando que el valor se encuentre entre el 1 y el 2%?
Usted no pregunta con qu nivel de confianza quiere el ministro el dato, porque seguro va
a tener que dar explicaciones que van a enredar la conversacin, as que Usted asume un
nivel alfa del 5%.

Respuesta: 1.962 x 0,015 x 0,985/0,0052=0,05675964/0,000025= 2270

Respuesta 6:
Ejercicio:
La unidad de nutricin esta interesada en poder determinar con una buena precisin el consumo
calrico promedio de la poblacin mayor de 80 aos. Tienen datos de una muestra de poblacin
general en donde se reporto un consumo promedio de 2300 kcal y un desvo estndar de los
datos de 250 kcal/da. Consideran que la precisin de estimacin de la media debe ser de +- 50
kcal/da.
Calcule el tamao muestral necesario para que el intervalo de confianza del 95%
del estimador muestral tenga una precisin de ms menos 50 kcal/da.
Respuesta: 1.962 x 2502 / 502 = 96

Respuesta 7:
Ejercicio:
Tabla 1

Total de personas
tratadas

Nmero de personas sin


parasitemia a las 36 hs

Tasa de respuesta

Cloroquina

184

129

70%

Droga Nueva

103

80

78%

Droga

Los investigadores del estudio de la Tabla 1, donde se compar una nueva droga contra la malaria
con la Cloroquina, luego de ver que la diferencia encontrada les resulta clnicamente significativa
pero no alcanzaron significancia estadstica, pretenden continuar el estudio. Le preguntan a Ud:

cul sera el tamao muestral necesario para encontrar que esa diferencia es
estadsticamente significativa con un poder de 0.8 y un nivel del significancia del
5%?

Respuesta :
Utilizamos la siguiente formula:
N = 2 x(Z1+Z2)2 x P x (1-P)
(p1-p2)2
P= (0.70+0.78)/2 = 0.74
N= 2 x 7.84 x 0.74 x 0.26 = 471 por rama
0.0064

MDULO: ESTADSTICA INFERENCIAL

UNIDAD TEMTICA: CLCULO DEL TAMAO MUESTRAL

25