Está en la página 1de 15

Departamento de Estadstica

Universidad Carlos III de Madrid


BIOESTADISTICA (55 - 10536)

Estudios de prevalencia (transversales)


CONCEPTOS CLAVE
1)

Caractersticas del diseo en un estudio de prevalencia, o transversal.

2)

Importancia del mecanismo de muestro y seleccin del tamao muestral.

3)

Tipos y caractersticas de las medidas de prevalencia.

4)

Estrategias para el anlisis de estudios transversales: Estimacin vs.


Comparacin de prevalencias.

1. INTRODUCCION
Un Estudio de Prevalencia es aquel en el que se examinan las relaciones entre las enfermedades o entre
las caractersticas relacionadas con la salud y otras variables de inters, del modo en que existen en una
poblacin y momento determinados. La presencia o ausencia de la enfermedad y de las otras variables
(o, si son de tipo cuantitativo, su nivel) se determinan en cada miembro de la poblacin estudiada o en
una muestra representativa en un momento dado.
La relacin entre una variable y la enfermedad puede examinarse:
1) En trminos de la prevalencia de la enfermedad en diferentes subgrupos de poblacin, definidos
de acuerdo con la presencia o ausencia (o nivel) de las variables.
2) En trminos de la presencia o ausencia (o nivel) de las variables en los individuos enfermos, en
comparacin con los sanos.
En la figura siguiente se muestra una representacin grfica de un estudio transversal.

Obsrvese que, en un estudio de prevalencia (o estudio transversal), lo que queda registrado formalmente
no es la incidencia de una enfermedad, sino su prevalencia. La secuencia temporal de causa a efecto no
queda necesariamente determinada en un estudio de este tipo.
Despus del proceso se seleccin, todos los sujetos participantes son examinados, observados, y/o
encuestados acerca de la enfermedad, su nivel actual o pasado del factor en estudio y otras variables de
inters. En ocasiones los estudios transversales no utilizan muestreo probabilstico, en esos casos su
valor es limitado para describir la frecuencia de la enfermedad y de otras caractersticas en la poblacin
objeto.

2. MEDIDAS DE PREVALENCIA
Hemos revizado las medidas fundamentales para cuantificar la prevalencia: prevalencia puntual y
prevalencia lpsica.
1) La ms utilizada de estas medidas es la Prevalencia Puntual (P), que no es ms que la
probabilidad de que un individuo en una poblacin presente una determinada caracterstica (por
ejemplo, enfermedad) en el tiempo t. As, se estima por: P t =

C t , donde C es el nmero de
t
Nt

casos prevalentes y Nt es la poblacin encuestada.


2) La Prevalencia Lpsica (PL) no es ms que la probabilidad de que un individuo de una
poblacin sea un caso en cualquier momento del perodo (t0, t). Se estima por:

P P( t0 ,t) =

C ( t0 ,t) C 0 + I ( t0 ,t)
=
. Donde C(to,t) incluye los casos prevalentes C0 y los casos
N
N

incidentes I(to,t).
Raras veces la prevalencia tiene inters directo en aplicaciones etiolgicas de la investigacin
epidemiolgica. Puesto que la probabilidad de sobrevivir (o de curacin) afecta a la prevalencia, los
estudios transversales o estudios basados en casos prevalentes obtienen asociaciones que reflejan los
determinantes de la supervivencia (la cura) una vez que se padece la enfermedad, as como las causas de
tal enfermedad. Una supervivencia mejor, y por tanto, una prevalencia ms alta, podran estar realmente
relacionadas con la accin de factores preventivos que mitigasen de alguna manera la enfermedad, una
vez que se produjese.

2.1. Relacin entre Incidencia y Prevalencia


Aunque es evidente la prevalencia depende en parte de la incidencia, la relacin funcional que se
establece entre ellas es bastante compleja. Sin embargo, si asumimos que la poblacin est en posicin
de equilibrio, o sea, es estable y las tasas de prevalencia e incidencia permanecen constantes, puede
obtenerse una relacin bastante sencilla.
Bajo las condiciones de equilibrio la cantidad de casos incidentes I en un perodo (t0,t) de duracin 2t es
igual a los casos salientes TC (casos que mueren por la enfermedad, o por otra causa, y casos que curan)
durante el mismo perodo, o sea, I = TC.
Tenemos que I = DI(N-C)2t, donde N es la cantidad de individuos de la poblacin, y TC = TDC2t,
donde TD es la tasa o densidad de salida y C los casos prevalentes, de donde obtenemos:

C
DI
.
=
N - C TD

Si representamos las salidas de la enfermedad por un proceso Poisson, tenemos que TD es igual al inverso
de la duracin de la enfermedad D . Dividiendo por N y sustituyendo TC, obtenemos:

P=

DI D
DI D + 1

Si la prevalencia es pequea (P < 0.1) se tiene una frmula simplificada: P = DI D .

3. DISEO DE UN ESTUDIO DE PREVALENCIA


Los principales puntos metodolgicos a considerar en el diseo de un estudio de prevalencia son:
a) Definir la poblacin de referencia.
b) Determinar si el estudio se realizar sobre el total de la poblacin o en una muestra.
c) Determinar el tamao de la muestra poblacional y las formas de seleccin de la misma.
d) Elaborar y validar los instrumentos y tcnicas mediante los cuales se determinar la presencia o
ausencia de las caractersticas de inters.
e) Asegurar la comparabilidad de la informacin obtenida en los diferentes grupos.
f) Determinar el tipo de anlisis epidemiolgico y estadstico de los datos.
g) Determinar la conducta a seguir con los datos detectados.
Nos centraremos en los puntos c) y f)
Veamos a continuacin como se calculan los tamaos de muestra en los estudios de prevalencia para
distintas situaciones:
1) Si el objetivo es estimar una proporcin (P) en una poblacin con una precisin absoluta
especificada se deber "conocer":
a) Proporcin esperada en la poblacin P
b) Nivel de confianza 100(1- )%
c) Precisin absoluta requerida d
2

Se utiliza en este caso la siguiente frmula: n =

z 1-

/2

P(1 - P)
d

La mayora de software estadstico, entre ellos el programa EpiDat utilizan adems la siguiente
correccin: n =

n0
, donde n0 se obtiene por la frmula anterior y N es el tamao de la poblacin.
1 + n0
N

Ejemplo 1. Clculo tamao muestral con EpiDat, para estimar una prevalencia del 50% (P=0.5) con una
precisin del 5% (d = 0.05) en una poblacin con 10,000 habitantes (N=10000).

2) Si el objetivo es probar que la proporcin poblacional difiere de un valor dado P0 se


deber "conocer":
a) Valor de la proporcin bajo la hiptesis nula, P0
b) Valor anticipado de la proporcin Pa
c) Nivel de significacin 100 %
d) Potencia del test 100(1-)%
e) Hiptesis alternativas: Pa > P0, Pa <P0 Pa P0Se utilizan en este caso las siguientes frmulas:
Para pruebas de una sola cola: n =
dos colas: n =

[ z 1-

/2

[ z 1-

2
P 0 (1 - P 0 ) + z 1- P a (1 - P a ) ]
, y para pruebas de
( P 0 - P a )2

2
P 0 (1 - P 0 ) + z 1- P a (1 - P a ) ]
.
( P 0 - P a)2

Ejemplo 2: La proporcin de pacientes curados de cncer despus de 5 aos de tratamiento se reporta en


la literatura como del 50%. Un investigador desea probar que esta tasa de cura es vlida en su distrito
sanitario. Qu tamao de muestra necesita si est interesado en rechazar la hiptesis si la tasa verdadera
es menor que 50% y desea con un 90% de seguridad detectar una tasa verdadera del 40% a un nivel de
confianza del 95%?
En este caso P0 = 0.5, Pa = 0.4, = 0.05, = 0.1 y Ha: Pa < P0, sustituyendo obtenemos que n=211.
3) Si el objetivo es estimar la diferencia entre dos proporciones poblacionales con una
precisin absoluta especificada, se deber "conocer":
a) Proporciones esperadas de las poblaciones P1 y P2
b) Nivel de confianza 100(1- )%
c) Precisin absoluta requerida d
Se utiliza en este caso la siguiente frmula:

n=

2
z 1- /2[ P 1(1 - P 1) + P 2 (1 - P 2)]
2
d

Ejemplo 3: Qu tamao de muestra es necesario seleccionar de dos poblaciones para estimar una
diferencia de riesgo con un nivel de confianza del 95% y una precisin de 0.05, cuando no se conocen
estimaciones de P1 y P2?
En este caso la seleccin ms aconsejable es P1 = P2 = 0.5, pues el valor V = P1(1-P1) + P2(1-P2) es
mximo para esos valores. Tenemos adems = 0.05 y d = 0.05, de donde utilizando la frmula anterior
obtenemos, n = 769 para cada una de las poblaciones.

4) Si el objetivo es probar que dos proporciones poblacionales son diferentes se deber


"conocer":
a) Hiptesis nula: P1-P2 = 0.
b) Proporciones esperadas de las poblaciones P1 y P2
c) Nivel de confianza 100(1- )%
d) Potencia del test 100(1-)%
e) Hiptesis alternativas: P1-P2 > 0, P1-P2 < 0 P1-P2 0
Se utilizan en este caso las siguientes frmulas:

Para pruebas de una sola cola: n =

z 1-

2 P m(1 P m ) + z 1( P 1 - P 2)2

V=P1(1-P1) + P2(1-P2). Para pruebas de dos colas: n =

z 1-

/2

, donde Pm =(P1+P2)/2 y

2 P m(1 - P m) + z 1( P 1 - P 2)2

De nuevo en la mayora de software estadstico, como el programa EpiDat, permite el clculo para una
2

n
4
.
1+ 1+
prueba de dos colas utilizando la correccin de Yates: n =
4
n | P1 - P 2 |
Ejemplo 4: Volvamos al ejemplo anterior, y supongamos ahora que P1 = 0.6, P2 = 0.5, L=0.05, y =0.1,
se podra calcular el tamao muestral utilizando EpiDat

4. ANLISIS DE ESTUDIOS TRANSVERSALES


La disposicin de los resultados de un estudio de prevalencia se presenta en la siguiente tabla:

Variable Dependiente
Variable Independiente Presente Ausente Total

Tasa

Presente

m1

a/m1

Ausente

m2

c/m2

Total

n1

n2

n1/n

En los estudios transversales puede calcularse la Razn de Prevalencias por RR =

a / m1
.
c/m2

Cuando se tiene una poblacin en estado de equilibrio se puede estimar la razn de densidad
/ (1 - P 1)
de incidencia RDI, utilizando la relacin entre DI y P: RDI = ID 1 = T 2 P 1
, o
ID 2 T 1 P 2 / (1 - P 2)
ad
.
equivalentemente: ORP = RDI T 1 que puede estimarse por
bc
T2
4.1. Plan de anlisis estadstico para estudios de proporciones
Un posible esquema del plan de anlisis estadstico para estudios de proporciones.

Mtodo 1: Estimacin de una proporcin (Modelo binomial)


Supongamos que una experiencia se repite n veces, y cada vez la probabilidad p de ocurrencia de un
suceso dado (por ejemplo, enfermedad, exposicin) sea siempre la misma. Si las experiencias sucesivas
son independientes, podemos asumir un modelo binomial.
Si en n repeticiones independientes se observa X veces el suceso de inters, se tienen los siguientes
resultados:

X
es un estimador sin sesgo de p.
n
p(1 - p)
p (1 - p )
y se estima por
.
Su varianza es igual a
n
n
p =

El intervalo exacto de para p es de difcil clculo y por tanto se utiliza un intervalo de


confianza aproximado definido por ( p, p ) :

p=

n
z2
p (1 - p ) z 2

p
+
z
+ 2
n + z2
n
2n
4n

Si n

p = p + z

y p=

n
z2
p (1 - p ) z 2

p
+
+
z
+ 2
n + z2
n
2n
4n

30 el intervalo aproximado para p ser

con:

p = p - z

p (1 - p )
n

p (1 - p )
, donde z = z1- /2.
n

Tambin podemos encontrar este mtodo en forma de test estadstico de p respecto a una

1
2n .
P(1 P)
n

| p - P|proporcin P dada: z =

Ejemplo 5: Supongamos que el tamao de la muestra es n = 257 y se observan 23 casos, entonces con
EpiDat se obtiene:

10

Ejemplo 6: Siguiendo con el ejemplo anterior tambin podramos contrastar si H0: P=0.10, entonces con
EpiDat se obtiene:

Lo cual nos lleva a concluir que hay evidencias suficientes (p=0.6474) para aceptar H0.

11

Mtodo 2: Estimacin de una proporcin (Modelo hipergeomtrico)


El modelo hipergeomtrico parte de suponer que en una poblacin de tamao N, hay N1 enfermos y N-N1
individuos sanos. Se toma una muestra de n personas que contiene n1 enfermos y n-n1 sanos. Se desea
estimar la proporcin N1/N, o sea, la tasa de prevalencia de cierta poblacin. Bajo el modelo
hipergeomtrico se tienen los siguientes resultados:
n1/n es un estimador sin sesgo de N1/N.
La varianza de n1/n se estima por:
se aproxima por:

N - n n1
n 1
, y si n/N 0.10 entonces la varianza
1 1
N -1 n
n n

n1
n 1
.
1 1
n
n n

El intervalo exacto para p es de difcil clculo y por tanto utilizaremos un intervalo de


confianza aproximado definido por ( p, p ) :

p=

N - n n1
N - n n1
n
n 1
n1
n 1
1- 1
, y p= 1 + z
1- 1
.
-z
n
N -1 n
n n
n
N -1 n
n n

Mtodo 3: Modelos discretos (Dos-binomial e hipergeomtrico)


a) Modelo Dos-binomial: Consideremos un estudio transversal en el que de los n1 sujetos expuestos a
un factor estn enfermos a individuos, y de los n2 no expuestos b son enfermos, entonces de acuerdo al
modelo binomial la probabilidad de tener a casos expuestos y b casos no expuestos es igual a:

n1 a
n2 b
p 1 (1 p 1)c
p (1 p 2 ) d , que es el producto de las probabilidades binomiales para cada uno
a
b 2
de los grupos expuestos y no expuestos. El clculo de probabilidades para la comprobacin de hiptesis es
difcil y ambiguo, lo cual exige uso de paquetes estadsticos.
b) Modelo Hipergeomtrico: Si consideramos que los marginales de la Tabla 22 son fijos podemos
utilizar el modelo hipergeomtrico, entonces la probabilidad de obtener a o ms casos en los expuestos
esta dada por:

Pr( K

a) =

min ( m 1 ,n 1 )
k=a

n1
k

n2
m1 - k
n
m1

La regla de decisin es rechazar que existe asociacin entre el factor y la enfermedad H0 si la


probabilidad Pr(K a)
.

12

Mtodo 4: Aproximaciones a los modelos discretos.


Debido al nmero de clculos que requieren los modelos del Mtodo 3, se utilizan aproximaciones
(prueba estadstica asinttica) para calcular el valor de P:
a) Modelo Hipergeomtrico: Bajo H0, la variable aleatoria a (nmero de casos expuestos) tiene
media =

m1 n1
y
n

= m1 2m 2 n 1 n 2 , y el test estadstico que se utiliza es: z =


n (n - 1)

a-

y como regla de

decisin z z1-L.
b) Modelo Dos-binomial: El test estadstico que se obtiene es similar al anterior con la nica diferencia
que

m1 m 2 n1 n 2
.
n3

Ejemplo 6: En la siguiente tabla se muestran los resultados de un estudio sobre consumo de


clorodiazepxido en la fase inicial de la gestacin, en madres con nios nacidos con defecto cardacos
congnitos y madres con nios normales.

Uso de clorodiazepxido
Si

No

Total

Madre caso

386

390

Madre no caso

1250

1254

Total

1636

1644

Obtenemos = 3908/1644 1.898, S2 = 816363901254/(164421645)


z = (4-1.898)/1.2 1.75, que para una prueba de una cola p = 0.04.

1.44 y S = 1.2, tenemos

Mtodo 5: Test 42 (Ji-cuadrado)


Para los datos de la Tabla 22, se utiliza el test estadstico:

(| ad - bc | - 1/ 2n) 2 n
n 1 n 2 m1 m 2

, que permite

calcular los intervalos de confianza para el cociente de prevalencias mediante la expresin: RR 1 z / ,


donde z = z1-L/2.
Ejemplo 7: Analizando la Tabla 22 del ejemplo anterior con EpiDat, obtenemos:

13

Tablas de contingencia : Tablas 2x2 simples


Tipo de estudio
: Transversal
Nivel de confianza: 95,0%
Tabla
-----------Expuestos
No expuestos
-----------Total

Enfermos
-------4
386
-------390

Sanos
-------4
1250
-------1254

Total
-------8
1636
-------1644

Prevalencia de la enfermedad
Estimacin
---------------------------------------- ---------En expuestos
0,500000
En no expuestos
0,235941
Razn de prevalencias
2,119171
---------------------------------------- ----------

IC(95,0%)
----------------1,054016
4,260736
-----------------

Prevalencia de exposicin
Estimacin
---------------------------------------- ---------En enfermos
0,010256
En no enfermos
0,003190
Razn de prevalencias
3,215385
---------------------------------------- ----------

IC(95,0%)
----------------0,807922
12,796660
-----------------

14

OR
--------3,238342

IC(95,0%)
----------------0,806111
13,009196
0,883539
11,869266

(Woolf)
(Cornfield)

Prueba Ji-cuadrado de asociacin


Estadstico
Valor p
---------------------------------------- ----------------Sin correccin
3,0677
0,0799
Correccin de Yates
1,7820
0,1819

15

También podría gustarte