Está en la página 1de 5

CONCEPTOS EN EPlDEMlOLOGlA

El significado de la significancia
Favio Rivas

Se puede afirmar que las pruebas de signifi- cópicos causantes de enfermedad. El


cancia estadística son métodos indirectos para epidemiólogo necesita, sin lugar a dudas,
evaluar los resultados de un estudio que no se valerse de esta herramienta para darle base
puede hacer en toda la población-sujeto sino en firme a sus estudios, pero, requiere además del
una muestra de ella y que, fundamentalmente, análisis juicioso de los hallazgos para darle
buscan responder a la siguiente pregunta: ¿se sentido a sus conclusiones y razón a sus
hubiera encontrado lo mismo si en mi estudio acciones en salud pública.
estuviera toda la población? Mediante las pruebas de significancia
Sin embargo, a las pruebas de significancia estadística, se pretende -en últimas- establecer
estadística se les ha atribuido más de lo que asociaciones, las cuales se fundamentan en la
pueden dar. El problema hoy es mayor puesto detección de diferencias. Por ejemplo, un
que en la información científico-médica estudio cualquiera encontró diferencia en la
suministrada en la literatura o en los congresos ocurrencia de determinado proceso patológico
y simposios -que por tanta es casi imposible de entre una población expuesta a un factor de
analizar a fondo- se termina dándole a p (p riesgo y ello permite pensar que la exposición
value) un alcance que no tiene y descartando está asociada con la ocurrencia de la
información que puede ser muy valiosa desde el enfermedad. Pero, claro, tal diferencia pudo
punto de vista clínico, epidemiológico o de salud haber ocurrido por simple casualidad; es decir,
pública, solo por resultar <<nosignificativa puede aparecer inesperadamente por efecto del
estadísticamente>). azar y no necesariamente porque exista una
real diferencia. Como se repetirá más adelante,
En este artículo, la significancia estadística se
lo que quiere indagarse, entonces, es si tal
aborda de manera sencilla con el ánimo de que diferencia (que conlleva una asociación)
quien acuda a la literatura científica o se
detectada en el estudio pueda haber ocurrido
exponga a los congresos, pueda evaluar -con un
por azar.
mínimo de criterio epidemiológico- muchos
hallazgos que encontrará, en buena proporción, Supuestos erróneos acerca del valor de p
expresados con sentido estadístico. - Un valor bajo de p (por ejemplo, p=0,0002)
Debe quedar claro, sin embargo, que la prueba que la diferencia encontrada se debe a la
estadística es una de las herramientas con las intervención, si es un estudio experimental, o a
cuales trabaja el epidemiólogo y con su ayuda la exposición en uno de cohortes o de casos y
se han iniciado muchas investigaciones que, controles.
partiendo del hallazgo (a veces accidental) de . Un valor bajo de demuestra relación causa-
una asociación, terminaron en el control de una efecto entre una exposición y un padecimiento,
epidemia o en medidas de salud pública
dirigidas a factores de riesgo específicos o en - Un valor bajo de p establece la fuerza de la
análisis de laboratorio, buscando micros- asociación.
Subdirección de Eoidemioloaía v Laboratorio Nacional de Referencia
Recibido para su Publicación: 2ó de agosto de 1998 -Aprobado para su publicación: 19 de enero de 1999

291
-Un valor bajo de p demuestra la validez del dos tratamientos no tienen un efecto similar
estudio. sobre la hipertensión arterial (rechazo de la
- Un valor de p alto (por ejemplo, p>0,05)
hipótesis nula) y, por extensión, que el
significa que no hay asociación entre la medicamento B es mejor que el A.
exposición A y el resultado B o que no hay El primer concepto que debe quedar claro,
diferencia entre exposición y no exposición, entonces, es que las pruebas estadísticas nada
etc. prueban; simplemente evalúan la probabilidad de
Desde luego, hay algunas otras interpre- que nuestros hallazgos puedan o no atribuirse al
taciones erróneas con respecto al valor de p, azar. Para probar una asociación en el campo
pero quizás, éstas sean las más frecuente- de la ciencia, no son suficientes las pruebas
mente leidas, referidas o escuchadas por parte estadísticas y se necesitan varios criterios
del personal de salud. adicionales con los cuales puede establecerse,
por ejemplo, una relación causa-efecto, como
Las pruebas de significancia estadística parten
de una hipótesis de no asociación (o de no se verá más adelante.
diferencia) a la cual se le llama hipótesis nula. En contraste con la probabilidad de que ocurra
Por ejemplo, se quiere evaluar mediante un por azar una diferencia detectada en un estudio
ensayo clínico, si el tratamiento B es mejor que (valor p), las medidas de asociación (riesgo
el ya conocido tratamiento A para el manejo de relativo, RR, y razón de disparidades, OR)
la hipertensión arterial. La hipótesis nula sería indican la dirección y la fuerza con que están
que el tratamiento B es igual (o no es mejor) ligados dos factores (por ejemplo, exposición-
que el A, a la cual se le contrapone una enfermedad) y sus intervalos de confianza del
hipótesis alterna: el tratamiento B es mejor que 95% (IC95%) pueden ser usados como prueba
el tratamiento A. La diferencia de proporciones de significancia estadística.
de individuos que mejoraron con uno y otro
tratamiento, se evaluará con la prueba de El RR se obtiene dividiendo la incidencia de
significancia. enfermedad de quienes estaban expuestos al
factor de riesgo entre la incidencia de
Vamos a suponer que una vez finalizado el
estudio, se encontró una diferencia enfermedad de quienes no lo estaban. Si las
(estadísticamente significativa) en las dos incidencias resultaren iguales, el RR será
proporciones de individuos que mejoraron en igual a 1 y a esto se llama el valor nulo de esta
cada grupo de pacientes hipertensos, a favor medida. El OR mide lo mismo que el RR en
del tratamiento B. La prueba de significancia aquellos estudios en los cuales no es posible
estadística solamente permitirá establecer establecer las incidencias de la enfermedad
aué tan i~robableera encontrar esa diferencia (casos y controles).
(o una mayor) de ser cierta la hipótesis nula. Por su parte, los intervalos de confianza del
Es decir, si partimos del supuesto que los dos 95% (IC 95%), para estos casos, indican entre
tratamientos contra la hipertensión arterial
qué valores se encuentra un RR o un OR con un
eran similares, ¿qué tan probable era
95% de certeza, es decir, con sólo 5% de
encontrar la diferencia que pudimos detectar o
incertidumbre. Aquellos IC 95% que dejan por
una aún mayor a esa? Esta probabilidad es la
que está indicando el valor de p. Si resultó ser fuera el valor nulo (uno) de cualquiera de estas
del orden de 0,002, quiere decir que la dos medidas, serán significativos. Por ejemplo,
probabilidad de detectar tal diferencia (o una se encontró un RR de 2 con un IC 95% que
más grande) entre las proporciones de oscila entre 1,5 y 3,O; entonces, decimos que el
individuos hipertensos que mejoraron con uno hallazgo es estadísticamente significativo
y otro tratamiento, es de 2 por mil y eso se porque el valor nulo de todo RR es 1 y, en este
considera ínfimo. Por tanto, se afirma que los caso, está por fuera del intervalo encontrado.
SIGNIFICADO DE LA SIGNIFICANCIA

Sin embargo, como cualquier otra prueba de asociación estadísticamente significativa, en


significancia, también los intervalos tienen algo uno de ellos tal asociación pudo ser producto
que ver con el tamaño de la muestra. Cuando es del azar; o dicho de otra manera, de 100
pequeña, los IC 95% serán muy amplios y estudios similares, en cinco, tal diferencia o
pueden llegar a incluir la unidad, lo cual - asociación encontrada, ocurrió accidental-mente
estadísticamente hablando- haría tal hallazgo y no porque existiera en realidad.
<<nosignificativo,, y posiblemente, si se hubiera
El segundo concepto es que el no poder
obtenido una muestra de mayor tamaño, se
rechazar la hipótesis nula, nunca significa que
podría encontrar que los IC 95% no incluyen
!a alterna sea falsa. O sea, que un valor de p
la unidad, esto sería <<estadísticamente
mayor de 0,05 (5%) no necesariamente
significa ti vos^^.
significa la inexistencia de asociación (o de
Un ejemplo de lo anterior se muestra en un diferencia entre los dos tratamientos a favor
estudio realizado hace algunos años, el cual del B, en el ejemplo). Ese dato solamente
buscaba la asociación entre la presencia de informa que la diferencia encontrada en el
úlceras genitales y el desarrollo de estudio pudo ocurrir por azar. En otras
seroconversión al VIH (figura 1). palabras, que no podemos descartar el papel
Figura 1. Seguimiento de pacientes con presencia de del azar en nuestro hallazgo.
úlceras genitaies y sin ellas con respecto al desarrollo de
positividad al VIH. Es claro que el papel del azar nunca va a poder
descartarse en el 100%, por más pequeño que
Seroconversión resulte el valor de p. Eso, precisamente, hace la
al ViH diferencia entre lo improbable y lo imposible; un
Sí No
valor de p muy pequeño hace improbable el
Sí 53 RR=3,55 hecho de que una diferencia (o asociación) igual
Ulceras IC 95% (0,8-15,9)
genitales ~ ~ 0 . 0 7
o más extrema que la detectada en el estudio,
No 47 pueda ser explicada por el azar, pero no la hace
imposible.
10 90 100
Si un determinado estudio en una muestra
pequeña de la población-sujeto resulta con un
Seroconversión riesgo relativo alto (mayor de 2) en ausencia de
al VIH sesgos o de factores de confusión, aún con
3 No unos intervalos de confianza que incluyan la
Sí 106 RR= 3.55
unidad, debe ser tenido en cuenta por cuanto, a
Uiceras IC95% (1,2-10.2) pesar de la no significancia estadística, puede
genitaies p= 0,02 ser epidemiológicamente relevante. Un claro
NO 94 ejemplo (y extremo, por demás) se observa en
20 180 200
un estudio de cohotie con 215 VIH positivos y
201 VIH negativos para establecer el riesgo de
Se observa cómo, teóricamente, al estudiar una desarrollar TBC clínica. Se encontró un RR de
muestra mayor, ese mismo RR adquiere unos 7,5 con unos IC 95% de 0,9 a 59, que resultó no
intervalos de confianza menos amplios, que significativo desde el punto de vista estadístico
dejan por fuera la unidad, y el valor de p, a su (por estar incluido el valor nulo del RR en ese
vez, se hace más pequeño, es decir, se pasa intervalo). Pero, estaríamos completamente
desde la no significancia a la significancia ciegos si no le diéramos importancia
estadística. epidemiológica a semejante asociación (figura
En resumen, con un valor de p de 0,05, lo 2).
único que se quiere decir es que de 20 estudios De lo anterior, se puede desprender que la
semejantes en los cuales se encontró una fuerza de la asociación no puede determinarse
Figura 2. Seguimiento de pacientes VIH positivos y El cuadro adjunto (cuadro l ) , extraido del texto
negativos con relación al desarrollo de TBC clínica. todos de Lilienfeld, muestra cómo, con un RR de 2 y
PPD positivos.
una prevalencia de la característica susceptible
TBC clínica de ser controlada totalmente de 95%, la
si NO
incidencia de tal enfermedad se podria disminuir
sí en 49%.
Ulceras
genitales Cuadro 1. Riesgos atribuibles, expresados en términos
NO de proporción, correspondientes a un cierto valor de
riesgo relativo y a una cierta proporción de la población
con determinada característica.

con el valor de P pero si con un RR o un OR, Porcentaje de Riesgo relativo


por cuanto estos datos (en el caso más la población 2 4 10 12
c o n característla
sencillo) dicen cuántas veces es mayor el
riesgo de enfermar entre quienes se
expusieron con respecto a quienes no lo
hicieron. Si el RR es 3, entonces, los
expuestos tienen tres veces mayor probabilidad
de enfermar que quienes no se expusieron. Los
RR y los OR, con el apoyo de los intervalos de
confianza, nos muestran también la dirección de
la asociación. En el caso del referido RR de 3, Finalmente, se pueden encontrar asociaciones
se ha dicho que quienes están expuestos tienen estadísticamente significativas que no tienen
un riesgo mayor de enfermar, pero, puede ocurrir ninguna significancia desde puntos de vista no
que el RR sea menor de 1 y que los intervalos estrictamente estadísticos. Muestras de estudio
de confianza del 95% también dejen por fuera el en extremo grandes, pueden dejar ver
valor nulo. En este caso, deberemos decir que diferencias significativas que, en realidad, son
quienes se exponen están protegidos de la irrelevantes clínica o epidemiológicamente
enfermedad o que la exposición no es un factor hablando.
de riesgo y sí uno de protección. Esta es la
dirección de la asociación, algo que no puede En resumen, el asunto de la significancia
obtenerse con el valor de p. estadística es un hallazgo estadístico que en
ciertas ocasiones, cuando la muestra del
Adicionalmente, los RR u OR mayores de 1 estudio es adecuada y sin sesgos o factores de
pero menores de 2, que a simple vista pudieran confusión, puede ser de valor clínico,
estimarse bajos, sin importancia desde el punto epidemiológico o de salud pública.
de vista de la fuerza de la asociación, pueden
ser extraordinariamente importantes si se miran El tercer concepto que debe quedar claro, es
desde la óptica de la salud pública. Cuando hay que la significancia estadistica por sí misma no
una alta prevalencia de la exposición o del factor implica relación causa-efecto y tampoco la no
de riesgo en la comunidad, los beneficios que significancia la descarta. Aparte del papel que
se obtendrían, si se controlara dicha exposición, haya podido estar jugando el azar que, a su vez,
pudieran ser valiosos. Esto último tiene que ver tiene bastante que ver con el tamaño de la
con otra medida en epidemiología, relacionada muestra, se deben evaluar otros aspectos. Uno
con la frecuencia con que se presenta una de tales aspectos es la presencia o no de
característica en l a población, el riego sesgos en el diseño del estudio que,
poblacional atribuible. Esto es, la proporción fundamentalmente, pueden ser de selección, de
máxima de incidencia de una enfermedad que información o de confusión, además de los
lograría eliminarse si se controlara completa- errores cometidos en el análisis de sus
mente la exposición implicada. resultados. No es extraño utilizar una prueba
SIGNIFICADO DE LA SlGNlFlCANClA

estadística inadecuada para el tipo de datos que atribuir al azar un hallazgo en contra de una
se está analizando, aunque ahora, con la ayuda asociación ya descrita y estudiada que cuando
de los computadores y de los paquetes es l a primera vez que se describe,
estadísticos es menos probable encontrar estas independientemente del resultado de las
fallas en la literatura científica. pruebas.
Los sesgos, que resultan críticos en cualquier Si con lo expuesto hasta ahora no ha quedado
tipo de estudio, determinan la validez y, si a su clara la respuesta a la pregunta de qué tratan de
prevención, le adicionamos el juicio del resolver las pruebas de significancia, aquella
epidemiólogo al considerarlos, así como la con que empieza este documento, hay que
consistencia de los hallazgos con anteriores decir que no es posible responderla ciento por
estudios similares, la relación temporal entre ciento afirmativamente y a lo máximo que
exposición y enfermedad, la plausibilidad podremos llegar es al 90%, al 95% o al 99% de
biológica y la relación dosis-respuesta, puede certidumbre (este último con tamaños de
considerarse, ahora sí con más seriedad, una muestra bastante mayores que los dos primeros
relación causa-efecto. porcentajes). Es decir, si con nuestro estudio
(eso sí, bien hecho) hemos detectado un RR de
No se puede finalizar esta revisión sin
2,2 con unos intervalos de confianza del 95%
mencionar un último punto, para tranquilidad de
entre 1,7y 3,1, podemos afirmar con un 95% de
los estadísticos y, también, de los
probabilidades de no equivocarnos, que el
epidemiólogos. Si se tiene un estudio bien
verdadero RR en el universo poblacional estará
hecho, esto es, con una muestra adecuada
entre 1,7y 3 , l . A esto, nunca podremos llegar
para el problema que desea abordarse, libre
al considerar únicamente el valor de p.
de sesgos y de confusión y con una aplicación
correcta de las pruebas de significancia, insistir Referencias
en que hay asociación sólo porque se observó
Beaglehole R, Bonita R, Kjellstrom T.
cierta diferencia en los resultados (por ejemplo, Epidemiología básica. Publicación Científica No.
de los tratamientos A y 13 mencionados 551. Washington. D.G.: OPS; 1994.
anteriormente) sin que se consiguiera rechazar Giesecke J. Modern infectious disease epide-
la hipótesis nula, es a todas luces, inadecuado. miology. New York: Oxford University Press, Inc.;
1994.
De otro lado, los estudios que muestran
asociaciones estadísticas significativas Gregg M. Field epidemiology. New York: Oxford
University Press. Inc.; 1996.
(cuando se describen por primera vez) son y
han sido, en no pocas ocasiones, el punto de Norman G , Streiner D. Bioestadistica. Barcelona:
partida de investigaciones más profundas que MosbyIDoyma Libros; 1996.
han permitido conocer a fondo algunos Londofio J. Melodologia de ia investigación
factores de riesgo de enfermedad. epidemiológica. Medellin: Editorial Universidad de
Antioquia; 1995.
Finalmente, K. Rothman y S. Greenland, en la Dawson B, Trapp R. Basic and ciinical bio-statistcs.
última edición de su texto Modern epidemiology, New Jersey: Prentice-Hall lnternational inc.; 1990.
afirman "ser estadístico o médico o ambos al
Goldberg M. La epidemiología sin esfuerzo. Madrid:
tiempo, no es necesario ni suficiente para ser Diaz de Santos; 1994.
epidemiólogo. Se necesita el entendimiento de
Lilienfeld A , Lilienfeld D. Fundamentos de
los principios de la investigación epidemiológica epidemiologia. México, D.F.. Addison-Wesiey
y experiencia para aplicarlos". De eso se trata, Iberoamérica: 1986.
de pensar con criterio epidemiológico, cosa Rothman K, Greenland S. Modern epidemiology.
bastante diferente del simplemente estadístico o Second edition. USA: Lippincott-Raven Publishers:
del simplemente médico. Es mucho más <<fácil,) 1998

También podría gustarte