Está en la página 1de 4

Rev. Chilena de Ciruga. Vol 60 - N 1, Febrero 2008; pgs.

86-89
86 Rev. Chilena de Ciruga. Vol 60 - N 1, Febrero 2008

DOCUMENTOS

El valor de p y la significacin estadstica.


Aspectos generales y su valor en la prctica clnica*
Interpretation of medical statistics
Drs. CARLOS MANTEROLA D.,1,2 VIVIANA PINEDA N.1, GRUPO MINCIR
1Departamento de Ciruga, Facultad de Medicina, 2CIGES (Capacitacin, Investigacin y Gestin para la Salud
Basada en Evidencia), Universidad de La Frontera, Temuco, Chile.

INTRODUCCIN que queremos probar y el tamao de la muestra; si


estos elementos no estn adecuadamente conside-
Desarrollar cualquier estudio clnico tiene rados en el estudio permitirn la generacin de
como objetivo poner de manifiesto la existencia de resultados espurios, que pueden finalmente llevar a
asociacin entre variables. Sin embargo, esta aso- la toma incorrecta de decisiones, ya sea por errores
ciacin puede ser real o ficticia, ya sea producto del de tipo I II.
azar, la existencia de sesgos, presencia de confun- Existen formas ms apropiadas de representar
dentes, etc. los resultados en investigacin clnica como la ra-
Es quizs por esto que los clnicos, nos basa- zn de odds, el riesgo relativo, el nmero necesario
mos habitualmente en la significacin estadstica de pacientes a tratar para reducir un evento, entre
para nuestra toma de decisiones. Este artculo, in- otras, que se asocian a la significacin clnica y
tenta poner una nota de alerta al respecto en rela- permiten dilucidar de mejor forma la incertidumbre
cin a que, si bien es cierto que es una herramienta existente frente a una situacin clnica puntual.
til, no necesariamente va ligada a la relevancia Desarrollar cualquier estudio clnico tiene
clnica del fenmeno en estudio; esto se debe a que como objetivo poner de manifiesto la existencia o
la significacin estadstica puede no resolver la no de asociacin entre diversas variables. La aso-
incertidumbre clnica ante un escenario puntual, ciacin encontrada puede ser real; sin embargo,
dado que es un concepto exclusivamente matem- con mayor frecuencia de la que uno se imagina
tico y no de garanta de calidad. sta es producto del azar, de la existencia de
El concepto significacin estadstica se rela- sesgos, de la presencia de variables de confusin
ciona con la necesidad de probar hiptesis, situa- o de la variabilidad biolgica del fenmeno en estu-
cin a la cual los clnicos no estamos habituados y, dio. Para dilucidar este problema existen una serie
quizs, sea sta una de las razones por las que de pasos fundamentales al momento de disear y
confiamos tanto en el concepto de significacin conducir una investigacin; y, posteriormente, al
estadstica y nos dejamos llevar por el valor de p. momento del anlisis de los datos, que es donde
Antes de valorar el valor de p, es relevante aparece recin la utilizacin de herramientas estads-
tener en cuenta que este concepto depende de dos ticas tanto de carcter descriptivo como analtico. Y
elementos esenciales: la magnitud de la diferencia es la utilizacin de estas ltimas la que permite

*Recibidoel 1 de Julio de 2007 y aceptado para publicacin el 28 de Agosto de 2007.


Correspondencia: Dr. Carlos Manterola D.
Casilla 54-D, Temuco, Chile.
Fax: 56-45-325761
e-mail: cmantero@ufro.cl
El valor de p y la significacin estadstica. Aspectos generales... / Carlos Manterola y cols. 87

generalizar resultados, o inferir los resultados obte- con KTP/532 lser y 442 disecados con electro-
nidos de la muestra estudiada a la poblacin blanco ciruga monopolar), se observ desarrollo de com-
que la gener1. plicaciones graves en 16 pacientes disecados
Por todo lo anteriormente expuesto es que re- con KTP/532 lser y 11 con electrociruga mono-
sulta fundamental el cuidadoso diseo del estudio, polar. Existe diferencia significativa respecto del
tomar en consideracin los criterios de seleccin y porcentaje de complicaciones graves entre ambas
la estimacin del tamao de la muestra, puesto que tcnicas de diseccin?5.
mientras ms grande es el tamao de la muestra, H0 (hiptesis nula)= No hay diferencia entre
mayor es la precisin; y por ende, la variabilidad ambas tcnicas de diseccin.
secundaria al azar se reduce. De todos modos, el Ha (hiptesis alternativa)= S existe diferencia
rol que siempre jugar el azar debe tenerse en entre ambas tcnicas de diseccin.
cuenta, evaluarse y medirse, por ejemplo conside-
rando los intervalos de confianza que nos permiten Tratamiento N pacientes Respuesta p
conocer la precisin de la estimacin dentro de un
margen de error previamente establecido2,3. KTP/532 lser 199 16/199 = 0,080 p1
Es por todo esto que, desde la perspectiva Electrociruga mono- 422 11/422 = 0,026 p2
polar
clnica, el concepto de significacin estadstica no
es relevante, pues no resuelve la incertidumbre. Se
Si [p1 - p2] es mayor que el producto de 1,96 (Z-0,05)
debe tener en cuenta que estamos hablando de un
multiplicado por el error estndar, concluimos que la dife-
concepto matemtico, por lo que una asociacin
rencia es significativa. Por lo tanto, hemos de calcular el
estadsticamente significativa puede no ser clnica-
error estndar para luego compararlo con la diferencia
mente relevante; una asociacin estadsticamente
observada en los grupos en estudio.
significativa puede no ser causal; y una asociacin
estadsticamente no significativa puede deberse a
[p1 - p2] = [0,080 - 0,026] = 0,054
un problema de tamao de muestra insuficiente. Es
p= [p1 + p2] / 2 = [0,080 + 0,026] / 2= 0,053
decir, podemos encontrar asociaciones estadsti-
camente significativas y conceptualmente espu-
El error estndar se calcula de la siguiente forma:
rias4; por ello, hay que tener siempre presente que
Error estndar= p (1-p) (1/n1+ 1/n2) =
el trmino estadsticamente significativo no es
= 0,053 (1-0,053) (1/199+ 1/422)= 0,00035
"garanta de calidad".
El concepto significacin estadstica se rela- Error estndar multiplicado por Z-0,05 = 0,00035 * 1,96=
ciona con la necesidad de probar hiptesis. Este 0,00069
proceso se realiza utilizando pruebas de hipte-
sis, las que permiten cuantificar hasta que punto la Entonces, si la diferencia de [p1 - p2] = 0,054
variabilidad de la muestra en estudio es responsa- supera al error estndar multiplicado por Z-0,05
ble de los resultados obtenidos en el estudio. Es as (0,00069) concluimos que existe una diferencia
como H0 o hiptesis nula, representa la afirmacin estadsticamente significativa entre los grupos en
de que no hay asociacin entre las dos variables; y estudio; razn por la cual rechazamos H0, por ende,
Ha, o hiptesis alternativa, afirma que existe asocia- aceptamos la Ha.
cin entre las dos variables. Entonces, la estadsti- No obstante ello, se ha de tener en cuenta que
ca nos permite decidir sobre que hiptesis debe- el rechazo de H0 tiene implcito el riesgo de cuan-
mos elegir, lo que ser con el nivel de seguridad tificar el valor de p, que representa la probabilidad
que previamente se haya establecido por el equipo de aceptar la Ha, cuando en realidad la hiptesis
de investigacin (habitualmente en clnica es 95%). correcta podra ser H0.
Las pruebas estadsticas funcionan entonces El valor de p que indica que la asociacin es
de la siguiente forma: se verifica la magnitud de la estadsticamente significativa ha sido arbitraria-
diferencia existente entre los grupos a comparar (A mente aceptado por consenso; y, en clnica, se
y B). Si esta magnitud es mayor que un error admite 0,05. Dicho en otros trminos, esto repre-
estndar definido multiplicado por una seguridad senta una seguridad del 95% que la asociacin que
definida, concluimos que la diferencia entre A y B estamos estudiando no sea por el azar; por lo que
es significativa; por ende, se rechaza la hiptesis si queremos trabajar con un margen de seguridad
nula y se acepta la hiptesis alternativa. Por de 99%, ste lleva implcito un valor de p inferior a
ejemplo, en un estudio en el que se compararon los 0,01.
resultados obtenidos en 641 pacientes colecis- Pero qu significa que el valor de p" sea
tectomizados por va laparoscpica (199 disecados superior a 0,05? Entonces hemos de plantearnos
88 Rev. Chilena de Ciruga. Vol 60 - N 1, Febrero 2008

que los resultados pueden estar influidos por el error tipo I? Realizar un adecuado diseo y planifi-
azar y entonces no podemos rechazar H0, que cacin del estudio de forma tal de evitar buscar
avala que las variables no estn asociadas6. asociacin entre variables por si resulta o dispa-
Sin embargo, es relevante tener en cuenta que rar a la bandada esperando que caiga algo; reducir
el concepto de significacin estadstica depende el nmero de pruebas estadsticas a utilizar, slo a
de dos elementos esenciales: la magnitud de la las necesarias, evitando sobreutilizar herramientas
diferencia que queremos probar y el tamao de la estadsticas; limpiar la base de datos para evitar
muestra. Con respecto a la magnitud de la diferen- errores de valores extremos que puedan producir
cia, es importante comprender que a mayor diferen- hallazgos falsamente significativos; recurrir al uso
cia entre las variables en estudio, ms fcil ser de valores de alfa ms pequeos o reducir los
poder demostrar que la diferencia es significativa; intervalos de confianza (0,01 0,001); observar si
al revs, si la diferencia es pequea las posibilida- los resultados del estudio se pueden reproducir.
des de detectar diferencias se minimizan. Ahora, Cmo reducir la probabilidad de cometer un
respecto del tamao de la muestra, es fcil com- error tipo II? Incrementar el tamao de la muestra,
prender que mientras mayor sea ste, ms fcil evaluar el poder estadstico del estudio, aumentar
ser detectar diferencias entre las variables en es- el tamao del efecto a detectar, elevar el valor de
tudio; entonces, cuando las diferencias son peque- alfa y utilizar pruebas estadsticas ms robustas
as se requiere de muestras de gran tamao; al como las denominadas pruebas paramtricas (t-
revs, cuando las diferencias son grandes se nece- test, ANOVA, etc.).
sita de muestras pequeas para conducir el estu- Por todas las razones antes expuestas, ms
dio. As, el tamao de la muestra afecta la significa- relevante que hablar de significacin estadstica
cin estadstica a travs del error estndar que se es utilizar el concepto de relevancia clnica; esto,
hace ms pequeo cuantos ms pacientes tenga el debido a que la relevancia clnica de un fenmeno
estudio. En resumen, cualquier diferencia entre las va ms all de clculos matemticos y depende de
variables en estudio puede ser estadsticamente la gravedad del problema, la morbilidad y mortali-
significativa si se dispone del nmero suficiente de dad generada por el mismo, la magnitud de la dife-
pacientes. rencia, la vulnerabilidad, los costes involucrados,
Por ejemplo, en un estudio referente a trata- etc.
miento de cncer gstrico, al calcular la muestra De este modo, las formas ms apropiadas de
necesaria con una supervivencia de 50% para el representar los resultados en investigacin clnica
grupo de ciruga y quimiorradioterapia y 41% para son la razn de odds, el riesgo absoluto (RA), el
el grupo con ciruga exclusiva (resultados reporta- riesgo relativo (RR), la reduccin relativa del riesgo
dos en el artculo), un alfa de 0,05 y una potencia (RRR), la reduccin absoluta del riesgo (RAR), el
de 80%, la muestra necesaria para la conduccin nmero necesario de pacientes a tratar para reducir
del estudio es de 960 sujetos (480 por grupo); y no un evento (NNT) y el nmero necesario de pacien-
556 en total (281 para el grupo de ciruga y tes a daar (NND)10-12; y la significacin estadstica
quimiorradioterapia; 275 para el grupo de ciruga no es nada ms que eso, la significacin estads-
exclusiva)7,8. tica, que en ocasiones puede ser positiva y
Con este ejemplo, se hace patente la aparicin clnicamente irrelevante, o negativa, sin que eso
de dos conceptos: el de error tipo I o alfa y el de signifique necesariamente que no hay diferencias
error tipo II o beta. El error tipo I corresponde a un reales entre las variables en estudio.
falso positivo, es decir rechazar la H0 cuando en Por ello es que el valor de p, debe ser obser-
realidad es verdadera; en trminos ms sencillos, vado con cautela y siempre tomado en cuenta en el
creer que hay una asociacin estadsticamente sig- contexto del estudio, su diseo, las caractersticas
nificativa cuando no la hay, que es lo que ocurri en de la muestra o la poblacin en estudio, de los
el estudio de MacDonald7,8. ste es un claro ejem- potenciales sesgos, etc. Y no como una cifra mgi-
plo que el valor de p no es un indicador de fuerza ca que nos seduzca de tal forma, que nos invite o
de una asociacin, como tampoco de su importan- autorice a tomar decisiones o cambiar conductas
cia (para ello existen la razn de Odds, el riesgo relacionadas con la prctica clnica cotidiana.
relativo, etc.). Por otra parte, el error tipo II corres- Por ltimo, antes de tomar decisiones o cam-
ponde a un falso negativo, es decir, consiste en biar conductas basadas en un valor de p, se ha de
aceptar H0 cuando es falsa; en trminos ms sen- considerar adems la validez externa o generaliza-
cillos, creer que no existe una asociacin estads- cin de los resultados obtenidos en ese estudio
ticamente significativa cuando quizs la hay9. respecto de la poblacin blanco y, particularmente,
Cmo reducir la probabilidad de cometer un respecto de nuestros pacientes o nuestra realidad
El valor de p y la significacin estadstica. Aspectos generales... / Carlos Manterola y cols. 89

laboral, que pueden ser no necesariamente equiva- 7. MacDonald JS, Smalley SR, Benedetti J, Hundahl
lentes a los utilizadas en el estudio valorado por SA, Estes NC, Stemmermann GN et al. Chemora-
nosotros. diotherapy after surgery compared with surgery
alone for adenocarcinoma of the stomach or the
gastroesophageal junction. New Engl J Med 2001;
REFERENCIAS
345: 725-730.
8. Manterola C, Torres R, Burgos L, Vial M, Pineda V.
1. Manterola C. El proceso que conduce al desarrollo
Methodological quality of an article on the treatment
de la investigacin cientfica. Su aplicacin en ciru- of gastric cancer adopted as protocol by some
ga. Rev Chil Cir 2001; 53: 104-109. Chilean hospitals. Rev Med Chil 2006; 134: 920-926.
2. Altman DG. Confidence intervals for the nember
9. Daly LE, Bourke GJ. Interpretation and uses of me-
needed to treat. BMJ 1998; 317: 1309-1312. dical statistics. Blackwell science, Oxford, 5th ed,
3. Daly LE. Confidence limits made easy: interval 2000.
estimation using a subsitution method. Am J Epide-
10. Cook RJ, Sackett DL. The number needed to treat: a
miol 1998; 147: 783-790. clincally useful measure of treatment effect. BMJ
4. Silva Ayaguer LC. Cultura estadstica e investiga- 1995; 310: 452-454.
cin cientfica en el campo de la salud: una mirada
11. Laupacis A, Sackett DL, Roberts RS: An assesment
crtica. Editorial Daz de Santos, Madrid, 1997. of clinically useful measures of treatment. New Engl
5. Lane GE, Lathrop JC. Comparison of results of KTP/ J Med 1988; 318: 1728-1733.
532 laser versus monopolar electrosurgical dissec-
12. Sackett DL, Richarson WS, Rosenberg W, Hynes
tion in laparoscopic cholecystectomy. J Laparo- RB. Evidence-based medicine: how to practice and
endosc Surg 1993; 3: 209-214. teach EBM. Churchill-livingstone; London, 2nd ed.
6. Jekel JF, Elmore JG, Katz DL. Epidemiology Biosta-
2000.
tistics and Preventive Medicine. WB Saunders
Company, Philadelphia, 1996.

También podría gustarte