Está en la página 1de 5

PRINCIPIOS

CAPÍTULO

DE LA ESTADÍSTICA 9
Una vez recolectados los datos, ¿qué hacemos ahora? ¿Cómo traducimos los datos
clínicos individuales en valores numéricos que resuman los datos de la población estu-
diada? ¿Cómo comparamos datos de una manera válida? ¿Qué podemos concluir con
esta comparación?
La Estadística es la herramienta fundamental que nos permite traducir la experiencia de
un grupo de individuos en datos numéricos para hacer inferencias acerca de la población
estudiada y derivar conclusiones generales.
La Estadística, como toda ciencia, tiene su propio lenguaje, razonamiento y metodolo-
gía. Por lo tanto, es fundamental entender cómo razona la Estadística y su lenguaje antes
de comenzar a estudiar sus métodos.
Supongamos que deseamos saber cuál es la mortalidad del infarto agudo de miocardio
en su etapa intrahospitalaria.
Para determinar este valor deberíamos tomar a todos los pacientes internados por in-
farto de miocardio del mundo. Como esto, obviamente, no es posible, se obtiene lo que se
llama una muestra de pacientes, que representan a todos los infartos internados. Este es un
grupo de sujetos que, teniendo las mismas características, representan a la población de
interés (universo entero de todos los casos que están siendo estudiados).
La manera correcta de elegir una muestra para que sea representativa de la población
es seleccionar los sujetos al azar, mediante un procedimiento conocido como aleatoriza-
ción.
Si tomamos 10 000 pacientes provenientes de diferentes países y calculamos su mor-
talidad, podríamos concluir que la mortalidad del infarto de miocardio es, por ejemplo, del
8%, pero ¿es este valor único e inamovible?
Obviamente no es así, porque si tomamos otra muestra de 10 000 pacientes, casi seguro la
mortalidad que observaremos no será exactamente 8%; quizás esta vez sea de un 10%.
De este ejemplo podemos concluir que, cada vez que realicemos un mismo experimento
repetidas veces, nos encontraremos con distintos resultados.
Los datos obtenidos a través de métodos estadísticos no nos informan un valor abso-
luto e inamovible; lo que hace la estadística es inferir o deducir un valor que se acerque lo
más posible al supuesto valor real (que nunca conoceremos) y asumir este valor como el
verdadero valor.
La estadística entonces no mide valores exactos sino que los estima. Cuando hablamos
de estimación nos referimos al cálculo más cercano que podamos hacer del verdadero valor
y cuál es el grado de precisión con el cual este valor ha sido calculado.
El ejemplo más común son las encuestas que se realizan antes de un acto electoral: se
toma una muestra suficientemente grande de sujetos al azar para estimar el porcentaje de
votos de cada candidato en la población de interés (todas las personas mayores de 18 años
del país). Una vez realizadas las elecciones se pueden comparar las estimaciones hechas a
partir de las muestras con los resultados obtenidos.
Ruth P. Henquin | Epidemiología y Estadística para principiantes

Pensemos que en una elección no todas las personas mayores de 18 años concurren a
votar, por lo que el acto electoral podría ser asumido como la muestra más grande posible
de obtener, debido a que la única forma de saber el verdadero porcentaje de cada candi-
dato sería que nadie falte a votar. Es por eso que decimos que el verdadero valor nunca lo
conoceremos, sólo lo podemos estimar.

AZAR Y PROBABILIDAD

¿Por qué si tomamos la misma cantidad de pacientes en varias oportunidades nunca obte-
nemos el mismo valor, por ejemplo de mortalidad?
Más allá de todos los factores que puedan afectar la evolución de un infarto, sin ninguna
duda y en última instancia, es el azar el que determina estas variaciones.
Pensemos por ejemplo en una maternidad y en qué porcentaje de varones nacen cada
día durante un mes. Seguramente algunos días no nacerá ningún varón y otro día serán
todos varones, lo cual intuitivamente sabemos ocurrirá muy pocas veces. Con mayor fre-
cuencia observaremos que el porcentaje de varones está entre un 40 y un 60%. Esto se
debe a que la verdadera proporción de varones y mujeres es del 50% y que sólo existen
estas dos posibilidades.
Estas variaciones son debidas al azar, pero debemos estar seguros. La estadística nos
ayuda a determinar cuál es la variación que puede presentar un valor debido solo al azar o,
dicho de otro modo, cuál es el rango de valores que probablemente obtendremos por azar
al medir la ocurrencia de un evento.
Si los eventos no variaran al azar serían enteramente predecibles y no necesitaríamos
de la estadística.
A través del cálculo de probabilidades es posible determinar cuál es la probabilidad que
tiene un evento de ocurrir bajo determinadas condiciones y cuál es la variación que puede
presentar ese mismo valor debido al azar.
Por ejemplo, la probabilidad de ser varón o mujer es del 50%, debido a que sólo existen
dos resultados posibles o condiciones.
La posibilidad de obtener el número 1 cuando tiramos un dado es 1 en 6, porque sólo
existen 6 posibilidades o condiciones.
Probabilidad es simplemente una forma de describir cuán posible es que un evento
ocurra dadas ciertas condiciones y por azar. La probabilidad se expresa con números de-
cimales. La probabilidad de obtener un número dado por azar tirando un dado se expresa
como 0,166 (1 dividido 6).
Su interpretación es fácil: si un evento tiene una probabilidad muy baja de ocurrencia,
por ejemplo 0,001 (probabilidad 1 en 1 000 de que ocurra), se concluye que es muy impro-
bable que ocurra sólo por azar, a diferencia de un evento con probabilidad 0,9 (probabilidad
9 en 10) el cual es altamente probable que ocurra sólo por azar.
Si un evento puede ocurrir o no, entonces la probabilidad toma valores entre 1 y 0: 1
significa que un evento ocurrirá y 0 significa que el evento nunca ocurrirá.
Entre la posibilidad absoluta de que un evento ocurra o no hay diferentes posibilidades
intermedias: un evento puede ser más o menos probable. Por eso los valores intermedios
entre 1 y 0 nos transmiten esta probabilidad. Por ejemplo, la probabilidad de que una per-
sona muera es 1, ya que todos en algún momento moriremos, pero la probabilidad de que
muera mañana podría ser 1 en 100 000, o 0,000001. Si bien es cercana a cero y muy
improbable, puede existir la posibilidad de que sufra un accidente de tránsito.
El cálculo de probabilidad es el eje de las pruebas estadísticas.

‡
&DStWXORPrincipios de la Estadística

El término p o valor de p se refiere a probabilidad y es lo que siempre se ve expresado


como p = x (por ejemplo, p = 0,003, que indica que un evento tiene una probabilidad o
chance de ocurrir por azar de 3 en 1 000 bajo ciertas condiciones).

LÓGICA DE LAS PRUEBAS ESTADÍSTICAS

Las pruebas estadísticas asumen entonces que todos los eventos (en principio) ocurren por
azar y calculan cuál es la probabilidad de que un determinado evento se haya producido por
azar para confirmar esta asunción.
A las asunciones en que se basa la Estadística se las llama supuestos.
Entonces, el supuesto de la estadística es que, hasta que se pruebe lo contrario, todos
los eventos ocurren por azar, dadas ciertas condiciones, y el deber de las pruebas esta-
dísticas es probarlo a través del cálculo de la probabilidad de ocurrencia de un evento o
valor p.
Supongamos que en un estudio que compara una nueva droga se observa que la tasa
de mortalidad es del 5% y en el grupo tratado con droga estándar (grupo control) es del
8%. Si las dos muestras tienen la misma cantidad de pacientes con las mismas característi-
cas y fueron seleccionados al azar, ¿cuál es la probabilidad de haber obtenido 5% de mor-
talidad con la nueva droga sólo por azar, asumiendo que ambos valores no son diferentes
desde el punto de vista estadístico?
Las pruebas estadísticas asumen en principio que estos valores no son diferentes. Sólo
por azar en un grupo se obtuvo 5 y en el otro 8%: a esto se lo denomina hipótesis nula.
Cuando en términos estadísticos decimos que no hay diferencias estadísticamente signi-
ficativas, queremos decir que el haber obtenido un 5% de mortalidad fue una de las tantas va-
riaciones posibles de encontrar este resultado sólo por azar cuando la hipótesis nula es cierta.
¿Qué significa cuando la hipótesis nula es cierta? Quiere decir que asumimos como
verdadero que no hay diferencias entre estos dos porcentajes.
Cuando asumimos como hipótesis nula que 5% y 8% son iguales, estamos haciendo justa-
mente eso: “asumir como cierto que no hay diferencia”. Debido a que no conocemos el verda-
dero valor de mortalidad, algo hay que fijar como cierto: ambos porcentajes son iguales.
Es muy común que se malinterprete el valor de p cuando su resultado nos dice que dos
valores no son estadísticamente diferentes. En general se lo entiende como la probabilidad
de obtener un valor sólo por azar y que el efecto observado no es real: 5% de mortalidad no
es real, sólo fue por azar. Esto no es así. Sólo podemos decir que no hemos podido probar
esta vez que fuera un efecto real.
Es como el principio de inocencia: toda persona es inocente hasta que se demuestre lo
contrario. Pues bien, esto es lo que hacen las pruebas estadísticas: tratar de encontrar la
evidencia para demostrar culpabilidad.
La culpabilidad en términos estadísticos es lo opuesto a la hipótesis nula, o sea dos
valores son verdaderamente distintos: no fue el azar el responsable de esta diferencia. A
esta asunción se la denomina hipótesis alternativa.
Es como si lleváramos a cabo un juicio donde el abogado defensor dice: “mi cliente es
inocente” (las diferencias observadas son al azar, hipótesis nula) vs. el fiscal que dice “el
acusado es culpable” (las diferencias observadas no fueron al azar, algo las provocó, hipó-
tesis alternativa). Entonces el juez pide pruebas para demostrar la culpabilidad o, lo que es
lo mismo, para demostrar que la hipótesis alternativa es la correcta.
La forma de demostrar una u otra hipótesis es aportando evidencia o pruebas. La evi-
dencia de la que dispone la estadística es el cálculo de probabilidades.

‡
Ruth P. Henquin | Epidemiología y Estadística para principiantes

En Estadística, cuando el valor p es grande (alta probabilidad de que un evento ocurra


por azar) no decimos que no hay diferencias estadísticas; decimos que no tenemos eviden-
cia para demostrar lo contrario y, hasta que no la tengamos, debemos asumir que ambos
valores fueron obtenidos por azar. En términos jurídicos, no hemos podido probar culpabi-
lidad; por lo tanto, aunque la persona sea culpable, debemos asumir, hasta encontrar más
pruebas, que es inocente.
Si vamos a decidir que los eventos no son por azar en base a un valor de p debemos,
por convención, fijar un valor a partir del cual estemos todos de acuerdo en que tenemos
la evidencia suficiente para probarlo. Este valor es el que se reporta en los estudios como
p < 0,05, que significa que, cuando la probabilidad es de 5 en 100 (5%) o menor, asumi-
mos que es suficiente evidencia para rechazar la hipótesis nula, y aceptar que el evento no
ocurrió por azar.
De lo que se trata es de probar o no que la hipótesis nula es cierta.
Por lo tanto, cuando p es, por ejemplo, 0,005 decimos que la probabilidad de obtener 5%
de mortalidad (siendo la verdad que 5 y 8% son iguales) es de 5 en 1 000, muy poco proba-
ble, y la conclusión que sacamos es que la hipótesis nula no es cierta (los porcentajes no son
iguales) y, traducido a un estudio clínico, concluimos que un tratamiento fue mejor que otro.
Si el valor p fuera de 0,09 diríamos que la probabilidad de obtener 5% de mortalidad
bajo el supuesto de no diferencia es de 9 en 100, bastante probable. Entonces diríamos
que no podemos rechazar la hipótesis nula. No rechazar no es lo mismo que decir que la
hipótesis nula sea cierta, sino asumir que todavía no hay evidencia para aseverarlo y que,
por lo tanto, hay que aceptar que el supuesto desde donde partimos sigue siendo cierto.
Traducido al estudio clínico, concluiríamos que ambos tratamientos son iguales, porque,
si partimos del supuesto de no diferencia, no tenemos forma de probar lo contrario. Esta vez
no pudimos probar que una droga fue mejor que otra.

CONCEPTO DE INTERVALO DE CONFIANZA

El cálculo del intervalo de confianza es una forma alternativa de evaluar el rol del azar y es
más informativo que el solo cálculo del valor p, ya que aporta el grado de certidumbre con
el cual hemos estimado un valor.
Volviendo al ejemplo anterior, en el que la nueva droga tuvo una mortalidad de 5%
mientras que la droga estándar tuvo una mortalidad de 8%, lo que el intervalo de confianza
nos informa son los valores que probablemente obtendremos por variaciones al azar, si
realizamos el experimento varias veces.
En el caso de usar la nueva droga, por ejemplo, en 100 grupos de 1 000 pacientes,
cada uno con las mismas características, veremos que no siempre obtendremos los mismos
valores de mortalidad. Obtendremos un rango de valores, por ejemplo entre 2 y 7%.
La Estadística es capaz de estimar o inferir cuáles serían esos valores a partir de una
sola muestra. Si obtuvimos una mortalidad del 5%, el intervalo de confianza nos informa
entre qué valores pudo haber variado este 5% sólo por azar (en este caso entre un 2 a
7%). Este rango de 2 a 7% también nos habla del grado de certeza que tuvimos al estimar
el valor de mortalidad o cuán cerca estamos del supuesto verdadero valor. Si hubiéramos
obtenido un intervalo de confianza entre 2 y 28%, el verdadero valor estaría entre 2 y 28.
Una mortalidad de 28% es muy diferente a una del 2%, por lo que este intervalo nos dice
que la estimación que hicimos no es muy precisa.
Expresado de otra manera, el intervalo de confianza nos dice que de cada 100 veces
que realicemos un experimento, en 95 oportunidades obtendremos valores entre x y x, por

‡
&DStWXORPrincipios de la Estadística

ejemplo entre 2 y 7%, y que dentro de este rango está el supuesto verdadero valor que
queremos estimar.
A este rango de posibles valores es al que llamados intervalo de confianza del 95%. En
general se lo reporta como IC 95%.
Para el ejemplo anterior, si la mortalidad de la nueva droga fue de 5% en nuestro expe-
rimento y sabemos, por el cálculo del intervalo de confianza, que por azar es posible que en
el 95% de los casos obtengamos valores entre 2 y 7%, entonces el verdadero valor de la
mortalidad de este grupo estará entre 2 y 7%.
Entonces 8%, la mortalidad del grupo control, es un valor que no esperamos encontrar
por azar.
Si la hipótesis nula es cierta, no diferencia entre valores, ambos porcentajes deberían
estar dentro del IC 95%.
Si alguno de estos valores no está dentro del IC 95%, entonces queda dentro del 5%
de probabilidad que utilizamos para decir que un evento no fue al azar. Lo que es igual a
obtener un valor de p < 0,05.
Como sabemos que el verdadero valor de la mortalidad de la nueva droga está entre 2
y 7%, obviamente 8% no es un valor posible de hallar por azar.
Veamos otro ejemplo. Supongamos que la droga A disminuye la tensión arterial en 15
mmHg y la droga B en 5 mmHg. La diferencia entre ambas es de 10 mmHg, ahora sabemos
que estos valores pueden variar sólo por azar, por lo que esta diferencia podría incluir va-
lores calculando el IC 95% de entre 3 y 12 mmHg, con lo cual podemos concluir que, aun
interviniendo el azar en el 95% de los casos, la tensión arterial será diferente entre ambas
drogas, como mínimo 3 mmHg y como máximo 12 mmHg. Podemos estar seguros de que
en 95 veces de 100 no vamos a encontrar que ambas drogas reduzcan la tensión arterial
con la misma magnitud. Siempre la droga A reduce más la tensión arterial que la droga
B aunque a veces esta reducción podría ser mínima (3 mmHg) y otras veces máxima (12
mmHg). El verdadero valor de la reducción de la tensión arterial por la droga A está entre
3 y 12.
Si el IC 95% contiene al cero, por ejemplo IC 95% -4 a 20 mmHg, en algún experimento
que volvamos a realizar con estas dos drogas ambas reducirán la tensión arterial de igual
forma (la diferencia sería cero) o, lo que es lo mismo, de 100 veces que realicemos el ex-
perimento puede ocurrir que, en algunos casos, no haya diferencias en la reducción de la
tensión arterial entre ambas drogas. Entonces decimos que, por azar, la diferencia de la ten-
sión arterial puede variar entre tres posibilidades: que la droga B disminuya más la tensión
arterial que la droga A (-4 mmHg), que ambas drogas sean iguales (diferencia cero) o que
la droga A disminuya más la tensión arterial que la droga B (20 mmHg).
La conclusión obvia con este intervalo de confianza es que la droga A no siempre mues-
tra ser superior a la droga B, por lo que no hay evidencia para rechazar la hipótesis nula. En
este caso ambas drogas reducen de igual forma la tensión arterial y la diferencia observada
se debió sólo al azar. El verdadero valor de la reducción de la tensión arterial es algún valor
entre -4 y 20 mmHg
En resumen, la Estadística basa sus mediciones en la estimación, lo más cercana posi-
ble al verdadero valor, a partir de una muestra representativa de sujetos.
Estas estimaciones son sólo una aproximación al verdadero valor, debido a que por azar
los valores cambian de un experimento a otro.
El grado de certeza con respecto a cuán cerca o lejos estamos del verdadero valor
nos lo da el IC 95% y la evidencia para afirmar que los valores observados no se deben a
variaciones por azar cuando asumimos que son iguales, la obtenemos con el cálculo de p.

‡

También podría gustarte