Está en la página 1de 29

1

MEDICINA BASADA EN EVIDENCIA


PARA PRÓFUGOS DE LAS
MATEMÁTICAS

Presentación
El título de este manual es engañoso, porque en realidad sí se requiere para su
entendimiento de conocimientos matemáticos: saber sumar, restar, multiplicar y
dividir (además de saber picar algunos botones de la calculadora de mano). La
verdad es que el pensamiento crítico, el sentido común y las matemáticas que
requiere la medicina basada en evidencias (MBE) son sencillos y su complejidad
radica en el entendimiento de los procesos lógicos de algunos análisis. Por ejemplo,
la prueba de Chi cuadrado (o Ji al cuadrado para los puristas del lenguaje) puede
ser intimidante por su nombre, pero en realidad solo compara si las proporciones
vistas en los grupos son semejantes o diferentes; quizá la dificultad radica más en
entender los conceptos básicos de probabilidad y la filosofía que hay detrás de las
pruebas estadísticas.
Este manual no pretende ser un compendio o sustituto de los excelentes libros que
ya existen. Pretende ser un prontuario para auxiliar en el entendimiento de los
conceptos detrás de la MBE y las herramientas matemáticas que emplea.
Procuramos, sin embargo, cubrir todos los aspectos esenciales que debe dominar
quien se ostente como partidario de la MBE.

1
ÍNDICE
1. Conceptos de Medicina Basada en Evidencias
2. Introducción a la Bioestadística
3. Anatomía del Protocolo de Investigación
4. Diseño: Los Distintos Tipos de Estudio
5. Universo, Población y Muestra
6. Probabilidad: Conceptos Básicos y sus Reglas
7. Distribuciones de Probabilidad
8. Datos y Variables
9. Estadística Descriptiva
10. Estimaciones Puntuales y Límites de Confianza
11. Estadística Inferencial: Contraste de Hipótesis y Significancia
Estadística
12. Riesgos y Momios: Tamaño del efecto
13. Correlación y Regresión
14. Análisis Multivariado y Otras Técnicas Especiales (logística, múltiple)
15. Pruebas de Diagnóstico
16. Análisis de Bayes
17. Sobrevida
18. Mediciones de Significancia Clínica
19. Ética en Investigación
20. Redacción del Escrito Científico
21. Lectura Crítica
22. Presentaciones en Congresos

2
Capítulo 1. Conceptos de Medicina Basada en
Evidencias.
La medicina basada en evidencias (MBE) es la práctica de la medicina que usa la
mejor evidencia disponible como guía para tomar decisiones. Es importante aclarar
que la MBE no exige que todas las decisiones se tomen sobre la base de evidencias
puesto que, en ocasiones, las evidencias simplemente no existen y debemos actuar
con la lógica. Por ejemplo, si un matador de toros sufre un desgarro de la arteria
femoral con la consecuente hemorragia, la lógica nos dicta detenerla de inmediato
y difícilmente encontraremos un estudio aleatorizado al respecto. En otras
ocasiones, dependemos para empezar de que un concepto tenga al menos
plausibilidad biológica; beber orina para curar enfermedades, por ejemplo, carece
de todo sustento farmacológico y eso es suficiente para no intentarlo. Estos
principios no evitan que surjan argumentos en contra que sugieran que al no ser
dañino un procedimiento deba usarse por ese solo hecho; hay que recordar que la
ausencia de evidencia no es evidencia de ausencia.

El valor de la MBE se incrementa a la luz de las siguientes consideraciones:


1. El volumen de evidencia disponible para guiar las decisiones clínicas
continúa creciendo a un ritmo rápido. Se requieren habilidades para
discriminar de entre la vasta información la que nos resulte de utilidad.
2. Las mejoras en el diseño de la investigación, las mediciones clínicas y los
métodos para analizar los datos nos llevan a una mejor comprensión de cómo
producir evidencias de utilidad clínica.
3. También es verdad que no todo evidencia es válida solo porque está escrita
o es el producto de un estudio de investigación. A pesar de los avances en
los métodos de investigación, algunos de los resultados de estudios
publicados son falsos o extraen conclusiones engañosas.

3
4. Muchos clínicos, incluso aquellos con buena reputación, no practican la
medicina de acuerdo con la mejor evidencia disponible debido a errores
conceptuales que pretenden que la MBE se opone a los valores tradicionales
de la medicina como el humanismo, el valor de la experiencia, el principio de
beneficencia y el principio de autonomía de los pacientes. Nada es más falso
que eso: la MBE sostiene los valores tradicionales de la medicina y acepta el
valor de la experiencia de los profesionales.
Los elementos básicos del proceso de construcción y uso de la evidencia incluyen:
● Formular una pregunta clínica
● Encontrar o construir la mejor evidencia disponible
● Evaluar la calidad de la evidencia sobre la base de su plausibilidad biológica, el
tipo de estudios que la sustentan y el control de los posibles sesgos o prejuicios
● Aplicar la evidencia en la práctica, junto con la experiencia clínica y las
preferencias de los pacientes.

La atención clínica se tiene que brindar con humanismo y se centra en obtener un


diagnóstico y plantear un tratamiento sobre la base de los resultados de la
investigación. Los desenlaces clínicos como el control de los síntomas, la duración
de la enfermedad, evitar la pérdida de la función y la muerte son materia de interés
del paciente. No olvidemos que la medicina debe estar centrada en su bienestar y
no en los procesos o desenlaces económicos; por lo anterior, los desenlaces deben
tener en lo posible mediciones de beneficio clínico y no solo subalternos como los
valores de laboratorio.

Otros tipos de pruebas, como las obtenidas por la experiencia personal no


sistematizada y los estudios de laboratorio de la patogenia de la enfermedad,
pudieran abonar, pero generalmente son evidencias de bajo grado, en contraste con
las que se obtienen de estudios comparativos. Como dijimos, la MBE no se opone
a los valores tradicionales ni niega el valor de la experiencia, sino que está destinada
a complementar, no a reemplazar, el juicio clínico para una mejor atención de los
pacientes. Los profesionales con experiencia desarrollan un método heurístico que
toma atajos para una más rápida decisión; este método es el que sustenta los
algoritmos que frecuentemente se encuentran en las guías diagnósticas y
terapéuticas. Por otra parte, las habilidades psicomotoras requieren práctica
continua y se reconoce que, por ejemplo, un cirujano que ha efectuado un
procedimiento 100 veces lo hará mejor que quien lo ha hecho un par de ocasiones.
Desde luego, la experiencia tiene que sistematizarse pues no se puede llamar
“experiencia” a la repetición inadvertida de los mismos errores. De manera similar,
la MBE y la prestación de cuidados efectivos y sensibles a nivel cultural, social e
individual son complementarios, no contradictorios.

4
Entonces, la MBE integra la experiencia del profesional con la mejor evidencia
científica disponible y los valores tradicionales de la medicina. Es un movimiento
que tiene como objetivo aumentar el uso de investigación clínica de alta calidad en
la toma de decisiones clínicas. La MBE requiere nuevas habilidades del clínico,
incluida la búsqueda eficiente de la literatura y su lectura crítica para que pueda
usarla con eficiencia. La práctica de la MBE es un proceso de aprendizaje de por
vida, auto dirigido y basado en la solución de los problemas, en el que cuidar a los
pacientes crea la necesidad de información clínicamente importante para optimizar
el beneficio de las decisiones.
Podemos concluir que los buenos médicos utilizan tanto su experiencia clínica como
la mejor evidencia disponible. Sin experiencia clínica, la práctica corre el riesgo de
ser tiranizada por la evidencia externa, ya que incluso una excelente evidencia
externa puede ser inaplicable o riesgosa en manos inexpertas. Por otro lado, sin la
mejor evidencia externa actual, la práctica corre el riesgo de quedar obsoleta
rápidamente en detrimento de los pacientes.
En fin, aunque no tenemos evidencia absoluta de que la MBE sea siempre la mejor,
aceptamos que, al menos, es lo mejor que tenemos. Es por ello que han quedado
obsoletas designaciones como “medicina alopática”. La medicina debe ser solo una:
la que se sustenta en la mejor evidencia disponible. Lo demás, son diversas
“terapias” que puedan resultar en franco perjuicio, en mínimo beneficio, o en el mejor
de los casos, en efecto placebo.

5
Capítulo 2. Introducción a la Bioestadística.
La estadística es una rama de las matemáticas encargada, entre otras cosas, de
analizar datos, describirlos, agruparlos, contrastarlos con leyes de probabilidad,
hacer inferencias y bajo ciertas condiciones, hacer predicciones. Cuando los
fenómenos que se analizan son de naturaleza biológica, donde la incertidumbre es
la regla, entonces se le denomina bioestadística.

La bioestadística pareciera gozar de una fama contrastante: por un lado, hay


quienes la consideran una ciencia compleja e ininteligible y ven como semidioses a
quienes la ejecutan porque dominan un lenguaje complicado; por otra parte, hay
quienes consideran a esta disciplina un instrumento para tergiversar la verdad y
consideran a sus entendidos como manipuladores de la información para el
beneficio de unos cuantos. Esto proviene del desconocimiento de lo que en realidad
es la bioestadística.

Para que no te abrumes, es mejor que veas la bioestadística como una caja de
herramientas. Recuerda que las herramientas tienen la función de facilitar la
ejecución del trabajo, pero debes escoger la herramienta adecuada para poder
realizar la tarea que requieres; es decir, si necesitas quitar un tornillo de una tabla,
la herramienta que debes usar es un destornillador, no un serrucho. Así, conviene
tener claras las tareas que quieres realizar para que utilices la herramienta
adecuada. De manera burda, las tareas que puedes realizar con la bioestadística
son: analizar, describir y agrupar datos biológicos (edad, sexo, peso, talla,
frecuencia cardiaca, etc.); además, puedes comparar estos y otros datos entre dos
o más poblaciones, grupos de pacientes, etc. Se considera que con el manejo de
leyes de probabilidad y el análisis de los datos, puedes hacer predicciones basado
en patrones repetitivos de algunos fenómenos biológicos (por ejemplo, algunas
epidemias).

Por lo anterior, la bioestadística (en sí, la estadística) se divide en estadística


descriptiva e inferencial (la que compara). Se considera que los intentos predictivos
de la estadística forman parte de la estadística inferencial; sin embargo, algunos
autores contemplan la predicción como una clasificación independiente.

La estadística descriptiva, como su nombre lo dice, busca describir a una población


o grupo de sujetos. Mientras más atributos (variables) se hayan evaluado de esas
personas (también pueden ser animales, edificios, bacterias, etc.) se enriquece la
descripción. Según sea la naturaleza de los datos que se quieren describir, la

6
estadística puede contarlos y determinar su proporción en porcentajes o hacer unas
sencillas operaciones matemáticas y calcular la media y la desviación estándar,
entre otras mediciones. La media ya la sabes calcular (cuando sacas un promedio
de calificaciones, costos, etc.); la desviación estándar puede ser un concepto más
intimidante, pero solo señala la variación de los datos.

La estadística inferencial compara datos entre dos o más grupos o poblaciones. Su


función, de una manera muy resumida es proporcionarte un valor P (si, la famosa
P<0.05), para que tú puedas decidir si la diferencia que observas entre grupos es
significativa o es solamente producto de la casualidad (un chiripazo). Para hacerlo,
se debe tomar en cuenta si los datos se expresan como cualidades o números. En
caso de que sean cualidades (cualitativos) la estadística inferencial compara entre
dos o más grupos la proporción de sujetos o elementos que presentaron o no la
cualidad de interés y esto se realiza con una herramienta denominada tabla de
contingencia. Las pruebas estadísticas inferenciales para este tipo de datos son
variadas, pero las más famosas son la prueba de Chi cuadrado y la prueba de la
probabilidad exacta de Fisher.

Por otra parte, en el caso de que las variables se expresen como números, se dice
que pueden ser cuantificadas (cuantitativas); así, la comparación entre grupos se
basa en pruebas que comparen elementos como la media o la varianza. Las
pruebas estadísticas más empleadas para hacer inferencias al comparar variables
cuantitativas entre dos o más grupos son la prueba t de Student o el análisis de
varianza. Cabe señalar que estas pruebas se denominan paramétricas y para poder
realizarlas, los datos a comparar deben tener distribución de normalidad (es decir,
que se parezcan a la campana de Gauss). Si los datos no tienen distribución de
normalidad, se comparan las variables cuantitativas con pruebas denominadas no
paramétricas, tales como la prueba U de Mann-Whitney, la prueba de los rangos
con signo de Wilcoxon o la prueba de Kruskal-Wallis, entre otras. Los nombres de
las pruebas hacen homenaje a quienes las diseñaron, pero como suenan muy
complejos, hay quienes disfrutan con enunciarlas para buscar un efecto dramático
en presentaciones académicas.

La bioestadística también analiza el grado de relación que pueden tener algunas


variables entre sí. Por ejemplo, evalúa si el peso de una persona está relacionado
con la cantidad de kilocalorías que ingiere o el ejercicio que realiza; o evaluar si el
peso de un niño se relaciona con su edad (lo cual suena muy lógico). Esto lo analiza
mediante algunas pruebas llamadas de correlación y asociación. Así mide si la
relación es directa (el incremento de una variable se relaciona con el incremento de
la otra) o inversa (el incremento de una variable se relaciona con el decremento de

7
la otra). Además de la relación se obtiene una fórmula en la que sustituyes valores
conocidos y puedes “predecir” el valor de lo desconocido; por ejemplo, cuando
determinas el peso que debería tener un niño si conoces solo la edad mediante la
fórmula: peso = edad en años x 2 + 8. En capítulos específicos, se verán con detalle
estas pruebas.

Otra manera de predecir, que realiza la bioestadística, es la inclusión de análisis de


probabilidades basados en el Teorema de Bayes. Aunque suena muy técnico, en
realidad es un análisis muy intuitivo que permite, mediante el conocimiento de unos
factores, predecir la probabilidad de que ocurra un evento. En medicina esto es muy
útil para el diagnóstico. Si conoces los datos del paciente y los resultados de
pruebas de laboratorio y gabinete, la probabilidad de cierto diagnóstico puede
incrementar o disminuir rotundamente. Por ejemplo, un varón de 15 años que se
queja de dolor abdominal, que a la palpación es más intenso al dejar de oprimir el
abdomen y que se localiza en la fosa iliaca derecha te proporciona datos suficientes
como para considerar que padece apendicitis con alta probabilidad. Si a eso le
sumas que el laboratorio reporta leucocitos elevados en sangre, la probabilidad de
apendicitis sube aún más.

Además de lo mencionado, se han sumado a la bioestadística análisis centrados en


el paciente, tales como el análisis de riesgos relativos (RR), los números necesarios
a tratar (NNT), los años de vida ajustados por calidad (QALY), los años de vida
ajustados por discapacidad (DALY), la sobrevida y los análisis de riesgos
proporcionales (Kaplan-Meier y Pruebas de Cox). Estas pruebas permiten evaluar
la efectividad o eficiencia de un tratamiento con información que pueda ser más útil
para el paciente, pues se busca hacer partícipe al propio paciente del proceso
terapéutico para que tome las decisiones de manera informada sobre evidencia
sólida. A la luz de estos análisis, se ha llegado a la conclusión, por ejemplo, que no
conviene hacer escrutinio indiscriminado en los varones mayores de 40 años para
cáncer de próstata mediante la determinación del antígeno prostático específico
(APE), pues está relacionado con falsos positivos e intervenciones quirúrgicas
innecesarias que incrementan el riesgo de complicaciones como incontinencia
urinaria o disfunción eréctil, además de que su efecto preventivo sobre el cáncer es
relativamente marginal. (referencia US Preventive Services Task Force)

Finalmente, hay que señalar que la ciencia se está construyendo y perfeccionando


continuamente. Actualmente, se puso en la palestra de la opinión pública y de la
comunidad científica una serie de cuestionamientos respecto de la utilidad de lo que
se ha considerado la quintaescencia de la investigación científica de los siglos XIX,
XX y lo que va del XXI: ¡el valor P! Por una parte, hay quienes proponen que los

8
estudios debieran ser solamente publicados si los análisis señalan que el valor P es
menor a 0.005; esto ha merecido críticas, toda vez que para alcanzar esos niveles
los estudios tendrían tamaños de muestra descomunales. Por la otra parte, hay
quienes proponen abandonar de una vez por todas el valor P y buscar otras medidas
de análisis, tal y como el modelo Bayesiano, pues permite darle un sentido más
intuitivo a la información e integra en la práctica los resultados de una manera más
directa. El debate recién comienza, habrá que ver hacia donde evoluciona.

Quizá observamos los últimos momentos de una época en la ciencia, la era de la


significancia estadística. Ilustración de David Parkins, (Amrhein V, Greenland S,
McShane B. Scientists rise up against statistical significance. Nature. 2019
Mar;567(7748):305-307. doi: 10.1038/d41586-019-00857-9).

9
Capítulo 3. Anatomía del Protocolo de
Investigación.
Iniciar con la redacción de un protocolo de investigación es una actividad retadora,
pues se tiene que vencer el miedo a la página en blanco. Tener ideas de
investigación en la cabeza es sencillo, pero plasmarlas en escrito es ya una
actividad superior, que por desgracia practican pocos clínicos. Independientemente
de las técnicas de escritura que se abordarán más adelante, conviene tener clara la
estructura del documento y adelantar que el lenguaje debe ser simple y directo.

Redactar un protocolo puede parecer un trámite engorroso e innecesario y muchos


prefieren ir a la ejecución de un proyecto de investigación sin su guía, lo que
constituye un grave error que equivale a querer emprender un viaje sin planificar.
Por lo anterior, conviene ver a este documento como el plan de vuelo que te
permitirá llegar con seguridad a tu destino.

En esencia un protocolo de investigación es un documento que contiene al menos


las siguientes secciones:
1. Portada. En esta sección debes anotar el título del proyecto, los nombres de
los autores y colaboradores, así como las instituciones participantes.
2. Antecedentes. En este apartado debes redactar con el apropiado
fundamento bibliográfico disponible hasta la fecha y que esté relacionado con
la temática del proyecto. Se recomienda que escribas en un orden de lo
general a la particular.
3. Justificación. Esta sección debes escribirla con particular cuidado, toda vez
que su objetivo es “vender” la idea del proyecto para conseguir su
autorización o financiamiento. Debes dejar muy claro por qué hay que hacer
el estudio. Para escribirla, se nutre del análisis FINER, el cual se describe
más adelante.
4. Planteamiento del problema. A pesar de que no tiene una posición principal
dentro del protocolo, es el punto de partida para su ejecución pues contiene
la pregunta de investigación.
5. Hipótesis. En esta sección debes redactar las respuestas posibles
(hipotéticas) a la pregunta de investigación. Hay proyectos que no requieren
hipótesis, como los descriptivos. Para los diseños que requieren hipótesis,
debes escribir tanto la hipótesis nula como la alterna.
6. Objetivos. En esta sección escribe el objetivo general del proyecto y los
particulares. Debes tener precaución de no hacer un listado de actividades,
pues los objetivos deben ser acciones científicas que empiezan con verbos
en infinitivo; además, las sumas de los objetivos particulares deben permitir
conseguir el objetivo general.
7. Material y métodos. Esta sección debes estructurarla con varios rubros, a
saber: Diseño del estudio, sitio donde se realizará el estudio y su
temporalidad, universo al que se pretende inferir, descripción de población y
muestra poblacional. Debes agregar también los fundamentos del cálculo del

10
tamaño de muestra requerida. Redacta los criterios de elegibilidad (inclusión,
no inclusión, exclusión y eliminación). Anota, describe y define las variables
del estudio. Haz una descripción detallada de los procedimientos y métodos
que se emplearán. Describe cómo se realizará el análisis estadístico de la
información. Como habrás notado, esta sección la deberás escribir en futuro.
8. Aspectos éticos. Esta sección tiene particular relevancia, debes dejar claro
que el estudio se fundamenta sobre la legislación nacional e internacional en
materia de investigación. También señala cuál es el nivel de riesgo al que los
participantes estarán sometidos y en caso de ser necesario solicitarás la
firma del consentimiento informado.
9. Referencias bibliográficas. En esta parte escribe, en el orden de aparición en
el texto del protocolo, todas las referencias empleadas con un estilo
uniformado. Aunque hay varios formatos para escribirlas, para los protocolos
del área médica se recomienda el método Vancouver.
10. Cronograma de actividades. En un gráfico, que puede ser el diagrama de
Gantt simplificado, debes señalar todas las tareas y actividades con el
protocolo y el tiempo estimado de su ejecución. Es una guía que permite ver
tanto a los investigadores como a las autoridades regulatorias el avance del
proyecto.
11. Desglose de recursos humanos, materiales y financieros.
Independientemente de si vas a solicitar financiamiento o no, se recomienda
que tengas un listado y estimado de costos al respecto de insumos,
materiales, reactivos, prestadores de servicios, etc.
12. Anexos. En esta sección agregarás íntegramente documentos
complementarios para el protocolo, tales como escalas, formatos de captura
o registro de datos, insertos de reactivos, instructivos de equipo, etc.

Análisis FINER
Como se mencionó anteriormente en el punto 4 de la lista anterior, la
pregunta de investigación es parte fundamental de cualquier trabajo de
investigación. Para esto puedes utilizar los criterios FINER:
• Factibilidad: básicamente que cuentes con todos los recursos
necesarios de manera adecuada para llevar a cabo la investigación;
número de personas, experiencia técnica, recursos financieros,
materiales, etc.
• Interés: se refiere a que la investigación sea de interés para la
sociedad, institución patrocinadora o el investigador.
• Novedad: hace referencia a la originalidad del proyecto, que
proporcione nuevos conocimientos o aplique instrumentos y
estrategias innovadoras.
• Ética: respeta los principios éticos de investigación.
• Relevancia: ya sea para el conocimiento científico, líneas de
investigación a futuro o política educativa y de salud.

11
Capítulo 6. Probabilidad: Conceptos Básicos y sus
Reglas.
El estudio de la probabilidad es una rama de la matemática que se ocupa de calcular
la ocurrencia o presentación de un evento. Se expresa como un número que solo
puede ser entre 0 y 1. Un evento con una probabilidad de 1 puede considerarse una
certeza mientras que uno con la probabilidad de 0 puede considerarse una
imposibilidad. La probabilidad 1 significaría el 100%. Por cierto, las probabilidades
de 0 y 1 son muy poco comunes en bioestadística.

La fórmula de probabilidad la puedes expresar como:

A partir de ya conviene que entiendas la diferencia con “momio”. La fórmula de


momio la puedes expresar como:

También puedes decir que:

Para que entiendas la probabilidad debes saber que existen los eventos
mutuamente excluyentes y los no mutuamente excluyentes. Los primeros son
aquellos que al sumarse dan el total de 1, esto quiere decir que mientras uno sucede
el otro no puede suceder. Por ejemplo, si se realizara una encuesta de grupos
sanguíneo tendremos que el 60% son tipo 0, el 20% son tipo A, el 15% son tipo B,
y el 5% son tipo AB; al juntarlos, tendríamos la muestra total original (0.6 + 0.20 +
0.15 + 0.05 = 1) y son mutuamente excluyentes ya que no se puede ser de grupo
sanguíneo A y O al mismo tiempo. Con este principio, si se investigara en el mismo
grupo también el sexo de los participantes y se tiene que el 50% son hombres y
50% mujeres, estos serán datos no mutuamente excluyentes pues sin importar el
sexo, puede variar el tipo sanguíneo. Por lo tanto, los datos no mutuamente
excluyentes son aquellos que pueden ocurrir simultáneamente.
En los cálculos, debes asignar a la probabilidad con la letra “P” y generalmente se
agrega un subíndice para señalar de qué probabilidad se trata. Por ejemplo, si
quisieras determinar cuál es la probabilidad de que dos personas del grupo anterior,
escogidas al azar, tengan el grupo sanguíneo “A”, podríamos escribirlo como P AA.

Dentro de los conceptos generales de la probabilidad te vas a encontrar con las


reglas bajo las que se rige:

12
Regla de la Multiplicación

La regla de la multiplicación se aplica para eventos independientes entre sí, pero se


espera que ocurran al mismo tiempo o de manera concatenada o “conjunta”. Estos
eventos independientes no están condicionados entre sí y la ocurrencia de uno no
depende de la ocurrencia del otro. Es decir, si sigues el ejemplo de arriba, para
calcular la probabilidad de que dos personas escogidas al azar tengan el grupo
sanguíneo A, aplicarás la fórmula de multiplicación.

Del mismo modo, podrías obtener la probabilidad de que la primera persona


escogida al azar fuera mujer y además tuviera el grupo sanguíneo 0. En tal caso:

Regla de la Suma
Esta regla expresa la suma de eventos que son mutuamente excluyentes. Por
ejemplo, del grupo anterior, si quieres saber cuál es la probabilidad de que una
persona elegida al azar tenga el grupo sanguíneo B o AB, aplicas la regla de la
suma:

Regla Modificada de la Suma (o Regla de la Suma/Multiplicación)

Esta regla se aplica para encontrar la probabilidad de eventos que no son


mutuamente excluyentes y que puedan ocurrir ya sea uno o el otro. Por ejemplo, si
para el grupo anterior quisieras saber cuál es la probabilidad de que una persona
escogida al azar sea varón o que tenga el grupo sanguíneo 0, aplicas la regla
modificada de la suma del siguiente modo:

13
Existe también una probabilidad “condicionada” para situaciones en las que la
ocurrencia de una depende de la ocurrencia previa de la otra. Por ejemplo, la
probabilidad de que llueva hoy se incrementa si amaneció nublado. Esta
probabilidad “bayesiana” es objeto de un capítulo aparte, dada su aplicación en el
método clínico.

En resumen, si quieres conocer la probabilidad conjunta de dos o más eventos usa


la conjunción “y” para aplicar la regla de la multiplicación, sin importar si los eventos
son mutuamente excluyentes o no lo son; simplemente multiplica unas
probabilidades por otras. Por otra parte, si quieres conocer la probabilidad de que
ocurran unos eventos u otros, usa la disyunción “o”. Si los eventos son mutuamente
excluyentes, utiliza la regla de la suma, mientras que, si los eventos no son
mutuamente excluyentes, utiliza la regla modificada de la suma.

Probabilidades Vs. Momios


Como mencionamos, mientras que la probabilidad es el índice de lo que ocurre entre
lo que puede ocurrir, el momio es el índice de lo que ocurre sobre lo que no ocurre.
Son fácilmente convertibles entre ellos, del modo siguiente:

Estas relaciones se utilizan mucho en cálculos del análisis bayesiano, como


veremos después.

14
Capítulo 7. Distribuciones de probabilidad.
Distribución normal
Se llama distribución normal aquella manera en que se presentan las frecuencias
de los datos de una variable; además, al graficarse forma una campana simétrica
que se conoce como la campana de Gauss. En condiciones ideales, el eje de
simetría coincide con el valor del promedio, la mediana y la moda de la variable
estudiada. Las desviaciones estándar (DE) a la derecha e izquierda del eje de
simetría delimitan un porcentaje del área bajo la curva, es decir, señalan cuánta
población está incluida bajo ciertos criterios de variabilidad. Así, el rango delimitado
entre -1 DE y +1 DE señala aproximadamente el 68% de las observaciones,
mientras que el rango de -/+2 DE incluye al 95% y el rango de -/+ 3 DE incluye al
99.7% de la muestra cómo puede observarse en la figura.
La desviación estándar es un modelo importante pues de él parten los principios
que permiten sacar conclusiones en las pruebas de estadística inferencial que verás
más delante.

Fig.7-1. Muestra una gráfica de distribución normal, con los rangos de desviaciones
en las que caen las observaciones.
Las características de la distribución normal ideal son las siguientes: ·
1. Es simétrica
2. Es asintótica (los extremos de la campana se aproximan cada vez más al eje
horizontal pero nunca lo tocan, porque siempre hay individuos en los
extremos)
3. La media, la mediana y la moda se encontrarán en el eje de simetría de la
campana, es decir tienden a ser iguales.
4. El área bajo la curva indica el 100% de los valores de una muestra, pero
como lo mencionamos anteriormente, el porcentaje del área bajo la curva
depende de los límites establecidos dentro de las desviaciones estándar.
Errores Tipo 1 y 2 (Alfa y Beta)

15
Prueba de Hipótesis
En investigación, es común que partas de una hipótesis que quieras probar para
que al final, la aceptes como verdadera o la rechaces como falsa. Este es un
proceso que suena sencillo pero que requiere de gran formalidad, pues te obliga al
uso de herramientas que se conocen como estadística inferencial. La hipótesis a
probar generalmente se expresa en términos de nulidad; por ejemplo, si quieres
saber si un nuevo medicamento es mejor que un placebo, la expresas como: “El
nuevo medicamento X es semejante al placebo”. Si al enfrentar los resultados del
estudio observas que el nuevo medicamento fue significativamente mejor que el
placebo, rechazas la hipótesis de nulidad y aceptas la alternativa: “El nuevo
medicamento X es mejor que un placebo”. Si tu conclusión corresponde a la
realidad, habrás acertado. Si, por el contrario, tu conclusión es errónea, habrás
cometido un error. Los errores en la inferencia son de dos tipos: tipo I o II qué difícil,
¿verdad?
Errores
Como ya viste, existen dos tipos de errores que pueden ocurrir en el procedimiento
de prueba de hipótesis. Rechazar la hipótesis nula cuando ésta es verdadera se le
conoce como error de tipo I (falso positivo). Esto ocurre cuando un investigador
concluye que un medicamento es mejor que un placebo, pero en realidad no es así.
La causa del error tipo I suele ser un diseño de estudio inapropiado. Por el otro lado,
sostener la hipótesis nula cuando ésta es falsa recibe el nombre de error de tipo II
(falso negativo). Esto ocurre cuando el investigador concluye que el medicamento
es igual que el placebo, pero en realidad era mejor. La causa del error tipo II suele
ser un número suficiente de sujetos en la muestra de estudio; por ello, es importante
el cálculo de un tamaño mínimo de muestra cuando se plantea un protocolo.
A pesar de que el concepto es sencillo, puede tener sus dificultades para entenderlo,
por ello acompáñame a ver esta triste historia, donde con unos ejemplos sencillos
pretenderemos explicártelo: si concluyes que tu pareja te engaña, pero en realidad
te es fiel, estás cometiendo un error de tipo I (en este caso, celos, muy mal por ti).
Por otra parte, si concluyes que tu pareja te es fiel, pero en realidad ya tiene
intereses en otra persona; déjame decirte mi amiga/o, que estás en un error de tipo
II (cuernos), amiga/o date cuenta...

16
Figura 7-2. Errores tipo I y II.

17
El proceso de inferencia
La probabilidad de que el resultado sea a consecuencia del azar (un chiripazo), pone
en duda la hipótesis nula. Para fines de investigación se usa un nivel de probabilidad
P de 0.05 (5 %) o menor, para rechazar la hipótesis de nulidad y aceptar la alterna.
Dicho de otra forma, si repitiéramos el experimento muchas veces, por cada 100
repeticiones observaríamos que en menos de 5 de ellos se sostendría la hipótesis
nula. Por ejemplo, si al probar un nuevo medicamento el análisis estadístico
concluye que es mejor que un placebo y la probabilidad del azar es de 0.03 (3%),
rechazamos formalmente la hipótesis de nulidad e inferimos que el nuevo
medicamento es mejor que el placebo. Por el contrario, si la probabilidad del azar
fue de 0.06 (6%) concluimos que, aunque el nuevo medicamento parece mejor, el
análisis estadístico encontró que la diferencia no fue significativa y mantenemos la
hipótesis de nulidad.

Figura 7-3. La gráfica muestra la representación clásica del error tipo I y II. En
donde se toma como ejemplo un test de significancia estadística, donde la
hipótesis nula (H0) es un punto de partida donde la media y mediana de una
población son iguales. Mientras que en la hipótesis alterna (H1) la media y
mediana de una población es diferente. Tomando como riesgo de rechazo de
hipótesis valores de .05 a .01. Esto quiere decir que cuanto mayor sea el riesgo de
cometer un error tipo II, menor será el riesgo de cometer un error tipo I (tienen una
relación inversamente proporcional).

18
Capítulo 8. Datos y Variables.
La información que obtienes en la investigación médica debes procesarla para
realizar un análisis matemático y así identificar patrones, hacer comparaciones e
incluso poder hacer algunas predicciones. Toda esta información se denomina
“datos” y su análisis es una actividad fundamental en la bioestadística y la medicina
basada en evidencias. Los datos que obtienes de revisar pacientes, expedientes,
etc. pueden ser números (numéricos) o cualidades (cualitativos). Los datos pueden
provenir de una característica que siempre tiene el mismo valor (constante) o de
una característica que cambia (variable); por ejemplo, en un estudio sobre cáncer
de próstata, el sexo es un dato constante; por otro lado, en un estudio sobre un
medicamento para la diabetes, el sexo es un dato variable. En un estudio de
investigación es muy importante que determines las variables que vas a analizar,
pues entre la variación de los datos debes buscar identificar patrones o tendencias
que sean útiles para el conocimiento.
Para concluir y sintetizar lo anterior, hay que recalcar que un dato es la
representación numérica o alfanumérica de una variable. Una variable es una
característica cuyo valor puede cambiar y es susceptible de ser medido o calificado.
Para quienes realizan investigación es un dolor de cabeza identificar y clasificar las
variables de un estudio. Para facilitar su comprensión hay que tener clara la
naturaleza de las variables.
Se denomina variable numérica a aquella que puede medirse y de la medición se
obtiene un número. De igual manera, si la variable numérica puede ser cuantificada
(determinar su cantidad en cada sujeto, paciente, etc.) la variable se denomina
cuantitativa (porque mide su cantidad).
Se conocen como variables no numéricas las que no se pueden representar con un
número sino por nombres o categorías.

19
A continuación, te describimos la naturaleza de las variables:
• Según su operatividad
o Cualitativas. Existencia o ausencia de una característica concreta.
(sexo, nacionalidad).
▪ Cualitativas dicotómicas. Solo existen o se contemplan 2
opciones posibles. (Vivo o muerto, mujer u hombre).
▪ Cualitativas politómicas. Múltiples valores, pero solo se permite
la identificación de uno y éste excluye al resto. (Color, tipo de
sangre)
o Cuasi-cuantitativas. Expresan una cualidad que se puede organizar y
establecer un orden o jerarquía, pero no existe una constancia entre
una categoría y la que le precede o la que le sigue (Último grado de
estudios).
o Cuantitativas. Permiten la operativización de sus valores.
▪ Continuas. Decimales. (Temperatura).
▪ Discretas. Enteros. (Número de hijos).
• Ambas pueden ser
o De intervalo. (Cero relativo: Escalas Celsius y
Fahrenheit)
o De razón. (Cero absoluto: Escala Kelvin)
• Según su relación con otras variables
o Independientes. De ella se parte para observar los efectos que
determina cualidad, característica o situación que puede tener sobre
diferentes elementos.
o Dependientes. Escogida y generada a partir de la independiente.
o Moderadoras. Alteran la relación existente entre las anteriores.
o Extrañas. No se han tenido en cuenta, pero tienen efecto sobre los
resultados obtenidos en la investigación. Pueden llevarnos a
conclusiones erróneas.
• Según escala. Nota que cada una tiene las características de la anterior.
o Nominal. Los valores que puede alcanzar permiten distinguir la
existencia de una cualidad concreta, sin permitir ordenar o realizar
operaciones matemáticas con estos valores.
o Ordinal. Permiten ordenar los valores, pero no establecer relaciones
matemáticas.
o De intervalo. Permiten establecer relaciones numéricas. No hay un
cero absoluto definido. Rangos más que valores concretos.
o De razón. Es posible su total operativización, diversas
transformaciones a los resultados y estableciendo relaciones
numéricas complejas entre sí. Existe un cero absoluto.

20
Capítulo 9. Estadística descriptiva.
La estadística descriptiva es el conjunto de técnicas y procedimientos que te ayudan
a describir y sintetizar la información de un conjunto de datos. El objetivo es que
describas las características y el comportamiento de los datos mediante el uso de
números, gráficas y tablas. Los datos que vas a analizar provienen de variables que
pueden ser tanto cualitativas como cuantitativas, tal y como se describe en el
capítulo 8. Brevemente, para describir datos de variables cualitativas entre las
herramientas con las que cuentas está el reporte de proporciones, porcentajes o
tasas; de igual manera puedes emplear gráficos que muestren distribución o
tendencias en estos datos. Por otra parte, para las variables cuantitativas, toda vez
que son números, empleas las medidas de tendencia central y de dispersión para
señalar en una serie de datos ordenados de menor a mayor, cuáles son los valores
del “centro” y cuánto “varían” entre sí. Las medidas de tendencia central son la
media, mediana y moda. Las de dispersión son rango, varianza y desviación
estándar.

Medidas de tendencia central


Media. La media aritmética, o también llamada promedio, es la suma de todos los
valores del conjunto divididos entre el número de valores. En la notación estadística
el promedio se representa de dos maneras: una también llamada X barra (imagen)
que representa el promedio de una muestra o la letra griega mi minúscula (μ) que
representa el promedio de una población o universo, de igual manera la sumatoria
se representa con la letra griega sigma en mayúscula (Σ), donde x representa a
cada uno de los valores y n representa al número de mediciones realizadas. Por lo
anterior, la fórmula para calcular el promedio, expresada en notación estadística es
la siguiente:

Mediana. Es la puntuación ubicada en la parte central, cuando se han organizado


los datos en orden ascendente. Cuando la mediana queda entre dos números en la
parte central, se toma el promedio de ellos. El símbolo en estadística para este valor
de tendencia central es Me.

Moda. Es el valor que más se repite dentro de una serie de datos numéricos. Puede
haber más de una moda, pero no debes promediarla como se hace con la mediana.
El símbolo de este valor es Mo.

21
Medidas de dispersión

Estas medidas muestran la variabilidad de los valores determinados dentro de un


conjunto de datos e indican cuánto se alejan estos valores de su centro de
distribución. Estas medidas son, entre otras: rango, varianza y desviación estándar.

Rango. Es la diferencia entre el valor máximo y el valor mínimo del conjunto de


datos; su resultado es un valor absoluto.

Varianza. Mide la dispersión de los datos del conjunto con respecto a la media y se
expresa en unidades cuadradas. Se calcula al realizar las desviaciones medias de
cada uno de los datos, elevarlas al cuadrado para evitar su cancelación aritmética
y finalmente se divide entre el número de observaciones realizadas. Si la varianza
se determina a partir de una muestra de la población, la división se realiza entre el
número de observaciones realizadas menos uno (n-1). Su símbolo es 𝛔2 y S2 y la
fórmula es la siguiente:

Desviación Estándar. Mide el promedio de las desviaciones respecto a la media


de los datos y se expresa en unidades simples (no cuadradas). Una manera sencilla
de explicarla es que la desviación estándar es el resultado de sacar raíz cuadrada
a la varianza.

22
Diseño de gráficos <3
Un gráfico es la representación visual de un conjunto de información organizada
bajo ciertos criterios. Su función es expresar la información de manera sencilla, para
que a golpe de vista un lector pueda identificar grupos, tendencias, tamaños, etc. A
continuación, te mostramos algunas de las gráficas más comunes.

Gráfico de barras. Es una herramienta utilizada con frecuencia, sirve para


representar distintas categorías de una variable cualitativa y la frecuencia absoluta
o relativa con que ésta se presentó en la población estudiada. En el eje horizontal
se anotan las distintas categorías de la variable y en el vertical, las frecuencias.

Histograma. Es uno de los llamados “gráficos de barras”; es la representación más


común de la estadística, la cual se usa para mostrar la distribución de frecuencias
de los valores representados. Se usa para representar una variable cuantitativa
continua dividida en intervalos de frecuencia. En el eje horizontal se posicionan las
clases de la variable continua (los intervalos o las marcas de clase que son los
puntos medios de cada intervalo) y el eje vertical se sitúan las frecuencias.

Para la elaboración del histograma se deben de seguir los siguientes pasos:


1. En el eje horizontal se colocan los intervalos, de menor a mayor.
2. En el eje vertical se representan las frecuencias absolutas o relativas. Se
dibujan barras rectangulares de anchura igual y proporcional al intervalo.
3. Las barras rectangulares se dibujan una junto a la otra sin empalmarse
4. Se comparan los valores por la altura de la barra de cada grupo.
5. En algunas situaciones se traza una línea entre los extremos superiores de
las barras para formar curvas que pueden suavizarse para facilitar su
interpretación visual (Figura 9-2).

Figura 9-1. Se representa un Histograma, en donde el rango de la edad muestra la


anchura de los grupos, mientras que se compara con la frecuencia del número de
personas dentro de cada grupo.

23
Figura 9-2. Histograma suavizado.

24
Gráfica de Pastel. Es un “gráfico de sectores” que representa de forma circular las
frecuencias relativas de una variable cualitativa. Sirve para representar porcentajes
y proporciones. Es muy empleado y conviene evitar su abuso, por ejemplo, cuando
se utiliza para representar variables dicotómicas (únicamente dos categorías). Para
realizarlo se deben de seguir los siguientes pasos:
1. Se deben de reunir todos los valores numéricos de mayor a menor
2. Se suman todos los valores numéricos
3. Se realiza una división individual de cada valor entre el valor total de la suma,
de tal manera que dé un valor decimal el cual será representado por un
porcentaje.
4. El valor decimal dado de la división de cada valor individualmente se
multiplicará por 360, debido a que es el número de grados dentro de un
círculo. El resultado de estas multiplicaciones indica un número de grados
que ocupará ese grupo.
5. Finalmente se grafica con apoyo de un compás y transportador los grupos
con su valor correspondiente en grados dentro de la gráfica circular.

Figura 9-2. Gráfica de pastel en la cual se observan los porcentajes de las distintas
categorías de una variable. El tamaño del porcentaje abarca cierta cantidad de
grados de un círculo. Así, el tamaño de la porción o “rebanada” del pastel refleja el
porcentaje que ocupa la categoría.

25
Diagrama de caja y bigote. Son gráficos que describen varias características al
mismo tiempo. Se trazan sobre la base de la dispersión y simetría de los datos. Es
una caja en forma de rectángulo, donde los lados más largos muestran el recorrido
intercuartílico. La primer división muestra la mediana y por lo tanto su relación con
los cuartiles primero y tercero, recordando que el segundo siempre representa la
mediana. La caja se ubica dentro de una recta que tiene como extremos los valores
de las percentilas 25 y 75 (primer y tercer cuartil). A las líneas que sobresalen les
llamamos “bigotes” y sus extremos señalan los valores mínimo y máximo de la
variable.

Los pasos para hacer un gráfico de caja y bigotes son los siguientes:
1. Se ordenan todos los valores de mayor a menor.
2. Se calcula el primer cuartil, el valor que representa el 25% de los valores
ordenados. Así, en una muestra de 20 valores ordenados, se divide 20/4 para
obtener el lugar donde se localiza el primer cuarto, el cual en este ejemplo
sería la posición número 5.
3. El segundo cuartil indica la mediana de la distribución (50%). Por lo anterior,
dividiremos entre 2 el número de valores; en nuestro ejemplo, dicho valor
sería el que ocupe la posición 10.
4. El tercer cuartil indica el valor que está en el 75% de los datos ordenados.
En nuestro ejemplo, sería el valor que ocupa la posición 15.
5. Finalmente, los bigotes se trazan desde los extremos de las cajas hasta
donde se delimiten los valores mínimo y máximo.

Fig. 9-3.- Representa la gráfica de caja y bigote de 20 valores y su distribución en


cuartiles.

26
Diagrama de dispersión

El diagrama de dispersión tiene como finalidad estudiar las relaciones entre dos
conjuntos de datos. Cada par formado por esta relación forma un punto. En un
conjunto de varias observaciones los datos se representan como una nube de
puntos. Una relación positiva entre las variables representadas en el eje horizontal
y el vertical se determina al encontrar una nube de puntos creciente. Una relación
negativa significa que la nube decrece. En caso de que ambas variables sean
independientes entre sí, se afirmará que no existe correlación. La fuerza de cada
relación se puede medir según sea la distribución y puede ser fuerte o débil. En la
gráfica, una relación fuerte sería una nube de datos con proximidad pequeña entre
sí, mientras que en la débil los puntos se verán más dispersos. Esto puede ser
analizado de una manera más precisa mediante el coeficiente de correlación y el de
determinación, como se verá en el capítulo correspondiente. Los pasos a seguir
para realizarlo son los siguientes:

1. Recabar los datos relacionados entre sí (x, y) a partir de dos conjuntos de


datos asociados.
2. Encontrar los valores mínimo y máximo, tanto para “x” como para “y” y utilizar
estos valores para elaborar la escala de los ejes horizontal y vertical. Ambos
deben tener aproximadamente la misma longitud.
3. Graficar los datos pareados (x, y). Cuando haya dos pares de datos que
tengan los mismos valores, dibujar círculos.
4. Examinar la forma de la nube de puntos para descubrir los tipos y las fuerzas
de las relaciones.

27
Figura 9-4.- Diagrama de dispersión

En este capítulo se señalan las instrucciones o pasos a seguir para realizar los
gráficos de manera manual; pero si se quiere dejar de sufrir, existen programas de
cómputo que realizan este trabajo de manera sencilla y rápida.

28

También podría gustarte