Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Autores:
– Juan José Granizo Martínez
El análisis estadístico es uno de los aspectos que más interés suscita por parte de los
investigadores, pero de hecho, el análisis es el problema menos importante.
Por otra parte, un error de diseño no tiene reparación posible, mientras que un
error de estadística no suele ocasionar más que molestias reparables.
Por último, de ser adecuado el diseño, hasta es posible que la estadística sea innecesaria, ya que los
resultados serán evidentes sin necesidad de recurrir a un solo cálculo.
1. Estimación realista del tamaño muestral, de manera que se evite embarcarse en un estudio carente de
potencia que no llegará a ningún sitio y asesorar sobre el rendimiento estadístico de las variables atendiendo
a su naturaleza, (mejor cuantitativas, peor cualitativas).
1/10
31/1/22 12:48 Módulo 4: Análisis dentro del diseño del estudio y control de calidad de los datos – VERSIÓN IMPRIMIR – Biblioteca Virtual
4. Uso de la estadística descriptiva con el fin de caracterizar la muestra ofreciendo datos de centralización y
dispersión en las variables cuantitativas adecuados a la naturaleza de las variables: si son normales
emplearemos media y desviación típica y si no son normales la mediana y los recorridos intercuartílicos. Para
las variables cualitativas se emplearán porcentajes.
Los puntos 1 a 3 son propios del diseño previo al estudio y los 4 y 5 son posteriores a la
ejecución del estudio.
Si el estudio no tiene fines analíticos, el trabajo de la estadística acaba en el 4º de estos puntos, que se ha
tocado a lo largo de este curso en algunos temas. En definitiva supone el uso de los estadísticos más útiles
según la naturaleza de los datos y emplear las medidas de precisión correctas.
El primer paso del análisis consiste siempre en comparar los grupos entre sí.
En un diseño habitual con dos grupos (casos /controles, expuestos / no expuestos, tratamiento /
placebo) el problema se reduce a emplear la técnica estadística adecuada:
2/10
31/1/22 12:48 Módulo 4: Análisis dentro del diseño del estudio y control de calidad de los datos – VERSIÓN IMPRIMIR – Biblioteca Virtual
En un segundo paso se debe pasar al análisis multivariado, que supone crear un modelo matemático que
explica la realidad observada. Esta es una opción ambiciosa que suele exceder la capacidad del propio
trabajo en muchos casos. Los modelos se construyen con múltiples variables independientes o
predictoras que explican la variabilidad de una variable dependiente que suele ser de naturaleza
dicotómica (en ese caso hablamos de modelos logísticos) o cuantitativas (modelos lineales).
Predictivos
Buscan definir el efecto de una o unas pocas variables independientes sobre la variable dependiente,
explorando las relaciones entre ellas. Tienen más interés médico pues simplifican el problema a unas pocas
variables con sentido clínico. Por ejemplo, que efecto tiene tomar vitamina C para reducir la incidencia de
gripe.
Explicativos
Buscan definir el conjunto de un amplio conjunto de variables independientes para explicar la mayor
variabilidad de la variable dependiente aunque su interés como ciencia es mayor a veces médicamente no
son prácticos.
3/10
31/1/22 12:48 Módulo 4: Análisis dentro del diseño del estudio y control de calidad de los datos – VERSIÓN IMPRIMIR – Biblioteca Virtual
Los criterios de selección de las variables que se introducirán en el modelo son de dos tipos: en
función del valor de la p detectada en el análisis bivariado (siempre los más bajos con prioridad) o
por un criterio pragmático (basado en la experiencia previa o los intereses del investigador).
No incluir variables independientes que estén asociadas (colinealidad) entre sí, como por ejemplo si
cargamos como variables la estancia en UCI o el uso de respirador (ambas se asocian). En ese caso se
debe priorizar o las que definen una situación del paciente o bien una decisión médica.
Cuántos sujetos han cumplido los criterios de inclusión y de exclusión y cuantos se han incluido en el
estudio.
Cuántos de los sujetos incluidos en el estudio se han perdido a lo largo del mismo, es decir, no se
incluyen en el análisis final. Este aspecto puede explicar buena parte de los sesgos y cada vez es más
pedido por los revisores de revistas aunque no se vea publicado.
Comparar si estas pérdidas son similares en los grupos comparados en el estudio si hay varios grupos.
Describir los valores de las variables en el momento de la inclusión o en el momento inicial del estudio
(por ejemplo, antes del inicio de una terapia).
Comparar esas mismas variables entre los grupos incluidos en el estudio, si ha lugar.
Describir la situación a lo largo del estudio, lo que puede suponer ofrecer tablas de valores en
momentos seleccionados por su interés. Siguiendo con el ejemplo de una terapia para adelgazar, ver los
pesos a las 4, 8 y 12 semanas por ejemplo.
De nuevo, comparar esas mismas variables entre los grupos incluidos en el estudio, si ha lugar.
4/10
31/1/22 12:48 Módulo 4: Análisis dentro del diseño del estudio y control de calidad de los datos – VERSIÓN IMPRIMIR – Biblioteca Virtual
Describir la situación al final del estudio y otra vez comparar esas mismas variables entre los grupos
incluidos en el estudio, si ha lugar.
Dar análisis marginales con grupos seleccionados (¿Qué ocurre con nuestros diabéticos?)
➤ Es obvio que la primera cosa que debemos hacer es redactar un protocolo o proyecto completo, que
incluya los procedimientos normalizados de trabajo del equipo investigador. Si el estudio es complejo, la
sección de material y métodos del protocolo debe ser ampliado de manera exhaustiva como un manual de
procedimientos.
2.1 El CRD
Este documento necesita de particular cuidado en su redacción ya que será la pieza angular del
trabajo de investigación. Debe diseñarse con la persona que hará la entrada de datos en la base
de datos de análisis ya que esto facilitará enormemente el trabajo de los encargados de ese
trabajo.
El CRD debe ser claro, sencillo, fácil de rellenar y se debe hacer un ejemplar por paciente. Los datos
deben ordenarse en la secuencia de recogida de los mismos (sobre todo si hay un orden cronológico):
criterios de inclusión, variables predictoras y por último las variables de respuesta.
5/10
31/1/22 12:48 Módulo 4: Análisis dentro del diseño del estudio y control de calidad de los datos – VERSIÓN IMPRIMIR – Biblioteca Virtual
El CRD debe llevar (preferiblemente) escrita la codificación de las variables para evitar errores. La
identificación de los pacientes debe hacerse solo con un número (que identifique centro y paciente) y nunca
con el número de historia, siglas o nombres. Esos datos deben estar en otra fuente de registro separada
del CRD con el fin de hacer anónima la información por completo. Pero al mismo tiempo, el número de
identificación debe hacer recuperable la información para corregir posibles errores.
⮎ Las variables de texto que se puedan recoger, cosa que no es recomendable, deben dejarse de
la manera más literal posible.
⮎ Debe emplearse mayúsculas, pero la información que se recoja en texto libre no debe ser
relevante, ya que se presta a errores de interpretación.
⮎ Las variables dicotómicas tipos si / no se codificarán con números, siempre de la misma
manera en el mismo cuaderno (por ejemplo: 1 = si, 0 =no).
⮎ Las fechas deben emplear siempre un mismo formato (el español: día-mes-año: 25-12-1966,
por ejemplo).
⮎ Siempre hay que pensar qué hacer con la información no disponible, dejando un campo “no
consta” o fijando un comentario al respecto.
En primer lugar: la calidad final de los datos depende y mucho de la calidad de las personas que
“piquen” los datos. Por eso es fundamental que exista doble entrada y que se haga una muestra
aleatoria de pacientes para comprobar la calidad de los mismos. En personas no profesionales se
puede esperar entre un 3- 5% de errores en los datos, lo que es un cantidad relativamente elevada.
6/10
31/1/22 12:48 Módulo 4: Análisis dentro del diseño del estudio y control de calidad de los datos – VERSIÓN IMPRIMIR – Biblioteca Virtual
Segundo: mucha información del CRD debe ser resituada en la base de datos, modificada o
transformada, ya sea porque estaba previsto que se empleara como fuente de información para otros
fines o porque su rendimiento no ha sido el esperado.
Por ejemplo:
Imaginemos que recogemos el consumo de Antibiótico en la estancia de un paciente y codificamos
varios códigos para diversas familias, pero al acabar la recogida de datos, vemos que algunas
familias tienen efectivos mínimos. En ese caso, se conserva la categoría original y se crea otra nueva
que agrupe a esos AB en “otros” o las redistribuya con otras similares, por ejemplo asociando
Lincosamidas con Macrólidos.
En estudios multicéntricos es mejor que la entrada de datos la haga una o unas pocas personas, aunque
esto siempre es cierto, en este tipo de estudios es fundamental ya que la experiencia demuestra que
siempre se producen contingencias imprevistas que es necesario resolver, para lo que es mejor una única
persona.
Cualquier duda debe ser remitida a los investigadores en forma de pregunta oficial, que requiere respuesta
igualmente oficial. Habitualmente se lleva en un cuaderno las incidencias y dudas, así como sus respuestas
con sus fechas. Se suelen hacer estas correcciones en el CRD en color rojo, dejando firma y fecha de los
cambios.
➤ Las personas que hacen la entrada de datos, si poseen conocimiento adecuado del estudio
pueden actuar como control de calidad de los datos. En muchas ocasiones se revisan datos que
presentan claros indicios de error (una mujer con una hemoglobina alta, fechas incoherentes…etc.).
Casi todos los errores graves se pueden detectar con un examen cuidadoso de la información del
paciente respondiendo a la pregunta ¿es coherente y lógica la información?.
Esto no quita para que se monitorice la información de los CRD antes, preferiblemente de llegar a ser
tecleada.
Para ello se comprueba en los CRD, uno a uno, que la información de la historia clínica y la de todas y
cada una de las pruebas coincide con los datos del CRD.
7/10
31/1/22 12:48 Módulo 4: Análisis dentro del diseño del estudio y control de calidad de los datos – VERSIÓN IMPRIMIR – Biblioteca Virtual
Recomendamos emplear como gestor de datos una hoja de cálculo no una base de datos.
Por último, la norma de oro de una base de datos es cada paciente ocupa una fila, cada variable una
columna.
Por ejemplo:
– PESO3SEMANAS
– PESO6SEMANAS
Estas variables se incluyen en columnas sucesivas, agrupando juntas las variables medidas en cada
momento del estudio.
⮎ Por otra parte, diseñar una prueba piloto con pacientes reales o ficticios en los que se expongan
algunos de los problemas previsibles del estudio será una opción que nos ayudará si preveemos algún
problema.
Debe recogerse la información de la prueba piloto, analizarse y someterse a un examen crítico para
detectar fallos en el CRD o en el personal. Ayuda bastante en esta tarea la colaboración de una persona ajena
al estudio.
En caso de que las incidencias sean muchas es conveniente corregir los problemas.
8/10
31/1/22 12:48 Módulo 4: Análisis dentro del diseño del estudio y control de calidad de los datos – VERSIÓN IMPRIMIR – Biblioteca Virtual
Bibliografía
10/10