Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DE LA INVESTIGACIÓN
BIOMÉDICA
Fundamentos
-1-
Todos los derechos reservados
Queda hecho el depósito que previene la ley 11.723
Buenos Aires. República Argentina. 2016
Este libro no puede reproducirse total o parcialmente por níngún método
gráfico, electrónico o mecánico, incluyendo los sistemas de fotocopia,
registro magnetofónico o de alimentación de datos, sin expreso
consentimiento del editor.
Si reproduce este libro de alguna manera, no sólo está infringiendo la ley,
además está impidiendo que pueda publicar otro.
-2-
La vida nos ofrece una nueva oportunidad cada día que amanece.
La única diferencia es que no tenemos ni los mismos materiales
ni las mismas herramientas que ayer. Ese es el desafío de vivir
-3-
-4-
A todos mis alumnos de estos años. Esta obra es por
ellos y para ellos.
El autor
-5-
-6-
1. A quienes está dirigido, que contiene y como usar este libro 13
1.1 Destinatarios 13
1.2 Que puede hallar en este libro y cómo usarlo 14
1.3 “Fundamentos” para el aspirante a asesor científico 15
2. Diagnóstico de situación 17
2.1 Que son y para qué sirven el Método Científico y la Metodología de la Investigación 17
2.2 Bases racionales para la sistematización del conocimiento 19
metodológico
2.3 Etapas de una investigación científica 22
-7-
7 Diseñando (II): Introducción a la clasificación de diseños 51
7.1 Requisitos de una clasificación de diseños 51
7.1.1 Diseños según método empleado 51
7.1.2 Diseños según la información buscada 51
7.1.3 Diseños según relación entre momentos de formulación del problema 51
y de registro de los datos
7.1.4 Diseños según la intervención del investigador en el proyecto 52
7.1.5 Diseños según número de mediciones de la variable en estudio 52
7.1.6 Diseños según control de la variable subjetividad 52
7.1.7 Diseños según control de otras variables 53
7.2 Seleccionando diseños: relación entre diseños y esquemas 53
conceptuales
9. Diseñando muestras 57
9.1 Tamaño y representatividad de una muestra 57
9.2 El criterio de semejanza 58
9.3 Aleatoreidad y randomización 60
9.4 Diseño muestral: operatoria 61
9.4.1 Operatoria para calcular el tamaño muestral 61
9.4.2 Qué hacer si no puede conseguir tantos casos 62
9.4.3 Elegir método de muestreo 64
9.4.3.1 Muestreo probabilístico aleatorio simple 65
9.4.3.2 Muestreo probabilístico a población incompleta 65
9.4.3.3 Muestreos no probabilísticos 65
9.5 El tamaño muestral no vale un reino 66
-8-
11.4.4 Interpretación y formulación de conclusiones para intervalos de 82
confianza para una proporción 83
11.5 Proyección de los intervalos de confianza en el conocimiento moderno 84
11.6 Intervalos o bandas de tolerancia 85
11.6.1 Uso práctico de las bandas de tolerancia
-9-
14.5 Control de covariables en estudios de comparación 115
14.5.1Control de variables en modelos a muestras relacionadas 115
14.5.2 Control de variables en modelos a muestras independientes 115
14.5.3 Control de variables en modelos a muestras únicas 116
14.5.4 Control de variables desconocidas 116
14.6 Selección de la prueba de significación 116
14.7Información producida al resolver problemas de comparación 118
14.7.1Conclusiones para las muestras 119
14.7.2 Conclusiones informativas para la población y decisión clínica 120
14.8 Estimación de intervalos de confianza para diferencias entre
parámetros 121
14.9 Número de pacientes que es necesario tratar (NNT) 123
14.10 Tablas de vida para dos o más grupos 125
- 10 -
17. Estimación de coeficientes de correlación regresión Parte II: 155
análisis de regresión bivariado
17. 1 Interpretación del coeficiente “b” en el análisis bivariado 159
17. 2 Interpretación del coeficiente “a” en el análisis bivariado 160
17. 3 La predicción es la meta 160
- 11 -
20.2 Alicientes para la participación 181
20.3 Revisión y aprobación de proyectos 182
20.4 Investigación con patrocinio de organismos extranjeros 182
20.5 Modelo para redactar el epígrafe "Reparos éticos" en el protocolo. 182
- 12 -
23.7.2 Listado de tareas para ensamblar el informe de un trabajo a partir del 210
resumen tipo 2b y sin protocolo
23.8 Eligiendo un título para el trabajo 211
25 Síntesis 217
26 Apéndice 219
27 Referencias Bibliográficas 221
- 13 -
- 14 -
1 - A QUIENES ESTA DIRIGIDO, QUE CONTIENE Y COMO USAR ESTE LIBRO
1.1 DESTINATARIOS
Al igual que fue con Principios, con Fundamentos intento cubrir la curiosidad
del lector que piensa investigar o simplemente saber cómo se produce información;
las necesidades de los alumnos que deben cursar la materia y las de los aspirantes
a asesores científicos, que desean reunir en una sola fuente gran parte del
material sobre temas básicos disponible en publicaciones dispersas.
- 15 -
1.2 QUE PUEDE HALLAR EN ESTE LIBRO Y CÓMO USARLO
Las reglas que conforman el método deben servir para orientar, organizar.
Deben impedir que se cometan errores evitables durante una investigación, pero
no deben impedir la investigación misma.
El contenido de Fundamentos proviene, por partes iguales, de : a - la experiencia
acumulada en el ejercicio profesional, ayudando a colegas a resolver aquellos problemas
con sus investigaciones; b - la información bibliográfica; c - la conjugación lógica de
ambos. En el libro desarrollo el glosario básico y RESPONDO LA PREGUNTA: COMO
SE ENCARA CONCEPTUALMENTE UNA INVESTIGACIÓN BIOMÉDICA.
A través de las clasificaciones de problemas según la información buscada y
método de resolución y el desarrollo de los esquemas conceptuales, busco una
sistematización racional de esos conocimientos y facilitar el aprendizaje de
la materia, sorteando la abundancia de información, que suele desorientar
al novicio.
La operación matemática más compleja que le muestro es una raíz cuadrada. Si
está buscando FORMULAS ESTADÍSTICAS sólo ENCONTRARÁ unas pocas que hicieron
falta para alguna explicación. T engo particular interés en diferenciar claramente los
alcances de cada materia. ESTE VOLUMEN ESTA DESTINADO A METODOLOGÍA NO
A ESTADÍSTICA. Con todo no se ignoran las necesidades básicas, de aquellos puntos
en los que Metodología y Estadística confluyen.
Trato los temas con contenido estadístico indicando sólo lo que Ud. necesita para
conceptualizar el proceso de investigación: los fundamentos, los casos de aplicación
y la interpretación. Y para eso no hacen falta fórmulas, sino sentido común. En Internet
podrá encontrar las fórmulas que necesite, sean cuales fueran.(Apéndice)
Las definiciones son convenciones que permiten que las personas se refieran a las
mismas cosas, evitando las confusiones derivadas del lenguaje. Así que abundan. Tal
como dije en 1984 (14) no necesariamente son las únicas o las mejores.
Cada punto está tratado en la profundidad que creí adecuada para este nivel. Un
análisis más detallado me pareció fuera de los alcances de este volumen por lo que le
recomiendo consultar las referencias correspondientes.
Estoy convencido que es poco probable que exista un conocimiento acabadamente
cierto. Luego, para simplificar el discurso a partir de aquí, decidí ELIMINAR todos los
giros idiomáticos que debería haber usado para relativizar las afirmaciones.
Hay algunas repeticiones que no son casuales: sirven para que Ud. repase planteos
hechos muchas páginas antes y evitarle la necesidad de volver a ese lugar.
He seguido un sistema de numeración decimal legal tanto para capítulos y apartados,
como para las tablas y figuras. De este modo podrá ubicarlas facilmente. Así la tabla
7.1 está en el apartado 7.1 , mientras que la figura 3.4 está en el apartado 3.4.
Sugiero al menos dos lecturas de cada capítulo: en la primera tal vez le convenga
saltear los párrafos escritos en letra pequeña.
- 16 -
1.3 “FUNDAMENTOS” PARA EL ASPIRANTE A ASESOR CIENTÍFICO
Convengamos que un metodólogo es un experto en temas de Metodología
y que cuando emplea sus conocimientos para orientar a otros profesionales en la
realización de sus investigaciones científicas cumple la función de ASESOR
CIENTIFICO. Ésta es la que cumplimos desde 1985, cuando iniciamos actividades
en la División de Asesoría Científica del Hospital de Clínicas.
Desde entonces aprendimos mucho, pero mantuvimos la misma filosofía básica:
el ejercicio de la Metodología debía tener iguales componentes que la Medicina:
asistencia, docencia e investigación. En algunas publicaciones previas, fundamenté
los motivos por los cuales consideraba que la formación en Metodología de la
Investigación requiere tanto capacitación teórica como práctica (16)
Lo que define el nivel de un médico es su capacidad de resolver los
problemas clínicos, empleando normas conocidas. Así los estudiantes del último
año conocen la mayoría de las normas, pero no saben cómo y cuando aplicarlas
exactamente o usar vías alternativas. El médico residente avanzado sabe aplicar
la gran mayoría de las normas y a veces puede llegar a usar vías alternativas.
El especialista usa indistintamente ambas.
Dado que el asesoramiento metodológico se refiere a un sistema de normas
(el Método Científico), también se pueden determinar tres niveles: iniciados,
usuarios y expertos, equivalentes respectivamente a los estudiantes del último
año, el residente avanzado y el especialista. Hoy es fácil demostrar que para
ser un asesor científico se requiere una formación particular. A Ud. no se le
ocurre que está habilitado para ser médico por que ha tenido algunas
enfermedades en su vida, y/o es bioquímico, y/o farmacéutico. Del mismo modo,
haber participado personalmente de algunas investigaciones, o poseer
conocimientos laterales como Epidemiología, Salud Pública, Epistemología,
etc. raramente alcanzan para conformar un usuario, y nunca un experto, en
Metodología de la Investigación. Esto sólo se logra con el ejercicio continuado
de la profesión de metodólogo, asesorando equipos de investigación, investigando
en Metodología y enseñando lo que se aprende por la práctica y por la
investigación, además de lo que se estudia. En nuestra querida División, hubo
un grupo de profesionales que con su entusiasmo y sus ganas de averiguar,
movieron las estructuras de lo aceptado e impidieron la generación del moho
de la inactividad.
Varios de ellos constituyeron una nueva generación de asesores científicos
profesionales ejerciendo en diversos centros profesionales. Fundamentos se
escribió pensando también en quienes, hoy, quieren imitarlos. La idea es que
sirva a modo de plataforma de lanzamiento para naves espaciales: los oriente
en sus inicios, y no los estorbe en su avance futuro.
- 17 -
- 18 -
2 - DIAGNÓSTICO DE SITUACIÓN
2.1 QUE SON Y PARA QUE SIRVEN EL MÉTODO CIENTÍFICO Y LA
METODOLOGÍA DE LA INVESTIGACIÓN
Por ejemplo Ud. puede saber que el lugar más profundo del océano está localizado
en la fosa de las Filipinas, o que, en los seres humanos, la ingesta de sal se asocia con
hipertensión.
Pero si Ud. es el capitán de un submarino perdido en el fondo del Pacífico, es posible
que use ese conocimiento sobre la fosa de las Filipinas para tomar alguna decisión. A partir
de ese momento llamaremos información aquello que era conocimiento.
Lo mismo ocurre si es médico y debe suprimir la ingesta de sal a un paciente
hipertenso. Lo que era conocimiento ("la ingesta de sal se asocia con hipertensión") se
transforma en información ya que es aplicado a la toma de decisiones.
Cuanta más información tengan quienes deben tomar las decisiones, más
probabilidades tendrán de tomar las decisiones correctas.
- 19 -
En ciencia, una investigación es un proceso teórico-empírico por el cual se
aplica el método científico a la solución de un problema. Las investigaciones se
pueden clasificar según diversos ejes, tal como se muestra en el cuadro 2.1
- 20 -
Tal vez el sentido común del que tanto se habla no sea más que ese conjunto
de reglas nunca escrito (y a veces nunca aprendido) de lo que no conviene hacer
porque ya se sabe que conducirá a un error.
En este libro muestro que tanto los problemas como la información se pueden
clasificar en tipos y a cada uno de ellos corresponde un sólo modelo de solución.
- 21 -
Ahora bien: cuando Ud. como médico diagnostica que el paciente tiene una
infección bacteriana sabe, de un modo genérico, que deberá usar antibióticos.
Pero no sabe con certeza cuáles, en qué dosis, por cuál vía, porque eso varía de
paciente en paciente. Lo mismo le ocurre a quién se decide a realizar una
investigación.
Es cierto que propongo dos métodos generales que rigen la producción de
información. Pero para cada situación también deberá tomar decisiones
particulares igual que si estuviera eligiendo un antibiótico para una infección de
un paciente dado.
No se preocupe. Como le mostraré, una vez que un problema haya sido
clasificado (cap. 4) , Ud. dispondrá de una serie de reglas generales que he
denominado esquemas conceptuales (cap. 6 ) con las que podrá manejarse
inicialmente.
Una vez que haya desarrollado los esquemas conceptuales que corresponden
a cada modelo de problema, entonces explicaré de qué modo,de ellos , puede
derivar el diseño o sea las reglas para recoger los datos y obtener la información
para poder responder al problema. (cap. 7)
- 22 -
- 23 -
2.3 ETAPAS DE UNA INVESTIGACIÓN CIENTÍFICA
El flujograma de la figura 2.3 indica cómo se produce conocimiento durante una IC.
(9, 80) El bloque de inicio está constituido por el descubrimiento, formulación y
análisis del problema. Inmediatamente después y antes que cualquier otra cosa,
Ud. debe realizar una búsqueda bibliográfica (BB) cuyos objetivos, en el contexto
de una investigación serán:
1 - Determinar si alguien ha resuelto el problema
2 - Obtener información destinada a apuntalar los aspectos teóricos de la
justificación del proyecto.
3 - Enriquecer los aspectos técnicos tanto disciplinarios como analíticos.
Luego de la BB, Ud. dará por finalizado el proceso sólo si ha encontrado una
solución que sea satisfactoria. Si esto debe continuar, diseñará una investigación
adecuada al problema (bloque 3 ), por lo que deberá:
- 24 -
3 - EL PROBLEMA: FORMULACIÓN Y ANÁLISIS
La Real Academia Española define problema (24) como una cuestión que se
trata de aclarar o una proposición o dificultad de solución dudosa. Esta
dificultad termina generando una pregunta o hipótesis que también recibe el
nombre de problema. (2)
- 25 -
Antes de encontrar el problema elija el área o tema de su interés.
- 26 -
3.1.3 SI YA ELIGIÓ TEMA, CÓMO DESCUBRIR PROBLEMAS
- 27 -
- 28 -
4 - CLASIFICACIONES DE PROBLEMAS DE INVESTIGACIÓN
4.1 - MOTIVO E IMPORTANCIA DE LAS CLASIFICACIONES
- 29 -
p3. La prevalencia de diabetes en una población.
p4. La talla promedio de los niños varones de 8 años.
p5. Al cabo de cuánto tiempo se produce una recidiva
en un cáncer gástrico operado.
Note que lo que Ud. quiere "conocer" es una cifra. Por ejemplo en p4 la respuesta
puede ser 120 cm; la respuesta en el p2 puede ser 4 días, etc. En todo caso deberá proveer
evidencia que apoye sus conclusiones.
- 30 -
La primera categoría metodológica esta conformada por los problemas de
cuantificación (en la literatura, a veces, llamados descriptivos). En estos casos, la
información que busque serán cifras que indiquen el comportamiento de una
variable en una población, como Ud. puede deducir del análisis de los siguientes
ejemplos: (vea también cap. 11)
- Estimar la media de tensiones arteriales entre estudiantes de secundario.
- Estimar el porcentaje de boletas mal confeccionadas en un negocio.
- Estimar el porcentaje de anomalías faciales asociadas con agenesias del tercer molar
- Estimar qué porcentaje de pacientes vacunados quedan inmunes a la difteria.
- 31 -
En todos los problemas de comparación termina obteniendo también cifras:
por ejemplo una estimación de diferencias entre porcentajes de éxitos entre dos
tratamientos, o una estimación de riesgo relativo según la presencia o no de un
factor de riesgo.
Aunque miden eventos diferentes que los parámetros buscados en problemas
de cuantificación o de correlación, éstas también son cifras y están sometidas a
los mismos postulados que cualquier cifra.
Estos problemas me parecen los más interesantes y posiblemente son los más
difíciles de resolver y son los únicos que (por ahora) no tienen una cifra como
respuesta. (cap. 19)
Los avances con la disponibilidad de software han permitido que las cifras
obtenidas en las tres primeras categorías (cuantificación, correlación y
comparación) se puedan estimar dando lugar a una nueva y más eficiente
clasificación.
E1) El porcentaje de pacientes con infección urinaria que curan, en mayor cuando
reciben cefalosporinas, que cuando reciben trimetoprima-sulfa.
- 32 -
Tiene razón porque es cierto que es algo más complicado redactar E3 que E1.
- 33 -
- 34 -
5 - OBJETIVOS: FORMULACIÓN Y ANÁLISIS
Un objetivo es un enunciado en el cual se indica cuál es la información que
está buscando y cuál es la población blanco. (11). Sobre la población blanco
trataremos en el ap. 5.4.1
5.1 - Cómo formular objetivos para problemas de cifras: el verbo
"estimar"
Hay problemas en los que se buscan cifras para una población. Por ejemplo
quiere saber:
Cuál es la talla promedio de niños de 8 años
Cuánto tiempo tarda en producirse una recidiva
de un Ca gástrico operado.
Lo ideal sería obtener PARÁMETROS (medidas estadísticas para toda la
población).
Lo más común es que no pueda y no quedará otra alternativa que usar una
muestra. Las medidas estadísticas para las muestras se denominan:
ESTADÍSTICAS. (3,23)
Pero es sabido que la estadística que busca, puede tener un valor diferente
en cada muestra: si quiere “conocer” la talla promedio de un recién nacido y
toma varias muestras de recién nacidos, el promedio de las tallas no será el mismo
en cada una de las muestras tomadas. Por lo tanto lo único que podrá hacer será
ESTIMAR el parámetro que busca.
¿Y a qué se refiere cuando habla de “estimar”?
Para aproximarnos analógica e intuitivamente al concepto suponga que le dicen que
cuando usa un fármaco en dosis de 30 a 50 mg, el 95 % de los pacientes se cura. Ud
interpreta que de cada 100 veces que use el fármaco dentro de esas dosis, podrá tener
una confianza que el 95 % de las veces el paciente se curará. Estamos ofreciendo un valor
mínimo, un valor máximo y una confianza. No sabe exactamente cuánto necesita un
determinado paciente, pero con esa información puede tomar decisiones. Algo parecido
ocurre con las estimaciones.
- 35 -
Qué porcentaje de pacientes que consultan el porcentaje de pacientes que
en Dermatología son mujeres consultan en Dermatología que son mujeres.
colocando el verbo “estimar” por delante del problema y haciendo los ajustes
sintácticos necesarios.
El “intervalo de valores” comprendido entre el valor mínimo y el valor
máximo calculados con una confianza del X % se denomina INTERVALO DE
CONFIANZA DEL X%. (Ver también el apartado 11.4 sobre estimación de
parámetros)
Pero todavía hay muchos investigadores que prefieren seguir usando las
hipótesis, por lo que, en el punto siguiente trataremos el modo de formular
objetivos para hipótesis.
- 36 -
5.2 - Cómo Formular Objetivos Para Problemas Hipótesis
Atención !!! Antes de abalanzarse sobre el primer paciente que pase para
comenzar su investigación, examine los prerrequisitos éticos (cap. 20) y asegúrese
que lo que ha descubierto es un problema.
- 37 -
CUADRO 5.2.1: FORMULACIÓN DE OBJETIVOS PRECISOS PARA
PROBLEMAS DE HIPÓTESIS (Variante 1)
SI SE QUIERE CONOCER SI… CÓMO SE FORMULA CORRECTAMENTE EL
OBJETIVO CORRESPONDIENTE (*)
Los pacientes con infección urinaria, curan en La presente investigación se realizó para
mayor porcentaje cuando reciben contrastar la hipótesis que los pacientes con
cefalosporinas, que cuando reciben trimetoprima infección urinaria, curan en mayor porcentaje
sulfa. cuando reciben cefalosporinas, que cuando
reciben trimetoprima sulfa.
Los pacientes con HIV tienen mayor prevalencia La presente investigación se realizó para
de tuberculosis pulmonar. contrastar la hipótesis que los pacientes con
HIV tienen mayor prevalencia de tuberculosis
pulmonar.
En los seres humanos hay una relación entre La presente investigación se realizó para
peso y superficie corporal, tal que se puede usar contrastar la hipótesis que en los seres
el peso para predecir la superficie corporal humanos hay una relación entre peso y superficie
corporal, tal que se puede usar el peso para
predecir la superficie corporal
(*) Este tipo de problemas se resuelve empleando el llamado “test de hipótesis”. Cuando finalice la
investigación dispondrá de un valor de p que le permitirá responder si rechaza o no la hipótesis.
- 38 -
CUADRO 5.2.2: FORMULACIÓN DE OBJETIVOS PRECISOS PARA
PROBLEMAS DE HIPÓTESIS (Variante 2)
CÓMO SE FORMULA
SI SE QUIERE CONOCER SI… CORRECTAMENTE EL OBJETIVO
CORRESPONDIENTE (*)
Los pacientes con HIV tienen mayor Estimar la diferencia de prevalencia de
prevalencia de tuberculosis pulmonar. tuberculosis pulmonar en los pacientes
con y sin HIV.
En los seres humanos hay una relación Estimar los coeficientes de regresión
entre peso y superficie corporal, tal que se entre peso y superficie corporal en los seres
puede usar el peso para predecir la humanos.
superficie corporal
(*) Cuando finalice estas investigaciones dispondrá de una diferencia entre parámetros
poblacionales que le permitirá responder si las diferencias apoyan la hipótesis (o no) y cuál
es la magnitud de la misma. Esta información es más completa que la que se obtiene con
el Variante 1.
- 39 -
Estimación de parámetros Cuantificación
Estimación de coeficientes de correlación Correlación / Regresión
regresión
Estimación de diferencias entre Comparación (incluyendo Factores de
parámetros (*) Riesgo y Medios de Diagnóstico)
Si tiene dificultades para hacer esto, el problema aún no está listo para su
planteo y mucho menos para orientar una investigación.
- 40 -
5.4.1 Cómo identificar genéricamente la población
Uno de los elementos que hace que una investigación sea “científica”
es la búsqueda de leyes que permitan generalizar, a universos muy
grandes o directamente infinitos.
Finalmente de todos los niños que le son accesibles, muchas veces termina
estudiando sólo algunos, quienes constituyen la MUESTRA en estudio. (3,4,19,23,25)
- 41 -
5.5 - Variables : qué son y cómo se identifican en un problema
Un aspecto interesante de las variables es que Ud. las puede medir (ap.
10.3) de alguna manera, y emplear luego esa información para descubrir, describir,
predecir y controlar eventos de la naturaleza.
Por ahora nos conformaremos con clasificar las variables según su rol
en el problema científico a resolver.
- 42 -
¿ Cuál es el grado de correlación entre el tiempo de polimerización de un sellador y su
periódo de permanencia en la cavidad dentaria? (RELACION ENTRE EL TIEMPO DE
POLIMERIZACION DEL SELLADOR Y EL PERIODO DE PERMANENCIA EN LA CAVIDAD)
- Estimar el porcentaje de anomalías faciales asociadas con agenesias del tercer molar
(PRESENCIA DE ANOMALIA FACIAL)
- Establecer la causa del Síndrome de Pierre Robin (CAUSA DEL SINDROME)
- Las publicaciones americanas editan mejores artículos que las europeas (CALIDAD DEL
ARTICULO)
- Estimar el porcentaje de pacientes vacunados que son inmunes a la difteria (INMUNIDAD
A LA DIFTERIA)
- 43 -
T odas estas son VARIABLES que NO están en estudio pero:
- tienen relación con la variable en estudio (presencia de infección urinaria) y
- pueden alterar (SESGAR) las conclusiones que obtenga.
Este método (y otros que describiremos ap. 14.5) se usan con las covariables
que son conocidas.
Para intentar controlar las covariables pero que aún no han sido descubiertas
(desconocidas) se aplican procedimientos de aleatorización durante el muestreo
ya que queda la esperanza que tales variables confundentes se distribuirán
en forma tal que sea poco probable de que obtenga muestras sesgadas (cap. 9).
Por otra parte es posible que en algún momento, por la aparición de informes
nuevos, o cualquier otro motivo, Ud. tenga dudas acerca de si cierta variable
es irrelevante o debe ser controlada. En este caso trátela como si fuera una
variable a controlar.
Por ejemplo, hasta la fecha no existen informes que indiquen que la ingesta
de vitamina C es una variable interviniente en el problema [P22] de la prevalencia
de infecciones urinarias. Suponga que Ud. quiere realizar la investigación y
alguien dentro del equipo plantea esta posibilidad.
Primero trate de conseguir toda la información que haga falta y si luego
de ello aún persisten las dudas, trate esta variable “ingesta de la vitamina C”
como si fuera una covariable.
Esto se justifica porque si efectivamente termina siendo interviniente, Ud.
ya la controló, mientras que si era irrelevante, entonces no tuvo importancia
lo que hizo con ella.
- 44 -
Si después de haber formulado y analizado el problema y realizado
la búsqueda bibliográfica aún no tiene la información que necesita, debería
llevar a cabo una investigación.
- 45 -
- 46 -
6 - DISEÑANDO (I) : PENSANDO EN ESQUEMAS CONCEPTUALES
Convengamos que, en este contexto, un esquema conceptual (EC) es un
sistema de reglas básicas que orientan el desarrollo de una investigación en
relación con el tipo de información que se quiere obtener.
Una vez que disponga de esas reglas básicas, de ellas derivará otras más
elaboradas que constituyen el diseño .
El EC es un predecesor del diseño. En aquél determina a grandes rasgos qué
habrá que hacer para resolver el problema. En el diseño, considerará la factibilidad
ética y material del proyecto y especificará todos los detalles. En el apartado 7.2
le mostraré que para cada esquema conceptual puede haber diferentes diseños
posibles.
- 47 -
6.1 ESQUEMA CONCEPTUAL PARA RESOLVER PROBLEMAS DE
CUANTIFICACIÓN o de ESTIMACIÓN DE PARAMETROS
- 48 -
6.2 ESQUEMA CONCEPTUAL PARA RESOLVER PROBLEMAS DE CORRELACIÓN
o de ESTIMACIÓN DE COEFICIENTES DE CORRELACIÓN Y REGRESIÓN
a - dada una patología el porcentaje de éxitos es mayor con un tratamiento A que con
otro B. En este caso hay dos muestras de mediciones que provienen de individuos
diferentes. Por eso este modelo de estudio se denomina “a muestras independientes”
(Fig. 6.3)
b – la incidencia de una enfermedad es mayor entre quienes están expuestos a un factor
de riesgo que quienes no. (Modelo a muestras independientes) (Fig. 6.3)
c – la tensión arterial desciende después de una sesión de yoga. En este caso hay dos
muestras de mediciones : las mediciones de la tensión arterial antes de la sesión, y las
mediciones de la tensión arterial después de la sesión, pero ambas provienen del mismo
conjunto de individuos. Por eso este modelo de estudio se denomina “a muestras
relacionadas”.(Fig. 6.4)
- 49 -
d – un nuevo medio de diagnóstico tiene la misma capacidad diagnóstica que uno más
antiguo (generícamente llamado gold estándar) (Modelo a muestras relacionadas)
(Fig. 6.4)
PASO ACTIVIDAD
(1) - Definir precisamente la población (P)
(2) - Obtener en forma aleatoria una (o más) muestra(s) (M) de
individuos según el modelo.
(3) - Aplicar los tratamientos (T) correspondientes.
(4) – Medir las variables en las muestras de individuos y calcular los
resultados (R)
(5) – Calcular los estimadores de diferencias y comparar los R usando
las pruebas de significación adecuadas.
(6) - Calcular los intervalos de confianza necesarios para los
estimadores
(7) - Formular conclusiones para la poblacion.
│ │
│ (1) │ <------------------- (7)
│ P │ . ┘
┌──────┴───────────┴─────┐ │
│ │ │
┌───┴───┐ ┌───┴───┐ │
(2) │ M1 │ │ M2 │ │
└───┬───┘ └───┬───┘ │
│ │ │
(3) T1 ----> │ │<--- T2 │
│ │ │
│ │ │
┌──┴───┐ ┌───┴──┐ │
(4) │ R1 │ │ R2 │ │
└──────┘ └──────┘ │
───────────────────────────────── │
(5) Estimación de diferencias entre parámetros │
COMPARACION USANDO PRUEBAS DE SIGNIFICACION │
───────────────────────────────── │
│
(6) CONCLUSIONES -------------------->
- 50 -
│ │
│POBLACION │ <--------------------
└─────┬─────┘ │
┌───────────┐ │
│ MUESTRA │ │
└─────┬─────┘ │
TRATAMIENTO PRE ---> │ │
┌─────┴─────┐ │
│ RESULTADOS│ │
│ PRE │ │
└─────┬─────┘ │
TRATAMIENTO POST --> │ │
┌────┴──────┐ │
│ RESULTADOS│ │
│ POST │ │
└───────────┘ │
───────────────────────────────── │
Estimación de diferencias entre parámetros │
COMPARACION USANDO PRUEBAS DE SIGNIFICACION │
───────────────────────────────── │
CONCLUSIONES ------------------->
- 51 -
- 52 -
7 - DISEÑANDO (II) : INTRODUCCIÓN A LA CLASIFICACIÓN
DE DISEÑOS
Convengamos que el DISEÑO es un sistema de reglas destinado a establecer
las condiciones de recolección de los datos cuyo análisis le servirá para responder
al problema. (46)
Una clasificación de diseños debe ser como cualquier otra clasificación: es decir un
sistema de medición (cap. 10). El conjunto de las distintas categorías constituyen la escala.
Deben existir reglas coherentes que indiquen como asignar los valores. Sólo así la
clasificación será valida.
En muchas disciplinas (Epidemiología, Estadística, por ej.) se tiende a usar los nombres
propios de los diseños para identificarlos. Esto complica la comprensión del principiante
ya que hay sinonimias y homonimias varias. Pero si Ud usa los criterios que describimos a
continuación siempre estará en condiciones de identificar la operatoria usada.
Los ejes más corrientes para clasificar diseños, toman en cuenta: el método
empleado, la información buscada, la relación temporal entre la recolección de
datos y la formulación del problema, la intervención del investigador, el número
de mediciones que realice de la misma variable y el control que realice sobre
variables intervinientes. (68)
- 53 -
Si, al momento de formular el problema, los datos ya estaban registrados en
alguna parte no importa por cual motivo, (por ejemplo una historia clínica) entonces
el diseño es RETROSPECTIVO. Mientras no afecte la validez interna (ap. 23.6.9.1)
puede combinar ambas variedades, pero perderá muchas de las ventajas que tienen
las investigaciones prospectivas puras.
- 54 -
7.1.7 DISEÑOS SEGÚN CONTROL DE OTRAS VARIABLES
Puede ser intersujeto (transformación en constante, balanceo) como en
los modelos a muestras independientes o intrasujeto como en los modelos a
muestras relacionadas, a muestra única, a dos muestras, a varias muestras,
muestras grandes o pequeñas (ap. 14.5), etc.
Por esas diferencias, los estudios retrospectivos son más económicos que
los prospectivos. Del mismo modo los observacionales tienen menos exigencias
que los experimentales. Pero la comunidad científica asigna mayor valor relativo
a los estudios experimentales y/o prospectivos.
- 55 -
- 56 -
8 - POBLACIONES: ACOTANDO UNIVERSOS DE DISCURSO
- 57 -
Pero le falta considerar el planteo bioético y la accesibilidad física.
Por otra parte Ud. no tendrá acceso a cualquier paciente inmovilizado por más
de 15 días en cualquier lugar del universo, sino solamente a aquellos que
consultaron en el lugar en el que desarrolló el proyecto y durante un cierto lapso.
Por ese motivo debe informar las COORDENADAS TÉMPORO -ESPACIALES y
al hacerlo estará definiendo la POBLACIÓN ACCESIBLE. En este caso por ejemplo
podrían ser:
- 58 -
9 - DISEÑANDO MUESTRAS
Ud. pretenderá producir información sobre toda la población, habiendo
estudiado sólo algunos individuos. Para que esa información sea válida desde el
punto de vista científico debe realizar ciertos procedimientos denominados en
conjunto diseño muestral.
Así M1, M2, M3 y M4 son algunas de todas las muestras posibles que se podrían
obtener de P. (figura 9.1)
- 59 -
Tamaño de una muestra es el número de individuos que la componen. Se suele
identificar con la letra n minúscula. Si está hablando de una muestra, la expresión
"n = 2", indica que la muestra está compuesta por dos individuos; "n= 8" equivale
a decir que la muestra tiene 8 individuos y así sucesivamente.
Por ejemplo si tiene una población de 500 soldados, les mide la talla a todos
y luego calcula el promedio, obtendrá el promedio exacto correspondiente a
la población. ero cuando no pueda estudiar toda la población, deberá usar
una muestra, siempre con la idea de tener información sobre la población.
En este caso esa muestra debe ser algo "especial": debe ser representativa,
o sea que el error que se cometa cuando se formulen conclusiones para la
población, debe ser mínimo y estimable.
Con una muestra representativa el error nunca es cero pero se puede
calcular y disminuir.
Por otra parte, la representatividad es más bien cuestión de grados.
Dada una población cualquier muestra tiene un cierto grado de representatividad
que depende de la aleatoreidad con la que fue obtenida, de su tamaño
y de su semejanza con la población de la que proviene.
- 60 -
Figura 9.1 : Muestras obtenidas aleatoriamente de una población de letras
No he accedido a informes sobre este tema pero creo que debería ser más
estudiado tanto desde el ángulo estadístico como desde el epistemológico.
Mientras tanto, por todos estos motivos y algunos que veremos luego, el
investigador médico seguirá haciendo lo que puede y no lo que le exige la teoría,
cuando se trata de obtener muestras de una población.
- 61 -
9.3 Aleatoreidad y randomizacion
La aleatoreidad con la que Ud obtiene una muestra, se basa en la
aplicación del principio de equiposibilidad, por el cual todos y cada uno de los
individuos que componen P deben tener la misma chance de ser incluidos en
la muestra. (19)
Estrictamente hablando la teoría estadística dice que todos los individuos que
componen la población deben tener una probabilidad conocida de formar parte
de la muestra . Por eso también se habla de un muestreo probabilístico (23)
A su vez la aplicación de este principio depende de que Ud. concrete dos
actividades:
a - Defina en forma precisa la población (19)
b - Emplee algún procedimiento que garantice la igualdad de oportunidades de
cada uno de los individuos de la población para ser incluidos en la muestra.
(sorteo, tablas de números al azar, sobres cerrados, etc).
- 62 -
En estudios con muestras, el error muestral es inevitable. Si el tamaño se
incrementa, el error muestral disminuye (como otros errores derivados del
muestreo, excepto los sesgos) . Al mismo tiempo aumenta el costo del estudio
Desde un punto de vista formal estricto Ud debería decidir qué tamaño tendrá
su muestra al planificar su investigación científica. Para ello verá que necesita
parámetros, datos.
Por ejemplo: si quiere establecer si una droga es efectiva sobre una cierta
enfermedad, deberá “conocer” al menos cuál es la proporción de curaciones actual
y la proporción de curaciones que espera obtener y sobre otros parámetros usados
para el cálculo ( errores, precisión, confianza, etc) y los deberá informar tanto
en el protocolo como en el trabajo final, conjuntamente con el tamaño muestral
calculado. (65)
La descripción detallada del cálculo de tamaños muestrales escapa a los objetivos de esta
obra, pero se puede consultar en la bibliografía especializada ( 23,83, 65; cap 13)
- 63 -
Hay varias maneras de estimar el tamaño. En orden de eficiencia serían:
I - Solicitar a un experto que haga el cálculo del tamaño muestral. Ganará
tiempo y confianza. Junto con el tamaño muestral el experto deberá informarle
los valores que usó (precisión, confianza, potencia, etc) (65,83)
- 64 -
Ya en sucesivos estudios ser irán estimando los elementos necesarios para
calcular el tamaño óptimo de muestra y luego todo será más fácil.
Pero ahora, que intenta hacer una aproximación inicial al problema: haga lo
mejor que pueda hacer. Use un planteo pragmático. Si encara una investigación
de exploración, cualquier tamaño de muestra servirá para formular hipótesis que
permitan seguir adelante. Como recomendación práctica: el número mínimo de
casos deberá ser 6, el conveniente á 30 a 50 y el ideal, mayor de cincuenta.
- 65 -
9.4.3 elegir método de muestreo
Tendrá una muestra válida si usa cualquier procedimiento de muestreo
inventado por Ud, siempre que ese método…
- 66 -
9.4.3.1 - Muestreo probabilístico aleatorio simple
Este método es apropiado para poblaciones completas. Se caracteriza
porque cada unidad tiene una probabilidad equitativa (y conocida) de ser incluida
en la muestra. Una modalidad operativa es un sorteo (por ejemplo, colocando
en un recipiente fichas o papeles que contienen nombre o números que
correspondan a cada unidad del universo)
- 67 -
Si bien los procedimientos no probabilísticos se pueden replicar literalmente
es difícil saber si las muestras obtenidas por distintos investigadores con el mismo
procedimiento son homologables y por lo tanto la comunidad científica tiende a
rechazar la evidencia así producida.
Pero hay dos procedimientos que se usan con mucha frecuencia y sin generar
críticas : el intencional y el consecutivo.
- 68 -
10 - MEDICIÓN: CONCEPTOS. DATOS Y RESULTADOS
10.1 MEDICIÓN
Hay escalas en las que el conjunto de valores posibles son términos (nombres).
Por eso son denominadas ESCALAS NOMINALES. Habitualmente Ud mide la variable
sexo en una escala nominal, con dos valores (varón y mujer). Ambos son nombres
comunes.
- 69 -
Cuando Ud. usa un concepto clasificatorio o escala nominal, las categorías
suelen quedar claramente diferenciadas. La escala para los grupos sanguíneos
está conformada por las categorías A, B, AB, O y cada individuo pertenece
o no pertenece a alguna de ellas.
Pero, según un dicho popular, "no siempre las cosas son blanco o negro". En
la Facultad, al medir una enfermedad, lo han acostumbrado a pensar también en
términos de grados. Por ejemplo: la insuficiencia cardíaca puede estar ausente,
ser leve, moderada o intensa. En el conjunto hay valores que indican dimensiones
intermedias de la variable que está midiendo, por eso se las denomina ESCALAS
ORDINALES.
Cuando se usan palabras como leve, moderado, grave, o grado I, grado II, etc.
es fácil reconocer que se trata de una escala ordinal. La hemos denominado
escala ordinal con base nominal en contraposición a la que describo a
continuación.
Pero a veces, una escala ordinal está compuesta por números, como pasa
con el Apgar, el Apache y muchos otros puntajes ( o escores). Por ejemplo el
escore de Apgar mide la variable vitalidad del recién nacido, y está conformado
por una escala que va del 0 al 10. (18)
Las hemos denominado escalas ordinales con base numérica. No se deje
engañar por los números. Recuerde que las operaciones aritméticas corrientes
no tienen sentido para estos números.
Para reconocerlas haga un razonamiento como el que sigue. Un neonato que tiene
un Apgar de 8, TIENE MAS VITALIDAD que otro que tiene 4, PERO NO TIENE EL DOBLE.
En la escala ordinal con base numérica, los números indican un orden pero no son
directamente proporcionales a la magnitud de variable que miden.
Otros ejemplos de escalas ordinales en Medicina son todas las situaciones en
las que se emplean los términos, leve, moderado, grave, grado N, o puntajes
(escores) del tipo de los mencionados, resultados de exámenes orales, etc.
Hay otras variables como glucemia, uremia, talla, peso, clearance de creatinina,
número de cigarrillos que se fuman por día, tiempo de evolución de una enfermedad,
edad de los pacientes y muchas otras que son medidas también en una escala
compuesta por números.
- 70 -
Estos valores son directamente proporcionales a la magnitud de variable que
miden y en este caso tiene sentido que, con esos números, realice operaciones
matemáticas.
Una vez que elegido la variable que medirá, deberá establecer el sistema de
medición o sea: la escala y las reglas con la que asignará valores. Esta tarea se
denomina: operacionalizar la variable.
En el caso de las escalas ordinales, las reglas deben indicar cómo se logra
que un individuo ocupe una posición mayor, igual o menor, que otro. (12)
Por ejemplo, el grado de insuficiencia respiratoria de una bronquiolitis aguda (18)
se mide en una escala ordinal (Grados I, II y III) con el siguiente sistema de reglas:
- 71 -
Las escalas con base numérica, incluso si son ordinales, tienen gran ventaja
respecto de las nominales por que le permiten realizar ciertas operaciones
matemáticas fundamentales a la hora de calcular estadísticas.
Cuando mida una variable en escala intervalar, generalmente accederá
a un sistema de reglas relacionado con el instrumento con el que ha de realizar
la medición. Si tiene que pesar, registrará el resultado que perciba en la escala
de la balanza, o directamente algún número que visualice en una pantalla
electrónica. Como otro ejemplo, recuerde todos los métodos disponibles para
determinar “tensión arterial”, que se termina expresando en una escala intervalar.
Si Ud. por ejemplo si quiere medir la variable talla puede pensar en al menos
tres sistemas diferentes de medición:
Sistema I
Escala nominal : altos, bajos.
Regla: dado un patrón, los individuos con mayor talla serán considerados
altos, y los de menor o igual talla, bajos.
Sistema II
Escala ordinal : altos, normales y bajos.
Regla: dado un patrón, los individuos con mayor talla serán considerados
altos, y los de igual talla, normales y los de menor talla, bajos.
Sistema III
Escala intervalar: centímetros
Regla : se obliga al individuo a apoyarse descalzo, de pie con la cabeza
erguida, mirando hacia el horizonte, en una vara centimetrada. Se asignará a la
talla el valor equivalente a la longitud en centímetros que se determine entre el
extremo inferior de apoyo de los talones y el vértex cefálico.
Acabo de mostrarle que la talla no "es" una variable intervalar, sino que
"se puede medir" con cualquiera de las tres escalas. Pero en este caso Ud. disponía
de tres sistemas.
No siempre es posible usar un instrumento fabricado, a veces hay que
construirlo. Hay variables para las que no se han diseñado aún sistemas de
medición con escalas alternativas (por ejemplo: sexo, grupo sanguíneo, estado
civil, algunos estados subjetivos como miedo, etc) y se miden como al principio
del conocimiento.
- 72 -
La vitalidad infantil se medía con una escala nominal antes de la propuesta
de Virginia Apgar en 1953 (36), pero la convalidación del nuevo sistema con una
escala ordinal, revolucionó la neonatología, cambiándola definitivamente.
Ud. PUEDE generar un nuevo sistema de medición útil para su actividad con los
pacientes. Sólo inténtelo.
Desde el punto de vista de su operacionalización hay variables simples
o elementales y otras complejas.
Convengamos en definir como simples a aquellas variables en las que
el procedimiento de medición se efectúa directamente sobre la propiedad.
Por ejemplo: frecuencia cardíaca, frecuencia respiratoria, color cutáneo,
reactividad refleja, peso, talla, etc.
Cuando la medición de una variable resulta de la combinación de varias
mediciones de otras, entonces la variable es compleja. Por ejemplo el test de
APGAR sirve para medir vitalidad neonatal. Esta no se mide directamente sino que
para lograr el dato hay que medir: frecuencias cardíaca y respiratoria, color
cutáneo, reactividad refleja, etc.
Otros ejemplos de variables complejas son : afectación del estado general
(APACHE) , rendimiento académico, inteligencia, calidad de vida, etc.
- 73 -
Formalizando: denominaremos RESULTADOS al conjunto de datos primarios
y/o derivados con cuya interpretación pueda responder al problema que originó
la investigación. ( ap. 10.5)
Hay autores que colocan bajo el epígrafe de resultado, cualquier dato que
recogieron durante el trabajo.
En la investigación del apartado precedente (promedio de talla neonatal ), NO
PUEDE CONSIDERAR COMO RESULTADOS que 100 niños habían nacido de cesárea,
o que 25 requirieron asistencia respiratoria mecánica, o que el promedio de las
edades maternas fue de 23.5 años, aún cuando esto sea muy importante para la
DESCRIPCIÓN del grupo.
Posiblemente la responsabilidad le quepa a los editores de revistas científicas
que aceptan y estimulan la colocación de los datos descriptivos de las muestras,
bajo el epígrafe de “RESULTADOS”
Por su parte, los datos en bruto con frecuencia no representan nada por si
mismos, si no los procesa adecuadamente hasta que los haya transformado en
enunciados que respondan al problema.
Hay un resultado que tiene un nombre propio es el denominado endpoint por los
angloparlantes, y traducido como punto final. Según el NCI Dictionary of CancerTerms se
define con ese término a un evento o consecuencia que puede ser medido objetivamente
para determinar si la intervención en estudio es beneficiosa (75)
- 74 -
Para un procesamiento eficiente es mejor transformar esos términos en
números (códigos)
Hay otras mediciones que arrojan números (cuando usa la escala ordinal con
base numérica o la escala intervalar). Respectivamente los denominamos “datos
semi cuantitativos” y “datos cuantitativos”. Para éstos, recomiendo que no los
codifique en la toma inicial . Registre directamente el número. Tendrá tiempo de
recodificarlo luego.
Si el dato no fue tomado (perdido o missing) debe identificarlo con un número
que indique esa condición. Por ej. -9999.
b - Enumere las variables en estudio y las covariables (ap 5.5.2.2 ) que serán
registradas. Aquí las VARIABLES EN ESTUDIO serían: Consumo de sushi y Presencia
de complicaciones cardiovasculares. COVARIABLES (a modo de ejemplos) : Tiempo
que se lleva consumiendo sushi , Antecedentes heredofamiliares de patología
cardiovascular, Obesidad ,Diabetes.
Además, en toda investigación se deben considerar las VARIABLES DE
IDENTIDAD Y CONTEXTO : Nombre del proyecto, Número de historia clínica o de
ficha, Lugar de realización del proyecto, Año, mes y día; Nombre del paciente ; Sexo
biológico; Edad; Número de grupo al cual pertenece el paciente si hay más de uno;
Nombre del investigador a cargo.
- 75 -
Obesidad (1 - presente, 0 - ausente)
Diabetes (1 - presente, 0 - ausente)
En otras circunstancias existen diferentes técnicas (21) pero los errores que
más preocupan son los outliers o datos extremos (por ejemplo en seres humanos
un peso 600 kg, una glucemia de 7 g % etc.) Para detectar los outliers puede: g1-
usar una planilla de cálculo (por ej. el Excel) a través de la función ordenamiento
(sort) o g2 - usar algún paquete estadístico (como el Epiinfo del CDC de Atlanta)
y realizando una distribución de frecuencias y/o diagrama de caja y bigotes. Una
vez detectados se los rectifica o ratifica según lo que corresponda.
- 76 -
11 - ESTIMACIÓN DE PARÁMETROS: PROBLEMAS DE
CUANTIFICACIÓN
Los siguientes modelos de problemas de cuantificación tienen el común
denominador de que se refieren a una población y una variable en estudio:
[p1] - Estimar la media de tensiones arteriales entre estudiantes de secundario
[p2 ]- Estimar el porcentaje de boletas mal confeccionadas en un negocio.
[p3] - Estimar el porcentaje de anomalías faciales asociadas con agenesia
del tercer molar
[p4]- Estimar el porcentaje de pacientes vacunados que son inmunes
a la difteria?
- 77 -
Podría haber respondido a los problemas [p3] y [p4] a través de una tabla
parecida.
En el caso de [p1], cuando Ud. finalice el proceso de medición le quedarán
muchos datos primarios si, por ejemplo, ha controlado 2375 estudiantes
secundarios. Habrá quienes tengan una tensión de 80, quienes 85, otros 100 y
etc. La información así, no le será de mucha utilidad.
Para exponerla puede construir una tabla de distribución de frecuencias
con intervalos de clase tal como le muestro en la T abla 11.2 a partir de la cual
podrá construir un gráfico que recibirá el nombre de HISTOGRAMA O GRÁFICO
DE DISTRIBUCIÓN DE FRECUENCIAS. Los distintos perfiles que muestran estos
gráficos han hecho que algunos reciban nombres particulares, como la
DISTRIBUCIÓN NORMAL o GAUSSIANA.
Sin embargo aún no logró la síntesis máxima. El problema [p1] le exige que
resuma el comportamiento de la variable en dos valores (uno inferior y otro
superior) que conformarán los intervalos de confianza. Esta no es la única
manera de reducir la información a una cifra, también logra este objetivo cuando
usa la mediana, el modo, el desvío estándar,etc.
La media, la mediana, el modo y las demás medidas estadísticas son parámetros
si derivan del estudio de toda la población. Pero pueden recibir otros nombres.
Es poco probable que Ud. estudie toda la población. Lo más común es que
estudie una muestra. T a m b i é n podrá calcular datos derivados para resumir
comportamientos de variables pero ahora se llaman estadísticas.
- 78 -
.
Salvo que ocurra una rara coincidencia, las estadísticas nunca son iguales
a los parámetros. Pero sirven para tener una idea (estimar) el valor de éstos.
Puede establecer dos categorías de estadísticas: las que consideran los
valores que están en el centro de la distribución de frecuencias, que se denominan
medidas de tendencia central y las que ponderan la variación de las variables
y que se llaman medidas de dispersión.
Ud. no puede usar cualquier estadística en forma indistinta y arbitraria.
Las medidas estadísticas más comunes se eligen del modo que muestro en
el Cuadro 11.1 (45).
La información más completa es la que brindan combinadas las medidas
de tendencia central y las de dispersión. El caso más conocido es el de la
media aritmética o promedio y el error estándar (que sirven para establecer
los intervalos de confianza) y la media aritmética y el desvío estándar (que
permiten calcular bandas de tolerancia.).
- 79 -
Por ejemplo en la tabla 11.2 el promedio de las tensiones arteriales entre
estudiantes secundarios fue de 109.56 mmHg. El desvío estándar fue de 7.688.
Si usa ambos combinados informará que la media de TAS entre estudiantes
secundarios fue de 109.56 ± 7.688 mmHg. (IC 95 % 109.25 - 109.87) (ap. 11.4.1)
Como le comenté, una de las ventajas de trabajar con esquemas conceptuales es que
hay ciertas tareas comunes de las que sólo es necesario hablar una vez: así es que los
pasos 1 a 4 fueron tratados en los capítulos 5 y 6. Sobre la base de la distribución de
frecuencias y el tipo de información requerida para la solución del problema, concretará
los pasos 4 y 5, (cálculo de los resultados y de las estadísticas elegidas)
Sólo nos resta hablar sobre la formulación de conclusiones para las muestras,
el proceso de inferencia y la formulación de conclusiones para la población.
Genéricamente hablando, la inferencia se considera un proceso intelectual por
el cual, a partir de un conocimiento dado, se obtiene otro conocimiento nuevo. ( 8,21)
Se puede hablar de, al menos, dos tipos de inferencia: inferencia lógica e inferencia
estadística. Ambas tienen reglas propias.
En el contexto del conocimiento estadístico, se denomina inferencia estadística al
proceso por el cual, partiendo de un conocimiento sobre la muestra se obtiene
información sobre la población, bajo ciertas reglas que se conocerán en cada apartado.
- 80 -
Dijimos que con la "estimación" Ud podría hacer una proyección de valores
mínimo y máximo con un cierto grado de confianza. Ud estudiaría 30, 40 , 100 casos
o los que pudiera y obtendría proyecciones como si hubiere estudiado 100 veces
una muestra de ese tamaño. Por supuesto que cuanto más pequeña es la muestra
más ancho será el intervalo. Pero el mundo no es perfecto !!!
Resuelto el tema del tamaño muestral, el segundo problema es la confianza.
Como a todos nosotros, a Ud le gustaría tener una confianza del 100% Pero hay
dificultades conceptuales y de cómputo que le impiden hacerlo. Conceptualmente
para cualquier estadística el IC del 100 % está entre menos infinito e infinito pero este
conocimiento no tiene uso práctico.
Si bien no puede hacer proyecciones con un 100% de confianza, puede con un
95%, o con el 99%, o con el porcentaje que Ud desee (excepto el del 100%). Sólo hay
que medir los casos que tiene ( no importa si son 10, 100 o 1000) y ajustar los cálculos
a la confianza elegida.
La fórmula general para cualquier intervalo de confianza (IC) es la siguiente:
IC = Estadístico ± K . EE
Donde:
Estadístico = estadístico calculado (media, porcentaje , coeficiente,
riesgo relativo, etc.)
EE = error estándar del estadístico, calculado según la fórmula para
cada parámetro (ver más adelante )
N = número de observaciones
K = coeficiente de confianza cuyo valor depende del nivel de
confianza que se pretenda y del estadístico sobre el que se lo está
calculando. (Tabla 11.4)
- 81 -
Media = es el promedio muestral obtenido
EE = Desvío Estándar / raíz cuadrada(N)
GL = Número de grados de libertad = N - 1
K = se calcula sobre la tabla de distribución del estadístico T, según
número de grados de libertad. (Tabla 11.4)
- 82 -
Ejemplo de interpretación, informe y uso de resultados
expresados como intervalos de confianza de promedios.
Variable Talla ingresantes al ejército.
Promedio obtenido 175 cm
Intervalo de confianza del 95% 173 - 176 cm
- 83 -
Datos:
K = 1.965 ( valor de Z para confianza del 95%)
n= 9 ; N = 81
p = 9/81 = 0.111
q = 1 - p = 0.889
EE = RAÍZ ( p x q /n) = RAÍZ (0.111 x 0.889 / 81) = 0.0349
- 84 -
11.5 - PROYECCIÓN DE LOS INTERVALOS DE CONFIANZA EN EL
CONOCIMIENTO MODERNO
- 85 -
Sin saberlo, en la práctica, para las variables clínicas, Ud. como médico, hace
exactamente lo mismo. Por ejemplo: a pesar que la glucemia media normal está calculada
en 90 mg%, Ud se preocupa solamente si una paciente tiene menos de 70 mg o más de 100
mg% . Al hacerlo, está usando una banda de confianza que está entre esos valores.
- 86 -
Este concepto de bandas de tolerancia, importado de la industria, en la que se
establece cuál es la variación TOLERABLE, en Medicina está conectado íntimamente
con una cierta manera de ver la normalidad.
- 87 -
- 88 -
12 - MODELOS ESPECIALES DE PROBLEMAS DE CUANTIFICACIÓN
12.1 Tasas
Dada una población y una variable, una tasa es el cociente resultante de dividir
el número de individuos que presentan la variable, por el número de individuos que
tiene la población en una cierta unidad de tiempo (74). Desde otro ángulo también
expresan el riesgo que tiene cualquier individuo de la población, de enfermar o
morir, en el lapso establecido.
El modelo corresponde a un problema de cuantificación desde el momento
que la pregunta tipo sería:
¿ Cuál es la proporción de individuos que tienen la característica en estudio ?
y algunos ejemplos podrían ser:
¿ Cuál fue la tasa de mortalidad infantil en la Provincia de Buenos Aires durante
el año 1992 ?
¿ Cuál fue la tasa de mortalidad por coqueluche en el año 1950 en la localidad
de Chivilcoy ?
Para la mayoría de las tasas usuales ya existe acuerdo de cuál debe ser el
tamaño del denominador. Por ejemplo la mortalidad infantil y la tasa de mortalidad
global se expresan por miles, mientras que la tasa de mortalidad específica por
causa (por ejemplo por cáncer) se expresa por cien mil. (74)
- 89 -
El valor de las tasas para una misma entidad, varía según las poblaciones. No
es la misma tasa de mortalidad infantil en Suecia, que en Namibia. Para compararlas
hacen falta fórmulas de ajuste , denominadas TASAS DE MORTALIDAD AJUSTADAS
O ESTANDARIZADAS que aparecen en libros especializados (73, 74)
12.1.1 Prevalencia
Con la prevalencia Ud. estima la totalidad de los casos de la enfermedad que
existen en la población durante un periodo específico y puede calcularla como
sigue:
12.1.2 Incidencia
Con la incidencia Ud. estima la proporción de casos nuevos de
enfermedad, que surgen en una población durante un periodo determinado.
Puede calcularla con la siguiente fórmula:
- 90 -
Hasta aquí le mostré algunos ejemplos de mediciones en relación con un
período fijo de tiempo. Otras veces necesita realizar mediciones similares en
lapsos regulares, para estudiar el comportamiento de una variable: así aparecen
las curvas de valores “normales” según la edad y las “tablas de sobrevida”.
Suponga que partió de 200 casos y en el primer año pierde 50. La tasa de
mortalidad para el primer año es del 25 % Ahora le quedan 150 casos. Si en el
segundo año pierde de nuevo 50, entonces tiene tres tasas de sobrevida:
la del primer año que fue ( 200- 50 /200) = 0.75 ó x 100 = 75.0 %
la del segundo año que fue (150 - 50 / 150) = 0.66 ó x 100 = 66.0 %
- 91 -
Note que tanto los denominadores como los numeradores se van modificando
por muertes y abandonos, así que para calcular la tercera tasa o sea la sobrevida
acumulada hay que hacer la siguiente operación:
También sirven para analizar no sólo la sobrevida , sino con cualquier evento
cuya escala de medición consista en dos alternativas: "se produjo", y "no se
produjo". Así podrá tener información evolutiva sobre recidivas, metástasis,
recaidas, etc.
Después del procesamiento y con ambas técnicas, Ud tendrá al menos la
siguiente información disponible:
- 92 -
Tabla 12.2.2: Curva de sobrevida de Kaplan y Meier para 128 ratas expuestas a
dosis única de cumarina.
Esto implica que puede tener una confianza del 95 % que el verdadero porcentaje
de sobrevida para esa población y en ese período, está comprendido en el intervalo
de confianza.
- 93 -
En la sexta línea (semana 2) comprueba que comenzaron el lapso 48
ratas.
A esa altura podría tener una confianza del 95 % que, para la población,
la sobrevida acumulada se hallaría comprendida entre 0.3878 - 0.5662 Y
así sucesivamente.
Hasta aquí pudo observar que mientras que en los problemas de estimación
de parámetros (cuantificación) se estudian variables , en los demás se analizan
relaciones entre variables. En este caso es necesario formular hipótesis tema
que , en el ámbito de las Ciencias de la Salud, está estrechamente ligado
a decisiones, errores y certidumbre y por ello, los trataremos en conjunto
en el capítulo siguiente.
- 94 -
13 - HIPÓTESIS: PROBABILÍSTICAS Y DETERMINÍSTICAS
DECISIÓN, CERTIDUMBRE Y ERRORES
13.1 HIPÓTESIS
Mañana lloverá
Juan es un tipo serio
Buenos Aires es una ciudad populosa.
Estos conjuntos de signos lingüísticos con los cuales se afirma algo acerca de
alguna cosa se denominan proposiciones o afirmaciones. (20, 21)
Por ejemplo, suponga que está mirando la "luz" de un semáforo y dice: "el
semáforo está en verde".
Todo parece igual que antes. Pero cuando dijo que el semáforo estaba en verde,
no sabía si decía la verdad. Ud. hizo una afirmación que cumple con la siguiente
definición de hipótesis (31):
- 95 -
Por ejemplo, para Ud podrían ser hipótesis :
"el cabello del autor es de color rubio"
"la secretaria que transcribió las notas, es francesa"
"mañana lloverá"
"el 1º de Abril de 1536 fue un día soleado"
No son hipótesis:
"Si Napoleón no hubiera perdido en Waterloo..."
"Si Julio César no hubiera sido asesinado..."
"Si los ingleses hubieran conquistado Buenos Aires en 1806..."
- 96 -
Las reglas serán las de la CONTRASTACIÓN: si lo que predice la hipótesis se
comprueba en los hechos, la hipótesis se categoriza como corroborada, si no, como
refutada.
Si Ud. contrasta una hipótesis una vez, tiene sentido decir que está corroborada o
refutada. Si la contrasta varias veces y obtiene siempre el mismo resultado, también.
Esto le da una excusa para tener la sensación subjetiva de estar seguro.
Convengamos en denominar certidumbre a esa sensación subjetiva de estar seguro.
La próxima vez que la contraste Ud. tendrá “la certidumbre” que ocurrirá lo mismo
que las anteriores. Un ejemplo sería que Ud. tuviera un automóvil desde hace muchos
años. Siempre que quiso encender el motor lo logró. La próxima vez que lo intente
tendrá “la certidumbre” que el motor arrancará.
Suponga que ahora compra un auto nuevo. Cuando intenta darle arranque, a veces
arranca y a veces no. Cada vez que lo intente, estará en lo que se llama situación de
incertidumbre, porque tiene la sensación subjetiva que no sabe qué puede ocurrir.
- 97 -
13.2 CERTIDUMBRE Y PROBABILIDAD
Si va a usar un sistema de medición para la certidumbre le conviene elegir
uno que se preste para el tratamiento científico de la información.
y ello nunca debe pasar porque Ud. eligió este sistema para medir su
certidumbre sobre el resultado de la contrastación de hipótesis que a veces
resultan verdaderas y otras falsas.
- 98 -
La regla más conocida, indica que calcule p realizando una división, en la
que el numerador es el número de veces que la hipótesis se verificó (n) y el
denominador es el número de veces que la hipótesis fue contrastada (N). Esta
es la llamada definición frecuencial de probabilidad. (3) Así que si Ud. probó la
hipótesis 100 veces (N) y se corroboró 35 veces (n) el cálculo arroja el siguiente
resultado:
p = (n/N)= 35/100 = 0.35
Lógicamente en este caso Ud. espera que 54 veces proyecten Cirano, 95 veces le
rechacen el perro o acierte 1 vez al 48. Si esto ocurriera podría decir que las hipótesis son
verdaderas y si no ocurriera, entonces que son falsas.
Pero si Ud. piensa ir al cine sólo una vez, quiere comprar perro sólo una vez,
y paga sólo para participar de una jugada. ¿ Cómo manejar su certidumbre sobre
hipótesis probabilísticas, cuando tiene que DECIDIR una sola vez ?
13.3 DECISIONES
Ya hemos hablado de decisiones en los apartados 11.4.2 y 11.4.4, con motivo
de la interpretación y aplicación de los intervalos de confianza. Allí mencionamos
la interpretación técnica, el modo de informar la conclusión y la decisión
operativa consecuente.
A continuación podrá observar la existencia de dos modelos de flujograma
para tomar decisiones al realizar un test de hipótesis.
El más difundido es el operativo que los estadísticos vienen usando siempre
para explicar la mecánica del test de hipótesis. De este flujograma cual deriva
gran parte de la terminología que tendrá que emplear.
- 99 -
Pero también hay una versión acelerada del proceso , tan sencilla como una
“tirada” de moneda, que usan particularmente quienes se dedican a evaluar
información científica. Ambos son útiles, así que comenzaré por describirle la
versión acelerada.
Ejemplo 13.3.1
Se quiere establecer si el consumo de sushi se asocia con una menor
incidencia de eventos cardiovasculares (ECV) en seres humanos adultos.
Después de haber realizado una investigación impecable obtiene los siguientes
resultados:
20/ 100 pacientes que no consumían sushi tuvieron ECV vs.
5 / 100 pacientes entre quienes consumían sushi.
O sea que la incidencia de ECV fue del 20 % en Grupo no sushi, vs. 5 % en el
Grupo sushi.
Los resultados son diferentes aritméticamente, pero para decidir si las
diferencias son estadísticamente significativas le hacen falta dos cosas: un valor
de p y un punto de corte (alfa,α) que indique cuáles valores de p señalan la
existencia de diferencias.
Dispone de dos criterios para decidir : el criterio general según el cual…
Con los datos suministrados puede acudir a cualquier calculadora online (ver
Apéndice) y obtendrá que p = 0.003 Aplicando directamente el Criterio [2]
dado que 0.003 y es menor que 0.05 debe concluir que las DIFERENCIAS ENTRE
PREVALENCIAS FUERON ESTADÍSTICAMENTE SIGNIFICATIVAS.
- 100 -
Como le comenté este proceso tiene la ventaja de la rapidez con la cual se
aprende y se aplica. Pero no le permite acceder a la terminología estadística
apropiada, cosa que logra aplicando el procedimiento estándar de planteo para
el test de hipótesis.
Ejemplo 13.3.2
Luego de agotadoras horas, estudiando Metodología, ha decidido salir a
pasear. En ese momento su pareja le recuerda que es posible que vaya a llover
y lo pone en la situación de tener que decidir si llevará paraguas o no.
Podría arrojar una moneda y decidir según caiga cara o cruz. Pero para un
estudioso de la Metodología no alcanza. Ud sólo lo llevará si está convencido
que va a llover. Sabe que existen modos de medir la probabilidad de que llueva
y decidir de un modo más “científico”. Así que busca un libro de estadística y
descubre la secuencia que buscaba.
El algoritmo estadístico para la toma de decisión, requerirá los siguientes
pasos:
Primero: formular una hipótesis (Ho) : NO LLOVERÁ. Podría haber formulado
otra tal como LLOVERÁ, pero a los fines didácticos y mantener el discurso
estadístico es preferible elegir esta Ho.
Segundo: establecer una regla de aceptación de Ho por ej.: "si p (No Lloverá)
es igual o mayor que 0.7, entonces Ho es verdadera".
Tercero: obtener el valor de p. En esa situación consultó el diario dónde
encontró que la probabilidad (p) de no llover era del 85% (p(NO LLOVERÁ) =
0.85).
Cuarto: Decidir. Como p fue mayor que 0.7, aceptó que Ho era verdadera o
sea que aceptó la hipótesis "NO LLOVERÁ".
Note que la segunda regla sólo indica como DECIDIR si H es verdadera o
falsa... Pero no indica cómo tiene que hacer para estar seguro !!! No se asombre
demasiado.
Esto no es diferente de cuando evalúa una glucemia para determinar presencia
de diabetes en un paciente. Ud sabe que algunas personas no diabéticas pueden
tener (transitoriamente) una glucemia en 150 mg %, así como que puede haber
diabéticos con glucemias de 90 mg %- O sea que cuando Ud informa: "un paciente
con 100 mg % de glucemia no es diabético" en realidad no está seguro, solamente
decide, con los elementos que tiene y para hacerlo necesita tener un punto de
corte. El ejemplo que acabamos de dar constituye una aproximación intuitiva al
proceso de teste de hipótesis. Veamos una redefinición más formal.
- 101 -
13.3.3 - Formalización estadística del proceso de decisión
Una formalización inicial para la secuencia para tomar decisión en el caso
del paraguas y la lluvia sería la siguiente :
Para decidir si la rechaza o no, debe establecer un punto de corte que recibe el
nombre de nivel de significación y luego calcular un valor de p. Las reglas son las
establecidas: si p es menor o igual que ese punto de corte Ud. decidirá rechazar Ho.
- 102 -
Por otra parte si p es mayor que ese punto de corte, entonces los estadísticos
dicen que “falló en rechazar la Ho”. (23)
En lenguaje coloquial el resto de los profesionales hablamos de “aceptar Ho”
que, como enunciado, no es equivalente al anterior. Pero en la decisión operativa
funciona del mismo modo. Cuando lo mencione en un futuro pondré “aceptar”
entre comillas para recordar este detalle.
- 103 -
Pero las decisiones operativas ( o sea qué hará con esa información), no
dependen solamente de la conclusión técnica, sino también de las consecuencias
empíricas que deriven. Como el tema está ensamblado con un segundo tipo
de error que se puede cometer lo trataremos conjuntamente, luego de hablar
de beta.
13.3.5 ERRORES ASOCIADOS CON LA CONTRASTACIÓN DE HIPÓTESIS
PROBABILÍSTICAS
Volviendo al ejemplo 13.3.2 Ud. está SEGURO que esa tarde en que decidió
pasear, “lloverá o no lloverá”. (Se que es una trivialidad pero sirve a los fines
didácticos)
Es lo mismo que decir que hay un 100 % de probabilidades que (LLUEVA O
NO LLUEVA) esa tarde, o en cualquier otro momento. La variación conjunta de
las p de ambas hipótesis se muestra en la tabla siguiente. Note que el total siempre
es igual a 1 (o sea el 100%).
CURSO 1 DE ACONTECIMIENTOS
Hasta aquí ha decidido llevar paraguas. Como no tiene otro, se lleva un enorme
paraguas, casi del tamaño de una sombrilla. Durante todo su paseo el sol brilla
en el firmamento…y el paraguas le pesa como un yunque. Es evidente que
cometió un error llevando el paraguas. Esto ocurrió porque Ud. rechazó Ho (el
procedimiento fue correcto, pero los hechos se desarrollaron en contra).
- 104 -
Este es el ya mencionado error tipo I o tipo alfa.
Ahora se ve claramente porqué conviene pensar en alfa como un nivel de error :
enseguida se hubiera dado cuenta que un 70 % de error es mucho error.
CURSO 2 DE ACONTECIMIENTOS
En contra de toda la evidencia que la indica que lleve el paraguas, decide no
llevarlo, porque no ve que haya nubes en el cielo. A los 15 minutos de estar en la
calle comienza a llover torrencialmente y Ud se moja. Corre desesperadamente
las cuadras que lo separan de su casa y cuando su pareja lo ve entrar le pregunta:
“ ¿ Volviste…. ? ¿Te mojaste?
Es evidente que cometió un error… no llevó el paraguas cuando debería
haberlo llevado. Este error se produjo porque operativamente Ud “aceptó”
Ho, o sea aceptó que no llovería. Se lo denomina error tipo II o error beta y es
el que se produce cuando se acepta una Ho que en los hechos es falsa.
Es fácil mostrar que cuando alfa aumenta, beta disminuye y a la inversa. La única
manera de disminuir simultáneamente ambos errores es incrementando el tamaño
muestral.
En la tabla 13.3.5 evidencio que, luego de decidir, siempre existe el riesgo
de cometer alguno de los dos errores. Como alfa se puede cometer al rechazar
Ho y beta al “aceptar” Ho, en una investigación sólo se puede cometer uno de
ellos. Ya aprendimos cómo se elige alfa, pero qué hacer con beta ?
Correcto
Correcto
- 105 -
Así como hay un valor estándar para alfa, también hay uno para beta
establecido en un valor de 0.20 Por lo tanto LA SECUENCIA COMPLETA PARA LA
TOMA DE DECISIONES, debe incorporar la elección del error beta: tal como le
muestro a continuación:
a - formular la hipótesis (ahora se llama Ho, hipótesis nula,etc)
b - establecer los errores tipo I y tipo II deseables (habitualmente alfa=
0.05 ; beta = 0.20)
c - establecer las reglas de toma de decisión. Si p > alfa se acepta Ho.
Si p ≤ alfa, se rechaza Ho.
d - averiguar el valor de p usando las pruebas de significación.
e - tomar decisión.
- 106 -
En el ejemplo del epidemiólogo ( ap. 11.4.3) la estimación del porcentaje de
población que necesitaría vacunarse estaba entre el 4.24 % y el 17.95 %. Con esta
evidencia, cualquier porcentaje comprendido entre esos valores tendría justificación
técnica. Pero queda en claro que si usaba un valor de 4.24 %, y se equivocaba, habría
muchas personas que quedarían desprotegidas. Por lo tanto decidió usar el 17.95%.
La situación inversa, o sea tener que disminuir alfa, se dará cuando el peor error
que puede cometer se producirá al rechazar Ho. Por ejemplo está probando un
fármaco caro con “Ho = no es efectivo”. Si rechaza Ho, pensará que es efectivo. Pero
si en realidad no lo es (cometió un error alfa) no sólo hará que sus pacientes gasten
más sino que tampoco los estará protegiendo.
- 107 -
Claro que una incidencia es:
número de casos / número de expuestos o sea n/N, de lo cual se deduce
que la incidencia es una medida de riesgo pero también es una probabilidad.
Como vemos, para poder tomar decisiones sobre hipótesis probabilísticas siempre
deberá calcular un pvalor, aún cuando a veces lo llame de otro modo.
- 108 -
14 - ESTIMACIÓN DE DIFERENCIAS ENTRE PARÁMETROS
(PROBLEMAS DE COMPARACIÓN)
Suponga que ha formulado un problema como el siguiente:
[P15] “ Las personas que consumen sushi tienen menor incidencia de eventos
cardiovasculares (ECV) que quienes no lo hacen “
Se apresurará a decir que esta es una hipótesis y que la respuesta debería
ser “si” o “no” con un cierto grado de probabilidad asociado.
Es cierto… Pero para llegar a la respuesta, necesitará medir la incidencia
de ECV tanto en consumidores de sushi, como en no consumidores y luego
comparar ambas incidencias. Por este motivo los hemos denominado problemas
de comparación. Pero también deberá usar las pruebas de significación adecuadas
para obtener el pvalor, dado que está manejando una hipótesis probabilística
Con el tiempo los investigadores se dieron cuenta que determinar si las diferencias
eran significativas no alcanzaba y establecieron que sería conveniente tener una
estimación de la diferencia. Por ese motivo actualmente los denominamos problemas
estimación de diferencias entre parámetros. (65)
- 109 -
14.1.1 Formas de hipótesis nulas en problemas de comparación
La enunciación de Ho, siempre depende de la forma de la hipótesis que tiene
el investigador, la que suele denominarse HIPÓTESIS ALTERNATIVA (Ha).
Algunos modelos de Ha serían:
Ha1- En pacientes tuberculosos, la proporción de curaciones en tratados
con estreptomicina es DISTINTA que la proporción de curaciones en
tratados con régimen.
- 110 -
Ha6 - En pacientes enuréticos, la proporción de curaciones en tratados
con el método psicoanalítico es MENOR que la proporción de curaciones
en tratados con el método conductista.
- 111 -
Ambas están medidas en escala nominal con dos alternativas:
Por otra parte existen variables que pueden sesgar los resultados
y deberán ser controladas (covariables), por ejemplo : tiempo que
lleva consumiendo sushi, antecedentes heredo familiares de patología
cardiovascular, obesidad, diabetes, etc.
Existen distintos procedimientos para el control de covariables conocidas,
algunos que se realizan durante el procesamiento estadístico de los
datos (control estadístico) y otros en el transcurso de la investigación
(lo denominamos control experimental), algunos de los cuales describo
un poco más adelante (ap. 14.5).
Figura 14.3.0
- 112 -
Para que Ud. resuelva un problema de comparación, como el caso sushi,
le propongo la siguiente SECUENCIA OPERATIVA a punto de partida del
esquema conceptual correspondiente (fig. 14.3) :
PASO ACTIVIDAD
(1) - Definir precisamente la población (P)
(2) - Obtener en forma aleatoria una (o más) muestra(s) (M) de
individuos según el modelo.
(3) - Aplicar los tratamientos (T) correspondientes.
(4) – Medir las variables en la o las muestras de individuos y obtener la o las
muestras de resultados (R)
(5) – Calcular los estimadores de diferencias y comparar los R usando
las pruebas de significación adecuadas.
(6) - Calcular los intervalos de confianza necesarios para los
estimadores
(7) - Formular conclusiones para la poblacion.
- 113 -
En una relación causa-efecto, la causa constituye la variable independiente,
mientras que el efecto constituye la variable dependiente (ver cap. 19).
Haciendo una analogía con la situación, en los estudios estadísticos, el
tratamiento ( en sentido estadístico) también recibe el nombre de variable
independiente mientras que al conjunto de los resultados, se los suele denominar
variable dependiente.
Como ve, los diseños destinados a resolver problemas de comparación tienen
una nomenclatura particular que paso a mostrarle.
- 114 -
Figura 14.4.1.2
- 115 -
Tiene al menos dos alternativas.
- Una alternativa puede ser comparar con LO QUE HUBIERA PASADO si el
sexo no fuera un factor relevante. Teóricamente debería esperar que de 12
pacientes, 6 fueran varones y 6 mujeres ya que tendrían un 50 % de probabilidades
cada sexo.
Ahora tiene un valor obtenido (9/12) y un valor esperado (6/12).
El VALOR ESPERADO provino de que Ud. razonó que si el "sexo" no fuera
variable independiente, la proporción esperada sería 6/12 .
- 116 -
14.5 - CONTROL DE COVARIABLES EN ESTUDIOS DE COMPARACIÓN
La elección del procedimiento de control depende de los objetivos y las
circunstancias en las que Ud. se está manejando. En principio, ya hizo algo
al establecer los criterios de exclusión. (ap. 5.5.2.2 ). En segunda instancia
hay procedimientos de control propios de los problemas de comparación.
- 117 -
Por ejemplo, cada dos mujeres que ingresen, sorteará la primera para determinar si la incluye
en el grupo tratado o control, mientras que la segunda, irá al grupo restante. Lo mismo hará con
cada par de hombres que reclute.
- 118 -
TABLA 14.6 - CRITERIOS PARA LA SELECCIÓN DE PRUEBAS ESTADÍSTICAS
PROBLEMAS DE COMPARACIÓN
- 119 -
También sabe que las pruebas diseñadas para muestras pequeñas pueden
ser usadas con muestras grandes pero no a la inversa. Algo similar ocurre con
las pruebas para varias muestras que pueden ser usadas cuando se trata de dos
muestras, pero no a la inversa.(45)
- 120 -
Claro que una cosa es concluir para las muestras y otra para la población.
14.7.1 Conclusiones para las muestras
Después de haber calculado el valor de p estará en condiciones de tomar
una decisión.
Suponga que tenía las siguientes hipótesis nulas:
- 121 -
14.7.2 Conclusiones informativas para la población y decisión clínica
Las conclusiones informativas para la población comenzarían diciendo:
“ La evidencia obtenida apoya la hipótesis que ….” y luego, para cada estudio
se agregaría
CP1 - …. la proporción de curaciones en tratados con estreptomicina ES
mayor que la proporción de curaciones en tratados con régimen higiénico
dietético. (X² = 6.78; p= 0.03)
Ahora bien, si está tratando pacientes con gripe tipo A, es posible que decida
no usar el tratamiento. En cambio, si los pacientes padecen rabia, aún cuando las
diferencias no fueron estadísticamente significativas, Ud. no dudará en tratar.
Con cualquier resultado que tenga sólo puede estar igual o mejor, pero nunca
peor, porque la mortalidad ya es del 100%. Este es un ejemplo en el que la decisión
clínica y la estadística no concuerdan.
- 122 -
No le conviene, bajo ningún concepto, aplicar el resultado de un
análisis estadístico a la toma de decisiones en la práctica, sin considerar
todos los aspectos del problema a resolver. (ver también ap. 13.3.5)
- 123 -
Si hubiera estudiado toda la población podría decir que el consumo de sushi
se asocia con un descenso del 15 % en la incidencia de ECV. Pero estudió
muestras. (En los problemas de comparación siempre estudia muestras) .
La diferencia es una cifra y para ella debería tener una estimación de los
intervalos de confianza.
Esto se logra acudiendo a cualquier software disponible, ya sea en su PC, su
tablet u Iphone. (Apéndice) Por ejemplo puede encontrar un sitio en el que se
obtengan los resultados de la figura 14.8.2, en la que vemos que los intervalos
de confianza del 95% van de 0.0592 – 0.2433 ( 5.92 - 24.33 %)
Figura 14.8.2
- 124 -
Otra medida del impacto clínico (valoración de tratamientos) puede ser el
número de pacientes que es necesario tratar.
- 125 -
Comparando los intervalos de confianza de ambos NNT, se observa que
el mejor resultado para B (NNT = 14 ) es peor que el peor resultado para A
(NNT = 8)
Con estos datos dispone de evidencia clínica que favorece el empleo del
tratamiento A en cambio del B, para esta patología.
Un problema especial de comparación en el que se aplican tanto el pvalor
como los intervalos de confianza son las tablas de sobrevida para dos grupos.
- 126 -
14.10 - Tablas de vida para dos o más grupos
En el apartado 12.2.2 traté el tema de las tablas de sobrevida para un solo
grupo, como un problema especial en el que cuantificaba la probabilidad
acumulada de que un cierto evento ocurriera en un momento determinado. El
procedimiento también se puede usar para comparar curvas de sobrevida con
diferentes tratamientos.
Suponga que debe elegir entre radioterapia y quimioterapia, para prolongar
la remisión (tiempo libre de recaída) en pacientes con tumores sólidos de
mediastino. El fenómeno se estudia adecuadamente con curvas de
sobrevida.
Comienza por formular la hipótesis cero que podría ser:
Ho : " la curva de probabilidad acumulada de mantenerse en remisión a lo
largo del tiempo NO ES DISTINTA para ambos tratamientos"
La variable independiente es el tratamiento, la dependiente es la curva de
probabilidades.
Siguiendo cada técnica, Ud. hará el cálculo de las probabilidades acumuladas,
a intervalos regulares de tiempo (Cuttler y Ederer) o cada vez que se produzca
una recaída en uno de los grupos (Kaplan y Meier). (22, 23, 35)
Para obtener el pvalor empleará la prueba del log rank test de Mantel y
Haenzel, o la prueba de Wilcoxon. (23) El rechazo de la Ho bidireccional, indicaría
que la probabilidad de mantenerse en remisión es diferente entre los tratamientos
para un mismo lapso o, lo que es lo mismo, que las curvas de probabilidad
acumulada son diferentes para ambos tratamientos.
Toma los datos de 43 pacientes en radioterapia y 53 en quimioterapia.
Después de aplicar el procedimiento de Kaplan y Meier, tiene el informe
que se muestra en las tablas 14.10.1 y 14.10.2 y el gráfico de la fig.
14.10.1
Entre los datos que allí se observan, destacaremos que:
Con estos elementos puede inferir que tiene evidencia que apoya la
hipótesis que, para esta población , cuando emplea radioterapia, el tiempo
de remisión es mayor que cuando usa quimio. La figura 14.10.1 es claramente
ilustrativa al respecto.
- 127 -
En la tabla aparece también un término nuevo: pacientes “censados”. En cualquier
momento de la evolución del estudio hay dos clases de casos : los que tuvieron el
evento en estudio y los que no. Aquellos que no padecieron el evento hasta ese
momento se consideran censados.
- 128 -
15 - COMPARACIONES Y ESTIMACIONES ESPECIALES : FACTORES DE
RIESGO. MEDIOS DE DIAGNÓSTICO: VALORES DE CRIBAJE.
Ejemplo 1 : sea la variable fumar con dos alternativas: fuma - no fuma. Se dice
que fumar es factor de riesgo de enfermedad pulmonar obstructiva crónica (EPOC)
porque cuando un individuo fuma se ha establecido que tiene mayores
probabilidades de padecer EPOC.
- 129 -
La obtención de una medida de riesgo es un problema científico por ello el primer
paso será la formulación precisa del mismo. Se pueden tener al menos dos modelos:
Modelo 1
Establecer si el hábito de fumar es factor de riesgo de cáncer pulmonar
Modelo 2
Estimar el grado de riesgo de cáncer pulmonar asociado con el hábito
de fumar.
Con esta formulación se busca un rango de cifras que cuantifique el riesgo. Las
respuestas son diversas medidas de riesgo según el diseño empleado (riesgo relativo,
riesgo atribuible, odds ratio o razón de chances, etc)
- 130 -
FIGURA 15.1.2 Esquema de desarrollo de un estudio de cohorte, para
factores de riesgo.
Cohorte
La Etapa II tiene una duración que depende del tiempo de latencia que tenga la
enfermedad en estudio. El estudio de cohorte es observacional. El investigador va
controlando a la cohorte según el protocolo. Cuando el mismo finaliza (inicio de la
Etapa III habrá pacientes expuestos y no expuestos, y, muy probablemente, en ambos
grupos haya individuos que presentan el evento: positivos. También es probable que
haya sujetos negativos, que no son de interés para el análisis estadístico.
- 131 -
15.1.2.1 - MEDIDAS DE RIESGO EN ESTUDIOS DE COHORTE
A partir de recuentos (tipo tabla 15.1.2.1) se calculará la incidencia entre expuestos
y no expuestos, según las siguientes fórmulas:
Incidencia entre Expuestos (IE) = A / (A+B)
Incidencia entre No Expuestos (INE) = C / (C +D)
La INCIDENCIA se definió como la proporción de casos nuevos de una afección que aparecen en un
período determinado, sobre el total de individuos de la población (11). Para este ejemplo, ningún paciente
estaba enfermo al iniciar el estudio, por lo tanto la fórmula está correctamente aplicada.
Las incidencias miden el riesgo absoluto para cada grupo. A partir de allí calculará
los riesgos atribuible y relativo.
RIESGO ATRIBUIBLE (RA) = IE - INE
RIESGO RELATIVO (RR) = IE / INE
Todas estas medidas están indicadas EXCLUSIVAMENTE en estudios de
cohorte ( prospectivos). (cap. 7)
- 132 -
No pierda tiempo en hacer los cálculos manualmente. Elija alguna de las
herramientas que se muestran en el Apéndice y aplíquela para obtener las medidas de
riesgo. En este caso si hubiera usado el VCCStat, obtendría los resultados que se
muestran en la figura 15.1.2.1
FIGURA 15.1.2.1 : Salida computarizada para una tabla en estudios de riesgo. Note que se calculan
las medidas de riesgo tanto para estudios de cohorte como casos y controles. Será el operador quien
deba elegir cuál usar.
En la figura 15.1.2.1 se comprueba que se han obtenido prácticamente todas las
medidas de riesgo mencionadas, incluyendo otras que aún no hemos tratado, como
por ejemplo el odds ratio.
Para un estudio en cohorte son aplicables la incidencia en expuestos igual a 0.2,
la incidencia entre no expuestos (0.05), el riesgo atribuible (0.15) y el riesgo relativo
con sus intervalos de confianza ( 4 ; 1.562 - 10.239).
Las incidencias ya fueron explicadas. El riesgo atribuible indica la proporción de
casos que son atribuibles al factor de riesgo en estudio. Para nuestro caso fue de 0.15,
(15%). Esto se interpreta como que según este estudio, el 15 % de los casos de cáncer
pulmonar observados, se puede atribuir al hábito de fumar. (74)
Los estudios de riesgo deberían responder al menos a las siguientes preguntas:
a - ¿Existe evidencia que el estudiado, es un factor de riesgo ?
b - ¿El tamaño muestral usado fue el adecuado?
Para responderlas en ESTUDIOS DE COHORTE hay que tomar en cuenta los intervalos
de confianza del riesgo relativo.
- 133 -
a - Si ambos límites de los intervalos de confianza son superiores a 1, puede
afirmar que tiene evidencia que el factor es un riesgo.
b - Si los intervalos de confianza son estrechos puede afirmar que el tamaño
muestral empleado, es adecuado.
Los estudios de cohorte con frecuencia requieren tiempo y una gran
infraestructura material y humana, lo que los hace inalcanzables desde el punto de
vista financiero. Por ello, habitualmente se recurre a un modelo alternativo : los
estudios de CASOS Y CONTROLES.
- 134 -
15.1.3.2 - MEDIDAS DE RIESGO EN ESTUDIOS DE CASOS Y CONTROLES: ODDS
Qué es un “odds”
En nuestra cultura estamos acostumbrados a utilizar el concepto de
probabilidad. Por ejemplo, al arrojar un dado una única vez, esperamos que la
probabilidad de que aparezca un 3 ( o cualquier otro número) sea de 1/6.
Basamos esta expectativa sobre el cálculo que un número sólo puede salir una
vez y que hay 6 números, por lo tanto la probabilidad de que salga cualquier
número es de 1/6.
Con el mismo dado, en otras culturas basan sus expectativas sobre un cálculo
ligeramente diferente: cualquier número sólo puede salir 1 vez y restan 5 números,
por lo tanto la relación entre el número de veces que puede salir sobre el número
de veces que puede no salir es de 1/5. Esta relación en las culturas anglófonas recibe
el nombre de ODDS.
En castellano se halló un sinónimo : MOMIO, el cual (creo) padece de cacofonía. Por ese
motivo muchos autores (entre quienes me incluyo) prefieren usar directamente el vocablo en
el idioma original, mientras que otros decidieron reservar la palabra CHANCE como sinónimo
de ODDS. (11, 42) Odds, chance y momio son sinónimos que se usan actualmente en la literatura.
Por lo tanto odds ratio, razón de chances y razón de momios también lo son. Bajo ciertas
circunstancias el odds ratio es un excelente estimador del riesgo relativo y por ello se lo llama
también riesgo relativo estimado (RRE). Otros sinónimos usados son razón de productos
cruzados, razón de oportunidades (74) Interesante situación en la que los hispano parlantes
deciden no usar un vocablo (ODDS) por pertenecer a otra lengua, y reemplazarlo por otro
vocablo (CHANCE) que tampoco pertenece al español ya que proviene del francés, idioma en
el que significa probabilidad.
Me parece que el español (que incorporó múltiples términos provenientes de muchos
otros idiomas) se puede permitir el lujo de aceptar otro. Si los anglófonos lo llaman odds y no
tenemos un sinónimo perfecto, pues hombre… llamémosle odds !!!!
Esta presentación de los odds se debe a que no se pueden usar los “riesgos”
como medida, en los estudios de casos y controles. De hecho cuando finalice un
estudio (por ejemplo, analizando hábito de fumar y cáncer de pulmón) dispondrá
de una tabla como la 15.1.3.1, sobre la cual deberá calcular las nuevas medidas.
- 135 -
Presente (Casos) Ausente (Controles)
20 80
5 95
Aplicando lo aprendido hasta aquí, con los datos de la primera línea, se puede
calcular el odds a favor de tener cáncer entre los fumadores según la fórmula:
Odds a favor = Veces que ocurrió / Veces que no ocurrió = 20/80
Análogamente el odds a favor de tener cáncer entre no fumadores sería igual a 5/95
Como dijimos, los estudios de riesgo deberían responder al menos a las siguientes
preguntas:
a - ¿Existe evidencia que el estudiado, es un factor de riesgo ?
b - ¿El tamaño muestral usado fue el adecuado?
Ejemplo 15.1.3.2.1
- 136 -
Interpretación: en la investigación los varones tuvieron un riesgo 10.5 veces
mayor de tener infarto de miocardio que las mujeres. La banda de confianza
indica que si repitiera el experimento 100 veces, en 95 de ellas hallaría valores
comprendidos entre 4.8 y 21.3 lo cual permite esperar algo similar en toda la
población. El intervalo de confianza es poco estrecho, se recomendaría incrementar
el tamaño muestral.
Ejemplo 15.1.3.2.2
Interpretación
En el caso a) el odds a favor de tener enfisema, siendo fumador pasivo fue
3.7 mayor que el odds en contra. La banda de confianza varió entre 2.8 y 7.9 y estos
resultados fueron estadísticamente significativos. La evidencia obtenida apoya la
hipótesis que “fumar pasivamente “ es factor de riesgo de enfisema. Algunos
autores podrían considerar que el tamaño muestral fue aceptable.
Los estudios de casos y controles son mucho más económicos y accesibles que los de cohorte
y por ese motivo son muy utilizados. Por otra parte están más expuestos a la comisión sesgos. Por
ejemplo, un punto crucial al cual deberá prestar máxima atención es la elección de controles
válidos. (73,74)
Mientras que los estudios de cohorte apoyan fuertemente la hipótesis de una relación
causal, los de casos y controles sólo son evidencia de asociación. Si determina que una variable
es factor de riesgo de otra, NO QUIERE DECIR que entre ambas haya relación causa-efecto Pero
puede ser una buena aproximación para que encare el estudio de una relación causa-efecto y le
ofrecería la base empírica (ap. 5.3) para pasar a la construcción de la teoría (ap. 19.3). T oda causa
es factor de riesgo de su efecto.
- 137 -
Cuando evalúe un MD, deberá responder al menos dos preguntas:
- 138 -
El casillero VP (verdaderos positivos), indicando el número de casos que dieron
positivos con ambos MD .
El casillero FP (falsos positivos) que computa cuántos dieron positivo al MD
nuevo, pero negativos al patrón oro.
El casillero FN (falsos negativos) en el que se inscribe el número de casos que
dieron negativos al MD nuevo pero eran positivos al patrón.
Finalmente está el casillero VN (verdaderos negativos) que indica el número
de casos que dieron negativos con ambos.
Con estos valores estará en condición de calcular los valores de cribaje, que
a su vez servirán para determinar: a - qué grado de rendimiento tiene el NMD;
b - cómo se modifica la situación diagnóstica de un paciente cuando se aplique el
NMD .
TABLA 15.2.1
- 139 -
15.2.2 VALORES DE CRIBAJE
Hay un conjunto de medidas estadísticas con la que se pondera el rendimiento
de un medio de diagnóstico y su potencial aplicación clínica. Son resultado una serie
de cálculos aritméticos ( a partir de los recuentos expuestos en la tabla 15.2.1 ) y
reciben el nombre genérico de VALORES DE CRIBAJE DE UN MEDIO
DIAGNOSTICO. Ellos son : Sensibilidad, Especificidad, Poderes Predictivos y
Cocientes de Probabilidades. (3, 11, 23,66)
La definición de cada uno de ellas es la siguiente:
SENSIBILIDAD de una prueba (S): porcentaje de individuos positivos al patrón
oro, que dan positivos a la prueba.
Se calcula según la siguiente fórmula: ( S= VP/(VP + FN)
ESPECIFICIDAD de una prueba (E): porcentaje de individuos negativos al patrón
oro, que dan negativos a la prueba.
Se calcula según la siguiente fórmula: ( E= VN/(VN + FP))
La sensibilidad y la especificidad se consideran propiedades intrínsecas del
medio de diagnóstico porque se mantienen constantes aún cuando cambie
la población.
PODER PREDICTIVO POSITIVO de una prueba (PPP): porcentaje de individuos
positivos a la prueba, que dan positivos al patrón oro.
Se calcula según la siguiente fórmula: (PPP = VP/(VP + FP))
PODER PREDICTIVO NEGATIVO (PPN): porcentaje de individuos negativos a
la
prueba, que dan negativo al patrón oro.
Se calcula según la siguiente fórmula: ( PPN= VN/(VN + FN))
Los poderes predictivos positivos y negativos se consideran propiedades
extrínsecas del medio de diagnóstico porque cambian según la población
de referencia. Tienen uso epidemiológico.
- 140 -
1- Especificidad ( proporción Falsos Positivos)
Gráfico 15.2.3.1: Curva ROC (línea señalada por la flecha) en el caso de un medio de diagnóstico
con . Se comprueba que a medida que aumenta la Sensibilidad, también aumenta
la proporción de Falsos Positivos, lo que muestra que el MD tiene una capacidad discriminativa nula.
Gráfico 15.2.3.2 : Curva ROC (línea señalada por la flecha) para un medio de diagnóstico con
Se comprueba que a medida que aumenta la Sensibilidad, la proporción de Falsos
Positivos se mantiene en cero, lo que muestra que el MD tiene una capacidad discriminativa óptima.
- 141 -
15.2.3.1 - CURVAS ROC
Se denomina curva ROC a un gráfico según el cual se puede valorar el rendimiento
de un medio de diagnóstico. (73,74)
Para construirlo se determinan los valores de sensibilidad y especificidad a
diferentes puntos de corte. Luego sobre el eje de las ordenadas se representan los
valores Sensibilidad (indicadores de la proporción de Verdaderos Positivos) y sobre
el eje de las abscisas se señalan los valores de 1-Especificidad (indicadores de la
proporción de Falsos Positivos). Las consecuencias e interpretación se pueden ver
en los gráficos 15.2.3.1 y 15.2.3.2
En el software que se suele usar para producir curvas ROC, se dispone de un
complemento numérico para la curva: es el cálculo del área bajo la curva (ABC).
El ABC correlaciona perfectamente con el tipo de curva y sirve a los mismos fines.
El medio de diagnóstico con rendimiento máximo tiene un ABC = 1, mientras que los
MD con nulo rendimiento tienen un ABC = 0.5.
Se pueden encontrar todos los valores posibles entre 0.5 y 1. Cuanto más cercana
es a 1, el ABC de un medio diagnóstico, mejor es su rendimiento.
Otra ventaja del cálculo del ABC es que permite la estimación de intervalos de
confianza, dando una idea de cual puede ser el mínimo y cuál el máximo rendimiento
del MD
Un beneficio secundario es que se pueden comparar dos o más medios de
diagnóstico para determinar si las diferencias entre rendimientos son significativas.
( fig. 15.2.3.3 )
Lo que le he descripto hasta aquí es la primera comparación con el Gold
Estándar y es sólo un PRIMER PASO para estimar su grado de rendimiento. En un
futuro, y con el uso puede descubrir que le permite realizar predicciones mas
precisas que las que lograba con el gold estándar. Entonces lo elevará a la categoría
de "patrón oro". Pero ello requerirá una extensa aplicación clínica.
En el apartado siguiente, le muestro la valoración de un NMD en su aplicación
clínica, a partir de un ejemplo concreto.
- 142 -
FIGURA 15.2.3.3: Curvas ROC para dos medios de diagnóstico usados en la misma
patología (líneas señaladas por la flechas) Gráfico y cálculos realizados con Epidat
2.4 Se comprueba que no sólo el ABC es bastante menor en el de la izquierda, sino
que el mejor valor del ABC a la izquierda, es peor,(más bajo) que el peor valor del
ABC a la derecha, aportando clara evidencia que las diferencias entre ambas áreas
son estadísticamente significativas.
- 143 -
15.2.5 - Cómo se usan los valores de cribaje de un MD, en la práctica clínica
Habiendo respondido a la primera pregunta, queda ahora, evaluar cuál es la
aplicación que tendría la PAF en la clínica.
Suponga que lo consulta una paciente de 35 años de edad, por la aparición de un
bulto en su pecho derecho. Tiene antecedentes familiares de cáncer de mama y el
resto de la exploración física es negativa. Revisando la literatura disponible descubre
que las pacientes con estas características tienen una probabilidad de 0.88 (88%) de
tener cáncer de mama. Este valor de probabilidad existe previamente a cualquier
medida que Ud tome incluso la aplicación de un MD. Por ello se la denomina
probabilidad pretest.
El uso de un medio de diagnóstico debería servir para mejorar la capacidad diagnóstica de la
clínica por si sola. Esto significa que después de aplicar el MD, Ud tiene que tener, acerca del
diagnóstico de la paciente, un grado de certidumbre mayor, que el que tendría aisladamente por
la clínica.
Ud decide aplicar la PAF, cuyos valores de cribaje son los que mostramos en la
figura 15.2.4.1 Allí entran en juego los cocientes de probabilidades positivo o negativo
(CPP, CPN), según el resultado de la prueba.
En nuestro ejemplo, la situación pretest es la siguiente: la paciente tiene una
probabilidad de 0.88 de tener cáncer de mama. Según lo expresado en el apartado
15.1.3.2 (sobre relación entre probabilidad y odds), esto equivale a un odds a favor de
7.33. (Necesitamos el valor de odds, ya que los CP se aplican a éstos y no a
probabilidades).
Luego que Ud aplica la PAF pueden ocurrir dos cosas: resulta positiva o negativa
dando lugar a las situaciones post test .
Si el resultado de la PAF es POSITIVO , deberá usar el CPP. El CPP indica en
cuántas veces se incrementa el odds de tener la patología si el test diera positivo.
En la figura 15.2.4.1 se ve que es igual a 11.5 Dado que el odds pretest era de 7.33
Ud calcula:
odds post test = odds pretest x CPP = 7.33 x 11.55 = 84.6615
Por la relación descripta entre odds y probabilidad (ap. 15.1.3.2)
p = chance /(1+chance) = 84.6615 /(1 +84.6615) = 0.9883
Conclusión: la probabilidad pretest era de 0.88 (88%) y luego que el test fue
positivo ha pasado a ser de 0.9883 o sea 98.83 %
Si el resultado de la PAF es NEGATIVO , deberá usar el CPN que indica cómo varía
el odds de tener la patología, luego que el test dio negativo. En la figura 15.2.4.1 se
ve que es igual a 0.07 Dado que el odds pretest era de 7.33 Ud calcula:
odds post test = odds pretest x CPP = 7.33 x 0.07 = 0.5131
Por la relación descripta entre chance y probabilidad (ap. 15.1.3.2)
p = chance /(1+chance) = 0.5131 /(1 + 0.5131) = 0.339
Conclusión: la probabilidad pretest era de 0.88 (88%) y luego que el test fue
positivo ha pasado a ser de 0.339 o sea 33.9 %
- 144 -
- 145 -
Figura 15.2.4.3 :Nomograma de
Fagan aplicado a los datos de los
ejemplos presentados en el texto. En
la línea gruesa superior, se ve el
cálculo de probabilidad post test para
el caso de PAF positivo, mientras que
la línea inferior muestra el resultado
cuando la PAF resultó negativa. La
ventaja del nomograma es que hace
innecesarios los cálculos a los fines de
una evaluación preliminar de la
situación y simplifica la interpretación
de los resultados. (Fagan TJ. Letter:
nomogram for Bayes theorem.NEngl
J Med.1975;293:257.)
A los fines de evitar cálculos engorrosos para el médico práctico, Fagan (86)
publicó un nomograma que tiene gran utilidad práctica el cual se muestra aplicado
para el caso presentado en la figura 15.2.4.3
De todo lo mencionado se deduce que: establecer la validez de un trabajo
científico sobre medios de diagnóstico no le será difícil si recuerda que se deben
cumplir algunos puntos fundamentales, a saber:
a - Se deben haber realizado las mediciones en muestras relacionadas y a doble
ciego, si esto no ocurre el trabajo no tiene validez interna.
b - Se deben haber calculado los parámetros para valorar el rendimiento del MD:
área bajo la curva y curva ROC
c - Se deben haber calculado todos los valores de cribaje con sus respectivos
intervalos de confianza. El tamaño de las muestras empleadas, tiene mucha
importancia pues necesita que los intervalos de confianza sean lo más estrechos posible.
Si Ud es el investigador, le conviene estimar ese tamaño, antes de realizar las
mediciones, empleando las fórmulas de tamaño muestral para comparación de
porcentajes. (23).
A partir del próximo capítulo trataremos procedimientos para estudiar la
variación conjunta de dos o más variables.
- 146 -
16 - ESTIMACIÓN DE COEFICIENTES DE CORRELACIÓN
REGRESIÓN - Parte I: Coeficientes de Correlación
Muchas personas frecuentemente usan conceptos estadísticos, ignorando
que son tales y los aplican en sus decisiones . Por ejemplo:
- 147 -
[p15.3] - En los seres humanos, el valor de creatininemia es un predictor
del clearance de creatinina.
Son cifras y por lo tanto deben ser estimadas, así que pasaremos a la
secuencia operativa que nos permitirá realizar las estimaciones.
- 148 -
16.1 ESQUEMA CONCEPTUAL PARA RESOLVER PROBLEMAS DE CORRELACIÓN
Para obtener información que indique que puede usar X para predecir Y y
llevar adelante los pasos 4 y 5 de la operatoria (calcular resultados y estadísticas)
Ud. usará tres procedimientos combinados. Dos de ellos son matemáticos: el
cálculo del coeficiente de correlación y el análisis de regresión. El tercer procedimiento
es gráfico (nube o diagrama de puntos), pero está reservado para variables medidas
en escala intervalar. (3, 23) Recomiendo comenzar por los más sencillos: el método
gráfico y/o el coeficiente de correlación. Si ambos indican una correlación como
la que está buscando, entonces use el análisis de regresión
- 149 -
Figura 16.2.1 Figura 16.2.2 Figura 16.2.3
- 150 -
Por ejemplo, para determinar correlación entre variables medidas en escala
nominal usará el coeficiente de contingencia (C), mientras que para dos variables
medidas en escala ordinal el coeficiente de Spearman (rs), y para varias en la
misma escala, el coeficiente de Kendall (W). Para la escala intervalar use el
coeficiente de correlación lineal r de Pearson. (23,45)
Usando los resultados de su investigación alimentará esas fórmulas
matemáticas. Luego realizará los cálculos y obtendrá ... el coeficiente !!! El
mismo resultado obtendrá con el soft apropiado y con menos esfuerzo.
El CC tendrá un valor comprendido entre 0 y 1, y un signo positivo o negativo.
Así por ejemplo podrá obtener CC de 0.25, 0.30, 0.87, -0.99, etc. El CC jamás
puede ser mayor que 1 o menor que -1.
En la actualidad para poder interpretar un CC debe disponer de: los
intervalos de confianza, la significación, el signo y el valor absoluto.
- 151 -
Si el CC no es significativo, ya puede concluir que no existe una relación
significativa entre X e Y y detener el análisis.
b - la amplitud del intervalo señala si el tamaño muestral empleado fue
suficiente, para lo cual aplicará los criterios expresados (ver ap. 11.5)
Pero no siempre se dispone de los intervalos de confianza. A veces sólo el
pvalor.
Ha: "en varones adultos, la correlación entre longitud del fémur y talla es de r= 0.76"
Esto quiere decir que a veces obtendrá ese valor de r, y a veces no. Por lo
tanto Ha es una hipótesis probabilística (ap. 13.1)
Para valorar su significación deberá seguir las pautas establecidas en el ap.
13.3.6 o sea:
a - formular la hipótesis nula (Ho)
En estudios de correlación Ho indica que el CC es igual a cero que es
lo mismo que decir que entre X e Y no hay correlación. En este caso:
Ho: "en varones adultos, la correlación entre longitud del fémur y talla es de r= 0"
b - establecer un nivel de significación (alfa) y el error beta aceptable
c - establecer las reglas de toma de decisión.
Si p ≤ alfa rechaza Ho.
d - averiguar el valor de p a través de las pruebas de significación adecuadas
para coeficientes de correlación (3, 23, 85)
e - tomar decisión.
I - El valor de p fue menor o igual que alfa. Deberá concluir que la hipótesis
nula es falsa. El CC fue distinto cero. La correlación entre X e Y fue
estadísticamente significativa.
- 152 -
II - El valor de p fue mayor que alfa. Deberá
“aceptar” que la hipótesis nula es verdadera. El CC Figura 16.3.3.1
no fue distinto cero. La correlación entre X e Y fue
estadísticamente NO significativa. Ya puede concluir
que no existe una relación significativa entre X e Y y
detener el análisis.
Recuerde que con la interpretación I, está corriendo
elriesgodecometerelerrortipo alfa otipoI, cuantificado
por el nivel de significación (ap. 13.3.4), mientras
que en la II, está corriendo el riesgo de cometer
el error tipo beta o tipo II.(ap. 13.3.5)
En definitiva, frente a un CC, el primer parámetro a
tomar en cuenta es el grado de significación que tiene. Si el CC no es significativo,
ya puede concluir que no existe una relación significativa entre X e Y y detener el
análisis. De lo contrario el próximo paso es la interpretación del signo.
Figura 15.4.3.1
Figura 15.4.3.1 16.3.3 - Signo de un coeficiente de correlación
El signo le indica si las variables se modifican en
un mismo sentido o no.
El signo es positivo cuando ambas variables
aumentan o disminuyen simultáneamente, y Ud
informará que la correlación es positiva. (figura
16.3.3.3 ; valor de
r=0.78).
Figura 16.3.3.2
Figura 16.3.3.3
Si el signo es
negativo, entonces informará que la correlación es
negativa lo cual significa que cuando una variable
aumenta, la otra disminuye. ( fig. 16.3.2 ; r = - 0.76) Para
continuar la semiología del CC, deberá evaluar su valor
absoluto.
- 153 -
La siguiente es la interpretación aplicable al valor absoluto del coeficiente
de correlación lineal r , el más ampliamente usado. Pero es útil para una aproximación
intuitiva a la interpretación del valor absoluto de cualquier otro CC.
Suponga que ha obtenido dos CC, uno entre longitud del fémur y talla
(Fig.16.3.4.1) y el otro entre longitud del húmero y superficie corporal (Fig. 16.3.4.2).
Ahora tome el coeficiente r1=0.70 y elévelo al cuadrado. El resultado será igual a
0.49, se simboliza con la letra R² y se denomina
Si multiplica R² por 100 tendrá 49, valor que se interpreta de este modo: desde
un punto de vista matemático el 49 % de la talla fue determinado (explicado) por la
variable longitud del fémur.
Si repite la operación con el R² de la dupla longitud húmero - talla (fig. 16.3.4.2)
podrá informar que ...
desde un punto de vista matemático un 64 % de la talla, fue explicado por la
variable longitud del húmero.
Y si estaba eligiendo predictores de la talla, podrá decir que la longitud del
húmero fue mejor predictor la del fémur.
Si lo que Ud. busca es usar variables X para predecir variables Y, le conviene
encontrar X que alcancen un R² igual o mayor que 0.64, lo que equivale a tener un
r igual o mayor que 0.8.
Un r inferior a 0.7 indica que la X que está estudiando explica menos de un 49%
de la variable Y. Por ese motivo muchos autores coinciden en decir que tales
coeficientes son bajos. No creo que se justifique usar un lenguaje cualitativo
hablando de coeficientes de correlación altos o bajos, cuando se dispone del
coeficiente de determinación, Me parece que es preferible decir que “Juan mide
1.85 metros”, que decir que “Juan es alto”. Podría ser alto con cualquier valor por
encima de 1.80, pero no es lo mismo 1.85 que 2.10 m.
- 154 -
Nota: el signo que precede al coeficiente r no afecta el coeficiente de
determinación, porque la operación es una potenciación al cuadrado, que
siempre le dará resultados positivos.
Cuadro 16.4.1
Combinación [1]:
a1 - la probabilidad que r= -0.8 se haya producido por azar fue de 0.20, mayor
que 0.05. Debe decidir que la correlación no es estadísticamente significativa
o, lo que es lo mismo, no es distinta de cero.
De esto, tiene derecho a deducir como información , SIN OTRO ANÁLISIS, que
la evidencia disponible apoya la hipótesis que entre X e Y no existe
correlación. Por este motivo le comenté que antes de evaluar el signo y valor
absoluto le convenía mirar la significación o los intervalos de confianza, que
en este caso tienen distinto signo.
- 155 -
Combinación [2]:
a2- la probabilidad que r=0.6 se haya producido por azar fue de 0.001, menor
que alfa=0.05. Debe decidir que la correlación fue estadísticamente
significativa.
b2- Puede tener una confianza del 95 % que la correlación en la población
está comprendida en el intervalo 0.5 - 0.7. Ambos límites del intervalo tienen
el mismo signo. Ya puede inferir que la evidencia disponible apoya la hipótesis
que entre X e Y, existe correlación.
c2- La correlación entre ambas variables fue positiva (ambas se modificaban
en el mismo sentido)
d2-la variable X explicó el 36 % de la variable Y. (R2 = r² = 0.6 x 0.6 = 0.36)
e2-El número de casos estudiados fue 123.
Puede informar que la correlación entre X e Y es positiva, que X explicó el
36 % de Y y que esto no ocurrió por azar.
Atención: también tiene derecho a inferir que el coeficiente de determinación
indica que no tendrá mucho éxito si usa X para predecir Y
(independientemente de que la correlación haya sido significativa).
Combinación [3]:
a3 - la probabilidad que r=0.5 se haya producido por azar fue de 0.08; mayor
que el alfa de 0.05. Debe decidir que la correlación no es estadísticamente
significativa.
b3- Ud. puede tener una confianza del 95 % que el coeficiente de correlación
en la población está entre -0.3 y 0.73
c3-la correlación entre ambas variables fue positiva (ambas se modificaban
en el mismo sentido)
d3 - la variable X explicó el 25% de la variable Y.
e3 - El número de casos estudiados fue 15.
Hasta aquí no parece haber diferencias entre esta interpretación y la
de la combinación [1].
Pero ATENCIÓN. 0.08 está tan cerca del valor aceptado como límite
(0.05) que habría que recoger mayor cantidad de datos antes de decidirse.
T al vez esta sería la mejor conclusión para su trabajo.
- 156 -
17 - ESTIMACIÓN DE COEFICIENTES DE CORRELACIÓN
REGRESIÓN - Parte II: Análisis de regresión bivariado
Existe una fórmula que permite calcular el peso corporal (Y) de un niño,
usando su edad en años (X). (18) Tiene aplicación entre los 2 y los 7 u 8 años de
edad y es la siguiente:
Aplicándola para un niño con 4 años de edad , éste debería pesar (en
promedio) 18 kg porque
Peso = 10+ 2 Edad = 10 + 8 = 18
Pruebe con cualquiera de los niños que suele tener cerca (hijo, sobrinos,
vecinitos, etc) Verá que aproxima con bastante precisión. Pero sigamos.
Se dice que los hijos tienden a ser más altos que los padres bajos y más bajos que sus padres
altos. Este fenómeno se repetía tanto en el reino animal como el vegetal. Por tal motivo Galton lo
denominó como LEY DE REGRESIÓN UNIVERSAL. Pearson y Lee, reunieron información y
desarrollaron un algoritmo que permite encontrar la fórmula que conecte cualquier par de X e Y
dados. Cuando publicaron el trabajo hicieron alusión a que se trataba un método de análisis de la
ley de regresión. A partir de entonces quedó este nombre de análisis de regresión. (35) ( Qué suerte
que no lo llamaron supercalifragilisticoespiralidoso !!! )
- 157 -
Como [3] representa asimismo un modelo matemático de la relación X
e Y, también recibe el nombre genérico de modelo. Es decir que, en este
contexto : modelo , ecuación de regresión y fórmula de regresión, son sinónimos.
Es evidente que si cada vez que mide X resulta que es igual a Y, no hace falta
ninguna ecuación especial:
X =Y y listo!
Pero esto no ocurre nunca. Ud está estudiando Y, porque tiene evidencias
que no tiene el mismo valor que X.
- 158 -
Sinónimos de a = constante, ordenada al origen, intercepción o
b₀ (b sub cero)
En inglés (constant , intercept)
Sinónimos de b = pendiente ,
En inglés (slope)
- 159 -
Cuando, como ahora, se estudia con el modelo de regresión lineal, aparece
una recta. En otros tipos de regresiones la línea puede ser una curva.
Precisamente la inspección del diagrama de puntos permite tener una idea
del tipo de relación que conecta las variables. (3, 23, 37)
Y = -5275.258 + 217 X
es decir:
- 160 -
17. 1 - Interpretación del coeficiente “b” en el análisis bivariado
Según la ecuación fundamental de regresión,
Y = a + bX
pero si b fuera igual a cero resultaría
Y = a + 0 X = a+ 0 = a
con lo que se obtienen dos conclusiones:
a - Y sería una constante, no una variable
b - No existe correlación entre X e Y
Se observa que la pendiente (b) se interpreta de un modo similar que el
coeficiente de correlación. Y esa similitud se extiende, porque tiene signo,
significación y además mide el peso de X sobre Y .
Aplicando lo aprendido en el capítulo sobre correlación, se obtienen las
siguientes reglas de interpretación de la pendiente
a - Significación
Se evalúa a través del pvalor y de los intervalos de confianza que deberían
acompañar los resultados ( fig. 17.0.2)
De manera general se puede decir que:
a1 - Si el pvalor es menor que 0.05, el coeficiente de regresión b es
significativamente distinto de cero lo que, coloquialmente se suele expresar
como que : “es significativo”.
a2 - Si ambos intervalos de confianza del 95 % tienen el mismo signo, se
interpreta que la pendiente b, “es significativa”.
De esta significación se deduce que (si se justifica biológicamente) los
valores de la variable X tienen “influencia” sobre los valores de la variable Y.
Si no se establece significación, entonces se deduce que la variable X no
tiene relación con la variable Y.
En el caso descripto en la fig. 17.0.2 los intervalos de confianza del 95 % para b
estarían comprendidos entre 142.046 y 291.954, tienen ambos el mismo signo y el
pvalor < 0.001 por lo tanto es menor que 0.05. Se desprende que la pendiente tiene
un valor estadísticamente
diferente de cero y por lo tanto
la Edad Gestacional tiene
“peso” sobre el Peso del recién
nacido.
En la figura 17.1 puede
observar una salida de otro
análisis de regresión donde no
aparecen intervalos de
confianza, pero se informa el
error estándar que permitirá su
cálculo. (ap.11.4.1) Se intentaba establecer si la Talla podría funcionar como predictor de los
valores de Colesterolemia. El pvalor = 0.0649 > 0.05. La pendiente tiene un valor NO
diferente de cero y por lo tanto la Talla no tiene “peso” sobre la colesterolemia.
- 161 -
Importante: en el caso del análisis bivariado la significación del coeficiente de correlación
entre X e Y , es igual que la significación del coeficiente b. (23)
Suponga que Ud. desea desarrollar una fórmula para predecir la talla de un niño
(variable Y), empleando para ello alguno de los siguientes predictores:
[Problema 17.3]
X1 = T alla Del Padre,
X2 = T alla De La Madre,
X3 = Número Del Calzado Del Tío Del Paciente,
X4 = Peso De Nacimiento Del Niño.
Primero hace un análisis de regresión tomando en cuenta solamente la T alla Del
Padre (X1). Obtiene la siguiente ecuación (ficticia)
Y = 60 + 8.9 X1
Uno de los coeficientes de regresión (la pendiente) vale 8.9.
Ud. formula la hipótesis nula: "la pendiente b=0" y establece alfa = 0.05. Usando un
programa estadístico calcula p = 0.001. Los resultados se pueden disponer de esta manera:
variable pendiente p
X1 b1= 8.9 0.001
Dado el nivel de significación y como p es menor que el mismo, Ud. decide que la
pendiente es significativamente distinto de cero. (ap. 17.1) Ahora Ud. tiene información
por la cual puede afirmar que la variable T alla del Padre (X1) tuvo peso en la predicción de
la variable T alla del Hijo (Y). Decide repetir la experiencia con las variables X2, X3 y X4 por
separado y obtiene los siguientes pendientes y su significación:
variable pendiente p
X2 b2= 7.5 0.02
X3 b3= 6.89 0.03
X4 b4= 0.83 0.37
- 162 -
18 - ESTIMACIÓN DE COEFICIENTES DE CORRELACIÓN
REGRESIÓN - Parte III: Introducción a la regresión
múltiple y al análisis multivariado
A alguien se le ocurrió que si en vez de usar por separado cada una de las
variables, se usaran todas juntas las que fueron significativas, la capacidad de
predicción sería mayor !!!! Y nació la regresión múltiple.
Suponga que Ud. desea resolver el [problema 17.3] y desarrollar una fórmula
para predecir la talla de un niño (variable Y), empleando para todos los predictores
significativos estudiados : X1 = T alla Del Padre, X2 = T alla De La Madre, X3 =
Número Del Calzado Del Tío Del Paciente.
Si Ud. hubiera manejado una sola variable X, la ecuación general sería: Y = a +
bX pero como tiene en juego tres variables X, la fórmula general se transforma
hasta quedar del siguiente modo:
Y = a + b1X1 + b2X2 + b3X3
- 163 -
18.1 - Experimento 1
En una población y a los fines demográficos se testeó la hipótesis que el
porcentaje de varones que leen (X1) influye sobre la mortalidad infantil (Y)
Se recogieron los datos y se aplicaron las herramientas informáticas señaladas en
el Apéndice. Los resultados se exponen en la figura 18.1
18.2 - Experimento 2
En la fig. 18.2 se muestra el resultado del mismo análisis hecho cambiando
la variable independiente a porcentaje de mujeres que leen y las conclusiones
son similares: la evidencia apoya la hipótesis que a mayor porcentaje de
MUJERES (X2) que leen, menor es la mortalidad infantil en el país.
- 164 -
Al mirar los resultados en la fig. 18.3 comprueba que X2 sigue teniendo un
coeficiente significativo (b 2= -1.207; p< 0.0001), mientras que X1 ha perdido
significación (b 1= -0.114; p = 0.788).
- 165 -
Se comprueba que ambos coeficientes b fueron significativos, con lo que se
llega a la conclusión que ambos factores influyen sobre la variable Y, de manera
independiente.
- 166 -
Por ejemplo: consultado por un niño de 4 años, puede predecir que su peso está
alrededor de los 18 Kg. El poder predictivo de una ecuación, es mayor a medida que
se incrementa el coeficiente de determinación, tal como explicamos en el ap. 16.3.4
Y = -13 + 2 X1 + 1 X2
dónde y= Talla que tendrá de adulto el niño
Observe que b1 = 2 mientras que b2 =1. La relación entre b1 y b2 es 2/1. Con estos
datos Ud. está en condición de informar que la talla del padre sería dos veces más
importante que la talla de la madre, para explicar la talla final del pequeño.
Pudo hacer esto porque ambas variables X1 y X2 estaban medidas en las mismas
unidades. Pero NO ES común que todas las variables independientes se midan en las
mismas unidades y por lo tanto, en un análisis multivariado con variables X medidas en
diferentes unidades el valor de cada b NO ES PROPORCIONAL al peso que cada X tiene
sobre Y.
Hay un proceso matemático por el cual se llevan todas las X a las mismas
unidades, entonces cada coeficiente b representa el peso de su X sobre la variable.
El proceso se denomina ESTANDARIZACIÓN DE COEFICIENTES. Finalizado el mismo los
coeficientes b representan el peso que su correspondiente variable X, tuvo sobre
la variable Y en esa muestra. (39)
- 167 -
En el experimento 18.3 descubrió que “en presencia del porcentaje de mujeres que
leen (X2), el de varones (X1) que leen perdió peso sobre la mortalidad infantil (Y)”.
De este modo no sólo sabe que hay relación entre X1 e Y, y entre X2 e Y, sino que
además establece que hay una relación entre X1 y X2, por la cual, X2 “abarca” la
información provista por X1 y por lo tanto simplifica el entendimiento del fenómeno.
Note cómo se refleja esta situación en el coeficiente de determinación múltiple
ajustado. En la fig. 18.1 donde X es el porcentaje de hombres que leen (X1), el R²
ajustado es igual a 0.651 En la fig. 18.2 donde X es el porcentaje de mujeres que leen
(X2), el R² ajustado es igual a 0.708, señalando que el peso de X2 es ligeramente
superior al de X1. Pero en la fig. 18.3 donde se usan X1 y X2, se ve que el R² = 0.705,
prácticamente el mismo que en la fig. 18.2 o sea que la combinación de ambas
variables casi no modifica el R². Por lo tanto ambas explican la misma cantidad de Y.
Pero la 18.3 emplea la variable X1, mientras que la 18.2 no !!!.
A través del uso del software indicado se pueden incluir un gran número de
variables X, analizarlas respecto de una Y, y SELECCIONAR CON ESTE PROCEDIMIENTO
CUALES VARIABLES SON RELEVANTES Y CUALES O. Así es como puede descubrir
relaciones insospechadas hasta el momento.
Al comparar las figuras notará que:
a - el coeficiente de regresión para X1 aisladamente (fig. 18.1 ) era -1.515
b - el coeficiente de regresión para X2 aisladamente (fig. 18.2 ) era -1.129
Cuando reunimos X1 y X2 en la ecuación de la fig. 18.3, los coeficientes de regresión
para cada X han cambiado. Para X1 pasó a -0.114 y para X2 pasó a -1.207.
Esto se explica porque el peso de cada variable ahora no sólo está en relación con
la Y sino también con el peso de las demás X.
También la significación de los coeficientes para cada X es relativa al resto de las X en
las ecuaciones. En una ecuación X1 puede ser significativa y en otra no, dependiendo
de la presencia de otras X. Por ej. en la fig. 18.3, X1 NO AGREGA INFORMACIÓN A LA
QUE PROVEE X2. Por lo tanto no tiene sentido que las use combinadas. (35)
En 1998 decía que “por estos motivos considero que el análisis multivariado será el
procedimiento estadístico más usado en los trabajos a publicar en años venideros” y
hoy agregaría que continuará siéndolo, a partir de nuevos algoritmos que se están
diseñando. Pero ni el más elaborado de los modelos estadísticos, es capaz de establecer
una relación de causa-efecto.
- 168 -
19 - RELACIÓN CAUSA Y EFECTO: PROBLEMAS Y SOLUCIONES
Cotidianamente Ud escucha afirmaciones tales como:
- El exceso de flúor es causa de manchas dentales.
- El Síndrome de Pierre Robin tiene un origen genético.
- La ingesta de dulces produce caries dentales
- La ingesta de glicerina elimina los síntomas del glaucoma agudo
En todas ellas aparece en forma explícita o implícita la idea que algo ( causa)
produce otra cosa (efecto). En Medicina, cuando nos referimos a las causas de
una enfermedad, hablamos de la ETIOLOGÍA.
La Real Academia Española define "efecto" como "lo que sigue por virtud
de una causa" y "causa" como "lo que se considera fundamento u origen de algo.
Evidentemente, este "algo" es el "efecto". (24)
De este modo con la interpretación lexicográfica Ud entra en un círculo vicioso:
las causas, producen efectos y los efectos son producidos por las causas.
No puede definir "efecto" sin hablar de causa y viceversa. Ambos conceptos
están relacionados de tal modo que es imposible separarlos. Pero ¿ para qué quiere
separarlos ?
"Muerto el perro, se acabó la rabia", reza el refrán popular. Ud. se interesa
tanto en aislar las causas porque supone que si las anula, también puede anular el
efecto. Es decir que logra el control máximo al que puede aspirar.
Pero si quiere convencer a la comunidad científica que controla una causa y
por lo tanto su efecto, no le alcanza con mostrar que algunas veces lo logra y
otras no. Las hipótesis probabilísticas ya no le sirven. Ahora necesita hipótesis
que se corroboren el 100 % de las veces. Cuando estas hipótesis se formulan con
motivo de una relación causa-efecto, las denominaré hipótesis determinísticas.
Ninguno de los esquemas conceptuales tratados hasta el momento sirven
para obtener este tipo de información. De hecho, no existe procedimiento
estadístico que establezca una relación causa efecto. (3, 6, 7, 37)
El problema sería sencillo si a cada efecto le pudiera asignar una sola causa.
Pero no es así.
Analice un accidente en la ruta: la causa podría ser error humano o estado
del camino o de los vehículos, o todas juntas. T al vez fue un intento de homicidio
dirigido a alguno de los conductores.
- 169 -
La tarea de deslindar claramente entre distintas causas posibles, buscando
una sola, es una tarea difícil, cuando no imposible.
Pero será más fácil si adopta la concepción que le propongo. T ome dos
eventos de su interés que Ud. cree que están conectados. Por ejemplo la ingesta
de dulces y las caries dentales. Después formule una hipótesis según la cual,
afirma cuál de los eventos es la causa del otro. Por ejemplo afirme que la ingesta
de dulces es la causa de las caries dentales.
De este modo puede redefinir la relación causa-efecto (RCE) diciendo que
es una hipótesis aplicable a algunas partes de la realidad, por el cual "algo"
denominado CAUSA, se considera como agente determinante de otro "algo",
denominado EFECTO. Esquemáticamente:
C —–––––> E
Por supuesto que este tipo de relación constituye una simplificación del
problema. Lo más probable es que no haya causas puras pero, para poder
comprender la realidad, Ud debe simplificarla.
No se preocupe. Esta simplificación no es exclusiva del análisis de relaciones
causa-efecto. Cuando estudiaba una regresión elegía solamente ciertas variables
independientes, no todas las variables independientes. Lo mismo cuando hace
comparaciones (por ejemplo del tipo, el tratamiento A es mejor que el
tratamiento B) en realidad sólo compara algunos aspectos posibles. Por ejemplo
en la comparación de curvas de sobrevida sólo toma en cuenta sobrevida, pero
no calidad de vida.
Será difícil hallar una investigación en la que se usen todas las variables
independientes o se comparen todos los aspectos posibles. Esto se debe, en parte, a
que el conocimiento de un fenómeno está limitado por el tiempo y el lugar en el que
se realiza, situación en la cual sólo se conocen algunas cosas y no todas. Además es
poco probable que se llegue a conocer en forma exhaustiva todas las posibles causas
de un fenómeno.
Como frente a cualquier otro la solución operativa de un problema
de relación causa-efecto (o sea de una hipótesis determinística) comienza
por el esquema conceptual.
- 170 -
19.3 CONSTRUCCIÓN DE TEORÍAS EXPLICATIVAS
Desde el punto de vista científico, y si aceptamos como definición de
sistema un conjunto de partes que interactúan entre sí (49), una teoría es
un sistema de hipótesis. Como sinónimo usaremos el término “modelo teórico”.
Una vez que una hipótesis o teoría ha sido contrastada, y corroborada muchas
veces, los científicos pueden referirse a ellas designándolas con el nombre de LEYES.
Dado el carácter provisional del conocimiento científico, la aparición de situaciones
refutadoras puede hacer que la comunidad científica replantee el título de ley,
conferido a una hipótesis.
- 171 -
Creo que la construcción de una teoría se parece a una aventura cruzando
un país inhóspito. Se puede analizar cuando se ha concretado (como suelen
hacerlo los epistemólogos cuando disecan la teoría ya formulada), pero salvo
sobre los primeros pasos, nadie puede decirle exactamente qué hacer porque
nadie sabe qué ocurrirá.
Claro que hablar sobre los primeros pasos, ya es un buen comienzo.
- 172 -
Si lo único que desea es analizar un conjunto de datos, recuerde que el
procedimiento estadístico es el más adecuado. Si no, creerá que está construyendo
una teoría, cuando en realidad está ajustando un conjunto cualquiera de hipótesis
para explicar aquello que ha registrado.
c - No esperar para teorizar hasta el momento en que el exceso de datos
confunda demasiado.
d - Elegir como hipótesis fundamentales conceptos teóricos.
Para justificar lo que es observable ( por ejemplo una correlación entre sexo y
alteraciones de la coagulación) le alcanza con la Estadística.
Si va a formular una teoría trate que sea una interpretación de lo que está
ocurriendo.
Por ejemplo: Sabe que hay factores que dirigen la coagulación y que muchos
factores se heredan. En este momento inventa su primera hipótesis sobre la
transmisión de la enfermedad ligada al sexo, que es un concepto teórico.
e - Rehuir la inescrutabilidad (formulación de hipótesis no verificables)
Por ejemplo NO formule una hipótesis como: "la hemofilia es un castigo de los
dioses que recae sobre los hijos, por los pecados cometidos por sus padres".
f - Mantener una compatibilidad razonable con las teorías bien corroboradas.
(Vea el ap. 21.4 sobre coherencia externa)
g - No elegir hipótesis de las que pueda deducirse poco o nada
h - Elegir hipótesis unidireccionales.
Estas recomendaciones, sigue Bunge, servirán como lineamientos generales, pero
recuerde que no hay recetas para construir teorías.
Mi sugerencia concreta es que, cuando tenga suficiente información estadística, comience
su teoría. Tengo la impresión que el mejor momento para comenzar a construir una
teoría es aquel en el que se ha establecido formalmente que una variable es factor de
riesgo de un supuesto efecto. Formule al menos una hipótesis determinística y pruébela.
Lo más probable es que funcione a veces y otras no, pero siempre puede mejorarla, como
veremos luego.
El instrumento para la construcción y contrastación de teorías determinísticas
es el método hipotético deductivo o método de la hipótesis, (5,31) cuyo uso
pasamos a examinar.
19.4 MÉTODO HIPOTÉTICO-DEDUCTIVO (MHD)
La reglas que debe seguir para aplicar el MHD son muy sencillas (8, 31), como
le muestro a continuación:
1º - Formular una hipótesis (H)
2º - Suponer que H es verdadera
3º - Deducir cuáles serían las consecuencias observacionales (CO)
4º - Establecer los criterios de corroboración o refutación
Si las CO se producen en los hechos, corroborar.
Si las CO no se producen en los hechos, refutar.
5º - Establecer si las CO, se producen en los hechos
6º - T omar decisión: corroborar o refutar H
- 173 -
El proceso por el cual se determina si las CO se producen en los hechos,
enumerado en quinto lugar, recibe el nombre de CONTRASTACIÓN. (8, 31) Si las CO
concuerdan con los hechos, se dice que la hipótesis se ha corroborado, de lo
contrario se dice que se ha refutado.
- 174 -
4º - Establecer las reglas de corroboración o refutación
Si las tres CO se producen en los hechos, corroborar.
Si alguna de las CO no se produce en los hechos, refutar.
5º - Establecer si las CO, se producen en los hechos
6º - Tomar decisión: corroborar o refutar H
Note que:
- en la REGLA DE ACEPTACIÓN DE UNA RCE (inciso 4º) se indica que se
deben cumplir siempre todas las CO postuladas en el modelo.
- la CO3 exige que Ud. pueda experimentar para manipular la causa,
introduciéndola o extrayéndola a voluntad para comprobar que el efecto
aparece o desaparece.
Esto le generará dificultades éticas muchas de las veces que quiera validar una
RCE en seres humanos.
Siguiendo el modelo, para poder afirmar que "fumar es CAUSA de cáncer de
pulmón", debería experimentar con personas. Esto no es ético. Por este camino
NUNCA podrá establecer esta relación causal. Pero, como bien sabe, para que tome
decisiones no es imprescindible que conozca todas las causas. Alcanza con saber que
algo es un factor de riesgo para aconsejar a nuestros pacientes.
- 175 -
Escena 2
El detective afirma "Si Juan fue asesinado, entonces está muerto".
Examina la habitación y encuentra el cadáver de Juan.
Entonces razona: "Juan está muerto. Por lo tanto fue asesinado".
Ud. puede objetar que Juan pudo haber muerto por causas naturales, o
cualquier otro motivo. Pero también debe aceptar que es posible que lo hayan
asesinado.
Este es el concepto de verdad plausible, uno de los criterios para la
corroboración de una hipótesis. (8)
Llevándolo al ejemplo de la insuficiencia renal, el razonamiento sería:
Si el paciente tiene insuficiencia renal (IR) entonces presenta edemas.
Tiene edemas
Por lo tanto es posible que tenga IR.
De esta manera corroboraría la hipótesis de la insuficiencia renal.
Corroboración y refutación tienen consecuencias asimétricas.
La corroboración de una hipótesis equivale a que la acepte transitoriamente
hasta que aparezcan otros hechos que la refuten, u otras hipótesis
que expliquen mejor los hechos. Luego de la corroboración, Ud.
emplea la hipótesis como si fuera verdadera.
La refutación es absoluta, porque se apoya en un razonamiento deductivo
correcto.
El único motivo por el cual la refutación no es infalible, es porque
depende de las hipótesis presupuestas. En ese caso puede cuestionar la
refutación aunque esto no es común (8). En la Escena 1, Ud. refutó la
hipótesis, bajo la suposición que la persona que estaba viendo era Juan.
Pero si la persona que vio en realidad era un sosías de Juan, Ud. estaba
refutando incorrectamente la hipótesis de asesinato.
El segundo criterio de importancia, para la corroboración de las hipótesis es
la coherencia con otras concebidas independientemente (COHERENCIA
EXTERNA) (8)
Escena 4
El detective afirma: "Si Juan fue asesinado con un arma blanca, entonces
tiene alguna herida en su cuerpo".
Examina el cadáver de Juan y encuentra una herida de arma blanca.
Nuevamente la conclusión parece imbatible: "Juan fue asesinado con un
arma blanca".
El detective examina la habitación y queda perplejo: la habitación está vacía
y cerrada por dentro. No hay otros accesos.
- 176 -
El homicidio con arma blanca parece corroborado por un hecho (la
presencia de la herida). Al mismo tiempo es refutado por otra hipótesis
formulada antes del evento por la cual nadie (ni siquiera el homicida) podría
haber cerrado la puerta por dentro y luego desaparecer sin dejar rastros.
La hipótesis del homicidio no tiene coherencia externa.
Llevando el concepto a nuestra actividad. Suponga que un colega afirma
que la uña encarnada es una enfermedad infecciosa. Luego aporta evidencias
que existe un patrón de transmisión entre individuos que son COHERENTES
con la hipótesis de la contagiosidad de las enfermedades transmisibles
que fue formulada y corroborada ANTERIORMENTE, por otras personas
y/o en relación con OTROS problemas. Esa coherencia hace, que una
hipótesis que parecía descabellada, en un principio, ahora pueda ser considerada
seriamente. Este sería un ejemplo de coherencia externa con hipótesis "concebidas
independientemente". (ver ap. 21.4 )
19.6.2 El procedimiento de contrastación
Una vez que haya establecido las CO de su teoría deberá llevar a cabo lo que
se denomina observación pertinente (OP). A partir de la OP, se formulan
enunciados observacionales que son comparados con las CO. Y así se determina
si las CO se producen o no. Para eso puede usar la observación, la experimentación
o ambas.
Hay eventos como un eclipse solar, que ocurren independientemente de la
voluntad humana ya que nadie puede provocar o evitar un eclipse. La extirpación
quirúrgica de un tumor sólo se puede producir mediando la acción humana.
Finalmente, otros eventos se dan a veces por la voluntad humana, o casualmente,
como el corte de suministro eléctrico de una vivienda. No importa el tema de la
teoría que desarrolló seguro que se refiere a algunos de estos tipos de eventos.
Para contrastar las referidas al primer tipo (eclipse) dispone de la observación,
si es del segundo tipo (extirpar un tumor) necesita experimentación. Con el
tercer tipo (corte de energía), puede usar una u otra.
La observación científica es guiada por las hipótesis de la teoría. Para ser
válida debe ser realizable, repetible e intersubjetiva. (31)
Para verificar si "una cabeza humana recién separada del cuerpo, sigue
pensando". Ud. debería poder observar "el pensamiento" de esa cabeza. En esta
época es imposible. La hipótesis propone una observación irrealizable. No es
científica.
Dado que cada hecho en si mismo es irrepetible, la ciencia se ocupa de
"familias o clases de hechos" (eventos).
- 177 -
La erupción de un volcán en un cierto lugar y momento, es un hecho irrepetible
(acontecimiento) pero pertenece a la familia de las "erupciones volcánicas" que
constituyen un evento (41).
La repetibilidad se refiere a la observación de eventos. La intersubjetividad
se cumple si la observación puede ser realizada por distintos individuos. Por
ejemplo: luego de un traumatismo de cráneo el paciente presenta convulsiones,
esto puede ser presenciado por varios médicos al mismo tiempo.
Pero también muchos médicos han observado y podrán observar convulsiones
en pacientes con traumatismo craneano. En síntesis, una vez que haya formulado
la hipótesis determinará si sus predicciones (CO) se producen.
Puede preparar una observación propiamente dicha, en la que presencie
un fenómeno que ocurre sin su intervención, o una experimentación en la que
Ud. produce el fenómeno. El paradigma de las ciencias ha sido la Física. Por
tal motivo la experimentación se ha considerado como el procedimiento más
válido para la contrastación de teorías.
A su vez en Medicina, hay grandes dificultades para llevar a cabo la experimentación
y esto hace que muchos médicos se sientan limitados. Note que los físicos astrales se
encuentran en el mismo problema. Sólo pueden observar eclipses o movimientos de
cuerpos celestes, pero no pueden producirlos. Esto sin embargo, no significó un obstáculo
insalvable para el avance de su disciplina.
- 178 -
Suponga que hace las observaciones pertinentes y ordena los resultados en
una tabla del siguiente modo:
Porcentaje esperado Porcentaje observado
(CO1) 100 78
(CO2) 100 75
(CO3) 100 95
Según la regla, debería decir que entre C y E no hay RCE. (versión naive del
Método Hipotético Deductivo, 31) Pero... considerando las observaciones
realizadas, el modelo resultó efectivo muchas veces como para deshecharlo en
su totalidad. En estas circunstancias parece adecuado adoptar la siguiente
conducta:
a - concluir, transitoriamente, que si C es causa de E, seguramente no es la
única causa, porque si no, el modelo se hubiera satisfecho completamente.
b - complejizar el modelo, agregando una segunda "causa" que en combinación
con la primera trate de explicar la RCE: por ejemplo la falta de higiene bucal.
En el nuevo modelo C = ingesta de dulces + falta de higiene y E = caries dentales
y tendría la siguiente forma:
(H) La ingesta de dulces y la falta de higiene producen caries
si H es verdadera, entonces
(CO1) Si se ingieren dulces y falta higiene, se tendrán caries.
(CO2) Si no hay caries, no se habrá ingerido dulces y/o se tuvo higiene.
(CO3) Si se detiene la ingesta de dulces y/o se tiene higiene, se
detiene la aparición de caries
Otra manera de hacer lo mismo sería indicar que a la hipótesis de la ingesta
de dulces, agrega la hipótesis de la falta de higiene. Así está construyendo un
modelo de teoría.
El agregado de la nueva hipótesis puede:
A - mejorar el porcentaje de éxitos en las predicciones
B - mantenerlo igual
En el caso A le sugeriría que siguiera adelante, tal vez buscando una
tercera hipótesis para agregar. La situación B le indica que a pesar de la nueva
hipótesis las cosas siguen igual. Por lo tanto debería retirarla. Es recomendable
repetir el proceso todas las veces que sea necesario, hasta obtener el sistema
de hipótesis (teoría) con mayor capacidad predictiva.
Nota: la construcción de una teoría requiere más que el simple modelo expuesto:
por ejemplo debería formular hipótesis fundamentales y derivadas. Ello está fuera
de los alcances de este libro. En 1984 (14) detallé el proceso en general y la construcción
en particular de una teoría hipotético deductivista.
- 179 -
19.8 Formulación de conclusiones luego de contrastar una teoría.
Al finalizar la o las observaciones pertinentes, Ud. habrá corroborado o
refutado su hipótesis.
Suponga, por ejemplo, que corroboró la hipótesis sobre la ingesta de dulces
y las caries. La conclusión que formule será muy sencilla, tal como:
"Las observaciones realizadas corroboran la hipótesis que la ingesta de dulces
produce caries". Del mismo modo si la refutó.
El MHD exige que las CO se produzcan siempre, si no debe refutar la hipótesis.
Ud. puede modificar esta exigencia si obtiene porcentajes de predicciones
correctas como los mostrados en el ejemplo del apartado anterior, pero no parece
haber reglas para decirle cuando abandonar su hipótesis (8)
En caso que la haya corroborado muchas veces, pero no siempre, puede decir
que los resultados obtenidos apoyan la hipótesis.
T al vez el abandono de su hipótesis sea cuestión de intuición. Pero lo más
frecuente será que emplee hipótesis ad hoc para salvar la suya.
Una hipótesis ad hoc es aquella que formula LUEGO de realizada la
contrastación con la finalidad de proteger o salvar su teoría de su refutación.
Su uso le está permitido, siempre que Ud. la pueda contrastar en forma independiente
de la que quiere salvar y que no sea contradictoria con el conocimiento aceptado. (8) Por
ejemplo, Harvey en 1628, había formulado la teoría que la sangre circulaba, llevada por
las arterias y traída por las venas, desde el corazón. Como no se percibían conexiones
evidentes entre venas y arterias, introdujo la hipótesis ad hoc que existían pequeños vasos
invisibles llamados capilares. Muchos años después cualquiera podía ver estos pequeños
vasos al microscopio . Esto es lo que quiere decir que la hipótesis es contrastable
independientemente. No hacía falta conocer la teoría de Harvey para observarlos.
Suponga que hizo una investigación y los resultados refutaron la hipótesis que la
ingesta de dulces produce caries. Ud debería refutar la hipótesis. En cambio afirma “esto
se podría deber a que los sujetos del experimento no ingirieron los dulces del modo como se
había indicado”.
Esta hipótesis es una ad hoc. Se hizo para salvar la teoría y se puede probar
independientemente ya que se puede preguntar a quienes llevaban el control del proyecto,
si efectivamente los sujetos del experimento habían cumplido con las indicaciones.
- 180 -
20 - BIOÉTICA E INVESTIGACIÓN CIENTÍFICA: BREVE
INTRODUCCIÓN
- 181 -
20.1.2 Conducta del investigador frente al consentimiento informado
Respecto del candidato a participar en la investigación, Ud. deberá:
- proporcionarle plena oportunidad y estímulo para plantear preguntas;
- no inducirlo a participar decepcionándolo o intimidándolo;
- pedirle el consentimiento luego de cumplir con lo propuesto en el ap. 20.1.1
y haberle dado oportunidades suficientes para considerar si participará o no.
- 182 -
- la investigación no puede llevarse a cabo razonablemente bien en comunidades
desarrolladas;
- la investigación es sensible a las necesidades de salud y a las prioridades
de la comunidad en la cual se realizará;
- se harán todos los esfuerzos para asegurar de que el consentimiento
del sujeto individual sea informado y
- las propuestas para la investigación han sido revisadas y aprobadas por
un comité de ética que tiene entre sus miembros o consultores a personas
que están completamente familiarizadas con las costumbres y tradiciones de
la comunidad.
- 183 -
20.3 REVISIÓN Y APROBACIÓN DE PROYECTOS
Antes que comience una investigación que involucre a personas, deberá
someter todas las propuestas a uno o más comités éticos y científicos
independientes, para su revisión y aprobación.
- 184 -
21 - REDACTAR EL PROTOCOLO DE INVESTIGACIÓN
Hay muchos formatos posibles y las instituciones que financian investigaciones tienen
el propio. Pero los puntos básicos son los mismos. A continuación expongo la estructura
básica empleada en la Sección de Asesoría Científica del Hospital de Clínicas de Buenos
Aires desde el año 1995 (11) , muy similar al que propone la OPS a partir del 2005 (35)
Por cuestiones de conveniencia, si puede, obtenga una copia del modelo que utiliza la
institución a la que rendirá cuentas de su investigación y si esta no tiene, utilice el que le
describo y luego coteje con los modelos internacionalmente estandarizados para
comprobar si algún detalle debe ser modificado.
Población y muestra(s)
o – Definir la población: criterios de inclusión, exclusión y eliminación
y coordenadas témporo-espaciales (cap. 8 )
o – Describir el diseño muestral:
Indicar el tamaño muestral.
Indicar criterios aceptados ( errores a y ß; diferencias esperadas, etc)
Describir el procedimiento a emplear (cap. 9)
o– Explicitar los reparos éticos del proyecto (ap. 20.5)
- 185 -
Materiales y Métodos (Técnicas)
o – Describir los materiales y técnicas a emplear
Enumerar las variables a medir e indicar sus escalas de medición y
el procedimiento de operacionalización (cap. 10)
Describir el instrumento de registro de datos (planilla o ficha). Adjuntar
un modelo e indicar el procedimiento de empleo del mismo (ap. 10.5)
Indicar el método de almacenamiento (manual, computarizado, etc.)
o – Proponer el tratamiento estadístico de los datos obtenidos (ap. 23.6.6)
Enunciar la técnica estadística y el programa estadístico a emplear para
el procesamiento de la información
o– Resumir con un esquema conceptual los procedimientos de análisis y
los resultados esperados. (cap. 6)
- 186 -
22 - Informando A La Comunidad Científica (I) : fundamentos
racionalessobreredaccióndel Trabajo Científico
22.1 INTRODUCCIÓN
- 187 -
Ud publica su información para que la use todo el que la necesite.
Otros profesionales la usarán para tomar decisiones diagnósticas y/o
terapéuticas.
El trabajo científico debe informar sobre la investigación, los resultados
y las conclusiones, de un modo ordenado, empleando un lenguaje preciso,
ofreciendo la información indispensable y de validez incuestionable.
La primera persona que debe considerar la validez de su trabajo es
Ud. mismo. Al revisarla, estará haciendo el mismo trabajo que hace el
comité editorial de una revista determinar el grado de validez interna,
coherencia y validez externa. Si se produce alguna falla en alguno de ellos
el comité tendrá derecho a rechazar la publicación.
- 188 -
Convengamos que para que un trabajo no sea rechazado, debe tener, en
principio validez interna.
Se considera que tiene validez interna cuando se han aplicado reglas
precisas y replicables y se han controlado las variables confundentes
conocidas y desconocidas.
Para tener validez externa, sus conclusiones se deben referir a
poblaciones real o potencialmente infinitas (universos).
22.3 V e r i f i c a b i l i d a d y R e p l i c a b i l i d a d
La verificabilidad una propiedad de las afirmaciones según la cual,
observando los hechos Ud. puede determinar si son verdaderas o falsas. (24)
Dadas las siguientes afirmaciones:
(I) "El estímulo del interés del alumno produce un mayor rendimiento
académico."
(II) "Los habitantes de Saturno tienen sangre de color amarillo.
diremos que (I) es verificable porque en la práctica se puede determinar
si es cierto o no que estimulando el interés del alumno se aumenta su
rendimiento. Pero (II) no es verificable, porque no hay modo de comprobar
si es cierto que los saturninos tienen sangre amarilla.
Un informe científico está formado por muchas afirmaciones.
Para ejemplificarlo mire los dos modelos de recetas para flan. (76)
Queda en claro que, aunque en el modelo A se dan muchos datos, la receta
no es replicable: no informa la cantidad de los ingredientes, ni los tiempos
o temperaturas necesarias para el horno, etc.
- 189 -
Cuando lee el Modelo B se da cuenta que es replicable sin necesidad de llevarlo a cabo,
porque las instrucciones (el método) se han detallado con la precisión necesaria para la
obtención del producto.
22.4 Conexidad
Inicialmente definimos conexidad como la propiedad por la que, tomándolas
de a pares, las distintas partes de un informe están relacionadas.(15) La práctica
nos mostró que esta definición era demasiado vaga. Hicimos nuevas definiciones
para cada par de componentes (55) que detallaremos en cada apartado en
particular.
- 190 -
Todas las partes del informe deben ser conexas entre sí: el tipo de problema
con: los objetivos, el esquema conceptual, los resultados y conclusiones.
La falta de conexidad afecta la validez interna del trabajo.
De las cualidades mencionadas sólo resta hablar de la coherencia.
- 191 -
Para el análisis del informe interesa la coherencia interna.
Obtenida ésta, para la valoración de las conclusiones en contexto del
conocimiento general interesa la coherencia externa.
Si un informe tiene a - inconsistencias internas y/o b- externas sin
fundamentos empíricos, justificará su rechazo absoluto.
Las externas con fundamentos empíricos justifican rechazos relativos.
La consistencia interna se valora en la totalidad del escrito; la externa,
habitualmente se busca en los apartados de Introducción y de Discusión del trabajo
pero también depende del grado de conocimiento del árbitro.
Para lograr un informe consistente, a medida que redacte, trate que cada
afirmación mantenga consistencia con las precedentes.
Cuando termine la redacción, lea todo el trabajo pesquisando contradicciones,
inconexidades o fallas en la verificabilidad.
También solicite a personas de confianza que lean el manuscrito y ofrezcan
una opinión sincera. Este control heterólogo será de gran ayuda para lograr
un escrito más comprensible y consistente y detectar aspectos pasibles de
rechazos. Conocer de antemano, cuáles pueden ser los motivos de un rechazo
es una ventaja. Si se expone a uno relativo le conviene tener a mano la
documentación que justifique que Ud. eligió un procedimiento aceptable, al
menos por una parte de la comunidad científica.
Por ejemplo hay estadísticos que sostienen que las pruebas paramétricas
llevan a las mismas conclusiones que las no paramétricas cuando el número de
casos es igual o superior a 10 (37). ¡¡¡ Ahora bien... sea práctico(a) !!! Si es igual... es
igual... No se exponga gratuitamente a un cuestionamiento. Si es lo mismo usar
una“paramétrica” que una “no paramétrica” y el comité revisor prefiere una “no
paramétrica”, use ésta y ... ¡¡¡ listo !!!
- 192 -
En cambio de obligar al pueblo a seguir el camino del erudito, debería
ser el erudito quien ayude al pueblo para que logre sus propósitos,
aunque quiera seguir caminos diferentes que los que él tomaría.
- 193 -
23.2 - Secuencia protocolar y resumen protocolar o tipo 1
Según la secuencia protocolar la información a difundir se obtuvo
desarrollando una investigación formalmente protocolizada (65), luego de la
cual se escribió el informe, redactando al final el resumen.
Hay muchas ventajas en hacerlo así, por ejemplo que ya hay partes del futuro
trabajo científico que están escritas en el protocolo, si bien otras deben ser
modificadas y algunas se escribirán por primera vez.
Las partes que ya están escritas (en el protocolo) son: Población y muestras
(Población blanco y accesible; Diseño Muestral ) , Diseño - Materiales y técnicas.
Simplemente las copiará y si, fuera necesario, modificará según lo que hubiera
ocurrido realmente durante la investigación. (65)
- 194 -
En cambio deberá escribir por completo tres apartados nuevos (Resultados,
Conclusiones y Discusión) porque obviamente no podían estar en el protocolo.
Finalmente hay cuatro apartados (Título, Introducción, Resumen y
Bibliografía) que, si bien estaban en el protocolo, no se pueden copiar
directamente porque pueden haber sufrido modificaciones desde el momento
que fueron escritos y van a requerir una versión final que será la que envíe a
impresión.
En el caso del RESUMEN, se lo realiza en el momento cronológico adecuado.
Es como cuando cosecha un fruto en el momento en que está maduro.En
adelante, denominaré a este tipo como resumen protocolar o tipo 1.
- 195 -
Si lo hace de otra manera se expone a errores ya descriptos en la literatura
bajo la forma de discordancias, a veces importantes, entre cuerpo del trabajo y
su resumen . Tengo motivos para opinar que esto se debe a que el cuerpo del TC
se reescribió olvidándose de tomar como referencia al resumen publicado.
En el ap. 2.3 describo una secuencia posible de acciones para redactar el
Resumen pragmático o Tipo 2 antes que el cuerpo del trabajo. Estos
lineamientos apuntan a que al redactar cualquier “Resumen” lo haga de tal
manera que no termine habiendo discordancias con el cuerpo del trabajo final.
- 196 -
9 – Inserte la Definición de Población, copiándola del protocolo. (cap. 8 ) Si hubo
cambios, modifique el apartado ajustándose a los cambios realizados.
10 – Inserte una descripción genérica del Diseño Muestral utilizado. (Por ejemplo:
muestreo accidental, aleatorio simple, estratificado, etc)
11 – Inserte una descripción genérica de la o las muestras obtenidas señalando las
variables de identidad y contexto básicas y cuál era el número de individuos
estudiados en cada muestra. (ap 23.6.3) Si hubo más de una muestra, señale el
grado de equivalencia entre ambas.
12 - Valore la conexidad y coherencia de todo el resumen que acaba de armar.
23.4.2 - Redacción del Resumen Tipo 2B (Si no dispone de protocolo
de investigación)
1 – Obtenga una copia de las INSTRUCCIONES PARA REDACCIÓN DE RESUMENES
que proveen la Institución, Publicación o Evento en el que piensa presentar el
Resumen. Para la redacción, lea el reglamento de publicaciones de la revista
elegida para la publicación y averigüe el formato aceptado y número de palabras
que debe contener: se habla de 150 a 250 (10, 59, 62)
2 – Redacte los encabezados para los apartados que componen un Resumen,
según se lo soliciten en las INSTRUCCIONES. Por ejemplo según los estándares
propuestos por el ICMJE (68) para RESÚMENES ESTRUCTURADOS: contexto o
antecedentes del estudio ; objetivos ; procedimientos básicos : a - selección de
los sujetos o animales de laboratorio que han participado en el estudio, b -
métodos de observación y c - métodos analíticos, principales resultados ;
magnitud de los efectos; significación estadística), conclusiones principales y
fuentes de financiación. Si está escribiendo un resumen de un Ensayo Clínico
consulte el procedimiento CONSORT (88)
3 – Inserte debajo del epígrafe correspondiente los Objetivos según los cuales se
llevó adelante el proyecto.
4 – Inserte debajo del encabezado correspondiente los Resultados principales o
sea sólo los que sirven para sustentar directamente las conclusiones.
5 – Inserte las Conclusiones, debajo del epígrafe del mismo nombre. (ap 23.6.8)
El resumen debería destacar aspectos nuevos e importantes o las observaciones
que se derivan del estudio.
6 – Analice la conexidad entre Objetivos, Resultados y Conclusiones
7 – Inserte una descripción general del Diseño, Materiales y Métodos (DMM)
Ajuste el perfil metodológico del resumen a las mismas exigencias que le solicitan
para el informe completo.
8 – Analice la conexidad del apartado DMM con los objetivos, los resultados y las
conclusiones.
9 – Inserte la Definición que se usó para identificar Población en estudio.
10 – Inserte una descripción genérica del Diseño Muestral utilizado. (Por ejemplo:
muestreo accidental, aleatorio simple, estratificado, etc)
- 197 -
11 – Inserte una descripción genérica de la o las muestras obtenidas señalando las
variables de identidad y contexto básicas y cuál era el número de individuos
estudiados en cada muestra.( ap. 23.6.3) Si hubo más de una muestra, señale el
grado de equivalencia entre ambas.
12 - Valore la conexidad y coherencia de todo el resumen que acaba de armar.
Sea protocolar o pragmático los contenidos del resumen se pueden presentar
en dos formatos.
- 198 -
En el caso de los resúmenes la conexidad aparece como la propiedad más relevante,
desde el momento que es imposible verificar un resumen pues faltan elementos esenciales.
(Cap.16) y éste es el motivo por el cual la información provista en resúmenes no puede ser
aceptada como válida para fundamentar conductas.
B - justifique la investigación
Indique qué espera que cambie si resuelve el problema. Por ejemplo: si analizó
la validez de una nueva prueba de diagnóstico para tuberculosis, indique si es más
barata, más rápida, más aplicable a mayor cantidad de individuos, o todo esto junto,
comparada con las existentes en plaza, etc.
- 199 -
c - Formule los objetivos
Deben tener el formato especificado en el cap. 5. Se pueden ubicar aquí o
inmediatamente después de la "Introducción" .
Deben cumplir condiciones de precisión y conexidad con el resto de los
componentes del informe.
Respecto a la extensión algunos autores aconsejan que la introducción no ocupe
más que media o una y media carilla, de papel tamaño carta, escrito a doble espacio.
- 200 -
c - Descripción de la(s) muestra(s)
Si tiene una muestra y pocas características a describir, hágalo
en el texto. Por ejemplo: “Veintinueve de 233 pacientes (12.4%) fumaban. Veinte
de 233 (8.6%) reconocían ingesta habitual de alcohol. Cuatro de 231 (1.7%)
tenían registro de uso de drogas mayores”
Si son muchas características mejor preséntelas en un listado o tabla, como
le muestro en la Tabla 23.6.3
d - Grado de representatividad de la(s) muestra(s) obtenida(s)
Si el procedimiento de muestreo fue aleatorio, el tamaño muestral está cercano
o supera al necesario y la muestra es semejante, se la considera totalmente
representativa. Esto permite que las conclusiones sean confiables.
Si el procedimiento de muestreo NO fue aleatorio, el tamaño muestral
está cercano o supera al necesario y la muestra es semejante, se la considera
parcialmente representativa. Las
conclusiones en estas condiciones, se
deben considerar hipótesis a comprobar.
Si carece de alguno de esos datos (en caso
de estudios piloto o exploratorios), debe
considerar que faltan datos para determinar
representatividad. Las conclusiones de un
trabajo con este muestreo no se deberían
emplear para tomar decisiones.
c - Grado de equivalencia
En los estudios de comparación a
muestras independientes (ap.14.4.1.1)
fue necesario obtener dos o más
muestras. Ud. debe informar las
características de todos los grupos estudiados y permitir que se hagan las
comparaciones necesarias. Puede describirlas en el texto o usar una tabla
como la 23.6.3.1. Puede elegir una disposición diferente, por ejemplo poniendo
en líneas lo que está en columnas y a la inversa. Cuando escribe un trabajo
sobre un problema de comparación, las muestras independientes no tendrían
que diferir en forma estadísticamente significativa entre sí antes de ser sometidas
a los tratamientos (muestras equivalentes). Informe si esto fue así y en cuáles
pruebas estadísticas funda esta afirmación (tabla 14.6 ) Por ejemplo en la
tabla 23.6.3.1, indicaría que entre ambos grupos de diabéticos, no hubo
diferencias estadísticamente significativas, ni en la proporción de sexos (Chi²
= 2.7; p=0.23) ni en las edades (F= 1.2; p=0.18). Si falta el cálculo para establecer
equivalencia, se justifica rechazo relativo, pero sin no son equivalentes, rechazo
absoluto.
23.6.4 Información que debe figurar en Diseño
Señale las características del diseño empleado según los ejes de clasificación
mencionados (cap. 7), por ejemplo :
- 201 -
... la investigación empleó un diseño PROSPECTIVO, LONGITUDINAL,
EXPERIMENTAL, A DOBLE CIEGO.
... se trató de un estudio PROSPECTIVO - OBSERVACIONAL - TRANSVERSAL
... el trabajo fue RETROSPECTIVO - LONGITUDINAL.
Si el diseño que ha elegido tiene nombre propio, úselo, por ejemplo: ENSAYO
CLÍNICO, ENSAYO CLÍNICO ABIERTO, ENSAYO CLÍNICO CONTROLADO ALEATORIZADO
DOBLE CIEGO , ESTUDIO DE CASOS Y CONTROLES, ESTUDIO DE COHORTE
La falta de identificación explícita del diseño puede justificar un rechazo
relativo aún cuando figuren la descripción de los procedimientos empleados, y
la secuencia de recolección de información.
La falta de consistencia entre la categoría del diseño y los procedimientos
empleados también justifican el rechazo absoluto. Por ejemplo esto
ocurriría si Ud. dice que realizó un “ensayo clínico controlado” y después el
“grupo control”, no es aceptado como tal, por fallas en los métodos de selección
o en la semejanza con el tratado o ambas cosas. La descripción del diseño orienta
al lector acerca del esquema conceptual que usó para resolver el problema.
Objetivos y diseño son conexos cuando el diseño sólo permite producir
información como la buscada a través del objetivo. Por ejemplo un diseño
pensado para comparar no sirve para cuantificar. (cap. 6). Si no hay conexidad
o no se puede determinar, entonces se justifica el rechazo absoluto del trabajo.
- 202 -
"La aquinesia del orbicular se logró con la técnica de O'Brien o Van Lint utilizando
de 5 a 10 cc de Duracaíne 0.5.- La analgesia se obtuvo por bloqueo del ganglio
ciliar inyectando en el espacio retrobulbar 4 cc de Duracaíne 0.5 mezclado con
una ampolla de Unidasa y empleando una aguja de 5 cm, calibre 26."
- 203 -
Bajo este epígrafe, en el informe deberá indicar cómo se recogieron y
procesaron los datos. Raramente necesitará describir la planilla o ficha en la que
registró los datos. Un modo sencillo de resolver el problema consiste en tomarles
una fotografía o escanearla e incluirla en las ilustraciones.
Haga una lista de las variables que fueron registradas, dentificándolas según
categoría.
Para el problema del consumo de sushi (ap. 10.5 ) por ejemplo serían:
VARIABLES EN ESTUDIO : Consumo de sushi , Presencia de complicaciones
cardiovasculares.
COVARIABLES (a modo de ejemplo) sólo pondremos algunas posibles: Tiempo
que se lleva consumiendo sushi, Antecedentes heredofamiliares de patología
cardiovascular, Obesidad, Diabetes.
- 204 -
Además, en toda investigación habrá registrado las VARIABLES DE
IDENTIDAD Y CONTEXTO a saber: Nombre del proyecto, Número de historia
clínica o de ficha , Lugar de realización del proyecto, Año, mes y día, Nombre
del paciente , Sexo biológico, Edad, Número de grupo al cual pertenece el
paciente si hay más de uno, Nombre del investigador a cargo.
Convengamos que los datos pertinentes son los derivados de las
mediciones de las variables en estudio y a controlar, que se usarán para
responder al problema que generó la investigación y de la organización de las
variables identidad y contexto (por ejemplo la descripción demográfica), que
sirven para contextuar la información aunque no responden de manera directa
al problema.
Para el “procesamiento y análisis estadístico de los datos” use el
siguiente modelo (65):
Utilice las partes del modelo que necesite y modifique según su conveniencia.
- 205 -
A partir de 30 casos puede usar estadísticas. Entre 10 y 30, Ud. elige la
manera.
Los “Resultados” apoyan en parte la verificabilidad de las
“Conclusiones” . Lo ideal es que el resto de la comunidad obtenga cifras
parecidas a los que Ud. publicó. Cuando muchas personas encuentran diferencias
es posible que duden del trabajo... pero ya estará publicado. Si hizo un buen
trabajo no lo menosprecie. (ap. 23.6.9.4)
Teniendo los resultados puede valorar la conexidad con los objetivos. Convengamos
que la categoría Indeterminable corresponde a los informes en los que faltan los
objetivos y/o los resultados. Dirá que hay Conexidad Total cuando con los
resultados puede producir toda la información buscada en los objetivos y parcial
cuando sólo se puede producir parte de la misma. Si no existe Conexidad Parcial
o T otal entonces se asigna categoría Inconexo.
Si le faltan resultados, no puede sustentar las conclusiones que pierden su base
empírica. La indeterminabilidad de y/o la inconexidad justifican el rechazo absoluto
y la conexidad parcial, el rechazo relativo.
Para los datos derivados, se agrega la condición haber empleado las reglas
indicadas para cada escala de medición. Por ejemplo: la mejor circunstancia
para emplear una media aritmética se da cuando los datos primarios han sido
obtenidos en una escala de medición de intervalar y su distribución sea normal.
(3, 23) Esta “falla” pueden justificar sólo rechazos relativos ya que hay
posibilidad de usar ciertas estadísticas independientemente de la escala de
medición de la variable. (19)
- 206 -
La secuencia sería la siguiente:
a - Determine la CONEXIDAD ENTRE OBJETIVOS Y CONCLUSIONES según
las siguientes reglas: Indeterminable: ausencia de objetivos y/o conclusiones;
Conexidad Total: las conclusiones ofrecen toda la información buscada en los
objetivos y nada más que esa. Parcial cuando ofrecen parte. Inconexidad: ausencia
de conexidad. La indeterminabilidad y la inconexidad justifican un rechazo
absoluto. La conexidad parcial justifica un rechazo parcial, si los objetivos y los
resultados son conexos. (cuadro 23.6.8)
- 207 -
Desde un punto de vista práctico el análisis de conexidades puede limitarse
a determinar las duplas objetivos - resultados y luego resultados - conclusiones.
Cualquier situación diferente de la conexidad total entre los distintos
componentes, justifica grados diversos de rechazo del informe.
- 208 -
Si su dura realidad es ésta, no intente publicar ... a menos que esté frente a
un gran descubrimiento. En este caso hipotetice, pero nunca afirme... porque
no puede.
23.6.9.2 Valoración de la Consistencia Externa del informe
a - Señale los límites de los hallazgos y sus posibles implicaciones.
b - Publicaciones previas: si otros autores habían escrito trabajos similares
compare los procedimientos empleados y las conclusiones con las suyas,
analizando los méritos y validez de cada trabajo. Utilice, citas elegidas y sobre
la misma materia, no repetitivas ni históricas. (10)
c -Compare con objetividad, sus resultados con los publicados. Explique claramente
las diferencias que existan con otros autores, tanto en la selección del material
como en el método seguido y en los resultados. La citas provenientes de otras
publicaciones se harán con precisión, sin eliminar frases o palabras.
d - No omita evidencias provenientes de otros autores con el propósito de que
la investigación propia aparezca como única o más importante. Si un trabajo
sobre la misma cuestión publicado con anterioridad llegó a idéntica conclusión,
no se debe enmascarar su cita en la Discusión (60)
e - Busque contrapruebas merecedoras de presentación y valoración. Las
evidencias ajenas que apoyan los hallazgos propios no deberían constituir las
únicas pruebas que se presenten en Discusión. (60)
- 209 -
Algunas recomendaciones serían:
No reclame una aparente prioridad.
NO la haga innecesariamente extensa.
NO revise el tema a fondo : muchos autores que han recogido abundantes citas
bibliográficas, no se resignan a excluirlas de la Discusión, haciendo de ella una
simple revisión de otros artículos.
NO discuta conocimientos aceptados como válidos o incluso disponibles en libros
de texto.
NO insista con datos colaterales
NO realice afirmaciones sin fundamento empírico
NO finalice proponiendo la elaboración de otro trabajo. Es censurable que finalice
un artículo sobre una investigación mal planeada o deficiente proponiendo que
se haga otra mejor o que se requieren más trabajos con mejor diseño para
precisar las dudas que ha dejado el actual, a menos que la contradicción entre
las evidencias propias y los otros ensayos no se pueda justificar y la discrepancia
sólo puede ser resuelta a través de un nuevo estudio, (10, 59)
No incluya las CONCLUSIONES primarias o internas.
Tampoco re escriba los RESULTADOS o enunciados formulados en la
Introducción.
- 210 -
Una alternativa es finalizar la DISCUSIÓN delimitando las líneas por las cuales
se debería profundizar la investigación.
Los distintos apartados ya están escritos. Es tiempo de ensamblar.
- 211 -
Una alternativa es finalizar la DISCUSIÓN delimitando las líneas por las cuales
se debería profundizar la investigación.
Los distintos apartados ya están escritos. Es tiempo de ensamblar.
- 212 -
11- Resumen : bajo el encabezado correspondiente inserte el Resumen que
hubiera preparado a partir del ap.23.5
Si ya lo había publicado previamente (por Congreso, Jornada, etc) corrobore que
no existen discordancias entre el Resumen publicado y el resto del escrito actual.
Si el Resumen ya había sido publicado, podría optar por usar el procedimiento de
Redacción con Resumen publicado.
- 213 -
10 – Discusión y Comentarios : bajo el encabezado correspondiente inserte
la Discusión que hubiera preparado.Coteje lo escrito con las instrucciones
recibidas y el ap. 23.6.9
11- Resumen: bajo el encabezado correspondiente inserte el Resumen que
hubiera preparado. Muy probablemente lo había publicado (por Congreso,
Jornada, etc) Si fue así no cambie ni una coma y corrobore que no existen
discordancias entre con el resto del escrito actual. Coteje lo escrito con las
instrucciones recibidas y el ap.23.5
- 214 -
La información que se busca se refiere a los valores de una variable o a una
hipótesis que trata de establecer relaciones entre variables ( ap. 4.2). Así que en
el título tienen que figurar, de manera genérica, las soluciones halladas : si se
buscaban cifras, señalando las estadísticas obtenidas, y si se testeaba una
hipótesis, si fue corroborada o no. Por lo tanto, en un primer borrador indique
qué información se ha encontrado y la población blanco. Luego aplique las reglas
de sintaxis necesarias.
Es sabido que algunos índices (Current Contents) seleccionan las palabras clave de
acuerdo con la información contenida exclusivamente en el título del artículo. (89) Esto
refuerza la posición exponer la información obtenida y la población blanco.Puede
también consultar literatura especializada sobre el tema de Redacciones Científicas
(10,59, 60, 61) O buscar ideas en Internet, googleando como palabras clave : título, trabajo
científico, redacción.
- Emplee todos los signos de puntuación que precise, a excepción del punto final, del
cual se prescinde por convención tipográfica (cuantos menos signos, mayor atracción)
- Incluya el nombre del grupo en caso de autoría corporativa.
- Aluda a conceptos de diseño (por ejemplo, estudio multicéntrico, asignación
aleatoria, estudio controlado, etc) para facilitar búsquedas de literatura.
- Si el artículo es parte de una serie, emplee el mismo título para todos los artículos ,
seguido por una oración o sintagma que aporta la diferencia que existe entre ellos.
Por ejemplo: La resonancia magnética nuclear indicaciones (I) - La resonancia
magnética nuclear técnica (II) La resonancia magnética nuclear resultados (III)
- Evite las expresiones retóricas como «consideraciones acerca de ..», «a
propósito de un caso de ...», <da fiebre tifoidea en nuestro medio ..», «revisión
de la literatura a propósito de un caso de ..» - No incluya abreviaturas. En caso
de que resulte excesivamente largo, puede emplear una abreviatura
ampliamente conocida. Cuando sea posible añadir un subtítulo al título
ampliando o matizando su contenido, considere que - no debe contener más
del doble de caracteres que el título - debe tener sentido por sí mismo; es
decir, aunque esté relacionado con el título, no debe ser su continuación.
Para redactar su trabajo, habrá tenido que leer muchos de otros autores.
Habrá descubierto empíricamente que, si bien hay mucho publicado, son escasos
los escritos valiosos. Tal vez hubiera querido disponer de un método para
seleccionarlos y no perder tiempo con información no válida. Precisamente ese
es el tema del próximo capítulo.
- 215 -
24 - TÉCNICA DE LECTURA CRÍTICA DE INFORMES
CIENTÍFICOS: OPD SIMPLIFICADA
Textualmente se lee en la página del Journal of Evidence Based Medicine
: “ … el EBMJ escanea más de 120 journals anuales, unos 50000 artículos de
los cuales selecciona aproximadamente 0.5%” (90)
Existe consenso, en el sentido que la oferta de información es abundante.
Pero hay investigaciones (23, 27, 42, 44,52, 54, 57) que indican que más de un
70 % de los trabajos evaluados tienen fallas en su validez. Algunos autores
(entre quienes me incluyo) considera que menos del 1 % de lo publicado es
simultáneamente válido y de aplicación clínica inmediata (52, 57,58,81)
Leyendo indiscriminadamente toda la información publicada Ud perdería al
menos un 70% de su tiempo. La solución: identificar rápidamente los trabajos
válidos. Esto lo pueden hacer, en diverso grado : expertos en el tema,
estadígrafos relacionados con Ciencias Médicas, metodólogos, epistemólogos,
epidemiólogos y, actualmente, evidenciólogos.
Se han propuesto técnicas relativamente complejas (23, 27, 42,81). Comparto
parcialmente sus principios ya que tienen un sesgo hacia los aspectos estadísticos,
en desmedro de los lógicos, que a mi entender deberían ser prioritarios.
Por mi parte he venido perfeccionando un procedimiento desde 1985 (15)
que denominé técnica OPD por las iniciales de los primeros tres componentes
del análisis: Objetivos, Población y Diseño. Con el tiempo llegué a organizarla
de tal modo que la aplico en las dos etapas que relato en el apartado siguiente.
Parto del principio que ciertos componentes del informe son rápidamente
identificables y cuando tienen fallas, justifican el rechazo absoluto.
- 216 -
Otra cosa sería decir que la información es FALSA, pero eso no le consta por
la sola lectura del trabajo.
En contraposición, si cumple con todos los requisitos, catalogará el trabajo
como “APTO para justificar una conducta o documentar una investigación”. Otra
cosa sería decir que la información es VERDADERA, pero eso tampoco le consta
por la sola lectura del trabajo.
La aplicación de técnicas completas consume tiempo, que se puede ahorrar
dividiendo la tarea en dos: primero un screening rápido con la técnica simplificada
para categorizar los trabajos en “no apto” o “presuntamente apto”; en una
segunda etapa se analizarían los presuntamente aptos, con procedimientos más
laboriosos para su aceptación o descarte final.
Nuestra técnica OPD simplificada se aplica en 30 segundos y tiene un poder
predictivo positivo del 100 %. O sea el 100 % de los trabajos cuestionables,
efectivamente “tienen validez cuestionable" y por lo tanto la información que
proveen se debe considerar como “no apta…” aunque pueda ser muy interesante
como propuesta teórica. Posee un poder predictivo negativo que se puede
estimar en un 85 %. Es decir que un 15 % de los trabajos “presuntamente aptos”
aún pueden ser cuestionables en una segunda evaluación. Piense en este
procedimiento como una receta inicial. Si quiere hacer un flan y no sabe, iría a un
libro de cocina y seguiría la receta hallada. Después de cocinar muchos flanes,
seguramente tendrá una receta propia. La receta que le ofrezco es solo para
empezar. Con el tiempo Ud tendrá la suya.
- 217 -
Si objetivos y conclusiones son conexos pase al siguiente punto, si no
termine su lectura crítica aquí. Ya puede dictaminar que el trabajo es “NO
APTO”. Seguramente no querrá creerme, así que siga hasta que esté
convencido… Pero recuerde que le avisé.
PASO 4 - Valore la definición de población: Categorice la definición de
POBLACIÓN en COMPLETA, INCOMPLETA, AUSENTE. Es completa cuando se
han formulado los criterios de inclusión y de exclusión, y si fuera necesario los
de eliminación. La definición de población está ausente o incompleta termine
su lectura crítica aquí. Ya puede dictaminar que el trabajo es “NO APTO”.
Pero si ha llegado hasta aquí siguiendo secuencialmente los pasos 1 a 4, y
en ningún momento pudo rechazar el trabajo entonces puede declararlo
“presuntamente apto” y ponerlo aparte para analizarlo en mayor profundidad,
ya sea con la OPD completa o con cualquier otra técnica, como por ejemplo
según medicina basada en evidencias.(90)
- 218 -
24.4 - Comparación entre OPD y MBE
- 219 -
25 - SÍNTESIS
Al finalizar el año lectivo, cuando se despiden educandos del mismo nivel,
prácticamente se dicen las mismas cosas. Mucho de lo que expresaré aquí,
estuvo en la página final de Principios.
Tal como le planteé las cosas la única manera de hacer investigación científica
es hacerla bien, es decir siguiendo las reglas del método científico. También está
en claro que hay muchas maneras de hacerlas bien, si respeta la validez interna.
Para que Ud. lo logre deberá tener deseos, tiempo, conocimiento y posibilidad
de consulta.
a) DESEOS: los adultos han aprendido que sólo logran lo que intentan, y solo
intentan aquello que quieren.
b) TIEMPO: la carencia de tiempo es un factor que el profesional suele
considerar limitante. Hay dos maneras de que le "falte tiempo": verdaderamente
le falte (nada que hacer !!!) o administra mal el tiempo que tiene. Trate de no
hallarse entre aquellos colegas que usan cantidades importantes de tiempo y otros
recursos, para llevar a cabo "trabajos" anodinos llamados injustamente
"investigaciones". Esos recursos podrían ser orientados a producir un número
menor de trabajos científicos, pero bien realizados.
c) CONOCIMIENTO BÁSICO DEL MÉTODO CIENTÍFICO: lo puede lograr a
través de programas organizados por instituciones educativas y/o asociaciones
profesionales. De éstos dispone una profusa oferta, tanto online como
presenciales, tanto pagos, como gratuitos.
Si participó de cursos de Metodología sabrá que pueden aparecer diversos
inconvenientes: el más común es que se trata de cursos de Estadística o
Epistemología, con el nombre cambiado. Raramente ofrecen un nivel de
entrenamiento que permita que el alumno aplique esa información en la práctica.
Parecería que una cosa es recibir formación en las aulas, y otra, poderla aplicar
efectivamente a investigaciones propias. De allí la trascendencia del apartado que
sigue.
d) POSIBILIDAD DE CONSULTA: hay evidencias que indican que muchos
profesionales médicos (incluso publicadores habituales) con frecuencia cometen
errores, que hubieran sido fácilmente evitados por el experto en Metodología.
(42, 44, 50). También existen principiantes o quienes, esporádicamente desean
participar del proceso de producción de información (como los investigadores
curriculares) y en ese momento notan las falencias formativas (65)
Puede ocurrir que el investigador no use una técnica, (por ejemplo estadística)
porque le es desconocida o porque fue entrenado en ella mucho tiempo atrás.
En ambos casos puede recurrir a la bibliografía, pero raramente alcanzará un
grado aceptable de certidumbre al momento de formular conclusiones.
- 220 -
Las instituciones que deseen tener un cuerpo de profesionales bien preparado
en asuntos de investigación debe proveer las oportunidades para que ellos reciban
entrenamiento y consulten con expertos cuando lo consideren necesarios.
***
- 221 -
http://www.institutodemetodología.net
http://goo.gl/bXQWqs
Calculo de intervalos de
confianza http://graphpad.com/quickcalcs/Cimean1/
Tablas de 2 x 2 todos los http://www.statpages.org/ctab2x2.html
cálculos necesarios (riesgo, cribaje,
pvalor, etc
Cálculo tamaños muestrales http://goo.gl/vFYk1o
http://goo.gl/qYTrg0
http://goo.gl/Ucn4F6
ESCRIBA http://1drv.ms/1L7M911
- 222 -
- 223 -
1.Arnau Grass J: Diseños experimentales en psicología y educación. Mexico: Trillas, 1981.
2.Asti Vera Armando: Metodología de la investigación. Buenos Aires: Kapelusz, 1973.
3.Armitage P., G. Berry: Estadística para la investigación biomédica. 2a Ed Barcelona. Doyma, 1992.
4.Barbancho Alonso G.: Estadística Elemental Moderna. 5a Ed. Barcelona. Ariel,1978.
5.Barker,S F: Inducción e hipótesis. Buenos Aires. Eudeba: 1963
6.Bernard, C: Introducción al estudio de la Medicina Experimental. Buenos Aires. Losada:1944
7.Bernard,C: Curso de medicina experimental. Córdoba (RA). Assandri:1944
8.Bunge, M: La investigación científica. Barcelona. Ariel: 1969
9.Bunge Mario: La ciencia, su método y su filosofía. Ed. Siglo XX. Buenos Aires. 1980.
10.Caldeiro MA,Feliu E,Foz M,Gracia D,Herranz G : Manual de estilo de publicaciones
biomédicas. Barcelona: Doyma, 1993.
11.Cañedo Dorantes L: Investigación Clínica. Mexico: Interamericana, 1987
12. Carnap R: Fundamentación lógica de la física. Barcelona, Sudamericana,1969.
13. Castiglia,V C: El profesional y la actitud científica en el subdesarrollo.Rev.Arg.Ped. 1983;8:45-55
14. Castiglia,VC: Curso de introducción a la metodología de la investigación. Buenos
Aires. Ediciones Pediátricas Argentinas:1984
15. Castiglia,V C: Cómo preparar un trabajo científico. Arch.Arg.Pediatr. 1985;83:269–277
16. Castiglia,VC : El asesor metodológico: un nuevo miembro del equipo de investigación?
Rev. Hosp. Clin.Bs.As. 1987;3:25-32
17. Castiglia VC: Asesoramiento científico en un hospital universitario. Ocho años
dexperiencia (Resumen) Rev. Hosp. Clin.Bs.As. 1994;8:9-11
18. Cedrato AE, Ferrero NA, Ray CA: Pediatría. Buenos Aires: El Ateneo, 1992.
19. Clarke G.M.: Statistics and experimental design. 2nd Ed. London. Edward Arnold
Publishers, 1980.
20. Colacilli de Muro M. A., Colacilli de Muro J. C.: Elementos de la lógica
moderna y filosofía. Ed. Estrada. Buenos Aires. 1981.
21. Copi Irving M.: Introducción a la lógica. 18a Ed Buenos Aires. EUDEBA,1967,1974.
22. Cuttler SJ, Ederer F: Maximum utilization of the life table method in analyzing
survival. J Chron Dis 8: 699-712; 1958.
23. Dawson-Saunders Beth, Trapp Robert G.:Bioestadística Médica. México. 3ra
Ed Manual Moderno, 2002.
24. Diccionario de la lengua española: Real Academia Española. 21a Ed Madrid.
Espasa Calpe, 1992.
- 224 -
25. Fowler Newton E.: El muestreo estadístico aplicado a la auditoría. Buenos
Aires. Macchi, 1972.
26. Galtung Johan: Teoría y método de la investigación social. Buenos Aires:
Eudeba, 1973. (2 tomos)
27. Glantz, SA: Biostatistics: How to detect and prevent errors in the medical
literature. Circulation, 61; 1-7,1980.
28. Hayman John L.: Investigación y educación Buenos Aires: Paidós, 1978.
29. Hulley,SB; Cummings SR: Designing clinical research: an epidemiological
approach. Williams & Wilkins. Baltimore. 1987
30. International Ethical Guidelines for Biomedical Research Involving Human
Subjets, Geneva, Council for International Organizations of Medical Sciences
(CIOMS), 1993. En Progress in Human Reproduction Research, Nº 26,
1993 (UNDP/UNFPA/WHO/ World Bank Special Programme of Research,
Development and Research Training Human Reproduction). Traducción de
Isabel Plachner de Molinero, publicada en Medicina y Sociedad, 1994:(17),44-47.
31. Klimovsky G: Las desventuras del conocimiento científico. Una introducción
a la espistemología. Buenos Aires: AZ, 1994.
32. Lawrence M. Friedman, Curt D. Furberg, David L. DeMets: Fundamentals
of Clinical Trials, 2nd Ed. Massachusetts. PSG, 1985.
33. León Orfelio G., Montero I.: Diseño de investigaciones: Introducción
a la lógica de la investigación en Psicología y Educación. Madrid. McGraw-Hill,
1993.
34. Lewis-Beck M: Applied Regression: an introduction. Sage Publications
California, 1980.
35. Matthews DE, Farewell VT: Estadística Médica: aplicación e interpretación.
Barcelona: Salvat, 1988.
36. Nelson WE, Vaugham III VC, McKay JR: Tratado de Pediatría. Barcelona:
Salvat, 6ª Ed. 1ª Reimp, 1973.
37. Nickerson C. A., Nickerson I. A.:Statistical analysis for decision making.
New York: Petrocelli Books, 1978.
38. Ostle B.: Estadística Aplicada. México: Limusa, 1977.
39. Pedhazur EJ: Multiple regression in Behavioral Research. Explanation and
Prediction. Fort Worth (USA): Harcourt Brace College, 1982.
40. Polit D, Hungler B: Investigación científica en Ciencias de la Salud.
Mexico:Interamericana, 1985.
41. Popper Karl R.: La lógica de la investigación científica. Ed. Tecnos.
Madrid. 1977.
- 225 -
42. Riegelman Richard K., Hirsch Robert P.: Cómo Estudiar un estudio y
probar una prueba: lectura crítica de la literatura médica. 2a Ed. Washington,DC:
OPS, 1992.
43. Robert Michèle: Fondements et étapes de la recherche scientifique en
psychologie. 3a Ed Québec. Edisem, 1988.
44. Ross OB: Use of controls in medical research JAMA 145:72-75,1951
45. Siegel, Sidney: Estadística no paramétrica. 2da DE. 2da Rev. México.
Trillas 1975.
46. Sierra Bravo Restituto : Diccionario práctico de estadística. Madrid. Paraninfo, 1991.
47. Tarski, Alfred: Introducción a la lógica y a la metodología de la ciencias
deductivas. 3° ed. Espasa Calpe S.A. Madrid, 1977.
48. Van Dalen D. E., Meyer W. Y.: Manual de técnica de la investigación
educacional. Ed. Paidós. Buenos Aires, 1982.
49. Voltes Bou Pedro: La teoría general de los sistemas. Ed. Hispano Europea.
Barcelona, 1978.
50. Wulff, HR: Rational diagnosis and treatment. Oxford: Blackwell Scientific
Publications, 1976.
51. Castiglia,V C: Principios de Investigación Biomédica. Buenos Aires. Estudio
de Proyectos Científicos:1995.
52. Arribalzaga EB, Giuliano RJ. Reflexiones ante el análisis de una publicación
científica Rev. Arg. Cirug. 59; 242-249,1990.
53. Schulman K, Sulmasy DP: Ethics, Economics and the publication policies
of major medical journals. JAMA 272; 154-156, 1994
54. DerSimonian R, Charette JL, McPeek B, Mosteller F: Reporting on methods
in clinical trials. N Eng J M 306;1332-1337, 1982
55. Castiglia, VC, Neustadt EN, Grinspon D, Lujan S: Errores metodológicos
en resúmenes de trabajos científicos Rev. Hosp. Clin.Bs.As. 1996;3:21-28
56. Castiglia, V.C. Investigación Clínica, Información Científica y Validez.
Rev.Arg.de Urol., 60: IV-VI, Editorial, 1995.
57. Aiello, C.L. Estudio estadístico cualitativo de trabajos publicados sobre
temas de Ortopedia y Traumatología. Rev. Asoc. Arg. Ortop. y Traumatol.,
53 (4): 519-525, 1989.
58. Morris, R.W. A statistical study of papers in The Journal of Bone and
Joint Surgery (BR). JBJS 70-B (2): 242,1988.
59. Hernandez Vaquero D: El artículo científico en Biomedicina: normas
para la publicación de trabajos Barcelona. 2da Ed. CIBA-GEIGY SA. 1993
- 226 -
60. Huth EJ: Cómo escribir y publicar trabajos en ciencias de la salud.
Barcelona.Ediciones Científicas y Técnicas. 1992.
61. Day RA: Cómo escribir y publicar trabajos científicos. OrganizaciónPanamericana
de la Salud. Whashington. 1990
62. Requisitos de uniformidad para manuscritos enviados a revistas biomédicas:
Redacción y preparación de la edición de una publicación biomédica Actualizado
en Abril de 2010 Traducción de: Uniform Requirements for Manuscripts
Submitted to Biomedical Journals (Updated April 2010) Comité Internacional
de Editores de Revistas Médicas (ICMJE) www.ICMJE.org.
63. Gibbs WW: Ciencia del Tercer Mundo. Investigación y Ciencia. Diciembre
1995. pp72-79.
64. Miguel H, Baringoltz E: Problemas epistemológicos y metodológicos.
Buenos Aires. CBC Editora.1996.
65. Castiglia VC: Manual de investigación para principiantes. La imprenta digital.
Buenos Aires, 2015
66. Castiglia VC, Castiglia NI: Medios diagnósticos: un enfoque médico del
problema de la sensibilidad y otras pruebas de cribaje. Síntesis en Imagenología
Médica 2001; 2:53-56
67. Castiglia VC: 100 ejercicios de estadística y epidemiología. La imprenta
Digital. Buenos Aires, 2014
68. Castiglia,V C: Principios de Investigación Biomédica. Buenos Aires. Ed. Gráfica
Sur. Buenos Aires, 1998.
69. Gardner MJ, Altam DG : Confidence intervals rather than P values: estimation
rather than hypotesis testing. British Medical Journal, 1986; 292: 746-750
70. OPS: Guía para escribir un protocolo de investigación. Washington DC
20037-2895 - USA - 2005
71. Canales FH, Alvarado EL; Pineda EB: Metodología de la Investigación Manual
para el desarrollo de Personal de Salud. Publicación PASCCAP Nro 16 – Serie
PALTEX – ORGANIZACIÓN PANAMERICANA DE LA SALUD – Editorial Limusa.
México. 1986
72. Silva Aycager LC: Cultura estadística e investigación científica en el campo de
la salud: una mirada crítica. Diaz de Santos . Madrid.1997
73. Ruíz Morales A ; Morillo Zárate LE: Epidemiología Clínica - Investigación clínica
aplicada Ed. Médica Panamericana. Bogotá. Colombia 2004
74. Londoño F, JL : Metodología de la investigación epidemiológica. Editorial El
Manual Moderno. Bogotá. 2004 3ra Ed.
- 227 -
75 - NCI Dictionary of Cancer Terms: www.cancer.gov/publications/dictionaries/cancer-terms
76 - Receta de flan (Obtenida de: http://www.kiwilimon.com/receta/postres/flan-
napolitano-tradicional el 03/02/16)
77. Bancroft H: Introducción a la bioestadística. Eudeba. Buenos Aires, 1960.
78. Gómez Plascencia y Castillo J: Búsqueda Bibliográfica en bases de datos de
Internet en Martínez y Martínez: Como escribir un texto en ciencias de la salud.
Anatomía de un libro - Capitulo 6 – 2ª edición Manual Moderno – Mexico - 2002
79. Llanos CA: Metodología del trabajo intelectual y orientación universitaria.
Buenos Aires. Tekne, 1982.
80. Polgar S, Thomas SA: Introducción a la Investigación en Ciencias de la Salud.
Alhambra Longam SA. Madrid. 1993
81. Sackett D L , Straus S E, y col. : EVIDENCE – BASED MEDICINE - How to
practice and Teach EBM - Churchill Livingstone – Toronto 2000 - Second Edition.
82. Castiglia VC: Evaluando educandos: ¿ Monografía o Trabajo Científico ?
Inmanencia 2011; 1:40-44
83. Celis de la Rosa, A: Bioestadística. El Manual Moderno. Mexico 2004
84. Clarke M, Oxman AD, editores. Manual del Revisor Cochrane 4.1.6
[actualización enero 2003]. En: The Cochrane Library, Número 1, 2003.
Oxford
85. OPS: Guía para escribir un protocolo de investigación. Washington, D.C
20037-2895 - USA. 2005
86. Fagan TJ. Letter: nomogram for Bayes theorem. N Engl J Med.1975;293:257
87. Pitkin RM, Branagan MA, Burmmeister LF: Accuracy of data in abstracts of published
research articles. JAMA 1999;281(12):1110 -1111
88. Cobos-Carbó A, Augustovski FB: Declaración CONSORT 2010: actualización de la
lista de comprobación para informar ensayos clínicos aleatorizados de grupos paralelos.
CONSORT 2010 Declaration: Updated guideline for reporting parallel group randomised
trials. Med Clin (Barc). 2011;137(5):213–215
89. American Psychological Association: Publication Manual. 6th Ed. Whashingtong DC
2010
90. Evidence Based Medicine Journal Site. Perfomance. http://www.cebm.net/evaluating-
performance/ (24/04/16)
- 228 -
- 229 -
Índice Alfabético
A
a dos colas
hipótesis 110
abandono de hipótesis 180
ABC, área bajo la curva 142
afirmación
definición 95
alfa y confianza, relación 103
alfa, definición del nivel 103
análisis de regresión
definición 157
ecuación fundamental 157
ecuación fundamental, simplificación 162
interpretación del coeficiente “b” en el análisis bivariado 161
la meta es predecir 162
la predicción es la meta 162
reglas de interpretación de la pendiente 161
uso heurístico, descubrir relaciones 168
uso ponderativo 167
uso predictivo 166
análisis multivariado, definición 163
ANOVA 116
ANOVA para mediciones repetidas 116
asesor científico,aspirante 17
área bajo la curva, nulo rendimiento 142
área bajo la curva, rendimiento máximo. 142
B
background del problema 40
balanceo 117
base empírica 40
base poblacional 134
base teórica del problema 40
- 230 -
bioética
alicientes para la participación 183
inducción indebida 183
bioética de estudios epidemiológicos 183
C
calcular de intervalos de confianza para proporciones 83
calcular IC 95 % para promedios,regla práctica 82
calcular IC 95 % para proporciones, regla práctica 84
calcular intervalos de confianza para un promedio 81
calcular intervalos de confianza, formula general 81
casos y controles, realización de estudios 134
ceguera 54
censados, pacientes en tablas de sobrevida 128
certidumbre, definición 97
chance 135
ciego simple 54
clasificación de problemas, motivo e importancia 29
cociente de probabilidades positivo y negativo 140
coeficiente de correlación
de Pearson 151
definiciones 150
efecto del tamaño muestral en 152
interpretación de la significación 152
significación 152
significación por intervalos de confianza 151
valor absoluto, interpretación 153
coeficiente de correlación, no significativo 152, 153
coeficiente de correlación,intervalos de confianza 151
coeficiente de determinación múltiple ajustado 168
coeficiente de determinación, definición 154
coeficientes de correlación 150
coeficientes de regresión
interpretación 159
interpretación del coeficiente “a" 162
nomenclatura 158
ordenada al origen 159
pendiente 159
- 231 -
razonamiento para su obtención 158
sinónimos 158, 159
coherencia externa 187
cómo elegir el error beta 105
cómo elegir un nivel de significación 103
cómo usar este libro 15
comparación entre OPD y MBE 218
comunidades subdesarrolladas, en investigación 182
conceptos clasificatorios 69
conclusión estadística 84
conclusión informativa 84
conclusión técnica 103
conclusiones derivadas 206
conclusiones externas 206
conclusiones informativas para la población
en problemas de comparación 122
conclusiones internas 206
conclusiones primarias 206
conclusiones, definición 206
conexidad 190
de objetivos y diseños 202
confianza, significado y uso del término 35
conocimiento
definición 19
consecuencias, de las decisiones 107
consentimiento informado 181
conducta del investigador 182
consistencia 191
consistencia externa 191
consistencia interna 191
constante
definición 42
construcción de teorías, con el MHD 178
contexto de descubrimiento 15
contexto de justificación 15
contrastación
definición 96
contrastación, procedimiento 177
- 232 -
control
de la subjetividad 54
de variables desconocidas en estudios de comparación 118
de variables irrelevantes 44
intersujeto 55
intrasujeto 55
usando CRITERIOS DE EXCLUSIÓN 44
control de variables en muestras independientes 117
control estadístico, definición 112
control experimental, definición 112
control, definición del concepto 43
correlación, cómo se mide 148
correlación, definición 147
corroboración 174
de una hipótesis, consecuencias 176
definición 97
corroboración de hipótesis
definición 97
covariables
control de covariables conocidas 57
procedimientos de control en estudios de comparación 117
covariables, definición 43
CPN, cómo se interpreta 144
CPP, interpretación 144
criterio de eliminación, definición 58
criterio de estrechez de intervalos de confianza 85
criterio universal de exclusión 58
criterios generales de elección del tema 26
curvas,de referencia para valores normales 91
D
dato derivado 73
dato primario 73
dato, definición 69
datos
definición de codificación 74
depuración 76
derivados o elaborados 73
- 233 -
digitalizar, definición 76
primarios o brutos 73
datos pertinentes, definición 205
decisión clínica 84
decisión clínica y decisión estadística 122
decisión operativa 103
depuración de datos 76
desconocimiento
como control de subjetividad 54
diseño
definición 53
diseño a muestra única, definición 116
diseño muestral, operatoria 63
diseños
clasificación según la información buscada 53
clasificación según método 53
clasificación según número de muestras 116
doble ciego 54
E
ecuación de regresión
fórmula 157, 159
razonamiento para su obtención 157
sinónimos de la ecuación 158
efecto, en la relación causa efecto 169
elegibilidad
criterios de 57
eligiendo un título para el trabajo 213
endpoint, definición 74
enmascaramiento 54
ensamblado, del trabajo científico 211
ensayo clínico 55
enunciados contrafácticos
definición 96
equilibración 117
error beta, definición 105
error tipo alfa 103, 105
error tipo I 103, 105
- 234 -
error tipo II, definición 105
errores
consecuencias empíricas 104
en la contrastación de hipótesis probabilísticas 104
escala nominal, definición 70
escala, definición 69
escalas
ordinales con base numérica 70
ordinales, ejemplos 70
escalas de medición
de proporción 71
definición 69
escala ordinal con base nominal 70
intervalares o de intervalo 71
nominales 69
ordinales 70
especulaciones 210
esquema conceptual
para problemas de correlación - regresión. 149
para problemas de relación causa efecto 170
esquemas conceptuales
definición 47
etapas 47
ventaja resultante de pensar 47
esquematizar investigaciones para estimar coeficientes de correlación y
regresión 49
esquematizar investigaciones para estimar DIFERENCIAS entre
parámetros ( comparación) 49
esquematizar investigaciones para estimar parámetros ( problemas de
cuantificación) 48
estadísticas
definición de 35
medidas de dispersión 79
medidas de tendencia central 79
estadísticas. definición 78
estadístico Z 83
estimar parámetros poblacionales 80
estimar, significado y uso del verbo 35
estudio de factores de riesgo
- 235 -
modelo de casos y controles 134
modelo de cohorte 130
estudios de cohorte, operatoria para realizar 132
estudios de factores de riesgo
preguntas a responder 133
etiología, concepto 169
eventos,definición 177
F
ficha de registro
definición 75
ficha registro
proceso de construcción 75
formular conclusiones para intervalos de confianza de promedios 82
formular conclusiones para intervalos de confianza de proporciones 84
formular objetivos para hipótesis (Variante 1) 38
formular objetivos para problemas de hipótesis (Variante 2) 39
G
gráfica de Gantt 186
graficar esquema estimación coeficientes correlación, regresión. 48
graficar esquema estimación de parámetros 48
gráfico de dispersión 159
gráfico de regresión 159
H
hipótesis
de no diferencias, definición 102
definición 95
del investigador, definición 102
docimasia de, definición 102
formulación para problemas de comparación 109
nula, definición 102
nula, formas de 110
valor de verdad 95
hipótesis a una cola 111
- 236 -
hipótesis ad hoc 180
hipótesis alternativa 110
hipótesis alternativa, definición 102
hipótesis bidireccionales 110
hipótesis cero para curvas de sobrevida 127
hipótesis cero, definición 102
hipótesis determinísticas 169
hipótesis nula
en estudios de correlación regresión 152
hipótesis nula, fallo en rechazar 103
hipótesis unidireccional 111
Ho correspondientes Ha bidireccionales 110
I
ignorancia, definición 3
incertidumbre, definición 97
incidencia 90
inescrutabilidad 173
inferencia 80
inferencia estadística 80
inferencia, definición 80
información
definición 19
información, definición 19
informar la conclusión en estudios de proporciones poblacionales 84
informar la conclusiones sobre promedios 83
informe científico 187
informe científico,consistencia o coherencia 191
interpretación
de prevalencia 90
tablas de sobrevida para un grupo 92
tasas 89
interpretación de
de bandas de tolerancia 87
incidencia 90
interpretar intervalos de confianza de promedios 83
intersujeto 50
intervalo de confianza, significado y uso del término 36
- 237 -
intervalos de confianza
estrechez 85
para diferencias entre parámetros 123
para diferencias, cuestiones que resuelven 124
y valoración de informes científicos 85
intrasujeto 51
intrasujeto, definición de diseño 115
investigación
definición 20
investigación aplicada 20
investigación científica
etapas, esquema 24
Investigación Científica
definición 21
investigación con patrocinio del exterior 184
investigación exploratoria 64
investigaciones a muestras independientes 50
investigaciones en niños 182
L
ley, definición 171
línea de regresión, interpretación 160
M
materiales y técnicas
listar las variables medidas 202
listar los materiales 203
medición, definición 69
mediciones repetidas ,definición 115
medios de diagnóstico
área bajo la curva 142
cociente de probabilidades positivo y negativo 140
curvas ROC 142
organizar la investigación 138
preguntas a responder 138
propiedades extrínsecas 140
propiedades intrínsecas 140
- 238 -
razón de verosimilitud positiva y negativa 140
valores de cribaje 140
medir, definición 69
menosprecio del trabajo propio 210
método científico, definición 20
método de la hipótesis 173
metodología de la investigación, definición 21
metodólogo 17
modelo teórico o teoría 171
momios 135
muestra
aleatoria y no semejante 62
de que depende el grado de representatividad 60
definición 59
diseño muestral 59
error muestral 62
representativa, definición 60
representatividad 62
semejanza 60
tamaño de una 59, 60
valida, condiciones 66
muestra grande, definición 116
muestra pequeña, definición 116
muestra, parcialmente representativa 201
muestra, totalmente representativa 201
muestras independientes 49, 50
muestras relacionadas 49-51
muestreo
accidental o incidental 67
aleatorio simple 67
consecutivo 68
intencional 67, 68
no probabilístico 67
para población a constituir incompleta 66
para población completa o constituida 66
probabilístico 67
probabilístico a población incompleta 67
mujeres embarazadas, en investigación 183
- 239 -
N
nivel de significación 103
NNT, interpretación 125
nube de puntos, interpretación de los puntos 160
nube o diagrama de puntos 149
número de pacientes que es necesario tratar 125
O
objetivo, definición 35
observación científica 177
odds a favor 135
odds en contra 135
odds ratio 136
odds, concepto y definición 135
outliers, datos extremos 76
P
p valor, operacionalización 98
parámetros 26, 35, 36, 39-40, 48, 49
parámetros, definición 78
población
blanco, definición 41
como definir la población accesible 57
Cómo identificar genéricamente 41
completa 66
definición de coordenadas témporo espaciales 58
incompleta 66
población objetivo, definición 41
tamaño de una 59
población accesible,definición 58
población blanco, definición 57
población, identificar genéricamente 41
potencia de una prueba de significación 106
predictor, definición 148
prevalencia 90
probabilidad
definición frecuencial 99
- 240 -
probabilidad pretest 144
problema 25
cómo analizar un 40
problema, cómo elegir un 37
problemas científicos
clasificación metodológica 30
problemas científicos, correspondencia entre clasificaciones 40
problemas de cifras 30
problemas de comparación
definición 109
diseño a muestras independientes 114
diseño a muestras únicas 115
diseños a muestras relacionadas 114
diseños a varias muestras 116
problemas de estimación de parámetros
operatoria para resolver 80
problemas de hipótesis. 30
problemas estimación de diferencias entre parámetros 109
procesamiento de datos
definición 74, 203
etapas 74
reglas para registro digital de datos 76
procesos de redacción de informes científicos 193
Producción de los componentes del informe 199
proposición
definición 95
protocolo de investigación 185
prueba de Friedman 116
prueba de hipótesis, definición 102
prueba de Kruskall Wallis 116
pruebas de significación
definición 118
punto final 74
pvalor
definición 98
- 241 -
R
razón de odds 136
razón de oportunidades 135
razón de productos cruzados 135
razón de verosimilitud positiva y negativa 140
rechazo absoluto 188
rechazo relativo 188
redacción del informe científico
debilidades y fortalezas 208
extensión de la redacción 200
información que debe figurar en diseño 201
información que debe figurar en diseño muestral 200
información que debe figurar en Introducción 199
información que debe figurar en Población 200
información que debe figurar en procesamiento de datos y análisis
estadístico 203
información que NO debe figurar en discusión y/o comentarios 209
procesamiento y análisis estadístico de los datos 205
redacción del cierre de la discusión 210
valoración de consistencia externa 209
valoración de validez externa 209
valoración de validez interna 208
redacción del trabajo científico
contenido del resumen 198
ensamblado a partir de protocolo 211
ensamblado a partir del resumen tipo 2b 212
precauciones al redactar resumen T2 195
proceso ideal 193
resumen clásico 198
resumen estructurado 198
resumen protocolar 194
secuencia pragmática 195
secuencia protocolar 194
redactar en el protocolo
procesamiento y análisis estadístico de los datos 205
reparos éticos 184
refutación 174
de una hipótesis, consecuencias 176
definición 97
- 242 -
refutación de hipótesis
definición 97
Reglas para aplicar lectura crítica 215
regresión múltiple
aplicaciones y usos 166
experimento 1 164
experimento 2 164
experimento 3 164
experimento 4 165
experimento 5 166
fines de la 163
modelo, ejemplo de un 163
relación aritmética entre probabilidad y chance 135
relación causa-efecto, definición 170
replicabilidad 218
replicabilidad, definición 189, 218
resultados
definición 74
otro modo de definirlos 74
resultados, definición 203, 205
resumen protocolar o tipo 1 195
resumen Tipo 2 195
resumen tipo 2a 195
resumen Tipo 2b 195
revisión arbitral 187
riesgo absoluto o incidencia 129
riesgo atribuible, cálculo 132
riesgo atribuible, definición 133
riesgo relativo estimado 135
S
sesgo de selección 134
sistema de medición, definición 69
sistema, definición 171
situación posttest 144
situación pretest 144
sobrevida acumulada, concepto y cálculo 92
subjetividad
- 243 -
control de la variable 54
criterio para identificarla en un estudio 54
T
tablas actuariales, para que sirven 92
tablas de sobrevida para un grupo 91
tamaño muestral
pequeño, qué hacer 64
planteo formal estricto para su estimación 63
planteo formal laxo para su estimación 64
planteo pragmático para su estimación 65
tasa de mortalidad específica anual 89
tasa única de mortalidad bruta anual 89
tasas
ajustadas o estandarizadas 90
Tema
de investigación, cómo elegir 26
TEMA
Definición 26
teoría
construcción de una 171
definición 171
teorías
bases racionales de la contrastación 175
test de hipótesis
criterios para la elección de alfa y beta 107
niveles de decisión 106
secuencia correcta 106
trabajo científico 187
conexidad 190
presuntamente apto 217
rechazo absoluto 188
rechazo relativo 188
redacción del resumen Tipo 2a 196
redacción del resumen Tipo 2b 197
replicabilidad 189
transformar problema de hipótesis en problema de cifras 32
tratamiento estadístico, definición 113
- 244 -
U
universo de discurso 57
UNIVERSO DE DISCURSO
definición 41
uso heurístico
del análisis de regresión 167
V
validez externa 192
validez externa, definición 189
validez interna 187
validez interna de una investigación
definición 21
validez interna, definición 189
valor estándar para error beta 106
valoración de tratamientos 125
valores de cribaje 140
valores de cribaje, uso en la clínica 144
variable
comportamiento de una 77
definición 42
variable dependiente, definición 148
variable independiente, definición 148
variable predictora, definición 148
variables
a controlar,covariables, extrañas, confundentes, enmascaradas,
intervinientes 43
clasificación 42
clasificación según relación con el problema 42
complejas 73
control de 43
control en modelos a muestras independientes 117
control en modelos a muestras relacionadas 117
control en modelos a muestras únicas 118
controlar variables desconocidas 44
diferencias entre escala y comportamiento 77
en estudio 42, 43
en estudio, ficha registro 75
- 245 -
en un problema: qué son y cómo se identifican 42
irrelevantes 44
operacionalización de 71
simples 73
variables a controlar, en muestras relacionadas 117
variables categóricas 69
variables desconocidas, control de 44
ventaja de tener un N grande 82
verdad de una hipótesis
medición del 96
verdad plausible 176
verificación
definición 96
- 246 -
- 247 -
METODOLOGÍA DE LA INVESTIGACIÓN BIOMÉDICA
FUNDAMENTOS
ISBN 978-987-42-0484-4
- 248 -
- 249 -