Está en la página 1de 249

METODOLOGÍA

DE LA INVESTIGACIÓN
BIOMÉDICA

Fundamentos

Vicente Carmelo Castiglia

-1-
Todos los derechos reservados
Queda hecho el depósito que previene la ley 11.723
Buenos Aires. República Argentina. 2016
Este libro no puede reproducirse total o parcialmente por níngún método
gráfico, electrónico o mecánico, incluyendo los sistemas de fotocopia,
registro magnetofónico o de alimentación de datos, sin expreso
consentimiento del editor.
Si reproduce este libro de alguna manera, no sólo está infringiendo la ley,
además está impidiendo que pueda publicar otro.

Castiglia, Vicente Carmelo


Metodología de la investigación biomédica : fundamentos / Vicente Carmelo
Castiglia. - 1a edición para el alumno - Ciudad Autónoma de Buenos Aires : el
autor, 2016.
248 p. ; 25 x 18 cm.
ISBN 978-987-42-0484-4
1. Formación de Investigadores. 2. Consulta. 3. Epidemiología. I. Título.
CDD 001.42

-2-
La vida nos ofrece una nueva oportunidad cada día que amanece.
La única diferencia es que no tenemos ni los mismos materiales
ni las mismas herramientas que ayer. Ese es el desafío de vivir

Han pasado casi dos décadas desde la segunda edición de


Se agotó hace bastante y no está en los escaparates de libros
usados. Mis alumnos, y otros que no lo son lo siguen buscando. Pero ha sido víctima
del tiempo que hizo que algunos contenidos, no tantos, perdieran actualidad. En su
lugar aparece esta obra :
a partir de aquí a secas.
Es producto de muchos años de ejercicio de la profesión de metodólogo, la que
ahora definitivamente se ha incorporado a los planteles de investigación. No importa
de dónde provengan (Estadística, Epidemiología, Medicina Basada en Evidencias,
Epistemología) hay profesionales que usarán los
investigadores. A veces no lo saben y a veces no quieren llamarse así, pero
.
El conocimiento metodológico ya no es un tesoro de pocos. Basta poner en el
buscador de su navegador estas cuatro palabras “Metodología de la Investigación “
y aparecen millones de citas. Para mi se ha producido un fenómeno curioso: lejos de
complejizarse, el método se ha simplificado y hoy podría resumir sus fundamentos en
cuatro renglones:
Para investigar siempre
que cumpla con las siguientes condiciones:
a - la secuencia de operaciones que señala la regla, debe ser replicable;
b - durante esas operaciones se debe realizar el control de variables extrañas;
c - las conclusiones deben ser aplicables a universos potencialmente infinitos.
La operatoria cambia con los avances tecnológicos. Los fundamentos se
mantienen porque Metodología es Lógica aplicada y no creo que vayan a cambiar en
mucho, mucho tiempo.
es parecida a y como aquél está dirigida a un público con
necesidades que van más allá de las de un principiante.
La filosofía no ha cambiado y seguimos pensando que en los países en desarrollo
(como el nuestro) en el sentido de la
. Hoy nadie duda que
Metodología es una nueva ciencia básica y que es la clave en el manejo de la información.
La se refiere a que los graduados no necesiten dirección o instrucción
continuas, sean críticos responsables y por otros en pensamiento,
manejo de información, toma de decisiones y capacidad de innovación.
Todas estas son propiedades más fáciles de adquirir cuando se está preparado para
valorar información y planificar sus actividades, por lo que el manejo de Metodología
se transforma en una condición necesaria y es mi esperanza, que este libro cumpla
aunque sea con el propósito de interesarlo en conocer más, por su bien como profesional
y principalmente, el de nuestros pacientes.

-3-
-4-
A todos mis alumnos de estos años. Esta obra es por
ellos y para ellos.
El autor

Tapa, Diseño, Ilustraciones y Webmastering


Diana Fernanda Castiglia
diana.castiglia@gmail.com

-5-
-6-
1. A quienes está dirigido, que contiene y como usar este libro 13
1.1 Destinatarios 13
1.2 Que puede hallar en este libro y cómo usarlo 14
1.3 “Fundamentos” para el aspirante a asesor científico 15

2. Diagnóstico de situación 17
2.1 Que son y para qué sirven el Método Científico y la Metodología de la Investigación 17
2.2 Bases racionales para la sistematización del conocimiento 19
metodológico
2.3 Etapas de una investigación científica 22

3. El problema: formulación y análisis 23


3.1 Consideraciones preliminares 23
3.1.2 Ideas para elegir tema y problema para su investigación 24
3.1.3 Si ya eligió tema, cómo descubrir problemas 25

4 Clasificaciones de problemas de investigación 27


4.1 Motivo e importancia de las clasificaciones 27
4.2 Clasificación genérica según tipo de información esperado: cifras o 27
hipótesis
4.3 Clasificación metodológica de problemas científicos según 28
procedimiento implicado en la solución
4.4 Clasificación de problemas según la estimación buscada 30

5 Objetivos: formulación y análisis 33


5.1 Cómo formular objetivos para problemas de cifras: el verbo "estimar" 33
5.2 Cómo formular objetivos para problemas hipótesis 35
5.3 Cómo elegir un problema 35
5.4 Cómo analizar un problema 38
5.4.1 Cómo identificar genéricamente la población 38
5.5 Variables qué son y cómo se identifican en un problema 40
5.5.1 Constantes y variables 40
5.5.2 Tipos de variables según su relación con el problema 40
5.5.2.1 Variables en estudio 40
5.5.2.2 Variables a controlar 41
5.5.2.3 Variables irrelevantes 42

6. Diseñando (I): pensando en esquemas conceptuales 45


6.1 Esquema conceptual para problemas de cuantificación ( estimación 46
de parámetros)
6.2 Esquema conceptual para problemas de correlación ( estimación de 47
coeficientes de correlación y regresión)
6.3 Esquema conceptual para problemas de comparación ( estimación de 47
diferencias entre parámetros)

-7-
7 Diseñando (II): Introducción a la clasificación de diseños 51
7.1 Requisitos de una clasificación de diseños 51
7.1.1 Diseños según método empleado 51
7.1.2 Diseños según la información buscada 51
7.1.3 Diseños según relación entre momentos de formulación del problema 51
y de registro de los datos
7.1.4 Diseños según la intervención del investigador en el proyecto 52
7.1.5 Diseños según número de mediciones de la variable en estudio 52
7.1.6 Diseños según control de la variable subjetividad 52
7.1.7 Diseños según control de otras variables 53
7.2 Seleccionando diseños: relación entre diseños y esquemas 53
conceptuales

8. Poblaciones: acotando universos de discurso 55


8.1 Definición de poblaciones para investigaciones clínicas 55

9. Diseñando muestras 57
9.1 Tamaño y representatividad de una muestra 57
9.2 El criterio de semejanza 58
9.3 Aleatoreidad y randomización 60
9.4 Diseño muestral: operatoria 61
9.4.1 Operatoria para calcular el tamaño muestral 61
9.4.2 Qué hacer si no puede conseguir tantos casos 62
9.4.3 Elegir método de muestreo 64
9.4.3.1 Muestreo probabilístico aleatorio simple 65
9.4.3.2 Muestreo probabilístico a población incompleta 65
9.4.3.3 Muestreos no probabilísticos 65
9.5 El tamaño muestral no vale un reino 66

10. Medición: conceptos. Datos y resultados 67


10.1 Medición 67
10.2 Escalas de medición 67
10.3 Reglas de medición: operacionalización de variables 69
10.4 Resultados: análisis conceptual 71
10.5 Datos: conceptos sobre procesamiento 72

11.Estimación de parámetros (problemas de cuantificación) 75


11.1Exposición de resultados en problemas de cuantificación 76
11.2 Estadísticas: definición. Tipos. Selección 76
11.3 Operatoria para resolver problemas de estimación de parámetros 78
11.4 Estimar parámetros poblacionales 78
11.4.1 Calcular de intervalos de confianza para un promedio 79
11.4.2 Interpretación y formulación de conclusiones para intervalos de 80
confianza para un promedio
11.4.3 Calcular de Intervalos de confianza para una proporción 81

-8-
11.4.4 Interpretación y formulación de conclusiones para intervalos de 82
confianza para una proporción 83
11.5 Proyección de los intervalos de confianza en el conocimiento moderno 84
11.6 Intervalos o bandas de tolerancia 85
11.6.1 Uso práctico de las bandas de tolerancia

12 Modelos especiales de problemas de cuantificación 87


12.1 Tasas 87
12.1.1 Prevalencia 88
12.1.2 Incidencia 88
12.2 Cuantificación en relación con el tiempo 89
12.2.1 Curvas de referencia para valores normales 89
12.2.2 Tablas de sobrevida para un grupo 89

13 Hipótesis: probabilísticas y determinísticas, decisión, certidumbre 93


y errores
13.1 Hipótesis 93
13.2 Certidumbre Y Probabilidad 96
13.3 Decisiones 97
13.3.1 Proceso acelerado para “decidir” 98
13.3.2 Aproximación intuitiva al proceso de decisión 99
13.3.3 Formalización estadística del proceso de decisión 100
13.3.4 El nivel de significación, significados y sinonimia 101
13.3.4.1 Cómo elegir un nivel de significación 101
13.3.5 Errores asociados con la contrastación de hipótesis probabilísticas 102
13.3.6 Eligiendo beta y el algoritmo final 103

14. Estimación de diferencias entre parámetros (problemas de 107


comparación)
14.1 Formulación de hipótesis para problemas de comparación 107
14.1.1 Formas de hipótesis nulas en problemas de comparación 108
14.2 Análisis de problemas de comparación 109
14.3 Secuencia operativa para resolver problemas de estimación de 110
diferencias entre parámetros (de comparación)
14.4 Nomenclatura de modelos de diseños estadísticos para problemas de 112
comparación
14.4.1 Nomenclatura según relación entre las muestras 112
14.4.1.1 Muestras independientes 112
14.4.1.2 Muestras relacionadas 112
14.4.1.3 Muestras únicas 113
14.4.3 Nomenclatura según tamaño de las muestras 114
14.4.4 Nomenclatura según número de muestras 114
14.4.5 Diseños a varias muestras 114

-9-
14.5 Control de covariables en estudios de comparación 115
14.5.1Control de variables en modelos a muestras relacionadas 115
14.5.2 Control de variables en modelos a muestras independientes 115
14.5.3 Control de variables en modelos a muestras únicas 116
14.5.4 Control de variables desconocidas 116
14.6 Selección de la prueba de significación 116
14.7Información producida al resolver problemas de comparación 118
14.7.1Conclusiones para las muestras 119
14.7.2 Conclusiones informativas para la población y decisión clínica 120
14.8 Estimación de intervalos de confianza para diferencias entre
parámetros 121
14.9 Número de pacientes que es necesario tratar (NNT) 123
14.10 Tablas de vida para dos o más grupos 125

15 Comparaciones y estimaciones especiales: de Riesgo y de Medios de


diagnóstico. Valores de cribaje 127
15.1 Factores de riesgo 127
15.1.2 Estudios de cohorte 128
15.1.2.1 Medidas de riesgo en estudios de cohorte 130
15.1.2.2 Operatoria para realizar estudios de cohorte 130
15.1.3 Estudios de casos y controles 132
15.1.3.1 Operatoria para la realización de estudios de casos y controles 132
15.1.3.2 Medidas de riesgo en estudios de casos y controles 133
15.2 Valoración de medios de diagnóstico 135
15.2.1 Cómo se organiza una investigación para valorar medios diagnósticos 136
15.2.2 Valores de cribaje 138
15.2.3 Valoración del rendimiento de un medio diagnóstico 139
15.2.3.1 Curvas ROC 140
15.2.4 Obtención e interpretación de información aplicada a la clínica sobre
medios de diagnóstico. 140
15.2.5 Cómo se usan los valores de cribaje en la práctica clínica 142

16. Estimación de coeficientes de correlación regresión Parte I:


coeficientes de correlación 145
16.1 Esquema conceptual para resolver problemas de correlación 147
16. 2 Nube o diagrama de puntos 147
16.3 Coeficientes de correlación 148
16.3.1 Intervalos de confianza para un CC 149
16.3.2 Significación de un coeficiente de correlación 150
16.3.3 Signo de un coeficiente de correlación 151
16.3.4 Valor absoluto de un coeficiente de correlación 151
16.4 Información en problemas de correlación: conclusiones para la población 153

- 10 -
17. Estimación de coeficientes de correlación regresión Parte II: 155
análisis de regresión bivariado
17. 1 Interpretación del coeficiente “b” en el análisis bivariado 159
17. 2 Interpretación del coeficiente “a” en el análisis bivariado 160
17. 3 La predicción es la meta 160

18. Estimación de coeficientes de correlación regresión Parte III: 161


Introducción a la regresión múltiple y al análisis multivariado
18.1 Experimento 1 162
18.2 Experimento 2 162
18.3 Experimento 3: combinación de dos variables en el análisis 162
18.4 Experimento 4 163
18.5 Experimento 5: combinación de tres variables en el análisis 164
18.6 Aplicaciones y usos de la regresión 164
18 .6.1 Uso predictivo 164
18.6.2 Uso ponderativo 165
18.6.3 Uso heurístico 165

19. Relación causa y efecto: problemas y soluciones 167


19.1 Causas, efectos y su relación 167
19.2 Esquema conceptual para resolver problemas de RCE 168
19.3 Construcción de teorías explicativas 169
19.3.1 Actividades preliminares 170
19.4 Método hipotético deductivo (MHD) 171
19.5 Operatoria para construir un modelo teórico de relación causa efecto 172
19.6 Contrastación de teorías 173
19.6.1 Bases racionales 173
19.6.2 El procedimiento de contrastación 175
19.7 Aplicación práctica del MHD en la construcción de teorías 176
19.8 Formulación de conclusiones luego de contrastar una teoría. 178
19.9 Cuando usar método hipotético deductivo 178

20. Bioética e investigación científica: breve introducción 179


20.1 Consentimiento informado 179
20.1.1 Información esencial para los probables sujetos de investigación 179
20 .1.2 Conducta del investigador frente al consentimiento informado 180
20 .1.3 Consentimiento informado de los sujetos 180
20.1.4 Situaciones especiales 180
20.1.4.1 Investigaciones que involucran a niños 180
20.1.4.2 Investigaciones que involucran a sujetos en comunidades
subdesarrolladas 180
20.1.4.3 Investigaciones que involucran a mujeres embarazadas o que están
amamantando. 181
20.1.4.4 Consentimiento informado en estudios epidemiológicos 181

- 11 -
20.2 Alicientes para la participación 181
20.3 Revisión y aprobación de proyectos 182
20.4 Investigación con patrocinio de organismos extranjeros 182
20.5 Modelo para redactar el epígrafe "Reparos éticos" en el protocolo. 182

21 Redactar el protocolo de investigación 183


21.1 Listado de componentes del protocolo de investigación 183

22. Informando a la comunidad científica (I): fundamentos racionales 185


sobre redacción del trabajo científico
22.1 Introducción 185
22.2 Validez , coherencia y rechazos 185
22.3 Verificabilidad y replicabilidad 187
22.4 Conexidad 188
22.5 Consistencia o coherencia 189

23 Informando a la comunidad científica (II) : apuntes sobre la 191


operatoria de redacción del informe científico
23.1 Procesos de redacción de informes científicos: ideal y pragmático 191
23.2 Secuencia protocolar y resumen protocolar o Tipo 1 192
23.3 Secuencia pragmática: el resumen pragmático o Tipo 2 193
23.4 Redacción del resumen antes que el trabajo completo (resúmenes tipo 2) 194
23.4.1 Redacción del resumen Tipo 2a (si dispone de protocolo de 194
investigación)
23.4.2 Redacción del resumen Tipo 2b (si no dispone de protocolo de 195
investigación)
23.5 Contenidos del resumen según el formato: estructurado y clásico 196
23.6 Producción de los componentes del informe 197
23.6.1 Información que debe figurar en Introducción 197
23.6.2 Información que debe figurar en Población 198
23.6.3 Información que debe figurar en Diseño muestral y muestras 198
23.6.4 Información que debe figurar en Diseño 199
23.6.5 Información que debe figurar en Materiales y Técnicas 200
23.6.6 Información que debe figurar en Procesamiento de datos y análisis 201
estadístico
23.6.7 Información que debe figurar en Resultados 203
23.6.8 Información que debe figurar en Conclusiones 204
23.6.9 Información que debe figurar en Discusión y/o comentarios 206
23.6.9.1 Valoración de la validez interna del informe 206
23.6.9.2 Valoración de la consistencia externa del informe 207
23.6.9.3 Valoración de la validez externa del informe 207
23.6.9.4 Información que no debe figurar en Discusión y/o comentarios 207
23.6.9.5 Redacción del cierre de la Discusión 208
23.7 Modelos de secuencias de ensamblado del trabajo científico 209
23.7.1 Listado de tareas para ensamblar el informe de un trabajo realizado bajo protocolo 209

- 12 -
23.7.2 Listado de tareas para ensamblar el informe de un trabajo a partir del 210
resumen tipo 2b y sin protocolo
23.8 Eligiendo un título para el trabajo 211

24. Técnica de lectura crítica de informes científicos: OPD simplificada 213


24.1 Reglas para la aplicación de técnicas de lectura crítica 213
24.2 Técnica OPD simplificada de valoración de trabajos científicos 214
24.3 Conceptos de validación de informes científicos según medicina basada 215
en evidencias
24.4 Comparación entre OPD y MBE 216

25 Síntesis 217
26 Apéndice 219
27 Referencias Bibliográficas 221

- 13 -
- 14 -
1 - A QUIENES ESTA DIRIGIDO, QUE CONTIENE Y COMO USAR ESTE LIBRO
1.1 DESTINATARIOS

Al igual que fue con Principios, con Fundamentos intento cubrir la curiosidad
del lector que piensa investigar o simplemente saber cómo se produce información;
las necesidades de los alumnos que deben cursar la materia y las de los aspirantes
a asesores científicos, que desean reunir en una sola fuente gran parte del
material sobre temas básicos disponible en publicaciones dispersas.

Hay profesionales que son investigadores de carrera. Otros que investigan


eventualmente y el resto jamás lo hará. Pero todos "consumirán" información.

Fundamentos se refiere primordialmente a los aspectos conceptuales


de la investigación, o sea del proceso de producción de información
más importante de todos los tiempos.

Si Ud. es investigador de carrera, no importa que no lea este libro:


sólo le tomará algún tiempo más, reunir la información, y tal vez pierda
algunas propuestas originales que hago. Pero eso es todo. Más tarde
o más temprano aprenderá todo lo que le haga falta. Este es, en parte
su "negocio". Ud. produce información. Ud. como profesional que desea
realizar investigación, debe aprender Metodología para no cometer errores
evitables.

Pero como consumidor de información le interesa más conocer el proceso


porque así sabrá si puede confiar en el producto, que es... ni más ni menos que
la información que le servirá para tomar decisiones con sus pacientes.
Si está buscando una síntesis conceptual del proceso de investigación biomédica,
para APRENDER A INTERPRETAR INFORMACIÓN CIENTÍFICA, Fundamentos puede
ser su libro.

Se habla de la existencia de tres contextos (31) para el conocimiento: de


descubrimiento, de justificación y de aplicación.
El primero está relacionado con todo el proceso que desemboca en el descubrimiento
de un problema científico (heurística) y el justificación con los procedimientos de
validación: cómo saber si el conocimiento descubierto es auténtico o si una hipótesis
posee fundamentos y es justificable.
Hay dudas acerca de cuándo se está en uno u otro contexto.
Considero que si se toma en cuenta la secuencia de decisiones el descubrimiento
abarca la etapa previa a tomar la decisión de realizar el experimento validatorio; el
de justificación abarca todo aquello que se hace hasta el momento en el cual se
decide que el conocimiento está en condiciones de ser aplicado.
El contenido de este manual apunta predominantemente al contexto de justificación.

- 15 -
1.2 QUE PUEDE HALLAR EN ESTE LIBRO Y CÓMO USARLO
Las reglas que conforman el método deben servir para orientar, organizar.
Deben impedir que se cometan errores evitables durante una investigación, pero
no deben impedir la investigación misma.
El contenido de Fundamentos proviene, por partes iguales, de : a - la experiencia
acumulada en el ejercicio profesional, ayudando a colegas a resolver aquellos problemas
con sus investigaciones; b - la información bibliográfica; c - la conjugación lógica de
ambos. En el libro desarrollo el glosario básico y RESPONDO LA PREGUNTA: COMO
SE ENCARA CONCEPTUALMENTE UNA INVESTIGACIÓN BIOMÉDICA.
A través de las clasificaciones de problemas según la información buscada y
método de resolución y el desarrollo de los esquemas conceptuales, busco una
sistematización racional de esos conocimientos y facilitar el aprendizaje de
la materia, sorteando la abundancia de información, que suele desorientar
al novicio.
La operación matemática más compleja que le muestro es una raíz cuadrada. Si
está buscando FORMULAS ESTADÍSTICAS sólo ENCONTRARÁ unas pocas que hicieron
falta para alguna explicación. T engo particular interés en diferenciar claramente los
alcances de cada materia. ESTE VOLUMEN ESTA DESTINADO A METODOLOGÍA NO
A ESTADÍSTICA. Con todo no se ignoran las necesidades básicas, de aquellos puntos
en los que Metodología y Estadística confluyen.
Trato los temas con contenido estadístico indicando sólo lo que Ud. necesita para
conceptualizar el proceso de investigación: los fundamentos, los casos de aplicación
y la interpretación. Y para eso no hacen falta fórmulas, sino sentido común. En Internet
podrá encontrar las fórmulas que necesite, sean cuales fueran.(Apéndice)
Las definiciones son convenciones que permiten que las personas se refieran a las
mismas cosas, evitando las confusiones derivadas del lenguaje. Así que abundan. Tal
como dije en 1984 (14) no necesariamente son las únicas o las mejores.
Cada punto está tratado en la profundidad que creí adecuada para este nivel. Un
análisis más detallado me pareció fuera de los alcances de este volumen por lo que le
recomiendo consultar las referencias correspondientes.
Estoy convencido que es poco probable que exista un conocimiento acabadamente
cierto. Luego, para simplificar el discurso a partir de aquí, decidí ELIMINAR todos los
giros idiomáticos que debería haber usado para relativizar las afirmaciones.
Hay algunas repeticiones que no son casuales: sirven para que Ud. repase planteos
hechos muchas páginas antes y evitarle la necesidad de volver a ese lugar.
He seguido un sistema de numeración decimal legal tanto para capítulos y apartados,
como para las tablas y figuras. De este modo podrá ubicarlas facilmente. Así la tabla
7.1 está en el apartado 7.1 , mientras que la figura 3.4 está en el apartado 3.4.
Sugiero al menos dos lecturas de cada capítulo: en la primera tal vez le convenga
saltear los párrafos escritos en letra pequeña.

- 16 -
1.3 “FUNDAMENTOS” PARA EL ASPIRANTE A ASESOR CIENTÍFICO
Convengamos que un metodólogo es un experto en temas de Metodología
y que cuando emplea sus conocimientos para orientar a otros profesionales en la
realización de sus investigaciones científicas cumple la función de ASESOR
CIENTIFICO. Ésta es la que cumplimos desde 1985, cuando iniciamos actividades
en la División de Asesoría Científica del Hospital de Clínicas.
Desde entonces aprendimos mucho, pero mantuvimos la misma filosofía básica:
el ejercicio de la Metodología debía tener iguales componentes que la Medicina:
asistencia, docencia e investigación. En algunas publicaciones previas, fundamenté
los motivos por los cuales consideraba que la formación en Metodología de la
Investigación requiere tanto capacitación teórica como práctica (16)
Lo que define el nivel de un médico es su capacidad de resolver los
problemas clínicos, empleando normas conocidas. Así los estudiantes del último
año conocen la mayoría de las normas, pero no saben cómo y cuando aplicarlas
exactamente o usar vías alternativas. El médico residente avanzado sabe aplicar
la gran mayoría de las normas y a veces puede llegar a usar vías alternativas.
El especialista usa indistintamente ambas.
Dado que el asesoramiento metodológico se refiere a un sistema de normas
(el Método Científico), también se pueden determinar tres niveles: iniciados,
usuarios y expertos, equivalentes respectivamente a los estudiantes del último
año, el residente avanzado y el especialista. Hoy es fácil demostrar que para
ser un asesor científico se requiere una formación particular. A Ud. no se le
ocurre que está habilitado para ser médico por que ha tenido algunas
enfermedades en su vida, y/o es bioquímico, y/o farmacéutico. Del mismo modo,
haber participado personalmente de algunas investigaciones, o poseer
conocimientos laterales como Epidemiología, Salud Pública, Epistemología,
etc. raramente alcanzan para conformar un usuario, y nunca un experto, en
Metodología de la Investigación. Esto sólo se logra con el ejercicio continuado
de la profesión de metodólogo, asesorando equipos de investigación, investigando
en Metodología y enseñando lo que se aprende por la práctica y por la
investigación, además de lo que se estudia. En nuestra querida División, hubo
un grupo de profesionales que con su entusiasmo y sus ganas de averiguar,
movieron las estructuras de lo aceptado e impidieron la generación del moho
de la inactividad.
Varios de ellos constituyeron una nueva generación de asesores científicos
profesionales ejerciendo en diversos centros profesionales. Fundamentos se
escribió pensando también en quienes, hoy, quieren imitarlos. La idea es que
sirva a modo de plataforma de lanzamiento para naves espaciales: los oriente
en sus inicios, y no los estorbe en su avance futuro.

- 17 -
- 18 -
2 - DIAGNÓSTICO DE SITUACIÓN
2.1 QUE SON Y PARA QUE SIRVEN EL MÉTODO CIENTÍFICO Y LA
METODOLOGÍA DE LA INVESTIGACIÓN

Al igual que para muchas otras cosas, para la enseñanza de Metodología de


la Investigación conviene ponerse en la situación del investigador. Es una persona
que por algún motivo trata de resolver una dificultad, un problema. Para esto le
hace falta información, no sólo científica, sino también de otro tipo. En este libro
nos ocuparemos solamente de la producción de información científica.

Conviene diferenciar el concepto de conocimiento en relación con el de


información. Convengamos que, conocimiento es aquello que se sabe.

Por ejemplo Ud. puede saber que el lugar más profundo del océano está localizado
en la fosa de las Filipinas, o que, en los seres humanos, la ingesta de sal se asocia con
hipertensión.
Pero si Ud. es el capitán de un submarino perdido en el fondo del Pacífico, es posible
que use ese conocimiento sobre la fosa de las Filipinas para tomar alguna decisión. A partir
de ese momento llamaremos información aquello que era conocimiento.
Lo mismo ocurre si es médico y debe suprimir la ingesta de sal a un paciente
hipertenso. Lo que era conocimiento ("la ingesta de sal se asocia con hipertensión") se
transforma en información ya que es aplicado a la toma de decisiones.

Dicho de otro modo: conocimiento es lo que se sabe. Si lo que se sabe se


aplica para tomar decisiones, entonces será información.

Para resolver cada problema hace falta la información adecuada.


Si en una comunidad, Ud. se piensa dedicar a fabricar habitáculos para
incubadoras tendrá pocas probabilidades de éxito si no dispone de información
sobre cuál es la talla promedio de un recién nacido, y sus variaciones dentro de
esa comunidad.
Por otra parte saber cuánto sodio se pierde en promedio, servirá solamente
para reponer, pero no para interrumpir la pérdida de sodio por intestino. Para
lograr esto debe estar informado sobre el mecanismo de pérdida del sodio.

Cuanta más información tengan quienes deben tomar las decisiones, más
probabilidades tendrán de tomar las decisiones correctas.

Ud. puede obtener la información de diversas maneras, igualmente válidas,


dependiendo de su sistema de creencias: puede preguntar a un experto, a un
oráculo, a un líder religioso, buscar en publicaciones o desarrollar una
investigación. (8, 43)

- 19 -
En ciencia, una investigación es un proceso teórico-empírico por el cual se
aplica el método científico a la solución de un problema. Las investigaciones se
pueden clasificar según diversos ejes, tal como se muestra en el cuadro 2.1

En Ciencias de la Salud, no se investiga por placer, sino por necesidad o sea


se realiza investigación aplicada. Por ejemplo, en el tema de la pérdida de sodio
por intestino, saber si el V. Cholerae produce una, dos, tres o más enterotoxinas,
no es cuestión de curiosidad sino de necesidad.

Etapa del conocimiento Exploratoria - Confirmatoria


Modelo teórico Cualitativa - Cuantitativa
Motivo de realización Básica - Aplicada
Interacción Investigador - Participante - No participante
Participante
Ámbito de aplicación Biomédica - Epidemiológica - Social -
etc.
Obligatoriedad Curricular - No curricular (65)

En la actualidad se tiende a considerar la información como un producto o


sea: la información se puede producir, tal como se producen lapiceras, chupetines
y helados.
En la validación de los productos interesan tanto el proceso como el producto.
Un helado puede tener gusto muy agradable, pero nadie lo aceptaría si para
producirlo se han empleado sustancias tóxicas.
La información no es una excepción a esta regla. Ud tiene muchas maneras
de realizar investigaciones, pero no cualquiera será considerada válida.
La comunidad científica se ha puesto de acuerdo en que sólo aceptará
información que haya sido producida bajo un conjunto de normas o reglas
universalmente difundidas y aceptadas. Este conjunto de normas se denomina
Método Científico (MC) y su objetivo es evitar que, durante la investigación
se cometan errores que afectan la validez de la información y que por conocidos,
son evitables. Un error evitable se denomina sesgo.
Aclarando un poco más el concepto: cualquier adulto normal... sabe que caerá, si
corta la rama en la que está apoyado en cualquier punto ubicado entre su lugar de apoyo
y el de inserción de la rama en el tronco. Esto es lo que podríamos llamar un "error
evitable". No es necesario cometerlo, para saber que no conviene hacerlo. Por lo tanto
los adultos normales hemos generado una regla que dice:
"no se debe cortar la rama en la que uno está apoyado"

- 20 -
Tal vez el sentido común del que tanto se habla no sea más que ese conjunto
de reglas nunca escrito (y a veces nunca aprendido) de lo que no conviene hacer
porque ya se sabe que conducirá a un error.

La Metodología de la Investigación (MI) es una disciplina derivada de la


Lógica (47). Tiene como objeto de estudio el sistema de normas o reglas llamado
Método Científico, para valorarlas, determinando cuáles reglas son eficaces o
más eficientes que las existentes, para disminuir al máximo el número de sesgos
durante la investigación.

A su vez la investigación desarrollada de acuerdo con el MC será Investigación


Científica (IC). La comunidad científica considera que la información producida
durante una investigación científica tiene validez interna, precisamente porque
ha cumplido con el MC.

Desde sus épocas de estudiante Ud. sabe que si dispone de alguna


sistematización racionalizada, el aprendizaje de una materia le resulta más
sencillo. ¿ Pero cómo se puede racionalizar el conocimiento metodológico ?

2.2 BASES RACIONALES PARA LA SISTEMATIZACIÓN DEL


CONOCIMIENTO METODOLÓGICO

T al como Ud. puede imaginar existen infinitos problemas posibles, cada


uno de los cuales requiere información que le es propia y sería complicado
diseñar para todos y cada uno de ellos un procedimiento que funcione
válidamente.

En este libro muestro que tanto los problemas como la información se pueden
clasificar en tipos y a cada uno de ellos corresponde un sólo modelo de solución.

Más adelante (cap. 4) trataré las clasificaciones de los problemas según


varios ejes.
Por ahora, mencionando una, basta decir que según el procedimiento
implicado en su solución he propuesto cuatro categorías: de cuantificación, de
correlación, de comparación (que abarcan la valoración de medios terapéuticos,
de medios diagnósticos y de explicación de relación causa-efecto) tal como
muestro en la T abla 2.2
En la columna izquierda muestro algunos tipos de información requerida
según modelo de problema (columna central) y en la columna derecha los dos
métodos generales de resolución: estadístico e hipotético deductivo.

A su vez dentro del estadístico menciono dos modelos basados en conceptos


diferentes de probabilidad denominados según el nombre del matemático que
tuvo mayor influencia en su desarrollo: el pearsoniano y el bayesiano.

- 21 -
Ahora bien: cuando Ud. como médico diagnostica que el paciente tiene una
infección bacteriana sabe, de un modo genérico, que deberá usar antibióticos.
Pero no sabe con certeza cuáles, en qué dosis, por cuál vía, porque eso varía de
paciente en paciente. Lo mismo le ocurre a quién se decide a realizar una
investigación.
Es cierto que propongo dos métodos generales que rigen la producción de
información. Pero para cada situación también deberá tomar decisiones
particulares igual que si estuviera eligiendo un antibiótico para una infección de
un paciente dado.
No se preocupe. Como le mostraré, una vez que un problema haya sido
clasificado (cap. 4) , Ud. dispondrá de una serie de reglas generales que he
denominado esquemas conceptuales (cap. 6 ) con las que podrá manejarse
inicialmente.
Una vez que haya desarrollado los esquemas conceptuales que corresponden
a cada modelo de problema, entonces explicaré de qué modo,de ellos , puede
derivar el diseño o sea las reglas para recoger los datos y obtener la información
para poder responder al problema. (cap. 7)

Esta secuencia, fundada en el empleo de los esquemas conceptuales


constituye la espina dorsal de esta sistematización del conocimiento
metodológico.
Actualmente no caben dudas que cada IC es un acontecimiento dentro del
proceso destinado a la producción de información. Con esta concepción paso a
considerar sus etapas.

- 22 -
- 23 -
2.3 ETAPAS DE UNA INVESTIGACIÓN CIENTÍFICA
El flujograma de la figura 2.3 indica cómo se produce conocimiento durante una IC.
(9, 80) El bloque de inicio está constituido por el descubrimiento, formulación y
análisis del problema. Inmediatamente después y antes que cualquier otra cosa,
Ud. debe realizar una búsqueda bibliográfica (BB) cuyos objetivos, en el contexto
de una investigación serán:
1 - Determinar si alguien ha resuelto el problema
2 - Obtener información destinada a apuntalar los aspectos teóricos de la
justificación del proyecto.
3 - Enriquecer los aspectos técnicos tanto disciplinarios como analíticos.

Podrá encontrar una descripción detallada de la metodología a seguir para realizar


la BB en los capítulos 4 a 7 de nuestro Manual de Investigación para Principiantes ( 65) y
otros sitios (78)

Luego de la BB, Ud. dará por finalizado el proceso sólo si ha encontrado una
solución que sea satisfactoria. Si esto debe continuar, diseñará una investigación
adecuada al problema (bloque 3 ), por lo que deberá:

a - determinar cuáles son los objetivos de la investigación, o sea cuál es el


tipo de información que se requerirá y por lo tanto el modelo de problema al
que se ajusta. (cap. 4)
b - identificar el esquema conceptual correspondiente a ese modelo de
problema. (cap. 6)
c - seleccionar el diseño más adecuado para tal investigación tomando en
cuenta no sólo los aspectos técnicos sino también los éticos. (cap. 7)
d - sobre la base de lo desarrollado en los incisos anteriores, redactar un
protocolo de investigación. (cap. 21)

Luego continuará con los bloques 4 y 5 o sea realizar la investigación y


formular conclusiones. Si estas conclusiones constituyen la información que soluciona
el problema, finaliza el proceso. De lo contrario deberá comenzar nuevamente.

Atención: desde el punto de vista del conocimiento humano una solución a un


problema, genera nuevas preguntas y nuevas investigaciones. Por ejemplo, una vez que
se estableció que la viruela era prevenible, hubo quienes averiguaron si otras enfermedades
infecciosas también lo eran. El proceso de producción de conocimiento queda mejor
representado por una espiral evolutiva que por un círculo. Nunca se cierra.

En el próximo capítulo pasaré a detallar el primer bloque de actividades,


correspondiente al descubrimiento, formulación y análisis del problema.

- 24 -
3 - EL PROBLEMA: FORMULACIÓN Y ANÁLISIS
La Real Academia Española define problema (24) como una cuestión que se
trata de aclarar o una proposición o dificultad de solución dudosa. Esta
dificultad termina generando una pregunta o hipótesis que también recibe el
nombre de problema. (2)

Desde este ángulo y en el contexto de una investigación el término


“problema” tiene al menos dos interpretaciones:
a - Dificultad o pregunta a resolver
b -La información que se necesita para resolver una dificultad.

Si, por ejemplo, necesita asignar recursos para prevención y manejo de la


diabetes en una población y sabe que los recursos se asignan según la
prevalencia de la DBT pero no tiene este dato, entonces obtener la “ prevalencia
de DBT en esa población” es el problema. Como se ve la pregunta implica una
respuesta y ambas (pregunta y respuesta ) se denominan problema:
La pregunta es: cuál es la prevalencia
La información necesaria es : la prevalencia es x %

En el contexto del descubrimiento (31) “problema” designa la


pregunta o dificultad. Hemos desarrollado extensamente este tema en el MIPP
(Poslogo p. 129; 65) y a partir de allí le ofrecemos algunas cuestiones a tomar
en cuenta

3.1 CONSIDERACIONES PRELIMINARES


Si está leyendo estas líneas es muy probable que tenga que hacer una
investigación por alguna obligación académica (curricular).
Tal vez le han solicitado un meta análisis.
Los procedimientos de meta análisis han elevado a las producciones monográficas a
la categoría de trabajos científicos, por lo que las personas que cultivan la medicina basada
en evidencias los consideran como información de primera categoría. (84) Para realizar
un meta análisis lo referimos a la bibliografía especializada. (81 )
Personalmente opino que, si bien un meta análisis tiene mejores probabilidades
de orientar decisiones en la práctica, de ninguna manera puede ser homologado a un
trabajo científico, entre otras cosas porque durante la realización de cualquier investigación,
el investigador produce información nueva a partir de datos obtenidos directamente
mientras quien construye una monografía lo hace con información preexistente (datos
medidos por terceros). Matemáticamente hablando en un trabajo original de investigación
sólo hay una fuente error ( los que pudieron cometer los investigadores) mientras que
en un meta análisis se agrega una segunda fuente de error (los errores de interpretación
y/o procesamiento que realizan los monografistas). De lo cual se deduce que hay mayores
chances que tenga errores un meta análisis, que un trabajo original. En esta obra sólo
nos referimos a investigaciones originales.

- 25 -
Antes de encontrar el problema elija el área o tema de su interés.

3.1.2 - IDEAS PARA ELEGIR TEMA Y PROBLEMA PARA SU INVESTIGACIÓN


TEMA es el nombre con el que se designa un conjunto de conocimientos que
están agrupados empleando algún criterio.
Así emplea como criterio el tipo de especialidad tiene; pediatría, ginecología,
obstetricia, etc. Si el criterio es el de la patología tiene: tuberculosis, infarto de miocardio,
sífilis, etc. Otro criterio podría ser la relación entre dos de los temas ya enunciados como
por ejemplo: diabetes y retinopatías, infarto y estrés, y así una infinidad. (11)

¡ Atención ! Tome en cuenta que un tema no es lo mismo que un problema.


Para elegir el tema le conviene disponer un listado lo más completo posible.
Un manera de lograrlo consiste en revisar los tratados tradicionales de su
especialidad. Por ejemplo, si es pedíatra busque en Nelson, si es clínico en Farreras
y si reumatólogo en Mc Carthey. Además consiga un cuaderno para tomar notas.
Abra el tratado y hojéelo desde la primera hasta la última página.
Cada vez que encuentre un tema de su interés, regístrelo en su cuaderno.
Durante la investigación lo usará como libro de bitácora.
Cuando ya disponga de la lista, consulte con su tutor académico o algún colega
de mayor experiencia para que opine y lo ayude a lograr que al final quede solo un
área temática.
Durante la búsqueda utilice algunos criterios generales de elección:
A - Recuerde que para una investigación clínica hacen falta tiempo y pacientes y si debe
investigar por motivaciones académicas, conviene que elija una temática que le asegure de
obtener rápidamente el número de casos requeridos.
B - Le conviene elegir un tema novedoso sobre el cual haya poca literatura disponible.
Cuando el tema está en etapa de descubrimiento todo aporte puede ser sumamente
util. Es como la exploración de una región geográfica nueva: no hacen falta equipos
especiales y cualquiera puede descubrir algo importante. Una investigación exploratoria
es siempre una opción (65, Apéndice 1)
C - Hay modelos de investigaciones que son poco complejos y tienen alto potencial de
factibilidad como los estudios de estimación de parámetros en una población; hay otros que
tienen alta complejidad y por lo tanto bajo grado de factibilidad como los ensayos clínicos
multicéntricos randomizados a doble ciego.
D - Hay un quehacer cotidiano que es pasible de investigación (no sólo en asistencia,
sino también en docencia ). Por ejemplo las encuestas de satisfacción por parte de los
pacientes, o estudios centrados en la familia del paciente, investigaciones relacionadas con
los hábitos de prevención de los alumnos universitarios en ciencias de la salud, etc.
E - UNA PROPUESTA tendadora es la creación de sistemas de medición con base
numérica, uno de los grandes desafíos de la Medicina Clínica moderna y uno de los problemas
que están más al alcance de cualquier investigador. Piense en Virginia Apgar y cómo cambió
la neonatología luego de su propuesta en 1953 (12,29). Tal vez Ud. puede hacer lo mismo por
su especialidad. ¿Por qué no intentarlo ?

- 26 -
3.1.3 SI YA ELIGIÓ TEMA, CÓMO DESCUBRIR PROBLEMAS

Cuando se habla de descubrimientos casuales o no, en realidad se habla del


descubrimiento de la respuesta al problema. Fleming descubrió la penicilina
casualmente pero la penicilina era la respuesta. La manzana cayó sobre la
cabeza de Newton, pero era la respuesta, y no la pregunta. La pregunta la
tenía en su cabeza.

Debe ser excepcional la persona que se levanta un día y decide que va a


investigar científicamente sobre algo elegido en forma aleatoria. Lo más
corriente que quien investigue sea un profesional preocupado por una situación
dificultosa que requiere una solución (Fleming, Newton, Apgar, Jenner, etc).

Pero el único que necesita descubrir “preguntas interesantes” es aquél


que por cuestiones académicas debe realizar una investigación científica.

La dificultad es que no hay reglas para descubrir preguntas interesantes. Pero


se pueden dar algunos consejos.

Lea la mayor cantidad posible de información sobre el tema elegido para


buscar nichos de información faltante.
En lo inmediato y para ayudarlo en la selección pasaré a mostrarle los tipos
de problemas con los que se puede encontrar.

- 27 -
- 28 -
4 - CLASIFICACIONES DE PROBLEMAS DE INVESTIGACIÓN
4.1 - MOTIVO E IMPORTANCIA DE LAS CLASIFICACIONES

En casi toda publicación sobre Metodología se dice que el paso más


importante para tener éxito en una investigación, es la identificación del
problema.
Para una identificación se suelen usar distintos ejes y por lo tanto existen
varias clasificaciones con diferentes categorías para un mismo individuo. Por
ejemplo un gato es un vertebrado (para la clasificación vertebrados o no) y
también es un mamífero (para la clasificación mamíferos o no) o un carnívoro
(para la clasificación carnívoros o no) y así sucesivamente.

La situación es análoga para la identificación de un problema, de modo


que podemos identificarlo según distintos ejes, entre otros:

A - la información genérica que busca (en problemas de cifras o


hipótesis); (clasificación genérica)
B - según el procedimiento metodológico que está implicado en la
obtención de la respuesta ( de cuantificación, de correlación, de
comparación y de relación causa efecto) (clasificación metodológica)
C- según el tipo de estimación que busca (estimación de parámetros o
estimación de relaciones entre parámetros).

Desde el año 1984 (14,15) venimos usando la clasificación metodológica


B con mucho éxito para la orientación de los investigadores consultantes. Pero
ocurrió que los avances tecnológicos han permitido llevar casi todos los
problemas (excepto los de explicación de relación causa – efecto) a la
estimación de parámetros (cifras). Esto conlleva varias ventajas, ya que la
estimación ofrece información no sólo sobre el parámetro buscado, sino
también sobre la adecuación del tamaño muestral, y el grado del efecto clínico
posible. (65,69)

En restantes capítulos del libro usaremos como base la clasificación


metodológica, si bien iremos aclarando durante el discurso, cómo se coordinan
estos tres ejes de clasificación.
4.2 - CLASIFICACIÓN GENÉRICA SEGUN TIPO DE INFORMACIÓN ESPERADO:
CIFRAS O HIPÓTESIS

Por ejemplo, Ud quiere "conocer":


p1. Qué porcentaje de pacientes que consultan en Dermatología son
mujeres.
p2. Cuál es el promedio de días de estadía post operatorio luego de
una apendicectomía.

- 29 -
p3. La prevalencia de diabetes en una población.
p4. La talla promedio de los niños varones de 8 años.
p5. Al cabo de cuánto tiempo se produce una recidiva
en un cáncer gástrico operado.

Note que lo que Ud. quiere "conocer" es una cifra. Por ejemplo en p4 la respuesta
puede ser 120 cm; la respuesta en el p2 puede ser 4 días, etc. En todo caso deberá proveer
evidencia que apoye sus conclusiones.

Denominaremos como "problemas de cifras" al conjunto que abarca


todos estos tipos de problemas, para los cuales la solución tiene forma de una
cifra.
Pero también puede suponer algo y quiere saber si es cierto o no. Por
ejemplo Ud. sospecha que:
p6. Los pacientes con infección urinaria, curan en mayor porcentaje
cuando reciben cefalosporinas, que cuando reciben trimetoprima
sulfa.
p7. Los pacientes con HIV tienen mayor prevalencia de tuberculosis
pulmonar.
p8. La incidencia de infarto agudo de miocardio es mayor entre pacientes
fumadores.
p9. La radiografía de tórax es menos específica que la tomografía
computada para el diagnóstico de cáncer de pulmón.
p10. La inhalación de asbestos es factor de riesgo de cáncer de pulmón.
p11. La carencia de ingesta de frutas frescas causa escorbuto.
p12. En los seres humanos hay una relación entre peso y superficie
corporal, tal que se puede usar el peso para predecir la superficie
corporal.
Ya que los enunciados p6 a p12 son hipótesis (31, 51), los denominaremos,
problemas de hipótesis. Cuando termine la investigación obtendrá evidencia a
favor o en contra. Entonces podrá responder con un “si” o “no” . En la actualidad
se sabe que no alcanza con responder “si o no” y se agrega el grado de probabilidad
de que el enunciado sea falso (pvalor).
Pero también puede clasificarlos según el procedimiento de solución.

4.3 - Clasificación metodológica de problemas científicos según


procedimiento implicado en la solución

Según el procedimiento implicado en su solución, los problemas científicos


se pueden clasificar en cuatro modelos básicos: cuantificación, correlación,
comparación, y explicación de relación causa efecto. (15) Tal como le mostraré, las
reglas para resolverlos también se pueden reducir a los correspondientes modelos
básicos que he denominado esquemas conceptuales que tratamos más
extensamente en cada capítulo específico. (caps. 6, 11, 14 y 16)

- 30 -
La primera categoría metodológica esta conformada por los problemas de
cuantificación (en la literatura, a veces, llamados descriptivos). En estos casos, la
información que busque serán cifras que indiquen el comportamiento de una
variable en una población, como Ud. puede deducir del análisis de los siguientes
ejemplos: (vea también cap. 11)
- Estimar la media de tensiones arteriales entre estudiantes de secundario.
- Estimar el porcentaje de boletas mal confeccionadas en un negocio.
- Estimar el porcentaje de anomalías faciales asociadas con agenesias del tercer molar
- Estimar qué porcentaje de pacientes vacunados quedan inmunes a la difteria.

La categoría siguiente está constituida por los problemas de correlación de


los que le muestro estos ejemplos:
- ¿ Cuál es el grado de correlación entre el tiempo de polimerización de un
sellador y su periódo de permanencia en la cavidad dentaria?
- En los seres humanos, la superficie corporal correlaciona con el peso
- El valor de creatininemia es un predictor del clearance de creatinina
- Se puede usar la edad para predecir el peso de un niño

En los problemas de correlación Ud. estudia la variación conjunta de dos o más


variables. Su intención es usar una variable para predecir la otra. Por tal motivo
deberá correlacionar las variables en estudio. En los ejemplos
- el periódo de polimerización predice el tiempo de permanencia del sellador,
- el peso servirá para predecir la superficie corporal,
- la creatininemia para predecir el clearance de creatinina y
-la edad para predecir el peso.
También obtendrá cifras, pero servirán para medir una correlación entre variables.
(Vea también el caps. 16 a 18)

En la tercera categoría están los problemas de comparación, por ejemplo:


- Establecer si en el tratamiento de la esquizofrenia hay diferencias en la
proporción de éxitos, cuando se usan dos métodos psicoanalíticos
- Los alumnos responden mejor a regímenes dirigistas de enseñanza
- Las publicaciones americanas editan mejores artículos que las europeas

En estos problemas también estudia una relación: trata de determinar si algo es


mejor, igual o peor que otra cosa. Para lograr esa información le hace falta
comparar (de allí el nombre de esta categoria) dos series de mediciones. A veces
provenientes de distintos sujetos (muestras independientes) y otras, de los mismos
sujetos (muestras relacionadas).(cap. 14)
Están incluidos en este grupo los problemas de valoración de medios de
diagnóstico y de factores de riesgo. (cap. 15)

- 31 -
En todos los problemas de comparación termina obteniendo también cifras:
por ejemplo una estimación de diferencias entre porcentajes de éxitos entre dos
tratamientos, o una estimación de riesgo relativo según la presencia o no de un
factor de riesgo.
Aunque miden eventos diferentes que los parámetros buscados en problemas
de cuantificación o de correlación, éstas también son cifras y están sometidas a
los mismos postulados que cualquier cifra.

Finalmente cuando la investigación apunta a determinar si algo es causa de


otra cosa, entonce tiene problemas de explicación de relación causa efecto como
los ejemplos que le muestro:
- Establecer si el suministro de fluor causa la detención de las caries dentales.
- Determinar la causa del Sindrome de Pierre Robin
- El acoholismo es causa de polineuritis.

Estos problemas me parecen los más interesantes y posiblemente son los más
difíciles de resolver y son los únicos que (por ahora) no tienen una cifra como
respuesta. (cap. 19)

Los avances con la disponibilidad de software han permitido que las cifras
obtenidas en las tres primeras categorías (cuantificación, correlación y
comparación) se puedan estimar dando lugar a una nueva y más eficiente
clasificación.

4.4 - CLASIFICACIÓN DE PROBLEMAS SEGÚN LA ESTIMACIÓN


BUSCADA

Es un hecho interesante el que algunos problemas de hipótesis se puedan


transformar en un problemas de cifras. (65) Por ejemplo el enunciado:

E1) El porcentaje de pacientes con infección urinaria que curan, en mayor cuando
reciben cefalosporinas, que cuando reciben trimetoprima-sulfa.

Es una hipótesis que expresada en términos algebraicos quedaría así:


E2 ) (% curaciones c/ cefalosporinas) - (% curaciones c/ trimetoprima-sulfa ) > cero

Luego se puede lograr que E2 se transforme en E3


E3 ) En pacientes con infección urinaria, la diferencia entre porcentajes de curaciones
cuando reciben cefalosporinas o cuando reciben trimetoprima-sulfa es positiva.

Considerando lo complicada que es la expresión E3 , pensará que es


preferible usar E1. Tiene razón y está equivocado.

- 32 -
Tiene razón porque es cierto que es algo más complicado redactar E3 que E1.

Y está equivocado porque como ahora la hipótesis se ha transformado en la


búsqueda de una cifra ( la diferencia entre porcentajes de curaciones ) puede
reformular el problema de un modo mucho más sencillo y eficiente diciendo que
la investigación se hizo para :

E4 ) Estimar la diferencia de porcentaje de curaciones entre pacientes con


infección urinaria que reciben cefalosporinas o trimetoprima sulfa.
Y es más eficiente porque está indicando precisamente cuál es la cifra que
hay que obtener para responder a la hipótesis.

Además puede aprovechar la disponibilidad de software que simplifica los


cálculos de intervalos de confianza para diferencias, para coeficientes de
correlación regresión, para estimadores de riesgo y para valores de cribaje de
medios diagnósticos. (ver Recursos para el Investigador Principiante, en nuestro
sitio, Apéndice )

Ahora tiene dos variantes para la formulación de algunos problemas de


hipótesis que se pueden reformular como se verá en el cuadro 5.2.2

Una vez DEFINIDA la información que busca, será tiempo de enunciar el


problema, con formato de objetivo.

- 33 -
- 34 -
5 - OBJETIVOS: FORMULACIÓN Y ANÁLISIS
Un objetivo es un enunciado en el cual se indica cuál es la información que
está buscando y cuál es la población blanco. (11). Sobre la población blanco
trataremos en el ap. 5.4.1
5.1 - Cómo formular objetivos para problemas de cifras: el verbo
"estimar"
Hay problemas en los que se buscan cifras para una población. Por ejemplo
quiere saber:
Cuál es la talla promedio de niños de 8 años
Cuánto tiempo tarda en producirse una recidiva
de un Ca gástrico operado.
Lo ideal sería obtener PARÁMETROS (medidas estadísticas para toda la
población).
Lo más común es que no pueda y no quedará otra alternativa que usar una
muestra. Las medidas estadísticas para las muestras se denominan:
ESTADÍSTICAS. (3,23)

Pero es sabido que la estadística que busca, puede tener un valor diferente
en cada muestra: si quiere “conocer” la talla promedio de un recién nacido y
toma varias muestras de recién nacidos, el promedio de las tallas no será el mismo
en cada una de las muestras tomadas. Por lo tanto lo único que podrá hacer será
ESTIMAR el parámetro que busca.
¿Y a qué se refiere cuando habla de “estimar”?
Para aproximarnos analógica e intuitivamente al concepto suponga que le dicen que
cuando usa un fármaco en dosis de 30 a 50 mg, el 95 % de los pacientes se cura. Ud
interpreta que de cada 100 veces que use el fármaco dentro de esas dosis, podrá tener
una confianza que el 95 % de las veces el paciente se curará. Estamos ofreciendo un valor
mínimo, un valor máximo y una confianza. No sabe exactamente cuánto necesita un
determinado paciente, pero con esa información puede tomar decisiones. Algo parecido
ocurre con las estimaciones.

En el contexto de la Estadística (y la Metodología), el verbo ESTIMAR


significa : cuál sería el valor mínimo y cuál sería el valor máximo que alcanzaría
la “cifra” que se quiere estudiar,con una confianza del X % (3,23)

También en este contexto el término CONFIANZA significa que si el


experimento se repitiera 100 veces, en X de esas 100 veces, la “cifra” tendría un
valor comprendido entre el valor mínimo y el valor máximo calculados.
Usando ambos términos podemos reformular los problemas dándoles un
formato PRECISO: como observa en el cuadro 5.1, la diferencia más importante
entre el problema y el objetivo, consiste en que el objetivo se ha formulado

- 35 -
Qué porcentaje de pacientes que consultan el porcentaje de pacientes que
en Dermatología son mujeres consultan en Dermatología que son mujeres.

Cuál es el promedio de días de estadía el promedio de días de estadía


postoperatorio luego de una apendicectomía postoperatorio luego de una apendicectomía
con una confianza del 90 %

La prevalencia de diabetes en una población la prevalencia de diabetes en una


población
La talla promedio de los niños de 8 años la talla promedio de los niños de 8
años
Al cabo de cuánto tiempo se produce una el tiempo tarda en producirse una
recidiva en un cáncer gástrico operado recidiva en un cáncer gástrico operado con
una confianza del 99 %

colocando el verbo “estimar” por delante del problema y haciendo los ajustes
sintácticos necesarios.
El “intervalo de valores” comprendido entre el valor mínimo y el valor
máximo calculados con una confianza del X % se denomina INTERVALO DE
CONFIANZA DEL X%. (Ver también el apartado 11.4 sobre estimación de
parámetros)

El valor estándar de X % es del 95 %. En este caso se habla del INTERVALO DE


CONFIANZA DEL 95 % y no se suele mencionar explícitamente. (Objetivos 1,3 y 4
en el cuadro). Pero si se quiere usar una confianza diferente, esto debe quedar
indicado. (Objetivos 2 y 5 en el cuadro).

Después de lo dicho en el ap. 4.4, no tendría sentido formular objetivos para


hipótesis, ya que las hipótesis se pueden traducir a cifras y sólo se debería
“estimar”. La excepción son los problemas de explicación de relación causa-efecto.

Pero todavía hay muchos investigadores que prefieren seguir usando las
hipótesis, por lo que, en el punto siguiente trataremos el modo de formular
objetivos para hipótesis.

- 36 -
5.2 - Cómo Formular Objetivos Para Problemas Hipótesis

Hay dos variantes para formular objetivos para problemas de hipótesis.


En la primera sólo hay que rescribir el problema agregando una frase, que es
la misma para todos los casos. (Cuadro 5.2.1)

Como observa, la diferencia más importante entre el objetivo y el problema,


consiste en que en el objetivo se ha colocado la frase:
“ La presente investigación se realizó para contrastar la hipótesis que…”

Es cierto que usar la misma frase resulta iterativo y posiblemente aburrido


para muchos investigadores. Si puede formular una frase diferente que
signifique “exactamente” lo mismo y que no afecte la precisión del objetivo, no
hay inconvenientes en que la use. Si le preocupa la falta de variedad recuerde
que el discurso científico se usa para informar. Si quiere entretener a sus
lectores no escriba un trabajo científico, escriba una obra literaria. La ciencia,
agradecida.

Según la información buscada quedan cuatro tipos de problemas tal como se


comprueba en el cuadro 5.2.3. En el mismo también se muestra la correspondencia
con la clasificación de metodológica .

De acuerdo con los estándares actuales la clasificación por metodología es


menos eficiente que la anterior pero más difundida y por tal motivo en el resto
del libro la seguiremos usando, aclarando, cuando corresponda, a cuál de las
nuevas categorías nos estaríamos refiriendo.

5.3 - CÓMO ELEGIR UN PROBLEMA

A estas alturas ya sabe que al menos podrá optar entre problemas


de cifras o de hipótesis.
Cuando lea el tema elegido busque huecos en la información publicada
alguna cifra que está haciendo falta, alguna hipótesis impensada.

Haga un listado de los problemas que le parezcan viables y con el


mismo consulte a su tutor para finalmente seleccionar alguno.

Atención !!! Antes de abalanzarse sobre el primer paciente que pase para
comenzar su investigación, examine los prerrequisitos éticos (cap. 20) y asegúrese
que lo que ha descubierto es un problema.

- 37 -
CUADRO 5.2.1: FORMULACIÓN DE OBJETIVOS PRECISOS PARA
PROBLEMAS DE HIPÓTESIS (Variante 1)
SI SE QUIERE CONOCER SI… CÓMO SE FORMULA CORRECTAMENTE EL
OBJETIVO CORRESPONDIENTE (*)

Los pacientes con infección urinaria, curan en La presente investigación se realizó para
mayor porcentaje cuando reciben contrastar la hipótesis que los pacientes con
cefalosporinas, que cuando reciben trimetoprima infección urinaria, curan en mayor porcentaje
sulfa. cuando reciben cefalosporinas, que cuando
reciben trimetoprima sulfa.

Los pacientes con HIV tienen mayor prevalencia La presente investigación se realizó para
de tuberculosis pulmonar. contrastar la hipótesis que los pacientes con
HIV tienen mayor prevalencia de tuberculosis
pulmonar.

La incidencia de infarto agudo de miocardio es La presente investigación se realizó para


mayor entre pacientes fumadores. contrastar la hipótesis que la incidencia de
infarto agudo de miocardio es mayor entre
pacientes fumadores.

La radiografía de tórax es menos específica que La presente investigación se realizó para


la tomografía computada para el diagnóstico de contrastar la hipótesis que la radiografía de
cáncer de pulmón. tórax es menos específica que la tomografía
computada para el diagnóstico de cáncer de
pulmón.

La inhalación de asbestos es factor de riesgo de La presente investigación se realizó para


cáncer de pulmón. contrastar la hipótesis que la inhalación de
asbestos es factor de riesgo de cáncer de
pulmón.
La carencia de ingesta de frutas frescas causa La presente investigación se realizó para
escorbuto. contrastar la hipótesis que “la carencia de
ingesta de frutas frescas causa escorbuto”.

En los seres humanos hay una relación entre La presente investigación se realizó para
peso y superficie corporal, tal que se puede usar contrastar la hipótesis que en los seres
el peso para predecir la superficie corporal humanos hay una relación entre peso y superficie
corporal, tal que se puede usar el peso para
predecir la superficie corporal

(*) Este tipo de problemas se resuelve empleando el llamado “test de hipótesis”. Cuando finalice la
investigación dispondrá de un valor de p que le permitirá responder si rechaza o no la hipótesis.

- 38 -
CUADRO 5.2.2: FORMULACIÓN DE OBJETIVOS PRECISOS PARA
PROBLEMAS DE HIPÓTESIS (Variante 2)
CÓMO SE FORMULA
SI SE QUIERE CONOCER SI… CORRECTAMENTE EL OBJETIVO
CORRESPONDIENTE (*)
Los pacientes con HIV tienen mayor Estimar la diferencia de prevalencia de
prevalencia de tuberculosis pulmonar. tuberculosis pulmonar en los pacientes
con y sin HIV.

la incidencia de infarto agudo de miocardio Estimar la relación de incidencias


es mayor entre pacientes fumadores. (riesgo relativo) de infarto agudo de
miocardio en pacientes fumadores
respecto a los no fumadores.

La radiografía de tórax es menos específica Estimar la diferencia entre


que la tomografía computada para el especificidades de la radiografía de tórax
diagnóstico de cáncer de pulmón. versus la tomografía computada para el
diagnóstico de cáncer de pulmón.

La inhalación de asbestos es factor de Estimar el riesgo relativo de cáncer de


riesgo de cáncer de pulmón. pulmón de obreros que inhalan de asbestos
respecto de quienes no lo inhalan.e
pulmón.

La carencia de ingesta de frutas frescas Es un problema de relación causa


causa escorbuto. efecto. No se puede formular como
problema de cifras.

En los seres humanos hay una relación Estimar los coeficientes de regresión
entre peso y superficie corporal, tal que se entre peso y superficie corporal en los seres
puede usar el peso para predecir la humanos.
superficie corporal

(*) Cuando finalice estas investigaciones dispondrá de una diferencia entre parámetros
poblacionales que le permitirá responder si las diferencias apoyan la hipótesis (o no) y cuál
es la magnitud de la misma. Esta información es más completa que la que se obtiene con
el Variante 1.

- 39 -
Estimación de parámetros Cuantificación
Estimación de coeficientes de correlación Correlación / Regresión
regresión
Estimación de diferencias entre Comparación (incluyendo Factores de
parámetros (*) Riesgo y Medios de Diagnóstico)

Explicación de Relación Causa/Efecto Explicación de Relación Causa/Efecto

(*) en esta categoría están incluidos los problemas de ESTIMACIÓN DE VALORES DE


CRIBAJE PARA MEDIOS DE DIAGNÓSTICO Y DE ESTIMACIÓN DE GRADO DE RIESGO PARA
FACTORES DE RIESGO.

Cualquier ocurrencia NO es un problema científico . Este requiere como mínimo de una


base empírica, y convenientemente una teórica. (8,31,70)
Por ejemplo: sea el problema "determinar si el infarto agudo de miocardio (IAM) es más
frecuente en varones". Es de esperar que tenga datos sobre una serie de por lo menos
seis o más IAM vistos por Ud. entre quienes la proporción varones hubiera sido muy
superior (2 a 1 o más). Estas observaciones previas, propias o de otros autores, constituyen
en cierto modo un sustento empírico.
El sustento teórico (background ) se podría dar : a - documentando relaciones entre
la variable independiente y las variables respuesta ; b – justificando teóricamente las
posibles respuestas a la pregunta. En el ejemplo sería de gran apoyo alguna explicación
fisiopatológica que justificara cierta labilidad anatómica del corazón masculino. (68,70)
Sin estas bases, muy especialmente la empírica, lo que Ud. cree que es un
problema científico, en realidad es una ocurrencia. Y la comunidad científica difícilmente
tolera las investigaciones sobre ocurrencias. (8)
Para determinar si un problema es apto para servir de guía a una investigación
científica Ud. deberá analizarlo.

5.4 CÓMO ANALIZAR UN PROBLEMA


Deberá realizar en forma ordenada y sucesiva los siguientes pasos:

a) identificar genéricamente la población en estudio


b) identificar genéricamente las variables involucradas

Si tiene dificultades para hacer esto, el problema aún no está listo para su
planteo y mucho menos para orientar una investigación.

- 40 -
5.4.1 Cómo identificar genéricamente la población

Uno de los elementos que hace que una investigación sea “científica”
es la búsqueda de leyes que permitan generalizar, a universos muy
grandes o directamente infinitos.

Cuando trata de determinar la utilidad de un tratamiento psicoterapéutico


en niños neuróticos en realidad quiere hacer algo más que una crónica
de aquello que ocurrió con sus pacientes: pretende extrapolar la información
obtenida a todos los niños neuróticos que pudieran consultar y, tal
vez más, a todo neurótico en general.

Dentro de este problema todos los "niños con diagnóstico de neurosis"


(los que hubo, los que hay y los que habrá) constituyen el UNIVERSO
DE DISCURSO (20) o, como ha sido definida más recientemente la POBLACIÓN
BLANCO (29) o POBLACIÓN OBJETIVO (23).

Sin embargo, como todo investigador Ud. está limitado a su tiempo y


a su espacio, por lo que sólo puede acceder a un conjunto de "niños neuróticos":
los que consulten en su lugar de trabajo durante el tiempo que dure el proyecto.
Estos serán los que constituyan su POBLACIÓN ACCESIBLE. (29) o POBLACIÓN
MUESTRADA. (23) En el capítulo 8 tratamos extensamente el tema POBLACIÓN.

Finalmente de todos los niños que le son accesibles, muchas veces termina
estudiando sólo algunos, quienes constituyen la MUESTRA en estudio. (3,4,19,23,25)

Para identificar genéricamente la población dentro de un problema


formulado le sugiero que piense en términos de población blanco, tal como
muestro en los siguientes ejemplos, en los que la he destacado en negrita:

- Estimar la media de tensiones arteriales entre estudiantes de secundario.


- Establecer si, en el tratamiento de la esquizofrenia,dos métodos
psicoanalíticos tienen la misma proporción de éxitos.
- Los alumnos responden mejor a regímenes dirigistas de enseñanza
- ¿ Cuál es el grado de correlación entre el tiempo de polimerización de un
sellador y su período de permanencia en la cavidad dentaria?
- Estimar el porcentaje de anomalías faciales asociadas con agenesias del
tercer molar
- Establecer la causa del Síndrome de Pierre Robin
- Las publicaciones americanas editan mejores artículos que las europeas
- Estimar el porcentaje de pacientes vacunados que son inmunes a la
difteria.

Ahora que ya ha identificado genéricamente la población del problema,


deberá hacer lo propio con las variables involucradas.

- 41 -
5.5 - Variables : qué son y cómo se identifican en un problema

5.5.1 Constantes y variables

Dado un conjunto (o población), una constante es una propiedad que


mide lo mismo (cap. 10) en todos los individuos. Por ejemplo, dado el conjunto de
los cuervos, el "color del plumaje" es una constante, ya que todos son "negros".
Entre los seres humanos adultos el "número de corazones" es una constante, ya
que todos tienen "uno".
En cambio una variable, es una propiedad que no mide lo mismo en todos
los individuos del conjunto. Entre los cuervos la "envergadura", el "peso", la
"talla", son variables. Entre los seres humanos ocurre lo mismo con la talla, el peso,
el sexo o el color de ojos.

Recuerde!!! Un cambio de población hace que una propiedad pueda pasar de


variable a constante y viceversa. Por ejemplo: el color del plumaje es una constante en
una población de "cuervos", pero si cambia la población a "aves", entonces es una variable,
ya que no todas las aves tienen el mismo color de plumaje.

Un aspecto interesante de las variables es que Ud. las puede medir (ap.
10.3) de alguna manera, y emplear luego esa información para descubrir, describir,
predecir y controlar eventos de la naturaleza.
Por ahora nos conformaremos con clasificar las variables según su rol
en el problema científico a resolver.

5.5.2 Tipos de Variables según su relación con el problema


Puede clasificar las variables de acuerdo a como estén involucradas en el
problema que quiere resolver. Así tiene variables...
- en estudio.
- a controlar.
- irrelevantes.

5.5.2.1 Variables en estudio


Son aquellas sobre las que está buscando información.
En los ejemplos que siguen, al final de cada problema enunciado he
colocado entre paréntesis, las variables en estudio:
- Estimar la media de tensiones arteriales entre estudiantes de secundario. (TENSION
ARTERIAL)
-- Determinar si dos métodos psicoanalíticos tienen la misma proporción de éxitos, en el
tratamiento de la esquizofrenia (RESULTADO DEL TRATAMIENTO DE LA ESQUIZOFRENIA)
- Los alumnos responden mejor a regímenes dirigistas de enseñanza. (RESPUESTA DE LOS
ALUMNOS)

- 42 -
¿ Cuál es el grado de correlación entre el tiempo de polimerización de un sellador y su
periódo de permanencia en la cavidad dentaria? (RELACION ENTRE EL TIEMPO DE
POLIMERIZACION DEL SELLADOR Y EL PERIODO DE PERMANENCIA EN LA CAVIDAD)
- Estimar el porcentaje de anomalías faciales asociadas con agenesias del tercer molar
(PRESENCIA DE ANOMALIA FACIAL)
- Establecer la causa del Síndrome de Pierre Robin (CAUSA DEL SINDROME)
- Las publicaciones americanas editan mejores artículos que las europeas (CALIDAD DEL
ARTICULO)
- Estimar el porcentaje de pacientes vacunados que son inmunes a la difteria (INMUNIDAD
A LA DIFTERIA)

5.5.2.2 Variables a controlar

Las variables a controlar son aquellas que al estado actual de los


conocimientos tienen relación con el problema en estudio y pueden ser fuente
de error evitable (sesgo). Según algunos autores también se denominan variables
intervinientes,(48) y según otros, variables confundentes (23) o variables extrañas
(40) o variables enmascaradas (33).
En la actualidad, dada la gran difusión de las técnicas de regresión múltiple
(cap 18) se suelen denominar covariables. Pero no importa cómo las denomine,
todos los autores coinciden en que hay que controlarlas.

La palabra control es un término genérico que se aplica a cualquier


procedimiento que sirva para evitar la producción de sesgos (46) los que se
pueden presentar de múltiples maneras, a veces insospechadas .

Existen varios modos de controlar covariables, según el modelo de


investigación que esté desarrollando. ( Ver también los cap. 8 - Definición de
población- y 14.5 - Control de variables en estudios de comparación )
Para aprehender el concepto de control de variables veamos un ejemplo. Sea
el problema:
[P22] - Estimar la prevalencia (%) de infección urinaria en pacientes que han estado
inmovilizados durante más de 15 días.
La variable en estudio es la presencia o no de infección urinaria en pacientes
que cumplen con la condición de haber estado inmovilizados durante más de 15
días.

A continuación Ud. se puede preguntar: “ ¿ voy a aceptar a todos los casos ?


incluso si …
... ya tenían infección o malformación urinaria ?
... reciben antibióticos durante la internación ?
... se les colocó una sonda vesical en algún momento?

- 43 -
T odas estas son VARIABLES que NO están en estudio pero:
- tienen relación con la variable en estudio (presencia de infección urinaria) y
- pueden alterar (SESGAR) las conclusiones que obtenga.

En la mayoría de las investigaciones se usa un método de control que


consiste transformar algunas covariables en constantes. Se logra al formular
los denominados CRITERIOS DE EXCLUSIÓN. Para aplicar esta técnica en el
caso del [P22] debería excluir los pacientes que :

... ya tenían infección o malformación urinaria.


... vayan a recibir antibióticos durante la internación.
... se les deba colocar una sonda vesical.

Este método (y otros que describiremos ap. 14.5) se usan con las covariables
que son conocidas.

Para intentar controlar las covariables pero que aún no han sido descubiertas
(desconocidas) se aplican procedimientos de aleatorización durante el muestreo
ya que queda la esperanza que tales variables confundentes se distribuirán
en forma tal que sea poco probable de que obtenga muestras sesgadas (cap. 9).

5.5.2.3 Variables irrelevantes

Como su nombre lo indica no son tomadas en cuenta porque son aquellas


que al estado actual del conocimiento no tienen relación con las variables en
estudio. Las menciono aquí porque vale recordar que algunos grandes
descubrimientos en ciencia se han hecho cuando alguna variable considerada
hasta entonces como irrelevante, fue elevada a nivel de covariable.

Por otra parte es posible que en algún momento, por la aparición de informes
nuevos, o cualquier otro motivo, Ud. tenga dudas acerca de si cierta variable
es irrelevante o debe ser controlada. En este caso trátela como si fuera una
variable a controlar.

Por ejemplo, hasta la fecha no existen informes que indiquen que la ingesta
de vitamina C es una variable interviniente en el problema [P22] de la prevalencia
de infecciones urinarias. Suponga que Ud. quiere realizar la investigación y
alguien dentro del equipo plantea esta posibilidad.
Primero trate de conseguir toda la información que haga falta y si luego
de ello aún persisten las dudas, trate esta variable “ingesta de la vitamina C”
como si fuera una covariable.
Esto se justifica porque si efectivamente termina siendo interviniente, Ud.
ya la controló, mientras que si era irrelevante, entonces no tuvo importancia
lo que hizo con ella.

- 44 -
Si después de haber formulado y analizado el problema y realizado
la búsqueda bibliográfica aún no tiene la información que necesita, debería
llevar a cabo una investigación.

Cuando un profesional llega a esta situación la primera pregunta que suele


formular es: ¿ Y ahora... cómo sigo ?

La lectura de la mayoría de los libros que exponen sobre metodología de


la investigación, me dejaron perplejo pues mostraban una infinidad de diseños
posibles (1, 3, 8, 11, 23, 40) con una gran variedad de nombres. Incluso se llegaba
a usar igual nombre para distintos diseños y a la inversa, según el autor que
leyera.

Cada investigación nueva tiene un diseño propio elegido por el investigador.


Por ende si la cantidad de investigaciones posibles es infinita, probablemente
habrá una infinidad de variantes de diseños entre los cuales Ud debería elegir.

La práctica durante la consulta metodológica me orientó hacia un camino más


simple de recorrer.

Primero Ud. debe BOCETEAR EL PLAN SIN ENTRAR EN DETALLES o sea


construir un esquema conceptual lo que le permitirá organizarse genéricamente.

- 45 -
- 46 -
6 - DISEÑANDO (I) : PENSANDO EN ESQUEMAS CONCEPTUALES
Convengamos que, en este contexto, un esquema conceptual (EC) es un
sistema de reglas básicas que orientan el desarrollo de una investigación en
relación con el tipo de información que se quiere obtener.

Se podría decir que es un boceto de la investigación y tiene un formato de


flujograma simplificado. Los EC son tan sencillos que puede construir una
imagen mental de los mismos, tanto si está por investigar como si se está
leyendo un trabajo científico y quiere evaluar el recorrido efectuado por el autor
del trabajo.

Una vez que disponga de esas reglas básicas, de ellas derivará otras más
elaboradas que constituyen el diseño .
El EC es un predecesor del diseño. En aquél determina a grandes rasgos qué
habrá que hacer para resolver el problema. En el diseño, considerará la factibilidad
ética y material del proyecto y especificará todos los detalles. En el apartado 7.2
le mostraré que para cada esquema conceptual puede haber diferentes diseños
posibles.

Cada EC es fácil de recordar porque va asociado con los tipos generales de


problema ya descriptos (Cuadro 5.2.3).
Los cuatro EC están organizados en tres etapas: dos teóricas y una empírica.
La primera es la ETAPA TEORICA I durante la cual Ud define la población y
establece las pautas del muestreo (diseño muestral) y el sistema de medición.
La segunda es la ETAPA EMPIRICA durante la cual Ud. recoge y analiza los datos.
La tercera también es una etapa teórica (TEORICA II) durante la cual produce la
información.
Si logró estudiar toda la población , entonces luego de analizar los datos,
directamente formulará las conclusiones. Pero si tuvo que realizar un muestreo
deberá:
- formular conclusiones con los datos obtenidos en la muestra y
- realizar el proceso de inferencia para poder formular conclusiones
sobre la población.

La primera ventaja resultante de pensar en términos de EC consiste en descubrir


que tres de los cuatro modelos, tienen las mismas actividades iniciales: definición
de población, la selección de la(s) muestra(s) y del sistema de medición.

- 47 -
6.1 ESQUEMA CONCEPTUAL PARA RESOLVER PROBLEMAS DE
CUANTIFICACIÓN o de ESTIMACIÓN DE PARAMETROS

Modelo de problema de estimación de parámetros


“Estimar la prevalencia de diabetes en adolescentes de 15 a 18 años”

La secuencia de operaciones que realizará para resolver problemas de


cuantificación, es la siguiente:

PASO NRO OPERACION A REALIZAR

(1) - Definir precisamente la población (P)


(2) - Obtener una muestra (M) de individuos, representativa.
(3) - Medir la variable en estudio en cada individuo y obtener la muestra
de mediciones.
(4) - Calcular los resultados (R)
(5) - Calcular los estimadores necesarios (medidas de tendencia central -
promedio , mediana, modo - o de dispersión - desvío estándar,
rango.)
(6) - Calcular los intervalos de confianza necesarios para los estimadores.
(7) - Formular conclusiones para la poblacion.

- GRAFICO DEL ESQUEMA CONCEPTUAL


PARA RESOLVER Y
DE

- 48 -
6.2 ESQUEMA CONCEPTUAL PARA RESOLVER PROBLEMAS DE CORRELACIÓN
o de ESTIMACIÓN DE COEFICIENTES DE CORRELACIÓN Y REGRESIÓN

Modelo de problema de estimación de coeficientes de correlación y regresión


“Estimar los coeficientes de correlación-regresión entre peso y superficie
corporal para niños de 3 a 10 años de edad”

La secuencia de operaciones que realizará para resolver problemas de estimación


de coeficientes de correlación-regresión, es la siguiente:

PASO NRO OPERACION A REALIZAR


(1) - Definir precisamente la población (P)
(2) - Obtener una muestra (M) de individuos, representativa
(3) - Medir las variables (X e Y) en estudio en cada individuo y
obtener las muestras de mediciones.
(4) - Calcular los resultados (R)
(5) - Calcular los estimadores de coeficientes de correlación-regresión
(6) - Calcular los intervalos de confianza necesarios para los estimadores
(7) - Formular conclusiones para la poblacion.

El esquema conceptual está representado en la figura 6.1. Note que el formato


de este esquema es idéntico al empleado para resolver problemas de cuantificación
salvo que, en el paso 3, en cada individuo, Ud medirá al menos una variable X y una
variable Y, mientras que en los problemas de cuantificación sólo medía una variable.

6.3 ESQUEMA CONCEPTUAL PARA RESOLVER PROBLEMAS DE


COMPARACIÓN o de ESTIMACIÓN DE DIFERENCIAS ENTRE PARÁMETROS
Hay varios modelos de problemas de comparación en los que se buscan
diferencias entre parámetros. Por ejemplo cuando quiere saber si:

a - dada una patología el porcentaje de éxitos es mayor con un tratamiento A que con
otro B. En este caso hay dos muestras de mediciones que provienen de individuos
diferentes. Por eso este modelo de estudio se denomina “a muestras independientes”
(Fig. 6.3)
b – la incidencia de una enfermedad es mayor entre quienes están expuestos a un factor
de riesgo que quienes no. (Modelo a muestras independientes) (Fig. 6.3)
c – la tensión arterial desciende después de una sesión de yoga. En este caso hay dos
muestras de mediciones : las mediciones de la tensión arterial antes de la sesión, y las
mediciones de la tensión arterial después de la sesión, pero ambas provienen del mismo
conjunto de individuos. Por eso este modelo de estudio se denomina “a muestras
relacionadas”.(Fig. 6.4)

- 49 -
d – un nuevo medio de diagnóstico tiene la misma capacidad diagnóstica que uno más
antiguo (generícamente llamado gold estándar) (Modelo a muestras relacionadas)
(Fig. 6.4)

Para que Ud. resuelva un problema de comparación o estimación de diferencias entre


parámetros le propongo un ESQUEMA CONCEPTUAL con la siguiente SECUENCIA
OPERATIVA :

PASO ACTIVIDAD
(1) - Definir precisamente la población (P)
(2) - Obtener en forma aleatoria una (o más) muestra(s) (M) de
individuos según el modelo.
(3) - Aplicar los tratamientos (T) correspondientes.
(4) – Medir las variables en las muestras de individuos y calcular los
resultados (R)
(5) – Calcular los estimadores de diferencias y comparar los R usando
las pruebas de significación adecuadas.
(6) - Calcular los intervalos de confianza necesarios para los
estimadores
(7) - Formular conclusiones para la poblacion.

│ │
│ (1) │ <------------------- (7)
│ P │ . ┘
┌──────┴───────────┴─────┐ │
│ │ │
┌───┴───┐ ┌───┴───┐ │
(2) │ M1 │ │ M2 │ │
└───┬───┘ └───┬───┘ │
│ │ │
(3) T1 ----> │ │<--- T2 │
│ │ │
│ │ │
┌──┴───┐ ┌───┴──┐ │
(4) │ R1 │ │ R2 │ │
└──────┘ └──────┘ │
───────────────────────────────── │
(5) Estimación de diferencias entre parámetros │
COMPARACION USANDO PRUEBAS DE SIGNIFICACION │
───────────────────────────────── │

(6) CONCLUSIONES -------------------->

- 50 -
│ │
│POBLACION │ <--------------------
└─────┬─────┘ │
┌───────────┐ │
│ MUESTRA │ │
└─────┬─────┘ │
TRATAMIENTO PRE ---> │ │
┌─────┴─────┐ │
│ RESULTADOS│ │
│ PRE │ │
└─────┬─────┘ │
TRATAMIENTO POST --> │ │
┌────┴──────┐ │
│ RESULTADOS│ │
│ POST │ │
└───────────┘ │
───────────────────────────────── │
Estimación de diferencias entre parámetros │
COMPARACION USANDO PRUEBAS DE SIGNIFICACION │
───────────────────────────────── │
CONCLUSIONES ------------------->

Finalmente vale recordar que hay procedimientos de comparación a


muestras relacionadas (intra sujetos, ) y a una sóla muestra (ap. 14.4.1.3)

Habiendo elegido el esquema conceptual apropiado, es tiempo


de seleccionar el diseño.

- 51 -
- 52 -
7 - DISEÑANDO (II) : INTRODUCCIÓN A LA CLASIFICACIÓN
DE DISEÑOS
Convengamos que el DISEÑO es un sistema de reglas destinado a establecer
las condiciones de recolección de los datos cuyo análisis le servirá para responder
al problema. (46)

7.1 REQUISITOS DE UNA CLASIFICACION DE DISEÑOS


Cuando se interne aún más en el conocimiento metodológico, verá que existe
una infinidad de clasificaciones de diseños. (1, 3, 11, 23, 33, 40). No tiene sentido
que las transcriba aquí, tomando en cuenta que incluso algunas son inconsistentes.
Prefiero formular los requisitos que debería cumplir una clasificación de diseños y
que después Ud los aplique a discreción.

Una clasificación de diseños debe ser como cualquier otra clasificación: es decir un
sistema de medición (cap. 10). El conjunto de las distintas categorías constituyen la escala.
Deben existir reglas coherentes que indiquen como asignar los valores. Sólo así la
clasificación será valida.

En muchas disciplinas (Epidemiología, Estadística, por ej.) se tiende a usar los nombres
propios de los diseños para identificarlos. Esto complica la comprensión del principiante
ya que hay sinonimias y homonimias varias. Pero si Ud usa los criterios que describimos a
continuación siempre estará en condiciones de identificar la operatoria usada.
Los ejes más corrientes para clasificar diseños, toman en cuenta: el método
empleado, la información buscada, la relación temporal entre la recolección de
datos y la formulación del problema, la intervención del investigador, el número
de mediciones que realice de la misma variable y el control que realice sobre
variables intervinientes. (68)

7.1.1 DISEÑOS SEGÚN MÉTODO EMPLEADO


Diseños destinados a resolver problemas de cuantificación (descriptivos),
correlación, comparación y relación causa-efecto.

7.1.2 DISEÑOS SEGÚN LA INFORMACIÓN BUSCADA


Diseños destinados a estimar parámetros, estimar coeficientes de
correlación-regresión, estimar diferencias entre parámetros, identificar causas.

7.1.3 DISEÑOS SEGÚN RELACIÓN ENTRE MOMENTOS DE


FORMULACIÓN DEL PROBLEMA Y DE REGISTRO DE LOS DATOS
Si Ud. primero formula el problema y luego recoge los datos, el diseño es
PROSPECTIVO.

- 53 -
Si, al momento de formular el problema, los datos ya estaban registrados en
alguna parte no importa por cual motivo, (por ejemplo una historia clínica) entonces
el diseño es RETROSPECTIVO. Mientras no afecte la validez interna (ap. 23.6.9.1)
puede combinar ambas variedades, pero perderá muchas de las ventajas que tienen
las investigaciones prospectivas puras.

7.1.4 DISEÑOS SEGÚN LA INTERVENCIÓN DEL INVESTIGADOR EN EL PROYECTO


Si Ud. participa en la generación de la variable dependiente (por ejemplo
suministra un tratamiento con estreptomicina para curar tuberculosis), el diseño
se denomina EXPERIMENTAL.
Si la variable dependiente se produce espontáneamente, entonces se llama
OBSERVACIONAL. Puede combinar ambos diseños mientras no afecte la validez
interna (ap. 23.6.9.1)

7.1.5 DISEÑOS SEGÚN NÚMERO DE MEDICIONES DE LA VARIABLE EN ESTUDIO


Si Ud. mide la variable en estudio una única vez en un cierto lapso, entonces
se denomina TRANSVERSAL. Por ejemplo cuando determina la prevalencia de una
enfermedad. Si la variable debe ser medida más de una vez, entonces se denomina
LONGITUDINAL. Por ejemplo si quiere determinar la incidencia de una enfermedad
necesita realizar dos mediciones (ap. 15.1.2)

7.1.6 DISEÑOS SEGÚN CONTROL DE LA VARIABLE SUBJETIVIDAD


La subjetividad puede ser fuente de error durante la medición. Para eso hace
falta que el sistema de medición involucre al menos a una persona.
Puede haber subjetividad tanto por parte del médico que asiste al paciente,
como del paciente, como de una tercera persona involucrada (laboratorista,
radiólogo, etc).
Por ejemplo: suponga que necesita probar un análgésico y antiinflamatorio.
Si Ud. le pregunta a un paciente, si siente dolor, es probable que le responda
diferente según si cree que le están suministrando el analgésico, o no. Lo mismo
le pasará a Ud. o al radiólogo, cuando valore el grado de compromiso articular.
La subjetividad se controla con el desconocimiento. Si cualquiera de las
personas mencionadas desconoce cuál es la variable indepediente a la que están
sometiendo al sujeto , entonces no hay motivos para pensar que la autosugestión
pueda ser fuente de sesgos.

Los procedimientos con los que se controla la subjetividad se denominan


"enmascaramiento" o "ceguera". Así tiene estudios a "ciego simple", si sólo un
individuo (el investigador o el paciente) ignoran cuál tratamiento está recibiendo
el paciente. Son a "doble ciego", si lo ignoran ambos.
Si la variable será medida por una máquina que arroja el dato en un papel o
una pantalla, no hace falta el control de subjetividad. Las máquinas no tienen
subjetividad.

- 54 -
7.1.7 DISEÑOS SEGÚN CONTROL DE OTRAS VARIABLES
Puede ser intersujeto (transformación en constante, balanceo) como en
los modelos a muestras independientes o intrasujeto como en los modelos a
muestras relacionadas, a muestra única, a dos muestras, a varias muestras,
muestras grandes o pequeñas (ap. 14.5), etc.

7.2 - SELECCIONANDO DISEÑOS: RELACIÓN ENTRE DISEÑOS Y ESQUEMAS


CONCEPTUALES
Como ya comenté el esquema conceptual es el antecesor del diseño, y
sobre aquél se estructura éste. Suponga que tiene la siguiente hipótesis:
"La frecuencia de fenómenos tromboembólicos post-infarto de miocardio
es menor entre los pacientes que ingieren aspirina"
La necesidad de comparar (entre los que toman y los que no toman)
permite clasificarlo correctamente como un problema de comparación.Básicamente
debe definir una población, tomar dos muestras y medir las variables en estudio
para comparar los resultados.(ap. 14.3)
Ud. puede decidir un diseño prospectivo y experimental, al tomar dos grupos
de pacientes, darle aspirina a uno y comparar la frecuencia de fenómenos
trombo-embólicos en ambos. Este tipo de diseño recibe la denominación de
ENSAYO CLÍNICO (32)
Pero puede optar por un diseño retrospectivo y observacional, si toma
las historias clínicas de pacientes con infarto de miocardio y los divide entre
los que tomaron aspirina y los que no. Luego compara la prevalencia de trombo
embolismos en ambos grupos. Finalmente puede emplear ambos diseños
combinados si ello no afecta la validez interna del trabajo.

Note que en un diseño prospectivo, la población es de SUJETOS, y las muestras, son de


resultados de mediciones realizadas con la prolijidad que requiere una investigación científica.
En un estudio retrospectivo, la población está conformada por HISTORIAS CLÍNICAS de sujetos.
Los resultados son el producto de mediciones realizadas en la rutina clínica. Ud. ya sabe que no
mide la tensión arterial del mismo modo en rutina, que cuando sospecha algo o está realizando
una investigación.

Por esas diferencias, los estudios retrospectivos son más económicos que
los prospectivos. Del mismo modo los observacionales tienen menos exigencias
que los experimentales. Pero la comunidad científica asigna mayor valor relativo
a los estudios experimentales y/o prospectivos.

El hecho que quiero resaltar es que dado un problema, EL ESQUEMA


CONCEPTUAL PARA RESOLVERLO NO CAMBIA (siempre debe definir población,
obtener muestras de resultados y hacer el análisis correspondiente) mientras
que el diseño varía según las posibilidades o las conveniencias que Ud. dispone
como investigador.

- 55 -
- 56 -
8 - POBLACIONES: ACOTANDO UNIVERSOS DE DISCURSO

8.1 DEFINICIÓN DE POBLACIONES PARA INVESTIGACIONES CLÍNICAS


En el apartado 5.4.1, definí los términos población blanco y población accesible,
ahora es tiempo de darle contenido más formal a tales enunciados.

En principio y a los fines de una investigación, Ud. debe llegar a definir


la población accesible, formulando los siguientes criterios:
- DE INCLUSIÓN
- DE EXCLUSIÓN
- TÉMPORO ESPACIALES
- DE ELIMINACIÓN

Los criterios de inclusión, están dados por el conjunto de cualidades


principales que deben tener los individuos y que están en relación con
el problema que generó la investigación.

Sea el problema de [P8.1]


Estimar la prevalencia (%) de infección urinaria en pacientes
que han estado inmovilizados durante más de 15 días.

Las características principales que hacen que un individuo sea elegible


para este proyecto son:
CI 1 - ser paciente
CI 2 - haber estado inmovilizado durante más de 15 días.
y por lo tanto son los CRITERIOS DE INCLUSIÓN (CI) o de elegibilidad.

Para el control de algunas covariables conocidas deberá formular los CRITERIOS


DE EXCLUSIÓN (CE) (ap. 5.5.2.2)
CE 1 - tener infección o malformación urinaria preexistente
CE 2 - recibir antibióticos durante la internación
CE 3 - necesitar la colocación de una sonda vesical durante la internación.

MUY IMPORTANTE: La formulación de CI, evita que al excluir tenga que


agregar enunciados bizarros como : “excluyo a los primates”, “excluyo a los
invertebrados” y así una lista infinita.
Ya en los CI señalaba, implícitamente que los primates y los invertebrados
no eran elegibles y por eso no necesitará formular criterios para excluirlos. Los
motivos de exclusión sólo se establecen para quienes hubieran sido elegibles.

Hasta aquí, los criterios definidos (inclusión y exclusión) determinan lo que


se llamaría la población blanco o sea aquel conjunto de individuos de los que
quiere hablar (correctamente hablando, universo de discurso).

- 57 -
Pero le falta considerar el planteo bioético y la accesibilidad física.

Si el paciente, o su representante, decide no participar del proyecto, también


debe ser excluido (cap. 20 ). Así que agregará siempre un criterio de exclusión
por falta de consentimiento (criterio universal de exclusión):

CE 4 - no haber consentido en participar del proyecto.

Por otra parte Ud. no tendrá acceso a cualquier paciente inmovilizado por más
de 15 días en cualquier lugar del universo, sino solamente a aquellos que
consultaron en el lugar en el que desarrolló el proyecto y durante un cierto lapso.
Por ese motivo debe informar las COORDENADAS TÉMPORO -ESPACIALES y
al hacerlo estará definiendo la POBLACIÓN ACCESIBLE. En este caso por ejemplo
podrían ser:

CTE 1 - Consultar al Hospital de Clínicas


CTE 2 - Entre el 1/1/1992 y el 31/12/1992

Finalmente trabajando en el [P 8.1] puede que haya enrolado un caso (Jaimito)


porque creyó que cumplía con los CI, CE y CTE . Luego, en algún momento,
fortuitamente descubrió que Jaimito tenía una malformación genitourinaria que
es un criterio de exclusión. Para no sesgar el análisis deberá eliminar sus datos. Si
hubiera sabido esto al principio no lo hubiera dejado entrar, pero ahora sólo queda
la eliminación de datos.

Esto es lo que se denomina un CRITERIO DE ELIMINACIÓN o sea la sea un


criterio que indica cuáles son las condiciones que hacen que los datos ,de ciertos
los individuos ya enrolados, deban ser excluidos del análisis.
Otro ejemplo: cuando compare si un tratamiento es mejor que otro, deberá
eliminar la información proveniente de pacientes que no pudieron cumplir alguno
de los esquemas terapéuticos indicados.

Ud. necesita definir la población blanco, para poder decirle a la comunidad


científica de quienes quiere hablar. T ambién necesita definir la población
accesible, para informar a quienes estudió efectivamente. Pero por diversos
motivos (el más común la falta de recursos) de la población accesible, sólo
podrá estudiar a algunos individuos quienes constituirán una muestra.

- 58 -
9 - DISEÑANDO MUESTRAS
Ud. pretenderá producir información sobre toda la población, habiendo
estudiado sólo algunos individuos. Para que esa información sea válida desde el
punto de vista científico debe realizar ciertos procedimientos denominados en
conjunto diseño muestral.

Definimos como DISEÑO MUESTRAL al sistema de reglas que indican cómo


se debe tomar la muestra ( o sea realizar el muestreo) para evitar sesgos y
disminuir al máximo el error muestral.

El diseño muestral cumple las siguientes funciones :


a – permite la replicabilidad del muestreo;
b –permite el control de la mayor cantidad posible de covariables.

Más adelante veremos el proceso operatorio que implica, pero previamente


hay que hacer algunas consideraciones teóricas, extremadamente útiles al
momento de “muestrear”.

9.1 Tamaño y representatividad de una muestra

Dada una población (P) (figura 9.1), se denomina muestra a cualquier


subconjunto de ella. (4, 46)

Así M1, M2, M3 y M4 son algunas de todas las muestras posibles que se podrían
obtener de P. (figura 9.1)

En la población hay ciertos individuos que comparten entre sí características


que los otros individuos no tienen. Por ejemplo: las A, B y C son todas letras del
abecedario. Pero las A son iguales entre si y distintas de las B y las C. El subconjunto
de las A, constituyen un estrato. (3, 23). Las B y las C, también conforman sus
propios estratos. En poblaciones de humanos, Ud. puede determinar estratos,
usando como criterio alguna propiedad: el sexo, el grupo etario, la profesión, etc.

La palabra tamaño se refiere al número de individuos. (3, 23)

Tamaño de una población es el número de individuos que la componen.


Se suele identificar con la letra N mayúscula. En el caso de la población de la
figura 9.1, N=60, o sea que la población está compuesta por 60 individuos.

- 59 -
Tamaño de una muestra es el número de individuos que la componen. Se suele
identificar con la letra n minúscula. Si está hablando de una muestra, la expresión
"n = 2", indica que la muestra está compuesta por dos individuos; "n= 8" equivale
a decir que la muestra tiene 8 individuos y así sucesivamente.

Cuando Ud pueda estudiar toda una población, seguramente lo hará. En


ese caso cualquier medición que haga de un parámetro será perfecta o sea
que tendrá un error igual a cero.

Por ejemplo si tiene una población de 500 soldados, les mide la talla a todos
y luego calcula el promedio, obtendrá el promedio exacto correspondiente a
la población. ero cuando no pueda estudiar toda la población, deberá usar
una muestra, siempre con la idea de tener información sobre la población.
En este caso esa muestra debe ser algo "especial": debe ser representativa,
o sea que el error que se cometa cuando se formulen conclusiones para la
población, debe ser mínimo y estimable.
Con una muestra representativa el error nunca es cero pero se puede
calcular y disminuir.
Por otra parte, la representatividad es más bien cuestión de grados.
Dada una población cualquier muestra tiene un cierto grado de representatividad
que depende de la aleatoreidad con la que fue obtenida, de su tamaño
y de su semejanza con la población de la que proviene.

9.2 El criterio de semejanza


Mire la figura 9.1. Suponga que obtuvo las cuatro muestras haciendo un
sorteo, dando a todos los individuos de la población la misma chance de entrar en
cada muestra.
Intuitivamente, al mirarlas, pensará que ni M1 ni M2 podrían ser consideradas
representativas de P. Le parecería que sería como aceptar que se puede analizar
la tasa de mortalidad de una ciudad, tomando sólo los varones o niños.
Sin embargo habíamos aceptado que todas las muestras tienen cierto grado
de representatividad.
Su intuición se produjo porque notó que M1, M2 aparecen menos semejantes
a la población que M3 y M4.
Convengamos que una muestra es semejante a la población cuando presenta
todos los estratos en proporciones que no difieren estadísticamente de las
poblacionales.
¿ Pero, hasta donde las variaciones en la semejanza pueden afectar la
representatividad de muestra ? Es difícil de responder.

- 60 -
Figura 9.1 : Muestras obtenidas aleatoriamente de una población de letras

En principio debería disponer de la composición real de la población o de una


estimación muy precisa. Si esto le falta nunca podrá valorar por completo la
semejanza de una muestra respecto de la población.

Si dispone de la composición de la población, las muestras quedarán divididas


en tres categorías: aquellas que son semejantes sin ninguna duda, pues tienen
una composición idéntica, como la muestra 4 del ejemplo. Aquellas que no
son semejantes, pues les falta algún estrato, como las muestras 1 y 2 del ejemplo
y finalmente aquellas en las que puede tener dudas porque están todos los
estratos, pero en proporciones diferentes que las de la población, como la
muestra 3.

Para este último tipo puede tratar de establecer el grado de semejanza,


probando la significación (cap. 13) de la siguiente hipótesis probabilística "la
proporciones de estratos de la muestra y la población NO difieren entre si" .

No he accedido a informes sobre este tema pero creo que debería ser más
estudiado tanto desde el ángulo estadístico como desde el epistemológico.
Mientras tanto, por todos estos motivos y algunos que veremos luego, el
investigador médico seguirá haciendo lo que puede y no lo que le exige la teoría,
cuando se trata de obtener muestras de una población.

- 61 -
9.3 Aleatoreidad y randomizacion
La aleatoreidad con la que Ud obtiene una muestra, se basa en la
aplicación del principio de equiposibilidad, por el cual todos y cada uno de los
individuos que componen P deben tener la misma chance de ser incluidos en
la muestra. (19)
Estrictamente hablando la teoría estadística dice que todos los individuos que
componen la población deben tener una probabilidad conocida de formar parte
de la muestra . Por eso también se habla de un muestreo probabilístico (23)
A su vez la aplicación de este principio depende de que Ud. concrete dos
actividades:
a - Defina en forma precisa la población (19)
b - Emplee algún procedimiento que garantice la igualdad de oportunidades de
cada uno de los individuos de la población para ser incluidos en la muestra.
(sorteo, tablas de números al azar, sobres cerrados, etc).

Por una incorporación de términos provenientes de la literatura anglófona


esta operatoria se denomina randomización. Y Para realizarla deberá conocer el
tamaño de la población y el de la muestra. (65, pag. 65)

En el muestreo para estudios en humanos , no es posible la aplicación cruda


del principio de aleatoriedad dado que hay obtener el consentimiento
informado. Entonces, por cada paciente que se niega, aumenta la probabilidad
para el resto de ser escogido, para quienes consienten en participar.
Si había, por ejemplo, 20 pacientes para muestrear, la probabilidad de ser
elegido para cada uno es de 1/20. Pero si 5 pacientes se niegan a participar la
probabilidad de ser elegido para los restantes pasa a ser de 1/15 . Así que en
investigación humana se sustituye la aplicación cruda del principio de
aleatoriedad por un concepto más elaborado: el sorteo se realiza entre quienes
consienten en participar.
La aleatoreidad no garantiza la plena representatividad. Es raro pero se
pueden obtener muestras aleatorias que no representan a la población.
Por ejemplo: debe tomar 20 individuos, en una población en la que hay la misma
proporción de machos que hembras. Es posible que en el sorteo salgan 18 machos y 2
hembras y aunque tiene una muestra aleatoria ésta no es semejante a la población y
por lo tanto tampoco representativa.

Para que las reglas de inferencia estadística se apliquen válidamente las


muestras se deben haber obtenido en forma aleatoria y ser semejantes a la
población. Aún así la información obtenida en cualquier muestra,
excepcionalmente es idéntica a la que obtendría estudiando toda la población.
A esa diferencia entre la información muestral y la poblacional se la
denomina “error muestral”.

- 62 -
En estudios con muestras, el error muestral es inevitable. Si el tamaño se
incrementa, el error muestral disminuye (como otros errores derivados del
muestreo, excepto los sesgos) . Al mismo tiempo aumenta el costo del estudio

A pesar de que muchos de estos conceptos son conocidos, los investigadores


siguen preguntando “cuántos casos debo reunir para tener una muestra
representativa”, como si hubiera un número mágico.

Para responder a tal pregunta se me ocurren tres planteos: dos formales


y otro pragmático.

Desde un punto de vista formal estricto Ud debería decidir qué tamaño tendrá
su muestra al planificar su investigación científica. Para ello verá que necesita
parámetros, datos.
Por ejemplo: si quiere establecer si una droga es efectiva sobre una cierta
enfermedad, deberá “conocer” al menos cuál es la proporción de curaciones actual
y la proporción de curaciones que espera obtener y sobre otros parámetros usados
para el cálculo ( errores, precisión, confianza, etc) y los deberá informar tanto
en el protocolo como en el trabajo final, conjuntamente con el tamaño muestral
calculado. (65)

9.4 - Diseño muestral: operatoria


Se desarrolla en las siguientes etapas:
a – Cálculo del tamaño muestral, previa estimación
del tamaño de la población, si fuera necesario
b – Elección del algoritmo de muestreo
c - Valoración de la semejanza de la muestra

9.4.1 - operatoria para calcular el tamaño muestral


Desde un punto de vista teórico convendría usar siempre el mayor tamaño muestral.
Pero atención !!! La relación no es lineal: a partir de un cierto punto incluso aumentos
muy importantes de tamaño sólo logran pequeñisimos incrementos de
representatividad. (3, 23, 25)

Por lo tanto desde el punto de vista práctico hay un tamaño de muestra


que puede ser considerado como óptimo. Este sería el menor número de
individuos que debería estudiar para alcanzar un máximo de representatividad. Así
lograría un importante ahorro de recursos (humanos, económicos y de tiempo).

La descripción detallada del cálculo de tamaños muestrales escapa a los objetivos de esta
obra, pero se puede consultar en la bibliografía especializada ( 23,83, 65; cap 13)

- 63 -
Hay varias maneras de estimar el tamaño. En orden de eficiencia serían:
I - Solicitar a un experto que haga el cálculo del tamaño muestral. Ganará
tiempo y confianza. Junto con el tamaño muestral el experto deberá informarle
los valores que usó (precisión, confianza, potencia, etc) (65,83)

II - Hacer los cálculos Ud. mismo:

a – Buscando algún software que pueda usar para realizar el cálculo


de alguna de las siguientes maneras:
a1 - Puede hacer cálculos online en la web. Elija la página que mejor
le convenga.
a2 - Para calcular tamaños muestrales en PC puede usar alguna
aplicación para PC, para ANDROID o Iphone (puede buscar
en nuestro sitio o en Internet en general)(Apéndice)
a3 – A mano con calculadora u hoja de cálculo, usando las
fórmulas expuestas en la bibliografía. (1,14,15,33)

El planteo formal estricto no suele ser fácil de satisfacer. En investigación


clínica es frecuente que el tamaño y/o composición de la población yel comportamiento
de la variable no sean conocidas.
En su reemplazo Ud. podrá usar un planteo formal laxo, por el cual le
está permitido proponer el valor que Ud considere conveniente para cualquiera
de estos parámetros o todos ellos. (65, cap. 13)

Cuando finalmente tiene un tamaño muestral pueden aparecer otros


problemas: el tamaño estimado suele superar largamente las posibilidades
de un consultorio de clínica. Por ejemplo: un estadístico podría decirle que para
hacer su investigación, le hacen falta 55 casos de lupus en cada uno de dos
grupos. ¿ Pero... quién puede reunir 110 casos de lupus en toda su carrera ?

9.4.2 Qué hacer si no puede conseguir tantos casos


Debe haber concordancia entre la información estadística que se busca, el
motivo por el cual se la busca, las conclusiones que se pueden formular y el número
de individuos o de observaciones de la muestra.
El conocimiento de cualquier cosa, necesariamente comienza por alguna parte,
aún cuando resulte parcializado, y después puede confiar que las sucesivas
aproximaciones lo mejorarán sustancialmente. Piense en dos tipos de investigaciones:
las exploratorias y las verificatorias. Ud. se encuentra involucrado en una
investigación exploratoria cuando trata problemas realmente nuevos, de los que
no hay información en la literatura.

- 64 -
Ya en sucesivos estudios ser irán estimando los elementos necesarios para
calcular el tamaño óptimo de muestra y luego todo será más fácil.

Pero ahora, que intenta hacer una aproximación inicial al problema: haga lo
mejor que pueda hacer. Use un planteo pragmático. Si encara una investigación
de exploración, cualquier tamaño de muestra servirá para formular hipótesis que
permitan seguir adelante. Como recomendación práctica: el número mínimo de
casos deberá ser 6, el conveniente á 30 a 50 y el ideal, mayor de cincuenta.

Las conclusiones derivadas de estos estudios alcanzarán sólo un status de


hipótesis (cap.13), cuya corroboración (verificación) deberá realizar en un futuro.

Si su investigación se refiere a un tema muy conocido y tratado en la literatura,


sus conclusiones deberán ser muy precisas. Así que, será imprescindible que
calcule con prolijidad el tamaño muestral y obtenga todos los casos requeridos.

Para formular conclusiones estadísticas con la precisión actualmente


exigida por la comunidad científica, deberá investigar disponiendo de todos
los elementos enunciados para población, muestra y variables en estudio. Sólo así
puede aprovechar al máximo el aparato matemático de la Estadística.

Si el tamaño muestral calculado es desmedido para sus posibilidades le sugiero


tres alternativas:

a - investigar de cualquier manera. En este caso, a la hora de publicar no


espere grandes comentarios y sea muy precavido en los alcances que
quiera dar a sus resultados y conclusiones.
b - buscar a un colega con el cual complementar la casuística, por ejemplo
álguien que esté estudiando los mismos casos desde otro ángulo.
c - inaugurar o ingresar en un estudio multicéntrico. (11)

Finalmente recuerde que el grado de representatividad de una muestra depende


de la aleatoreidad con la que fue obtenida, de su tamaño y de su semejanza con
la población de la que proviene.

Teniendo los tamaños estimativos de la población y de la muestra, el próximo


paso consiste en elegir el método de muestreo

- 65 -
9.4.3 elegir método de muestreo
Tendrá una muestra válida si usa cualquier procedimiento de muestreo
inventado por Ud, siempre que ese método…

A - Garantice la replicabilidad por parte del lector.


B - Controle todas las covariables conocidas a través de la
valoración de la semejanza de la muestra con la población.
C - Gestione el control de las covariables desconocidas a través
de la aleatorización.
Si no desea inventar, dispone de muchas soluciones válidas que están
disponibles y cumplen con esos requisitos.

Para encarar el algoritmo de muestreo considere al menos dos tipos de


condiciones según tipo de población a muestrear.

A población constituida o completa: técnicas de muestreo para


estudios transversales y/o longitudinales retrospectivos.
La población a muestrear ya está constituida. Su tamaño puede ser
pequeño o grande y puede estár físicamente accesible o no para el
investigador. Pero si dispusiera de la logística todos los individuos
podrían ser reunidos simultáneamente en un mismo lugar físico. En
su reemplazo se suele reunir un conjunto de números cada uno de
los cuales representa a un individuo, para poder realizar un sorteo.
Un ejemplo era el sorteo anual para decidir cuáles jóvenes eran llamados al
servicio militar usando un bolillero que contenía un número por candidato.
En esta situación están los estudios retrospectivos que se realizan
sobre materiales (fichas, historias clínicas, etc) todos los cuales ya
están disponibles al momento de diseñar la investigación.

A población a constituir o incompleta: técnicas de muestreo para


estudios longitudinales prospectivos.
Si piensa probar un nuevo fármaco en pacientes que aparecerán en
un futuro, algunos individuos que serán estudiados todavía no
existen. Se espera que aparezcan en algún momento. Lo ideal sería
estudiarlos a todos, pero si son demasiados en relación a los
recursos disponibles, habrá que muestrear.

Dada la extensión asignada a esta obra mencionaremos algunos


ejemplos de técnicas comunes, remitiéndolo a los manuales
especializados. ( 3, 23, 25, 71, 83)

- 66 -
9.4.3.1 - Muestreo probabilístico aleatorio simple
Este método es apropiado para poblaciones completas. Se caracteriza
porque cada unidad tiene una probabilidad equitativa (y conocida) de ser incluida
en la muestra. Una modalidad operativa es un sorteo (por ejemplo, colocando
en un recipiente fichas o papeles que contienen nombre o números que
correspondan a cada unidad del universo)

9.4.3.2 - Muestreo Probabilístico a población Incompleta


Es una población que todavía no existe físicamente. Pero podríamos tener
una estimación de su tamaño a partir de datos anteriores.
Por ejemplo en una maternidad con un promedio anual histórico de partos
de 3500, se puede esperar que el año próximo también haya 3500 partos .
Suponga que calculó un tamaño de 500 casos. Se obtendría una muestra aleatoria
tomando uno de cada 7 partos. Para lograrlo podría usar un listado generado por
computadora, relacionado con los números de las historias clínicas. También se
podría usar una caja conteniendo 7 sobres y uno de ellos marcado. Cada vez que
se produjera un parto sacudiría la caja para que los naipes se mezclaran y luego,
sin mirar, extraería uno. Cuando saliera el naipe marcado, el parto
correspondiente quedaría incluido en la investigación. Después vuelve a guardar
el naipe marcado en la caja, la cierra, la sacude y la guarda hasta el próximo parto.

Todo procedimiento de selección debe dar a todos los participantes la


misma oportunidad de ser incluidos en uno u otro grupo del estudio. Hay pruebas
matemáticas que documentan que es incorrecto usar el sistema de asignar casos
en forma alternada a cada grupo como por ejemplo decidir “que todos los
números pares van al grupo 1 y los impares al grupo 2 “. (45)

9.4.3.3 - Muestreos No Probabilísticos


Las muestras no probabilísticas son aquéllas en las que se desconoce la
probabilidad de que un sujeto sea seleccionado. Suelen presentar sesgos de
elección de la persona que recoge los datos, o de quien realiza el conteo, y no
satisfagan los requisitos necesarios para calcular los errores de muestreo. Pero
con frecuencia es lo único de lo que dispone el investigador biomédico.
El más deficiente de los muestreos no probabilísticos sería el denominado
"accidental o incidental", que consiste en utilizar las unidades disponibles.
Tampoco son probabilísticos el muestreo "intencional" o "por
conveniencia", y el “consecutivo”

- 67 -
Si bien los procedimientos no probabilísticos se pueden replicar literalmente
es difícil saber si las muestras obtenidas por distintos investigadores con el mismo
procedimiento son homologables y por lo tanto la comunidad científica tiende a
rechazar la evidencia así producida.

Pero hay dos procedimientos que se usan con mucha frecuencia y sin generar
críticas : el intencional y el consecutivo.

En el intencional se toman unidades supuestamente "típicas" de la población


que desea conocer. Se aplica en estudios experimentales o estudios de "casos"
y en los de “casos y controles”, ya que en éstos se decide analizar algún
fenómeno en particular, siendo necesario que la muestra reúna las características
que el investigador considera pertinentes.

En el muestreo “consecutivo”, se incluyen todos los casos que se presenten


en un lapso dado y/o hasta que se haya cubierto un número de casos necesarios.
Por ejemplo si determinó que le hacían falta 52 pacientes, toma en forma sucesiva
ininterrumpida los primeros 52 casos que cumplan los criterios de definición. Es
uno de los procedimientos más usados en la actualidad, quizás porque si la
población accesible es realmente representativa de la población blanco, es la
única situación en la que la muestra obtenida tenga las mismas chances de ser
representativa, que una muestra verdaderamente aleatoria.

9.5 - El tamaño muestral no vale un reino


Si bien es una demanda muy frecuente de todos los comités de aprobación de
protocolos de investigación, el establecimiento del tamaño muestral en investigación
con humanos debería tener un peso relativo, entre otros motivos, porque:

A - Hay tantas hipótesis presupuestas en juego, a partir de los términos


estimados en las fórmulas que ninguna de ellas se puede adjudicar la
virtud de ser la única o la mejor.
B - Hay muchas fórmulas diferentes que llevan a resultados parecidos.
“LA” fórmula perfecta es una utopía.
C - Hay autores, entre los que me cuento, que prefieren que el investigador
estime el tamaño muestral que haga falta según estas fórmulas. Si puede
reunir esos casos, bien. Si no puede entonces que estudie todos los casos
que pueda en el tiempo que dure la investigación y luego (siempre) estime
los intervalos de confianza de sus resultados para tener una idea del error
muestral cometido. (68,72)

Después que Ud. ha definido la población y ha seleccionado los individuos,


llegó el momento de que obtenga los datos.

- 68 -
10 - MEDICIÓN: CONCEPTOS. DATOS Y RESULTADOS

10.1 MEDICIÓN

Medir significa asignar valores a la dimensión de una variable empleando un


sistema de reglas y una escala preestablecidos. (45). La medición es el proceso por
el cual Ud. le asigna el valor a la propiedad.

No importa si Ud. expresa el valor en palabras o números. Siempre estará


midiendo.
Ud puede decir:
A - Juan es varón
B - Pedro tiene una temperatura de 38 grados Centígrados.

En ambos casos está midiendo pero con diferentes sistemas de medición.


"Varón" y "38 grados Centígrados" son datos. El DATO es el valor que Ud.
asigna a una variable, cuando la mide en un individuo.

10.2 ESCALAS DE MEDICIÓN


Convengamos que una escala es el conjunto de valores posibles que le puede
asignar a una variable empleando el sistema de reglas correspondiente. La escala
y las reglas para asignar valores conforman un sistema de medición.

Hay escalas en las que el conjunto de valores posibles son términos (nombres).
Por eso son denominadas ESCALAS NOMINALES. Habitualmente Ud mide la variable
sexo en una escala nominal, con dos valores (varón y mujer). Ambos son nombres
comunes.

En Medicina el sexo, la raza, el estado civil y el grupo sanguíneo son algunos


ejemplos de la multitud de variables que Ud mide en escala nominal. Hay quienes
las llaman variables categóricas (11), porque cada término de la misma determina
una categoría y otros se refieren a ellas como conceptos clasificatorios (12),
precisamente porque las reglas que Ud. usa para medir nominalmente, son
clasificaciones.
Todo el sistema de diagnósticos médicos tienen como base una escala nominal.
Cuando Ud. dice que un paciente tiene LEPRA está midiendo la variable estado de
salud y asignándole el valor LEPRA, utilizando los criterios diagnósticos como
sistema de reglas.

- 69 -
Cuando Ud. usa un concepto clasificatorio o escala nominal, las categorías
suelen quedar claramente diferenciadas. La escala para los grupos sanguíneos
está conformada por las categorías A, B, AB, O y cada individuo pertenece
o no pertenece a alguna de ellas.

Si ha diseñado una clasificación nominal y aparece un caso que no


se puede saber si pertenece o no a una de las categorías a escala
nominal que ha diseñado es imperfecta y debe perfeccionarla.

Pero, según un dicho popular, "no siempre las cosas son blanco o negro". En
la Facultad, al medir una enfermedad, lo han acostumbrado a pensar también en
términos de grados. Por ejemplo: la insuficiencia cardíaca puede estar ausente,
ser leve, moderada o intensa. En el conjunto hay valores que indican dimensiones
intermedias de la variable que está midiendo, por eso se las denomina ESCALAS
ORDINALES.

Cuando se usan palabras como leve, moderado, grave, o grado I, grado II, etc.
es fácil reconocer que se trata de una escala ordinal. La hemos denominado
escala ordinal con base nominal en contraposición a la que describo a
continuación.

Pero a veces, una escala ordinal está compuesta por números, como pasa
con el Apgar, el Apache y muchos otros puntajes ( o escores). Por ejemplo el
escore de Apgar mide la variable vitalidad del recién nacido, y está conformado
por una escala que va del 0 al 10. (18)
Las hemos denominado escalas ordinales con base numérica. No se deje
engañar por los números. Recuerde que las operaciones aritméticas corrientes
no tienen sentido para estos números.
Para reconocerlas haga un razonamiento como el que sigue. Un neonato que tiene
un Apgar de 8, TIENE MAS VITALIDAD que otro que tiene 4, PERO NO TIENE EL DOBLE.
En la escala ordinal con base numérica, los números indican un orden pero no son
directamente proporcionales a la magnitud de variable que miden.
Otros ejemplos de escalas ordinales en Medicina son todas las situaciones en
las que se emplean los términos, leve, moderado, grave, grado N, o puntajes
(escores) del tipo de los mencionados, resultados de exámenes orales, etc.
Hay otras variables como glucemia, uremia, talla, peso, clearance de creatinina,
número de cigarrillos que se fuman por día, tiempo de evolución de una enfermedad,
edad de los pacientes y muchas otras que son medidas también en una escala
compuesta por números.

- 70 -
Estos valores son directamente proporcionales a la magnitud de variable que
miden y en este caso tiene sentido que, con esos números, realice operaciones
matemáticas.

Dos tabletas de un fármaco que pesan 50 mg cada una, equivalen a una de


100 mg. Un clearance de creatinina de 60 ml/min es la mitad de otro de 120
ml/min. Estas escalas numéricas, con cuyos valores tiene sentido realizar
operaciones matemáticas se denominan ESCALAS INTERVALARES O DE INTERVALO. (45)

Existen dos variedades: las intervalares propiamente dichas y las de proporción.


En este contexto la diferencia no tiene importancia, mucho más considerando
que el procesamiento estadístico de ambas es el mismo. (45) Por tal motivo,
en el resto del libro nos referiremos indistintamente a ellas con cualquiera de
ambos términos.

10.3 Reglas de medición : Operacionalización de variables

Una vez que elegido la variable que medirá, deberá establecer el sistema de
medición o sea: la escala y las reglas con la que asignará valores. Esta tarea se
denomina: operacionalizar la variable.

En la escala nominal las reglas deben indicar bajo cuáles circunstancias un


individuo queda incluido en una categoria (12). Por ejemplo si toma la variable
estado civil y la escala conformada por los valores: casado, soltero, divorciado, viudo,
otros, las reglas pueden ser las siguientes:

1ro- Mirar el documento de identidad del individuo y


2do- buscar el lugar en dónde está registrado el estado civil y
3ro- verificar cuál de los términos que se mencionan en la escala es
el que el individuo tiene registrado, asignando ese valor al dato.

En el caso de las escalas ordinales, las reglas deben indicar cómo se logra
que un individuo ocupe una posición mayor, igual o menor, que otro. (12)
Por ejemplo, el grado de insuficiencia respiratoria de una bronquiolitis aguda (18)
se mide en una escala ordinal (Grados I, II y III) con el siguiente sistema de reglas:

Grado I: el niño puede dormir y alimentarse.


Grado II: el niño puede dormir, pero no puede alimentarse.
Grado III: el niño no puede ni dormir ni alimentarse.

- 71 -
Las escalas con base numérica, incluso si son ordinales, tienen gran ventaja
respecto de las nominales por que le permiten realizar ciertas operaciones
matemáticas fundamentales a la hora de calcular estadísticas.
Cuando mida una variable en escala intervalar, generalmente accederá
a un sistema de reglas relacionado con el instrumento con el que ha de realizar
la medición. Si tiene que pesar, registrará el resultado que perciba en la escala
de la balanza, o directamente algún número que visualice en una pantalla
electrónica. Como otro ejemplo, recuerde todos los métodos disponibles para
determinar “tensión arterial”, que se termina expresando en una escala intervalar.

Frecuentemente escuchará que alguien dice el sexo ES una variable nominal


o que la glucemia ES una variable intervalar. Esto ES INCORRECTO. Las variables
NO SON nominales, ordinales o intervalares, sino que ESTÁN MEDIDAS en una
escala con ese nombre y ésta es una decisión del investigador que depende:
- de la precisión que es necesaria al medir
- de la disponibilidad de un sistema de medición

Si Ud. por ejemplo si quiere medir la variable talla puede pensar en al menos
tres sistemas diferentes de medición:
Sistema I
Escala nominal : altos, bajos.
Regla: dado un patrón, los individuos con mayor talla serán considerados
altos, y los de menor o igual talla, bajos.
Sistema II
Escala ordinal : altos, normales y bajos.
Regla: dado un patrón, los individuos con mayor talla serán considerados
altos, y los de igual talla, normales y los de menor talla, bajos.
Sistema III
Escala intervalar: centímetros
Regla : se obliga al individuo a apoyarse descalzo, de pie con la cabeza
erguida, mirando hacia el horizonte, en una vara centimetrada. Se asignará a la
talla el valor equivalente a la longitud en centímetros que se determine entre el
extremo inferior de apoyo de los talones y el vértex cefálico.

Acabo de mostrarle que la talla no "es" una variable intervalar, sino que
"se puede medir" con cualquiera de las tres escalas. Pero en este caso Ud. disponía
de tres sistemas.
No siempre es posible usar un instrumento fabricado, a veces hay que
construirlo. Hay variables para las que no se han diseñado aún sistemas de
medición con escalas alternativas (por ejemplo: sexo, grupo sanguíneo, estado
civil, algunos estados subjetivos como miedo, etc) y se miden como al principio
del conocimiento.

- 72 -
La vitalidad infantil se medía con una escala nominal antes de la propuesta
de Virginia Apgar en 1953 (36), pero la convalidación del nuevo sistema con una
escala ordinal, revolucionó la neonatología, cambiándola definitivamente.
Ud. PUEDE generar un nuevo sistema de medición útil para su actividad con los
pacientes. Sólo inténtelo.
Desde el punto de vista de su operacionalización hay variables simples
o elementales y otras complejas.
Convengamos en definir como simples a aquellas variables en las que
el procedimiento de medición se efectúa directamente sobre la propiedad.
Por ejemplo: frecuencia cardíaca, frecuencia respiratoria, color cutáneo,
reactividad refleja, peso, talla, etc.
Cuando la medición de una variable resulta de la combinación de varias
mediciones de otras, entonces la variable es compleja. Por ejemplo el test de
APGAR sirve para medir vitalidad neonatal. Esta no se mide directamente sino que
para lograr el dato hay que medir: frecuencias cardíaca y respiratoria, color
cutáneo, reactividad refleja, etc.
Otros ejemplos de variables complejas son : afectación del estado general
(APACHE) , rendimiento académico, inteligencia, calidad de vida, etc.

Esto es importante durante la lectura crítica porque es frecuente que distintos


autores le pongan el mismo nombre a una variable compleja, pero la desagregan
de modo diferente, con lo cual no es posible comparar en forma válida los resultados
y las conclusiones de tales investigaciones.

Ud. comenzó su investigación porque requería información para solucionar


un problema. Definió su población, obtuvo su muestra, realizó las mediciones y
registró sus datos. Aquellos datos que fueron producto directo de la medición
se denominan DATOS PRIMARIOS O BRUTOS. Si con ellos realiza cálculos
aritméticos, los resultados de esos cálculos de denominan DATOS ELABORADOS
O DERIVADOS. (46)
Por ejemplo, si quería determinar la talla promedio de los neonatos de su maternidad
primero registrará los datos de la talla de cada individuo, luego los sumará y finalmente
los dividirá por el número de individuos. La talla medida en cada individuo, constituye el
dato primario. El promedio de las tallas constituye un dato derivado.
Pero solo algunos de los datos obtenidos durante la investigación pueden
ser considerados RESULTADOS.

10.4 RESULTADOS: ANÁLISIS CONCEPTUAL


Ud. comenzó el proceso con una pregunta (el problema, caps. 3 y 5). Para
mantener la coherencia del sistema sólo puede ser resultado aquello que sirva
para la respuesta.

- 73 -
Formalizando: denominaremos RESULTADOS al conjunto de datos primarios
y/o derivados con cuya interpretación pueda responder al problema que originó
la investigación. ( ap. 10.5)
Hay autores que colocan bajo el epígrafe de resultado, cualquier dato que
recogieron durante el trabajo.
En la investigación del apartado precedente (promedio de talla neonatal ), NO
PUEDE CONSIDERAR COMO RESULTADOS que 100 niños habían nacido de cesárea,
o que 25 requirieron asistencia respiratoria mecánica, o que el promedio de las
edades maternas fue de 23.5 años, aún cuando esto sea muy importante para la
DESCRIPCIÓN del grupo.
Posiblemente la responsabilidad le quepa a los editores de revistas científicas
que aceptan y estimulan la colocación de los datos descriptivos de las muestras,
bajo el epígrafe de “RESULTADOS”
Por su parte, los datos en bruto con frecuencia no representan nada por si
mismos, si no los procesa adecuadamente hasta que los haya transformado en
enunciados que respondan al problema.

Hay un resultado que tiene un nombre propio es el denominado endpoint por los
angloparlantes, y traducido como punto final. Según el NCI Dictionary of CancerTerms se
define con ese término a un evento o consecuencia que puede ser medido objetivamente
para determinar si la intervención en estudio es beneficiosa (75)

10.5 - DATOS: CONCEPTOS SOBRE PROCESAMIENTO


El procesamiento de datos es una secuencia de actividades que comienza
con la recolección de los datos y finaliza con la producción de las estadísticas,
tablas y gráficos, denominados en conjunto, como vimos, resultados. A través
de su interpretación se obtendrán enunciados científicos que se puedan
sustentar en ellos: las conclusiones.

Si bien un detalle sobre el procesamiento de datos está fuera de los


propósitos de este libro, no podríamos dejar de mencionar ciertos elementos
que ayudarán a la homogeneidad discursiva.
Puede clasificar las etapas del procesamiento de datos en: codificación y
recolección ; digitalización , depuración y análisis.
Codificar datos significa sustituir el dato obtenido por un número,cuando
ello sea necesario.
Le comenté que cuando usa la escala nominal o la escala ordinal con base
nominal, las mediciones arrojan términos.

- 74 -
Para un procesamiento eficiente es mejor transformar esos términos en
números (códigos)
Hay otras mediciones que arrojan números (cuando usa la escala ordinal con
base numérica o la escala intervalar). Respectivamente los denominamos “datos
semi cuantitativos” y “datos cuantitativos”. Para éstos, recomiendo que no los
codifique en la toma inicial . Registre directamente el número. Tendrá tiempo de
recodificarlo luego.
Si el dato no fue tomado (perdido o missing) debe identificarlo con un número
que indique esa condición. Por ej. -9999.

La codificación y recolección (registro) se puede llegar a realizar conjuntamente


con la digitalización cuando se cargan directamente los datos a una PC a través de
pantallas expresamente diseñadas pero para registrarlos se suele emplear algún
instrumento denominado genéricamente ficha de registro (FR), habitualmente
construida en soporte de papel.

El diseño de la FR requiere un proceso prolijo que describiré esquemáticamente


a través de un caso particular. Para más detalles sugiero el MIPP (65 ; cap. 17.3)

a - Formule con precisión el problema. Por ejemplo: "establecer si las personas


que consumen sushi, tienen menor incidencia de complicaciones cardiovasculares
que quienes no lo consumen”

b - Enumere las variables en estudio y las covariables (ap 5.5.2.2 ) que serán
registradas. Aquí las VARIABLES EN ESTUDIO serían: Consumo de sushi y Presencia
de complicaciones cardiovasculares. COVARIABLES (a modo de ejemplos) : Tiempo
que se lleva consumiendo sushi , Antecedentes heredofamiliares de patología
cardiovascular, Obesidad ,Diabetes.
Además, en toda investigación se deben considerar las VARIABLES DE
IDENTIDAD Y CONTEXTO : Nombre del proyecto, Número de historia clínica o de
ficha, Lugar de realización del proyecto, Año, mes y día; Nombre del paciente ; Sexo
biológico; Edad; Número de grupo al cual pertenece el paciente si hay más de uno;
Nombre del investigador a cargo.

c - Agregue, al lado de cada variable del listado precedente, la escala en la


que será medida y si es posible sus códigos o unidades de medición. Por ejemplo:
Consumo de sushi ( 0 - nulo, 1 - escaso, 2 - moderado, 3 - importante)
Presencia de complicaciones cardiovasculares.
( 0- no hubo, 1 - complicaciones menores y 2 - complicaciones mayores)
Tiempo que se lleva consumiendo sushi (….. en años) (poner cifra)
Antecedentes heredofamiliares de patología cardiovascular
(1 - con antecedentes, 0 - sin antecedentes)

- 75 -
Obesidad (1 - presente, 0 - ausente)
Diabetes (1 - presente, 0 - ausente)

Cuando deba registrar datos cuantitativos No olvide dejar un espacio para


colocar directamente el resultado de la medición, Por ejemplo:
GLUCEMIA (mg%) ……………………..
Si, como en este caso, dispone de la cifra nunca haga esto:
Glucemia: NORMAL ELEVADA BAJA.
Está perdiendo sensibilidad en la medición.

d - Con el listado de las variables a la vista, formatee la ficha de registro en


algún soporte: papel, cartulina, pantallas de bases de datos o directamente
planillas de cálculo. Puede hacerlo con un procesador de texto o con software
para producir fichas disponible en la web. (Palabras clave : “software”, “diseño”,
“cuestionarios” o similares. )

e - Realice una prueba piloto para determinar la eficacia y eficiencia de la ficha.


Utilícela con una decena de unidades (pacientes o historias clínicas) y vea si
funcionan bien o requieren ajustes. De ese modo se podrá comprobar si contiene
todos los elementos necesario.

f - Digitalizar significa transferir el dato desde el medio de recolección a un


soporte digital que luego será procesado por los paquetes estadísticos. Para su
análisis los datos deberán tener un formato que permita su procesamiento con un
paquete estadístico, como el de una tabla de planilla de cálculo tipo Excel donde se
deben registrar respetando ciertas reglas rigurosas.

g- La depuración es el proceso por el cual se trata de eliminar los datos que


pudieran ser erróneos. Cuando se trata de pocos casos la depuración se efectúa
cotejando los datos digitalizados con los existentes en las fichas o formularios.

En otras circunstancias existen diferentes técnicas (21) pero los errores que
más preocupan son los outliers o datos extremos (por ejemplo en seres humanos
un peso 600 kg, una glucemia de 7 g % etc.) Para detectar los outliers puede: g1-
usar una planilla de cálculo (por ej. el Excel) a través de la función ordenamiento
(sort) o g2 - usar algún paquete estadístico (como el Epiinfo del CDC de Atlanta)
y realizando una distribución de frecuencias y/o diagrama de caja y bigotes. Una
vez detectados se los rectifica o ratifica según lo que corresponda.

- 76 -
11 - ESTIMACIÓN DE PARÁMETROS: PROBLEMAS DE
CUANTIFICACIÓN
Los siguientes modelos de problemas de cuantificación tienen el común
denominador de que se refieren a una población y una variable en estudio:
[p1] - Estimar la media de tensiones arteriales entre estudiantes de secundario
[p2 ]- Estimar el porcentaje de boletas mal confeccionadas en un negocio.
[p3] - Estimar el porcentaje de anomalías faciales asociadas con agenesia
del tercer molar
[p4]- Estimar el porcentaje de pacientes vacunados que son inmunes
a la difteria?

A veces verá que se mencionan varias variables en estudio pero NO PARA


ESTABLECER RELACIONES ENTRE ELLAS. Por ejemplo cuando busca valores de
talla, peso y perímetro cefálico en lactantes normales. En cada caso medirá cada
variable e indicará los resultados para ellas, pero SIN INTENTAR RELACIONARLAS.

Ud. formula un problema de cuantificación porque desea conocer el


comportamiento de una variable dentro de la población. El término comportamiento
de la variable se refiere a los distintos valores que la misma alcanza efectivamente
en la población. Note la diferencia sutil, pero importante, que existe entre escala
y comportamiento de la variable. Por ejemplo: si está midiendo tallas de seres
humanos adultos puede usar el sistema métrico decimal cuya escala comienza
en el cero y llega a infinito. Pero las personas adultas raramente han medido
menos que 60 cm o más de 240 cm. Así que mientras la escala va de cero a
infinito el comportamiento de la variable se da entre 60 y 240 cm.

Una de las maneras adecuadas para saber cómo se comporta la variable,


consiste en que Ud. ordene de algún modo los distintos valores que alcanza e
indique el número de individuos que tenían cada valor. Esto es lo que se llama
una distribución de frecuencias y le servirá para exponer los resultados.

11.1 Exposición de resultados en problemas de cuantificación

Ofreceremos algunos lineamientos generales ya que un tratamiento más


extenso del tema excede los alcances de este libro, pero puede consultar otras
obras. (65,83)

En el problema [p2], la variable se medía en una escala nominal con dos


alternativas: bien confeccionadas y mal confeccionadas. Una respuesta podría
ser una distribución de frecuencias como le muestro en la T abla 11.1

- 77 -
Podría haber respondido a los problemas [p3] y [p4] a través de una tabla
parecida.
En el caso de [p1], cuando Ud. finalice el proceso de medición le quedarán
muchos datos primarios si, por ejemplo, ha controlado 2375 estudiantes
secundarios. Habrá quienes tengan una tensión de 80, quienes 85, otros 100 y
etc. La información así, no le será de mucha utilidad.
Para exponerla puede construir una tabla de distribución de frecuencias
con intervalos de clase tal como le muestro en la T abla 11.2 a partir de la cual
podrá construir un gráfico que recibirá el nombre de HISTOGRAMA O GRÁFICO
DE DISTRIBUCIÓN DE FRECUENCIAS. Los distintos perfiles que muestran estos
gráficos han hecho que algunos reciban nombres particulares, como la
DISTRIBUCIÓN NORMAL o GAUSSIANA.
Sin embargo aún no logró la síntesis máxima. El problema [p1] le exige que
resuma el comportamiento de la variable en dos valores (uno inferior y otro
superior) que conformarán los intervalos de confianza. Esta no es la única
manera de reducir la información a una cifra, también logra este objetivo cuando
usa la mediana, el modo, el desvío estándar,etc.
La media, la mediana, el modo y las demás medidas estadísticas son parámetros
si derivan del estudio de toda la población. Pero pueden recibir otros nombres.

11.2 ESTADÍSTICAS: DEFINICIÓN. TIPOS. SELECCIÓN

Es poco probable que Ud. estudie toda la población. Lo más común es que
estudie una muestra. T a m b i é n podrá calcular datos derivados para resumir
comportamientos de variables pero ahora se llaman estadísticas.

El término estadísticas así, con minúscula y en plural se refiere a ciertos datos


derivados que sirven para resumir el comportamiento de una variable, a partir
de la información obtenida de una muestra y tienen el mismo nombre que los
parámetros: promedio, mediana, modo, desvío estándar, etc. (4)

- 78 -
.

85 -89 10 0,4 0.2 - 0.8


90-94 50 2,1 1.6 - 2.8
95-99 170 7,2 6.2 - 8.3
100-104 300 12,6 11.4 - 14
105-109 680 28,6 26.8 - 30.5
110-114 600 25,3 23.6 - 27.0
115-119 340 14,3 13.0 - 15.8
120-124 150 6,3 5.4 -7.4
125-129 60 2,5 2.0 - 3.2
130-134 15 0,6 0.4 - 1.0
Total 2375 100

Salvo que ocurra una rara coincidencia, las estadísticas nunca son iguales
a los parámetros. Pero sirven para tener una idea (estimar) el valor de éstos.
Puede establecer dos categorías de estadísticas: las que consideran los
valores que están en el centro de la distribución de frecuencias, que se denominan
medidas de tendencia central y las que ponderan la variación de las variables
y que se llaman medidas de dispersión.
Ud. no puede usar cualquier estadística en forma indistinta y arbitraria.
Las medidas estadísticas más comunes se eligen del modo que muestro en
el Cuadro 11.1 (45).
La información más completa es la que brindan combinadas las medidas
de tendencia central y las de dispersión. El caso más conocido es el de la
media aritmética o promedio y el error estándar (que sirven para establecer
los intervalos de confianza) y la media aritmética y el desvío estándar (que
permiten calcular bandas de tolerancia.).

- 79 -
Por ejemplo en la tabla 11.2 el promedio de las tensiones arteriales entre
estudiantes secundarios fue de 109.56 mmHg. El desvío estándar fue de 7.688.
Si usa ambos combinados informará que la media de TAS entre estudiantes
secundarios fue de 109.56 ± 7.688 mmHg. (IC 95 % 109.25 - 109.87) (ap. 11.4.1)

11.3 - Operatoria para resolver problemas de estimación de parámetros


Comience por considerar el esquema conceptual indicado (Fig. 6.1), cuyos
pasos serían:
PASO NRO OPERACION A REALIZAR
(1) - Definir precisamente la población (P)
(2) - Obtener una muestra (M) de individuos, representativa.
(3) - Medir la variable en estudio en cada individuo y obtener la muestra
de mediciones.
(4) - Calcular los resultados (R)
(5) - Calcular los estimadores necesarios (medidas de tendencia central -
promedio , mediana, modo - o de dispersión - desvío estándar,
rango.)
(6) - Calcular los intervalos de confianza necesarios para los estimadores.
(7) - Formular conclusiones para la poblacion.

Como le comenté, una de las ventajas de trabajar con esquemas conceptuales es que
hay ciertas tareas comunes de las que sólo es necesario hablar una vez: así es que los
pasos 1 a 4 fueron tratados en los capítulos 5 y 6. Sobre la base de la distribución de
frecuencias y el tipo de información requerida para la solución del problema, concretará
los pasos 4 y 5, (cálculo de los resultados y de las estadísticas elegidas)

Sólo nos resta hablar sobre la formulación de conclusiones para las muestras,
el proceso de inferencia y la formulación de conclusiones para la población.
Genéricamente hablando, la inferencia se considera un proceso intelectual por
el cual, a partir de un conocimiento dado, se obtiene otro conocimiento nuevo. ( 8,21)
Se puede hablar de, al menos, dos tipos de inferencia: inferencia lógica e inferencia
estadística. Ambas tienen reglas propias.
En el contexto del conocimiento estadístico, se denomina inferencia estadística al
proceso por el cual, partiendo de un conocimiento sobre la muestra se obtiene
información sobre la población, bajo ciertas reglas que se conocerán en cada apartado.

La base moderna de la inferencia es la estimación de parámetros poblacionales.


Dado que es el punto central de gran parte del análisis estadístico al día, romperé
ligeramente mi promesa de no mostrarle fórmulas, pero sólo aquí.

11.4 - Estimar Parámetros Poblacionales


Según lo visto hasta el momento, ya sabe que con cualquier muestra siempre
podrá tener “algo” de información y con ese “algo” estimar el parámetro que
busca calculando el intervalo o banda de confianza. La base racional de este
procedimiento se explicó en el apartado 5.1 cuando se habló del verbo "estimar".

- 80 -
Dijimos que con la "estimación" Ud podría hacer una proyección de valores
mínimo y máximo con un cierto grado de confianza. Ud estudiaría 30, 40 , 100 casos
o los que pudiera y obtendría proyecciones como si hubiere estudiado 100 veces
una muestra de ese tamaño. Por supuesto que cuanto más pequeña es la muestra
más ancho será el intervalo. Pero el mundo no es perfecto !!!
Resuelto el tema del tamaño muestral, el segundo problema es la confianza.
Como a todos nosotros, a Ud le gustaría tener una confianza del 100% Pero hay
dificultades conceptuales y de cómputo que le impiden hacerlo. Conceptualmente
para cualquier estadística el IC del 100 % está entre menos infinito e infinito pero este
conocimiento no tiene uso práctico.
Si bien no puede hacer proyecciones con un 100% de confianza, puede con un
95%, o con el 99%, o con el porcentaje que Ud desee (excepto el del 100%). Sólo hay
que medir los casos que tiene ( no importa si son 10, 100 o 1000) y ajustar los cálculos
a la confianza elegida.
La fórmula general para cualquier intervalo de confianza (IC) es la siguiente:
IC = Estadístico ± K . EE
Donde:
Estadístico = estadístico calculado (media, porcentaje , coeficiente,
riesgo relativo, etc.)
EE = error estándar del estadístico, calculado según la fórmula para
cada parámetro (ver más adelante )
N = número de observaciones
K = coeficiente de confianza cuyo valor depende del nivel de
confianza que se pretenda y del estadístico sobre el que se lo está
calculando. (Tabla 11.4)

11.4.1 - Calcular de Intervalos de Confianza para un Promedio


Si aplicamos la fórmula general:
IC = Media ± K. EE

- 81 -
Media = es el promedio muestral obtenido
EE = Desvío Estándar / raíz cuadrada(N)
GL = Número de grados de libertad = N - 1
K = se calcula sobre la tabla de distribución del estadístico T, según
número de grados de libertad. (Tabla 11.4)

A continuación voy a calcular los intervalos de confianza del 95 % para los


siguientes datos:
Media muestral = 5.97 ; DE = 4.77 ; N=81
Preparando los datos para el cálculo tiene:
Media = 5.97
EE = (Desvío Estándar) / raíz cuadrada(n) = 4.77/ 9
Número de grados de libertad (GL) = N - 1 = 81- 1= 80
K = para 80 GL según Tabla 11.4 ≈ 1.99
Sustituyendo en la fórmula
IC 95% para la Media = 5.97 ± 1.99 x 4.77 / 9
Calculando miembro a miembro:
Límite inferior IC95 % = 5.97 - 1.99 x 4.77 / 9 = 4.915
Límite superior IC95 % = 5.97 + 1.99 x 4.77 / 9 = 7.025

En conclusión el intervalo de confianza del 95 % para la media del problema


está comprendido entre 4.915 - 7.025.
Si hubiera querido calcular el intervalo de confianza del 90 % el valor de K se
debería haber sustituido por K = 1.660

REGLA PRÁCTICA cuando no se requiere demasiada precisión: para intervalos de


confianza del 95 %, si la muestra es grande (mayor o igual a 30 casos), le puede asignar
a K (coeficiente de confianza) un valor arbitrario de 2 con lo que la fórmula quedaría:
IC95 % = MEDIA ± 2EE
Cuanto mayor sea el tamaño de la muestra, más pequeño será el error
estándar y más estrecho el intervalo de confianza. Por lo tanto, la ventaja de
tener un N grande es que el promedio de su muestra constituirá una estimación
más precisa del promedio de la población
11.4.2 - Interpretación y formulación de conclusiones para
Intervalos de Confianza para un Promedio
El concepto de banda o intervalo de confianza (IC) de X % aplicado a un
promedio o un porcentaje indica que Ud. no conocerá el valor exacto de ese
promedio (o porcentaje) pero tendrá una confianza de X % que el verdadero
promedio (o porcentaje) de la población está dentro del intervalo.

- 82 -
Ejemplo de interpretación, informe y uso de resultados
expresados como intervalos de confianza de promedios.
Variable Talla ingresantes al ejército.
Promedio obtenido 175 cm
Intervalo de confianza del 95% 173 - 176 cm

Interpretación técnica: si repitiera el experimento 100 veces, 95 de ellas el


menor promedio obtenido sería de 173 y el mayor de 176 cm.
Modo de informar la conclusión (a registrar en el trabajo de investigación):
el análisis de los datos mostró que el promedio de tallas hallado fue de 175 cm
con un intervalo de confianza del 95 % comprendido entre 173 - 176 cm.

Uso de la información (decisión operativa): un sastre militar decidiría


producir los uniformes sobre la base que la talla de los soldados es de 176 cm.
Posteriormente sería más fácil reducir la longitud de las mangas si fuera necesario. (42)

11.4.3 - Calcular de Intervalos de Confianza para una Proporción

Hay cálculos exactos y también aproximados para intervalos de confianza


para una proporción. Todas ellos en software gratuito para PC, Android o IOS.
(Apéndice) Nuevamente acudimos a mostrar un procedimiento de cálculo
aproximado aplicando la fórmula general:
IC = Media ± K. EE
En el caso de una proporción p , los miembros son los siguientes:
N = número de observaciones
n = número de observaciones con evento
Media = p = es la proporción obtenida = n/N
___________
EE= (p X q / n)
q= 1- p
K = se calcula sobre el estadístico Z de la distribución normal,
según la confianza deseada (Tabla 11.4, línea INFINITO ) .
Problema: estimar con una confianza del 95% el porcentaje de personas que
están expuestas al contagio a una epidemia y necesitan vacunas, sabiendo
que en una muestra de 81 personas, 9 presentaban carencia de anticuerpos
para el virus epidémico.

- 83 -
Datos:
K = 1.965 ( valor de Z para confianza del 95%)
n= 9 ; N = 81
p = 9/81 = 0.111
q = 1 - p = 0.889
EE = RAÍZ ( p x q /n) = RAÍZ (0.111 x 0.889 / 81) = 0.0349

Calculando miembro a miembro:


Límite inferior IC95 % = 0.111 - 1.965 x 0.0349 = 0.0424
Límite superior IC95 % = 0.111 + 1.965 x 0.0349 = 0.1795

Luego el intervalo de confianza del 95 % para la proporción del problema está


comprendido entre 0.0424 - 0.1795. Dado que K varía según la confianza deseada
si hubiera querido calcular el intervalo de confianza del 90 %, K hubiera sido igual
a 1.640.

REGLA PRÁCTICA cuando no se requiere demasiada precisión para


intervalos de confianza del 95 %, si la muestra es grande (mayor o igual
a 30 casos), le puede asignar a K un valor arbitrario de 2 con lo que la
fórmula quedaría del siguiente modo: IC95 % = p ± 2. EE

11.4.4 - Interpretación y formulación de conclusiones para Intervalos de


Confianza para una PROPORCIÓN
Variable estar expuesto a contagio
Proporción obtenida 0.111 ( 11.1 %)
Intervalo de confianza del 95% 0.0424 - 0.1795 ó
4.24 % - 17.95 %
Interpretación técnica (conclusión técnica o estadística): si repitiera el
experimento 100 veces 95 de ellas el menor porcentaje obtenido sería de 4.24 %
y el mayor de 17.95 %

Modo de informar la conclusión (a registrar en el trabajo de investigación) o


conclusión informativa: La evidencia disponible apoya la hipótesis que en la
población el porcentaje los pacientes expuestos al contagio se halla entre 4.24 y
17.95 % con una confianza del 95%

Uso de la información (decisión operativa o clínica) : un epidemiólogo


decidiría enviar vacunas asumiendo que un 17.95 % de la población puede
necesitarlas. La consecuencia de su decisión sería más grave si sólo envía vacunas
para un 4.24%. Enviando para 17.95 % tiene una confianza del 95 % de tomar una
decisión que beneficie a la mayor cantidad posible de personas.

- 84 -
11.5 - PROYECCIÓN DE LOS INTERVALOS DE CONFIANZA EN EL
CONOCIMIENTO MODERNO

Las bandas o intervalos de confianza aportan información sobre dos


componentes fundamentales para la valoración de trabajos científicos:
a - como vimos, indican una proyección a la población de los valores mínimo
y máximo posibles, para las variables en estudio.
b - permiten que el lector evalúe si el tamaño muestral empleado fue
suficiente. Si la banda de confianza es estrecha, entonces se considera que el
tamaño muestral fue suficiente.
Hasta donde hemos leído, la estrechez de las bandas de confianza es una
cuestión subjetiva y vaga. Hay intervalos en los cuales todos estarían de acuerdo
en que son estrechos y otros en los que coincidirían en que no lo son. También
hay valores que son considerados estrechos por algunos autores y no por otros.

Como los intervalos de confianza tienen uso en las decisiones operativas he


recurrido al siguiente criterio de estrechez de intervalos de confianza:

Para un determinado problema, un intervalo de confianza es estrecho


cuando con el límite inferior del intervalo, se tomaría una decisión
operativa similar a la que se elegiría con el límite superior.

También vimos que se pueden tomar decisiones operativas solamente a partir


del uso del límite inferior o del límite superior, y por lo tanto la estrechez del
intervalo parecería una cuestión, hasta cierto punto, superflua. ( ver el ejemplo
del epidemiólogo y las vacunas, ap. 11.4.3).

Sin embargo en otras la estrechez del mismo es crucial, porque las


consecuencias de un error en más o en menos serían muy graves. Por ejemplo, si
un avión de la marina aceptara una confianza del 95% para aterrizar sobre el
portaaviones, correría el riesgo de caer al mar o chocar con el puente de mando
en 5 de cada 100 intentos .

Su cuestión como investigador se reduce a que para resolver problemas de


cuantificación debe obtener un intervalo de confianza. Y esto es muy fácil si
cumple las siguientes actividades:
a - obtenga una muestra representativa
b - calcule en la misma el "promedio" que busca
c - calcule la banda de confianza que necesita
empleando las herramientas adecuadas. (3, 23, Apéndice)

- 85 -
Sin saberlo, en la práctica, para las variables clínicas, Ud. como médico, hace
exactamente lo mismo. Por ejemplo: a pesar que la glucemia media normal está calculada
en 90 mg%, Ud se preocupa solamente si una paciente tiene menos de 70 mg o más de 100
mg% . Al hacerlo, está usando una banda de confianza que está entre esos valores.

Acostúmbrese a usar bandas de confianza para la información que recibe


a través de las publicaciones. Por ejemplo, antes de aceptar que la proporción
de curaciones por un tratamiento fue del 90 %, averigüe cuántos casos fueron
tratados y vea si el autor le informa la banda de confianza. Decida recién después
de este análisis.
Ud. mismo debería estimar el intervalo de confianza para cualquier estadística
que calcule (promedio, porcentaje, coeficiente de correlación, coeficiente de
regresión, desvío estándar, error estándar, etc). Pocos autores lohacen aprovechando
que son escasos los lectores que lo saben. Sin bandas de confianza las estadísticas
son casi inútiles.
Le dije en algún momento que el tamaño de la muestra tenía una importancia
relativa: con cualquier tamaño podrá estimar un intervalo de confianza. Pero
la banda será mas ancha y a medida que se achique la muestra, pierde precisión
en la información.
Pero a veces Ud no quiere saber cuánto mide la variable, sino cuántos individuos
poseen ciertos valores de la misma. Como siempre, no puede hacerlo con
exactitud porque usa muestras, pero puede aproximarse bastante empleando
las llamadas bandas de tolerancia (38).

11.6 - Intervalos o bandas de tolerancia


Una banda o intervalo de tolerancia es un intervalo de valores entre los
cuales se espera que haya un porcentaje fijo de población. Si la variable tiene
una distribución normal, los intervalos de tolerancia ya están establecidos , como
se ve a continuación.
entre… espera hallar aproximadamente…
media ± 1 DE el 67 % de los individuos de una población
media ± 2 DE el 95 % de los individuos de una población
media ± 3 DE el 99 % de los individuos de una población
Suponga que hizo los cálculos y en una población de neonatos tiene una talla promedio
de 50 cm y un desvío estándar (DE) de 1 cm. Como la variable talla tiene distribución
normal Ud. puede esperar que

entre valores de se hallen


talla de… aproximadamente…
media ± 1 DE 49 - 51 cm el 67 % de los neonatos
media ± 2 DE 48 - 52 cm el 95 % de los neonatos
media ± 3 DE 47 - 53 cm el 99 % de los neonatos

- 86 -
Este concepto de bandas de tolerancia, importado de la industria, en la que se
establece cuál es la variación TOLERABLE, en Medicina está conectado íntimamente
con una cierta manera de ver la normalidad.

11.6.1 - Uso práctico de las bandas de tolerancia.

Ud piensa implementar un taller de producción de habitáculos para


incubadoras. Las matrices producen habítáculos aptos para infantes de una talla
máxima de 52.5 cms. Quiere averiguar qué porcentaje de recién nacidos no podrán
ser ubicados en sus incubadoras.

Solicita un estudio y se le informa que la banda de tolerancia del 95 % para


esa población está comprendida entre 48.5 y 52.5 cm. Esto implica que 2.5 % de
los neonatos, son más pequeños y otro 2.5 % son más grandes que esos valores.

Los más pequeños cabrán perfectamente en un habitáculo de 52.5 cm,


pero los más grandes no, o sea que Ud debería esperar que el 2.5 % de los
recién nacidos, no puedan caber en sus incubadoras. Luego usará esta información,
obtenida a través de las bandas de tolerancia, como mejor le convenga.

Hay algunos modelos de problemas de cuantificación que podemos


considerar especiales tales como la estimación de tasas de prevalencia
e incidencia que son medidas epidemiológicas. Otros son las curvas de
sobrevida para un grupo. Todos serán motivo de análisis en el próximo
capítulo.

- 87 -
- 88 -
12 - MODELOS ESPECIALES DE PROBLEMAS DE CUANTIFICACIÓN
12.1 Tasas
Dada una población y una variable, una tasa es el cociente resultante de dividir
el número de individuos que presentan la variable, por el número de individuos que
tiene la población en una cierta unidad de tiempo (74). Desde otro ángulo también
expresan el riesgo que tiene cualquier individuo de la población, de enfermar o
morir, en el lapso establecido.
El modelo corresponde a un problema de cuantificación desde el momento
que la pregunta tipo sería:
¿ Cuál es la proporción de individuos que tienen la característica en estudio ?
y algunos ejemplos podrían ser:
¿ Cuál fue la tasa de mortalidad infantil en la Provincia de Buenos Aires durante
el año 1992 ?
¿ Cuál fue la tasa de mortalidad por coqueluche en el año 1950 en la localidad
de Chivilcoy ?

Para la mayoría de las tasas usuales ya existe acuerdo de cuál debe ser el
tamaño del denominador. Por ejemplo la mortalidad infantil y la tasa de mortalidad
global se expresan por miles, mientras que la tasa de mortalidad específica por
causa (por ejemplo por cáncer) se expresa por cien mil. (74)

Cuando el cociente es demasiado pequeño y no estuviera estandarizado el


denominador, se suele incrementar el valor en el denominador para poder expresar
el resultado con números decimales, mayores que la unidad. Por ejemplo entre las
expresiones equivalentes:
a - "la tasa de infección de herida quirúrgica fue de 0.017 por ciento"
b - "la tasa de infección de herida quirúrgica fue de 1.7 por mil"
se suele preferir la segunda.

Algunas de las tasas más empleadas son: (11)


Tasa única de mortalidad bruta anual : proporción de la población que muere en un
año en términos de la población total. Se suele expresar como muertos por mil
habitantes. Es un indicador general que decrece cuando la salud de la población
mejora, pero que no es útil para comparar grupos de población, por los diversos
factores que intervienen en su composición

Tasa de mortalidad específica anual se define como proporción de muertes en un


subgrupo especifico durante un año, en relación con el total de la población en
ese subgrupo específico.Por ejemplo tasa anual de muertes por infarto de
miocardio entre varones adultos. Se suele expresar como muertes por cien mil.

- 89 -
El valor de las tasas para una misma entidad, varía según las poblaciones. No
es la misma tasa de mortalidad infantil en Suecia, que en Namibia. Para compararlas
hacen falta fórmulas de ajuste , denominadas TASAS DE MORTALIDAD AJUSTADAS
O ESTANDARIZADAS que aparecen en libros especializados (73, 74)

Cuando desee ponderar la magnitud de una enfermedad en una


población podrá usar la incidencia y la prevalencia.

12.1.1 Prevalencia
Con la prevalencia Ud. estima la totalidad de los casos de la enfermedad que
existen en la población durante un periodo específico y puede calcularla como
sigue:

Número total de casos de la enfermedad durante un lapso específico


Prevalencia = —–––––--------------------------------------–-—-––-—-—-–-–-—–––––––––--
Población total durante el mismo período

Le servirá para medir el riesgo que tiene cualquier individuo de la población,


de estar ya enfermo por la patología. También permite estimar los recursos
de salud necesarios para controlar una enfermedad. (73, 74)
La prevalencia depende de tres factores: incidencia, duración de la
enfermedad y mortalidad; la incidencia y la prevalencia varían conjuntamente:
cuando aumenta una también lo hace la otra. Las enfermedades crónicas
tienen mayor prevalencia que incidencia, y las enfermedades agudas se comportan
en sentido inverso. (11)

12.1.2 Incidencia
Con la incidencia Ud. estima la proporción de casos nuevos de
enfermedad, que surgen en una población durante un periodo determinado.
Puede calcularla con la siguiente fórmula:

Número de casos nuevos de la enfermedad en un lapso determinado


Incidencia = —––––––––––––––––----------------------------------------------------------—––––––––
Población en riesgo

Mide la probabilidad que tiene un individuo que pertenece a esa población


de desarrollar la enfermedad en el lapso estipulado. Refleja la velocidad con que
aparecen nuevos casos de la enfermedad, sirve para calcular el riesgo relativo (ap.
15.1.2.1 ) y para pesquisar etiologías de enfermedades (cap.19, 11, 73, 74)
Todo lo expresado referente a la necesidad de tener las bandas de confianza en general,
vale para tasas, incidencia y prevalencia, que son un caso especial de proporción. (42)

- 90 -
Hasta aquí le mostré algunos ejemplos de mediciones en relación con un
período fijo de tiempo. Otras veces necesita realizar mediciones similares en
lapsos regulares, para estudiar el comportamiento de una variable: así aparecen
las curvas de valores “normales” según la edad y las “tablas de sobrevida”.

12.2 Cuantificación en relacion con el tiempo


Se trata de problemas de cuantificación ya que se estiman proporciones,
promedios, etc. Su característica peculiar es que la cuantificación de las variables
en estudio se hace a intervalos prefijados. Cuando Ud. lleva los resultados a un
gráfico de coordenadas cartesianas, en el que el eje de las X representa el tiempo,
entonces obtiene una línea que se denomina genéricamente curva.

12.2.1 Curvas de referencia para valores normales


Las variables en estudio pueden ser medidas antropométricas (CURVAS DE
CRECIMIENTO Y DESARROLLO) o valores de laboratorio (recuentos hematológicos,
secreciones endocrinas), valores clínicos (tensión arterial, tension ocular) etc,
todos ellos en relación con la edad del individuo. La producción de estudios
antropométricos, o de tablas de referencia, si bien no escapan al concepto general
de intervalos de confianza, exceden los alcances de este libro.

Otro caso particular es aquel en que Ud. trata de cuantificar la proporción de


sobrevidas en relación con el tiempo.
12.2.2 Tablas de sobrevida para un grupo
Cuando analiza algunas patologías agudas, puede saber que algunos pacientes
van a tener un evento (por ejemplo, muerte) dentro de la semana y que pasado
ese tiempo, el evento ya no ocurrirá. En esa situación, siempre a la semana, sabrá
si se produjo o no el evento. Si 30 % lo tuvo podrá afirmar que la tasa de sobrevida
a la semana fue de un 70 %, e incluso, ofrecer intervalos de confianza.
Pero cuando maneja situaciones crónicas es diferente: depende de la evolución
individual a largo plazo del fenónemo en estudio. No sabe en qué momento se
puede producir el evento así que tiene que seguir al paciente y, cada cierto lapso,
establecer si lo ha tenido. Y continua así hasta que decide finalizar el estudio.

Suponga que partió de 200 casos y en el primer año pierde 50. La tasa de
mortalidad para el primer año es del 25 % Ahora le quedan 150 casos. Si en el
segundo año pierde de nuevo 50, entonces tiene tres tasas de sobrevida:

la del primer año que fue ( 200- 50 /200) = 0.75 ó x 100 = 75.0 %
la del segundo año que fue (150 - 50 / 150) = 0.66 ó x 100 = 66.0 %

- 91 -
Note que tanto los denominadores como los numeradores se van modificando
por muertes y abandonos, así que para calcular la tercera tasa o sea la sobrevida
acumulada hay que hacer la siguiente operación:

sobrevida o probabilidad acumulada = 0.75 x 0.66 = 0.50

Como observa, la sobrevida acumulada resulta de la multiplicación de las


sobrevidas de cada período.

Con ello cuantifica la proporción de sobrevidas tomando en cuenta cuánto


tiempo ha transcurrido desde un cierto momento cero, por ejemplo del
diagnóstico, o de una operación, etc.

Los cálculos para obtener la probabilidad acumulada y sus intervalos de


confianza, son sencillos cuando encara situaciones como el ejemplo dado.
Pero las hay mucho más complejas y para ello se han diseñado métodos de
análisis de sobrevida o supervivencia. Actualmente se están empleando dos
modelos: el de Kaplan y Meier y el de Cuttler y Ederer (22, 23, 35), que, si bien
difieren en los procedimientos, conducen a estimaciones casi idénticas.

Ambos están integrados en el soft estándar disponible, incluso online.


(Apéndice)

También sirven para analizar no sólo la sobrevida , sino con cualquier evento
cuya escala de medición consista en dos alternativas: "se produjo", y "no se
produjo". Así podrá tener información evolutiva sobre recidivas, metástasis,
recaidas, etc.
Después del procesamiento y con ambas técnicas, Ud tendrá al menos la
siguiente información disponible:

a - Lapso transcurrido desde el momento cero.


b - Número de casos que iniciaron el período y estarán en riesgo.
c - Proporcion acumulada de eventos ocurridos (probabilidad acumulada de que
ocurra el evento)
d - El error estándar y/o las bandas de confianza correspondientes a esa probabilidad.

Lo expresado se puede observar en la figura 12.2.2 y la tabla 12.2.2 en relación


con la mortalidad de 128 ratas expuestas a una dosis única de cumarina.

La información de la primera línea se interpreta como que: en el período inicial


había 128 ratas. Al cumplirse una semana comenzaban el período 93 y la sobrevida
acumulada alcanzaba 0.8090 (IC95% 0.7402 - 0.8778).

- 92 -
Tabla 12.2.2: Curva de sobrevida de Kaplan y Meier para 128 ratas expuestas a
dosis única de cumarina.

Esto implica que puede tener una confianza del 95 % que el verdadero porcentaje
de sobrevida para esa población y en ese período, está comprendido en el intervalo
de confianza.

Figura 12.2.2: Curva de sobrevida de Kaplan y Meier para


128 ratas expuestas a dosis única de cumarina.

- 93 -
En la sexta línea (semana 2) comprueba que comenzaron el lapso 48
ratas.

A esa altura podría tener una confianza del 95 % que, para la población,
la sobrevida acumulada se hallaría comprendida entre 0.3878 - 0.5662 Y
así sucesivamente.

Algún software no produce intervalos de confianza, pero aporta el valor


de p acumulada y el error estándar. A los fines prácticos es lo mismo ya
que los intervalos de confianza se calculan según la fórmula general expresada
en el ap. 11.4

Hasta aquí pudo observar que mientras que en los problemas de estimación
de parámetros (cuantificación) se estudian variables , en los demás se analizan
relaciones entre variables. En este caso es necesario formular hipótesis tema
que , en el ámbito de las Ciencias de la Salud, está estrechamente ligado
a decisiones, errores y certidumbre y por ello, los trataremos en conjunto
en el capítulo siguiente.

- 94 -
13 - HIPÓTESIS: PROBABILÍSTICAS Y DETERMINÍSTICAS
DECISIÓN, CERTIDUMBRE Y ERRORES
13.1 HIPÓTESIS

Todos los días Ud. escucha enunciados tales como:

Mañana lloverá
Juan es un tipo serio
Buenos Aires es una ciudad populosa.

Estos conjuntos de signos lingüísticos con los cuales se afirma algo acerca de
alguna cosa se denominan proposiciones o afirmaciones. (20, 21)

Las afirmaciones pueden ser verdaderas o falsas. La verdad o falsedad de una


afirmación se llama valor de verdad. (20, 21, 31)

Cuando escucha algo que le parece dudoso o probablemente falso, suele


responder diciendo "éso es sólo una hipótesis" porque en el lenguaje diario esta
palabra es peyorativa. Pero las cosas son diferentes en Ciencia dónde las hipótesis
juegan un papel trascendental.

Por ejemplo, suponga que está mirando la "luz" de un semáforo y dice: "el
semáforo está en verde".

Esta afirmación es verdadera, si el semáforo está en verde, o falsa, si no lo está.


Pero en el momento en que Ud. lo dijo, ya sabía si estaba mintiendo o no, porque
estaba mirando hacia el semáforo.

Suponga que ahora se pone de espaldas al semáforo. Ya no puede determinar


de ningún modo el color de la "luz", pero de cualquier manera afirma:
"el semáforo está en verde"

Todo parece igual que antes. Pero cuando dijo que el semáforo estaba en verde,
no sabía si decía la verdad. Ud. hizo una afirmación que cumple con la siguiente
definición de hipótesis (31):

"proposición cuyo valor de verdad se desconoce al momento de ser formulada"

- 95 -
Por ejemplo, para Ud podrían ser hipótesis :
"el cabello del autor es de color rubio"
"la secretaria que transcribió las notas, es francesa"
"mañana lloverá"
"el 1º de Abril de 1536 fue un día soleado"

si, cuando las enuncia, no sabe si son verdaderas o falsas.

No son hipótesis:
"Si Napoleón no hubiera perdido en Waterloo..."
"Si Julio César no hubiera sido asesinado..."
"Si los ingleses hubieran conquistado Buenos Aires en 1806..."

Y no son hipótesis porque YA SABE que Napoleón perdió en Waterloo, Julio


César fue asesinado y los ingleses no conquistaron Buenos Aires en 1806.

Son enunciados contrafácticos, porque contradicen los hechos conocidos.(20,21)

Si aplica la definición a la vida diaria, descubrirá que Ud. formula hipótesis


permanentemente: al levantarse estira la mano al interruptor de luz, suponiendo
que la lamparita se encenderá; hace girar las llaves del encendido en el automóvil
suponiendo que arrancará; espera un trasporte al lado de una señal, suponiendo
que aquél pasará por allí.
Estos son actos que realiza sobre las siguientes hipótesis:
la lamparita encenderá,
el automóvil arrancará
el ómnibus pasará por donde lo está esperando.
Y es fácil mostrarle que son hipótesis, porque en ningún momento está
seguro si la lamparita o el motor encenderán o el ómnibus pasará por allí.

En el ámbito de las Ciencias Fácticas como Medicina hay un proceso por el


cual se prueba el valor de verdad de una hipótesis, denominado contrastación
o verificación. El mismo consiste en comparar la predicción de la hipótesis con
lo que ocurre en los hechos. (8, 31)

Si considera que el valor de verdad de una hipótesis es una variable, puede


establecer un sistema de medición con escala y reglas (ap. 10.1) .

La escala tendrá dos alternativas: VERIFICADO (corroborado) o REFUTADO.

- 96 -
Las reglas serán las de la CONTRASTACIÓN: si lo que predice la hipótesis se
comprueba en los hechos, la hipótesis se categoriza como corroborada, si no, como
refutada.
Si Ud. contrasta una hipótesis una vez, tiene sentido decir que está corroborada o
refutada. Si la contrasta varias veces y obtiene siempre el mismo resultado, también.
Esto le da una excusa para tener la sensación subjetiva de estar seguro.
Convengamos en denominar certidumbre a esa sensación subjetiva de estar seguro.

La próxima vez que la contraste Ud. tendrá “la certidumbre” que ocurrirá lo mismo
que las anteriores. Un ejemplo sería que Ud. tuviera un automóvil desde hace muchos
años. Siempre que quiso encender el motor lo logró. La próxima vez que lo intente
tendrá “la certidumbre” que el motor arrancará.
Suponga que ahora compra un auto nuevo. Cuando intenta darle arranque, a veces
arranca y a veces no. Cada vez que lo intente, estará en lo que se llama situación de
incertidumbre, porque tiene la sensación subjetiva que no sabe qué puede ocurrir.

Lo mismo le pasaría si contrasta una hipótesis muchas veces y algunas la


corrobora y otras la refuta. A este tipo las denominaré HIPÓTESIS PROBABILÍSTICAS.

El nudo del problema tiene que ver con el hecho que :

a - la mayoría (por no decir la totalidad ) de las hipótesis que constituyen las


ciencias de la salud son probabilísticas.

b - que, como profesional en Ciencias de la Salud, aún en situación de


incertidumbre Ud debe tomar decisiones. Ese es su trabajo, especialmente si es
médico.

c - además de estar en situación de incertidumbre, las decisiones que tome deben


ser consensuadas con el resto de la comunidad científica, para que esté en su
derecho legal de tomarlas.

d - como dijimos la incertidumbre es una sensación subjetiva, y al igual que la


experiencia, intransferible a otras personas. Sólo podrá consensuar decisiones
si puede medir la incertidumbre y objetivarla para compartirla.

¡Pero cómo medir la incertidumbre ?

- 97 -
13.2 CERTIDUMBRE Y PROBABILIDAD
Si va a usar un sistema de medición para la certidumbre le conviene elegir
uno que se preste para el tratamiento científico de la información.

Actualmente Ud. puede medir su certidumbre con sistemas de medición


que tienen una escala denominada probabilidad (p) o pvalor y las correspondientes
reglas asociadas.

Otros sistemas de medición usan el ODDS o momio. (ap. 15.1.2.1)

La "ESCALA" probabilidad abarca valores que van del 0 al 1 y emplea todos


los números decimales intermedios que se le puedan ocurrir. Así que p puede
valer 0.5, 0.03, 0.87, 0.999, 0.000423, etc.

En lenguaje coloquial Ud. puede expresar p en términos de porcentaje,


multiplicando el decimal por 100. Así habla de probabilidades del 99 %, 5 %, 78 %,
5 % , etc.

Los valores 0 y 1 no están permitidos para p.

Esto se debe a que cuando dice que..


para una hipótesis p= 0 equivale a decir que “ la hipótesis es FALSA”
mientras que
para una hipótesis p= 1 equivale a decir que “la hipótesis es VERDADERA”

y ello nunca debe pasar porque Ud. eligió este sistema para medir su
certidumbre sobre el resultado de la contrastación de hipótesis que a veces
resultan verdaderas y otras falsas.

Las REGLAS PARA ASIGNAR LOS VALORES serán cálculos matemáticos


preestablecidos para cada situación, tal como comprobará en cualquier tratado
de Estadística. Realizando las operaciones aritméticas necesarias, podrá asignar
un valor p para una hipótesis sobre un evento cualquiera, pero preste atención
al hecho que hay diferentes conjuntos de reglas para las operaciones. (ver ap.
14.6)
Puede ocurrir que para un mismo evento disponga de varias maneras de calcular
p con distintos resultados según las reglas que use (3) Y no hay modo de demostrar
que cualquiera de los valores calculados con formulas diferentes, sea mejor que otro.

- 98 -
La regla más conocida, indica que calcule p realizando una división, en la
que el numerador es el número de veces que la hipótesis se verificó (n) y el
denominador es el número de veces que la hipótesis fue contrastada (N). Esta
es la llamada definición frecuencial de probabilidad. (3) Así que si Ud. probó la
hipótesis 100 veces (N) y se corroboró 35 veces (n) el cálculo arroja el siguiente
resultado:
p = (n/N)= 35/100 = 0.35

Si repasa la tabla 2.2 recordará que mencioné un método estadístico


(pearsoniano) basado en una definición frecuencial de probabilidad y el
otro, (bayesiano) en una definición condicional. (3, 23, 37)

Ahora Ud. dispone de una noción objetivable y transferible del grado


de certidumbre, cuando oye hipótesis probabilísticas, como las que siguen:
- Hay un 54 % de probabilidades que hoy en el cine estén proyectando "Cirano"
- La probabilidad que el reglamento del consorcio prohíba tener perros es 0.95.
- El "48" tiene una probabilidad de salir de 1/100 en esta jugada de quiniela.

Además pensaría que podría determinar fácilmente su valor de verdad


si tuviera la oportunidad de :
- asistir al cine, 100 veces
- intentar tener un perro, 100 veces o
- jugar en la quiniela el número "48", 100 veces

Lógicamente en este caso Ud. espera que 54 veces proyecten Cirano, 95 veces le
rechacen el perro o acierte 1 vez al 48. Si esto ocurriera podría decir que las hipótesis son
verdaderas y si no ocurriera, entonces que son falsas.
Pero si Ud. piensa ir al cine sólo una vez, quiere comprar perro sólo una vez,
y paga sólo para participar de una jugada. ¿ Cómo manejar su certidumbre sobre
hipótesis probabilísticas, cuando tiene que DECIDIR una sola vez ?

13.3 DECISIONES
Ya hemos hablado de decisiones en los apartados 11.4.2 y 11.4.4, con motivo
de la interpretación y aplicación de los intervalos de confianza. Allí mencionamos
la interpretación técnica, el modo de informar la conclusión y la decisión
operativa consecuente.
A continuación podrá observar la existencia de dos modelos de flujograma
para tomar decisiones al realizar un test de hipótesis.
El más difundido es el operativo que los estadísticos vienen usando siempre
para explicar la mecánica del test de hipótesis. De este flujograma cual deriva
gran parte de la terminología que tendrá que emplear.

- 99 -
Pero también hay una versión acelerada del proceso , tan sencilla como una
“tirada” de moneda, que usan particularmente quienes se dedican a evaluar
información científica. Ambos son útiles, así que comenzaré por describirle la
versión acelerada.

13.3.1 - Proceso acelerado para “Decidir”


La situación siempre es la de comparar dos conjuntos de mediciones, para
determinar si difieren en forma estadísticamente significativa.

Ejemplo 13.3.1
Se quiere establecer si el consumo de sushi se asocia con una menor
incidencia de eventos cardiovasculares (ECV) en seres humanos adultos.
Después de haber realizado una investigación impecable obtiene los siguientes
resultados:
20/ 100 pacientes que no consumían sushi tuvieron ECV vs.
5 / 100 pacientes entre quienes consumían sushi.
O sea que la incidencia de ECV fue del 20 % en Grupo no sushi, vs. 5 % en el
Grupo sushi.
Los resultados son diferentes aritméticamente, pero para decidir si las
diferencias son estadísticamente significativas le hacen falta dos cosas: un valor
de p y un punto de corte (alfa,α) que indique cuáles valores de p señalan la
existencia de diferencias.
Dispone de dos criterios para decidir : el criterio general según el cual…

Criterio [1 ] si p≤ α , las diferencias SON ESTADÍSTICAMENTE SIGNIFICATIVAS.


Pero, el valor de α (nivel de significación) de uso habitual se sitúa en 0.05
ó 5 % lo que lleva a enunciar el

Criterio [2 ] si p≤ 0.05 , las diferencias SON ESTADÍSTICAMENTE SIGNIFICATIVAS.

Con los datos suministrados puede acudir a cualquier calculadora online (ver
Apéndice) y obtendrá que p = 0.003 Aplicando directamente el Criterio [2]
dado que 0.003 y es menor que 0.05 debe concluir que las DIFERENCIAS ENTRE
PREVALENCIAS FUERON ESTADÍSTICAMENTE SIGNIFICATIVAS.

Si hubiera estado comparando promedios y hubiera obtenido un pvalor


menor que alfa, aplicando el criterio [2] también debería concluir que las
diferencias entre promedios fueron estadísticamente significativas.

- 100 -
Como le comenté este proceso tiene la ventaja de la rapidez con la cual se
aprende y se aplica. Pero no le permite acceder a la terminología estadística
apropiada, cosa que logra aplicando el procedimiento estándar de planteo para
el test de hipótesis.

13.3.2 - Aproximación intuitiva al proceso Estándar de decisión

Ejemplo 13.3.2
Luego de agotadoras horas, estudiando Metodología, ha decidido salir a
pasear. En ese momento su pareja le recuerda que es posible que vaya a llover
y lo pone en la situación de tener que decidir si llevará paraguas o no.
Podría arrojar una moneda y decidir según caiga cara o cruz. Pero para un
estudioso de la Metodología no alcanza. Ud sólo lo llevará si está convencido
que va a llover. Sabe que existen modos de medir la probabilidad de que llueva
y decidir de un modo más “científico”. Así que busca un libro de estadística y
descubre la secuencia que buscaba.
El algoritmo estadístico para la toma de decisión, requerirá los siguientes
pasos:
Primero: formular una hipótesis (Ho) : NO LLOVERÁ. Podría haber formulado
otra tal como LLOVERÁ, pero a los fines didácticos y mantener el discurso
estadístico es preferible elegir esta Ho.
Segundo: establecer una regla de aceptación de Ho por ej.: "si p (No Lloverá)
es igual o mayor que 0.7, entonces Ho es verdadera".
Tercero: obtener el valor de p. En esa situación consultó el diario dónde
encontró que la probabilidad (p) de no llover era del 85% (p(NO LLOVERÁ) =
0.85).
Cuarto: Decidir. Como p fue mayor que 0.7, aceptó que Ho era verdadera o
sea que aceptó la hipótesis "NO LLOVERÁ".
Note que la segunda regla sólo indica como DECIDIR si H es verdadera o
falsa... Pero no indica cómo tiene que hacer para estar seguro !!! No se asombre
demasiado.
Esto no es diferente de cuando evalúa una glucemia para determinar presencia
de diabetes en un paciente. Ud sabe que algunas personas no diabéticas pueden
tener (transitoriamente) una glucemia en 150 mg %, así como que puede haber
diabéticos con glucemias de 90 mg %- O sea que cuando Ud informa: "un paciente
con 100 mg % de glucemia no es diabético" en realidad no está seguro, solamente
decide, con los elementos que tiene y para hacerlo necesita tener un punto de
corte. El ejemplo que acabamos de dar constituye una aproximación intuitiva al
proceso de teste de hipótesis. Veamos una redefinición más formal.

- 101 -
13.3.3 - Formalización estadística del proceso de decisión
Una formalización inicial para la secuencia para tomar decisión en el caso
del paraguas y la lluvia sería la siguiente :

a - formular la hipótesis (ahora se llama Ho, hipótesis nula,etc)


b - establecer un punto de corte en el valor de p (ahora se llama
nivel de significación)
c - establecer las reglas de toma de decisión. Son siempre las mismas.
Nunca cambian. Si p > alfa se acepta Ho. Si p ≤ alfa, se rechaza Ho.
d - averiguar el valor de p. En esta situación se calcula empleando una serie
de fórmulas matemáticas que genéricamente se denominan pruebas de
significación. (Tabla 14.6)
e - tomar decisión.

Este procedimiento recibe el nombre de PRUEBA, TEST O DOCIMASIA DE


HIPÓTESIS y es tratado en una rama de la Estadística, que se denomina Estadística
Inferencial por Prueba de Hipótesis. (3, 4, 23)
A los fines didácticos, me pareció conveniente enunciar las definiciones de los
términos empleados hasta aquí. Al igual que en el ejemplo 13.3.2 en todo proyecto
la norma estadística indica que sea formulada la llamada hipótesis cero que es
la única con la que trabaja el estadístico cuando realiza sus cálculos. (23)
Sea el siguiente problema:
La incidencia de complicaciones cardiovasculares (CCV) es diferente entre
personas que consumen sushi y aquellas que no.
Este enunciado es una hipótesis probabilística, que ha formulado el
investigador y por ello se la suele denominar hipótesis del investigador o
hipótesis alternativa.
Para el proceso de docimasia de hipótesis hace falta formular una hipótesis
cero, (Ho) por ejemplo así:
La incidencia de complicaciones cardiovasculares (CCV) NO es diferente entre
pacientes que consumen sushi y aquellos que no.
Precisamente se la denomina hipótesis cero o hipótesis de no diferencias
o hipótesis nula, porque enuncia que NO espera diferencias entre las
mediciones que se están comparando. La hipótesis cero es complementaria de
la hipótesis alternativa. Y es el eje del proceso estadístico.
La necesidad de su construcción tiene fundamentos estadísticos que están más
allá de los propósitos de este libro.

Para decidir si la rechaza o no, debe establecer un punto de corte que recibe el
nombre de nivel de significación y luego calcular un valor de p. Las reglas son las
establecidas: si p es menor o igual que ese punto de corte Ud. decidirá rechazar Ho.

- 102 -
Por otra parte si p es mayor que ese punto de corte, entonces los estadísticos
dicen que “falló en rechazar la Ho”. (23)
En lenguaje coloquial el resto de los profesionales hablamos de “aceptar Ho”
que, como enunciado, no es equivalente al anterior. Pero en la decisión operativa
funciona del mismo modo. Cuando lo mencione en un futuro pondré “aceptar”
entre comillas para recordar este detalle.

13.3.4 - El nivel de significación, significados y sinonimia


Desde pequeños estamos acostumbrados a establecer puntos de corte,
por ejemplo, con el pie trazábamos una raya en el piso, indicando que nuestro
rival no debía atravesarla… capisci ?
Así que el concepto parece sencillo: de este lado se rechaza y del otro se
“acepta”. Al ser usado para decidir significación se lo denomina: nivel de
significación. Como hay también otros puntos de corte, por ser, éste, el
primero, lo llamaremos alfa.
La elección del nivel de significación, en las publicaciones, se indica
expresando : “…. alfa = 0.05” o “…. alfa = 0.01”, etc.
Con alfa también cuantificará el error que se puede cometer al rechazar
Ho (vea el apartado ….. sobre Errores ) y por ese motivo se denomina error tipo
I o error tipo alfa (3, 23).
También está relacionado con el nivel de confianza (ap.11.3).
Sea un alfa = 0.05, la confianza será igual a: 1 - 0.05 = 0.95 = 95 %
Aquí aparece más claramente como medida de error. Si la confianza es del 95 %
el error es del 5 % ; si alfa = 1 % , la confianza es = 99 % ; etc.
Establecida esta relación será más fácil explicar cómo debe elegir alfa.

13.3.4.1 - Cómo elegir un nivel de significación

En el apartado 13.3.1 vimos que el alfa estándar es de 0.05 Pero si bien es


el más usado no es el único. Al igual que con la confianza, no hay niveles de
significación universales. Según las circunstancias cada investigador TIENE
DERECHO a establecer SUS PROPIAS REGLAS DE SIGNIFICACIÓN es decir, sus
propios niveles de error. Y eso tiene que ver con el tipo de decisión que está en
juego y las consecuencias.
En los ap. 11.4.2 y 11.4.4 señalamos algunas secuencias de decisiones según
los intervalos de confianza hallados. Allí hablamos sobre una “conclusión
técnica” y su aplicación a la práctica : “decisión operativa” Dado que alfa y
confianza son conceptos complementarios, podemos hacer una analogía.
Cuando alfa sea menor que p, su conclusión técnica debería ser que las
diferencias fueron estadísticamente significativas. Si fue mayor que p, debería
concluir que las diferencias fueron estadísticamente no significativas.

- 103 -
Pero las decisiones operativas ( o sea qué hará con esa información), no
dependen solamente de la conclusión técnica, sino también de las consecuencias
empíricas que deriven. Como el tema está ensamblado con un segundo tipo
de error que se puede cometer lo trataremos conjuntamente, luego de hablar
de beta.
13.3.5 ERRORES ASOCIADOS CON LA CONTRASTACIÓN DE HIPÓTESIS
PROBABILÍSTICAS
Volviendo al ejemplo 13.3.2 Ud. está SEGURO que esa tarde en que decidió
pasear, “lloverá o no lloverá”. (Se que es una trivialidad pero sirve a los fines
didácticos)
Es lo mismo que decir que hay un 100 % de probabilidades que (LLUEVA O
NO LLUEVA) esa tarde, o en cualquier otro momento. La variación conjunta de
las p de ambas hipótesis se muestra en la tabla siguiente. Note que el total siempre
es igual a 1 (o sea el 100%).

Ud había establecido que aceptaría la hipótesis que (NO LLOVERÁ) si esto


podía ocurrir un 70 % de las veces. Eso es lo mismo que establecer alfa = 0.7 Para
decidir técnicamente necesita un valor de p. En esta ocasión en el periódico se
señala que p (NO LLOVERÁ) = 0.25 Como el valor de p obtenido (x periódico) era
de 0.25, más pequeño que su nivel de significación (alfa = 0.70), su conclusión
técnica debe ser que rechaza Ho. Recuerde si p < alfa, rechaza Ho. A partir de
su conclusión técnica toma una decisión operativa y “ lleva paraguas” .
Los acontecimientos que siguen, conforman un cuadro de consecuencias.
Veamos dos cursos posibles.

CURSO 1 DE ACONTECIMIENTOS
Hasta aquí ha decidido llevar paraguas. Como no tiene otro, se lleva un enorme
paraguas, casi del tamaño de una sombrilla. Durante todo su paseo el sol brilla
en el firmamento…y el paraguas le pesa como un yunque. Es evidente que
cometió un error llevando el paraguas. Esto ocurrió porque Ud. rechazó Ho (el
procedimiento fue correcto, pero los hechos se desarrollaron en contra).

- 104 -
Este es el ya mencionado error tipo I o tipo alfa.
Ahora se ve claramente porqué conviene pensar en alfa como un nivel de error :
enseguida se hubiera dado cuenta que un 70 % de error es mucho error.

CURSO 2 DE ACONTECIMIENTOS
En contra de toda la evidencia que la indica que lleve el paraguas, decide no
llevarlo, porque no ve que haya nubes en el cielo. A los 15 minutos de estar en la
calle comienza a llover torrencialmente y Ud se moja. Corre desesperadamente
las cuadras que lo separan de su casa y cuando su pareja lo ve entrar le pregunta:
“ ¿ Volviste…. ? ¿Te mojaste?
Es evidente que cometió un error… no llevó el paraguas cuando debería
haberlo llevado. Este error se produjo porque operativamente Ud “aceptó”
Ho, o sea aceptó que no llovería. Se lo denomina error tipo II o error beta y es
el que se produce cuando se acepta una Ho que en los hechos es falsa.
Es fácil mostrar que cuando alfa aumenta, beta disminuye y a la inversa. La única
manera de disminuir simultáneamente ambos errores es incrementando el tamaño
muestral.
En la tabla 13.3.5 evidencio que, luego de decidir, siempre existe el riesgo
de cometer alguno de los dos errores. Como alfa se puede cometer al rechazar
Ho y beta al “aceptar” Ho, en una investigación sólo se puede cometer uno de
ellos. Ya aprendimos cómo se elige alfa, pero qué hacer con beta ?

Correcto

Correcto

13.3.6 - Eligiendo beta y el algoritmo final


Para estimar beta tiene dos opciones. Lo más conveniente es que lo
establezca convencionalmente al principio del diseño de la investigación, del
mismo modo que hace con el nivel de significación. Esto lo obligará a calcular un
tamaño de muestra que satisfaga ambas condiciones. En efecto, el estadístico
solicita a los investigadores los valores de alfa y beta que luego usará en las
fórmulas destinadas a calcular el tamaño muestral.

- 105 -
Así como hay un valor estándar para alfa, también hay uno para beta
establecido en un valor de 0.20 Por lo tanto LA SECUENCIA COMPLETA PARA LA
TOMA DE DECISIONES, debe incorporar la elección del error beta: tal como le
muestro a continuación:
a - formular la hipótesis (ahora se llama Ho, hipótesis nula,etc)
b - establecer los errores tipo I y tipo II deseables (habitualmente alfa=
0.05 ; beta = 0.20)
c - establecer las reglas de toma de decisión. Si p > alfa se acepta Ho.
Si p ≤ alfa, se rechaza Ho.
d - averiguar el valor de p usando las pruebas de significación.
e - tomar decisión.

Muchos investigadores, en cambio de señalar el error beta, prefieren hablar


de potencia que es igual a 1-beta. Para un beta = 0.20, la potencia = 0.80. O
sea que en el inciso b hubieran colocado “(…. alfa= 0.05 ; potencia = 0.80)”

Frecuentemente llegan a la consulta profesionales que ya terminaron su


trabajo pero se olvidaron de ... establecer el error tipo beta. Antes de hacer la
investigación, Ud debería calcular el tamaño de la muestra, usando beta como
uno de los factores para el cálculo. (29, 37, 83) Pero una vez que hizo la
investigación, es tarde para hacer lo correcto. Busque como mejorar lo hecho.
Tiene el tamaño de la muestra, no tiene beta pero sólo puede estar en una
de dos situaciones:
a - Cuando terminó su investigación Ud. había rechazado Ho.
El valor de beta ya no le interesa porque que sólo se comete después que
aceptó Ho. (tabla 13.3.5).
b - Cuando terminó su investigación Ud. había “aceptado” Ho.
Entonces calcule beta. Más vale tarde que nunca. Hay calculadoras online
que le permiten hacerlo ( Apéndice)
Habiendo quedado en claro que tanto alfa como beta se pueden elegir al
principio de la investigación, vale examinar algunos criterios que pesarán en su
elección. Cuando analizamos el problema sobre cuántas dosis de vacuna había que
enviar (ap. 11.4.3) quedó en claro que al final hay tres niveles diferentes que
podríamos llamar de decisión:
a - técnico: en el que se interpretan los resultados estrictamente del modo como
indica la teoría estadística.
b - de interpretación o informativo: en el que informan los resultados en relación
a la evidencia que aportan.
c - de aplicación u operativo: en el que se decide cómo se implementarán las
medidas a tomar, considerando no sólo lo informado (b), sino también otras
situaciones de contexto y proyecciones.

- 106 -
En el ejemplo del epidemiólogo ( ap. 11.4.3) la estimación del porcentaje de
población que necesitaría vacunarse estaba entre el 4.24 % y el 17.95 %. Con esta
evidencia, cualquier porcentaje comprendido entre esos valores tendría justificación
técnica. Pero queda en claro que si usaba un valor de 4.24 %, y se equivocaba, habría
muchas personas que quedarían desprotegidas. Por lo tanto decidió usar el 17.95%.

La elección de alfa y beta dependen del objetivo que está persiguiendo el


investigador y de lo que puede pasar si se equivoca (consecuencias). Por ejemplo:
si está probando una vacuna antisarampionosa más barata pero posiblemente
menos efectiva que la que se usa actualmente. El peor error que podría cometer
sería llegar a la conclusión que la nueva es igual de efectiva que la que tiene, cuando
en realidad es menos. Este sería un error derivado de “aceptar” Ho. Un error beta.
Si la aplicara dejaría una gran parte de la población expuesta a una enfermedad que
de otro modo hubiera prevenido. Por lo tanto no le conviene usar el valor estándar
de 0.20 para beta, y debería proponer uno de 0.05 o más bajo.

La situación inversa, o sea tener que disminuir alfa, se dará cuando el peor error
que puede cometer se producirá al rechazar Ho. Por ejemplo está probando un
fármaco caro con “Ho = no es efectivo”. Si rechaza Ho, pensará que es efectivo. Pero
si en realidad no lo es (cometió un error alfa) no sólo hará que sus pacientes gasten
más sino que tampoco los estará protegiendo.

En resumen, los valores estándar se modifican si las consecuencias de “aceptar”


o rechazar Ho son graves. Y esto sólo lo sabe Ud, el investigador, cuando está
diseñando el proyecto.

13.4 Donde hay una hipótesis probabilística hay una p


Hemos postulado la necesidad de calcular p para decidir sobre hipótesis
probabilísticas. El formato básico para el cálculo de p es
p = n /N
donde n = número de veces que algo ocurre y
N = total de veces que podría ocurrir
Por ejemplo la probabilidad de que salga un TRES en una tirada de un dado es
de 1/6.
Pero si lo piensa un poco, también son probabilísticas las hipótesis sobre factores
de riesgo o sobre medios de diagnóstico. Allí nunca mencionamos la p, pero es
tiempo de descubrir dónde se esconde.
13.4.1 - La p en Estudios de Riesgo
Cuando consideraba “riesgo”, calculaba dos medidas básicas (entre otras):
incidencia y odds.

- 107 -
Claro que una incidencia es:
número de casos / número de expuestos o sea n/N, de lo cual se deduce
que la incidencia es una medida de riesgo pero también es una probabilidad.

La relación entre odds y probabilidad , señalando que son intercambiables, se mostró


en el ap……

13.4.2 - La p en Estudios de Diagnóstico


En la definición de sensibilidad se indicaba claramente que era “… la probabilidad
que un individuo sea positivo al nuevo medio de diagnóstico, habiendo dado positivo
al gold estándar.” Y así siguiendo con el resto de medidas de cribaje (cap. …)

Como vemos, para poder tomar decisiones sobre hipótesis probabilísticas siempre
deberá calcular un pvalor, aún cuando a veces lo llame de otro modo.

Pasemos ahora a considerar los distintos tipos de problemas de comparación.

- 108 -
14 - ESTIMACIÓN DE DIFERENCIAS ENTRE PARÁMETROS
(PROBLEMAS DE COMPARACIÓN)
Suponga que ha formulado un problema como el siguiente:
[P15] “ Las personas que consumen sushi tienen menor incidencia de eventos
cardiovasculares (ECV) que quienes no lo hacen “
Se apresurará a decir que esta es una hipótesis y que la respuesta debería
ser “si” o “no” con un cierto grado de probabilidad asociado.
Es cierto… Pero para llegar a la respuesta, necesitará medir la incidencia
de ECV tanto en consumidores de sushi, como en no consumidores y luego
comparar ambas incidencias. Por este motivo los hemos denominado problemas
de comparación. Pero también deberá usar las pruebas de significación adecuadas
para obtener el pvalor, dado que está manejando una hipótesis probabilística

Con el tiempo los investigadores se dieron cuenta que determinar si las diferencias
eran significativas no alcanzaba y establecieron que sería conveniente tener una
estimación de la diferencia. Por ese motivo actualmente los denominamos problemas
estimación de diferencias entre parámetros. (65)

Todo comienza con una formulación apropiada de la hipótesis a testear.

14.1 - FORMULACIÓN DE HIPÓTESIS PARA PROBLEMAS DE COMPARACIÓN

Para obtener información en problemas como [P15] debe establecer su


significación (calcular pvalor), o sea, seguir las pautas establecidas en el ap.
13.3.6, a saber:

a - Formular la hipótesis nula (Ho)


b - Establecer un nivel de significación (alfa) y el error beta aceptables.
c - Establecer las reglas de toma de decisión.
Si p > alfa acepta Ho.
Si p≤ alfa rechaza Ho.
d - Averiguar el valor de p a través de las pruebas de significación
adecuadas para docimasia de hipótesis.
e - Tomar decisión estadística.

Un hecho fundamental para la interpretación de los resultados es que en los


problemas de comparación, dispone de dos formatos de Ho.

- 109 -
14.1.1 Formas de hipótesis nulas en problemas de comparación
La enunciación de Ho, siempre depende de la forma de la hipótesis que tiene
el investigador, la que suele denominarse HIPÓTESIS ALTERNATIVA (Ha).
Algunos modelos de Ha serían:
Ha1- En pacientes tuberculosos, la proporción de curaciones en tratados
con estreptomicina es DISTINTA que la proporción de curaciones en
tratados con régimen.

Ha2- En pacientes enuréticos, la proporción de curaciones en tratados con


el método psicoanalítico es DISTINTA que la proporción de curaciones en
tratados con el método conductista.

Ha3- La proporción de mujeres con lupus es DISTINTA que la proporción


de varones con lupus.

En estas Ha el investigador NO expresa por completo su expectativa.


"Distinta" puede significar mayor o menor, mejor o peor, etc. Este tipo de
hipótesis se denominan BIDIRECCIONALES o A DOS COLAS. (23)

Las Ho correspondientes a las Ha bidireccionales formuladas, serían:

Ho1- En pacientes tuberculosos, la proporción de curaciones en tratados


con estreptomicina NO es DISTINTA que la proporción de curaciones
en tratados con régimen higiénico-dietético.

Ho2- En pacientes enuréticos, la proporción de curaciones en tratados


con el método psicoanalítico NO es DISTINTA que la proporción de
curaciones en tratados con el método conductista.

Ho3- La proporción de mujeres con lupus NO es DISTINTA que la


proporción de varones con lupus.

Pero puede ocurrir que Ud. disponga de información, o tiene expectativas


definidas del sentido que le quiere dar a la diferencia, y en ese caso hay
otra manera de formular una Ha sería:

Ha5 - En pacientes tuberculosos la proporción de curaciones en tratados


con estreptomicina es MAYOR que la proporción de curaciones en
tratados con régimen higiénico-dietético.

- 110 -
Ha6 - En pacientes enuréticos, la proporción de curaciones en tratados
con el método psicoanalítico es MENOR que la proporción de curaciones
en tratados con el método conductista.

Ha7 - La proporción de mujeres con lupus es MAYOR que la proporción


de varones con lupus.

Para este modelo de Ha, llamado a UNA COLA o UNIDIRECCIONAL


corresponderían las siguientes hipótesis nulas (23):

Ho5 - la proporción de curaciones en tratados con estreptomicina es


MENOR O IGUAL que la proporción de curaciones en tratados régimen
higiénico-dietético.

Ho6- la proporción de curaciones en tratados con el método psicoanalítico


es MAYOR O IGUAL que la proporción de curaciones en tratados con el
método conductista.

Ho7- la proporción de mujeres con lupus es MENOR O IGUAL que la


proporción de varones con lupus.

Según si está manejando hipótesis a una o dos colas el valor de p


se computará de maneras diferentes, pero algunos autores afirman que Ud
logra conclusiones más precisas con las unidireccionales. (23)
A partir de la hipótesis se puede realizar el análisis del problema e
identificar variables a controlar.

14.2 ANÁLISIS DE PROBLEMAS DE COMPARACIÓN


Volviendo al problema [P15]
“ Las personas que consumen sushi tienen menor incidencia de
eventos cardiovasculares (ECV) que quienes no lo hacen “

El enunciado del problema alude a una población (PERSONAS) y dos


variables en estudio (CONSUMIR SUSHI Y PRESENTAR ECV). Según lo
enunciado, consumir sushi, sería el tratamiento o variable independiente y
presentar ECV sería la variable dependiente.

Variable dependiente o evolución


Presentar ECV : alternativas si - no
Variable independiente o tratamiento
Consumir sushi: alternativas si - no

- 111 -
Ambas están medidas en escala nominal con dos alternativas:

Por otra parte existen variables que pueden sesgar los resultados
y deberán ser controladas (covariables), por ejemplo : tiempo que
lleva consumiendo sushi, antecedentes heredo familiares de patología
cardiovascular, obesidad, diabetes, etc.
Existen distintos procedimientos para el control de covariables conocidas,
algunos que se realizan durante el procesamiento estadístico de los
datos (control estadístico) y otros en el transcurso de la investigación
(lo denominamos control experimental), algunos de los cuales describo
un poco más adelante (ap. 14.5).

14.3 - Secuencia Operativa Para Resolver Problemas De Estimación De


Diferencias Entre Parámetros (De Comparación)

El concepto fundamental es que tiene dos o más series de mediciones (M1 y


M2 la figura 14.3) e intenta establecer
- si las diferencias entre ellas son significativas
- cual es el intervalo de confianza para esas diferencias.

Figura 14.3.0

- 112 -
Para que Ud. resuelva un problema de comparación, como el caso sushi,
le propongo la siguiente SECUENCIA OPERATIVA a punto de partida del
esquema conceptual correspondiente (fig. 14.3) :

PASO ACTIVIDAD
(1) - Definir precisamente la población (P)
(2) - Obtener en forma aleatoria una (o más) muestra(s) (M) de
individuos según el modelo.
(3) - Aplicar los tratamientos (T) correspondientes.
(4) – Medir las variables en la o las muestras de individuos y obtener la o las
muestras de resultados (R)
(5) – Calcular los estimadores de diferencias y comparar los R usando
las pruebas de significación adecuadas.
(6) - Calcular los intervalos de confianza necesarios para los
estimadores
(7) - Formular conclusiones para la poblacion.

En la secuencia descripta introduzco un término nuevo para Ud. pero habitual


en la jerga estadística. Efectivamente en el inciso (3) usé la palabra tratamiento y
en ese contexto tuvo el mismo significado que en Ciencias de la Salud: había dos
tratamientos (consumir sushi o no).
Pero si el problema fuera el siguiente:

[ P 15.2] “ establecer si el promedio de los cocientes mentales entre niños con


daño neurológico genético es menor que el promedio de CM entre los niños
con daño neurológico intraparto “

el “tratamiento” no sería tan evidente. Existe tal tratamiento en este caso?

Las diferencias entre ambos grupos fueron obra de la naturaleza.


El investigador solamente agrupó los pacientes según la causa del retardo.
Pero desde el punto de vista estadístico esta reagrupación se puede considerar
un tratamiento, y su concepto es más abarcativo que el clínico. Convengamos
que en este contexto, tratamiento estadístico es cualquier operación que
se realice con los sujetos en estudio y que modifique las condiciones de
presentación natural. Por ejemplo la agrupación de los pacientes en el [P15.2]
es un tratamiento.

- 113 -
En una relación causa-efecto, la causa constituye la variable independiente,
mientras que el efecto constituye la variable dependiente (ver cap. 19).
Haciendo una analogía con la situación, en los estudios estadísticos, el
tratamiento ( en sentido estadístico) también recibe el nombre de variable
independiente mientras que al conjunto de los resultados, se los suele denominar
variable dependiente.
Como ve, los diseños destinados a resolver problemas de comparación tienen
una nomenclatura particular que paso a mostrarle.

14.4 - Nomenclatura de Modelos de Diseños Estadísticos para Problemas


de comparación

Dado que el concepto fundamental reside en la comparación de dos o


más series de mediciones, que genéricamente se denominan “muestras” , los
modelos de diseños para análisis estadísticos reciben un nombre que depende
de tres factores muestrales: a-relación entre las muestras ; b - número de muestras
y c - tamaño de las mismas.

14.4.1 Nomenclatura según relación entre las muestras

14.4.1.1 - Muestras independientes


Si mira la figura 15.1 verá que he dibujado dos muestras de individuos (M1 y
M2) y dos muestras de resultados (R1 y R2). La muestra de resultados R1 se tomó
de la muestra de individuos M1 y la R2 de la M2. Por este motivo se dice que los
R1 son INDEPENDIENTES de los R2, porque provienen de sujetos diferentes. Así
que el modelo se denomina A MUESTRAS INDEPENDIENTES o también
INTERSUJETO. (33, 45) Otro ejemplo de estos modelos son los estudios de
factores de riesgo (ap. 15.1)

14.4.1.2 - Muestras relacionadas


También puede tomar los mismos individuos, y realizar dos (o más)
mediciones. O sea tendrá una muestra de individuos, pero DOS (o más) MUESTRAS
DE RESULTADOS. (Figura 14.1.2) Esto ocurre cuando hace estudios en los cuales
mide a las mismas sujetos, antes y después de un tratamiento. Por ejemplo si toma
10 personas y les mide la tensión arterial antes de una sesión de yoga y después de
la misma tendrá dos muestras de resultados: la muestra de resultados obtenidos
antes de la sesión y la muestra de resultados obtenidos después de la sesión.

- 114 -
Figura 14.4.1.2

Este modelo se llama A MUESTRAS RELACIONADAS, A MEDICIONES REPETIDAS


O INTRASUJETO. (33, 45) Poner a los individuos en situación basal fue el
"tratamiento previo", mientras que el ejercicio de yoga constituyó el "tratamiento
posterior". Las mediciones se realizaron en los mismos sujetos. Otro ejemplo
de este modelo es el diseño para comparar medios de diagnóstico (ap.
15.2)

14.4.1.3 Muestras únicas


Pero hay otras situaciones. Por ejemplo, Ud. ya tiene una serie de 12
pacientes lúpicos, 9 mujeres y 3 varones y quiere saber si esta disparidad (9
a 3) se debe a que hay alguna relación entre sexo y el lupus. Partiría de
una hipótesis como :

Si hay relación entre el sexo y el tener lupus, la proporción MUJER/VARÓN


OBSERVADA será distinta de la proporción MUJER/VARÓN ESPERADA.

Para obtener esta información hace falta comparar.


¿ Pero comparar con qué, si Ud. tiene sólo una muestra ?

- 115 -
Tiene al menos dos alternativas.
- Una alternativa puede ser comparar con LO QUE HUBIERA PASADO si el
sexo no fuera un factor relevante. Teóricamente debería esperar que de 12
pacientes, 6 fueran varones y 6 mujeres ya que tendrían un 50 % de probabilidades
cada sexo.
Ahora tiene un valor obtenido (9/12) y un valor esperado (6/12).
El VALOR ESPERADO provino de que Ud. razonó que si el "sexo" no fuera
variable independiente, la proporción esperada sería 6/12 .

- Otra alternativa consiste en utilizar estadísticas DISPONIBLES EN LA


LITERATURA, relacionando sexo con lupus. Por ejemplo, suponga que en alguna
publicación confiable leyó que la proporción era de 2/1, entonces podría haber
establecido su proporción esperada en 8/4.
Este modelo, en el que Ud. ( el investigador) dispuso de sólo una muestra
de resultados, se denomina A MUESTRA ÚNICA (45)

14.4.2 Nomenclatura según tamaño de las muestras


Si el número de individuos es inferior a 30, el modelo se denomina a MUESTRA
PEQUEÑA, sino es una MUESTRA GRANDE (37)

14.4.3 Nomenclatura según número de muestras


Si el número de muestras es... el modelo se llama...
UNA A UNA MUESTRA (muestra única)
DOS A DOS MUESTRAS
MAS DE DOS VARIAS MUESTRAS o K MUESTRAS.

14.4.4 - DISEÑOS A VARIAS MUESTRAS


Los procedimientos a emplear son los mismos que cuando se trata de dos muestras.
Debe formular la hipótesis cero y luego valorar su significación (ap. 10.6).
En un modelo a dos muestras A y B, Ud. formulaba la hipótesis cero enunciando que
no hay diferencias entre los resultados obtenidos en la muestra A y los obtenidos en la B.
Cuando hay más de dos muestras, por ejemplo M1, M2, M3 y M4, Ud. formulará Ho
diciendo que NO HAY diferencias entre los resultados obtenidos en M1, M2, M3 y M4.
Calculará el valor de p empleando ciertas pruebas de significación especiales para
varias muestras (vea tabla 14.6). Las más conocidas son: el análisis de variancia (ANOVA),
la prueba de Kruskall Wallis, ambas para muestras independientes y el ANOVA para
mediciones repetidas o la prueba de Friedman, para muestras relacionadas. (1, 45)
En todos los esquemas conceptuales vistos, el primer paso es la definición de
población y el segundo la obtención de muestras. En los problemas de comparación
el control de covariables (variables confundentes) es de importancia máxima.

- 116 -
14.5 - CONTROL DE COVARIABLES EN ESTUDIOS DE COMPARACIÓN
La elección del procedimiento de control depende de los objetivos y las
circunstancias en las que Ud. se está manejando. En principio, ya hizo algo
al establecer los criterios de exclusión. (ap. 5.5.2.2 ). En segunda instancia
hay procedimientos de control propios de los problemas de comparación.

14.5.1 - Control de variables en modelos a muestras relacionadas


En el caso de muestras relacionadas cada sujeto funciona como control de si
mismo por lo que no hay necesidad de preocuparse demasiado. Con todo debe
considerar algunas cuestiones.
Una variable a controlar es el tiempo transcurrido entre la primera medición
y las siguientes, dado que Ud investiga con seres humanos. En efecto: si Ud. mide
la tensión arterial de un paciente hoy, y luego la mide mañana, o la semana
próxima, e incluso el mes próximo pocos le dirían que la primera medición no es
un buen control, de las siguientes. Pero si realizara la segunda medición dentro de
cinco años, ¿todavía pensaría que el control ha sido tomado adecuadamente ?.
Cualquier pedíatra le diría enseguida que no. Los seres humanos envejecen y eso
hace que usar al mismo individuo como control tenga ciertos límites impuestos
por el tiempo que pasó.
T ambién debería controlar: la secuencialidad de los tratamientos, el
aprendizaje, el cansancio, etc (1)

14.5.2 - Control de variables en modelos a muestras Independientes


En los modelos a muestras independientes existe un procedimiento para
controlar variables (ap. 5.5.2.2 ) que se denomina equilibración o balanceo. (33)
Suponga que desea estudiar la evolución de los pacientes con infarto agudo
de miocardio (IAM) luego que les ha suministrado una droga. Ud. debería tomar
un grupo de pacientes y suministrarles el tratamiento nuevo (grupo tratado), y
a otro grupo suministrarle el tratamiento tradicional (grupo control). Luego
deberá comparar las proporción de curaciones obtenida en cada grupo.
Al estado actual de nuestros conocimientos la evolución del IAM es distinta,
según el sexo de los pacientes. Si, por ejemplo, al final de la investigación el
grupo tratado quedara compuesto mayoritariamente por mujeres, la información
resultante sería cuestionada porque puede haber un sesgo proveniente de la
falta de control de la variable "sexo". No cabe duda que en este proyecto es
una variable a controlar.
Podría usar un muestreo aleatorio simple (ver ap. 9.4.3.1). Pero corre el riesgo que las muestras
tengan proporciones significativamente desiguales de varones y mujeres. Para esta variable
extraña le convendrá usar algún procedimiento de equilibración o balanceo .

- 117 -
Por ejemplo, cada dos mujeres que ingresen, sorteará la primera para determinar si la incluye
en el grupo tratado o control, mientras que la segunda, irá al grupo restante. Lo mismo hará con
cada par de hombres que reclute.

Luego de finalizado el estudio tendrá que comparar la relación mujer/varón


en cada grupo, bajo la hipótesis probabilística que "la proporción (M/V ) en el
grupo tratado NO DIFIERE de la proporción M/V en el grupo control".
Finalmente establecerá si la rechaza o no a través del proceso descripto en
el apartado 13.3.3 En este caso Ud. espera que no haya diferencias. Es decir
espera que Ho sea “verdadera”.
Otra alternativa sería estudiar varones y mujeres por separado. Con esto
controlaría la variable transformándola en constante.

14.5.3 - Control de variables en modelos a muestras únicas


Para los modelos a muestras únicas prácticamente no es posible ejercer
control, ya que una de las muestras en realidad es una construcción teórica de lo
que Ud. espera que ocurra. (vea ap. 14.4.1.3)

14.5.4 - Control de variables Desconocidas


El único procedimiento que permite disminuir la probabilidad de
tener un sesgo por variables desconocidas es la aleatorización de las
muestras. (ver cap.9)
Habiendo obtenido las muestras, corresponde que aplique los "tratamientos",
y realice las mediciones, obteniendo los resultados. Finalmente deberá
compararlos. Llegó el momento de calcular p.

14.6 Selección de la prueba de significación


El conjunto de fórmulas matemáticas o procedimientos que incluyen
la aplicación de las mismas y con las que puede calcular el valor
de p se denomina genéricamente pruebas de significación. Como muestro
en la tabla 14.6 hay distintos modelos de pruebas de significación,
algunas de las cuales reciben el nombre de su inventor (Fisher,
Kolmogorov-Smirnov, Snedecor, etc).

Excepto algunas (como la prueba de Fisher y la binomial)


emplean un valor obtenido de una distribución estadística particular
para el cálculo de p que se denomina ESTADÍSTICO. Los más usados
son t de Student, chi cuadrado (Chi2) y zeta. (45)

- 118 -
TABLA 14.6 - CRITERIOS PARA LA SELECCIÓN DE PRUEBAS ESTADÍSTICAS
PROBLEMAS DE COMPARACIÓN

Ud. no podrá usar cualquier prueba para realizar el cálculo de p. Debe


elegir la más indicada empleando diversos criterios, siendo los básicos: tipo,
número y tamaño de la(s) muestra(s), y la escala de medición de la variable
dependiente.
La tabla 14.6 (al igual que muchas otras que puede hallar en las referencias
bibliográficas) tiene gran similitud con las que ha visto en los libros de farmacología
para seleccionar una antibiótico en el tratamiento de la sepsis humana. Cuando
la use puede llegar a tomar buenas decisiones.
Pero si además cuenta con algo de experiencia mucho mejor. Por ejemplo,
el estadístico experimentado sabe que si tiene un número suficiente de
casos, en un diseño a muestras indpendientes, siempre puede usar el t
test de Student o el análisis de variancia (37).

- 119 -
También sabe que las pruebas diseñadas para muestras pequeñas pueden
ser usadas con muestras grandes pero no a la inversa. Algo similar ocurre con
las pruebas para varias muestras que pueden ser usadas cuando se trata de dos
muestras, pero no a la inversa.(45)

Le mostraré algunos ejemplos de selección de pruebas de significación.


Suponga que ya tiene los resultados del problema “La proporción de mujeres
con lupus es MAYOR que la proporción de varones con lupus.” y efectivamente,
sobre 12 pacientes halló 9 que son mujeres. Se trata de un modelo a MUESTRA
ÚNICA Y PEQUEÑA; la variable dependiente está medida en escala nominal
(mujer-varón). Si mira la primera línea de la tabla 15.2.2 comprobará que para
estos casos se indica la prueba binomial, para el cálculo de p.

Puede resolver el problema 14.4.1.2 ( variación de la tensión arterial después


de una sesión de yoga) según un modelo a dos muestras pequeñas relacionadas.
La variable dependiente está medida en escala proporcional (mmHg). Si
quiere calcular p debe elegir la prueba de la aleatoreidad o el t test para
muestras apareadas o relacionadas.

El problema 15.2 requiere ser solucionado con un modelo a dos muestras


independientes. Pero la variable dependiente (cociente intelectual) está medida
en escala ordinal. Si las muestras son pequeñas debe elegir la prueba de Man
Withney o la prueba de la Mediana. Si son grandes, el t test para muestras
independientes o la prueba de Z .

14.7 INFORMACIÓN PRODUCIDA AL RESOLVER PROBLEMAS DE


COMPARACIÓN
Después que terminó de valorar la significación de la hipótesis llegará a que
rechazó o aceptó Ho. En la jerga estadística hay otra manera de decirlo. Rechazar
Ho equivale a decir que LAS DIFERENCIAS HALLADAS FUERON ESTADÍSTICAMENTE
SIGNIFICATIVAS.

Aceptar Ho, es lo mismo que decir: LAS DIFERENCIAS HALLADAS FUERON


ESTADÍSTICAMENTE NO SIGNIFICATIVAS. ( vulgarmente se tiende a cambiar
la posición de la negación diciendo: las diferencias halladas no fueron
estadísticamente significativas. Me parece más adecuado poner el NO delante
de SIGNIFICATIVAS, pero vox populum...)

- 120 -
Claro que una cosa es concluir para las muestras y otra para la población.
14.7.1 Conclusiones para las muestras
Después de haber calculado el valor de p estará en condiciones de tomar
una decisión.
Suponga que tenía las siguientes hipótesis nulas:

Ho1 - la proporción de curaciones en tratados con estreptomicina es MENOR


O IGUAL que la proporción de curaciones en tratados con régimen.

Ho2- el cociente intelectual promedio en dañados neurológicos por parto es


IGUAL que el cociente intelectual promedio en dañados neurológicos de
origen genético.

Ho3- la proporción de mujeres con lupus es MENOR O IGUAL que la proporción


de varones con lupus.

Con los datos referentes al nivel de significación y los valores de p que


obtuvo para cada una de ellas, puede construir un cuadro como el que sigue:

Hipótesis Estadístico Alfa p Decisión


con Ho
Ho1 Chi2= 6.78 0.05 0.03 Rechazar
Ho2 T = 1.23 0.05 0.20 “Aceptar”
Ho3 Chi2= 7.78 0.01 0.02 “Aceptar”

Las Conclusiones Técnicas para las muestras podrían tener la siguiente


forma:
C1 - la proporción de curaciones en tratados con estreptomicina FUE MAYOR
que la proporción de curaciones en tratados con régimen, EN FORMA
ESTADÍSTICAMENTE SIGNIFICATIVA. (X² = 6.78; p= 0.03)

C2- Las diferencias halladas entre el cociente intelectual promedio en dañados


neurológicos por parto y el cociente intelectual promedio en dañados
neurológicos de origen genético FUERON ESTADÍSTICAMENTE NO
SIGNIFICATIVAS ( t= 1.10; p= 0.20)

C3- NO SE HALLARON DIFERENCIAS ESTADÍSTICAMENTE SIGNIFICATIVAS


ENTRE la proporción de mujeres con lupus y la proporción de varones con lupus.
(X² = 7.78; p= 0.02)

- 121 -
14.7.2 Conclusiones informativas para la población y decisión clínica
Las conclusiones informativas para la población comenzarían diciendo:
“ La evidencia obtenida apoya la hipótesis que ….” y luego, para cada estudio
se agregaría
CP1 - …. la proporción de curaciones en tratados con estreptomicina ES
mayor que la proporción de curaciones en tratados con régimen higiénico
dietético. (X² = 6.78; p= 0.03)

CP2- … no existen diferencias entre el cociente intelectual promedio en


dañados neurológicos por parto y el cociente intelectual promedio en
dañados neurológicos de origen genético.( t= 1.10; p= 0.20)

CP3- … no existen diferencias entre la proporción de mujeres con


lupus y la proporción de varones con lupus.(X² = 7.78; p= 0.02)

Con el pvalor aisladamente las decisiones operativas de aplicación clínica


quedan a discreción del lector quien no tiene una idea del impacto clínico
de la intervención. Tanto es así que no siempre la decisión clínica acompaña
la decisión estadística.

Por ejemplo la decisión clínica para C1 hubiera sido usar estreptomicina en


lugar de régimen higiénico dietético, para tratar pacientes tuberculosos, aún
cuando no tendría idea de cuántos pacientes se verían beneficiados (problema
que resolveremos en los apartados siguientes) Aquí decisión estadística y clínica
van de la mano.
Pero puede ocurrir que realice un ensayo clínico para una cierta patología
y encuentre que 2/10 casos respondieron a cierto tratamiento vs. 0/10 casos en
el grupo control.

El pvalor con el test de Fisher, calculado online (Apéndice) es de 0.286. Por


lo tanto p> 0.05. Las diferencias entre tratamientos fueron estadísticamente no
significativas. Esto apoya la hipótesis que no hay relación entre tratamiento y
mortalidad.

Ahora bien, si está tratando pacientes con gripe tipo A, es posible que decida
no usar el tratamiento. En cambio, si los pacientes padecen rabia, aún cuando las
diferencias no fueron estadísticamente significativas, Ud. no dudará en tratar.
Con cualquier resultado que tenga sólo puede estar igual o mejor, pero nunca
peor, porque la mortalidad ya es del 100%. Este es un ejemplo en el que la decisión
clínica y la estadística no concuerdan.

- 122 -
No le conviene, bajo ningún concepto, aplicar el resultado de un
análisis estadístico a la toma de decisiones en la práctica, sin considerar
todos los aspectos del problema a resolver. (ver también ap. 13.3.5)

Es decir que la solución de los problemas de comparación queda


incompleta cuando solo se calcula el pvalor y hay que complementar con
la estimación de intervalos de confianza para las diferencias, no importa
si se trata de comparación de proporciones o promedios.

En la actualidad hay pruebas que indican que el cálculo de intervalos


de confianza para las diferencias entre parámetros permiten hacer una
inferencia a la población que es mucho más adecuada a las necesidades
de los investigadores (65, 69 ), tema que trato en el apartado siguiente.

14.8 Estimación de intervalos de confianza para diferencias entre


Parámetros

Volvamos al ejemplo del consumo de sushi. La hipótesis de


alternativa es que “ la frecuencia de eventos cardiovasculares es menor
entre personas que consumen sushi que entre quienes no lo hacen”.

La hipótesis nula sería que “la frecuencia de eventos cardiovasculares


es mayor o igual entre personas que consumen sushi que entre quienes no
lo hacen”.
Suponga que realizó el experimento, con un alfa de 0.05 y obtuvo
los resultados que se muestran en la tabla adjunta.
Dado que p < 0.05, las diferencias
fueron estadísticamente significativas.
Debe rechazar Ho. La evidencia que
obtuvo apoya la hipótesis que el
consumo de sushi se relaciona con una
disminución de la incidencia de ECV.
Hemos avanzado en dos niveles de
decisión ( ap. 12.2.2 y ap. 14.3.4 ) el
técnico y el informativo. Pero falta
decidir cómo se usará la información.
Si usa solamente el pvalor estará autorizado a sugerir que las personas
consuman sushi, pero ignora cuál es el impacto clínico que puede llegar
a tener esta decisión. En la tabla hay 20 % de ECV entre quienes no
consumen y 5 % de ECV entre quienes consumen sushi.

- 123 -
Si hubiera estudiado toda la población podría decir que el consumo de sushi
se asocia con un descenso del 15 % en la incidencia de ECV. Pero estudió
muestras. (En los problemas de comparación siempre estudia muestras) .
La diferencia es una cifra y para ella debería tener una estimación de los
intervalos de confianza.
Esto se logra acudiendo a cualquier software disponible, ya sea en su PC, su
tablet u Iphone. (Apéndice) Por ejemplo puede encontrar un sitio en el que se
obtengan los resultados de la figura 14.8.2, en la que vemos que los intervalos
de confianza del 95% van de 0.0592 – 0.2433 ( 5.92 - 24.33 %)

Los intervalos de confianza del 95 % para diferencias entre parámetros (sean


proporciones o promedios) permiten establecer al menos tres cuestiones.

1) Si las diferencias entre los grupos estudiados son significativas. Como


regla general, las diferencias son estadísticamente significativas si
ambos límites tienen el mismo signo.
2) Cuál es la magnitud del “efecto clínico”. Por ejemplo, según los
resultados en la fig 10.8.2 se puede esperar, con una confianza del 95 %,
que entre consumidores de sushi el porcentaje de ECV sea entre un 5.9
y un 24.3 %, menor que entre los no consumidores.
3) Si los tamaños muestrales empleados fueron adecuados. Esto ocurre
cuando el intervalo se considera estrecho. (ap 11.5)
Solo con el pvalor respondíamos al inciso a) , mientras que con los IC ,
además, podremos evaluar impacto clínico y adecuación del tamaño muestral.

Figura 14.8.2

- 124 -
Otra medida del impacto clínico (valoración de tratamientos) puede ser el
número de pacientes que es necesario tratar.

14.9 - Número de pacientes que es necesario tratar (NNT)


Supongamos que en un ensayo clínico hemos obtenido los resultados que se
muestran en el cuadro adyacente.
Tomando el pvalor concluirá que las
diferencias son significativas. También
llegaría a la misma conclusión si
calcula los intervalos de confianza del
95 % de las diferencias entre
proporciones de fracasos (0.1132 -
0.3717). De hecho, tiene evidencia
que le permite esperar que al menos se observe un 11.32 % menos de fracasos
si usa el tratamiento A.
Pero existe otro modo de mirar el fenómeno.
La incidencia de fracasos fue de 0.5 ó 50 % con el placebo y de 0.25 con el
tratamiento A. Dado que la incidencia medía el riesgo absoluto (ap. 12.1.2) se
observa una reducción en el riesgo absoluto (RRA) de
0.5 - 0.25 = 0.25 ( ó 25 %)
La RRA le permite calcular el NNT, que se define como el número de
pacientes que es necesario tratar, para que uno se vea beneficiado por el
tratamiento. La fórmula de cálculo es sencilla:
NNT : 1/ RRA
Para el caso en estudio sería
NNT = 1/0.25 = 4
Ya explicamos que las estadísticas sin intervalos de confianza no tienen
uso confiable. Empleando el software adecuado o buscando online (Apéndice)
el resultado se vería como sigue:
NNT = 1/0.25 = 4 (IC 95 % 3 - 8)
Esto se interpreta como que, con el tratamiento A, el número de pacientes
que es necesario tratar para que 1 se vea beneficiado, fue de 4. La evidencia
disponible apoya la hipótesis que el NNT mínimo sería de 3 y el máximo de 8
con una confianza del 95 %
Cuánto más pequeño es el NNT, mejor calificación tiene el tratamiento.
El NNT se puede usar también a los fines comparativos entre dos tratamientos.
Suponga que tiene otro tratamiento (B) para la misma patología. Después de
hacer las investigaciones encuentra que el NNT para B es
NNT = 20 (IC 95 % 14 - 37)

- 125 -
Comparando los intervalos de confianza de ambos NNT, se observa que
el mejor resultado para B (NNT = 14 ) es peor que el peor resultado para A
(NNT = 8)
Con estos datos dispone de evidencia clínica que favorece el empleo del
tratamiento A en cambio del B, para esta patología.
Un problema especial de comparación en el que se aplican tanto el pvalor
como los intervalos de confianza son las tablas de sobrevida para dos grupos.

- 126 -
14.10 - Tablas de vida para dos o más grupos
En el apartado 12.2.2 traté el tema de las tablas de sobrevida para un solo
grupo, como un problema especial en el que cuantificaba la probabilidad
acumulada de que un cierto evento ocurriera en un momento determinado. El
procedimiento también se puede usar para comparar curvas de sobrevida con
diferentes tratamientos.
Suponga que debe elegir entre radioterapia y quimioterapia, para prolongar
la remisión (tiempo libre de recaída) en pacientes con tumores sólidos de
mediastino. El fenómeno se estudia adecuadamente con curvas de
sobrevida.
Comienza por formular la hipótesis cero que podría ser:
Ho : " la curva de probabilidad acumulada de mantenerse en remisión a lo
largo del tiempo NO ES DISTINTA para ambos tratamientos"
La variable independiente es el tratamiento, la dependiente es la curva de
probabilidades.
Siguiendo cada técnica, Ud. hará el cálculo de las probabilidades acumuladas,
a intervalos regulares de tiempo (Cuttler y Ederer) o cada vez que se produzca
una recaída en uno de los grupos (Kaplan y Meier). (22, 23, 35)
Para obtener el pvalor empleará la prueba del log rank test de Mantel y
Haenzel, o la prueba de Wilcoxon. (23) El rechazo de la Ho bidireccional, indicaría
que la probabilidad de mantenerse en remisión es diferente entre los tratamientos
para un mismo lapso o, lo que es lo mismo, que las curvas de probabilidad
acumulada son diferentes para ambos tratamientos.
Toma los datos de 43 pacientes en radioterapia y 53 en quimioterapia.
Después de aplicar el procedimiento de Kaplan y Meier, tiene el informe
que se muestra en las tablas 14.10.1 y 14.10.2 y el gráfico de la fig.
14.10.1
Entre los datos que allí se observan, destacaremos que:

a - la radioterapia tuvo un tiempo promedio de remisión de 21.33


meses (IC95% : 15.688 - 26.971 meses) mientras que para la
quimioterapia fue de 8.856 (IC95% 6.055 - 11.658). Se observa que la
máxima expectativa de remisión para la quimio, es peor que la
mínima para la radioterapia.

b - el resultado del log-rank test (al pie de la tabla 14.10.2) arrojó un


pvalor =0.0007 y por lo tanto menor que 0.05. Por ello su decisión
estadística debería ser rechazar Ho. Así que concluye que las curvas
de sobrevida difieren en forma estadísticamente significativa.

Con estos elementos puede inferir que tiene evidencia que apoya la
hipótesis que, para esta población , cuando emplea radioterapia, el tiempo
de remisión es mayor que cuando usa quimio. La figura 14.10.1 es claramente
ilustrativa al respecto.

- 127 -
En la tabla aparece también un término nuevo: pacientes “censados”. En cualquier
momento de la evolución del estudio hay dos clases de casos : los que tuvieron el
evento en estudio y los que no. Aquellos que no padecieron el evento hasta ese
momento se consideran censados.

Pero hay problemas de comparación en los que el cálculo del pvalor no es


necesario y ni siquiera estaría indicado. Es el caso del análisis de factores de
riesgo y la valoración de medios de diagnóstico.

- 128 -
15 - COMPARACIONES Y ESTIMACIONES ESPECIALES : FACTORES DE
RIESGO. MEDIOS DE DIAGNÓSTICO: VALORES DE CRIBAJE.

15.1 Factores de riesgo


Se dice que una variable es FACTOR de riesgo para un evento (RIESGO) cuando,
si un individuo posee ciertos valores de esa variable, se incrementa su probabilidad
de padecer el evento.

Ejemplo 1 : sea la variable fumar con dos alternativas: fuma - no fuma. Se dice
que fumar es factor de riesgo de enfermedad pulmonar obstructiva crónica (EPOC)
porque cuando un individuo fuma se ha establecido que tiene mayores
probabilidades de padecer EPOC.

Ejemplo 2 : sea la variable colesterolemia con valores de 80 a 600 mg % Se dice


que la colesterolemia superior a 200 mg % es factor de riesgo de coronariopatía
porque cuando un individuo tiene colesterolemias superiores a 200 mg se ha
establecido que tiene mayores probabilidades de padecer coronariopatía.

Hay dos medidas de riesgo que fueron presentadas al hablar de tasas: la


prevalencia y la incidencia.

Si bien la prevalencia es la tasa de casos de una enfermedad en una población


en un momento dado (ap. 12.1.1) también mide el riesgo de un individuo de padecer
la enfermedad por el simple hecho de pertenecer a la población. Por ejemplo, si
se dice que la prevalencia de diabetes en una población P, es del 10 %, también se
está diciendo que cualquier individuo que pertenece a P tiene un riesgo del 10 %
de padecer diabetes.

Por su lado, si bien la incidencia es la tasa de casos nuevos de una enfermedad


que se producen en una población P, en un lapso L, también mide el riesgo de un
individuo de desarrollar la enfermedad en un lapso L, si pertenece a la población
P. Por ejemplo si se dice que la incidencia de diabetes en una población P es del
1 % anual, también se está diciendo que si un individuo pertenece a P, su riesgo
de desarrollar diabetes en un año es del 1 %. Por este motivo, la incidencia también
se llama riesgo absoluto.

A veces se pretende saber si un factor significa un riesgo para cierto evento.


Para medir tal significación se han inventado otras medidas de riesgo, como por
ejemplo el riesgo relativo o el odds ratio. Cuando trate de descubrir factores de
riesgo sólo puede recurrir a dos modelos de estudios: estudios de cohorte y
estudios de casos y controles.

- 129 -
La obtención de una medida de riesgo es un problema científico por ello el primer
paso será la formulación precisa del mismo. Se pueden tener al menos dos modelos:

Modelo 1
Establecer si el hábito de fumar es factor de riesgo de cáncer pulmonar

Este modelo tiene forma de hipótesis y una respuesta posible es si o no con un


valor de p asociado. Como veremos luego con esto sólo no alcanza.

Modelo 2
Estimar el grado de riesgo de cáncer pulmonar asociado con el hábito
de fumar.

Con esta formulación se busca un rango de cifras que cuantifique el riesgo. Las
respuestas son diversas medidas de riesgo según el diseño empleado (riesgo relativo,
riesgo atribuible, odds ratio o razón de chances, etc)

Como sea que lo formule, ambos modos requieren de un mismo modelo de


respuesta y, operativamente, es preferible formular el problema según el modelo 2

Desde el punto de vista metodológico, los problemas de riesgo son problemas


de comparación, porque, para obtener la información, se compara lo que ocurre entre
los portadores del riesgo y aquellos que no lo son.
Desde el punto de vista de la información que se busca, es un modelo de
problema de estimación de cifras, las que a su vez, como veremos más adelante, son
diferencias entre porcentajes (como el riesgo atribuible) o relación entre porcentajes
(riesgo relativo).

Pasaremos a continuación a describir los dos modelos de investigación para


estudios de factores de riesgo, destinados a resolver el Modelo 2 de problema.

15.1.2 - ESTUDIOS DE COHORTE


En estos estudios se trabaja a partir de la hipótesis que los pacientes EXPUESTOS
tendrán mayor incidencia de eventos que los pacientes NO EXPUESTOS.
Se desarrollan en etapas según se muestra en la figura 15.1.2.
En la Etapa I, se hace un relevamiento de la población en estudio con la finalidad
de detectar si hay individuos que tienen el evento que se está estudiando. Por ejemplo
en este caso, si tienen cáncer de pulmón.
Durante esa etapa inicial, la fracción enferma es retirada del estudio y solamente
quedan los individuos que no tienen la enfermedad (sanos): la cohorte.

- 130 -
FIGURA 15.1.2 Esquema de desarrollo de un estudio de cohorte, para
factores de riesgo.

Cohorte

El estudio de cohorte es longitudinal porque la variable en estudio se mide al


menos dos veces: la primera es para descartar la existencia de patología y una
segunda para controlar si ha aparecido.

La Etapa II tiene una duración que depende del tiempo de latencia que tenga la
enfermedad en estudio. El estudio de cohorte es observacional. El investigador va
controlando a la cohorte según el protocolo. Cuando el mismo finaliza (inicio de la
Etapa III habrá pacientes expuestos y no expuestos, y, muy probablemente, en ambos
grupos haya individuos que presentan el evento: positivos. También es probable que
haya sujetos negativos, que no son de interés para el análisis estadístico.

En la Etapa III , cerrado el protocolo, obtendrá una tabla como la siguiente:

Tabla 15.1.2.1 Presencia del Evento


Presente Ausente
Expuestos A B
No expuestos C D

- 131 -
15.1.2.1 - MEDIDAS DE RIESGO EN ESTUDIOS DE COHORTE
A partir de recuentos (tipo tabla 15.1.2.1) se calculará la incidencia entre expuestos
y no expuestos, según las siguientes fórmulas:
Incidencia entre Expuestos (IE) = A / (A+B)
Incidencia entre No Expuestos (INE) = C / (C +D)
La INCIDENCIA se definió como la proporción de casos nuevos de una afección que aparecen en un
período determinado, sobre el total de individuos de la población (11). Para este ejemplo, ningún paciente
estaba enfermo al iniciar el estudio, por lo tanto la fórmula está correctamente aplicada.

Las incidencias miden el riesgo absoluto para cada grupo. A partir de allí calculará
los riesgos atribuible y relativo.
RIESGO ATRIBUIBLE (RA) = IE - INE
RIESGO RELATIVO (RR) = IE / INE
Todas estas medidas están indicadas EXCLUSIVAMENTE en estudios de
cohorte ( prospectivos). (cap. 7)

15.1.2.2 - OPERATORIA PARA REALIZAR ESTUDIOS DE COHORTE


NOTA IMPORTANTE: La siguiente operatoria le servirá para observar cómo se aplican las
reglas señaladas a la relación hábito de fumar y cáncer de pulmón, como si Ud fuera un médico
del año 1950, cuando la relación entre cigarrillo y cáncer no era segura.
Hoy no sería ético hacer esta investigación porque la relación de riesgo ya se ha establecido.
Formulación del problema
Estimar el grado de riesgo de cáncer pulmonar, asociado con el hábito de fumar.
Procedimiento
● Defina la población sobre la que hará el estudio.
● Realice lo que sea necesario para detectar la existencia de pacientes con cáncer de
pulmón, y los retira del proyecto.
● Obtenga así una muestra grande de personas libres de la enfermedad (la cohorte).
● Luego las controla según protocolo durante el período de tiempo necesario.
● Dejará que espontáneamente se dividan en fumadores y no fumadores.
● Cuando se de por finalizado el estudio, deberá determinar cuántos expuestos hubo,
cuántos no expuestos y cuál fue la incidencia de cáncer en ambos grupos. En la
tabla 15.9.2.2 se muestran resultados ficticios para este estudio de cohorte .

Tabla 15.1.2.2 Presencia de Cáncer Pulmonar


Presente Ausente
Fumadores 20 80
No Fumadores 5 95

- 132 -
No pierda tiempo en hacer los cálculos manualmente. Elija alguna de las
herramientas que se muestran en el Apéndice y aplíquela para obtener las medidas de
riesgo. En este caso si hubiera usado el VCCStat, obtendría los resultados que se
muestran en la figura 15.1.2.1

FIGURA 15.1.2.1 : Salida computarizada para una tabla en estudios de riesgo. Note que se calculan
las medidas de riesgo tanto para estudios de cohorte como casos y controles. Será el operador quien
deba elegir cuál usar.
En la figura 15.1.2.1 se comprueba que se han obtenido prácticamente todas las
medidas de riesgo mencionadas, incluyendo otras que aún no hemos tratado, como
por ejemplo el odds ratio.
Para un estudio en cohorte son aplicables la incidencia en expuestos igual a 0.2,
la incidencia entre no expuestos (0.05), el riesgo atribuible (0.15) y el riesgo relativo
con sus intervalos de confianza ( 4 ; 1.562 - 10.239).
Las incidencias ya fueron explicadas. El riesgo atribuible indica la proporción de
casos que son atribuibles al factor de riesgo en estudio. Para nuestro caso fue de 0.15,
(15%). Esto se interpreta como que según este estudio, el 15 % de los casos de cáncer
pulmonar observados, se puede atribuir al hábito de fumar. (74)
Los estudios de riesgo deberían responder al menos a las siguientes preguntas:
a - ¿Existe evidencia que el estudiado, es un factor de riesgo ?
b - ¿El tamaño muestral usado fue el adecuado?
Para responderlas en ESTUDIOS DE COHORTE hay que tomar en cuenta los intervalos
de confianza del riesgo relativo.

- 133 -
a - Si ambos límites de los intervalos de confianza son superiores a 1, puede
afirmar que tiene evidencia que el factor es un riesgo.
b - Si los intervalos de confianza son estrechos puede afirmar que el tamaño
muestral empleado, es adecuado.
Los estudios de cohorte con frecuencia requieren tiempo y una gran
infraestructura material y humana, lo que los hace inalcanzables desde el punto de
vista financiero. Por ello, habitualmente se recurre a un modelo alternativo : los
estudios de CASOS Y CONTROLES.

15.1.3 - ESTUDIOS DE CASOS Y CONTROLES

En estos estudios se trabaja a partir de la hipótesis que, los pacientes actualmente


enfermos (CASOS) han tenido mayor oportunidad de estar expuestos, que otros
pacientes con iguales características pero sanos (CONTROLES).

15.1.3.1 - OPERATORIA PARA LA REALIZACIÓN DE ESTUDIOS DE CASOS Y CONTROLES

Formulación del problema


Estimar el grado de riesgo de cáncer pulmonar, asociado con el hábito de fumar.
Procedimiento
a - Defina la base poblacional sobre la que hará el estudio. Tanto los casos, como
los controles deben provenir de la misma base poblacional, es decir del mismo ámbito
( si los casos son de consultorio externo, los controles también ; si los casos provienen
de internación, los controles también, etc) . Comparar resultados de pacientes
provenientes de distintos ámbitos constituye un sesgo de selección.
b - Defina con precisión las condiciones de inclusión para que un sujeto sea
considerado CASO. Por supuesto la más importante es padecer o haber padecido el
evento.
c - Defina con precisión las condiciones de inclusión para que un sujeto sea
considerado CONTROL. Por supuesto la más importante es NO padecer o haber padecido
el evento. Deberá seleccionar sujetos que biológicamente, sean lo más semejantes
posible a los CASOS.
d - Estime aproximadamente el tamaño muestral adecuado. (ap. 9.4.1)
e - Obtenga así las muestras de ambos grupos.
f - Interrogue a todos los sujetos sobre antecedentes de exposición al
factor de riesgo ( en el ejemplo del habito de fumar y cáncer de pulmón,
investigará el número de casos estuvieron expuestos (fumaban), así como
el número de controles.
g - Cuando de por finalizado el estudio podrá construir una tabla como la 15.1.2.2
se muestran resultados ficticios para un estudio de cohorte.

Pero el estudio de Casos y Controles no es longitudinal, por lo que no está


permitido usar las medidas de riesgo conocidas. Hay que recurrir al odds y al odds
ratio ( términos cuya profusa sinonimia en castellano veremos enseguida).

- 134 -
15.1.3.2 - MEDIDAS DE RIESGO EN ESTUDIOS DE CASOS Y CONTROLES: ODDS

Qué es un “odds”
En nuestra cultura estamos acostumbrados a utilizar el concepto de
probabilidad. Por ejemplo, al arrojar un dado una única vez, esperamos que la
probabilidad de que aparezca un 3 ( o cualquier otro número) sea de 1/6.
Basamos esta expectativa sobre el cálculo que un número sólo puede salir una
vez y que hay 6 números, por lo tanto la probabilidad de que salga cualquier
número es de 1/6.
Con el mismo dado, en otras culturas basan sus expectativas sobre un cálculo
ligeramente diferente: cualquier número sólo puede salir 1 vez y restan 5 números,
por lo tanto la relación entre el número de veces que puede salir sobre el número
de veces que puede no salir es de 1/5. Esta relación en las culturas anglófonas recibe
el nombre de ODDS.

En castellano se halló un sinónimo : MOMIO, el cual (creo) padece de cacofonía. Por ese
motivo muchos autores (entre quienes me incluyo) prefieren usar directamente el vocablo en
el idioma original, mientras que otros decidieron reservar la palabra CHANCE como sinónimo
de ODDS. (11, 42) Odds, chance y momio son sinónimos que se usan actualmente en la literatura.
Por lo tanto odds ratio, razón de chances y razón de momios también lo son. Bajo ciertas
circunstancias el odds ratio es un excelente estimador del riesgo relativo y por ello se lo llama
también riesgo relativo estimado (RRE). Otros sinónimos usados son razón de productos
cruzados, razón de oportunidades (74) Interesante situación en la que los hispano parlantes
deciden no usar un vocablo (ODDS) por pertenecer a otra lengua, y reemplazarlo por otro
vocablo (CHANCE) que tampoco pertenece al español ya que proviene del francés, idioma en
el que significa probabilidad.
Me parece que el español (que incorporó múltiples términos provenientes de muchos
otros idiomas) se puede permitir el lujo de aceptar otro. Si los anglófonos lo llaman odds y no
tenemos un sinónimo perfecto, pues hombre… llamémosle odds !!!!

Hay dos tipos de odds: a favor y en contra.


odds a favor = Nro. de veces que puede ocurrir/ Nro. de veces que puede no ocurrir
En una tirada de dados el odds a favor de que salga un TRES es 1/5
odds en contra = Nro. de veces que puede no ocurrir/ Nro. de veces que puede ocurrir
En una tirada de dados el odds en contra de que salga un TRES es 5/1
Por razones que verá luego, es el momento de destacar que existe una
relación aritmética entre probabilidad y odds:

PROBABILIDAD = odds /(1 + odds)


odds = PROBABILIDAD / (1-PROBABILIDAD)

Esta presentación de los odds se debe a que no se pueden usar los “riesgos”
como medida, en los estudios de casos y controles. De hecho cuando finalice un
estudio (por ejemplo, analizando hábito de fumar y cáncer de pulmón) dispondrá
de una tabla como la 15.1.3.1, sobre la cual deberá calcular las nuevas medidas.

- 135 -
Presente (Casos) Ausente (Controles)

20 80
5 95

Aplicando lo aprendido hasta aquí, con los datos de la primera línea, se puede
calcular el odds a favor de tener cáncer entre los fumadores según la fórmula:
Odds a favor = Veces que ocurrió / Veces que no ocurrió = 20/80
Análogamente el odds a favor de tener cáncer entre no fumadores sería igual a 5/95

En estudios de casos y controles, la medida de riesgo, equivalente al riesgo


relativo, sería la razón de odds de aquí en adelante odds ratio (OR).
Odds Ratio (OR) = Odds a favor entre expuestos / Odds a favor entre no expuestos
Para la tabla 15.1.3.1 el cálculo sería:
Odds Ratio (OR) = (20/80) / (5/95) = 4.75

Como dijimos, los estudios de riesgo deberían responder al menos a las siguientes
preguntas:
a - ¿Existe evidencia que el estudiado, es un factor de riesgo ?
b - ¿El tamaño muestral usado fue el adecuado?

En un estudio de CASOS Y CONTROLES, hay que tomar en cuenta los intervalos


de confianza del OR:
a - Si ambos límites de los intervalos de confianza son superiores a 1, puede
afirmar que tiene evidencia que el factor es un riesgo.
b - Si los intervalos de confianza son estrechos puede afirmar que el tamaño
muestral empleado, es adecuado. (ap. 11.5)

En la figura 15.1.2.1 se observan tanto el odds ratio como sus intervalos de


confianza para las cifras de la tabla 15.1.3.1. El OR fue 4.75 (IC95% 1.7 - 13.2). La
evidencia obtenida apoya la hipótesis que el hábito de fumar es factor de riesgo de
cáncer de pulmón. Si se deseara precisar aún más el peso real del hábito, se
recomendaría incrementar el tamaño muestral, ya que el intervalo de confianza
obtenido se puede considerar poco estrecho. Veamos otros ejemplos:

Ejemplo 15.1.3.2.1

Sexo Masculino Infarto de Miocardio 10.5 4.8 - 21.3

- 136 -
Interpretación: en la investigación los varones tuvieron un riesgo 10.5 veces
mayor de tener infarto de miocardio que las mujeres. La banda de confianza
indica que si repitiera el experimento 100 veces, en 95 de ellas hallaría valores
comprendidos entre 4.8 y 21.3 lo cual permite esperar algo similar en toda la
población. El intervalo de confianza es poco estrecho, se recomendaría incrementar
el tamaño muestral.

Ejemplo 15.1.3.2.2

a)Fumador pasivo Enfisema 3.7 2.8 - 7.9


b)Sexo Masculino ACV 1.8 0.8 - 4.6

Interpretación
En el caso a) el odds a favor de tener enfisema, siendo fumador pasivo fue
3.7 mayor que el odds en contra. La banda de confianza varió entre 2.8 y 7.9 y estos
resultados fueron estadísticamente significativos. La evidencia obtenida apoya la
hipótesis que “fumar pasivamente “ es factor de riesgo de enfisema. Algunos
autores podrían considerar que el tamaño muestral fue aceptable.

En el caso b) el odds a favor de tener un accidente cerebro vascular fue 1.8


veces mayor que el odds en contra; la banda de confianza abarca el valor 1. La
evidencia obtenida apoya la hipótesis que “pertenecer al sexo masculino “ NO es
factor de riesgo de accidente cerebro vascular.

Los estudios de casos y controles son mucho más económicos y accesibles que los de cohorte
y por ese motivo son muy utilizados. Por otra parte están más expuestos a la comisión sesgos. Por
ejemplo, un punto crucial al cual deberá prestar máxima atención es la elección de controles
válidos. (73,74)
Mientras que los estudios de cohorte apoyan fuertemente la hipótesis de una relación
causal, los de casos y controles sólo son evidencia de asociación. Si determina que una variable
es factor de riesgo de otra, NO QUIERE DECIR que entre ambas haya relación causa-efecto Pero
puede ser una buena aproximación para que encare el estudio de una relación causa-efecto y le
ofrecería la base empírica (ap. 5.3) para pasar a la construcción de la teoría (ap. 19.3). T oda causa
es factor de riesgo de su efecto.

En el apartado siguiente encaramos la solución de problemas de medios de


diagnóstico.

15.2 - Valoración de medios de diagnóstico


Generalmente la situación es que cuenta con un medio de diagnóstico
(MD) y lo quiere suplantar por otro más económico, más sencillo, etc. El primer
MD, aquel con el que ya contaba, funciona como el patrón oro o gold standard
de los autores anglófonos. Con ése, es con el que comparará el nuevo MD.

- 137 -
Cuando evalúe un MD, deberá responder al menos dos preguntas:

a- ¿Se trata de un “buen” medio de diagnóstico ? O sea ¿cuánto rendimiento


tiene respecto del patrón oro? Siempre se parte de la suposición que el
patrón oro tiene un rendimiento del 100 % Para evaluar rendimiento usará
un procedimiento gráfico denominado curvas ROC y su complemento
matemático: estimación del área bajo la curva (ABC) (ap. 15.2.3.1 )

b - La segunda pregunta es: cómo cambia la perspectiva de un diagnóstico


de un paciente determinado, luego que el MD se ha aplicado. Podrá
responderla usando los denominados cocientes de probabilidades.
Conseguirá lo que necesita realizando una investigación para valorar medios
de diagnóstico.

15.2.1 - Cómo se organiza una investigación para valorar medios


diagnósticos
Suponga que es un mastólogo, que ha descubierto un nuevo medio de
diagnóstico para el cáncer de mama: la punción de aguja fina. Hasta el momento
sólo contaba con la biopsia tradicional a cielo abierto.
Deberá responder a las dos preguntas mencionadas en el apartado anterior.
Comenzará el diseño de la investigación formulando un objetivo preciso. Un
modelo para esta circunstancia sería:

“estimar los valores de cribaje de la punción de aguja fina (PAF) para la


detección del cáncer de mama”.

El esquema conceptual para la realización de la investigación podría ser el


que se muestra en la figura 15.2.1. Observe que ha tomado una muestra de una
población blanco. Cada uno de los pacientes de la muestra es sometido a una
medición con la biopsia habitual (que funciona como patrón oro o gold estándar)
y a la punción de aguja fina (PAF) que es el nuevo medio de diagnóstico. (NMD)

MUY IMPORTANTE: a - se obtienen dos mediciones distintas en los mismos


sujetos : se trata de un modelo a muestras relacionadas. b - La lectura anátomo
patológica de las muestras deberán ser realizada en forma independiente por
dos profesionales. Éstos registrarán los resultados sin intercambiar información
de ningún tipo. Recién al final del estudio se podrán cruzar los resultados de
ambos patólogos. Los resultados se expondrán en una tabla como la 15.2.1.
Cuando Ud. usa un MD, quiere que indique "positivo" en los individuos enfermos
y "negativo" en los sanos. Y puede cometer dos errores, decir que un individuo
está enfermo, cuando está sano y viceversa, todos hechos que se reflejan en la
tabla 15.2.1, en la que observa cuatro casilleros.

- 138 -
El casillero VP (verdaderos positivos), indicando el número de casos que dieron
positivos con ambos MD .
El casillero FP (falsos positivos) que computa cuántos dieron positivo al MD
nuevo, pero negativos al patrón oro.
El casillero FN (falsos negativos) en el que se inscribe el número de casos que
dieron negativos al MD nuevo pero eran positivos al patrón.
Finalmente está el casillero VN (verdaderos negativos) que indica el número
de casos que dieron negativos con ambos.

Con estos valores estará en condición de calcular los valores de cribaje, que
a su vez servirán para determinar: a - qué grado de rendimiento tiene el NMD;
b - cómo se modifica la situación diagnóstica de un paciente cuando se aplique el
NMD .

TABLA 15.2.1

- 139 -
15.2.2 VALORES DE CRIBAJE
Hay un conjunto de medidas estadísticas con la que se pondera el rendimiento
de un medio de diagnóstico y su potencial aplicación clínica. Son resultado una serie
de cálculos aritméticos ( a partir de los recuentos expuestos en la tabla 15.2.1 ) y
reciben el nombre genérico de VALORES DE CRIBAJE DE UN MEDIO
DIAGNOSTICO. Ellos son : Sensibilidad, Especificidad, Poderes Predictivos y
Cocientes de Probabilidades. (3, 11, 23,66)
La definición de cada uno de ellas es la siguiente:
SENSIBILIDAD de una prueba (S): porcentaje de individuos positivos al patrón
oro, que dan positivos a la prueba.
Se calcula según la siguiente fórmula: ( S= VP/(VP + FN)
ESPECIFICIDAD de una prueba (E): porcentaje de individuos negativos al patrón
oro, que dan negativos a la prueba.
Se calcula según la siguiente fórmula: ( E= VN/(VN + FP))
La sensibilidad y la especificidad se consideran propiedades intrínsecas del
medio de diagnóstico porque se mantienen constantes aún cuando cambie
la población.
PODER PREDICTIVO POSITIVO de una prueba (PPP): porcentaje de individuos
positivos a la prueba, que dan positivos al patrón oro.
Se calcula según la siguiente fórmula: (PPP = VP/(VP + FP))
PODER PREDICTIVO NEGATIVO (PPN): porcentaje de individuos negativos a
la
prueba, que dan negativo al patrón oro.
Se calcula según la siguiente fórmula: ( PPN= VN/(VN + FN))
Los poderes predictivos positivos y negativos se consideran propiedades
extrínsecas del medio de diagnóstico porque cambian según la población
de referencia. Tienen uso epidemiológico.

Finalmente, para el uso clínico, quedan por presentar los cocientes de


probabilidades.
El COCIENTE DE PROBABILIDADES POSITIVO, también llamado RAZON DE
VEROSIMILITUD POSITIVA se calcula de la siguiente manera:
CPP= Sensibilidad / (1- Especificidad)
Se aplica para un paciente determinado para estimar en cuánto aumenta el odds
de tener la enfermedad, si la prueba resulta positiva.

El COCIENTE DE PROBABILIDADES NEGATIVO, también llamado RAZON DE


VEROSIMILITUD NEGATIVA se calcula:
CPN = (1- Sensibilidad) / Especificidad
Se aplica para un paciente determinado para estimar en cuánto disminuye el
odds de tener la enfermedad, si la prueba resulta negativa.
Le comenté que el primer paso sería evaluar el rendimiento del NMD.

- 140 -
1- Especificidad ( proporción Falsos Positivos)

Gráfico 15.2.3.1: Curva ROC (línea señalada por la flecha) en el caso de un medio de diagnóstico
con . Se comprueba que a medida que aumenta la Sensibilidad, también aumenta
la proporción de Falsos Positivos, lo que muestra que el MD tiene una capacidad discriminativa nula.

Gráfico 15.2.3.2 : Curva ROC (línea señalada por la flecha) para un medio de diagnóstico con
Se comprueba que a medida que aumenta la Sensibilidad, la proporción de Falsos
Positivos se mantiene en cero, lo que muestra que el MD tiene una capacidad discriminativa óptima.

15.2.3 - VALORACIÓN DEL RENDIMIENTO DE UN MEDIO DIAGNÓSTICO


Parece una obviedad que un buen MD debería tener máxima sensibilidad y
máxima especificidad. Pero esta situación no es tan frecuente : en realidad cuando
los medios de diagnóstico tienen buena sensibilidad suelen tener mala sensibilidad
y viceversa. Por ese motivo se han desarrollado análisis que permiten valorar ambas
propiedades en conjunto, por ejemplo las curvas ROC.

- 141 -
15.2.3.1 - CURVAS ROC
Se denomina curva ROC a un gráfico según el cual se puede valorar el rendimiento
de un medio de diagnóstico. (73,74)
Para construirlo se determinan los valores de sensibilidad y especificidad a
diferentes puntos de corte. Luego sobre el eje de las ordenadas se representan los
valores Sensibilidad (indicadores de la proporción de Verdaderos Positivos) y sobre
el eje de las abscisas se señalan los valores de 1-Especificidad (indicadores de la
proporción de Falsos Positivos). Las consecuencias e interpretación se pueden ver
en los gráficos 15.2.3.1 y 15.2.3.2
En el software que se suele usar para producir curvas ROC, se dispone de un
complemento numérico para la curva: es el cálculo del área bajo la curva (ABC).
El ABC correlaciona perfectamente con el tipo de curva y sirve a los mismos fines.
El medio de diagnóstico con rendimiento máximo tiene un ABC = 1, mientras que los
MD con nulo rendimiento tienen un ABC = 0.5.
Se pueden encontrar todos los valores posibles entre 0.5 y 1. Cuanto más cercana
es a 1, el ABC de un medio diagnóstico, mejor es su rendimiento.
Otra ventaja del cálculo del ABC es que permite la estimación de intervalos de
confianza, dando una idea de cual puede ser el mínimo y cuál el máximo rendimiento
del MD
Un beneficio secundario es que se pueden comparar dos o más medios de
diagnóstico para determinar si las diferencias entre rendimientos son significativas.
( fig. 15.2.3.3 )
Lo que le he descripto hasta aquí es la primera comparación con el Gold
Estándar y es sólo un PRIMER PASO para estimar su grado de rendimiento. En un
futuro, y con el uso puede descubrir que le permite realizar predicciones mas
precisas que las que lograba con el gold estándar. Entonces lo elevará a la categoría
de "patrón oro". Pero ello requerirá una extensa aplicación clínica.
En el apartado siguiente, le muestro la valoración de un NMD en su aplicación
clínica, a partir de un ejemplo concreto.

15.2.4 - OBTENCIÓN E INTERPRETACIÓN DE INFORMACIÓN APLICADA A LA CLÍNICA


SOBRE MEDIOS DE DIAGNÓSTICO.
Suponga que realizó la investigación para la PAF en cáncer de mama
y obtuvo los resultados ficticios de la tabla 15.2.4
Tabla 15.2.4

Positivos 14 (VP) 8 (FP)


Negativos 1 (FN) 91 (VN)

Eligiendo cualquiera de las herramientas indicadas (Apéndice) por ejemplo


el VCCStat 2.11), podrá obtener resultados como los que se muestran en
la figura 15.4.2.1 (similares a los obtenidos con Epidat 3.1).

- 142 -
FIGURA 15.2.3.3: Curvas ROC para dos medios de diagnóstico usados en la misma
patología (líneas señaladas por la flechas) Gráfico y cálculos realizados con Epidat
2.4 Se comprueba que no sólo el ABC es bastante menor en el de la izquierda, sino
que el mejor valor del ABC a la izquierda, es peor,(más bajo) que el peor valor del
ABC a la derecha, aportando clara evidencia que las diferencias entre ambas áreas
son estadísticamente significativas.

Si bien los valores de sensibilidad y especificidad indican un medio de


diagnóstico con buenas cualidades es mejor proceder metódicamente y responder
a las preguntas específicas o sea qué rendimiento tiene la PAF y cuál sería su
utilidad clínica (en un caso en particular).
Para responder a la primera usaremos los datos derivados del análisis de la
figura 15.2.4.2 en la cual aparece una curva ROC, obtenida usando la herramienta
Epidat 3.1 para los datos de la tabla 15.2.4 La línea aparece muy cercana al eje de las
ordenadas, o sea cercana al modelo de medio de diagnóstico con rendimiento
máximo ( figura 15.2.3.2)
En la misma salida se muestra el cálculo del área bajo la curva (ABC) en 0.9263
con un error estándar de 00.361. Lo cual permitió establecer que el intervalo de
confianza del 95 % comprendido entre 0.8556 y 0.9969
Ambos resultados configuran un modelo de medio de diagnóstico con
rendimiento aceptable en relación al patrón oro.
Si, en cambio, el valor del ABC hubiera estado cercano a 0.5 la PAF se debería
haber descartado como un procedimiento con aplicabilidad en la práctica.

- 143 -
15.2.5 - Cómo se usan los valores de cribaje de un MD, en la práctica clínica
Habiendo respondido a la primera pregunta, queda ahora, evaluar cuál es la
aplicación que tendría la PAF en la clínica.
Suponga que lo consulta una paciente de 35 años de edad, por la aparición de un
bulto en su pecho derecho. Tiene antecedentes familiares de cáncer de mama y el
resto de la exploración física es negativa. Revisando la literatura disponible descubre
que las pacientes con estas características tienen una probabilidad de 0.88 (88%) de
tener cáncer de mama. Este valor de probabilidad existe previamente a cualquier
medida que Ud tome incluso la aplicación de un MD. Por ello se la denomina
probabilidad pretest.
El uso de un medio de diagnóstico debería servir para mejorar la capacidad diagnóstica de la
clínica por si sola. Esto significa que después de aplicar el MD, Ud tiene que tener, acerca del
diagnóstico de la paciente, un grado de certidumbre mayor, que el que tendría aisladamente por
la clínica.
Ud decide aplicar la PAF, cuyos valores de cribaje son los que mostramos en la
figura 15.2.4.1 Allí entran en juego los cocientes de probabilidades positivo o negativo
(CPP, CPN), según el resultado de la prueba.
En nuestro ejemplo, la situación pretest es la siguiente: la paciente tiene una
probabilidad de 0.88 de tener cáncer de mama. Según lo expresado en el apartado
15.1.3.2 (sobre relación entre probabilidad y odds), esto equivale a un odds a favor de
7.33. (Necesitamos el valor de odds, ya que los CP se aplican a éstos y no a
probabilidades).
Luego que Ud aplica la PAF pueden ocurrir dos cosas: resulta positiva o negativa
dando lugar a las situaciones post test .
Si el resultado de la PAF es POSITIVO , deberá usar el CPP. El CPP indica en
cuántas veces se incrementa el odds de tener la patología si el test diera positivo.
En la figura 15.2.4.1 se ve que es igual a 11.5 Dado que el odds pretest era de 7.33
Ud calcula:
odds post test = odds pretest x CPP = 7.33 x 11.55 = 84.6615
Por la relación descripta entre odds y probabilidad (ap. 15.1.3.2)
p = chance /(1+chance) = 84.6615 /(1 +84.6615) = 0.9883
Conclusión: la probabilidad pretest era de 0.88 (88%) y luego que el test fue
positivo ha pasado a ser de 0.9883 o sea 98.83 %

Si el resultado de la PAF es NEGATIVO , deberá usar el CPN que indica cómo varía
el odds de tener la patología, luego que el test dio negativo. En la figura 15.2.4.1 se
ve que es igual a 0.07 Dado que el odds pretest era de 7.33 Ud calcula:
odds post test = odds pretest x CPP = 7.33 x 0.07 = 0.5131
Por la relación descripta entre chance y probabilidad (ap. 15.1.3.2)
p = chance /(1+chance) = 0.5131 /(1 + 0.5131) = 0.339
Conclusión: la probabilidad pretest era de 0.88 (88%) y luego que el test fue
positivo ha pasado a ser de 0.339 o sea 33.9 %

- 144 -
- 145 -
Figura 15.2.4.3 :Nomograma de
Fagan aplicado a los datos de los
ejemplos presentados en el texto. En
la línea gruesa superior, se ve el
cálculo de probabilidad post test para
el caso de PAF positivo, mientras que
la línea inferior muestra el resultado
cuando la PAF resultó negativa. La
ventaja del nomograma es que hace
innecesarios los cálculos a los fines de
una evaluación preliminar de la
situación y simplifica la interpretación
de los resultados. (Fagan TJ. Letter:
nomogram for Bayes theorem.NEngl
J Med.1975;293:257.)

A los fines de evitar cálculos engorrosos para el médico práctico, Fagan (86)
publicó un nomograma que tiene gran utilidad práctica el cual se muestra aplicado
para el caso presentado en la figura 15.2.4.3
De todo lo mencionado se deduce que: establecer la validez de un trabajo
científico sobre medios de diagnóstico no le será difícil si recuerda que se deben
cumplir algunos puntos fundamentales, a saber:
a - Se deben haber realizado las mediciones en muestras relacionadas y a doble
ciego, si esto no ocurre el trabajo no tiene validez interna.
b - Se deben haber calculado los parámetros para valorar el rendimiento del MD:
área bajo la curva y curva ROC
c - Se deben haber calculado todos los valores de cribaje con sus respectivos
intervalos de confianza. El tamaño de las muestras empleadas, tiene mucha
importancia pues necesita que los intervalos de confianza sean lo más estrechos posible.
Si Ud es el investigador, le conviene estimar ese tamaño, antes de realizar las
mediciones, empleando las fórmulas de tamaño muestral para comparación de
porcentajes. (23).
A partir del próximo capítulo trataremos procedimientos para estudiar la
variación conjunta de dos o más variables.

- 146 -
16 - ESTIMACIÓN DE COEFICIENTES DE CORRELACIÓN
REGRESIÓN - Parte I: Coeficientes de Correlación
Muchas personas frecuentemente usan conceptos estadísticos, ignorando
que son tales y los aplican en sus decisiones . Por ejemplo:

� Un campesino espera que luego de una época de lluvias, el pasto


crezca
de manera proporcionada a la cantidad de lluvia caída.
� Un padre espera que, al crecer, su hijo sea al menos tan alto como él.
� Un criador de cerdos, espera que a mayor cantidad de alimento que
reciban sus animales, mayor sea el peso que luego alcanzarán.

Si examina los problemas mencionados descubrirá que en los tres casos


alguien quiere usar una variable (cantidad de lluvia, altura del padre, cantidad de
alimento suministrado) para predecir el valor que alcanzará otra variable (altura
del pasto, altura del hijo, peso del cerdo). Aunque no lo sepan, intentan
establecer una relación denominada correlación.

Preste atención al hecho que la palabra “correlación” se usa coloquialmente


para referirse a relaciones de asociación: por ejemplo se dice que “el infarto
de miocardio correlaciona con vida sedentaria”, “La diabetes correlaciona con
los antecedentes familiares”. Pero en este caso “correlación” se usa en un
sentido genérico laxo porque en realidad se debería decir:
“el infarto de miocardio se asocia con una vida sedentaria”
“la diabetes se asocia con antecedentes familiares”.

En adelante usaremos el término CORRELACIÓN, para significar que entre dos


variables (X e Y) existe una relación tal que se pueden usar los valores de X para
predecir los valores de Y. En los problemas de correlación lo importante es esta
relación porque Ud. piensa la puede medir y usar para predecir.

También en los problemas listados a continuación se busca establecer


una correlación:
[p15.1] - El tiempo de polimerización de un sellador y el período que permanecerá
en la cavidad dentaria guardan una relación lineal.

[p15.2 ]- En un mercado normal, el costo del producto es inversamente


proporcional a la oferta de venta que hay del mismo

- 147 -
[p15.3] - En los seres humanos, el valor de creatininemia es un predictor
del clearance de creatinina.

[p15.4 ] - Se puede usar la edad para predecir el peso de un niño.

La variable que usará para predecir es identificada con diversos nombres:


variable independiente, variable predictora o predictor o la letra X. Más
recientemente se ha extendido el uso del término “covariable” para las variables
independientes (23)

La otra variable, la que Ud intenta predecir, se llamará variable dependiente,


o variable a predecir o variable predicha y con la letra Y. (4, 23)

Esta nomenclatura tiene origen matemático: con la misma se quiere decir


que se puede construir una ecuación en la que que los valores de Y dependen
(matemáticamente hablando) de los valores de X. Por ejemplo en [p15.3] se esta
diciendo que los valores del clearence de creatininemia dependen del valor de
creatininemia. Si este valor cambia, aquellos también lo hacen. Y viceversa. La
reversibilidad de la ecuación no siempre el posible. El sentido común deja en
claro que si el peso de un niño depende físicamente de la edad la inversa no es
cierta: la edad no depende físicamente del peso.

La ecuación es sólo un medio para estudiar la relación.


Es en el momento de formular el problema cuando el investigador decide cuál
variable es X y cuál es Y.
Por ejemplo se dice que el número de anillos de un tronco, indica cuántos
años tenía el árbol. Si el número de anillos es de 5, el árbol tenía 5 años; si el
número de anillos es de 20, el árbol tenía 20 años. Como se ve, cuando cambia
el valor de X (número de anillos), cambia el valor de Y (edad del árbol.) Si quisiera
estudiarlo al revés, por ejemplo sabiendo la edad del árbol, adivinar el número
de anillos que tendrá el tronco, también puede hacerlo así. Pero en esta nueva
manera de formular el problema ( y nueva ecuación) edad del árbol es X y
número de anillos es Y.

En resumen lo que se intenta es medir la correlación y para ello se utilizan


coeficientes de correlación y coeficientes de regresión.

Son cifras y por lo tanto deben ser estimadas, así que pasaremos a la
secuencia operativa que nos permitirá realizar las estimaciones.

- 148 -
16.1 ESQUEMA CONCEPTUAL PARA RESOLVER PROBLEMAS DE CORRELACIÓN

A grandes rasgos la secuencia de operaciones que deberá realizar para resolver


problemas de correlación o sea el ESQUEMA CONCEPTUAL, es el siguiente:

PASO NRO OPERACIÓN A REALIZAR


(1) - Definir precisamente la población (P)
(2) - Obtener una muestra (M) de individuos, representativa.
(3) - Medir las variables (X e Y) en estudio en cada individuo
(4) - Obtener los resultados (R)
(5) - Calcular las estadísticas elegidas
(6) - Formular las conclusiones para la muestra.
(7) - Realizar las estimaciones para la inferencia a la población
(8) - Formular conclusiones para la población

Un detalle sobre el esquema, así como un gráfico ilustrativos fueron tratados


en el apartado 6.2

Las operaciones 1 a 3 ya fueron tratadas (caps. 8 a 10).

Para obtener información que indique que puede usar X para predecir Y y
llevar adelante los pasos 4 y 5 de la operatoria (calcular resultados y estadísticas)
Ud. usará tres procedimientos combinados. Dos de ellos son matemáticos: el
cálculo del coeficiente de correlación y el análisis de regresión. El tercer procedimiento
es gráfico (nube o diagrama de puntos), pero está reservado para variables medidas
en escala intervalar. (3, 23) Recomiendo comenzar por los más sencillos: el método
gráfico y/o el coeficiente de correlación. Si ambos indican una correlación como
la que está buscando, entonces use el análisis de regresión

16. 2 Nube o Diagrama de Puntos


Es un gráfico sencillo de obtener. Deberá llevar los valores de X e Y, a un sistema
de coordenadas cartesianas, representando con un punto cada intersección. Luego
obtendrá diagramas similares a los que se muestran en todas las figuras
pertenecientes al actual capítulo.
Observando la nube sólo podrá saber cuántas observaciones se han realizado
y si puede considerar que se “vislumbra” algún tipo de línea que señale si hay
relación entre ambas variables. (4)

- 149 -
Figura 16.2.1 Figura 16.2.2 Figura 16.2.3

Por ejemplo en la figura 16.2.1 se observa un patrón que indica ausencia


de correlación. En la figura 16.2.2 se ve un patrón de correlación negativa
y en la 16.2.3 uno de correlación positiva.

Referente al número mínimo de observaciones para este gráfico , estimo


empíricamente, que necesitará veinte casos para poder opinar válidamente. Si
hay menos, no será conveniente que use un diagrama de puntos. Use un coeficiente
de correlación y/o de regresión.

16.3 - Coeficientes de correlación

Si bien la definición estándar de coeficiente de correlación (CC) señala que:


[Def.1] Es un número que mide la fuerza o intensidad de asociación
entre las variables X e Y (3, 42)

personalmente prefiero decir que:


[Def.2] es un número que mide el grado de asociación entre las variables
X e Y, ya que el concepto de fuerza no me parece apropiado para
el contexto.

Obtendrá el CC aplicando un conjunto de FORMULAS MATEMÁTICAS


denominadas genéricamente también coeficientes de correlación, disponibles
en la literatura especializada o implícitas en el software apropiado. (Apéndice)

Hay distintos tipos de fórmulas para coeficientes de correlación, que deberá


aplicar según el número de muestras, variables y la escala en la que han
sido medidas las variables. En esencia, el modo de interpretarlos es el mismo.

- 150 -
Por ejemplo, para determinar correlación entre variables medidas en escala
nominal usará el coeficiente de contingencia (C), mientras que para dos variables
medidas en escala ordinal el coeficiente de Spearman (rs), y para varias en la
misma escala, el coeficiente de Kendall (W). Para la escala intervalar use el
coeficiente de correlación lineal r de Pearson. (23,45)
Usando los resultados de su investigación alimentará esas fórmulas
matemáticas. Luego realizará los cálculos y obtendrá ... el coeficiente !!! El
mismo resultado obtendrá con el soft apropiado y con menos esfuerzo.
El CC tendrá un valor comprendido entre 0 y 1, y un signo positivo o negativo.
Así por ejemplo podrá obtener CC de 0.25, 0.30, 0.87, -0.99, etc. El CC jamás
puede ser mayor que 1 o menor que -1.
En la actualidad para poder interpretar un CC debe disponer de: los
intervalos de confianza, la significación, el signo y el valor absoluto.

16.3.1 Intervalos de confianza para un CC


Sea el problema [16.3.1] : Ud. es patólogo forense, y quiere usar la longitud
del fémur (X) , para predecir la altura de varones adultos (Y). Obtuvo los datos
de 30 pacientes para establecer la correlación
Como no estudió toda la población, los coeficientes de correlación que calcule
funcionarán como una estimacion promedio de los verdaderos coeficientes en la
población para lo cual deberá estimar los intervalos de confianza.
El concepto, los criterios y el uso que les dará son los mismos que los expresados
para bandas de confianza para promedios. (ap. 11.4.2). Por supuesto que se
calculan con otras formulas, especiales para cada coeficiente (3, 23,83) o empleando
el software indicado (Apéndice)
El CC, que para este caso se denomina coeficiente de correlación de
Pearson y se representa con la letra r.
Siguiendo con la relación entre fémur y altura, suponga que obtiene r =
0.76. Después completa los cálculos y obtiene un intervalo de confianza del
95% comprendido entre 0.50 y 0.89. Ahora puede informar que tiene una confianza
del 95 % que, en la población, la correlación entre la longitud del fémur y la
talla esté comprendida entre 0.50 y 0.89
Como de costumbre, los intervalos de confianza aportan información
complementaria:
a - la más importante consiste en que, con los intervalos podrá decidir si el
coeficiente es estadísticamente significativo (sin necesidad de calcular p, como
haremos en el apartado siguiente). En efecto si ambos extremos de los intervalos
de confianza tienen el mismo signo, puede afirmar que el CC es “estadísticamente
significativo” , de lo contrario no lo es (ver ap. 16.3.2)

- 151 -
Si el CC no es significativo, ya puede concluir que no existe una relación
significativa entre X e Y y detener el análisis.
b - la amplitud del intervalo señala si el tamaño muestral empleado fue
suficiente, para lo cual aplicará los criterios expresados (ver ap. 11.5)
Pero no siempre se dispone de los intervalos de confianza. A veces sólo el
pvalor.

16.3.2 Significación de un coeficiente de correlación


Otro enfoque para solución del problema [16.3.1] podría ser el siguiente:
Obtuvo los datos e hizo los cálculos con 30 pacientes para establecer r =
0.76. Con este dato tiene derecho a formular el siguiente enunciado:

Ha: "en varones adultos, la correlación entre longitud del fémur y talla es de r= 0.76"

Pero recuerde que:


a - de todos los varones posibles tomó sólo algunos.
b - de la infinita variedad de combinaciones de longitudes de fémures
y tallas, también tomó sólo algunas (las de sus pacientes).

Esto quiere decir que a veces obtendrá ese valor de r, y a veces no. Por lo
tanto Ha es una hipótesis probabilística (ap. 13.1)
Para valorar su significación deberá seguir las pautas establecidas en el ap.
13.3.6 o sea:
a - formular la hipótesis nula (Ho)
En estudios de correlación Ho indica que el CC es igual a cero que es
lo mismo que decir que entre X e Y no hay correlación. En este caso:
Ho: "en varones adultos, la correlación entre longitud del fémur y talla es de r= 0"
b - establecer un nivel de significación (alfa) y el error beta aceptable
c - establecer las reglas de toma de decisión.
Si p ≤ alfa rechaza Ho.
d - averiguar el valor de p a través de las pruebas de significación adecuadas
para coeficientes de correlación (3, 23, 85)
e - tomar decisión.

Sea usando software o manualmente, obtenido el valor de p, tendrá las


siguientes variantes de interpretación:

I - El valor de p fue menor o igual que alfa. Deberá concluir que la hipótesis
nula es falsa. El CC fue distinto cero. La correlación entre X e Y fue
estadísticamente significativa.

- 152 -
II - El valor de p fue mayor que alfa. Deberá
“aceptar” que la hipótesis nula es verdadera. El CC Figura 16.3.3.1
no fue distinto cero. La correlación entre X e Y fue
estadísticamente NO significativa. Ya puede concluir
que no existe una relación significativa entre X e Y y
detener el análisis.
Recuerde que con la interpretación I, está corriendo
elriesgodecometerelerrortipo alfa otipoI, cuantificado
por el nivel de significación (ap. 13.3.4), mientras
que en la II, está corriendo el riesgo de cometer
el error tipo beta o tipo II.(ap. 13.3.5)
En definitiva, frente a un CC, el primer parámetro a
tomar en cuenta es el grado de significación que tiene. Si el CC no es significativo,
ya puede concluir que no existe una relación significativa entre X e Y y detener el
análisis. De lo contrario el próximo paso es la interpretación del signo.

Figura 15.4.3.1
Figura 15.4.3.1 16.3.3 - Signo de un coeficiente de correlación
El signo le indica si las variables se modifican en
un mismo sentido o no.
El signo es positivo cuando ambas variables
aumentan o disminuyen simultáneamente, y Ud
informará que la correlación es positiva. (figura
16.3.3.3 ; valor de
r=0.78).
Figura 16.3.3.2
Figura 16.3.3.3
Si el signo es
negativo, entonces informará que la correlación es
negativa lo cual significa que cuando una variable
aumenta, la otra disminuye. ( fig. 16.3.2 ; r = - 0.76) Para
continuar la semiología del CC, deberá evaluar su valor
absoluto.

16.3.4 Valor absoluto de un coeficiente de


correlación
En principio convengamos que la relación entre la variable predictora y la
predicha es de mayor grado cuanto mayor es el CC, ya que su valor absoluto
medía directamente ese parámetro. Luego verá que en caso de estar estudiando
varias variables X respecto de una Y, el CC sirve para establecer cuál de todas las
X tiene mayor grado de asociación con Y. (cap. 18)

- 153 -
La siguiente es la interpretación aplicable al valor absoluto del coeficiente
de correlación lineal r , el más ampliamente usado. Pero es útil para una aproximación
intuitiva a la interpretación del valor absoluto de cualquier otro CC.

Figura 16.3.4.1 Figura 16.3.4.2

Suponga que ha obtenido dos CC, uno entre longitud del fémur y talla
(Fig.16.3.4.1) y el otro entre longitud del húmero y superficie corporal (Fig. 16.3.4.2).
Ahora tome el coeficiente r1=0.70 y elévelo al cuadrado. El resultado será igual a
0.49, se simboliza con la letra R² y se denomina

COEFICIENTE DE DETERMINACIÓN (Note que R² = (r)²) (4, 23)

Si multiplica R² por 100 tendrá 49, valor que se interpreta de este modo: desde
un punto de vista matemático el 49 % de la talla fue determinado (explicado) por la
variable longitud del fémur.
Si repite la operación con el R² de la dupla longitud húmero - talla (fig. 16.3.4.2)
podrá informar que ...
desde un punto de vista matemático un 64 % de la talla, fue explicado por la
variable longitud del húmero.
Y si estaba eligiendo predictores de la talla, podrá decir que la longitud del
húmero fue mejor predictor la del fémur.
Si lo que Ud. busca es usar variables X para predecir variables Y, le conviene
encontrar X que alcancen un R² igual o mayor que 0.64, lo que equivale a tener un
r igual o mayor que 0.8.
Un r inferior a 0.7 indica que la X que está estudiando explica menos de un 49%
de la variable Y. Por ese motivo muchos autores coinciden en decir que tales
coeficientes son bajos. No creo que se justifique usar un lenguaje cualitativo
hablando de coeficientes de correlación altos o bajos, cuando se dispone del
coeficiente de determinación, Me parece que es preferible decir que “Juan mide
1.85 metros”, que decir que “Juan es alto”. Podría ser alto con cualquier valor por
encima de 1.80, pero no es lo mismo 1.85 que 2.10 m.

- 154 -
Nota: el signo que precede al coeficiente r no afecta el coeficiente de
determinación, porque la operación es una potenciación al cuadrado, que
siempre le dará resultados positivos.

16.4 Información En Problemas De Correlación: Conclusiones


Para La Población
A menos que haya estudiado toda la población, los coeficientes de correlación
(al igual que los de regresión ) que Ud. calculó funcionan como una estimación
promedio de los verdaderos coeficientes en la población. Y Ud. está habilitado
para estimar sus intervalos de confianza, usando fórmulas (3,23,85) o software
(Apéndice).
En el problema [16.3.1] habíamos supuesto que obtuvo un coeficiente r= 0.76
(IC95% 0.50 - 089) y podía informar que tenía una confianza del 95 % que, en la población,
la correlación entre la longitud del fémur y la talla esté comprendida entre 0.50 y
0.89 .

En el apartado siguiente le ofrezco algunos formatos de interpretaciones


posibles para los resultados de estudios de correlación, que se exponen en el
Cuadro 16.4.1

Cuadro 16.4.1

[1] 10 - 0.8 (-0.4) - (0.6) 0.20


[2] 123 0.6 0.5- 0.7 0.001
[3] 15 0.5 (-0.3) - 0.73 0.08
[4] 34 - 0.9 (-0.85) - (-0.95) 0.002

Combinación [1]:
a1 - la probabilidad que r= -0.8 se haya producido por azar fue de 0.20, mayor
que 0.05. Debe decidir que la correlación no es estadísticamente significativa
o, lo que es lo mismo, no es distinta de cero.
De esto, tiene derecho a deducir como información , SIN OTRO ANÁLISIS, que
la evidencia disponible apoya la hipótesis que entre X e Y no existe
correlación. Por este motivo le comenté que antes de evaluar el signo y valor
absoluto le convenía mirar la significación o los intervalos de confianza, que
en este caso tienen distinto signo.

- 155 -
Combinación [2]:
a2- la probabilidad que r=0.6 se haya producido por azar fue de 0.001, menor
que alfa=0.05. Debe decidir que la correlación fue estadísticamente
significativa.
b2- Puede tener una confianza del 95 % que la correlación en la población
está comprendida en el intervalo 0.5 - 0.7. Ambos límites del intervalo tienen
el mismo signo. Ya puede inferir que la evidencia disponible apoya la hipótesis
que entre X e Y, existe correlación.
c2- La correlación entre ambas variables fue positiva (ambas se modificaban
en el mismo sentido)
d2-la variable X explicó el 36 % de la variable Y. (R2 = r² = 0.6 x 0.6 = 0.36)
e2-El número de casos estudiados fue 123.
Puede informar que la correlación entre X e Y es positiva, que X explicó el
36 % de Y y que esto no ocurrió por azar.
Atención: también tiene derecho a inferir que el coeficiente de determinación
indica que no tendrá mucho éxito si usa X para predecir Y
(independientemente de que la correlación haya sido significativa).

Combinación [3]:
a3 - la probabilidad que r=0.5 se haya producido por azar fue de 0.08; mayor
que el alfa de 0.05. Debe decidir que la correlación no es estadísticamente
significativa.
b3- Ud. puede tener una confianza del 95 % que el coeficiente de correlación
en la población está entre -0.3 y 0.73
c3-la correlación entre ambas variables fue positiva (ambas se modificaban
en el mismo sentido)
d3 - la variable X explicó el 25% de la variable Y.
e3 - El número de casos estudiados fue 15.
Hasta aquí no parece haber diferencias entre esta interpretación y la
de la combinación [1].
Pero ATENCIÓN. 0.08 está tan cerca del valor aceptado como límite
(0.05) que habría que recoger mayor cantidad de datos antes de decidirse.
T al vez esta sería la mejor conclusión para su trabajo.

¿ Cómo interpreta Ud. la combinación [4] ? Correcto: la correlación es negativa,


significativa y X explica el 81 % de Y. Puede tener una confianza del 95 % que,
en la población la correlación está entre -0.85 y -0.95. El número de casos
estudiado fue de 34. Una situación ideal !!!

A continuación me introduzco en el tercer método de estudio para una


correlación: el análisis de regresión para dos o más variables.

- 156 -
17 - ESTIMACIÓN DE COEFICIENTES DE CORRELACIÓN
REGRESIÓN - Parte II: Análisis de regresión bivariado
Existe una fórmula que permite calcular el peso corporal (Y) de un niño,
usando su edad en años (X). (18) Tiene aplicación entre los 2 y los 7 u 8 años de
edad y es la siguiente:

Peso = 10 + Edad en años x 2 [1]

Otra manera de escribirla es:


Y = 10 + 2X [2]

Aplicándola para un niño con 4 años de edad , éste debería pesar (en
promedio) 18 kg porque
Peso = 10+ 2 Edad = 10 + 8 = 18
Pruebe con cualquiera de los niños que suele tener cerca (hijo, sobrinos,
vecinitos, etc) Verá que aproxima con bastante precisión. Pero sigamos.

La fórmula [2] se puede generalizar del siguiente modo :


Y = a + bX
Esta es un modelo de la FÓRMULA O ECUACIÓN DE REGRESIÓN. Su existencia
se funda en el siguiente razonamiento:
si entre X e Y existe covariación
entonces
a cada valor de X debe corresponderle un valor de Y
por lo tanto
debe existir una fórmula (función) que permita calcular cuánto valdrá Y
usando los valores de X.
El problema para los matemáticos, fue desarrollar una técnica que produjera fórmulas
para relacionar cualquier par de X e Y. Pero lo lograron y alguien lo bautizó con el
nombre de análisis de regresión.

Se dice que los hijos tienden a ser más altos que los padres bajos y más bajos que sus padres
altos. Este fenómeno se repetía tanto en el reino animal como el vegetal. Por tal motivo Galton lo
denominó como LEY DE REGRESIÓN UNIVERSAL. Pearson y Lee, reunieron información y
desarrollaron un algoritmo que permite encontrar la fórmula que conecte cualquier par de X e Y
dados. Cuando publicaron el trabajo hicieron alusión a que se trataba un método de análisis de la
ley de regresión. A partir de entonces quedó este nombre de análisis de regresión. (35) ( Qué suerte
que no lo llamaron supercalifragilisticoespiralidoso !!! )

Es decir que el término análisis de regresión identifica un procedimiento


que consiste en hallar los valores de los coeficientes a y b para obtener finalmente
la fórmula :
Y = a + bX [3]
Ésta puede recibir el nombre de ecuación fundamental de regresión.

- 157 -
Como [3] representa asimismo un modelo matemático de la relación X
e Y, también recibe el nombre genérico de modelo. Es decir que, en este
contexto : modelo , ecuación de regresión y fórmula de regresión, son sinónimos.

Para encontrar el procedimiento Pearson y Lee usaron dos series de mediciones


apareadas con el siguiente formato:

Familia Talla del Padre (X) Talla del Hijo (Y)


1 192 190
2 185 184
3 170 175
………………………………………………………………
N Xi Yi

En la actualidad los algoritmos necesarios para hacer los cálculos están


disponibles en cualquier software estadístico, planillas de cálculo e incluso
online. (Apéndice)

Haga el experimento y verá que: no importa cuáles valores ponga en las


columnas destinadas a las X, ni cuáles destinadas a la Y, siempre obtiene una
ecuación general.
Pero preste atención : tener una ecuación no quiere decir que la ecuación
sirva (funcione para predecir). Y si Ud quiere predecir, no le sirve cualquier
ecuación. (ver ap. 17.3)

Veamos el razonamiento que lleva a la obtención de los coeficientes.

Es evidente que si cada vez que mide X resulta que es igual a Y, no hace falta
ninguna ecuación especial:
X =Y y listo!
Pero esto no ocurre nunca. Ud está estudiando Y, porque tiene evidencias
que no tiene el mismo valor que X.

La fórmula más sencilla que podría obtener sería


Y = bX
en la cual Y fuera exactamente igual a X multiplicada por algún coeficiente (b). Pero
esto casi nunca ocurre en mediciones de variables naturales.

Por ese motivo es necesario un coeficiente de ajuste ( a ) que lo conduce a


esta ecuación:
Y = a + bX

A partir de aquí los coeficientes a y b se denominan coeficientes de


regresión. Y tienen sinónimos (3):

- 158 -
Sinónimos de a = constante, ordenada al origen, intercepción o
b₀ (b sub cero)
En inglés (constant , intercept)
Sinónimos de b = pendiente ,
En inglés (slope)

Observe ahora cómo se interpretan.


La ordenada al origen (a) es el valor que tendrá Y cuando X valga cero.
Esto es fácil de comprender desde el punto de vista matemático, ya que
si en la fórmula [3] se reemplaza X por cero resulta:
Y=a+bx0
Y=a+0
Y=a
La pendiente, b, indica la variación promedio de Y por cada unidad de X
Así en la fórmula Peso = 10 + Edad x 2 [1]
por cada año que pasa, el peso se incrementa
en promedio en dos unidades.

El análisis de los valores de coeficientes de regresión permite responder a


una serie de cuestiones que califican y cuantifican la relación de X e Y.
Suponga que tiene un conjunto de datos obtenidos en 31 recién nacidos ,
y observa que, a medida
que aumenta la edad
gestacional aumenta el
peso del neonato. Puede
formular una hipótesis
como:
“se puede usar la edad
gestacional para predecir con
precisión el peso del neonato.”
Buscará convalidar esta
hipótesis usando el
software indicado
(Apéndice ) y en primer Figura 17.0.1
lugar obtendrá la nube de
puntos también
denominado el gráfico de
dispersión o gráfico de
regresión adjunto. En el
mismo se observan los
puntos que indican las observaciones y una línea que es la representación
gráfica de la ecuación de regresión (Y = a + bX) aplicada a los datos mostrados.
Esta línea se muestra en todos los gráficos de este tipo.

- 159 -
Cuando, como ahora, se estudia con el modelo de regresión lineal, aparece
una recta. En otros tipos de regresiones la línea puede ser una curva.
Precisamente la inspección del diagrama de puntos permite tener una idea
del tipo de relación que conecta las variables. (3, 23, 37)

La línea del gráfico representa la relación teórica entre X e Y. Pero la más


importante es la relación empírica que se evalúa observando que cuanto más
se acercan los puntos (datos empíricos) a la línea (teórica), mayor será la
correlación entre X e Y.

Luego podrá calcular el coeficiente de correlación. Con los datos de esos 31


casos obtiene los siguientes valores:
r = 0.7398 (IC 95% : 0.5224 - 0.8669) ; p < 0.001

Como observa es un coeficiente con intervalos de confianza amplios, pero


con el mismo signo ( o sea que es “estadísticamente significativo).
Pero la información más completa será provista por el análisis de regresión,
calculando los coeficientes a y b.
El mismo software que produjo el gráfico permite acceder a los resultados
del análisis de regresión que, en una salida de computadora, se presentan como
se ve en la fig. 17.0.2

Observando la salida se puede construir la siguiente ecuación:

Y = -5275.258 + 217 X
es decir:

Peso del recién nacido = -5275.258 + 217 x Edad Gestacional

Para hacer la “semiología” de esta salida de computadora, comenzamos


por la interpretación del coeficiente b (pendiente o slope) que , en este caso,
tiene un valor de 217.

- 160 -
17. 1 - Interpretación del coeficiente “b” en el análisis bivariado
Según la ecuación fundamental de regresión,
Y = a + bX
pero si b fuera igual a cero resultaría
Y = a + 0 X = a+ 0 = a
con lo que se obtienen dos conclusiones:
a - Y sería una constante, no una variable
b - No existe correlación entre X e Y
Se observa que la pendiente (b) se interpreta de un modo similar que el
coeficiente de correlación. Y esa similitud se extiende, porque tiene signo,
significación y además mide el peso de X sobre Y .
Aplicando lo aprendido en el capítulo sobre correlación, se obtienen las
siguientes reglas de interpretación de la pendiente
a - Significación
Se evalúa a través del pvalor y de los intervalos de confianza que deberían
acompañar los resultados ( fig. 17.0.2)
De manera general se puede decir que:
a1 - Si el pvalor es menor que 0.05, el coeficiente de regresión b es
significativamente distinto de cero lo que, coloquialmente se suele expresar
como que : “es significativo”.
a2 - Si ambos intervalos de confianza del 95 % tienen el mismo signo, se
interpreta que la pendiente b, “es significativa”.
De esta significación se deduce que (si se justifica biológicamente) los
valores de la variable X tienen “influencia” sobre los valores de la variable Y.
Si no se establece significación, entonces se deduce que la variable X no
tiene relación con la variable Y.
En el caso descripto en la fig. 17.0.2 los intervalos de confianza del 95 % para b
estarían comprendidos entre 142.046 y 291.954, tienen ambos el mismo signo y el
pvalor < 0.001 por lo tanto es menor que 0.05. Se desprende que la pendiente tiene
un valor estadísticamente
diferente de cero y por lo tanto
la Edad Gestacional tiene
“peso” sobre el Peso del recién
nacido.
En la figura 17.1 puede
observar una salida de otro
análisis de regresión donde no
aparecen intervalos de
confianza, pero se informa el
error estándar que permitirá su
cálculo. (ap.11.4.1) Se intentaba establecer si la Talla podría funcionar como predictor de los
valores de Colesterolemia. El pvalor = 0.0649 > 0.05. La pendiente tiene un valor NO
diferente de cero y por lo tanto la Talla no tiene “peso” sobre la colesterolemia.

- 161 -
Importante: en el caso del análisis bivariado la significación del coeficiente de correlación
entre X e Y , es igual que la significación del coeficiente b. (23)

17. 2 - Interpretación del coeficiente “a” en el análisis bivariado


La ordenada al origen o constante, tiene importancia sólo si b es significativa.
Por ejemplo en la fig. 17.1 se observa que la a (CONSTANT) se asocia con un valor
de p < 0.0001 y por lo tanto es muy “significativa”. Pero esto no es importante ya que
la pendiente (TALLA) no había sido “significativa”.
Si el valor de p de la constante (a) no es significativo o sus bandas de confianza
abarcan el valor cero, ello equivale a decir que en la ecuación fundamental “a “ no es
necesaria por lo que alcanzaría con una simplificación de la misma: y = bx.

17. 3 - La Predicción es la meta

Suponga que Ud. desea desarrollar una fórmula para predecir la talla de un niño
(variable Y), empleando para ello alguno de los siguientes predictores:
[Problema 17.3]
X1 = T alla Del Padre,
X2 = T alla De La Madre,
X3 = Número Del Calzado Del Tío Del Paciente,
X4 = Peso De Nacimiento Del Niño.
Primero hace un análisis de regresión tomando en cuenta solamente la T alla Del
Padre (X1). Obtiene la siguiente ecuación (ficticia)
Y = 60 + 8.9 X1
Uno de los coeficientes de regresión (la pendiente) vale 8.9.

Ud. formula la hipótesis nula: "la pendiente b=0" y establece alfa = 0.05. Usando un
programa estadístico calcula p = 0.001. Los resultados se pueden disponer de esta manera:

variable pendiente p
X1 b1= 8.9 0.001
Dado el nivel de significación y como p es menor que el mismo, Ud. decide que la
pendiente es significativamente distinto de cero. (ap. 17.1) Ahora Ud. tiene información
por la cual puede afirmar que la variable T alla del Padre (X1) tuvo peso en la predicción de
la variable T alla del Hijo (Y). Decide repetir la experiencia con las variables X2, X3 y X4 por
separado y obtiene los siguientes pendientes y su significación:
variable pendiente p
X2 b2= 7.5 0.02
X3 b3= 6.89 0.03
X4 b4= 0.83 0.37

Las conclusiones para X2 y X3 son muy parecidas que para X1.


Pero en el caso de X4 la pendiente resultó ser estadísticamente no significativa
ya que el valor de p = 0.37 fue mayor que 0.05.
Esto equivale a informar que no existió correlación entre X4 e Y, por lo tanto que el
peso de nacimiento del niño no fue un buen predictor de su talla. (35)

- 162 -
18 - ESTIMACIÓN DE COEFICIENTES DE CORRELACIÓN
REGRESIÓN - Parte III: Introducción a la regresión
múltiple y al análisis multivariado
A alguien se le ocurrió que si en vez de usar por separado cada una de las
variables, se usaran todas juntas las que fueron significativas, la capacidad de
predicción sería mayor !!!! Y nació la regresión múltiple.

El razonamiento lógico de la regresión múltiple (RM) es el mismo que en el


caso de la regresión simple. Allí empleaba una variable X para predecir el
comportamiento (los valores que alcanzaría) una variable Y.

Con frecuencia se intercambian los términos regresión múltiple y análisis


multivariado, cuando en realidad son diferentes. Análisis multivariado es un
término que se refiere a cualquier procedimiento estadístico que permite
estudiar relaciones entre varias variables, simultáneamente, por ejemplo el
análisis de variancia o el de covariancia (3,23). Por supuesto que también la
RM es un análisis multivariado pero no es el único.

En la RM trata de usar varias variables X (X1, X2, X3....etc) para predecir


el comportamiento de una variable Y.

Suponga que Ud. desea resolver el [problema 17.3] y desarrollar una fórmula
para predecir la talla de un niño (variable Y), empleando para todos los predictores
significativos estudiados : X1 = T alla Del Padre, X2 = T alla De La Madre, X3 =
Número Del Calzado Del Tío Del Paciente.
Si Ud. hubiera manejado una sola variable X, la ecuación general sería: Y = a +
bX pero como tiene en juego tres variables X, la fórmula general se transforma
hasta quedar del siguiente modo:
Y = a + b1X1 + b2X2 + b3X3

Nuevamente a, b1, b2 y b3 se denominan coeficientes de regresión. Imagine


que hace los cálculos (solicitándolos a un especialista o usando el soft señalado
en el apéndice) y resulta que la talla del niño expresada en cm se puede predecir
empleando la siguiente fórmula (ficticia):

[10] talla (Y) = 2.95 + 7 X1 + 3.5 X2 + 0.01 X3

Los coeficientes y la ecuación de regresión provenientes de una RM


permiten obtener información con fines predictivos, ponderativos, heurísticos
y comparativos, hecho que comprobará a través de los siguientes experimentos
realizados usando RM.

- 163 -
18.1 - Experimento 1
En una población y a los fines demográficos se testeó la hipótesis que el
porcentaje de varones que leen (X1) influye sobre la mortalidad infantil (Y)
Se recogieron los datos y se aplicaron las herramientas informáticas señaladas en
el Apéndice. Los resultados se exponen en la figura 18.1

Aplicando lo aprendido en regresión bivariada podrá deducir los siguientes


enunciados:
a - la variable dependiente (Y) es la MORTALIDAD INFANTIL
b - la variable independiente es el porcentaje de VARONES (X1) que leen.
c - el coeficiente b es negativo y significativo (IC95% = (- 1.756) -(- 1.275) ;
p < 0.0001).
d - la conclusión sería que la evidencia disponible apoya la hipótesis que
a mayor porcentaje de varones que leen en una población menor es la
mortalidad infantil.
e - como detalle complementario, la capacidad predictiva de la ecuación
obtenida en este estudio se mide con R² cuyo valor es de 0.651. ( ver
recuadro en la figura y ap. 16.3.4).

18.2 - Experimento 2
En la fig. 18.2 se muestra el resultado del mismo análisis hecho cambiando
la variable independiente a porcentaje de mujeres que leen y las conclusiones
son similares: la evidencia apoya la hipótesis que a mayor porcentaje de
MUJERES (X2) que leen, menor es la mortalidad infantil en el país.

18.3 - Experimento 3 : combinación de dos variables en el análisis


Pero el hallazgo verdaderamente interesante aparece cuando, en cambio
de regresión bivariada, se aplica regresión múltiple, usando como variables
independientes las dos mencionadas : porcentaje de hombres (X1) y de
mujeres que leen (X2).

- 164 -
Al mirar los resultados en la fig. 18.3 comprueba que X2 sigue teniendo un
coeficiente significativo (b 2= -1.207; p< 0.0001), mientras que X1 ha perdido
significación (b 1= -0.114; p = 0.788).

Este fenómeno se interpreta del siguiente modo: en presencia de la variable


X2 la variable X1 perdió significación. El motivo sería que la información que
aportaba X1, ya estaba “contenida” en la X2 y por lo tanto es innecesario que
figuren ambas en la ecuación de regresión. (3,23,83)

Una interpretación sociológica podría ser que las mujeres y hombres


ilustrados eligen parejas también ilustradas.
A ello se puede agregar que en realidad el grado de ilustración del padre, es
mucho menos importante que el de la madre, quien es la que queda,
habitualmente, al cuidado del niño y la que debe seguir (leer) las instrucciones
que los agentes de salud le hacen llegar.
Veamos ahora la culminación del proceso con un cuarto y quinto experimentos
18.4 - Experimento 4
En otro experimento se testeó la hipótesis que el producto bruto interno
por cápita (X3) y la ingesta diaria de calorías (X4) tienen influencia sobre la
mortalidad infantil. Los resultados se muestran en la figura 18.4

- 165 -
Se comprueba que ambos coeficientes b fueron significativos, con lo que se
llega a la conclusión que ambos factores influyen sobre la variable Y, de manera
independiente.

18.5 - Experimento 5 : combinación de tres variables en el análisis


Sabiendo que el porcentaje de mujeres que leen, el ingreso bruto per cápita
y la ingesta diaria de calorías tenían influencia sobre la mortalidad infantil, se hizo
una RM colocando los tres factores en la misma ecuación. Los resultados que se
leen en la figura 18.5 muestran que el agregado del porcentaje de mujeres que
leen hizo perder significado al producto bruto interno, señalando que, para la
variable mortalidad infantil, ambos factores no son independientes como lo es la
ingesta calórica diaria.

18.6 - Aplicaciones y usos de la regresión


A partir de estos experimentos podré exponer los usos que tiene la regresión,
especialmente la RM. Podrá usar los resultados de una regresión a los fines predictivos,
ponderativos y heurísticos.

18 .6.1 Uso predictivo


Con la ecuación [1] (cap. 17) podía llegar a predecir el peso de un niño en particular,
conociendo su edad en años.

- 166 -
Por ejemplo: consultado por un niño de 4 años, puede predecir que su peso está
alrededor de los 18 Kg. El poder predictivo de una ecuación, es mayor a medida que
se incrementa el coeficiente de determinación, tal como explicamos en el ap. 16.3.4

18.6.2 Uso ponderativo


En una regresión simple en cierto modo el valor de b, le indica el peso que X tiene,
para determinar Y.
Imagine que desarrolla una formula para calcular la talla que tendrá cuando sea
adulto, un niño varón (y) a partir de la talla paterna (x1) y la talla materna (x2 ). Obtiene
los datos y aplica los procedimientos estadísticos necesarios. Al final produce la
siguiente ecuación (ficticia):

Y = -13 + 2 X1 + 1 X2
dónde y= Talla que tendrá de adulto el niño

Observe que b1 = 2 mientras que b2 =1. La relación entre b1 y b2 es 2/1. Con estos
datos Ud. está en condición de informar que la talla del padre sería dos veces más
importante que la talla de la madre, para explicar la talla final del pequeño.

Pudo hacer esto porque ambas variables X1 y X2 estaban medidas en las mismas
unidades. Pero NO ES común que todas las variables independientes se midan en las
mismas unidades y por lo tanto, en un análisis multivariado con variables X medidas en
diferentes unidades el valor de cada b NO ES PROPORCIONAL al peso que cada X tiene
sobre Y.

Hay un proceso matemático por el cual se llevan todas las X a las mismas
unidades, entonces cada coeficiente b representa el peso de su X sobre la variable.
El proceso se denomina ESTANDARIZACIÓN DE COEFICIENTES. Finalizado el mismo los
coeficientes b representan el peso que su correspondiente variable X, tuvo sobre
la variable Y en esa muestra. (39)

Puede observar coeficiente estandarizados en las figuras 18.1 a 18.5 de los


experimentos. En el experimento 18.4 se ve que la ingesta diaria de calorías tiene un
coeficiente estandarizado de (- 0.594) mientras que el producto bruto interno per cápita
tiene un coeficiente estandarizado de ( -0.244). Con ello puede afirmar que la ingesta
diaria de calorías tiene prácticamente el doble de peso que el PBI en su influencia sobre
la mortalidad infantil. (34)

18.6.3 Uso heurístico


También puede emplear el análisis de regresión múltiple para descubrir relaciones
entre variables interpretando la significación de los coeficientes de regresión.(4)
En los experimentos 18.1 y 18.2 descubrió que por separado el porcentaje de hombres
que leen (X1) y el de mujeres que leen (X2) tienen coeficientes significativos respecto de la
mortalidad infantil (Y). O sea que, por separado, X1 y X2 son relevantes para la variable Y.

- 167 -
En el experimento 18.3 descubrió que “en presencia del porcentaje de mujeres que
leen (X2), el de varones (X1) que leen perdió peso sobre la mortalidad infantil (Y)”.
De este modo no sólo sabe que hay relación entre X1 e Y, y entre X2 e Y, sino que
además establece que hay una relación entre X1 y X2, por la cual, X2 “abarca” la
información provista por X1 y por lo tanto simplifica el entendimiento del fenómeno.
Note cómo se refleja esta situación en el coeficiente de determinación múltiple
ajustado. En la fig. 18.1 donde X es el porcentaje de hombres que leen (X1), el R²
ajustado es igual a 0.651 En la fig. 18.2 donde X es el porcentaje de mujeres que leen
(X2), el R² ajustado es igual a 0.708, señalando que el peso de X2 es ligeramente
superior al de X1. Pero en la fig. 18.3 donde se usan X1 y X2, se ve que el R² = 0.705,
prácticamente el mismo que en la fig. 18.2 o sea que la combinación de ambas
variables casi no modifica el R². Por lo tanto ambas explican la misma cantidad de Y.
Pero la 18.3 emplea la variable X1, mientras que la 18.2 no !!!.
A través del uso del software indicado se pueden incluir un gran número de
variables X, analizarlas respecto de una Y, y SELECCIONAR CON ESTE PROCEDIMIENTO
CUALES VARIABLES SON RELEVANTES Y CUALES O. Así es como puede descubrir
relaciones insospechadas hasta el momento.
Al comparar las figuras notará que:
a - el coeficiente de regresión para X1 aisladamente (fig. 18.1 ) era -1.515
b - el coeficiente de regresión para X2 aisladamente (fig. 18.2 ) era -1.129
Cuando reunimos X1 y X2 en la ecuación de la fig. 18.3, los coeficientes de regresión
para cada X han cambiado. Para X1 pasó a -0.114 y para X2 pasó a -1.207.
Esto se explica porque el peso de cada variable ahora no sólo está en relación con
la Y sino también con el peso de las demás X.
También la significación de los coeficientes para cada X es relativa al resto de las X en
las ecuaciones. En una ecuación X1 puede ser significativa y en otra no, dependiendo
de la presencia de otras X. Por ej. en la fig. 18.3, X1 NO AGREGA INFORMACIÓN A LA
QUE PROVEE X2. Por lo tanto no tiene sentido que las use combinadas. (35)

El análisis de regresión múltiple o multivariado ha adquirido una gran trascendencia.


Esto se debe a que:
a - actualmente dispone de los instrumentos necesarios para realizar rápidamente
los cálculos. No sólo computadoras, sino programas al alcance de cualquier laboratorio
de investigación incluyendo el suyo. (Apéndice)
b - según algunos viene a resolver el problema del control experimental
difícil de manejar en Clínica Médica, cambiándolo por el concepto de control
estadístico de variables, transformándolas en constantes a través del cálculo y
no por selección de individuos. (39)
c - hay una gran variedad de modelos que se adecuan prácticamente
a cada necesidad del investigador médico. Por ejemplo: - regresión logística
binaria para variables dicotómicas; - regresión de riesgo proporcional para
supervivencia ; - regresión múltiple escalonada; - regresión polinomial;etc.

En 1998 decía que “por estos motivos considero que el análisis multivariado será el
procedimiento estadístico más usado en los trabajos a publicar en años venideros” y
hoy agregaría que continuará siéndolo, a partir de nuevos algoritmos que se están
diseñando. Pero ni el más elaborado de los modelos estadísticos, es capaz de establecer
una relación de causa-efecto.

- 168 -
19 - RELACIÓN CAUSA Y EFECTO: PROBLEMAS Y SOLUCIONES
Cotidianamente Ud escucha afirmaciones tales como:
- El exceso de flúor es causa de manchas dentales.
- El Síndrome de Pierre Robin tiene un origen genético.
- La ingesta de dulces produce caries dentales
- La ingesta de glicerina elimina los síntomas del glaucoma agudo

En todas ellas aparece en forma explícita o implícita la idea que algo ( causa)
produce otra cosa (efecto). En Medicina, cuando nos referimos a las causas de
una enfermedad, hablamos de la ETIOLOGÍA.

19.1 - CAUSAS, EFECTOS Y SU RELACIÓN

La Real Academia Española define "efecto" como "lo que sigue por virtud
de una causa" y "causa" como "lo que se considera fundamento u origen de algo.
Evidentemente, este "algo" es el "efecto". (24)
De este modo con la interpretación lexicográfica Ud entra en un círculo vicioso:
las causas, producen efectos y los efectos son producidos por las causas.
No puede definir "efecto" sin hablar de causa y viceversa. Ambos conceptos
están relacionados de tal modo que es imposible separarlos. Pero ¿ para qué quiere
separarlos ?
"Muerto el perro, se acabó la rabia", reza el refrán popular. Ud. se interesa
tanto en aislar las causas porque supone que si las anula, también puede anular el
efecto. Es decir que logra el control máximo al que puede aspirar.
Pero si quiere convencer a la comunidad científica que controla una causa y
por lo tanto su efecto, no le alcanza con mostrar que algunas veces lo logra y
otras no. Las hipótesis probabilísticas ya no le sirven. Ahora necesita hipótesis
que se corroboren el 100 % de las veces. Cuando estas hipótesis se formulan con
motivo de una relación causa-efecto, las denominaré hipótesis determinísticas.
Ninguno de los esquemas conceptuales tratados hasta el momento sirven
para obtener este tipo de información. De hecho, no existe procedimiento
estadístico que establezca una relación causa efecto. (3, 6, 7, 37)
El problema sería sencillo si a cada efecto le pudiera asignar una sola causa.
Pero no es así.
Analice un accidente en la ruta: la causa podría ser error humano o estado
del camino o de los vehículos, o todas juntas. T al vez fue un intento de homicidio
dirigido a alguno de los conductores.

- 169 -
La tarea de deslindar claramente entre distintas causas posibles, buscando
una sola, es una tarea difícil, cuando no imposible.
Pero será más fácil si adopta la concepción que le propongo. T ome dos
eventos de su interés que Ud. cree que están conectados. Por ejemplo la ingesta
de dulces y las caries dentales. Después formule una hipótesis según la cual,
afirma cuál de los eventos es la causa del otro. Por ejemplo afirme que la ingesta
de dulces es la causa de las caries dentales.
De este modo puede redefinir la relación causa-efecto (RCE) diciendo que
es una hipótesis aplicable a algunas partes de la realidad, por el cual "algo"
denominado CAUSA, se considera como agente determinante de otro "algo",
denominado EFECTO. Esquemáticamente:

C —–––––> E
Por supuesto que este tipo de relación constituye una simplificación del
problema. Lo más probable es que no haya causas puras pero, para poder
comprender la realidad, Ud debe simplificarla.
No se preocupe. Esta simplificación no es exclusiva del análisis de relaciones
causa-efecto. Cuando estudiaba una regresión elegía solamente ciertas variables
independientes, no todas las variables independientes. Lo mismo cuando hace
comparaciones (por ejemplo del tipo, el tratamiento A es mejor que el
tratamiento B) en realidad sólo compara algunos aspectos posibles. Por ejemplo
en la comparación de curvas de sobrevida sólo toma en cuenta sobrevida, pero
no calidad de vida.

Será difícil hallar una investigación en la que se usen todas las variables
independientes o se comparen todos los aspectos posibles. Esto se debe, en parte, a
que el conocimiento de un fenómeno está limitado por el tiempo y el lugar en el que
se realiza, situación en la cual sólo se conocen algunas cosas y no todas. Además es
poco probable que se llegue a conocer en forma exhaustiva todas las posibles causas
de un fenómeno.
Como frente a cualquier otro la solución operativa de un problema
de relación causa-efecto (o sea de una hipótesis determinística) comienza
por el esquema conceptual.

19.2 ESQUEMA CONCEPTUAL PARA RESOLVER PROBLEMAS DE RCE


El esquema de operatoria para resolver problemas de RCE es el más
sencillo de todos. Ud. deberá concretar tres etapas:
1 - Construir una teoría explicativa.
2 - Verificar (contrastar) la teoría.
3 - Formular conclusiones.

- 170 -
19.3 CONSTRUCCIÓN DE TEORÍAS EXPLICATIVAS
Desde el punto de vista científico, y si aceptamos como definición de
sistema un conjunto de partes que interactúan entre sí (49), una teoría es
un sistema de hipótesis. Como sinónimo usaremos el término “modelo teórico”.

Una vez que una hipótesis o teoría ha sido contrastada, y corroborada muchas
veces, los científicos pueden referirse a ellas designándolas con el nombre de LEYES.
Dado el carácter provisional del conocimiento científico, la aparición de situaciones
refutadoras puede hacer que la comunidad científica replantee el título de ley,
conferido a una hipótesis.

Ud. estudia conjuntos de fenómenos similares para poder extraer


generalizaciones, que luego usará para predecir en casos individuales de
características parecidas a los estudiados.
Por ejemplo, analiza casos de insuficiencia cardíaca, y obtiene un conocimiento
que luego usa en situaciones en las que un cierto paciente presenta insuficiencia
cardíaca: es decir, que las generalizaciones obtenidas al estudiar la casuística
permiten generar explicaciones que se aplicarán a los casos particulares.

Pero las generalizaciones estadísticas tienen una serie de desventajas,


la más grande es que Ud. nunca "sabe" que es lo que ocurrirá con un paciente
en particular. Y Ud. (a menos que sea sanitarista) toma decisiones con cada
paciente a la vez.
Una ventaja del uso de una hipótesis determinística corroborada es que, cuando
la aplica, Ud. tiene un alto grado de certidumbre de lo que ocurrirá. Ud."sabe"
que si un varón hemofílico y una mujer normal homocigota, tienen una hija, ella
no tendrá problemas de coagulación. (18)

Cuando Ud. formula una hipótesis, siempre lo hace en un contexto,


en el que ya se dan por corroboradas muchas otras hipótesis. (8, 31). Si
afirma que el glaucoma cura con glicerina, da por aceptado que: existen
pacientes con glaucoma, ésta enfermedad está localizada en el ojo, la glicerina
es inocua, su ingesta produce diarrea, etc. O sea que, incluso cuando Ud.
formula una sola hipótesis, está articulando una teoría.
A pesar de eso, una cosa es que formule una hipótesis para tratar de
corroborarla y otra ensamblar varias hipótesis para construir una teoría. La
formulación de hipótesis y mucho menos la construcción de teorías aún
no están regladas. Puede estar seguro que no hay reglas para ello. Si las
hubiera todo el mundo estaría construyendo teorías.
Dice Galtung : "La dificultad en cuanto a la formulación de una teoría,
consiste en que nadie sabe realmente como llevarla a cabo" (26)

- 171 -
Creo que la construcción de una teoría se parece a una aventura cruzando
un país inhóspito. Se puede analizar cuando se ha concretado (como suelen
hacerlo los epistemólogos cuando disecan la teoría ya formulada), pero salvo
sobre los primeros pasos, nadie puede decirle exactamente qué hacer porque
nadie sabe qué ocurrirá.
Claro que hablar sobre los primeros pasos, ya es un buen comienzo.

19.3.1 Actividades preliminares


Comience por desprenderse de algunos prejuicios. El primero consiste en
pensar que sólo algunos son capaces de inventar teorías y que Ud no pertenece
a este grupo de elegidos. Es cierto que sólo algunos han inventado teorías fértiles,
pero nadie sabía de antemano quienes. Así que no se autodescalifique sin haberlo
intentado.
Otro prejuicio es considerar que una teoría debe ser un sistema complejo y,
cuanto más complejo mejor.
Una teoría tiene estadios que van del preteorético al matématico, por lo que
la simpleza o complejidad que tenga, dependerá tanto de la ciencia con la que
trata como del conocimiento que Ud posee al construirla.
Cualquiera que conozca bien un problema, es capaz de inventar una teoría
que pueda explicarlo. Si luego la teoría resulta verificada y, en última instancia,
fecunda, esto ya es harina de otro costal. Mucha gente ha construido teorías sin
tener la formación epistemológica necesaria para saber cómo se analiza, cuáles
tipos de hipótesis pueden componerla, etc.
El análisis epistemológico es un resorte del filósofo de la ciencia, destinado
más al estudio del producto obtenido, que a dirigir futuros proyectos de
construcción.
Así que para comenzar le alcanza con una humilde hipótesis, como la de una
relación causal entre ingesta de dulces y caries.
Bunge (8) considera que la construcción de teorías científicas no es una
actividad dirigida por reglas, pero sí controlada por reglas que no se logra
manipulando datos (en forma personal o a través de máquinas), sino inventando
una esquematización ideal del objeto de la teoría, complicándola luego en forma
progresiva.
Entre los consejos definidos para teorizar, propone:
a - Tener un problema planteado en forma precisa.
b - Tener información estadística sobre el campo elegido.
Ud. inventa una hipótesis determinística cuando ya ha pasado ciertas etapas. Ha
resuelto cuantificaciones, correlaciones y comparaciones relacionadas con el
problema. Por ejemplo sabe que la sangre proveniente del 98 % de las personas
coagula y que los varones tienen trastornos de la coagulación más frecuentemente
que las mujeres. Pero no sabe porqué. Este es el momento de teorizar.

- 172 -
Si lo único que desea es analizar un conjunto de datos, recuerde que el
procedimiento estadístico es el más adecuado. Si no, creerá que está construyendo
una teoría, cuando en realidad está ajustando un conjunto cualquiera de hipótesis
para explicar aquello que ha registrado.
c - No esperar para teorizar hasta el momento en que el exceso de datos
confunda demasiado.
d - Elegir como hipótesis fundamentales conceptos teóricos.
Para justificar lo que es observable ( por ejemplo una correlación entre sexo y
alteraciones de la coagulación) le alcanza con la Estadística.
Si va a formular una teoría trate que sea una interpretación de lo que está
ocurriendo.
Por ejemplo: Sabe que hay factores que dirigen la coagulación y que muchos
factores se heredan. En este momento inventa su primera hipótesis sobre la
transmisión de la enfermedad ligada al sexo, que es un concepto teórico.
e - Rehuir la inescrutabilidad (formulación de hipótesis no verificables)
Por ejemplo NO formule una hipótesis como: "la hemofilia es un castigo de los
dioses que recae sobre los hijos, por los pecados cometidos por sus padres".
f - Mantener una compatibilidad razonable con las teorías bien corroboradas.
(Vea el ap. 21.4 sobre coherencia externa)
g - No elegir hipótesis de las que pueda deducirse poco o nada
h - Elegir hipótesis unidireccionales.
Estas recomendaciones, sigue Bunge, servirán como lineamientos generales, pero
recuerde que no hay recetas para construir teorías.
Mi sugerencia concreta es que, cuando tenga suficiente información estadística, comience
su teoría. Tengo la impresión que el mejor momento para comenzar a construir una
teoría es aquel en el que se ha establecido formalmente que una variable es factor de
riesgo de un supuesto efecto. Formule al menos una hipótesis determinística y pruébela.
Lo más probable es que funcione a veces y otras no, pero siempre puede mejorarla, como
veremos luego.
El instrumento para la construcción y contrastación de teorías determinísticas
es el método hipotético deductivo o método de la hipótesis, (5,31) cuyo uso
pasamos a examinar.
19.4 MÉTODO HIPOTÉTICO-DEDUCTIVO (MHD)
La reglas que debe seguir para aplicar el MHD son muy sencillas (8, 31), como
le muestro a continuación:
1º - Formular una hipótesis (H)
2º - Suponer que H es verdadera
3º - Deducir cuáles serían las consecuencias observacionales (CO)
4º - Establecer los criterios de corroboración o refutación
Si las CO se producen en los hechos, corroborar.
Si las CO no se producen en los hechos, refutar.
5º - Establecer si las CO, se producen en los hechos
6º - T omar decisión: corroborar o refutar H

- 173 -
El proceso por el cual se determina si las CO se producen en los hechos,
enumerado en quinto lugar, recibe el nombre de CONTRASTACIÓN. (8, 31) Si las CO
concuerdan con los hechos, se dice que la hipótesis se ha corroborado, de lo
contrario se dice que se ha refutado.

En el siguiente ejemplo clínico se muestra el funcionamiento del MHD : lo


consultan por un paciente que no orina desde hace 24 hs. Ud. no puede observar
directamente a su riñón y determinar si hay falla renal. Entonces pone en marcha
el MHD:
1º - Formula una hipótesis (H): "El paciente tiene falla renal"
2º - Supone que H es verdadera
3º - Deduce cuales serían las consecuencias observacionales (CO)
Si H es verdadera, el paciente debe presentar elevación de la
tensión arterial y miembros inferiores hinchados (edema).
4º - Establece las reglas de corroboración o refutación
Si las CO se producen en los hechos, corroborar.
Si las CO no se producen en los hechos, refutar.
5º - Establece si las CO, se producen en los hechos
Usando un tensiómetro determina la tensión arterial.
Por observación directa determina la presencia de edema.
6º - T oma decisión: corrobora o refuta H

Seguramente habrá reconocido que este es el mecanismo habitual de


razonamiento que usa para llegar a un diagnóstico en clínica. Y no está equivocado.
hace muchos años que piensa y actúa empleando MHD, sólo que ahora sabe qué
nombre tiene.

19.5 Operatoria para construir un modelo teórico de relación causa - efecto


Empleando lo enunciado en el apartado anterior le propongo una manera
de aproximarse a construir una teoría explicativa de una RCE
1º - Formular una hipótesis (H): aquí sería
“ C es la causa de E”
2º - Suponer que H es verdadera
3º - Deducir cuáles serían las consecuencias observacionales (CO)

Aceptando una versión simplificada de la realidad hay tres consecuencias


observaciones posibles:
CO1 : cada vez que se dio C luego se dio E.
CO2: cada vez que faltó E, no había antecedentes de C
CO3: cada vez que se bloqueó C, no se produjo E.

- 174 -
4º - Establecer las reglas de corroboración o refutación
Si las tres CO se producen en los hechos, corroborar.
Si alguna de las CO no se produce en los hechos, refutar.
5º - Establecer si las CO, se producen en los hechos
6º - Tomar decisión: corroborar o refutar H

Note que:
- en la REGLA DE ACEPTACIÓN DE UNA RCE (inciso 4º) se indica que se
deben cumplir siempre todas las CO postuladas en el modelo.
- la CO3 exige que Ud. pueda experimentar para manipular la causa,
introduciéndola o extrayéndola a voluntad para comprobar que el efecto
aparece o desaparece.
Esto le generará dificultades éticas muchas de las veces que quiera validar una
RCE en seres humanos.
Siguiendo el modelo, para poder afirmar que "fumar es CAUSA de cáncer de
pulmón", debería experimentar con personas. Esto no es ético. Por este camino
NUNCA podrá establecer esta relación causal. Pero, como bien sabe, para que tome
decisiones no es imprescindible que conozca todas las causas. Alcanza con saber que
algo es un factor de riesgo para aconsejar a nuestros pacientes.

Una vez que haya construido su "teoría" deberá contrastarla.

19.6 CONTRASTACIÓN DE TEORÍAS


19.6.1 Bases racionales
El proceso de contrastación de teorías está fundado en dos conceptos
(verdad plausible y coherencia externa) (8). Para explicarlos usaré algunas
situaciones ambientadas en una ficticia obra teatral de corte policial.
Escena 1
Un detective afirma "Si Juan fue asesinado, entonces está muerto".
Acto seguido, una puerta se abre sobre un costado de la escena y aparece
Juan.
La conclusión parece contundente: " Juan no está muerto. Por lo tanto no
fue asesinado". Esta es una forma correcta de razonamiento deductivo que se
conoce con el nombre de modus tollens (20, 21).

En su profesión es posible que haya realizado razonamientos como éste:


Si el paciente tiene insuficiencia renal (IR) entonces presenta edemas.
No tiene edemas
Por lo tanto no tiene IR.
en los que Ud. refutó la hipótesis con un razonamiento deductivo correcto.

- 175 -
Escena 2
El detective afirma "Si Juan fue asesinado, entonces está muerto".
Examina la habitación y encuentra el cadáver de Juan.
Entonces razona: "Juan está muerto. Por lo tanto fue asesinado".
Ud. puede objetar que Juan pudo haber muerto por causas naturales, o
cualquier otro motivo. Pero también debe aceptar que es posible que lo hayan
asesinado.
Este es el concepto de verdad plausible, uno de los criterios para la
corroboración de una hipótesis. (8)
Llevándolo al ejemplo de la insuficiencia renal, el razonamiento sería:
Si el paciente tiene insuficiencia renal (IR) entonces presenta edemas.
Tiene edemas
Por lo tanto es posible que tenga IR.
De esta manera corroboraría la hipótesis de la insuficiencia renal.
Corroboración y refutación tienen consecuencias asimétricas.
La corroboración de una hipótesis equivale a que la acepte transitoriamente
hasta que aparezcan otros hechos que la refuten, u otras hipótesis
que expliquen mejor los hechos. Luego de la corroboración, Ud.
emplea la hipótesis como si fuera verdadera.
La refutación es absoluta, porque se apoya en un razonamiento deductivo
correcto.
El único motivo por el cual la refutación no es infalible, es porque
depende de las hipótesis presupuestas. En ese caso puede cuestionar la
refutación aunque esto no es común (8). En la Escena 1, Ud. refutó la
hipótesis, bajo la suposición que la persona que estaba viendo era Juan.
Pero si la persona que vio en realidad era un sosías de Juan, Ud. estaba
refutando incorrectamente la hipótesis de asesinato.
El segundo criterio de importancia, para la corroboración de las hipótesis es
la coherencia con otras concebidas independientemente (COHERENCIA
EXTERNA) (8)

Escena 4
El detective afirma: "Si Juan fue asesinado con un arma blanca, entonces
tiene alguna herida en su cuerpo".
Examina el cadáver de Juan y encuentra una herida de arma blanca.
Nuevamente la conclusión parece imbatible: "Juan fue asesinado con un
arma blanca".
El detective examina la habitación y queda perplejo: la habitación está vacía
y cerrada por dentro. No hay otros accesos.

- 176 -
El homicidio con arma blanca parece corroborado por un hecho (la
presencia de la herida). Al mismo tiempo es refutado por otra hipótesis
formulada antes del evento por la cual nadie (ni siquiera el homicida) podría
haber cerrado la puerta por dentro y luego desaparecer sin dejar rastros.
La hipótesis del homicidio no tiene coherencia externa.
Llevando el concepto a nuestra actividad. Suponga que un colega afirma
que la uña encarnada es una enfermedad infecciosa. Luego aporta evidencias
que existe un patrón de transmisión entre individuos que son COHERENTES
con la hipótesis de la contagiosidad de las enfermedades transmisibles
que fue formulada y corroborada ANTERIORMENTE, por otras personas
y/o en relación con OTROS problemas. Esa coherencia hace, que una
hipótesis que parecía descabellada, en un principio, ahora pueda ser considerada
seriamente. Este sería un ejemplo de coherencia externa con hipótesis "concebidas
independientemente". (ver ap. 21.4 )
19.6.2 El procedimiento de contrastación
Una vez que haya establecido las CO de su teoría deberá llevar a cabo lo que
se denomina observación pertinente (OP). A partir de la OP, se formulan
enunciados observacionales que son comparados con las CO. Y así se determina
si las CO se producen o no. Para eso puede usar la observación, la experimentación
o ambas.
Hay eventos como un eclipse solar, que ocurren independientemente de la
voluntad humana ya que nadie puede provocar o evitar un eclipse. La extirpación
quirúrgica de un tumor sólo se puede producir mediando la acción humana.
Finalmente, otros eventos se dan a veces por la voluntad humana, o casualmente,
como el corte de suministro eléctrico de una vivienda. No importa el tema de la
teoría que desarrolló seguro que se refiere a algunos de estos tipos de eventos.
Para contrastar las referidas al primer tipo (eclipse) dispone de la observación,
si es del segundo tipo (extirpar un tumor) necesita experimentación. Con el
tercer tipo (corte de energía), puede usar una u otra.
La observación científica es guiada por las hipótesis de la teoría. Para ser
válida debe ser realizable, repetible e intersubjetiva. (31)
Para verificar si "una cabeza humana recién separada del cuerpo, sigue
pensando". Ud. debería poder observar "el pensamiento" de esa cabeza. En esta
época es imposible. La hipótesis propone una observación irrealizable. No es
científica.
Dado que cada hecho en si mismo es irrepetible, la ciencia se ocupa de
"familias o clases de hechos" (eventos).

- 177 -
La erupción de un volcán en un cierto lugar y momento, es un hecho irrepetible
(acontecimiento) pero pertenece a la familia de las "erupciones volcánicas" que
constituyen un evento (41).
La repetibilidad se refiere a la observación de eventos. La intersubjetividad
se cumple si la observación puede ser realizada por distintos individuos. Por
ejemplo: luego de un traumatismo de cráneo el paciente presenta convulsiones,
esto puede ser presenciado por varios médicos al mismo tiempo.
Pero también muchos médicos han observado y podrán observar convulsiones
en pacientes con traumatismo craneano. En síntesis, una vez que haya formulado
la hipótesis determinará si sus predicciones (CO) se producen.
Puede preparar una observación propiamente dicha, en la que presencie
un fenómeno que ocurre sin su intervención, o una experimentación en la que
Ud. produce el fenómeno. El paradigma de las ciencias ha sido la Física. Por
tal motivo la experimentación se ha considerado como el procedimiento más
válido para la contrastación de teorías.
A su vez en Medicina, hay grandes dificultades para llevar a cabo la experimentación
y esto hace que muchos médicos se sientan limitados. Note que los físicos astrales se
encuentran en el mismo problema. Sólo pueden observar eclipses o movimientos de
cuerpos celestes, pero no pueden producirlos. Esto sin embargo, no significó un obstáculo
insalvable para el avance de su disciplina.

Si bien no es lo mismo observación que experimentación científica, desde el


punto metodológico ambas requieren de una puesta a punto de los elementos
necesarios para llevarlas a cabo. El planteo teórico resulta útil para el análisis, pero
al momento de hacer, nada mejor que un ejemplo práctico de aplicación del MHD.

19.7 Aplicación práctica del MHD en la construcción de teorías


Volvamos al ejemplo de las caries dentales. Suponga que construyó el
siguiente modelo:
(H) La ingesta de dulces produce caries
si H es verdadera, entonces)
(CO1) Si se ingieren dulces se tendrán caries
(CO2) Si no hay caries no se habrá ingerido dulces
(CO3) Si se detiene la ingesta de dulces se detiene la aparición
de caries
Según la regla de aceptación de la RCE, siempre deberán producirse todas las
CO. Esto significa que debería observar que el 100 por ciento, de los que ingieren
dulces tienen caries, de los que no tienen caries no ingirieron dulces y de los que
detienen la ingesta de dulces, detienen las caries.

- 178 -
Suponga que hace las observaciones pertinentes y ordena los resultados en
una tabla del siguiente modo:
Porcentaje esperado Porcentaje observado
(CO1) 100 78
(CO2) 100 75
(CO3) 100 95

Según la regla, debería decir que entre C y E no hay RCE. (versión naive del
Método Hipotético Deductivo, 31) Pero... considerando las observaciones
realizadas, el modelo resultó efectivo muchas veces como para deshecharlo en
su totalidad. En estas circunstancias parece adecuado adoptar la siguiente
conducta:
a - concluir, transitoriamente, que si C es causa de E, seguramente no es la
única causa, porque si no, el modelo se hubiera satisfecho completamente.
b - complejizar el modelo, agregando una segunda "causa" que en combinación
con la primera trate de explicar la RCE: por ejemplo la falta de higiene bucal.
En el nuevo modelo C = ingesta de dulces + falta de higiene y E = caries dentales
y tendría la siguiente forma:
(H) La ingesta de dulces y la falta de higiene producen caries
si H es verdadera, entonces
(CO1) Si se ingieren dulces y falta higiene, se tendrán caries.
(CO2) Si no hay caries, no se habrá ingerido dulces y/o se tuvo higiene.
(CO3) Si se detiene la ingesta de dulces y/o se tiene higiene, se
detiene la aparición de caries
Otra manera de hacer lo mismo sería indicar que a la hipótesis de la ingesta
de dulces, agrega la hipótesis de la falta de higiene. Así está construyendo un
modelo de teoría.
El agregado de la nueva hipótesis puede:
A - mejorar el porcentaje de éxitos en las predicciones
B - mantenerlo igual
En el caso A le sugeriría que siguiera adelante, tal vez buscando una
tercera hipótesis para agregar. La situación B le indica que a pesar de la nueva
hipótesis las cosas siguen igual. Por lo tanto debería retirarla. Es recomendable
repetir el proceso todas las veces que sea necesario, hasta obtener el sistema
de hipótesis (teoría) con mayor capacidad predictiva.

Nota: la construcción de una teoría requiere más que el simple modelo expuesto:
por ejemplo debería formular hipótesis fundamentales y derivadas. Ello está fuera
de los alcances de este libro. En 1984 (14) detallé el proceso en general y la construcción
en particular de una teoría hipotético deductivista.

- 179 -
19.8 Formulación de conclusiones luego de contrastar una teoría.
Al finalizar la o las observaciones pertinentes, Ud. habrá corroborado o
refutado su hipótesis.
Suponga, por ejemplo, que corroboró la hipótesis sobre la ingesta de dulces
y las caries. La conclusión que formule será muy sencilla, tal como:
"Las observaciones realizadas corroboran la hipótesis que la ingesta de dulces
produce caries". Del mismo modo si la refutó.
El MHD exige que las CO se produzcan siempre, si no debe refutar la hipótesis.
Ud. puede modificar esta exigencia si obtiene porcentajes de predicciones
correctas como los mostrados en el ejemplo del apartado anterior, pero no parece
haber reglas para decirle cuando abandonar su hipótesis (8)
En caso que la haya corroborado muchas veces, pero no siempre, puede decir
que los resultados obtenidos apoyan la hipótesis.
T al vez el abandono de su hipótesis sea cuestión de intuición. Pero lo más
frecuente será que emplee hipótesis ad hoc para salvar la suya.
Una hipótesis ad hoc es aquella que formula LUEGO de realizada la
contrastación con la finalidad de proteger o salvar su teoría de su refutación.
Su uso le está permitido, siempre que Ud. la pueda contrastar en forma independiente
de la que quiere salvar y que no sea contradictoria con el conocimiento aceptado. (8) Por
ejemplo, Harvey en 1628, había formulado la teoría que la sangre circulaba, llevada por
las arterias y traída por las venas, desde el corazón. Como no se percibían conexiones
evidentes entre venas y arterias, introdujo la hipótesis ad hoc que existían pequeños vasos
invisibles llamados capilares. Muchos años después cualquiera podía ver estos pequeños
vasos al microscopio . Esto es lo que quiere decir que la hipótesis es contrastable
independientemente. No hacía falta conocer la teoría de Harvey para observarlos.
Suponga que hizo una investigación y los resultados refutaron la hipótesis que la
ingesta de dulces produce caries. Ud debería refutar la hipótesis. En cambio afirma “esto
se podría deber a que los sujetos del experimento no ingirieron los dulces del modo como se
había indicado”.
Esta hipótesis es una ad hoc. Se hizo para salvar la teoría y se puede probar
independientemente ya que se puede preguntar a quienes llevaban el control del proyecto,
si efectivamente los sujetos del experimento habían cumplido con las indicaciones.

19.9 CUANDO USAR MÉTODO HIPOTÉTICO DEDUCTIVO

Si encara un estudio confirmatorio y hay suficiente información estadística


como para poder generar una teoría explicativa podrá usar MHD. Los estudios
de cohorte y de casos y controles constituyen una buena base estadística para
comenzar. Deberá construir una teoría y diseñar la observación pertinente. El
número de individuos necesarios para un experimento es poco relevante, si éste
está basado en una teoría que tiene muchas consecuencias observacionales. Una
sola explosión avala la teoría de la fisión atómica.

- 180 -
20 - BIOÉTICA E INVESTIGACIÓN CIENTÍFICA: BREVE
INTRODUCCIÓN

Considerando que el tema es Investigación Científica en Medicina, y que los


profesionales de la salud estamos comprometidos por el juramento hipocrático
o sus variantes, éste no debería ser motivo de análisis.
Hay muchos aspectos que deben ser considerados. Por primera vez
hubo una reunión sobre el tema en Helsinski en 1955, luego en T okio
en 1980, además de infinidad de cursos, simposios, seminarios, etc. En
cada caso siempre se trató de mejorar la reglamentación realizada la vez
anterior.
El ordenamiento que le ofrezco, es una adaptación de International
Ethical Guidelines for Biomedical Research Involving Human Subjets, producido
en Ginebra en 1993 por el Council for International Organizations of Medical
Sciences (CIOMS) (30) que cubre todos los aspectos considerados relevantes...
hasta el momento.

20.1 CONSENTIMIENTO INFORMADO


20.1.1 Información esencial para los probables sujetos de investigación
Al pedirle a una persona que participe de una investigación, Ud.
como INVESTIGADOR, debe proporcionarle la siguiente información en
un lenguaje que sea capaz de comprender:
- Que lo invita a participar de la investigación, como sujeto.
- Cuáles son los objetivos y métodos del proyecto.
- Cuánto tiempo necesita que participe.
- Cuáles son los beneficios que puede esperar como resultado de la
investigación.
- Cuáles son los riesgos previsibles o molestias que puede esperar
como resultado de la investigación.
- Si dispone de procedimientos o vías de tratamiento alternativas que
podrían ser tan ventajosos como aquellos a los que será sometido
a prueba en la investigación.
- Cómo se guardará la confidencialidad de los registros en los que
aparece identificado.
- Hasta dónde es Ud. responsable si se da el caso, de tener que
proveerle servicios médicos.
- Que la terapéutica para los daños que puedan relacionarse con
la investigación, le será suministrada en forma gratuita.
- De cuál modo serán compensadas el sujeto o sus familiares o
personas a cargo si muere o queda discapacitado en relación con
la investigación.
- Que es libre de negarse a participar y para abandonar su participación en
la investigación en cualquier momento, sin que se lo sancione de
ninguna manera.

- 181 -
20.1.2 Conducta del investigador frente al consentimiento informado
Respecto del candidato a participar en la investigación, Ud. deberá:
- proporcionarle plena oportunidad y estímulo para plantear preguntas;
- no inducirlo a participar decepcionándolo o intimidándolo;
- pedirle el consentimiento luego de cumplir con lo propuesto en el ap. 20.1.1
y haberle dado oportunidades suficientes para considerar si participará o no.

20.1.3 Consentimiento informado de los sujetos


Cumplidas las reglas enunciadas en 20.1.1 y 20.1.2 estará en condiciones
de obtener el consentimiento informado de la persona que potencialmente
participará de la investigación. Si ésta no puede darlo, (niños, deficientes
mentales) deberá obtener el de un apoderado o representante autorizado.
Como evidencia del consentimiento informado, obtendrá la firma de un
formulario por cada participante. Lo renovará si se producen cambios en
las condiciones o procedimientos de la investigación.

20.1.4 Situaciones especiales


20.1.4.1 Investigaciones que involucran a niños
Sólo podrá involucrar a niños en una investigación si Ud. está seguro que:
- la investigación no puede desarrollarse igualmente sobre adultos;
- el propósito de la investigación es obtener conocimiento relevante para
las necesidades de salud infantil;
- ha obtenido el consentimiento del niño , en la medida de su capacidad
de decidir; en este caso la negativa del niño debe ser respetada siempre,
a menos que, por el protocolo de la investigación, el niño vaya a recibir
una terapéutica para la cual no existe una alternativa médicamente aceptable;
- el riesgo que puede presentarse es bajo y proporcionado a la importancia
del conocimiento que se ganará y
- las intervenciones destinadas a proporcionar un beneficio terapéutico son,
por lo menos, tan ventajosas para el niño como individuo como cualquier
otra alternativa disponible.
Considere que las exigencias para personas con trastornos mentales
o de comportamiento son las mismas que para el caso de los niños,
mutatis mutandii.

20.1.4.2 Investigaciones que involucran a sujetos en comunidades


subdesarrolladas
Antes de emprender una investigación que involucre a sujetos en una
comunidad subdesarrollada, sea en países desarrollados o en vías de desarrollo,
se debe asegurar que:

- 182 -
- la investigación no puede llevarse a cabo razonablemente bien en comunidades
desarrolladas;
- la investigación es sensible a las necesidades de salud y a las prioridades
de la comunidad en la cual se realizará;
- se harán todos los esfuerzos para asegurar de que el consentimiento
del sujeto individual sea informado y
- las propuestas para la investigación han sido revisadas y aprobadas por
un comité de ética que tiene entre sus miembros o consultores a personas
que están completamente familiarizadas con las costumbres y tradiciones de
la comunidad.

20.1.4.3 Investigaciones que involucran a mujeres embarazadas o que


están amamantando.
Considere que las mujeres embarazadas o que están amamantando
no deben ser sujetos de investigación no clínica a menos que el objetivo
sea obtener nuevos conocimientos sobre el embarazo y la lactancia y
acarree, a lo sumo, riesgos mínimos para el feto o el lactante. Como regla
general, las mujeres embarazadas o que están amamantando sólo podrán
ser sujetos de ensayos clínicos que hayan sido diseñados para proteger o
mejorar la salud de mujeres embarazadas o que están amamantando, o fetos
o lactantes, y para los cuales las mujeres no embarazadas y/o amamantando
resultan sujetos no adecuados.

20.1.4.4 Consentimiento informado en estudios epidemiológicos


Es cierto que para algunos tipos de investigación epidemiológica el
consentimiento informado de los individuos es, o bien impracticable, o
desaconsejable. En este caso deberá hacer que un comité de revisión ética
determine si: a- el proyecto es éticamente aceptable sin un consentimiento
informado de los individuos y b - si sus planes son adecuados para proteger
la seguridad de los sujetos y para mantener la confidencialidad de los
datos.

20.2 Alicientes para la participación


Podrá retribuir con dinero, a los participantes de un proyecto por
los inconvenientes, la pérdida de tiempo y gastos en que incurran por
su participación en la investigación. T ambién puede ofrecerles servicios
médicos gratuitos. El pago no deberá ser tan elevado o los servicios médicos
de tanta amplitud como para inducir a los probables sujetos a consentir
en participar en la investigación en contra de su buen juicio ("inducción
indebida"). Todos los pagos, reintegros y servicios médicos que serán suministrados
a los sujetos deberían ser aprobados por un comité de revisión de ética.

- 183 -
20.3 REVISIÓN Y APROBACIÓN DE PROYECTOS
Antes que comience una investigación que involucre a personas, deberá
someter todas las propuestas a uno o más comités éticos y científicos
independientes, para su revisión y aprobación.

20.4 INVESTIGACIÓN CON PATROCINIO DE ORGANISMOS EXTRANJEROS


Si realiza una investigación con patrocinio del exterior, tiene las siguientes
obligaciones éticas:
- el organismo patrocinante debería someter el protocolo de
investigación a una revisión científica y ética de acuerdo con lo
estándares de su propio país ;
- los estándares éticos deben ser tan estrictamente aplicados como
lo serían en el caso de que la investigación fuera realizada en el país
patrocinante;
- recién después de la aprobación científica y ética en el país del
organismo patrocinante, y antes de la realización de la investigación,
las autoridades correspondientes del país huésped, deberán hacer
cumplir las reglamentaciones locales.
Allí, un comité de revisión ética o su equivalente debe estar de acuerdo en
que la investigación cumple con los requisitos éticos propios.
Tanto en el protocolo como en el trabajo final deberán figurar los detalles
de los reparos éticos que hubiera sido necesario tomar durante la investigación,
a cuyo fin le propongo el modelo siguiente.

20. 5 - Modelo para redactar el epígrafe “reparos eticos” en


el protocolo
"Se tomarán los recaudos éticos recomendados según recomendaciones de
Helsinski y Tokio y sus modificaciones posteriores.
Los datos clínicos serán protegidos de modo tal :
a – que no se pueda identificar a quién pertenecen.
b – no puedan ser accesibles por personas que no están comprometidas con
el secreto profesional.
Se adjunta un modelo de consentimiento informado con su correspondiente
aprobación por el Comité de Ética."

Cambie los tiempos verbales y modifique lo necesario, para la redacción en


el trabajo final, según lo que hubiera podido ocurrir durante la investigación.

- 184 -
21 - REDACTAR EL PROTOCOLO DE INVESTIGACIÓN

Un protocolo de investigación es el documento en el cual se registran los


fundamentos, objetivos y plan de realización de una investigación. Su redacción es el
primer trabajo que debe encarar pero, para completarlo tendrá que realizar gran
número de tareas intermedias que listamos más adelante.

Hay muchos formatos posibles y las instituciones que financian investigaciones tienen
el propio. Pero los puntos básicos son los mismos. A continuación expongo la estructura
básica empleada en la Sección de Asesoría Científica del Hospital de Clínicas de Buenos
Aires desde el año 1995 (11) , muy similar al que propone la OPS a partir del 2005 (35)

Por cuestiones de conveniencia, si puede, obtenga una copia del modelo que utiliza la
institución a la que rendirá cuentas de su investigación y si esta no tiene, utilice el que le
describo y luego coteje con los modelos internacionalmente estandarizados para
comprobar si algún detalle debe ser modificado.

Para una presentación institucional en las primeras páginas le van a solicitar,: el


título del proyecto, nombre de los autores, grado académico y lugar de trabajo de cada
uno de ellos. Es bastante común que soliciten también un resumen de todo el proyecto.

Luego, en el CUERPO PRINCIPAL deberá detallar los aspectos que paso a


enunciar.

21.1 Listado de Componentes del Protocolo de investigación


- Descripción de las características generales del proyecto
o – Plantear exlícitamente problema (como pregunta o hipótesis) (cap.3)
y/o enunciar los objetivos de la investigación . (cap. 5 )
o - Enunciar los antecedentes (1 a 2 páginas de extensión) (ap. 23.6.1)
o – Justificar la realización de la investigación. (ap. 23.6.1 )
o – Describir las características del diseño ( cap. 7 )

Población y muestra(s)
o – Definir la población: criterios de inclusión, exclusión y eliminación
y coordenadas témporo-espaciales (cap. 8 )
o – Describir el diseño muestral:
Indicar el tamaño muestral.
Indicar criterios aceptados ( errores a y ß; diferencias esperadas, etc)
Describir el procedimiento a emplear (cap. 9)
o– Explicitar los reparos éticos del proyecto (ap. 20.5)

- 185 -
Materiales y Métodos (Técnicas)
o – Describir los materiales y técnicas a emplear
Enumerar las variables a medir e indicar sus escalas de medición y
el procedimiento de operacionalización (cap. 10)
Describir el instrumento de registro de datos (planilla o ficha). Adjuntar
un modelo e indicar el procedimiento de empleo del mismo (ap. 10.5)
Indicar el método de almacenamiento (manual, computarizado, etc.)
o – Proponer el tratamiento estadístico de los datos obtenidos (ap. 23.6.6)
Enunciar la técnica estadística y el programa estadístico a emplear para
el procesamiento de la información
o– Resumir con un esquema conceptual los procedimientos de análisis y
los resultados esperados. (cap. 6)

Enumerar los recursos estimados


Informar sintéticamente
cuánto tiempo llevará realizar la investigación,
cuánto costará y
cuáles elementos harán falta en términos de recursos
humanos
materiales y
físicos. ( 65)
Describir del plan en forma escrita o gráfica
La gráfica de Gantt consiste en un diagrama que representa la actividad a realizar y el
tiempo a emplear para concretarla, dando una idea evolutiva de todo el proyecto. Por
ejemplo como se muestra a continuación:

Enumerar las Referencias Bibliográficas: según el sistema de la convención Internacional


de Editores de Revistas Médicas. (62)

Protocolo e informe científico están directamente relacionados. En las


páginas que siguen nos concentramos en sugerirle qué puede escribir en
el informe, pero aún más en aquello que no conviene escribir.

- 186 -
22 - Informando A La Comunidad Científica (I) : fundamentos
racionalessobreredaccióndel Trabajo Científico

22.1 INTRODUCCIÓN

Un informe científico (también llamado trabajo científico) es un escrito en


el cual Ud. (el investigador) comunica que logró cierta información y explica
cómo hizo para obtenerla.

Si Ud. nunca escribió un trabajo, encontrará en este apartado ideas para


su organización. Pero es momento de decirle que, sobre cómo redactar y
analizar un informe científico se ha escrito mucho (10,15,59,60,61). Y cuando
esto ocurre, significa que no es tan fácil dar con la norma adecuada y que tal
vez nadie lo ha hecho aún. Tengo la impresión que se trata de una receta con
dos componentes: uno técnico y el otro literario.

Un trabajo vale por la información que provee y la información vale si los


procedimientos empleados para producirla no son cuestionables o sea han
seguido las reglas del método científico (validez interna) y no contradicen el
conocimiento aceptado por la comunidad hasta el momento (coherencia
externa). Estos componentes son los que revisarán los árbitros en principio
desde el punto de vista técnico, pero tampoco dejan de considerar el
componente literario. Lo importante es que no le puedan cuestionar lo técnico.
Sobre lo literario...¡¡¡ buena suerte !!! Ellos también tienen tienen criterios y
prejuicios propios (53, 63).

En los párrafos siguientes vamos a trabajar sobre el aspecto técnico y le voy a


ofrecer las pautas que, tanto en la Sección del Hospital de Clínicas, como en mi estudio,
han servido a muchos consultantes. Si Ud. ya escribió trabajos científicos, seguramente
ha leído el párrafo anterior porque es curioso. Lo felicito por ello. Parece que la
curiosidad es el primer paso en viaje del conocimiento. Claro que con su experiencia
tal vez no agregue muchas cosas a lo que sabe y si esto ocurre, me sentiría realizado.

22.2 Validez , Coherencia y Rechazos

La manera más sencilla de tener un informe válido es desarrollar válidamente


una investigación. Si no lo hizo, el único modo de redactar un informe válido
es relatar otra realidad... (¿mentir ?). Pero para esto no me necesita.

- 187 -
Ud publica su información para que la use todo el que la necesite.
Otros profesionales la usarán para tomar decisiones diagnósticas y/o
terapéuticas.
El trabajo científico debe informar sobre la investigación, los resultados
y las conclusiones, de un modo ordenado, empleando un lenguaje preciso,
ofreciendo la información indispensable y de validez incuestionable.
La primera persona que debe considerar la validez de su trabajo es
Ud. mismo. Al revisarla, estará haciendo el mismo trabajo que hace el
comité editorial de una revista determinar el grado de validez interna,
coherencia y validez externa. Si se produce alguna falla en alguno de ellos
el comité tendrá derecho a rechazar la publicación.

Podemos hablar de dos tipos de rechazos: absoluto y relativo.


Convendremos en llamar rechazo absoluto aquél en el cual el comité
revisor no acepta el manuscrito bajo ningún concepto. Rechazo relativo
será el que se produce cuando el manuscrito es devuelto para su corrección,
como condición inicial para su aceptación futura. Veamos como se puede
llegar a alguna de estas situaciones.
Ciertas reglas indican una conducta única, es decir tienen carácter
excluyente. Si no las cumple, el informe es cuestionable y no tiene modo
de defender las conclusiones. Esto justifica un rechazo absoluto.
Casos así pueden ocurrir si, por ejemplo, Ud. no define la Población Blanco
(ap. 5.4.1 y cap. 8 ) y entonces no tiene sujetos sobre los cuales pueda
hablar en forma genérica. Lo mismo ocurrirá si no describe la muestra
obtenida y no puede asegurar que es representativa. (cap. 9)

Otras reglas apuntan a varias conductas posibles e igualmente


correctas. Por ejemplo puede comparar dos proporciones (tabla 14.6)
usando una prueba de significación para proporciones u otra para promedios
y, bajo ciertas condiciones, las conclusiones son idénticas. Entonces elegir
uno u otro procedimiento es asunto de gustos. Aquí el informe es
cuestionable desde ciertos ángulos, pero puede defender sus conclusiones
explicando que optó por una alternativa diferente. El trabajo sería
relativamente rechazable .

En este capítulo hablaremos de “justificar rechazos ” sobre la base


de un análisis lógico del asunto. Si después el árbitro decide algo diferente
( y frecuentemente lo hace) ese es otro problema. (53, 63)

- 188 -
Convengamos que para que un trabajo no sea rechazado, debe tener, en
principio validez interna.
Se considera que tiene validez interna cuando se han aplicado reglas
precisas y replicables y se han controlado las variables confundentes
conocidas y desconocidas.
Para tener validez externa, sus conclusiones se deben referir a
poblaciones real o potencialmente infinitas (universos).

22.3 V e r i f i c a b i l i d a d y R e p l i c a b i l i d a d
La verificabilidad una propiedad de las afirmaciones según la cual,
observando los hechos Ud. puede determinar si son verdaderas o falsas. (24)
Dadas las siguientes afirmaciones:
(I) "El estímulo del interés del alumno produce un mayor rendimiento
académico."
(II) "Los habitantes de Saturno tienen sangre de color amarillo.
diremos que (I) es verificable porque en la práctica se puede determinar
si es cierto o no que estimulando el interés del alumno se aumenta su
rendimiento. Pero (II) no es verificable, porque no hay modo de comprobar
si es cierto que los saturninos tienen sangre amarilla.
Un informe científico está formado por muchas afirmaciones.

Desde el punto de vista del lector la única verificabilidad relevante es la


de las conclusiones, porque es la información que se aplicará.
Las conclusiones sólo se pueden verificar repitiendo el estudio. ¡¡¡ Claro
que hacerlo con todos los trabajos es imposible !!!
Cuando hablo de verificar no me refiero literalmente a repetir cualquier
investigación: sólo a estar seguro que cuando quiera podré hacerlo. Para lograr
esto el trabajo científico debe ser replicable.

Replicar un trabajo científico en Ciencias de la Salud, significa hacer lo


mismo que hizo el autor del trabajo, con sujetos de la misma población
blanco, pero en otro tiempo y/o lugar.

La replicabilidad es una propiedad que tiene un TC si está escrito de


modo tal que, con sólo leerlo, Ud puede establecer si está en condiciones
de hacerlo de nuevo en su propio lugar de trabajo (por supuesto
disponiendo de todos los participantes y materiales requeridos).

Para ejemplificarlo mire los dos modelos de recetas para flan. (76)
Queda en claro que, aunque en el modelo A se dan muchos datos, la receta
no es replicable: no informa la cantidad de los ingredientes, ni los tiempos
o temperaturas necesarias para el horno, etc.

- 189 -
Cuando lee el Modelo B se da cuenta que es replicable sin necesidad de llevarlo a cabo,
porque las instrucciones (el método) se han detallado con la precisión necesaria para la
obtención del producto.

La falta de replicabilidad afecta la validez interna del trabajo. Pero un trabajo


mal hecho puede ser replicable (las cosas se pueden repetir mal) o sea que,
aisladamente, la replicabilidad no garantiza nada. No menos importante que la
verificabilidad es la conexidad.

22.4 Conexidad
Inicialmente definimos conexidad como la propiedad por la que, tomándolas
de a pares, las distintas partes de un informe están relacionadas.(15) La práctica
nos mostró que esta definición era demasiado vaga. Hicimos nuevas definiciones
para cada par de componentes (55) que detallaremos en cada apartado en
particular.

- 190 -
Todas las partes del informe deben ser conexas entre sí: el tipo de problema
con: los objetivos, el esquema conceptual, los resultados y conclusiones.
La falta de conexidad afecta la validez interna del trabajo.
De las cualidades mencionadas sólo resta hablar de la coherencia.

22.5 Consistencia o Coherencia


La consistencia es una relación lógica que se establece entre dos afirmaciones
conexas, por la cual ninguna contradice a la otra. (20)
Un informe científico tiene consistencia interna si ninguna de sus afirmaciones
se contradice con el resto de su contenido. Y tiene consistencia externa si no
contradice hipótesis verificadas y uniformemente aceptadas.
Por ejemplo: Ud. comienza una investigación en personas de 60 a 80 años de
edad para establecer el grado de nefrotoxicidad que tiene cierto antibiótico.
Como una hipótesis de partida acepta que la suficiencia renal de los ancianos es
igual a la del adulto normal.
Después desarrolla una investigación incuestionable desde el punto de vista
del método. A pesar de esto el comité revisor le rechazará el trabajo. No por estar
mal realizado, sino porque el conocimiento disponible indica que el anciano tiene
cierto grado de insuficiencia renal en relación al adulto normal. Como su trabajo
partió de un concepto que no coincide con lo que está aceptado por la comunidad,
este es un caso de inconsistencia externa.
Posologías o vía de administración de medicamentos distintas de las que se
aceptan, pueden originar rechazos relativos o absolutos dado que también
constituyen hipótesis presupuestas aceptadas uniformemente.
Ud repite la investigación sobre nefrotoxicidad, partiendo de lo aceptado: los
ancianos tienen cierto grado de insuficiencia renal. Nuevamente desarrolla un
trabajo incuestionable. Redacta el informe.

En el apartado de conclusiones indica


(a1) “ la nueva droga produjo un incremento del 50 % en los niveles de
creatininemia de los ancianos” .
En el apartado de discusión escribe que
(a2) “ la nueva droga no tuvo repercusión en la función renal de los
pacientes”.
Envía el manuscrito y de nuevo es rechazado. Esta vez porque, si (a1) es cierta
entonces (a2) no lo es, y viceversa. Este es un caso de inconsistencia interna
porque hay inconsistencia entre dos afirmaciones producidas con motivo del
mismo trabajo.

- 191 -
Para el análisis del informe interesa la coherencia interna.
Obtenida ésta, para la valoración de las conclusiones en contexto del
conocimiento general interesa la coherencia externa.
Si un informe tiene a - inconsistencias internas y/o b- externas sin
fundamentos empíricos, justificará su rechazo absoluto.
Las externas con fundamentos empíricos justifican rechazos relativos.
La consistencia interna se valora en la totalidad del escrito; la externa,
habitualmente se busca en los apartados de Introducción y de Discusión del trabajo
pero también depende del grado de conocimiento del árbitro.
Para lograr un informe consistente, a medida que redacte, trate que cada
afirmación mantenga consistencia con las precedentes.
Cuando termine la redacción, lea todo el trabajo pesquisando contradicciones,
inconexidades o fallas en la verificabilidad.
También solicite a personas de confianza que lean el manuscrito y ofrezcan
una opinión sincera. Este control heterólogo será de gran ayuda para lograr
un escrito más comprensible y consistente y detectar aspectos pasibles de
rechazos. Conocer de antemano, cuáles pueden ser los motivos de un rechazo
es una ventaja. Si se expone a uno relativo le conviene tener a mano la
documentación que justifique que Ud. eligió un procedimiento aceptable, al
menos por una parte de la comunidad científica.

Por ejemplo hay estadísticos que sostienen que las pruebas paramétricas
llevan a las mismas conclusiones que las no paramétricas cuando el número de
casos es igual o superior a 10 (37). ¡¡¡ Ahora bien... sea práctico(a) !!! Si es igual... es
igual... No se exponga gratuitamente a un cuestionamiento. Si es lo mismo usar
una“paramétrica” que una “no paramétrica” y el comité revisor prefiere una “no
paramétrica”, use ésta y ... ¡¡¡ listo !!!

Para cerrar este apartado sobre la validez convengamos que un trabajo


científico tiene validez externa cuando la información que ha producido es
aplicable efectivamente, en otro tiempo y/o lugar, a individuos de la población
blanco, que no participaron de la investigación. Ello dependerá de la definición
de la población blanco y del diseño muestral empleado. (caps. 8 y 9)

En el próximo apartado tratamos algunos principios generales para la operatoria


en la redacción de un trabajo científico.

- 192 -
En cambio de obligar al pueblo a seguir el camino del erudito, debería
ser el erudito quien ayude al pueblo para que logre sus propósitos,
aunque quiera seguir caminos diferentes que los que él tomaría.

23 - Informando a la comunidad científica (II) : apuntes


sobre la operatoria de redacción del Informe Científico.
A pesar que, en diversos sitios (Editores de Revistas, cada Revista
propiamente dicha, etc) (62) se recomiendan ordenamientos y/ epígrafes
diferentes, como por ejemplo el de Vancouver (Resumen, Introducción, Métodos,
Selección y descripción de los participantes , Información técnica, Estadística,
Resultados, Discusión, Referencias bibliográficas ) el contenido básico requerido
es siempre el que se describe en la Tabla 23.1 que en 1985 denominé modelo
racionalizado de informe (15) ya que contenido y secuencia se explican
racionalmente.

23.1 – PROCESOS DE REDACCION DE INFORMES CIENTIFICOS: IDEAL Y


PRAGMÁTICO

El orden de presentación de un trabajo científico tiene el formato básico


estándar con los apartados de Introducción, Metodos, Resultados, Conclusiones
(IMRC) uno de cuyos modos expandidos describo en el cuadro 23.1

En el imaginario público, después de haber terminado la investigación, el


investigador, se sienta a escribir el trabajo, comenzando por el título y terminando
por la bibliografía, redactando ordenadamente el resto de los apartados.
He participado y realizado muchas redacciones y nunca pude observar un
proceso, lineal y secuencial como ése, al que llamaré imaginario.
Cuando Ud escriba su primer TC descubrirá que el orden de redacción de los
apartados raramente coincide con el orden en la presentación final.
Casi todo el mundo cree que el Resumen se debe escribir cuando se ha
terminado el trabajo, pero muchos se asombran cuando descubren que tienen
que hacer lo mismo con el TÍTULO y la INTRODUCCIÓN (ap. 23.8 )
Lo que he observado es que los contenidos de los componentes se van
redactando en distintos momentos. Luego cada componente se ensambla (del
mismo modo que se ensambla un automovil).
Aún así hay una secuencia, la que indica el protocolo y por lo tanto podríamos
llamar protocolar y otra pragmática. En ambas me refiero a trabajos válidos. No
hace falta método para escribir un trabajo inválido.

- 193 -
23.2 - Secuencia protocolar y resumen protocolar o tipo 1
Según la secuencia protocolar la información a difundir se obtuvo
desarrollando una investigación formalmente protocolizada (65), luego de la
cual se escribió el informe, redactando al final el resumen.
Hay muchas ventajas en hacerlo así, por ejemplo que ya hay partes del futuro
trabajo científico que están escritas en el protocolo, si bien otras deben ser
modificadas y algunas se escribirán por primera vez.
Las partes que ya están escritas (en el protocolo) son: Población y muestras
(Población blanco y accesible; Diseño Muestral ) , Diseño - Materiales y técnicas.
Simplemente las copiará y si, fuera necesario, modificará según lo que hubiera
ocurrido realmente durante la investigación. (65)

- 194 -
En cambio deberá escribir por completo tres apartados nuevos (Resultados,
Conclusiones y Discusión) porque obviamente no podían estar en el protocolo.
Finalmente hay cuatro apartados (Título, Introducción, Resumen y
Bibliografía) que, si bien estaban en el protocolo, no se pueden copiar
directamente porque pueden haber sufrido modificaciones desde el momento
que fueron escritos y van a requerir una versión final que será la que envíe a
impresión.
En el caso del RESUMEN, se lo realiza en el momento cronológico adecuado.
Es como cuando cosecha un fruto en el momento en que está maduro.En
adelante, denominaré a este tipo como resumen protocolar o tipo 1.

Si bien había un Resumen en el protocolo, el que tiene que presentar para el TC


requiere contenidos diferentes, así que deberá reescribirlo casi por completo.
Si desde un primer momento, Ud intenta publicar en una revista, la secuencia
estandarizada parece la única aceptable. Pero no siempre intenta publicar en
revistas…

23.3 - Secuencia Pragmática: El Resumen Pragmático o Tipo 2


Cuando apunta a presentaciones preliminares (congresos, jornadas,
simposios, etc) lo obligan a usar una secuencia diferente que he denominado
secuencia pragmática.
Los “responsables” sólo le piden que presente un escrito con una extensión
mínima (también llamado RESUMEN) y , muchas veces, no hace falta que muestre
que ya ha escrito el trabajo completo.
Así que en la secuencia pragmática se quiere difundir información que se
obtuvo ya sea a - al final de una investigación realizada protocolarmente como
por b - el análisis de un conjunto de datos (frecuentemente obtenidos en forma
retrospectiva) reunidos a partir una idea originaria nunca formalizada en un
protocolo (65).
Pero en este caso b se comienza por escribir el resumen y eventualmente
se redacta un informe definitivo. A los fines de la precisión del discurso
propongo que estos resúmenes se denominen Tipo 2.
Si la investigación fue realizada protocolarmente, Ud ya dispone del
protocolo y no le resultará demasiado complicado aplicar la secuencia
pragmática. También por la precisión del discurso propongo que éste se
denomine RESUMEN TIPO 2a.
Si la investigación no disponía de protocolo, propongo el nombre de
RESUMEN TIPO 2b.
Tome precauciones al construir un Resumen T2. Recuerde que si se decide
a redactar el TC completo, deberá usarlo sin cambiarle ni una coma y como
referente para el informe final en el cual no podrá escribir nada que sea
discordante con el resumen. (55, 87)

- 195 -
Si lo hace de otra manera se expone a errores ya descriptos en la literatura
bajo la forma de discordancias, a veces importantes, entre cuerpo del trabajo y
su resumen . Tengo motivos para opinar que esto se debe a que el cuerpo del TC
se reescribió olvidándose de tomar como referencia al resumen publicado.
En el ap. 2.3 describo una secuencia posible de acciones para redactar el
Resumen pragmático o Tipo 2 antes que el cuerpo del trabajo. Estos
lineamientos apuntan a que al redactar cualquier “Resumen” lo haga de tal
manera que no termine habiendo discordancias con el cuerpo del trabajo final.

23.4 - Redacción del resumen antes que el trabajo completo


(Resúmenes tipo 2)
23.4.1- Redacción del Resumen Tipo 2a (Si dispone de protocolo de
investigación)
1 – Obtenga una copia de las INSTRUCCIONES PARA REDACCIÓN DE RESUMENES
que proveen la Institución, Publicación o Evento en el que piensa presentar el
Resumen. Para la redacción, lea el reglamento de publicaciones de la revista
elegida para la publicación y averigüe el formato aceptado y número de palabras
que debe contener: se habla de 150 a 250 (10, 59, 62)
2 – Redacte los encabezados para los apartados que componen un Resumen,
según se lo soliciten en las INSTRUCCIONES. Por ejemplo según los estándares
propuestos por el ICMJE (62) para RESÚMENES ESTRUCTURADOS: contexto o
antecedentes del estudio ; objetivos ; procedimientos básicos : a - selección de
los sujetos o animales de laboratorio que han participado en el estudio, b -
métodos de observación y c - métodos analíticos, principales resultados ;
magnitud de los efectos; significación estadística), conclusiones principales y
fuentes de financiación. Si está escribiendo un resumen de un Ensayo Clínico
consulte el procedimiento CONSORT (88).
3 – Inserte debajo del epígrafe correspondiente una copia de los Objetivos
enunciados en el protocolo, o sus modificaciones si se hubiera realizado alguna.
4 – Inserte debajo del encabezado correspondiente los Resultados principales o
sea sólo los que sirven para sustentar directamente las conclusiones.
5 – Inserte las Conclusiones, debajo del epígrafe del mismo nombre. (ap 23.6.9)
El resumen debería destacar aspectos nuevos e importantes o las observaciones
que se derivan del estudio.
6 – Analice la conexidad entre Objetivos, Resultados y Conclusiones (ap. 23.6.9)
7 – Inserte una descripción general del Diseño, Materiales y Métodos (DMM)
USANDO COMO FUENTE el protocolo , tomando en cuenta los cambios que se
hubieran podido realizar durante la investigación. Ajuste el perfil metodológico
del resumen a las mismas exigencias que le solicitan para el informe completo.
8 – Analice la conexidad del apartado DMM con los objetivos, los resultados y las
conclusiones.

- 196 -
9 – Inserte la Definición de Población, copiándola del protocolo. (cap. 8 ) Si hubo
cambios, modifique el apartado ajustándose a los cambios realizados.
10 – Inserte una descripción genérica del Diseño Muestral utilizado. (Por ejemplo:
muestreo accidental, aleatorio simple, estratificado, etc)
11 – Inserte una descripción genérica de la o las muestras obtenidas señalando las
variables de identidad y contexto básicas y cuál era el número de individuos
estudiados en cada muestra. (ap 23.6.3) Si hubo más de una muestra, señale el
grado de equivalencia entre ambas.
12 - Valore la conexidad y coherencia de todo el resumen que acaba de armar.
23.4.2 - Redacción del Resumen Tipo 2B (Si no dispone de protocolo
de investigación)
1 – Obtenga una copia de las INSTRUCCIONES PARA REDACCIÓN DE RESUMENES
que proveen la Institución, Publicación o Evento en el que piensa presentar el
Resumen. Para la redacción, lea el reglamento de publicaciones de la revista
elegida para la publicación y averigüe el formato aceptado y número de palabras
que debe contener: se habla de 150 a 250 (10, 59, 62)
2 – Redacte los encabezados para los apartados que componen un Resumen,
según se lo soliciten en las INSTRUCCIONES. Por ejemplo según los estándares
propuestos por el ICMJE (68) para RESÚMENES ESTRUCTURADOS: contexto o
antecedentes del estudio ; objetivos ; procedimientos básicos : a - selección de
los sujetos o animales de laboratorio que han participado en el estudio, b -
métodos de observación y c - métodos analíticos, principales resultados ;
magnitud de los efectos; significación estadística), conclusiones principales y
fuentes de financiación. Si está escribiendo un resumen de un Ensayo Clínico
consulte el procedimiento CONSORT (88)
3 – Inserte debajo del epígrafe correspondiente los Objetivos según los cuales se
llevó adelante el proyecto.
4 – Inserte debajo del encabezado correspondiente los Resultados principales o
sea sólo los que sirven para sustentar directamente las conclusiones.
5 – Inserte las Conclusiones, debajo del epígrafe del mismo nombre. (ap 23.6.8)
El resumen debería destacar aspectos nuevos e importantes o las observaciones
que se derivan del estudio.
6 – Analice la conexidad entre Objetivos, Resultados y Conclusiones
7 – Inserte una descripción general del Diseño, Materiales y Métodos (DMM)
Ajuste el perfil metodológico del resumen a las mismas exigencias que le solicitan
para el informe completo.
8 – Analice la conexidad del apartado DMM con los objetivos, los resultados y las
conclusiones.
9 – Inserte la Definición que se usó para identificar Población en estudio.
10 – Inserte una descripción genérica del Diseño Muestral utilizado. (Por ejemplo:
muestreo accidental, aleatorio simple, estratificado, etc)

- 197 -
11 – Inserte una descripción genérica de la o las muestras obtenidas señalando las
variables de identidad y contexto básicas y cuál era el número de individuos
estudiados en cada muestra.( ap. 23.6.3) Si hubo más de una muestra, señale el
grado de equivalencia entre ambas.
12 - Valore la conexidad y coherencia de todo el resumen que acaba de armar.
Sea protocolar o pragmático los contenidos del resumen se pueden presentar
en dos formatos.

23.5 – CONTENIDOS DEL RESUMEN SEGÚN EL FORMATO: ESTRUCTURADO Y CLÁSICO

El ICMJE (62) indica que en el contenido del resumen deben figurar:


- Los objetivos del estudio o de la investigación.
- La metodología fundamental (selección de los sujetos del estudio o de
los animales de experimentación, los métodos de observación y de análisis)
- Los resultados principales (ofrecer datos específicos y su significación
estadística, si es posible).
- Las conclusiones más importantes, insistiendo en los aspectos nuevos
e importantes del trabajo
- las fuentes de financiación.
El resumen debería destacar aspectos nuevos e importantes o las
observaciones que se derivan del estudio. Los artículos sobre ensayos clínicos
deberían seguir las instrucciones del CONSORT al igual que su resumen (88)
El ordenamiento de los encabezados da origen al formato, según el cual se
definen dos tipos de resumen el clásico o el estructurado.
El CLÁSICO o normal tiene 150 palabras como máximo, también denominado
INDICATIVO O DESCRIPTIVO. Se recomienda para los Artículos de Revisión o
Artículos Especiales, textos teóricos, en informes y como material en el anuncio
de conferencias, pues sólo viene a ser un índice de los temas que se desarrollan
en el trabajo que sigue cuya finalidad es precisamente esa.
El RESUMEN ESTRUCTURADO, que se ha sido imponiendo en los últimos
años, permite 250 palabras. Su contenido se divide en siete apartados, simulando
-aunque en miniatura- la estructura del artículo: Objetivo, Diseño, Emplazamiento,
Pacientes o Participantes, Intervención, Mediciones y resultados principales y
Conclusiones (10, 59)
Recuerde : en un resumen de un trabajo original no pueden faltar Objetivos,
Obtención y procesamiento de datos , Resultados y Conclusiones pero no importa
el formato, el resumen raramente asegura la replicabilidad del trabajo.
Como el resumen tiene los mismos apartados que el trabajo completo su lectura
crítica sigue los mismos lineamientos en el sentido de cumplir los requisitos de
verificabilidad, conexidad y consistencia, con las limitaciones derivadas de estar
trabajando con información parcial. (55,87).

- 198 -
En el caso de los resúmenes la conexidad aparece como la propiedad más relevante,
desde el momento que es imposible verificar un resumen pues faltan elementos esenciales.
(Cap.16) y éste es el motivo por el cual la información provista en resúmenes no puede ser
aceptada como válida para fundamentar conductas.

Pensando en la redacción del informe científico como un ensamblado,


pasaremos ahora a la redacción de cada una de las partes para luego ofrecer un
flujograma para la secuencia final.

23.6 - Producción de los componentes del informe


Antes de entrar en detalles de los contenidos de cada apartado, tome en
cuenta la siguiente regla general: no desentone. Adáptese a los requisitos de la
publicación que eligió para enviar su informe. Estudie las recomendaciones para
los autores de la revista elegida y observe el formato de artículos similares al suyo
y ya publicados.

23.6.1 - Información que debe figurar en Introducción


La introducción debería funcionar como un razonamiento en el cual, las
premisas son el marco de referencia y el problema y la conclusión es la necesidad
de realizar la investigación con objetivos orientados a la solución del problema.
Cuando la redacte el trabajo, la única diferencia con el protocolo será que conoce las conclusiones y deberá
decidir si las menciona o no y de qué manera. Un trabajo científico no es una novela de misterio.
a - Enuncie los antecedentes
Indique el campo genérico del conocimiento al cual se referirá el informe. Por
ejemplo: ¿ es un problema de educación , de psicología, bioquímica, clínica, etc ?
Señale el problema. Relate cómo se originó. ¿Se descubrió por falta de
información o por la detección de sucesos inesperados?
¿ No encontró información relacionada con el tema? ¿Cuál pudo ser la causa ?
Recuerde que en esta época es raro que no haya información sobre el tema que
sea. Si este es su caso debería indicar el sistema usado para realizar la búsqueda,
las palabras clave empleadas y el período que abarcó porque es posible que
usando otros aparezcan respuestas a los interrogantes. (65)
¿ Existen planteos similares por parte de otros autores ? ¿ Cuáles fueron los
intentos de resolución más importantes ? Si los hubo explique por qué no le
resultan satisfactorios.
Si el trabajo emplea hipótesis presupuestas distintas a las aceptadas
habitualmente (ap.22.5) debe justificar su adopción, con publicaciones de otros
autores que las prueben, o será pasible de rechazo.

B - justifique la investigación
Indique qué espera que cambie si resuelve el problema. Por ejemplo: si analizó
la validez de una nueva prueba de diagnóstico para tuberculosis, indique si es más
barata, más rápida, más aplicable a mayor cantidad de individuos, o todo esto junto,
comparada con las existentes en plaza, etc.

- 199 -
c - Formule los objetivos
Deben tener el formato especificado en el cap. 5. Se pueden ubicar aquí o
inmediatamente después de la "Introducción" .
Deben cumplir condiciones de precisión y conexidad con el resto de los
componentes del informe.
Respecto a la extensión algunos autores aconsejan que la introducción no ocupe
más que media o una y media carilla, de papel tamaño carta, escrito a doble espacio.

23.6.2 Información que debe figurar en Población


a - Deben figurar todos los criterios de definición de la población blanco.
Hecho esto clasifíquela como COMPLETA (cuando están todos los criterios)
INCOMPLETA (cuando falta alguno). Si solamente describe la(s) muestra(s)
obtenida(s), la definición estará AUSENTE. Corrija cualquier falla en este sentido.
Cuando la Población está incompleta o ausente el lector no podrá saber con
quienes puede repetir la investigación ( pierde replicabilidad) y tampoco a quienes
aplicar la información (pierde validez externa). El trabajo se podrá rechazar en
forma absoluta.
b - También deben figurar con precisión las coordenadas témporoespaciales
(que definen la población accesible ). Cuando no están, no puede conocer el
contexto en el cual se realizó el trabajo y por lo tanto el grado de verosimilitud
de su realización.

Nota ética: en muchas publicaciones la definición de "Población" y descripción de las "Muestras"aparecen


como subapartados de "Materiales y Métodos". Este hábito me parece incorrecto formal y éticamente.
Formalmente ya que ni los seres humanos, ni sus partes anatómicas, son "Materiales y/o Métodos",en el
sentido habitual de estos términos. Incorrecto éticamente, porque la inclusión como tales implica el sometimiento
de la condición humana de algunos ("los pacientes") a la voluntad de otros ("los investigadores").

23.6.3 Información que debe figurar en Diseño Muestral y Muestras


a - Método de estimación del tamaño muestral
Señale estimación de la diferencia esperada, precisión, errores alfa, beta.
Si no estimó el tamaño antes de la investigación vea ap. 13.3.5
b - Procedimiento de muestreo empleado
Indique el procedimiento y si considera que fue aleatorio o no. ( cap. 9)

- 200 -
c - Descripción de la(s) muestra(s)
Si tiene una muestra y pocas características a describir, hágalo
en el texto. Por ejemplo: “Veintinueve de 233 pacientes (12.4%) fumaban. Veinte
de 233 (8.6%) reconocían ingesta habitual de alcohol. Cuatro de 231 (1.7%)
tenían registro de uso de drogas mayores”
Si son muchas características mejor preséntelas en un listado o tabla, como
le muestro en la Tabla 23.6.3
d - Grado de representatividad de la(s) muestra(s) obtenida(s)
Si el procedimiento de muestreo fue aleatorio, el tamaño muestral está cercano
o supera al necesario y la muestra es semejante, se la considera totalmente
representativa. Esto permite que las conclusiones sean confiables.
Si el procedimiento de muestreo NO fue aleatorio, el tamaño muestral
está cercano o supera al necesario y la muestra es semejante, se la considera
parcialmente representativa. Las
conclusiones en estas condiciones, se
deben considerar hipótesis a comprobar.
Si carece de alguno de esos datos (en caso
de estudios piloto o exploratorios), debe
considerar que faltan datos para determinar
representatividad. Las conclusiones de un
trabajo con este muestreo no se deberían
emplear para tomar decisiones.
c - Grado de equivalencia
En los estudios de comparación a
muestras independientes (ap.14.4.1.1)
fue necesario obtener dos o más
muestras. Ud. debe informar las
características de todos los grupos estudiados y permitir que se hagan las
comparaciones necesarias. Puede describirlas en el texto o usar una tabla
como la 23.6.3.1. Puede elegir una disposición diferente, por ejemplo poniendo
en líneas lo que está en columnas y a la inversa. Cuando escribe un trabajo
sobre un problema de comparación, las muestras independientes no tendrían
que diferir en forma estadísticamente significativa entre sí antes de ser sometidas
a los tratamientos (muestras equivalentes). Informe si esto fue así y en cuáles
pruebas estadísticas funda esta afirmación (tabla 14.6 ) Por ejemplo en la
tabla 23.6.3.1, indicaría que entre ambos grupos de diabéticos, no hubo
diferencias estadísticamente significativas, ni en la proporción de sexos (Chi²
= 2.7; p=0.23) ni en las edades (F= 1.2; p=0.18). Si falta el cálculo para establecer
equivalencia, se justifica rechazo relativo, pero sin no son equivalentes, rechazo
absoluto.
23.6.4 Información que debe figurar en Diseño
Señale las características del diseño empleado según los ejes de clasificación
mencionados (cap. 7), por ejemplo :

- 201 -
... la investigación empleó un diseño PROSPECTIVO, LONGITUDINAL,
EXPERIMENTAL, A DOBLE CIEGO.
... se trató de un estudio PROSPECTIVO - OBSERVACIONAL - TRANSVERSAL
... el trabajo fue RETROSPECTIVO - LONGITUDINAL.
Si el diseño que ha elegido tiene nombre propio, úselo, por ejemplo: ENSAYO
CLÍNICO, ENSAYO CLÍNICO ABIERTO, ENSAYO CLÍNICO CONTROLADO ALEATORIZADO
DOBLE CIEGO , ESTUDIO DE CASOS Y CONTROLES, ESTUDIO DE COHORTE
La falta de identificación explícita del diseño puede justificar un rechazo
relativo aún cuando figuren la descripción de los procedimientos empleados, y
la secuencia de recolección de información.
La falta de consistencia entre la categoría del diseño y los procedimientos
empleados también justifican el rechazo absoluto. Por ejemplo esto
ocurriría si Ud. dice que realizó un “ensayo clínico controlado” y después el
“grupo control”, no es aceptado como tal, por fallas en los métodos de selección
o en la semejanza con el tratado o ambas cosas. La descripción del diseño orienta
al lector acerca del esquema conceptual que usó para resolver el problema.
Objetivos y diseño son conexos cuando el diseño sólo permite producir
información como la buscada a través del objetivo. Por ejemplo un diseño
pensado para comparar no sirve para cuantificar. (cap. 6). Si no hay conexidad
o no se puede determinar, entonces se justifica el rechazo absoluto del trabajo.

23.6.5 Información que debe figurar en Materiales y Técnicas


Este apartado se redacta para que cualquier científico pueda repetir
(reproducir) los pasos que Ud dio, en la investigación. Lo que sigue constituye un
modelo para colocar bajo el epígrafe “Materiales y Técnicas” del informe.
Es posible que haya tantas variantes de descripción como trabajos publicados.
Pero todo lo que usó e hizo durante una investigación apuntaba a la obtención
de datos pertinentes cuyo modo ordenado de exposición pasamos a considerar.
(11)
23.6.5.1 - Listar las variables medidas
Comience por enumerar las variables medidas y la forma de medirlas.
Un modelo de formulación podría ser: "..se construyó una planilla en la que se
registraron las siguientes variables:“ y a continuación se crea un listado como el
que se ve en el cuadro 22.6.5 Los tratamientos también son variables. Para ellos
debería describir qué se suministra, por cuál vía, durante cuanto tiempo, cuantas
veces por día, etc. Es posible que haya usado otras técnicas, además de las
destinadas a la medición de variables, para producir un efecto que, no es variable
en estudio pero es necesario a los fines de la investigación.
Por ejemplo en un proyecto para valorar la evolución a largo plazo de lesiones
corneanas, hizo falta operar a los pacientes y hubo que lograr “aquinesia del orbicular
y analgesia local”. El autor describió los procedimientos empleados como sigue:

- 202 -
"La aquinesia del orbicular se logró con la técnica de O'Brien o Van Lint utilizando
de 5 a 10 cc de Duracaíne 0.5.- La analgesia se obtuvo por bloqueo del ganglio
ciliar inyectando en el espacio retrobulbar 4 cc de Duracaíne 0.5 mezclado con
una ampolla de Unidasa y empleando una aguja de 5 cm, calibre 26."

Sería ideal no mezclar descripciones de técnicas y materiales, pero a veces,


como acabo de mostrar, se hace necesario para la homogeneidad del texto.
Si describe una técnica por primera vez, hágalo en forma pormenorizada. Si
es una técnica corriente y la usó sin modificar, alcanza con informar el nombre
habitual y la cita bibliográfica. Pero... si esa cita aparece en publicaciones de difícil
acceso, será mejor que transcriba la descripción.

23.6.5.2 - Listar los Materiales


Haga un listado completo con la descripción detallada de los materiales
empleados. Por ejemplo: en el caso de soluciones, el nombre genérico de la droga,
y la dilución; para aparatos, las características técnicas, el modelo y
eventualmente la casa fabricante; para animales la especie y la subespecie; para
células, la progenie, etc. Evite hacer publicidad gratuita pero si ciertos productos
tienen calidad particular, agregue a los datos mencionados, el nombre comercial
y la casa fabricante.
Si piensa publicar revise un ejemplar reciente de la revista, vea cómo lo hicieron
quienes ya publicaron y trate de imitarlos. Actualmente tanto el hardware como
el software comercial se consideran materiales y se debe registrar la marca, el
fabricante y todos los datos que fueran necesarios para que otro investigador
pueda usarlos y comprobar su eficacia.
Tomando como criterio la operacionalización de las variables (ap. 10.3), su
descripción de los “MATERIALES Y TÉCNICAS” será COMPLETA cuando indique
los procedimientos de operacionalización y las técnicas necesarias para
reproducir la investigación; PARCIAL cuando ha descripto una parte e
INDETERMINABLE, si el apartado falta por completo. Estas últimas categorías
justifican un rechazo absoluto.
Tenía los sujetos y midió las variables. Cuando comunica sus resultados, en
realidad está informando los RESULTADOS DE LAS MEDICIONES o datos
obtenidos, tal como le muestro de seguido.

23.6.6 Información que debe figurar en Procesamiento de Datos y


Análisis Estadístico
El procesamiento de datos es una secuencia de actividades que comienza
con la recolección de los datos y finaliza con la producción de las estadísticas, tablas
y gráficos, denominados en conjunto, resultados. A través de su interpretación se
obtendrán enunciados científicos que se puedan sustentar en ellos: las
conclusiones. El detalle del procesamiento se puede consultar en la literatura (65).

- 203 -
Bajo este epígrafe, en el informe deberá indicar cómo se recogieron y
procesaron los datos. Raramente necesitará describir la planilla o ficha en la que
registró los datos. Un modo sencillo de resolver el problema consiste en tomarles
una fotografía o escanearla e incluirla en las ilustraciones.
Haga una lista de las variables que fueron registradas, dentificándolas según
categoría.
Para el problema del consumo de sushi (ap. 10.5 ) por ejemplo serían:
VARIABLES EN ESTUDIO : Consumo de sushi , Presencia de complicaciones
cardiovasculares.
COVARIABLES (a modo de ejemplo) sólo pondremos algunas posibles: Tiempo
que se lleva consumiendo sushi, Antecedentes heredofamiliares de patología
cardiovascular, Obesidad, Diabetes.

- 204 -
Además, en toda investigación habrá registrado las VARIABLES DE
IDENTIDAD Y CONTEXTO a saber: Nombre del proyecto, Número de historia
clínica o de ficha , Lugar de realización del proyecto, Año, mes y día, Nombre
del paciente , Sexo biológico, Edad, Número de grupo al cual pertenece el
paciente si hay más de uno, Nombre del investigador a cargo.
Convengamos que los datos pertinentes son los derivados de las
mediciones de las variables en estudio y a controlar, que se usarán para
responder al problema que generó la investigación y de la organización de las
variables identidad y contexto (por ejemplo la descripción demográfica), que
sirven para contextuar la información aunque no responden de manera directa
al problema.
Para el “procesamiento y análisis estadístico de los datos” use el
siguiente modelo (65):

Los datos fueron registrados en una planilla cuyo modelo se adjunta y


volcados en una base de datos .... (nombre de la base de datos, por ej.: Fox
Base+ 2.1 © 1988 Fox- Software.) y luego analizados empleando el paquete
estadístico ....(nombre del paquete estadístico por ej.: Statistix Versión 3.5
© 1985/91 Analytical Software).
Para todas las variables se estableció la distribución de frecuencias y/o los
porcentajes en relación con el total de casos. Para aquellas medidas en escala
ordinal o superior, se computaron las siguientes estadísticas: Número de
casos, Valor mínimo hallado, Valor máximo hallado, Media aritmética,
Desvío Estándar y cualquier otra que hubiera sido necesaria a partir de la
distribución de frecuencias. Cuando fue necesario se utilizaron las pruebas
de significación indicadas según escala de medición y distribución de la
variable dependiente. El nivel de significación establecido fue de alfa = ...
(valor de alfa) mientras que el error tipo II se estableció en ... (valor de beta).

Utilice las partes del modelo que necesite y modifique según su conveniencia.

23.6.7 Información que debe figurar en Resultados


Los resultados están conformados por el conjunto de datos derivados
del análisis de las variables en estudio y covariables a controlar.
Bajo este epígrafe, los resultados toman diversos formatos : descripción
en texto, tablas simples, tablas a doble entrada, gráficos, etc. Dada la
complejidad adquirida en la actualidad por estas operaciones, opté por
sugerirle que consulte la literatura disponible (59,60,62,65) y usar el espacio
para cuestiones relacionadas con las conclusiones y la discusión, aspectos
habitualmente menos formalizados.
Se verá obligado a exponer los datos primarios sólo si tiene muy pocas
observaciones ( a propósito de un caso y en general menos de 10 pacientes)

- 205 -
A partir de 30 casos puede usar estadísticas. Entre 10 y 30, Ud. elige la
manera.
Los “Resultados” apoyan en parte la verificabilidad de las
“Conclusiones” . Lo ideal es que el resto de la comunidad obtenga cifras
parecidas a los que Ud. publicó. Cuando muchas personas encuentran diferencias
es posible que duden del trabajo... pero ya estará publicado. Si hizo un buen
trabajo no lo menosprecie. (ap. 23.6.9.4)
Teniendo los resultados puede valorar la conexidad con los objetivos. Convengamos
que la categoría Indeterminable corresponde a los informes en los que faltan los
objetivos y/o los resultados. Dirá que hay Conexidad Total cuando con los
resultados puede producir toda la información buscada en los objetivos y parcial
cuando sólo se puede producir parte de la misma. Si no existe Conexidad Parcial
o T otal entonces se asigna categoría Inconexo.
Si le faltan resultados, no puede sustentar las conclusiones que pierden su base
empírica. La indeterminabilidad de y/o la inconexidad justifican el rechazo absoluto
y la conexidad parcial, el rechazo relativo.
Para los datos derivados, se agrega la condición haber empleado las reglas
indicadas para cada escala de medición. Por ejemplo: la mejor circunstancia
para emplear una media aritmética se da cuando los datos primarios han sido
obtenidos en una escala de medición de intervalar y su distribución sea normal.
(3, 23) Esta “falla” pueden justificar sólo rechazos relativos ya que hay
posibilidad de usar ciertas estadísticas independientemente de la escala de
medición de la variable. (19)

23.6.8 Información que debe figurar en Conclusiones


Las conclusiones son afirmaciones con las que responde de manera directa
al problema tomando como base exclusivamente los resultados obtenidos.
Algunos autores también las denominan conclusiones primarias o internas en
contraposición a las conclusiones derivadas o externas que serían las que se obtienen
por conjugación de las primarias y las de trabajos de otros autores. (59)
Opino que deberían conformar un apartado especial del informe. Un análisis
racional muestra que, después indicar qué buscaba, cómo lo buscó y cuáles
resultados obtuvo, Ud. está en condiciones de llegar a una conclusión y no
hay ningún motivo racional para que primero escriba los "Comentarios" y/o la
"Discusión", del modo como se lo piden a veces (59).
Al hacerlo distrae la atención del lector. Así que algunos aprovechan esta
circunstancia para disimular sus conclusiones tras una cortina de palabras y
tal vez, no puntualizarlas jamás.
Disponiendo de los objetivos y las conclusiones, está en condiciones de
valorar las cualidades deseables de su informe de manera rápida y eficiente
(tanto que constituyen la base de la técnica OPD de lectura crítica abreviada
(cap. 24).

- 206 -
La secuencia sería la siguiente:
a - Determine la CONEXIDAD ENTRE OBJETIVOS Y CONCLUSIONES según
las siguientes reglas: Indeterminable: ausencia de objetivos y/o conclusiones;
Conexidad Total: las conclusiones ofrecen toda la información buscada en los
objetivos y nada más que esa. Parcial cuando ofrecen parte. Inconexidad: ausencia
de conexidad. La indeterminabilidad y la inconexidad justifican un rechazo
absoluto. La conexidad parcial justifica un rechazo parcial, si los objetivos y los
resultados son conexos. (cuadro 23.6.8)

CUADRO 23.6.8 - Ejemplos de conexidad entre objetivos y conclusiones

b - Determine la CONEXIDAD ENTRE RESULTADOS Y CONCLUSIONES según


las siguientes reglas. Indeterminable: ausencia de resultados y/o conclusiones.
Conexidad Total: los resultados son los necesarios y suficientes para sustentar
las conclusiones y Parcial cuando los resultados no son suficientes. Inconexidad:
ausencia de conexidad. La indeterminabilidad y la inconexidad justifican un rechazo
absoluto. La conexidad parcial justifica un rechazo parcial, si los objetivos y los
resultados son conexos.
Se puede demostrar lógicamente que la conexidad es una relación transitiva.
Si las conclusiones son totalmente conexas con los objetivos y éstos con los
resultados, puede estar seguro que las conclusiones son conexas con los
resultados.

- 207 -
Desde un punto de vista práctico el análisis de conexidades puede limitarse
a determinar las duplas objetivos - resultados y luego resultados - conclusiones.
Cualquier situación diferente de la conexidad total entre los distintos
componentes, justifica grados diversos de rechazo del informe.

Ahora ya produjo la información. Ahora es tiempo de evaluar calidad del


trabajo, la consistencia con el resto del conocimiento y las proyecciones que
puede tener. Esas son funciones del apartado sobre “Discusión y Comentarios”.

23.6.9 Información que debe figurar en Discusión y/o Comentarios

Si Ud. es una persona con mucha experiencia escribiendo, tal vez no


descubra nada nuevo. La creatividad, el talento y los conocimientos del
escritor ilustran este apartado de maneras diferentes. Si es su primer informe,
piense sobre los aspectos que trato seguidamente y desarrolle por escrito
los que le convengan y se adapten a su situación particular. Propongo que
bajo este epígrafe se desarrollen al menos los siguientes aspectos : valoración
de la validez interna, valoración de la consistencia externa y, hasta donde
sea posible, una proyección de los beneficios resultantes del conocimiento
producido.

23.6.9.1 Valoración de la Validez Interna del informe


Algunos autores se refieren a este apartado, señalando un subtítulo
destinado a debilidades y fortalezas del trabajo. Se evalúa hasta dónde se
cumplieron las reglas del método científico:
¿ Es replicable todo el proceso descripto ?
¿Se hizo control de todas las variables confundentes, tanto conocidas
como desconocidas ?
¿El tamaño muestral fue el adecuado, sea por calculo , obtención (cap.
9) o por resultados (ap. 11.5) Si no estimó el tamaño muestral antes,
indique cuál podría ser el efecto sobre las conclusiones.
¿Se puede(n) considerar la(s) muestra(s) obtenida(s) como
representativas de la población blanco ?
¿ Ocurrió algo relevante para la interpretación de los datos durante la
ejecución de la investigación ? (por ejemplo: ¿hubo inconvenientes en
el uso de algún aparato o hizo falta cambiar un equipo o el operador del
mismo? etc.).

Si informó que durante la realización del trabajo ocurrieron condiciones


extraordinarias que pueden viciar los resultados se está exponiendo a un
rechazo absoluto por invalidez de los datos.

- 208 -
Si su dura realidad es ésta, no intente publicar ... a menos que esté frente a
un gran descubrimiento. En este caso hipotetice, pero nunca afirme... porque
no puede.
23.6.9.2 Valoración de la Consistencia Externa del informe
a - Señale los límites de los hallazgos y sus posibles implicaciones.
b - Publicaciones previas: si otros autores habían escrito trabajos similares
compare los procedimientos empleados y las conclusiones con las suyas,
analizando los méritos y validez de cada trabajo. Utilice, citas elegidas y sobre
la misma materia, no repetitivas ni históricas. (10)
c -Compare con objetividad, sus resultados con los publicados. Explique claramente
las diferencias que existan con otros autores, tanto en la selección del material
como en el método seguido y en los resultados. La citas provenientes de otras
publicaciones se harán con precisión, sin eliminar frases o palabras.
d - No omita evidencias provenientes de otros autores con el propósito de que
la investigación propia aparezca como única o más importante. Si un trabajo
sobre la misma cuestión publicado con anterioridad llegó a idéntica conclusión,
no se debe enmascarar su cita en la Discusión (60)
e - Busque contrapruebas merecedoras de presentación y valoración. Las
evidencias ajenas que apoyan los hallazgos propios no deberían constituir las
únicas pruebas que se presenten en Discusión. (60)

23.6.9.3 - Valoración de la Validez Externa del informe


¿ Hasta qué punto los hallazgos de un ensayo terapéutico se pueden
generalizar a toda la población de pacientes con la enfermedad ?
¿ Existen aplicaciones justificables con base en esta investigación ? ¿De qué
manera se pueden vincular los hallazgos con fenómenos a niveles más o menos
complejos de análisis? ¿Qué se necesita saber para establecer tales vínculos? (89)

23.6.9.4- Información que NO debe figurar en Discusión y/o Comentarios


Algunos autores señalan que la "exageración" sería la mayor perversión de
la Discusión, favorecida en ciertos ámbitos por la naturaleza de algunos autores.
A ello se pueden agregar otros intereses ya individuales o corporativos. De hecho
existe la posibilidad de que las conclusiones de algunos artículos nada tengan
que ver con los hallazgos realizados. Así los fármacos salen de la Discusión con
calificaciones mejores que las conseguidas en los Resultados o las técnicas quirúrgicas
aparecen como inmejorables cuando sólo han obtenido estimaciones mediocres. (10)
En otras ocasiones los Resultados de una pequeña serie se extrapolan
gratuitamente en la Discusión y se concluye el artículo afirmaciones que se vienen
abajo con una mínima valoración. Incluso se publican estudios ampulosamente
llamados multicéntricos, cuando ha sido un único equipo el responsable del
trabajo y los otros, a lo sumo, sólo han colaborado con el envío apresurado de
los cuestionarios. (10)

- 209 -
Algunas recomendaciones serían:
No reclame una aparente prioridad.
NO la haga innecesariamente extensa.
NO revise el tema a fondo : muchos autores que han recogido abundantes citas
bibliográficas, no se resignan a excluirlas de la Discusión, haciendo de ella una
simple revisión de otros artículos.
NO discuta conocimientos aceptados como válidos o incluso disponibles en libros
de texto.
NO insista con datos colaterales
NO realice afirmaciones sin fundamento empírico
NO finalice proponiendo la elaboración de otro trabajo. Es censurable que finalice
un artículo sobre una investigación mal planeada o deficiente proponiendo que
se haga otra mejor o que se requieren más trabajos con mejor diseño para
precisar las dudas que ha dejado el actual, a menos que la contradicción entre
las evidencias propias y los otros ensayos no se pueda justificar y la discrepancia
sólo puede ser resuelta a través de un nuevo estudio, (10, 59)
No incluya las CONCLUSIONES primarias o internas.
Tampoco re escriba los RESULTADOS o enunciados formulados en la
Introducción.

Otro peligro es el menosprecio del trabajo propio. Si el investigador no está


seguro de lo que dice o desconfía de sus observaciones y hallazgos, mejor haría
deteniéndose y reflexionando antes de escribir el trabajo. Pero tampoco se debe
intimidar ante hallazgos sorprendentes o inesperados. La historia de la ciencia en
sus grandes o pequeños avances está moldeada con observaciones asombrosas y
ni ello o la incredulidad de otros investigadores debe detener la comunicación científica.
William Harvey fue ridiculizado al describir la circulación de la sangre y Semmelweiss
en 1847 fracasó en su intento de obligar a los médicos de un hospital de Viena a
que se lavaran las manos antes de traer niños al mundo. Todos conocemos como
la propia historia de la Medicina y de la Ciencia en General, está repleta de escepticismo,
cuando no de envidias y rencores. (10)

23.6.9.5 - Redacción del Cierre de la Discusión


No hay que extenderse demasiado en deducciones y especulaciones; los
lectores de artículos científicos buscan conclusiones sólidas basadas en hechos.
(60) Si lo considera oportuno, destaque los aspectos nuevos e importantes de
sus observaciones.
¿Por qué es importante el problema? ¿Qué se modificó a partir de su trabajo? ¿Qué
cuestiones más amplias que trascienden las particularidades de la especialidad, dependen
de los hallazgos? ¿Qué proposiciones se confirman o no mediante la extrapolación de
estos descubrimientos a tales temas de mayor importancia? ¿Qué fenómenos de la vida
real es posible explicar o modificar en función de los resultados? Si hizo “recomendaciones”
asegúrese que se pueden basar en las conclusiones porque si no es así se hace pasible de un
rechazo relativo. Este apartado es el único donde tiene posibilidad de hacer especulaciones
o sea hipótesis sobre la interpretación y/o aplicación de lo informado, para cuyo apoyo
Ud no posee datos; presunciones plausibles que deberán ser verificadas a posteriori. (68)

- 210 -
Una alternativa es finalizar la DISCUSIÓN delimitando las líneas por las cuales
se debería profundizar la investigación.
Los distintos apartados ya están escritos. Es tiempo de ensamblar.

Antes de pasar al listado de tareas para ensamblar debo señalarle que, el


ensamblado se hace a partir de algún plan inicial. Si partió de un protocolo,
obtendrá los materiales para la construcción del informe a partir del mismo. Si
no, entonces usará algún resumen que tenga. Si no tiene ninguno, entonces no
comience por redactar todo el trabajo, redacte primero algún modelo de resumen
(aps. 23.4 y 23.5 ) y luego el trabajo propiamente dicho.

- 211 -
Una alternativa es finalizar la DISCUSIÓN delimitando las líneas por las cuales
se debería profundizar la investigación.
Los distintos apartados ya están escritos. Es tiempo de ensamblar.

23.7 - Modelos de SECUENCIAS DE ENSAMBLADO DEL TRABAJO CIENTÍFICO


23.7.1 - Modelo de listado de tareas para ensamblar el informe de
un trabajo realizado bajo protocolo

1 – Obtenga una copia reciente de las INSTRUCCIONES PARA REDACCIÓN DE


TRABAJOS ORIGINALES provista por la Institución, Publicación o Evento en el que
piensa presentar el trabajo.
2 – Arme un “esqueleto” con los distintos encabezados correspondientes al
trabajo científico. Utilice el modelo propuesto en la Institución, Publicación o
Evento donde piensa presentar el trabajo o el del cuadro 23.1
3 – Introducción : bajo el encabezado correspondiente inserte una copia de
la Introducción tal como la redactó en el Protocolo, dejando siempre los Objetivos
al final de este apartado.
Modifique el contenido según los cambios que se hubieran podido realizar desde
el momento en que hizo la redacción para el Protocolo. Coteje lo escrito con las
instrucciones recibidas y el ap. 23.6.1
4 - Resultados: inserte los Resultados que hubiera preparado a partir del ap.
23.6.7
5 – Conclusiones: bajo el encabezado correspondiente inserte las
Conclusiones y luego analice la conexidad entre Objetivos, Resultados y
Conclusiones. Coteje lo escrito con las instrucciones recibidas y el ap. 23.6.8
6 – Diseño Materiales y Métodos: inserte Diseño, Materiales y Métodos
usando como fuente el protocolo.
Modifique el contenido según los cambios que se hubieran podido realizar desde
el momento en que hizo la redacción para el Protocolo.
Analice la conexidad del apartado DMyM con los objetivos, los resultados y las
conclusiones. Coteje lo escrito con las instrucciones recibidas y los ap. 23.6.5 y
23.6.8
7 – Población: bajo el encabezado correspondiente inserte Población usando
como fuente el protocolo.
Modifique el contenido según los cambios que se hubieran podido realizar desde
el momento en que hizo la redacción para el Protocolo. Coteje lo escrito con las
instrucciones recibidas y el cap. 8
8 – Diseño muestral : bajo el encabezado correspondiente inserte la
información sobre el Diseño Muestral utilizado. Modifique el contenido según
los cambios que se hubieran podido realizar desde el momento en que hizo la
redacción para el Protocolo. Coteje lo escrito con las instrucciones recibidas y el
cap. 9
9 – Muestras : bajo el encabezado correspondiente inserte la información
sobre la o las muestras obtenidas.Coteje lo escrito con las instrucciones recibidas
y el ap. 23.6.3
10 – Discusión y Comentarios: bajo el encabezado correspondiente inserte la
Discusión que hubiera preparado a partir del ap. Coteje lo escrito con las
instrucciones recibidas y el ap. 23.6.9

- 212 -
11- Resumen : bajo el encabezado correspondiente inserte el Resumen que
hubiera preparado a partir del ap.23.5
Si ya lo había publicado previamente (por Congreso, Jornada, etc) corrobore que
no existen discordancias entre el Resumen publicado y el resto del escrito actual.
Si el Resumen ya había sido publicado, podría optar por usar el procedimiento de
Redacción con Resumen publicado.

23.7.2 - Modelo de listado de tareas para esamblar el informe de


un trabajo realizado a partir del resumen tipo 2b. cuando no
dispone de protocolo
1 – Obtenga una copia de las INSTRUCCIONES PARA REDACCIÓN DE
TRABAJOS ORIGINALES provista por la Institución, Publicación o Evento en el que
piensa presentar el trabajo.
2 – Arme un “esqueleto” con los distintos encabezados correspondientes al
trabajo científico. Utilice el modelo propuesto en la Institución, Publicación o
Evento donde piensa presentar el trabajo o el del cuadro 23.1
3 – Introducción : bajo el encabezado correspondiente inserte la
“Introducción” que hubiera publicado en el Resumen dejando siempre los
Objetivos al final. Si es necesario agregue la información que considere
conveniente. Coteje lo escrito con las instrucciones recibidas y el ap.23.6.1
4 - Resultados: bajo el encabezado correspondiente inserte los Resultados
escritos en el Resumen. Agregue aquellos Resultados que, siendo importantes,
no se escribieron en el Resumen por razones de extensión. Coteje lo escrito con
las instrucciones recibidas y el ap.23.6.7
5 – Conclusiones : bajo el encabezado correspondiente inserte las
Conclusiones escritas en el Resumen. Analice la conexidad entre Resultados y
Conclusiones.Coteje lo escrito con las instrucciones recibidas y el ap.23.6.8
6 – Diseño Materiales y Métodos: bajo el encabezado correspondiente inserte
Diseño, Materiales y Métodos usando como fuente el Resumen. Agregue aquellos
MyM que, siendo importantes, no se escribieron en el Resumen por razones de
extensión. Complete todos los detalles necesarios a los fines de la replicabilidad
(ap 23.6.5 ) . Analice la conexidad del apartado DMyM con los objetivos, los
resultados y las conclusiones.Coteje lo escrito con las instrucciones recibidas y
el ap. 23.6.8
7 – Población: Bajo el encabezado correspondiente inserte Población usando
como fuente el Resumen. Coteje lo escrito con las instrucciones recibidas y el
cap. 8
8 – Diseño muestral : bajo el encabezado correspondiente inserte la
información sobre el Diseño Muestral utilizado proveniente del Resumen.
Agregue aquellos elementos que, siendo importantes, no se escribieron en el
Resumen por razones de extensión. Coteje lo escrito con las instrucciones
recibidas y el cap.9
9 – Muestras : bajo el encabezado correspondiente inserte la información
sobre la o las muestras obtenidas a partir del contenido del Resumen. Agregar
aquellos elementos que, siendo importantes, no se escribieron en el Resumen
por razones de extensión.Coteje lo escrito con las instrucciones recibidas y el
ap. 23.6.3

- 213 -
10 – Discusión y Comentarios : bajo el encabezado correspondiente inserte
la Discusión que hubiera preparado.Coteje lo escrito con las instrucciones
recibidas y el ap. 23.6.9
11- Resumen: bajo el encabezado correspondiente inserte el Resumen que
hubiera preparado. Muy probablemente lo había publicado (por Congreso,
Jornada, etc) Si fue así no cambie ni una coma y corrobore que no existen
discordancias entre con el resto del escrito actual. Coteje lo escrito con las
instrucciones recibidas y el ap.23.5

Sin considerar el modelo de ensamblado, cuando haya finalizado y en todos


los casos deberá analizar la validez del escrito en su totalidad considerando :
conexidad, coherencia externa, coherencia interna y validez externa. (ver ap.
21.2)

Si no hubiera elegido el título, cuando redactó el resumen podrá tomar en


cuenta las recomendaciones que se dan en el apartado siguiente.

23.8 - Eligiendo un título para el trabajo


Hay autores que lo ven como un gancho de atracción para lectores
potenciales : “El título es el primer contacto que tiene el lector con el escrito .
Debería ser explicativo, breve y claro con suficiente atractivo como para llamar
la atención del lector”. (89)
Pienso que los profesionales no eligen un título para leer como se elige un libro o una
película para un fin de semana. Buscan información para resolver problemas concretos.
Con todo, en estos tiempos, es posible que algunas personas naveguen en las publicaciones
buscando títulos atractivos por motivos que, óbviamente, no son científicos.

Es probable que sea rara la situación en la que el autor escribe el título


al primer intento. Deberá realizar varios borradores antes de llegar al
definitivo. Y el objetivo me parece la mejor guía: expone la información que
se busca y la población blanco.

- 214 -
La información que se busca se refiere a los valores de una variable o a una
hipótesis que trata de establecer relaciones entre variables ( ap. 4.2). Así que en
el título tienen que figurar, de manera genérica, las soluciones halladas : si se
buscaban cifras, señalando las estadísticas obtenidas, y si se testeaba una
hipótesis, si fue corroborada o no. Por lo tanto, en un primer borrador indique
qué información se ha encontrado y la población blanco. Luego aplique las reglas
de sintaxis necesarias.

Es sabido que algunos índices (Current Contents) seleccionan las palabras clave de
acuerdo con la información contenida exclusivamente en el título del artículo. (89) Esto
refuerza la posición exponer la información obtenida y la población blanco.Puede
también consultar literatura especializada sobre el tema de Redacciones Científicas
(10,59, 60, 61) O buscar ideas en Internet, googleando como palabras clave : título, trabajo
científico, redacción.

Algunos detalles interesantes sobre el título provenien de Caldeiro -Feliu(10):

- Emplee todos los signos de puntuación que precise, a excepción del punto final, del
cual se prescinde por convención tipográfica (cuantos menos signos, mayor atracción)
- Incluya el nombre del grupo en caso de autoría corporativa.
- Aluda a conceptos de diseño (por ejemplo, estudio multicéntrico, asignación
aleatoria, estudio controlado, etc) para facilitar búsquedas de literatura.
- Si el artículo es parte de una serie, emplee el mismo título para todos los artículos ,
seguido por una oración o sintagma que aporta la diferencia que existe entre ellos.
Por ejemplo: La resonancia magnética nuclear indicaciones (I) - La resonancia
magnética nuclear técnica (II) La resonancia magnética nuclear resultados (III)
- Evite las expresiones retóricas como «consideraciones acerca de ..», «a
propósito de un caso de ...», <da fiebre tifoidea en nuestro medio ..», «revisión
de la literatura a propósito de un caso de ..» - No incluya abreviaturas. En caso
de que resulte excesivamente largo, puede emplear una abreviatura
ampliamente conocida. Cuando sea posible añadir un subtítulo al título
ampliando o matizando su contenido, considere que - no debe contener más
del doble de caracteres que el título - debe tener sentido por sí mismo; es
decir, aunque esté relacionado con el título, no debe ser su continuación.

Para redactar su trabajo, habrá tenido que leer muchos de otros autores.
Habrá descubierto empíricamente que, si bien hay mucho publicado, son escasos
los escritos valiosos. Tal vez hubiera querido disponer de un método para
seleccionarlos y no perder tiempo con información no válida. Precisamente ese
es el tema del próximo capítulo.

- 215 -
24 - TÉCNICA DE LECTURA CRÍTICA DE INFORMES
CIENTÍFICOS: OPD SIMPLIFICADA
Textualmente se lee en la página del Journal of Evidence Based Medicine
: “ … el EBMJ escanea más de 120 journals anuales, unos 50000 artículos de
los cuales selecciona aproximadamente 0.5%” (90)
Existe consenso, en el sentido que la oferta de información es abundante.
Pero hay investigaciones (23, 27, 42, 44,52, 54, 57) que indican que más de un
70 % de los trabajos evaluados tienen fallas en su validez. Algunos autores
(entre quienes me incluyo) considera que menos del 1 % de lo publicado es
simultáneamente válido y de aplicación clínica inmediata (52, 57,58,81)
Leyendo indiscriminadamente toda la información publicada Ud perdería al
menos un 70% de su tiempo. La solución: identificar rápidamente los trabajos
válidos. Esto lo pueden hacer, en diverso grado : expertos en el tema,
estadígrafos relacionados con Ciencias Médicas, metodólogos, epistemólogos,
epidemiólogos y, actualmente, evidenciólogos.
Se han propuesto técnicas relativamente complejas (23, 27, 42,81). Comparto
parcialmente sus principios ya que tienen un sesgo hacia los aspectos estadísticos,
en desmedro de los lógicos, que a mi entender deberían ser prioritarios.
Por mi parte he venido perfeccionando un procedimiento desde 1985 (15)
que denominé técnica OPD por las iniciales de los primeros tres componentes
del análisis: Objetivos, Población y Diseño. Con el tiempo llegué a organizarla
de tal modo que la aplico en las dos etapas que relato en el apartado siguiente.
Parto del principio que ciertos componentes del informe son rápidamente
identificables y cuando tienen fallas, justifican el rechazo absoluto.

24.1 - Reglas para la aplicación de TÉCNICAS DE LECTURA CRÍTICA


No importa cuál técnica vaya a emplear Ud no jugará el rol de un juez que
debe sentenciar si cierta información es verdadera o falsa, sino el de un
consumidor que está por comprar un producto alimenticio nuevo.
Ud. no conoce el producto, y no tiene porque desconfiar, pero va a tomar
ciertas precauciones, por ejemplo buscar la fecha de vencimiento. Si no la
encuentra tendría derecho a clasificarlo como “no apto para consumo”.
Esto no quiere decir que el producto está descompuesto o que sea de mala
calidad. Sólo significa que no lo piensa consumir porque no reúne las
condiciones de confiabilidad necesarias. Lo importante es que no consuma si
tiene dudas.
Homologando la situación, después de aplicar una técnica completa de
lectura crítica podremos categorizar a un trabajo como “NO APTO para justificar
una norma o documentar otra investigación” porque no podremos usar la
información que provee por falta de confiabilidad. (Como el producto sin
fecha de vencimiento).

- 216 -
Otra cosa sería decir que la información es FALSA, pero eso no le consta por
la sola lectura del trabajo.
En contraposición, si cumple con todos los requisitos, catalogará el trabajo
como “APTO para justificar una conducta o documentar una investigación”. Otra
cosa sería decir que la información es VERDADERA, pero eso tampoco le consta
por la sola lectura del trabajo.
La aplicación de técnicas completas consume tiempo, que se puede ahorrar
dividiendo la tarea en dos: primero un screening rápido con la técnica simplificada
para categorizar los trabajos en “no apto” o “presuntamente apto”; en una
segunda etapa se analizarían los presuntamente aptos, con procedimientos más
laboriosos para su aceptación o descarte final.
Nuestra técnica OPD simplificada se aplica en 30 segundos y tiene un poder
predictivo positivo del 100 %. O sea el 100 % de los trabajos cuestionables,
efectivamente “tienen validez cuestionable" y por lo tanto la información que
proveen se debe considerar como “no apta…” aunque pueda ser muy interesante
como propuesta teórica. Posee un poder predictivo negativo que se puede
estimar en un 85 %. Es decir que un 15 % de los trabajos “presuntamente aptos”
aún pueden ser cuestionables en una segunda evaluación. Piense en este
procedimiento como una receta inicial. Si quiere hacer un flan y no sabe, iría a un
libro de cocina y seguiría la receta hallada. Después de cocinar muchos flanes,
seguramente tendrá una receta propia. La receta que le ofrezco es solo para
empezar. Con el tiempo Ud tendrá la suya.

24.2 - Técnica OPD simplificada de valoración de trabajos científicos


PASO 1 – Busque los objetivos del trabajo donde quiera que estén ( tanto
en el resumen como en el cuerpo del trabajo). Si al leerlos, Ud. puede contestar
con un si, un no o con cifras, entonces los objetivos son precisos. (Mire los
objetivos formulados en los cuadros 5.1, 5.2.1, 5.2.2 y verá que las respuestas son
cifras, si o no). Si están y son precisos pase al siguiente punto. Si no están o no
son precisos termine su lectura crítica aquí. Ya puede dictaminar que el trabajo
es “NO APTO”. Seguramente no querrá creerme, así que siga hasta que esté
convencido… Pero recuerde que le avisé.
PASO 2 – Busque las conclusiones del trabajo, donde quiera que estén ( tanto
en el resumen como en el cuerpo del trabajo). Si las conclusiones se resumen en
un SI, un NO o cifras, entonces son precisas. Si las conclusiones no son precisas,
entonces “son vagas”. Si están y son precisas pase al siguiente punto. Si no
están o son vagas termine su lectura crítica aquí. Ya puede dictaminar que el
trabajo es “NO APTO”. Seguramente no querrá creerme, así que siga hasta que
esté convencido… Pero recuerde que le avisé.
PASO 3 - Valore la conexidad entre objetivos y conclusiones : Son conexos
si: 1-ambos existen, 2- ambos son precisos 3- en la conclusión se responde sólo al
objetivo y nada más que él. Observe algunos ejemplos en el cuadro 23.6.8

- 217 -
Si objetivos y conclusiones son conexos pase al siguiente punto, si no
termine su lectura crítica aquí. Ya puede dictaminar que el trabajo es “NO
APTO”. Seguramente no querrá creerme, así que siga hasta que esté
convencido… Pero recuerde que le avisé.
PASO 4 - Valore la definición de población: Categorice la definición de
POBLACIÓN en COMPLETA, INCOMPLETA, AUSENTE. Es completa cuando se
han formulado los criterios de inclusión y de exclusión, y si fuera necesario los
de eliminación. La definición de población está ausente o incompleta termine
su lectura crítica aquí. Ya puede dictaminar que el trabajo es “NO APTO”.
Pero si ha llegado hasta aquí siguiendo secuencialmente los pasos 1 a 4, y
en ningún momento pudo rechazar el trabajo entonces puede declararlo
“presuntamente apto” y ponerlo aparte para analizarlo en mayor profundidad,
ya sea con la OPD completa o con cualquier otra técnica, como por ejemplo
según medicina basada en evidencias.(90)

24.3 - Conceptos de validación de informes científicos según


medicina basada en evidencias
Mientras diseñaba la técnica OPD otros especialistas trabajaban sobre el
problema de la documentación por caminos diferentes y promovían un nuevo
“paradigma”: la Medicina Basada en la Evidencia (81). El término fue acuñado
en la década del 80 en la McMaster Medical School of Canadá como la
integración de la mejor evidencia de investigación con la habilidad clínica y los
valores del paciente.
Genéricamente los siguientes modelos de diseño indican que existe
adecuada (buena) evidencia científica para recomendar o desaconsejar la
adopción de la tecnología: Metanálisis de ensayos controlados y aleatorizados,
Ensayo Controlado y aleatorizado de muestra grande, Ensayo controlado y
aleatorizado de muestra pequeña (enfermedad poco prevalente)
Por su parte los siguientes diseños indican que existe cierta evidencia
científica para recomendar o desaconsejar la adopción de la tecnología: Ensayo
controlado y aleatorizado de muestra pequeña (enfermedad prevalente),
Estudios de Cohorte, Estudios de caso y control, Ensayo Clínico No
aleatorizado.
Finalmente los diseños que identifican estudios que no ofrecen evidencia
científica para recomendar o desaconsejar la adopción de la tecnología son: Series
Clínicas , Estudios Transversales, Conferencia de Consenso, Comités de Expertos,
Anécdotas ( a propósito de un caso). La descripción completa de los modelos de
validación propuestos en MBE, trascienden el alcance de este libro por lo que le
sugiero consultar las obras y/o los sitios correspondientes en Internet. ( Apéndice)

- 218 -
24.4 - Comparación entre OPD y MBE

En mi opinión, los pilares para la validación de trabajos científicos son


lógicos y metodológicos. La validación estadística es secundaria: gran número
de trabajos defectuosos, van acompañados de cálculos estadísticos
perfectamente realizados.
Considero que la MBE es un excelente modelo para la formación de
profesionales y es muy eficaz como método de selección, pero tengo mis dudas
sobre su eficiencia para el uso cotidiano. La evaluación de los trabajos con ella
requiere capacitación en Estadística, Epidemiología y Metodología de la
Investigación, que son ciencias que a su vez están en continuo cambio. Así que
el profesional además de actualizarse en Medicina, también debe hacerlo en
aquellas. Tengo la impresión que la carga es muy alta y trasciende las posibilidades
del profesional asistencial estándar.
Por su parte los conceptos lógicos implicados en la técnica OPD (que los
enunciados de un trabajo científico deben ser replicables , conexos y
consistentes, y que debe haber control de covariables conocidas y desconocidas)
no van a cambiar . Una vez aprendida su aplicación sólo resta perfeccionarla.
Dentro de la validez interna, el criterio más importante es la replicabilidad
del trabajo. Una investigación (trabajo científico) es replicable si está escrito como
una receta: de tal modo que si Ud sigue los pasos descriptos, podrá obtener el
mismo resultado que el autor del trabajo. Si los pasos faltan, Ud no podrá
comprobar si lo que le están diciendo es verdadero o falso. (55,87)
En nuestros lugares de trabajo usamos la técnica OPD para realizar el
screening preliminar y luego, según el tipo de trabajo complementamos con la
OPD completa o las pautas dadas según la MBE.
Finalmente recuerde que así como hay contextos para el descubrimiento, los
hay para la aplicación del conocimiento. No siempre se puede conseguir el diseño
perfecto. Descartando la deshonestidad, los investigadores consiguen el mejor
posible para sus circunstancias. Una aplicación indiscriminada de la crítica puede
hacer que desprecie información valiosa. T enga cuidado con la aplicación que
da a esta técnica. Después que tenga los elementos de juicio, Ud. decidirá qué es
lo que conviene hacer con la información recabada. Eso sí... sólo después.
Si por algún motivo no sólo le interesa ahorrar tiempo, sino que quiere valorar
la totalidad del trabajo puede profundizar el análisis crítico (68)

- 219 -
25 - SÍNTESIS
Al finalizar el año lectivo, cuando se despiden educandos del mismo nivel,
prácticamente se dicen las mismas cosas. Mucho de lo que expresaré aquí,
estuvo en la página final de Principios.

Tal como le planteé las cosas la única manera de hacer investigación científica
es hacerla bien, es decir siguiendo las reglas del método científico. También está
en claro que hay muchas maneras de hacerlas bien, si respeta la validez interna.

Para que Ud. lo logre deberá tener deseos, tiempo, conocimiento y posibilidad
de consulta.

a) DESEOS: los adultos han aprendido que sólo logran lo que intentan, y solo
intentan aquello que quieren.
b) TIEMPO: la carencia de tiempo es un factor que el profesional suele
considerar limitante. Hay dos maneras de que le "falte tiempo": verdaderamente
le falte (nada que hacer !!!) o administra mal el tiempo que tiene. Trate de no
hallarse entre aquellos colegas que usan cantidades importantes de tiempo y otros
recursos, para llevar a cabo "trabajos" anodinos llamados injustamente
"investigaciones". Esos recursos podrían ser orientados a producir un número
menor de trabajos científicos, pero bien realizados.
c) CONOCIMIENTO BÁSICO DEL MÉTODO CIENTÍFICO: lo puede lograr a
través de programas organizados por instituciones educativas y/o asociaciones
profesionales. De éstos dispone una profusa oferta, tanto online como
presenciales, tanto pagos, como gratuitos.
Si participó de cursos de Metodología sabrá que pueden aparecer diversos
inconvenientes: el más común es que se trata de cursos de Estadística o
Epistemología, con el nombre cambiado. Raramente ofrecen un nivel de
entrenamiento que permita que el alumno aplique esa información en la práctica.
Parecería que una cosa es recibir formación en las aulas, y otra, poderla aplicar
efectivamente a investigaciones propias. De allí la trascendencia del apartado que
sigue.
d) POSIBILIDAD DE CONSULTA: hay evidencias que indican que muchos
profesionales médicos (incluso publicadores habituales) con frecuencia cometen
errores, que hubieran sido fácilmente evitados por el experto en Metodología.
(42, 44, 50). También existen principiantes o quienes, esporádicamente desean
participar del proceso de producción de información (como los investigadores
curriculares) y en ese momento notan las falencias formativas (65)
Puede ocurrir que el investigador no use una técnica, (por ejemplo estadística)
porque le es desconocida o porque fue entrenado en ella mucho tiempo atrás.
En ambos casos puede recurrir a la bibliografía, pero raramente alcanzará un
grado aceptable de certidumbre al momento de formular conclusiones.

- 220 -
Las instituciones que deseen tener un cuerpo de profesionales bien preparado
en asuntos de investigación debe proveer las oportunidades para que ellos reciban
entrenamiento y consulten con expertos cuando lo consideren necesarios.

Sobre estas bases promoví la idea (17) de desarrollar profesionalmente la


actividad de Asesoría Científica en Ciencias de la Salud instituyéndola como un
servicio regular institucional en el Hospital de Clínicas José de San Martín. Conté
para ello con el apoyo entusiasta de las autoridades del Hospital. Hoy continúa
con sus actividades, dirigida por quienes, en su momento, fueron aspirantes a
asesores y se formaron en nuestras filas. El ejemplo cundió y en muchas otras
instituciones hay servicios y/o profesionales que se dedican al Método.

Claro que investigar no es "soplar y hacer botellas". En todo el mundo,


sometidos a alguna clase de limitación, los investigadores clínicos hacen lo que
pueden y no lo que quieren, (y así creo que debe ser porque ESTAN AL SERVICIO
DE SUS CONGÉNERES Y NO A LA INVERSA).

No tengo recetas para hacer de Ud un investigador, pero puedo afirmar sin


ninguna duda que el ingrediente indispensable para serlo es la tenacidad.
Tenacidad para estudiar temas que son extraños al quehacer diario o para
obtener los recursos materiales o humanos faltantes para el logro del proyecto.
T enacidad que posiblemente no sea una virtud difundida, pero es patrimonio
de todo aquel que quiere cambiar el medio. (13)

Como su antecesor, Fundamentos buscó aproximar y facilitar a los colegas y


colaboradores, esta aventura apasionante que es la investigación con el ser
humano para su beneficio. Espero haberlo logrado y Ud. amigo lector, es,
nuevamente, el juez y el jurado.

***

- 221 -
http://www.institutodemetodología.net
http://goo.gl/bXQWqs
Calculo de intervalos de
confianza http://graphpad.com/quickcalcs/Cimean1/
Tablas de 2 x 2 todos los http://www.statpages.org/ctab2x2.html
cálculos necesarios (riesgo, cribaje,
pvalor, etc
Cálculo tamaños muestrales http://goo.gl/vFYk1o
http://goo.gl/qYTrg0
http://goo.gl/Ucn4F6

Epidat 3.1 http://goo.gl/Eo3RF5


VccStat http://1drv.ms/1wUGVym

PSPP (clon gratuito del SPSS,) http://sourceforge.net/projects/pspp4windows/

ESCRIBA http://1drv.ms/1L7M911

Todo el material mencionado en este apéndice, está disponible en forma gratuita


online en nuestro sitio, ya sea directamente o a través de los links
correspondientes.

- 222 -
- 223 -
1.Arnau Grass J: Diseños experimentales en psicología y educación. Mexico: Trillas, 1981.
2.Asti Vera Armando: Metodología de la investigación. Buenos Aires: Kapelusz, 1973.
3.Armitage P., G. Berry: Estadística para la investigación biomédica. 2a Ed Barcelona. Doyma, 1992.
4.Barbancho Alonso G.: Estadística Elemental Moderna. 5a Ed. Barcelona. Ariel,1978.
5.Barker,S F: Inducción e hipótesis. Buenos Aires. Eudeba: 1963
6.Bernard, C: Introducción al estudio de la Medicina Experimental. Buenos Aires. Losada:1944
7.Bernard,C: Curso de medicina experimental. Córdoba (RA). Assandri:1944
8.Bunge, M: La investigación científica. Barcelona. Ariel: 1969
9.Bunge Mario: La ciencia, su método y su filosofía. Ed. Siglo XX. Buenos Aires. 1980.
10.Caldeiro MA,Feliu E,Foz M,Gracia D,Herranz G : Manual de estilo de publicaciones
biomédicas. Barcelona: Doyma, 1993.
11.Cañedo Dorantes L: Investigación Clínica. Mexico: Interamericana, 1987
12. Carnap R: Fundamentación lógica de la física. Barcelona, Sudamericana,1969.
13. Castiglia,V C: El profesional y la actitud científica en el subdesarrollo.Rev.Arg.Ped. 1983;8:45-55
14. Castiglia,VC: Curso de introducción a la metodología de la investigación. Buenos
Aires. Ediciones Pediátricas Argentinas:1984
15. Castiglia,V C: Cómo preparar un trabajo científico. Arch.Arg.Pediatr. 1985;83:269–277
16. Castiglia,VC : El asesor metodológico: un nuevo miembro del equipo de investigación?
Rev. Hosp. Clin.Bs.As. 1987;3:25-32
17. Castiglia VC: Asesoramiento científico en un hospital universitario. Ocho años
dexperiencia (Resumen) Rev. Hosp. Clin.Bs.As. 1994;8:9-11
18. Cedrato AE, Ferrero NA, Ray CA: Pediatría. Buenos Aires: El Ateneo, 1992.
19. Clarke G.M.: Statistics and experimental design. 2nd Ed. London. Edward Arnold
Publishers, 1980.
20. Colacilli de Muro M. A., Colacilli de Muro J. C.: Elementos de la lógica
moderna y filosofía. Ed. Estrada. Buenos Aires. 1981.
21. Copi Irving M.: Introducción a la lógica. 18a Ed Buenos Aires. EUDEBA,1967,1974.
22. Cuttler SJ, Ederer F: Maximum utilization of the life table method in analyzing
survival. J Chron Dis 8: 699-712; 1958.
23. Dawson-Saunders Beth, Trapp Robert G.:Bioestadística Médica. México. 3ra
Ed Manual Moderno, 2002.
24. Diccionario de la lengua española: Real Academia Española. 21a Ed Madrid.
Espasa Calpe, 1992.

- 224 -
25. Fowler Newton E.: El muestreo estadístico aplicado a la auditoría. Buenos
Aires. Macchi, 1972.
26. Galtung Johan: Teoría y método de la investigación social. Buenos Aires:
Eudeba, 1973. (2 tomos)
27. Glantz, SA: Biostatistics: How to detect and prevent errors in the medical
literature. Circulation, 61; 1-7,1980.
28. Hayman John L.: Investigación y educación Buenos Aires: Paidós, 1978.
29. Hulley,SB; Cummings SR: Designing clinical research: an epidemiological
approach. Williams & Wilkins. Baltimore. 1987
30. International Ethical Guidelines for Biomedical Research Involving Human
Subjets, Geneva, Council for International Organizations of Medical Sciences
(CIOMS), 1993. En Progress in Human Reproduction Research, Nº 26,
1993 (UNDP/UNFPA/WHO/ World Bank Special Programme of Research,
Development and Research Training Human Reproduction). Traducción de
Isabel Plachner de Molinero, publicada en Medicina y Sociedad, 1994:(17),44-47.
31. Klimovsky G: Las desventuras del conocimiento científico. Una introducción
a la espistemología. Buenos Aires: AZ, 1994.
32. Lawrence M. Friedman, Curt D. Furberg, David L. DeMets: Fundamentals
of Clinical Trials, 2nd Ed. Massachusetts. PSG, 1985.
33. León Orfelio G., Montero I.: Diseño de investigaciones: Introducción
a la lógica de la investigación en Psicología y Educación. Madrid. McGraw-Hill,
1993.
34. Lewis-Beck M: Applied Regression: an introduction. Sage Publications
California, 1980.
35. Matthews DE, Farewell VT: Estadística Médica: aplicación e interpretación.
Barcelona: Salvat, 1988.
36. Nelson WE, Vaugham III VC, McKay JR: Tratado de Pediatría. Barcelona:
Salvat, 6ª Ed. 1ª Reimp, 1973.
37. Nickerson C. A., Nickerson I. A.:Statistical analysis for decision making.
New York: Petrocelli Books, 1978.
38. Ostle B.: Estadística Aplicada. México: Limusa, 1977.
39. Pedhazur EJ: Multiple regression in Behavioral Research. Explanation and
Prediction. Fort Worth (USA): Harcourt Brace College, 1982.
40. Polit D, Hungler B: Investigación científica en Ciencias de la Salud.
Mexico:Interamericana, 1985.
41. Popper Karl R.: La lógica de la investigación científica. Ed. Tecnos.
Madrid. 1977.

- 225 -
42. Riegelman Richard K., Hirsch Robert P.: Cómo Estudiar un estudio y
probar una prueba: lectura crítica de la literatura médica. 2a Ed. Washington,DC:
OPS, 1992.
43. Robert Michèle: Fondements et étapes de la recherche scientifique en
psychologie. 3a Ed Québec. Edisem, 1988.
44. Ross OB: Use of controls in medical research JAMA 145:72-75,1951
45. Siegel, Sidney: Estadística no paramétrica. 2da DE. 2da Rev. México.
Trillas 1975.
46. Sierra Bravo Restituto : Diccionario práctico de estadística. Madrid. Paraninfo, 1991.
47. Tarski, Alfred: Introducción a la lógica y a la metodología de la ciencias
deductivas. 3° ed. Espasa Calpe S.A. Madrid, 1977.
48. Van Dalen D. E., Meyer W. Y.: Manual de técnica de la investigación
educacional. Ed. Paidós. Buenos Aires, 1982.
49. Voltes Bou Pedro: La teoría general de los sistemas. Ed. Hispano Europea.
Barcelona, 1978.
50. Wulff, HR: Rational diagnosis and treatment. Oxford: Blackwell Scientific
Publications, 1976.
51. Castiglia,V C: Principios de Investigación Biomédica. Buenos Aires. Estudio
de Proyectos Científicos:1995.
52. Arribalzaga EB, Giuliano RJ. Reflexiones ante el análisis de una publicación
científica Rev. Arg. Cirug. 59; 242-249,1990.
53. Schulman K, Sulmasy DP: Ethics, Economics and the publication policies
of major medical journals. JAMA 272; 154-156, 1994
54. DerSimonian R, Charette JL, McPeek B, Mosteller F: Reporting on methods
in clinical trials. N Eng J M 306;1332-1337, 1982
55. Castiglia, VC, Neustadt EN, Grinspon D, Lujan S: Errores metodológicos
en resúmenes de trabajos científicos Rev. Hosp. Clin.Bs.As. 1996;3:21-28
56. Castiglia, V.C. Investigación Clínica, Información Científica y Validez.
Rev.Arg.de Urol., 60: IV-VI, Editorial, 1995.
57. Aiello, C.L. Estudio estadístico cualitativo de trabajos publicados sobre
temas de Ortopedia y Traumatología. Rev. Asoc. Arg. Ortop. y Traumatol.,
53 (4): 519-525, 1989.
58. Morris, R.W. A statistical study of papers in The Journal of Bone and
Joint Surgery (BR). JBJS 70-B (2): 242,1988.
59. Hernandez Vaquero D: El artículo científico en Biomedicina: normas
para la publicación de trabajos Barcelona. 2da Ed. CIBA-GEIGY SA. 1993

- 226 -
60. Huth EJ: Cómo escribir y publicar trabajos en ciencias de la salud.
Barcelona.Ediciones Científicas y Técnicas. 1992.
61. Day RA: Cómo escribir y publicar trabajos científicos. OrganizaciónPanamericana
de la Salud. Whashington. 1990
62. Requisitos de uniformidad para manuscritos enviados a revistas biomédicas:
Redacción y preparación de la edición de una publicación biomédica Actualizado
en Abril de 2010 Traducción de: Uniform Requirements for Manuscripts
Submitted to Biomedical Journals (Updated April 2010) Comité Internacional
de Editores de Revistas Médicas (ICMJE) www.ICMJE.org.
63. Gibbs WW: Ciencia del Tercer Mundo. Investigación y Ciencia. Diciembre
1995. pp72-79.
64. Miguel H, Baringoltz E: Problemas epistemológicos y metodológicos.
Buenos Aires. CBC Editora.1996.
65. Castiglia VC: Manual de investigación para principiantes. La imprenta digital.
Buenos Aires, 2015
66. Castiglia VC, Castiglia NI: Medios diagnósticos: un enfoque médico del
problema de la sensibilidad y otras pruebas de cribaje. Síntesis en Imagenología
Médica 2001; 2:53-56
67. Castiglia VC: 100 ejercicios de estadística y epidemiología. La imprenta
Digital. Buenos Aires, 2014
68. Castiglia,V C: Principios de Investigación Biomédica. Buenos Aires. Ed. Gráfica
Sur. Buenos Aires, 1998.
69. Gardner MJ, Altam DG : Confidence intervals rather than P values: estimation
rather than hypotesis testing. British Medical Journal, 1986; 292: 746-750
70. OPS: Guía para escribir un protocolo de investigación. Washington DC
20037-2895 - USA - 2005
71. Canales FH, Alvarado EL; Pineda EB: Metodología de la Investigación Manual
para el desarrollo de Personal de Salud. Publicación PASCCAP Nro 16 – Serie
PALTEX – ORGANIZACIÓN PANAMERICANA DE LA SALUD – Editorial Limusa.
México. 1986
72. Silva Aycager LC: Cultura estadística e investigación científica en el campo de
la salud: una mirada crítica. Diaz de Santos . Madrid.1997
73. Ruíz Morales A ; Morillo Zárate LE: Epidemiología Clínica - Investigación clínica
aplicada Ed. Médica Panamericana. Bogotá. Colombia 2004
74. Londoño F, JL : Metodología de la investigación epidemiológica. Editorial El
Manual Moderno. Bogotá. 2004 3ra Ed.

- 227 -
75 - NCI Dictionary of Cancer Terms: www.cancer.gov/publications/dictionaries/cancer-terms
76 - Receta de flan (Obtenida de: http://www.kiwilimon.com/receta/postres/flan-
napolitano-tradicional el 03/02/16)
77. Bancroft H: Introducción a la bioestadística. Eudeba. Buenos Aires, 1960.
78. Gómez Plascencia y Castillo J: Búsqueda Bibliográfica en bases de datos de
Internet en Martínez y Martínez: Como escribir un texto en ciencias de la salud.
Anatomía de un libro - Capitulo 6 – 2ª edición Manual Moderno – Mexico - 2002
79. Llanos CA: Metodología del trabajo intelectual y orientación universitaria.
Buenos Aires. Tekne, 1982.
80. Polgar S, Thomas SA: Introducción a la Investigación en Ciencias de la Salud.
Alhambra Longam SA. Madrid. 1993
81. Sackett D L , Straus S E, y col. : EVIDENCE – BASED MEDICINE - How to
practice and Teach EBM - Churchill Livingstone – Toronto 2000 - Second Edition.
82. Castiglia VC: Evaluando educandos: ¿ Monografía o Trabajo Científico ?
Inmanencia 2011; 1:40-44
83. Celis de la Rosa, A: Bioestadística. El Manual Moderno. Mexico 2004
84. Clarke M, Oxman AD, editores. Manual del Revisor Cochrane 4.1.6
[actualización enero 2003]. En: The Cochrane Library, Número 1, 2003.
Oxford
85. OPS: Guía para escribir un protocolo de investigación. Washington, D.C
20037-2895 - USA. 2005
86. Fagan TJ. Letter: nomogram for Bayes theorem. N Engl J Med.1975;293:257
87. Pitkin RM, Branagan MA, Burmmeister LF: Accuracy of data in abstracts of published
research articles. JAMA 1999;281(12):1110 -1111
88. Cobos-Carbó A, Augustovski FB: Declaración CONSORT 2010: actualización de la
lista de comprobación para informar ensayos clínicos aleatorizados de grupos paralelos.
CONSORT 2010 Declaration: Updated guideline for reporting parallel group randomised
trials. Med Clin (Barc). 2011;137(5):213–215
89. American Psychological Association: Publication Manual. 6th Ed. Whashingtong DC
2010
90. Evidence Based Medicine Journal Site. Perfomance. http://www.cebm.net/evaluating-
performance/ (24/04/16)

- 228 -
- 229 -
Índice Alfabético
A
a dos colas
hipótesis 110
abandono de hipótesis 180
ABC, área bajo la curva 142
afirmación
definición 95
alfa y confianza, relación 103
alfa, definición del nivel 103
análisis de regresión
definición 157
ecuación fundamental 157
ecuación fundamental, simplificación 162
interpretación del coeficiente “b” en el análisis bivariado 161
la meta es predecir 162
la predicción es la meta 162
reglas de interpretación de la pendiente 161
uso heurístico, descubrir relaciones 168
uso ponderativo 167
uso predictivo 166
análisis multivariado, definición 163
ANOVA 116
ANOVA para mediciones repetidas 116
asesor científico,aspirante 17
área bajo la curva, nulo rendimiento 142
área bajo la curva, rendimiento máximo. 142

B
background del problema 40
balanceo 117
base empírica 40
base poblacional 134
base teórica del problema 40

- 230 -
bioética
alicientes para la participación 183
inducción indebida 183
bioética de estudios epidemiológicos 183

C
calcular de intervalos de confianza para proporciones 83
calcular IC 95 % para promedios,regla práctica 82
calcular IC 95 % para proporciones, regla práctica 84
calcular intervalos de confianza para un promedio 81
calcular intervalos de confianza, formula general 81
casos y controles, realización de estudios 134
ceguera 54
censados, pacientes en tablas de sobrevida 128
certidumbre, definición 97
chance 135
ciego simple 54
clasificación de problemas, motivo e importancia 29
cociente de probabilidades positivo y negativo 140
coeficiente de correlación
de Pearson 151
definiciones 150
efecto del tamaño muestral en 152
interpretación de la significación 152
significación 152
significación por intervalos de confianza 151
valor absoluto, interpretación 153
coeficiente de correlación, no significativo 152, 153
coeficiente de correlación,intervalos de confianza 151
coeficiente de determinación múltiple ajustado 168
coeficiente de determinación, definición 154
coeficientes de correlación 150
coeficientes de regresión
interpretación 159
interpretación del coeficiente “a" 162
nomenclatura 158
ordenada al origen 159
pendiente 159

- 231 -
razonamiento para su obtención 158
sinónimos 158, 159
coherencia externa 187
cómo elegir el error beta 105
cómo elegir un nivel de significación 103
cómo usar este libro 15
comparación entre OPD y MBE 218
comunidades subdesarrolladas, en investigación 182
conceptos clasificatorios 69
conclusión estadística 84
conclusión informativa 84
conclusión técnica 103
conclusiones derivadas 206
conclusiones externas 206
conclusiones informativas para la población
en problemas de comparación 122
conclusiones internas 206
conclusiones primarias 206
conclusiones, definición 206
conexidad 190
de objetivos y diseños 202
confianza, significado y uso del término 35
conocimiento
definición 19
consecuencias, de las decisiones 107
consentimiento informado 181
conducta del investigador 182
consistencia 191
consistencia externa 191
consistencia interna 191
constante
definición 42
construcción de teorías, con el MHD 178
contexto de descubrimiento 15
contexto de justificación 15
contrastación
definición 96
contrastación, procedimiento 177

- 232 -
control
de la subjetividad 54
de variables desconocidas en estudios de comparación 118
de variables irrelevantes 44
intersujeto 55
intrasujeto 55
usando CRITERIOS DE EXCLUSIÓN 44
control de variables en muestras independientes 117
control estadístico, definición 112
control experimental, definición 112
control, definición del concepto 43
correlación, cómo se mide 148
correlación, definición 147
corroboración 174
de una hipótesis, consecuencias 176
definición 97
corroboración de hipótesis
definición 97
covariables
control de covariables conocidas 57
procedimientos de control en estudios de comparación 117
covariables, definición 43
CPN, cómo se interpreta 144
CPP, interpretación 144
criterio de eliminación, definición 58
criterio de estrechez de intervalos de confianza 85
criterio universal de exclusión 58
criterios generales de elección del tema 26
curvas,de referencia para valores normales 91

D
dato derivado 73
dato primario 73
dato, definición 69
datos
definición de codificación 74
depuración 76
derivados o elaborados 73

- 233 -
digitalizar, definición 76
primarios o brutos 73
datos pertinentes, definición 205
decisión clínica 84
decisión clínica y decisión estadística 122
decisión operativa 103
depuración de datos 76
desconocimiento
como control de subjetividad 54
diseño
definición 53
diseño a muestra única, definición 116
diseño muestral, operatoria 63
diseños
clasificación según la información buscada 53
clasificación según método 53
clasificación según número de muestras 116
doble ciego 54

E
ecuación de regresión
fórmula 157, 159
razonamiento para su obtención 157
sinónimos de la ecuación 158
efecto, en la relación causa efecto 169
elegibilidad
criterios de 57
eligiendo un título para el trabajo 213
endpoint, definición 74
enmascaramiento 54
ensamblado, del trabajo científico 211
ensayo clínico 55
enunciados contrafácticos
definición 96
equilibración 117
error beta, definición 105
error tipo alfa 103, 105
error tipo I 103, 105

- 234 -
error tipo II, definición 105
errores
consecuencias empíricas 104
en la contrastación de hipótesis probabilísticas 104
escala nominal, definición 70
escala, definición 69
escalas
ordinales con base numérica 70
ordinales, ejemplos 70
escalas de medición
de proporción 71
definición 69
escala ordinal con base nominal 70
intervalares o de intervalo 71
nominales 69
ordinales 70
especulaciones 210
esquema conceptual
para problemas de correlación - regresión. 149
para problemas de relación causa efecto 170
esquemas conceptuales
definición 47
etapas 47
ventaja resultante de pensar 47
esquematizar investigaciones para estimar coeficientes de correlación y
regresión 49
esquematizar investigaciones para estimar DIFERENCIAS entre
parámetros ( comparación) 49
esquematizar investigaciones para estimar parámetros ( problemas de
cuantificación) 48
estadísticas
definición de 35
medidas de dispersión 79
medidas de tendencia central 79
estadísticas. definición 78
estadístico Z 83
estimar parámetros poblacionales 80
estimar, significado y uso del verbo 35
estudio de factores de riesgo

- 235 -
modelo de casos y controles 134
modelo de cohorte 130
estudios de cohorte, operatoria para realizar 132
estudios de factores de riesgo
preguntas a responder 133
etiología, concepto 169
eventos,definición 177

F
ficha de registro
definición 75
ficha registro
proceso de construcción 75
formular conclusiones para intervalos de confianza de promedios 82
formular conclusiones para intervalos de confianza de proporciones 84
formular objetivos para hipótesis (Variante 1) 38
formular objetivos para problemas de hipótesis (Variante 2) 39

G
gráfica de Gantt 186
graficar esquema estimación coeficientes correlación, regresión. 48
graficar esquema estimación de parámetros 48
gráfico de dispersión 159
gráfico de regresión 159

H
hipótesis
de no diferencias, definición 102
definición 95
del investigador, definición 102
docimasia de, definición 102
formulación para problemas de comparación 109
nula, definición 102
nula, formas de 110
valor de verdad 95
hipótesis a una cola 111

- 236 -
hipótesis ad hoc 180
hipótesis alternativa 110
hipótesis alternativa, definición 102
hipótesis bidireccionales 110
hipótesis cero para curvas de sobrevida 127
hipótesis cero, definición 102
hipótesis determinísticas 169
hipótesis nula
en estudios de correlación regresión 152
hipótesis nula, fallo en rechazar 103
hipótesis unidireccional 111
Ho correspondientes Ha bidireccionales 110

I
ignorancia, definición 3
incertidumbre, definición 97
incidencia 90
inescrutabilidad 173
inferencia 80
inferencia estadística 80
inferencia, definición 80
información
definición 19
información, definición 19
informar la conclusión en estudios de proporciones poblacionales 84
informar la conclusiones sobre promedios 83
informe científico 187
informe científico,consistencia o coherencia 191
interpretación
de prevalencia 90
tablas de sobrevida para un grupo 92
tasas 89
interpretación de
de bandas de tolerancia 87
incidencia 90
interpretar intervalos de confianza de promedios 83
intersujeto 50
intervalo de confianza, significado y uso del término 36

- 237 -
intervalos de confianza
estrechez 85
para diferencias entre parámetros 123
para diferencias, cuestiones que resuelven 124
y valoración de informes científicos 85
intrasujeto 51
intrasujeto, definición de diseño 115
investigación
definición 20
investigación aplicada 20
investigación científica
etapas, esquema 24
Investigación Científica
definición 21
investigación con patrocinio del exterior 184
investigación exploratoria 64
investigaciones a muestras independientes 50
investigaciones en niños 182

L
ley, definición 171
línea de regresión, interpretación 160

M
materiales y técnicas
listar las variables medidas 202
listar los materiales 203
medición, definición 69
mediciones repetidas ,definición 115
medios de diagnóstico
área bajo la curva 142
cociente de probabilidades positivo y negativo 140
curvas ROC 142
organizar la investigación 138
preguntas a responder 138
propiedades extrínsecas 140
propiedades intrínsecas 140

- 238 -
razón de verosimilitud positiva y negativa 140
valores de cribaje 140
medir, definición 69
menosprecio del trabajo propio 210
método científico, definición 20
método de la hipótesis 173
metodología de la investigación, definición 21
metodólogo 17
modelo teórico o teoría 171
momios 135
muestra
aleatoria y no semejante 62
de que depende el grado de representatividad 60
definición 59
diseño muestral 59
error muestral 62
representativa, definición 60
representatividad 62
semejanza 60
tamaño de una 59, 60
valida, condiciones 66
muestra grande, definición 116
muestra pequeña, definición 116
muestra, parcialmente representativa 201
muestra, totalmente representativa 201
muestras independientes 49, 50
muestras relacionadas 49-51
muestreo
accidental o incidental 67
aleatorio simple 67
consecutivo 68
intencional 67, 68
no probabilístico 67
para población a constituir incompleta 66
para población completa o constituida 66
probabilístico 67
probabilístico a población incompleta 67
mujeres embarazadas, en investigación 183

- 239 -
N
nivel de significación 103
NNT, interpretación 125
nube de puntos, interpretación de los puntos 160
nube o diagrama de puntos 149
número de pacientes que es necesario tratar 125

O
objetivo, definición 35
observación científica 177
odds a favor 135
odds en contra 135
odds ratio 136
odds, concepto y definición 135
outliers, datos extremos 76

P
p valor, operacionalización 98
parámetros 26, 35, 36, 39-40, 48, 49
parámetros, definición 78
población
blanco, definición 41
como definir la población accesible 57
Cómo identificar genéricamente 41
completa 66
definición de coordenadas témporo espaciales 58
incompleta 66
población objetivo, definición 41
tamaño de una 59
población accesible,definición 58
población blanco, definición 57
población, identificar genéricamente 41
potencia de una prueba de significación 106
predictor, definición 148
prevalencia 90
probabilidad
definición frecuencial 99

- 240 -
probabilidad pretest 144
problema 25
cómo analizar un 40
problema, cómo elegir un 37
problemas científicos
clasificación metodológica 30
problemas científicos, correspondencia entre clasificaciones 40
problemas de cifras 30
problemas de comparación
definición 109
diseño a muestras independientes 114
diseño a muestras únicas 115
diseños a muestras relacionadas 114
diseños a varias muestras 116
problemas de estimación de parámetros
operatoria para resolver 80
problemas de hipótesis. 30
problemas estimación de diferencias entre parámetros 109
procesamiento de datos
definición 74, 203
etapas 74
reglas para registro digital de datos 76
procesos de redacción de informes científicos 193
Producción de los componentes del informe 199
proposición
definición 95
protocolo de investigación 185
prueba de Friedman 116
prueba de hipótesis, definición 102
prueba de Kruskall Wallis 116
pruebas de significación
definición 118
punto final 74
pvalor
definición 98

- 241 -
R
razón de odds 136
razón de oportunidades 135
razón de productos cruzados 135
razón de verosimilitud positiva y negativa 140
rechazo absoluto 188
rechazo relativo 188
redacción del informe científico
debilidades y fortalezas 208
extensión de la redacción 200
información que debe figurar en diseño 201
información que debe figurar en diseño muestral 200
información que debe figurar en Introducción 199
información que debe figurar en Población 200
información que debe figurar en procesamiento de datos y análisis
estadístico 203
información que NO debe figurar en discusión y/o comentarios 209
procesamiento y análisis estadístico de los datos 205
redacción del cierre de la discusión 210
valoración de consistencia externa 209
valoración de validez externa 209
valoración de validez interna 208
redacción del trabajo científico
contenido del resumen 198
ensamblado a partir de protocolo 211
ensamblado a partir del resumen tipo 2b 212
precauciones al redactar resumen T2 195
proceso ideal 193
resumen clásico 198
resumen estructurado 198
resumen protocolar 194
secuencia pragmática 195
secuencia protocolar 194
redactar en el protocolo
procesamiento y análisis estadístico de los datos 205
reparos éticos 184
refutación 174
de una hipótesis, consecuencias 176
definición 97

- 242 -
refutación de hipótesis
definición 97
Reglas para aplicar lectura crítica 215
regresión múltiple
aplicaciones y usos 166
experimento 1 164
experimento 2 164
experimento 3 164
experimento 4 165
experimento 5 166
fines de la 163
modelo, ejemplo de un 163
relación aritmética entre probabilidad y chance 135
relación causa-efecto, definición 170
replicabilidad 218
replicabilidad, definición 189, 218
resultados
definición 74
otro modo de definirlos 74
resultados, definición 203, 205
resumen protocolar o tipo 1 195
resumen Tipo 2 195
resumen tipo 2a 195
resumen Tipo 2b 195
revisión arbitral 187
riesgo absoluto o incidencia 129
riesgo atribuible, cálculo 132
riesgo atribuible, definición 133
riesgo relativo estimado 135

S
sesgo de selección 134
sistema de medición, definición 69
sistema, definición 171
situación posttest 144
situación pretest 144
sobrevida acumulada, concepto y cálculo 92
subjetividad

- 243 -
control de la variable 54
criterio para identificarla en un estudio 54

T
tablas actuariales, para que sirven 92
tablas de sobrevida para un grupo 91
tamaño muestral
pequeño, qué hacer 64
planteo formal estricto para su estimación 63
planteo formal laxo para su estimación 64
planteo pragmático para su estimación 65
tasa de mortalidad específica anual 89
tasa única de mortalidad bruta anual 89
tasas
ajustadas o estandarizadas 90
Tema
de investigación, cómo elegir 26
TEMA
Definición 26
teoría
construcción de una 171
definición 171
teorías
bases racionales de la contrastación 175
test de hipótesis
criterios para la elección de alfa y beta 107
niveles de decisión 106
secuencia correcta 106
trabajo científico 187
conexidad 190
presuntamente apto 217
rechazo absoluto 188
rechazo relativo 188
redacción del resumen Tipo 2a 196
redacción del resumen Tipo 2b 197
replicabilidad 189
transformar problema de hipótesis en problema de cifras 32
tratamiento estadístico, definición 113

- 244 -
U
universo de discurso 57
UNIVERSO DE DISCURSO
definición 41
uso heurístico
del análisis de regresión 167

V
validez externa 192
validez externa, definición 189
validez interna 187
validez interna de una investigación
definición 21
validez interna, definición 189
valor estándar para error beta 106
valoración de tratamientos 125
valores de cribaje 140
valores de cribaje, uso en la clínica 144
variable
comportamiento de una 77
definición 42
variable dependiente, definición 148
variable independiente, definición 148
variable predictora, definición 148
variables
a controlar,covariables, extrañas, confundentes, enmascaradas,
intervinientes 43
clasificación 42
clasificación según relación con el problema 42
complejas 73
control de 43
control en modelos a muestras independientes 117
control en modelos a muestras relacionadas 117
control en modelos a muestras únicas 118
controlar variables desconocidas 44
diferencias entre escala y comportamiento 77
en estudio 42, 43
en estudio, ficha registro 75

- 245 -
en un problema: qué son y cómo se identifican 42
irrelevantes 44
operacionalización de 71
simples 73
variables a controlar, en muestras relacionadas 117
variables categóricas 69
variables desconocidas, control de 44
ventaja de tener un N grande 82
verdad de una hipótesis
medición del 96
verdad plausible 176
verificación
definición 96

- 246 -
- 247 -
METODOLOGÍA DE LA INVESTIGACIÓN BIOMÉDICA
FUNDAMENTOS

TODOS LOS DERECHOS RESERVADOS


2016 - Vicente C. Castiglia

ISBN 978-987-42-0484-4

- 248 -
- 249 -

También podría gustarte