Está en la página 1de 14

165

CONCEPTOS BÁSICOS DEL ANÁLISIS ESTADÍSTICO SIN MATEMÁTICAS

Taller 1-10

CONFUSIÓN Y

ANÁLISIS ESTRATIFICADO
(los fundamentos lógicos del Análisis Multivariante)

Si en grupo de 1000 jóvenes tratados con “A” curan 600 (60%) y


en grupo de 1000 viejos tratados con “B” curan 200 (20%)
no podemos saber si la ventaja del primer grupo se debe
a que “A” es mejor o a la juventud de sus componentes

Un factor no controlado puede


enmascarar o incluso invertir
aparentemente el efecto
del factor principal.
50 personas con dieta veget. à en 10’ corren: media = 600 m Edad ≈ 20

50 personas con dieta omniv. à en 10’ corren: media = 100 m Edad ≈ 70

50 bebedores à 40 con Enfer Pulmón : p = 40 / 50 = 0.80 Todos Fumaban

50 no bebedores à 5 con Enfer pulmón: p = 5 / 50 = 0.10 Nadie fumaba

1.10a
166

1. En cada una de 100 personas se mide la distancia que pueden correr durante 10’. La mitad son
vegetarianos y la media fue 600 m. Los otros 50 son omnívoros y su media fue 100 m. Concluimos que
los vegetarianos pueden correr seis veces más que los omnívoros. Pero si nos dicen que en el grupo de
vegetarianos tenían todos edad en torno a 20 años y los omnívoros tenían edad en torno a 70 ¿Qué
pensamos? Obviamente, pensamos que la ventaja de los vegetarianos puede deberse a su menor edad,
no al efecto de la dieta. Decimos que la edad actúa como factor de confusión, que impide saber cuál es
el efecto de la dieta.
2. Si en un grupo de 50 bebedores (en exceso y durante muchos años) acaban teniendo EPOC (enfermedad
pulmonar obstructiva crónica) 40, p = 0.80 y en un grupo de 50 no bebedores acaban teniendo EPOC 5,
p = 0.10, decimos que esa enfermedad es mucho más frecuente en los bebedores y parece claro que
beber multiplica el riesgo de padecer EPOC por 8. Pero si nos dicen todos los bebedores eran fumadores
empedernidos y que los no bebedores no fumaban ¿Qué pensamos? Obviamente, pensamos que el
efecto negativo del alcohol puede deberse, total o parcialmente, al tabaco. Decimos que el tabaco actúa
como factor de confusión, que impide saber cuál es el efecto del alcohol.
3. En 1999 se publicaron en EE UU trabajos científicos mostrando que la frecuencia de cáncer de próstata
era mayor en los varones operados de vasectomía. Dato muy alarmante, porque muchos miles habían
sido operados. Pero pronto se vio que en esos datos la raza del paciente era factor de confusión. La
raza negra tiene mayor riesgo de cáncer de próstata y en el grupo de vasectomizados había mayor
proporción de negros que en el grupo control. Los números podrían ser de este tipo:
Vasectomía Controles
TOTAL CANC. % CANC TOTAL CANC. %CAN
Blancos 400 8 2% 1400 28 2%
Negros 1600 80 5% 600 30 5%
Total 2000 88 4.4 % 2000 58 2.9 %

Vemos que la frecuencia de cáncer no se modifica por la vasectomía, siendo 2% en blancos (operados o
no) y 5% en negros (operados o no). Pero si no se desglosa por razas y se considera la última fila de la
tabla en la que ambas están juntas, el porcentaje de cáncer es mayor en los vasectomizados. Ello se
debe a que en este grupo hay mayor proporción de negros (1600 / 2000 = 0.80) que en el otro (600 / 2000
= 0.30). Al hacer el análisis estratificando se descubre que el efecto inicialmente atribuido a la vasectomía
se debía en realidad a la Confusión creada por la raza.
4. En el ejemplo que sigue parece que fumar disminuye la incidencia de Cáncer de pulmón, si no se
estratifica por edad (última fila) ya que tienen cáncer el 4.7% de los fumadores y el 9.2% de los no
fumadores, pero en realidad es perjudicial en ambas edades: 4% vs 2% en jóvenes y 20% vs 10% en
viejos.
Fuman No Fuman
TOTAL CANC % CANC TOTAL CANC. % CANC
Jóvenes: 55 a. o menos 800 32 4% 100 2 2%
Viejos: Más de 55 a. 40 8 20 % 900 90 10%
Todos: Jov + Viejos 840 40 4.7 % 1000 92 9.2 %
La edad es el factor de confusión. Se produce confusión porque en los viejos el % de cáncer es
mayor que en los jóvenes y en los no fumadores son viejos el 90% (900 / 1000), mientras que en los
fumadores son viejos el 4.7% (40 / 840 = 0.047).

5. En la tabla siguiente se ve la cantidad y el % de curaciones en un grupo de 500 enfermos que recibieron


el fármaco “K” y en otro grupo de 500 que no recibieron fármaco. Se llama EFECTO de un factor a la
DIFERENCIA de proporciones de curaciones cuando está presente el factor y cuando no lo está. En este
ejemplo, decimos que el efecto de K es bajar 30 puntos el % de curados en los viejos (40% - 10% = 30%).
El efecto de K es bajar también 30 puntos el % de curados en los jóvenes (90% - 60% = 30%).
167

FARMACO K NO FARMACO Efecto de K


Tot Cur %Cur Tot Cur %Cur
Total 500 275 55% 500 250 50% sube 5 punt.
Viejos 50 5 10%  400 160 40%  baja 30 puntos
Jóvenes 450 270 60%  100 90 90%  baja 30 puntos

Pero si se suman los dos grupos de edad, se encuentra que en el grupo con K el % es 5 puntos mayor.
Decimos que hay Confusión, puesto que en cada edad K baja la FR de curaciones y cuando se ignora la
edad parece que la sube en 5 puntos.

Los supuestos anteriores NO son curiosidades numéricas, sino ejemplos de una realidad que puede
ocurrir en cualquier investigación y que debe tenerse en cuenta para evitar llegar a conclusiones no
avaladas por los datos o incluso contrarias a lo que los datos realmente dicen. No se trata de una sutileza
matemática, sino de características de las muestras que pueden hacernos atribuir cierto efecto a una
causa, cuando en realidad la causa es otra.

6. En la parte superior vemos que en las mujeres el tratamiento A cura 20 puntos porcentuales más que su
placebo, tanto en mujeres como en hombres, pero si se juntan ambos sexos parece que A cura 10 puntos
menos que el placebo. Ello se debe a que 1) Las mujeres curan más que los hombres y 2) en el grupo
de placebo hay mucha mayor proporción de mujeres que en el grupo tratado con A.
7. El tratamiento B cura 42 puntos más que su placebo, pero si nos dicen que todos los tratados con B son
jóvenes y todos los de placebo son viejos, no hay modo de saber qué parte de la ventaja de B sobre el
placebo se debe al tratamiento y cual a la edad.
8. Pero si nos dicen que la mayoría (no todos) de los tratados con B son jóvenes y que la mayoría (no
todos) de los de placebo son viejos, SI hay modo de saber qué parte de la ventaja de B sobre el placebo
se debe al fármaco y cual a la edad. Para ello separamos en dos grupos de edad y vemos el efecto de
B en cada edad. Vemos que B no hace nada. El presunto efecto que consistía en aumentar el % de
168

curados en 42 puntos se debe a que los jóvenes curan mucho más que los viejos y en el grupo con B
hay mayor % de jóvenes que en el de placebo.
9. La confusión se puede presentar en todo tipo de estudios y el investigador debe estar preparado para
detectarla y subsanarla con el análisis estratificado correspondiente, que le permitirá no atribuir a un
factor el efecto que en realidad se debe a otro.
10. Rara vez en las investigaciones reales estudiamos la influencia sobre el resultado que estamos
estudiando de una sola variable. Lo habitual es que se hayan medido varias variables y queramos ver
cómo el efecto de cada una es influenciado por cada una de las otras. Para ello es imprescindible tener
totalmente claros los conceptos de Confusión e Interacción en el Análisis Estatificado.
11. La mayoría de los libros de Bioestadística de nivel básico e intermedio no exponen estos temas con la
extensión que se necesita y la claridad que merecen. Pero en los de nivel medio o avanzado se asume
que el lector los conoce. La realidad es que pueden y deben ser explicados estos conceptos en un
contexto de situaciones sencillas, sin usar más matemática que porcentajes y medias.

Entendiendo la confusión
FARMACO NO FARMACO 1- Los Jov
Efecto de F
Tot Cura %+ Tot Cura %+ curan más
Viejos 50 5 0.10 à 90 9 0.10 à no efecto
2- Hay más FR de
Jovenes 450 360 0.80 à 10 8 0.80 à no efecto Jov en el grupo
Total 500 365 0.73 100 17 0.17 + 56 p con fármaco
% Jov = 450 / 500 = 0.90 % Jov = 10 / 100 = 0.10

FARMACO NO FARMACO 1- Los Jov


Efecto de A
Tot Cur % Cura Tot Cur % Cura curan más
Viejos 50 5 10% à 10 1 10% à no efecto
2- Hay igual FR
Jovenes 450 360 80% à 90 72 80% à no efecto de Jov en los
Total 500 365 73% 100 73 73% No efecto dos grupos
% Jov = 450 / 500 = 0.90 % Jov = 90 / 100 = 0.90

FARMACO NO FARMACO 1- Los Jov


Efecto de A curan más
Tot Cura % Cura Tot Cur % Cura
Viejos 200 20 10% à 50 5 10% no efecto 2- Hay menos
Jovenes 300 240 80% à 450 360 80% à no efecto FR de Jov en el
grupo con
Total 500 260 52% 500 365 73% - 21 p
fármaco
% Jov = 300 / 500 = 0.60 % Jo = 450 / 500 = 0.90
1.10c

12. En la parte superior hay confusión. Se ve claramente que los jóvenes curan mayor % que los viejos. El
fármaco no cura más que el placebo (no fármaco) pero como hay mucho mayor % de jóvenes en el grupo
con fármaco, parece que este cura más que el placebo.
13. En la parte media no hay confusión, porque el % de jóvenes es igual en los dos grupos.
14. En la parte inferior hay confusión, porque el % de jóvenes es menor en el grupo con fármaco y por eso
hay menos curaciones en ese grupo. Por lo que parece que el fármaco es perjudicial.

14. En los ejemplos anteriores la variable respuesta era dicotómica, por lo que se resumía con el % de
enfermos, o % de curados, o % de agresivos… Si la variable respuesta es continua se resume con medias
y se calcula el efecto del factor como “diferencia de medias”.
169

CONFUSIÓN CON VARIABLE RESPUESTA CUANTITATIVA

Se administra "A" a un grupo de 100 personas y se les pide correr al máximo


durante un minuto. Corrieron, por término medio, 470 m, MCON "A" = 470 m.
En otro grupo de 100 personas sin "A" y se encuentra MSIN "A" = 230 m.
SIN A CON A
N Total Media N Total Media
Total 100 23000 230 ! 100 47000 470

1- Los jóvenes corren más 2- En el grupo con A hay mayor prop de jóvenes (90% vs 10%)

En otro grupo de 100 personas con B la media fue 235

37000 370

B baja el rendimiento en jóvenes y en viejos


1- Los Jóvenes tienen más rendimiento
2- En el grupo con B hay más FR de Jóvenes (90%) que en el grupo sin B (10%) 1.10d

15. Se sospecha que el fármaco "A” aumenta el rendimiento físico, que se evaluará midiendo la distancia que
cada individuo puede recorrer en un minuto. Se administra "A" a un grupo de 100 personas y se les pide
correr al máximo durante un minuto. Se encuentra que corrieron, por término medio, 470 m. Se somete a
la misma prueba a otro grupo de 100 personas sin "A" y se encuentra MSIN "A" = 230 m. Los individuos
con "A" tuvieron rendimiento medio muy superior a los no tratados (470 frente a 230) y parece que "A"
aumenta notablemente el rendimiento físico.
16. Pero si nos dicen que en el grupo con “A” la mayoría son jóvenes, y en el grupo sin “A” la mayoría son
viejos, pensaremos que el mayor rendimiento en el grupo con “A” puede deberse, total o parcialmente, a
la menor edad de los sujetos. Vemos que entre los 100 sin “A” hay 10 jóvenes y entre los 100 con “A” hay
90 jóvenes. La edad es factor de Confusión y si no se estratifica por ella parece que el fármaco hace un
efecto que no es real. Realmente el fármaco A no tiene efecto en jóvenes (igual rendimiento con A que
sin él = 500) y tampoco en viejos (rendimiento = 200, con y sin fármaco). La confusión se debe a que los
jóvenes tienen mayor rendimiento y en el grupo con A hay mayor % de jóvenes que en el otro.
17. Por el contrario, el fármaco B parece que aumenta en 140 cuando se ven los datos ignorando la edad,
aunque realmente baja en 100, tanto en viejos como en jóvenes.
170

Confusion: Respuesta cuantit., factor politomico ordenado


Duración del parto según cantidad de gimnasia realizada
15
% de Dosis Nº de SUMA Media ONLY
SOLO CANARIAS
INGLESAS 14
ingle de MUJE de las Por 13
sas gimna RES horas Parto Nº Suma MED Nº Suma MED
12
10% NADA 400 2760 6.9 360 2170 6 40 590 14.8
11
30% POCA 200 1540 7.7 140 700 5 60 840 14 10
70% MEDIA 200 2060 10.3 60 240 4 140 1820 13 9
90% MUCHA 500 5550 11.1 150 3 12

Duración del parte


50 450 5400 8
7
Todas: a más gimnasia à partos más largos 6
Canarias: a más gimnasia à partos más cortos 5
Inglesas: a más gimnasia à partos más cortos 4
3
1º ¿Qué hace la Gimnasia ? Disminuye la duración del parto 0 1 2 3
Gimnasia
2º - ¿Por qué parece lo contrario? Concurren dos circunstancias:

1- Las inglesas tienen, en promedio, partos más largos


2- Hay mayor % de inglesas en los grupos que hacen más gimnasia
1.10e

18. Se sospecha que la gimnasia diseñada para el embarazo ayuda a tener partos más cortos, disminuyendo
el sufrimiento fetal (hipoxia) y el materno (fuertes dolores en el parto). Pero arriba a la izquierda vemos
que la duración media de los partos es mayor en las mujeres que hicieron más gimnasia (6.9 h en las que
no hicieron nada, 7.7 h en las que hicieron un poco…)
19. Pero al estratificar por nacionalidad vemos que en las mujeres canarias la duración del parto baja, en
promedio, al aumentar la gimnasia (6 h en las que no hicieron nada, 5 h en las que hicieron un poco…).
Y también baja en la inglesas (14.8 h en las que no hicieron nada, 14 h en las que hicieron un poco…)
20. La confusión se produce porque los partos duran más en las inglesas y hay más proporción de inglesas
en los grupos que hacen más gimnasia. En la columna de la izquierda vemos que en el grupo que no hizo
gimnasia hay solamente 10% de inglesas y en el grupo con poca gimnasia hay 30% de inglesas… El
grupo que hizo mucha gimnasia tiene 90% de inglesas y por ello la media de la duración de los partos es
muy alta en ese grupo.
21. Observando los datos sin estratificar por país parece que hacer gimnasia alarga los partos. Pero
estratificando por país vemos que la gimnasia acorta los partos. Ante cualquier resultado encontrado en
un estudio el investigador debe asegurarse, en la medida de los posible, de que no es fruto de una
confusión. Pero nunca podemos estar seguro de eso. De todos modos esa posibilidad no invalida el
interés del resultado. Si el resultado encontrado es interesante conceptualmente o útil en la práctica, y
por ello la comunidad científica debe conocerlo, tiempo habrá posteriormente de ver qué factores de
confusión podían estar entrando en juego.
171

CONFUSION con dos FACTORES CUANTITIVOS


25 25 r=0.60 Reg fondo peso
p=0.005
b=1.46 b = 1.55 P = 0.005
20 20
R2 = 0.37
15 15
fondo

fondo
Reg fondo peso i.edad
10 10 b = -0.9 P = 0.00001
5 5
R2 = 0.97
peso pe so
0 0
2 4 6 8 10 12 2 4 6 8 10 12

15 a
25 25

20 12 a
Se20tiene en cuenta la Edad de cada
15
niño y se analiza por separado cada
FONDO

15
FONDO

grupo de edad.
10 10
12 a
Dentro de cada edadb=-1.0
vemos que a
5 5
9a
más peso hay menos
9a resistencia
b=-0.97
6a 6a
0 0
2 4 6 8 10 12 2 4 6 8 10 12

1.10f

22. En un grupo de 20 niños se evalúa su peso y su resistencia en carrera de fondo. La gráfica arriba a la
izquierda muestra que en, contra de lo esperado, hay regresión ascendente: en promedio a más peso hay
más resistencia. En la gráfica de la derecha vemos la recta de regresión de mínimos cuadrados y que al
hacer el test para la H0 que dice que en población no hay relación se encuentra P = 0.005, que es notable
evidencia a favor de la relación.
23. En la gráfica inferior se usa distinto símbolo para cada punto, según la edad de cada niño. Así vemos que
los 5 puntos más altos corresponden a niños de 15 años y dentro de ese grupo hay regresión negativa,
como indica la pequeña recta descendente. Y lo mismo ocurre en los niños de 12 años y en los de 9 y en
los de 6 años.
24. Decimos que la edad es factor de confusión y si no se estratifica por edad parece que más peso se
acompaña de más resistencia, cuando en realidad es lo contrario
172

FACTORES “INTERMEDIOS” Y MECANISMOS DE


ACCIÓN
Si se estratifica por un factor que forma parte intermedia de la cadena que conduce de la causa al efecto,
pueden ser relevantes los porcentajes “brutos” (ignorando ese factor), además de los correspondientes a
cada estrato.

Estratificación: Confusión y Mecanismos de acción-1


¿Es el % de Enf mayor en fumadores?
Estratifico NO fuman Fuman
Fumar no aumenta el % de Enf.
por edad Total Enf % Enf Total Enf % Enf
El % de Enf es mayor en la 4ª edad
De 80 a 90 100 80 80% 500 400 80%
De 60 a 70 500 110 22% 100 22 22% En el grupo de fumad. hay mas %
600 190 32% 600 422 70% de Enf porque hay más viejísimos
100/600 = 17% 4ª Edad 500/600 = 83% 4ª Edad Obvio: fumar no causa vejez

¿Es el % de Enf mayor en bebedores?


Estrato de NO beben Beben
arteros- El % de Enf es mayor en los AT
clerosis,AT Total Enf % Enf Total Enf % Enf
¿Qué podemos decir sobre
AT 100 80 80% 500 400 80%
qué hace el beber?
No AT 500 110 22% 100 22 22% Depende del tipo de
600 190 32% 600 422 70% muestreo
100 / 600 = 17% AT 500 / 600 = 83% AT

1- Si se muestreó tomando 100 2- Si se muestreó tomando 600 B- y 600 B+ :


B- y AT, 500 B+ y AT, 500 B- y Vemos que beber aumenta el % de AT y
AT- y 100 B+ y AT- : por ello aumenta el % de Enf
No puedo saber si beber La AT es un Factor Intermedio en el
aumenta el % de AT mecanismo de acción del alcohol 1.10g

25. Veamos un ejemplo más en el que lo correcto es ignorar el efecto “bruto” y tener en cuenta solamente los
efectos correspondientes a cada uno de los estratos. En la tabla de arriba vemos la posible relación entre
un factor, digamos Fumar, y la enfermedad “Enf”. La Enf se presenta en el 32% de la muestra de no
fumadores y en el 70% de la muestra de fumadores. Diríase que fumar aumenta en 38 puntos el % de
Enf. Pero dentro de cada edad fumar no aumenta el % de Enf. La edad es factor de confusión debido a
que en la 4ª edad hay mayor % de Enf y en el grupo de fumadores hay mayor % de 4ª edad que en los
no fumadores.
26. Pero no siempre es correcto ignorar el efecto “bruto” y tener en cuenta solamente los efectos
correspondientes a cada uno de los estratos. La tabla de abajo es igual a la de arriba, pero el factor de
confusión no es la edad (todos los pacientes tiene edad muy similar) sino la ARTEROSCLEROSIS, AT.
Igual que arriba, si estratificamos por AT vemos que entre los que la padecen el % de Enf no se modifica
por la bebida. Y el % de Enf tampoco se modifica por la bebida entre los que no sufren AT. En el grupo
de bebedores hay más Enf porque en ellos hay mayor % de AT que en el otro. ¿Qué podemos decir
sobre qué hace la bebida? Depende del tipo de muestreo, como se explica en la diapositiva
27. Si se muestreó tomando 600 F- y 600 F+, diremos que la AT forma parte del mecanismo de acción que
lleva de la bebida a la Enf, es decir, beber no parece que aumente la FR de Enf, pero sí aumenta la FR
de AT, que, a su vez, incrementa la FR de Enf. La diferencia con la tabla de arriba es que fumar no
173

incrementa la edad, pero beber sí incrementa el % de AT y por ello beber es responsable del incremento
de Enf.
28. Si el muestreo fue tomando 100 personas con AT que no beben, etc.., no se puede saber si beber
incrementa el % de AT. Hay mucho AT en el grupo de bebedores porque alguien decidió tomar una
muestra de 500 bebedores con AT y otra de solo 100 bebedores sin AT.

Estratificación: Confusión y Mecanismos de acción-2


¿Es el % de Aprobados mayor en los que estudian muchas horas?
H+ = Dedican muchas horas a estudiar y hacer ejercicios. H- = Dedican pocas horas
E+ = Entienden los conceptos básicos. E- = No los entienden “A+”: Aprueban
H- (pocas horas) H+ (muchas horas)
Total A+ %A Total A+ %A
TOTAL 1000 260 0.26 1000 660 0.66
E+ (Entienden) 200 180 0.90 700 630 0.90
E- (no entienden) 800 80 0.10 300 30 0.10
20% Entienden 70% Entienden
1- Si se muestreó tomando 200 H- y E+, 700 E+ y H+, 800 E- y H- y 300 E+ y H- :
No podemos saber si estudiar mucho aumenta el % de los que entiende
2- Si se muestreó tomando 1000 H- y 1000 H+ :
Vemos que estudiar mucho aumenta el % de E+ y por ello aumenta el % A+

¿Es el % de Curados mayor en los que juegan al Golf?


No es Juegan golf No Juegan golf
errata, es Jugar golf no causa riqueza
asturiano Total Curan % Cur Total Curan % Cur
TOTAL 1000 780 0.78 1000 480 0.48 Jugar golf y curarse más
Ricos 800 720 0.90 300 270 0.90 son ambas asociadas
Probes 200 60 0.30 700 210 0.30 a la riqueza
80% Ricos 30% Ricos 1.10h
29. En la tabla superior vemos la relación entre estudiar o no muchas horas y aprobar o no cierta materia. En
la primera línea (TOTAL) vemos que el % de aprobados es mucho mayor en los que estudian muchas
horas. Pero al estratificar por Entender bien la materia o no entenderla se encuentra que entre los que la
entienden el número de horas estudiadas no modifica el % de aprobados. Tampoco lo hace entre los que
no la entienden. La interpretación de los datos depende de cómo se han tomado las muestras.
30. Opción 1. Se decidió estudiar 200 personas que entendían y estudiaban pocas horas y 700 que entendían
y estudiaban muchas horas, y 800 personas que no entendían y estudiaban pocas horas y 300 que no
entendían y estudiaban muchas horas. En ese caso la conclusión es que lo que determina el % de
aprobados es entender o no entender. El número de horas que se estudia no influye en ninguno de los
dos grupos (aprueban 90% de los que entienden, estudien muchas o pocas horas, y aprueban 10% de
los que no entienden, estudien muchas o pocas horas). En la línea de totales el % de aprobados es mayor
en el grupo de los que estudian muchas horas, porque en ese grupo se decidió poner a muchos que
entendían. Si las muestras se tomaron de este modo no podemos saber si estudiar muchas horas
favorece entender la materia y por ello no podemos saber si favorece aprobarla.
31. Opción 2. Se decidió estudiar 1000 personas que estudiaban pocas horas y se encuentra que entendían
200 (180 de ellas aprobaron) y no entendía 800 (80 de ellas aprobaron). Y se decidió estudiar 1000
personas que estudiaban muchas horas y se encuentra que entendían 700 (630 de ellas aprobaron) y no
entendía 300 (30 de ellas aprobaron).
32. En ese caso la conclusión también es que lo que determina el % de aprobados es entender o no entender.
Pero este tipo de muestreo permite ver que el % de los que entienden es mayor en los que estudian
muchas que en los que no estudian. En la línea de totales el % de aprobados es mayor en el grupo de los
174

que estudian muchas horas, NO porque en ese grupo se decidió poner a muchos que entendían, sino
porque, en entre los que estudia muchas horas aparecen mayor de proporción de entendedores.
Podríamos decir que estudiar muchas horas favorece entender y por ello aprobar.
33. Otro ejemplo: En la tabla que sigue vemos el % de Claudicación Intermitente, CI, (cuando el paciente
camina, el dolor en las piernas, por falta de riego sanguíneo, le obliga a detenerse) en bebedores crónicos
y cómo afecta según haya o no arterosclerosis, ART, femoral (placas ateromatosas en las arterias
femorales que disminuyen el flujo sanguíneo a través de ellas)
NO BEBEN BEBEN Efecto de
Tot CI %CI Tot CI %CI beber
Total 1000 180 18% 1000 740 74% + 56 puntos
Arterosc, ART 100 90 90%  800 720 90%  0 puntos
No ART 900 90 10%  200 20 10%  0 puntos

34. Ignorando la arterosclerosis, vemos que en los bebedores el % de enfermos es 56 puntos más alto (74%
- 18%). Pero si estratificamos por ART, vemos que entre los que la padecen el % de CI no se modifica
por la bebida. Y tampoco se modifica por la bebida entre los que no sufren ART. La información que nos
dan estos datos también aquí depende de cómo se tomaron las muestras. Si se tomaron 4 muestras de
100, 900, 800 y 200, no podemos saber si beber aumenta el % de ART y por ello aumenta el % de CI.
Pero si se tomó una muestra de 1000 bebedores y otra de 1000 abstenidos, pensamos que la bebida
incrementa notablemente la incidencia de ART y por ello conlleva aumento de la incidencia de CI.

EJERCICIOS DEL TEMA 1.10


SIE 1-10: 1 Sobre Confusión e Interacción
¿Fumar favorece la aparición de enfermedad de pulmón? Se estudian 600 fumadores y 1200 no
fumadores. Se evalúa el “efecto” como diferencia de proporciones de enfermos (no como cocientes).

FUMADORES NO FUMADORES
Total Enferm % Enferm Total Enferm % Enferm
TODOS 600 230 38.3 % 1200 520 43.3 %

Viejos 100 80 80% 1000 500 50%


Jóvenes 500 150 30% 200 20 10%
Todas las afirmaciones que siguen se refieren a la muestra.
1. El efecto del tabaco en los viejos es aumentar 30 puntos el porcentaje de enfermos.
2. El tabaco aumenta en 30 puntos el % de enfermos en los jóvenes.
3. Es igual de probable que tenga enfermedad un joven que fuma que uno que no fuma.
4. El tabaco es perjudicial en los dos grupos de edad, pero el efecto es mayor en viejos que en jóvenes.
5. La enfermedad es más frecuente en los viejos que en los jóvenes, tanto en fumadores como en no fumadores.
175

SIE 1-10: 2 Sobre Confusión e Interacción


Mismo enunciado que el 1-10: 1
Todas las afirmaciones que siguen se refieren a la muestra.
1. Decimos que la edad es factor de confusión porque vemos que el tabaco es perjudicial tanto en jóvenes como en
viejos, pero parece beneficioso cuando no se tiene en cuenta la edad.
2. La Confusión se debe únicamente a que enferman más los viejos que los jóvenes: 50 puntos más en fumadores y
40 en no fumadores.
3. La Confusión se debe a que los jóvenes enferman menos y en el grupo de fumadores hay más proporción de jóvenes
que en el grupo de no fumadores.
4. La conclusión final del estudio tras observar toda la tabla es: el tabaco puede disminuir el % de cancerosos si no se
conoce la edad del paciente.

5. La conclusión final, tras observar toda la tabla, del estudio es: el tabaco aumenta el % de cancerosos, pero si no se
estratifica por la edad del paciente, parece que lo disminuye.

SIE 1-10: 3 Confusión: tratamientos A y B


En un Ensayo Clínico se estudia el porcentaje de curaciones, “%+”, obtenidas con cada uno de dos
tratamientos, ‘A’ y ‘B’, para la misma enfermedad.
A B
Total + %+ Total + %+ Efecto de A

Mujeres 100 80 80% 500 300 60% +20


Varones 500 110 22% 100 2 2% +20
Todos 600 190 31.7% 600 302 50.3% - 18.3
1. Se produce confusión (al juntar hombres y mujeres parece que A cura menos que B) sólo porque los hombres curan
menos que las mujeres, con cualquier tratamiento.
2. Se produce confusión sólo porque entre los tratados con A hay mayoría de hombres.
3. Se produce confusión porque los hombres curan menos que las mujeres y en el grupo tratado con A hay mayor
proporción de varones que en el grupo tratado con B.
4. Son más fiables las conclusiones cuando se estudian en hombres y mujeres juntos, 600 con A y 600 con B, porque
el número de individuos usados es mayor que al separarlos por sexos.
5. Teniendo en cuenta toda la información de este estudio, vemos que en estas muestras es realmente más efectivo el
tratamiento A.

SIE 1-10: 4 ¿La práctica del deporte favorece la aparición de la agresividad? Se estudian 1000
deportistas y 1000 sedentarios. Se evalúa el “efecto” como diferencia de proporciones de enfermos
(no como cocientes).
DEPORTISTAS SEDENTARIOS Efecto del
Total Agresiv % Agresiv Total Agresiv % Agresiv deporte
TODOS 1000 620 62 % 1000 270 27 % + 35
Mujeres 200 20 10% 900 180 20% -10
Varones 800 600 75% 100 90 90% - 15
1. En esta muestra son agresivas el 27% de las personas sedentarias y el 62% de las personas deportistas.
2. Si no se tiene en cuenta el sexo, el deporte parece aumentar el % de agresivos.
3. La agresividad es más frecuente en los varones que en las mujeres, tanto en deportistas como en no deportistas.
4. Mirando toda la tabla se ve claramente que en estas muestras el deporte aumenta la agresividad.
5. Mirando toda la tabla se ve claramente que en estas muestras el deporte disminuye la agresividad.
176

SIE 1-10: 5 Se sospecha que el fármaco "B” aumenta el rendimiento físico, que se evaluará
midiendo la distancia que cada individuo puede recorrer en un minuto.

SIN B CON B
N Total Media N Total Media
Total 100 23000 230  100 23500 235
Jóvenes 10 5000 500  90 36000 400
Viejos 90 18000 200  10 1000 100
1. En la muestra B disminuye el rendimiento en jóvenes.
2. En la muestra B aumenta el rendimiento en viejos.
3. La edad es factor de confusión.
4. El efecto (medido como diferencia) del fármaco B en jóvenes y en viejos es el mismo.
5. La confusión se debe a que los jóvenes tienen mayor rendimiento y en el grupo con B hay mayor % de jóvenes que
en el otro.

SIE 1-10: 6 Se sospecha que el fármaco "C” aumenta el rendimiento físico, que se evaluará midiendo
la distancia que cada individuo puede recorrer en un minuto.

SIN C CON C
N Total Media N Total Media
Total 100 23000 230  100 23500 235
Jóvenes 10 5000 500  90 22500 250
Viejos 90 18000 200  10 1000 100
1. En la muestra C reduce a la mitad el rendimiento.
2. La edad es factor de confusión.
3. En estas muestras se ve que C no hace prácticamente nada.
4. Decimos que hay confusión porque vemos que el efecto (medido como diferencia) no es el mismo en ambas edades.
5. El efecto (medido como diferencia) es 150 unidades mayor en jóvenes que en viejos.

SIE 1-10: 7 Para ver si cierto fármaco F modifica el rendimiento físico, se administra a un grupo de
90 jóvenes y a otro de 10 viejos, y se les pide que corran al máximo durante un minuto. Se hace la
misma prueba con 10 jóvenes y 90 viejos que no habían tomado F. Se anota el espacio en metros que,
por término medio, recorrió cada uno de los grupos. Se evalúa el efecto del fármaco como diferencia
entre distancia media con y sin F.
CON F  Jóvenes: N = 90, Media = 250 || Viejos: N = 10, Media = 100
SIN F  Jóvenes: N = 10, Media = 500 || Viejos: N = 90, Media = 200

Media en (Jov + Vie) : Con F (90 * 250 + 10 * 100) / 100 = (22500 + 1000) / 100 = 235
Sin F (10 * 500 + 90 * 200) / 100 = (5000 + 18000) / 100 = 230

1. El efecto del fármaco en jóvenes es la distancia media recorrida por los 90 jóvenes, es decir, 250.
2. El efecto de F en viejos es la diferencia entre la distancia media recorrida con y sin F, es decir, 100 – 200 = -100.
3. En la muestra F disminuye la distancia media recorrida en 250 m en los jóvenes.
4. En los viejos, F no tiene ningún efecto en la muestra.
5. Si no tenemos en cuenta la edad de los individuos, la distancia media recorrida sin F es 230 y con fármaco 235.
177

SIE 1-10: 8 Para ver si cierto fármaco F modifica el rendimiento físico, se administra a un grupo de
90 jóvenes y a otro de 10 viejos, y se les pide que corran al máximo durante un minuto. Se hace la
misma prueba con 10 jóvenes y 90 viejos que no habían tomado F. Se anota el espacio en metros que,
por término medio, recorrió cada uno de los grupos. Se evalúa el efecto del fármaco como diferencia
entre distancia media con y sin F.
CON F  Jóvenes: N = 90, Media = 250 || Viejos: N = 10, Media = 100
SIN F  Jóvenes: N = 10, Media = 500 || Viejos: N = 90, Media = 200

Media en (Jov + Vie) : Con F (90 * 250 + 10 * 100) / 100 = (22500 + 1000) / 100 = 235
Sin F (10 * 500 + 90 * 200) / 100 = (5000 + 18000) / 100 = 230

1. Decimos que la edad es factor de confusión porque al no considerar la edad de los individuos vemos que el fármaco
baja el rendimiento.
2. En la muestra el efecto de F es mayor en jóvenes (baja 250 m la media) que en viejos (la baja 100m).
3. El efecto (medido como diferencia) del fármaco F en jóvenes y en viejos es el mismo.
4. Si no se tiene en cuenta la edad de los individuos, parece que F aumenta la distancia media recorrida en 5 m.
5. Decimos que hay confusión porque el efecto del fármaco no es el mismo en jóvenes que en viejos.

SIE 1-10: 9 Para ver si cierto fármaco F modifica el rendimiento físico, se administra a un grupo de
90 jóvenes y a otro de 10 viejos, y se les pide que corran al máximo durante un minuto. Se hace la
misma prueba con 10 jóvenes y 90 viejos que no habían tomado F. Se anota el espacio en metros que,
por término medio, recorrió cada uno de los grupos. Se evalúa el efecto del fármaco como diferencia
entre distancia media con y sin F.
CON F  Jóvenes: N = 90, Media = 250 || Viejos: N = 10, Media = 100
SIN F  Jóvenes: N = 10, Media = 500 || Viejos: N = 90, Media = 200

Media en (Jov + Vie) : Con F (90 * 250 + 10 * 100) / 100 = (22500 + 1000) / 100 = 235
Sin F (10 * 500 + 90 * 200) / 100 = (5000 + 18000) / 100 = 230

1. En la muestra las distancias recorridas por los jóvenes son mayores que las de los viejos.
2. Si no se tiene en cuenta la edad parece que F es perjudicial; la única razón es que las distancias de los jóvenes son
mayores que las de los viejos.
3. Como los viejos recorren menos distancia que los jóvenes y hay muchos viejos en el grupo de los que no reciben F,
hace que la distancia sin F, en el total de personas, sea menor que con F.
4. El fármaco F realmente no es efectivo, pues no aumenta la distancia cuando se tiene en cuenta la edad.
5. La edad es factor de confusión en este estudio.

SIE 1-10: 10 Para estudiar la relación entre “número de horas semanales dedicadas a hacer deporte”
y la “edad ”, se estudia un grupo de 13 hombres y otro de 17 mujeres, y se obtiene:
Hombres Mujeres Hom + Muj
N Media sum N Media sum N Media sum
Menos de 20 años 4 2 8 6 10 60 10 6.8 68
Entre 20 y 40 años 3 6 18 7 7 49 10 6.7 67
Más de 40 años 6 11 66 4 1 4 10 6.8 68
Total 13 7.23 94 17 6.65 113

1. El número medio de horas dedicado al deporte es 7.23 en los hombres.


2. En las mujeres, el número de horas dedicadas al deporte disminuye con la edad.
3. Los mayores de 40 años del grupo estudiado (hombres y mujeres) dedican 9.5 horas, por término medio a la semana
a hacer deporte.
4. El número de horas dedicadas al deporte es independiente de la edad en los hombres.
5. En los hombres, el número de horas dedicadas al deporte aumenta con la edad.
178

FACTORES “INTERMEDIOS” Y MECANISMOS DE ACCIÓN


SIE 1-10: 11 Se clasifica a médicos según tres variables dicotómicas, en relación con la bioestadística
Horas: H+ = Dedican muchas horas a estudiar y hacer ejercicios. H- = Dedican pocas horas
Entienden: E+ = Entienden los conceptos básicos. E- = No los entienden
Aprueban y Aprovechan: A+ = Aprueban los exámenes A- = No aprueban

H- (pocas horas) H+ (muchas horas)


N A+ % A+ N A+ % A+
Total 1000 220 0.22  1000 866 0.866
E+ (Entienden) 200 180 0.90  960 864 0.90
E- (no entienden) 800 40 0.05  40 2 0.05

1. Aprueban el 13.5% de los alumnos que dedican pocas horas y el 86.6% de los que dedican muchas horas.
2. Aprueban el 90% de los alumnos que entienden, hayan estudiado pocas o muchas horas.
3. Aprueban el 5% de los alumnos que no entienden, hayan estudiado pocas o muchas horas.
4. Decimos que Entender es un factor de confusión INTERMEDIO, porque el % de los que entienden es mayor en el
grupo que estudia muchas horas.
5. Entender es factor intermedio. Los que estudian muchas horas aprueban más porque la mayoría de ellos consiguen
entender, mientras que solo un 20% de los que no estudian consiguen entender.

SIE 1-10: 12 Se clasifica a PCS según tres variables dicotómicas, en relación con la bioestadística
Horas: H+ = Dedican muchas horas a estudiar y hacer ejercicios. H- = Dedican pocas horas
Entienden: E+ = Entienden los conceptos básicos. E- = No los entienden
Aprueban y Aprovechan: A+ = Aprueban los exámenes A- = No aprueban

H- (pocas horas) H+ (muchas horas)


N A+ % A+ N A+ % A+
Total 1000 220 0.22  1000 866 0.866
E+ (Entienden) 200 180 0.90  960 864 0.90
E- (no entienden) 800 40 0.05  40 2 0.05

1. Si estudian muchas horas y entienden aprobarán en mayor % que si estudian pocas horas y entienden.
2. Si estudian muchas horas y no entienden es igual que si estudian pocas horas y no entienden.
3. Toda la ventaja de estudiar muchas horas se debe a que entienden más.
4. Si estudian muchas horas y entienden es mejor que si estudian pocas horas y entienden.
5. Lo decisivo no es el número de horas que estudian, sino entender o no.

SIE 1-10: 13 Se clasifica a PCS según tres variables dicotómicas, en relación con la bioestadística
Horas: H+ = Dedican muchas horas a estudiar y hacer ejercicios. H- = Dedican pocas horas
Entienden: E+ = Entienden los conceptos básicos. E- = No los entienden
Aprueban y Aprovechan: A+ = Aprueban los exámenes A- = No aprueban

H- (pocas horas) H+ (muchas horas)


N A+ % A+ N A+ % A+
Total 1000 220 0.22  1000 866 0.866
E+ (Entienden) 200 180 0.90  960 864 0.90
E- (no Entienden) 800 40 0.05  40 2 0.05

1. Lo decisivo para tener más probabilidad de aprobar es el número de horas que estudian.
2. Si estudian muchas horas tiene más probabilidad de aprobar.
3. El % de los que entienden es mucho mayor entre los que estudian muchas horas.
4. Estudiar mucho o poco no influye en la probabilidad que tiene de entender.
5. Entienden el 80% de los que estudian mucho y el 4% de los que estudian poco.

También podría gustarte