Está en la página 1de 1355

Gua Prctica del Curso

de Bioestadstica Aplicada
a las Ciencias de la Salud

Dr. Jacobo Daz Portillo


Gua Prctica del Curso
de Bioestadstica Aplicada
a las Ciencias de la Salud

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

Direccin Territorial de Ceuta


Hospital Universitario de Ceuta
Urb. Loma Colmenar, s/n
51003 Ceuta

Edita: Instituto Nacional de Gestin Sanitaria


Subdireccin General de Gestin Econmica y Recursos Humanos
Servicio de Recursos Documentales y Apoyo Institucional
Alcal, 56 28014 Madrid

El copyright y otros derechos de propiedad intelectual pertenecen


al Instituto Nacional de Gestin Sanitaria.
Se autoriza la reproduccin total o parcial para uso no comercial,
siempre que se cite explcitamente su procedencia.

Depsito Legal: M-33564-2011


NIPO: 865-11-010-6
Coleccin Editorial de Publicaciones del INGESA: 1.921
La medicina es una ciencia de probabilidades y el arte de manejar la incertidumbre...

La estadstica es la ciencia que permite tomar decisiones en situaciones


de incertidumbre.

Bailar JC III. Some uses of statistical thinking. En: Bailar JC III,


Mostoller F, editors. Medical uses of statistics. Boston: N Engl
J Med Books, 1992; p. 25-57.
ndice
Gua Prctica del Curso de Bioestadstica Aplicada
a las Ciencias de la Salud

Captulo 1
Pgina 10
Publicacin Bioestadstica: Introduccin.

Captulo 2
Pgina 72
Publicacin Bioestadstica: Variables y grficos.
Captulo 3
Pgina 161
Publicacin Bioestadstica: Tamao muestral, Error y .

Captulo 4
Pgina 214
Publicacin Bioestadstica: Error y . Evaluacin de pruebas
diagnsticas.

Captulo 5
Pgina 355
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cualitativa versus cualitativa.

Captulo 6
Pgina 450
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cualitativa versus cualitativa. Medidas
de asociacin.
Captulo 7
Pgina 640
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cuantitativa versus cuantitativa.

Captulo 8
Pgina 727
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cualitativa dicotmica versus
cuantitativa.

Captulo 9
Pgina 874
Publicacin Bioestadstica: Anlisis bivariante. Test de
contraste de hiptesis. Cualitativa policotmica versus
cuantitativa.
Captulo 10
Pgina 992
Publicacin Bioestadstica:
Medidas de concordancia. Variables cualitativas.

Captulo 11
Pgina 1021
Publicacin Bioestadstica: Medidas de concordancia.
Variables cuantitativas.

Captulo 12
Pgina 1158
Publicacin Bioestadstica: Anlisis multivariante.

Captulo 13
Pgina 1337
Publicacin Bioestadstica: Bibliografa.
Es una verdad muy cierta que, cuando no est a nuestro alcance determinar
lo que es verdad, deberemos buscar lo que es ms probable.
Discurso del Mtodo. Ren Descartes.

No existe ni el negro ni el blanco, solo existe una completa escala de grises...

La respuesta est dibujada en el aire...


Si, segn Montaigne, para juzgar cosas grandes y nobles, es necesario
poseer un alma igual de grande y noble(*), para juzgar un artculo cientfico
escrito por un colega es necesario poseer, adems, conocimientos,
experiencia, imparcialidad, confidencialidad, diligencia, una cierta dosis de
pedagoga y otra no menos esencial de compaerismo (**).

(*) Montaigne M. Les essais [libro en internet]. Versin HTML daprs ldition de 1595 [acceso 31 de
octubre de 2008]. Disponible en: http://www.bribes.org/trismegiste/montable.htm

(**) F. Antoja Rib. Revisores. Revista del laboratorio clnico. 2009; 2: 63.
C aptulo 1 Pgina 10

Captulo 1

Publicacin Bioestadstica: Introduccin.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 1 Pgina 11

Bioestadstica aplicada a las Ciencias de la Salud


Definicin

La Estadstica es la ciencia que se ocupa de los mtodos y procedimientos


para recoger, clasificar, resumir, hallar regularidades y analizar los datos,
siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de
los mismos; as como de realizar inferencias a partir de ellos, con la finalidad
de ayudar a la toma de decisiones y en su caso formular predicciones.
C aptulo 1 Pgina 12

Bioestadstica aplicada a las Ciencias de la Salud


Estadstica descriptiva

Describe, analiza y representa un grupo de datos utilizando mtodos


numricos y grficos que resumen y presentan la informacin contenida en
ellos.
C aptulo 1 Pgina 13

Bioestadstica aplicada a las Ciencias de la Salud


Estadstica inferencial

Apoyndose en el clculo de probabilidades y a partir de datos de una


muestra (procedente de una poblacin), efecta estimaciones, decisiones,
predicciones u otras generalizaciones sobre un conjunto mayor de datos.
Permite generalizar los datos obtenidos a partir de una muestra a la poblacin
de la que proceden. Se basa en la teora de las probabilidades y trabaja con
los datos que le proporciona la estadstica descriptiva.
C aptulo 1 Pgina 14

Bioestadstica aplicada a las Ciencias de la Salud


Estadstica en Medicina

La medicina es una ciencia estadstica, pues siempre se trabaja con la


probabilidad de enfermar y con la oportunidad incierta del diagnstico y del
tratamiento. El mdico debe adecuar el conocimiento cientfico y tecnolgico
a la situacin clnica personal y social del paciente del que se ocupa en ese
momento, ya que no existen enfermedades sino enfermos. El buen juicio
mdico logra un equilibrio entre el riesgo que comporta toda intervencin
diagnstica y/o teraputica y el beneficio esperable de dicha intervencin
en el paciente concreto, lo que obliga a combinar ciencia y arte, pues no
es fcil trabajar con la incertidumbre, y slo la estadstica nos proporciona
el instrumento adecuado que nos permite convivir con el azar, y con las
limitaciones del conocimiento mdico.
C aptulo 1 Pgina 15

Hay verdades que por sabidas no se dicen, y por no decirlas se olvidan...

Hay mentiras (mitos o leyendas) que por decirlas pueden terminar siendo
pseudorealidades o realidades virtuales.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada.
Hospital Universitario de Ceuta.
C aptulo 1 Pgina 16

Mitos y Leyendas en Bioestadstica

Bobenrieth Astete M.A . Mitos y realidades en torno a la publicacin


cientfica. Med Clin (Barc) 2000; 114: 339-341.

Bobenrieth Astete M.A . Lectura crtica de artculos originales en Salud.


Medicina de Familia (And) 2001; 2: 81-90.

Profesor Bobenrieth Astete M.A.


Profesor de Metodologa de Investigacin y Escritura Cientfica.
Escuela Andaluza de Salud Pblica.
C aptulo 1 Pgina 17

Mitos y Realidades en Bioestadstica

MITO 1: La sonrisa de la esfinge.

Cul es el ser que por la maana anda con cuatro patas, luego por la
tarde con dos, y despus por la noche con tres patas, y que se vuelve
ms dbil cuanto ms patas tiene?

Hay dos hermanas una de las cuales engendra a la otra, y sta a su vez
engendra a la primera Quines son?
C aptulo 1 Pgina 18

Mitos y Realidades en Bioestadstica


REALIDAD 1: Respuesta de Edipo.
Cul es el ser que por la maana anda con cuatro patas, luego por la tarde
con dos, y despus por la noche con tres patas, y que se vuelve ms dbil
cuanto ms patas tiene?
Edipo respondi correctamente y dijo: el HOMBRE, porque la maana, la
tarde y la noche traducen las etapas de la vida. El da o comienzo de la vida
muestra al beb gateando en cuatro pies o patas, la tarde o mitad de la vida
es la adultez del ser humano caminando en dos pies y la noche o final de la
vida muestra al anciano con un bastn o sea en tres pies.

Hay dos hermanas una de las cuales engendra a la otra, y sta a su vez
engendra a la primera Quines son?
Edipo contest: el DA y la NOCHE.

Furiosa, la Esfinge se suicida lanzndose al vaco y Edipo fue aclamado como


el salvador de Tebas, y como premio, Edipo fue nombrado rey de Tebas.
C aptulo 1 Pgina 19

Mitos y Realidades en Bioestadstica


MITO 1: La sonrisa de la esfinge.

Cmo voy a ser capaz de presentar y defender una comunicacin cientfica


en cualquier foro pblico o mandar a publicar un artculo original a una revista
sanitaria ante tan docto auditorio?

Qu me van a preguntar? Qu me van a decir si no respondo o no lo hago


adecuadamente? Seguro que hago el ridculo

Seguro que me rechazan el artculo original cuando lo mande a publicar a la


revista...
Si lo publican seguro que alguien me lo critica con una carta al director
que se publica en el nmero siguiente, y todo el mundo va a conocer mis
deficiencias
Dr. Jacobo Daz Portillo
Coordinador de Formacin Continuada
Hospital Universitario INGESA de Ceuta
C aptulo 1 Pgina 20

Realidad 1: Respuesta de Edipo

FORMACIN CONTINUADA

METODOLOGA DE INVESTIGACIN
BIOESTADSTICA
ESCRITURA CIENTFICA
PRESENTACIONES CIENTFICAS EN POWER POINT
BSQUEDA DE BIBLIOGRFICA SEGN CRITERIOS
DE MEDICINA BASADA EN LA EVIDENCIA
C aptulo 1 Pgina 21

Bioestadstica

La bioestadstica es la punta visible del iceberg de la metodologa de


investigacin.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 1 Pgina 22

Mitos y Realidades en Bioestadstica

REALIDAD 1: Muchos investigadores tienen bien definido su estudio y


manejan correctamente las variables (datos), pero no aciertan cuando
escogen las pruebas estadsticas pertinentes, y llegan a la presentacin
oral (comunicacin) o a la redaccin de las revistas cientficas (artculo
original) trabajos que adolecen de una manifiesta mala sincrona entre los
datos obtenidos y su posterior anlisis estadstico.

Antoja Rib F. The innocence of the storks.


Rev Lab Clin 2010; 3 (2): 51.
C aptulo 1 Pgina 23

Mitos y Leyendas en Bioestadstica

REALIDAD 1: Los auditores de los congresos sanitarios y los revisores


de las revistas cientficas suelen ser colegas con un alto perfil profesional,
aceptable formacin en Metodologa de Investigacin, pero quizs sin un
alto nivel de conocimientos de anlisis estadstico de datos.

Antoja Rib F. The innocence of the storks.


Rev Lab Clin 2010; 3 (2): 51.
C aptulo 1 Pgina 24

Mitos y Leyendas en Bioestadstica

REALIDAD 1: El Comit Cientfico de los congresos y los editores de las


revistas ante trabajos de difcil evaluacin metodolgica incorporan un
tercer revisor especialista en Bioestadstica que dictamina definitivamente
sobre la idoneidad de las herramientas metodolgicas empleadas por los
autores.

Antoja Rib F. The innocence of the storks.


Rev Lab Clin 2010; 3 (2): 51.
C aptulo 1 Pgina 25

Enseanza de la Bioestadstica Aplicada

MITO 2: Enseanza de la investigacin clnica.

Antonio Fraguas de Pablo (Forges).


Qu le pasa, Doctor?Eh?. Ediciones Doyma 1988 (Barcelona).
C aptulo 1 Pgina 26

Mitos y Realidades en Bioestadstica


Enseanza autodidacta de la Bioestadstica aplicada

REALIDAD 2: La educacin autodidacta en Bioestadstica es el conjunto de


procesos que realizamos para incorporar nuevos conocimientos necesarios
para cada momento, donde uno mismo selecciona la informacin que
necesita y se evala a s mismo con el mtodo ensayo-error.

La educacin autodidacta es, creo firmemente, el nico tipo de educacin


que existe.
Isaac Asimov.
C aptulo 1 Pgina 27

Mitos y Realidades en Bioestadstica

MITO 3: Una publicacin sobre las ventajas de un nuevo tratamiento con


otro vigente que demuestra significacin estadstica (p < 0,05) posee, en
consecuencia, importancia y significacin clnica.
C aptulo 1 Pgina 28

Mitos y Realidades en Bioestadstica

REALIDAD 3: Mediciones y afirmaciones de probabilidad pueden ser


de gran ayuda en la prctica mdica, pero nunca deben reemplazar en
muchos casos a
- La experiencia.
- La perceptividad.
- El sentido comn.
- Y la intuicin.

Dr. Manuel Bobenrieth Astete


Profesor de Metodologa de Investigacin y Escritura Cientfica
Escuela Andaluza de Salud Pblica.
C aptulo 1 Pgina 29

Mitos y Realidades en las publicaciones cientficas

REALIDAD 3: El valor de p, debe ser valorado con precaucin y teniendo


en cuenta el contexto del estudio, su diseo, las caractersticas de la
muestra o la poblacin analizada, de los potenciales sesgos, etc. Y NUNCA
como una cifra mgica que nos seduzca tanto, que nos invite o autorice a
tomar decisiones o cambiar conductas relacionadas con la prctica clnica
cotidiana.

REALIDAD 3: Antes de tomar decisiones o cambiar conductas clnicas


basadas en un valor de p, se ha de considerar tambin la VALIDEZ
EXTERNA (generalizacin de los resultados obtenidos en ese estudio
respecto de la poblacin inicial y, si esas conclusiones pueden ser
extrapoladas a nuestros pacientes o nuestra realidad laboral (que pueden
ser distinta a la descrita en el estudio publicado y valorado por nosotros.
C aptulo 1 Pgina 30

Realidad 3
...de lo estadsticamente significativo a lo clnicamente relevante

Hallazgos estadsticos Hallazgos clnicos

1. Reflejan la influencia del azar en el 1. Reflejan el valor biolgico del resultado


resultado
2. Se practica en individuos especficos
2. Derivan de grupos de individuos
3. Las decisiones clnicas deben tomarse a
3. Requieren cantidades adecuadas de menudo con datos insuficientes
datos para ser vlidas
4. Los tratamientos mdicos requieren
4. Las respuestas estadsticas son decisiones oportunas comprometidas
probabilsticas
5. La prctica clnica no puede medir
5. El anlisis estadstico siempre requiere fcilmente cada funcin, cada sistema,
medicin. cada signo o sntoma clnico
C aptulo 1 Pgina 31

Realidad 3
...de lo estadsticamente significativo a lo clnicamente relevante
Por todo ello, es ms apropiado que hablar de SIGNIFICACIN
ESTADSTICA es ms correcto utilizar el concepto de RELEVANCIA
CLNICA; porque la relevancia clnica de un fenmeno va ms all de
clculos matemticos y depende de

1. La gravedad del problema,


2. La morbilidad y mortalidad generada por el mismo,
3. La magnitud de la diferencia,
4. La vulnerabilidad,
5. Los costes involucrados, etc.
C aptulo 1 Pgina 32

Realidad 3
...de lo estadsticamente significativo a lo clnicamente relevante

Realidad 3: ...de lo Es clnicamente relevante?


estadsticamente significativo a lo
clnicamente relevante.
Es estadsticamente significativo? S (xito) No (fracaso)
S (p < 0,05) Clnicamente relevante Clnicamente irrelevante (p < 0,05)

Estadsticamente significativo Estadsticamente significativo

Error Alfa?

No (p > 0,1) Clnicamente relevante Clnicamente irrelevante

Estadsticamente NO Estadsticamente NO significativo


significativo

Error Beta?
C aptulo 1 Pgina 33

Mitos y Realidades en Bioestadstica

REALIDAD 3: Un resultado estadsticamente significativo (p<0,05) sin


relevancia clnica no deja de ser una ANCDOTA; un hallazgo clnicamente
importante sin significacin clnica (p>0,1) no puede ser asumido como
concluyente, ya que no podemos atribuir con seguridad el hallazgo clnico a
la intervencin realizada (no podemos descartar la influencia del AZAR).
C aptulo 1 Pgina 34

Mitos y Realidades en Bioestadstica

REALIDAD 3: Una prueba estadstica NO es una prueba de relevancia


cientfica. Bajo ningn concepto la relevancia del dato se encuentra en la
tcnica de anlisis, sino en la repercusin del mismo en el conocimiento
del objeto de estudio. Es perfectamente compatible encontrar diferencias
estadsticamente significativas que no suponen relevancia clnica, y
viceversa.

Guttman . What is not what statistics (1977).


C aptulo 1 Pgina 35

Mitos y Realidades en Bioestadstica

MITO 4: La ausencia de evidencia es evidencia de ausencia.

REALIDAD 4: La ausencia de evidencia NO es evidencia de ausencia.

Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ 1995;311:485.
C aptulo 1 Pgina 36

Mitos y Realidades en Bioestadstica

MITO 4: La ausencia de significacin estadstica (p > 0,05) implica que


dos tratamientos comparados tienen la misma eficacia y por tanto pueden
prescribirse indistintamente.

Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ 1995;311:485.
C aptulo 1 Pgina 37

Mitos y Realidades en Bioestadstica

REALIDAD 4: Altman y Bland alertaron sobre un error comn en la


bibliografa biomdica: interpretar un resultado estadsticamente no
significativo, cuando se comparan dos tratamientos, como sinnimo de su
equivalencia teraputica.

Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ 1995;311:485.

Argimon JM. La ausencia de significacin estadstica en un ensayo clnico no significa equivalencia


teraputica. Med Clin (Barc) 2002; 118: 701-3.
C aptulo 1 Pgina 38

Mitos y Realidades en Bioestadstica

REALIDAD 4: Un valor de significacin estadstica mayor p > 0,05 se


etiqueta como no significativo. Estos estudios se les denomina negativos,
un trmino que implica errneamente que los tratamientos son iguales,
cuando lo nico que sucede es que no se ha podido demostrar una
diferencia. Ambos conceptos son distintos. Un resultado que no alcance
significacin estadstica quiere decir que (si en realidad no existe esa
diferencia), es probable que la observada en el estudio pueda haberse
producido simplemente por el AZAR (variabilidad aleatoria). No debe
interpretarse como indicativo de que no existe una diferencia en la realidad,
sino tan slo de que no puede descartarse esta posibilidad, en especial en
los estudios que han incluido a pocos sujetos.
C aptulo 1 Pgina 39

Mitos y Realidades en Bioestadstica

MITO 5: La estadstica es una religin que conduce a la salvacin a travs


del mgico ritual de la bsqueda de valores significativos de la p (p<0,05),
alcanzando entonces los autores la verdad absoluta y el paraso prometido
de la publicacin del trabajo en una revista de alto ndice de impacto.
C aptulo 1 Pgina 40

Mitos y Realidades en Bioestadstica

REALIDAD 5: En la bibliografa cientfica se est abusando del trmino


significacin estadstica. Numerosos investigadores dan por supuesto que
si en un estudio hallan una probabilidad (p) inferior a 0,05, ello certifica
la existencia tanto de la validez cientfica de su observacin como de la
relevancia clnica de la misma. Y ello est lejos de ser cierto.Su fe ciega en
el valor de la p contrasta con los detractores de su significado (ateos de la
estadstica).
C aptulo 1 Pgina 41

Mitos y Realidades en Bioestadstica

REALIDAD 5: La estadstica es una herramienta til para el diseo


y realizacin de estudios sanitarios siempre que sea utilizada
adecuadamente.

Salsburg DS. The religion of statistics as practiced


in medical journals. Am Statistician 1985; 39: 220-223.
C aptulo 1 Pgina 42

Mitos y Realidades en Bioestadstica

REALIDAD 5: Los mtodos estadsticos NO son un sustituto del sentido


comn y la objetividad. Nunca deberan estar dirigidos a impresionar o
confundir al lector, sino que deben ser una contribucin importante a la
claridad de los conocimientos cientficos.

Pocock SJ. The role of statistics in medical research. Br J Psychiat 1980; 137: 188-190.
C aptulo 1 Pgina 43

Mitos y Realidades en Bioestadstica

REALIDAD 5: Es fundamental hacer buenas preguntas de investigacin, lo


cual nos llevar a trabajos interesantes y respuestas con sentido comn, no
habr necesidad de SALIR DE PESCA para presentar al editor muchas
p menores de 0.05. Todo, con mesura y utilizado racionalmente, es bueno,
y la estadstica es un instrumento indispensable pero, como todo en la
vida, con SENTIDO COMN (y este sentido estadsticamente hablando no
parece ser a veces muy frecuente).

Dr. Juan M. Garca Torrecillas


Mdico de Especialista en Medicina Familiar y Comunitaria
Experto en Epidemiologa y Nuevas Tecnologas
C aptulo 1 Pgina 44

El Borracho

Utiliza la estadstica como un borracho usa una farola, para aguantarse


en lugar de para iluminarse

Andrew Lang
C aptulo 1 Pgina 45

Objetivo principal de la estadstica:


Cul es la probabilidad de que la diferencia observada en el estudio
se deba al AZAR?
- Una p < 0,05 indica que en menos de 5 veces de cada 100 que
repitiramos el mismo estudio, nuestro resultado se debera al AZAR.

- Cuanto mayor sea la p (p > 0,1) ms fuerte y segura ser la evidencia a


favor de la hiptesis nula (igualdad).

- El valor de la p no es un indicador de fuerza de asociacin, ni tampoco


de su importancia clnica.
C aptulo 1 Pgina 46

La Llave Dorada

La estadstica no es la llave dorada que abre la puerta de la verdad


absoluta e infinita

La verdad absoluta e infinita tiene una sonrisa diablica. Si consigo la llave dorada podr
abrir la puerta , y as podr conocer la verdad absoluta e infinita.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 1 Pgina 47

Mitos y Realidades en Bioestadstica

MITO 6 (significantitis): Si p es mayor que el 5%, el resultado del estudio


no vale para nada; slo si es menor de 0,05, hemos hecho un gran
descubrimiento.

Chia KS. Significant-itis: an obsession with the P value. Scand J Work Environ Health. 1997; 23:152-4.
Christenson P. To p or not to p. J Child Adolesc Psychiatr Nurs. 1995; 8:42.
C aptulo 1 Pgina 48

Mitos y Realidades en Bioestadstica

REALIDAD 6: Algunos, de forma irnica, a esta postura tan drstica y


que pocas veces est realmente justificada la consideran una autntica
enfermedad llamada significantitis o es como un problema de conciencia:
to p or not to p. Neyman et al. al considerar que haba que establecer un
lmite claro en el valor p para aplicar los razonamientos anteriores de forma
absoluta. Este valor crtico de p es el famoso 0,05 y marca el mtico lmite
de la significacin estadstica.

Neyman J, Pearson E. On the problem of the most efficient tests of statistical hypothesis. Philosophical trans
of the Royal Society of London (A) 1933;231:289-337.
C aptulo 1 Pgina 49

Mitos y Realidades en Bioestadstica

REALIDAD 6: Neyman et al lanzaron este lema exclusivamente bajo


el punto de vista de la toma de decisin ante un problema que fuera
trascendente y en el que, urgiera tal toma de decisin: rechazar o no la
hiptesis nula con sus consecuencias derivadas. Lo que ocurre es que se
ha universalizado demasiado y se lo ha sacado de su contexto, ya que se
aplica a cualquier inferencia estadstica, aunque el fin de la investigacin no
suponga obligacin alguna de tomar una decisin tan drstica, basada en la
ley del todo o nada.

Neyman J, Pearson E. On the problem of the most efficient tests of statistical hypothesis. Philosophical trans
of the Royal Society of London (A) 1933;231:289-337.
C aptulo 1 Pgina 50

Mitos y Realidades en Bioestadstica

MITO 7 (adoradores de la p): La esencia de la estadstica es la bsqueda


de los valores ms bajos de la p, (una p < 0,001 es mejor que una p < 0,01,
y sta superior a una p <0,05) ya que cuanto ms pequea sea esta p
mayor intensidad de asociacin y causalidad existir entre las variables y
mayor credibilidad tendrn las conclusiones de mi estudio.
C aptulo 1 Pgina 51

Mito 7: Adoradores de la p

El cual los tom de las manos, y formlo con buril, e hizo de ello un
becerro de fundicin. Entonces dijeron: Israel, estos son tus dioses, que
te sacaron de la tierra de Egipto

xodo 32, 1-6


C aptulo 1 Pgina 52

Mitos y Realidades en Bioestadstica

REALIDAD 7: La utilidad de la p es una medida de la influencia del AZAR


en la posible asociacin entre las variables analizadas, este azar debe ser
siempre contemplado, evaluado y cuantificado mediante el valor de la p. La
p NO es un indicador de fuerza de la asociacin entre variables, ni de su
importancia. Los valores de la p deben ser considerados solo como una
gua y no como base de conclusiones definitivas e irrevocables.
C aptulo 1 Pgina 53

Mitos y Realidades en Bioestadstica

MITO 8: Hace poco le en la prensa mdica la siguiente frase: Yo no


creo en la estadstica, (ATEOS de la estadstica) porque est claro que la
estadstica, como religin que es, es solo una cuestin de fe, que como tal
debe ser respetada (segn dice el artculo 16 de la Constitucin Espaola
sobre la libertad religiosa).
C aptulo 1 Pgina 54

Mitos y Realidades en Bioestadstica

REALIDAD 8: La estadstica constituye un instrumento cientfico que


requiere el cumplimiento de NUMEROSAS CONDICIONES para producir
resultados vlidos.
1. Es preciso que los experimentos tengan un diseo muy escrupuloso.
2. Es inexcusable aplicar en cada circunstancia aquellos mtodos que en
ella son idneos y controlar rigurosamente su validez.
3. NUNCA es legtimo deducir que un resultado significativo es clnicamente
relevante.
4. Una correlacin entre dos variables acabar siendo siempre significativa
(p < 0,05) si la muestra es lo suficientemente grande.
5. Por eso en algunos casos, se dice que: La estadstica es un
instrumento, que si no se usa adecuadamente, puede demostrar cualquier
MENTIRA.
C aptulo 1 Pgina 55

Mitos y Realidades en Bioestadstica

REALIDAD 8: Aplicando los mtodos estadsticos de forma abusiva (como


lo haca la Santa Inquisicin), si torturamos suficientemente a nuestros
datos, acabaran por confesarnos lo que nosotros queramos. El fin nunca
justifica los medios.

Ars A. Tmese una antes de acostarse. 1 edicin. Barcelona: Planeta; 1998.


C aptulo 1 Pgina 56

La estadstica es un instrumento, que si no se usa adecuadamente, puede


demostrar cualquier mentira.

En Bioestadstica el fin nunca justifica los medios.


C aptulo 1 Pgina 57

Mitos y Realidades en Bioestadstica

REALIDAD 8: Si los datos de un estudio se analizan con muchos enfoques


distintos y con la suficiente intensidad hasta TORTURARLOS, acaban
dando los resultados que al investigador le hubiese gustado obtener,
aunque tales resultados suelen ser cientficamente NEFASTOS.

Mills JL. Data torturing. N Engl J Med. 1993; 329: 1196-9.


C aptulo 1 Pgina 58

Mitos y Realidades en Bioestadstica

MITO 9: La inocencia de las cigeas

Una buena correlacin estadstica (coeficiente de correlacin r elevado)


(p < 0,05) siempre significa que existe una relacin entre las variables
evaluadas y, por tanto, existe una relacin causa - efecto.
C aptulo 1 Pgina 59
C aptulo 1 Pgina 60

Mitos y Realidades en Bioestadstica

REALIDAD 9:
- Una buena correlacin estadstica (r elevado) (p < 0,05) NO siempre
significa que exista una relacin entres las variables evaluadas y, por
tanto, NO implica una relacin causa-efecto.
- El trabajo estara mal planteado, aunque se hubiera aplicado un
tratamiento estadstico aparentemente correcto.
- Los autores de un estudio deben ser muy cautos en la aplicacin y
posterior interpretacin del anlisis estadstico.

Antoja Rib F. The innocence of the storks. Rev Lab Clin 2010; 3 (2): 51.
C aptulo 1 Pgina 61

Estudio ecolgico

Variable PREDICTORA Variable RESULTADO


Factor de exposicin (F) Efecto o Enfermedad (E)
CIGEAS NATALIDAD HUMANA

Nmero de ejemplares de Tasa de natalidad de la


cigeas poblacin humana
C aptulo 1 Pgina 62

Estudio de Bartels (Alemania)


Variable RESULTADO-RESPUESTA-posible EFECTO
Tasa de nacimientos en la poblacin humana

Enero

Mayo Abril
Variable cuantitativa continua

Junio
Febrero

Agosto Marzo
Noviembre
Octubre

Julio

Septiembre

Diciembre

Variable PREDICTORA-EXPOSICIN-posible CAUSA


Nmero de ejemplares de cigeas
Variable cuantitativa continua
C aptulo 1 Pgina 63

Estudio de Bartels (Alemania)

RESULTADOS: En Alemania, en un mismo ao, descendieron, de forma


significativa, la tasa de nacimientos de la poblacin humana y el nmero
de ejemplares de cigeas. La correlacin entre ambas variables era alta,
lo que demostraba cientficamente su relacin.

CONCLUSIN: La baja natalidad alemana en el ao de estudio se explica


por la disminucin del nmero de cigeas repartidoras de bebs. La
culpa era de las cigeas.
C aptulo 1 Pgina 64

Comentarios

- Es muy saludable encontrar detalles de humor.

- Si leyramos un supuesto artculo cientfico con esa conclusin tan extravagante


pensaramos, sin duda, que se trata de una parodia y como tal la aceptaramos.

- Es fcil entender el error porque sabemos que las cigeas no tienen nada que ver
con la reproduccin humana y, por tanto, se ha buscado errneamente una relacin
entre dos variables sin plausibilidad biolgica.

- El trabajo est mal planteado, y aunque se hubiera aplicado un tratamiento


estadstico aparentemente correcto.

- Una buena correlacin estadstica (r elevado) (p < 0,05) NO siempre significa que
existe una relacin entres las variables evaluadas, y por tanto NO implica una relacin
causa efecto.
C aptulo 1 Pgina 65

Reflexiones

Qu ocurre cuando el estudio se lleva a cabo con variables (datos) menos


conocidos, de poblaciones que nos son menos familiares, obtenidos en estudios
complejos?

Cmo sabemos si el autor sabe certeramente entre qu grupos se puede establecer


relaciones y entre cules no tiene sentido hacerlas?

Esto slo es posible si el investigador conoce muy bien lo que est estudiando y ha
partido de un planteamiento y el diseo del estudio bien estructurado.

Las conclusiones que se obtienen al aplicar las pruebas estadsticas slo tienen
sentido cuando las variables (datos) estn bien definidas y tienen plausibilidad
biolgica.
C aptulo 1 Pgina 66

Estos tipos de errores se originan cuando los autores NO tienen claros


algunos conceptos bsicos de METODOLOGA de INVESTIGACIN
pero disponen de programas estadsticos potentes, en los que slo
se necesita sealar y aceptar con el ratn entre un amplio abanico de
pruebas estadsticas.
C aptulo 1 Pgina 67

Parafraseando a Sneca , debemos convenir que

todo lo honesto es difcil

y la investigacin clnica no es una excepcin.

Sneca LA. De los beneficios. En: Lucio Anneo Sneca: Obras completas. Madrid: Aguilar, 1961.
C aptulo 1 Pgina 68

Curso de Bioestadstica Aplicada

1. Introduccin a la bioestadstica.
2. Estadstica descriptiva. Variables y grficos.
3. Tamao muestral: Error alfa y error beta.
4. Evaluacin de pruebas diagnsticas.
5. Test de contraste de hiptesis: variable cualitativa versus cualitativa.
6. Test de contraste de hiptesis: variable cuantitativa versus cuantitativa.
7. Test de contraste de hiptesis: variable cuantitativa versus cualitativa.
8. Anlisis estadstico multivariante.
9. Utilidad de la bioestadstica en los resultados y discusin del estudio.
C aptulo 1 Pgina 69

Salir de nuestra cueva de BENZ, de nuestro nicho ecolgico

Comunicar nuestra experiencia a los dems

Utilizando la bioestadstica como herramienta de trabajo.


C aptulo 1 Pgina 70

Etapas del proceso de investigacin


TEORIA
1. Problema
18. Conclusin (Preguntas)
(Respuestas)

Fase interpretativa 17. Alcance


y limitaciones
2. Revisin
bibliogrfica
Fase conceptual
DISCUSIN INTRODUCCIN
16. Importancia
Novedad 3. Marco
terico

15. Validez interna y 4. Definicin


externa Variables

DEDUCCIN
INDUCCIN
5. HIPTESIS
14. ANLISIS
OBJETIVOS

13. Presentacin 6. Seleccin del


de datos diseo
TEMA A INVESTIGAR
Campo de investigacin
12. 12.
Procesamiento
Procesamiento
7. Identificacin de
estadstico de datos
de datos
la poblacin

Fase planificacin
11. Recoleccin
8. Determinacin MATERIAL y
Fase emprica de datos
Casos/muestra
MTODOS
RESULTADOS 9. Estudio
10. Fuentes de
informacin piloto

HECHOS
DATOS
C aptulo 1 Pgina 71

La bioestadstica y el mtodo epidemiolgico aportan ms ciencia al arte de la


medicina y enfermera y es por ello que la colaboracin conjunta de expertos en
metodologa, bioestadsticos y los clnicos deben trabajar en equipo en colaboracin
para en un esfuerzo conjunto reducir la variabilidad que rodea al ejercicio de la
medicina y enfermera que ser siempre una ciencia de probabilidades y un arte de
manejar la incertidumbre.

Expertos en
Bioestadsticos
metodologa

Personal
sanitario

Pita Fernndez S. Dificultades de los mdicos para la realizacin de estudios clnico-epidemiolgicos.


Congreso Galego de Estadstica e Investigacin de Operacins. Santiago de Compostela, A Corua
(Espaa). 11-13 Novembre-1999.
C aptulo 2 Pgina 72

Captulo 2

Publicacin Bioestadstica: Variables y grficos.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 2 Pgina 73

Materiales
Pacientes

1. Criterios de seleccin de la muestra (inclusin y exclusin).


2. Procedencia.
3. Tcnica de reclutamiento utilizada.
4. Tiempo empleado para reunir a todos los participantes.
5. Principales caractersticas de los pacientes.
- Edad
- Sexo
- Procedencia
- Gravedad
- Aos de evolucin de la enfermedad
- Patologas asociadas...
6. Clculo de tamao muestral.
C aptulo 2 Pgina 74

Tipos de variables

- Variables cualitativas
- Categricas nominales
- Dicotmicas o Binarias
- Policotmicas
- Categricas ordinales Categorizacin

- Variables cuantitativas
- Discretas
- Continuas
C aptulo 2 Pgina 75

Tipos de variables

- Variables CUALITATIVAS: Representan una cualidad o atributo que clasifica a cada


individuo en una de varias categoras. Pueden ser de dos tipos:
- Dicotmicas o binarias: La situacin ms sencilla es aquella en la que se clasifica cada
individuo en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador).
- Policotmicas: Es necesario un mayor nmero de categoras (color de los ojos, grupo
sanguneo, profesin, etctera).

- Variables CUANTITATIVAS: Son aquellas que pueden medirse, cuantificarse o


expresarse numricamente. Pueden ser de dos tipos:
- Continuas: Son aquellas que si admiten tomar cualquier valor dentro de un rango
numrico determinado, con uno o varios decimales (peso, talla, edad).
- Discretas: Son aquellas que NO admiten todos los valores intermedios en un rango.
Suelen tomar solamente valores enteros (nmero de hijos, abortos, partos, hermanos).
C aptulo 2 Pgina 76

Tipos de variables segn la escala de medida

Escalas nominales: Variables NOMINALES: sta es una forma de observar o medir en la


que los datos se ajustan por categoras que no mantienen una relacin de orden entre s.
- Sexo.
- Grupo sanguneo.
- Presencia o ausencia de una enfermedad.
- Presencia o ausencia de un factor de riesgo.
Escalas ordinales: Variables ORDINALES: En las escalas utilizadas para medirlas existe un
cierto orden, grado o jerarqua entre las categoras.
- Grado de disnea.
- Grado de dolor.
- Intensidad del hbito tabquico.
- Tipo de fumador.
C aptulo 2 Pgina 77

Variables cualitativas categricas ordinales

- Grado de disnea.
- Grado de dolor.
- Intensidad del hbito tabquico.
- 1-9 cigarrillos/da.
- 10-20 cigarrillos/da.
- > 20 cigarrillos/da.
- Tipo de fumador.
- Exfumador.
- Fumador pasivo.
- Fumador activo.
C aptulo 2 Pgina 78

Categorizacin de variables cuantitativas

Variable Variable
Cuantitativa continua Cualitativa dicotmica
Triglicridos Hipertriglicridemia
Normotriglicridemia

Categorizacin

Variable Variable
Cuantitativa discreta Cualitativa ordinal
Test de APGAR Patolgico < 7
Dudoso = 7
Fisiolgico > 7

Categorizacin
C aptulo 2 Pgina 79

Tipos de variables
Ejemplos

Variables cualitativas - Sexo


- Categricas nominales - Credo religioso en Ceuta
- Binarias - Hipertensin
- Policotmicas - Tipo de fumador
- Ordinales - Colesterolemia
- Nmero de abortos
Variables cuantitativas - Nivel de instruccin
- Discretas - Edad gestacional
- Continuas - Frecuencia cardiaca
- Test de apgar
C aptulo 2 Pgina 80

Tipos de variables
Ejemplos

Variables cualitativas - Antecedentes de IAM


- Categricas nominales - Grupo sanguneo
- Binarias - Hipertensin
- Policotmicas - Tipo de fumador
- Ordinales - Colesterolemia
- N intentos de dejar fumar
Variables cuantitativas - Nivel econmico
- Discretas - Edad
- Continuas - Peso
- Test de apgar
C aptulo 2 Pgina 81

Tipos de variables
Ejemplos

Variables cualitativas - Desenlace


- Categricas nominales - Estado civil
- Binarias - Inmunizacin toxoplasma
- Policotmicas - Intensidad del hbito tabquico
- Ordinales - LDL colesterol
- Nmero de cigarrillos
Variables cuantitativas - Grado de disnea
- Discretas - Aos de evolucin
- Continuas - Hemoglobina
- Nmero de hijos
C aptulo 2 Pgina 82

Tipos de variables

Variable independiente (X) Variable dependiente (Y)


Controlada por el investigador Respuesta que no se controla
Informacin disponible Informacin que se desea conseguir
Variable predictora Variable desenlace
Variable previa Variable criterio
Exposicin (F) Resultado (E)
Posible causa Posible efecto
Factor Consecuencia
Regreso Regresando
C aptulo 2 Pgina 83

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable Variable Pruebas de contraste de Observaciones y/o limitaciones del test
Independiente o Dependiente o hiptesis
PREDICTORA RESULTADO
Cualitativa Cualitativa Ji cuadrado Si el tamao muestral es grande
Prueba exacta de Fisher Si el tamao muestral es pequeo
Test de McNemar Dos grupos de muestras repetidas o apareadas
Q de Cochran Ms de dos grupos de muestras repetidas o apareadas
REGRESIN LOGSTICA Varias variables predictoras cualitativas
Cualitativa Cuantitativa t de Student Compara medias entre dos grupos independientes
Anlisis de la Varianza Compara medias entre ms de dos grupos independientes
Test de Mann-Whitney Dos grupos independientes No paramtricos
Test de Wilcoxon Dos grupos medidas repetidas No paramtrico
Test de Kruskall-Wallis Ms de dos grupos No paramtrico, grupos indendientes
Test de Friedman Ms de dos grupos No paramtrico medidas repetidas
Cuantitativa Cualitativa Regresin logstica simple Una sola variable predictora cuantitativa
Regresin logstica multivariante Varias variable predictoras cuantitativa o cualitativas
Cuantitativa Cuantitativa Regresin lineal simple Paramtrico
Correlacin de Pearson Paramtrico
Correlacin de Sperman No paramtrico
REGRESIN MLTIPLE Varias variables predictoras cuantitativas
Cualitativa Superviviencia Kaplan-Meier Curvas de supervivencia
Long-Rank Compara curvas de superviviencia
Regresin de COX Anlisis Multivariante
C aptulo 2 Pgina 84

Fases del anlisis estadstico

1.- ANLISIS DESCRIPTIVO

2.-ANLISIS BIVARIANTE

3.- ANLISIS MULTIVARIANTE


C aptulo 2 Pgina 85

Estadsticos descriptivos

Medidas de tendencia central Medidas de dispersin


- Media aritmtica - Varianza
- Media geomtrica - Desviacin estndar
- Media armnica - Coeficiente de variacin
- Media ponderada - Error estndar de la media
- Mediana
- Moda Medidas de posicin
- Cuantiles
Medidas de forma - Percentiles
- Asimetra
- Curtosis o apuntamiento
C aptulo 2 Pgina 86

Medidas de tendencia central

- Media aritmtica [x]


- Media geomtrica
- Media armnica
- Media ponderada
- Mediana (P50)
- Moda
C aptulo 2 Pgina 87

Media aritmtica

- Principal medida de tendencia central, pero menos robusta que la media geomtrica o
media armnica.
- Se deja influir mucho por los valores extremos de la distribucin.
- Se suman todos los valores y se divide por el nmero total de individuos.
- Expresin con pocos decimales.
C aptulo 2 Pgina 88

Ejemplo: Cul es la nota de un alumno del curso de


metodologa de investigacin que ha obtenido las siguientes
calificaciones?

xi valor Peso valor


Asistencia a clase (X1) 7,5 W1 20%
Tesina (prcticas) (X2) 5,5 W2 20%
Examen inicial (X3) 3/14 (2,1) W3 10%
Examen final (X4) 11/14 (7,8) W4 20%
Incremento en sus conocimientos (X4 - X3) 8 W5 30%

Media ponderada = 6,7


C aptulo 2 Pgina 89

Mediana P50

- Medida de tendencia central robusta, de clculo fcil.

- No se deja influir mucho por los valores extremos de la distribucin.

- Coincide con el valor central del conjunto ordenado de observaciones que deja por
debajo y por encima a la mitad de las observaciones realizadas.

- Se debe utilizar siempre en dos casos:


- Bajo tamao muestral (para muestras pequeas) y/o
- Cuando existen observaciones extremas (perifricos)
C aptulo 2 Pgina 90

Medidas de dispersin
- Varianza [s2]

- Desviacin tpica o estndar [s]

- Coeficiente de variacin [CV]

- Error estndar de la media [EE]


C aptulo 2 Pgina 91

Cul de las siguientes


distribuciones presenta un
mayor valor de la media?

Cul de las siguientes


distribuciones presenta una
mayor dispersin?

Cul de las siguientes


distribuciones presenta una
mayor dispersin?

Cul de las siguientes


distribuciones presenta un
mayor valor de la media?
C aptulo 2 Pgina 92

Desviacin estndar (s)

- Medida de dispersin que nos suministra mucha informacin sobre la naturaleza de


una variable.

- Cuanto ms separados estn los valores de la media mayor ser su dispersin, y


mayor ser su desviacin estndar.

- Se debe representar como media (desviacin estndar), y NO como media


desviacin estndar.

- Su magnitud SI depende de las unidades de medida de la variable. NO permite la


comparacin directa de la dispersin de varias variables.
C aptulo 2 Pgina 93

Coeficiente de variacin (CV)

- Medida de dispersin que relaciona que proporcin porcentual de la media representa


la desviacin estndar.

- Representa la desviacin estndar medida en unidades de magnitud relativas a la


media.

- Permite la comparacin directa de la dispersin de varias variables.

- Su magnitud NO depende de las unidades de medida de la variable.


C aptulo 2 Pgina 94

Cul de las siguientes variables presenta un mayor grado de


dispersin?
Repetibilidad interdiaria de los procedimientos de anlisis del metabolismo frrico
Componente N Media Desviacin Coeficiente de
estndar variacin (CV %)
Hemoglobina 20 121,70 0,64 0,53
Hierro 20 0,99 0,01 1,20
Ferritina 20 94,50 4,24 4,49
Transferrina 20 3,25 0,094 2,89
Receptor soluble de la transferrina 20 2,39 0,13 5,44

Cul de las siguientes variables presenta un menor grado de


dispersin?
C aptulo 2 Pgina 95

Distribucin de los valores de una variable x


medidos en los individuos de una poblacin
Sigma : desviacin
estndar de los individuos
Desviacin estndar: Mide el grado de de la poblacin general
dispersin de todos los individuos que
forman la muestra (s) o la poblacin ().

Distribucin de las medias X observadas en las infinitas muestras


de tamao n que pueden obtenerse de una poblacin de media
Media poblacional desconocida de la que y de desviacin estndar
proceden todas las muestras extradas DISTRIBUCIN
DE LAS MEDIAS
MUESTRALES

Error Estndar de la Media EEM: Mide el grado de dispersin de las medias de todas las posibles muestras
que pudieran extraerse de la poblacin. Mide el grado de dispersin de las medias muestrales respecto a la
media poblacional (desconocida).
C aptulo 2 Pgina 96

Medidas de forma

Asimetra (coeficiente de asimetra g1 de Fisher)


Simtrica (coeficiente de asimetra g1 = 0)
n

3
i

Asimtrica (coeficiente de asimetra g1 0) g1 = i =1

R3
Asimetra positiva (coeficiente de asimetra g1 > 0)
Asimetra negativa (coeficiente de asimetra g1 < 0)
Curtosis o apuntamiento (coeficiente g2 curtosis de Fisher)
Mesocrtica (g2 = 0)
n

4
i

g2 = i =1
-3
Platicrtica (g2 < 0) R4

Leptocrtica (g2 > 0)

Coeficiente g2 mide el grado de


APLASTAMIENTO de una curva
C aptulo 2 Pgina 97

Medidas de forma
Asimetra
n

3
i

g1 = i =1

R3

Histograma de frecuencias de una variable cuantitativa


con distribucin simtrica (coeficiente de asimetra g1 = 0)

Distribucin normal [Asimetra] < 2 EEasimetra

g1 < 2 EE g1
C aptulo 2 Pgina 98

Medidas de forma
Asimetra

Histograma de frecuencias de una variable cuantitativa


con distribucin Asimtrica Positiva (coeficiente de asimetra g1 > 0)
C aptulo 2 Pgina 99

Histograma de frecuencias de una variable cuantitativa


con distribucin Asimtrica positiva (coeficiente de asimetra g1 > 0)

Moda Mediana
%
Media

* Coeficiente de asimetra g1 > 0 (VALOR POSITIVO)


X
* La Mediana es un valor ms pequeo que la Media
* La cola de la distribucin se aleja por la derecha
C aptulo 2 Pgina 100

Medidas de forma
Asimetra

Histograma de frecuencias de una variable cuantitativa


con distribucin Asimtrica Negativa (coeficiente de asimetra g1 < 0)
C aptulo 2 Pgina 101

Histograma de frecuencias de una variable cuantitativa con


distribucin Asimtrica negativa (coeficiente de asimetra g1 < 0)

Moda
Mediana
%
Media

X
* Coeficiente de asimetra g1 < 0 (VALOR NEGATIVO)
* La Mediana es un valor ms grande que la Media
* La cola de la distribucin se aleja por la izquierda
C aptulo 2 Pgina 102

Medidas de forma
Curtosis o apuntamiento

Coeficientes g2 de apuntamiento o curtosis de Fisher

Mesocrtica (g2 = 0) Platicrtica (g2 < 0) Leptocrtica (g2 > 0)

Distribucin normal [curtosis] < 2 EEcurtois

g2 < 2 EE g2
C aptulo 2 Pgina 103

Segn las medidas de forma Cmo puede clasificarse esta


variable?

Asimetra g1 = 0,01
Curtosis g2 = 0,02

Simtrica (g1 0)
Mesocrtica (g2 0)

Distribucin
NORMAL

Coeficientes de asimetra g1 y de apuntamiento o curtosis g2


en diversos tipos de distribuciones
C aptulo 2 Pgina 104

Segn las medidas de forma Cmo puede clasificarse esta


variable?

Asimetra g1 = + 2,98
Curtosis g2 = +11,53

Asimtrica (g1 >0)(+)


Leptocrtica (g2 >0)

Distribucin
ANORMAL

Coeficientes de asimetra g1 y de apuntamiento o curtosis g2


en diversos tipos de distribuciones
C aptulo 2 Pgina 105

Segn las medidas de forma Cmo puede clasificarse esta


variable?

Asimetra g1 = -1,59
Curtosis g2 = +1,97 Asimtrica (g1 <0)(-)
Leptocrtica (g2 >0)

Distribucin
ANORMAL

Coeficientes de asimetra g1 y de apuntamiento o curtosis g2


en diversos tipos de distribuciones
C aptulo 2 Pgina 106

Segn las medidas de forma Cmo puede clasificarse esta


variable?

Asimetra g1 = - 0,04
Curtosis g2 = - 1,37 Simtrica (g1 0)
Platicrtica (g2 <0)

Coeficientes de asimetra g1 y de apuntamiento o curtosis g2


en diversos tipos de distribuciones
C aptulo 2 Pgina 107

Segn las medidas de forma Como puede clasificarse esta


variable?
Asimetra g1= + 0,135
Curtosis g2 = + 0,320

Simtrica (g1 0)
Mesocrtica (g2 0)

Sigue una Distribucin Normal?


Frecuencia

Distribucin
NORMAL

Peso en adultos (Kg)

Test de Kolmogorov - Smirnov = 0,705 p = 0,702


C aptulo 2 Pgina 108

Segn las medidas de forma Cmo puede clasificarse esta


variable?
Asimetra g1 = + 0,713
Curtosis g2 = + 3,660
Sigue una Distribucin Normal?
Frecuencia

Distribucin ANORMAL

Asimtrica (g1 >0)(+)


Leptocrtica (g2 >0)

Edad

Test de Kolmogorov - Smirnov = 1,498 p = 0,022


C aptulo 2 Pgina 109

Medidas de posicin:
Cuartiles y percentiles

120
110
6 datos 110 Cuartil 3 = P75
95
92

Mediana P50 91
90 Cuartil 2 = P50 RIC
88
85

6 datos
76
76
Cuartil 1 = P25
73
72

RIC: Rango intercuartlico

Representacin esquemtica de la Mediana P50


(percentil 50) y de los cuartiles P75 y P25
C aptulo 2 Pgina 110

Grficos de caja (box-plot)

Bigote superior =[1,5 * RI ] + P75


80
70
Tercer cuartil P75
60
Rango intercuartlico (RI)
50
Tercer cuartil Primer cuartil
40

30

20
Mediana P50
10
0
Primer cuartil P25
Consumo de Cigarrillos / da
Bigote inferior = P25 [1,5 * RI ]

Diagrama de caja (box & whister plot)


C aptulo 2 Pgina 111

Grficos de caja (box-plot)

Es legtimo un dato
puntual cuyo valor
es excepcionalmente
grande o pequeo? 220 Perifrico o Outlier

Es 220 un valor mal


Bigote superior = 180
registrado?

Es el resultado de un P75 = 158


error o accidente en la Mediana = 140 RIC = 33
experimentacin? P25 = 125
Bigote inferior

Tensin arterial sistlica (mm Hg)

Diagrama de cajas con un individuo perifrico

Martnez Gonzlez MA, Jokin de Irala Estvez, Faulin Fajardo FJ. Bioestadstica amigable. Madrid:
Ediciones Daz de Santos; 2001.
C aptulo 2 Pgina 112

Tcnicas de deteccin de Outlier

outlier?
Variable resultado

Variable predictora
C aptulo 2 Pgina 113

Tcnicas de deteccin de Outlier


Coeficiente de determinacin R2

Variable resultado

Variable predictora
C aptulo 2 Pgina 114

Grficos de caja (box-plot)

Sigue el sTfR una Distribucin Normal?


6

Perifrico o Outlier
5

sTfR (mg/L)
Receptor soluble 4
de la transferrina
en suero (sTfR)
3

Tamao muestral N = 121


1

Distribucin de los valores de sTfR en el grupo de referencia


C aptulo 2 Pgina 115

Grficos de caja (box-plot)

Mediana
Variable resultado

Media

Perifrico o Outlier

Grupos de estudio
C aptulo 2 Pgina 116

Grficos de histograma

30
Asimetra positiva g1 >0
Mesocrtica g2 =0 Distribucin
ANORMAL
20
Frecuencia (%)

10
Perifricos o Outlier

1,50 2,00 2,25 2,50 2,75 3,00 3,25 3,50 3,75 4,00 4,25 4,50 5,00 5,25

Concentraciones del Receptor srico de la transferrina (sTfR) (mg/L)

Histograma de frecuencias de distribucin del sTfR en una poblacin sana


C aptulo 2 Pgina 117

Grficos de histograma

195
180
165 Asimetra positiva g1 >0
Nmero total de observaciones

150 Mesocrtica g2 =0
135
120
105 Distribucin ANORMAL
90
75
60
45
30 Perifricos o Outlier
15
0
45 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 140

Tensin arterial diastlica (mm Hg)


Histograma de distribucin de la tensin arterial diastlica en el estudio de Venecia N= 1002
C aptulo 2 Pgina 118

Distribucin uniforme discreta


Distribucin uniforme discreta
120

100

80
Frecuencia

60

40

20

0
1 2 3 4 5 6
Nmero de caras
Resultados empricos obtenidos en la realidad
despus de lanzar un dado 600 veces

Cul es el nmero que sale con ms frecuencia?


C aptulo 2 Pgina 119

Distribucin uniforme discreta


Distribucin uniforme discreta
1200
120

1000
100
800
80
Frecuencia
Frecuencia

600
60
400
40
200
20

0
0
1 2 3 4 5 6
1 2 3 4 5 6
Nmero
Nmero de de caras
caras
Resultados empricos obtenidos en la realidad
despus de lanzar un dado 600 veces

Cul es el nmero que sale con ms frecuencia?


C aptulo 2 Pgina 120

Distribucin normal
200

180 7 = 3+ 4, 4+ 3, 6+1, 1+ 6, 2+ 5, 5+ 2
160

140 12 = 6 + 6
2=1+1
Frecuencia

120

100

80

60

40

20

0
2 3 4 5 6 7 8 9 10 11 12
Sumas

Resultados empricos (sumatorio) obtenidos


en la realidad despus de lanzar dos dados 1000 veces

Cul es el nmero que sale con ms frecuencia?


C aptulo 2 Pgina 121

Distribucin normal
Frecuencia

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

Sumas
Resultados empricos (sumatorio) obtenidos en la realidad despus de lanzar 5 dados 1000 veces

Cul es el nmero que sale con MENOS frecuencia?


C aptulo 2 Pgina 122

Distribucin normal

Cambios que se van produciendo en la distribucin de frecuencias


al aumentar el nmero de factores independientes
y las repeticiones de la experiencia

Nmero de factores independientes: Nmero de dados

Repeticiones de la experiencia: Nmero de tiradas

Martnez Gonzlez MA, Jokin de Irala Estvez, Faulin Fajardo FJ. Bioestadstica amigable. Madrid:
Ediciones Daz de Santos; 2001.
C aptulo 2 Pgina 123

La altura de las personas sigue una distribucin normal?


De qu depende la altura de una persona?

1. De la altura del padre


2. De la altura de la madre
3. De su nutricin en la infancia y adolescencia
4. De la velocidad de maduracin de su esqueleto
5. Del aporte que reciba de vitamina D
6. Del aporte de calcio
7. Del ejercicio fsico
8. De sus niveles de hormona del crecimiento
9. Otras variables (algunos de ellas desconocidas)

Martnez Gonzlez MA, Jokin de Irala Estvez, Faulin Fajardo FJ. Bioestadstica amigable. Madrid:
Ediciones Daz de Santos; 2001.
C aptulo 2 Pgina 124

Caractersticas de la distribucin normal

1. Tener forma de campana.

2. Ser simtrica.

3. Mesocrtica (no excesivamente plana ni muy picuda).

4. Coincidir la media, mediana y moda.

5. Tener aproximadamente el 95% de sus valores dentro del intervalo media 2


desviaciones estndar.
C aptulo 2 Pgina 125

Distribucin normal

- El 100% de los valores deben estar por encima y por debajo


de 3 veces la desviacin estndar (s)
(valores entre X 3 s)
- La distribucin debe ser SIMTRICA. La asimetra en valor
absoluto g1 debe ser menor que 2 veces su error estndar
[Asimetra] < 2 EEasimetra g1 < 2 EEg1
- La distribucin debe ser MESOCRTICA. La curtois en valor
absoluto g2 debe ser menor que 2 veces su error estndar
[curtois] < 2 EEcurtois g2 < 2 EEg2
C aptulo 2 Pgina 126

Propiedades de la distribucin normal

Z
( x - )2
1 -
f ( x) = e 2 2

2
C aptulo 2 Pgina 127

Propiedades de la curva de Gauss

Media D.E. 68% del rea total


Media D.E. 68% del rea total
Media 2 D.E. 95% del rea total
Media 32 D.E.
Media D.E.
95%
99% del
delrea
reatotal
total
Media 3 D.E. 99% del rea total
C aptulo 2 Pgina 128

Distribucin de la t de Student

Grados de libertad = n - 1 = n-1

(x - )
valores " t " : t =
s
C aptulo 2 Pgina 129

Distribucin de la F de Snedecor

s12 12
valores " F " : F = 2 2 Grados de libertad 1 y 2
s2 2
1 = n1 - 1 2 = n2 - 1
C aptulo 2 Pgina 130

Qu variables biolgicas siguen una distribucin normal?


En qu circunstancias y en qu poblaciones?

- Colesterol srico poblacin sana


- Consumo de alcohol
- Peso corporal
- Bilirrubina en pacientes cirrticos
- Urea en sangre en poblacin sana
- Urea en sangre en pacientes con insuficiencia renal
- Troponina I en poblacin sana
- Excrecin urinaria de sodio en orina de 24 horas

Asimtrica g1 > 0 (+)


Leptocrtica g2 > 0 (+)

Distribucin ANORMAL
C aptulo 2 Pgina 131

Histograma de la uremia en 504 individuos


Sigue una Distribucin Normal?
80
N = 504 Criterio de normalidad
Media (x) = 64,8
Desviacin estndar (s) = 44,69 X x
60 s< > s
2 2
Frecuencia (%)

S (desviacin tpica) < X (media aritmtica) /2 (CV<50%)


40

S (desviacin tpica) > X (media aritmtica)/2 (CV>50%)

20
44,69 > 64,8/2 (32,4) (CV=69%)

0
10 30 50 70 90 110 150 170 190 210 250

Uremia (mg/dl) Distribucin ANORMAL


C aptulo 2 Pgina 132

Histograma de la urea en sangre en 94 pacientes con


insuficiencia renal
Sigue una distribucin normal?
20
N = 94
Media (x) = 126 X x
Desviacin estndar (s) = 46,8
s< > s
2 2
Frecuencia (%)

S (desviacin tpica) < X (media aritmtica)/2 (CV<50%)


10
46,8 < 126/2 (63) (CV=37%)

0
20 65 105 145 185 225

Uremia (mg/dl) en 94 pacientes con IR Distribucin NORMAL


C aptulo 2 Pgina 133

Histograma de la urea en sangre en 410 individuos sin


insuficiencia renal
Sigue una distribucin normal?
140
N = 410 x
Media (x) = 51 X
120 s< > s
Desviacin estndar (s) = 29,9 2 2
Frecuencia absoluta

100

80 S (desviacin tpica) > X (media aritmtica)/2 (CV>50%)


29,9 > 51/2 (25,5) (CV=59%)
60

40
Distribucin ANORMAL
20

0
10 45 80 110 145 180

Uremia (mg/dl) en 410 individuos sin IR


C aptulo 2 Pgina 134

Medidas de tendencia central


Medidas de dispersin o variabilidad
Media = 183,9
Desviacin estndar = 82,5
N = 293

Distribucin X
Valores entre X 3 s (< 431,4) ANORMAL > s
40 2
S (desviacin tpica) < X (media aritmtica)/2 (CV<50%)
Frecuencia relativa (%)

30
82.5 < 183.9/2 (91.9) (CV=45%)

20
Sigue una Distribucin Normal?
X3s
10

0
20 60 100 140 180 220 260 300 340 380 420 460

Excrecin urinaria de sodio en orina de 24 horas (Na24 h mEq/24)


C aptulo 2 Pgina 135

Condiciones y pruebas de normalidad

Asimtrica (+) (g1 > 0) Distribucin ANORMAL


90 Leptocrtica (+) (g2 > 0)
80

70
Frecuencia (%)

60 X CV > 50%
50 > s
40 2
30
Perifricos o Outlier
20
10
0

Bilirrubinemia (mg/dl)

Distribucin de frecuencias de los niveles de bilirrubina en pacientes cirrticos.


(Distribucin Anormal con asimetra positiva)
C aptulo 2 Pgina 136

Condiciones y pruebas de normalidad


Transformacin logartmica
Frecuencia

Logaritmos de las concentraciones de bilirrubina srica

Distribucin de frecuencias de los logaritmos de los niveles


de bilirrubina en pacientes cirrticos.
Con esta transformacin matemtica se corrige la asimetra positiva anterior
C aptulo 2 Pgina 137

Troponina I en poblacin sana


50% 50%

40% 40%
Frequency of normal population

97.5% URL

Total Imprecision (CV%)


30% 30%
Frequency of normal population

Total I mprecision (CV%)


99% URL

20% 20%

10% 10%

0% 0%
0,00 0,02 0,04 0,06 0,08 0,10 0,12 0,14 0,16 0,18 0,20

cTnI g/L 5
0.03 0.06
ng/mL ng/mL
C aptulo 2 Pgina 138

La amilasemia sigue una Distribucin Normal?

Asimtrica (+) (g1 > 0)


Leptocrtica (+) (g2 > 0)
Frecuencia absoluta

Distribucin ANORMAL

Perifricos o Outlier

Amilasemia (UI/l)
C aptulo 2 Pgina 139

Estadsticos descriptivos de la amilasemia

N Media Desviacin tpica Asimetra Curtosis

g1 EEg1 g2 EEg2

Amilasa 549 90,86 135,043 11,359 0,104 170,89 0,208

Asimetra Curtosis

g1 EEg1 g1/ EEg1 g2 EEg2 g2/ EEg2


Amilasa 11,359 0,104 109,22 170,89 0,208 821,6

[Asimetra] > 2 EEasimetra g2 > 2 EEg2 Distribucin ANORMAL

[Curtosis] > 2 EEcurtois g2 > 2 EEg2 Distribucin ANORMAL


C aptulo 2 Pgina 140

Test de normalidad

- Test de Kolmogoroff-Smirnoff-Lilliefors (test ms potente para muestra > 30 casos).


- Test de Shapiro-Wilk (la prueba ms potente para muestra < 30 casos).
- Test de DAgostino.
- Test de Anderson-Darling.
- Test chi-cuadrado de bondad de ajuste.
- Test de Contraste de asimetra: Sirve para contrastar la hiptesis de que el coeficiente de
asimetra de Fisher g1 es cero. Propiedad que verifica la distribucin normal (g1 = 0).
- Test de Curtosis: Contraste de apuntamiento, sirve para contrastar la hiptesis de que
el coeficiente g2 curtosis de Fisher (coeficiente de apuntamiento) es cero. Propiedad que
verifica la distribucin normal (g2 = 0).
- Test de Jarque-Bera.
C aptulo 2 Pgina 141

Test de Kolmogorov-Smirnov
- Es el test de normalidad ms difundido en los programas estadsticos.
- Otorga un MENOR PESO a las observaciones extremas (perifricos o OUTLIER) y por
ello es menos tolerante a las desviaciones que normalmente se producen en estos tramos
distales.
- Cuando se dispone de un nmero suficiente de datos (amplio volumen muestral), los
dems tests de normalidad sern capaces de detectar diferencias pequeas an cuando
estas no sean relevantes para la mayor parte de los objetivos, por eso se recomienda el
test de Kolmogorov-Smirnov (se considera uno de los tests ms potentes para muestras
mayores de 30 casos).
- Se basa en la idea de comparar la funcin de distribucin acumulada de los datos
observados con la de una DISTRIBUCIN NORMAL, midiendo la mxima distancia entre
ambas curvas.
- Como en todos los tests de contraste de hiptesis, la hiptesis nula (Ho) se rechaza
cuando el valor del estadstico calculado supera un cierto valor crtico (tabulado) que se
obtiene de una tabla de clculo de probabilidades.

- p > 0,05 se acepta la Ho (se cumple la normalidad), se pueden usar test paramtricos.
- p < 0,05 se acepta la Ha (no se cumple la normalidad), se deben usar test NO paramtricos.
C aptulo 2 Pgina 142

Pregunta de investigacin
Los valores analticos de ambas tcnicas siguen una
distribucin normal?
Objetivo: Evaluacin de la amilasa tcnica 1 frente a la tcnica 2.

Amilasa (srica) Amilasa (srica)


Tcnica 1 Tcnica 2

Cul es el test estadstico ms acertado?

Test de Kolmogorov-Smirnov
C aptulo 2 Pgina 143

Test de Kolmogorov-Smirnov

Resultados del test Tcnica 1 Tcnica 2


N 548 548
Parmetros normales Media 91,03 79,29
Desviacin tpica 135,11 120,52
Diferencias ms extremas Absoluta 0,289 0,301
Positiva 0,289 0,301
Negativa - 0,280 - 0,299
Z de Kolmogorov-Smirnov 6,763 7,034
Significacin bilateral 0,000 0,000

Como la significacin p < 0,05 se rechaza la hiptesis nula Ho (normalidad) y se acepta la


hiptesis alternativa Ha (no se cumple la normalidad), se deben usar test NO paramtricos.
C aptulo 2 Pgina 144

Test de Jarque-Bera
- El test de Jarque-Bera se realiza para contrastar:
H0: g1 = g2 = 0, lo que significa simetra y curtsis exactas (g = 0)
H1: g1 0 o g2 0 lo que significa que existe curtsis (g 0) o asimetra.

- La consecuencia es que si existe asimetra o curtsis falla la normalidad.


H0: p > 0,05 simetra y curtsis exactas (g = 0) test paramtricos
H1: p < 0,05 curtsis (g 0) o asimetra test NO paramtricos

- Al contrastarlo conjuntamente (curtsis y asimetra) exige un fallo mayor de alguna de


ellas o de ambas para rechazarse.

n n
g12 g 22
3
i
4 i
2 2
JB = t + t = T +
1 2
g2 = -3 6 24
i =1
g1 = i =1

R3 R4
C aptulo 2 Pgina 145

Test de Jarque-Bera

Forma terica de la
Asimetranegativa:
Asimetra positiva normal
casi nula:mayor
mediana mediana
que
menorlaque la media
media TEST de normalidad de JARQUE-BERA
Estadstico 2 = 1.54
valor de p = 0.463 (p > 0,05)

Se acepta la H0
H0: g1= g2= 0, lo que significa
simetra y curtsis exactas.
DISTRIBUCIN NORMAL

Forma terica de la
distribucin emprica
Curtsis negativa: mas
apuntamiento que la normal
C aptulo 2 Pgina 146

Estadstica descriptiva

TIPO DE DISTRIBUCIN SIMTRICA ASIMTRICA

ndice de tendencia central Media Mediana

ndice de dispersin EEM Rango intercuartil

Peso de valores extremos Importante Escaso o nulo


(outlier o perifricos)
Fiabilidad del estadstico Mucha Poca
C aptulo 2 Pgina 147

Pruebas paramtricas: Requisitos

- Las variables cuantitativas tienen que ser continuas.


- Los datos siguen una distribucin normal.
- Los datos numricos se expresan con la media y la desviacin estndar o el EEM
- Homogeneidad de las varianzas muestrales.
- Tamao muestral > 30.
- Presentan un mayor poder de contraste que los tests no paramtricos, y pueden analizar
interacciones entre variables predictoras.
- Cuando se dan las condiciones de aplicacin, las pruebas paramtricas tienen ms
potencia que las no paramtricas, pero, cuando esto no es as, el riesgo alfa puede ser
mayor que el especificado de antemano.
C aptulo 2 Pgina 148

Pruebas NO paramtricas: Requisitos

- Las variables cuantitativas pueden ser ordinales o discretas.


- Los datos siguen una distribucin libre (no necesariamente normal), uno de los grupos
puede tener una distribucin normal mientras que el otro no.
- Los datos numricos se expresan con la mediana y los intervalos intercuartlicos.
- Heterogeneidad de las varianzas muestrales (en uno o ms de un grupo).
- Tamao muestral < 30.
- Presentan un menor poder estadstico que los tests paramtricos.
- Trabajan con la simple ordenacin y recuento (asignando rankings) a los valores de la
variable sin importar el tipo distribucin.
C aptulo 2 Pgina 149

Principales pruebas NO paramtricas

- Chi cuadrado de Pearson.


- Test exacto de Fisher.
- Chi cuadrado de Mc Nemar.
- Q de Cochran.
- U de Mann Whitney.
- Wilcoxon.
- Kruskall Wallis.
- Friedman.

http://www.slideshare.net/freddygarcia/pruebas-no-parametricas-presentation
C aptulo 2 Pgina 150

Pruebas robustas: Caractersticas

- Otra alternativa a los mtodos paramtricos; la utilizacin de los llamados mtodos


robustos. Estos mtodos son menos potentes que los paramtricos, pero se muestran
superiores a los no paramtricos clsicos.
- La principal de sus ventajas es que no se afectan por la existencia de datos anmalos.
- Los mtodos robustos pueden ser de utilidad para la realizacin de inferencias sin tener
que depurar los datos extremos.
- Como parmetros de localizacin (posicin central) se recomienda en primer lugar, el
estimador de Huber y, en segundo lugar, la media a-recortada muestral (con a = 0,2).
- Como medida de dispersin se utiliza la desviacin absoluta mediana estandarizada.
- Mtodos robustos para el contraste de hiptesis con los parmetros antes referidos, se
pueden construir intervalos de confianza robustos y realizar contrastes de hiptesis.
C aptulo 2 Pgina 151

Mtodos robustos para el clculo de medidas de posicin:


Medidas robustas de tendencia central
Media -winsorizada muestral
Se sustituye un determinado porcentaje, , (20% Generalmente) de valores extremos a
cada lado de la muestra por el valor ms prximo no sustituido.

Media -recortada muestral


Se eliminan las k observaciones extremas de cada lado en lugar de winsorizarlas,
calculando la media aritmtica de las observaciones restantes.

Mediana muestral
Divide la distribucin en dos partes con el mismo nmero de elementos.

Estimador de Huber
Se encuentra dentro de los denominados M-estimadores, que generalizan al estimador de
mxima verosimilitud con buenas propiedades de robustez y eficiencia. En este caso se
descartan las observaciones que sean mayores (o menores) a una constante.
C aptulo 2 Pgina 152

Mtodos robustos para el clculo de medidas de dispersin:


Medidas robustas de dispersin

Desviacin absoluta mediana estandarizada


Es la mediana de las desviaciones absolutas a la mediana.

Cuasi desviacin tpica -winsorizada muestral


En la que se sustituye un determinado porcentaje de valores extremos a cada lado de la
muestra por el valor ms prximo no sustituido.
C aptulo 2 Pgina 153

Pruebas Robustas de contraste de hiptesis

- Mtodos robustos para el contraste de hiptesis con los parmetros antes referidos, se
pueden construir intervalos de confianza robustos y realizar contrastes de hiptesis.
- El test de Yuen es una alternativa a las pruebas de la t de Student y U de Mann-Whitney
para tamaos muestrales pequeos y distribuciones no normales.
- Para comparar ms de dos medias, cuando no puede utilizarse el ANOVA clsico,
deberamos recurrir a los clsicos no paramtricos de Kruskal-Wallis o, mejor, a mtodos
robustos como la generalizacin robusta del test Welch, que utiliza medias a-recortadas
muestrales.
- Deberamos recurrir a mtodos no paramtricos (Spearman) o, mejor, a mtodos robustos
como el coeficiente de porcentaje ajustado poblacional y el estimador robusto de regresin
medio biponderado.

http://www.slideshare.net/freddygarcia/pruebas-no-parametricas-presentation
C aptulo 2 Pgina 154

Seleccin de la muestra

Poblacin Seleccin aleatoria Muestra

TCNICAS DE MUESTREO

ERROR ALEATORIO

Parmetro Estadstico X
Media poblacional Inferencia Media muestral

Estructura del proceso de la INFERENCIA ESTADSTICA


C aptulo 2 Pgina 155

Prueba de rachas

- Sirve para determinar si una muestra de observaciones es o no aleatoria, es decir, si las


observaciones de una determinada secuencia son independientes entre si.
- En una serie temporal, las observaciones no son aleatorias: lo que ocurre con una
observacin cualquiera depende, de las caractersticas de una observacin anterior.
- En una muestra aleatoria, lo que ocurre con una observacin cualquiera sea
independiente de las caractersticas de la(s) observacion(es) anterior(es).
- Esta prueba permite determinar si el nmero de rachas (R), observado en una
determinada muestra de tamao n es lo suficientemente grande o lo suficientemente
pequea como para poder rechazar la hiptesis de independencia-aleatoriedad de las
observaciones.
C aptulo 2 Pgina 156

Prueba de rachas

El concepto de RACHA hace referencia a una secuencia de observaciones de un


mismo tipo.

Supongamos que lanzamos una moneda al aire 10 veces seguidas, repitiendo la


experiencia en tres ocasiones

Cmo garantizamos que el resultado obtenido es ALEATORIO?


C aptulo 2 Pgina 157

Prueba de rachas

1 EXPERIENCIA: Tenemos 5 RACHAS: CCC, X,CC, XXX, C

C C C C C C
2 EXPERIENCIA: Tenemos 2 RACHAS: CCCCC, XXXXX

C C C C C
3 EXPERIENCIA: Tenemos 10 RACHAS: CX, CX, CX, CX, CX

C C C C C
En cul de las 3 experiencias podemos garantizar que el resultado obtenido es
ALEATORIO?
C aptulo 2 Pgina 158

Prueba de rachas

Prueba de RACHAS EXP 1 EXP 2 EXP 3


Valor de prueba 1 1 1
Casos < Valor de prueba 4 5 5
Casos Valor de prueba 6 5 5
Casos en total 10 10 10
Nmero total de rachas 5 2 10
Z - 0,211 - 2,348 2,348
Significacin bilateral 0,833 0,019 0,019

Como el nivel de significacin es mayor a 0,05 en la experiencia 1, podemos


aceptar la hiptesis de independencia (Ho) y concluir que la secuencia de
observaciones estudiada es ALEATORIA.

Como el nivel de significacin es inferior a 0,05 en la experiencia 2 y 3,


podemos rechazar la hiptesis de independencia y concluir que la secuencia de
observaciones estudiada NO es aleatoria (Ha).
C aptulo 2 Pgina 159

Pregunta de investigacin
Los valores analticos de ambas tcnicas son aleatorias?

Objetivo: Evaluacin de la amilasa tcnica 1 frente a la tcnica 2.

Amilasa (srica) Amilasa (srica)


Tcnica 1 Tcnica 2

Cul es el test estadstico ms acertado?

Prueba de RACHAS
C aptulo 2 Pgina 160

Prueba de rachas

Tcnica 1 Tcnica 2
Valor de prueba (mediana) 70 61
Casos < Valor de prueba 267 267
Casos Valor de prueba 282 281
Casos en total 549 549
Nmero total de rachas 259 263
Z - 1,393 - 1,012
Significacin bilateral 0,164 0,312

Como el nivel de significacin es mayor a 0,05 en ambas tcnicas, podemos


aceptar la hiptesis de independencia (Ho) y concluir que la secuencia de
observaciones estudiada es ALEATORIA.
C aptulo 3 Pgina 161

Captulo 3

Publicacin Bioestadstica: Tamao muestral, Error y .

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 3 Pgina 162

Materiales y mtodos
Estructura

1. Tipo de diseo (estudio).


2. Sujetos incluidos (criterios de seleccin de la muestra).
3. Fuentes de informacin.
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales).
5. Instrumentos y procedimientos de medida (cuestionarios).
6. Definicin de las variables y covariables incluidas en el estudio (factor de
estudio y criterio de evaluacin).
7. Limitaciones y consideraciones ticas de la investigacin.
8. Pruebas estadsticas a utilizar (programa estadstico).
C aptulo 3 Pgina 163

Materiales
Pacientes

1. Criterios de seleccin de la muestra (inclusin y exclusin).


2. Procedencia.
3. Tcnica de reclutamiento utilizada.
4. Tiempo empleado para reunir a todos los participantes.
5. Principales caractersticas de los pacientes.
- Edad.
- Sexo.
- Procedencia.
- Gravedad.
- Aos de evolucin de la enfermedad.
- Patologas asociadas...
6. Clculo de tamao muestral.
C aptulo 3 Pgina 164

Seleccin de la muestra

Poblacin Seleccin aleatoria Muestra

TCNICAS DE MUESTREO

ERROR ALEATORIO

Parmetro Estadstico X
Media poblacional Inferencia Media muestral

Estructura del proceso de la INFERENCIA ESTADSTICA


C aptulo 3 Pgina 165

INFERENCIA ESTADSTICA: Es el conjunto de procedimientos estadsticos que


permiten pasar de lo particular (la muestra) a lo general (la poblacin).

TCNICAS DE MUESTREO: Es el conjunto de procedimientos que permiten elegir


muestras que sean representativas de la poblacin (de todos los individuos de la
poblacin).

ERROR ALEATORIO: Es el error que se comete al estudiar un problema en base a una


muestra elegida al azar (es siempre un error inevitable). La imposibilidad de estudiar a
todos los individuos de la poblacin obliga al investigador a trabajar con muestras, lo
que supone siempre cometer un error aleatorio.
C aptulo 3 Pgina 166

Muestra de la poblacin

Muestra

Poblacin en estudio

Poblacin diana
C aptulo 3 Pgina 167

Proceso de seleccin de individuos para el estudio


Poblacin diana: Conjunto de individuos al que hace referencia la pregunta principal
del objetivo del estudio. Es la poblacin a la que se deseara generalizar los resultados
obtenidos. Se define principalmente sobre la base de caractersticas demogrficas y
clnicas generales.

Criterios de seleccin Validez externa

Poblacin de estudio: Es un subconjunto de la poblacin diana definida por criterios


de seleccin establecidos en un protocolo. Esta poblacin presenta determinadas
caractersticas geogrficas y temporales que la hacen accesible al estudio.

Muestreo Validez interna

Muestra: Es un conjunto de individuos que pueden ser estudiados en el momento de


realizar el estudio y que cumplen con los criterios definidos en el protocolo de estudio.
C aptulo 3 Pgina 168

Poblacin diana: Pacientes con HTA esencial del rea sanitaria de Ceuta.

Criterios de seleccin Validez externa

Poblacin de estudio: Pacientes con HTA esencial leve-moderada de edad comprendida


40-60 aos del rea sanitaria de Ceuta.

Muestreo Validez interna

Muestra: Pacientes con HTA esencial leve-moderada de edad comprendida 40-60 aos
registrados en los ficheros del Centro de Salud 1 que incluyen la edad y el sexo.
C aptulo 3 Pgina 169

Poblacin diana: Poblacin peditrica de Ceuta.

Criterios de seleccin Validez externa?

Poblacin de estudio: Nios que acuden a la consulta de Atencin al nio sano de Atencin
Primaria de edad comprendida 12-14 aos.

Muestreo Validez interna?

Muestra: Nios que acuden al Programa de Atencin al nio sano de los centros de Salud
de Atencin Primaria de edades comprendida entre 12-14 aos que sus madres demandan
la realizacin de una analtica rutinaria completa.
C aptulo 3 Pgina 170

Poblacin diana: Poblacin gestante de Ceuta.

Criterios de seleccin Validez externa

Poblacin de estudio: Mujeres gestantes del rea sanitaria que acuden a la consulta de
Obstetricia del INGESA de Ceuta.

Muestreo Validez interna

Muestra: Mujeres gestantes del rea sanitaria de Ceuta que acuden a la consulta de
Obstetricia del INGESA embarazo controlado- con cartilla de embarazo completa, que
incluyen las variables predictoras (etnia, nivel cultural, edad, etc) y la variable resultado
(determinacin de anticuerpos frente al virus de la rubeola en el primer trimestre) incluidas
en el estudio.
C aptulo 3 Pgina 171

Proceso de seleccin de individuos para el estudio


Poblacin diana: Poblacin inmigrante de Ceuta.

Criterios de seleccin Validez externa

Poblacin de estudio: Individuos inmigrantes residentes en el campamento de Calamocarro


de Ceuta atendidos por el personal sanitario.

Muestreo Validez interna

Muestra: Individuos inmigrantes residentes en el momento del estudio en el campamento


de Calamocarro de Ceuta, atendidos por el personal sanitario, y en cuya ficha se haban
recogido las variables predictoras (filiacin, pas de origen, edad), as como el resultado
de todas las pruebas complementarias (incluido la Variable resultado: prueba de la
tuberculina) incluidas en el estudio.
C aptulo 3 Pgina 172

Material
Pacientes

- Criterios de seleccin de la muestra (inclusin y exclusin).


- Procedencia.
- Tcnica de reclutamiento utilizada.
- Tiempo empleado para reunir a todos los participantes.
- Principales caractersticas de los pacientes.
Edad.
Sexo.
Procedencia.
Gravedad.
Aos de evolucin de la enfermedad.
Patologas asociadas...
- Clculo de tamao muestral.
C aptulo 3 Pgina 173

Qu error alfa y que error beta estoy dispuesto a asumir?

Cuntos pacientes debo elegir para que mi estudio sea correcto?


C aptulo 3 Pgina 174

Concepto e importancia y utilidad prctica del error alfa


() y error beta ()
- Determinacin del tamao muestral
- Estudios para determinar parmetros poblacionales (slo error alfa)
Estimacin de una proporcin
Estimacin de una media
- Estudios para contraste de hiptesis (error alfa y beta)
Comparacin de dos proporciones
Comparacin de dos medias
Correlacin entre dos variables cuantitativas
- Rentabilidad diagnstico de una prueba-test
- Exactitud
Sensibilidad
Especificidad
- Seguridad
Valor predictivo positivo (VPP)
Valor predictivo negativo (VPN).
C aptulo 3 Pgina 175

Riesgos al tomar decisiones


Ejemplo: Se juzga a un individuo por la presunta comisin de un delito

H0: Hiptesis nula Los datos pueden refutarla


- Es inocente (no se encuentran Es la hiptesis que se acepta si las
indicios de culpabilidad) pruebas no indican lo contrario
Rechazarla por error tiene graves
consecuencias (condenar a un
inocente)

H1: Hiptesis alternativa No debera ser aceptada sin


- Es culpable (se encuentran una gran evidencia a favor.
indicios de culpabilidad) Rechazarla por error tiene
consecuencias consideradas
menos graves que la anterior
(liberar a un delincuente)
C aptulo 3 Pgina 176

Tipos de error al tomar una decisin

Tipos de error al tomar una decisin Realidad

Culpable Inocente

Veredicto Culpable OK Error


Resultado de la prueba Hiptesis ALTERNATIVA No error Muy grave
Sentencia del juez aceptada VP FP
Ha Encarcelar a un inocente

Inocente Error OK
Hiptesis NULA FN No error
aceptada Menos grave: Liberar un VN
Ho culpable
C aptulo 3 Pgina 177

Hiptesis nula (Ho): No existen diferencias significativas en la eficacia clnica de dos


frmacos A y B (A=B)
Hiptesis alternativa (Ha): Existen diferencias en la eficacia clnica de dos frmacos A y B
(A B)
A>BA<B

Tipos de ERROR ALEATORIO en una prueba estadstica de contraste de hiptesis

A B A=B
Ha Ho

AB VP FP
Ha
A=B
Ho FN VN

Error tipo I (alfa): El investigador rechaza la Ho siendo esta verdadera en la poblacin (el
investigador concluye que existe diferencia cuando en realidad no la hay).
Error tipo II (beta): El investigador no rechaza la Ho siendo esta falsa en la poblacin (el
investigador concluye que ha sido incapaz de encontrar una diferencia que existe en la
realidad).
C aptulo 3 Pgina 178

Tipos de error al contrastar hiptesis

Realidad

H0 Falsa H0 Cierta
AB A=B
Rechazo H0 Correcto Error de tipo I
Acepto H1 El tratamiento nuevo B tiene El tratamiento nuevo B realmente no es
AB mayor efecto que A y el mejor que el antiguo A pero se decide
experimento lo confirma. errneamente que s.
Probabilidad
VP
FP
No Rechazo H0 Error de tipo II Correcto
Acepto H0 El tratamiento nuevo B El tratamiento nuevo B no tiene mayor
A=B realmente si tiene mayor efecto efecto que el antiguo A y as se decide.
que el antiguo A pero no lo
percibimos en nuestro estudio. VN
Probabilidad

FN
C aptulo 3 Pgina 179

Tipos de error al contrastar hiptesis

Realidad

H0 Falsa H0 Cierta
AB A=B
Rechazo H0 Correcto Error de tipo I
Acepto H1 Se rechaza la hiptesis nula (H0) Se rechaza la H0 (se dice que los
AB (se dice que los resultados son resultados son estadsticamente
Encuentro pruebas (+) estadsticamente significativos y significativos) pero nos equivocamos.
p < 0,05 es verdad. Probabilidad

VP FP Error ALFA
No Rechazo H0 Error de tipo II Correcto
Acepto H0 No se rechaza la hiptesis No se rechaza la hiptesis nula H0 (el
A=B nula (H0) (se dice que no hay azar puede explicar las diferencias
No encuentro pruebas (-) diferencias significativas) pero observadas en los datos), y es verdad.
p > 0,05 nos equivocamos. Probabilidad
VN
FN Error BETA
C aptulo 3 Pgina 180

Tipos de error al contrastar hiptesis

Realidad

Ha H0

Ha Acierto Error de tipo I


Encuentro pruebas (+) (1- )
p < 0,05 POTENCIA ESTADSTICA
FP
Error ALFA
VP
H0 Error de tipo II Acierto
No encuentro pruebas (-) (1- )
p > 0,05
FN Error BETA VN

POTENCIA ESTADSTICA: Es la capacidad del estudio para detectar una diferencia si sta existe realmente.
C aptulo 3 Pgina 181

Tipos de error al contrastar hiptesis

Realidad

Ha H0

Ha Acierto Error de tipo I


Encuentro pruebas (+) (1- )
p < 0,05 POTENCIA ESTADSTICA
FP
Error ALFA
VP
H0 Error de tipo II Acierto
No encuentro pruebas (-) (1- )
p > 0,05
FN Error BETA VN

NIVEL DE CONFIANZA (1 - ): Es la probabilidad a priori de que el intervalo de confianza (IC) a calcular


contenga al verdadero valor del parmetro
C aptulo 3 Pgina 182

El error tipo I (error alfa)

- En nuestro estudio se concluye diciendo que hay diferencias cuando


realmente no las hay.

- Se detecta significacin estadstica (p < 0,05) y se rechaza H0, cuando en


realidad sta es verdadera.

- La probabilidad de cometer este error es lo que mide la p.

FALSOS POSITIVOS
C aptulo 3 Pgina 183

El error tipo II (error beta)

- Cuando los resultados de nuestro estudio NO son significativos (p>0,05)


se concluye diciendo que no hay diferencias (estudio negativo) cuando
realmente SI las hay, pero nosotros no hemos sido capaces de detectarlas
- La probabilidad de tomar esta decisin (y aceptar la H0) siendo
incorrecta se llama error beta.

- En realidad existen diferencias pero el estudio ha sido incapaz de


detectarlas!
- Son los falsos negativos.

FALSOS NEGATIVOS
C aptulo 3 Pgina 184

Recomendaciones para disminuir el error alfa () tipo I


- Disponer de una teora que gue la investigacin, evitando el salir de pesca
con el ordenador buscando asociaciones entre variables.

- Disminuir el nmero de test estadsticos llevados a cabo en el estudio.

- Depurar la base de datos para evitar errores de valores extremos que


puedan producir hallazgos significativos.

- Utilizar valores de alfa ms reducidos (0,01 0,001).

- Reproducir el estudio. Si al reproducir el estudio se obtienen resultados


similares, estaremos ms seguros de no estar cometiendo el error de tipo I.

Pita Fernndez S, Prtega Daz S. Significancia estadstica y relevancia clnica.


Cad Aten Primaria 2001; 8: 191-195.
C aptulo 3 Pgina 185

Recomendaciones para disminuir el error beta () tipo II


- Incrementar el tamao de la muestra.

- Estimar el poder estadstico del estudio (1 ).

- Incrementar el tamao del efecto a detectar.

- Incrementar el valor de alfa.

- Utilizar test paramtricos (ms potentes) en lugar de test no paramtricos

Pita Fernndez S, Prtega Daz S. Significancia estadstica y relevancia clnica.


Cad Aten Primaria 2001; 8: 191-195.
C aptulo 3 Pgina 186

Importancia del error alfa y error beta


- Determinacin del tamao muestral
- Estudios para determinar parmetros poblacionales (slo error alfa)
- Estimacin de una proporcin.
- Estimacin de una media.
- Estudios para contraste de hiptesis (error alfa y beta).
- Comparacin de dos proporciones.
- Comparacin de dos medias.
- Correlacin entre dos variables cuantitativas.

- Rentabilidad diagnstico de una prueba-test.


- Sensibilidad.
- Especificidad.
- Valor predictivo positivo (VPP).
- Valor predictivo negativo (VPN).
C aptulo 3 Pgina 187

Clculo del tamao muestral de un parmetro


1. VARIABILIDAD del parmetro que se desea estimar
- Variables cuantitativas: varianza
- Variables cualitativas: 1-P
1. Variabilidad del parmetro
Cuando esta variabilidad es desconocida
- Bibliografa
- Datos propios previos
- Estudio piloto

2. PRECISIN (i) con la que se desea obtener la estimacin (amplitud deseada del IC). Se
fija i previo al estudio. Cuanto ms precisin ms estrecho ser el IC, y mayor deber ser
el volumen muestral.
2. Precisin

3. NIVEL DE CONFIANZA deseado (generalmente 95%), que corresponde a un valor de


alfa de 0,05. Este valor indica el grado de confianza de que el verdadero valor poblacional
desconocido del parmetro en estudio se site en el intervalo obtenido.
3. Nivel de confianza 95%
C aptulo 3 Pgina 188

Frmulas para el clculo del nmero de sujetos necesarios para la realizacin de un estudio
cuyo objetivo es la estimacin de un parmetro

Estimacin de una variable CUALITATIVA (proporcin - prevalencia)

Z2 * P * (1- P)
N=
i2

Estimacin de una variable CUANTITATIVA (MEDIA)

Z2 * s2
N=
i2

N = nmero de sujetos necesarios


Z 2 = Valor del estadstico Z correspondiente al riesgo alfa fijado ( = 0,05)
P = Valor de la proporcin (prevalencia) que se supone que existe en la poblacin
S2 = Varianza de la distribucin de la variable cuantitativa que se supone que existe en la poblacin
i: Precisin con que se desea estimar el parmetro
C aptulo 3 Pgina 189

Influencia del valor supuesto de la proporcin (P) o prevalencia (variabilidad del Parmetro
que se desea estimar sobre el nmero de sujetos necesarios N (tamao muestral mnimo
necesario).

INFLUENCIA DE LA PROPORCIN
1. Variabilidad del parmetro 2. Precisin (i = 0,05) 3. Nivel de confianza 95% = 0,05

Prevalencia Precisin (i = cte) Tamao muestral (N)


0,10 0,05 (5%) 138
0,20 0,05 (5%) 246
0,30 0,05 (5%) 323
0,40 0,05 (5%) 369
0,50 0,05 (5%) 384
Postura de mxima indeterminacin
i = Z P (1 P) / N
Todos los clculos han sido realizados con un nivel de confianza del 95%
P = valor supuesto de la proporcin que se desea estimar.
i = precisin de la estimacin, que corresponde a la mitad del intervalo de confianza (P i)
N = nmero de sujetos necesarios para realizar la estimacin de P con la precisin deseada y el 95%
de confianza
C aptulo 3 Pgina 190

Influencia de la precisin (i) de la estimacin sobre el nmero de sujetos necesarios N


(tamao muestral mnimo necesario).

INFLUENCIA DE LA PRECISIN
1. Variabilidad del parmetro (P=cte) 2. Precisin (i = 0,05) 3. Nivel de confianza 95% = 0,05

Prevalencia Precisin (i = cte) Tamao muestral (N)


0,40 0,1 (10%) 92
0,40 0,075 (7,5% 164
0,40 0,050 (5%) 369
0,40 0,025 (2,5%) 1475
0,40 0,01 (1%) 9220

i = Z P (1 P) / N
Todos los clculos han sido realizados con un nivel de confianza del 95% ( = 0,05)
P = valor supuesto de la proporcin que se desea estimar.
i = precisin de la estimacin, que corresponde a la mitad del intervalo de confianza (P i)
N = nmero de sujetos necesarios para realizar la estimacin de P con la precisin deseada y el 95%
de confianza
C aptulo 3 Pgina 191

Cul es el tamao muestral necesario para conocer la prevalencia de


inmunizacin toxoplsmica en la ciudad de Ceuta?

Postura de mxima
indeterminacin

Precisin 5%
i = 0,05

Tamao muestral necesario (n) para conocer la prevalencia


de inmunizacin frente a Toxoplasma gondii en la poblacin
de la ciudad de Ceuta
C aptulo 3 Pgina 192

Variabilidad
i = 0,05
Precisin 5%
Precisin 5%
i = 0,05

Nivel de confianza
95%
= 0,05

Tamao muestral necesario (n) para conocer la prevalencia


de inmunizacin frente a Toxoplasma gondii en la poblacin
de la ciudad de Ceuta
C aptulo 3 Pgina 193

Cul es el tamao muestral necesario para conocer la prevalencia de rasgo


beta-talasmico en la ciudad de Ceuta?

i = 0,005
Precisin 0,5%
C aptulo 3 Pgina 194

Variabilidad i = 0,005
Precisin 0,5%
Precisin i = 0,5%

Nivel de confianza
95%
= 0,05
C aptulo 3 Pgina 195

Cuntas personas tenemos que estudiar para conocer la


prevalencia de diabetes tipo 2 en el distrito de salud X de
Ceuta que atiende a una poblacin de 15.000 habitantes?
1. Proporcin esperada: asumamos que puede ser prxima al 5%
2. Precisin (i)(d): 3%
3. Nivel del confianza (seguridad): 95%

n = 203 personas del distrito de salud X

4. Tamao de la poblacin de origen (poblacin atendida por el distrito de salud X)

n = 200 personas del distrito de salud X

Pita Fernndez S. Determinacin del tamao muestral. Cad Aten Primaria 1996; 3: 138-144.
Pita Fernndez S. Determinacin del tamao muestral. Cad Aten Primaria 1996; 3: 138-144.
C aptulo 3 Pgina 196

Clculo del tamao muestral para contraste de hiptesis


1. Magnitud de la diferencia a detectar que tenga inters clnico.
- Comparacin de dos medias.
- Comparacin de dos proporciones: P1 y P2.

2. Aproximacin de los parmetros de la variable que se estudia (bibliografa o estudios


previos).

3. NIVEL DE CONFIANZA deseado o seguridad del estudio (generalmente 95%), que


corresponde a un valor de de 0,05 (riesgo de cometer un error alfa).

4. PODER ESTADSTICO (1- )(riesgo de cometer un error ).

5. Definir si la hiptesis va a ser unilateral o bilateral.


- Bilateral: cualquiera de los dos parmetros a comparar puede ser mayor o menor
que el otro (no hay direccin) (A B).
- Unilateral: cuando se considera que uno debe ser mayor que el otro (direccin de
las diferencias) (A < B).
C aptulo 3 Pgina 197

Prueba UNILATERAL: Se utiliza cuando se pretende determinar si el frmaco nuevo B


es ms eficaz que
Prueba el clsico A,
UNILATERAL: es decir,
Se utiliza tan
cuando se slo interesa
pretende unasi de
determinar las direcciones
el frmaco nuevo de la
B es ms eficaz que el clsico A, es decir, tan solo interesa una de las direcciones de
comparacin (B > A), interesa
la comparacin demostrar
(B > A), interesa queque
demostrar B sea
B seams efectivo
ms efectivo quequeA. A.

DISTRIBUCIN Una sola cola


NORMAL Z 1-
TIPIFICADA (Z) Ho: o
Ha: o > = 0,05
Valores de la distribucin normal
tipificada (Z) correspondientes al
valor del 5% en las pruebas B>A Z = 1.645
estadsticas unilaterales y bilaterales.

Las pruebas unilaterales especifica


la direccin de la diferencia. Dos colas
Las pruebas bilaterales NO especifica
la direccin de la diferencia. Ho: o = Z 1- /2
Ha: o

AB Z = - 1.96 Z = 1.96

Prueba BILATERAL: Se utiliza cuando se pretende determinar si dos frmacos


Prueba BILATERAL: Seenutiliza
A y B difieren cuando
su efectividad se pretende
clnica (A B) determinar si dos frmacos A y B
difieren en su efectividad clnica (A B).
C aptulo 3 Pgina 198

Pruebas de contraste unilateral:


Riesgo en la toma de decisiones

Se utiliza cuando se pretende Ho Ha


determinar si el frmaco nuevo Una sola cola
B es ms eficaz que el clsico
A, es decir, tan solo interesa B>A
una de las direcciones de la
comparacin (B > A)
Riesgo alfa
= 0,05
Riesgo beta Z = 1,645
error b

1 - = Nivel de confianza 1 - b = Potencia estadstica


Probabilidad de Ho cuando esta es cierta Probabilidad de Ha cuando esta es cierta
C aptulo 3 Pgina 199

Pruebas de contraste bilateral:


Riesgo en la toma de decisiones

Se utiliza cuando se pretende determinar si dos frmacos A y B difieren en su


eficacia clnica (A B)
Dos colas
Riesgo beta Riesgo beta
error b error b

B<A B>A
/2 = 0,025 /2 = 0,025

Z = - 1.96 Z = 1.96
Riesgo alfa = 0,05 se distribuye simtricamente a cada lado 0,025
C aptulo 3 Pgina 200

Ejemplo de comparacin de clculo del tamao muestral para comparacin


de dos proporciones a una sola cola

Deseamos evaluar si el nuevo frmaco B es mejor que el tratamiento clsico A para el


alivio del dolor, para lo que diseamos un ensayo clnico. Sabemos por datos previos
(bibliografa) que la eficacia del frmaco A es prxima al 70% y consideramos clnicamente
relevante si el nuevo frmaco B alivia el dolor en un 90%. Nuestro nivel de riesgo alfa lo
fijamos en 0.05 (error =5%) y deseamos un poder estadstico (1- ) de un 80% (error
=20%). Cul es el volumen muestral?


B>A Una sola cola
Z = 1.645

n = 48 pacientes
En cada grupo (A y B) precisamos 48 pacientes.

Pita Fernndez S. Determinacin del tamao muestral. Cad Aten Primaria 1996; 3: 138-144.
C aptulo 3 Pgina 201

Ejemplo de comparacin de clculo del tamao muestral para comparacin


de dos proporciones a dos colas.

Sabemos por datos previos (bibliografa) que la mortalidad del frmaco A es prxima al
31% comparada con el frmaco B que tiene una tasa de mortalidad del 40%. Nuestro nivel
de riesgo alfa lo fijamos en 0.05 (error =5%) y deseamos un poder estadstico (1- ) de
un 90% (error =10%). Cul es el volumen muestral?

Dos colas
BA
Z = 1.96

Necesitamos un total de 1184 pacientes, 592 para cada grupo (A y B).


C aptulo 3 Pgina 202

Influencia de la magnitud del efecto a detectar y del poder estadstico en la


determinacin del tamao muestral (n1 y n2).
Comparacin de dos Prevalencias (proporciones) P1 y P2.
100%
P1 = 40% = 20%
90% P2 = 60% P1 = 40% = 15%
80%
P2 = 55%
Poder estadstico (1 )

70%

60%

50% P1 = 40% = 10%


40% P2 = 50%
30%
20%

10%

0%
0 50 100 150 200 250 300 350 400 450 500
Nmero de casos por grupo
C aptulo 3 Pgina 203

Clculo del tamao de la muestra por software (ejemplo)

El clculo resulta an ms fcil, cuando se utiliza un software. Por ejemplo


utilizando el software gratuito PS: Power and Sample Size Program, tenemos
que introducir los valores correspondientes a:

1. Las tasa de mortalidad en los grupos que recibieron el tratamiento A y B


(0.31 y 0.40).

2. El nivel de significacin estadstica (ERROR ALFA del 5%) (p < 0.05) .

3. El poder estadstico del estudio (ERROR BETA del 10%) (0.90) asumido
para obtener el tamao muestral por cada grupo.
C aptulo 3 Pgina 204
C aptulo 3 Pgina 205

Ejemplo del clculo del tamao muestral para el clculo del coeficiente de
correlacin entre dos variables cuantitativas

Supongamos que se desea estudiar la asociacin entre la edad y el nivel de colesterol


entre los pacientes de un centro de salud. Se disea un estudio piloto en el que se
determinar mediante una analtica el colesterol en una muestra aleatoria de los pacientes
durante un periodo de tiempo prefijado, de los que tambin se registrar su edad. Se
obtiene un valor del coeficiente de correlacin lineal de Pearson entre la edad y el
colesterol de r=0,3. Aplicando las frmulas, con un NIVEL DE CONFIANZA del 95% (error
=5%) y un PODER ESTADSTICO del 80% (error =20%), se obtiene:

En este caso, se necesitara


incluir a 85 pacientes para
llevar a cabo el estudio.

Si, adems, en este ltimo caso se prev un 20% de posibles prdidas de informacin
durante la ejecucin del estudio, el tamao muestral se recalcula segn la expresin:
Es decir, se necesitara una
muestra de 107 pacientes para
llevar a cabo la investigacin.

Prtegas Daz S , Pita Fernndez S. Determinacin del tamao muestral para calcular la significacin del
coeficiente de correlacin lineal. Cad Aten Primaria 2001; 9: 209-211.
C aptulo 3 Pgina 206

Frmulas para el clculo


del poder estadstico (1-
) en funcin del tipo de
diseo del estudio.

Clculo del poder estadstico


de un estudio.

Prtegas Daz S, Pita Fernndez S.


Unidad de Epidemiologa Clnica
y Bioestadstica. Complexo
Hospitalario-Universitario Juan
Canalejo. La Corua
C aptulo 3 Pgina 207

Frmulas para el clculo del poder estadstico (1-) en funcin del tipo de
diseo del estudio.

Clculo del poder estadstico de un estudio.

Prtegas Daz S, Pita Fernndez S.


Unidad de Epidemiologa Clnica y Bioestadstica. Complexo Hospitalario-Universitario Juan Canalejo.
La Corua
C aptulo 3 Pgina 208

n = Tamao muestral. En un estudio de casos y controles, n es el nmero de casos.


P1 = En un estudio transversal o de cohortes, proporcin de expuestos que
desarrollan la enfermedad. En un estudio de casos y controles, proporcin de casos
expuestos
P2 = En un estudio transversal o de cohortes, proporcin de NO expuestos que
desarrollan la enfermedad. En un estudio de casos y controles, proporcin de
controles expuestos
d = Valor mnimo de la diferencia a detectar entre dos medias
s2 = Varianza en el grupo control o de referencia
c = Nmero de controles por caso, en estudios caso-control
m = En un estudio de casos y controles, nmero de controles
OR = Valor aproximado del odds ratio a detectar
RR = Valor aproximado del riesgo relativo a detectar
r = Magnitud del coeficiente de correlacin a detectar
C aptulo 3 Pgina 209

Valores de los estadsticos Z ms frecuentemente utilizados en el clculo del tamao muestral


considerando el error y

Error Seguridad (1 - ) Test unilateral Test bilateral


Z 1- Z 1- /2

0,05 95% 1,645 1,96

0,01 99% 2,326 2,576

Error Poder estadstico (1 ) Z 1-

0,10 90% 0,10 1,282

0,20 80% 0,20 0,842


C aptulo 3 Pgina 210

Asociacin observada

p < 0,05 p > 0,1


Estadsticamente significativa Estadsticamente NO significativa

AB A=B
VP VN
FN
FP Verdadera Verdadera
(no existe asociacin)
Falsa
Falsa
Utilidad clnica
Error
Sin inters prctico Comparacin
Error poco sensible

Sesgo Nmero insuficiente de sujetos


Interpretacin de una asociacin (o diferencia) observada en un estudio Sesgo
C aptulo 3 Pgina 211

Interpretacin de una asociacin (o diferencia)


observada en un estudio ERROR ALFA
Expedicin de pesca

La probabilidad de encontrar resultados FALSOS POSITIVOS FP (error alfa )


aumenta notablemente con el nmero de comparaciones injustificadas realizadas
entre las distintas variables durante el anlisis (ir de pesca).

Estudios que sin apoyarse en ninguna hiptesis a PRIORI (estrategia de anlisis),


consideran todas las variables de igual importancia (hiptesis a POSTERIORI),
analizndolas unos contra otras (sin criterio), esperando a ver que se encuentra
C aptulo 3 Pgina 212

Decisiones que se pueden tomar en un test de contraste


de hiptesis despus de conocer el valor de significacin
estadstica p
p < 0,05 AB p 0,10 A=B
Se rechaza la hiptesis nula No se puede rechazar la hiptesis nula
No parece que el azar pueda No se puede descartar que el azar lo
explicarlo todo explique todo
El EFECTO observado es mayor que El EFECTO observado es similar que el
el ERROR ERROR
Hay diferencias estadsticamente NO hay diferencias estadsticamente
significativas significativas
Existen evidencias a favor de la NO existen evidencias a favor de la
hiptesis alternativa Ha, y por tanto hiptesis alternativa Ha, y por tanto
rechazamos la hiptesis nula Ho aceptamos la hiptesis nula Ho

Los lmites de 0,05 y 0,1 pueden ser considerados en cierto modo


arbitrarios y aproximados
C aptulo 3 Pgina 213

Materiales
Pacientes

1. Criterios de seleccin de la muestra (inclusin y exclusin).


2. Procedencia.
3. Tcnica de reclutamiento utilizada.
4. Tiempo empleado para reunir a todos los participantes.
5. Principales caractersticas de los pacientes.
- Edad.
- Sexo.
- Procedencia.
- Gravedad.
- Aos de evolucin de la enfermedad.
- Patologas asociadas...
6. Clculo de tamao muestral.
C aptulo 4 Pgina 214

Captulo 4

Publicacin Bioestadstica: Error y .


Evaluacin de pruebas diagnsticas.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 4 Pgina 215

Bioestadstica: Error y
Influencia de los errores y en la rentabilidad clnica de las
pruebas diagnsticas

Evaluacin de las pruebas diagnsticas


C aptulo 4 Pgina 216

Evaluacin de las pruebas diagnsticas

- Exactitud (validez, efectividad o rentabilidad).


- Sensibilidad.
- Especificidad.
- Seguridad: valores predictivos.
- Valor predictivo positivo (VPP).
- Valor predictivo negativo (VPN).
- Razn de verosimilitud.
- Curvas roc.
- Reproductivilidad.
- Invasividad.
- Coste econmico (URV).
C aptulo 4 Pgina 217

Hiptesis nula (Ho): No existen diferencias significativas en la eficacia clnica


de dos frmacos A y B (A = B)

Hiptesis alternativa (Ha): Existen diferencias en la eficacia clnica de dos


frmacos A y B (A B) A>B A<B

Realidad
Existe No existe
diferencia diferencia
(Ha (Ho
verdadera) verdadera)
Resultado p < 0,05 No error Error tipo I
de la prueba Acepto la Ha VP (1-) FP ( )
Se produce un cierto solapamiento en las estadstica p > 0,05 Error tipo II No error
distribuciones de probabilidad de la Ho y de Acepto la Ho FN () VN
la Ha, en este solapamiento siempre aparece
el error y asumido, el cual ser mayor o
menor en funcin del resultado o diferencia Resultados de una prueba de significacin estadstica
observada en nuestro estudio Ho: hiptesis nula (no hay diferencias significativas)
X: distribucin de la diferencia cuando Ho es cierta
Y: distribucin de la diferencia cuando Ha es cierta
R: resultado (diferencia) observado en nuestro estudio
C aptulo 4 Pgina 218

Relacin de los riesgos asociados a un test de hiptesis


unilateral (estadstico valor de la media):
Error tipo I (riesgo a) y tipo II (riesgo b)

Muestra:
cae en esta lnea:
xx cae en esta lnea:
Riesgo alfa
Riesgo beta error 0,05
error b
Significacin
estadstica

b
x

Regin
Regin de de aceptacin
aceptacin H0 H0 Regin de rechazo
Regin H0
de rechazo H0

Regin de rechazo H1
Regin de rechazo Ha Regin de aceptacin
Regin H1
de aceptacin H a
C aptulo 4 Pgina 219

Riesgo alfa y riesgo beta

Se produce un cierto de la
Ho y de la Ha, en este Ho Ha
solapamiento siempre
aparece el error y
asumido, el cual ser
mayor o menor en funcin
del resultado o diferencia
observada en nuestro
estudio
Riesgo alfa
Riesgo beta error 0,05
error b Significacin
estadstica

Se acepta Ho Se acepta Ha
Se rechaza Ha Se rechaza Ho
C aptulo 4 Pgina 220

Error alfa versus error beta:


No se puede tener todo

b
ERROR BETA
a
FALSOS NEGATIVOS ERROR ALFA
FALSOS POSITIVOS
C aptulo 4 Pgina 221

Error alfa versus error beta:


No se puede tener todo

a 1-5 %
ERROR ALFA
FALSOS POSITIVOS
b 10-20 %
ERROR BETA
FALSOS NEGATIVOS
C aptulo 4 Pgina 222

Error alfa versus error beta:


No se puede tener todo
Hay que buscar un equilibrio entre los FALSOS POSITIVOS (error ) y los FALSOS
NEGATIVOS (error b).
Ho Ha

error b error
10% (0,05)

Ho Ha

error b
error
20%
(0,01)

Para un tamao muestral fijo (N= cte), no se pueden reducir a la vez ambos tipos de error.
Para reducir b, hay que aumentar el tamao muestral N.
C aptulo 4 Pgina 223

Tipos de error en las pruebas diagnsticas

Realidad

Enfermos Sanos
Test de laboratorio Positivo VERDADEROS FALSO POSITIVO
(+) POSITIVOS error
Hiptesis alternativa VP Error Muy grave
(1- )

Negativo FALSO NEGATIVO VERDADEROS


(-) error NEGATIVOS
Hiptesis nula Error Menos grave VN
C aptulo 4 Pgina 224

Tipos de error en las pruebas diagnsticas

Tipos de error en las pruebas diagnsticas Realidad

Enfermos Sanos
Test de laboratorio Positivo VERDADEROS FALSO POSITIVO
PSA (+) POSITIVOS FP
VP

Negativo FALSO NEGATIVO VERDADEROS


(-) FN NEGATIVOS
VN
C aptulo 4 Pgina 225

Tipos de error en las pruebas diagnsticas

Tipos de error en las pruebas diagnsticas Evento o enfermedad estudiada

Enfermos Sanos Total


Resultados de la prueba Positivo VERDADEROS FALSO VP + FP
diagnstica (+) POSITIVOS POSITIVO
VP FP

Negativo FALSO NEGATIVO VERDADEROS FN + VN


(-) FN NEGATIVOS
VN

Total VP + FN FP + VN

VP Enfermos positivos
SENSIBILIDAD = SENSIBILIDAD =
VP + FN Total de ENFERMOS
C aptulo 4 Pgina 226

La sensibilidad de la prueba diagnstica

- Es la probabilidad de clasificar correctamente a un individuo enfermo.

- Es la probabilidad de que para un sujeto enfermo se obtenga en la prueba


un resultado positivo.

- Es la capacidad del test para detectar la enfermedad.

- Probabilidad de obtener un resultado positivo cuando el individuo tiene la


enfermedad.

- Mide su capacidad para detectar la enfermedad cuando est presente.

- Su valor depende del error BETA ().


C aptulo 4 Pgina 227

Tipos de error en las pruebas diagnsticas

Tipos de error en las pruebas diagnsticas Evento o enfermedad estudiada

Enfermos Sanos Total


Resultados de la prueba Positivo VERDADEROS FALSO VP + FP
diagnstica (+) POSITIVOS POSITIVO
VP FP

Negativo FALSO NEGATIVO VERDADEROS FN + VN


(-) FN NEGATIVOS
VN

Total VP + FN FP + VN

Sanos negativos VN
ESPECIFICIDAD == ESPECIFICIDAD =
Total de SANOS VN + FP
C aptulo 4 Pgina 228

La especificidad de la prueba diagnstica

- Es la probabilidad de clasificar correctamente a un individuo sano.

- Es la probabilidad de que para un sujeto sano se obtenga un resultado


negativo.

- Es la capacidad del test para detectar a los sanos.

- Es la probabilidad de obtener un resultado negativo cuando el individuo no


tiene la enfermedad.

- Mide la capacidad para descartar la enfermedad cuando no est presente.

- Su valor depende del error ALFA ().


C aptulo 4 Pgina 229

Exactitud en las pruebas diagnsticas

- Es la principal cualidad clnica de una prueba diagnstica.

- Es la capacidad de una prueba diagnstica para clasificar correctamente a


los pacientes.

- Es la capacidad de una prueba diagnstica para clasificar correctamente


a los individuos en subgrupos clnicamente relevantes (enfermos y NO
enfermos).

- En su forma ms simple es la capacidad para distinguir entre dos estados de


salud (enfermos y NO enfermos).

VP + VN
EXACTITUD =
VP + FN + FP + VN
C aptulo 4 Pgina 230

Exactitud en las pruebas diagnsticas

VP + VN
EXACTITUD =
VP + FN + FP + VN

SENSIBILIDAD ESPECIFICIDAD

ACIERTOS
EXACTITUD =
ACIERTOS + FALLOS
C aptulo 4 Pgina 231

Tipos de error en las pruebas diagnsticas

Tipos de error en las pruebas Evento o enfermedad estudiada


diagnsticas
Enfermos Sanos Total
Resultados Positivo VERDADEROS FALSO VP + FP
de la prueba (+) POSITIVOS POSITIVO (total de positivos)
diagnstica VP FP

Negativo FALSO NEGATIVO VERDADEROS FN + VN


(-) FN NEGATIVOS
VN

Total VP + FN FP + VN

VP VP
VPP = VPP =
Total de POSITIVOS VP + FP
C aptulo 4 Pgina 232

Valor Predictivo Positivo (VPP) de la prueba diagnstica

- Es la probabilidad de padecer la enfermedad si se obtiene un resultado


positivo en el test.

- Se puede definir el VPP como la proporcin de resultados vlidos (VP) entre


todos resultados positivos de la prueba (VP + FP).

- Su valor depende del error ALFA () y de la POTENCIA ESTADSTICA.

- Su valor depende de la prevalencia (P) de la enfermedad; cuanto menor sea


la prevalencia menor ser el VPP y cuanto mayor sea la prevalencia mayor
ser el VPP.
C aptulo 4 Pgina 233

Tipos de error en las pruebas diagnsticas

Tipos de error en las pruebas Evento o enfermedad estudiada


diagnsticas
Enfermos Sanos Total
Resultados Positivo VERDADEROS FALSO VP + FP
de la prueba (+) POSITIVOS POSITIVO (total de positivos)
diagnstica VP FP

Negativo FALSO NEGATIVO VERDADEROS FN + VN


(-) FN NEGATIVOS (total de
VN negativos)

Total VP + FN FP + VN

VN VN
VPN = VPN =
Total de NEGATIVOS VN + FN
C aptulo 4 Pgina 234

Valor Predictivo Negativo (VPN) de la prueba diagnstica

- Es la probabilidad de que un sujeto con un resultado negativo en la prueba


est realmente sano.

- El VPN es la proporcin de resultados vlidos (VN) entre todos los


resultados negativos (VN + FN).

- Su valor depende del error BETA ().

- Su valor depende de la prevalencia (P) de la enfermedad en estudio


Cuanto menor sea la prevalencia, mayor ser el VPN, y cuanto mayor sea la
prevalencia, menor ser el VPN.
C aptulo 4 Pgina 235

Prevalencia de la enfermedad

Es la frecuencia con la que se presenta una determina enfermedad en una


poblacin definida en un momento dado.

VP + FN
PREVALENCIA =
VP + FP + FN + VN

ENFERMOS
PREVALENCIA =
ENFERMOS + SANOS
C aptulo 4 Pgina 236

Prevalencia de la enfermedad

VP + FN
PREVALENCIA =
VP + FP + FN + VN

ENFERMOS
PREVALENCIA = VALOR VALOR
ENFERMOS
PREDICTIVO + SANOS
PREDICTIVO
POSITIVO (VPP) NEGATIVO (VPN)

Los valores predictivos (VPP y VPN) dependen de la prevalencia de la


enfermedad en estudio.
C aptulo 4 Pgina 237

EXACTITUD

SENSIBILIDAD ESPECIFICIDAD

VALOR PREDICTIVO VALOR PREDICTIVO


NEGATIVO (VPN) POSITIVO (VPP)

PREVALENCIA
C aptulo 4 Pgina 238

Relacin entre la prevalencia y el valor predictivo positivo


(VPP)

Prevalencia Resultado Enfermos Sanos Total VPP


de la prueba (No enfermos)
enfermedad diagnstica
1% + 99 495 594 15%
- 1 9404 9406 (99/595)
Total 100 9900 10000
5% + 495 475 970 51%
- 5 9025 9030 (495/970)
Total 500 9500 10000

SENSIBILIDAD DIAGNSTICA = 99% ESPECIFICIDAD DIAGNSTICA = 95%


C aptulo 4 Pgina 239

Relacin entre la prevalencia y el valor predictivo

VALOR PREDICTIVO POSITIVO (VPP)


Valor predictivo (%)

VALOR PREDICTIVO NEGATIVO (VPN)

Prevalencia de la enfermedad
C aptulo 4 Pgina 240

Razn de verosimilitud

SENSIBILIDAD
RV + =
1 - ESPECIFICIDAD

Tasa de VP (%)
RV + =
Tasa de FP (%)
C aptulo 4 Pgina 241

Cul es la probabilidad de que un paciente que acude a


la consulta tenga un carcinoma de prstata si el PSA (+)
([PSA]s > 4 ng/ml)?

Variable PREDICTORA Variable RESULTADO

PSA (+) Carcinoma de prstata

VALOR PREDICTIVO POSITIVO (VPP)

Es la probabilidad de que un paciente tenga un carcinoma de prstata (CP) una vez que el test (PSA) ha
dado positivo ([PSA] > 4 ng/ml).
C aptulo 4 Pgina 242

Cul es la probabilidad de que un paciente que acude a la


consulta NO tenga un carcinoma de prstata si el PSA (-)
([PSA] < 4 ng/ml)?

VALOR PREDICTIVO NEGATIVO (VPN)

Es la probabilidad de que un individuo sano NO tenga un carcinoma de prstata (CP) una vez que el test
(PSA) ha dado negativo ([PSA] < 4 ng/ml).
C aptulo 4 Pgina 243

Cul es la probabilidad de que un paciente diagnosticado


de carcinoma de prstata presente un PSA (+) ([PSA] > 4
ng/ml)?

Variable PREDICTORA Variable RESULTADO

Carcinoma de prstata PSA (+) ([PSA] > 4 ng/ml)

SENSIBILIDAD DIAGNSTICA

Es la probabilidad de que el test (PSA) sea positivo entre los individuos realmente enfermos (carcinoma de
prstata).
C aptulo 4 Pgina 244

Cul es la probabilidad de que un paciente sin carcinoma


de prstata (CP) presente un PSA (-) ([PSA] < 4 ng/ml)?

ESPECIFICIDAD DIAGNSTICA

Es la probabilidad de que el test (PSA) sea negativo entre los individuos realmente no enfermos (sin cncer
de prstata).
C aptulo 4 Pgina 245

Cul es la probabilidad de que un valor de PSA patolgico


([PSA] > 4 ng/ml)? sea X veces ms probable en un paciente
con carcinoma de prstata (CP) que en otro sujeto sin cncer?

RAZN DE VEROSIMILITUD (RV+)

Es la probabilidad de que un resultado elevado del test (PSA) aparezca en los pacientes con carcinoma de
prstata frente a los individuos realmente no enfermos (sin cncer de prstata).
C aptulo 4 Pgina 246

Pregunta de investigacin
Qu utilidad clnica tiene el tacto rectal en el diagnstico del
carcinoma de prstata (CP) en una muestra de pacientes con
sospecha de CP que acuden a una consulta de Urologa?
Objetivo: Evaluacin del tacto rectal en el diagnstico del CP en una
consulta de urologa.

Tcnica analtica a valuar Tcnica de referencia


(patrn de oro)
TACTO RECTAL BIOPSIA PROSTTICA mediante
ecografa transrectal

Cul es el test estadstico ms acertado?

Pita Fernndez S, Prtegas Daz S. Pruebas diagnsticas. Cad Aten Primaria 2003; 10: 120-124.
C aptulo 4 Pgina 247

Tipos de error en las pruebas diagnsticas

Tipos de error en las pruebas diagnsticas Tcnica de referencia


(BIOPSIA transrectal ecodirigida)

POSITIVA NEGATIVA
TACTO RECTAL Positivo VERDADEROS FALSO POSITIVO
(+) POSITIVOS FP
VP

Negativo FALSO NEGATIVO VERDADEROS


(-) FN NEGATIVOS
VN
C aptulo 4 Pgina 248

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)

TACTO RECTAL positiva (+) negativa (-) Total

Positivo (+) 634 269 903

Negativo (-) 487 1251 1738

Total 1121 1520 2641

VP
SENSIBILIDAD =
VP + FN

634
SENSIBILIDAD = = 56,5%
634 + 487
C aptulo 4 Pgina 249

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)

TACTO RECTAL positiva (+) negativa (-) Total

Positivo (+) 634 269 903

Negativo (-) 487 1251 1738

Total 1121 1520 2641

VN
ESPECIFICIDAD =
VN + FP

1251
ESPECIFICIDAD = = 82,3%
1251 + 269
C aptulo 4 Pgina 250

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)

TACTO RECTAL positiva (+) negativa (-) Total

Positivo (+) 634 269 903

Negativo (-) 487 1251 1738

Total 1121 1520 2641

VP + VN
EXACTITUD =
VP + FN + FP + VN

634 + 1251
EXACTITUD = = 71,4 %
634 + 487 + 269 + 1251
C aptulo 4 Pgina 251

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)

TACTO RECTAL positiva (+) negativa (-) Total

Positivo (+) 634 269 903

Negativo (-) 487 1251 1738

Total 1121 1520 2641

VP 634
VPP = VPP = = 70,2%
VP + FP 634 + 269

La probabilidad de tener un CP es del 70% cuando el tacto rectal es positivo.


C aptulo 4 Pgina 252

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)

TACTO RECTAL positiva (+) negativa (-) Total

Positivo (+) 634 269 903

Negativo (-) 487 1251 1738

Total 1121 1520 2641

VN 1251
VPN = VPN = = 72,0%
VN + FN 1251 + 487

La probabilidad de NO tener un CP es de tan slo el 72% cuando el tacto rectal es negativo.


Como la prueba tiene un VPN bajo, un resultado negativo del tacto rectal slo permite descartar el
diagnstico de CP con una probabilidad del 72%.
C aptulo 4 Pgina 253

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)

TACTO RECTAL positiva (+) negativa (-) Total

Positivo (+) 634 269 903

Negativo (-) 487 1251 1738

Total 1121 1520 2641

VP + FN
PREVALENCIA =
VP + FP + FN + VN

634 + 487
PREVALENCIA = = 42,4 %
634 + 269 + 487 + 1251
C aptulo 4 Pgina 254

Tcnica de referencia (BIOPSIA prosttica mediante ecografa transrectal)

TACTO RECTAL positiva (+) negativa (-) Total

Positivo (+) 634 269 903

Negativo (-) 487 1251 1738

Total 1121 1520 2641

SENSIBILIDAD 0,565
RV + = RV + = = 3,2
1 - ESPECIFICIDAD 1 - 0,823

Un tacto rectal anormal (+) es 3 veces ms probable en un paciente con CP que en otro sujeto sin cncer.
C aptulo 4 Pgina 255

Pregunta de investigacin
Qu utilidad clnica tiene la tira reactiva en orina en el
diagnstico de la infeccin del tracto urinario (ITU)?
Objetivo: Evaluacin de la TIRA REACTIVA en el diagnstico de la ITU.

Tcnica analtica a valuar Tcnica de referencia


(patrn de oro)
TIRA REACTIVA CULTIVO
(orina) (orina)

Cul es el test estadstico ms acertado?

Latorre C, Noguero M, Mira A. Evaluacin de la tira reactiva para el diagnstico de infeccin urinaria en
nios y adultos. Med Clin (Barc) 2001; 116: 286-289.
C aptulo 4 Pgina 256

Tipos de error en las pruebas diagnsticas

Tipos de error en las pruebas diagnsticas Tcnica de referencia


(CULTIVO)

POSITIVO NEGATIVO
Test de laboratorio Positiva VERDADEROS FALSO POSITIVO
TIRA REACTIVA (+) POSITIVOS FP
orina VP

Negativa FALSO NEGATIVO VERDADEROS


(-) FN NEGATIVOS
VN
C aptulo 4 Pgina 257

INFECCIN DEL TRACTO URINARIO (ITU)

Tira reactiva SI NO Total

Positva (+) 86 433 519

Negativa (-) 20 548 568

Total 106 981 1087

VP
SENSIBILIDAD =
VP + FN

86
SENSIBILIDAD = = 81,1%
86 + 20
C aptulo 4 Pgina 258

INFECCIN DEL TRACTO URINARIO (ITU)

Tira reactiva SI NO Total

Positva (+) 86 433 519

Negativa (-) 20 548 568

Total 106 981 1087

VN
ESPECIFICIDAD =
VN + FP

548
ESPECIFICIDAD = = 55,9%
548 + 433
C aptulo 4 Pgina 259

INFECCIN DEL TRACTO URINARIO (ITU)

Tira reactiva SI NO Total

Positva (+) 86 433 519

Negativa (-) 20 548 568

Total 106 981 1087

VP + VN
EXACTITUD =
VP + FN + FP + VN

86 + 548
EXACTITUD = = 58,3%
86 + 20 + 433 + 548
C aptulo 4 Pgina 260

INFECCIN DEL TRACTO URINARIO (ITU)

Tira reactiva SI NO Total

Positva (+) 86 433 519

Negativa (-) 20 548 568

Total 106 981 1087

VP 86
VPP = VPP = = 16,6%
VP + FP 86 + 433

La probabilidad de tener una ITU es de tan slo el 17% cuando la tira reactiva es positiva.
C aptulo 4 Pgina 261

INFECCIN DEL TRACTO URINARIO (ITU)

Tira reactiva SI NO Total

Positva (+) 86 433 519

Negativa (-) 20 548 568

Total 106 981 1087

VN 548
VPN = VPN = = 96,5%
VN + FN 548 + 20

La probabilidad de NO tener una ITU es del 96,5% cuando la tira reactiva es negativa.
Como la prueba tiene un VPN alto, un resultado negativo de la tira urinaria descarta el diagnstico de ITU
con una probabilidad del 96,5%.
C aptulo 4 Pgina 262

INFECCIN DEL TRACTO URINARIO (ITU)

Tira reactiva SI NO Total

Positva (+) 86 433 519

Negativa (-) 20 548 568

Total 106 981 1087

VP + FN
PREVALENCIA =
VP + FP + FN + VN

86 + 20
PREVALENCIA = = 9,7 %
86 + 433 + 20 + 548
C aptulo 4 Pgina 263

INFECCIN DEL TRACTO URINARIO (ITU)

Tira reactiva SI NO Total

Positva (+) 86 433 519

Negativa (-) 20 548 568

Total 106 981 1087

SENSIBILIDAD
RV + =
1 - ESPECIFICIDAD

0,811
RV + = = 1,84
1 - 0,559

Una tira reactiva anormal (+) es casi 2 veces ms probable en un paciente con ITU que en otro sujeto sin
infeccin.
C aptulo 4 Pgina 264

Pregunta de investigacin
Qu utilidad clnica tienen los niveles de ferritina srica
en el diagnstico de la anemia ferropnica?
Objetivo: Evaluacin de la FERRITINA en el diagnstico de la anemia
ferropnica.

Tcnica analtica a valuar Tcnica de referencia


(patrn de oro)
FERRITINA ANEMIA FERROPNICA
(srica)

Cul es el test estadstico ms acertado?

DL Sackett. Epidemiologa clnica. Buenos Aires, Editorial Mdica Panamericana, 1994.


C aptulo 4 Pgina 265

Tipos de error en las pruebas diagnsticas

Tipos de error en las pruebas diagnsticas Realidad

Anemia ferropnica Sanos

Test de laboratorio Positivo VERDADEROS FALSO POSITIVO


FERRITINA (+) POSITIVOS FP
srica FERRITINA VP
BAJA

Negativo FALSO NEGATIVO VERDADEROS


(-) FN NEGATIVOS
FERRITINA VN
NORMAL
C aptulo 4 Pgina 266

ANEMIA FERROPNICA

FERRITINA SI NO Total

BAJA (+) 731 270 1001

NORMAL (-) 78 1500 1578

Total 809 1770 2579

VP
SENSIBILIDAD =
VP + FN

731
SENSIBILIDAD = = 90,3%
731 + 78

Si una prueba tiene una sensibilidad alta, un resultado negativo descarta el diagnstico.
C aptulo 4 Pgina 267

ANEMIA FERROPNICA

FERRITINA SI NO Total

BAJA (+) 731 270 1001

NORMAL (-) 78 1500 1578

Total 809 1770 2579

VN
ESPECIFICIDAD =
VN + FP

1500
ESPECIFICIDAD = = 84,7%
1500 + 270

Si una prueba tiene una especificidad alta, un resultado positivo confirma el diagnstico.
C aptulo 4 Pgina 268

ANEMIA FERROPNICA

FERRITINA SI NO Total

BAJA (+) 731 270 1001

NORMAL (-) 78 1500 1578

Total 809 1770 2579

VP + VN
EXACTITUD =
VP + FN + FP + VN

731 + 1500
EXACTITUD = = 86,5%
731 + 78 + 270 + 1500

Una exactitud elevada permite distinguir con un mnimo error entre dos estados de salud.
C aptulo 4 Pgina 269

ANEMIA FERROPNICA

FERRITINA SI NO Total

BAJA (+) 731 270 1001

NORMAL (-) 78 1500 1578

Total 809 1770 2579

VP 731
VPP = VPP = = 73%
VP + FP 731 + 270

La probabilidad de tener una anemia ferropnica es del 73% cuando la ferritina srica es baja.
C aptulo 4 Pgina 270

ANEMIA FERROPNICA

FERRITINA SI NO Total

BAJA (+) 731 270 1001

NORMAL (-) 78 1500 1578

Total 809 1770 2579

VN 1500
VPN = VPN = = 95,1%
VN + FN 1500 + 78

La probabilidad de NO tener una anemia ferropnica es del 95,1% cuando la ferritina srica es normal.
Como la prueba tiene un VPN alto, una ferritina normal descarta el diagnstico de anemia ferropnica con
una probabilidad del 95,1%.
C aptulo 4 Pgina 271

ANEMIA FERROPNICA

FERRITINA SI NO Total

BAJA (+) 731 270 1001

NORMAL (-) 78 1500 1578

Total 809 1770 2579

VP + FN
PREVALENCIA =
VP + FP + FN + VN

731 + 78
PREVALENCIA = = 31%
731 + 270 + 78 + 1500
C aptulo 4 Pgina 272

ANEMIA FERROPNICA

FERRITINA SI NO Total

BAJA (+) 731 270 1001

NORMAL (-) 78 1500 1578

Total 809 1770 2579

SENSIBILIDAD
RV + =
1 - ESPECIFICIDAD

0,903
RV + = = 5,9
1 - 0,847
Una ferritina baja es casi 6 veces ms probable en un paciente con anemia ferropnica que en otro sujeto
sin anemia ferropnica.
C aptulo 4 Pgina 273

Pregunta de investigacin
Qu utilidad clnica tiene el ttulo srico de anticuerpos
antinucleares en el diagnstico de enfermedades autoinmunes?

Objetivo: Evaluacin del ttulo de ANA en el diagnstico de diferentes


enfermedades autoinmunes.

Tcnica analtica a valuar Tcnica de referencia


(patrn de oro)
ANA (IFI) ENFERMEDADES
AUTOINMUNES

Cul es el test estadstico ms acertado?


C aptulo 4 Pgina 274

Tipos de error en las pruebas diagnsticas

Tipos de error en las pruebas diagnsticas Realidad

Enfermedad autoinmune Sanos

Test de laboratorio Positivo VERDADEROS FALSO POSITIVO


ANA (+) POSITIVOS FP
(IFI) VP

Negativo FALSO NEGATIVO VERDADEROS


(-) FN NEGATIVOS
VN
C aptulo 4 Pgina 275

Razn de verosimilitud
Cocientes de probabilidades

SENSIBILIDAD
RV + =
1 - ESPECIFICIDAD

Tasa de VP (%)
RV + =
Tasa de FP (%)
C aptulo 4 Pgina 276

Grupos de estudio Razn de verosimilitud (+) (cociente de probabilidades positivo)


Ttulo 1/40 Ttulo 1/80 Ttulo 1/160 Ttulo 1/320
LES (n= 38) 3,1 7,3 18,9 26,1
ESP (n= 37) 3,2 7,1 17,3 25,1
SS (n= 37) 2,7 5,7 14,7 21,3
AR (n= 38) 1,5 2,8 2,7 0,81
RPB (n= 37) 1,2 1,7 1,5 1,2
Sanos (n=120) 1,0 1,0 1,0 1,0

La razn de verosimilitud positivo (RV+) o cociente de probabilidad (CP)


positivo (sensibilidad dividida por el complementario de la especificidad)
es una medida que calcula cunto ms probable es que un resultado
positivo de una prueba (ANA) se presente en un sujeto enfermo (EAI)
frente a uno sano.

La razn de verosimilitud negativo (RV-) o cociente de probabilidad (CP)


negativo (complementario de la sensibilidad dividida por la especificidad)
relaciona la probabilidad de que un resultado negativo de una prueba se
presente en un enfermo frente a un sano.
C aptulo 4 Pgina 277

Razn de verosimilitud
Cocientes de probabilidades

RV +

Ttulo 1/40
Ttulo 1/80
Ttulo 1/160
Ttulo 1/320

Camps Garca MT, Muoz Rocan N, Calvo de Mora A, De Ramn Garrido E. Los cocientes de probabilidad
como medida de la utilidad de la determinacin de anticuerpos antinucleares por inmunofluorescencia
indirecta en la clnica. Aplicacin de los resultados de la investigacin clnica. Med Clin (Barc)1999;113: 476.
C aptulo 4 Pgina 278

Tipos de error en las pruebas diagnsticas

Tipos de error en las pruebas diagnsticas Realidad

Hemocromatosis Sanos

Test de laboratorio Positivo VERDADEROS FALSO POSITIVO


FERRITINA (+) POSITIVOS FP
IST FERRITINA alta VP
IST alto

Negativo FALSO NEGATIVO VERDADEROS


(-) FN NEGATIVOS
FERRITINA normal VN
IST normal
C aptulo 4 Pgina 279

91,3
Mutacin C282Y

97

96

90

86 88 90 92 94 96 98
IST > 55% Ferritina > 300 ng/ml varones Ferritina > 200 ng/ml mujeres IHH > 1,9

Genotypic/phenotypic correlations in genetic hemochromatosis: evolution of diagnostic criteria.Adams PC,


Chakrabarti S. Gastroenterology. 1998 Feb;114(2):319-23.
C aptulo 4 Pgina 280

Valoracin conjunta del IST y ferritina en el screening de la


hemocromatosis

IST (-) y Ferritina (-) 97

94
IST (+) y Ferritina (+)

92 93 94 95 96 97
Sensibilidad valor predictivo negativo

Holman JR. Hereditary hemochromatosis. J Fam Pract 1997; 44: 304-308.


C aptulo 4 Pgina 281

Pruebas diagnsticas en el cncer de prstata

FAP

PSA

Cociente

PSA libre/ PSA total

Tacto rectal

Citologa aspiracin

Biopsia prosttica mediante


ecografa transrectal
C aptulo 4 Pgina 282

Pruebas diagnsticas:
Mala rentabilidad diagnstica.
Baja sensibilidad y especificidad (FAP)

Sanos Enfermos

HPB
Cncer Prstata

FN FP

Niveles de FAP
error b error
C aptulo 4 Pgina 283

Pruebas diagnsticas:
Buena rentabilidad diagnstica.
Equilibrio entre sensibilidad y especificidad (PSA)

HPB
Cncer Prstata

Niveles de PSA (ng/ml)


error b error
C aptulo 4 Pgina 284

Pruebas diagnsticas:
Excelente rentabilidad diagnstica.
Mxima sensibilidad y especificidad (Cociente PSAlibre/total)

Sanos Enfermos

HPB
Cncer Prstata

error b error Cociente PSAlibre/total


C aptulo 4 Pgina 285

Situacin ideal de las pruebas diagnsticas:


Mxima sensibilidad y especificidad

HPB
Frecuencia

Cncer Prstata
Sanos Enfermos

Su Negatividad indican Su Positividad indican


siempre la ausencia de la siempre la presencia de la
enfermedad enfermedad

Especificidad ~ 100% Sensibilidad ~ 100%


C aptulo 4 Pgina 286

Situacin real de las pruebas diagnsticas:


PSA - Buen equilibrio entre sensibilidad y especificidad
Frecuencia

HPB Cncer Prstata


Sanos Enfermos

Concentracin PSA (ng/ml)

Sensibilidad ~ 61%
Especificidad ~ 90% Zona gris / Zona indeterminada
C aptulo 4 Pgina 287

Pruebas diagnsticas a evitar:


Fosfatasa cida prosttica
Mal equilibrio entre sensibilidad y especificidad
Baja Especificidad
Frecuencia

HPB Cncer Prstata


sanos enfermos

Concentracin FAP

Sensibilidad ~ 60-70%
Zona gris / Zona indeterminada
Especificidad ~ 40-50%
C aptulo 4 Pgina 288

Eleccin del punto de corte


Frecuencia Punto de corte ideal

HPB Cncer Prstata


Sanos Enfermos

0 Especificidad = 100% Xideal Sensibilidad = 100%

Su Negatividad indican Su Positividad indican


siempre la ausencia de la siempre la presencia de la
enfermedad enfermedad
C aptulo 4 Pgina 289

Eleccin del punto de corte

Punto de corte real


Frecuencia

HPB Cncer Prstata


Sanos Enfermos

Concentracin PSA (ng/ml) 4


Sensibilidad ~ 61%
Las pruebas
Las pruebas diagnosticas
diagnsticasno notienen
un soloun
tienen parsolo
sensibilidad/especificidad
par sensibilidad/ Especificidad ~ 90%
(S/E), sino muchos,
especificidad uno por cada
(S/E), sino
muchos, uno por cada
nivel de decisin o punto nivel
dedecorte Zona gris
decisin o punto
que se adopte de corte que Zona indeterminada
se adopte.
C aptulo 4 Pgina 290

Aumento del valor del punto de corte

Aumentar la especificidad
Frecuencia

HPB
sanos enfermos
Cncer Prstata

Concentracin PSA (ng/ml) 4 10

Para cualquier prueba en la que la distribucin de los


Sensibilidad ~ 30% resultados de los grupos sano y enfermo se solapen,
existe un equilibrio entre sensibilidad y especificidad.
Especificidad 99% Ambas varan en direcciones opuestas: si se
AUMENTA el punto de corte disminuye la sensibilidad,
y aumenta la especificidad.
C aptulo 4 Pgina 291

Disminucin del valor del punto de corte

Frecuencia Aumentar la sensibilidad

HPB Cncer Prstata


sanos enfermos

1,0 4.0 Concentracin PSA (ng/ml)

Para cualquier prueba en la que la distribucin de los


Sensibilidad 92% resultados de los grupos sano y enfermo se solapen,
existe un equilibrio entre sensibilidad y especificidad.
Especificidad ~ 35% Ambas varan en direcciones opuestas: si se
DISMINUYE el punto de corte aumenta la
sensibilidad, y disminuye la especificidad.
C aptulo 4 Pgina 292

PSA: ejemplo de error alfa (FP) y error beta (FN)

Error b Error

PUNTO DE CORTE = 4 ng/ml


- Buena sensibilidad a la hora de detectar los CP
- Pero existe un nmero elevado de falsos positivos (HBP) > baja especificidad
C aptulo 4 Pgina 293

Sensibilidad y especificidad diagnstica:


Pruebas en el Cncer de Prstata
Prueba S E Patrn de oro
(tcnica de
referencia)

FAP 56% 94% Biopsia de la


prstata mediante
PSA 61% 90% Ecografa
transrectal
PSA libre/PSA total 69% 95%

Examen rectal 56% 82%

Citologa aspiracin 55% 91%


C aptulo 4 Pgina 294

Construccin de la curva ROC para cada prueba diagnstica


En el eje Y de coordenadas se sita la sensibilidad o fraccin de verdaderos positivos, calculada en los enfermos
1

La curva ROC es un
SENSIBILIDAD DIAGNSTICA

grfico que muestra todos


los pares posibles
sensibilidad/especificidad
resultantes de la variacin
continua de los puntos de
corte en todo el rango de
resultados observados.

La diagonal muestra por tanto


la peor situacin posible.
0
0 1 ESPECIFICIDAD 1
(Falsos positivos)

En el eje X se sita la fraccin de FP o 1 - especificidad, definida como 1 E = FP/VN + FP y calculada en


los no enfermos (sanos).
C aptulo 4 Pgina 295

Diagrama de la curva ROC de la prueba diagnstica A

1
SENSIBILIDAD DIAGNSTICA

A
Las curvas ROC son los mejores ndices
de la efectividad, rentabilidad o exactitud
diagnstica y proporcionan un criterio
unificador en el proceso de evaluacin de
una prueba, y de comparacin simultnea
de varias pruebas diagnsticas.

0
0 1 ESPECIFICIDAD 1
(Falsos positivos)
C aptulo 4 Pgina 296

Diagrama de la curva ROC de la prueba diagnstica B

1
SENSIBILIDAD DIAGNSTICA

La diagonal muestra la peor


situacin posible.
B
El rea bajo la curva ROC es un
ndice de la EXACTITUD o valor
global de la prueba: la exactitud
mxima correspondera a un valor
del rea de 1 y la mnima de 0.5
0
0 1 ESPECIFICIDAD 1
(Falsos positivos)
C aptulo 4 Pgina 297

Diagrama de la curva ROC del PSA

Gann PH, Hennekens CH, Stampfer MJ. A prospective evaluation of plasma prostate.specific antigen for
detection of prostatic cancer. JAMA. 1995; 273: 289-294.
C aptulo 4 Pgina 298

Med Clin (Barc) 2006;127:41-6


C aptulo 4 Pgina 299
C aptulo 4 Pgina 300

Introduccin (fragmento del texto)


Objetivos

El objetivo fundamental de este estudio es valorar la utilidad de la calprotectina fecal


(CPF) para predecir la presencia de una colonoscopia patolgica y, secundariamente,
analizar su uso para discriminar entre diferentes enfermedades orgnicas y correlacionar
sus valores con el grado de actividad clnica, endoscpica e histolgica en pacientes con
enfermedad inflamatoria intestinal (EII).
C aptulo 4 Pgina 301

Pregunta de investigacin
Qu utilidad clnica tienen los niveles de calprotectina fecal de
la actividad de la enfermedad inflamatoria intestinal?

Tcnica analtica a valuar Tcnica de referencia


(patrn de oro)
Calprotectina fecal Colonoscopia: ndice de actividad
de la enfermedad inflamatoria
intestinal
C aptulo 4 Pgina 302

Resultados (fragmento del texto)

La curva ROC mostr que el valor de CPF de 217 mg/kg fue el mejor punto de corte para
discriminar a los pacientes con enfermedad orgnica en colon. A partir de estos datos,
obtuvimos una sensibilidad de la medida de CPF del 85%, una especificidad del 81%, un
valor predictivo positivo del 64% y un valor predictivo negativo del 93%, respectivamente
(p < 0,001).

Valor
Sensibilidad 85%
Especificidad 81%
Valor predictivo positivo 64%
Valor predictivo negativo 93%
C aptulo 4 Pgina 303

Discusin (fragmento del texto)

En el presente estudio, la CPF ha mostrado ser una prueba altamente sensible para
detectar a pacientes con CCR y EII utilizando un punto de corte de 217 g/g.

La eleccin de un punto de corte ptimo debera realizarse a partir de un procedimiento


de referencia estndar, lo que en pacientes con dolor abdominal y diarrea implicar un
estudio gastrointestinal completo. De todas formas, siempre es aconsejable utilizar puntos
de corte ms bajos porque lo que debemos pretender con esta prueba es seleccionar a los
pacientes que requieren un estudio endoscpico posterior.
C aptulo 4 Pgina 304

MITO 1: La sonrisa de la esfinge

Me parece acertada la eleccin de la curva ROC. Sin embargo

Por qu no has incluido el grfico de la curva?

Cul es el rea de la curva ROC y su IC95%?

En la bibliografa existen datos de curvas ROC que dan datos inferiores de rentabilidad
diagnstica, que no coinciden con lo presentados por Garca Snchez et al.

Cmo justificas esas diferencias?


C aptulo 4 Pgina 305

Diagrama de la curva ROC de la calprotectina fecal

S = 85%

S = 70%

E = 65%

E = 85%

Tibblea J et al. Faecal calprotectin and faecal occult blood tests in the diagnosis of colorectal carcinoma and
adenoma. Gut 2001;49:402-408.
C aptulo 4 Pgina 306

Interpretacin de Hanley y McNeil del rea bajo la curva


ROC

- El rea bajo la curva (ABC) ROC es una medida global de la exactitud de una prueba
diagnstica.
- Se define como la probabilidad de clasificar correctamente un par de individuos sano
y enfermo, seleccionados al azar de la poblacin, mediante los resultados obtenidos al
aplicarles la prueba diagnstica.
- Es la probabilidad de que el resultado de la prueba se presente ms elevado en el
paciente enfermo
rea bajo la curva ROC = Probabilidad (X enfermo > X sano)
- En el ejemplo del PSA anterior un rea de 0,83 significa que un individuo seleccionado al
azar del grupo de enfermos tendr el 83% de las veces un valor de PSA cuantitativamente
mayor que el PSA de un individuo elegido al azar del grupo no enfermo (sanos).

Hanley JA, McNeil BJ. The meaning and use of the area under a Receiver Operating Characteristic (ROC)
Curve. Radiology 1982; 143: 29-36.
C aptulo 4 Pgina 307

Interpretacin de Swets del rea bajo la curva ROC


- El rea bajo la curva ROC es siempre mayor o igual que 0,5. Toma valores comprendidos
entre 0,5, si no existen diferencias en la distribucin de resultados de la prueba entre
los grupos enfermo y sano, y 1,0, cuando existe separacin perfecta entre las dos
distribuciones.
- Swets interpreta el valor del rea de la siguiente manera:
- Entre 0,5 y 0,7 indican baja exactitud
- Entre 0,7 y 0,9 pueden ser tiles para algunos propsitos
- Valores mayor de 0,9 indica alta exactitud.
- La capacidad de discriminacin de la prueba diagnstica puede evaluarse estimando el
intervalo de confianza del rea de la curva ROC. Si el intervalo no incluye el valor 0,5 la
prueba es capaz de discernir entre enfermos y sanos.
- En el ejemplo del PSA anterior el rea de 0,83 debe ser interpretado que la prueba puede
ser til en algunas situaciones clnicas, pero no es til por ejemplo, para realizar programas
de screening de la poblacin en bsqueda del cncer de prstata en la poblacin general.

Swets JA. Measuring the accuracy of diagnostic systems. Science 1988; 240: 1.285-1.293.
C aptulo 4 Pgina 308

Comparacin del rea bajo la curva:


Prueba A versus prueba B

1
SENSIBILIDAD DIAGNSTICA

A El rea de la curva ROC es la probabilidad


B de clasificar correctamente un par de
individuos sano y enfermo, seleccionados al
azar de la poblacin en estudio, mediante los
resultados obtenidos al aplicarles la prueba
diagnstica.

El rea bajo la curva ROC es el mejor indicador de la


capacidad predictiva del la prueba, y permite la
comparacin entre diferentes pruebas diagnsticas.
0
0 1 ESPECIFICIDAD 1
(Falsos positivos)
C aptulo 4 Pgina 309

Comparacin del rea bajo la curva:


Prueba A versus prueba B

1
A = REA de la curva A
SENSIBILIDAD DIAGNSTICA

A B = REA de la curva B
B
Qu prueba diagnstica (A versus
B) presenta una mayor rentabilidad,
efectividad, exactitud o valor global?

Estadstico Z de Hanley y McNeil (1983)


0
0 1 ESPECIFICIDAD 1
(fraccin de Falsos positivos)
C aptulo 4 Pgina 310

Comparacin del rea de las curvas ROC en muestras


independientes
( A 1 A 2)
Z=
( EEA 1 )2 + (EEA 2 )2
A1 = rea bajo la curva ROC de la tcnica 1

A 2 = rea bajo la curva ROC de la tcnica 2

EEA 1 = error estndar del rea bajo la curva ROC de la tcnica 1

EEA 2 = error estndar del rea bajo la curva ROC de la tcnica 2

Si el estudio se realiza en grupos INDEPENDIENTES, la comparacin de reas mediante mtodos


estadsticos es directa. Si se utilizan datos APAREADOS o dependientes es necesario calcular previamente
la correlacin r entre las pruebas coeficiente de correlacin entre ambas tcnicas para muestras
independientes vale cero (r = 0).
C aptulo 4 Pgina 311

Comparacin del rea de las curvas ROC en muestras


apareadas
( A 1 A 2)
Z=
( EEA 1 )2 + (EEA 2 )2 - 2 r * EEA 1 * EEA 2

A1 = rea bajo la curva ROC de la tcnica 1

A 2 = rea bajo la curva ROC de la tcnica 2

EEA 1 = error estndar del rea bajo la curva ROC de la tcnica 1

EEA 2 = error estndar del rea bajo la curva ROC de la tcnica 2

r = coeficiente de correlacin entre las reas de ambas tcnicas para


muestras dependientes
C aptulo 4 Pgina 312

Comparacin del rea bajo la curva: prueba A


versus prueba B

0,9 B
0,8
Dos curvas ROC (A y B) con
SENSIBILIDAD DIAGNSTICA

0,7 A igual rea. Sin embargo,


estas dos curvas ROC no
0,6 son idnticas. La prueba B
es superior a la prueba
0,5 A en el rango alto de falsos
0,4 positivos (o intervalo de
alta sensibilidad), mientras
0,3 que en la zona baja de
falsos negativos (intervalo
0,2 Qu prueba diagnstica (A versus B) de baja sensibilidad) la
presenta una mayor rentabilidad, prueba A es superior a la B
0,1 efectividad, exactitud o valor global?

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1


1 ESPECIFICIDAD
(fraccin de Falsos positivos)
C aptulo 4 Pgina 313

Pregunta de investigacin
Qu utilidad clnica tienen los niveles de urea en sangre
en el diagnstico de la insuficiencia renal?
Objetivo: Evaluacin de la uremia en el diagnstico de la insuficiencia
renal.

Tcnica analtica a valuar Tcnica de referencia


(patrn de oro)
Uremia (mg/dl) Insuficiencia renal

Cul es el test estadstico ms acertado?


C aptulo 4 Pgina 314

Tipos de error en las pruebas diagnsticas

Tipos de error en las pruebas diagnsticas Enfermedad en estudio

Valor del punto de corte 90 mg/dl Insuficiencia renal No enfermos

Test de laboratorio Positivo VERDADEROS FALSO POSITIVO


uremia (+) POSITIVOS FP
Uremia > 90 mg/dl VP

Negativo FALSO NEGATIVO VERDADEROS


(-) FN NEGATIVOS
Uremia 90 mg/dl VN
C aptulo 4 Pgina 315

VN FP

Individuos SIN
Insuficiencia renal

Uremia mg/dl 0 300 mg/dl


Pacientes
Insuficiencia renal
FN VP

Punto de corte
optimo 90 mg/dl
C aptulo 4 Pgina 316

Individuos SIN
Insuficiencia renal

Pacientes con
Insuficiencia renal
Frecuencia

0 50 100 150 200 250 300 mg/dl


Uremia mg/dl
Punto de corte optimo 90 mg/dl
C aptulo 4 Pgina 317

1,00

Curva ROC
de la uremia
0,75
(fraccin de verdaderos positivos)
SENSIBILIDAD DIAGNSTICA

0,50

Las curvas ROC


son ndices
Las curvas ROC deson
la ndices
0,25 exactitud diagnstica
de la exactitud diagnosticayy
proporcionan el mejor
proporcionan criterio
el mejor
unificadorunificador
criterio en el proceso
en el de
evaluacin de
proceso de una prueba. de
evaluacin
una prueba.
0,00
0,00 0,25 0,50 0,75 1,00
1 ESPECIFICIDAD
(fraccin de Falsos positivos)
C aptulo 4 Pgina 318

Pregunta de investigacin
Qu tcnica analtica presenta una mayor exactitud, valor global,
rentabilidad, o efectividad clnica la urea o la creatinina srica en
el diagnstico de la insuficiencia renal?

Objetivo: Evaluacin de la urea frente a la creatinina en el diagnstico de


la insuficiencia renal.

Urea (srica) Creatinina (srica)

Cul es el test estadstico ms acertado?

Comparacin del rea bajo la curva ROC


C aptulo 4 Pgina 319

1,00

Curva ROC
de la creatinemia
0,75 Curva ROC
(fraccin de Verdaderos Positivos)
SENSIBILIDAD DIAGNSTICA

de la uremia

0,50

Cuanto ms prxima se sita una curva


ROC a la esquina superior izquierda,
0,25 ms alta es la exactitud diagnstica de la
prueba. Si comparamos en el mismo
grfico las curvas obtenidas con la urea y
la creatinina, sta ltima por estar
situada ms hacia arriba y hacia la
izquierda tendr la mayor exactitud.
0,00
0,00 0,25 0,50 0,75 1,00
1 ESPECIFICIDAD
(fraccin de Falsos Positivos)
C aptulo 4 Pgina 320

Pregunta de investigacin
Qu prueba diagnstica (uremia versus creatinemia) presenta
una mayor rentabilidad, exactitud o valor global en el diagnstico
de la insuficiencia renal?

Variables rea bajo la curva Error estndar del Lmite inferior Lmite superior
contrastadas ROC rea del intervalo de del intervalo de
confianza al 95% confianza al 95%

Uremia 0,930 0,012 0,906 0,955

Creatinemia 0,984 0,005 0,974 0,994

Cul es el test estadstico ms acertado?


C aptulo 4 Pgina 321

Comparacin del rea de las curvas ROC en muestras


dependientes
( A 1 A 2)
Z=
( EEA 1 )2 + (EEA 2 )2 - 2 r * EEA 1 * EEA 2

A1 = rea bajo la curva ROC de la tcnica 1

A 2 = rea bajo la curva ROC de la tcnica 2

EEA 1 = error estndar del rea bajo la curva ROC de la tcnica 1

EEA 2 = error estndar del rea bajo la curva ROC de la tcnica 2

r = coeficiente de correlacin entre las reas de ambas tcnicas para


muestras dependientes
C aptulo 4 Pgina 322

( A 1 A 2)
Z=
( EEA 1 )2 + (EEA 2 )2 - 2 r * EEA 1 * EEA 2

A 1 (creatinina) = 0,984 EEA1 (creatinina) = 0,005.

A 2 (urea) = 0,930 EEA2 (urea) = 0,012.

Hiptesis nula Ho: A1 A 2 = 0 .

Hiptesis alternativa Ha: A1 A 2 0 .

Resultado: El estadstico para la comparacin de ambas curvas Z de Hanley y


McNeil vale 4,15 que como es mayor que Z95% = 1,96 .

Conclusin: Ambas pruebas tienen un rendimiento significativamente distinto.


C aptulo 4 Pgina 323

Pregunta de investigacin
Qu utilidad clnica tienen los niveles de VCM en el diagnsti-
co de la anemia ferropnica?
Objetivo: Evaluacin del VCM en el diagnstico de la anemia ferropnica.

Tcnica analtica a valuar Tcnica de referencia


(patrn de oro)
VCM Depsitos de Fe en mdula sea
(hemograma)

Cul es el test estadstico ms acertado?


C aptulo 4 Pgina 324

Tipos de error en las pruebas diagnsticas

Tipos de error en las pruebas diagnsticas Examen de los depsitos de hierro en mdula sea
Dficit de Fe Presencia de Fe

Test de laboratorio Positivo VERDADEROS FALSO POSITIVO


VCM (+) POSITIVOS FP
(hemograma) VCM VP
BAJO
(microcitosis)

Negativo FALSO NEGATIVO VERDADEROS


(-) FN NEGATIVOS
VCM VN
NORMAL
C aptulo 4 Pgina 325

VCM en 100 pacientes con diagnstico de


anemia ferropnica

Tcnica de referencia: Examen de los Volumen corpuscular medio (VCM)


depsitos de hierro en mdula sea

Ausencia de Hierro (n= 33) 52, 58, 62, 65, 67, 68, 70, 72, 72, 73, 73, 74,75,
77, 77, 77, 78, 78, 80, 80, 81, 81, 81, 81, 84, 84,
85, 85, 87, 88, 88, 92, 92

Presencia de hierro (n=67) 60, 66, 68, 69, 71, 71, 71, 73, 74, 74, 74, 76,76,
77, 77, 77, 78, 79, 79, 79, 80, 80, 81, 81,82, 82,
82, 83, 83, 83, 83, 83, 83, 83, 83, 84,84, 84, 85,
85, 86, 86, 86, 86, 88, 88, 88, 89,89, 89, 90, 90,
90, 91, 91, 93, 93, 93, 94, 94,94, 94, 96, 97, 98,
100, 103

Beck JR, Shultz EK. The use of relative operating characteristic (ROC) curves in test performance
evaluation. Arch Pathol Lab Med 1986; 110:13-20.
C aptulo 4 Pgina 326

110

100
Tcnica analtica a evaluar
90
FN VN
VCM 80
(hemograma)
70
FP VP
60

50

Hierro normal Hierro BAJO


VCM < 80
Sensibilidad = 55,9% Examen de los depsitos de hierro en mdula sea
Especificidad = 71,2%
Tcnica de referencia (patrn de oro)
C aptulo 4 Pgina 327

110

100
Tcnica analtica a evaluar
90
FN VN
VCM 80
(hemograma)
70

60 FP VP
50

Hierro normal Hierro BAJO


VCM < 65
Sensibilidad = 8,8%
Especificidad = 98,5% Examen de los depsitos de hierro en mdula sea

Tcnica de referencia (patrn de oro)


C aptulo 4 Pgina 328

110

100
Tcnica analtica a evaluar FN VN
90

VCM 80
(hemograma) FP VP
70

60

50

Hierro normal Hierro BAJO


VCM < 90
Sensibilidad = 94,1% Examen de los depsitos de hierro en mdula sea
Especificidad = 25,8%
Tcnica de referencia (patrn de oro)
C aptulo 4 Pgina 329

La pruebas diagnsticas
Lano tienen
pruebas un solonopar
diagnosticas tienen
100 unsensibilidad/especificidad
solo par sensibilidad/especificidad
(S/E), sino sino
(S/E), muchos, uno por cada
muchos, uno
nivel
pordecada
decisin o punto
nivel dededecisin
corte
80 que
o se adopte.
punto de corte que se
(fraccin de Verdaderos Positivos)
SENSIBILIDAD DIAGNSTICA

VCM < 81 adopte.


60 Punto de corte ideal para el
VCM es de < 81, valor lmite que
permite resumir los resultados de
40 una escala continua en dos
categoras: positivo y negativo
Cul ser el par que describa con una mayor exactitud o
20 rentabilidad diagnstica.
la exactitud de la prueba?

0
VCM < 81
Sensibilidad = 61%
0 20 40 60 80 100
Fraccin de FP = 30%
1 ESPECIFICIDAD
(fraccin de Falsos Positivos) Especificidad = 70%

El clculo del rea bajo la curva es de 0,717 con un EE de 0,05, es decir, el VCM es una prueba diagnstica
de baja rentabilidad, y por tanto no se aconseja, como prueba nica, en el diagnstico de la anemia
ferropnica.
C aptulo 4 Pgina 330
C aptulo 4 Pgina 331
C aptulo 4 Pgina 332
C aptulo 4 Pgina 333
C aptulo 4 Pgina 334

Pregunta de investigacin
Qu tcnica analtica presenta una mayor rentabilidad, el VCM
o la ferritina en el diagnstico de la anemia ferropnica?
Objetivo: Evaluacin del VCM frente a la ferritina en el diagnstico de la
anemia ferropnica.

VCM Ferritina (srica)


(hemograma)

Cul es el test estadstico ms acertado?

Comparacin del rea bajo la curva ROC


C aptulo 4 Pgina 335

Punto Corte VCM Sensibilidad Especificidad 100 especificidad


(%) (%) (%)

65 8,8 98,5 1,5


70 20,6 93,9 6,1
75 38,2 84,8 15,2
80 55,9 71,2 28,8
85 79,4 43,9 56,1
90 94,1 25,8 74,2
92 97,1 19,7 80,3

Construccin de la curva ROC: Es un grfico que muestra todos los pares sensibilidad/especificidad
resultantes de la variacin continua de los puntos de corte en todo el rango de resultados observados.
C aptulo 4 Pgina 336

Comparacin del rea bajo la curva: ferritina srica versus


VCM
100
Ferritina
SENSIBILIDAD DIAGNSTICA

VCM
Para comparar el VCM con los niveles
sricos de ferritina, se construye para
ella otra curva y se calculara su rea.
Se comparan las reas mediante el
estadstico Z de Hanley y McNeil (1983).
0
0 1 ESPECIFICIDAD 100
(Falsos positivos)

Hanley JA, McNeil BJ. A method of comparing the areas under receiver operating characteristic curves
derived from the same cases. Radiology 1983; 148: 839-843.
C aptulo 4 Pgina 337

Comparacin del rea de las curvas ROC en muestras


dependientes
( A 1 A 2)
Z=
( EEA 1 )2 + (EEA 2 )2 - 2 r * EEA 1 * EEA 2
A1 = rea bajo la curva ROC de la tcnica 1

A 2 = rea bajo la curva ROC de la tcnica 2

EEA 1 = error estndar del rea bajo la curva ROC de la tcnica 1

EEA 2 = error estndar del rea bajo la curva ROC de la tcnica 2

r = coeficiente de correlacin entre las reas de ambas tcnicas para


muestras dependientes

Hanley JA, McNeil BJ. A method of comparing the areas under receiver operating characteristic curves
derived from the same cases. Radiology 1983; 148: 839-843.
C aptulo 4 Pgina 338

( A 1 A 2)
Z=
( EEA 1 )2 + (EEA 2 )2 - 2 r * EEA 1 * EEA 2

A 1 (creatinina) = 0,984 EEA1 (creatinina) = 0,005.

A 2 (urea) = 0,930 EEA2 (urea) = 0,012.

Hiptesis nula Ho: A1 A 2 = 0 .

Hiptesis alternativa Ha: A1 A 2 0 .

Resultado: El estadstico para la comparacin de ambas curvas Z de Hanley y


McNeil vale 4,15 que como es mayor que Z95% = 1,96 .

Conclusin: Ambas pruebas tienen un rendimiento significativamente distinto.


C aptulo 4 Pgina 339

Comparacin del rea bajo la curva: ferritina srica


versus VCM
C aptulo 4 Pgina 340

Eleccin del punto de corte:


Criterio basado en el equilibrio de riesgos y beneficios de
las decisiones mdicas
Es un enfoque prctico que se basa en el cociente entre los costes de un
resultado falso positivo (FP) frente a un falso negativo (FN), en funcin de
la prevalencia (P) de la enfermedad. El valor de corte ptimo se determina
hallando el punto de la curva ROC cuya tangente a la curva tiene de
pendiente el valor de m.

Coste de FP 1-P
m = *
Coste de FN P

Zweig MH, Campbell G. Receiver-operating characteristic (ROC) plots: a fundamental evaluation tool in
clinical medicine. Clin Chem 1993; 39: 561-577.

McNeil BJ, Keeler E, Adelstein SJ. Primer on certain elements of medical decision making. N Engl J Med
1975; 293: 211-215.
C aptulo 4 Pgina 341

Eleccin del punto de corte:


Postulados de Galen y Gambino

1. Criterio de mxima SENSIBILIDAD DIAGNSTICA

Se elige la mayor sensibilidad posible cuando:


1. La enfermedad sea grave y no pueda pasar inadvertida.
2. La enfermedad sea tratable, y
3. Los resultados falsos positivos no supongan un traumatismo
psicolgico o econmico en los individuos examinados.

Podras poner algn ejemplo?

Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of medical diagnoses. Nueva
York: J Wiley and Sons, lnc., 1975.
C aptulo 4 Pgina 342

Cribado poblacional de cncer de mama (CaM)


Programa preventivo destinado a la deteccin precoz de CaM mediante la
realizacin de mamografa bilateral con periodicidad bienal en mujeres de 45
a 70 aos. La realizacin del screening permite la deteccin precoz de CaM
en un estadio menos avanzado que el que correspondera a un diagnstico
clnico, lo que supone una considerable mejora en cuanto a la afectacin,
pronstico de la enfermedad y reduccin de aos de vida perdidos.

Variable PREDICTORA Variable RESULTADO


Cualitativa dicotmica Cualitativa dicotmica
Mamografa bilateral Cncer de mama
C aptulo 4 Pgina 343

Cumple los postulados de Galen y Gambino?


En Espaa se ha descrito que la tasa acumulada de falsos positivos en un
programa de cribado de mama es del 30% tras 10 determinaciones bianuales
(1). De hecho, diversos estudios han demostrado que, por cada muerte
prevenida a travs de un programa de cribado, han aparecido al menos 200
resultados falsos positivos (2). En respuesta a este hecho, la OMS ha incidido
en nuevos criterios para los programas de cribado, centrndose en aspectos
ticos, en las consecuencias psicolgicas de resultados falsos positivos y en
la necesidad del consentimiento informado (3).

1. Castells X, Molins E, Macia F. Cumulative false positive recall rate and association with participant
related factors in a population based breast cancer screening programme. J Epidemiol Community Health.
2006;60:316-21.
2. Raffle AE, Alden B, Quinn M, Babb PJ, Brett MT. Outcomes of screening to prevent cancer: analysis
of cumulative incidence of cervical abnormality and modelling of cases and deaths prevented. BMJ.
2003;326:901.
3. Brodersen J, McKenna SP, Doward LC, Thorsen H. Measuring the psychosocial consequences of
screening. Health Qual Life Outcomes. 2007;5:3.
C aptulo 4 Pgina 344

Cribado poblacional del cncer de pulmn (CP)


mediante TC

Variable PREDICTORA Variable RESULTADO


Cualitativa dicotmica Cualitativa dicotmica
Tomografa computarizada (TC) Cncer de pulmn

Cumple los postulados de Galen y Gambino?


C aptulo 4 Pgina 345

Un estudio publicado por Bach et al (2007) acerca del cribado de cncer de


pulmn sealaba que el uso de la tomografa computarizada (TC) puede
aumentar la tasa de diagnstico y tratamiento de dicho cncer sin reducir el
riesgo de avance de la enfermedad o la mortalidad. Por lo tanto, concluan la
inutilidad del cribado en la prevencin del cncer de pulmn.

Bach PB, Jett JR, Pastorino U, Tockman MS, Swensen SJ, Begg CB. Computed tomography screening and
lung cancer outcgomes. JAMA. 2007;297:953-61.
C aptulo 4 Pgina 346

Cribado poblacional de cncer de colon


Programa preventivo destinado a la deteccin precoz de colon

Variable PREDICTORA Variable RESULTADO


Cualitativa dicotmica Cualitativa dicotmica
Deteccin de SANGRE OCULTA en Cncer de colon
heces (guayacol)

Sensibilidad = 40-80%
Especificidad = 90-99%

La sensibilidad de la prueba es tan slo de 5060% cuando se lo utiliza una


vez, pero puede ascender a 90% cuando se la utiliza cada 12 aos en un
perodo de tiempo prolongado (sensibilidad programtica).
C aptulo 4 Pgina 347

Cribado poblacional de cncer de colon


Programa preventivo destinado a la deteccin precoz de colon
El cncer de colon es el tipo de cncer con mayor posibilidad de deteccin
precoz y que responde mejor al tratamiento en estadios iniciales, por ello se
propone una prueba gentica a la poblacin diana: hombres y mujeres a partir
de los 50 aos..

Variable PREDICTORA Variable RESULTADO


Cualitativa dicotmica Cualitativa dicotmica
Deteccin de la forma metilada del Cncer de colon
gen Septina 9 (SEPT9).

Sensibilidad = 67%
Especificidad = 88%
C aptulo 4 Pgina 348

Cumple los postulados de Galen y Gambino?


Los resultados FALSOS POSITIVOS causan ansiedad y pueden conducir
a un aumento de pruebas invasivas para determinar si hay enfermedad
realmente, en este caso una prueba positiva a la deteccin de sangre oculta
en heces ser seguida por una colonoscopia.
C aptulo 4 Pgina 349

Falsos positivos versus Falsos negativos

1. Gravedad o importancia en salud pblica. Si la enfermedad puede ser tratada y


detectada evitando complicaciones posteriores han de utilizarse pruebas con alta
SENSIBILIDAD, es decir con baja tasa de FALSOS NEGATIVOS.
2. Si el coste del proceso asistencial (posibles pruebas invasivas complementarias,
exmenes y cuidados mdicos y de enfermera requeridos ) del enfermo es alto se deben
elegir pruebas con alta ESPECIFICIDAD, para reducir los falsos positivos.
3. Si la enfermedad diagnosticada conlleva consecuencias psicosociales graves, como
la infeccin por VIH, han de minimizarse los falsos positivos, eligiendo pruebas de alta
ESPECIFICIDAD.
4. Baja prevalencia de la enfermedad. En los programas de screening se eligen pruebas
de alta ESPECIFICIDAD, para reducir la tasa de falsos positivos y as garantizar la
eficiencia del programa.
C aptulo 4 Pgina 350

Las carencias metodolgicas en la investigacin evaluativa de pruebas diagnsticas


explican en parte la inadecuacin del uso de pruebas diagnsticas. Por otra parte, no se
ha considerado la potencial iatrogenia atribuible al uso de pruebas diagnsticas, y se hace
necesaria una monitorizacin de los posibles efectos adversos derivados de cualquier
tecnologa diagnstica, as como la informacin detallada a los pacientes de sus beneficios
y riesgos, tanto en el campo del cribado como en el del diagnstico clnico.
C aptulo 4 Pgina 351

Eleccin del punto de corte:


Postulados de Galen y Gambino

2. Criterio de mxima ESPECIFICIDAD DIAGNSTICA

Se elige la mayor especificidad posible cuando:


1. La enfermedad sea importante pero difcil de curar o incurable, y
2. El hecho de conocer que no se padezca la enfermedad tiene una
importante carga sanitaria y psicolgica.

Podras poner algn ejemplo?

Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of medical diagnoses. Nueva
York: J Wiley and Sons, lnc., 1975.
C aptulo 4 Pgina 352

Eleccin del punto de corte:


Postulados de Galen y Gambino

3.- Criterio de alto VALOR PREDICTIVO POSITIVO

Se elige un alto VPP cuando:


El tratamiento de los falsos positivos (FP) pueda tener consecuencias
graves en personas que NO tienen la enfermedad.

VP
VPP =
VP + FP

Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of medical diagnoses. Nueva
York: J Wiley and Sons, lnc., 1975.
C aptulo 4 Pgina 353

Eleccin del punto de corte:


Postulados de Galen y Gambino

4. Criterio de mxima EXACTITUD DIAGNSTICA

Se desea una elevada exactitud (efectividad, valor global o rentabilidad


diagnstica) cuando:
1. La enfermedad sea importante pero curable, y
2. Tanto los falsos positivos (FP) como los falsos negativos (FN)
supongan un traumatismo y conlleven consecuencias graves.

Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of medical diagnoses. Nueva
York: J Wiley and Sons, lnc., 1975.
C aptulo 4 Pgina 354

Ventajas de las curvas ROC en la evaluacin de pruebas


diagnsticas
1. Son una representacin grfica fcilmente comprensible de la capacidad de
discriminacin de la prueba diagnstica en todo el rango de puntos de corte.
2. Son simples, grficas y fciles de interpretar visualmente.
3. No requieren un nivel de decisin particular porque est incluido todo el espectro de
puntos de corte.
4. Son independientes de la prevalencia, ya que ni la sensibilidad ni la especificidad
dependen de ella.
5. Proporcionan una comparacin visual directa entre distintas pruebas en una escala
comn, mientras que otro tipo de grficos, como los diagramas de puntos o los
histogramas de frecuencias requieren diferentes grficos cuando difieren las escalas.
6. La especificidad y la sensibilidad son fcilmente accesibles en el grfico, en contraste
con los diagramas de puntos y los histogramas.

Zweig MH, Campbell G. Receiver-Operating Characteristic (ROC) Plots: fundamental evaluation tool in
clinical medicine. Clin Chem 1993; 39: 561-577.

Burgueo MJ, J.L. Garca-Bastos JL, Gonzlez-Buitrago JM. Las curvas ROC en la evaluacin
de las pruebas diagnsticas. Med Clin (Barc) 1995: 104: 661-670.
C aptulo 5 Pgina 355

Captulo 5

Publicacin Bioestadstica: Anlisis bivariante.


Test de contraste de hiptesis.
Cualitativa versus cualitativa.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 5 Pgina 356

Materiales y mtodos
Estructura

1. Tipo de diseo (estudio)


2. Sujetos incluidos (criterios de seleccin de la muestra)
3. Fuentes de informacin
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales)
5. Instrumentos y procedimientos de medida (cuestionarios)
6. Definicin de las variables y covariables incluidas en el estudio (factor de
estudio y criterio de evaluacin)
7. Limitaciones y consideraciones ticas de la investigacin
8. Pruebas estadsticas a utilizar (programa estadstico)
C aptulo 5 Pgina 357

Fases del anlisis estadstico

1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE
C aptulo 5 Pgina 358

Decisiones que se pueden tomar en un test de contraste


de hiptesis despus de conocer el valor de significacin
estadstica p
p < 0,05 AB p 0,10 A=B
Se rechaza la hiptesis nula No se puede rechazar la hiptesis nula
No parece que el azar pueda No se puede descartar que el azar lo
explicarlo todo explique todo
El EFECTO observado es mayor que El EFECTO observado es similar que el
el ERROR ERROR
Hay diferencias estadsticamente NO hay diferencias estadsticamente
significativas significativas
Existen evidencias a favor de la NO existen evidencias a favor de la
hiptesis alternativa Ha, y por tanto hiptesis alternativa Ha, y por tanto
rechazamos la hiptesis nula Ho aceptamos la hiptesis nula Ho

Los lmites de 0,05 y 0,1 pueden ser considerados en cierto modo


arbitrarios y aproximados
C aptulo 5 Pgina 359

Anlisis estadstico
Tipos de test analticos estadsticos de contraste de hiptesis
segn el tipo de variables implicadas en el estudio

Variable dependiente
Variable resultado

Dicotmica Continua
Variable Dicotmica Test de 2 t de Student
Predictora
Variable Continua Regresin lo- Regresin lineal
Independiente gstica
C aptulo 5 Pgina 360

Anlisis estadstico

Variable resultado
ANLISIS ESTADSTICO Dicotmica Continua
Variable Dicotmica Test de 2 t de Student
Predictora
Variable Continua Regresin lo- Regresin lineal
Independiente gstica

Test de 2
C aptulo 5 Pgina 361

Tipos de test analticos estadsticos bivariantes de contraste


de hiptesis ms frecuentes
Variable Variable RESULTADO o Dependiente (Criterio de evaluacin)
PREDICTORA o Cualitativa nominal Cualitativa nominal Cualitativa ordinal o Cuantitativa
Independiente (factor dos >2 Cuantitativa NO paramtrica
de estudio) categoras categoras paramtrica
Cualitativa dos grupos Chi cuadrado Chi cuadrado U de Mann-Whitney T de Student
independientes Z comparacin de (prueba de Welch)
proporciones
Test exacto de
Fisher
Cualitativa dos grupos Test de McNemar Q de Cochran Prueba de los T de Student
apareados rangos para datos
de Wilcoxon emparejados
Cualitativa > 2 grupos Chi cuadrado Chi cuadrado Prueba de Kruskal- Anlisis de la Varianza
independientes Wallis (ANOVA)
Cualitativa > 2 grupos Q de Cochran Q de Cochran Prueba de Friedman Anlisis de la Varianza
apareados de dos vas
Cuantitativa Regresin logstica Regresin logstica Correlacin de Regresin lineal
Sperman Correlacin de Pearson
Tau de Kendall
C aptulo 5 Pgina 362

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable Variable Pruebas de contraste de Observaciones y/o limitaciones del test
Independiente o Dependiente o hiptesis
PREDICTORA RESULTADO
Cualitativa Cualitativa Ji cuadrado Si el tamao muestral es grande
Prueba exacta de Fisher Si el tamao muestral es pequeo
Test de McNemar Dos grupos de muestras repetidas o apareadas
Q de Cochran Ms de dos grupos de muestras repetidas o apareadas
REGRESIN LOGSTICA Varias variables predictoras cualitativas
Cualitativa Cuantitativa t de Student Compara medias entre dos grupos independientes
Anlisis de la Varianza Compara medias entre ms de dos grupos independientes
Test de Mann-Whitney Dos grupos independientes No paramtricos
Test de Wilcoxon Dos grupos medidas repetidas No paramtrico
Test de Kruskall-Wallis Ms de dos grupos No paramtrico, medidas repetidas
Test de Friedman Ms de dos grupos No paramtrico medidas repetidas
Cuantitativa Cualitativa Regresin logstica simple Una sola variable predictora cuantitativa
Regresin logstica multivariante Varias variable predictoras cuantitativa o cualitativas
Cuantitativa Cuantitativa Regresin lineal simple Paramtrico
Correlacin de Pearson Paramtrico
Correlacin de Sperman No paramtrico
REGRESIN MLTIPLE Varias variables predictoras cuantitativas
Cualitativa Superviviencia Kaplan-Meier Curvas de superviviencia
Long-Rank Compara curvas de superviviencia
Regresin de COX Anlisis Multivariante
C aptulo 5 Pgina 363

Datos categricos:
Cualitativa versus cualitativa. Nominales
- Test de 2 de Pearson
- Relacin entre dos variables cualitativas nominales o policotmicas
- Comparacin de proporciones
- Correccin de Yates
- Test exacto de Fisher
- Valores esperados menores de 5
- Razn de verosimilitud
- Evaluacin de pruebas diagnsticas
- Test de 2 de McNemar
- Datos apareados o emparejados
- Coeficiente PHI ()
- V de Cramer
- Coeficiente de contingencia
- Coeficiente de incertidumbre
- Tau de Goodman y Kruskal
- Lambda de Goodman y Kruskal (coeficiente de predictibilidad de Guttman)
C aptulo 5 Pgina 364

Datos categricos:
Cualitativa versus cualitativa. Ordinales

- Test de 2 de tendencia lineal


- Tau-B de Kendall o Stuart
- Tau-C de Kendall
- Coeficiente Gamma de Goodman y Kruskal
- D de Somers
- Correlacin de Spearman

Estos estadsticos NO se pueden


utilizar cuando alguna de las variables
sea NOMINAL
C aptulo 5 Pgina 365

Test de 2 de Pearson

Variable RESULTADO

Variable PREDICTORA (+) (-) Total

Si a b a+b

No c d c+d

Total a+c b+d n

2 n ( a d b c )2
=
(a + b) (c + d) (a + c) (b + d) 2

2 = (f f )
o- e
Grados de libertad = [ K - 1] [F - 1]
fo
C aptulo 5 Pgina 366

Test de 2 de Pearson

Grados de libertad = [K - 1] [F - 1]

Tabla de valores crticos (tabulados) de 2


Grados de libertad Tabla 2 x F Valores crticos con un nivel de
confianza del 95%
1 2 3,84
2 3 5,99
3 4 7,81
4 5 9,49
5 6 11,07
6 7 12,59
100 99 124,34

K = n de columnas
F = n de filas
C aptulo 5 Pgina 367

Influencia de los Grados de libertad k en la distribucin de


probabilidades de 2 de Pearson

Frecuencia relativa esperada Grados de libertad (gl) = (K - 1) (F 1)

2
2 de Pearson para gl=1 2 de Pearson para gl=3
2 de Pearson para gl=2 2 de Pearson para gl=6
C aptulo 5 Pgina 368

( f o - fe )
2

2 =
Frecuencia relativa esperada fo

fo = frecuencia observada

fe = frecuencia esperada

Error alfa
Ho Ha
2
2Pearson tabulado= 3,84
C aptulo 5 Pgina 369

Influencia de los Grados de libertad k en la distribucin de


probabilidades de 2 de Pearson

K = n de columnas
Grados de libertad (gl) = (K - 1) (F 1) F = n de filas

gl = 3
gl = 5 gl = 10
Grados de libertad

7,81 11,07

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
C aptulo 5 Pgina 370

Test de 2 de Pearson
Condiciones necesarias y suficientes de aplicacin

1. Ambas variables deben ser cualitativas en escala NOMINAL.


2. Nmero de sujetos estudiados igual o superior a 40 (n>40)
3. Ninguno de los valores esperados en cada casilla debe ser menor de 5
4. No se debe aplicar cuando la variable dependiente o resultado es
ORDINAL
5. Es un test no dirigido (test de planteamiento bilateral), que nos indica si
existe o no relacin entre dos variables cualitativas pero no en qu sentido
se produce tal, ni cuantifica la intensidad de dicha asociacin.

La prueba permite comprobar si dos variables cualitativas estn o no asociadas. Si al final del
estudio concluimos que las variables no estn relacionadas podremos decir que ambas variables son
independientes, con un determinado nivel de confianza, generalmente del 95%.
C aptulo 5 Pgina 371

Pregunta de investigacin
Qu tcnica quirrgica es preferible en pacientes que deben ser
intervenidos de colecistectoma va laparoscpica?

Variable PREDICTORA Variable RESULTADO


Cualitativa dicotmica Cualitativa dicotmica
- KTP/532 lser Desarrollo de complicaciones graves
- Electrociruga monopolar postquirrgicas

Cul es el test estadstico ms adecuado?

Lane GE, Lathrop JC. Comparison of results of KTP/532 laser versus monopolar electrosurgical dissection
in laparoscopic cholecystectomy.
J Laparoendosc Surg 1993; 3: 209-214.
C aptulo 5 Pgina 372

Existe diferencia significativa respecto del porcentaje de


complicaciones graves entre ambas tcnicas de diseccin?
Ho (hiptesis nula) = No hay diferencia entre ambas tcnicas de diseccin.

Ha (hiptesis alternativa) = S existe diferencia entre ambas tcnicas de


diseccin.

KTP/532 lser Electrociruga monopolar

Lane GE, Lathrop JC. Comparison of results of KTP/532 laser versus monopolar electrosurgical dissection
in laparoscopic cholecystectomy.
J Laparoendosc Surg 1993; 3: 209-214.
C aptulo 5 Pgina 373

Test de 2 de Pearson

Variable resultado
Complicaciones postquirrgicas graves
Variable predictora SI (+) NO (-) Total
Tipo de ciruga
KTP/532 lser 16 (8%) P1 183 199

Electrociruga 11 (2,6%) P2 411 422


monopolar

2Pearson = 9,60 p = 0,0019 Existe asociacin


C aptulo 5 Pgina 374

Si [P1 - P2] es mayor que el producto de 1,96 (Z95% error = 0,05) multiplicado por el error estndar, concluimos que
la diferencia es significativa. Por lo tanto, hemos de calcular el error estndar para luego compararlo con la diferencia
observada en los grupos en estudio.
[P1 - P2] = [0,080 - 0,026] = 0,054 [ P1 - P2 ] Z95% X EE
P= [P1 - P2] / 2 = [0,080 + 0,026] / 2 = 0,053
El error estndar se calcula de la siguiente forma:
EE = p (1 p ) ( 1 / n1 + 1 / n2 )
Error estndar (EE) = p (1 p ) ( 1 / n1 + 1 / n2 )
Error estndar (EE) = 0,053 (1-0,053) (1/199+ 1/422)= 0,00035
Error estndar (EE) multiplicado por Z95% = 0,00035 * 1,96 = 0,00069
Z95%= 1,96
Si la diferencia de [P1 - P2] ( 0,054) > EE * Z95% (0,00069) concluimos que existe una diferencia estadsticamente
significativa entre los grupos en estudio (p< 0,05); razn por la cual rechazamos Ho, por ende, aceptamos la Ha.

[ P1 - P2 ] < Z95% X EE p > 0,1 Ho (hiptesis nula)

[ P1 - P2 ] > Z95% X EE p < 0,05 Ha (hiptesis alternativa)


C aptulo 5 Pgina 375

Figura 1. Frecuencia de complicaciones graves en 641 pacientes colecistectomizados por va


laparoscpica. Distribucin por tcnicas de diseccin.

p = 0,0019

KTP/532 lser

Electrociruga
monopolar

Test de 2 de Pearson

Lane GE, Lathrop JC. Comparison of results of KTP/532 laser versus monopolar electrosurgical dissection
in laparoscopic cholecystectomy. J Laparoendosc Surg 1993; 3: 209-214.
C aptulo 5 Pgina 376

Test de 2 de Pearson

Resultados de un estudio Variable resultado


imaginario que estudia la Porcentaje de respuestas a cada tratamiento
eficacia de dos tratamientos
A y B en dos grupos de 30
pacientes
Variable predictora SI (+) NO (-) Total
Tipo de tratamiento
A 16 (8%) P1 183 199

B 11 (2,6%) P2 411 422

2Pearson = 2,5 p = 0,12 No existe asociacin


C aptulo 5 Pgina 377

Comparacin de proporciones:
Importancia del intervalo de confianza
Resultados de un estudio imaginario que estudia la eficacia de dos
tratamientos A y B en dos grupos de 30 pacientes

Diferencia [ P1 - P2 ] = 0,70 - 0,50 = 0,20

IC95% = 0,20 024

- 4% a + 44%
A 50% 20% B 70%
C aptulo 5 Pgina 378

Realidad 15: ...de lo Es clnicamente relevante?


estadsticamente significativo a lo
clnicamente relevante.
Es estadsticamente significativo? S (xito) No (fracaso)
S (p < 0,05) Estadsticamente significativo Estadsticamente significativo

Clnicamente relevante Clnicamente irrelevante (p < 0,05)

No (p > 0,1) Estadsticamente NO Estadsticamente NO significativo


significativo
Clnicamente irrelevante
Clnicamente
relevante
C aptulo 5 Pgina 379

Test de 2 de Pearson

Resultados de un estudio Variable resultado


imaginario que estudia la Porcentaje de respuestas a cada tratamiento
eficacia de dos tratamientos
A y B en dos grupos de 800
pacientes
Variable predictora SI (+) NO (-) Total
Tipo de tratamiento
A 480 (60%) P1 320 800

B 520 (65%) P2 280 800

2Pearson = 4,2 p = 0,04 Existe asociacin


C aptulo 5 Pgina 380

Comparacin de proporciones:
Importancia del intervalo de confianza
Resultados de un estudio imaginario que estudia la eficacia de dos
tratamientos A y B en dos grupos de 800 pacientes

Diferencia [ P1 - P2 ] = 0,65 - 0,60 = 0,05

IC95% = 0,05 0,047

+ 0,3% a + 9,7%

A 60% 5% B 65%
C aptulo 5 Pgina 381

Realidad 15: ...de lo Es clnicamente relevante?


estadsticamente significativo a lo
clnicamente relevante.
Es estadsticamente significativo? S (xito) No (fracaso)
S (p < 0,05) Estadsticamente significativo Estadsticamente significativo

Clnicamente relevante Clnicamente irrelevante (p < 0,05)

No (p > 0,1) Estadsticamente NO Estadsticamente NO significativo


significativo
Clnicamente irrelevante
Clnicamente
relevante
C aptulo 5 Pgina 382

Importancia del intervalo de confianza


Cul de los siguientes tratamientos es estadsticamente
significativo?
Ho Ha
A= B Diferencia con INTERS CLNICO
B - A = 0 A B
AB B A = 20% Tratamiento Diferencia Significacin IC95%
BA=
10% observada estadstica
Ho
A 20% p < 0,05 +10 a
RC +30%
A B 30% p < 0,05 +25 a
+35%
B
C 10% p < 0,05 +5 a +15%
C

D D 10% NS -5 a +25%

E
E 25% p < 0,05 +15 a
+35%
-10 -5 0% 5 10 15 20% 25 30 35 40

Resultados hipotticos de un estudio que compara un tratamiento activo frente a un placebo y utiliza como
medidas del efecto la diferencia entre los porcentajes de curacin observados. Se considera que la mnima
diferencia con relevancia clnica es del 20%. RC: Diferencia con relevancia clnica.
C aptulo 5 Pgina 383

Importancia del intervalo de confianza

Tratamiento Diferencia Significacin IC95% Interpretacin


observada estadstica
A 20% p < 0,05 +10 a +30% No concluyente
Potencialmente
importante
(observado =
relevante)
B 30% p < 0,05 +25 a +35% Importante
C 10% p < 0,05 +5 a +15% No concluyente
D 10% NS -5 a +25% No concluyente
E 25% p < 0,05 +15 a +35% No concluyente
Potencialmente
importante
(observado >
relevante)

Resultados hipotticos de un estudio que compara un tratamiento activo frente a un placebo y utiliza como
medidas del efecto la diferencia entre los porcentajes de curacin observados. Se considera que la mnima
diferencia con relevancia clnica es del 20%. RC: Diferencia con relevancia clnica.
C aptulo 5 Pgina 384

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso de la ciudad de
Ceuta y la prevalencia de inmunizacin frente al virus de la Rubeola
en la poblacin gestante?
Variable PREDICTORA Variable RESULTADO
Cualitativa dicotmica Cualitativa dicotmica
- Cristianas Virus de la Rubeola
- Musulmanas

Cul es el test estadstico ms adecuado?

Daz Portillo J, Torres E, Vadillo Andrade J, Laroca C.PREVALENCIA DE ANTICUERPOS FRENTE AL


VIRUS DE LA RUBOLA EN UNA POBLACIN GESTANTE DE CEUTA. Revista de Diagnstico Biolgico
1995, 44: 114-119.
C aptulo 5 Pgina 385

Test de 2 de Pearson

Rubeola Variable predictora


Religin
Variable resultado Cristiana Musulmana
Inmunizacin
(+) 279 (87,2%) 372 (86,1%)

(-) 41 60

2Pearson = 0,18; p=0,668 No existe asociacin


C aptulo 5 Pgina 386

Resumen del procesamiento informtico de los datos

Clculos del programa estadstico Valor Grados de Contraste Contraste


tabla 2 x 2 libertad bilateral unilateral
2 Pearson 0,183 1 0,669
Correccin de Yates 0,102 1 0,749
Razn de verosimilitud 0,184 0,668
Test exacto de Fisher 1 0,746 0,376
N Casos vlidos 752

Ho (hiptesis nula) = La inmunizacin frente al virus de la rubeola NO est asociada al grupo cultural de la
gestante.
Ha (hiptesis alternativa) = La inmunizacin frente al virus de la rubeola est asociada al grupo cultural de la
gestante.
C aptulo 5 Pgina 387

Test de 2 de Pearson (1 grado de libertad)

2Pearson calculado = 0,183 < 2Pearson tabulado = 3,84

AZAR
2 = 0,183
Ho (hiptesis nula) = La inmunizacin frente al
virus de la rubeola NO est asociada al grupo
cultural de la gestante.

Error alfa

Ho Ha
2
AZAR 2Pearson tabulado = 3,84
C aptulo 5 Pgina 388

Pregunta de investigacin
Qu relacin existe entre el hbito tabquico y el cncer de mama?

Variable PREDICTORA Variable RESULTADO


Cualitativa dicotmica Cualitativa dicotmica
Hbito tabquico Cncer de mama

Cul es la prueba estadstica ms adecuada?


C aptulo 5 Pgina 389

Tabla de contingencia cncer de mama Variable RESULTADO


versus tabaquismo Cncer de mama
Variable PREDICTORA Si No Total
Fumadora 15 20 35
No fumadora 10 40 50
Total 25 60 85

Clculos del Valor Grados de libertad Contraste bilateral Contraste


programa unilateral
estadstico tabla
2x2
2Pearson 5,18 1 0,023
Correccin de 4,14 1 0,042
Yates
Razn de 5,14 0,023
verosimilitud
Test exacto de 1 0,030 0,021
Fisher
N Casos vlidos 85
C aptulo 5 Pgina 390

Test de 2 de Pearson (1 grado de libertad)

2Pearson calculado = 5,18 > 2Pearson tabulado = 3,84

AZAR
Ha (hiptesis alternativa) = El hbito tabquico est
asociado al cncer de mama en las mujeres de mi estudio.

2 = 5,18

Error alfa

Ho Ha
2
AZAR 2Pearson tabulado = 3,84
C aptulo 5 Pgina 391

Pregunta de investigacin
El hbito tabquico de los alumnos del I curso de metodologa de
investigacin depende del sexo?

Variable PREDICTORA Variable RESULTADO


Cualitativa dicotmica Cualitativa dicotmica
Sexo de los alumnos Hbito tabquico

Cul es la prueba estadstica ms adecuada?


C aptulo 5 Pgina 392

Test de 2 de Pearson

Alumnos del curso Variable RESULTADO

Variable PREDICTORA Fumador No fumador Total


Masculino 5 28 33
Femenino 18 10 28
Total 23 38 61

Ho (hiptesis nula) = El hbito tabquico es independiente de sexo del alumno


del I curso de Metodologa de Investigacin.

Ha (hiptesis alternativa) = El hbito tabquico depende del sexo del alumno


del I curso de Metodologa de Investigacin.
C aptulo 5 Pgina 393

Test de 2 de Pearson (1 grado de libertad)

2Pearson calculado = 15,57 > 2Pearson tabulado = 3,84

AZAR
Ha (hiptesis alternativa) = El hbito tabquico depende del
sexo de alumno del I curso de Metodologa de Investigacin. Es
decir hay diferencias en el hbito tabquico en funcin del sexo.
2 = 15,57

Error alfa
Ho Ha
2
AZAR 2Pearson tabulado = 3,84
C aptulo 5 Pgina 394

Test de 2 de Pearson
Resumen del procesamiento informtico de los datos

Clculos del Valor Grados de libertad Contraste bilateral Contraste


programa unilateral
estadstico
2Pearson (*) 15,57 1 0,000
Correccin de 13,54 1 0,000
Yates
Razn de 16,28 0,000
verosimilitud
Test exacto de 1 0,000 0,000
Fisher
N Casos vlidos 61

(*) 0 casillas (0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 10,56

Ha (hiptesis alternativa) = El hbito tabquico depende del sexo de alumno del I curso de Metodologa de
Investigacin. Es decir, hay diferencias en el hbito tabquico en funcin del sexo.
C aptulo 5 Pgina 395

Pregunta de investigacin
El hbito tabquico es homogneo en los alumnos del II curso de
metodologa de investigacin en funcin del sexo?

Variable PREDICTORA Variable RESULTADO


Cualitativa dicotmica Cualitativa dicotmica
Sexo de los alumnos Hbito tabquico

Cul es la prueba estadstica ms adecuada?


C aptulo 5 Pgina 396

Alumnos del curso Variable RESULTADO


Variable PREDICTORA (+) (-) Total
Si 8 7 15
No 24 4 28
Total 32 11 43

Ho (hiptesis nula) = El hbito tabquico es homogneo en hombres y


mujeres del II curso de Metodologa de Investigacin.

Ha (hiptesis alternativa) = El hbito tabquico NO es homogneo en


hombres y mujeres del II curso de Metodologa de Investigacin.

Test de 2 de Pearson
C aptulo 5 Pgina 397

Test de 2 de Pearson (1 grado de libertad)

2Pearson calculado = 5,38 > 2Pearson tabulado = 3,84

AZAR
Ha (hiptesis alternativa) = El hbito tabquico NO es homogneo en hombres
y mujeres del II curso de Metodologa de Investigacin. Es decir hay diferencias
en el hbito tabquico en funcin del sexo.

2 = 5,38

Error alfa

Ho Ha
2
AZAR 2Pearson tabulado = 3,84
C aptulo 5 Pgina 398

Mito 1: La sonrisa de la esfinge

Se cumplen todos lo requisitos para el uso del test de Pearson?


2

He observado que en uno de los casilleros el valor obtenido es inferior a 5


observaciones.

Cmo justificas el empleo del test de Pearson?


2

La correccin de Yates permite analizar si dos variables dicotmicas estn


asociadas cuando la muestra a estudiar es pequea y no se cumplen las
condiciones necesarias para que la aplicacin del test Pearson sea
2

adecuada (uno de las casillas es inferior a 5). El test de Pearson exige que
2

todos los valores esperados de las celdas en una tabla de contingencia sean
mayores de 5.
C aptulo 5 Pgina 399

Test de 2 de Yates:
Correccin de continuidad
En la frecuencia esperada en una de las cuatro celdas es menor de 5, por
lo que NO resulta adecuado aplicar el test 2 Pearson , aunque s el test
de Yates. Las variables sexo y tabaquismo son independientes, porque la
probabilidad asociada a los datos del estudio (p = 0,051) es inferior a 0,05
(error alfa). Por tanto no podemos descartar la hiptesis nula (Ho).

Ho (hiptesis nula) = El hbito tabquico es homogneo en hombres y


mujeres del II curso de Metodologa de Investigacin

Regla de Decisin: Frecuencias esperadas


3 5

Fisher Yates Pearson


C aptulo 5 Pgina 400

Resumen del procesamiento informtico de los datos

Clculos del Valor Grados de libertad Contraste bilateral Contraste unilateral


programa
estadstico
2Pearson (*) 5,38 1 0,020
Correccin de 3,81 1 0,051
Yates
Razn de 5,21 0,022
verosimilitud
Test exacto de 1 0,031 0,027
Fisher
N Casos vlidos 43
(*) 1 casillas (25%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 3,84

Ho (hiptesis nula) = El hbito tabquico NO depende del sexo de alumno del I curso
de Metodologa de Investigacin. Es decir NO hay diferencias en el hbito tabquico en
funcin del sexo.
C aptulo 5 Pgina 401

Test exacto de Fisher

Variable RESULTADO
Variable PREDICTORA (+) (-) Total
Si a b a+b
No c d c+d
Total a+c b+d n

p (a + b)! * (c + d)! * (a + c)! * (b + c)!


=
n! * a! * b! * c! * d!
C aptulo 5 Pgina 402

Pregunta de investigacin
El hbito tabquico es homogneo en los alumnos del III curso de
metodologa de investigacin en funcin del sexo?

Variable PREDICTORA Variable RESULTADO


Cualitativa dicotmica Cualitativa dicotmica
Sexo de los alumnos Hbito tabquico

Cul es la prueba estadstica ms adecuada?


C aptulo 5 Pgina 403

Alumnos del curso Variable RESULTADO


Variable PREDICTORA Fumador No fumador Total
Masculino 2 5 7
Femenino 8 2 10
Total 10 7 17

Ho (hiptesis nula) = El hbito tabquico es homogneo en hombres y


mujeres del III curso de Metodologa de Investigacin.

Ha (hiptesis alternativa) = El hbito tabquico NO es homogneo en


hombres y mujeres del III curso de Metodologa de Investigacin.

Correccin de continuidad de Yates

Test de 2 de Pearson
C aptulo 5 Pgina 404

Test de 2 de Pearson (1 grado de libertad)

2Pearson calculado = 4,49 > 2Pearson tabulado = 3,84

AZAR
Ha (hiptesis alternativa) = El hbito tabquico NO es homogneo en
hombres y mujeres del III curso de Metodologa de Investigacin. Es decir
hay diferencias en el hbito tabquico en funcin del sexo.

2 = 4,49

Error alfa

Ho Ha
2
AZAR 2Pearson tabulado = 3,84
C aptulo 5 Pgina 405

Mito 1: La sonrisa de la esfinge

Se cumplen todos lo requisitos para el uso del test de 2 Pearson?

He observado que en varios casilleros el valor es igual o inferior a 5


observaciones.

Cmo justificas el empleo del test de 2 Pearson?

El test exacto de Fisher permite analizar si dos variables dicotmicas estn


asociadas cuando la muestra a estudiar es demasiado pequea y no se
cumplen las condiciones necesarias para que la aplicacin del test 2
Pearson sea adecuada. Estas condiciones exigen que los valores esperados
de las celdas en una tabla de contingencia sean mayores de 5.
C aptulo 5 Pgina 406

Test exacto de Fisher


En esta tabla a=2, b=5, c=8 y d=2. La frecuencia esperada en dos de las
cuatro celdas es menor de 5, por lo que NO resulta adecuado aplicar el test
2 Pearson, ni la correccin de Yates, aunque s el test exacto de Fisher. Si las
variables sexo y tabaquismo fuesen independientes, la probabilidad asociada
a los datos que han sido observados vendra dada por p = 0,058 (bilateral).

Ho (hiptesis nula) = El hbito tabquico es homogneo en hombres y


mujeres del III curso de Metodologa de Investigacin.

Regla de Decisin: Frecuencias esperadas


3 5

Fisher Yates Pearson


C aptulo 5 Pgina 407

Clculos del Valor Grados de libertad Contraste bilateral Contraste


programa unilateral
estadstico
2Pearson 4,49 1 0,034
Correccin de 2,62 1 0,105
Yates
Razn de 4,65 0,031
verosimilitud
Test exacto de 1 0,058 0,052
Fisher
N Casos vlidos 17

(*) 3 casillas (75%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 2,88.

En ambos casos la Ho es la misma: la prevalencia de tabaquismo es igual en hombres y mujeres (Ho). En


el contraste unilateral la hiptesis alternativa (Ha) dice de que la prevalencia es mayor en las mujeres que
en los hombres (p=0,052). Cuando el planteamiento se hace con una perspectiva bilateral, la hiptesis
alternativa (Ha) consiste en asumir que existen diferencias en la prevalencia de tabaquismo entre sexos,
pero sin especificar de antemano en qu sentido se producen dichas diferencias, (p=0,058), que tampoco
es significativo. Las dos formas de clculo nunca proporcionan los mismos resultados. El contraste
unilateral (ms exigente) siempre resultar en un valor de p menor al contraste bilateral. En ambos casos, y
a la vista de los resultados del programa estadstico, NO existe evidencia estadstica de asociacin entre el
sexo y el hbito tabquico en los alumnos del curso de metodologa de investigacin de mi estudio.
C aptulo 5 Pgina 408

Pregunta de investigacin
Qu utilidad clnica tiene la prueba diagnstica X en el diagnstico
clnico de una determinada enfermedad E?

Objetivo: Evaluacin de la prueba X en el diagnstico de la enfermedad E.

Tcnica analtica a valuar Tcnica de referencia


(diagnstico definitivo)
PRUEBA X ENFERMEDAD E

Cul es el test estadstico ms acertado?


C aptulo 5 Pgina 409

Razn de Verosimilitud de 2
- Si la proporcin o frecuencia observada fo es en realidad igual a la
proporcin esperada fe segn la hiptesis nula (Ho), las 2 probabilidades
calculadas sern iguales y su razn ser igual a 1.

- Cuanto mayor sea la diferencia entre fo y fe, mayor ser la razn entre
ambas. La razn de estas 2 probabilidades o verosimilitudes puede utilizarse
como estadstico para medir el grado de ajuste entre las frecuencias
observadas y las esperadas.

- Esta prueba se calcula de la siguiente manera:

RV2 = 2 * fo * ln fe
fo
C aptulo 5 Pgina 410

Razn de Verosimilitud de 2

Estudio Diagnstico definitivo


Casos - Controles
Prueba X Enfermos Sanos Total
Positiva (+) 9 (2,1%) 19 (4,4%) 28 (6,5%)
Negativa (-) 67 (15,7%) 335 (93,5%) 402 (93,5%)
Total 76 (17,7%) 354 (82,3) 430

Ho (hiptesis nula) = Los resultados de la prueba diagnstica X NO estn


relacionados con el diagnstico definitivo.

Ha (hiptesis alternativa) = Los resultados de la prueba diagnstica X estn


relacionados con el diagnstico definitivo.
C aptulo 5 Pgina 411

Razn de Verosimilitud de 2

Clculos del Valor Grados de libertad Contraste bilateral Contraste unilateral


programa
estadstico
2Pearson 4,309 1 0,038
Correccin de 3,311 1 0,069
Yates
Razn de 3,706 0,054
verosimilitud
Test exacto de 1 0,067 0,041
Fisher
N Casos vlidos 430

A pesar de que el test de 2 de Pearson es significativo (p < 0,05) no podemos rechazar


la hiptesis nula ya que la razn de verosimilitud es mayor de 0,05 (diseo de casos y
controles).
Ho (hiptesis nula) = Los resultados de la prueba diagnstica X NO estn relacionados con
el diagnstico definitivo
C aptulo 5 Pgina 412

Un equipo de traumatlogos desarrollaron una nueva tcnica quirrgica


para el reemplazo de la cabeza del fmur que suponan superior a la
tcnica tradicional.

Existen diferencias significativa respecto al porcentaje de complicaciones


postoperatorias inmediatas?

Ho (hiptesis nula) = No hay diferencia entre ambas tcnicas de


quirrgicas.

Ha (hiptesis alternativa) = S existe diferencia entre ambas tcnicas de


quirrgicas.

Tcnica CLSICA Tcnica NUEVA


C aptulo 5 Pgina 413

Variable resultado Variable predictora Tipo de ciruga


Complicaciones Tcnica CLSICA Tcnica NUEVA
INMEDIATAS
Dao nervioso 485 (50%) 28 (26,4%)
Hemorragia 285 (29,4%) 16 (15,1%)
Desplazamiento 52 (5,4%) 4 (3,8%)
Ninguna 148 (15,3%) 58 (54,7%)
Total 970 106

Cul es el test estadstico ms acertado?


Test de 2 de Pearson

2Pearson = 129,97 p < 0,0001 Existe asociacin


C aptulo 5 Pgina 414

2Pearson = 129,97 p < 0,0001

Frecuencia absoluta(%)

Complicaciones postquirrgicas
INMEDIATAS
C aptulo 5 Pgina 415

Test de 2 de Pearson

Grados de libertad = [ K - 1] [F - 1] = (2-1) (4 -1) = 3

2Pearson calculado = 129,97 > 2Pearson tabulado = 7,81

2 = 129,97
AZAR

Ho
Ha

7,81
AZAR

Ha (hiptesis alternativa) = La frecuencia de las complicaciones postquirrgicas


inmediatas en la nueva tcnica NO eran iguales que en la tcnica clsica.
C aptulo 5 Pgina 416

Pregunta de investigacin
Qu relacin existe entre el pas de procedencia y la prevalencia de
infeccin tuberculosa en el colectivo de inmigrantes del campamento
de Calamocarro de Ceuta?

Variable PREDICTORA Variable RESULTADO


Cualitativa policotmica Cualitativa dicotmica
Pases africanos de origen Infeccin tuberculosa

Cul es el test estadstico ms adecuado?

Fernndez SanFrancisco T, Daz Portillo J, Snchez Romero JM et al. PREVALENCIA DE INFECCIN


TUBERCULOSA EN LA POBLACIN DE INMIGRANTES EN CEUTA. Rev Esp Salud Pblica 2001; 75:
501-558.
C aptulo 5 Pgina 417

Test de 2 de Pearson

Pas de procedencia N Prevalencia


Argelia 133 25,6
Camern 128 48,4
Costa de marfil 18 27,8
Gambia 107 11,2
Guinea Bissau 186 26,3
Liberia 105 27,4
Mali 291 32,7
Mauritania 55 24,1
Nigeria 597 29,1
R.D. Congo 146 34,0
R. Guinea 45 65,1
Sierra Leona 177 20,8

2Pearson= 165; p<0,00001 Existe asociacin


C aptulo 5 Pgina 418

Gambia 11%
Sierra Leona 20%
Pas africano de procedencia del inmigrante
Mauritania 24%
Argelia 25%
Guinea Bissau 26%
Liberia 27%
Costa de marfil 28%
Nigeria 29%
Mali 33%
R.D. Congo 34%
Camern 48%

R. Guinea 65%

Prevalencia de infeccin tuberculosa


Fernndez SanFrancisco T, Daz Portillo J, Snchez Romero JM et al. PREVALENCIA DE INFECCIN
TUBERCULOSA EN LA POBLACIN DE INMIGRANTES EN CEUTA. Rev Esp Salud Pblica 2001; 75:
501-558.
C aptulo 5 Pgina 419

Pregunta de investigacin
Existen diferencias en la prevalencia de infeccin tuberculosa en el
colectivo de inmigrantes segn la ciudad de destino (Ceuta, Barcelo-
na, Toledo)?

Variable PREDICTORA Variable RESULTADO


Cualitativa policotmica Cualitativa dicotmica
Destino Infeccin tuberculosa
- Ceuta
- Barcelona
- Toledo

Cul es el test estadstico ms adecuado?


C aptulo 5 Pgina 420

Test de 2 de Pearson
Variable RESULTADO
Prueba de Mantoux
Variable PREDICTORA (+) (-) Total
Ceuta 722 (32,6%) 1501 2223
Barcelona 506 (34%) 983 1489
Toledo 75 (27,7%) 269 344

2Pearson= 19,29; p = 0,000065

Ha: Existen diferencias en la prevalencia de infeccin tuberculosa en el colectivo de inmigrantes segn la


ciudad de destino (Ceuta, Barcelona, Toledo).
C aptulo 5 Pgina 421

Fernndez Sanfrancisco MT, Daz Portillo J, Snchez Romero JM, et al. Prevalencia de infeccin
tuberculosa en la poblacin inmigrante de Ceuta. Rev Esp Salud Pblica 2001; 75: 551-558.

Duran E, Cabezos J, Ros M, et al. Tuberculosis en los inmigrantes recin llegados a Barcelona. Med Clin
(Barc) 1996; 106: 525-528.

Alonso Moreno FJ, Garca Bajo MC, Lougedo Caldern MJ, et al. Prevalencia de infeccin tuberculosa en
las personas inmigrantes del rea sur de Toledo. Rev Esp Salud Pblica 2004; 78: 593-600.
C aptulo 5 Pgina 422

Realidad 3
...de lo estadsticamente significativo a lo clnicamente relevante

Realidad 3: ...de lo Es clnicamente relevante?


estadsticamente significativo a lo
clnicamente relevante.
Es estadsticamente significativo? S (xito) No (fracaso)
S (p < 0,05) Clnicamente relevante Clnicamente irrelevante (p < 0,05)

Estadsticamente significativo Estadsticamente significativo

Error Alfa?

No (p > 0,1) Clnicamente relevante Clnicamente irrelevante

Estadsticamente NO Estadsticamente NO significativo


significativo

Error Beta?
C aptulo 5 Pgina 423

Pregunta de investigacin
Qu relacin y qu grado de asociacin existe entre el grupo cultu-
ral/religioso de la ciudad de Ceuta y la prevalencia de inmunizacin
frente a Toxoplasma goondi en la poblacin gestante?

Variable PREDICTORA Variable RESULTADO


Cualitativa policotmica Cualitativa dicotmica
Grupo cultural: Infeccin Toxoplasma goondi
- Cristianas
- Musulmanas

Cul es el test estadstico ms adecuado?

Daz Portillo J, Torres E, Vadillo Andrade J. SEROEPIDEMIOLOGA DE LA TOXOPLASMOSIS EN UNA


POBLACIN GESTANTE DE CEUTA. Revista de Diagnstico Biolgico 1998; 47: 106-116.
C aptulo 5 Pgina 424

Test de 2 de Pearson
Variable predictora Religin
Variable resultado Cristiana Musulmana
Inmunizacin
(+) 112 220
(-) 210 148

2Pearson= 43,99; p<0,0000001 Existe asociacin

No cuantifica el grado de intensidad de la asociacin.


C aptulo 5 Pgina 425

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar DESPUS
ANTES XITO (+) FRACASO (-)
XITO (+) A B
FRACASO (-) C D

2McMemar =
[ ( B C ) 1 ]2

B+C
C aptulo 5 Pgina 426

Existen evidencias de un mejor efecto analgsico en los dos


frmacos protocolizados para el clico nefrtico?
- Diseo APAREADO
- Un solo grupo de pacientes (n=20) con clico nefrtico recidivante (dos
episodios de clico nefrtico).
- Dos mediciones repetidas (antes y despus).
- Gran potencia estadstica (mnima variabilidad aleatoria).

- Hiptesis nula Ho: la eficacia de ambos analgsicos es la misma Metamizol


= Ketorolaco

Test de McNemar
C aptulo 5 Pgina 427

N = 20 pacientes

KETOROLACO METAMIZOL
C aptulo 5 Pgina 428

Test de McNemar para datos apareados

McNemar METAMIZOL
KETOROLACO XITO = 1 FRACASO = 0
XITO = 1 A B
FRACASO = 0 C D

2McMemar =
[ ( B C ) 1 ]2

B+C

(B C)1
Z McNemar =
B+C
C aptulo 5 Pgina 429

Test de McNemar para datos apareados

McNemar METAMIZOL
KETOROLACO XITO = 1 FRACASO = 0
XITO = 1 8 9
FRACASO = 0 2 1

[ ( 9 2 ) 1 ]2
2 McMemar = = 3,27 p > 0,05
9+2
C aptulo 5 Pgina 430

Procesamiento informtico de los datos

Test de McNemar para datos apareados


Valor Significacin bilateral (*)
Prueba de McNemar 3,27 0,065
N casos vlidos 20

(*) Utilizada la distribucin binomial

Hiptesis nula Ho: La eficacia de ambos analgsicos es la misma, es decir


Metamizol = Ketorolaco

Es posible un error ?
Qu ocurre si aumentamos el tamao muestral?
C aptulo 5 Pgina 431

N = 30 pacientes

KETOROLACO METAMIZOL
C aptulo 5 Pgina 432

Test de McNemar para datos apareados

McNemar METAMIZOL
KETOROLACO XITO = 1 FRACASO = 0
XITO = 1 11 14
FRACASO = 0 3 2

[ ( 14 3 ) 1 ]2
2 McMemar = = 5,88
14 + 3
p = 0,013
C aptulo 5 Pgina 433

Procesamiento informtico de los datos

Test de McNemar para datos apareados


Valor Significacin bilateral (*)
Prueba de McNemar 5,88 0,013
N casos vlidos 30

(*) Utilizada la distribucin binomial

Hiptesis alternativa Ha: La eficacia de ambos analgsicos es NO la misma,


es decir Metamizol Ketorolaco
C aptulo 5 Pgina 434

Pregunta de investigacin
Existen evidencias de una mejora en los conocimientos
tericos de Metodologa de investigacin en los alumnos
despus del curso?
Examen de 14 preguntas a los 8 alumnos antes y despus de realizar el curso
Aprobado: [ > 7 respuestas correctas de 14 ] = 1
Suspenso: [ < 8 respuestas correctas de 14 ] = 0

DESPUS del curso


ANTES del curso APROBADO (> 7) SUSPENSO (< 8)
APROBADO (> 7) A B
SUSPENSO (< 8) C D
C aptulo 5 Pgina 435

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar DESPUS del curso
ANTES del curso APROBADO (< 7) SUSPENSO (< 8)
APROBADO (< 7) A B
SUSPENSO (< 8) C D

2McMemar =
[ ( B C ) 1 ]2

B+C
(B C)1
Z McNemar =
B+C
C aptulo 5 Pgina 436

Existen evidencias de una mejora en los conocimientos


tericos de metodologa de investigacin en los alumnos
despus del curso?
N del Alumno Evaluacin ANTES del curso Evaluacin DESPUS del curso
1 APROBADO (10) APROBADO (14)
2 SUSPENSO (7) APROBADO (14)
3 SUSPENSO (7) APROBADO (14)
4 SUSPENSO (5) APROBADO (14)
5 SUSPENSO (4) APROBADO (13)
6 SUSPENSO (3) APROBADO (13)
7 SUSPENSO (2) APROBADO (13)
8 SUSPENSO (2) APROBADO (11)

Cul es el test estadstico ms acertado?


C aptulo 5 Pgina 437

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar DESPUS del curso
ANTES del curso APROBADO (< 7) SUSPENSO (< 8)
APROBADO (< 7) 1 0
SUSPENSO (< 8) 7 0

[ ( 0 7 ) 1 ]2
2 McMemar = = 9,14
0+7
C aptulo 5 Pgina 438

Z Valor
(B C)1 Z95% 1,96 0,05
Z McNemar = Z98% 2,32 0,02
B+C Z99% 2,56 0,01
Z99,5% 3,29 0,005

(0 7)1
Z McNemar = = 3,03 > Z 99% = 2,56
0+7

Conclusin: Como el estadstico Z calculado 3,03 es superior a Z tabulado


para un error alfa de 0,01 (2,56), podemos decir que las dos variables
evaluadas NO son independientes, sino que estn asociadas (p<0,01), es
decir, la accin formadora mejora los conocimientos de los alumnos.
C aptulo 5 Pgina 439

110

Colesterol total (mg/dl) al nacimiento

80

50

20

80 130 180 230


Colesterol total (mg/dl) durante el segundo ao de vida
C aptulo 5 Pgina 440

110 8/108 (7,4%)

21/108 (19,4%)
b 4/61 Cristianos (6,5%)
4/44 Musulmanes (9,1%)
14/61 Cristianos (23,0%)
6/44 Musulmanes (13,6%) a
Colesterol total (mg/dl) al nacimiento

80

P75

50
D c
64/108 (59,5%) 14/108 (13,9%)
34/61 Cristianos (55,7%) 9/61 Cristianos (14,7%)
28/44 Musulmanes (63,6%) 6/44 Musulmanes (13,6%)
20

80 130 180 230


P75
Colesterol total (mg/dl) durante el segundo ao de vida
C aptulo 5 Pgina 441

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar SEGUNDO AO DE VIDA
NEONATOS CT > P75 CT P75
CT > P75 A B
CT P75 C D

2McMemar =
[ ( B C ) 1 ]2

B+C
(B C)1
Z McNemar =
B+C
C aptulo 5 Pgina 442

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)

McNemar SEGUNDO AO DE VIDA


NEONATOS CT > P75 CT P75
CT > P75 8 21
CT P75 14 64

Test de McNemar para datos apareados


Valor Significacin bilateral Significacin unilateral
Prueba de McNemar 1,03 0,311 0,155
N casos vlidos 108
C aptulo 5 Pgina 443

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar SEGUNDO AO DE VIDA
NEONATOS CT > P75 CT P75
CT > P75 8 21
CT P75 14 64

[ ( 21 14 ) 1 ]2
2 McMemar = = 1,03
21 + 14

Jacobo Daz Portillo .Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta, Tesis doctoral. Facultad de Medicina de la Universidad de Cdiz. 1997
C aptulo 5 Pgina 444

(B C)1 Z Valor
Z McNemar = Z95% 1,96 0,05
B+C Z98% 2,32 0,02
Z99% 2,56 0,01
Z99,5% 3,29 0,005
( 21 14 ) 1
Z McNemar = = 1,014
21 + 14

Conclusin: Como el estadstico Z calculado 1,014 es INFERIOR a Z tabulado


para un error alfa de 0,05 (1,96), podemos decir que las dos variables
evaluadas son independientes, es decir, NO estn asociadas, y por tanto no
hay cambios importantes en la distribucin del colesterol total al pasar del
nacimiento al segundo ao de vida. Este comportamiento tambin se repite
en los dos grupos culturales (cristianos y musulmanes).
C aptulo 5 Pgina 445

Existen evidencias de un mejor efecto antitusgeno en los 3 frmacos ensayados?

TOS
Si (1) No (0)

A RESPUESTA A

TOS
Si (1) No (0)

B RESPUESTA B

TOS
Si (1) No (0)

C RESPUESTA C

Cul es el test estadstico ms adecuado?


C aptulo 5 Pgina 446

Q de Cochran
Para tres o ms muestras dependientes

- La prueba Q de Cochran es una extensin de la prueba de McNemar, que


se utiliza en los modelos experimentales con 3 o ms muestras dependientes
o relacionadas entre s, es decir, esta poblacin sirve como su propio control,
en el que existe un perodo previo y otro ulterior; adems, el tipo de escala
debe ser nominal.
- El valor calculado en la prueba Q de Cochran se distribuye igual que la ji
cuadrada, por lo cual el smbolo utilizado ser X 2Q.

Donde:
X 2Q = estadstico ji cuadrada de la prueba Q de Cochran.
K = nmero de tratamientos.
Gn = nmero total de respuestas de cambio de cada tratamiento o columna.
Lc = nmero total de respuestas de cambio por individuo de la muestra o hileras.
C aptulo 5 Pgina 447

25 pacientes reciben 3 frmacos para mejorar su tos

Paciente Frmaco A Frmaco B Frmaco C Paciente Frmaco A Frmaco B Frmaco C


1 1 1 1 15 0 1 1
2 1 1 0 16 1 0 0
3 0 1 0 17 0 0 1
4 1 1 1 18 1 1 0
5 0 0 1 19 0 0 0
6 1 1 0 20 1 0 1
7 0 1 0 21 1 1 1
8 1 1 0 22 0 1 0
9 0 0 0 23 1 1 0
10 0 1 1 24 1 0 1
11 1 1 0 25 0 1 1
12 1 1 1
13 1 0 0 0 = Mejora la tos
14 1 1 1 1 = NO mejora la tos
C aptulo 5 Pgina 448

N Media DE Mnimo Mximo


Frmaco A 25 0,60 0,500 0 1
Frmaco B 25 0,65 0,478 0 1
Frmaco C 25 0,48 0,510 0 1

Valores Test estadsticos


0 1 N 250
Frmaco A 10 15 Q de Cochran 2,111
Frmaco B 8 17 gl 2
Frmaco C 13 12 Significacin 0,348

Grados de libertad = [ K - 1] [F - 1]

Hiptesis nula Ho: No hay diferencia entre los 3 frmacos para evitar la tos.
Hiptesis alternativa Ha: Hay diferencia entre los 3 frmacos para evitar la tos.
Conclusiones: No hay diferencias estadsticamente significativas entre los 3 frmacos
para evitar la tos en los pacientes.
C aptulo 5 Pgina 449

Datos categricos
Cualitativa versus cualitativa ORDINALES

- Test de 2 de tendencia lineal


- Tau-B de Kendall o Stuart
- Tau-C de Kendall
- Gamma de Goodman y Kruskal
- D de Somers
- Correlacin de Spearman

Estos estadsticos NO se pueden utilizar cuando alguna de las variables sea


NOMINAL
C aptulo 6 Pgina 450

Captulo 6

Publicacin Bioestadstica: Anlisis bivariante.


Test de contraste de hiptesis.
Cualitativa versus cualitativa.
Medidas de asociacin.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 6 Pgina 451

Datos categricos:
Cualitativa versus cualitativa. Nominales
- Test de 2 de Pearson
- Relacin entre dos variables cualitativas nominales o policotmicas
- Comparacin de proporciones
- Correccin de Yates
- Test exacto de Fisher
- Valores esperados menores de 5
- Razn de verosimilitud
- Evaluacin de pruebas diagnsticas
- Test de 2 de McNemar
- Datos apareados o emparejados
- Coeficiente PHI ()
- V de Cramer
- Coeficiente de contingencia
- Coeficiente de incertidumbre
- Tau de Goodman y Kruskal
- Lambda de Goodman y Kruskal (coeficiente de predictibilidad de Guttman)
C aptulo 6 Pgina 452

Datos categricos:
Cualitativa versus cualitativa. Ordinales

- Test de 2 de tendencia lineal


- Tau-B de Kendall o Stuart
- Tau-C de Kendall
- Coeficiente Gamma de Goodman y Kruskal
- D de Somers
- Correlacin de Spearman

Estos estadsticos NO se pueden


utilizar cuando alguna de las variables
sea NOMINAL
C aptulo 6 Pgina 453

Medidas de asociacin
Son indicadores estadsticos que miden la FUERZA o INTENSIDAD
con la que una determinada enfermedad o evento de salud (VARIABLE
RESULTADO)est asociada o relacionada con un determinado factor (que se
presume como su causa, VARIABLE PREDICTORA).

Estadstico Transversales Cohortes Casos-controles


OR (Odds ratio) Limitaciones NO SI
RR (Riesgo Relativo) NO SI NO
Q de Yule SI SI SI
Coeficiente PHI SI SI SI
V de Cramer SI SI SI
Coeficiente de contingencia SI SI SI
Lambda SI SI SI
Tau de Goodman y Kruskal SI SI SI
Coeficiente de incertidumbre SI SI SI
Gamma SI SI SI
D de Somers SI SI SI
Tau-b de Kendall SI SI SI
C aptulo 6 Pgina 454

Test de 2 de independencia de Pearson


No es un test de contraste de
Test de la Q de Yule hiptesis (no calcula p)
Tablas = 2 x 2

Nominales
Coeficiente PHI
CONTRASTES A POSTERIORI

Tablas = 2 x 2
Nominales
V de Cramer Tablas > 2 x 2

Nominales
Coeficiente Lambda Tablas > 2 x 2

Nominales
Coeficiente de incertidumbre Tablas > 2 x 2

Ordinales
Coeficiente Tau-b de Kendall Tablas > 2 x 2
Ordinales
Coeficiente Gamma Tablas > 2 x 2
Ordinales
D de Somers Tablas > 2 x 2
C aptulo 6 Pgina 455

Test de la Q de Yule
Variable predictora Religin
Variable resultado Cristiana Musulmana
Inmunizacin
(+) A B
(-) C D

[ (A * D) (B * C) ]
Q =
[ (A * D) + (B * C) ]
C aptulo 6 Pgina 456

Test de la Q de Yule
Coeficiente Gamma

- Interpretacin:
-Q=0 independencia
-Q>0 asociacin positiva
-Q<0 asociacin negativa

- Intervalo de Q: (-1, +1)

- Informacin:
- Medida de la intensidad de la asociacin
- Sentido de la misma
C aptulo 6 Pgina 457

Caractersticas de la Q de Yule
- Medida de asociacin.
- Valores mayores de 0 (asociacin positiva).
- Valores menores de 0 (asociacin negativa).
- Valor = 0 o prximos a 0 (es probable que no exista asociacin).
- Vlida para cualquier tipo de Estudios (diseo).
- Alcanza valores extremos (+1, -1) bajo condiciones de asociacin perfectas.
- Es independiente de los cambios de ESCALA de filas y columnas.
- Si se intercambian entre si las filas o las columnas se mantiene la magnitud
de la INTENSIDAD de la asociacin, slo cambia la direccin de la misma, es
decir el signo de la Q.
- Es ms valida con un test previo de contraste de hiptesis que indique
relacin entre ambas variables.
C aptulo 6 Pgina 458

Test de la Q de Yule
Coeficiente Gamma

Rubeola Religin
Variable resultado Cristiana Musulmana
Inmunizacin
(+) 279 (87,2%) 372 (86,1%)
(-) 41 60

[ (279 * 60) (372 * 41) ]


Q = = 0,047
[ (279 * 60) + (372 * 41) ]

Gamma (Q de Yule) EEk T aprox p


0,047 0,113 0,430 0,667
C aptulo 6 Pgina 459

Mito 1: La sonrisa de la esfinge

La Q de Yule es un test que cuantifica la magnitud de la intensidad de la


asociacin entre dos variables cualitativas, pero NO es un test de contraste
de hiptesis, y por tanto, que para usarlo se debe cumplir previamente la
asociacin estadstica entre ambas variables. Se cumple?

He observado en tus resultados anteriores que el test de contraste de


hiptesis de 2 Pearson tiene un valor de tan slo 0,18, con p = 0,67. Cmo
justificas el empleo de la Q de Yule si NO existe asociacin estadstica entre
ambas variables?
C aptulo 6 Pgina 460

Test de la Q de Yule
Toxoplasma goondi Religin
Variable resultado Cristiana Musulmana
Inmunizacin
(+) 112 (34,8%) 220 (59,8%)
(-) 210 148

[ (112 * 148) (220 * 210) ]


Q = = 0,47
[ (112 * 148) + (220 * 210) ]

Gamma (Q de Yule) EEk T aprox p


- 0,47 0,041 - 6,780 0,000
C aptulo 6 Pgina 461

Q = 0,47 Q = 0,70 Q = 0,72

59,8

Seroprevalencia (%) 53,6

43,3

34,8

17,3

11,0

Figura .- Evolucin de la seroprevalencia de la toxoplasmosis en gestante de Ceuta (periodos 1994, 2004,


2010) (Q= Q de Yule; gamma; p < 0,001)
C aptulo 6 Pgina 462

Ejercicio: Qu grado de asociacin existe entre el infarto


de miocardio y el sexo del paciente?
Q de Yule Acontecimiento de infarto
Sexo (+) (-)
Hombre 32 10
Mujer 11 27

[ (32 * 27) (11 * 10) ]


Q = = 0,77
[ (32 * 27) + (11 * 10) ]

Gamma (Q de Yule) EEk T aprox p


0,774 0,102 4,782 0,000
C aptulo 6 Pgina 463

Ejercicio: Qu grado de asociacin existe entre el infarto


de miocardio y el sexo del paciente?

Q de Yule

El valor de 0,77 sugiere un grado de asociacin entre los factores sexo y


acontecimiento del infarto bastante elevado, ya que 0,77 est prximo a
1, y adems indica que dicha asociacin es positiva, es decir los varones
desarrollan con ms frecuencia el infarto que las mujeres.
C aptulo 6 Pgina 464

Pregunta de investigacin
En qu grupo cultural/religioso es mayor la prevalencia de inmuniza-
cin frente a Toxoplasma goondi en la poblacin gestante de Ceuta?
Musulmanas o cristianas?

Variable PREDICTORA Variable RESULTADO


Cualitativa policotmica Cualitativa dicotmica
Grupo cultural: Infeccin Toxoplasma goondi
- Cristianas
- Musulmanas

Cul es el test estadstico ms adecuado?

Daz Portillo J, Torres E, Vadillo Andrade J. SEROEPIDEMIOLOGA DE LA TOXOPLASMOSIS EN UNA


POBLACIN GESTANTE DE CEUTA. Revista de Diagnstico Biolgico 1998; 47: 106-116.
C aptulo 6 Pgina 465

Coeficiente PHI () Variable predictora


Variable resultado Positiva (+) Negativa (-) Total
Positiva (+) a b a+b
Negativa (-) c d c+d
Total a+c b+d n

= 2
n
Coeficiente PHI

(a * d) (b * c)
=
(a + c) (b + d) (a + b) (c + d)
C aptulo 6 Pgina 466

Coeficiente PHI

Coeficiente PHI () Variable predictora


Variable resultado Positiva (+) Negativa (-) Total
Positiva (+) 112 (34,8%) 220 (59,8%) 332
Negativa (-) 210 148 358
Total 322 368 690

= 2
n
= 43,99
690
= 0,25

Coeficiente es un test de contraste de hiptesis p < 0,01


C aptulo 6 Pgina 467

Coeficiente PHI
Coeficiente PHI () Variable predictora
Variable resultado Positiva (+) Negativa (-) Total
Positiva (+) 112 (34,8%) 220 (59,8%) 332
Negativa (-) 210 148 358
Total 322 368 690

(112 * 148) (220 * 210)


= = - 0,25
(112 + 210) (220 + 148) (112 + 220) (210 + 148)

Ha: La inmunizacin a Toxoplasma se encuentra asociada a la cultura musulmana.


C aptulo 6 Pgina 468

Coeficiente PHI

- Condiciones: Tablas tetracricas (2 x 2).

- Interpretacin:
- =0 independencia.
- >0 asociacin positiva.
- <0 asociacin negativa.

- Intervalo de : entre -1 y 1.

- Informacin: Es un test de contraste de hiptesis que ofrece una medida


de la intensidad de la asociacin. Cuando se acercan a cero, indican
independencia o asociacin muy dbil entre las variables. Cuando se acercan
a uno, indican una relacin ms fuerte o intensa entre las variables asociadas.
C aptulo 6 Pgina 469

Pregunta de investigacin
El resultado del tratamiento depende del frmaco empleado?
La condicin de asintomtico se encuentra asociado al uso de
Mosaprida?

Variable PREDICTORA Variable RESULTADO


Cualitativa policotmica Cualitativa dicotmica
- Metoclopramida (n = 99) - Asintomtico
- Cisaprida (n = 102) - Sntomas
- Mosaprida (n = 99) - Mejora clnica

Cul es el test estadstico ms adecuado?


C aptulo 6 Pgina 470

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer

Coeficiente de contingencia

Lambda

Tau de Goodman y Kruskal

Coeficiente de incertidumbre
C aptulo 6 Pgina 471

El resultado del tratamiento depende del frmaco


empleado?
Variable RESULTADO Resultado del tratamiento a la semana
Variable PREDICTORA Asintomtico Sintomtico Mejora
Tipo de medicamento
Metoclopropamida 24 (8%) 54 (18%) 21 (7%)
Cisaprida 27 (9%) 18 (6%) 57 (19%)
Mosaprida 51 (17%) 27 (9%) 21 (7%)

2Pearson= 60,12 p = 0,000 Existe asociacin

Ha: El resultado del tratamiento depende del frmaco empleado


La condicin de asintomtico se encuentra asociado al uso de Mosaprida?

V de Cramer
C aptulo 6 Pgina 472

V de Cramer

V= 2
n (k- 1)
V= 60,12
300 (3 -1)
= 0,317

Nominal por nominal Valor del estadstico Significacin (p)


Coeficiente PHI 0,448 0,000
V de Cramer 0,317 0,000
N de casos vlidos 300 pacientes

Ha: La condicin de asintomtico se encuentra asociado al uso de Mosaprida.


C aptulo 6 Pgina 473

V de Cramer
- Definicin: V de Cramer es una manera de calcular la correlacin en los cuadros que
tienen ms de 2x2 filas y columnas. Se utiliza como posterior a la prueba para determinar
la intensidad de la asociacin despus de que el test de chi-cuadrado ha sido significativa.
Chi-cuadrado, dice que existe una relacin significativa entre las variables, pero no dice
nada del grado de significancia ni de su importancia. V de Cramer es un post-test para dar
esta informacin adicional.
- Condiciones: Tablas de ms de 2 x 2. Cuando la tabla es de 2 x 2 (tetracrica), utilice el
coeficiente PHI.
- Interpretacin:
-V =0 independencia.
-V >0 asociacin positiva.
- Intervalo de V : entre 0 y 1.
- Informacin: Es una medida de la intensidad de la asociacin. Cuando se acercan a cero,
indican independencia o asociacin muy dbil entre las variables. Cuando se acercan a
uno, indican una relacin ms fuerte o intensa entre las variables estudiadas.

Cramer, H. (1999). Mtodos Matemticos de Estadstica, Princeton University Press.


C aptulo 6 Pgina 474

Limitaciones del test 2 de Pearson como medida de


asociacin
Una vez que tenemos hallado el valor del 2 podemos preguntarnos si existe
o no asociacin. No se puede emplear el valor de 2 como una medida de
asociacin ya que este aumenta con el tamao muestral. El valor absoluto de
2 no permite tener una idea clara de la fuerza de la asociacin ya que sus
valores no estn acotados en un intervalo definido.
Un coeficiente que s tiene la propiedad de que sus valores varen dentro de
un intervalo es el COEFICIENTE DE CONTINGENCIA.

Coeficiente de contingencia

El valor de este coeficiente nunca ser inferior a 0 ni superior a 1. El 0


corresponder a ausencia de asociacin, con 2 = 0. No en todos los casos
la dependencia extrema necesariamente debe dar 1, depender del nmero
de categoras k.
C aptulo 6 Pgina 475

Coeficiente de contingencia (C)

El coeficiente de contingencia se utiliza para saber la asociacin de variables


cualitativas NOMINALES, que tienen dos o ms categoras. Este coeficiente
requiere del clculo previo del estadstico 2 de Pearson.

Cmx =
k-1
k C= 2
2 + n
Donde:
C = coeficiente de contingencia.
2 = valor de chi-cuadrado de Pearson calculado previamente.
n = tamao o nmero de la muestra.

C=0 Significa que NO hay asociacin.


C > 0,30 Indica una buena asociacin entre las variables.
Cmx No alcanza el valor 1 aunque las dos variables estn totalmente
relacionadas.
C aptulo 6 Pgina 476

Coeficiente de contingencia (C)


El coeficiente de contingencia se utiliza para saber la asociacin de variables
cualitativas NOMINALES, que tienen dos o ms categoras. Este coeficiente
requiere del clculo previo del estadstico 2 de Pearson.

C= 2
2 + n
Cajustado =
Cmx =
k-1
k
C aptulo 6 Pgina 477

La ADHERENCIA al curso de bioestadstica depende del


modelo docente utilizado (presencial, semipresencial o
online)?

Cursos semipresenciales

Presencial Online (a distancia)


C aptulo 6 Pgina 478

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer

Coeficiente de contingencia

Lambda

Tau de Goodman y Kruskal

Coeficiente de incertidumbre
C aptulo 6 Pgina 479

Variable predictora TIPO DE CURSO


Variable resultado PRESENCIAL ONLINE semiPRESENCIAL
Adherencia al curso
Seguimiento 190 170 180
Abandonos 10 (5%) 30 (15%) 20 (10%)
Total 200 200 200

2Pearson= 11,11 p = 0,004 Existe asociacin

Ha: La adherencia al curso es dependiente del tipo de modalidad de enseanza empleado.

El modelo PRESENCIAL se encuentra asociado a una mayor adherencia del alumno al


curso?
C aptulo 6 Pgina 480

El modelo presencial se encuentra asociado a una mayor


adherencia del alumno al curso?
Variable predictora TIPO DE CURSO
Variable resultado PRESENCIAL ONLINE semiPRESENCIAL
Adherencia al curso
Seguimiento 190 170 180
Abandonos 10 (5%) 30 (15%) 20 (10%)
Total 200 200 200

C= 2
2 + n
C= 11,11
11,11 + 600
= 0,135

C < 0,30

Ha: La adherencia al curso es mayor en la modalidad PRESENCIAL.


C aptulo 6 Pgina 481

Nominal por nominal Valor del estadstico Significacin (p)


Coeficiente de contingencia C 0,135 0,004
V de Cramer 0,136 0,004
N de casos vlidos 600 pacientes

Cmx =
k-1
k
Cmx =
3-1
3
= 0,816

0,135
C ajustado = = 0,165 (16,5%)
0,816

Ha: La adherencia al curso es mayor en la modalidad PRESENCIAL.


C aptulo 6 Pgina 482

Decisin: El coeficiente de contingencia como medida de asociacin para una escala


nominal, es una funcin de 2. La decisin de aceptar o rechazar la hiptesis se establece
mediante el valor de 2 = 11,11 con dos grados de libertad, y se obtiene una probabilidad
en su distribucin de p < 0,05. Entonces se acepta Ha y se rechaza Ho; adems, el
coeficiente 0,135 es distinto de 0, aunque muy lejos de su valor mximo (0,816), ya que
slo supone el 16,5% de dicho valor, y tambin est lejos del punto de corte (0,30) por lo
que la asociacin encontrada es dbil.

Grados de libertad = [ K - 1] [F - 1] = [ 3 1] [2 1] = 2

2 = 11,11 p = 0,004

Ho
Ha
AZAR
2
5,99
C aptulo 6 Pgina 483

Interpretacin del coeficiente de contingencia

La asociacin existente entre la ADHERENCIA al curso del alumno y el


tipo de modalidad docente utilizada es verdadera, en la cual conforme
sea el tipo de modalidad empleada, cambia la frecuencia de abandonos
de manera significativa, siendo mayor el porcentaje de abandonos en el
modelo ONLINE, con un valor de coeficiente de contingencia de 0,135.

PRESENCIAL
C aptulo 6 Pgina 484

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer

Coeficiente de contingencia

Lambda

Tau de Goodman y Kruskal

Coeficiente de incertidumbre
C aptulo 6 Pgina 485

Tau de Goodman y Kruskal

Al igual que el coeficiente de incertidumbre y lambda, el coeficiente Tau (de


Goodman y Kruskal) es una medida de asociacin basada en la reduccin
proporcional del error. Es una medida que expresa el grado de incertidumbre
que conseguimos reducir cuando utilizamos una variable para efectuar
pronsticos sobre otra.

Nominal por nominal Valor Tau EE Significacin


Tipo de modalidad de curso variable resultado 0,009 0,005 0,004
Rendimiento del curso variable resultado 0,019 0,010 0,004

Ha: La adherencia al curso es mayor en la modalidad PRESENCIAL.


C aptulo 6 Pgina 486

Coeficiente de incertidumbre

Al igual que el coeficiente Tau y lambda, el coeficiente de incertidumbre es


una medida de asociacin basada en la reduccin proporcional del error. Es
una medida que expresa el grado de incertidumbre que conseguimos reducir
cuando utilizamos una variable para efectuar pronsticos sobre otra.

Nominal por nominal Valor EE T aprox Significacin


Simtrica 0,014 0,008 1,762 0,003
Tipo de modalidad de curso variable 0,009 0,005 1,762 0,003
resultado
Adhesin al curso variable resultado 0,030 0,017 1,762 0,003

Ha: La adherencia al curso es mayor en la modalidad PRESENCIAL.


C aptulo 6 Pgina 487

El RENDIMIENTO acadmico (adquisicin de conocimientos)


al curso de bioestadstica depende del modelo docente
utilizado (presencial, semipresencial o online)?

Cursos semipresenciales

Presencial Online (a distancia)


C aptulo 6 Pgina 488

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer

Coeficiente de contingencia

Lambda

Tau de Goodman y Kruskal

Coeficiente de incertidumbre
C aptulo 6 Pgina 489

El RENDIMIENTO acadmico (adquisicin de conocimientos)


al curso de bioestadstica depende del modelo docente
utilizado (presencial, semipresencial o online)?
Variable predictora TIPO DE CURSO
Variable resultado ONLINE SEMIpresencial PRESENCIAL Total
Evaluacin de los
conocimientos
Aprobados 15 (37,5%) 20 (38,4%) 60 (80%) 95
Suspensos 25 32 15 72
Total 40 52 75 167

2Pearson= 29,68 p = 0,0000004 Existe asociacin

Ha: El rendimiento del curso es dependiente del tipo de modalidad de enseanza


empleado.

El modelo PRESENCIAL se encuentra asociado a un mayor rendimiento del alumno?


C aptulo 6 Pgina 490

El modelo PRESENCIAL se encuentra asociado a un mayor


rendimiento del alumno?
Variable predictora TIPO DE CURSO
Variable resultado ONLINE SEMIpresencial PRESENCIAL Total
Evaluacin de los
conocimientos
Aprobados 15 (37,5%) 20 (38,4%) 60 (80%) 95
Suspensos 25 32 15 72
Total 40 52 75 167

C= 2
2 + n
C= 29,68
29,68 + 167
= 0,388
C > 0,30

Ha: El rendimiento del curso es mayor en la modalidad PRESENCIAL.


C aptulo 6 Pgina 491

Nominal por nominal Valor del estadstico Significacin (p)


Coeficiente de contingencia C 0,388 0,000
V de Cramer 0,421 0,000
N de casos vlidos 167 alumnos

Cmx =
k-1
k
Cmx =
3-1
3
= 0,816

0,388
C ajustado = = 0,475 (47,5%)
0,816

Ha: El rendimiento del curso es mayor en la modalidad PRESENCIAL.


C aptulo 6 Pgina 492

Decisin: El coeficiente de contingencia como medida de asociacin para una escala


nominal, es una funcin de 2. La decisin de aceptar o rechazar la hiptesis se establece
mediante el valor de 2 = 29,68 con dos grados de libertad, y se obtiene una probabilidad
en su distribucin de p < 0,00001, dado que la zona de rechazo es mayor que 0,05.
Entonces se acepta Ha y se rechaza Ho; adems, el coeficiente 0,388 es distinto de
0, aunque no muy lejos de su valor mximo (0,816), ya que supone el 47,5% del valor
mximo.

Grados de libertad = [ K - 1] [F - 1] = [ 3 1] [2 1] = 2

2 = 29,68 p = 0,0000004

Ho
Ha
AZAR
2
5,99
C aptulo 6 Pgina 493

Interpretacin del coeficiente de contingencia

La asociacin existente entre el RENDIMIENTO acadmico del alumno


y el tipo de curso realizado es verdadera, aumentando la frecuencia
de aprobados de manera significativa (p < 0,00001) en el modelo
PRESENCIAL, con un elevado valor de coeficiente de contingencia de
0,388 (C > 0,30).

PRESENCIAL
C aptulo 6 Pgina 494

Coeficiente Lambda

Al igual que el coeficiente de incertidumbre, lambda es una medida que


expresa el grado de incertidumbre que conseguimos reducir cuando
utilizamos una variable para efectuar pronsticos sobre otra. Lambda tiene
tres versiones dos asimtricas (cuando conocemos la variable predictora y la
resultado) y una simtrica cuando no sabemos cual es la variable predictora y
cual es la variable resultado).

Nominal por nominal Valor EE T aprox Significacin


Simtrica 0,238 0,077 2,801 0,005
Tipo de modalidad de curso variable 0,185 0,067 2,527 0,012
resultado
Adhesin al curso variable resultado 0,306 0,111 2.331 0,020

Ha: El rendimiento del curso es dependiente del tipo de modalidad de enseanza


empleado.
C aptulo 6 Pgina 495

Tau de Goodman y Kruskal

Al igual que el coeficiente de incertidumbre y lambda, el coeficiente Tau (de


Goodman y Kruskal) es una medida de asociacin basada en la reduccin
proporcional del error. Es una medida que expresa el grado de incertidumbre
que conseguimos reducir cuando utilizamos una variable para efectuar
pronsticos sobre otra.

Nominal por nominal Valor Tau EE Significacin


Tipo de modalidad de curso variable resultado 0,103 0,034 0,000
Rendimiento del curso variable resultado 0,178 0,057 0,000

Ha: El rendimiento del curso es dependiente del tipo de modalidad de


enseanza empleado.
C aptulo 6 Pgina 496

Coeficiente de incertidumbre

Al igual que el coeficiente Tau y lambda, el coeficiente de incertidumbre es


una medida de asociacin basada en la reduccin proporcional del error. Es
una medida que expresa el grado de incertidumbre que conseguimos reducir
cuando utilizamos una variable para efectuar pronsticos sobre otra.

Nominal por nominal Valor EE T aprox Significacin


Simtrica 0,106 0,036 2,958 0,000
Tipo de modalidad de curso variable 0,087 0,030 2,958 0,000
resultado
Adhesin al curso variable resultado 0,136 0,046 2,958 0,000

Ha: El rendimiento del curso es dependiente del tipo de modalidad de enseanza


empleado.
C aptulo 6 Pgina 497

Pregunta de investigacin
El resultado del tratamiento depende del frmaco empleado?
La condicin de asintomtico se encuentra asociado al uso de
Mosaprida?

Variable PREDICTORA Variable RESULTADO


Cualitativa policotmica Cualitativa policotmica
- Metoclopramida (n = 99) - Asintomtico
- Cisaprida (n = 102) - Sntomas
- Mosaprida (n = 99) - Mejora clnica

Cul es el test estadstico ms adecuado?


C aptulo 6 Pgina 498

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer

Coeficiente de contingencia

Lambda

Tau de Goodman y Kruskal

Coeficiente de incertidumbre
C aptulo 6 Pgina 499

El resultado del tratamiento depende del frmaco empleado?

Variable RESULTADO Resultado del tratamiento a la


semana
Tipo de medicamento Asintomtico Sintomtico Mejora
Metoclopropamida 24 (8%) 54 (18%) 21 (7%)
Cisaprida 27 (9%) 18 (6%) 57 (19%)
Mosaprida 51 (17%) 27 (9%) 21 (7%)

2Pearson= 60,12 p = 0,000 Existe asociacin

Ha: El resultado del tratamiento depende del frmaco empleado.

La condicin de asintomtico se encuentra asociada al uso de Mosaprida?

Coeficiente Lambda
C aptulo 6 Pgina 500

Coeficiente Lambda

Al igual que el coeficiente de incertidumbre, lambda es una medida que


expresa el grado de incertidumbre que conseguimos reducir cuando
utilizamos una variable para efectuar pronsticos sobre otra. Lambda tiene
tres versiones dos asimtricas (cuando conocemos la variable predictora y la
resultado) y una simtrica cuando no sabemos cual es la variable predictora y
cual es la variable resultado).

Nominal por nominal Valor EE T aprox Significacin


Simtrica 0,303 0,048 5,814 0,000
Tipo de Frmaco variable resultado 0,303 0,052 5,108 0,000
Resultado del tratamiento a la semana 0,303 0,054 4,899 0,000
variable resultado

Ha: La condicin de asintomtico se encuentra asociada al uso de Mosaprida.


C aptulo 6 Pgina 501

Nominal x Nominales (Tablas > 2 x 2)


V de Cramer

Coeficiente de contingencia

Lambda

Tau de Goodman y Kruskal

Coeficiente de incertidumbre
C aptulo 6 Pgina 502

Pregunta de investigacin
El resultado del tratamiento depende del frmaco empleado?
La condicin de asintomtico se encuentra asociada al uso de
Mosaprida?

Variable PREDICTORA Variable RESULTADO


Cualitativa policotmica Cualitativa policotmica
- Metoclopramida (n = 99) - Asintomtico
- Cisaprida (n = 102) - Sntomas
- Mosaprida (n = 99) - Mejora clnica

Cul es el test estadstico ms adecuado?


C aptulo 6 Pgina 503

El resultado del tratamiento depende del frmaco empleado?

Variable RESULTADO Resultado del tratamiento a la


semana
Variable PREDICTORA Asintomtico Sintomtico Mejora
Tipo de medicamento
Metoclopropamida 24 (8%) 54 (18%) 21 (7%)
Cisaprida 27 (9%) 18 (6%) 57 (19%)
Mosaprida 51 (17%) 27 (9%) 21 (7%)

2Pearson= 60,12 p = 0,000 Existe asociacin

Ha: El resultado del tratamiento depende del frmaco empleado.

La condicin de asintomtico se encuentra asociada al uso de Mosaprida?

Coeficiente de incertidumbre
C aptulo 6 Pgina 504

Coeficiente de incertidumbre

Al igual que el coeficiente Tau y lambda, el coeficiente de incertidumbre es


una medida de asociacin basada en la reduccin proporcional del error. Es
una medida que expresa el grado de incertidumbre que conseguimos reducir
cuando utilizamos una variable para efectuar pronsticos sobre otra.

Nominal por nominal Valor EE T aprox Significacin


Simtrica 0,086 0,023 3,801 0,000
Tipo de Frmaco variable resultado 0,086 0,023 3,801 0,000
Resultado del tratamiento a la semana 0,086 0,023 3,801 0,000
variable resultado

Ha: La condicin de asintomtico se encuentra asociada al uso de Mosaprida.


C aptulo 6 Pgina 505

Odds Ratio (OR)

Enfermedad (Variable resultado)


Exposicin (Variable predictora) Casos Controles
(+) A B
(-) C D
Tasa de exposicin
Tasa de exposicin
observada en los CASOS
observada en los CASOS
A: Personas enfermas que estn expuestas OR
OR ==Tasa de exposicin observada en
Tasa de exposicin observada en
B: Personas sanas que estn expuestas los CONTROLES
los CONTROLES
C: Personas enfermas que no estn
expuestas [ [AA/ /CC] ]
D: Personas sanas que no estn expuestas
OR
OR ==
[ [BB/ /DD] ]

[ [(A
(A**D)
D)] ]
OR
OR == [ [(B
(B**C)
C)] ]
C aptulo 6 Pgina 506

Caractersticas de la Odds Ratio (OR)


- Medida de asociacin.
- Valores mayores de 1 (asociacin positiva) (factor de riesgo).
- Valores menores de 1 (asociacin negativa) (factor de proteccin).
- Valor = 1 (no existe asociacin).
- Estudios casos-controles.
- OR: es la razn entre la probabilidad de que un suceso ocurra y la
probabilidad de que no ocurra.
- OR : cociente entre la tasa de exposicin observada en el grupo de casos
(A/C) y la tasa de exposicin observada en el grupo control (B/D).
- OR: refleja la probabilidad de que los casos (cncer de pulmn) estn
expuestos al factor de estudio (tabaco) comparada con la probabilidad de que
lo estn los controles.
C aptulo 6 Pgina 507

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe entre la
cloracin del agua y el cncer de vejiga?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA dicotmica CUALITATIVA dicotmica
Cloracin del agua Cncer de vejiga

Cul es el test estadstico ms adecuado?


C aptulo 6 Pgina 508

Odds Ratio (OR)

Cncer de vejiga
Exposicin Casos Controles
Cloracin (+) A B
Cloracin (-) C D
TasaTasa de exposicin
de CLORACIN observada en los
enfermos de CANCER
observada en losdeCASOS
vejiga (casos)

A: Personas enfermas de cncer de vejiga OR


OR ==TasaTasadedeCLORACIN
exposicin observada
observadaen
expuestas al cloro los en
CONTROLES
SANOS (controles)

B: Personas sanas expuestas al cloro


C: Personas enfermas de cncer de vejiga no [A/C]
expuestas al cloro
D: Personas sanas no expuestas al cloro OR =
[B/D]

[ (A * D) ]
OR =
[ (B * C) ]
C aptulo 6 Pgina 509

Influencia de la metodologa de la evaluacin


de la exposicin
C aptulo 6 Pgina 510

Rodrguez Calabuig D, Igual Adell R, Oltra Alcaraz C, Snchez Snchez P, Bustamante Balen M, Parra
Godoy F y Nagore Enguidanos E. Actividad laboral agrcola y estrongiloidiasis. Estudio caso-control. Rev
Cln Esp 2001; 201:81-84
C aptulo 6 Pgina 511

Ejemplo de uso de la OR:


Estudio caso-control

- CASOS: Individuos con Strongiloides stercolaris en las heces ante la


presencia de eosinofilias en el hemograma.

- CONTROLES: Individuos de igual edad y sexo sin eosinofilia ni parsitos en


heces.

Rodrguez Calabuig D, Igual Adell R, Oltra Alcaraz C, Snchez Snchez P, Bustamante Balen M, Parra
Godoy F y Nagore Enguidanos E. Actividad laboral agrcola y estrongiloidiasis. Estudio caso-control. Rev
Cln Esp 2001; 201:81-84.
C aptulo 6 Pgina 512

Odds Ratio (OR)


Ejemplo estudio caso-control
C aptulo 6 Pgina 513

Odds Ratio (OR)


Ejemplo estudio caso-control
C aptulo 6 Pgina 514

Actividad laboral agrcola y estrongiloidiasis


Estudio caso-control
Discusin

Un gran nmero de personas trabajaban descalzas en la siembra, cuidando y


recolectando el arroz, con los pies hundidos en el fango durante largos perodos de tiempo,
lo que facilitara la entrada del nematodo. Los resultados obtenidos, especificando el tipo
de actividad, muestran una asociacin de la estrongiloidiasis con el cultivo de arroz OR de
2,97 (IC 95%: 1,16-7,71), lo que representa un mayor riesgo de infestacin. En la limpieza
de acequias se obtuvo tambin una tendencia casi significativa OR de 2,39 (IC 95%:
0,85-6,82), en cambio en el cultivo de ctricos y de hortalizas, que habitualmente no se
realizaban descalzos ni en tierras fangosas, no se han encontrado estas diferencias.

Rodrguez Calabuig D, Igual Adell R, Oltra Alcaraz C, Snchez Snchez P, Bustamante Balen M, Parra
Godoy F y Nagore Enguidanos E. Actividad laboral agrcola y estrongiloidiasis. Estudio caso-control. Rev
Cln Esp 2001; 201:81-84.
C aptulo 6 Pgina 515

Mito 1: La sonrisa de la esfinge


En las tablas 1 y 2 presentadas se han incluido slo el valor de la OR y su IC95%, pero
no se ha incluido el valor del estadstico (test de contraste de hiptesis) ni la significacin
estadstica p para cada variable predictora presuntamente significativa.

Cul es el valor de la p?
Por qu dices que la prctica de la limpieza de acequias est relacionada con la
estrongiloidiasis cuando el valor del IC95% de la OR incluye a la unidad?
Cul es el test de contraste de hiptesis que has empleado en cada asociacin?
Test de 2 Pearson
He calculado el valor del estadstico 2 Pearson NO hay la significacin estadstica.
Ser un error beta ?
Cul es la potencia estadstica del estudio (valor )?
C aptulo 6 Pgina 516

Qu relacin y qu medida de asociacin existe entre la


prctica del cultivo de arroz y la estrongiloidiasis?

Test de 2 de Pearson Variable RESULTADO


Estrongiloidiasis
Variable PREDICTORA Casos Controles Total
Cultivo de arroz
Si 25 (53%) 13 (28%) 38
No 22 34 56
Total 47 47 94

2Pearson = 6,36; p = 0,012 OR = 2,97 (1,16-7,71)


Q de Yule = 0,50
C aptulo 6 Pgina 517

Resumen del procesamiento informtico de los datos

Clculos del programa estadstico tabla Valor Grados de Contraste Contraste


2x2 libertad bilateral unilateral
2Pearson 6,361 1 0,012
Correccin de Yates 5,345 1 0,021
Razn de verosimilitud 6,447 1 0,011
Test exacto de Fisher 0,020 0,010
N Casos vlidos 94

Ho (hiptesis nula) = La prctica del cultivo de arroz NO est asociada a la estrongiloidiasis


en el grupo estudiado.

Ha (hiptesis alternativa) = La prctica del cultivo de arroz est asociada a la


estrongiloidiasis en el grupo estudiado.
C aptulo 6 Pgina 518

Test de 2 de Pearson (1 grado de libertad)

2Pearson calculado = 6,36 > 2Pearson tabulado = 3,84

AZAR

Ha (hiptesis alternativa) = Existe relacin entre la


prctica del cultivo de arroz y la estrongiloidiasis.

2 = 6,36
Error alfa

Ho Ha
2
AZAR 2Pearson tabulado = 3,84
C aptulo 6 Pgina 519

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe entre la
prctica del cultivo del arroz y la estrongiloidiasis?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA dicotmica CUALITATIVA dicotmica
Cultivo de arroz Estrongiloidiasis

OR = 2,97
IC95% = 1,16 7,71
2Pearson = 6,36; p = 0,012 Q de Yule = 0,50
C aptulo 6 Pgina 520

Qu relacin y qu medida de asociacin existe entre la


prctica de la limpieza de acequias y la estrongiloidiasis?

Test de 2 de Pearson Variable RESULTADO


Estrongiloidiasis
Variable PREDICTORA Casos Controles Total
Limpieza de acequia
Si 17 (36%) 9 (19%) 26
No 30 38 68
Total 47 47 94

2 = 3,40 ; p = 0,065 No existe asociacin


C aptulo 6 Pgina 521

Resumen del procesamiento informtico de los datos

Clculos del programa estadstico tabla Valor Grados de Contraste Contraste


2x2 libertad bilateral unilateral
2Pearson 3,403 1 0,065
Correccin de Yates 2,605 1 0,107
Razn de verosimilitud 3,445 0,063
Test exacto de Fisher 1 0,106 0,053
N Casos vlidos 94

Ho (hiptesis nula) = La limpieza de acequias NO est asociada a la


estrongiloidiasis en el grupo estudiado.

Ha (hiptesis alternativa) = La limpieza de acequias est asociada a la


estrongiloidiasis en el grupo estudiado.
C aptulo 6 Pgina 522

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe entre la
prctica de la limpieza de acequias y la estrongiloidiasis?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA dicotmica CUALITATIVA dicotmica
Limpieza de acequias Estrongiloidiasis

OR = 2,39
IC95% = 0,85 - 6,82
2 = 3,40 ; p = 0,065 Q de Yule = 0,41
C aptulo 6 Pgina 523

Test de 2 de Pearson (1 grado de libertad)

2Pearson calculado = 3,40 < 2Pearson tabulado = 3,84

AZAR
Ho (hiptesis nula) = NO existe relacin entre la prctica
de la limpieza de acequias y la estrongiloidiasis.

2 = 3,40 Grados de libertad = [ K - 1] [F - 1] = (2-1) (2 -1) = 1

Error alfa

Ho Ha
2
AZAR 2Pearson tabulado = 3,84
C aptulo 6 Pgina 524

Riesgo Relativo (RR)

Enfermedad (E)
Exposicin (F) Casos Controles
Tabaco (+) A B
Tabaco (-) C D

[ A / (A + B)]
A: Personas enfermas de cncer de pulmn
RR =
fumadoras [ C / (C + D) ]
B: Personas sanas fumadoras
A<< B C<< D
C: Personas enfermas de cncer de pulmn
no fumadores A+ B B C+D D
D: Personas sanas no fumadoras
[ (A * D) ]
RR =
[ (B * C) ]
Es la probabilidad de que una enfermedad (E) se desarrolle en el
grupo expuesto (F) en relacin a la del grupo no expuesto.
C aptulo 6 Pgina 525

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe entre la
exposicin al humo del tabaco durante la gestacin y el bajo
peso al nacimiento del RN?
Variable PREDICTORA Variable RESULTADO
CUALITATIVA dicotmica CUALITATIVA dicotmica
Exposicin al humo del Peso del RN
tabaco

RR = 2,71 (1,38-5,34)
Q de Yule = 0,47
2Pearson= 9.03; p = 0.00265

Martn TR, Bracken MB. Association of low birth weight with passive smoke exposure in
pregnancy. Am J. Epidemiol 1986; 124: 633-642.
C aptulo 6 Pgina 526

Riesgo Relativo (RR)


En la Tabla, exponemos los resultados
de un estudio de seguimiento donde
Enfermedad (E) 853 mujeres estuvieron pasivamente
expuestas al humo del tabaco durante
Exposicin (F) Casos Controles
la gestacin y 1620 no lo estuvieron,
Tabaco (+) A (20) B (833) y su asociacin con el bajo peso al
Tabaco (-) C (14) D (1606) nacer.

2 = 9.03; p = 0.00265
95% IC (1.38;5.34)
A: RN de bajo peso de madres expuestas al
Q de Yule = 0,47
tabaco
B: RN normopeso de madres expuestas al Ie 20/853
RR = = = 2,713
tabaco Io 14/1620
C: RN de bajo paso de madres NO expuestas
al tabaco
D: RN normopeso de madres NO expuestas El RR es 2.71, significa que las
expuestas al factor F (exposicin
al tabaco pasiva al tabaco) tienen 2,71 veces
ms probabilidades de tener nios de
bajo peso que las no expuestas.

Martn TR, Bracken MB. Association of low birth weight with passive smoke exposure in pregnancy. Am J.
Epidemiol 1986; 124: 633-642.
C aptulo 6 Pgina 527

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe entre el
sedentarismo (factor de riesgo) y el desenlace (muerte) en
pacientes que han sufrido un IAM?
Variable PREDICTORA Variable RESULTADO
CUALITATIVA dicotmica CUALITATIVA dicotmica
Ejercicio moderado/ Muerte / Supervivencia
Sedentarismo

100 pacientes
con IAM
C aptulo 6 Pgina 528

Evolucin de 100 pacientes con IAM a los 5 aos en funcin del ejercicio fsico realizado.
Existe asociacin entre el factor de riesgo (SEDENTARISMO) y el desenlace (MUERTE)?
Cul es la magnitud de dicha asociacin?

Seguimiento
Sedentarios 5 aos Fallecimientos A = 15
N = 40
Sobrevivientes B = 25
100 pacientes
con IAM
Fallecimientos C = 10
Ejercicio
moderado Seguimiento
N = 60 Sobrevivientes D = 50
5 aos
C aptulo 6 Pgina 529

Evolucin de 100 pacientes Desenlace (E) Existe asociacin entre el factor


con IAM a los 5 aos en Variable resultado de riesgo (SEDENTARISMO) y el
funcin del ejercicio fsico desenlace (MUERTE)?
Exposicin (F) Variable Muerte Sobreviviente
predictora
Sedentarismo (+) A = 15 B = 25
Sedentarismo (-) C = 10 D = 50

100 pacientes con IAM

A: Fallecidos con sedentarismo


B: Sobrevivientes sedentarios
C: Fallecidos deportistas
D: Sobrevivientes deportistas

Cul es la prueba estadstica ms adecuada?


C aptulo 6 Pgina 530

Test de 2 de Pearson
Clculos del Valor Grados de libertad Contraste bilateral Contraste unilateral
programa
estadstico
2Pearson (*) 5,56 1 0,018
Correccin de 4,50 1 0,034
Yates
Razn de 5,47 0,019
verosimilitud
Test exacto de 1 0,033 0,017
Fisher
N Casos vlidos 100

Ha: Existe asociacin entre el factor de riesgo (SEDENTARISMO) y el desenlace


(MUERTE).
C aptulo 6 Pgina 531

2 = 5,56

Error alfa
Ho Ha
2

AZAR 2Pearson tabulado = 3,84

2Pearson
2Pearson calculado = 5,56 >2Pearson= 43,99; = 3,84
p<0,0000001
tabulado Existe asociacin p < 0,05
C aptulo 6 Pgina 532

Evolucin de 100 pacientes Desenlace (E)


con IAM a los 5 aos en Variable resultado
funcin del ejercicio fsico
Exposicin (F) Variable Muerte Sobreviviente
predictora
Sedentarismo (+) A = 15 B = 25
Sedentarismo (-) C = 10 D = 50

Cul es la intensidad o
100 pacientes con IAM magnitud de dicha asociacin?

A: Fallecidos con sedentarismo


[ A / (A + B)]
B: Sobrevivientes sedentarios RR =
C: Fallecidos deportistas [ C / (C + D) ]
D: Sobrevivientes deportistas

Es la probabilidad de morir (E) en el grupo de sedentarios (expuestos al factor de riesgo) en relacin con la
probabilidad de muerte en deportistas (grupo no expuesto).
C aptulo 6 Pgina 533

Tasa de Incidencia de muertes en


sedentarios (en expuestos) Ie
Riesgo Relativo (RR) = RR =
Tasa de Incidencia de muertes Io
en deportistas ( NO expuestos )

[ A / (A + B)] [ 15 / (15 + 25)]


RR = RR = = 2,25
[ C / (C + D) ] [ 10 / (10 + 50) ]

RR = 2,25
Q de Yule = 0,50
2Pearson= 5,56; p = 0,018
C aptulo 6 Pgina 534

Pregunta de investigacin
Qu relacin y qu medida de asociacin existe entre el
ejercicio fsico moderado (factor de riesgo) y el desenlace
(muerte) en pacientes que han sufrido un IAM?
Variable PREDICTORA Variable RESULTADO
CUALITATIVA dicotmica CUALITATIVA dicotmica
Ejercicio moderado/ Muerte / Supervivencia
Sedentarismo

100 pacientes
con IAM
C aptulo 6 Pgina 535

Evolucin de 100 pacientes con IAM a los 5 aos en funcin del ejercicio fsico realizado.
Existe asociacin entre el factor de riesgo (EJERCICIO FSICO) y el desenlace
(MUERTE)? Cul es la magnitud de dicha asociacin?

Seguimiento
Ejercicio 5 aos Fallecimientos C = 10
moderado
N = 60 Sobrevivientes D = 50
100 pacientes
con IAM
Fallecimientos A = 15
Sedentarios
N = 40 Seguimiento
Sobrevivientes B = 25
5 aos
C aptulo 6 Pgina 536

Evolucin de 100 pacientes Desenlace (E)


con IAM a los 5 aos en Variable resultado
funcin del ejercicio fsico
Exposicin (F) Variable Muerte Sobreviviente
predictora
Ejercicio fsico (+) A = 10 B = 50
Ejercicio fsico (-) C = 15 D = 25

100 pacientes con IAM

A: Fallecidos con ejercicio fsico moderado


[ A / (A + B)]
B: Sobrevivientes con ejercicio fsico RR =
moderado [ C / (C + D) ]
C: Fallecidos sedentarios (NO deportistas)
D: Sobrevivientes sedentario (NO deportistas)

Es la probabilidad de morir (E) en el grupo de deportistas (expuestos al factor de riesgo) en relacin con la
probabilidad de muerte en sedentarios -NO deportistas- (grupo no expuesto).
C aptulo 6 Pgina 537

Tasa de Incidencia de muertes en


deportistas moderados (en expuestos) Ie
Riesgo Relativo (RR) = RR =
Tasa de Incidencia de muertes
en sedentarios ( NO expuestos )
Io

[ A / (A + B)] [ 10 / (10 + 50)]


RR = RR = = 0,44
[ C / (C + D) ] [ 15 / (15 + 25) ]

RR = 0,44
Q de Yule = - 0,50
2Pearson= 5,56; p = 0,018
C aptulo 6 Pgina 538

Evolucin de 100 pacientes operados con una NUEVA tcnica quirrgica frente a 100
pacientes operados con la tcnica CLSICA.

Seguimiento
Nueva tcnica quirrgica Complicaciones A = 15
Grupo problema
N= 100 Sin complicaciones B = 85

Complicaciones C = 20
Tcnica clsica
Grupo Control
Seguimiento
N = 100 Sin complicaciones D = 80
C aptulo 6 Pgina 539

Tasa de Incidencia de complicaciones


con la NUEVA tcnica Ie
Riesgo Relativo (RR) = RR =
Tasa de Incidencia de Io
complicaciones con la tcnica
CLASICA

[ A / (A + B)] [ 15 / (15 + 85)]


RR = RR = = 0,75
[ C / (C + D) ] [ 20 / (20 + 80) ]

RR = 0,75

RRR = [ 1 RR ] * 100 RRR = 25%

RRA = [ IN IC ] * 100 RRA = 5%


C aptulo 6 Pgina 540

Evento en estudio
Frmula Complicaciones quirrgicas
Incidencia de complicaciones 15%
quirrgicas con la NUEVA I N = [ A / (A + B)]
tcnica
Incidencia de complicaciones 20%
quirrgicas con la tcnica I C = [ C / (C + D) ]
CLSICA
RIESGO RELATIVO (RR) [ A / (A + B)] 0,75
RR =
[ C / (C + D) ]

Reduccin del RIESGO RRR = [ 1 RR ] * 100 25%


RELATIVO (RRR)
Reduccin ABSOLUTA del 5%
RAR = [ IN IC ] * 100
RIESGO (RAR)
Nmero de pacientes que se 20
NNT = [ 1 / RAR ] * 100
necesita operar (NNT)
C aptulo 6 Pgina 541

Escenario clnico: Un da muy ocupado en su centro y usted esta sentado


con la piernas en alto, hojeando un nmero reciente de Mdicos en su
tiempo libre. Se encuentra con un anuncio dePLAVIX que indica que este
medicamento produce una reduccin del riesgo de eventos cardiovasculares
en un 8% comparado con aspirina. Usted piensa si debera cambiar todos sus
pacientes a Plavix .

Eventos resultantes del anlisis del estudio CAPRIE


PLAVIX ASPIRINA DIFERENCIA
Pacientes 9599 9586
ICTUS 4,6% 4,8% - 0,2%
IAM 2,9% 3,5% - 0,6%
Otras muertes vasculares 2,4% 2,4% 0%
Total de eventos vasculares 9,8% 10,7% - 0,9%

Como se muestra en el cuadro PLAVIX se asoci con una menor incidencia


de eventos resultantes de cualquier clase. La reduccin del Riesgo Relativo
fue de 8,7% con un IC95% = 0,3-16,5% p=0,045. Sin embargo la reduccin
del riesgo absoluto (9,8% contra 10,7%) fue de tan slo 0,9%.
C aptulo 6 Pgina 542

Aparicin de eventos cardiovasculares despus de un periodo de seguimiento en pacientes


tratados con PLAVIX (grupo problema) frente a los pacientes tratados con ASPIRINA
(grupo control).

Grupo problema Iplavix = 9,8 Eventos cardiovasculares A


PLAVIX
Seguimiento Sin eventos B

Eventos cardiovasculares C
Grupo control Seguimiento
ASPIRINA
Iaspirina = 10,7 Sin eventos D
C aptulo 6 Pgina 543

Tasa de Incidencia de eventos


cardiovasculares con el PLAVIX IP
Riesgo Relativo (RR) = RR =
Tasa de Incidencia de eventos IA
cardiovasculares con ASPIRINA

IP 9,8
RR = = = 0,916 RR = 0,916
IA 10,7

RRR = [ 1 RR ] * 100 RRR = 8,7%


IC95% = 0,3-16,5% p = 0,045

RAR = [ IP IA ] * 100 RAR = 0,9%

NNT = [ 1 / RAR ] * 100 NNT = 111 pacientes


C aptulo 6 Pgina 544

Evento en estudio
Frmula Complicaciones quirrgicas
Incidencia de eventos 9,8%
cardiovasculares con el PLAVIX
I Plavix= [ A / (A + B)]
Incidencia de eventos 10,7%
cardiovasculares con la I Aspirina = [ C / (C + D) ]
ASPIRINA
RIESGO RELATIVO (RR) 0,916
[ A / (A + B)]
RR =
[ C / (C + D) ]

Reduccin del RIESGO RRR = [ 1 RR ] * 100 8,7%


RELATIVO (RRR)
Reduccin ABSOLUTA del RAR = [ IN IC ] * 100 0,9%
RIESGO (RAR)
Nmero de pacientes que se 111
necesita operar (NNT) NNT = [ 1 / RAR ] * 100
Aumento del coste mensual del Ensayo CAPRIE (Lancet) + 112 $ (94 )
Plavix respecto a la aspirina
C aptulo 6 Pgina 545

Resolucin del escenario

El 8,7% de reduccin del riego que publica el artculo es la Reduccin del Riesgo
Relativo (RRR). La Reduccin Absoluta del Riesgo (RAR) fue un ridculo 0,9%, con
un NNT muy elevado (111),con un amplio IC95% (de 57 a 2500).El resultado fue
estadsticamente significativo casi marginalmente, p = 0,045, donde el IC95% de la RRR
fue del 0.3% al 16.5%, que ni siquiera apareca en el texto (slo a pie de tabla). Aunque es
estadsticamente significativo, sin embargo la significacin CLNICA es muy cuestionable.
La RRR del 8,7% de Plavix frente a aspirina se dibuja en un grfico con una rea que es
casi igual que la del 25% del RRR de la aspirina frente al placebo, violando claramente
de la ley de Tufte (factor mentiroso de Tufte = Tamao del efecto mostrado en el grfico /
Tamao del efecto en los datos 1).
La publicacin es un estudio real, el ensayo CAPRIE publicado en Lancet, y sin embargo,
despus de todo usted lgicamente decide, ahorrarles a sus pacientes y a la Seguridad
Social los 112 dlares (94) al mes que cuesta Plavix y seguir tratando a sus pacientes con
aspirina.
C aptulo 6 Pgina 546

Objetivo: Evaluar la eficacia de la disminucin de colesterol con simvastatina en la reduccin de la


mortalidad y morbilidad en pacientes con enfermedad coronaria (EC).
Diseo: Ensayo clnico controlado, aleatorizado en dos ramas, a doble ciego con placebo y un seguimiento
medio de 5,4 aos.
mbito: Pacientes procedentes de 95 centros mdicos de Escandinavia.
Sujetos de estudio: 4.444 pacientes de entre 35 y 70 aos, 81% hombres, 51% mayores de 60 aos, con
antecedentes de infarto de miocardio previo a angina de pecho, colesterol srico de 5,5 a 8,8 mmol/l,
concentraciones medias de HDL de 1,18 mmol/l, LDL 4,87 mmol/l, triglicridos 1,50 mmol/l y dieta
hipolipemiante concurrente.
Intervencin: 2.223 sujetos se les administraron 20 mgr de simvastatina y a 2.221 el correspondiente
placebo.
Parmetros principales de eficacia: Mortalidad total, mortalidad de causa coronaria, infarto de miocardio no
letal probable o definitivo verificado.
Resultados principales: Durante los 5,4 aos en promedio de seguimiento la simvastatina produjo unos
cambios medios de colesterol total, LDL colesterol y HDL colesterol de 25%, -35% y +8%,
respectivamente. 256 (12%) sujetos en el grupo de placebo murieron en comparacin con 182 (8%) en
el grupo de simvastatina. Hubo 189 muertes de origen coronario en el grupo de placebo y 111 en el de
simvastatina y 49 y 46 muertes de origen no cardiovascular en dichos grupos, respectivamente. 622 sujetos
(28%) en el grupo con placebo y 431 (19%) en el de simvastatina tuvieron uno o ms incidentes coronarios
mayores.
Conclusiones: La disminucin de la concentracin de colesterol con simvastatina reduce la mortalidad
total y la incidencia de incidentes cardiovasculares mayores.

Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the Scandivarian
Simvastatin Survival Study (4S). Lancet 1994; 334: 1383-1389.
C aptulo 6 Pgina 547

Incidentes coronarios
Grupo problema ISimvastatina = 19%
mayores A = 431
SIMVASTATINA
N = 2223 Sin eventos B
Seguimiento
medio 5,4 aos Incidentes coronarios
Grupo control mayores C = 622
PLACEBO
N = 2221 IPlacebo = 28% Sin eventos D

Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the
Scandivarian Simvastatin Survival Study (4S). Lancet 1994; 334: 1383-1389.
C aptulo 6 Pgina 548

Muertes de origen NO
cardiovascular 46
Muertes de origen
Grupo problema cardiovascular A = 111
SIMVASTATINA
ISimvastatina = 8%
N = 2223 Sin eventos B
Muertes de origen NO
cardiovascular 49 Muertes de origen
Grupo control cardiovascular C = 189
PLACEBO
IPlacebo = 12% Sin eventos D
N = 2221

Seguimiento
medio 5,4 aos

Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the
Scandivarian Simvastatin Survival Study (4S). Lancet 1994; 334: 1383-1389.
C aptulo 6 Pgina 549

Simvastatina Placebo RR RRR RAR NNT


Incidencia Incidencia IS IP

[ 1 / RAR ] * 100
[ 1 RR ] * 100
en tratados en tratados IS
con con RR =
Simvastatina placebo
IS IP IA

Incidentes 19% 28% 0,68 32% 9% 11


cardiovasculares
mayores

Mortalidad 8% 12% 0,66 33% 4% 25

Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the
Scandivarian Simvastatin Survival Study (4S). Lancet 1994; 334: 1383-1389.
C aptulo 6 Pgina 550

Recurrencia de accidentes
vasculares cerebrales de ori-
Prdidas
gen isqumico o muerte
Grupo problema 196
WARFARINA
N = 1103 IWarfarina = 17,8
Sin eventos

Recurrencia de accidentes
vasculares cerebrales de ori-
Prdidas gen isqumico o muerte
Grupo control 176
ASPIRINA
N = 1103 IAspirina = 16,0
Sin eventos
Seguimiento 2 aos

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.
C aptulo 6 Pgina 551
C aptulo 6 Pgina 552

Tasa de Incidencia de Recurrencia de


accidentes vasculares cerebrales de origen
isqumico o muerte con WARFARINA IW
Riesgo Relativo (RR) = RR =
Tasa de Incidencia de Recurrencia de
accidentes vasculares cerebrales de IA
origen isqumico o muerte con ASPIRINA

17,8
RR = = 1,13
16,0

RR = 1,13 ; IC95% = 0,92 - 1,38 p = 0,25

RRR = [ 1 RR ] * 100 RRR = - 13%

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.
C aptulo 6 Pgina 553

IWarfarina = 2,2 Hemorragias


Prdidas Intensas
Grupo problema 44
WARFARINA
N = 1103 Seguimiento 2 aos Sin eventos

Hemorragias
IAspirina = 1,5 Prdidas Intensas
Grupo control 30
ASPIRINA
N = 1103
Sin eventos
Seguimiento 2 aos

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.
C aptulo 6 Pgina 554

Tasa de Incidencia de HEMORRAGIAS


intensas con WARFARINA 2,2
Riesgo Relativo (RR) = RR =
Tasa de Incidencia de HEMORRAGIAS
intensas con ASPIRINA
1,5

IP
RR = = 1,48
IA

RR = 1,48; IC95%= 0,93-2,44 p = 0,10

RRR = [ 1 RR ] * 100 RRR = - 48%

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.
C aptulo 6 Pgina 555

Warfarina Aspirina RR RRR RAR


Incidencia en Incidencia IW I A

[ 1 RR ] * 100
tratados con en tratados IS IW
WARFARINA con RRRR
= =
IW ASPIRINA IA IA
IA

Incidencia 2,2 1,5 1,48 - 48% 0,7


HEMORRAGIAS
intensas

Adems, tal como comentaban los autores en la discusin del artculo, la


warfarina tiene un coste mayor y requiere una monitorizacin ms estrecha.
Con estos datos, se puede considerar que la warfarina y la aspirina
son alternativas teraputicas razonables para prevenir los accidentes
cerebrovasculares isqumicos recurrentes?

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al.
A comparison of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.
C aptulo 6 Pgina 556

Hemorragias leves
IWarfarina = 20,8 Prdidas 413
Grupo problema
WARFARINA
N = 1103 Seguimiento 2 aos Sin eventos

Hemorragias leves
IAspirina = 12,9 Prdidas 259
Grupo control
ASPIRINA
N = 1103
Sin eventos
Seguimiento 2 aos

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.
C aptulo 6 Pgina 557

Tasa de Incidencia de HEMORRAGIAS


leves con WARFARINA 20,8
Riesgo Relativo (RR) = RR =
Tasa de Incidencia de HEMORRAGIAS 12,9
leves con ASPIRINA

IP
RR = = 1,61
IA

RR = 1,61; IC95%= 1,38-1,89 p < 0,001

RRR = [ 1 RR ] * 100 RRR = - 61%

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al. A comparison
of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.
C aptulo 6 Pgina 558

Warfarina Aspirina RR RRR RAR


Incidencia en Incidencia IW I A

[ 1 RR ] * 100
tratados con en tratados IS IW
WARFARINA con RRRR
= =
IW ASPIRINA IA IA
IA

Incidencia 20,8 12,9 1,61 - 61% 7,9


HEMORRAGIAS leves

Adems, tal como comentaban los autores en la discusin del artculo, la


warfarina tiene un coste mayor y requiere una monitorizacin ms estrecha.
Con estos datos, se puede considerar que la warfarina y la aspirina
son alternativas teraputicas razonables para prevenir los accidentes
cerebrovasculares isqumicos recurrentes?

Mohr JP, Thompson JLP, Lazar RM, Levin B, Sacco RL, Furie KL, et al.
A comparison of warfarin and aspirin for the prevention of recurrent ischemic stroke.
N Engl J Med 2001;345:1444-51.
C aptulo 6 Pgina 559
C aptulo 6 Pgina 560
C aptulo 6 Pgina 561
C aptulo 6 Pgina 562
C aptulo 6 Pgina 563
C aptulo 6 Pgina 564
C aptulo 6 Pgina 565
C aptulo 6 Pgina 566
C aptulo 6 Pgina 567

there were no significant differences between the warfarin and


aspirin groups in the time to the primary end point (p = 0,25 by
two-tailed logrank test; hazard ratio for warfarin as compared with
aspirin, 1.13; 95 percent confidence interval, 0.92 to 1.38; two-year
probability of an event, 17.8 percent with warfarin and 16.0
percent with aspirin) (Table 2 and Fig. 2)
C aptulo 6 Pgina 568

RESULTS (fragmento del texto)


The rates of major hemorrhage were low, with no significant
differences between treatment groups; the annual rates were
2.22 per 100 patient-years for warfarin and 1.49 per 100
patient-years for aspirin (rate ratio, 1.48; p = 0,10). Patients in
the warfarin group had significantly more minor hemorrhages
than did those in the aspirin group (Table 3). There was no
significant difference between groups in the time to the first
occurrence of major hemorrhage or the primary end point (p =
0,16; hazard ratio with warfarin as compared with aspirin, 1.15;
95 percent confidence interval, 0.95 to 1.39) (Table 2).
C aptulo 6 Pgina 569

DISCUSSION (fragmento del texto)

We observed no significant difference between treatment


with warfarin and treatment with aspirin in the prevention of
recurrent ischemic stroke or death or in the occurrence of
serious adverse events in this large cohort of patients with
inferred noncardioembolic ischemic stroke..

Warfarin offered no additional benefit over aspirin in


preventing recurrent ischemic stroke in the population we
studied. Patients with other, established reasons for warfarin
use may take comfort in the evidence of safety and lack of
significant difference overall, as compared with aspirin.
However, aspirin, either alone or in combination with some
other antiplatelet agents, 38 appears to be a well-justified
choice for the prevention of recurrent ischemic stroke.
C aptulo 6 Pgina 570

Mito 1: La sonrisa de la esfinge

Por qu concluyes que la ausencia de evidencia es evidencia de ausencia?

La ausencia de evidencia NO es evidencia de ausencia.

Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ
1995;311:485.

Altman y Bland alertaron sobre un error comn en la bibliografa biomdica:


interpretar un resultado estadsticamente no significativo, cuando se comparan
dos tratamientos, como sinnimo de su equivalencia teraputica.
C aptulo 6 Pgina 571

Mito 1: La sonrisa de la esfinge


En este estudio se comparaba la eficacia de la warfarina y de la aspirina para prevenir las
recurrencias de los accidentes vasculares cerebrales de origen isqumico. Mohr JP, et al
disearon el estudio para poder demostrar una reduccin relativa del riesgo (RRR) del 30%
en el grupo tratado con warfarina. Cuando finaliz el perodo de dos aos de seguimiento,
no se observaron diferencias estadsticamente significativas entre los dos grupos, y los
autores llegaron a la conclusin de que la warfarina y la aspirina son opciones teraputicas
razonables en este tipo de situaciones clnicas. Sin embargo, la warfarina no slo NO
consigui reducir el riesgo en un 30%, sino que lo INCREMENT en un 13%, y el riesgo
de HEMORRAGIAS importantes fue SUPERIOR en el grupo de la WARFARINA (2,22 por
100 pacientes/ao) frente a la ASPIRINA (1,49 por 100 pacientes/ao en el grupo aspirina)
pero sin alcanzar significacin. Con estos datos.

Crees que se puede considerar que la warfarina y la aspirina son alternativas teraputicas
razonables para prevenir los accidentes cerebrovasculares isqumicos recurrentes?
NO.
Adems, tal como comentaban los autores en la discusin del artculo, la warfarina tiene
un coste mayor y requiere una monitorizacin ms estrecha.
C aptulo 6 Pgina 572
C aptulo 6 Pgina 573

El Romiplostim produjo un aumento estadsticamente significativo


del recuento de plaquetas durante el periodo de estudio, pero no
se asoci a una disminucin del las hemorragias de grado .
C aptulo 6 Pgina 574
C aptulo 6 Pgina 575
C aptulo 6 Pgina 576
C aptulo 6 Pgina 577

Romiplostim. PTI
- Romiplostim. Ensayo pivotal. Fase III vs. placebo.
- Inclusin: < 30.000 plaquetas/mmc.
- Objetivo principal: > 50.000 plaquetas/mmc.

Efectos adversos: Objetivo subrrogado

Romiplostim Placebo p
Hemorragia Grado 3/4 6 de 84 (7%) 5 de 41 (12%) n.s.

David J Kuter, James B Bussel. Efficacy of romiplostim in patients with chronic immune thrombocytopenic
purpura: a double-blind randomised controlled trial. Lancet 2008; 371: 395403.
C aptulo 6 Pgina 578

Romiplostim. PTI

Hemorragia Grado 3/4 Romiplostim Placebo Total


SI 6 (7%) 5 (12%) 11
NO 78 36 114
Total 84 41 125

El Romiplostim produjo un aumento estadsticamente significativo del


recuento de plaquetas durante el periodo de estudio, pero no se asoci a
una disminucin del las hemorragias de grado .

2Pearson= 0,88; p = 0,349

David J Kuter, James B Bussel. Efficacy of romiplostim in patients with chronic immune thrombocytopenic
purpura: a double-blind randomised controlled trial. Lancet 2008; 371: 395403.
C aptulo 6 Pgina 579

Odds Ratio (OR) versus Riesgo Relativo (RR)


Enfermedad (E)
Exposicin (F) Cncer de No enfermos (-) Total
pncreas (+)
Tabaco (+) A (10) B (9990) 10000
Tabaco (-) C (10) D (19990) 20000
Total 20 29980 30000

Tasa de exposicin
observada en los CASOS
OR = [ A / (A + B)] [ 10 / (10000)]
RR = Tasa de exposicin observada en
los CONTROLES RR =
[ C / (C + D) ] [ 10 / (20000) ]

[A/C]
[ 10/10 ]
OR = 2,001
OR = OR =
[B/D] [ 9990 /19990 ]
RR = 2,000
[ (A * D) ]
La OR slo se aproxima al RR cuando el suceso es raro y ocurre en menos del 10% de los sujetos, en
OR =
[ (B * C) ]
estos casos ambos estimadores son intercambiables.
C aptulo 6 Pgina 580

Importancia del intervalo de confianza en el RR


- Risk Factors for Future Cardiovascular Events: WHS -

Lipoprotein(a)
Homocysteine
IL-6
Colesterol total (CT)
Colesterol-LDL (cLDL)
sICAM-1
SAA
Apo B
Cociente CT/cHDL
PCR ultrasensible
PCR + CT/cHDL

0 1.0 2.0 4.0 6.0


Relative Risk of Future Cardiovascular Events

Ridker PM et al. N Engl J Med 2000;342:836-843.


C aptulo 6 Pgina 581

Datos categricos:
Cualitativa versus cualitativa. Ordinales

- Test de 2 de tendencia lineal


- Tau-B de Kendall o Stuart
- Tau-C de Kendall
- Coeficiente Gamma de Goodman y Kruskal
- D de Somers
- Correlacin de Spearman

Estos estadsticos NO se pueden


utilizar cuando alguna de las variables
sea NOMINAL
C aptulo 6 Pgina 582

Pregunta de investigacin
Existe relacin entre el nivel cultural y el hbito tabquico?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA ordinal CUALITATIVA dicotmica
Nivel cultural Hbito tabquico

Cul es el test estadstico ms acertado?


C aptulo 6 Pgina 583

Existe relacin entre el nivel socioeconmico y el


hbito tabquico?
Tabla de contingencia que representa el nivel de estudios alcanzado frente al hbito tabquico actual

Fumador actual
ESTUDIOS NO SI Total Porcentaje
<Primarios 7 13 20 65%
Primarios 30 20 50 40%
Secundarios 20 10 30 33%
Universitarios 75 25 100 25%
TOTAL 132 68 200 34%

Test de 2 de tendencia lineal

2 tendencia lineal = 11,56 p=0,001


C aptulo 6 Pgina 584

Grfico que representa el porcentaje de fumadores


segn su nivel de instruccin
Frecuencia de tabaquismo

2 tendencia lineal = 11,56 p = 0,001


C aptulo 6 Pgina 585

Pregunta de investigacin
Existe relacin entre el nivel cultural y la realizacin de
alguna mamografas de cribado en los 3 ltimos aos?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA ordinal CUALITATIVA dicotmica
Nivel educativo Mamografa

Cul es el test estadstico ms acertado?


C aptulo 6 Pgina 586

Existe relacin entre el nivel de instruccin y la


realizacin de mamografas?
Tabla de contingencia que representa el nivel de estudios alcanzado frente a la realizacin de alguna
mamografa de cribado en los ltimos 3 aos.

Mamografa de cribado
ESTUDIOS SI NO % OR IC 95%
Sin estudios 9 233 3,7% 1,00
Primarios 81 700 10,4% 3,00 1,48 - 6,06
Secundarios 23 140 14,1% 4,25 1,91 9.45
Universitarios 13 41 24,1% 8,21 3,30 20,44
TOTAL 126 1114

Test de 2 de tendencia lineal


2 tendencia lineal = 24,22 p < 0,00001
C aptulo 6 Pgina 587

Grfico que representa el porcentaje de fumadores


segn su nivel de instruccin
Mujeres que se han realizado alguna mamografia en los 3 ltimos aos
Frecuencia de participacin en programas de prevencin

2 tendencia lineal = 24,22 p < 0,0001


C aptulo 6 Pgina 588

Resultados (fragmento del texto)

El conocimiento que las mujeres tienen de la mamografa como medida


preventiva del cncer de mama se encuentra asociado estadsticamente a
la mayor utilizacin de la misma por parte de stas y se detecta una clara
tendencia creciente en la utilizacin de la mamografa de cribado a medida
que aumenta el nivel educativo de las mujeres de la muestra.

Sim Miana J, Gaztambide Ganuza M, Morote Sanchs M, et al. Utilizacin de la mamografa de cribado
y sus determinantes demogrficos y de riesgo entre mujeres de 25 a 65 aos. Med Clin (Barc) 1997; 108:
767-771.
C aptulo 6 Pgina 589

Discusin (fragmento del texto)

Coincidente con otros datos publicados es la relacin encontrada entre el


nivel educativo y la utilizacin de la mamografa de cribado. Al igual que
ocurre con otras prcticas de carcter preventivo, la mamografa de cribado
es ms utilizada por las mujeres con mayor nivel educativo. No hay que
olvidar que este factor est relacionado con el nivel econmico, variable que
no ha sido recogida en nuestro trabajo y que tambin ha sido asociada a una
mayor utilizacin de la mamografa de cribado.

Sim Miana J, Gaztambide Ganuza M, Morote Sanchs M, et al. Utilizacin de la mamografa de cribado
y sus determinantes demogrficos y de riesgo entre mujeres de 25 a 65 aos. Med Clin (Barc) 1997; 108:
767-771.
C aptulo 6 Pgina 590

Pregunta de investigacin
Existe relacin entre el sndrome anmico gestacional
y el grupo cultural en Ceuta? Existen diferencias en la
prevalencia durante los trimestres de la gestacin?
Variable PREDICTORA Variable RESULTADO
Cualitativa dicotmica Cualitativa ordinal
- Cristianas Sndrome anmico gestacional
- Musulmanas - Primer trimestre
- Segundo trimestre
- Tercer trimestre

Daz Portillo J et al. Prevalencia del sndrome anmico gestacional en Ceuta. Estudio de una poblacin
birracial. Ciencia Ginecolgika 1998, 2 (1): 3-14.
C aptulo 6 Pgina 591

Tabla de contingencia que representa la prevalencia de sndrome anmico gestacional en los dos grupos
culturales mayoritarios de Ceuta, y su incidencia en cada trimestre del embarazo.

Mamografa de cribado
Trimestre Cristianas Musulmanas Test 2 p Total
1 trimestre 5,1% 11,4% 4,75 p = 0,029 7,9%

2 trimestre 23,9% 27,0% NS NS 25,5%


3 trimestre 39,6% 57,4% 19,91 p < 0,0001 49,2%
de tendencia lineal
2
34,3 56,7 71,8
Significacin (p) p < 0,001 p < 0,001 p < 0,001

Test de 2 de tendencia lineal

Test de 2 de Pearson de indepencia


C aptulo 6 Pgina 592

Grfico que representa la prevalencia de sndrome


anmico gestacional en los dos grupos culturales
mayoritarios de Ceuta
Frecuencia de Sndrome anmico gestacional
C aptulo 6 Pgina 593

Pregunta de investigacin
La hipertrigliceridemia en sangre de cordn umbilical
puede ser indicativa de episodios de sufrimiento fetal?

Variable PREDICTORA Variable RESULTADO


SFA Hipertrigliceridemia
Test de APGAR Triglicridos (sangre de
cordn)
C aptulo 6 Pgina 594

Test de 2 de tendencia lineal


Categorizacin

Variable RESULTADO Variable RESULTADO


Cuantitativa continua Cualitativa nominal
Variable PREDICTORA Tabla 4.- Relacin entre la presencia de hipertrigliceridemia neonatal y el indice de apgar al minuto.

Cuantitativa discreta TEST DE Hipertrigliceridemia Normotrigliceridemia OR


APGAR (n=36) (n=636)
Mayor de 7 27 (2,1%) 1253 (97,9%) 1,00
Igual a 7 4 (11,1%) 81 (88,9%) 2,29
Menor de 7 5 (15,6%) 27 (84,4%) 8,57

Variable OR: Odds Ratio

PREDICTORA Test de ji al cuadrado de tendencia (2) = 20,85 ; p<0,0001

Cualitativa ordinal

Daz Portillo J. Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta. Tesis doctoral . Facultad de Medicina. Universidad de Cdiz . Noviembre 1997.
C aptulo 6 Pgina 595

Resultados

La tabla 4 relaciona la presencia de hipertrigliceridemia neonatal con


el ndice de Apgar al minuto. Se observ una relacin estadsticamente
significativa con tendencia lineal entre ambas variables categricas, con
una asociacin creciente entre la hipertrigliceridemia y la disminucin
del ndice de Apgar. La probabilidad de detectar hipertrigliceridemia en
neonatos con ndices de Apgar inferiores a 7 fue ocho veces superior que
en RN con Apgar fisiolgico.
C aptulo 6 Pgina 596

Discusin

Nuestros resultados apoyan los obtenidos por Tsang et al. (12) y Andersen
y Friis-Hansen (13), e indican una fuerte asociacin entre los episodios de
sufrimiento fetal y la hipertrigliceridemia neonatal.
Del mismo modo, la frecuencia de hipertrigliceridemia va aumentando
conforme disminuye el ndice de Apgar.

Exposicin Desenlace o efecto

SFA Hipertrigliceridemia

OR = 7,23 p=0,003

Daz Portillo J. Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta. Tesis doctoral . Facultad de Medicina. Universidad de Cdiz . Noviembre 1997.
C aptulo 6 Pgina 597

Pregunta de investigacin
La hipertrigliceridemia en sangre de cordn umbilical puede
ser debida al consumo de tabaco durante la gestacin?

Variable PREDICTORA Variable RESULTADO

Consumo de tabaco Hipertrigliceridemia


Triglicridos (sangre de cordn)

Jacobo Daz Portillo, Mara Jess Snchez Del Pino, Ana Navarro Arvalo. INFLUENCIA DEL
TABAQUISMO EN EL PERFIL LIPOPROTEICO Y GRADO DE PEROXIDACIN LIPDICA EN SANGRE DE
CORDN.
Revista de Diagnstico Biolgico 2000; 49: 23-30.
C aptulo 6 Pgina 598

Test de 2 de tendencia lineal


Categorizacin
Variable RESULTADO Variable RESULTADO
Cuantitativa continua Cualitativa nominal

Influencia del tabaco Hipertrigliceridemia Normotrigliceridemia OR


neonatal neonatal
No fumadoras 1,7% 98,3% 1,00
Fumadoras moderadas 5,3% 94,7% 3,20
Grandes fumadoras 5,4% 94,6% 3,27

2 tendencia lineal = 5,68 p=0,017

Utiliza la estadstica como un borracho usa una farola, para aguantarse en


lugar de para iluminarse
Andrew Lang
C aptulo 6 Pgina 599

Pregunta de investigacin
Existen diferencias en la prevalencia de infeccin tuberculosa
en el colectivo de inmigrantes residentes en el campamento de
Calamocarro en Ceuta segn la edad?
Variable PREDICTORA Variable RESULTADO
CUALITATIVA policotmica CUALITATIVA dicotmica
Inmigrantes Tuberculosis
< 25 aos
25-35 aos
>35

Cul es el test estadstico ms adecuado?

Fernndez MT, Daz J, Snchez JM, Prez A, Vadillo J. Prevalencia de infeccin tuberculosa en la poblacin
de inmigrantes en Ceuta, Espaa. Rev Esp Salud Pblica 2001; 75: 551-8.
C aptulo 6 Pgina 600

Anlisis del texto en el MATERIAL y MTODOS


Empleamos el test de chi2 para comparacin de porcentajes, y la prueba
de la t de Student para variables cuantitativas. La evaluacin de las
tendencias se realiz con la prueba de chi2 de tendencia lineal.

Anlisis del texto en los RESULTADOS


Con independencia del punto de corte seleccionado, se observ mayor
positividad en el sexo masculino que en el femenino, y la positividad
tambin present una ligera tendencia a aumentar con la edad (p=0,07).

Anlisis del texto en la DISCUSIN


?

Fernndez MT, Daz J, Snchez JM, Prez A, Vadillo J. Prevalencia de infeccin tuberculosa en la poblacin
de inmigrantes en Ceuta, Espaa. Rev Esp Salud Pblica 2001; 75: 551-8.
C aptulo 6 Pgina 601

Test de 2 de tendencia lineal


Categorizacin
Variable RESULTADO Variable RESULTADO
Cuantitativa continua Cualitativa nominal policotmica

Grupo etario Mantoux (+) Mantoux (-) N Prevalencia

Menos de 25 aos 221 721 942 28,2%


25 - 35 aos 242 482 724 33,5%
> 35 aos 15 38 53 27,8%

2 tendencia lineal = 5,2 p = 0,07

Utiliza la estadstica como un borracho usa una farola, para aguantarse en


lugar de para iluminarse
Andrew Lang
C aptulo 6 Pgina 602

Test de 2 de Pearson de independencia


Categorizacin
Variable RESULTADO Variable RESULTADO
Cuantitativa continua Cualitativa nominal dicotmica
Grupo etario Mantoux (+) Mantoux (-) N Prevalencia

Menos de 25 aos 221 721 942 28,2%


25 - 35 aos 242 482 777 33,1%

2 = 26,07 p=0,0000003

Utiliza la estadstica como un borracho usa una farola, para aguantarse en


lugar de para iluminarse
Andrew Lang
C aptulo 6 Pgina 603

Pregunta de investigacin
Existen diferencias en la prevalencia de infeccin tuberculosa
en el colectivo de inmigrantes residentes en Toledo segn la
edad?
Variable PREDICTORA Variable RESULTADO
CUALITATIVA policotmica CUALITATIVA dicotmica
Inmigrantes Tuberculosis
< 20 aos
25-29 aos
30-39 aos

Cul es el test estadstico ms adecuado?

Alonso Moreno FJ, Garca Bajo MC, Lougedo Caldern MJ, et al. Prevalencia de infeccin tuberculosa en
las personas inmigrantes del rea sur de Toledo. Rev Esp Salud Pblica 2004; 78: 593-600.
C aptulo 6 Pgina 604

Anlisis del texto en el MATERIAL y MTODOS


En el anlisis se emplearon los tests de la 2 de Pearson, para comparacin de
porcentajes, y la t de Student y anlisis de varianza (ANOVA), para comparacin de
medias y varianzas. Se realiz tambin una regresin logstica no condicional por el
mtodo stepwise backward (LR). Las variables independientes incluidas en el modelo
fueron la edad, sexo, peso y origen subsahariano, mientras que la variable dependiente fue
la IDRM positiva.

Anlisis del texto en los RESULTADOS


La prevalencia de infeccin tuberculosa por grupos de edad se muestra en la tabla 2, en
la que puede apreciarse cmo la mayor frecuencia (38,7%) apareci en el grupo de edad
30-39 aos..

Anlisis del texto en la DISCUSIN


En sta ltima la prevalencia encontrada tanto en el grupo de edad de 20 a 29 aos
(12,1%), como en el de 30 a 39 aos (22,7%), est en ambos casos por debajo de los
resultados de nuestro estudio. Los resultados de nuestro trabajo aportan valores en la
misma lnea que los obtenidos por Durn y colaboradores13 en inmigrantes recin llegados
a Barcelona.
Alonso Moreno FJ, Garca Bajo MC, Lougedo Caldern MJ, et al. Prevalencia de infeccin tuberculosa en
las personas inmigrantes del rea sur de Toledo. Rev Esp Salud Pblica 2004; 78: 593-600.
C aptulo 6 Pgina 605

Test de 2 de tendencia lineal


Categorizacin
Variable RESULTADO Variable RESULTADO
Cuantitativa continua Cualitativa nominal ordinal

Prueba de la Transversal Casos-


tuberculina controles
Grupo etario Mantoux (+) Mantoux (-) N Prevalencia OR

Menos de 25 aos 5 61 64 7,8% 1,00


25 - 35 aos 21 41 62 33,9% 6,25
> 35 aos 36 57 93 38,7% 7,71

2 tendencia lineal = 17,4 p = 0,00003


C aptulo 6 Pgina 606

Pregunta de investigacin
Qu relacin existe entre la edad y la presencia de deterioro
cognitivo moderado-severo en un grupo de enfermos mayores
( aos) atendidos en los servicios de urgencia del hospital?
Variable PREDICTORA Variable RESULTADO
Cualitativa ORDINAL Cualitativa dicotmica
Grupo etario Deterioro cognitivo
- 60-64 aos
- 65-69 aos
- 70-74 aos
- 75-79 aos
- 80-84 aos
85 aos

Cul es el test estadstico ms adecuado?

Laguna P, Moya M, Gazapo R, Salgado R, Calabrese S. Deteccin de deterioro cognitivo en ancianos


atendidos en un servicio de urgencias hospitalario. Rev Cln Esp 1997; 197: 336-340.
C aptulo 6 Pgina 607

Test de 2 de tendencia lineal


Categorizacin
Variable RESULTADO Variable RESULTADO
Cuantitativa continua Cualitativa nominal ordinal
Deterioro cognitivo Transversal Casos-controles
Grupo etario SI NO N Prevalencia OR IC95%
60 - 64 aos 8 41 49 16,3% 1,00
65 - 69 aos 14 56 70 20 % 1,28 0,45 - 3,72
70 - 74 aos 19 64 83 22,9% 1,52 0,56 - 4,20
75 - 79 aos 18 51 69 26,1% 1,81 0,66 - 5,09
80 - 84 aos 18 33 51 35,3% 2,80 0,99 - 8,09
85 aos 17 13 30 56,7% 6,70 2,11 22,07
Total 94 258 352 26,7%

2 tendencia lineal = 16,3 p = 0,0005


C aptulo 6 Pgina 608

Mito 1: La sonrisa de la esfinge


Por qu estratificas la variable edad en 6 categoras?

Por qu no categorizas la variable edad en slo 3 estratos ordinales?

Aunque el clculo de la prueba Pearson de tendencia lineal ha resultado


2

significativa, el IC95% de los OR de los distintos grupos de edad incluyen el 1


(valor numrico de igualdad), con lo que perdemos informacin...

El test de de tendencia lineal, aunque admite ms de 3 categoras ordinales


2

para la variable predictora, no es conveniente estratificar ms all a no ser


que se disponga de un importante volumen muestral, de lo contrario los
IC95% no son significativos.
C aptulo 6 Pgina 609

Test de 2 de tendencia lineal


Categorizacin
Variable RESULTADO Variable RESULTADO
Cuantitativa continua Cualitativa nominal ordinal
Deterioro cognitivo Transversal Casos-controles
Grupo etario SI NO N Prevalencia OR IC95%
60 - 69 aos 22 97 119 18,5% 1,00
70 79 aos 37 115 152 32,2% 1,42 (1,12 1,83)
80 aos 35 46 81 43,2% 3,35 (2,05 4,96)
Total 94 258 352 26,7%

El anlisis de tendencias demostr una relacin estadsticamente significativa entre la


edad del anciano y el deterioro cognitivo de grado moderado o severo (p < 0,001).

2 tendencia lineal = 13,9 p = 0,0002


C aptulo 6 Pgina 610

Pregunta de investigacin
Existe relacin entre el hbito tabquico y la presencia del
ADN del Papiloma virus (HPV) en pacientes con lesiones
escamosas intraepiteliales del crvix uterino?
Variable PREDICTORA Variable RESULTADO
Cualitativa ORDINAL Cualitativa dicotmica
Hbito tabquico ADN del HPV
(n cigarrillos/da) Human Papilloma Virus
1. No fumador (0 )
2. Moderado ( 20)
3. Alto (> 20)

Cul es el test estadstico ms acertado?

Laguna P, Moya M, Gazapo R, Salgado R, Calabrese S. Deteccin de deterioro cognitivo en ancianos


atendidos en un servicio de urgencias hospitalario. Rev Cln Esp 1997; 197: 336-340.
C aptulo 6 Pgina 611

Test de 2 de tendencia lineal

ADN HPV
TABACO (+) (-) % OR IC 95% p
No fumador 5 13 27,8 1,00

Moderado 19 24 44,2 2,06 0,55 8,62 0,36


Alto 4 1 80,0 10,40 0,70 550,31 0,06
TOTAL 28 38 2 tendencia lineal = 4,022 0,045

Tabla de contingencia que representa el hbito tabquico (n de cigarrillos al da) y la


presencia del ADN del papiloma virus (HPV) en pacientes con lesiones escamosas
intraepiteliales del crvix uterino.
C aptulo 6 Pgina 612

Resultados (fragmento del texto)

No se observaron diferencias significativas entre la edad media y la edad


media de inicio de las relaciones sexuales, y la positividad del HPV. Por
el contrario, la asociacin con el hbito tabquico fue estadsticamente
significativa, observndose una asociacin creciente ente la deteccin del
HPV y el consumo de cigarrillos (tabla).

Torn A, Ordi J, Lluis M, et al. Determinacin del papiloma virus mediante hibridacin in situ. Correlacin
clnicopatolgica y virolgica en pacientes con lesiones escamosas intraepiteliales del crvix uterino. Med
Clin (Barc) 1997; 109: 691-695.
C aptulo 6 Pgina 613

Discusin (fragmento del texto)

Diversos estudios han destacado el efecto que el consumo de tabaco


puede ejercer en interaccin con el HPV facilitando y cooperando con los
mecanismos oncogenticos. En el presente estudio, el hallazgo de una
asociacin creciente entre la deteccin del HPV y el consumo de cigarrillos
puede relacionarse con el resultado de estudios experimentales que
demuestran que los productos del tabaco causan un defecto inmunolgico
a nivel cervical, disminuyendo la capacidad de presentacin de antgenos
por las clulas de langerhans, fenmeno que finalmente favorece tanto la
infeccin por HPV en el epitelio cervical.

Torn A, Ordi J, Lluis M, et al. Determinacin del papiloma virus mediante hibridacin in situ. Correlacin
clnicopatolgica y virolgica en pacientes con lesiones escamosas intraepiteliales del crvix uterino. Med
Clin (Barc) 1997; 109: 691-695.
C aptulo 6 Pgina 614

Mito 1: La sonrisa de la esfinge

Aunque el clculo de la prueba Pearson de tendencia lineal ha resultado


2

significativa (p= 0,045), sin embargo el IC95% de los OR de los distintos


grupos de fumadoras (moderadas e intensas) incluyen el 1 (valor numrico de
igualdad), con lo que perdemos informacin, adems se pierde significacin
estadstica (p>0,05)

El test de de tendencia lineal, aunque admite 3 o ms categoras ordinales


2

para la variable predictora, NO es conveniente que los casilleros contengan


valores inferiores a 5, como ocurre en el grupo de las fumadoras intensas (>
20 cigarrillos/da) .

Sabes lo que ocurre si agrupas las fumadoras moderadas con las intensas y
la enfrentas a las no fumadoras (no fumadoras versus fumadoras)?

OBSERVA LO QUE OCURRE!!!


C aptulo 6 Pgina 615

Tabla de contingencia que representa la presencia del HPV con el hbito


tabquico.

ADN HPV
TABACO SI (+) NO (-) Total
NO 5 13 18
SI 23 25 48
TOTAL 28 38 66

Test de 2 de Pearson de independencia

2 = 2,17 p=0,140 No existe asociacin


C aptulo 6 Pgina 616

Mito 1: La sonrisa de la esfinge


Por qu torturas a los datos con test estadsticos NO idneos para que te
digan lo que a ti te interesa?
Sabes lo que te ha ocurrido?
Te ha abrumado el enorme peso de la bibliografa que es muy numerosa
en estudios experimentales y clnicos que relacionan el tabaco, el HPV y el
cncer de crvix, y su interaccin.
Ante tan bajo volumen muestral
No crees que puedes haber cometido un error beta (bajo tamao muestral)?

Sndrome de la CARGA bibliogrfica

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario INGESA de Ceuta
C aptulo 6 Pgina 617

Pregunta de investigacin
Existe asociacin entre el hbito tabquico y la EPOC?

Variable PREDICTORA Variable RESULTADO


Cualitativa dicotmica Cualitativa dicotmica
Hbito tabquico EPOC

Cul es el test estadstico ms acertado?


C aptulo 6 Pgina 618

Tabla de contingencia que representa la EPOC frente al hbito tabquico.

EPOC
TABACO SI NO Total
SI 26 (43%) 34 60
NO 7 (23%) 23 30
TOTAL 33 57 90

Test de 2 de Pearson de independencia

2 = 3,44 p=0,063 No existe asociacin


C aptulo 6 Pgina 619

Pregunta de investigacin
Existe relacin entre la EPOC y el la intensidad del hbito
tabquico?

Variable PREDICTORA Variable RESULTADO


Cualitativa ordinal Cualitativa dicotmica
Hbito tabquico EPOC
1. No fumador
2. Moderado
3. Alto

Cul es el test estadstico ms acertado?


C aptulo 6 Pgina 620

Tabla de contingencia que representa la EPOC frente al hbito tabquico.

EPOC
TABACO SI NO Total
No fumador 7 23 30
Moderado 11 19 30
Alto 15 15 30
TOTAL 33 57 90

Test de 2 de Pearson de independencia

2 = 4,60 p=0,111 No existe asociacin


C aptulo 6 Pgina 621

Mito 1: La sonrisa de la esfinge

Por qu utilizas el test de


2
?
Pearson

Se cumplen sus condiciones de aplicacin?

En el clculo de la prueba Pearson no se tiene en cuenta el orden de las


2

categoras y de este modo perdemos una valiosa informacin..

El test de de tendencia lineal, siempre tiene un grado de libertad, e incluye


2

una modificacin para su clculo respecto a la expresin de la prueba


2

Pearson
, de modo se tiene en cuenta el orden de las categoras.
C aptulo 6 Pgina 622

Tabla de contingencia que representa la EPOC frente al hbito tabquico.

EPOC Caso-control
TABACO SI NO Total OR
No fumador 7 23 30 1,00
Moderado 11 19 30 1,90
Alto 15 15 30 3,29
TOTAL 33 57 90

Test de 2 de tendencia lineal

2 = 4,54 p = 0,033 Existe asociacin


C aptulo 6 Pgina 623

Pregunta de investigacin
Existe relacin entre la gravedad de la EPOC y la intensidad
del hbito tabquico?

Variable PREDICTORA Variable RESULTADO


Cualitativa ordinal Cualitativa ordinal
Hbito tabquico Gravedad EPOC
1. No fumador 1. Leve
2. Moderado 2. Moderada
3. Alto 3. Grave

Cul es el test estadstico ms acertado?


C aptulo 6 Pgina 624

Tabla de contingencia que representa la gravedad de la EPOC frente al hbito tabquico

EPOC
TABACO Leve Moderado Grave Total
No Fumador 20 8 2 30
Moderado 8 10 12 30
Alto consumo 2 8 20 30
TOTAL 30 26 34 90

Test de 2 de tendencia lineal Existe asociacin

Coeficiente Gamma = 0,718

Fuerte asociacin positiva entre ambas variables


C aptulo 6 Pgina 625

Pregunta de investigacin
Existe asociacin entre el nivel de instruccin (cultural) y el
nivel econmico?
A mayor nivel cultural habr mayor nivel econmico?
Variable PREDICTORA Variable RESULTADO
Cualitativa ordinal Cualitativa ordinal
Nivel instruccin Nivel econmico

Cul es el test estadstico ms acertado?


C aptulo 6 Pgina 626

Existe asociacin entre el nivel de instruccin y el nivel


econmico?
Tabla de contingencia que representa el nivel de estudios frente al nivel econmico
Nivel econmico
ESTUDIOS Alto Medio Bajo TOTAL
Universitarios 19 5 1 25
Secundarios 14 22 1 37
Primarios 7 36 7 50
TOTAL 40 63 9 112

2 Pearson = 30,15 p <0,000001 SI

Existe relacin gradual entre el nivel de instruccin y el nivel econmico?

Tau-b de Kendall
C aptulo 6 Pgina 627

Existe relacin gradual entre el nivel de instruccin y el nivel


econmico?
Ho: A mayor nivel de instruccin no existe mayor nivel econmico.
Ha: A mayor nivel de instruccin mayor nivel econmico.

Tau-b de Kendall

Ordinal por ordinal Valor del estadstico Significacin


Tau-b de Kendall + 0,448 0,000
Tau-c de Kendall + 0,399 0,000

Ha: A mayor nivel de instruccin mayor nivel econmico. SI


C aptulo 6 Pgina 628

Tau-b de Kendall
- Condiciones de aplicacin.
- Tablas cuadradas (3 x 3), (4 x 4)
- Interpretacin:
- Tau = 0 independencia. Estadistico Tipo Variables Tipo tabla

- Tau > 0 asociacin positiva. Tau-b de Kendall Ordinal X Ordinal K=F


- Tau < 0 asociacin negativa. Tau-c de Kendall Ordinal X Ordinal KF
- Intervalo de Tau : (-1, +1).
- Informacin:
- Medida de la intensidad de la asociacin de variables ordinales.
- Sentido de la misma (direccionalidad).

Tau-b de Kendall
- Condiciones de aplicacin: nmero de filas distinto al nmero de columnas (Tablas NO
cuadradas).
C aptulo 6 Pgina 629

Pregunta de investigacin
Existe asociacin entre el nivel de instruccin (cultural) y el
nivel econmico?
A mayor nivel cultural habr mayor nivel econmico?
Variable PREDICTORA Variable RESULTADO
Cualitativa ordinal Cualitativa ordinal
Nivel instruccin Nivel econmico

Cul es el test estadstico ms acertado?


C aptulo 6 Pgina 630

Existe asociacin entre el nivel de instruccin y el nivel


econmico?
Tabla de contingencia que representa el nivel de estudios frente al nivel econmico
Nivel econmico
ESTUDIOS Alto Medio Bajo TOTAL
Universitarios 19 5 1 25
Secundarios 14 22 1 37
Primarios 7 36 7 50
TOTAL 40 63 9 112

2 Pearson = 30,15 p <0,000001 SI

Existe relacin gradual entre el nivel de instruccin y el nivel econmico?

Coeficiente Gamma
C aptulo 6 Pgina 631

Existe relacin gradual entre el nivel de instruccin y el nivel


econmico?
Ho: A mayor nivel de instruccin no existe mayor nivel econmico.
Ha: A mayor nivel de instruccin mayor nivel econmico.

Coeficiente Gamma

Ordinal por ordinal Valor de EE T aprox Significacin


Gamma + 0,687 0,098 5,804 0,000
N de casos vlidos 112

Ha: A mayor nivel de instruccin mayor nivel econmico. SI


C aptulo 6 Pgina 632

Coeficiente Gamma
- Test de contraste de hiptesis.
- Test de asociacin para variables ordinales.
- Interpretacin:
=0 independencia
>0 asociacin positiva
<0 asociacin negativa
- Intervalo de : (-1, +1).
- Informacin:
- Medida de la intensidad de la asociacin de variables ordinales.
- Sentido de la misma (direccionalidad).

A mayor nivel de A mayor nivel de


instruccin MENOR instruccin MAYOR
Variables no
nivel econmico nivel econmico
asociadas

-1 0 +1
C aptulo 6 Pgina 633

Pregunta de investigacin
Existe asociacin entre el nivel de instruccin (cultural) y el
nivel econmico?
A mayor nivel cultural habr mayor nivel econmico?
Variable PREDICTORA Variable RESULTADO
Cualitativa ordinal Cualitativa ordinal
Nivel instruccin Nivel econmico

Cul es el test estadstico ms acertado?


C aptulo 6 Pgina 634

Existe asociacin entre el nivel de instruccin y el nivel


econmico?
Tabla de contingencia que representa el nivel de estudios frente al nivel econmico
Nivel econmico
ESTUDIOS Alto Medio Bajo TOTAL
Universitarios 19 5 1 25
Secundarios 14 22 1 37
Primarios 7 36 7 50
TOTAL 40 63 9 112

2 Pearson = 30,15 p <0,000001 SI

Ha: El nivel econmico (variable resultado) es dependiente del nivel de


instruccin (variable predictora).
Existe relacin gradual entre el nivel de instruccin y el nivel econmico?

D de Somers
C aptulo 6 Pgina 635

Existe relacin gradual entre el nivel de instruccin y el nivel


econmico?
Ho: A mayor nivel de instruccin no existe mayor nivel econmico.
Ha: A mayor nivel de instruccin mayor nivel econmico.

D de Somers

Valor del estadstico D Significacin


Simtrica (no se sabe cual es la resultado) 0,447 0,000
Nivel de instruccin resultado (dependiente) 0,484 0,000
Nivel econmico resultado (dependiente) 0,415 0,000

Ha: A mayor nivel de instruccin mayor nivel econmico. SI


C aptulo 6 Pgina 636

D de Somers
- Test de contraste de hiptesis.
- Test de asociacin para variables ordinales.
- Interpretacin:
D =0 independencia
D >0 asociacin positiva
D <0 asociacin negativa
- Intervalo de D de Somers: (-1, +1).
- Informacin:
- Medida de la intensidad de la asociacin de variables ordinales.
- Sentido de la misma (direccionalidad).

A mayor nivel de A mayor nivel de


instruccin MENOR instruccin MAYOR
Variables no
nivel econmico nivel econmico
asociadas

-1 0 +1
C aptulo 6 Pgina 637

Pregunta de investigacin
Existe asociacin entre el nivel de instruccin (cultural) y el
nivel econmico?
A mayor nivel cultural habr mayor nivel econmico?
Variable PREDICTORA Variable RESULTADO
Cualitativa ordinal Cualitativa ordinal
Nivel instruccin Nivel econmico

RESUMEN

Cul es los tests estadsticos ms acertados?


C aptulo 6 Pgina 638

Nivel econmico
ESTUDIOS Alto Medio Bajo Muy bajo TOTAL
Titulado superior 12 32 6 0 50
Titulado medio 5 21 136 19 181
Secundarios 0 1 94 95 190
Primarios 0 0 24 29 53
TOTAL 17 54 260 143 474

Existe relacin gradual entre el nivel de instruccin y el nivel econmico?

D de Somers Gamma

Tau-b de Kendall Tau-c de Kendall


C aptulo 6 Pgina 639

D de Sommers (medidas Valor del EED T aprox Muy bajo


direccionales) estadstico
Simtrica (no se sabe cual es la 0,557 0,029 16,075 0,000
variable resultado)
Nivel econmico variable 0,525 0,030 16,075 0,000
resultado (dependiente)
Nivel de instruccin variable 0,593 0,030 16,075 0,000
resultado (dependiente)

Ordinal por ordinal Valor del estadstico EE T aprox Significacin


Gamma 0,798 0,031 16,075 0,000
Tau-b de Kendall 0,558 0,029 16,075 0,000
Tau-c de Kendall 0,469 0,029 16,075 0,000
N de casos vlidos 474

Ha: A mayor nivel de instruccin mayor nivel econmico.


C aptulo 7 Pgina 640

Captulo 7

Publicacin Bioestadstica: Anlisis bivariante.


Test de contraste de hiptesis.
Cuantitativa versus cuantitativa.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 7 Pgina 641

Materiales y mtodos
Estructura

1. Tipo de diseo (estudio).


2. Sujetos incluidos (criterios de seleccin de la muestra)
3. Fuentes de informacin.
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales).
5. Instrumentos y procedimientos de medida (cuestionarios).
6. Definicin de las variables y covariables incluidas en el estudio (factor de
estudio y criterio de evaluacin).
7. Limitaciones y consideraciones ticas de la investigacin.
8. Pruebas estadsticas a utilizar (programa estadstico).
C aptulo 7 Pgina 642

Fases del anlisis estadstico

1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE
C aptulo 7 Pgina 643

Decisiones que se pueden tomar en un test de contraste


de hiptesis despus de conocer el valor de significacin
estadstica p
p < 0,05 AB p 0,10 A=B
Se rechaza la hiptesis nula No se puede rechazar la hiptesis nula
No parece que el azar pueda No se puede descartar que el azar lo
explicarlo todo explique todo
El EFECTO observado es mayor que El EFECTO observado es similar que el
el ERROR ERROR
Hay diferencias estadsticamente NO hay diferencias estadsticamente
significativas significativas
Existen evidencias a favor de la NO existen evidencias a favor de la
hiptesis alternativa Ha, y por tanto hiptesis alternativa Ha, y por tanto
rechazamos la hiptesis nula Ho aceptamos la hiptesis nula Ho

Los lmites de 0,05 y 0,1 pueden ser considerados en cierto modo


arbitrarios y aproximados
C aptulo 7 Pgina 644

Anlisis estadstico
Tipos de test analticos estadsticos de contraste de hiptesis
segn el tipo de variables implicadas en el estudio

Variable dependiente
Variable resultado

Dicotmica Continua
Variable Dicotmica Test de 2 t de Student
Predictora
Variable Continua Regresin lo- Regresin lineal
Independiente gstica
C aptulo 7 Pgina 645

Anlisis estadstico

Variable resultado
ANLISIS ESTADSTICO Dicotmica Continua
Variable Dicotmica Test de 2 t de Student
Predictora
Variable Continua Regresin lo- Regresin lineal
Independiente gstica

REGRESIN LINEAL SIMPLE


C aptulo 7 Pgina 646

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable Variable Pruebas de contraste de Observaciones y/o limitaciones del test
Independiente o Dependiente o hiptesis
PREDICTORA RESULTADO
Cualitativa Cualitativa Ji cuadrado Si el tamao muestral es grande
Prueba exacta de Fisher Si el tamao muestral es pequeo
Test de McNemar Dos grupos de muestras repetidas o apareadas
Q de Cochran Ms de dos grupos de muestras repetidas o apareadas
REGRESIN LOGSTICA Varias variables predictoras cualitativas
Cualitativa Cuantitativa t de Student Compara medias entre dos grupos independientes
Anlisis de la Varianza Compara medias entre ms de dos grupos independientes
Test de Mann-Whitney Dos grupos independientes No paramtricos
Test de Wilcoxon Dos grupos medidas repetidas No paramtrico
Test de Kruskall-Wallis Ms de dos grupos No paramtrico, medidas repetidas
Test de Friedman Ms de dos grupos No paramtrico medidas repetidas
Cuantitativa Cualitativa Regresin logstica simple Una sola variable predictora cuantitativa
Regresin logstica multivariante Varias variable predictoras cuantitativa o cualitativas
Cuantitativa Cuantitativa Regresin lineal simple Paramtrico
Correlacin de Pearson Paramtrico
Correlacin de Sperman No paramtrico
REGRESIN MLTIPLE Varias variables predictoras cuantitativas
Cualitativa Superviviencia Kaplan-Meier Curvas de superviviencia
Long-Rank Compara curvas de superviviencia
Regresin de COX Anlisis Multivariante
C aptulo 7 Pgina 647

Tipos de test analticos estadsticos bivariantes de contraste


de hiptesis ms frecuentes
Variable Variable RESULTADO o Dependiente (Criterio de evaluacin)
PREDICTORA o Cualitativa nominal Cualitativa nominal Cualitativa ordinal o Cuantitativa
Independiente (factor dos >2 Cuantitativa NO paramtrica
de estudio) categoras categoras paramtrica
Cualitativa dos grupos Chi cuadrado Chi cuadrado U de Mann-Whitney T de Student
independientes Z comparacin de (prueba de Welch)
proporciones
Test exacto de
Fisher
Cualitativa dos grupos Test de McNemar Q de Cochran Prueba de los T de Student
apareados rangos para datos
de Wilcoxon emparejados
Cualitativa > 2 grupos Chi cuadrado Chi cuadrado Prueba de Kruskal- Anlisis de la Varianza
independientes Wallis (ANOVA)
Cualitativa > 2 grupos Q de Cochran Q de Cochran Prueba de Friedman Anlisis de la Varianza
apareados de dos vas
Cuantitativa Regresin logstica Regresin logstica Correlacin de Regresin lineal
Sperman Correlacin de Pearson
Tau de Kendall
C aptulo 7 Pgina 648

Cualitativa versus cuantitativa


Cules son las pruebas estadsticas que tenemos que emplear?

Variable PREDICTORA Variable RESULTADO


CUANTITATIVA CUANTITATIVA
- Continua - Continua
- Discreta - Discreta
C aptulo 7 Pgina 649

Datos cuantitativos:
Cuantitativa versus cuantitativa

Regresin lineal simple:


- Describe como es la relacin entre la variable predictora (X) y la variable
resultado (Y)
- Busca la lnea que mejor se ajusta a los puntos (x, y), y por tanto busca la
mejor prediccin de Y a partir de X

Correlacin:
- Mide el grado o fuerza de asociacin entre dos variables cuantitativas (X, Y).
C aptulo 7 Pgina 650

Datos cuantitativos:
Cuantitativa versus cuantitativa

Regresin lineal simple.


- Coeficiente de regresin
- Covarianza

Correlacin paramtrica
- Coeficiente de correlacin de Pearson (r)
- Coeficiente de determinacin r2

Correlacin NO paramtrica
- Coeficiente de correlacin de Spearman ()

Concordancia
- Coeficiente de correlacin intraclase
C aptulo 7 Pgina 651

Datos cuantitativos:
Cuantitativa versus cuantitativa

Comparacin de mtodos analticos

Regresin paramtrica
- Regresin lineal simple
- Coeficiente de regresin
- Coeficiente de correlacin intraclase

Regresiones NO paramtricas
- Regresin de Theil
- Regresin de Passing - Bablok
- Regresin de Bland - Altman
- Regresin de Tholen - Ludbrook
C aptulo 7 Pgina 652

Relacin directa e inversa


330 100
80
280 Incorrelacin 90 Fuerte relacin 70 Cierta relacin
80 directa. 60 inversa
230
50
70
180 40
60
30
130
50 20
80 40 10

30 0
30
140 150 160 170 180 190 200
140 150 160 170 180 190 200 140 150 160 170 180 190 200

Para valores de X por en- Para los valores de X mayores Para los valores de X mayores
cima de la media tenemos que la media le corresponden que la media le corresponden
valores de Y por encima y valores de Y mayores tambin. valores de Y menores. Esto es
por debajo en proporciones Para los valores de X menores relacin inversa o decreciente.
similares. Incorrelacin. que la media le corresponden
valores de Y menores tambin.
Esto se llama relacin directa.
C aptulo 7 Pgina 653

Pregunta de investigacin
Qu relacin existe entre el grado de IRC y el grado de
anemizacin del enfermo?

Variable PREDICTORA (X) Variable RESULTADO (Y)


Cuantitativa continua Cuantitativa continua
IRC Anemia

Creatinemia Hemoglobinemia
C aptulo 7 Pgina 654

Relacin entre variables cuantitativas continuas


Hemoglobina (g/dl)
Variable RESULTADO-RESPUESTA-posible EFECTO

11
Variable cuantitativa continua

10
Variable dependiente

2 3 4 5 6 7 8 Creatinina (mg/dl)

Representacin grfica de los niveles de creatinina y hemoglobina en


50 pacientes con fallo renal crnico
Variable PREDICTORA-EXPOSICIN-posible CAUSA
Variable independiente, fija controlada por el investigador
Variable cuantitativa continua
C aptulo 7 Pgina 655

Regresin lineal simple. Coeficiente de regresin


Hemoglobina (g/dl)
0 Estimaciones de los parmetros y sus
1 1 errores estndar para en la relacin de los
niveles de creatinina y hemoglobina en 50
pacientes con fallo renal crnico
Variable Estimacin Error estndar
Constante 12,25 0,2984
Creatinina - 0,5708 0,05312

Representacin grfica de los niveles de creatinina y


hemoglobina en 50 pacientes con fallo renal crnico
E(Y) = 0 + 1 * X

Coeficiente de regresin 1

Hb (Y) = 12,25 0,5708 * [Creatinina]


C aptulo 7 Pgina 656

Regresin Lineal Simple. Coeficiente de regresin


El valor de 1 es estadsticamente distinto de cero y por tanto podemos decir que existe
dependencia lineal entre los niveles de Hb y los de Cr en los pacientes con IRC?

Z Valor Error Estimaciones de los parmetros y sus


Z90% 1,64 90% 10% errores estndar para en la relacin de los
niveles de creatinina y hemoglobina en 50
Z95% 1,96 95% 5% pacientes con fallo renal crnico
Z99% 2,56 99% 1% Variable Estimacin Error estndar
Z99,5% 3,29 99,5% 0,5% Constante 12,25 0,2984
Creatinina - 0,5708 0,05312

1 0,5708
= = 10,74 > Z95%
EE1 0,05312

Podemos decir con error inferior al 5% que el nivel de Hb est asociado o depende del
nivel de Cr.
C aptulo 7 Pgina 657

Clculo del Intervalo de Confianza (IC) del coeficiente de


regresin
Cul es el IC al 95% de confianza para el cambio en el nivel de Hb por unidad de
aumento en el nivel de Cr en los pacientes con IRC?

Z Valor
Z95% 1,96 95%
Z99% 2,56 99%
Z99,5% 3,29 99,5%

1 Z95% X EE1
- 0,5708 (1,96) X 0,05312 = (- 0,67, -0,47)
Podemos decir con error inferior al 5% , es decir con una confianza del 95%, que el
descenso medio del nivel de Hb ser como mnimo 0,47 g/dl y como mximo 0,67 g/dl por
aumento en 1 mg/dl en el nivel de Cr. El hecho de que el IC95% no contenga al cero esta
de acuerdo con el resultado del contraste de hiptesis realizado (p<0,05).
C aptulo 7 Pgina 658

Covarianza de dos variables X e Y

- La covarianza entre dos variables, Sxy, nos indica si la posible relacin entre
dos variables es directa o inversa.
Directa: Sxy >0 1
Inversa: Sxy <0 S xy =
n
( xi - x )( yi - y )
Incorreladas: Sxy =0 i

- El signo de la covarianza nos dice si el aspecto de la nube de puntos es


creciente o no, pero no nos dice nada sobre el grado de relacin entre las
variables.
C aptulo 7 Pgina 659

Regresin lineal simple: Covarianza


n

Covarianza positiva > 0 Covarianza negativa < 0 ( X i - X )(Yi - Y )


sxy = i =1

Valores de la COVARIANZA dependiendo de la variacin al unsono de x e y n


100
( X i - X )(Yi - Y )
rxy = i =1

90
n sx s y

80

70
sxy
Covarianza nula = 0 rxy =
sx s y
60

10 20 30 40 50

El valor de la COVARIANZA es cero cuando no hay variacin al unsono de x e y


C aptulo 7 Pgina 660

Covarianza y coeficiente de correlacin de Pearson (r)

( X i - X )(Yi - Y )
rxy = i =1

n sx s y

sxy
rxy =
sx s y
C aptulo 7 Pgina 661

S xy
Coeficiente de correlacin lineal de Pearson r=
SxS y
- La coeficiente de correlacin lineal de Pearson de dos variables, r, nos indica si los
puntos tienen una tendencia a disponerse alineadamente.
- El coeficiente tiene el mismo signo que la covarianza Sxy por tanto su signo nos informa
del tipo de relacin, directa o inversa.
r es til para determinar si hay relacin lineal entre dos variables, pero no servir para otro
tipo de relaciones (cuadrtica, logartmica, ...)
- El coeficiente de correlacin no se debe extrapolar ms all del rango de valores
observado de las variables en estudio ya que la relacin existente entre X e Y puede
cambiar fuera de dicho rango.
- La correlacin no implica causalidad. La causalidad es un juicio de valor que requiere
ms informacin que un simple valor cuantitativo de un coeficiente de correlacin (*).
- No debe utilizarse para comparar dos mtodos que intentan medir el mismo evento
(variable), como por ejemplo dos instrumentos que miden la tensin arterial. El coeficiente
r mide el grado de asociacin entre dos cantidades pero no mira el nivel de acuerdo
o concordancia. Si los instrumentos de medida miden sistemticamente cantidades
diferentes uno del otro, la correlacin puede ser r 1 y su concordancia ser nula (**).
(*) Pita Fernndez S. Correlacin frente a causalidad JANO 1996; (1174): 59-60.
(**) Bland JM, Altman DG. Statistical methods for assesing agreement between two methods of clinical
measurement. Lancet 1986; 1: 307-310.
C aptulo 7 Pgina 662

Propiedades de r
- Es adimensional
- Slo toma valores en [-1,1]
- Las variables son incorreladas r=0
- Relacin lineal perfecta entre dos variables r=+1 o r=-1
- Excluimos los casos de puntos alineados horizontal o verticalmente.
- Cuanto ms cerca est r de +1 o -1 mejor ser el grado de relacin lineal.
- Siempre que no existan observaciones anmalas.

Relacin Variables Relacin


inversa incorreladas directa casi
perfecta perfecta

-1 0 +1

Horbar JD, Onstad L, Wright E. Predicting mortality risk for infants weighing 501 to 1500 grams at birth: The
National Institutes of Health Neonatal Research Network report. Crit Care Med 1993; 21:1218.
C aptulo 7 Pgina 663

Hb (Y) = 12,25 0,5708 * [Creatinina] Hb (Y) = 12,25 0,5708 * [Creatinina]

12
1 = - 0,5708 12 1 = - 0,5708
Y
Y

10
10

8
8

6
6

2 4 6 8 10
X X
2 4 6 8 10

Nube de puntos con distinta fuerza de asociacin pero con la misma regresin 1
C aptulo 7 Pgina 664

Coeficiente de correlacin de Pearson


Y Y
12
1 =1-= 0,5708
- 0,5708 12 1 = - 0,5708

10
10

8
8

6
6
r = - 0,72
0,98 r = - 0,72
2 4 6 8 10
X X
2 4 6 8 10

Alta fuerza de asociacin Menor fuerza de asociacin


Alto valor de r Menor valor de r
C aptulo 7 Pgina 665

Coeficiente de correlacin de Pearson


Y
12
- El valor absoluto de r es una medida de la fuerza de
asociacin entre dos variables cuantitativas distintas.
r > 0,70: magnitud intensa
10
0,3 < r < 0,7: magnitud moderada
r < 0,3: magnitud dbil
- Valores: -1 y 1
8 - Clculo del tamao muestral
- Mide la asociacin pero NO confundir la asociacin
estadstica con una relacin CAUSA-EFECTO.
6

r = - 0,72

2 4 6 8 10
X

Valor de r indica FUERZA de asociacin


C aptulo 7 Pgina 666

Coeficiente de correlacin de Pearson

r =r 0,136;
= -0,136; p = 0,048
p = 0,042 r = 0,178; p = 0,042
r = - 0,178

Indice de Quetelet (IMC)


Edad

Excrecin de sodio (mEq) en orina de 24 horas

Bajo valor de r Baja fuerza de asociacin


C aptulo 7 Pgina 667

Ejemplo del clculo del tamao muestral para el clculo del


coeficiente de correlacin entre dos variables cuantitativas
Supongamos que se desea estudiar la asociacin entre la edad y el nivel de colesterol
entre los pacientes de un centro de salud. Se disea un estudio piloto en el que se
determinar mediante una analtica el colesterol en una muestra aleatoria de los pacientes
durante un periodo de tiempo prefijado, de los que tambin se registrar su edad. Se
obtiene un valor del coeficiente de correlacin lineal de Pearson entre la edad y el
colesterol de r=0,3. Aplicando las frmulas, con un NIVEL DE CONFIANZA del 95% (error
=5%) y un PODER ESTADSTICO del 80% (error =20%), se obtiene:

En este caso, se necesitara incluir a 85


pacientes para llevar a cabo el estudio.

Si, adems, en este ltimo caso se prev un 20% de posibles prdidas de informacin
durante la ejecucin del estudio, el tamao muestral se recalcular segn la expresin:
Es decir, se necesitara una muestra
de 107 pacientes para llevar a cabo la
investigacin.

Prtegas Daz S, Pita Fernndez S. Determinacin del tamao muestral para calcular la significacin del
coeficiente de correlacin lineal. Cad Aten Primaria 2001; 9: 209-211.
C aptulo 7 Pgina 668

Regresin lineal simple. Coeficiente de determinacin


Hemoglobina (g/dl)
Variable RESULTADO-RESPUESTA-posible EFECTO

0 11
r = - 0,84
1
Variable cuantitativa continua

10

r2 = 0,71
Variable dependiente

Y = 12,25 0,5708 * X
7

2 3 4 5 6 7 8 Creatinina (mg/dl)

Representacin grfica de los niveles de creatinina y hemoglobina en


50 pacientes con fallo renal crnico
Variable PREDICTORA-EXPOSICIN-posible CAUSA
Variable independiente, fija controlada por el investigador
Variable cuantitativa continua
C aptulo 7 Pgina 669

Coeficiente de determinacin r2
- Indica el porcentaje de la variabilidad total de la variable dependiente o resultado
(Y) que puede ser explicada por la variable independiente o predictora (X)

- Se puede afirmar que el 71% de la variabilidad de las Hb (variable resultado) de


los 50 pacientes con IRC puede ser explicada por la distinta Cr de ellos ( r 2 =
0,71 ), resta por explicar un 29% que es achacable a otras variables predictoras
distintas de la Cr.

- Valores: -1 y 1

- El coeficiente de correlacin r de Pearson deca que la magnitud de la


asociacin entre la Hb y la Cr es del 84% (r=0,84) de la mxima posible.
C aptulo 7 Pgina 670

Tipos de correlaciones: positivas (r > 0)


330 130
120
280 110
230 100
90
180 80
70
130 60
50
80 r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,8 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

1 = constante (+)
C aptulo 7 Pgina 671

Tipos de correlaciones: negativas (r < 0)


90 80
80 70
70 60
60 50
50
40
40
30
30
20
20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200

80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200

1 = constante (-)
C aptulo 7 Pgina 672

Fenmeno Tracking

FACTORES AMBIENTALES

PERFIL LIPDICO Estudio de cohortes PERFIL LIPDICO


NEONATO de 108 nios SEGUNDO AO

FACTORES GENTICOS

Daz Portillo J. Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta. Tesis doctoral (Noviembre 1997). Facultad de Medicina de la Universidad de Cdiz.
C aptulo 7 Pgina 673

110
r = 0,23
r2 = 0,05
p < 0,05
Colesterol total (mg/dl) al nacimiento

80

50

20

80 130 180 230


Colesterol total (mg/dl) durante el segundo ao de vida
C aptulo 7 Pgina 674

110 8/108 (7,4%)

21/108 (19,4%)
b 4/61 Cristianos (6,5%)
4/44 Musulmanes (9,1%)
14/61 Cristianos (23,0%)
6/44 Musulmanes (13,6%) a
Colesterol total (mg/dl) al nacimiento

80

P75

50

c
64/108 (59,5%) 14/108 (13,9%)
34/61 Cristianos (55,7%) D 9/61 Cristianos (14,7%)
6/44 Musulmanes (13,6%)
20 28/44 Musulmanes (63,6%)

80 130 180 230


P75
Colesterol total (mg/dl) durante el segundo ao de vida
C aptulo 7 Pgina 675

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar DESPUS del curso
NEONATOS CT > P75 CT P75
CT > P75 A B
CT P75 C D

2McMemar =
[ ( B C ) 1 ]2

B+C
(B C)1
Z McNemar =
B+C
C aptulo 7 Pgina 676

Test de McNemar para datos apareados


(Prueba de la significacin de los cambios)
McNemar DESPUS del curso
NEONATOS CT > P75 CT P75
CT > P75 8 21
CT P75 14 64

[ ( 21 14 ) 1 ]2
2 McMemar = = 1,03
21 + 14
C aptulo 7 Pgina 677

Z Valor (B C)1
Z95% 1,96 0,05 Z McNemar =
Z98% 2,32 0,02 B+C
Z99% 2,56 0,01
Z99,5% 3,29 0,005
( 21 14 ) 1
Z McNemar = = 1,014
21 + 14

Conclusin: Como el estadstico Z calculado 1,014 es INFERIOR a Z tabulado


para un error alfa de 0,05 (1,96), podemos decir que las dos variables
evaluadas son independientes, es decir NO estn correlacionadas, y por tanto
no hay cambios importantes en la distribucin del colesterol total al pasar del
nacimiento al segundo ao de vida. Este comportamiento tambin se repite
en los dos grupos culturales (cristianos y musulmanes) de Ceuta.
C aptulo 7 Pgina 678

110

Colesterol total (mg/dl) al nacimiento


b a

80

P75

50

c
D
20

80 130 180 230


P75
Colesterol total (mg/dl) durante el segundo ao de vida
C aptulo 7 Pgina 679

50 r = 0,37
r2 = 0,14
40
p < 0,01
Apoprotena B (mg/dl) al nacimiento

30

20

10

0
30 40 50 60 70 80 90 100 110 120 130

Apoprotena B (mg/dl) durante el segundo ao de vida (12-20 meses)


C aptulo 7 Pgina 680

42
Apoprotena B (mg/dl) al nacimiento

34

26

r = 0,29 (IC95%=0,03-0,50)
18
r2 = 0,08
p < 0,05
10
30 70 110 150
Apoprotena B (mg/dl) durante los primeros meses (12-13) del segundo ao de vida
C aptulo 7 Pgina 681

47
r = 0,50 (IC95%=0,25-0,68)
r2 = 0,25
Apoprotena B (mg/dl) al nacimiento
39

p < 0,001
31

23

15

40 60 80 100 120
Apoprotena B (mg/dl) durante los 14-20 meses del segundo ao de vida
C aptulo 7 Pgina 682

Limitaciones del coeficiente de correlacin de Pearson


Representacin grfica de la actividad de protrombina (INR) y la albmina srica en pacientes con hepatocarcinoma.
120
Protrombina (INR) = 25,1 + (14,4 * [Albmina])
100
= 14,4 (IC95%: 8,3-20,5)
Variable RESULTADO-RESPUESTA

Variable cuantitativa continua


Variable dependiente

80
PROTROMBINA

60

40

20
R2 = 0,16
0
1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 3,4 3,6 3,8 4,0

ALBMINA
Variable PREDICTORA
Variable independiente, fija controlada por el investigador
Variable cuantitativa continua

Slo con la variable predictora incluida en el modelo (ALBMINA srica) slo se puede explicar el 16% de
la variabilidad de la variable resultado (PROTROMBINA), queda por explicar un 84% de la variabilidad que
es achacable a otras variables predictoras distintas no incluidas.
C aptulo 7 Pgina 683

Limitaciones del coeficiente de correlacin de Pearson


El modelo (coeficiente ) indica 26,0

Variable RESULTADO-RESPUESTA-posible EFECTO


IMC = 23,5 + (0,03 * Horas sentada)
que por cada 10 horas que pasa

IMC (peso [Kg] / Talla 2 [m2])


25,5 R2 = 0,006
sentada una mujer a la semana
aumenta su peso en unos 800

Variable cuantitativa continua


25,0

gr.

Variable dependiente
24,5

24,0

Slo con la variable predictora 23,5

incluida en el modelo (horas 23,0

sentado) slo se puede explicar 0 10 20 30 40 50 60 70 80

el 0,6% de la variabilidad de la Horas sentado / semana (tiempo libre)

variable resultado (IMC), queda


Relacin entre el ndice de masa corporal (IMC) y las horas de estar sentado
por explicar un 99,4% de la a la semana en el tiempo libre.
variabilidad que es achacable Muestra representativa (n=7.926) mujeres de la Unin Europea
a otras variables predictoras Variable PREDICTORA-EXPOSICIN-posible CAUSA
Variable independiente, fija controlada por el investigador
distintas no incluidas. Variable cuantitativa continua
C aptulo 7 Pgina 684

Limitaciones del coeficiente de correlacin de Pearson

100
34

1 = 0
32
1 = 0
90 30

Indice de masa Corporal (IMC)


Glucemia (mg/dl)

28
80
26

24
70

22

60 20

10 20 30 40 50 60 70 80
10 20 30 40 50

Edad Edad

Dos nubes de puntos con la misma pendiente 1 de valor cero que muestran dos situaciones muy diferentes.
A la izquierda ausencia de relacin. A la derecha relacin NO lineal.

NO se puede emplear el coeficiente de correlacin de Pearson


C aptulo 7 Pgina 685

Limitaciones del coeficiente de correlacin de Pearson

Relacin y=a+b
1
cuadrtica X

y = a + b x2 Relacin
hiperblica

NO se puede emplear el coeficiente de correlacin de Pearson

Podemos encontrar cualquier tipo de funcin matemtica con claro apartamiento de la


linealidad.
C aptulo 7 Pgina 686

Otros coeficientes de correlacin


- Cuando las variables en vez de ser numricas son ordinales, es posible
preguntarse sobre si hay algn tipo de correlacin entre ellas?
- Disponemos para estos casos de tres test estadsticos:
- (ro) de Spearman
- (tau) de Kendall
- Coeficiente de asociacin ordinal de Goodman-Kruscall (coefiente
gamma)
- Son estadsticos anlogos al coeficiente de correlacin lineal de Pearson r,
que aparecen en estudios donde las variables cuantitativas no son continuas
y/o no siguen una distribucin normal.
- El coeficiente de correlacin de Spearman es recomendable utilizarlo
cuando los datos presentan valores externos ya que dichos valores afectan
mucho el coeficiente de correlacin de Pearson, o ante distribuciones NO
normales.
n
6 di2
rs = 1 - i =1

n ( n 2 - 1)
C aptulo 7 Pgina 687

Coeficientes de correlacin
PEARSON SPEARMAN

- Ambas variables deben seguir - No requiere supuestos previos


la distribucin NORMAL de normalidad
- Slo detecta asociaciones
lineales - Detecta asociaciones distintas
- Las observaciones han de ser de la lineal
independientes
- Es un mtodo no paramtrico
pero permite la construccin de
intervalos de confianza

- Estima el grado de asociacin


de cualquier tipo con
independencia de la funcin
matemtica que relaciona ambas
variables
C aptulo 7 Pgina 688

Pregunta de investigacin
Existe relacin entre la edad del paciente y la duracin de
la estancia en UCI?

Variable PREDICTORA 1 Variable RESULTADO


CUANTITATIVA continua CUANTITATIVA discreta
Edad Estancia
- Aos - Das

Cul es el test estadstico ms acertado?


C aptulo 7 Pgina 689
C aptulo 7 Pgina 690

80
Lnea continua ajuste mediante estimador robusto de
regresin medio ponderado
Das de estancia en UCI
Lnea de trazos discontinuos: ajuste mediante mnimos
60 cuadrados

40

20

0
20 30 40 50 60 70 80
Edad del paciente
C aptulo 7 Pgina 691

Resultados
Coeficiente de correlacin de Spearman
Variable N Correlacin (r) Significacin
Edad del paciente versus Estancia en UCI 22 0,614 (**) 0,002

Tau-b de Kendall
Variable N Correlacin (r) Significacin
Edad del paciente versus Estancia en UCI 22 0,470 (**) 0,003

** La correlacin es significativa al nivel 0,01 (bilateral).

p < 0,01 Rechazamos la hiptesis nula


C aptulo 7 Pgina 692

Pregunta de investigacin
Existe relacin entre la intensidad del estudio y el rendimiento
acadmico en el examen del curso de Bioestadstica?

Variable PREDICTORA 1 Variable RESULTADO


Cuantitativa continua Cuantitativa discreta
Horas de estudio Rendimiento acadmico

Cul es el test estadstico ms acertado?


C aptulo 7 Pgina 693

Pregunta de investigacin: Existe relacin entre la intensidad del


estudio y el rendimiento acadmico en el examen del curso de
Bioestadstica?
N del Horas N

Nmero de respuestas correctas


Alumno de respuestas
estudio correctas 20
(X1) (Y)

15 r = 0.976 p< 0.001


1 5 6
2 9 16
3 17 18 10
4 1 1
5 2 3 5
6 21 21
7 3 7 0
8 29 20
9 7 15 10 30 50 70 90
10 100 22 Nmero de horas de estudio

Cul es el test estadstico ms acertado?


C aptulo 7 Pgina 694

Resultados
Coeficiente de correlacin de Spearman
Variable N Correlacin (r) Significacin
Horas de estudio versus Respuestas correctas 10 0,976 (**) 0,000

Tau-b de Kendall
Variable N Correlacin (r) Significacin
Horas de estudio versus Respuestas correctas 10 0,911 (**) 0,000

** La correlacin es significativa al nivel 0,01 (bilateral).

p < 0,01 Rechazamos la hiptesis nula


C aptulo 7 Pgina 695

Mito 1: La sonrisa de la esfinge

He observado que el individuo n 20 se aparta bastante de la tendencia del


grupo. De hecho si se eliminara se podra considerar una supuesta relacin
lineal.

Ests seguro que ese dato n 10 es correcto?Est bien tomado? Cmo


ests seguro de que ese individuo ha estudiado 100 horas? Qu medidas
has tomado para considerar la credibilidad de la variable predictora (horas de
estudio)?

No podra considerarse a ese individuo n 10 como un perifrico o


OUTLIER?
C aptulo 7 Pgina 696

Pregunta de investigacin
Existe relacin entre el coeficiente intelectual de los alumnos y el
rendimiento acadmico en el examen del curso de Bioestadstica?

Variable PREDICTORA 2 Variable RESULTADO


Cuantitativa discreta Cuantitativa discreta
Coeficiente intelectual Rendimiento acadmico

Cul es el test estadstico ms acertado?


C aptulo 7 Pgina 697

Pregunta de investigacin: Existe relacin entre el coeficiente


intelectual del alumno y el rendimiento acadmico en el examen
del curso de Bioestadstica?
N del Horas N
Alumno de respuestas
estudio correctas

Nmero de respuestas correctas


(X 2) (Y) 20

1 104 6
15
2 125 16
3 115 18 r = 0.811 p< 0.01
10
4 100 1
5 100 3 5
6 140 21
7 112 7 0
8 130 20
100 110 120 130 140
9 125 15
Coeficiente intelectual (CI)
10 122 22

Cul es el test estadstico ms acertado?


C aptulo 7 Pgina 698

Resultados
Coeficiente de correlacin de Spearman
Variable N Correlacin (r) Significacin
Coeficiente intelectual versus respuestas correctas 10 0,811 (**) 0,004

Tau-b de Kendall
Variable N Correlacin (r) Significacin
Coeficiente intelectual versus respuestas correctas 10 0,705 (**) 0,005

** La correlacin es significativa al nivel 0,01 (bilateral).

p < 0,01 Rechazamos la hiptesis nula


C aptulo 7 Pgina 699

Pregunta de investigacin
Existe relacin entre las horas de asistencia a clase y el
rendimiento acadmico en el examen del curso de Bioestadstica?

Variable PREDICTORA 3 Variable RESULTADO


Cuantitativa continua Cuantitativa discreta
Horas de asistencia a clases Rendimiento acadmico

Cul es el test estadstico ms acertado?


C aptulo 7 Pgina 700

Pregunta de investigacin: Existe relacin entre las horas de


asistencia a clase y el rendimiento acadmico en el examen del
curso de Bioestadstica?
N del Horas N

Nmero de respuestas correctas


Alumno de respuestas 20 r = 0.985 p< 0.01
estudio correctas
(X3) (Y)
15
1 23 6
2 92 16
3 78 18 10

4 15 1
5 20 3 5
6 100 21
7 35 7
0
8 95 20
25 50 75 100
9 75 15
Horas de asistencia a clase
10 100 22

Cul es el test estadstico ms acertado?


C aptulo 7 Pgina 701

Resultados
Coeficiente de correlacin de Spearman
Variable N Correlacin (r) Significacin
Asistencia a clase versus respuestas correctas 10 0,985 (**) 0,000

Tau-b de Kendall
Variable N Correlacin (r) Significacin
Asistencia a clase versus respuestas correctas 10 0,944 (**) 0,000

** La correlacin es significativa al nivel 0,01 (bilateral).

p < 0,01 Rechazamos la hiptesis nula


C aptulo 7 Pgina 702

Resumen de los resultados de correlacin bivariante

Variables predictoras Rho Spearman Significacin Tau de Kendall Significacin


Horas de estudio 0,976 0,000 0,911 0,000
Coeficiente intelectual 0,811 0,004 0,705 0,005
Asistencia a clase 0,985 0,000 0,944 0,000
Variable resultado: Rendimiento acadmico (nmero de respuestas correctas)

Existe relacin entre las distintas variables predictoras?

COLINEALIDAD?
C aptulo 7 Pgina 703

Pregunta de investigacin
Existe relacin entre las horas dedicadas al estudio por el
alumno y el coeficiente intelectual de los alumnos del curso
de Bioestadstica?

Variable PREDICTORA 1 Variable PREDICTORA 2


Cuantitativa continua Cuantitativa discreta
Horas de estudio Coeficiente intelectual

Cul es el test estadstico ms acertado?


C aptulo 7 Pgina 704

Resultados
Coeficiente de correlacin de Spearman
Variable N Correlacin (r) Significacin
Horas de estudio versus coeficiente intelectual 10 0,787 (**) 0,007

** La correlacin es significativa al nivel 0,01 (bilateral).

Tau-b de Kendall
Variable N Correlacin (r) Significacin
Horas de estudio versus coeficiente intelectual 10 0,614 (*) 0,015

* La correlacin es significativa al nivel 0,05 (bilateral).

p < 0,05 Rechazamos la hiptesis nula


C aptulo 7 Pgina 705

Pregunta de investigacin
Existe relacin entre las horas de estudio del alumno y las
horas de asistencia a clase del curso de Bioestadstica?

Variable PREDICTORA 1 Variable PREDICTORA 3


Cuantitativa continua Cuantitativa continua
Horas de estudio Horas de asistencia a clases

Cul es el test estadstico ms acertado?


C aptulo 7 Pgina 706

Resultados
Coeficiente de correlacin de Spearman
Variable N Correlacin (r) Significacin
Horas de estudio versus asistencia a clase 10 0,954 (**) 0,000

** La correlacin es significativa al nivel 0,01 (bilateral).

Tau-b de Kendall
Variable N Correlacin (r) Significacin
Horas de estudio versus asistencia a clase 10 0,854 (**) 0,001

** La correlacin es significativa al nivel 0,01 (bilateral).

p < 0,05 Rechazamos la hiptesis nula


C aptulo 7 Pgina 707

Pregunta de investigacin
Existe relacin entre el coeficiente intelectual del alumno y
las horas de asistencia a clase del curso de Bioestadstica?

Variable PREDICTORA 2 Variable PREDICTORA 3


Cuantitativa discreta Cuantitativa continua
Coeficiente intelectual Horas de asistencia a clases

Cul es el test estadstico ms acertado?


C aptulo 7 Pgina 708

Resultados
Coeficiente de correlacin de Spearman
Variable N Correlacin (r) Significacin
Coeficiente intelectual versus asistencia a clase 10 0,869 (**) 0,001

** La correlacin es significativa al nivel 0,01 (bilateral).

Tau-b de Kendall
Variable N Correlacin (r) Significacin
Coeficiente intelectual versus asistencia a clase 10 0,782 (**) 0,002

** La correlacin es significativa al nivel 0,01 (bilateral).

p < 0,05 Rechazamos la hiptesis nula


C aptulo 7 Pgina 709

Variable PREDICTORA 1
Cuantitativa
Horas
de estudio

Variable PREDICTORA 2 Variable RESULTADO


Cuantitativa Cuantitativa
Coeficiente Rendimiento
intelectual acadmico

Variable PREDICTORA 3
Cuantitativa
Horas de
asistencia a clases
C aptulo 7 Pgina 710
C aptulo 7 Pgina 711

Qu relacin existe entre el consumo de cigarrillos y los


niveles de cadmio en sangre?

Cuantitativa discreta Cuantitativa continua


Consumo de cigarrillos Cadmio en sangre
Nmero de cigarrillos Niveles sricos de cadmio
consumidos por da (g/L)

Cul es el test estadstico ms acertado?


C aptulo 7 Pgina 712

r = 0,532 p = 0,001
C aptulo 7 Pgina 713

Med Clin (Barc) 2006;127:41-6.


C aptulo 7 Pgina 714
C aptulo 7 Pgina 715

Pregunta de investigacin
Qu relacin y que grado de asociacin existe entre el
ndice de actividad clnica de las enfermedades inflamatorias
intestinales (EII) y los niveles de calprotectina fecal?

Variable PREDICTORA Variable RESULTADO


Cuantitativa continua Cuantitativa discreta
Calprotectina fecal ndice de actividad de la enfermedad
inflamatoria intestinal (Harvey-
Bradshaw modificado para colitis
ulcerosa y enfermedad de Crohn)
C aptulo 7 Pgina 716

ndice de Harvey-Bradshaw

Qu tipo de variable es el ndice de Harvey-Bradshaw?


C aptulo 7 Pgina 717

20

Coeficiente de correlacin
Rho de Spearman
ndice de actividad clnica 15
ndice de Harvey- Bradshaw

r = 0,719 p < 0,01


10

0
0 1.000 2.000 3.000 4.000 5.000 6.000 7.000 8000
Calprotectina fecal (g/g)

Cul es la prueba estadsticas ms adecuada?


C aptulo 7 Pgina 718

Anlisis estadstico (fragmento del texto)

El anlisis de los datos se llev a cabo mediante el programa estadstico SPSS 11.0. El
valor de la CPF se presenta como media y con un intervalo de confianza (IC) del 95%.
Se utiliz el test de Kruskal-Wallis para evaluar las diferencias entre los valores de CPF
entre los diferentes grupos y el coeficiente de Spearman para valorar la correlacin entre
este marcador y el ndice de actividad de la enfermedad en el grupo de pacientes con
enfermedad inflamatoria intestinal (EII).
C aptulo 7 Pgina 719

Resultados (fragmento del texto)

En la figura 2 se muestra la correlacin positiva entre la concentracin de la CPF y


el ndice de actividad de la enfermedad en pacientes con enfermedades inflamatoria
intestinales (EII) (enfermedad de Crohn (EC) y colitis ulcerosa (CU)) (r = 0,719, p < 0,01).

Discusin (fragmento del texto)

El presente trabajo muestra que la concentracin de CPF est significativamente elevada


en pacientes con procesos orgnicos en colon, fundamentalmente en el cncer colorrectal
y enfermedad inflamatoria intestinal (EII). Adems, los valores ms altos se alcanzan
en pacientes con EII, y sus valores se correlacionan con el grado de actividad de la
enfermedad.
C aptulo 7 Pgina 720

Pregunta de investigacin
Qu relacin y qu grado de asociacin existe entre el nivel
de conocimientos mdicos actualizados sobre el mejor trata-
miento posible y el tiempo transcurridos desde la graduacin?

Variable PREDICTORA Variable RESULTADO


Cuantitativa continua Cuantitativa discreta
Aos desde la graduacin Conocimientos actualizados
sobre el mejor tratamiento posible
(medidos segn escala de MBE)
C aptulo 7 Pgina 721

Conocimientos actualizados sobre el mejor


Coeficiente de correlacin Rho de Spearman
tratamiento posible (niveles de evidencia)
r = - 0,54
p < 0,001
. ..
. . .... . ...
...
... .... ...
.... ..
Una Pendiente Resbaladiza

Aos desde la graduacin


C aptulo 7 Pgina 722

Estudios ecolgicos
EE.UU
Ferroviarios Seven
Countries
Study

FINLANDIA
HOLANDA
Zutphen

YUGOSLAVIA JAPON
Belgrado Tanushimaru
ITALIA
Dalmacia
Crevalcore Ushibuka
GRECIA Eslavonia
Montegiorgio
Creta Velika Krsna
Roma
Corfu Zrenjanin
C aptulo 7 Pgina 723

Estudio ecolgico

Variable PREDICTORA Variable RESULTADO


Factor de exposicin (F) Efecto o Enfermedad (E)
Grasas saturadas Cardiopata coronaria

cidos grasos saturados Tasas de mortalidad por


de la dieta (% de aporte cardiopata coronaria
calrico)

Cul es el test estadstico ms acertado?


C aptulo 7 Pgina 724

Estudio ecolgico
5

Fallecimiento por cardiopata coronaria (%)


Coeficiente de correlacin r de Spearman E
4

U N
3

2 W
MC S
G DB
1 r = 0,84
V Z
K
0 5 10 15 20 25
cidos grasos saturados en la dieta (% de aporte calrico)

Tasa de mortalidad por cardiopata coronaria en funcin del contenido en cidos grasos saturados de la
dieta (% del aporte calrico). Ambas variables estn significativamente correlacionadas segn un amplio
estudio (Seven Countries Study) llevado a cabo en diferentes grupos de poblacin. B = Belgrado, C=
Crevalcore, D= Dalmacia, E = este de Finlandia, G = Corf, K = Creta, N = Zutphen, M = Montegiorgio, S
= Eslavonia, T = Tanushimaru, U = empleados de ferrocarriles de EEUU, V = Velika Krsna, W = oeste de
Finlandia, Z = Zrenjarin.
C aptulo 7 Pgina 725

Estudio ecolgico

Variable PREDICTORA Variable RESULTADO


Factor de exposicin (F) Efecto o Enfermedad (E)
Grasas saturadas Colesterolemia

cidos grasos saturados Tasas de colesterol en


de la dieta (% de aporte sangre (mg/dl)
calrico)

Cul es el test estadstico ms acertado?


C aptulo 7 Pgina 726

Estudio ecolgico
280 Coeficiente de correlacin r de Spearman

260 W E
240 U N
Colesterolemia (mg/dl)

220 B
K Z
200 G MC S
180
D r = 0,89
T
160

140 V
0 5 10 15 20 25
cidos grasos saturados en la dieta (% de aporte calrico)
Valores de colesterol en sangre en relacin con el contenido en cidos grasos saturados de la dieta (%
del aporte calrico). Ambas variables estn significativamente correlacionadas segn un amplio estudio
(Seven Countries Study) llevado a cabo en diferentes grupos de poblacin. B = Belgrado, C= Crevalcore,
D= Dalmacia, E = este de Finlandia, G = Corf, K = Creta, N = Zutphen, M = Montegiorgio, S = Eslavonia,
T = Tanushimaru, U = empleados de ferrocarriles de EEUU, V = Velika Krsna, W = oeste de Finlandia, Z =
Zrenjarin.
C aptulo 8 Pgina 727

Captulo 8

Publicacin Bioestadstica: Anlisis bivariante.


Test de contraste de hiptesis.
Cualitativa dicotmica versus cuantitativa.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 8 Pgina 728

Materiales y mtodos
Estructura

1. Tipo de diseo (estudio).


2. Sujetos incluidos (criterios de seleccin de la muestra)
3. Fuentes de informacin.
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales).
5. Instrumentos y procedimientos de medida (cuestionarios).
6. Definicin de las variables y covariables incluidas en el estudio (factor de
estudio y criterio de evaluacin).
7. Limitaciones y consideraciones ticas de la investigacin.
8. Pruebas estadsticas a utilizar (programa estadstico).
C aptulo 8 Pgina 729

Fases del anlisis estadstico

1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE
C aptulo 8 Pgina 730

Decisiones que se pueden tomar en un test de contraste


de hiptesis despus de conocer el valor de significacin
estadstica p
p < 0,05 AB p 0,10 A=B
Se rechaza la hiptesis nula No se puede rechazar la hiptesis nula
No parece que el azar pueda No se puede descartar que el azar lo
explicarlo todo explique todo
El EFECTO observado es mayor que El EFECTO observado es similar que el
el ERROR ERROR
Hay diferencias estadsticamente NO hay diferencias estadsticamente
significativas significativas
Existen evidencias a favor de la NO existen evidencias a favor de la
hiptesis alternativa Ha, y por tanto hiptesis alternativa Ha, y por tanto
rechazamos la hiptesis nula Ho aceptamos la hiptesis nula Ho

Los lmites de 0,05 y 0,1 pueden ser considerados en cierto modo


arbitrarios y aproximados
C aptulo 8 Pgina 731

Anlisis estadstico
Tipos de test analticos estadsticos de contraste de hiptesis
segn el tipo de variables implicadas en el estudio

Variable dependiente
Variable resultado

Dicotmica Continua
Variable Dicotmica Test de 2 t de Student
Predictora
Variable Continua Regresin lo- Regresin lineal
Independiente gstica
C aptulo 8 Pgina 732

Anlisis estadstico

Variable resultado
ANLISIS ESTADSTICO Dicotmica Continua
Variable Dicotmica Test de 2 t de Student
Predictora
Variable Continua Regresin lo- Regresin lineal
Independiente gstica

t de Student
C aptulo 8 Pgina 733

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable Variable Pruebas de contraste de Observaciones y/o limitaciones del test
Independiente o Dependiente o hiptesis
PREDICTORA RESULTADO
Cualitativa Cualitativa Ji cuadrado Si el tamao muestral es grande
Prueba exacta de Fisher Si el tamao muestral es pequeo
Test de McNemar Dos grupos de muestras repetidas o apareadas
Q de Cochran Ms de dos grupos de muestras repetidas o apareadas
REGRESIN LOGSTICA Varias variables predictoras cualitativas
Cualitativa Cuantitativa t de Student Compara medias entre dos grupos independientes
Anlisis de la Varianza Compara medias entre ms de dos grupos independientes
Test de Mann-Whitney Dos grupos independientes No paramtricos
Test de Wilcoxon Dos grupos medidas repetidas No paramtrico
Test de Kruskall-Wallis Ms de dos grupos No paramtrico, medidas repetidas
Test de Friedman Ms de dos grupos No paramtrico medidas repetidas
Cuantitativa Cualitativa Regresin logstica simple Una sola variable predictora cuantitativa
Regresin logstica multivariante Varias variable predictoras cuantitativa o cualitativas
Cuantitativa Cuantitativa Regresin lineal simple Paramtrico
Correlacin de Pearson Paramtrico
Correlacin de Sperman No paramtrico
REGRESIN MLTIPLE Varias variables predictoras cuantitativas
Cualitativa Superviviencia Kaplan-Meier Curvas de superviviencia
Long-Rank Compara curvas de superviviencia
Regresin de COX Anlisis Multivariante
C aptulo 8 Pgina 734

Tipos de test analticos estadsticos bivariantes de contraste


de hiptesis ms frecuentes
Variable Variable RESULTADO o Dependiente (Criterio de evaluacin)
PREDICTORA o Cualitativa nominal Cualitativa nominal Cualitativa ordinal o Cuantitativa
Independiente (factor dos >2 Cuantitativa NO paramtrica
de estudio) categoras categoras paramtrica
Cualitativa dos grupos Chi cuadrado Chi cuadrado U de Mann-Whitney T de Student
independientes Z comparacin de (prueba de Welch)
proporciones
Test exacto de
Fisher
Cualitativa dos grupos Test de McNemar Q de Cochran Prueba de los T de Student
apareados rangos para datos
de Wilcoxon emparejados
Cualitativa > 2 grupos Chi cuadrado Chi cuadrado Prueba de Kruskal- Anlisis de la Varianza
independientes Wallis (ANOVA)
Cualitativa > 2 grupos Q de Cochran Q de Cochran Prueba de Friedman Anlisis de la Varianza
apareados de dos vas
Cuantitativa Regresin logstica Regresin logstica Correlacin de Regresin lineal
Sperman Correlacin de Pearson
Tau de Kendall
C aptulo 8 Pgina 735

Cualitativa versus cuantitativa


Cules son las pruebas estadsticas que tenemos que emplear?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA dicotmica CUANTITATIVA
C aptulo 8 Pgina 736

Cualitativa dicotmica versus cuantitativa

PARAMTRICOS NO PARAMTRICOS
2 GRUPOS

T de Student para mues- U de Mann-Whitney


Independientes tras independientes

T de Student para mues- Wilcoxon


Aparejados tras apareadas

Variable predictora Cualitativa versus variable resultado Cuantitativa.


C aptulo 8 Pgina 737

Test de la T de Student para dos muestras independientes


Condiciones de aplicacin (1)

- n1 y n2 >= 30
- Normalidad (Requisitos necesarios)
- Comprobar que el mximo y el mnimo quedan dentro del intervalo
definido por 3 DE por encima y por debajo de la media (media 3 DE)
- Que la asimetra (en valor absoluto) sea menor que dos veces el error
estndar [asimetra] < 2 EE de asimetra
- Que la curtois (en valor absoluto) sea menor que 2 veces su EE [Curtois] <
2 EE de curtois

Test de Kolmogorov-Smirnov
Test de Shapiro-Wilks
C aptulo 8 Pgina 738

Test de la T de Student para dos muestras independientes


Condiciones de aplicacin (2)

Homogeneidad de varianzas (homoscedasticidad)


- Prueba F de Snedecor
- Test de Barttlet Varianza mayor
- Test de Levene F=
Varianza menor

Ho: Las varianzas de ambos grupos son iguales Test T de Student

Ha: Existen diferencias entre las varianzas Test de Welch

Fcalculada < Ftabulada p>0,05 (aceptamos la Ho)

Fcalculada > Ftabulada p<0,05 (rechazamos la hiptesis nula)


C aptulo 8 Pgina 739

Pregunta de investigacin
El peso al nacer de los varones difiere del peso al nacer de
las mujeres?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA dicotmica CUANTITATIVA continua
Sexo Peso (Kg)

Cul es la prueba estadstica ms adecuada?


C aptulo 8 Pgina 740

Test de la T de Student:
Muestras independientes
Hiptesis nula Ho: El peso al nacer de los varones NO difiere del peso al
nacer de las mujeres

Hiptesis alternativa Ha: El peso al nacer de los varones difiere del peso al
nacer de las mujeres
Peso al nacer del RN
Varones Mujeres
Media 3380,3 3246,8
Desviacin estndar (S) 417,3 388,0
n 833 789

X1 X2
t calculada =
tcalculada= 6,666

(n 1) S12 + (m 1) S22 1 1
+
(n + m 2) n m
C aptulo 8 Pgina 741

Test de la T de Student para muestras independientes


Grados de libertad (g.l) = n + m - 2 gl = 883 + 789 - 2 = 1620

Peso del RN Varones Mujeres


n 883 789
Media 3380,34 3246,79
Desviacin estndar 417,28 388,0
EEM 14,46 13,81
t calculada 6,666
Grados de libertad 1620
Significacin (bilateral) 0,000

t calculada= 6,666 > t tabulado = 1,96; p < 0,001

Ha: El peso al nacer de los varones difiere del peso al nacer de las mujeres
C aptulo 8 Pgina 742

Distribucin de la t de Student

Grados de libertad = n - 1
= n-1

(x - )
valores " t " : t =
s
C aptulo 8 Pgina 743

Distribucin de la t de Student (gl 30)


El test de la T de Student para muestras de ms de 30 individuos presenta
una distribucin muy similar a la distribucin normal tipificada Z.

El test de la T de Student es una prueba BILATERAL, y por tanto NO


especifica la direccin de la diferencia ( A B).

Nivel de significacin
estadstica = 0,05 t calculada = 6,666

Z 1- /2 Z 1- /2

- 1,96 1,96
t tabulado = 1,96 para los grados de libertad de la muestra (1620)
C aptulo 8 Pgina 744

Interpretacin del valor de la t de Student (t=6,666)

- La diferencia observada (t calculada= 6,666) es muy grande en relacin a


la variabilidad aleatoria esperada (t tabulada) , y por tanto existen diferencias
significativas (p<0,001)
- El efecto observado (diferencia entre el peso de los dos sexos) es muy
superior a la variabilidad biolgica esperada.
- El efecto observado (diferencia entre el peso de los dos sexos) es
importante, es decir mucho mayor de lo esperado por el azar.
- El valor de la t tabulada para un error alfa del 5% es muy inferior al encontrado
t tabulado < t calculada
- El valor de la p (p < 0,001) indica que existe una probabilidad muy baja
(<0,1%) de observar al menos estas diferencias en los pesos por efecto del
AZAR y no porque los varones tengan distinto peso que las mujeres.
C aptulo 8 Pgina 745

Pregunta de investigacin
Tiene influencia el tipo de dieta (pescado/huevos) seguida
en el peso del individuo?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA dicotmica CUANTITATIVA continua
Tipo de dieta Peso (Kg)
C aptulo 8 Pgina 746

Test de la T de Student:
Muestras independientes
Hiptesis nula Ho (ambas dietas tienen igual efecto)
Hiptesis alternativa H1 (las dietas tienen distinto efecto)

Variable PREDICTORA
Cualitativa discreta y dicotmica: TIPO DE DIETA (pescado o huevos)

Variable RESULTADO
Cuantitativa continua: Kg adelgazados durante los 3 meses que dur la dieta

Personas que siguen la dieta Variable PREDICTORA Variacin en el peso (kg)


P a base de pescado n=19 Cualitativa discreta y
dicotmica:
Personas que siguen la dieta TIPO DE DIETA Variacin en el peso (kg)
H a base de huevo n=10 3 meses

Martnez Gonzlez MA, Jokin de Irala Estvez, Faulin Fajardo FJ. Bioestadstica amigable. Madrid:
Ediciones Daz de Santos; 2001.
C aptulo 8 Pgina 747

Personas que siguen la dieta Personas que siguen la dieta


P a base de pescado n=19 H a base de huevo n=10
ID DIETA REDUCCION PESO (Kg) ID DIETA REDUCCION PESO
(Kg)
20 HUEVOS 23
1 PESCADO 19
21 HUEVOS 23
2 PESCADO 28
22 HUEVOS 5
3 PESCADO 17 23 HUEVOS 14

4 PESCADO 15 24 HUEVOS 22

25 HUEVOS 20
5 PESCADO 16
26 HUEVOS 4
6 PESCADO 21
27 HUEVOS 12
7 PESCADO 27 28 HUEVOS 18

8 PESCADO 18 29 HUEVOS 33

30 HUEVOS 19
9 PESCADO 15
Media 17,545
10 PESCADO 10
Desviacin estndar 8,43
11 PESCADO 10 Varianza 71,1

12 PESCADO 2
Variable RESULTADO
13 PESCADO 12
Cuantitativa continua
14 PESCADO 13

15 PESCADO 19

16 PESCADO 9
X1 X2
17 PESCADO 29 t calculada =

18 PESCADO 35 (n 1) S12 + (m 1) S22 1 1
+
19 PESCADO 38 (n + m 2) n m
Media 18,579 t calculada = 0,3
Desviacin estndar 9,26 t calculada= 0,3 < t tabulado p = 0,76
Varianza 85,8

Variable RESULTADO
Cuantitativa continua
C aptulo 8 Pgina 748

Test de la T de Student:
Muestras independientes
Test de la t de Student

t calculada < t tabulada t calculada > t tabulada


p > 0,05 p < 0,05

Hiptesis nula H0 Hiptesis alternativa Ha

Las medias de la reduccin Las medias de la reduccin


del peso en los dos grupos del peso en los dos grupos
comparados es independiente de comparados son diferentes
la intervencin diettica entre s, es decir NO pueden
considerarse iguales

t calculada = 0,3 < t tabulado p = 0,76

Tienen el mismo efecto las dietas ensayadas para reducir el peso corporal?

S
C aptulo 8 Pgina 749

Interpretacin del valor de la t de Student (t=0,30)

- La diferencia observada (t calculada= 0,3) es pequea en relacin a la


variabilidad aleatoria esperada (t tabulada) , y por tanto no existen diferencias
significativas (p>0,05)
- El efecto observado (diferencia entre las dos dietas) es slo del 30% de la
variabilidad biolgica esperada.
- El efecto observado (diferencia entra las dos dietas) es insignificante, es
decir mucho menor de lo esperado por el azar.
- El valor de la t tabulada para un error alfa del 5% es superior al encontrado
t tabulado > t calculada
- El valor de la p (p = 0,76) indica que existe una probabilidad muy alta (76%)
de observar al menos estas diferencias en la reduccin del peso si la muestra
procediese de una poblacin donde las dos dietas tienen el mismo efecto (las
diferencias observadas son producidas por el AZAR y no porque las dietas
tengan distinto efecto).
C aptulo 8 Pgina 750

Test de la T de Student para dos muestras independientes


Condiciones de aplicacin (1)

- n1 y n2 >= 30
- Normalidad (Requisitos necesarios)
- Comprobar que el mximo y el mnimo quedan dentro del intervalo
definido por 3 DE por encima y por debajo de la media (media 3 DE)
- Que la asimetra (en valor absoluto) sea menor que dos veces el error
estndar [asimetra] < 2 EE de asimetra
- Que la curtois (en valor absoluto) sea menor que 2 veces su EE [Curtois] <
2 EE de curtois

Test de Kolmogorov-Smirnov
Test de Shapiro-Wilks
C aptulo 8 Pgina 751

Test de la T de Student para dos muestras independientes


Condiciones de aplicacin (2)

Homogeneidad de varianzas (homoscedasticidad)


- Prueba F de Snedecor
- Test de Barttlet Varianza mayor
- Test de Levene F=
Varianza menor

Ho: Las varianzas de ambos grupos son iguales Test T de Student

Ha: Existen diferencias entre las varianzas Test de Welch

Fcalculada < Ftabulada p>0,05 (aceptamos la Ho)

Fcalculada > Ftabulada p<0,05 (rechazamos la hiptesis nula)


C aptulo 8 Pgina 752

Mito 1: La sonrisa de la esfinge

La t de Student es un test paramtrico, es decir para usarlo se debe


cumplir la normalidad de la variable cuantitativa. Se cumple?Como lo has
comprobado?

He observado que en los dos grupos de estudio comparados slo tienen 19 y


11 sujetos respectivamente. Ante tan bajo volumen muestral (n < 30),

Cmo justificas esa supuesta normalidad?Que test has empleado para


comprobar esa normalidad de la reduccin del peso? Ests seguro que se
cumplen los criterios para poder usar la t de Student ? Se cumplen todos los
requisitos para su utilizacin?
C aptulo 8 Pgina 753

Realidad 1: Respuesta de Edipo

Test de Kolmogorov-Smirnov
Tipo de dieta Estadstico g.l Significacin
Reduccin del peso Pescado 0,166 19 0,178
Huevos 0,168 11 0,200

Test de Shapiro-Wilk
Tipo de dieta Estadstico g.l Significacin
Reduccin del peso Pescado 0,956 19 0,493
Huevos 0,950 11 0,615

Ho: p > 0,05 test paramtricos Ha: p < 0,05 test NO paramtricos

Los test de normalidad ensayados dan un valor de p NO significativo (p >0,05) en ambos


grupos (tipos de dieta). Por tanto no hay evidencias suficientes para rechazar la hiptesis
nula de normalidad de la variable reduccin del peso en ambas muestras.
C aptulo 8 Pgina 754
C aptulo 8 Pgina 755
C aptulo 8 Pgina 756

+ IC95% + IC95%

Media Kg pescado
Media Kg huevos

- IC95%

- IC95%
C aptulo 8 Pgina 757

Pregunta de investigacin
Existen diferencias en los valores del VCM en sangre en
funcin de los depsitos de hierro normales o ferropnicos
en mdula sea?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA dicotmica CUANTITATIVA continua
Depsitos de Fe en mdula sea VCM
Normal =1 (hemograma)
Dficit = 0

Cul es el test estadstico ms acertado?


C aptulo 8 Pgina 758
C aptulo 8 Pgina 759
C aptulo 8 Pgina 760

Test de la T de Student para muestras independientes

Grados de libertad (g.l) = n + m - 2 gl = 67 + 33 - 2 = 98


VCM Medula normal Dficit de hierro
n 67 33
Media 83,56 76,89
Desviacin estndar 8,588 9,323
EEM 1,049 1,623
t calculada 3,560
Grados de libertad 98
Significacin (bilateral) 0,001

t calculada = 3,560 > t tabulado = 1,96; p < 0,001

Ha: El VCM es depende de los depsitos medulares de hierro.


C aptulo 8 Pgina 761

Pregunta de investigacin
Existen diferencias en los valores de la ferritina en sangre en
funcin de los depsitos de hierro normales o ferropnicos
en mdula sea?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA dicotmica CUANTITATIVA continua
Depsitos de Fe en mdula sea FERRITINA srica
Normal =1
Dficit = 0

Cul es el test estadstico ms acertado?


C aptulo 8 Pgina 762
C aptulo 8 Pgina 763

Test de Welch para desigualdad de varianzas

FERRITINA srica Mdula normal Dficit de hierro


n 67 33
Media 21,76 12,61
Desviacin estndar 9,165 5,528
EEM 1,120 0,962
T calculada 6,201
Grados de libertad 93,876
Significacin (bilateral) 0,000

t calculada = 3,560 > t tabulado = 1,96; p < 0,001

Ha: El ferritina srica depende de los depsitos medulares de hierro.


C aptulo 8 Pgina 764

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los niveles
de anticuerpos frente al virus de la Rubeola en la poblacin gestante
inmunizada de Ceuta en el ao 1994?
Variable PREDICTORA Variable RESULTADO
Cualitativa dicotmica Cuantitativa continua
Cristianas inmunizadas Virus de la Rubeola
Musulmanas inmunizadas

Cul es el test estadstico ms adecuado?


C aptulo 8 Pgina 765

Test de t de Student para muestras independientes


P < 0,001

Figura 1.- Ttulos de anticuerpos frente al virus de la Rubeola en gestantes inmunizadas de Ceuta en 1994.
Distribucin por grupos culturales.
C aptulo 8 Pgina 766

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los niveles
de anticuerpos frente al virus de la Rubeola en la poblacin gestante
inmunizada de Ceuta en el ao 2010?
Variable PREDICTORA Variable RESULTADO
Cualitativa dicotmica Cuantitativa continua
Cristianas inmunizadas Virus de la Rubeola
Musulmanas inmunizadas

Cul es el test estadstico ms adecuado?


C aptulo 8 Pgina 767

Test de la T de Student para muestras independientes

Grados de libertad (g.l) = n + m - 2 gl = 234 + 487 - 2 = 719

IgG-anti-RUBEOLA Cristianas Musulmanas


n 234 487
Media 133,20 94,90
Desviacin estndar 197,26 100,69
EEM 12,89 4,56
t calculada 3,452
Grados de libertad 719
Significacin (bilateral) 0,001

t calculada = 3,452 > t tabulado = 1,96; p < 0,001

Ha: Los niveles de IgG anti-Rubeola depende del grupo cultural, siendo distintos en
cristianas y musulmanas.
C aptulo 8 Pgina 768

Test de t de Student para muestras independientes


(varianzas desiguales)

Ttulos de anticuerpos IgG anti-RUBEOLA (UI/ml) p = 0,006

133,2

94,9

Figura 2.- Ttulos de anticuerpos frente al virus de la Rubeola en gestantes inmunizadas de Ceuta en 2010.
Distribucin por grupos culturales.
C aptulo 8 Pgina 769

Mito 1: La sonrisa de la esfinge

Para poder usar la t de Student para muestras independientes es


necesario, entre otras condiciones, la homogeneidad de las varianzas
(homocedasticidad) de la variable cuantitativa.

La variable cuantitativa niveles de anticuerpos IgG anti-RUBEOLA


(UI/ml) en la poblacin gestante inmunizada de Ceuta cumple la
homocedasticidad?

Que test has empleado para comprobar que se cumple la homogeneidad


de las varianzas?
C aptulo 8 Pgina 770

Test de Levene para homocedasticidad

Test de Levene para la igualdad de varianzas IgG-anti-RUBEOLA


F 14,498
Significacin 0,000

Ho: Las varianzas de ambos grupos son iguales.


Ha: Existen diferencias entre las varianzas.

Fcalculada > Ftabulada p < 0,05 (rechazamos la hiptesis nula)

Test de Welch
C aptulo 8 Pgina 771

Test de Welch para desigualdad de varianzas

IgG-anti-RUBEOLA Cristianas Musulmanas


n 234 487
Media 133,20 94,90
Desviacin estndar 197,26 100,69
EEM 12,89 4,56
T calculada 2,800
Grados de libertad 292,8
Significacin (bilateral) 0,005

tcalculada= 2,800 > ttabulado = 1,96; p < 0,01

Ha: Los niveles de IgG anti-Rubeola depende del grupo cultural, siendo distintos en
cristianas y musulmanas.
C aptulo 8 Pgina 772

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los niveles de
anticuerpos frente a Toxoplasma en la poblacin gestante inmunizada
de Ceuta en el ao 1994?
Variable PREDICTORA Variable RESULTADO
Cualitativa dicotmica Cuantitativa continua
Cristianas inmunizadas Virus de la Rubeola
Musulmanas inmunizadas

Cul es el test estadstico ms adecuado?


C aptulo 8 Pgina 773

Test de t de Student para muestras independientes

p > 0,1
Ttulos de IgG anti-toxoplasma (UI/ml)

35,5
32,8

Figura 1.- Ttulos de anticuerpos frente a Toxoplasma en gestantes inmunizadas de Ceuta en 1994.
Distribucin por grupos culturales.
C aptulo 8 Pgina 774

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los niveles de
anticuerpos frente a Toxoplasma en la poblacin gestante inmunizada
de Ceuta en el ao 2010?
Variable PREDICTORA Variable RESULTADO
Cualitativa dicotmica Cuantitativa continua
Cristianas inmunizadas Toxoplasma
Musulmanas inmunizadas

Cul es el test estadstico ms adecuado?


C aptulo 8 Pgina 775

Test de t de Student para muestras independientes

p > 0,1

78,6
67,9

Figura 2.- Ttulos de anticuerpos frente a Toxoplasma en gestantes inmunizadas de Ceuta en 2010.
Distribucin por grupos culturales.
C aptulo 8 Pgina 776

Mito 1: La sonrisa de la esfinge

La t de Student para muestras independientes es un test paramtrico, es


decir para usarlo se debe cumplir la normalidad de la variable cuantitativa.
La variable cuantitativa niveles de anticuerpos (UI/ml) en la poblacin
gestante inmunizada de Ceuta sigue una distribucin normal?

No encuentro datos estadsticos de dispersin (desviacin tpica)


Cmo justificas esa supuesta normalidad? Qu test has empleado para
comprobar que se cumple la normalidad (campana de Gauss)?
C aptulo 8 Pgina 777

Test de normalidad Test de Kolmogorov-Smirnov


Ao 2010 N Media DE Estadstico Z Significacin
Niveles de anticuerpos IgG 721 107,3 140,6 6,870 0,000
anti-RUBEOLA

Test de normalidad Test de Kolmogorov-Smirnov


Ao 2010 Tipo de cultura N Media DE Estadstico Z Significacin
Niveles de Cristianas 234 133,2 197,3 4,211 0,000
anticuerpos
IgG anti- Musulmanas 487 94,9 100,7 4,723 0,000
RUBEOLA

Ho: p > 0,05 test paramtricos Ha: p < 0,05 test NO paramtricos

Los test de normalidad ensayados dan un valor de p significativo (p <0,05) en ambos


grupos culturales. Por tanto hay evidencias suficientes para rechazar la hiptesis nula de
normalidad de la variable reduccin del peso en ambas muestras. NO PODEMOS USAR
TEST PARAMTRICOS.
C aptulo 8 Pgina 778

Test de normalidad Test de Kolmogorov-Smirnov


Ao 2010 N Media DE Estadstico Z Significacin
Niveles de anticuerpos IgG 297 77,5 133,6 5,321 0,000
anti-RUBEOLA

Test de normalidad Test de Kolmogorov-Smirnov


Ao 2010 Tipo de cultura N Media DE Estadstico Z Significacin
Niveles de Cristianas 32 67,9 58,6 1,260 0,084
anticuerpos
IgG anti- Musulmanas 265 78,62 139,9 5,110 0,000
RUBEOLA

Ho: p > 0,05 test paramtricos Ha: p < 0,05 test NO paramtricos

Los test de normalidad ensayados dan un valor de p significativo (p <0,05) en ambos


grupos culturales. Por tanto hay evidencias suficientes para rechazar la hiptesis nula de
normalidad de la variable reduccin del peso en ambas muestras. NO PODEMOS USAR
TEST PARAMTRICOS.
C aptulo 8 Pgina 779

Cualitativa dicotmica versus cuantitativa

PARAMTRICOS NO PARAMTRICOS
2 GRUPOS

T de Student para mues- U de Mann-Whitney


Independientes tras independientes

T de Student para mues- Wilcoxon


Aparejados tras apareadas

Variable predictora Cualitativa versus variable resultado Cuantitativa.


C aptulo 8 Pgina 780

Pregunta de investigacin
Existen diferencias de la tensin arterial sistlica (TAS) de los 20
alumnos del curso de Metodologa de investigacin en funcin del
sexo?
Variable PREDICTORA Variable RESULTADO
Cualitativa dicotmica Cuantitativa
Sexo TAS

Cul es el test estadstico ms adecuado?


C aptulo 8 Pgina 781

Test de la U de Mann-Whitney
Condiciones de aplicacin:
- Si alguna de las dos muestras contiene menos de 30 observaciones y No se puede
asumir la normalidad.
- Variable medida en escala ORDINAL.
- Si la muestra es de muy pequeo tamao (<10 observaciones en alguno de los dos
grupos).

Inconvenientes:
- Se pierde potencia para detectar diferencias significativas (para una comparacin que
resulte significativa con 95 individuos en la t de Student, se necesitaran 100 individuos
para que la misma comparacin resulte significativa con el test de Mann-Whitney).
- No permite construir intervalos de confianza.
C aptulo 8 Pgina 782

Alumnos TAS Rango 1 Orden Alumnas TAS Rango 2 Orden


Alumnos (R1) Alumnas (R2)
1 110 9,5 7 1 90 1 1
2 120 16 15 2 95 2,5 2
3 100 5 4 3 110 9,5 9
4 115 13,5 13 4 110 9,5 10
5 110 9,5 8 5 120 16 17
6 100 5 5 6 115 13,5 14
7 120 16 16 7 110 9,5 11
8 125 18,5 18 8 100 5 6
9 125 18,5 19 9 95 2,5 3
10 125 20 20 10 100 9,5 12
10 Total 10 78,5

Hiptesis nula Ho: La TAS es igual en alumnos y en alumnas.

Hiptesis alternativa Ha: La TAS es diferente en alumnos y en alumnas.


C aptulo 8 Pgina 783

U de Mann-Whitney

U W

rea de Area de NO rea de


rechazo rechazo rechazo

Ha Ha
Hiptesis nula

Los valores de estadstico U y W calculados por el test se comparan con los tabulados para un contraste
bilateral con un error alfa 0,05.
C aptulo 8 Pgina 784

U de Mann-Whitney

SEXO N Mean Rank Sum of Ranks


TAS Alumna 10 7,85 78,50
Alumno 10 13,15 131,50
Total 20

Test estadsticos TAS


Sum of ranks
Mann-Whitney U 23,50 Mean rank =
Wilcoxon W 78,50 N
U-R
Zu - 2,030 Zu =
Significacin a dos colas 0,041
Significacin exacta a una cola 0,043 n

El ranking promedio de la TAS en mujeres es 7,85 y en los hombres 13,15, es decir existen
diferencias entre alumnos y alumnas, y por tanto como p < 0,05 se rechaza la Ho.

Conclusin: La TAS es diferente en alumnos y en alumnas, siendo mayor en varones.


C aptulo 8 Pgina 785

Ejemplo para muestras pequeas

- Un profesor de bioestadstica utiliza dos tipos de modelos de cursos para


ensear la misma materia a un grupo de 10 alumnos mdicos con un nivel
previo similar de conocimientos en bioestadstica. El experimentador quiere
demostrar que el procedimiento clsico de asistencia a clase (PRESENCIAL)
es ms efectivo que el curso online (a DISTANCIA) que le propone la
direccin que presupone que es ms eficiente; para ello, mide el nivel de
conocimientos adquiridos por los alumnos en bioestadstica en ambos
modelos de curso mediante el mismo examen de conocimientos realizado al
final de cada tipo de curso.

- El plan experimental preliminar consiste en elegir al azar tanto una muestra


total de 10 mdicos, 5 para cada mtodo.
C aptulo 8 Pgina 786

Planteamiento de la hiptesis

- Hiptesis nula (Ho). Las diferencias observadas entre las calificaciones del
examen de conocimientos mediante los dos tipos de cursos se deben al azar.

- Hiptesis alternativa (Ha). Las calificaciones del examen de conocimientos,


segn el mtodo de enseanza PRESENCIAL son ms altas y diferentes que
las observadas en el mtodo A DISTANCIA.

Cul es la prueba estadstica ms adecuada?


C aptulo 8 Pgina 787

Tipo de Curso Calificaciones de los alumnos


N del alumno 1 2 3 4 5
A DISTANCIA 80 85 25 70 90

Tipo de Curso Calificaciones de los alumnos


N del alumno 6 7 8 9 10
PRESENCIAL 95 100 93 110 45

- Nivel de significacin: Para todo valor de probabilidad igual o menor que p = 0,05, se
acepta Ha y se rechaza Ho.
- Zona de rechazo: Para todo valor de probabilidad mayor que 0,05, se acepta Ho y se
rechaza Ha.
- Dos cursos diferentes aplicados en dos grupos de alumnos mdicos.
C aptulo 8 Pgina 788

Test de la U de Mann-Whitney (paso 1)


- Aplicacin de la prueba estadstica.
De acuerdo con los pasos, las observaciones se deben ordenar en rangos del
menor al mayor.
- Rangos de lectura de la tabla anterior.

Tipo de Curso Calificaciones de los alumnos R (S)


A distancia Grupo 1 80 (4) 85 (5) 25 (1) 70 (3) 90 (6) 19
Presencial Grupo 2 95 (8) 100 (9) 93 (7) 110 (10) 45 (2) 36
C aptulo 8 Pgina 789

Test de la U de Mann-Whitney (paso 2)

Calculamos las U de Mann-Whitney (U1 y U2) con las siguientes frmulas:


C aptulo 8 Pgina 790

Test de la U de Mann-Whitney (paso 2)

Calculamos las U de Mann-Whitney (U1 y U2)


C aptulo 8 Pgina 791

Test de la U de Mann-Whitney (paso 3)

- De los dos valores de U calculados (U1 y U2), se elige el valor ms pequeo (U2
= 4) y se comparan con los valores tabulados crticos de la U Mann-Whitney

- En caso de que el valor de U calculado no se localice en las tablas


correspondientes, se obtendr de la frmula siguiente;
Ucalculado = [ n1 * n2 ] - U Ucalculado = [ 5 * 5 ] 21 = 4

- En esta frmula, U corresponde al valor ms alto (U1 = 21) . El resultado en


ambos casos es el mismo (4).
C aptulo 8 Pgina 792

Tamao
muestral

Ucalculado =

p = 0,048
C aptulo 8 Pgina 793

Decisin

A la probabilidad del valor U de Mann-Whitney, calculado anteriormente (Ucalculado),


corresponde a un valor de la p de 0,048, el cual es ms pequeo que el nivel de
significancia (0,05); por lo tanto, se acepta Ha y se rechaza Ho.
C aptulo 8 Pgina 794

Interpretacin

Entre las calificaciones del examen de conocimientos adquiridos mediante las dos
modalidades del curso de enseanza de la bioestadstica, existe una diferencia
significativa con un nivel de probabilidad de error alfa menor del 5% (p<0,05); es
decir, aun cuando las muestras de ambos grupos son pequeas, las calificaciones
ms altas mediante el curso clsico PRESENCIAL sealan ms efectividad, con
la probabilidad de equivocarse de 0,048 para aceptarlo por la influencia del AZAR
(4,8%).
C aptulo 8 Pgina 795

Ejemplo aplicable cuando la muestra es mayor de 25 y donde


n1 y n2 pueden ser iguales o de un tamao diferente:

El Profesor del curso de Bioestadstica aplicada para mdicos, entusiasmado


por las observaciones y conclusiones preliminares, decide repetir el experimento
aumentando el tamao muestral en ambos grupos. Disea un nuevo estudio con 10
alumnos mdicos que realizan el curso con el mtodo a DISTANCIA y 25 mdicos
mediante el procedimiento clsico PRESENCIAL. Los nuevos datos del estudio se
muestran en la tabla siguiente.
C aptulo 8 Pgina 796

Planteamiento de la hiptesis

- Hiptesis nula (Ho). Las posibles diferencias entre las calificaciones dadas por
los alumnos en ambos tipos de cursos se deben al azar.

- Hiptesis alternativa (Ha). Las calificaciones de los alumnos inscritos en el curso


realizado por el mtodo clsico PRESENCIAL, propuesto por el experimentador,
son diferentes y con valores ms altos.

- Nivel de significacin: Para todo valor de probabilidad igual o menor que 0,05,
se acepta Ha y se rechaza Ho.

- Zona de rechazo: Para todo valor de probabilidad mayor que 0,05, se acepta Ho
y se rechaza Ha.
C aptulo 8 Pgina 797

Poblacin de alumnos mdicos a los cuales se les aplic dos


tipos de cursos (mtodo presencial, mtodo a distancia)

Curso PRESENCIAL N=25


PRESENCI
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
AL

Notas 55 70 90 110 45 60 60 75 80 95 100 110 95 60 70 80 40 65 50 75 90 90 100 80 100

Curso a DISTANCIA (online) N=10

DISTANCIA N=10 1 2 3 4 5 6 7 8 9 10

Notas 60 80 25 30 40 60 90 100 60 55

Cul es la prueba estadstica ms adecuada?


C aptulo 8 Pgina 798

Test de la U de Mann-Whitney (paso 1)

- Aplicacin de la prueba estadstica. Primero ordenamos los rangos de todas las


observaciones.

- Direccin de las ligas o empates y el tamao de estas.


C aptulo 8 Pgina 799
C aptulo 8 Pgina 800

Test de la U de Mann-Whitney (paso 2)

Calculamos las U de Mann-Whitney (U1 y U2)


C aptulo 8 Pgina 801

Test de la U de Mann-Whitney (paso 3)

Teniendo en cuenta los pasos del test, hay que saber que cuando el tamao
muestral total es mayor de 25 (como ocurre en este caso), el estadstico del
test de Mann-Whitney se distribuye normalmente, por tanto se calcula el
estadstico Z, que se compara con el tabulado para conocer la probabilidad
(p). Esto se calcula como sigue:

_
U- U
Z Z=
U
C aptulo 8 Pgina 802

Test de la U de Mann-Whitney (paso 3a)

Donde:
Z = valor estadstico de la curva normal.
U = cualquier valor de U calculado (ya sea U1 o U2).
U = valor promedio de U.
U = desviacin estndar de U.

Calculamos el valor promedio de U:

_ n1 * n2
_
10 * 25
U= 2
U=
2
= 125
C aptulo 8 Pgina 803

Test de la U de Mann-Whitney (paso 3b)

- La desviacin estndar de U (U ) se determina de la forma siguiente:

- Donde:
U = desviacin estndar de U.
n1 y n2 = tamao de la muestra de los grupos 1 y 2.
N = tamao total de la muestra (la suma de n1 y n2).
Li = sumatoria de las ligas o empates.

El clculo de Li se realiza de la siguiente manera:

Li =
C aptulo 8 Pgina 804

_ _ n1 * n2
U- U U=
Z= 2
U
U =
Li =
C aptulo 8 Pgina 805

Test de la U de Mann-Whitney (paso 3c)

- Una vez obtenida la sumatoria de Li, se determinar la desviacin estndar de U


(U ) mediante la expresin siguiente:

U =

U =

U = 27,24
C aptulo 8 Pgina 806

Test de la U de Mann-Whitney (paso 3d)

- Una vez calculados todos los parmetros necesarios, se obtiene el valor Z


conforme la frmula anterior:

_ 178 - 125
Z = = 1,95
U- U 27,24
Z=
U 72 - 125
Z= 27,24
= - 1,95

U = cualquier valor de U calculado (ya sea U1 o U2).


C aptulo 8 Pgina 807

Test de la U de Mann-Whitney (paso 4)

- Para obtener la probabilidad (valor de la p) del valor Zcalculado de 1.95 (1,9 +


0,05), se debe consultar la tabla de tamao de la muestra en funcin de los
valores d y buscar la hilera 1.9, en cuya columna correspondiente al error alfa de
0,05 se localiza el nmero 0,9788, cuyo complementario (1 - 0,9744 = 0,0256)
corresponde a la probabilidad del valor de U con respecto al promedio (p =
0,0256). Esto quiere decir que es menor que el nivel de significancia (p<0,05).
C aptulo 8 Pgina 808

p = [ 1 - 0,9744 ] = 0,0256
C aptulo 8 Pgina 809

Decisin

A la cifra de Z de 1,95 le corresponde una probabilidad menor que 0,05 (p = 0,0256),


por lo cual se acepta Ha y se rechaza Ho (tabla de probabilidades asociadas en
valores extremos como los de 2 en la distribucin normal).
C aptulo 8 Pgina 810

Interpretacin

El experimentador (profesor de bioestadstica de los cursos), al aumentar el tamao


muestral en ambos grupos (n1=10, y n2=25, N=35), CONFIRMA la investigacin
preliminar con una muestra pequea (n1=5, y n2=5, N=10), con lo cual da a
entender que los resultados (calificaciones de los alumnos) logrados con el mtodo
PRESENCIAL son diferentes de los obtenidos con el mtodo de enseanza A
DISTANCIA; adems, este ltimo revela calificaciones ms bajas y permitira concluir
que es menos efectivo que el otro.
C aptulo 8 Pgina 811

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los niveles
de anticuerpos frente al virus de la Rubeola en la poblacin gestante
inmunizada de Ceuta en el ao 2010?
Variable PREDICTORA Variable RESULTADO
Cualitativa dicotmica Cuantitativa continua
Cristianas inmunizadas Virus de la Rubeola
Musulmanas inmunizadas

Cul es el test estadstico ms adecuado?


C aptulo 8 Pgina 812

SEXO N Mean Rank Sum of Ranks


Anti-IgG- Cristianas 234 392,46 91836,0
RUBEOLA Musulmanas 487 345,88 168445,0
Total 721

Test estadsticos IgG-Rubeola


Sum of ranks
Mann-Whitney U 49573,00 Mean rank =
Wilcoxon W 168401,0 N
U-R
Zu - 2,828 Zu =
Significacin a dos colas (bilateral) 0,005
Significacin exacta a una cola 0,043 n

El ranking promedio de los niveles de Anti-IgG-RUBEOLA en gestantes inmunizadas


cristianas superior al de las musulmanas, es decir existen diferencias significativas entre
ambos grupos culturales, y por tanto como p < 0,05 se rechaza la Ho.

Conclusin: El grado de inmunizacin frente a la rubeola es diferente en cristianas y


musulmanas, siendo mayor en las primeras.
C aptulo 8 Pgina 813

Pregunta de investigacin
Qu relacin existe entre el grupo cultural/religioso y los niveles de
anticuerpos frente a Toxoplasma en la poblacin gestante inmunizada
de Ceuta en el ao 2010?
Variable PREDICTORA Variable RESULTADO
Cualitativa dicotmica Cuantitativa continua
Cristianas inmunizadas Toxoplasma
Musulmanas inmunizadas

Cul es el test estadstico ms adecuado?


C aptulo 8 Pgina 814

Test de normalidad Test de Kolmogorov-Smirnov


Ao 2010 N Media DE Estadstico Z Significacin
Niveles de anticuerpos IgG 297 77,5 133,6 5,321 0,000
anti-toxoplasma

Test de normalidad Test de Kolmogorov-Smirnov


Ao 2010 Tipo de cultura N Media DE Estadstico Z Significacin
Niveles de Cristianas 32 67,9 58,6 1,260 0,084
anticuerpos
IgG anti- Musulmanas 265 78,62 139,9 5,110 0,000
toxoplasma

Ho: p > 0,05 test paramtricos Ha: p < 0,05 test NO paramtricos

Los test de normalidad ensayados dan un valor de p significativo (p <0,05) en ambos


grupos culturales. Por tanto hay evidencias suficientes para rechazar la hiptesis nula de
normalidad de la variable reduccin del peso en ambas muestras. NO PODEMOS USAR
TEST PARAMTRICOS.
C aptulo 8 Pgina 815

SEXO N Mean Rank Sum of Ranks


Anti-IgG- Cristianas 32 162,11 5187,50
toxoplasma Musulmanas 265 147,42 39065,50
Total 297

Test estadsticos IgG-toxoplasma


Sum of ranks
Mann-Whitney U 3820,50 Mean rank =
Wilcoxon W 39065,50 N
U-R
Zu - 0,914 Zu =
Significacin a dos colas (bilateral) 0,361
n

El ranking promedio de los niveles de Anti-IgG-toxoplasma en gestantes inmunizadas


cristianas similar al de las musulmanas, es decir NO existen diferencias significativas entre
ambos grupos culturales, y por tanto como p > 0,05 se acepta la Ho (igualdad).

Conclusin: El grado de inmunizacin (nivel de anticuerpos especficos) frente a


Toxoplasma es igual cristianas y musulmanas.
C aptulo 8 Pgina 816

Cualitativa dicotmica versus cuantitativa

PARAMTRICOS NO PARAMTRICOS
2 GRUPOS

T de Student para mues- U de Mann-Whitney


Independientes tras independientes

T de Student para datos Wilcoxon


Aparejados apareados

Variable predictora Cualitativa versus variable resultado Cuantitativa.


C aptulo 8 Pgina 817

Variables cuantitativas:
Comparacin de la media entre dos grupos
Muestras independientes
Muestras relacionadas
Tipos de dieta Peso (Kg)
Pescado 23 Peso inicial Peso final (Kg) DIF
Pescado 19
23 21 -2
Pescado 28
Pescado 23
19 22 +3
Pescado 5 28 26 -2
Pescado 17
23 25 +2
Pescado 14
Pescado 13
5 2 -3
. 17 28 + 11
Huevos 21
14 17 +3
Huevos 22
Huevos 26
13 4 -9
Huevos 25 ..
Huevos 2
Huevos 28
Huevos 17
Huevos 4
Huevos 12
.

Se compara cada individuo consigo mismo antes y despus de un tratamiento con una
determinada dieta.
C aptulo 8 Pgina 818

Test de la t de Student para datos apareados (muestras


relacionadas)
Caractersticas del test:

- Se realizan mediciones repetidas en un mismo individuo.


- Se aplican dos frmacos consecutivos a un mismo paciente.
- Se desea evaluar el cambio de una variable cuantitativa tras aplicar un
tratamiento (cambio entre antes y despus).
- Calcular una nueva variable que es la diferencia entre los valores antes
y despus de cada individuo.
- Cuando el tamao muestral es inferior al 30, se debe probar si la nueva
variable sigue una distribucin normal.

- En las muestras relacionadas la variabilidad ALEATORIA es menor que en


las muestras independientes.
C aptulo 8 Pgina 819

Test de la t de Student para muestras relacionadas

Pregunta de investigacin: Existen variacin del peso de la madre antes y


despus del embarazo?
Hiptesis nula Ho X antes = X despus ( DIF = POST FREC = 0) d - O
t calculada =
Hiptesis alternativa Ha X antes X despus ( DIF = POST FREC 0)
S2
n

Variables
Estadsticos Peso antes del Peso despus del Diferencia de peso
embarazo parto
Media 54,26 55,64 1,38
Desviacin estndar (S) 6,653 7,624 4,096
n 1626 1626 1626
C aptulo 8 Pgina 820

Media N Desviacin Error estndar de


Variables estndar (s) la media (EEM)
Peso ANTES 54,26 1626 6,653 0,165
embarazo
Peso DESPUS 55,64 1626 7,624 0,189
del parto

Variable N Correlacin (r) Significacin


Peso ANTES embarazo versus Peso 1626 0,844 0,000
DESPUS del parto

Variables Diferencias relacionadas Intervalo de t calculada gl Significacin


confianza de la bilateral
diferencia
Media s EEM Inferior Superior 13,562 1625 0,000
Peso despus del 1,378 4,096 0,102 1,178 1,577
parto peso antes
del embarazo

t calculada= 13,56 > t tabulado = 1,96; p < 0,001

tcalculada > ttabulada p < 0,05 (rechazamos la hiptesis nula)

Ha: Existe variacin en el peso de las madres antes y despus de un embarazo.


C aptulo 8 Pgina 821

Distribucin de la t de Student (gl 30)


El test de la T de Student para muestras de ms de 30 individuos presenta
una distribucin muy similar a la distribucin normal tipificada Z.

El test de la T de Student es una prueba BILATERAL, y por tanto NO


especifica la direccin de la diferencia ( A B).

Nivel de significacin
estadstica = 0,05 t calculada = 6,666

Z 1- /2 Z 1- /2

- 1,96 1,96
t tabulado = 1,96 para los grados de libertad de la muestra (1620)
C aptulo 8 Pgina 822

Test de la t de Student para datos apareados (muestras


relacionadas)
Ejemplo
Estudio sobre la forma fsica de un grupo de 30 individuos antes y despus
de un programa de entrenamiento deportivo (PED).

Pregunta de investigacin:
Ha mejorado la forma fsica del grupo durante las sesiones del PED?
Reduce el PED la frecuencia cardiaca media?

Variable PREDICTORA Variable RESULTADO


Cualitativa dicotmica Cuantitativa
PED Frecuencia Cardaca Media
C aptulo 8 Pgina 823

Objetivo: Conocer si el entrenamiento deportivo (PED) mejora la forma fsica


de un grupo de individuos.

Material: Grupo de 30 individuos antes y despus de un programa de


entrenamiento deportivo (PED)

Mtodo: Se evala la frecuencia cardiaca antes (FRECPRE) y despus del


PED (FRECPOST).

Se define una nueva variable DIF = FRECPRE FRECPOST.

Hiptesis nula Ho X antes = X despus


( DIF = FRECPRE FRECPOST =

Hiptesis alternativa H1 X antes X despus


(DIF = FRECPRE FRECPOST 0)
C aptulo 8 Pgina 824

Resultados

Variables Media N Desviacin Error estndar de


estndar (s) la media (EEM)
FRECPRE 79,53 30 19,15 3,50
FRECPOST 70,40 30 12,95 2,36

Variables N Correlacin (r) Significacin


FRECPRE versus FRECPOST 30 0,828 0,000

Variables Diferencias Intervalo de t calculada gl Significacin


relacionadas confianza de la bilateral
diferencia
Media s EEM Inferior Superior 4,49 29 0,000
FRECPRE - 9,13 11,12 2,031 4,98 13,29
FRECPOST

t calculada < t tabulada p>0,05 (aceptamos la Ho)

t calculada > t tabulada p<0,05 (rechazamos la hiptesis nula)


C aptulo 8 Pgina 825

Test de la t de Student para datos apareados (muestras


relacionadas)
Ejemplo - Conclusiones
1. Puede concluirse que ha existido un descenso significativo (p<0,001)
de la frecuencia cardiaca despus del PED. Existen evidencias, con una
confianza del 95%, para afirmar que el PED se ha acompaado de un
descenso de la frecuencia cardaca .

2. El descenso medio estimado fue de 9 latidos por minuto despus del


PED.
C aptulo 8 Pgina 826

Mito 1: La sonrisa de la esfinge

La t de Student de datos apareados es un test paramtrico, es decir para


usarlo se debe cumplir la normalidad de la variable cuantitativa.

Se cumple? La nueva variable DIF = FRECPRE FRECPOST sigue una


distribucin normal?

He observado en tus resultados de DIF un valor de la desviacin tpica (11,1)


muy superior a la media (9,1),

Cmo justificas esa supuesta normalidad? Qu test has empleado para


comprobar esa supuesta normalidad?

La frecuencia cardiaca es una variable cuantitativa DISCRETA.

Por qu empleas un test paramtrico para este tipo de variables?No sera


ms adecuado utilizar el test de WILCOXON?
C aptulo 8 Pgina 827

Objetivo: Comprobar si la reduccin ponderal conseguida tras intervencin


diettica en los pacientes con obesidad mrbida disminuye los factores de
riesgo cardiovascular.

Prueba de la t de Student para datos apareados

Prueba de Shapiro-Wilk (test de normalidad)

IMC > 40

Inicio Final p IC (95%)


Peso (Kg) 149,1 (22) 115 (18) < 0,001 26,9-39,8
IMC (Kg/m2) 49,2 (7,7) 38,8 (5) < 0,001 7,8-13,2
Cintura (cm) 144,4 (17,3) 119,6 (12,1) < 0,001 18,4-36,5
Cadera (cm) 143,3 (17,5) 127,7 (14,6) 0,02 9,1-24,1
Indice C/c 1,01 (0,12) 0,94 (0,08) 0,02 0,017-0,16

Los valores se expresan como media (desviacin estndar); p nivel de significacin; IC intervalo de
confianza; IMC: ndice de masa corporal; C/c cintura-cadera.
C aptulo 8 Pgina 828

Objetivo: Comprobar si la reduccin ponderal conseguida tras intervencin


diettica en los pacientes con obesidad mrbida disminuye los factores de
riesgo cardiovascular.

Prueba de la t de Student para datos apareados

IMC > 40

Inicio Final p IC (95%)


Peso (Kg) 126 (19) 107 (18) < 0,001 13,5-20,3
IMC (Kg/m2) 48,7 (5,8) 42,5 (6,2) < 0,001 4,5-7,5
Cintura (cm) 129,8 (17,7) 118,7 (15,4) < 0,001 9,1-21,6
Cadera (cm) 142,5 (15,6) 132,8 (13) 0,003 3,6-15,9
ndice C/c 0,92 (0,11) 0,89 (0,09) 0,04 0,017-0,16

Los valores se expresan como media (desviacin estndar); p nivel de significacin; IC intervalo de
confianza; IMC: ndice de masa corporal; C/c cintura-cadera
C aptulo 8 Pgina 829

La reduccin ponderal se acompa de una mejora del perfil lipdico


(triglicridos, cHDL y apoprotena B100 principalmente en los varones.

Varones Inicio Final p IC (95%)


Colesterol total (mg/dl) 192 (49,7) 179,7 (34,5) 0,16 -5,1 a 29,6
Triglicridos (mg/dl) 162,4 (73,6) 107,7 (33,7) 0,001 25,4 - 90,0
cLDL (mg/dl) 124,1 (38,5) 115 (30,4) 0,12 -12,9 a 5,7
cHDL (mg/dl) 35,4 (86,3) 43,5 (8,5) < 0,001 5,7 12,6
cVLDL (mg/dl) 32,5 (14,7) 21,9 (6,8) 0,002 4,8 18,5
Apo B100 (mg/dl) 122,1 (31,3) 100,7 (19,6) 0,01 6,5 40,5
Apo A1 (mg/dl) 117,8 (13,2) 126 (18,8) 0,24 - 17,5 a 4,9

Los valores se expresan como media (desviacin estndar); p nivel de significacin; IC intervalo de
confianza;
C aptulo 8 Pgina 830

La reduccin ponderal se acompa de una mejora del perfil lipdico


(triglicridos, cHDL y apoprotena B100 principalmente en los varones.

Mujeres Inicio Final p IC (95%)


Colesterol total (mg/dl) 189 (29,2) 183,6 (32) 0,32 -5,7 a 16,5
Triglicridos (mg/dl) 137 (60,8) 109,5 (43,7) 0,22 -5,8 a 23,5
cLDL (mg/dl) 117,8 (13,2) 115,6 (26,4) 0,07 -0,8 a 18,5
cHDL (mg/dl) 41,9 (15,6) 45,6 (13.1) 0,03 0,4 6,6
cVLDL (mg/dl) 32,3 (15,9) 22 (8,4) 0,2 -1,1 a 4,8
Apo B100 (mg/dl) 110 (30,6) 106,1 (20,6) 0,7 -11,4 a 15,9
Apo A1 (mg/dl) 124,1 (23,2) 129 (21,4) 0,052 -0,07 a 19,4

Los valores se expresan como media (desviacin estndar); p nivel de significacin; IC intervalo de
confianza;
C aptulo 8 Pgina 831

Discusin - Conclusiones

- Los varones presentaron una mayor reduccin ponderal que las mujeres.

- Con la intervencin diettica empleada conseguimos una mejora en el perfil


aterognico, principalmente en los triglicridos, VLDL y HDL.

- Los varones presentaron una mejora ms importante que las mujeres en el


perfil lipdico.

- La reduccin ponderal ha conseguido una reduccin de algunos de los


factores de riesgo cardiovascular (FRCV) analizados.

- El sexo masculino presenta una mejor respuesta global con reduccin de los
FRCV y mejora de la distribucin grasa.
C aptulo 8 Pgina 832

Mito 1: La sonrisa de la esfinge

La t de Student de datos apareados es un test paramtrico, es decir para


usarlo se debe cumplir la normalidad de las variables cuantitativas.

Se cumple en todas las variables? Las nuevas variables DIF = FRECPRE


FRECPOST siguen una distribucin normal? Cmo justificas esa supuesta
normalidad?Que test has empleado?

He observado que en tus resultados NO aparece las nuevas variables DIF ni


su desviacin tpica.

Porqu no se ha incluido en los resultados?


C aptulo 8 Pgina 833

Cualitativa versus cuantitativa

PARAMTRICOS NO PARAMTRICOS

T de Student para mues- U de Mann-Whitney


Independientes tras independientes

T de Student para mues- Wilcoxon


Aparejados tras apareadas

Variable predictora Cualitativa versus variable resultado Cuantitativa.


C aptulo 8 Pgina 834

Test de Wilcoxon

Prueba NO PARAMTRICA o de libre distribucin


- No se basa en la media, desviacin estndar, etc.

Condiciones de aplicacin:
- Diseo emparejado o de medidas repetidas
- Datos a comparar son
ORDINALES o
Cuantitativos con BAJO tamao muestral (n < 30) y
NO siguen una distribucin NORMAL
C aptulo 8 Pgina 835

Ejemplo (muestras relacionadas)


Test de Wilcoxon para datos apareados

Estudio sobre la mejora clnica del dolor en pacientes con artrosis tratados
con un infiltracin de corticoides.

Pregunta de investigacin:
Ha mejorado el grado de bienestar de los pacientes con artrosis tras el
tratamiento con infiltraciones?

Existen evidencias de una mejora en el nivel de dolor en los pacientes con


artrosis despus del tratamiento con infiltraciones intrarticulares?

Nivel de dolor ANTES Infiltracin Nivel de dolor DESPUS


del tratamiento del tratamiento
C aptulo 8 Pgina 836

Objetivo: Conocer si la infiltracin con corticoides mejora el bienestar clnico


de en un grupo de los pacientes con artrosis de rodilla...

Material: Grupo de pacientes con artrosis de rodilla del Hospital X


seleccionados para el ensayo.

Mtodo: Se evala el nivel de dolor en los pacientes mediante un test


estandarizado antes (NDA) y despus del tratamiento infiltrativo (NDD). Se
define una nueva variable DIF = NDA NDD.

Hiptesis nula Ho X antes = X despus ( DIF = NDA NDD = 0)

Ho (hiptesis nula) = La infiltracin con corticoides NO mejora el bienestar


clnico de los pacientes con artrosis de rodilla.

Hiptesis alternativa H1 X antes X despus (DIF = NDA NDD 0)

Ha (hiptesis alternativa) = La infiltracin con corticoides SI mejora el


bienestar clnico de los pacientes con artrosis de rodilla.
C aptulo 8 Pgina 837

Test de 2 de tendencia lineal

Ejercicio: Realizamos un estudio hipottico de cohortes recogiendo datos


sobre la actividad deportiva que practicaban en su juventud 10 pareja de
gemelos de Ceuta, donde despus de un seguimiento de 20 aos, uno de los
gemelos ha muerto y el otro sobrevive.
Variable predictora: Variable resultado:

Pareja Gemelo vivo Gemelo muerto


Actividad deportiva
1 S S
Variable cuantitativa ordinal
2 E S
S= sedentarios
3 R E
O= deporte ocasional 4 R E
R= deporte regular 5 C S
C = deporte competitivo 6 R E
E = deporte de elite 7 E R
8 E R
9 C E
10 O S
C aptulo 8 Pgina 838

Test de Wilcoxon para datos apareados

Ejercicio: Realizamos un estudio hipottico de cohortes recogiendo datos


sobre la actividad deportiva que practicaban en su juventud 10 pareja de
gemelos de Ceuta, donde despus de un seguimiento de 20 aos, uno de los
gemelos ha muerto y el otro sobrevive.
Variable predictora: Variable resultado:
Actividad deportiva
Pareja Gemelo vivo Gemelo muerto
1 0 0
Variable cuantitativa ordinal
2 1 0
0 = sedentarios
3 2 1
1= deporte espordico 4 2 1
2= deporte regular 5 4 0
3= deporte competitivo 6 2 1
4= deporte de lite 7 1 2
8 1 2
9 3 1
10 2 0
C aptulo 8 Pgina 839

Prueba de los rangos con signo de WILCOXON


para datos apareados
Estadstico de contraste DESENLACE - TIPO DE DEPORTE
Z - 1,897
Significacin asintomtica (bilateral) 0,058

Prueba de los signos para datos apareados


Estadstico de contraste DESENLACE - TIPO DE DEPORTE
Significacin asintomtica (bilateral) 0,180
C aptulo 8 Pgina 840

El test de Wilcoxon es una prueba BILATERAL, y por tanto NO especifica


la direccin de la diferencia ( A B).

Nivel de significacin
Z calculado= - 1,89 estadstica ( = 0,05)

Ho
Z 1- /2 Z 1- /2
Ha Ha

- 1,96 1,96
Z calculado= - 1,89 < Z tabulado = 1,96
C aptulo 8 Pgina 841

Ho = La prctica deportiva en la juventud NO reduce la mortalidad

Ha = La prctica deportiva en la juventud REDUCE la mortalidad


n(n + 1)
n(n + 1) W-
W- 4
4 z= ~ N (0,1)
z= ~ N (0,1) n(n + 1)(2n + 1) g t i3 - t i
n(n + 1)(2n + 1) -
24 24 i =1 2

1. Calculo del estadstico z: Zcalculado= -1,89

2. Comparacin del Zcalculado con el Ztabulado de las tablas de la normal. Zcalculado= -1,89 < Ztabulado = -1,96 para
p < 0,05 a dos colas. La significacin estadstica p = 0,058

3. No se dispone de evidencias para rechazar la Ho de igualdad de medias entre el gemelo que sobrevivi y
el que muri. La probabilidad de hallar unas diferencias al menos como las encontradas es de slo el 5,8%.
Las diferencias encontradas pueden ser debidas al AZAR.

4. No se puede rechazar Ho, ya que el valor de p es superior a 0,05. Estos datos NO proporcionan
evidencias que indiquen que la prctica deportiva era superior en los gemelos supervivientes respecto a
sus hermanos gemelos fallecidos. El estudio NO apoya que el deporte en la juventud reduzca la mortalidad
en el futuro.

5. ERROR de DISEO: falta de potencia estadstica por su escaso tamao muestral. ERROR BETA.
C aptulo 8 Pgina 842

Desenlace (E) Variable resultado


Exposicin (F) Variable predictora Muerte Sobreviviente
Sedentarismo (+) A B
Sedentarismo (-) C D

A: Fallecidos con sedentarismo [ A / (A + B)]


B: Sobrevivientes sedentarios RR =
C: Fallecidos deportistas [ C / (C + D) ]
D: Sobrevivientes deportistas

Es la probabilidad de morir (E) en el grupo de sedentarios (expuestos al factor


de riesgo) en relacin con la probabilidad de muerte en deportistas (grupo no
expuesto).
C aptulo 8 Pgina 843

RR = 1.41 IC95%=1.23-1.61 de los sedentarios frente a los para los ocasionalmente


activos

RR = 1.52 IC95%=1.06-2.17 de los sedentarios frente a los entrenados


Prdidas de
seguimiento
EXPUESTOS al Fallecimientos
factor de riesgo
(sedentarismo) Sobrevivientes
Seguimiento RIESGO
20 aos RELATIVO
Fallecimientos
NO expuestos al
factor de riesgo
(sedentarismo) Sobrevivientes
Prdidas de
seguimiento

Kumala et al. Relationship of leisure-time physical activity and mortality: the Finnish twin cohort. JAMA
1998; 11; 279: 440-4.
C aptulo 8 Pgina 844

Desenlace (E) Variable resultado


Exposicin (F) Variable predictora Muerte Sobreviviente
Deporte (+) A B
Deporte (-) C D

A: Fallecidos con sedentarismo [ A / (A + B)]


B: Sobrevivientes sedentarios RR =
C: Fallecidos deportistas [ C / (C + D) ]
D: Sobrevivientes deportistas

Es la probabilidad de morir (E) en el grupo de deportistas (expuestos al factor


de proteccin) en relacin con la probabilidad de muerte en sedentarios
(grupo no expuestos).
C aptulo 8 Pgina 845

RR = 0.71 IC95%=0.62-0.81 para los ocasionalmente activos

RR = 0.66 IC95%=0.46-0.94 para los entrenados

Prdidas de
seguimiento
EXPUESTOS al Fallecimientos
factor de riesgo
(sedentarismo) Sobrevivientes
Seguimiento RIESGO
20 aos RELATIVO
Fallecimientos
NO expuestos al
factor de riesgo
(sedentarismo) Sobrevivientes
Prdidas de
seguimiento

Kumala et al. Relationship of leisure-time physical activity and mortality: the Finnish twin cohort. JAMA
1998; 11; 279: 440-4.
C aptulo 8 Pgina 846

- Diseo: estudio de COHORTES


- 7925 varones gemelos
- 7977 mujeres gemelas
- Resultados:
- RR = 0,71: Se encontr una reduccin del 29% en la mortalidad para los
ocasionalmente activos comparados con los sedentarios.
- RR = 0,66: Se encontr una reduccin del 34% en la mortalidad para los entrenados
comparados con los sedentarios.

RRR = [ 1 RR ] * 100 RRR1 = 29% RRR2 = 34%

- Conclusiones: Este estudio es importante porque deja claro que la mejor superviviencia
de los ms activos NO se debe a una predisposicin gentica (controlada por el
emparejamiento entre gemelos), sino al efecto real del ejercicio fsico sobre la
superviviencia.

Kumala et al. Relationship of leisure-time physical activity and mortality: the Finnish twin cohort. JAMA
1998; 11; 279: 440-4.
C aptulo 8 Pgina 847

Ejemplo (muestras relacionadas)


Estudio sobre los conocimientos adquiridos en Metodologa de Investigacin
en Ciencias de la Salud (MICS) en los alumnos del curso de Sevilla.

Pregunta de investigacin:
Han mejorado los conocimientos adquiridos en Metodologa de Investigacin
en los alumnos del curso de Sevilla?
Aumenta el curso el nivel de conocimientos sobre la materia impartida?
Existen evidencias de una mejora en los conocimientos tericos de
Metodologa de investigacin en los alumnos despus del curso?

Conocimientos de MICS Curso Conocimientos de MICS


previos al curso despus del curso
C aptulo 8 Pgina 848

Objetivo: Conocer si el curso de Metodologa de Investigacin (CMI) realizado en Sevilla


mejora los conocimientos sobre dicha materia en un grupo de alumnos (licenciados en
Ciencias de la Salud).

Material: Grupo de 8 individuos FEA y residentes del Hospital Universitario de Valme


(Sevilla ) antes y despus de realizar el curso de Metodologa de Investigacin en Ciencias
de la Salud (CMICS)

Mtodo: Se evala los conocimientos mediante un test (examen) antes (RCAC) y despus
del CMICS (RCDC). Se define una nueva variable DIF = RCDC RCAC.

Hiptesis nula Ho X antes = X despus (DIF = RCDC RCAC = 0)

Ho (hiptesis nula) = La accin formativa (CMICS) no mejora los conocimientos sobre


metodologa de investigacin en los alumnos.

Hiptesis alternativa H1 X antes X despus (DIF = RCDC RCAC 0)

Ha (hiptesis alternativa) = La accin formativa (CMICS) mejora los conocimientos sobre


metodologa de investigacin en los alumnos.
C aptulo 8 Pgina 849

Existen evidencias de una mejora en los conocimientos


tericos de metodologa de investigacin en los alumnos
despus del curso?
N del N respuestas N respuestas correctas Diferencia de respuestas
Alumno correctas ANTES del DESPUS del curso (RCDC) acertadas DESPUS ANTES
curso (RCAC) (RCDC- RCAC)
1 10 14 4
2 7 14 7
3 7 14 7
4 5 14 9
5 4 13 9
6 3 13 10
7 2 13 11
8 2 11 9

Cul es el test estadstico ms acertado?


C aptulo 8 Pgina 850

Prueba de los rangos con signo de WILCOXON


para datos apareados
Estadstico de contraste DESENLACE - TIPO DE DEPORTE
Z -2,536
Significacin asintomtica (bilateral) 0,011

Prueba de los signos para datos apareados


Estadstico de contraste DESENLACE - TIPO DE DEPORTE
Significacin asintomtica (bilateral) 0,008
C aptulo 8 Pgina 851

RESULTADOS: Se realiz la comparacin del Zcalculado con el Ztabulado de


las tablas de la normal mediante el programa estadstico SPSS. El valor del
estadstico Zcalculado = 2,536 fue superior al Ztabulado = 1,96 para p < 0,05 a
dos colas (test de contraste bilateral). La significacin estadstica encontrada
fue de p = 0,011. Estos datos permiten rechazar Ho, ya que el valor de p es
inferior a 0,05.

CONCLUSIONES: Puede concluirse que ha existido un aumento significativo


(p<0,05) del nmero de respuestas acertadas despus del curso. Existen
evidencias, con una confianza del 95% (error alfa del 5%), para afirmar que
la accin formativa ha producido una mejora en los conocimientos. Por
tanto, estos datos proporcionan evidencias que indican una mejora objetiva
y significativa en los conocimientos terico-prcticos de Metodologa de
investigacin en los alumnos despus del curso (hiptesis alternativa).
C aptulo 8 Pgina 852

MUESTRAS

INDEPENDIENTES APAREADAS

n1 y n2 30 n1 o n2 30 n 30 n 30

Test de normalidad Test de normalidad

Test de levene
SI NO
SI NO
Homogeneidad Heterogeneidad
de las varianzas de las varianzas
Test de la Test de la t de
Test de la t de U de Student para Test de
Student para Mann-
Test de Welch datos Wilcoxon
muestras Whitney apareados
independientes
C aptulo 8 Pgina 853

Pregunta de investigacin
Qu relacin existe entre los niveles de colesterol-LDL en
sangre y la probabilidad de padecer un IAM?

Variable PREDICTORA Variable RESULTADO


CUANTITATIVA continua CUALITATIVA dicotmica
Niveles colesterol-LDL IAM

Cul es el test estadstico ms acertado?


C aptulo 8 Pgina 854

Pregunta de investigacin
Qu relacin existe entre los niveles de alcoholemia y la
probabilidad de tener un accidente de trfico?

Variable PREDICTORA Variable RESULTADO


CUANTITATIVA continua CUALITATIVA dicotmica
Niveles de Alcoholemia Accidente de trfico

Cul es el test estadstico ms acertado?


C aptulo 8 Pgina 855

Pregunta de investigacin
Qu relacin existe entre la ingesta crnica de alcohol y la
probabilidad de desarrollar cncer de esfago?

Variable PREDICTORA Variable RESULTADO


CUANTITATIVA continua CUALITATIVA dicotmica
Ingesta crnica de alcohol Cncer de esfago

Cul es el test estadstico ms acertado?


C aptulo 8 Pgina 856

Pregunta de investigacin
Qu relacin existe entre la edad gestacional y la
probabilidad de muerte del recin nacido?

Variable PREDICTORA Variable RESULTADO


CUANTITATIVA continua CUALITATIVA dicotmica
Edad gestacional Muerte del RN

Cul es el test estadstico ms acertado?


C aptulo 8 Pgina 857

Depsitos de Fe en mdula sea

Predice Produce Produce Predice

VCM (hemograma) Ferritina (srica)


C aptulo 8 Pgina 858

Pregunta de investigacin
Qu relacin existe entre el VCM del hemograma y la
probabilidad de tener dficit de los depsitos de hierro en
mdula sea?

Variable PREDICTORA Variable RESULTADO


CUANTITATIVA continua CUALITATIVA dicotmica
VCM Depsitos de Fe en mdula sea
(hemograma)

Cul es el test estadstico ms acertado?


C aptulo 8 Pgina 859

Pregunta de investigacin
Qu relacin existe entre los niveles de ferritina srica y la
probabilidad de tener dficit de los depsitos de hierro en
mdula sea?

Variable PREDICTORA Variable RESULTADO


CUANTITATIVA continua CUALITATIVA dicotmica
Ferritina (srica) Depsitos de Fe en mdula sea

Cul es el test estadstico ms acertado?


C aptulo 8 Pgina 860

Anlisis estadstico
Tipos de test analticos estadsticos de contraste de hiptesis
segn el tipo de variables implicadas en el estudio

Variable dependiente
Variable resultado

Dicotmica Continua
Variable Dicotmica Test de 2 t de Student
Predictora
Variable Continua Regresin logstica Regresin lineal
Independiente simple
C aptulo 8 Pgina 861

Anlisis estadstico

Variable resultado
ANLISIS ESTADSTICO Dicotmica Continua
Variable Dicotmica Test de 2 t de Student
Predictora
Variable Continua Regresin logstica Regresin lineal
Independiente

REGRESIN LOGSTICA SIMPLE


C aptulo 8 Pgina 862

Anlisis de Regresin Logstica Simple


- Variable RESULTADO: Dicotmica

- Variable PREDICTORA:
- Cuantitativa
- Categrica

Variables PREDICTORAS Variable RESULTADO


Alcoholemia Accidente de trfico
Ingesta de alcohol Cncer de esfago
Colesterolemia IAM
Edad gestacional Muerte del RN
C aptulo 8 Pgina 863

Pregunta de investigacin
Qu relacin existe entre los niveles de colesterol-LDL en
sangre y la probabilidad de padecer un IAM?

Variable PREDICTORA Variable RESULTADO


CUANTITATIVA continua CUALITATIVA dicotmica
Niveles colesterol-LDL IAM

Cul es el test estadstico ms acertado?


C aptulo 8 Pgina 864

Modelo de Anlisis de Regresin Logstica Simple

e 1X1 P
P= log
1-P
= 0 + 1X1
1 + e 1X1
Y
Y=1
Probabilidad de
Modelo de regresin
enfermedad logstica simple
coronaria
Modelo de probabilidad
lineal simple

Y=0
Factor de riesgo: cLDL X1
C aptulo 8 Pgina 865

Anlisis de regresin logstica simple


C aptulo 8 Pgina 866

Pregunta de investigacin
Qu relacin existe entre la edad gestacional y la probabili-
dad de muerte del recin nacido?

Estudio caso-control realizado por Brand et al con 410 RN de edad


gestacional entre 24-29 semanas.

Variable PREDICTORA Variable RESULTADO


CUANTITATIVA continua CUALITATIVA dicotmica
Edad gestacional Probabilidad de morir

Anlisis de Regresin Logstica Simple


C aptulo 8 Pgina 867

Anlisis de regresin logstica simple


Qu relacin existe entre la edad gestacional y la probabilidad de muerte
del recin nacido?

Variable PREDICTORA Edad gestacional


Edad gestacional Semanas 24 25 26 27 28 29 Total
Vivo 3 16 38 49 45 30 181
Muerto 26 56 69 50 21 7 229
Variable RESULTADO
Riesgo de muerte del RN

Estimaciones de los parmetros del modelo logstico


propuesto para los datos anteriores
Variable Estimacin Error estndar
Constante 18,36 2,375
Edad - 0,6819 0,08908
gestacional
P = probabilidad que muera un RN
C aptulo 8 Pgina 868

Regresin logstica. Coeficiente de regresin logstica 1


Existe relacin entre la probabilidad de muerte neonatal (Variable Resultado) y la edad
gestacional (Variable Predictora) en los RN de 24-29 semanas?

Z Valor Estimaciones de los parmetros del modelo logstico


propuesto para los datos anteriores
Z95% 1,96 95%
Variable Estimacin Error estndar
Z99% 2,56 99%
Constante 18,36 2,375
Z99,5% 3,29 99,5%
Edad - 0,6819 0,08908
gestacional
Coeficiente de regresin
logstica estandarizado

1 0,6819
= = 7,65 > Z95%
EE1 0,08908

Podemos decir con error inferior al 5% que existe asociacin entre la mortalidad de los RN
prematuros y su edad gestacional en el rango estudiado.
C aptulo 8 Pgina 869

Anlisis de regresin logstica simple

Estimaciones de los parmetros del modelo


logstico propuesto para los datos anteriores
Variable Estimacin Error estndar
Constante 18,36 2,375
Edad - 0,6819 0,08908
gestacional 1/OR = 1,98
Un RN presenta casi 2 veces ms riesgo de
morir que otro RN con una semana ms

OR = 0,506
20

1 = - 0,6819 Es el riesgo de morir de un RN respecto


10
a otro que tiene una semana menos
Logit

- 10
Cul es el riesgo de morir de un RN
con 25 semanas en relacin a otro de 29
24 25 26 27 28 29 semanas?
Edad gestacional (semanas)
Representacin grfica de los logits en las diferentes edades OR = e1 (X1-X2)
gestacionales estudiadas
OR = e -0,6819 (25-29) = 15,30
C aptulo 8 Pgina 870

Pregunta de investigacin
Qu relacin existe entre el VCM del hemograma y la
probabilidad de tener dficit de los depsitos de hierro en
mdula sea?

Variable PREDICTORA Variable RESULTADO


CUANTITATIVA continua CUALITATIVA dicotmica
VCM Depsitos de Fe en mdula sea
(hemograma)

Cul es el test estadstico ms acertado?


C aptulo 8 Pgina 871

Anlisis de Regresin Logstica Simple


Qu relacin existe entre el VCM y los depsitos de
hierro en mdula sea?
Variable PREDICTORA Variable RESULTADO

VCM Depsitos de Fe medular

Estimaciones de los parmetros del modelo


logstico propuesto para los datos anteriores
Variable Estimacin Error estndar
Constante - 6,1112
VCM 0,08485 0,02689
P
log = - 6,1112 + 0,08485 VCM
1- P
P = probabilidad de que existan depsitos de hierro medular
C aptulo 8 Pgina 872

Anlisis de Regresin Logstica Simple


Qu relacin existe entre la Ferritina srica y los depsitos
de hierro medular?
Variable PREDICTORA Variable RESULTADO

Ferritina srica Depsitos de Fe medular

Estimaciones de los parmetros del modelo


logstico propuesto para los datos anteriores
Variable Estimacin Error estndar
Constante - 2,1290
FERRITINA 0,1713 0,04085

P
log = - 2,1290 + 0,1713 FERRITINA
1 - P
P = probabilidad de que existan depsitos de hierro medular
C aptulo 8 Pgina 873

Tipos de test analticos estadsticos bivariantes de contraste


de hiptesis ms frecuentes
Variable Variable RESULTADO o Dependiente (Criterio de evaluacin)
PREDICTORA o Cualitativa nominal Cualitativa nomi- Cualitativa ordinal o Cuantitativa
Independiente (factor dos nal > 2 Cuantitativa NO paramtrica
de estudio) categoras categoras paramtrica
Cualitativa dos Chi cuadrado Chi cuadrado U de Mann-Whitney T de Student
grupos Z comparacin de (prueba de Welch)
independientes proporciones
Test exacto de Fisher
Cualitativa dos Test de McNemar Q de Cochran Prueba de los rangos T de Student
grupos de Wilcoxon para datos
apareados emparejados
Cualitativa > 2 grupos Chi cuadrado Chi cuadrado Prueba de Kruskal- Anlisis de la Varianza
independientes Wallis (ANOVA)

Cualitativa > 2 grupos Q de Cochran Q de Cochran Prueba de Friedman Anlisis de la Varianza


apareados de dos vas
Cuantitativa Regresin logstica Regresin logsti- Correlacin de Regresin lineal
simple ca multivariante Sperman Correlacin de Pearson
Tau de Kendall
C aptulo 9 Pgina 874

Captulo 9

Publicacin Bioestadstica: Anlisis bivariante.


Test de contraste de hiptesis.
Cualitativa policotmica versus cuantitativa.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 9 Pgina 875

Materiales y mtodos
Estructura

1. Tipo de diseo (estudio).


2. Sujetos incluidos (criterios de seleccin de la muestra)
3. Fuentes de informacin.
4. Descripcin de la intervencin y definicin del punto final de la
investigacin (estudios experimentales).
5. Instrumentos y procedimientos de medida (cuestionarios).
6. Definicin de las variables y covariables incluidas en el estudio (factor de
estudio y criterio de evaluacin).
7. Limitaciones y consideraciones ticas de la investigacin.
8. Pruebas estadsticas a utilizar (programa estadstico).
C aptulo 9 Pgina 876

Fases del anlisis estadstico

1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE
C aptulo 9 Pgina 877

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable Variable Pruebas de contraste de Observaciones y/o limitaciones del test
Independiente o Dependiente o hiptesis
PREDICTORA RESULTADO
Cualitativa Cualitativa Ji cuadrado Si el tamao muestral es grande
Prueba exacta de Fisher Si el tamao muestral es pequeo
Test de McNemar Dos grupos de muestras repetidas o apareadas
Q de Cochran Ms de dos grupos de muestras repetidas o apareadas
REGRESIN LOGSTICA Varias variables predictoras cualitativas
Cualitativa Cuantitativa t de Student Compara medias entre dos grupos independientes
Anlisis de la Varianza Compara medias entre ms de dos grupos independientes
Test de Mann-Whitney Dos grupos independientes No paramtricos
Test de Wilcoxon Dos grupos medidas repetidas No paramtrico
Test de Kruskall-Wallis Ms de dos grupos No paramtrico, medidas repetidas
Test de Friedman Ms de dos grupos No paramtrico medidas repetidas
Cuantitativa Cualitativa Regresin logstica simple Una sola variable predictora cuantitativa
Regresin logstica multivariante Varias variable predictoras cuantitativa o cualitativas
Cuantitativa Cuantitativa Regresin lineal simple Paramtrico
Correlacin de Pearson Paramtrico
Correlacin de Sperman No paramtrico
REGRESIN MLTIPLE Varias variables predictoras cuantitativas
Cualitativa Superviviencia Kaplan-Meier Curvas de superviviencia
Long-Rank Compara curvas de superviviencia
Regresin de COX Anlisis Multivariante
C aptulo 9 Pgina 878

Tipos de test analticos estadsticos bivariantes de contraste


de hiptesis ms frecuentes
Variable Variable RESULTADO o Dependiente (Criterio de evaluacin)
PREDICTORA o Cualitativa nominal Cualitativa nominal Cualitativa ordinal o Cuantitativa
Independiente (factor dos >2 Cuantitativa NO paramtrica
de estudio) categoras categoras paramtrica
Cualitativa dos grupos Chi cuadrado Chi cuadrado U de Mann-Whitney T de Student
independientes Z comparacin de (prueba de Welch)
proporciones
Test exacto de
Fisher
Cualitativa dos grupos Test de McNemar Q de Cochran Prueba de los T de Student
apareados rangos para datos
de Wilcoxon emparejados
Cualitativa > 2 grupos Chi cuadrado Chi cuadrado Prueba de Kruskal- Anlisis de la Varianza
independientes Wallis (ANOVA)
Cualitativa > 2 grupos Q de Cochran Q de Cochran Prueba de Friedman Anlisis de la Varianza
apareados de dos vas
Cuantitativa Regresin logstica Regresin logstica Correlacin de Regresin lineal
Sperman Correlacin de Pearson
Tau de Kendall
C aptulo 9 Pgina 879

Cualitativa versus cuantitativa


Cules son las pruebas estadsticas que tenemos que emplear?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA dicotmica CUANTITATIVA
C aptulo 9 Pgina 880

Cualitativa policotmica versus cuantitativa

PARAMTRICOS NO PARAMTRICOS
2 GRUPOS

ANOVA para muestras Kruskal-Wallis


Independientes independientes

Anlisis de la Varianza Friedman


Aparejados para muestras depen-
dientes o apareadas

Variable predictora Cualitativa versus variable resultado Cuantitativa.


C aptulo 9 Pgina 881

Anlisis de la varianza para un factor (ANOVA):


Condiciones de aplicacin
- Tipos de variables.
- Variable resultado: Cuantitativa numrica.
- Variable predictora: Cualitativa policotmicas.

- Normalidad: Variable resultado siga una distribucin normal o de gauss.

- Homogeneidad de las varianzas (homocedasticidad): Las varianzas de cada


grupo deben ser iguales.
- Prueba F de Snedecor.
- Test de Barttlet.
- Test de Levene.
C aptulo 9 Pgina 882

Homogeneidad de varianzas (homocedasticidad)

- Prueba F de Snedecor
- Test de Barttlet Varianza mayor
- Test de Levene F=
Varianza menor

Ho: Las varianzas de ambos grupos son iguales ANOVA

Ha: Existen diferencias entre las varianzas KRUSKAL-WALLIS

Fcalculada < Ftabulada p>0,05 (aceptamos la Ho)

Fcalculada > Ftabulada p<0,05 (rechazamos la hiptesis nula)


C aptulo 9 Pgina 883

HIPERLIPIDEMIA
EDAD
SEXO Excrecin urinaria
NIVEL CULTURAL de sodio en 24 horas

TABAQUISMO
OBESIDAD IMC
DIABETES
C aptulo 9 Pgina 884

Test de la t de Student
Anlisis de la varianza para un factor

Variables PREDICTORAS Variable RESULTADO

Sigue una Distribucin Normal?

Distribucin ANORMAL
C aptulo 9 Pgina 885

Pregunta de investigacin
Tienen la misma eficacia las dietas ensayadas para reducir
el nivel de colesterol-LDL?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA policotmica CUANTITATIVA continua
Tipos de dieta LDL- colesterol
- Dieta control
- Dieta moderada
- Dieta estricta

Cul es la prueba estadstica ms adecuada?


C aptulo 9 Pgina 886

Grupo Control (n=10) Dieta moderada (n=10) Dieta estricta (n=10)


+ 13 4 0
+ 10 8 12
+2 9 15
2 10 21
-8 20 -10
+5 15 -18
3 6 -16
+8 7 -10
+2 16 -20
-2 6 -15
Media = + 2,5 Media = - 10,1 Media = - 13,7
C aptulo 9 Pgina 887

Anlisis de la varianza para un factor

Hiptesis nula: 1 = 2 = 3 = = n

Hiptesis alternativa: al menos una de las medias x es distinta

EFECTO debido a la dieta Varianza entre grupos (EFECTO)


=
Dispersin debida al AZAR (error) Varianza residual (ERROR)

Varianza entre grupos (EFECTO) 723,6


F = = = 20,2
Varianza residual (ERROR) 35,7
C aptulo 9 Pgina 888

Tienen la misma eficacia las dietas ensayadas para reducir


el nivel de colesterol-LDL?
Varianza entre grupos (EFECTO) 723,6

Cambio en los niveles de colesterol-LDL (mg/dl) a los 6 meses de


15 F = = = 20,2

tratamiento de intervencin diettica en 3 grupos de voluntarios


Varianza residual (ERROR) 35,7
10

asignados a diferentes dietas


0

-5
Cambio de el LDL (mg/dl)

- 10

-15

- 20

- 25 Control Moderada Estricta

Cul es la intervencin diettica que ms reduce los niveles de colesterol-LDL?


Cambio de el LDL (mg/dl)
+10

- 10
0

- 20

Control
Moderada
Estricta

Cambio en los niveles de colesterol-LDL (mg/dl) a los 6 meses de


tratamiento de intervencin diettica en 3 grupos de voluntarios
asignados a diferentes dietas
C aptulo 9
Pgina 889
C aptulo 9 Pgina 890

Anlisis de la varianza para un factor


Peso del RN Suma de gl Media F Significacin
cuadrados cuadrtica
Inter-grupos 1447,2 2 723,6 20,235 0,000
Intra-grupos 965,5 27 35,7
Total 2412,7 29

F calculada= 20,235 > F tabulado = 3,23; p < 0,001

Hiptesis alternativa Ha: El reduccin del LDL difiere segn el tipo de dieta.

Cul es la intervencin diettica que ms reduce los niveles de colesterol-


LDL?
C aptulo 9 Pgina 891

Distribucin de la F de Snedecor

s12 12 Grados de libertad 1 y 2


valores " F " : F = 2 2
s2 2 1 = n1 - 1 2 = n2 - 1
El ANOVA para un factor para poblaciones con alto tamao
muestral presenta una distribucin de la F de Snedecor.
C aptulo 9 Pgina 892

Distribucin de la F de Snedecor

F calculada = 20,2
Ho F calculada > F tabulada

Ha
p < 0,05

F tabulado = 3,23 para los grados de libertad de la muestra


C aptulo 9 Pgina 893

Anlisis de la varianza para un factor


Anlisis de la Varianza para un factor

t calculada < t tabulada Varianza entre grupos (EFECTO) 318,6 t calculada > t tabulada
F= = = 5,2
p > 0,05 Varianza residual (ERROR) 61,0 p < 0,05

Hiptesis nula H0 Hiptesis alternativa Ha

El cambio en el nivel de cLDL es Las medias del cLDL de los


independiente de la intervencin distintos grupos son diferentes
diettica entre s, es decir NO pueden
considerarse iguales

Tienen la misma eficacia las dietas ensayadas para reducir el nivel de colesterol-LDL?
NO

Cul es la intervencin diettica que ms reduce los niveles de colesterol-LDL?


?
C aptulo 9 Pgina 894

Cul es la intervencin diettica que ms reduce los niveles


de colesterol-LDL?

Se comparan los
Procedimiento de SCHEFFE grupos de 2 en 2
CONTRASTES A POSTERIORI

Se comparan los
Procedimiento de BONFERRONI grupos de 2 en 2
Se comparan los
Mtodo de DUNNET grupos de 2 en 2
Se comparan los
Mtodo de TUKEY grupos de 2 en 2
Se comparan los
Mtodo de DUCAN grupos de 2 en 2

Mtodo de STUDENT- Se obtienen


intervalos de medias
NEWMAN-KEULS
C aptulo 9 Pgina 895

Contrastes a posteriori en SPSS


C aptulo 9 Pgina 896

Pruebas Post Hoc

Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al


resto de las dietas comparadas.

Hiptesis alternativa Ha: La dieta ESTRICTA reduce el LDL de forma


significativa con respecto al resto de las dietas comparadas.

DIETAS Control Moderada Estricta


Control Ho = Ho =
Ha Ha
Moderada Ho =
Ha
Estricta
C aptulo 9 Pgina 897

Procedimiento de Bonferroni

Dieta (I) Dieta (J) Diferencias de Error estndar Significacin


medias (I J)
Control Moderada 12,60 2,674 0,000
Estricta 16,20 2,674 0,000
Moderada Control - 12,60 2,674 0,000
Estricta 3,60 2,674 0,568
Estricta Control - 16,20 2,674 0,000
Moderada - 3,60 2,674 0,568

Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.
C aptulo 9 Pgina 898

Procedimiento de Scheffe

Dieta (I) Dieta (J) Diferencias de Error estndar Significacin


medias (I J)
Control Moderada 12,60 2,674 0,000
Estricta 16,20 2,674 0,000
Moderada Control - 12,60 2,674 0,000
Estricta 3,60 2,674 0,416
Estricta Control - 16,20 2,674 0,000
Moderada - 3,60 2,674 0,416

Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.
C aptulo 9 Pgina 899

Procedimiento de HSD de Tukey

Dieta (I) Dieta (J) Diferencias de Error estndar Significacin


medias (I J)
Control Moderada 12,60 2,674 0,000
Estricta 16,20 2,674 0,000
Moderada Control - 12,60 2,674 0,000
Estricta 3,60 2,674 0,383
Estricta Control - 16,20 2,674 0,000
Moderada - 3,60 2,674 0,383

Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.
C aptulo 9 Pgina 900

Procedimiento de Gabriel

Dieta (I) Dieta (J) Diferencias de Error estndar Significacin


medias (I J)
Control Moderada 12,60 2,674 0,000
Estricta 16,20 2,674 0,000
Moderada Control - 12,60 2,674 0,000
Estricta 3,60 2,674 0,459
Estricta Control - 16,20 2,674 0,000
Moderada - 3,60 2,674 0,459

Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.
C aptulo 9 Pgina 901

Procedimiento de Sidak

Dieta (I) Dieta (J) Diferencias de Error estndar Significacin


medias (I J)
Control Moderada 12,60 2,674 0,000
Estricta 16,20 2,674 0,000
Moderada Control - 12,60 2,674 0,000
Estricta 3,60 2,674 0,467
Estricta Control - 16,20 2,674 0,000
Moderada - 3,60 2,674 0,467

Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.
C aptulo 9 Pgina 902

Procedimiento de la t de Dunnett (bilateral)

Dieta (I) Dieta (J) Diferencias de Error estndar Significacin


medias (I J)
Control Estricta 16,20 2,674 0,000
Moderada Estricta 3,60 2,674 0,315

La prueba de Dunnett trata como un grupo como control y lo compara con


todos los dems grupos.

Hiptesis nula Ho: La dieta ESTRICTA reduce el LDL de forma similar al resto de las dietas comparadas.
C aptulo 9 Pgina 903

Mtodo de Duncan

Tipo de dieta Subconjunto para alfa


= 0,05
Test de Duncan DIETA N 1 2
Estricta 10 -13,700
Moderada 10 -10,100
Control 10 2,500
Significacin 0,189 1,000

Comparacin de la dieta estricta Comparacin de la dieta control con las


con la moderada (p > 0,1). dems (1- p = 1,000; p = 0,000).

Hiptesis nula Ho: La dieta CONTROL reduce el LDL de forma similar al resto de las dietas comparadas.
No existe diferencia entre la moderada y la estricta).
C aptulo 9 Pgina 904

Mito 1: La sonrisa de la esfinge

ANOVA es un test paramtrico, es decir para usarlo se debe cumplir la


normalidad de la variable cuantitativa. Se cumple?

He observado que en los tres grupos de estudio slo tienen 10 sujetos. Ante
tan bajo volumen muestral

Cmo justificas esa supuesta normalidad?

Qu test has empleado para comprobar esa normalidad de la reduccin del


LDL?

Ests seguro que se cumplen los criterios para poder usar ANOVA?
C aptulo 9 Pgina 905

Realidad 1: Respuesta de Edipo

Estadsticos descriptivos del LDL en cada dieta


Tipo de dieta Media DE Mediana g1 EEg1 g2 EEg2
Reduccin del Control 2,500 6,53 2,000 0,127 0,687 -0,732 1,334
LDL Moderada -10,100 5,19 -8,500 - 0,880 0,687 -0,307 1,334
Estricta - 13,700 6,12 -15,000 1,172 0,687 1,909 1,334

[Asimetria] < 2 EEasimetra g1 < 2 EE g1


Distribucin normal

[Curtosis] < 2 EEcurtois g2 < 2 EE g2


C aptulo 9 Pgina 906

Realidad 1: Respuesta de Edipo

Test de Kolmogorov-Smirnov
Tipo de dieta Estadstico Z g.l Significacin
Reduccin del LDL Control 0,488 10 0,971
Moderada 0,657 10 0,782
Estricta 0,582 10 0,887

Ho: p > 0,05 NORMALIDAD Test paramtricos

Ha: p < 0,05 ANORMALIDAD Test NO paramtricos

Los test de normalidad ensayados dan un valor de p NO significativo (p > 0,05) en los 3 grupos (tipos de
dieta). Por tanto no hay evidencias suficientes para rechazar la hiptesis nula de normalidad de la variable
reduccin del peso en ambas muestras: podemos usar test PARAMTRICOS.
C aptulo 9 Pgina 907

Test ANOVA: Observaciones

- Los resultados del contraste estadstico F en la prueba ANOVA son sustancialmente


vlidos aunque los datos no sean normales, en ese sentido se dice que es una
tcnica ROBUSTA frente a desviaciones de la normalidad.

- El efecto de desigualdad de las varianzas en los grupos sobre el contraste F y


los contrastes de medias dependen de que el nmero de observaciones en cada
grupo sea igual o muy distinto. Si todos los grupos tienen el mismo nmero de
observaciones, el contraste F es igualmente exacto aunque las varianzas sean
distintas. Es decir, podemos despreocuparnos de las varianzas a efectos de
contrastes de medias, siempre que haya aproximadamente el mismo nmero de
observaciones por grupo, en caso contrario, diferencias entre las varianzas pueden
ser graves.
C aptulo 9 Pgina 908

Pregunta de investigacin
El peso al nacer de los RN difiere segn la localidad
de origen?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA policotmica CUANTITATIVA continua
Ciudad de origen Peso del RN
1. Ceuta
2. Algeciras
3. Tarifa
4. La Lnea

Cul es la prueba estadstica ms adecuada?


C aptulo 9 Pgina 909

Anlisis de la varianza para un factor

Hiptesis nula Ho: El peso al nacer de los RN NO difiere segn la localidad de


origen.
Hiptesis alternativa Ha: El peso al nacer de los RN difiere segn la localidad
de origen.

Estadsticos Peso al nacer del RN


Localidad de origen Ceuta Algeciras Tarifa La Lnea
Media 3366,2 3217,2 3188,4 3169,0
Desviacin estndar (S) 393,0 444,1 471,5 361,4
n 1146 214 80 186

Varianza entre grupos (EFECTO)


F= = 21,3
Varianza residual (ERROR)
C aptulo 9 Pgina 910

Distribucin de la F de Snedecor

F calculada = 21,3
Ho
Ha

F tabulado = 3,23 para los grados de libertad de la muestra


C aptulo 9 Pgina 911

Anlisis de la varianza para un factor

Peso del RN Suma de gl Media cuadrtica F Significacin


cuadrados
Inter-grupos 10290751 3 3430250,3 21,351 0,000
Intra-grupos 260596358 1622 160663,599
Total 270887109 1625

F calculada= 21,3 > F tabulado = 3,23; p < 0,001

Hiptesis alternativa Ha: El peso al nacer de los RN difiere segn la localidad


de origen.

Cul es la ciudad donde los nios nacen con mayor peso?


C aptulo 9 Pgina 912

Pregunta de investigacin
Cul es la ciudad donde los nios nacen con mayor peso?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA policotmica CUANTITATIVA continua
Ciudad de origen Peso del RN
1. Ceuta
2. Algeciras
3. Tarifa
4. La Lnea

Cul es la prueba estadstica ms adecuada?


C aptulo 9 Pgina 913

Pruebas Post Hoc paramtrico

Se comparan los
Procedimiento de SCHEFFE grupos de 2 en 2
CONTRASTES A POSTERIORI

Se comparan los
Procedimiento de BONFERRONI grupos de 2 en 2
Se comparan los
Mtodo de DUNNET grupos de 2 en 2
Se comparan los
Mtodo de TUKEY grupos de 2 en 2
Se comparan los
Mtodo de DUCAN grupos de 2 en 2

Mtodo de STUDENT- Se obtienen


intervalos de medias
NEWMAN-KEULS
C aptulo 9 Pgina 914

Pruebas Post Hoc

Hiptesis nula Ho: Los RN que nacen en Ceuta tiene un peso medio similar
al resto de los RN de las otras ciudades.

Hiptesis alternativa Ha: Los RN que nacen en Ceuta tiene mayor peso
medio que el resto de las ciudades.

Ciudades Ceuta Algeciras Tarifa La Lnea

Ceuta Ho = Ho = Ho =
Ha Ha Ha
Algeciras Ho = Ho =
Ha Ha
Tarifa Ho =
Ha
La Lnea
C aptulo 9 Pgina 915

Procedimiento de Scheffe

Ciudad (I) Ciudad (J) Diferencias de Error estndar Significacin


medias (I J)
Ceuta Algeciras 148.92 29,85 0,000
Tarifa 177,79 46,35 0,002
La Lnea 197,13 31,69 0,000
Algeciras Ceuta - 148,92 29,85 0,000
Tarifa 28,87 52,53 0,960
La Lnea 48,21 40,18 0,696
Tarifa Ceuta - 177,79 46,35 0,002
Algeciras - 28,87 52,53 0,960
La lnea 19,34 53,59 0,988
La Lnea Ceuta - 197,13 31,69 0,000
- 48,21 40,18 0,696
Tarifa - 19,92 53,59 0,988

Hiptesis alternativa Ha: Los RN que nacen en Ceuta tiene mayor peso medio que el resto de las ciudades.
C aptulo 9 Pgina 916

Procedimiento de Bonferroni

Ciudad (I) Ciudad (J) Diferencias de Error estndar Significacin


medias (I J)
Ceuta Algeciras 148.92 29,85 0,000
Tarifa 177,79 46,35 0,001
La Lnea 197,13 31,69 0,000
Algeciras Ceuta - 148,92 29,85 0,000
Tarifa 28,87 52,53 1,000
La Lnea 48,21 40,18 1,000
Tarifa Ceuta - 177,79 46,35 0,001
Algeciras - 28,87 52,53 1,000
La lnea 19,34 53,59 1,000
La Lnea Ceuta - 197,13 31,69 0,000
- 48,21 40,18 1,000
Tarifa - 19,92 53,59 1,000

Hiptesis alternativa Ha: Los RN que nacen en Ceuta tiene mayor peso medio que el resto de las ciudades.
C aptulo 9 Pgina 917

Procedimiento de Duncan

Procedencia Subconjunto para alfa


= 0,05
Test de Duncan Ciudad N 1 2 (Ceuta)
La Lnea 186 3169,03
Tarifa 80 3188,38
Algeciras 214 3217,24
Ceuta 1146 3366,16 0,960
Significacin 0,298 1,000

Comparacin de las 3 ciudades Comparacin de Ceuta con las dems


(p > 0,1). ciudades (1- p = 1,000; p = 0,000).

Hiptesis alternativa Ha: Los RN que nacen en Ceuta tiene mayor peso medio que el resto de las ciudades.
C aptulo 9 Pgina 918

Cualitativa policotmica versus cuantitativa

PARAMTRICOS NO PARAMTRICOS
2 GRUPOS

ANOVA para muestras Kruskal-Wallis


Independientes independientes

Anlisis de la Varianza Friedman


Aparejados para muestras depen-
dientes o apareadas

Variable predictora Cualitativa versus variable resultado Cuantitativa.


C aptulo 9 Pgina 919

La prueba de Kruskal-Wallis (comparar ms de dos grupos)


- Para la comparacin de una misma variable cuantitativa en ms de tres grupos.
Es la prueba NO paramtrica ms potente para comparar >2 variables continuas
independientes. Es el similar al test de ANOVA para un factor.

- La prueba de Kruskal-Wallis, es una alternativa a la prueba F del ANOVA


(anlisis de varianza) para diseos de clasificacin simple donde NO se cumple la
normalidad de la variable cuantitativa.

- En este caso se comparan varios grupos de la variable predictora (cualitativa


POLICOTMICA) pero usando la MEDIANA de cada uno de ellos, en lugar de las
medias, donde, n es el total de datos.

12 k
Ri2
H= - 3(n + 1)
n(n + 1) i =1 ni
Ho: La mediana de las k poblaciones consideradas son iguales y
Ha: Al menos una de las poblaciones tiene mediana distinta a las otras
C aptulo 9 Pgina 920

Pregunta de investigacin
Tienen la misma eficacia las dietas ensayadas en grupos de
5 individuos para reducir el nivel de colesterol-LDL?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA policotmica CUANTITATIVA continua
Tipos de dieta LDL- colesterol
- Dieta control
- Dieta moderada
- Dieta estricta

Cul es la prueba estadstica ms adecuada?


C aptulo 9 Pgina 921

Tienen la misma eficacia las dietas ensayadas para reducir


el nivel de colesterol-LDL?
Variaciones en los niveles de colesterol-LDL (mg/dl) a los 6 meses de
seguimiento en 3 grupos de voluntarios asignados a diferentes medidas de
intervencin diettica.

Grupo Control Dieta moderada Dieta estricta


+ 13 -4 0
+ 10 -8 - 12
+2 -9 - 15
-2 - 10 - 21
-8 - 20
N=5 N=5 N=4
Media = + 3 Media = - 10,2 Media = - 12
N = 14 Media total = - 6
C aptulo 9 Pgina 922

Resultados: Prueba de Kruskal-Wallis

Rangos Cambio del LDLc


Tipo de DIETAS N Rango promedio
CONTROL 5 12,30
MODERADA 5 6,70
ESTRICTA 5 5,00
Total 15

Estadstico de contraste
N 15
Chi-cuadrado 7,308
gl (K 1) 2
Significacin 0,026
C aptulo 9 Pgina 923

Test de Kruskal-Wallis
Test de Kruskal-Wallis

t calculada < t tabulada t calculada > t tabulada


X2 H = 7,3 p = 0,026
p > 0,05 p < 0,05

Hiptesis nula H0 Hiptesis alternativa Ha

El cambio en el nivel de cLDL es Las medias del cLDL de los


independiente de la intervencin distintos grupos son diferentes
diettica entre s, es decir NO pueden
considerarse iguales

Tienen la misma eficacia las dietas ensayadas para reducir el nivel de colesterol-LDL?
NO

Cul es la intervencin diettica que ms reduce los niveles de colesterol-LDL?


?
Cambio de el LDL (mg/dl)
+10

- 10
0

- 20

Control
+3

Moderada
- 10,2

Estricta
-12

Cambio en los niveles de colesterol-LDL (mg/dl) a los 6 meses de


tratamiento de intervencin diettica en 3 grupos de 5 voluntarios
asignados a diferentes dietas
C aptulo 9
Pgina 924
C aptulo 9 Pgina 925

Pruebas Post Hoc no paramtricas

Procedimiento de BONFERRONI
CONTRASTES A POSTERIORI

Procedimiento de IDK

Mtodo de HOLM

Mtodo de HOLLAND-COPENHAVER

Mtodo de HOCHBERG
Mtodo de HOMMEL
Mtodo de ROM
C aptulo 9 Pgina 926

Med Clin (Barc) 2006;127:41-6.


C aptulo 9 Pgina 927
C aptulo 9 Pgina 928

Pregunta de investigacin
Qu relacin existe entre los niveles de calprotectina fecal
y las diferentes enfermedades orgnicas intestinales?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA policotmica CUANTITATIVA continua
Controles Calprotectina fecal
- Plipos
- Cncer colorrectal
- Enfermedad inflamatoria intestinal
C aptulo 9 Pgina 929

4.000

3.600

3.200

Calprotectina fecal (g/g) 2.800

2.400

2.000

1.600

1.200

800

400
217
0
Normal Polipos Cncer Enfermedad
colorrectal inflamatoria
Diagnstico endoscpico intestinal

Cul es la prueba estadstica ms adecuada?


C aptulo 9 Pgina 930

Qu relacin existe entre los niveles de calprotectina fecal


y las diferentes enfermedades orgnicas intestinales?
Concentraciones de calprotectina fecal (g/g)
Grupos N Media DE
Controles 117 113,7 113,1
Plipos 28 158,3 155,8
Cncer colorrectal 20 726,6 533,2
Enfermedad inflamatoria intestinal 25 2171,1 2133,6

Test de KRUSKAL-WALLIS p < 0,001


C aptulo 9 Pgina 931

Anlisis estadstico (fragmento del texto)

El anlisis de los datos se llev a cabo mediante el programa estadstico SPSS 11.0. El
valor de la CPF se presenta como media y con un intervalo de confianza (IC) del 95%.
Se utiliz el test de Kruskal-Wallis para evaluar las diferencias entre los valores de CPF
entre los diferentes grupos y el coeficiente de Spearman para valorar la correlacin entre
este marcador y el ndice de actividad de la enfermedad en el grupo de pacientes con
enfermedad inflamatoria intestinal (EII).
C aptulo 9 Pgina 932

Resultados (fragmento del texto)


En la figura 1 se muestra los valores de CPF en los diferentes grupos de pacientes. Se
encontr un incremento del valor medio (DE) en pacientes con enfermedad inflamatoria
intestinal (EII) EII (2.171 [2.134] mg/kg) y CCR (727 [533] mg/kg) con diferencias
estadsticamente significativas con respecto al grupo 1 (114 [113] g/g, p < 0,001).

Discusin (fragmento del texto)


El presente trabajo muestra que la concentracin de CPF est significativamente elevada
en pacientes con procesos orgnicos en colon, fundamentalmente en el cncer colorrectal
y enfermedad inflamatoria intestinal (EII). Adems, los valores ms altos se alcanzan
en pacientes con EII, y sus valores se correlacionan con el grado de actividad de la
enfermedad.
C aptulo 9 Pgina 933

Mito 1: La sonrisa de la esfinge

Me parece acertada la eleccin del test de KRUSKAL-WALLIS como


contraste de hiptesis, sin embargo

Qu test has empleado para comprobar esa supuesta anormalidad de la


calprotectina fecal?

Si la calprotectina no sigue la distribucin normal

Por qu utilizas la media y la desviacin estndar como estadsticos


descriptivos?
C aptulo 9 Pgina 934

Mito 1: La sonrisa de la esfinge

El test de KRUSKAL-WALLIS muestra un nivel crtico que es menor de 0,05,


y slo podemos rechazar la hiptesis de igualdad de promedios, concluyendo
que los grupos comparados (control, plipos, cncer colorrectal y enfermedad
inflamatoria intestinaI), difieren en los niveles de calprotectina fecal. Sin
embargo el test no te permite decir que en la enfermedad inflamatoria
intestinal los valores son mayores.

Por qu dices que los valores ms altos se alcanzan en pacientes con


enfermedad inflamatoria intestinal, cuando eso no te lo permite el test
estadstico empleado?
C aptulo 9 Pgina 935

Mito 1: La sonrisa de la esfinge

Aunque existen procedimientos POCT HOC para efectuar comparaciones


mltiples tras obtener un estadstico H significativo, para analizar con SPSS
que grupo tiene un mayor valor de CPF puedes utilizar la U de Mann-Whitney
para dos muestras independientes, pero acompaada de la correccin de
Bonferroni para controlar la probabilidad de cometer un error alfa.

Puesto que con 4 grupos de la variable predictora; control (CT), polipos (PL),
cncer colorrectal (CCR) y enfermedad inflamatoria intestinal (EII), necesitas
hacer 6 comparaciones 2 a 2 (CT-PL, CT-CCR, CT-EII, PL-CCR, PL-EII,
CCR-EII), la aplicacin de la correccin de Bonferroni te llevar a basar
vuestras decisiones en un nivel de significacin de 0,05/6 = 0,0083. Es decir,
consideraremos que dos grupos comparados difieren significativamente
cuando el nivel crtico obtenido (p) sea inferior a 0,0083.
C aptulo 9 Pgina 936

Test de Kruskal-Wallis

VENTAJAS INCONVENIENTES
Permite datos ordinales y cuantitativos Menor potencia estadstica
discretos
No es necesaria la normalidad (test no Menor sensibilidad para detectar
paramtrico) diferencias entre grupos
El tamao muestral puede ser pequeo No permite construir intervalos de
confianza
C aptulo 9 Pgina 937

Prueba de la Mediana

- Su objetivo es comparar las medianas de dos muestras y determinar si


pertenecen a la misma poblacin o no.
- Se calcula la mediana de todos los datos conjuntamente. Despus, se divide
cada muestra en dos subgrupos: uno para aquellos datos que se siten por
encima de la mediana y otro para los que se siten por debajo.
- La prueba de chi-cuadrado determinar si las frecuencias observadas en cada
grupo difieren de las esperadas con respecto a una distribucin de frecuencias
que combine ambas muestras.
- Esta prueba est especialmente indicada cuando los datos sean extremos o
estn sesgados.
C aptulo 9 Pgina 938

Pregunta de investigacin
Tienen la misma eficacia las dietas ensayadas para reducir
el nivel de colesterol-LDL?

Variable PREDICTORA Variable RESULTADO


CUALITATIVA policotmica CUANTITATIVA continua
Tipos de dieta LDL- colesterol
- Dieta control
- Dieta moderada
- Dieta estricta

Cul es la prueba estadstica ms adecuada?


C aptulo 9 Pgina 939

Grupo Control (n=10) Dieta moderada (n=10) Dieta estricta (n=10)


+ 13 4 0
+ 10 8 12
+2 9 15
2 10 21
-8 20 -10
+5 15 -18
3 6 -16
+8 7 -10
+2 16 -20
-2 6 -15
Media = + 2,5 Media = - 10,1 Media = - 13,7
C aptulo 9 Pgina 940

Prueba de la Mediana
Tipo de dietas
Control Moderada Estricta
> Mediana 9 4 1
Mediana 1 6 9

Hay 3 casillas con frecuencia esperada menor de 5.


La frecuencia de casilla esperada mnima es de 4,7

Estadstico de contraste LDL


N 30
Mediana - 8,000
Chi-cuadrado 13,125
gl (K 1) 2
Significacin 0,001
C aptulo 9 Pgina 941

Test de Jonckheere-Terpstra

- Cuando no se cumplen las condiciones para el ANOVA, hay tres tests


disponibles: H de Kruskal-Wallis, mediana y Jonckheere-Terpstra.

- El test H de Kruskal-Wallis, una extensin del test U de Mann-Whitney es el


anlogo no-paramtrico del ANOVA.

- El test de la mediana, que es una prueba ms general pero no tan potente,


detecta diferencias en la situacin y forma de las distribuciones. Ambas pruebas
asumen que no hay un ordenamiento a priori de las k poblaciones de las que se
han extrado las muestras.

- Cuando hay una ordenacin natural a priori (ascendente o descendente) de las


k poblaciones, es preferible usar el test de Jonckheere-Terpstra.
C aptulo 9 Pgina 942

74 pacientes ingresados en una UCI y queremos comparar las


estancias generadas en dicha unidad entre tres grupos de pa-
cientes clasificados en funcin de la edad (jvenes, maduros y
ancianos)
Variable PREDICTORA 1 Variable RESULTADO
CUALITATIVA ordinal CUANTITATIVA
Grupos etarios Estancia
- Jvenes - Das
- Maduros
- Ancianos

Cul es el test estadstico ms acertado?


C aptulo 9 Pgina 943

Estadsticos descriptivos

Variable resultado ESTANCIA N Media DE EEM Mediana


Variable predictora JVENES 28 5,18 11,17 2,11 2,00
Grupos etarios MADUROS 23 9,22 15,29 3,19 3,00
ANCIANOS 23 21,51 21,52 4,49 3,00

Variable resultado ESTANCIA N 1 EE1 2 EE1


Variable predictora JVENES 28 3,944 0,441 16,048 0,858
Grupos etarios MADUROS 23 2,760 0,481 8,430 0,935
ANCIANOS 23 2,290 0,481 5,682 0,935

Distribucin normal g1 < 2 EE g1 g2 < 2 EE g2

La variable resultado ESTANCIA, como casi todas las que se refieren al tiempo, es una variable conocida
por su distribucin alejada de lo normal. Si el tamao de los grupos que se estudian es pequeo menor
de 30, no sera adecuada la utilizacin de mtodos paramtricos (ANOVA) y deberamos recurrir a los
clsicos no paramtricos (KRUSKAL-WALLIS).
C aptulo 9 Pgina 944

Media

Media
Mediana Mediana
C aptulo 9 Pgina 945

Test de normalidad

Variable resultado Test de Kolmogorov-Smirnov


ESTANCIA N Estadstico Z Significacin
Variable predictora Jvenes 28 2,301 0,000
Grupos etarios Maduros 23 1,668 0,008
Ancianos 23 1,236 0,097
Total 74 2,829 0,000

Ho: p > 0,05 NORMALIDAD Test paramtricos

Ha: p < 0,05 Test NO paramtricos

El test de normalidad ensayado da un valor de p significativo (p < 0,05). Por tanto hay evidencias suficientes
para rechazar la hiptesis nula de normalidad de la variable ESTANCIA en UCI en los grupos. No se puede
asumir la normalidad.
C aptulo 9 Pgina 946

Prueba de la homogeneidad de las varianzas


Test de Levene

Variable resultado ESTANCIA en UCI (das)


Estadstico de Levene gl1 gl2 Significacin
3,707 2 71 0,022

El test de Levene (1960) se usa para contrastar si los 3 grupos comparados tienen la misma varianza, es
decir, la homogeneidad de varianzas. Para poder utilizar el anlisis de la varianza es necesario que las
varianzas son iguales para todos los grupos. De ah la importancia de verificar con el test de Levene esa
hiptesis.

Ho: Las varianzas de ambos grupos son iguales ANOVA


Ha: Existen diferencias entre las varianzas KRUSKAL-WALLIS

p > 0,05 (aceptamos la Ho) ANOVA


p < 0,05 (rechazamos la hiptesis nula) KRUSKAL-WALLIS
C aptulo 9 Pgina 947

Reflexiones: existen varios incumplimientos para el


ANOVA

1. Ausencia de normalidad.
2. Ausencia de homocedasticidad: el test de Levene para valorar la
homogeneidad de las variancias muestra que existen diferencias entre ellas (p =
0,027).
3. Y existencia de valores anmalos (outliers) que impiden la utilizacin de
mtodos paramtricos (ANOVA clsico).

Tenemos que recurrir a los clsicos no paramtricos de Kruskal-Wallis o, mejor, a


mtodos robustos como la generalizacin robusta del test Welch, que utiliza medias
-recortadas muestrales y es capaz de detectar diferencias significativas entre los
grupos.
C aptulo 9 Pgina 948

Resultados: Prueba H de Kruskal-Wallis

Clculo de Rangos
GRUPO ETARIO N Rango promedio
JVENES 28 31,00
MADUROS 23 38,37
ANCIANOS 23 44,54
Total 74

Estadstico de contraste ESTANCIA


Chi-cuadrado 5,234
gl (K 1) 2
Significacin 0,073

Hiptesis nula Ho: La estancia en UCI de los pacientes estudiados NO difiere segn el
grupo etario.
C aptulo 9 Pgina 949

Test de Jonckheere-Terpstra (J-T)

Estadstico de contraste ESTANCIA


Nmero de niveles 3
N 74
Estadstico de J-T observado 1136,500
Media del estadstico J-T 908,500
Desviacin tpica del estadstico J-T 99,118
Estadstico de J-T tipificado 2,305
Significacin (bilateral) 0,021

Hiptesis alternativa Ha: La estancia en UCI de los pacientes estudiados difiere segn el
grupo etario.
C aptulo 9 Pgina 950

Cualitativa policotmica versus cuantitativa

PARAMTRICOS NO PARAMTRICOS
2 GRUPOS

Anlisis de la Varianza Kruskal-Wallis


Independientes para muestras indepen-
dientes

ANOVA Friedman
Aparejados
para medidas repetidas

Variable predictora Cualitativa versus variable resultado Cuantitativa.


C aptulo 9 Pgina 951

Anlisis de la Varianza (ANOVA) para muestras


dependientes o apareadas (medidas repetidas)

- Anlisis de la variancia (ANOVA) se utiliza para la obtencin del coeficiente de


correlacin intraclase (CCI).

- En los estudios que evalan la concordancia, cada sujeto es examinado por


ms de un observador, siendo adecuado realizar un anlisis de la variancia
(ANOVA) para medidas repetidas (generalizacin de la prueba de la t de Student
para datos apareados).

- Este tipo de diseo permite aislar la variabilidad entre pacientes y


concentrarnos en la variabilidad debida al factor de inters; en el anlisis de la
variancia simple, la variabilidad entre pacientes est incluida en la variabilidad
residual.
C aptulo 9 Pgina 952

Experimento diseado para estudiar el efecto del paso del tiempo sobre la calidad del recuerdo y realizacin
prctica de estudios con aplicacin de la estadstica de los 30 alumnos que han realizado el curso de
BIOESTADSTICA APLICADA A LAS CIENCIAS DE LA SALUD. Se evala el grado de conocimientos con
el mismo examen de 20 preguntas tipo test en 4 momentos diferentes; inmediatamente despus de finalizar
el curso, al ao, a los 2 aos, y a los 3 aos del curso. Se valora el nmero de respuestas correctas.

TIEMPO N Media DE 1 EE1 2 EE1


INICIO 30 15,53 2,776 0,014 0,427 - 0,946 0,833
PRIMER AO 30 12,00 2,626 - 0,159 0,427 - 0,515 0,833
SEGUNDO AO 30 9,37 2,282 0,334 0,427 0,412 0,833
TERCER AO 30 8,03 2,539 0,366 0,427 - 0,647 0,833

TIEMPO Test de Kolmogorov-Smirnov


N Estadstico Z Significacin
INICIO 30 0,618 0,839
PRIMER AO 30 0,548 0,925
SEGUNDO AO 30 0,679 0,746
TERCER AO 30 0,648 0,795
C aptulo 9 Pgina 953

Comparacin de > de 2 grupos apareados

Test de Kolmogorov-Smirnov
p > 0,05; Normalidad

Prueba de la esfericidad de Mauchly


p > 0,05 p < 0,05
ESFERICIDAD NO ESFERICIDAD

Contrastes UNIVARIADOS Contrastes MULTIVARIADOS

p < 0,05 p < 0,05

POST HOC: Procedimiento de BONFERRONI: Comparacin por pares


C aptulo 9 Pgina 954

Prueba de la homogeneidad de las varianzas


Prueba de la esfericidad de Mauchly
Efecto intra-sujetos Prueba de esfericidad de Mauchly
W de Mauchly Chi cuadrado g.l Significacin
TIEMPO 0,803 6,096 5 0,297

Para el ANOVA de medidas repetidas es conveniente suponer que las varianzas de las diferencias entre
cada dos niveles del factor TIEMPO son iguales. Con los 4 niveles, tenemos 6 pares de combinaciones
dos a dos entre niveles; inicio-1ao, inicio-2ao, inicio-3 ao, 1ao-2ao, 1 ao-3ao, 2ao-
3ao. Calculando las diferencias entre las puntuaciones de esos 6 pares, tendremos 6 nuevas variables.
Este supuesto equivale a afirmar que la matriz de varianzas-covarianzas es circular o esfrico. Para el
procedimiento de medidas repetidas esto se realiza con la prueba de esfericidad de MAUCHLY. Puesto que
la significacin estadstica asociada al estadstico W de Mauchly es de 0,297, (mayor de 0,05), NO podemos
rechazar la hiptesis nula de esfericidad. La matriz de las varianzas-covarianzas es ESFRICA.
C aptulo 9 Pgina 955

Prueba de la esfericidad de Mauchly


Efecto intra-sujetos Epsilon
Greenhous e-Geisser Hunh-Feldt Lmite-interior
TIEMPO 0,865 0,958 0,333

Cuando el estadstico W de Mauchly nos lleve al rechazo de la esfericidad (NO ESFERICIDAD), podemos
basar nuestra decisin en los estadsticos F MULTIVARIADOS que no les afecta la falta de esfericidad, o
bien podemos utilizar el estadstico F UNIVARIADO aplicando el ndice corrector EPSILON.

El ndice corrector EPSILON expresa el grado en que la matriz de varianzas-covarianzas se aleja de la


esfericidad. En condiciones de esfericidad perfecta, psilon vale 1. En este caso psilon es alto porque hay
ESFERICIDAD.

Existen 3 estimaciones del ndice psilon, Greenhous e-Geisser es la ms conservadora. El lmite inferior
expresa el valor que adoptara psilon en caso de incumplimiento extremo de la esfericidad. El valor
de EPSILON se utiliza para corregir el valor del F UNIVARIADO. En este caso NO es necesario utilizar
EPSILON porque se cumple la ESFERICIDAD (p > 0,05).
C aptulo 9 Pgina 956

TIEMPO Contrastes MULTIVARIADOS


Valor F GI de la hiptesis GI del error Significacin
Traza de Pillai 0,902 83,25 3 27 0,000
Lambda de Wilks 0,098 83,25 3 27 0,000
Traza de Hotelling 9,250 83,25 3 27 0,000
Raz mayor de Roy 9,250 83,25 3 27 0,000

La tabla contiene 4 estadsticos multivariados: Traza de Pillai, Lambda de Wilks, Traza de Hotelling, Raz
mayor de Roy. Se interpretan de la misma forma que todos los estadsticos ya estudiados; puesto que la
significacin de cada uno de ellos (p < 0,001) es menor que 0,05, podemos rechazar la hiptesis nula
de igualdad de las medias y concluir que la calidad del recuerdo de los conocimientos de bioestadstica
adquiridos no es la misma en los 4 momentos temporales definidos en el factor tiempo.

Ha: La calidad del recuerdo de los conocimientos de bioestadstica NO es la misma en


los 4 momentos considerados.
C aptulo 9 Pgina 957

TIEMPO Contrastes UNIVARIADOS: Prueba de efectos INTRA-SUJETOS


Suma de cuadrados gl Media cuadrtica F Significacin
tipo III
Esfericidad asumida 984,067 3 328,022 103,236 0,000
Greenhouse-Geisser 984,067 2,596 379,006 103,236 0,000
Huynh-Feldt 984,067 2,874 342,361 103,236 0,000
Lmite-inferior 984,067 1,000 984,067 103,236 0,000

Si de cumple la ESFERICIDAD (homogeneidad de las varianzas) es preferible utilizar la aproximacin


UNIVARIADA (esfericidad asumida), ya que en condiciones de esfericidad, el estadstico UNIVARIADO F
(F= 103,236) es ms potente que los estadsticos MULTIVARIADOS de la tabla anterior (F= 83,246), sobre
todo con muestras pequeas, aunque, si ambos estadsticos conducen a la misma conclusin es irrelevante
utilizar uno u otro.

Observando los resultados de esta tabla vemos que las cuatro versiones del estadstico F UNIVARIADO (la
no corregida y las 3 corregidas con el valor de EPSLION) conducen a la misma conclusin, que coincide
con la ya alcanzada en la tabla de contrastes MULTIVARIADOS, por tanto, de nuevo rechazamos la Ho
(igualdad de medias) y aceptamos la Ha.

Ha: la calidad del recuerdo de los conocimientos NO es la misma en los 4 momentos considerados.
C aptulo 9 Pgina 958

TIEMPO MEDIAS MARGINALES ESTIMADAS


Media Error tpico Lmite inferior del IC95% Lmite inferior del IC95%
INICIO 15,553 0,507 14,494 16,570
1 ao 12,000 0,479 11,019 12,981
2 ao 9,367 0,417 8,515 10,219
3 ao 8,033 0,464 7,085 8,981

Se observa en la tabla que la media de los conocimientos adquiridos en el curso van disminuyendo
paulatinamente con el paso del TIEMPO.

Esta disminucin es estadsticamente significativa en cada uno de los


estratos temporales?
C aptulo 9 Pgina 959

Grfico de perfil representando el efecto del factor


tiempo
16 Se observa en el grfico que los conocimientos
adquiridos en el curso van disminuyendo
Medidas marginales estimadas

paulativamentre con el paso del TIEMPO en


14 todos los intervalos ensayados (p< 0,05)

12

10

Inicio 1 ao 2 ao 3 ao
TIEMPO

Qu test has utilizado para llegar a esa conclusin?


C aptulo 9 Pgina 960

TIEMPO Pruebas de CONTRASTES INTRA-SUJETOS


Suma de cuadrados gl Media cuadrtica F Significacin
tipo III
LINEAL 947,527 1 947,527 206,956 0,000
CUADRTICO 36,300 1 36,300 13,815 0,001
CBICO 0,240 1 0,240 0,103 0,750

La tabla ofrece contrastes polinmicos, de tipo ortogonal, mostrando tantos contrastes como niveles tiene el
factor tiempo menos uno, como el factor tiempo tiene 4 niveles, aparecen 3 contrastes (lineal, cuadrtico y
cbico).

Si miramos la significacin (p) asociados a cada estadstico F podemos rechazar las hiptesis nulas
referidas a los componentes lineal y cuadrtico, pero no la referida al componente cbico. Podemos
concluir que las medias de los conocimientos adquiridos en el curso en cada momento temporal se ajustan
significativamente tanto a una lnea recta (componente lineal) como a una curva (componente cuadrtico).
Pero como existe ms de un componente significativo se elige el de mayor orden (modelo lineal) (mayor
valor de F, y mejor significacin). El grafico del perfil siguiente nos ayuda a comprender con ms claridad lo
que est ocurriendo.
C aptulo 9 Pgina 961

Pruebas Post Hoc Anova apareado

TIEMPOS INICIO 1 AO 2 AO 3 AO
INICIO Ho = Ho = Ho =
Ha Ha Ha
1 AO Ho = Ho =
Ha Ha
2 AO Ho =
Ha
3 AO
C aptulo 9 Pgina 962

Procedimiento de Bonferroni: Comparacin por pares

Tiempo (I) Tiempo (J) Diferencias de Error estndar Significacin


medias (I J)
Inicio 1 ao 3,533 0,417 0,000
2 ao 6,167 0,407 0,000
3 ao 7,500 0,544 0,000
1 ao Inicio - 3,533 0,417 0,000
2 ao 2,633 0,405 0,000
3 ao 3,967 0,531 0,000
2 ao Inicio - 6,167 0,401 0,000
1 ao - 2,633 0,405 0,000
3 ao 1,333 0,440 0,031
3 ao Inicio - 7,500 0,544 0,000
1 ao - 3,9967 0,531 0,000
2 ao - 1,333 0,440 0,031
C aptulo 9 Pgina 963

Relacin entre las glucemias medias, la hemoglobina


glicosilada y el riesgo de aparicin de complicaciones
de la diabetes

GLUCEMIAS MEDIAS HbA1c (%) RIESGO DE COMPLICACIONES

60 4
90 5 RIESGO BAJO
120 6
150 7
RIESGO MODERADO (control aceptable hasta 7,5%)
180 8
210 9 RIESGO AUMENTADO
240 10 RIESGO ALTO
270 11
MAL CONTROL
METABLICO
300 12
RIESGO CRTICO (> 9,5%)
330 13
360 14
C aptulo 9 Pgina 964

Objetivo: Conocer si el curso de educacin diabetolgica mejora el control


metablico de un grupo de pacientes diabticos mal controlados (HbA1c > 8,0).

Material: Grupo de 30 individuos antes y despus de un programa de


educacin para el control diabtico (ECD).

Mtodo: Se evala la hemoglobina glicosilada antes (HbA1cPRE) y despus


del ECD (HbA1cPOST).

Se define una nueva variable HbA1cDIF = HbA1cPRE HbA1cPOST.

Hiptesis nula Ho X antes = X despus


( DIF = HbA1cPRE HbA1cPOST = 0)

Hiptesis alternativa H1 X antes X despus


(DIF = HbA1cPRE HbA1cPOST 0)
C aptulo 9 Pgina 965

El curso de educacin diabetolgica (ECD) mejora el con-


trol diabtico de un grupo de pacientes mal controlados
(HbA1c > 8,0)?

Diabetes = Educacin

HbA1c ANTES HbA1c DESPUS

Cul es la prueba estadstica ms adecuada?


C aptulo 9 Pgina 966

Resultados 1 objetivo

HbA1c N Media DE 1 EE1 2 EE2


INICIAL (PRE) 30 10,150 1,77 0,745 0,427 - 0,516 0,833
PRIMER AO (POST) 30 7,130 0,932 1,408 0,427 2,619 0,833

HbA1c Test de Kolmogorov-Smirnov


N Estadstico Z Significacin
INICIAL (PRE) 30 0,827 0,501
PRIMER AO 30 1,034 0,235

Experimento diseado con dos objetivos:


1. Se evala el control metablico con los niveles de HbA1c antes y despus (al ao) de la imparticin de un
curso intensivo de educacin diabetolgica a un grupo de 30 pacientes mal controlados (HbA1c > 8) para
comprobar si el curso ha sido til en la mejora del control glucmico a CORTO plazo.

2. Estudiar el efecto del paso del tiempo (LARGO plazo) sobre el control metablico tras la realizacin de
un curso de educacin diabetolgica en un grupo de 30 pacientes con diabetes mal controlada (HbA1c > 8),
realizando controles sucesivamente cada ao (2, 3 y 4 ao). Se quiere valorar si es necesario un nuevo
curso y con que frecuencia debera realizarse.
C aptulo 9 Pgina 967

Resultados 1 objetivo

Variables Media N Desviacin Error estndar de


estndar (s) la media (EEM)
HbA1cPRE 10,150 30 1,772 0,323
HbA1cPOST 7,130 30 0,932 0,170

Variable N Correlacin (r) Significacin


HbA1cPRE versus HbA1cPOST 30 0,772 0,000

Variables Diferencias relacionadas Intervalo de t calculada gl Significacin


confianza de la bilateral
diferencia
Media s EEM Inferior Superior 13,692 29 0,000
HbA1cPRE 3,020 1,208 0,2206 2,569 3,471
HbA1cPOST

t calculada < t tabulada p>0,05 (aceptamos la Ho)

t calculada > t tabulada p<0,05 (rechazamos la hiptesis nula)


C aptulo 9 Pgina 968

Resultados 2 objetivo

HbA1c N Media DE 1 EE1 2 EE2


PRIMER AO 30 7,130 0,932 1,408 0,427 2,619 0,833
SEGUNDO AO 30 7,207 0,835 1,110 0,427 1,805 0,833
TERCER AO 30 7,707 0,712 1,056 0,427 0,998 0,833
CUARTO AO 30 9,050 0,910 0,652 0,427 - 0,084 0,833

HbA1c Test de Kolmogorov-Smirnov


N Estadstico Z Significacin
PRIMER AO 30 1,034 0,235
SEGUNDO AO 30 0,901 0,392
TERCER AO 30 0,990 0,281
CUARTO AO 30 0,737 0,649

2. Estudiar el efecto del paso del tiempo (LARGO plazo) sobre el control metablico tras la realizacin de
un curso de educacin diabetolgica en un grupo de 30 pacientes con diabetes mal controlada (HbA1c > 8),
realizando controles sucesivamente cada ao (2, 3 y 4 ao). Se quiera valorar si es necesario un nuevo
curso y con que frecuencia debera realizarse.
C aptulo 9 Pgina 969

Prueba de la homogeneidad de las varianzas


Prueba de la esfericidad de Mauchly
Efecto intra-sujetos Prueba de esfericidad de Mauchly
W de Mauchly Chi cuadrado g.l Significacin
HbA1c 0,368 27,717 5 0,000

Para el ANOVA de medidas repetidas es conveniente que las varianzas de las diferencias entre cada
dos niveles del factor TIEMPO son iguales. Con los 4 niveles, tenemos 6 pares de combinaciones dos
a dos entre niveles; 1ao-2ao, 1 ao-3ao, 1ao-4ao, 2ao-3ao, 2ao-4ao, 3ao- 4ao.
Calculando las diferencias entre las puntuaciones de esos 6 pares, tendremos 6 nuevas variables. Este
supuesto equivale a afirmar que la matriz de varianzas es circular o esfrico. Para el procedimiento de
medidas repetidas esto se realiza con la prueba de esfericidad de MAUCHLY. Puesto que la significacin
estadstica asociada al estadstico W de Mauchly es p < 0,001, (MENOR de 0,05), podemos rechazar la
hiptesis nula de esfericidad.

NO HAY ESFERICIDAD.
C aptulo 9 Pgina 970

Prueba de la esfericidad de Mauchly


Efecto intra-sujetos Epsilon
Greenhous e-Geisser Hunh-Feldt Lmite-interior
TIEMPO 0,654 0,701 0,333

Cuando el estadstico W de Mauchly nos lleve al rechazo de la esfericidad (NO ESFERICIDAD), podemos
basar nuestra decisin en los estadsticos F MULTIVARIADOS que no les afecta la falta de esfericidad, o
bien podemos utilizar el estadstico F UNIVARIADO corregido aplicando el ndice corrector EPSILON.

El ndice corrector EPSILON expresa el grado en que la matriz de varianzas-covarianzas se aleja de la


esfericidad. En condiciones de esfericidad perfecta, psilon vale 1. Cuanto menor es psilon menor es la
esfericidad.

Existen 3 estimaciones del ndice psilon, Greenhous e-Geisser es la ms conservadora. El lmite inferior
expresa el valor que adoptara psilon en caso de incumplimiento extremo de la esfericidad. El valor de
EPSILON se utiliza para corregir el valor del F UNIVARIADO cuando no se cumple la esfericidad.
C aptulo 9 Pgina 971

TIEMPO Contrastes UNIVARIADOS: Prueba de efectos INTRA-SUJETOS


Suma de cuadrados gl Media cuadrtica F Significacin
tipo III
Esfericidad asumida 71,079 3 23,693 238,282 0,000
Greenhouse-Geisser 71,079 1,961 36,238 238,282 0,000
Huynh-Feldt 71,079 2,102 33,810 238,282 0,000
Lmite-inferior 71,079 1,000 71,079 238,282 0,000

Si se cumple la ESFERICIDAD es preferible utilizar la aproximacin UNIVARIADA (versin esfericidad


asumida), pues en condiciones de esfericidad el estadstico F UNIVARIADO es ms potente que los
estadsticos MULTIVARIADOS, sobre todo con muestras pequeas.

Si NO se cumple la ESFERICIDAD es preferible utilizar los estadsticos F MULTIVARIADOS (como en este


caso).
C aptulo 9 Pgina 972

Comparacin de > de 2 grupos apareados

Test de Kolmogorov-Smirnov
p > 0,05; Normalidad

Prueba de la esfericidad de Mauchly


p > 0,05 p < 0,05
ESFERICIDAD NO ESFERICIDAD

Contrastes UNIVARIADOS Contrastes MULTIVARIADOS

p < 0,05 p < 0,05

POST HOC: Procedimiento de BONFERRONI: Comparacin por pares


C aptulo 9 Pgina 973

TIEMPO Contrastes MULTIVARIADOS


Valor F GI de la hiptesis GI del error Significacin
Traza de Pillai 0,931 120,741 3 27 0,000
Lambda de Wilks 0,069 120,741 3 27 0,000
Traza de Hotelling 13,416 120,741 3 27 0,000
Raz mayor de Roy 13,416 120,741 3 27 0,000

La tabla contiene 4 estadsticos multivariados: Traza de Pillai, Lambda de Wilks, Traza de Hotelling, Raz
mayor de Roy. Se interpretan de la misma forma que todos los estadsticos ya estudiados; puesto que la
significacin de cada uno de ellos (p = 0,000) es menor que 0,05, podemos rechazar la hiptesis nula de
igualdad de las medias y concluir que el control metablico debido a la educacin del diabtico por el curso
no es el mismo en los 4 momentos temporales definidos en el factor tiempo.

Ha: el control metablico debido a la educacin del diabtico por el curso


no es la misma en los 4 momentos temporales definidos en el factor
tiempo.
C aptulo 9 Pgina 974

TIEMPO MEDIAS MARGINALES ESTIMADAS


Media Error tpico Lmite inferior del IC95% Lmite inferior del IC95%
1 ao 7,130 0,170 6,782 7,478
2 ao 7,207 0,152 6,895 7,518
3 ao 7,707 0,130 7,441 7,973
4 ao 9,050 0,166 8,710 9,390

Se observa en la tabla que la media de la hemoglobina glicosilada va aumentando paulatinamente con el


paso del TIEMPO.

Este aumento es estadsticamente significativo en cada uno de los


estratos?
C aptulo 9 Pgina 975

Grfico de perfil representando el efecto del factor


tiempo
9,5
Se observa en el grfico que la HbA1c
va aumentando con el paso del TIEMPO,
9,0 siendo este aumento significativo (p < 0,05) al
pasar del 2 ao al 3 ao, y del 3 al 4 ao.
Medidas marginales estimadas

8,5

8,0

7,5

7,0

1 ao 2 ao 3 ao 4 ao
TIEMPO

Qu test has utilizado para llegar a esa conclusin?


C aptulo 9 Pgina 976

Procedimiento de Bonferroni: Comparacin por pares

Tiempo (I) Tiempo (J) Diferencias de Error estndar Significacin


medias (I J)
1 ao 2 ao - 0,077 0,041 0,425
3 ao 0,577 0,070 0,000
4 ao - 1,920 0,098 0,000
2 ao 1 ao 0,077 0,041 0,425
3 ao - 0,500 0,068 0,000
4 ao - 1,843 0,104 0,000
3 ao 1 ao 0,577 0,070 0,000
2 ao 0,500 0,068 0,000
4 ao - 1,343 0,090 0,000
4 ao 1 ao 1,920 0,098 0,000
2 ao 1,843 0,104 0,000
3 ao 1,343 0,090 0,000
C aptulo 9 Pgina 977

Cualitativa policotmica versus cuantitativa

PARAMTRICOS NO PARAMTRICOS
2 GRUPOS

Anlisis de la Varianza Kruskal-Wallis


Independientes para muestras indepen-
dientes

Anlisis de la Varianza Friedman


Aparejados para muestras depen-
dientes o apareadas

Variable predictora Cualitativa versus variable resultado Cuantitativa.


C aptulo 9 Pgina 978

Existen diferencias en el tiempo de reaccin frente a los 3


frmacos ensayados?

RESPUESTA A
A Tiempo A

RESPUESTA B
B Tiempo B

RESPUESTA C
C Tiempo C

Cul es el test estadstico ms adecuado?


C aptulo 9 Pgina 979

Test de Friedman
- Es la versin NO PARAMTRICA del ANOVA para muestras apareadas.

- Utiliza la modificacin estadstica de Iman & Davenport (1980) que lo hace


menos conservador.

- El valor de z de cada hiptesis se puede utilizar para calcular la probabilidad


de error (valor p) mediante la distribucin normal.

- Se cumplen las condiciones impuestas por el test ANOVA?


SI: Utilizar ANOVA
NO: Utilizar el test de FRIEDMAN
C aptulo 9 Pgina 980

Se ha medido el tiempo de la reaccin farmacolgica de 10 pacientes a 3


medicamentos diferentes.

Paciente Frmaco A Frmaco B Frmaco C


1 10 10 15
2 10 15 20
3 11 15 12
4 8 12 10
5 7 12 9
6 15 10 15
7 14 12 18
8 10 14 17
9 9 9 12
10 10 14 16

Ho: No existen diferencias entre los tiempos de reaccin frente a los 3 frmacos.

Ha: Existen diferencias entre los tiempos de reaccin frente a los 3 frmacos.
C aptulo 9 Pgina 981

Test de Friedman

Estadstica descriptiva
Tratamiento N Mean Standars Desviation Minimum Maximum
Frmaco A 10 10,40 2,458 7,00 15,00
Frmaco B 10 12,30 2,162 9,00 15,00
Frmaco C 10 14,40 3,565 8,00 20,00

Ranks Friedman test Statistics


Tratamiento Promedio de rangos N 10
Frmaco A 1,35 Chi cuadrado 9,135
Frmaco B 2,00 gl (K 1) 2
Frmaco C 2,65 Significacin 0,010

Ha: Existen diferencias entre los tiempos de reaccin frente a los 3 frmacos.
C aptulo 9 Pgina 982

Coeficiente de concordancia W de Kendall


- Mide le grado de concordancia entre un grupo de elementos y un grupo
de caractersticas.

- Si la concordancia es mxima W=1, si la concordancia es mnima W=0.

S
W=
1/12 K2 (N3 N) K Li

Donde:
w = coeficiente de concordancia de Kendall.
S = suma de los cuadrados de las diferencias observadas con respecto a un promedio.
N = Tamao de la muestra en funcin del nmero de tripletes, tetrapletes, quintupletes, etc.
K = nmero de variables incluidas.
Li = sumatoria de las ligas o empates entre los rangos.
C aptulo 9 Pgina 983

Coeficiente de concordancia W de Kendall


- El coeficiente W de Kendall y el estadstico 2 de Friedman son
aplicables al mismo tipo de situaciones.

- La hiptesis nula de que los tratamientos aplicados son iguales en su


efectividad es exactamente lo mismo que mantener la hiptesis nula
de ausencia de concordancia en los resultados de los tratamientos
ensayados.
C aptulo 9 Pgina 984

Existen diferencias en la medida de la frecuencia cardaca


en los tres mdicos evaluados?
Mdico JEFE SERVICIO

A MEDIDA A
FC A
10 PACIENTES
Mdico RESIDENTE
MEDIDA B
B FC B

Mdico ADJUNTO MEDIDA C


FC C
C

Cul es el test estadstico ms adecuado?


C aptulo 9 Pgina 985

Comparacin de las mediciones consecutivas de la FRECUENCIA CARDACA en


pulsaciones por minuto (ppm) en 10 pacientes realizada por tres mdicos diferentes: un
mdico A, jefe del servicio, un mdico B en periodo de formacin, y un mdico C adjunto
del mismo departamento.

Pacientes Mdico JEFE Medico Mdico ADJUNTO (C)


SERVICIO (A) RESIDENTE (B)
1 75 80 74
2 74 84 72
3 76 81 75
4 79 83 80
5 82 92 84
6 83 88 82
7 85 90 84
8 87 92 86
9 87 92 88
10 88 93 88
Media 81,6 87,5 81,3
DE 5,3 5,04 5,85
C aptulo 9 Pgina 986

Test de Friedman

Estadsticos descriptivos
Mdico N Media Desviacin estndar Mnimo Mximo
JEFE A 10 81,6 5,23 74 88
RESIDENTE B 10 87,5 5,04 80 93
ADJUNTO C 10 81,3 5,85 72 88

Rangos Estadstico de contraste prueba de Friedman


Promedio de rangos N 10
JEFE A 1,35 Chi cuadrado 15,846
RESIDENTE B 2,00 gl (K 1) 2
ADJUNTO C 2,65 Significacin 0,000

Ha: Existen diferencias entre la medida de la frecuencia cardiaca en los tres mdicos.
C aptulo 9 Pgina 987

Coeficiente de concordancia W de Kendall

Rangos Estadstico de contraste prueba de Kendall


Promedio de rangos N 10
JEFE A 1,35 W de Kendall (*) 0,792
RESIDENTE B 2,00 Chi cuadrado 15,846
ADJUNTO C 2,65 gl (K 1) 2
Significacin 0,000

(*) Coeficiente de concordancia de Kendall

Ha: Existen diferencias entre la medida de la frecuencia cardiaca en los tres mdicos.
C aptulo 9 Pgina 988

Experimento diseado para estudiar el efecto del paso del tiempo sobre la calidad del
recuerdo y realizacin prctica de estudios con aplicacin de la estadstica de los 10
alumnos que han realizado el curso de BIOESTADSTICA APLICADA A LAS CIENCIAS
DE LA SALUD. Se evala el grado de conocimientos con el mismo examen de 20
preguntas tipo test en 4 momentos diferentes; inmediatamente despus de finalizar el
curso, al ao, a los 2 aos, y a los 3 aos del curso.

La calidad y cantidad del recuerdo de los conocimientos sobre bioestadstica


es la misma en los 4 momentos considerados?
C aptulo 9 Pgina 989

Respuestas acertadas en funcin del tiempo transcurrido desde la realizacin del curso
Alumnos Tiempo 0 1 ao 2 ao 3 ao
1 16 8 8 12
2 12 9 9 10
3 12 10 10 8
4 15 13 7 11
5 18 12 12 12
6 13 13 8 10
7 18 16 10 13
8 15 9 6 6
9 20 9 11 8
10 14 12 11 9

Cul es el test estadstico ms adecuado?


C aptulo 9 Pgina 990

Test de Friedman

Estadsticos descriptivos
Tiempo N Media Desviacin estndar Mnimo Mximo
INICIO 10 15,30 2,710 12 20
1 AO 10 11,10 2,514 8 16
2 AO 10 9,20 1,932 6 12
3 AO 10 9,90 2,183 6 13

Rangos Estadstico de contraste prueba de Friedman


Rango promedio N 10
INICIO 3,95 Chi cuadrado 20,868
1 AO 2,50 gl (K 1) 3
2 AO 1,70 Significacin 0,000
3 AO 1,85

Ha: la calidad del recuerdo de los conocimientos no es la misma en los 4 momentos


considerados.
C aptulo 9 Pgina 991

Coeficiente de concordancia W de Kendall

Rangos Estadstico de contraste prueba de Kendall


Rango promedio N 10
INICIO 3,95 W de Kendall (*) 0,698
1 AO 2,50 Chi cuadrado 20,868
2 AO 1,70 gl (K 1) 3
3 AO 1,85 Significacin 0,000

(*) Coeficiente de concordancia de Kendall

Ha: La calidad del recuerdo de los conocimientos no es la misma en los 4 momentos


considerados
C aptulo 10 Pgina 992

Captulo 10

Publicacin Bioestadstica: Medidas de concordancia.


Variables cualitativas.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 10 Pgina 993

Medidas de concordancia

- Fiabilidad de los procedimientos de medida empleados.

- Fleis: ni el ms elegante de los diseos seria capaz de paliar el dao


causado por un sistema de medida poco fiable.

- Error de medida: Variabilidad entre observadores.

- Estudios de fiabilidad.
- Sesgo entre observadores.
- Concordancia entre observadores.

- Indicadores del grado de variabilidad.


- Coeficiente de correlacin intraclase (variables cuantitativas).
- ndice de Kappa (variables cualitativas tipo categricos).
C aptulo 10 Pgina 994

Valoracin de la fiabilidad externa de las publicaciones de dos revistas


cientficas durante el ltimo quinquenio.

En 5 (4 de JAMA y uno de MC) de los 12 artculos se han llevado a


cabo tratamientos estadsticos no idneos para medir la concordancia,
mediante las siguientes pruebas de contraste de hiptesis:
- Comparacin de medias con la t de Student
- Test exacto de Fisher,
- Test de chi-cuadrado 2
- Anlisis de la varianza (ANOVA)
- Test de Wilcoxon
- Coeficiente de Spearman

Med Clin (Barc) 2003; 121 (20): 793-8


C aptulo 10 Pgina 995

Anlisis de concordancia: Variables Cualitativas

- ndice kappa de Cohen (2 observadores)


- ndice kappa de Fleiss (> 2 observadores)
- ndice kappa ponderado
- Prueba de homogeneidad de kappas
C aptulo 10 Pgina 996

ndice kappa de Cohen (medida dicotmica)

OBSERVADOR A OBSERVADOR B TOTAL


( 1 medicin) ( 2 medicin)
Anormal (+) Normal (-)
Anormal (+) a b a+b

Normal (-) c d c+d

Total a+c b+d N

Statistical methods for rates and proportions. Joseph L. Fleis. Ed.John Wiley New York 1981.
C aptulo 10 Pgina 997

Dos radilogos del programa de tuberculosis se les remiten radiografas de trax de 170
sujetos que estn controlados en una unidad de neumologa, y que se quiere estimar
el grado de concordancia entre ellos. Los radilogos A y B tienen que clasificar cada
radiografa en una de dos categoras:
(+) positiva (sospechosa de lesin tuberculosa).
(-) negativa (no sospechosa de lesin tuberculosa).

RADILOGO A RADILOGO B TOTAL


Anormal (+) Normal (-)
Anormal (+) 58 39 97
Normal (-) 12 61 73
Total 70 100 170

k = 0,415 IC95% = 0,2862 0,5430


C aptulo 10 Pgina 998

Cul es el grado de concordancia encontrado?

Medida de acuerdo Valor de Kappa EEk Z Significacin


Kappa de Cohen + 0,415 0,0655 5,688 0,000
N de casos vlidos 200

Junto al ndice kappa aparece su error estndar EEk y el valor del


estadstico Z.

Puesto que el valor de p es muy pequeo (<0,001) podemos rechazar la


hiptesis nula y concluir que existe un ACUERDO significativamente ms
alto que el esperado por el azar.

Cmo se clasifica el grado de concordancia encontrado?


C aptulo 10 Pgina 999

ndice kappa de Cohen


k = 0 cuando la concordancia observada po es la que se esperada a causa del azar pe
k > 0 cuando la concordancia observada po es mayor de la esperada slo por el azar pe

Valoracin del ndice Kappa


Valor de k Fuerza de concordancia
< 0,20 Pobre
0,21 0,40 Dbil
0,41 0,60 Moderada
0,61 0,80 Buena
0,81 1,00 Muy buena

Con los datos de la tabla se obtiene aplicando esta frmula un valor de k = 0,415 (IC95%:
0,2862 0,5430), que segn la clasificacin anterior calificaramos como una MODERADA
concordancia.
C aptulo 10 Pgina 1000

Pregunta de investigacin
Tienen los dos radilogos de mi servicio el mismo
criterio-juicio clnico para informar las radiografas?
Radilogo 2
Radilogo 1 Anormal Dudosa Normal

Anormal 18 4 3
Dudosa 1 10 5
Normal 2 4 53

Se enfrenta ambos radilogos a la tarea de categorizar una misma muestra


de 100 radiografas mediante la escala: anormal, dudosa, normal.

Cul es el test estadstico ms acertado?

Lpez de Ullibarri Galparsoro I, Pita Fernndez S. Medidas de concordancia: el ndice Kappa. Cad Aten
Primaria 1999; 6: 169-171.
C aptulo 10 Pgina 1001

ndice kappa de Fleiss

Medida de acuerdo Valor de Kappa EEk T aprox Significacin


Kappa de Fleiss + 0,660 0,044 8,944 0,000
N de casos vlidos 100

Coeficiente Gamma

Gamma EEk T aprox p


0,899 0,044 8,744 0,000
N de casos vlidos 100

Cmo se clasifica el grado de concordancia encontrado?


C aptulo 10 Pgina 1002

ndice kappa de Fleiss


k = 0 cuando la concordancia observada po es la que se esperada a causa del azar pe
k > 0 cuando la concordancia observada po es mayor de la esperada slo por el azar pe

Valoracin del ndice Kappa


Valor de k Fuerza de concordancia
< 0,20 Pobre
0,21 0,40 Dbil
0,41 0,60 Moderada
0,61 0,80 Buena
0,81 1,00 Muy buena

Con los datos de la tabla se obtiene aplicando esta frmula un valor de k = 0,660
(IC95%: 0,527-0,793), que segn la clasificacin anterior calificaramos como una buena
concordancia.
C aptulo 10 Pgina 1003

Pregunta de investigacin
Tienen los dos psiquiatras de mi servicio el mismo criterio-
juicio clnico al diagnosticar una muestra de 200 pacientes?

Psiquiatra 2
Psiquiatra 1 Fbica Histrica Obsesiva Depresiva
Fbica 20 8 6 1
Histrica 7 36 14 4
Obsesiva 1 8 43 7
Depresiva 2 6 4 33

Cul es el test estadstico ms acertado?


C aptulo 10 Pgina 1004

Medida de acuerdo Valor de Kappa EEk T aprox Significacin


Kappa de Fleiss + 0,538 0,046 12,921 0,000
N de casos vlidos 200

Junto al ndice kappa aparece su valor estandarizado (T aproximada),


resultado similar al resultante de dividir el valor de kappa por su error
estndar (EEk) (11,69).

Puesto que el valor de p es muy pequeo (<0,001) podemos rechazar la


hiptesis nula y concluir que existe un ACUERDO significativamente ms
alto que el esperado por el azar.

Cmo se clasifica el grado de concordancia encontrado?


C aptulo 10 Pgina 1005

ndice kappa de Fleiss


k = 0 cuando la concordancia observada po es la que se esperada a causa del azar pe
k > 0 cuando la concordancia observada po es mayor de la esperada slo por el azar pe

Valoracin del ndice Kappa


Valor de k Fuerza de concordancia
< 0,20 Pobre
0,21 0,40 Dbil
0,41 0,60 Moderada
0,61 0,80 Buena
0,81 1,00 Muy buena

Con los datos de la tabla se obtiene aplicando esta frmula un valor de k = 0,538, que
segn la clasificacin anterior calificaramos como una MODERADA concordancia.
C aptulo 10 Pgina 1006

Pregunta de investigacin
Podemos sustituir el diabur-test por el clinitest para la medida
de la glucosuria?

Clinitest Diabur-test 5000

Cul es el test estadstico ms acertado?

Banauch D, Koller PU, Bablok W. Evaluation of Diabur-Test 5000: a cooperative study carried out at 12
diabetes centers. Diabetes Care 1983; 6(3): 213-18.
C aptulo 10 Pgina 1007

Pregunta de investigacin
Se desea estimar la concordancia entre dos pruebas diagnsticas
de diabetes, el Diabur-Test5000 y el Clinitest en 1677 muestras
de orina. Calcula el valor de kappa sin ponderar y ponderado por
pesos cuadrticos.

Diabur-test 5000
Clinitest Negativo Trazas + ++ +++ ++++
Negativo 452 5
Trazas 133 270 28 1 2
+ 4 36 107 5 2 2
++ 5 53 76 2 4
+++ 12 28 81 35
++++ 2 11 44 251

ndice kappa Ponderado


C aptulo 10 Pgina 1008

Kappa ponderado. Si las categoras de clasificacin son ms de dos y estn definidas


en una escala ordinal, como por ejemplo sano, posiblemente enfermo y claramente
enfermo. A la hora de valorar el grado de discrepancia entre dos observadores, no es lo
mismo que uno clasifique a un sujeto como posiblemente enfermo y el otro lo declare
sano a que uno lo clasifique como sano y el otro como claramente enfermo. La
distancia entre ambas discrepancias no es la misma.
Cuando ciertos tipos de desacuerdo son ms acusados que otros, al investigador le puede
interesar tenerlo en cuenta en la construccin del ndice kappa. Para ello, se PONDERA
las diferentes discrepancias, usando una matriz de pesos que pueden variar segn el
criterio del investigador en funcin de lo que est analizando, aunque siempre cumpliendo
ciertas restricciones:
1. La matriz debe ser simtrica;
2. La diagonal de acuerdos se le asigna el mximo peso, que es 1 y el resto de pesos
deben ser inferiores, aunque siempre positivos o iguales a cero.
C aptulo 10 Pgina 1009

Medida de acuerdo Valor de Kappa EEk Z Significacin


Kappa NO ponderado + 0,6706 0,013 57,098 0,0000
N de casos vlidos 1677 IC95%: 0,6450 0,6961

Medida de acuerdo Valor


Acuerdo observado + 0,7376
Acuerdo esperado + 0,2035

Medida de acuerdo Valor de Kappa EEk Z Significacin


Kappa ponderado + 0,9491 0,0033 38,982 0,0000
N de casos vlidos 1677 IC95%: 0,9427 0,9555

Medida de acuerdo Valor


Acuerdo observado + 0,9856
Acuerdo esperado + 0,7165
C aptulo 10 Pgina 1010

Variabilidad en datos clnicos


Grado de acuerdo interobservador

Variables Acuerdo preadiestramiento Valor


(CCI / Kappa) Acuerdo postadiestramiento + 0,9856
(CCI / Kappa) + 0,7165 + 0,7165
Afectacin simtrica 0.14 0.79
Clase funcional -0.08 0.65
Numero criterios diagnsticos 0.02 0.93
Sexo 1 1
Anticuerpos antinucleares 0.62 0.84
Valor mximo VSG 0.70 0.99

A. Gmez de la Cmara et al. Med Clin (Barc) 1997; 108:377-381


C aptulo 10 Pgina 1011

Limitaciones del estadstico Kappa

- El valor de kappa se ve afectado por la prevalencia del rasgo estudiado. Por tanto,
es necesario ser cuidadoso a la hora de generalizar los resultados de comparacin de
observadores en situaciones con prevalencias diferentes; esto quiere decir que kappa es
un estadstico descriptivo til, pero es inadecuado con fines de prediccin o inferencia.

- Kappa es dependiente del nmero de categoras. Cuantas ms categoras se estn


considerando, ms difcil ser clasificar correctamente los sujetos de observacin, lo que
implica valores de kappa ms bajos. Por tanto, debe tenerse en cuenta el nmero de
categoras a la hora de interpretar kappa.

- Para datos ordinales derivados de categorizar variables continuas, kappa depende


fuertemente las definiciones arbitrarias que se hacen de las categoras.
C aptulo 10 Pgina 1012

Se desea evaluar los conocimientos prcticos adquiridos por los residentes de


microbiologa a su paso por el departamento de micobacterias. Para ello se mide
la concordancia con el Especialista adjunto mediante la evaluacin conjunta de un
determinado nmero de tinciones de Ziehl Neelsen. Se desea estimar el grado de
concordancia de cada residente con el adjunto, y si el grado de adiestramiento ha
sido el mismo en los 4 residentes que han rotado por el departamento.

RESIDENTE ADJUNTO

Cul es el test estadstico ms acertado?


C aptulo 10 Pgina 1013

Prueba de homogeneidad de las kappas

Hiptesis nula: k1 = k2 = k3 = = kn

Hiptesis alternativa: al menos una de las kappas kx es distinta

Comparacin de kappas: Distribucin de 2 de Pearson

Hiptesis nula Ho: Igualdad de las kappas comparadas. El grado de


aprendizaje no varia entre los distintos residentes.
Hiptesis alternativa Ha: Desigualdad de las kappas comparadas. El grado de
aprendizaje varia entre los distintos residentes. Existe al menos una kappa
diferente al resto.
C aptulo 10 Pgina 1014

RESIDENTE R1 ADJUNTO TOTAL


Anormal (+) Anormal (-)
Anormal (+) 320 30 350
Dudosa (-) 120 29 149
Total 440 59 499

P = 72,7%

Kappa EEk IC95% T aprox p


0,132 0,043 0,048 0,215 3.448 0,001

Gamma (Q de Yule) EEk T aprox p


0,441 0,113 3,027 0,002
C aptulo 10 Pgina 1015

RESIDENTE R2 ADJUNTO TOTAL


Anormal (+) Anormal (-)
Anormal (+) 890 210 1100
Dudosa (-) 290 700 990
Total 1180 59 2090

P = 75,4%

Kappa EEk IC95% T aprox p


0,518 0,019 0,481 0,555 23,764 0,000

Gamma (Q de Yule) EEk T aprox p


0,822 0,017 27,549 0,000
C aptulo 10 Pgina 1016

RESIDENTE R3 ADJUNTO TOTAL


Anormal (+) Anormal (-)
Anormal (+) 350 120 470
Dudosa (-) 70 550 620
Total 420 670 1090

P = 83,3%

Kappa EEk IC95% T aprox p


0,640 0,024 0,593 0,686 21,226 0,000

Gamma (Q de Yule) EEk T aprox p


0,916 0,013 25,914 0,000
C aptulo 10 Pgina 1017

RESIDENTE R4 ADJUNTO TOTAL


Anormal (+) Anormal (-)
Anormal (+) 280 80 360
Dudosa (-) 60 550 610
Total 340 630 970

P = 82,3%

Kappa EEk IC95% T aprox p


0,687 0,024 0,639 0,735 21,425 0,000

Gamma (Q de Yule) EEk T aprox p


0,940 0,011 24,63 0,000
C aptulo 10 Pgina 1018

Comparacin de kappas

Nmero de Kappas a comparar Nivel de confianza


4 95%

Kappa global IC95%


0,687 0,5379 0,5855

Prueba de la homogeneidad de kappas


Chi cuadrado gl Valor p
143,0515 3 0,0000

Hiptesis alternativa Ha: Desigualdad de las kappas comparadas. El grado de aprendizaje varia entre los
distintos residentes. Existe al menos una kappa diferente al resto.
C aptulo 10 Pgina 1019

Comparacin de kappas: Distribucin de 2 de Pearson

Grados de libertad = [ K - 1] [F - 1] = (2-1) (4 -1) = 3

2Pearson calculado = 143,05 > 2Pearson tabulado = 7,81

2 = 143,05 AZAR

Ho
Ha
7,81
AZAR

Hiptesis alternativa Ha: Desigualdad de las kappas comparadas. El grado de aprendizaje varia entre los
distintos residentes. Existe al menos una kappa diferente al resto.
C aptulo 10 Pgina 1020

Mito 1: La sonrisa de la esfinge

El valor de kappa se ve afectado por la prevalencia del rasgo estudiado. Por tanto, es
necesario ser cuidadoso a la hora de generalizar los resultados de comparacin de
observadores en situaciones con prevalencias diferentes; esto quiere decir que kappa es
un estadstico descriptivo til, pero es inadecuado con fines de prediccin o inferencia.

La prevalencia (porcentaje de tinciones positivas valoradas) es la misma en la evaluacin


de los 4 residentes comparados?

Si no son iguales NO podemos comparar los ndices kappa.

Gardner PL. Measuring attitudes to science: Unidimensionality and internal consistency revisited. Research
in Science Education 1995; 25: 283-9.
C aptulo 11 Pgina 1021

Captulo 11

Publicacin Bioestadstica: Medidas de concordancia.


Variables cuantitativas.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 11 Pgina 1022

Medidas de concordancia

- Fiabilidad de los procedimientos de medida empleados.

- Fleis: ni el ms elegante de los diseos seria capaz de paliar el dao


causado por un sistema de medida poco fiable.

- Error de medida: Variabilidad entre observadores.

- Estudios de fiabilidad.
- Sesgo entre observadores.
- Concordancia entre observadores.

- Indicadores del grado de variabilidad.


- Coeficiente de correlacin intraclase (variables cuantitativas).
- ndice de Kappa (variables cualitativas tipo categricos).
C aptulo 11 Pgina 1023

Valoracin de la fiabilidad externa de las publicaciones de dos revistas


cientficas durante el ltimo quinquenio.

En 5 (4 de JAMA y uno de MC) de los 12 artculos se han llevado a


cabo tratamientos estadsticos no idneos para medir la concordancia,
mediante las siguientes pruebas de contraste de hiptesis:
- Comparacin de medias con la t de Student
- Test exacto de Fisher,
- Test de chi-cuadrado 2
- Anlisis de la varianza (ANOVA)
- Test de Wilcoxon
- Coeficiente de Spearman

Med Clin (Barc) 2003; 121 (20): 793-8.


C aptulo 11 Pgina 1024

Evaluacin de mtodos diagnsticos cuantitativos

- Variacin metrolgica.
Errores aleatorios.
Errores sistemticos.

- Comparacin de mtodos.
C aptulo 11 Pgina 1025

Evaluacin metrolgica

La evaluacin metrolgica de una prueba diagnstica CUANTITATIVA


persigue detectar los errores aleatorios y sistemticos que origina,
para cuantificarlos mediante clculos estadsticos y determinar si son
inferiores a los lmites permisibles que no comprometen a la utilizacin
clnica de los resultados.

Esta evaluacin nos permite conocer el error que cometemos en


nuestras condiciones de trabajo, y si el la prueba es adecuada para
nuestros fines o es necesario cambiarlo por otros mtodos.
C aptulo 11 Pgina 1026

INTRASERIAL

EXPERIMENTOS DE
ERRORES ALEATORIOS REPLICACIN

INTERSERIAL

EVALUACIN METROLGICA
EXPERIMENTOS DE
CONSTANTES REPLICACIN

ERRORES SISTEMTICOS
EXPERIMENTOS DE
PROPORCIONALES REPLICACIN
C aptulo 11 Pgina 1027

Variacin
SD
metrolgica
CVa = * 100
X
Error aleatorio

Error sistemtico

Inexactitud y imprecisin Exactitud y imprecisin


Inexactitud y precisin Exactitud y precisin
C aptulo 11 Pgina 1028

Especificaciones de la calidad para la imprecisin analtica

Prestacin ptima CVa < CVBw

Prestacin deseable CVa < CVBw

Prestacin mnima CVa < CVBw


C aptulo 11 Pgina 1029

Fuentes de variacin biolgica

- Variacin biolgica NO aleatoria


- A lo largo de la vida
- Ritmo biolgico diario
- Ciclos mensuales
- Ritmos estacionales
- Variacin biolgica aleatoria
- Variacin biolgica intra-individual (CVBw)
- Variacin biolgica inter-individual (CVBb)
C aptulo 11 Pgina 1030

Fuentes de variacin biolgica

Colesterol
Concentracin relativa

Urea

Fsforo

20 30 40 50 60 70

Edad en aos
C aptulo 11 Pgina 1031

Variacin de los niveles de Colesterol total


Distribucin por grupos socioculturales

Colesterol total (mg/dl)


185

175

165

155

145

135
CRISTIANOS MUSULMANES
125
1 1,5 2 3 4 5 6 7 8 9 10 11 12 13
EDAD (aos)
C aptulo 11 Pgina 1032

Ritmo biolgico circadiano

Cortisol nmol/L
600
GH
mU/L

GH

300
Cortisol

9:00 horas 24:00 Tiempo 9:00


C aptulo 11 Pgina 1033

Clculo de la variacin total (CVt)

Cuando se obtiene una sola muestra y esta es analizada una sola vez....

CVt = CVp2 + CVa2 + CVBw2

Variacin
Variacin Variacin
biolgica
preanaltica analtica
intraindividual
C aptulo 11 Pgina 1034

Si minimizamos la variabilidad preanaltica mediante protocolizacin, entrenamiento,


buenas prcticas de laboratorio y seguimiento de los procedimientos operativos descritos y
estandarizados....

CVt = CVa2 + CVBw2

Variacin Variacin
analtica biolgica
intraindividual
C aptulo 11 Pgina 1035

Variabilidad biolgica aleatoria

Lmite de referencia superior


Lmite de referencia superior

CVBw = 4,3

CVBb = 18,3
Creatinemia (mg/dl)

Creatinemia (mg/dl)
Mediana Punto
de ajuste
homeost
homeosttico
tico

Lmite de referencia inferior


Lmite de referencia inferior
C aptulo 11 Pgina 1036

CVBw
ndice de individualidad (II) =
CVBb

II < 0,6
II > 0,6

CVBw > CVBb CVBw < CVBb

Escasa individualidad Fuerte individualidad

Diagnstico Seguimiento

Intervalos de referencia poblacionales Diferencia crtica


C aptulo 11 Pgina 1037

DC = 2 * Z [CVBw2 + CVa2]

Cambio significativo con probabilidad del 95% (Z=1.96)

DC95 = 2,77 [CVBw2 + CVa2]

Cambio significativo con probabilidad del 99% (Z=2.58)

DC99 = 3,65 [CVBw2 + CVa2]


C aptulo 11 Pgina 1038

Varn de 63 aos con hipertensin y una concentracin de colesterol total de 254 mg/dl,
la cual tras modificar sus hbitos de vida (tratamiento diettico) cambi a 224 mg/dl.

Cunto ha cambiado la colesterolemia?

CT final - CT inicial
Variacin
porcentual = = - 11,8%
CT inicial

Ha cambiado significativamente la colesterolemia?


C aptulo 11 Pgina 1039

Interpretacin del cambio aplicando criterios basados en la


variabilidad biolgica
Variacin biolgica: de la teora a la prctica
Callum G. Fraser

Ninewells Hospital and medical School. Dundee. Scotland. 2001.


C aptulo 11 Pgina 1040

Ha cambiado significativamente la colesterolemia?

Cambio significativo con probabilidad del 95% (Z=1.96)(p<0,05)

DC95 = 2,77 [CVBw2 + CVa2] DC = 19%

Cambio significativo con probabilidad del 99% (Z=2.58)(p<0,01)

DC99 = 3,65 [CVBw2 + CVa2] DC = 24,5%


C aptulo 11 Pgina 1041

Probabilidad estadstica de cambio P(%) Z 99% (p<0,01)

95% (p<0,05)
90% (p<0,1)

82%

11,8% 15,6% 19% 24,5%

Dc Cambio en la colesterolemia (%)


C aptulo 11 Pgina 1042

Comparacin de mtodos
Diagnsticos cuantitativos

1. Mtodos analticos

2. Mtodos de regresin

3. Mtodos grficos
C aptulo 11 Pgina 1043

Comparacin de mtodos
Diagnsticos cuantitativos

- Se utiliza para demostrar que el nuevo mtodo (Y) presenta una buena
concordancia con el mtodo clsico de referencia (X).

- Demostrar que una misma medida tiene equivalencia con diferentes


equipos.

- Detectar la presencia de SESGOS (errores sistemticos):


- Error (sesgo) constante.
- Error (sesgo) proporcional.
C aptulo 11 Pgina 1044

Error (sesgo) constante

La diferencia entre
ambos mtodos se
Mtodo Y

mantiene constante a
lo largo del rango de
medidas

Mtodo X
C aptulo 11 Pgina 1045

Error (sesgo) proporcional

La diferencia entre
ambos mtodos se
Mtodo Y

lineal a lo largo de
todo el largo del rango
de medicin.

Mtodo X
C aptulo 11 Pgina 1046

Comparacin de mtodos diagnsticos cuantitativos

- Si los errores sistemticos detectados y medidos estn en un lmite aceptable,


la evaluacin se debe completar con un experimento de comparacin de
mtodos frente a los resultados obtenidos con un mtodo de referencia.

- La utilizacin de la estadstica en los experimentos de comparacin de mtodos


es la parte ms difcil del anlisis estadstico en los estudios de evaluacin de
mtodos.

- Qu mtodo estadstico es el que comete menos error para calcular el error


que comete un mtodo analtico?
C aptulo 11 Pgina 1047

Anlisis de concordancia: variables cuantitativas


Mtodos diagnsticos

- Coeficiente de correlacin intraclase (ANOVA).


- Modelo de efectos ALEATORIOS.
- Modelo de efectos FIJOS.

- Coeficiente de correlacin-concordancia de Lin.

- Concordancia de Krippendorff.
C aptulo 11 Pgina 1048

Anlisis de concordancia: variables cuantitativas


Mtodos de regresin

- Mtodo de regresin lineal por mnimos cuadrados.


- Mtodo de regresin ortogonal de Deming.
- Modelo de Passing-Bablock.
- Mtodo de mnimos cuadrados ponderado.
- Mtodo de regresin de Bland y Altman.
- ANOVA de medidas repetidas.
- Modelos de ecuaciones estructurales.
C aptulo 11 Pgina 1049

Anlisis de concordancia: variables cuantitativas


Mtodos grficos

- Anlisis de las diferencias individuales mtodo de Bland y Altman (que calcula


un intervalo de concordancia),

- Grfico de distribucin acumulativa emprica grfico montaa (mountain


plot)

- Grfico de la concordancia- supervivencia (survival-agreement plot).


C aptulo 11 Pgina 1050

Cul es el mtodo estadstico ms adecuado para calcular


el error que comete un mtodo diagnstico cuantitativo?

La utilizacin de la estadstica en los experimentos de comparacin de mtodos


cuantitativos es la parte ms difcil del anlisis estadstico en los estudios de
evaluacin de mtodos diagnsticos.
C aptulo 11 Pgina 1051

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico por el
nuevo sistema digital para la medida de la tensin arterial?

Sistema analgico Sistema digital

Cul es el test estadstico ms acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.
C aptulo 11 Pgina 1052

Regresin lineal por mnimos cuadrados:


Condiciones de aplicacin(*)
1. Linealidad de datos.

2. Pequeos errores aleatorios.

3. Intervalo de valores normales suficientemente amplio de concentraciones.

4. Ausencia de valores aberrantes (outliers).

5. Que la variable PREDICTORA X no tenga error, es decir que el mtodo de


referencia utilizado sea exacto, pero en la mayora de ocasiones no es posible, por lo
que los resultados del mtodo de comparacin (X) tambin presenta errores.

(*) Westgard JO, Hunt MR. Use and interpretation of common statistical test in method-comparison studies.
Clin Chem 1973; 19: 44-57.
C aptulo 11 Pgina 1053

Medidas de tensin arterial sistlica en un


grupo de 30 pacientes mediante dos
mtodos de medicin (tradicional y
automatizado)

Mtodo digital

Error sistemtico
proporcional

Mtodo analgico


C aptulo 11 Pgina 1054

Se representan los datos de un estudio en el que se tom la tensin arterial sistlica


en 30 pacientes utilizando dos mtodos diferentes. Se representan grficamente estos
datos, indicando el coeficiente de correlacin lineal de Pearson r=0,997 (p<0,0001) una
asociacin prcticamente lineal.

Para variables cuantitativas, es frecuente que el anlisis de la concordancia entre dos


medidas de la misma variable se realice ERRNEAMENTE mediante el clculo del
coeficiente de correlacin de lineal (r) de Pearson como ndice de concordancia.

Bland JM, Altman DG. Statistical methods for assesing agreement between two methods of clinical
measurement. Lancet 1986; 1: 307-310.
C aptulo 11 Pgina 1055

Regresin lineal por mnimos cuadrados:


Variable Y DIGITAL
Variable X ANALGICO
Tamao de muestra 30
Coeficiente de determinacin R 2
0,9940
Ecuacin de regresin Y = 5,8672 + 0,9351 X

Parmetro Coeficiente Error estndar IC95% t p


0 5,8672 1,9830 1,8053-9,9291 2,9588 0,0062
0,9351 0,01369 0,9071-0,9632 66,295 < 0,0001
C aptulo 11 Pgina 1056

Coeficiente de correlacin de Pearson

- Mide la fuerza de asociacin entre ambas variables (X-Y), es decir


la intensidad de la relacin lineal entre los dos mtodos diagnsticos
cuantitativos.

- No ofrece informacin sobre el grado de CONCORDANCIA, por tanto no


puede detectar sesgo constante o proporcional.

- Es posible encontrar un alto coeficiente de correlacin con una baja


intensidad de concordancia entre mtodos.

CORRELACIN CONCORDANCIA
C aptulo 11 Pgina 1057

Mito 1: La sonrisa de la esfinge

Por qu has elegido el coeficiente de correlacin de Pearson? Se cumplen todos


los requisitos para poder utilizarlo?Te permite ese test decir que los resultados son
intercambiables entre ambos instrumentos de medida?

El coeficiente de correlacin de lineal (r) de Pearson NO resulta una medida adecuada del
grado de acuerdo o concordancia entre dos mediciones de un mismo parmetro (presin
arterial), ya que si dos instrumentos miden sistemticamente cantidades diferentes uno del
otro, la correlacin puede ser perfecta (r 1), a pesar de que la concordancia sea nula.

El coeficiente de correlacin r de Pearson deca que la magnitud de la asociacin de la


medida de la presin arterial entre el mtodo manual A y el mtodo digital B es del 99,7
(r=0,997) de la mxima posible.
C aptulo 11 Pgina 1058

Coeficiente de correlacin intraclase

- Los valores del CCI pueden oscilar entre 0 y 1, de modo que la mxima
concordancia posible corresponde a un valor de CCI=1.

- Cuando el valor CCI=0 se obtiene cuando la concordancia observada es


igual a la que se esperara que ocurriera slo por AZAR. En este caso la
variabilidad observada se explicara por las discrepancias entre los mtodos
de medicin o de los diferentes criterios utilizados por los observadores en
el experimento.

CORRELACIN CONCORDANCIA

Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of clinical
measurement. Lancet 1986;8:307-10.

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.
C aptulo 11 Pgina 1059

Coeficiente de correlacin intraclase


- La obtencin del CCI que permite evaluar la concordancia general entre dos o ms
mtodos u observaciones diferentes se basa en un modelo de anlisis de la variancia
(ANOVA) con medidas repetidas, pero su obtencin directa no es posible con los paquetes
estadsticos habituales.
- La variabilidad total observada en el CCI puede dividirse en tres componentes:
- La variabilidad debida a las diferencias entre los pacientes (2P);
- La variabilidad debida a las diferencias entre los observadores (mdicos A y B)
(2O), y
- La variabilidad (residual), inexplicable (aleatoria), asociada al error inherente a toda
medicin (2R).
- El CCI se define como la proporcin de variabilidad total debida a la variabilidad de los
pacientes:

2P
CCI =
2P + 2O + 2R
C aptulo 11 Pgina 1060

Coeficiente de correlacin intraclase


- Los valores del CCI pueden oscilar entre 0 y 1: donde el 0 indica ausencia de
concordancia y el 1, la concordancia o fiabilidad absoluta de los resultados obtenidos.
- Si bien el valor del CCI que define una fiabilidad satisfactoria es arbitrario (criterios de
Fleiss):
- CCI < 0,4 representan BAJA fiabilidad.
- CCI entre 0,4 - 0,75 representan una fiabilidad entre REGULAR y BUENA.
- CCI > 0,75 representan una fiabilidad EXCELENTE.
Fleiss JL. The design and analysis of clinical experiments. Nueva York: John Wiley
& Sons, Inc., 1986.
- Los resultados ofrecidos por la r de Pearson para estos propsitos pueden resultar
equvocos.
- Se recomienda el uso del CCI para cuantificar la fiabilidad de las mediciones clnicas.
C aptulo 11 Pgina 1061

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico por el
nuevo sistema digital para la medida de la tensin arterial?

Sistema analgico Sistema digital

Cul es el test estadstico ms acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.
C aptulo 11 Pgina 1062

Coeficiente de correlacin intraclase


Ejemplo

- En este caso CCI=0.991, casi toda la variabilidad observada no depende


de las diferencias en los mtodos de medicin empleados o los diferentes
observadores (tan slo el 0,9%).

- Es decir, slo el 0,9% de la variabilidad observada es debida a las


discrepancias o diferencias entre los mtodos de medicin o por el diferente
criterios utilizados por los observadores.

Sistema analgico Sistema digital

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.
C aptulo 11 Pgina 1063

Coeficiente de correlacin intraclase


Clculo del CCI mediante programas estadsticos

Parmetro Correlacin intraclase IC95%


Medidas individuales 0,9911 0,9398 a 0,9971
Medidas promedio 0,9955 0,9690 a 0,9986
C aptulo 11 Pgina 1064

Valoracin del Coeficiente de correlacin intraclase


Valoracin de la concordancia segn los valores de Coeficiente
de Correlacin Intraclase (CCI)

CCI Fuerza de la concordancia


> 0,90 Muy buena
0,71 - 0,90 Buena
0,51 - 0,70 Moderada
0,31 - 0,50 Mediocre
< 0,30 Mala o nula
C aptulo 11 Pgina 1065

Modelo de efectos aleatorios

Este modelo aleatorio es apropiado cuando los observadores implicados en la medicin,


las enfermeras A y B en el ejemplo, representan una muestra aleatoria de la poblacin
de posibles observadores (p. ej, otras enfermeras del hospital) que en el futuro harn uso
del instrumento evaluado (el esfigmomanmetro).

Luis Prieto, Rosa Lamarca, Alfonso Casado. La evaluacin de la fiabilidad en las observaciones clnicas: el
coeficiente de correlacin intraclase. Med Clin (Barc). 1998;110:142-5.
C aptulo 11 Pgina 1066

Se desea evaluar la concordancia entre las medidas de tensin arterial entre dos
enfermeras A y B mediante la comparacin de los resultados de dos mediciones
consecutivas de la presin arterial sistlica en 10 pacientes, realizadas en el mismo
esfingomanmetro por dos enfermeras.

ENFERMERA A ENFERMERA B

Cul es el test estadstico ms acertado?


C aptulo 11 Pgina 1067

Comparacin de dos mediciones consecutivas de la presin arterial


sistlica en 10 pacientes, realizadas en el mismo esfingomanmetro por dos
enfermeros diferentes.

Paciente Enfermera A Enfermera B Diferencia (B-A)


1 135 140 5
2 140 145 5
3 130 135 5
4 145 150 5
5 140 145 5
6 150 160 10
7 140 145 5
8 135 140 5
9 140 145 5
10 135 145 10
Media 139 145 6
DE 5,68 6,67 2,11
C aptulo 11 Pgina 1068

150
Pearson Rho Spearman
r = 0,954 r = 0,929
145
r2 = 0,910 p < 0,01
ENFERMERA A

p < 0,01
140

135

130

130 135 140 145 150 160

ENFERMERA B
C aptulo 11 Pgina 1069

160
Pearson
r = 0,954
150
r2 = 0,910
p < 0,01
145
ENFERMERA B

140

Rho Spearman
135 r = 0,929
p < 0,01

130
ENFERMERA A
130 135 140 145 150
C aptulo 11 Pgina 1070

160
Pearson Error
sistemtico
r = 0,954 constante
150
r2 = 0,910
p < 0,01
145
ENFERMERA B

140
Rho Spearman
r = 0,929
135 p < 0,01

130
ENFERMERA A
130 135 140 145 150 160
C aptulo 11 Pgina 1071

T de Student para datos apareados:

1. Mide la diferencia entre las medias de las mediciones realizadas por los dos
mtodos comparados.

2. Slo puede detectar el sesgo o error sistemtico constante.

3. No puede detectar el error sistemtico PROPORCIONAL.

Gardner PL. Measuring attitudes to science: Unidimensionality and internal consistency revisited. Research
in Science Education 1995; 25: 283-9.
C aptulo 11 Pgina 1072

Resultados

Variables Media N Desviacin Error estndar de


estndar (s) la media (EEM)
ENFERMERA A 139,0 10 5,678 1,795
ENFERMERA B 145,0 10 6,667 2,108

Variable N Correlacin (r) Significacin


ENFERMERA A versus ENFERMERA B 10 0,954 0,000

Variables Diferencias relacionadas Intervalo de t calculada gl Significacin


confianza de la bilateral
diferencia
Media s EEM Inferior Superior 9,000 9 0,000
Enfermera B - 6,00 2,108 0,667 4,492 7,508
Enfermera A

t calculada > t tabulada p<0,05 (rechazamos la hiptesis nula)


La t de Student para datos apareados permite detectar el sesgo o error sistemtico CONSTANTE.
C aptulo 11 Pgina 1073

2P
CCI =
2P + 2O + 2R

Frmula simplificada del coeficiente de correlacin intraclase (CCI)


para un MODELO de EFECTOS ALEATORIOS

( DEA )2 + ( DEB )2 - ( DEB-A )2


CCI =
( DEA )2 + ( DEB )2 + ( XB-A )2 - ( DEB-A )2/ n

Clculo del CCI del ejemplo anterior:


( 5,68 )2 + ( 6,67 )2 - ( 2,11 )2
CCI = = 0,64
( 5,68 )2 + ( 6,67 )2 + ( 6 )2 - ( 2,11 )2 / 10
C aptulo 11 Pgina 1074

Coeficiente de correlacin intraclase


Clculo del CCI mediante programas estadsticos

Parmetro Correlacin intraclase IC95%


Medidas individuales 0,6436 - 0,0488 a 0,9240
Medidas promedio 0,7831 - 0,1027 a 0,9695
C aptulo 11 Pgina 1075

Valoracin del Coeficiente de correlacin intraclase


Valoracin de la concordancia segn los valores de Coeficiente
de Correlacin Intraclase (CCI)

CCI Fuerza de la concordancia


> 0,90 Muy buena
0,71 - 0,90 Buena
0,51 - 0,70 Moderada
0,31 - 0,50 Mediocre
< 0,30 Mala o nula
C aptulo 11 Pgina 1076

Conclusiones

- El valor del CCI obtenido es claramente inferior al valor 0,954 obtenido


con la r de Pearson, demostrando que la existencia de una alta asociacin
entre dos variables no es necesariamente signo de una alta concordancia.

- Aplicando la frmula a los datos anteriores, se obtiene un CCI igual


a 0,64, lo que indica una concordancia moderada entre los resultados
obtenidos por las enfermeras A y B.

CORRELACIN CONCORDANCIA
C aptulo 11 Pgina 1077

Modelo de efectos fijos

- Este modelo es apropiado cuando los observadores que intervienen en el


estudio son los nicos que participarn en el mismo.

- Se utiliza cuando el objetivo es conocer la magnitud de las discrepancias


entre dos mdicos y determinar si el mdico A puede ser sustituido por el
mdico B en esa tarea.

- Slo estamos interesados en la comparacin de los resultados obtenidos por


estos 2 mdicos y no desearemos generalizar los resultados al conjunto de
mdicos que miden la frecuencia cardaca en el hospital.
C aptulo 11 Pgina 1078

Se desea valorar la concordancia de las mediciones de la FRECUENCIA


CARDACA obtenidas en 10 pacientes por 2 mdicos diferentes: un mdico A, jefe
del servicio, y un mdico B, en perodo de formacin. El objetivo es conocer la
magnitud de las discrepancias entre ambos y determinar si el mdico A puede ser
sustituido por el mdico B en esa tarea.

El pulso radial se siente mejor en la


mueca, debajo del pulgar.

JEFE DE SERVICIO MDICO RESIDENTE

Cul es el test estadstico ms acertado?


C aptulo 11 Pgina 1079

Comparacin de dos mediciones consecutivas de la FRECUENCIA


CARDACA en pulsaciones por minuto (ppm) en 10 pacientes realizada por
dos mdicos diferentes: un mdico A, jefe del servicio, y un mdico B en
periodo de formacin (modelo de EFECTOS FIJOS).

Paciente Mdico A Medico B Diferencia (B-A)


1 75 80 5
2 74 84 10
3 76 81 5
4 79 83 4
5 82 92 10
6 83 88 5
7 85 90 5
8 87 92 5
9 87 92 5
10 88 93 5
Media 81,6 87,5 5,9
DE 5,3 5,04 2,18
C aptulo 11 Pgina 1080

95

90

MEDICO RESIDENTE Pearson


85 r = 0,912
r2 = 0,832
p < 0,01
80
Rho Spearman
r = 0,855
75 p = 0,002

75 80 85 90 95

RESIDENTE = 16,7 + 0,868 * JEFE JEFE DE SERVICIO


C aptulo 11 Pgina 1081

95
Error sistemtico
constante
90

MEDICO RESIDENTE
85

80

75

75 80 85 90 95

RESIDENTE = 16,7 + 0,868 * JEFE JEFE DE SERVICIO


C aptulo 11 Pgina 1082

2P
CCI =
2P + 2O + 2R

Frmula simplificada del coeficiente de correlacin intraclase (CCI)


para un MODELO de EFECTOS FIJOS

( DEA )2 + ( DEB )2 - ( DEB-A )2


CCI =
( DEA )2 + ( DEB )2 + ( XB-A )2 / 2 - ( DEB-A )2 / 2n

Clculo del CCI del ejemplo anterior:

( 5,3 )2 + ( 5,04 )2 - ( 2,18 )2


CCI = = 0,69
( 5,3 )2 + ( 5,04 )2 + ( 5,9 )2 / 2 - ( 2,18 )2 / 2 x 10
C aptulo 11 Pgina 1083

Valoracin del Coeficiente de correlacin intraclase


Valoracin de la concordancia segn los valores de Coeficiente
de Correlacin Intraclase (CCI)

CCI Fuerza de la concordancia


> 0,90 Muy buena
0,71 - 0,90 Buena
0,51 - 0,70 Moderada
0,31 - 0,50 Mediocre
< 0,30 Mala o nula
C aptulo 11 Pgina 1084

Conclusiones

A pesar de que la r de Pearson indica una alta asociacin (r = 0,912),


aplicando la frmula a los datos anteriores, se obtiene un CCI igual a 0,69,
lo que indica una concordancia moderada entre los resultados obtenidos
por los mdicos A y B.

CORRELACIN CONCORDANCIA
C aptulo 11 Pgina 1085

Limitaciones del coeficiente de correlacin intraclase

A pesar de ser la medida de concordancia ms adecuada para el caso de variables


NUMRICAS, el CCI presenta ciertas limitaciones:

1. A la hora de interpretar los valores del CCI, la clasificacin de la tabla 5 es subjetiva.


2. Dificultad inherente a su clculo.
3. Se trata de una prueba PARAMTRICA, por lo que limita su uso a:
- variables distribuidas segn una normal.
- igualdad de varianzas.
- independencia entre los errores de cada observador.
4. El CCI depende en gran medida de la variabilidad de los valores observados: cuanto
ms homognea sea la muestra estudiada, ms bajo tender a ser el valor del CCI.
5. Lo que ms ha limitado la difusin del uso del CCI en la literatura mdica es la carencia
de interpretacin clnica completamente objetiva.

Prieto L, Lamarca R, Casado A. La evaluacin de la fiabilidad en las observaciones clnicas: el coeficiente


de correlacin intraclase. Med Clin (Barc) 1998;110:142-5.
C aptulo 11 Pgina 1086

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico por el
nuevo sistema digital para la medida de la tensin arterial?

Sistema analgico Sistema digital

Cul es el test estadstico ms acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.
C aptulo 11 Pgina 1087

Medidas de tensin arterial sistlica en un


grupo de 30 pacientes mediante dos mtodos
de medicin (tradicional y automatizado)

Error sistemtico
proporcional

Mtodo digital

Mtodo analgico


C aptulo 11 Pgina 1088

Coeficiente de concordancia de Lin


- El coeficiente de correlacin de las medidas de concordancia de LIN mide el
grado de acuerdo entre dos variables cuantitativas continuas.

- Es til para evaluar la reproducibilidad o fiabilidad entre dos observadores o


evaluadores.

Escala de McBrige para el coeficiente de


concordancia de Lin
Valor de la c Fuerza de acuerdo
< 0,90 Pobre
0,90 0,95 Moderada
0,95 0,99 Sustanciales
> 0,99 Casi perfecto
C aptulo 11 Pgina 1089

Coeficiente de concordancia de Lin

Variable Y DIGITAL
Variable X ANALGICO
Tamao de muestra 30
Coeficiente de CONCORDANCIA de Lin 0,9908
Intervalo de confianza al 95% 0,9832 a 0,9949
Pearson (precisin) 0,9970
Factor de correccin del sesgo C b (exactitud) 0,9937
C aptulo 11 Pgina 1090

Se desea evaluar la concordancia entre las medidas de tensin arterial entre dos
enfermeras A y B mediante la comparacin de los resultados de dos mediciones
consecutivas de la presin arterial sistlica en 10 pacientes, realizadas en el mismo
esfingomanmetro por dos enfermeras.

ENFERMERA A ENFERMERA B

Cul es el test estadstico ms acertado?


C aptulo 11 Pgina 1091

Coeficiente de concordancia de Lin

Variable Y Enfermera A
Variable X Enfermera B
Tamao de muestra 10
Coeficiente de CONCORDANCIA de Lin 0,6190
Intervalo de confianza al 95% 0,3074 a 0,8107
Pearson (precisin) 0,9542
Factor de correccin del sesgo C b (exactitud) 0,6487
C aptulo 11 Pgina 1092

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico por el
nuevo sistema digital para la medida de la tensin arterial?

Sistema analgico Sistema digital

Cul es el test estadstico ms acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.
C aptulo 11 Pgina 1093

Mtodo de regresin ortogonal de Deming

1. En el caso de que presenten errores aleatorios en el mtodo de referencia (X) ha sido


propuesto como ms aceptable el mtodo de regresin ortogonal establecido por Deming
en 1943 (*).
2. Es adecuado incluso si existen valores aberrantes (**).
3. Si el error que presenta esta variable es proporcional, cuando la varianza de los
resultados aumenta con la concentracin, ha sido considerado adecuado el clculo de la
correlacin lineal mediante el clculo de mnimos cuadrados ponderado.
4. Mientras que consideran mejor el mtodo de Deming si los errores en x son
significativos frente al intervalo ensayado, cuando el intervalo de concentraciones es
estrecho (v.g. en Potasio) (***).

(*) Wakkers PJM, Hallendoorn HBA, Op de Weegh GJ, Heerspink W. Applications of statistics in clinical
chemistry. A critical evaluation of regression lines. Clin Chim Acta 1975; 64: 173-84.
(**) Cornbleet PJ, Gochman N. Incorrect least-squares regression coefficients in method-comparison
analysis. Clin Chem 1979; 25: 432-38.
(***) Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended linear regressin models for
comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.
C aptulo 11 Pgina 1094

Representacin grfica de Deming

Error sistemtico
proporcional


C aptulo 11 Pgina 1095

Mtodo de regresin ortogonal de Deming

Variable Y DIGITAL
Variable X ANALGICO
Tamao de muestra 30
Ecuacin de regresin Y = 5,4741 + 0,9379 X

Mtodo Media Coeficiente de variacin (CV%)


X 140,23 26,24
Y 137,00 25,19

Parmetro Coeficiente Error estndar IC95%


0 5,4741 1,7780 1,8377-9,1106
0,9379 0,01275 0,9124-0.9634
C aptulo 11 Pgina 1096

Representacin grfica de los residuales de Deming


C aptulo 11 Pgina 1097

Modelos de regresin de Passing-Bablock

- En los aos 80-90, para evitar los inconvenientes del mtodo simple de mnimos
cuadrados, Passing y Bablok desarrollan el clculo del mtodo de regresin no
paramtrica.

- Fue defendido como mtodo de eleccin debido a su robustez y a permitir obtener


una estimacin no sesgada de la recta de regresin.

Frey E, Fuentes-Arderiu X, Queralt JM. Comparacin estadstica de mtodos analticos. Educacin


continuada Qumica Clnica. 1988; 1:
69-79.
C aptulo 11 Pgina 1098

Modelos de regresin de Passing-Bablock


Condiciones y limitaciones de aplicacin

1. La razn de varianzas en Y y X iguale el cuadrado de la pendiente.

2. Ausencia de error en la variable PREDICTORA (independiente) X.

3. Que el error en la variable RESULTADO Y debe ser homogneo en todo el intervalo


de concentraciones.

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.
C aptulo 11 Pgina 1099

Modelos de regresin de Passing-Bablock

Variable Y DIGITAL
Variable X ANALGICO
Tamao de muestra 30
Ecuacin de regresin Y = 5,9375 + 0,9375 X

Parmetro Coeficiente IC95%


0 5,9375 1,4912-9,5455
0,9375 0,9091-0,9649

Test de linealidad de p < 0,10 No existe desviacin significativa de la linealidad


suma acumulada
C aptulo 11 Pgina 1100

C aptulo 11 Pgina 1101

Se puede utilizar el mtodo de Passing-Bablock?

Sy 2
= [ 1 ]2
Sx 2
1190,69
= 0,8796 = [ 0,9375 ]2 = 0,8789
1353,56

S.
C aptulo 11 Pgina 1102

Pregunta de investigacin
El objetivo de este estudio ha sido analizar la concordan-
cia entre dos mtodos enzimticos de determinacin de la
AMILASA srica perteneciente a una misma casa comercial
y basados en el mismo principio fsico-qumico.

Amilasa antigua Amilasa nueva

Cul es el test estadstico ms acertado?


C aptulo 11 Pgina 1103

Modelos de regresin de Passing-Bablock

Variable Y AMILASA NUEVA


Variable X AMILASA CLSICA
Tamao de muestra 548
Ecuacin de regresin Y = 4,6190 + 0,8095 X

Parmetro Coeficiente IC95%


0 4,6190 4,000-5,200
0,8095 0,8000-0,8182

Test de linealidad de p < 0,01 Desviacin significativa de la linealidad


suma acumulada
C aptulo 11 Pgina 1104

Error sistemtico
proporcional

C aptulo 11 Pgina 1105

SD
CVa = * 100
CVa (nueva) = 152% X

CVa (clsica) = 148%

NO SE PUEDE UTILIZAR el mtodo de Regresin ortogonal de Deming


porque los CV > 100%.
C aptulo 11 Pgina 1106

Se puede utilizar el mtodo de Passing-Bablock?

Sy 2
= [ 1 ]2
Sx 2

14508
= 0,7060 [ 0,8095 ]2 = 0,6553
18695

No.
C aptulo 11 Pgina 1107

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico por el
nuevo sistema digital para la medida de la tensin arterial?

Sistema analgico Sistema digital

Cul es el test estadstico ms acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.
C aptulo 11 Pgina 1108

Mtodo de mnimos cuadrados ponderado

- En 1991 Zaydman et al., en su estudio sobre modelos de regresin lineal para


comparacin de mtodos, rechazan el mtodo de Passing-Bablok porque no cumple las
condiciones anteriores.

- Obtienen los mejores resultados con el mtodo de mnimos cuadrados ponderado


cuando los errores en la variable PREDICTORA X son pequeos frente al intervalo de
concentraciones como el medido (v.g. en Glucosa).
C aptulo 11 Pgina 1109

Mtodo de mnimos cuadrados ponderado

0,935
= = 66,76 >> Z95% (1,96) p < 0,05
EE 0,014
Z99,5% (3,29) p < 0,005
C aptulo 11 Pgina 1110

Pregunta de investigacin
El objetivo de este estudio ha sido analizar la concordan-
cia entre dos mtodos enzimticos de determinacin de la
AMILASA srica perteneciente a una misma casa comercial
y basados en el mismo principio fsico-qumico.

Amilasa antigua Amilasa nueva

Cul es el test estadstico ms acertado?


C aptulo 11 Pgina 1111

Mtodo de mnimos cuadrados ponderado


C aptulo 11 Pgina 1112

Mtodo grfico de Bland y Altman

- Bland y Altman proponen su mtodo de evaluacin de las diferencias, con el atractivo de


su sencillez de clculo y su utilizacin frente al uso de los mtodos de regresin anteriores.

- Representan grficamente la diferencia entre los dos mtodos (D = Y X) frente a la


media de la suma de los dos resultados (A = X + Y / 2).

Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison studies. The
Statistician 1983; 32, 307-317.

Lpez, F. Utilizacin adecuada de las pruebas estadsticas en los estudios de comparacin de


procedimientos. Quim Clin 2000; 19: 237.
C aptulo 11 Pgina 1113

Pregunta de investigacin
Podemos sustituir en instrumento clsico de gran tamao
por el sistema mini porttil para la medida del flujo respira-
torio mximo (FEM)?

Clsico grande Mini porttil

Cul es el test estadstico ms acertado?

Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison studies. The
Statistician 1983; 32, 307-317.
C aptulo 11 Pgina 1114

GRANDE 1 Medida GRANDE 2 medida MINI 1 medida MINI 2 medida


1 494 490 512 525
2 395 397 430 415
3 516 512 520 508
4 434 401 428 444
5 476 470 500 500
6 557 611 600 625
7 413 415 364 460
8 442 431 380 390
9 650 638 658 642
10 433 429 445 432
11 417 420 432 420
12 656 633 626 605
13 267 275 260 227
14 478 492 477 467
15 178 165 259 268
16 423 372 350 370
17 427 421 451 443

Se midi el flujo respiratorio mximo (FEM) en una muestra de 17 individuos con un amplia gama de FEM. Se
realizaron 2 mediciones en cada instrumento (grande clsico y Mini portatil). Slo la 1 medida de cada aparato
se utiliz para la comparacin de los mtodos, la 2 medicin se utiliz en el estudio de la repetibilidad.
C aptulo 11 Pgina 1115

Generalmente los puntos de datos se agrupan cerca de la lnea y


es difcil evaluar las diferencias entre los mtodos comparados

800
r = 0,9433; p <0,0001
Sistema portatil Mini (l/min)

600

400

200

0
0 200 400 600 800

Sistema clsico grande Flujo respiratorio (l/min)


C aptulo 11 Pgina 1116
C aptulo 11 Pgina 1117

Mtodo grfico de Bland y Altman: Interpretacin

- En el caso de que no haya error sistemtico los puntos se distribuirn de forma aleatoria
a uno y otro lado de la recta correspondiente a la diferencia 0 entre medidas (lnea
horizontal naranja).

- La lnea azul representa la media de las diferencias, que en nuestro ejemplo corresponde
a 2,1 (error sistemtico del segundo mtodo respecto al primero).

- Las lneas marrones representan los lmites de confianza definidos mediante 2 DE de


la media de la diferencia, y se denominan lmites de concordancia

Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison studies. The
Statistician 1983; 32, 307-317.

Bland JM, Altman DG . Statistical methods for assessing agreement between two methods of clinical
measurement. Lancet 1986: 307310.
C aptulo 11 Pgina 1118

Reflexiones del grfico

- Se observa una considerable falta de concordancia entre los medidores grandes y mini,
con discrepancias de hasta 80 l/min.
- Siempre que las diferencias d 2s no sean clnicamente importantes podamos asumir
que los mtodos de medicin son intercambiables. Estas d 2s son los lmites de
acuerdo.
- Para los datos de FEM se tiene:
d - 2s = -2,1 - (2 * 38,8) = - 78,1 l / min
d + 2s = -2,1 + (2 * 38,8) = - 73,9 l / min
- El medidor Mini ofrece datos de hasta 80 l / min por debajo o de 76 l / min por encima del
medidor grande, lo que es inaceptable para los propsitos clnicos.
- Esta falta de concordancia NO es evidente en la figura de correlacin lineal de FEM.
C aptulo 11 Pgina 1119

Ensayo de repetibilidad

- La repetibilidad es relevante para el estudio de comparacin de mtodos porque la


repetibilidad de los mtodos de medida limita el grado de concordancia.
- Si un mtodo presenta una repetibilidad pobre - es decir, existe una considerable
variacin en las mediciones repetidas en la misma muestra - el grado de concordancia
entre ambos mtodos es pobre tambin.
- La mejor manera de examinar la repetibilidad de un instrumento es tomar medidas
repetidas en una serie de muestras.
- Se calcula la media y la desviacin estndar de la diferencias medidas. La diferencia
media debe ser cero, ya que se trata del mismo mtodo. Si la diferencia de medias
es significativamente diferente de cero, no podemos utilizar los datos para evaluar la
repetibilidad, ya sea porque el conocimiento de la 1 medida est afectando a la 2 o el de
la medida es modificar la cantidad).
C aptulo 11 Pgina 1120

Ensayo de repetibilidad en el Mini


C aptulo 11 Pgina 1121

Pregunta de investigacin
Podemos sustituir en instrumento clsico analgico por el
nuevo sistema digital para la medida de la tensin arterial?

Sistema analgico Sistema digital

Cul es el test estadstico ms acertado?

Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis de concordancia
para variables numricas. Cad Aten Primaria 2004.
C aptulo 11 Pgina 1122

Mtodo grfico de Bland y Altman

La diferencia entre
ambos mtodos es
LINEAL a lo largo del
rango de medicin

Error sistemtico
proporcional


C aptulo 11 Pgina 1123

Mtodo grfico de Bland y Altman: Interpretacin

- Existe un importante error sistemtico porque los puntos se distribuyen preferentemente


por encima de la recta correspondiente a la diferencia 0 entre medidas (lnea horizontal
naranja).

- El error sistemtico es proporcional porque la diferencia entre ambos mtodos es LINEAL


(lnea rosa) a lo largo del rango de medicin.

- La lnea azul representa la media de las diferencias, que en nuestro ejemplo corresponde
a 3,2 (error sistemtico del segundo mtodo digital- respecto al primero analgico-).

- Las lneas marrones representan los lmites de confianza definidos mediante 2 DE de


la media de la diferencia (de -3,8 a +10,2 ), y se denominan lmites de concordancia.
C aptulo 11 Pgina 1124

Pregunta de investigacin
El objetivo de este estudio ha sido analizar la concordan-
cia entre dos mtodos enzimticos de determinacin de la
AMILASA srica perteneciente a una misma casa comercial
y basados en el mismo principio fsico-qumico.

Amilasa antigua Amilasa nueva

Cul es el test estadstico ms acertado?


C aptulo 11 Pgina 1125

Mtodo grfico de Bland y Altman

La diferencia entre ambos


mtodos es LINEAL a lo
largo del rango de medicin

Error sistemtico
proporcional


C aptulo 11 Pgina 1126

Mtodo grfico de Bland y Altman: Interpretacin

- Existe un error sistemtico porque casi todos los puntos se distribuyen preferentemente
por encima de la recta correspondiente a la diferencia 0 entre medidas (lnea horizontal
naranja).

- El error sistemtico es proporcional porque la diferencia entre ambos mtodos es LINEAL


(lnea rosa) a lo largo del rango de medicin.

- La lnea azul representa la media de las diferencias, que en nuestro ejemplo corresponde
a 11,8 (y nos mide el error sistemtico del segundo mtodo amilasa nueva- respecto al
primero clsica-).

- Las lneas marrones representan los lmites de confianza definidos mediante 2 DE de


la media de la diferencia (de -21,2 a +44,8 ), y se denominan lmites de concordancia.
C aptulo 11 Pgina 1127

Evaluacin de mtodos diagnsticos cuantitativos


Recomendaciones de Zaydman

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.
C aptulo 11 Pgina 1128

Recomendaciones de Zaydman
Modelos de regresin de Passing-Bablock
No debe utilizarse porque NO cumple la condicin:
1. La razn de varianzas en Y y X iguale el cuadrado de la pendiente.

Sy 2
= [ 1 ]2
Sx 2

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.
C aptulo 11 Pgina 1129

Recomendaciones de Zaydman
Mtodo de mnimos cuadrados (mtodo regresin lineal simple)
No debe utilizarse porque NO cumple los siguientes requisitos:

1. Ausencia de error en la variable PREDICTORA (independiente) X.

2. Que el error en la variable RESULTADO Y debe ser homogneo en todo el intervalo


de concentraciones.

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.
C aptulo 11 Pgina 1130

Recomendaciones de Zaydman
Mtodo de mnimos cuadrados ponderado
Debe utilizarse cuando:

Los errores en la variable predictora (independiente) x son pequeos frente al intervalo


de concentraciones medido (glucemia).

Mtodo de regresin ortogonal de Deming

Debe utilizarse cuando:


Cuando los errores en la variable predictora x son significativos frente al intervalo
ensayado, cuando el intervalo de concentraciones es estrecho (kaliemia).

Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended


linear regressin models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.
C aptulo 11 Pgina 1131
C aptulo 11 Pgina 1132

Pregunta de investigacin
El objetivo de este estudio ha sido analizar la concordancia
entre dos dispositivos de medida del oxido ntrico (NO) ex-
halado, un Analizador de quimioluminiscencia estacionario
(NIOX Aerocrine) analizador ideal, y un analizador porttil
(NIOX-MINO), basado en anlisis electroqumico.

Equipo estacionario Equipo porttil


N-6008 SIR NIOX-MINO

Cul es el test estadstico ms acertado?

Fortuna AM, Feixas T, Casan P. Determinacin de xido ntrico en aire espirado (FENO) mediante un equipo
porttil (NIOX-MINO Aerocrine) en poblacin sana. Arch Bronconeumol. 2007;43:176-9.
C aptulo 11 Pgina 1133

Anlisis estadstico

Para la descripcin de los valores de FENO se facilitan valores medios desviacin


estndar. La comparacin entre valores medios se llev a cabo mediante un test de Mann-
Whitney. La comparacin de los resultados individuales se analiz mediante la correlacin
de Pearson. En todos los casos la aproximacin ha sido bilateral y el nivel de significacin
el habitual del 5% ( = 0,05). El programa informtico empleado en el anlisis fue el
paquete estadstico SPSS versin 11.

Fortuna AM, Feixas T, Casan P. Determinacin de xido ntrico en aire espirado (FENO) mediante un equipo
porttil (NIOX-MINO Aerocrine) en poblacin sana. Arch Bronconeumol. 2007;43:176-9.
C aptulo 11 Pgina 1134

50
[NIOX-MINO] = 10 + 1,5 [N-6000 SIR]

FENO (ppb) con el equipo NIOX-MINO


40

30

20

10
r = 0,855; p =0,001

0
0 10 20
FENO (ppb) con el equipo N-6000 SIR

Fig. 3. Correlacin de xido ntrico en aire espirado (FENO) entre la determinacin con los equipos
N-6008 SIR (sensor de quimioluminiscencia) y NIOX-MINO (mtodo de electroqumica) en voluntarios
sanos. La correlacin de Pearson muestra la curva de regresin lineal entre ambos equipos (y = FENO
[ppb] con equipo NIOX-MINO; x = FENO [ppb] con el equipo N-6008 SIR).
C aptulo 11 Pgina 1135

Resultados

El valor medio ( desviacin estndar) de FENO con el equipo NIOX-MINO fue de 20 7


ppb (rango: 8-41ppb), y con el sensor N-6008, de 7 5 ppb (rango: 1-19 ppb).

Se observ una correlacin directa y estadsticamente significativa de la determinacin


de FENO entre ambos equipos (r = 0,92; p = 0,001). Los valores de FENO con el equipo
NIOX-MINO siempre fueron superiores a los obtenidos con el equipo N-6008. Adems,
la curva de regresin lineal demostr un factor de correccin de: FENO (NIOX-MINO) =
10 + 1,5 FENO (N-6008) (fig. 3).

Fortuna AM, Feixas T, Casan P. Determinacin de xido ntrico en aire espirado (FENO) mediante un equipo
porttil (NIOX-MINO Aerocrine) en poblacin sana. Arch Bronconeumol. 2007;43:176-9.
C aptulo 11 Pgina 1136

Discusin

Al comparar los 2 equipos y mtodos se constata que existe una muy buena correlacin
de cada determinacin de FENO para ambos equipos, con un factor de correccin entre
los valores de los 2 equipos de 1,5 + 10 para cada valor de FENO obtenido con el equipo
N-6008 (figs. 2 y 3), lo que coincide con los valores obtenidos por otros autores.

Fortuna AM, Feixas T, Casan P. Determinacin de xido ntrico en aire espirado (FENO) mediante un equipo
porttil (NIOX-MINO Aerocrine) en poblacin sana. Arch Bronconeumol. 2007;43:176-9.
C aptulo 11 Pgina 1137
C aptulo 11 Pgina 1138

Mito 1: La sonrisa de la esfinge

Por qu das un valor de corte, como valor de referencia, a partir de la media ms 2


desviaciones estndar?
El clculo de valores de referencia basado en la media 2 desviaciones estndar slo
puede aplicarse si las variables siguen distribuciones normales.

Se cumplen la normalidad de la variable cuantitativa (medida del NO en el aire exhalado)


en los dos instrumentos comparados?
No aportas ningn test estadstico (analtico o grfico) que demuestre que dicha variable
sigue la distribucin normal. En la tabla I aparecen otros trabajos (5 y 10) se han tenido que
realizar transformaciones logartmicas para normalizar la variable.

Seguro que sigue una distribucin normal?


C aptulo 11 Pgina 1139

Mito 1: La sonrisa de la esfinge

Por qu has elegido el coeficiente de correlacin de Pearson? Se cumplen todos


los requisitos para poder utilizarlo?Te permite ese test decir que los resultados son
intercambiables entre ambos instrumentos de medida?

El coeficiente de correlacin de lineal (r) de Pearson NO resulta una medida adecuada


del grado de acuerdo o concordancia entre dos mediciones de un mismo parmetro (NO),
ya que si dos instrumentos miden sistemticamente cantidades diferentes uno del otro, la
correlacin puede ser perfecta (r 1), a pesar de que la concordancia sea nula.

El coeficiente de correlacin r de Pearson deca que la magnitud de la asociacin de la


medida del NO entre el equipo NIOX-MINO y el equipo N-6008 es del 92% (r=0,92) de
la mxima posible.
C aptulo 11 Pgina 1140

Mito 1: La sonrisa de la esfinge

Por qu has elegido el coeficiente de correlacin de Pearson? Se cumplen todos


los requisitos para poder utilizarlo?Te permite ese test decir que los resultados son
intercambiables entre ambos instrumentos de medida?

Se ha demostrado que el coeficiente de correlacin de Pearson para evaluar la


concordancia entre medidas cuantitativas es insuficiente-inadecuado y que la
interpretacin de dicho coeficiente como una medida de concordancia es errnea. La
igualdad de medias tan slo garantiza que los 2 mtodos se centran en el mismo valor,
pero en ningn caso que todos sus valores sean iguales.
C aptulo 11 Pgina 1141

Mito 1: La sonrisa de la esfinge

Por qu utilizas el test de Mann-Whitney?

Los autores utilizan para la comparacin de medias el test de Mann-Whitney, que es


una prueba no paramtrica de comparacin de medias para grupos independientes; sin
embargo, al tratarse de medidas apareadas, deberan haber utilizado el test no paramtrico
para la comparacin de medias de medidas apareadas, que es la prueba de Wilcoxon.
C aptulo 11 Pgina 1142

Mito 1: La sonrisa de la esfinge

Afortunadamente, un buen estudio con un anlisis deficiente siempre se puede volver


a analizar. Hay paquetes estadsticos (MedCalc) que incorporan directamente un
procedimiento de comparacin de mtodos que incluyen el clculo de test que determinan
la concordancia entre medidas cuantitativas:
a) mtodos analticos, a travs del clculo de diferentes coeficientes que evalan
la concordancia, como el coeficiente de correlacin intraclase o el coeficiente de
correlacin-concordancia de Lin, modelos de regresin (modelos de regresin de
Deming y de Passing-Bablock), ANOVA de medidas repetidas y modelos de ecuaciones
estructurales, y

b) mtodos grficos como el mtodo de Bland y Altman (que calcula un intervalo de


concordancia), el grfico de distribucin acumulativa emprica grfico montaa
(mountain plot) o el grfico de la concordancia- supervivencia (survival-agreement plot).
C aptulo 11 Pgina 1143

Mito 1: La sonrisa de la esfinge

Como puedes observar en la tabla I he realizado una revisin bibliogrfica ms exhaustiva


que la tuya en la literatura mdica.
He encontrado en la pgina web http://www.nioxmino.com/references.html) muestra
diversos estudios que s utilizan algunos de estos mtodos (tabla I). Si hubieras usado los
grficos de Bland y Altman puede que hubieras encontrado (como los estudios 6 y 7 de
la tabla) una relacin entre los valores apareados de FENO con los 2 equipos de medida
de tipo heterocedstica, es decir, a mayores valores de FENO, mayores son las diferencias
entre las medidas.
C aptulo 11 Pgina 1144
C aptulo 11 Pgina 1145

Mito 1: La sonrisa de la esfinge

Por qu no indicas el intervalo de confianza del coeficiente de correlacin de Pearson?

Los autores no aportan un intervalo de confianza para dicho coeficiente. Calculado


por m, dicho intervalo del 95% es de 0,83 a 0,96, lo que implica que valores posibles
de dicho coeficiente podran ser inferiores a 0,90, los cuales empricamente se han
clasificado como correlacin slo buena.
C aptulo 11 Pgina 1146

Mito 1: La sonrisa de la esfinge

Eres el nico autor que ha investigado la correlacin entre dichos instrumentos?

Por qu no comparas tus resultados con los publicados en la bibliografa?

Otros trabajos, encontrados en mi revisin bibliogrfica, ninguno de los cuales han sido
mencionados por los autores, ofrecen coeficientes de correlacin de Pearson mejores
que el tuyo (0,92) y mucho ms cercanos a 1, como se indica en la tabla I.
C aptulo 11 Pgina 1147
C aptulo 11 Pgina 1148

Mito 1: La sonrisa de la esfinge

Como has podido ver en la tabla I, aunque otros autores tambin han utilizado slo el
coeficiente de correlacin de Pearson (trabajos 2, 8 y 11), este valor nicamente indica la
fuerza de asociacin entre 2 variables (la proximidad de los puntos de los 2 mtodos de
medida a la recta de regresin) y que dicha relacin es lineal, pero no necesariamente
que dicha recta sea la bisectriz; ni siquiera una correlacin perfecta es sinnimo de
concordancia perfecta.
C aptulo 11 Pgina 1149

Mito 1: La sonrisa de la esfinge

Aunque te puedo creer cuando describes las bondades de la medida de FENO con el
nuevo equipo porttil (sencillez, rapidez, manejabilidad, coste, etc.) y su utilidad en el
diagnstico y seguimiento del paciente asmtico, lo que en ningn caso, te puedo admitir
del anlisis estadsticos de tus datos es que dicho equipo sea concordante (fiable) con
el usado como referencia, ni que los valores de referencia propuestos sean vlidos sin
aportar informacin acerca de la forma de la distribucin de la variable.
C aptulo 11 Pgina 1150

2007; 67(6): 572-7


C aptulo 11 Pgina 1151

Anlisis estadstico

En el anlisis estadstico se ha estudiado la regresin de las medias de FENO obtenidas


con ambos dispositivos de medida respecto a la diferencia de las mismas, mediante
el mtodo Bland-Altman, tanto en valores absolutos como relativos. Asimismo, se ha
analizado el grado de acuerdo entre los dos dispositivos de medida, en relacin con los
valores de normalidad para ambos, mediante el estadstico kappa de Cohen.
C aptulo 11 Pgina 1152

40

30
+ 2 DE

20
DIFERENCIA

10 Media

0
- 2 DE

-10
0 50 100 150 200
Media FENO

Figura 2: Anlisis estadstico (Bland-Altman). Media FENO: media de la fraccin exhalada de xido ntrico;
DIF: diferencia de las medias de FENO obtenidas con NIOX y con NIOX-MINO, en valores absolutos.
C aptulo 11 Pgina 1153

Mito 1: La sonrisa de la esfinge

- Existe un error sistemtico porque casi todos los puntos se distribuyen preferentemente
por encima de la recta correspondiente a la diferencia 0 entre medidas (lnea horizontal
naranja).

- El error sistemtico es PROPORCIONAL porque la diferencia entre ambos mtodos es


LINEAL (lnea rosa) a lo largo del rango de medicin.

- La lnea azul representa la media de las diferencias, que en nuestro ejemplo


corresponde a 11 (y nos mide el error sistemtico del segundo mtodo porttil-respecto
al primero).

- Las lneas marrones representan los lmites de confianza definidos mediante 2 DE de


la media de la diferencia (de -3 a +25), y se denominan lmites de concordancia.
C aptulo 11 Pgina 1154

Anlisis estadstico mediante el ndice kappa de Cohen

NIOX-MINO NIOX TOTAL


Anormal (+) Normal (-)
Anormal (+) 9 1 10
Normal (-) 2 18 20
Total 11 19 30
Punto de corte de FENO: media de la fraccin exhalada de xido ntrico.

Medida de acuerdo Valor de Kappa EEk Z Significacin


Kappa de Cohen + 0,780 0,120 4,286 0,000
N de casos vlidos 20
C aptulo 11 Pgina 1155

Resultados (fragmento del texto)

La regresin de las medias obtenidas por ambos dispositivos de medida de FENO


respecto a la diferencia de las mismas fue significativa, tanto en valores absolutos como
relativos (p < 0,005) (fig. 2). Asimismo, hubo acuerdo entre los valores obtenidos con
ambos dispositivos de medida, kappa de Cohen 0,78 (fig. 3).
C aptulo 11 Pgina 1156

Discusin (fragmento del texto)

El objetivo de nuestro estudio ha sido analizar la concordancia entre dos dispositivos de


medida para NO exhalado, sistema NIOX y sistema porttil NIOX-MINO. Segn los datos
obtenidos en nuestra muestra, observamos que existen diferencias significativas (p <
0,005) en la regresin de las medias obtenidas por ambos dispositivos de medida respecto
a la diferencia de las mismas. Por tanto, los dos sistemas estudiados no son equivalentes,
por lo que no son sustituibles. De acuerdo con otros investigadores, los valores obtenidos
con el sistema NIOX-MINO han sido significativamente superiores a los obtenidos con el
sistema NIOX, tanto ms cuanto mayor ha sido el valor de FENO obtenido (fig. 2).
C aptulo 11 Pgina 1157

Discusin (conclusiones)
En conclusin, la FENO, determinada mediante tcnica electroqumica con sistemas
porttiles, es vlida en nios mayores de 5 aos y ofrece la posibilidad de cuantificar de
forma simple y no invasiva la inflamacin eosinoflica de la va area, que resulta de gran
utilidad como complemento a la funcin pulmonar en el diagnstico de asma y en el control
del tratamiento en nios.

Introduccin (fragmento del texto: objetivos)


El objetivo de este estudio ha sido analizar la concordancia entre dos dispositivos de
medida de NO exhalado, un analizador de quimioluminiscencia estacionario (NIOX,
Aerocrine, Suecia), considerado como analizador.
C aptulo 12 Pgina 1158

Captulo 12

Publicacin Bioestadstica: Anlisis multivariante.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 12 Pgina 1159

Fases del anlisis estadstico

1. ANLISIS DESCRIPTIVO

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE
C aptulo 12 Pgina 1160

Anova de 2 factores
Variable
Predictora 1

Causa o Factor 1: Cualitativa

Variable RESULTADO

Interaccin Desenlace o efecto:


Cuantitativa

Variable
Predictora 2

Causa o Factor 2: Cualitativa


C aptulo 12 Pgina 1161

Anova de 2 factores
Factor 1:
Variable predictora 1
F= 7,49 p<0,01

Grupo cultural
Variable RESULTADO
Cuantitativa
F= 1,09 p<0,01
Interaccin Desenlace o efecto:
Peso del RN

Factor 2:
Variable predictora 2

Tabaquismo materno F= 0,59 N.S


C aptulo 12 Pgina 1162

Anlisis de la varianza (ANOVA) de dos factores


Variable dependiente cuantitativa: Peso del RN
Factor 1 cualitativa: Grupo cultural
Factor 2 cualitativa: Tabaquismo materno
Estudio de la variable resultado peso del RN. Efecto de las variables predictoras grupo cultural y hbito de
tabaquismo en las madres.
Factor Varianza F Significacin
Grupo cultural 3,2631 7,49 p < 0,01
Tabaquismo 2,5776 0,59 N.S
Interaccin (*) 4,7592 1,09 p < 0,01
(*) Test ANOVA de dos factores

Las diferencias en el peso de los RN se mantuvieron slo dependientes del grupo cultural
o de la interaccin de ambos factores, pero no del hbito de fumar. A ello pudo contribuir
el bajo nmero de madres musulmanas fumadoras.
C aptulo 12 Pgina 1163

Anova de 2 factores
Factor 1:
Variable predictora 1
F= 3,67 p<0,01
Grupo cultural

Variable RESULTADO
Cuantitativa
F= 0,34 N.S
Desenlace o efecto:
VCM

Factor 2:
Variable predictora 2

Tipo de lactancia F= 1,03 p<0,01


C aptulo 12 Pgina 1164

Anlisis de la varianza (ANOVA) de dos factores


Variable dependiente o resultado cuantitativa: VCM
Factor 1 cualitativa (variable predictora principal): Grupo cultural
Factor 2 cualitativa (variable predictora secundaria): Tipo de lactancia
Estudio de la variable resultado VCM en lactantes. Efecto de las variables predictoras grupo cultural y tipo
de lactancia.
Factor Varianza F Significacin
Grupo cultural 6,0017 3,673 p < 0,01
Lactancia 1,6904 1,034 p < 0,01
Interaccin (*) 0,5579 0,341 N.S
(*) Test ANOVA de dos factores

Las diferencias en el VCM (microcitosis) se mantuvieron dependientes tanto del grupo


cultural como del tipo de lactancia, pero no de la interaccin de ambas variables.

Daz Portillo J. Influencia del grupo tnico en el patrn lipoproteico de una determinada poblacin
peditrica de Ceuta. Tesis doctoral . Facultad de Medicina. Universidad de Cdiz . Noviembre 1997.
C aptulo 12 Pgina 1165

Anlisis multivariante
Anlisis multivariante para la deteccin de potenciales factores de
confusin
Variable Predictora 1
Variable Predictora 2
Variable Predictora 3
Variable Resultado
Variable Predictora 4
Variable Predictora 5
Variable Predictora n
C aptulo 12 Pgina 1166

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable Variable Pruebas de contraste de Observaciones y/o limitaciones del test
Independiente o Dependiente o hiptesis
PREDICTORA RESULTADO
Cualitativa Cualitativa Ji cuadrado Si el tamao muestral es grande
Prueba exacta de Fisher Si el tamao muestral es pequeo
Test de McNemar Dos grupos de muestras repetidas o apareadas
Q de Cochran Ms de dos grupos de muestras repetidas o apareadas
REGRESIN LOGSTICA Varias variables predictoras cualitativas
Cualitativa Cuantitativa t de Student Compara medias entre dos grupos independientes
Anlisis de la Varianza Compara medias entre ms de dos grupos independientes
Test de Mann-Whitney Dos grupos independientes No paramtricos
Test de Wilcoxon Dos grupos medidas repetidas No paramtrico
Test de Kruskall-Wallis Ms de dos grupos No paramtrico, medidas repetidas
Test de Friedman Ms de dos grupos No paramtrico medidas repetidas
Cuantitativa Cualitativa Regresin logstica simple Una sola variable predictora cuantitativa
Regresin logstica multivariante Varias variable predictoras cuantitativa o cualitativas
Cuantitativa Cuantitativa Regresin lineal simple Paramtrico
Correlacin de Pearson Paramtrico
Correlacin de Sperman No paramtrico
REGRESIN MLTIPLE Varias variables predictoras cuantitativas
Cualitativa Superviviencia Kaplan-Meier Curvas de superviviencia
Long-Rank Compara curvas de superviviencia
Regresin de COX Anlisis Multivariante
C aptulo 12 Pgina 1167

REGRESIN LINEAL REGRESIN LOGSTICA


MLTIPLE MULTIVARIANTE
Variable Cuantitativa Cualitativa
RESULTADO (dicotmica)

Variables Cualitativa Cualitativa


PREDICTORAS Cuantitativa Cuantitativa

ECUACIN
C aptulo 12 Pgina 1168

Regresin logstica multivariante

Es un modelo de regresin que permite estudiar si una variable resultado


de tipo cualitativa nominal depende, o no, de otras variables predictoras. La
naturaleza de las variable predictoras puede ser:

- Categrica DICOTMICA, es decir, slo puede admitir dos posibles


resultados.

- CUANTITATIVA (discreta o continua).


C aptulo 12 Pgina 1169

Regresin logstica multivariante

Variable Predictora 1
Variable Predictora 2
Variable Predictora 3
Variable Resultado
Variable Predictora 4
Variable Predictora 5 Cualitativa dicotmica
Variable Predictora n
C aptulo 12 Pgina 1170

Ejemplos de posibles modelos de regresin logstica

Variable RESULTADO Variables PREDICTORAS

Curacin (si/no) tratamiento aplicado


grado de cumplimiento
gnero
comorbilidad

HTA (si/no) ingesta de sal


antecedentes familiares
edad

Morir por cncer de mama grado del tumor


edad
tipo histolgico
receptores hormonales

RN de bajo peso HTA, edad, tabaquismo, peso materno,


raza, complicaciones obsttricas
C aptulo 12 Pgina 1171

Aplicacin de los modelos de regresin logstica

- En ENSAYOS CLNICOS en los que se evala un evento o resultado en


relacin a uno o ms factores etiolgicos, predictores o asociados (RR).

- En estudios de COHORTES en los que se evala un evento o resultado en


relacin a uno o ms factores de riesgo (etiolgicos, predictores o asociados)
(RR).

- En estudios de CASOS Y CONTROLES en los que se evalan diferentes


factores en cada grupo, para encontrar asociaciones entre ellos y la
enfermedad o caso (OR).

- En estudios TRANSVERSALES en los que se evalan diferentes variables


predictoras (factores de riesgo), para encontrar asociaciones entre ellas y la
enfermedad en estudio (variable resultado).
C aptulo 12 Pgina 1172

Objetivos de los modelos de regresin logstica

1. ESTIMAR la relacin entre una o ms variables predictoras con la variable


resultado.
- Estudios etiolgicos.
- Confusin e interaccin.

2. PREDECIR lo mejor posible la variable RESULTADO o respuesta, usando


la combinacin ms eficiente de las variables PREDICTORAS incluidas en el
estudio.
C aptulo 12 Pgina 1173

Caractersticas de los modelos de regresin logstica


multivariante

- La variable RESULTADO es siempre cualitativa discreta


Si = 1
No = 0
- Las variables PREDICTORAS del modelo puede ser
Continuas
Discretas
- La ecuacin inicial del modelo NO es una funcin lineal, sino
EXPONENCIAL, si bien una sencilla transformacin logartmica (LOGIT) la
convierte finalmente en una funcin lineal, que sigue la ecuacin de la recta
cuyas pendientes son los distintos coeficientes de regresin i.
C aptulo 12 Pgina 1174

Anlisis de regresin logstica mltiple


C aptulo 12 Pgina 1175

Ventajas de los modelos de regresin logstica multivariante


(1)

1. Es un modelo til en muchas circunstancias de investigacin en medicina...


- En las que se quiere analizar o predecir una respuesta dicotmica de la
variable resultado
Enfermo / sano
Vive / muere
Presente / ausente
Positivo / negativo
- En funcin de su perfil de variables predictoras o factores de riesgo, que
pueden ser
cualitativas: gnero, sexo, grupo cultural, estado civil, nivel de estudios,
nivel socioeconmico,...
cuantitativas: edad, n de cigarrillos, IMC, colesterol, TAS,...
C aptulo 12 Pgina 1176

Ventajas de los modelos de regresin logstica multivariante


(2)

2. Es la mejor aproximacin a la realidad biolgica, ya que la influencia


de una variable predictora o factor de riesgo sobre la probabilidad de
que aparezca una enfermedad (variable resultado) suele asemejarse
ms a una curva sigmoidea (funcin exponencial) que a una recta.
La curva sigmoidal es la representacin habitual de una respuesta a
diferentes dosis de un estmulo.

Probabilidad de Y
enfermedad
coronaria

X1
Factor de riesgo: cLDL
C aptulo 12 Pgina 1177

Ventajas de los modelos de regresin logstica multivariante


(3)

3. El modelo matemtico del modelo permite obtener directamente la ODDS


RATIO (OR) o el RIESGO RELATIVO (RR) para cada factor de riesgo o
variable PREDICTORA incluida en el modelo. El coeficiente i de cada
variable predictora obtenido por regresin logstica es el logaritmo neperiano
de la OR o del RR del factor de riesgo.

OR OR1 = e 1

RR RR1 = e 1
C aptulo 12 Pgina 1178

Funciones de los modelos de regresin logstica


multivariante

1. CUANTIFICAR la relacin existente entre las distintas variables predictoras incluidas en


el modelo y la variable resultado (respuesta).

2. CONTROLAR Y AJUSTAR aquellas variables predictoras que actan como potenciales


FACTORES MODIFICADORES de EFECTO, especialmente los FACTORES de
CONFUSIN.

3. PREDECIR LA RESPUESTA de la variable resultado en funcin de las variables


predictoras o factores de riesgo, clasificando a los individuos en una de las dos posibles
respuestas en funcin de la probabilidad que arroje su perfil de variables predictoras
incluidas en el modelo de regresin logstica multivariante.
C aptulo 12 Pgina 1179

Variables explicativas o predictoras en el modelo de


regresin logstica

Variables CUALITATIVAS Variables CUANTITATIVAS

El modelo asume estimaciones basa- La OR y el RR son medidas que cuan-


das en variables continuas tifican el cambio en el riesgo cuando se
pasa de un valor del factor a otro

Las variables cualitativas deben ser Este aumento o disminucin del riesgo es
modeladas en 2 categoras (0,1) o lineal y proporcional al cambio
transformadas en tantas variables
dicotmicas como categoras (varia-
bles DUMMY)
C aptulo 12 Pgina 1180

Regresin logstica:
Estimacin de coeficientes i

0, 1, 2,.., n son los coeficientes de regresin logstica del modelo


- 0 es el trmino independiente (o constant en SPSS)
- El resto de las i son los coeficientes de regresin logstica para las
diferentes variables predictoras incluidas en le modelo
- La evidencia de relacin entre una variable predictora y la variable
resultado es la existencia de un coeficiente de regresin logstica
significativamente diferente a cero i 0
- El signo de i tiene un significado importante porque
- Si es positivo (i > 0) significa que esa variable predictora AUMENTA la
PROBABILIDAD del suceso (variable resultado o respuesta) que estamos
analizando.
- Si es negativo (i < 0) su clculo se lleva a cabo mediante la FUNCIN
DE MXIMA VEROSIMILITUD.
C aptulo 12 Pgina 1181

Regresin logstica:
Definicin de las hiptesis nula Ho y alternativa Ha

- La hiptesis conceptual es que una o varias variables predictoras influyen


significativamente en la probabilidad del suceso en estudio (que la variable
predictora tome un valor u otro)

- Las hiptesis operativas se reducen al contraste de los diferentes


coeficientes i obtenidos en el anlisis de los datos como estimadores de las
variables predictoras de inters
As, cuando slo hay una variable predictora X1
H0 1 = 0
Ha 1 0

- Hay varios procedimientos para llevar a cabo este contraste.


C aptulo 12 Pgina 1182

Regresin logstica:
Procedimientos para evaluar el contraste de hiptesis

1. Evaluacin estadstica del coeficiente i


2. Evaluacin estadstica de WALD
- El estadstico de WALD es el resultado de dividir el cuadrado del coeficiente
de regresin logstica i por el cuadrado de su error estndar EEi
3. Evaluacin estadstica de la razn de verosimilitud (L0)
4. Evaluacin estadstica del cambio del estadstico -2LL0
- Este estadstico resulta ser menor de dos veces el logaritmo neperiano de la
razn de verosimilitud (L0)
5. Evaluacin del estadstico Z2, (Goodness of Fit)
C aptulo 12 Pgina 1183

1. Evaluacin estadstica del coeficiente i

- El coeficiente de regresin logstica i de la variable predictora i debe


ser estadsticamente distinto de cero i 0 para que esta tenga influencia
significativa sobre la variable resultado.

- La hiptesis H0 ser que... i = 0

- La hiptesis Ha ser que... i 0

- Para tener en cuenta el error aleatorio (EEi) con que el coeficiente


i (obtenido en la regresin logstica) estima al coeficiente de regresin
poblacional n se lleva a cabo un contraste a travs del estadstico t
de Student con un nmero de grados de libertad igual al nmero de
individuos de la muestra (N) menos el nmero de variables predictoras (n)
introducidas en el modelo.
C aptulo 12 Pgina 1184

Interpretacin del coeficiente de regresin logstica i

- Si su signo es positivo (i > 0), la probabilidad de que se d o aparezca la


caracterstica de la variable predictora aumentar segn aumente el valor de
xn (la variable resultado a quien afecta).

- Si i 0 es significativamente distinta de cero (test de contraste de hiptesis


p < 0,05), la variable predictora i influye significativamente en la probabilidad
de que se d o aparezca la caracterstica de la variable resultado, y el modelo
logstico tiene sentido.
C aptulo 12 Pgina 1185

2. Evaluacin estadstica de Wald

El estadstico de Wald (W) es tambin muy utilizado para evaluar la


significacin estadstica del modelo de regresin logstica multivariante.

El estadstico W se obtiene dividiendo el cuadrado de i por el cuadrado del


error estndar de i

El estadstico de Wald se distribuye segn una CHI CUADRADO.

La hiptesis a contrastar son las mismas que en el caso anterior


La hiptesis H0 ser que... W = 0
La hiptesis Ha ser que... W 0
C aptulo 12 Pgina 1186

Evaluacin del modelo de Regresin logstica multivariante mediante el programa estadstico SPSS
ESTADSTICO HIPTESIS NULA CONTRASTE SIGNIFICACIN
i i = 0 t de Student p < 0,05
Wald i = 0 CHI CUADRADO p < 0,05
(i)2 / (EEi)2
- 2 Log Likelihood L=1 CHI CUADRADO Si rechaza la hiptesis
(-2LL) con n-k-1 grados de nula
(-2LL) = 0 libertad (p < 0,05) significa que el
ajuste perfecto modelo de regresin no
es significativo
Improvement (-2LLK-1) - (-2LLK ) CHI CUADRADO p < 0,05
o cambio en la razn con k grados de
de verosimilitud en libertad
cada paso
Z2 Z2 0 CHI CUADRADO Si se rechaza la
(Goodness of Fit) hiptesis nula
(p < 0,05) significa que el
modelo de regresin no
es significativo
Model Chi- Square (-2LL0) - (-2LLK ) CHI CUADRADO p < 0,05
con k grados de
libertad
C aptulo 12 Pgina 1187

Evaluacin del modelo de Regresin logstica multivariante


mediante el programa estadstico SPSS

ESTADSTICO HIPTESIS NULA CONSTANTE SIGNIFICACIN


i i = 0 t de Student p < 0,05
Wald W=0 CHI CUADRADO p < 0,05
[i]2
[EEi]2

Si se rechaza la hiptesis nula (Ho) (p< 0,05) significa que el modelo de regresin es
significativo.
C aptulo 12 Pgina 1188

Es posible predecir el estado de los depsitos medulares


de hierro conociendo los niveles sricos de ferritina y el
VCM del hemograma?

Variable predictora 1
VCM

Variable resultado cualitativa


Depsitos de hierro en
Mdula sea

Variable predictora 2 1 = Depsitos de hierro normales


0 = Dficit de hierro medular
FERRITINA
(srica)
C aptulo 12 Pgina 1189

Anlisis de regresin lineal mltiple

Posible variables predictoras asociadas a los depsitos de hierro en mdula sea


Variables predictoras Estimacin Error estndar EE
Constante - 0,6799
VCM - 0,02223 0,03835

FERRITINA srica 0,1919 0,05525

Para que una variables PREDICTORAS est relacionada estadsticamente con la


variable resultado (depsitos de hierro en mdula sea) debe cumplirse siempre la
condicin de que

Ferritina 0,1919
= = 3,47 > Z95% (1,96) p < 0,05
EE Ferritina 0,05525

VCM -0,02223
= = 0,06 << Z95% (1,96) p > 0,05
EE VCM 0,03835
C aptulo 12 Pgina 1190

Mtodo de introduccin de las REGRESIN LINEAL REGRESIN LOGSTICA


variables MLTIPLE MULTIVARIANTE
Forward (hacia adelante) Introducir progresivamente en el modelo las variables
predictoras estadsticamente significativas, comenzando por
la que tenga mayor significacin
Backward (hacia atrs) Comienza por estimar un modelo que contiene todas las
variables predictoras para ir eliminando posteriormente
una a una, de forma sucesiva, aquellas que no sean
significativas
Stepwise Es una combinacin de los anteriores
C aptulo 12 Pgina 1191

Anlisis de Regresin Logstica mltiple


Qu relacin existe entre las variables predictoras VCM
y Ferritina srica y los depsitos de hierro medular?
Variables PREDICTORAS Variable RESULTADO

VCM y Ferritina srica Depsitos de Fe medular

P
log = 0 + X1 + 2X2
1-P

P
log = -2,1290 + 0,1713 FERRITINA
1-P

P = probabilidad de que existan depsitos de hierro medular


C aptulo 12 Pgina 1192

Anlisis de Regresin Logstica mltiple


Qu relacin existe entre las variables predictoras VCM
y Ferritina srica y los depsitos de hierro medular?
Variables PREDICTORAS Variable RESULTADO

VCM y Ferritina srica Depsitos de Fe medular

OR = e (X)
i

OR = e
0,1713 (Xa Xb)

Xa = Niveles de ferritina srica del paciente A


Xb = Niveles de ferritina srica del paciente B
C aptulo 12 Pgina 1193

Qu diferencia promedio de probabilidades de tener depsitos


medulares normales existe entre un paciente A con 24 ng/ml de
ferritina y otro B con 3 ng/ml?

Variables predictoras i Paciente A Paciente B

Ferrritina srica (ng/ml) 0,1713 24 ng/ml 3 ng/ml

OR = e i (X a X b)

0,1713 (24 - 3)
OR = e = 36,6

El paciente A tiene una probabilidad de 37 veces de tener depsitos medulares de


hierro normal frente al paciente B.
C aptulo 12 Pgina 1194

Pregunta de investigacin
- Qu relacin existe entre diversas posibles variables predictoras y la probabilidad de
muerte del recin nacido de bajo peso?

- Estudio de COHORTES realizado por Horbar et al (1993) con 3603 RN de peso entre
501-1500 g (2 aos de seguimiento).

Variable Predictora 1 Anlisis Multivariante


Variable Predictora 2
Variable Predictora 3
Variable Resultado
Variable Predictora 4
Variable Predictora 5 Probabilidad de morir

Variable Predictora n

Horbar JD, Onstad L, Wright E. Predicting mortality risk for infants weighing 501 to 1500 grams at birth: The
National Institutes of Health Neonatal Research Network report. Crit Care Med 1993; 21:1218.
C aptulo 12 Pgina 1195

Estudio de cohortes prospectivo de Recin Nacidos

Variable RESULTADO-
Factores de Riesgo RESPUESTA-posible EFECTO
Variables predictoras Variable dependiente
Variable cualitativa dicotmica

Muertos por otras


causas Fallecimientos
3603 RN de peso
comprendido
entre 501 y 1500 g
Sobrevivientes
Prdidas de
seguimiento
Seguimiento mediana 2 aos

Horbar JD, Onstad L, Wright E. Predicting mortality risk for infants weighing 501 to 1500 grams at birth: The
National Institutes of Health Neonatal Research Network report. Crit Care Med 1993; 21:1218.
C aptulo 12 Pgina 1196

Estudio de cohortes prospectivo de Recin Nacidos


Objetivo: Evaluar el riesgo de muerte en RN de bajo peso (entre 501 1500 g)

Variable resultado: Fallecimiento del RN (dicotmica)

Variable predictora [1]: peso en gramos del RN


Variable predictora [2]: Tamao segn edad gestacional
Variable predictora [3]: Raza
Variable predictora [4]: Sexo
Variable predictora [5]: tipo de parto (vaginal/cesrea)
Variable predictora [6]: presentacin del parto
Variable predictora [7]: ndice del Apgar al minuto
Variable predictora [8]: Presencia o no de complicaciones maternas (diabetes melitus,
eclampsia, hipertensin o hemorragia) antes del parto
C aptulo 12 Pgina 1197

1. Peso del RN
2. Tamao segn edad gestacional (BPSEG)
3. Raza
4. Sexo
Riesgo de muerte
5. APGAR al 1 minuto
6. Presentacin del parto
7. Tipo de parto
8. Complicaciones maternas de parto
C aptulo 12 Pgina 1198

Variables predictoras significativas en la regresin logstica


multivariante

1. Peso del RN
2. Tamao segn edad gestacional (BPSEG)
3. Raza Riesgo de muerte

4. Sexo
5. APGAR al 1 minuto
C aptulo 12 Pgina 1199

Anlisis de regresin logstica mltiple


Estimacin del modelo para predecir la mortalidad en recin nacidos con
pesos entre 501 y 1500 gramos
Variables predictoras 2,606
Constante t de Student 0,029
Peso (en gr/100) - 0,422 0,157
BPSEG - 0,491 0,145
Raza - 0,450 p < 0,05
Sexo 0,656 0,131
Apgar 0,971 0,131
C aptulo 12 Pgina 1200

Tipos de variables del estudio Horbar et al.


Variable resultado (cualitativa dicotmica):
- Muerte = 1
- Sobrevivi = 0
1. Variable predictora 1: Peso del RN (gramos/100)
2. Variable predictora 2: Bajo peso segn la edad gestacional (BPSEG).
- Peso inferior al P10 para su edad gestacional = 1
- Peso igual o superior al P10 para su edad gestacional = 0
3. Variable predictora 3: RAZA
- Raza negra = 1
- Raza blanca = 0
4. Variable predictora 4: SEXO
- Hombre = 1
- Mujer = 0
5. Variable predictora 5: Indice de APGAR
- Apgar =< 3 = 1
- Apgar > 3 = 0

Horbar JD, Onstad L, Wright E. Predicting mortality risk for infants weighing 501 to 1500 grams at birth: The
National Institutes of Health Neonatal Research Network report. Crit Care Med 1993; 21:1218.
C aptulo 12 Pgina 1201

Qu diferencia promedio de riesgo de morir existe entre


un RN A con 850 gramos y otro B con 1250 gramos
iguales para el resto de las variables predictoras ensayadas?

Variables i RN A RN B
predictoras
Peso en - 0,422 850 g [8,5] 1250 g [12,5]
gramos/100

RR

RR = e i (X a X b) Un RN A de 850 g de peso al nacer


presenta 5.4 veces ms riesgo de
morir que otro RN B de 1250 g a
(850/100 1250/100) igualdad del resto de las variables
RR = e
-0,422
= 5.4 predictoras (Xi) incluidas en el
modelo.
C aptulo 12 Pgina 1202

Qu diferencia promedio de riesgo de morir existe entre


un RN A con SFA (Apgar < 3) con respecto a otro RN B sin
SFA (Apgar > 3) con igualdad para el resto de las variables
predictoras?
Variables i RN A SFA (+) RN B SFA (-)
predictoras
APGAR (>3/<=3) 0,971 APGAR < 3 [1] APGAR > 3 [0]
[1/0]

RR

e i (X a X b) Los RN con SFA presenta 2,62


RR = veces ms riesgo de morir que los
RN sin SFA a igualdad del resto
0,971 (1 0) de las variables predictoras (Xi)
RR = e = 2,62 incluidas en el modelo.
C aptulo 12 Pgina 1203

Qu diferencia promedio de riesgo de morir existe entre


un RN A nio con respecto a otro RN B nia con igualdad
para el resto de las variables predictoras incluidas en el
modelo?
Variables i RN A nio RN B nia
predictoras
SEXO (hombre/ 0,656 hombre [1] mujer [0]
mujer) [1/0]

RR

e (X X )
i a b
Los RN varones presentan 1,93
RR = veces ms riesgo de morir (un 93%)
que los RN mujeres a igualdad del
0,656 (1 0)
RR = e
resto de las variables predictoras
= 1,93 (Xi) incluidas en el modelo.
C aptulo 12 Pgina 1204

Qu diferencia promedio de riesgo de morir existe entre


un RN N de raza negra con respecto a otro RN B de raza
blanca con igualdad para el resto de las variables predictoras?

Variables i RN N RN B
predictoras
Raza (>1/<=1) - 0,450 Negra [1] Blanco [0]
[1/0]

RR

Los RN de raza blanca estn a Los RN de raza negra presenta 0.64


RR = e i (X n X b)
1/0.64 = 1.56 veces (un 56%) ms
riesgo de morir que los RN de raza
veces ms riesgo de morir que los
RN de raza blanca a igualdad del
negra a igualdad del resto de las resto de las variables predictoras
(1 0)
RR = e -0,450 = 0.64
variables predictoras. incluidas en el modelo.
C aptulo 12 Pgina 1205

Qu diferencia promedio de riesgo de morir existe entre


dos RN A y B con las siguientes caractersticas?

Variables predictoras i RN A RN B

Peso en gramos/100 - 0,422 1150 g [11,5] 1400 g [14,0]


Bajo peso para su edad - 0,491 BPPSEG [1] [0]
gestacional BPSEG [1/ 0]
Raza (>1/<=1) [1/0] - 0,450 Negra [1] Blanco [0]
Sexo (mujer/hombre) [1/ 0] 0,650 Nia [0] Nio [1]
Apgar (<=3/ >3) [1/ 0] 0,971 Apgar <=3 [1] Apgar >3 [0]

El RN A (nia negra) presenta un


RR 54% de riesgo de morir que el RN B
(nio blanco) segn el valor de las
variables predictoras incluidas en el
modelo.
C aptulo 12 Pgina 1206

Clculo de la probabilidad (P) de muerte individual

Variables predictoras RN A RN C

Peso en gramos/100 1150 g [11,5] 750 g [7,5]


Bajo peso para su edad BPPSEG [1] [0]
gestacional BPSEG [1/ 0]
Raza (>1/<=1) [1/0] Negra [1] Blanco [0]
Sexo (mujer/hombre) [1/ 0] Nia [0] Nio [1]
Apgar (<=3/ >3) [1/ 0] Apgar <=3 [1] Apgar >4 [1]

RN A

RN C
C aptulo 12 Pgina 1207

Estudio de Marshall et al. (NEOCOSUR)

- Objetivo: Desarrollar una ecuacin que permita predecir el riesgo de


mortalidad neonatal en RN de muy bajo peso de nacimiento basado en
variables predictoras conocidas en el momento del nacimiento, antes del
ingreso a la unidad de cuidado intensivo neonatal.

- Mtodos: Fueron incluidos en este estudio 1801 RN con peso al


nacimiento de 500 a 1500 gramos.

- Variables Predictoras: edad materna, peso de nacimiento, edad


gestacional, Apgar al 1 minuto, malformaciones congnitas mayores, sexo,
gestacin mltiple, uso de esteroides prenatales y peso pequeo para su
edad gestacional (BPSEG) (definida como ms bajo que Percentil 10 de
peso para edad gestacional).

Marshall G, Tapia JL, DApremont I, Grandi C. Un nuevo score para predecir el riesgo de mortalidad
neonatal del muy bajo peso de nacimiento en la red sudamericana NEOCOSUR. Journal of Perinatology
2005; 25:577582.
C aptulo 12 Pgina 1208

Estudio de Marshall et al (NEOCOSUR)


Objetivo: Predecir el riesgo de mortalidad neonatal en RN de muy bajo peso de nacimiento
(entre 500 1500 g)

Variable resultado: Fallecimiento del RN (dicotmica)


Variable predictora [1]: Edad materna
Variable predictora [2]: Peso de nacimiento
Variable predictora [3]: Edad gestacional
Variable predictora [4]: ndice del Apgar al minuto
Variable predictora [5]: Malformaciones congnitas mayores
Variable predictora [6]: Sexo
Variable predictora [7]: Gestacin mltiple
Variable predictora [8]: Uso de esteroides prenatales
Variable predictora [9]: Peso pequeo para su edad gestacional (definida como ms bajo
que Percentil 10 de peso para edad gestacional) (BPSEG)
C aptulo 12 Pgina 1209

5. Malformaciones
1. Edad de la madre congnitas

2. Peso Riesgo de 6. Sexo


muerte
7. Gestacin

3. Edad gestacional
8. Uso de esteroides
prenatales

4. APGAR al 1 minuto

9. BPSEG
C aptulo 12 Pgina 1210

Variables predictoras significativas en la regresin logstica


multivariante

Malformaciones
congnitas

Peso del RN Riesgo de Sexo


muerte

Edad gestacional
Uso de esteroides
prenatales

APGAR al 1 minuto
C aptulo 12 Pgina 1211

Estudio de Marshalll et al (NEOCOSUR)

APGAR Malformaciones
al 1 minuto congnitas

Fallecimientos
1801 RN de peso
Variable RESULTADO
comprendido entre Variable cualitativa dicotmica
500 y 1500 g
Sobrevivientes

Peso Edad Sexo Esteroides


del RN gestacional prenatales

Marshall G, Tapia JL, DApremont I, Grandi C. Un nuevo score para predecir el riesgo de mortalidad
neonatal del muy bajo peso de nacimiento en la red sudamericana NEOCOSUR. Journal of Perinatology
2005; 25:577582.
C aptulo 12 Pgina 1212

Anlisis de Regresin Logstica Mltiple: Estimacin del modelo para predecir la mortalidad en recin
nacidos con pesos entre 500 y 1500 gramos
Variables predictoras Estimacin Error estndar Cociente OR IC95%
Coeficiente EE / EE
Constante 8,378 0,99
Peso del RN - 0,331 0,04 8,27 0,72 0,64 0,79
Edad gestacional - 0,132 0,04 3,3 0,88 0,80 0,95
Apgar al minuto 0,265 0,03 8,83 0,77 0,71 0,82
Malformaciones 3,419 0,64 5,32 30,55 8,74 106,77
congnitas
(Si =1; No = 0)
Uso de esteroides - 0,302 0,08 3,77 0,74 0,58 0,89
prenatales
(Si =1; No = 0)

Sexo (mujer =1; - 0,474 0,16 2,96 0,62 0,30 0,93


hombre = 0)

Se ha utilizado el modelo de regresin logstica mltiple con un procedimiento paso a paso,descartndose


3 variables e incluyendo 6 variables predictoras que fueron estadsticamente significativos.
C aptulo 12 Pgina 1213

Interpretacin del modelo del estudio NEOCOSUR


La Tabla muestra los coeficientes del modelo de regresin logstica mltiple ,el error
estndar EE y los odds ratios (OR) asociados. Estos coeficientes para las 6 variables
predictoras seleccionadas en el modelo logstico permite evaluar el score NEOCOSUR
y puede ser usado para calcular el riesgo de mortalidad del RN con muy bajo peso al
nacimiento.

- Un aumento de 100 g en el peso de nacimiento redujo el riesgo de mortalidad


intrahospitalaria en 28% (OR = 0,72).
- La adicin de 1 punto en el score de Apgar al 1-minuto redujo el riesgo en 23% (OR =
0,77).
- Una semana adicional de edad de gestacin redujo el riesgo en 12% (OR= 0,88).
- La presencia de malformacin congnita tuvo el mayor efecto de entre todas las variables
predictoras (factores de riesgo)(OR=30,55) aumentando notablemente el riesgo de
mortalidad neonatal.

RRR = [ 1 RR ] * 100
C aptulo 12 Pgina 1214

Variables DUMMY (indicadoras)


Para la introduccin de variables policotmicas en el anlisis multivariante es necesario
crear las llamadas variables dummy. Siempre se elegir una categora de referencia
con la que se compararan el resto de las categoras. Si la variable tiene k categoras, se
proponen k - 1 variables dummy al modelo multivariante.

Hosmer and Lemeshow del Baystate Medical Center realizaron un estudio para conocer
los principales factores de riesgo asociados con el bajo peso del RN (definido como peso <
2500 g) en un grupo de 189 mujeres. Una de las 11 variables predictoras evaluadas fue la
RAZA, la cual tena 3 categoras (negra, blanca e hispana).

Para la variable RAZA se tienen que proponer dos variables dummy.

Cmo se formularon esas dos nuevas variables?


C aptulo 12 Pgina 1215

Anlisis bivariante previo

Relacin entre la variable predictora RAZA y la prevalencia del bajo peso al nacer.

Bajo peso del RN


RAZA SI NO Total (%)
Blanca 23 73 96 24%
Hispana 25 42 67 37%
Negra 11 15 26 42%
TOTAL 59 130 189

Test de 2 Pearson

2 = 5,005 p = 0,082 NO existe asociacin


C aptulo 12 Pgina 1216

Anlisis bivariante previo

Relacin entre la variable predictora RAZA y la prevalencia del bajo peso al nacer.

Bajo peso del RN


RAZA SI NO Total (%)
Blanca 23 73 96 24%
Otras razas 36 57 93 39%
TOTAL 59 130 189

Test de 2 Pearson

2 = 4,787 p = 0,029 Existe asociacin


C aptulo 12 Pgina 1217

Anlisis bivariante previo

Relacin entre la variable predictora RAZA y la prevalencia del bajo peso al nacer.

Bajo peso del RN Caso-control


RAZA SI NO Total (%) OR
Blanca 23 73 96 24% 1,00
Hispana 25 42 67 37% 1,89
Negra 11 15 26 42% 2,33
TOTAL 59 130 189 TOTAL

Test de 2 de tendencia lineal

2 = 4,68 p = 0,030 Existe asociacin


C aptulo 12 Pgina 1218

Edad de la madre Hbito tabquico materno


durante el embarazo

HTA durante el embarazo Bajo peso


del RN Trabajo prematuro de parto

N de visitas al gineclogo
Raza materna
durante el primer trimestre

Peso de la madre Irritabilidad uterina


C aptulo 12 Pgina 1219

Variables predictoras significativas en el anlisis


multivariante
Hbito tabquico materno
durante el embarazo

Bajo peso
del RN

Raza materna

Peso de la madre
P
Log = 0 + 1X1 + 2X2 + 3X3
1-P

Hosmer and Lemeshow (2000) Applied Logistic Regression: Second Edition. Baystate Medical Center,
Springfield, Massachusetts .
C aptulo 12 Pgina 1220

Modelo de regresin logstico para el BAJO PESO AL NACER


Variables predictoras Estimacin Error estndar EE /EE p
Constante -0,109 0,882 0,123 0,901
Tabaquismo 1,060 0,378 2,804 0,005
Peso de la madre -0,027 0,013 2,077 0,036
Raza negra (1 dummy) 1,290 0,511 2,525 0,012
(NEGRA=1, blanca =0,
hispana=0)
Raza hispana (2 dummy) 0,970 0,412 2,354 0,019
(HISPANA=1, blanca =0,
negra=0)

Para la variable RAZA se tienen que proponer dos variables dummy (k-1). La categora de referencia es la
que no tiene variable dummy propia, en esta caso la raza blanca.
C aptulo 12 Pgina 1221

REGRESIN LINEAL REGRESIN LOGSTICA


MLTIPLE MULTIVARIANTE
Variable Cuantitativa Cualitativa
RESULTADO (dicotmica)

Variables Cualitativa Cualitativa


PREDICTORAS Cuantitativa Cuantitativa

ECUACIN Y = 0 + 1X1 + ... + nXn


C aptulo 12 Pgina 1222

Regresin lineal mltiple

Se utiliza la regresin lineal mltiple cuando estudiamos la posible relacin


entre varias variables predictoras Xi (independientes o explicativas) y una
variable resultado (respuesta, dependiente, explicada ) que es siempre de tipo
numrico (cuantitativa).

Y = 0 + 1X1 + ... + nXn


C aptulo 12 Pgina 1223

Regresin lineal mltiple

Y = 0 + 1X1 + ... + nXn


Variable Predictora 1
Variable Predictora 2
Variable Predictora 3
Variable Resultado
Variable Predictora 4
Variable Predictora 5 Cuantitativa
Variable Predictora n
C aptulo 12 Pgina 1224

Utilidades de la regresin lineal mltiple

- Prediccin de respuestas (variable resultado) a partir de un conjunto de


variables explicativas (predictoras).

- Identificacin de variables predictoras y construccin del modelo de


regresin lineal mltiple.

- Deteccin de interacciones entre las distintas variables predictoras que


afectan a la variable resultado.

- Identificacin (y ajuste) de variables predictoras que actan como


FACTORES de CONFUSIN.
C aptulo 12 Pgina 1225

Requisitos para el uso de la regresin lineal mltiple

1. Linealidad.
La variable RESULTADO depende linealmente de las variables
PREDICTORAS.
Si encontramos respuestas no-lineales, esas variables predictoras se pueden
transformar en lineales.

2. Normalidad de las variables cuantitativas.


C aptulo 12 Pgina 1226

Modelo de la regresin lineal mltiple

Y = 0 + 1X1 + ... + nXn

- Y es la variable resultado o dependiente (debe ser siempre numrica).

- Los trminos Xi son las variables predictoras o independientes o explicativas,


las cuales pueden ser
- Cuantitativas (discretas o continuas).
- Cualitativas dicotmicas; en este caso deben transformarse en
cuantitativas ( 0,1 ).
- Cualitativas policotmicas; en este caso deben transformarse en
cuantitativas ( 0,1 ), son las variables dummy.

- Los trminos i son los coeficientes de regresin del modelo y los calcula el
programa estadstico.
C aptulo 12 Pgina 1227

Pregunta de investigacin
Existe relacin entre la intensidad del estudio y el rendimiento
acadmico en el examen del curso de Bioestadstica?

Variable PREDICTORA 1 Variable RESULTADO


Cuantitativa continua Cuantitativa discreta
Horas de estudio Rendimiento acadmico

Cul es el test estadstico ms acertado?


C aptulo 12 Pgina 1228

Modelo de regresin lineal simple para la variable resultado nmero de RESPUESTAS


correctas del examen ajustado por la variable predictora nmero de horas de ESTUDIO

Resumen del modelo


Modelo R R2 R 2 corregido Error estndar de la estimacin
Regresin 0,629 0,396 0,321 6,506

ANOVA
Modelo Suma de cuadrados g.l Media Cuadrtica F p
Regresin 222,234 1 222.234 5,250 0,051
Residual 338,666 8 42,333
Total 560,900 9

Coeficientes
Variables Coeficiente t p
Constante 9,662 2,496 3,871 0,005
Horas de estudio 0,167 0,073 2,291 0,051
C aptulo 12 Pgina 1229

Anlisis multivariante

Variable predictora 1: Cuantitativa

Horas de estudio
Variable resultado:
Cuantitativa

Interaccin Rendimiento acadmico

Variable predictora 2: Cuantitativa

Coeficiente intelectual
C aptulo 12 Pgina 1230

Pregunta de investigacin
Existe relacin entre el nmero de horas de estudio, el coefi-
ciente intelectual del alumno y el rendimiento acadmico en el
examen del curso de Bioestadstica?
N del Alumno Horas de estudio (X1) CI del alumno estudio (X 2) N respuestas correctas (Y)

1 5 104 6
2 9 125 16
3 17 115 18
4 1 100 1
5 2 100 3
6 21 140 21
7 3 112 7
8 29 130 20
9 7 125 15
10 100 122 22

Cul es el test estadstico ms acertado?


C aptulo 12 Pgina 1231

Modelo de regresin lineal MLTIPLE para la variable resultado nmero de RESPUESTAS


correctas del examen ajustado por las variables predictoras nmero de horas de ESTUDIO
y coeficiente intelectual CI

Resumen del modelo


Modelo R R2 R 2 corregido Error estndar de la estimacin
Regresin 0,948 0,899 0,870 2,842

ANOVA
Modelo Suma de cuadrados g.l Media Cuadrtica F p
Regresin 504,363 2 252,182 31,224 0,000
Residual 56,537 7 8,077
Total 560,900 9

Coeficientes
Variables Coeficiente t p
Constante - 41,153 8,667 - 4,748 0,002
Horas de estudio 0,096 0,034 2,836 0,001
Coeficiente intelectual 0,445 0,075 5,910 0,0025
C aptulo 12 Pgina 1232

Mito 1: La sonrisa de la esfinge

Para la realizacin del modelo de la regresin lineal mltiple es necesario que las
variables incluidas cumplan la normalidad.

Qu test de normalidad has utilizado?

Con independencia de la normalidad, los test paramtricos NO se recomiendan cuando el


tamao muestras es pequeo (n 10),y/o cuando la variables cuantitativa es discreta.

Ests seguro que se cumplen estas condiciones?


C aptulo 12 Pgina 1233

Realidad 1: Respuesta de Edipo

Test de Kolmogorov-Smirnov
Variables Estadstico N Significacin
Horas de estudio 0,881 10 0,420
Coeficiente intelectual 0,648 10 0,795
Rendimiento acadmico 0,439 10 0,991

Ho: p > 0,05 test paramtricos Ha: p < 0,05 test NO paramtricos

El test de normalidad ensayado da un valor de p NO significativo (p >0,05) en las 3


variables evaluadas. Por tanto no hay evidencias suficientes para rechazar la hiptesis nula
de normalidad. Podemos utilizar test paramtricos.
C aptulo 12 Pgina 1234

Realidad 1: Respuesta de Edipo

Distribucin paramtrica del coeficiente intelectual en la poblacin


C aptulo 12 Pgina 1235

Realidad 1: Respuesta de Edipo

CI Score Distribucin

Porcentaje
de poblacin

CI Score Distribucin
Distribucin paramtrica del coeficiente intelectual en la poblacin
C aptulo 12 Pgina 1236

Distribucin paramtrica del coeficiente intelectual en la poblacin


C aptulo 12 Pgina 1237

Mito 1: La sonrisa de la esfinge


Para la aplicacin del modelo de la regresin lineal mltiple es
necesario que NO exista COLINEALIDAD entre las variables
predictoras.

Variable PREDICTORA 1 Variable PREDICTORA 2


Cuantitativa continua Cuantitativa discreta
Horas de estudio Coeficiente intelectual

Existe COLINEALIDAD?
C aptulo 12 Pgina 1238

Colinealidad en la regresin lineal mltiple

- Es uno de los problemas ms importantes que se puede encontrar en un anlisis de


regresin. Si en un modelo de Regresin Lineal Mltiple alguna variable predictora es
combinacin lineal de otras variables predictoras, el modelo es irresoluble.

- La colinealidad aparece cuando alguna variable predictora es casi combinacin lineal de


otra u otras variables predictoras, es decir sus coeficientes de correlacin simple o mltiple
entre las variables predictoras son cercanos a 1, aunque no llegan a dicho valor.

- Como medida de la misma hay varios estadsticos propuestos, los ms sencillos son los
coeficientes de determinacin (r2) de cada variable predictoras con todas las dems.
C aptulo 12 Pgina 1239

Diagnstico de colinealidad (1):

- FACTOR DE INFLACIN DE LA VARIANZA (FIV)


FIV > 10: Colinealidad (*)
1
FIV =
1 - R 2j

- TOLERANCIA (T)
T < 0,1: Colinealidad (*)
1
T= = 1 - R 2j
FIV

(*) Regla emprica de Kleinbaum


C aptulo 12 Pgina 1240

Diagnstico de colinealidad (1):

Modelo R R2 R 2 corregido Error estndar de la estimacin


Regresin 0,948 0,899 0,870 2,842

Variable resultado: Nmero de respuestas correctas

1
FIV = FIV (estudio-CI) = 9,90
1 - R 2j

1
T= = 1 - R 2j T (estudio-CI) = 0,101
FIV

NO hay colinealidad
C aptulo 12 Pgina 1241

Diagnstico de colinealidad (2) SPSP


Ruta con SPSS: Opcin: Anlisis, Regresin lineal, Estadsticos
C aptulo 12 Pgina 1242

Diagnstico de colinealidad (2)

NDICE DE CONDICIN: Regla emprica (Belsley):


- ndices de condicin < 5 : NO existe colinealidad.
- ndices de condicin entre 5 y 10: colinealidad dbil.
- ndices de condicin entre 10 y 30: colinealidad moderada.
- ndices de condicin > 30 colinealidad fuerte (grave).

Modelo Dimensin Autovalor ndice de Proporciones de la varianza


condicin Constante Horas de CI
Estudio
1 1 2,456 1,000 0,00 0,06 0,00
2 0,536 2,136 0,00 0,84 0,00
3 0,005 21,608 1,00 0,10 1,00

Variable resultado: Nmero de respuestas correctas


C aptulo 12 Pgina 1243

Diagnstico de colinealidad (2)

- Hay un ndice de condicin alto (21,6) y asociado con el mismo est el trmino
constante y el coeficiente intelectual (CI) con proporcin de varianza alta.

- Nos indica, por tanto, que el CI slo es colineal con la constante, pero no con las
horas de estudio.

Modelo Dimensin Autovalor ndice de Proporciones de la varianza


condicin Constante Horas de CI
Estudio
1 1 2,456 1,000 0,00 0,06 0,00
2 0,536 2,136 0,00 0,84 0,00
3 0,005 21,608 1,00 0,10 1,00

Variable resultado: Nmero de respuestas correctas NO hay colinealidad


C aptulo 12 Pgina 1244

Pregunta de investigacin
Existe relacin entre el nmero de horas de estudio, el coefi-
ciente intelectual del alumno, asistencia a clases (horas) y el ren-
dimiento acadmico en el examen del curso de Bioestadstica?

N del Alumno Horas de estudio (X1) CI del alumno Horas de Asistencia N respuestas
(X 2) a clase (X3) correctas (Y)
1 5 104 23 6
2 9 125 92 16
3 17 115 78 18
4 1 100 15 1
5 2 100 20 3
6 21 140 100 21
7 3 112 35 7
8 29 130 95 20
9 7 125 75 15
10 100 122 100 22
C aptulo 12 Pgina 1245

Variable predictora 1: Cuantitativa

Horas de estudio
Variable resultado:
Cuantitativa
Variable predictora 2: Cuantitativa
Rendimiento acadmico
Coeficiente intelectual

Variable predictora 3: Cuantitativa

Horas de asistencia a clases


C aptulo 12 Pgina 1246

Modelo de regresin lineal MLTIPLE para la variable resultado nmero de RESPUESTAS


correctas del examen ajustado por las variables predictoras nmero de horas de
ESTUDIO, coeficiente intelectual CI y asistencia a clase

Resumen del modelo


Modelo R R2 R 2 corregido Error estndar de la estimacin
Regresin 0,984 0,969 0,954 1,696

ANOVA
Modelo Suma de cuadrados g.l Media Cuadrtica F p
Regresin 543,632 3 181,211 62,963 0,000
Residual 17,268 6 8,077
Total 560,900 9

Coeficientes
Variables Coeficiente t p
Constante - 2,593 11,651 0.0223 0,831
Horas de estudio 0,028 0,104 1,007 0,353
Coeficiente intelectual 0,022 0,123 0,177 0,865
Asistencia a clase (horas) 0,196 0,053 3,694 0,010
C aptulo 12 Pgina 1247

Variables Estadsticos de colinealidad


Tolerancia (T) FIV
Horas de estudio 0,477 2,098
Coeficiente intelectual 0,117 8,552
Asistencia a clase (horas) 0,89 11,241

Obsrvese que los mayores valores de la tolerancia (T) y del factor de inflacin
corresponden a la variable predictora ASISTENCIA a clase.

- FACTOR DE INFLACIN DE LA VARIANZA (FIV)


FIV > 10: Colinealidad (*)
- TOLERANCIA (T)
T < 0,1: Colinealidad (*)
C aptulo 12 Pgina 1248

Autovalor ndice de condicin Proporciones de la varianza


Constante Horas de Coeficiente ASISTENCIA
ESTUDIO intelectual a clases
3.366 1,000 0,00 0,02 0,00 0,00
0,538 2,501 0,00 0,45 0,00 0,00
0,095 5.957 0,00 0,24 0,00 0,14
0,001 64,725 0,99 0,29 1,00 0,85
Variable resultado: Rendimiento acadmico (respuestas acertadas)

Hay un ndice de condicin alto (64,72) y asociado con el mismo hay dos variables
(el trmino constante, coeficiente intelectual, y ASISTENCIA a clase) con proporcin
de varianza alta. Nos indica, por tanto, que la asistencia a clase es COLINEAL con el
coeficiente intelectual y con la constante.
C aptulo 12 Pgina 1249

Grasas TOTALES

Colesterol diettico

cidos grasos saturados

cidos grasos insaturados


Colesterol-LDL

EDAD

EJERCICIO FSICO
C aptulo 12 Pgina 1250

Realizando los anlisis de regresin de cada una de las variables predictoras


del modelo con todas las dems, se obtienen los siguientes coeficientes de
determinacin, tolerancia y factores de inflacin de la varianza que indican
graves problema de COLINEALIDAD.

Coeficientes no t Significacin Estadsticos de


estandarizados colinealidad
Modelo EE Tolerancia FIV
Constante 258,484 130,837 1,976 0,70
Grasa TOTAL - 5,714 4,776 -1,196 0,253 0,20 49,978
Colesterol dieta 0,067 0,036 1,851 0,087 0,038 26,530
Edad 0,443 2,867 0,155 0,879 0,098 10,225
Ejercicio - 3,115 45,953 - 0,068 0,947 0,143 7,005
cidos grasos 0,0722 0,075 0,966 0,351 0,066 15,242
saturados
cidos grasos - 0,0746 1,150 - 0,065 0,949 0,130 7,683
Insaturados
Variable resultado colesterol-LDL
C aptulo 12 Pgina 1251

Obsrvese que el factor de inflacin mayor corresponde a la variable grasas


TOTAL, resultado esperable debido a que se han creado tres variables ms
(colesterol diettico, cidos grasos saturados y cidos grasos insaturados) a
partir de ella.

Autovalor ndice de Proporciones de la varianza


condicin Constante Edad Grasas Ejercicio Colesterol cidos cidos
totales diettico grasos grasos
insaturados saturados
5,276 1,000 0,00 0,00 0,00 0,00 0,00 0,00 0,00
1,055 2,236 0,00 0,00 0,00 0,03 0,00 0,03 0,00
0,519 3,190 0,00 0,01 0,00 0,02 0,02 0,00 0,00
0,100 7,250 0,03 0,01 0,00 0,06 0,01 0,20 0,04
0,0354 12,200 0,06 0,00 0,00 0,78 0,03 0,64 0,04
0,01207 20,908 0,02 0,41 0,05 0,02 0,31 0,05 0,23
0,00205 50,781 0,89 0,58 0,95 0,09 0,64 0,07 0,69
Variable resultado: Colesterol-LDL
C aptulo 12 Pgina 1252

Autovalor ndice de Proporciones de la varianza


condicin Constante Edad Grasas Ejercicio Colesterol cidos cidos
totales diettico grasos grasos
insaturados saturados
5,276 1,000 0,00 0,00 0,00 0,00 0,00 0,00 0,00
1,055 2,236 0,00 0,00 0,00 0,03 0,00 0,03 0,00
0,519 3,190 0,00 0,01 0,00 0,02 0,02 0,00 0,00
0,100 7,250 0,03 0,01 0,00 0,06 0,01 0,20 0,04
0,0354 12,200 0,06 0,00 0,00 0,78 0,03 0,64 0,04
0,01207 20,908 0,02 0,41 0,05 0,02 0,31 0,05 0,23
0,00205 50,781 0,89 0,58 0,95 0,09 0,64 0,07 0,69
Variable resultado: Colesterol-LDL

Hay un ndice de condicin alto (50,781) y asociado con el mismo hay cinco variables
(el trmino constante, EDAD, GRASAS TOTALES, COLESTEROL diettico, y cidos
grasos SATURADOS) con proporcin de varianza alta. Nos indica, por tanto, que Grasas
TOTALES es COLINEAL con el COLESTEROL diettico, cidos grasos SATURADOS,
EDAD y con la constante. Al existir esta ltima colinealidad, el centrado de variables podra
mejorar el problema, se podra tambin renunciar a estudiar los trminos no lineales
COLESTEROL diettico y cidos grasos SATURADOS.
C aptulo 12 Pgina 1253

Edad de la madre Hbito tabquico materno


durante el embarazo

HTA durante el embarazo Peso


del RN Trabajo prematuro de parto

N de visitas al gineclogo
Raza materna
durante el embarazo

Peso de la madre ITU durante la gestacin


C aptulo 12 Pgina 1254

Interpretacin prctica de los resultados de la regresin lineal


mltiple
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) 2975,284 315,998 9,416 ,000 2351,748 3598,820
Edad de la madre -1,919 9,544 -,014 -,201 ,841 -20,752 16,914
Hbito tabquico materno -338,413 106,977 -,227 -3,163 ,002 -549,503 -127,322
Hipertensin durante el
-573,555 200,591 -,192 -2,859 ,005 -969,369 -177,742
embarazo
Infeccion urinaria en la
-488,353 136,959 -,239 -3,566 ,000 -758,604 -218,102
gestacin
Raza materna (blanca vs
-380,931 104,245 -,262 -3,654 ,000 -586,630 -175,232
otras)
Peso de la madre en Kg 8,055 3,570 ,155 2,256 ,025 1,010 15,100
N de visitas en el
-11,248 99,741 -,008 -,113 ,910 -208,059 185,563
embarazo categorizada
Trabajo prematuro de
-203,230 136,333 -,102 -1,491 ,138 -472,247 65,787
parto
a. Dependent Variable: Peso del RN

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 24747080 8 3093384,997 7,407 ,000a
Residual 75169973 180 417610,959
Total 99917053 188
a. Predictors: (Constant), Trabajo prematuro de parto, Hipertensin durante el
embarazo, Raza materna (blanca vs otras), N de visitas en el embarazo
categorizada, Infeccion urinaria en la gestacin, Peso de la madre en Kg, Edad de
C aptulo 12 Pgina 1255

Modelo de regresin logstico para el BAJO PESO AL NACER


Variables predictoras Estimacin Error /EE p
estndar EE t
Constante 2975,28 315,998 9,416 0,000
Edad de la madre -1,919 9,544 -0,201 0,841
Hbito tabquico materno -338,413 106,977 -3,163 0,002
Hipertensin durante el embarazo -573,555 200,591 -2,859 0,005
Infeccin urinaria durante el embarazo 488,353 136,959 -3,566 0,000
Raza materna (blanca versus otras) -380,931 104,245 -3,654 0,000
Peso de la madre en Kg 8,055 3,570 2,256 0,025
N visitas al gineclogo categorizada -11,248 99,741 -0,113 0,910
Trabajo prematuro de parto -203,230 136,333 -1,491 0,138
C aptulo 12 Pgina 1256

t = - 3,163
p = 0,002

Hbito tabquico materno


t = - 2,859 durante el embarazo
p = 0,005

HTA durante el embarazo Peso


del RN
t = - 3,654
p = 0,000

Raza materna
t = - 3,566
t = 2,256
p = 0,000
p = 0,025

Peso de la madre ITU durante la gestacin


C aptulo 12 Pgina 1257

Interpretacin prctica de los resultados de la regresin


lineal mltiple

- La aceptacin de la Ho (p > 0,05) implica que la variable resultado Y no est influenciada


por las variables predictoras Xi incluidas en el modelo.
- La aceptacin de la Ha (p < 0,05) supone que hay algn tipo de influencia de algunas de
las variables predictoras Xi sobre la variable resultado.
- La significacin estadstica se realiza mediante el test de contraste de hiptesis del
anlisis de la varianza (ANOVA).

ANOVAb

Sum of Significacin estadstica


Model Squares df Mean Square F Sig.
1 Regression 24747080 8 3093384,997 7,407 ,000a
del modelo de regresin
Residual 75169973 180 417610,959
Total 99917053 188
a. Predictors: (Constant), Trabajo prematuro de parto, Hipertensin durante el
embarazo, Raza materna (blanca vs otras), N de visitas en el embarazo
categorizada, Infeccion urinaria en la gestacin, Peso de la madre en Kg, Edad de
la madre, Hbito tabquico materno
b. Dependent Variable: Peso del RN
C aptulo 12 Pgina 1258

Interpretacin prctica de los resultados de la regresin


lineal mltiple
- Los programas estadsticos como el SPSS ofrecen una estimacin de los distintos
coeficientes de regresin i , junto al:
- Error estndar de los coeficientes de regresin EEi.
- Significacin estadstica (valor de p) de i cada variable predictora.
- Un intervalo de confianza (IC95%) de los coeficientes de regresin i.
- Las variables predictoras con significacin estadstica (p < 0,05) deben quedar en el
modelo multivariante y en la ecuacin que predice a la variable resultado.
- Las variables predictoras sin significacin estadstica (p > 0,1) deben ser excluidas del
modelo final.
C aptulo 12 Pgina 1259

i EEi IC95%i
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients 95% Confidence Interval for B
Model B Std. Error Beta t Sig. Lower Bound Upper Bound
1 (Constant) 2975,284 315,998 9,416 ,000 2351,748 3598,820
Edad de la madre -1,919 9,544 -,014 -,201 ,841 -20,752 16,914
Hbito tabquico materno -338,413 106,977 -,227 -3,163 ,002 -549,503 -127,322
Hipertensin durante el
-573,555 200,591 -,192 -2,859 ,005 -969,369 -177,742
embarazo
Infeccion urinaria en la
-488,353 136,959 -,239 -3,566 ,000 -758,604 -218,102
gestacin
Raza materna (blanca vs
-380,931 104,245 -,262 -3,654 ,000 -586,630 -175,232
otras)
Peso de la madre en Kg 8,055 3,570 ,155 2,256 ,025 1,010 15,100
N de visitas en el
-11,248 99,741 -,008 -,113 ,910 -208,059 185,563
embarazo categorizada
Trabajo prematuro de
-203,230 136,333 -,102 -1,491 ,138 -472,247 65,787
parto
a. Dependent Variable: Peso del RN
C aptulo 12 Pgina 1260

Interpretacin prctica de los resultados de la regresin


lineal mltiple
- El trmino estadstico R cuadrado (R2) es el porcentaje de reduccin de la incertidumbre
sobre la variabilidad de la variable RESULTADO (respuesta) cuando son conocidas las
variables PREDICTORAS. Cuanto ms se acerque a 1 ms poder explicativo tiene el
modelo.
- La R cuadrado corregida es un resultado ajustado, que penaliza la introduccin de
variables innecesarias en el modelo, es decir, disminuye su valor cuando se introducen
variables que no actan sobre la variable resultado.

R2 (R Square o bondad del ajuste) Model Summary


R2 corregida (ajustada)
Adjusted Std. Error of
Model R R Square R Square the Estimate
1 ,498a ,248 ,214 646,228
a. Predictors: (Constant), Trabajo prematuro de parto,
Hipertensin durante el embarazo, Raza materna
(blanca vs otras), N de visitas en el embarazo
categorizada, Infeccion urinaria en la gestacin, Peso
de la madre en Kg, Edad de la madre, Hbito
tabquico materno
C aptulo 12 Pgina 1261

Interpretacin prctica de los resultados de la regresin


lineal mltiple
- La tabla o matriz de correlaciones es de gran inters para identificar correlaciones
lineales entre parejas de variables cuantitativas.
- Interesante si ocurre entre la variable resultado y alguna de las variables predictoras.
- Problemtico si ocurre entre dos variables predictoras porque indica COLINEALIDAD.
- La matriz est formada por todos los coeficientes de correlacin lineal de Pearson (r) para
cada par de variables cuantitativas del estudio.
Coefficient Correlationsa

N de visitas
Trabajo Hipertensin Raza materna en el Infeccion Hbito
prematuro durante el (blanca vs embarazo urinaria en la Peso de la Edad de tabquico
Model de parto embarazo otras) categorizada gestacin madre en Kg la madre materno
1 Correlations Trabajo prematuro de
1,000 -,050 -,126 ,074 -,174 ,113 -,150 -,218
parto
Hipertensin durante el
-,050 1,000 -,053 -,065 ,092 -,240 ,043 -,025
embarazo
Raza materna (blanca vs
-,126 -,053 1,000 -,164 -,014 ,045 ,192 ,370
otras)
N de visitas en el
,074 -,065 -,164 1,000 -,042 ,028 ,165 -,199
embarazo categorizada
Infeccion urinaria en la
-,174 ,092 -,014 -,042 1,000 ,091 ,061 -,020
gestacin
Peso de la madre en Kg ,113 -,240 ,045 ,028 ,091 1,000 -,170 ,023
Edad de la madre -,150 ,043 ,192 ,165 ,061 -,170 1,000 ,094
Hbito tabquico materno -,218 -,025 ,370 -,199 -,020 ,023 ,094 1,000
Covariances Trabajo prematuro de
18586,737 -1365,589 -1791,262 1009,836 -3254,760 55,082 -195,718 -3181,035
parto
Hipertensin durante el
-1365,589 40236,901 -1118,575 -1306,095 2519,927 -171,932 81,982 -525,956
embarazo
Raza materna (blanca vs
-1791,262 -1118,575 10866,947 -1707,605 -200,116 16,866 190,755 4124,674
otras)
N de visitas en el
1009,836 -1306,095 -1707,605 9948,197 -574,052 9,929 156,628 -2124,941
embarazo categorizada
Infeccion urinaria en la
-3254,760 2519,927 -200,116 -574,052 18757,679 44,682 80,006 -292,270
gestacin
Peso de la madre en Kg 55,082 -171,932 16,866 9,929 44,682 12,745 -5,795 8,723
Edad de la madre -195,718 81,982 190,755 156,628 80,006 -5,795 91,092 95,883
Hbito tabquico materno -3181,035 -525,956 4124,674 -2124,941 -292,270 8,723 95,883 11444,113
a. Dependent Variable: Peso del RN
C aptulo 12 Pgina 1262

Mito 1: La sonrisa de la esfinge

En la regresin lineal mltiple realizado se han incluido inicialmente 8 posibles


variables predictoras de la variable resultado (peso del RN). De ellas slo 5
han quedado en el modelo final.

Ests seguro que se ha realizado una completa y actualizada revisin


bibliogrfica?

Por qu no se ha tenido en cuenta en el modelo de regresin la variable


DIABETES GESTACIONAL que es ampliamente conocido que aumenta el
peso del RN causando macrosomas?
C aptulo 12 Pgina 1263

Estudio transversal en pacientes con diabetes mellitus


Objetivo: Evaluar la influencia de determinadas variables en el control metablico de
la diabetes mellitus tipo 2.

Variable resultado: Niveles de hemoglobina glicosilada


Variable predictora [1]: Tipo de tratamiento
Variable predictora [2]: Sexo del paciente
Variable predictora [3]: Aos desde el diagnstico de la enfermedad
Variable predictora [4]: Nmero de enfermedades relacionadas con la diabetes
Variable predictora [5]: Acceso al dietista
Variable predictora [6]: Mdico interesado por la diabetes (actitud y conocimiento)
Variable predictora [7]: Nivel socioeconmico
Variable predictora [8]: Estilos de vida (tabaco, alcohol)
Variable predictora [9]: Edad del mdico
Variable predictora [10]: Sexo del mdico

Y = 0 + 1X1 + ... + nXn


C aptulo 12 Pgina 1264

Anlisis bivariante:
Existe relacin entre el tipo de tratamiento y los niveles de
hemoglobina glicosilada?

Variable PREDICTORA 1 Variable RESULTADO


Cualitativa policotmica Cuantitativa continua
Tipo de tratamiento %HbA1c
- Dieta
- Insulina
- ADO

Cul es el test estadstico ms acertado?

Anlisis de la Varianza para un factor (ANOVA) p < 0,05


C aptulo 12 Pgina 1265

Anlisis bivariante:
Existe relacin entre el sexo del paciente y los niveles de
hemoglobina glicosilada?

Variable PREDICTORA 2 Variable RESULTADO


Cualitativa dicotmica Cuantitativa continua
Sexo del paciente %HbA1c

Cul es el test estadstico ms acertado?

T de Student para muestras independientes p < 0,05


C aptulo 12 Pgina 1266

Anlisis bivariante:
Existe relacin entre los aos desde el diagnstico de la enfermedad
y los niveles de HbA1c?

Variable PREDICTORA 3 Variable RESULTADO


Cuantitativa continua Cuantitativa continua
Aos desde el diagnstico %HbA1c
de la enfermedad

Cul es el test estadstico ms acertado?

Coeficiente de correlacin de Pearson p < 0,05


C aptulo 12 Pgina 1267

Anlisis bivariante:
Existe relacin entre los aos desde el diagnstico de la enfermedad
y los niveles de HbA1c?

Variable PREDICTORA 3 Variable RESULTADO


Cualitativa dicotmica Cuantitativa continua
Aos desde el diagnstico %HbA1c
de la enfermedad
> 7 aos
< 7 aos

Cul es el test estadstico ms acertado?

T de Student para muestras independientes p < 0,05


C aptulo 12 Pgina 1268

Anlisis bivariante:
Existe relacin entre el nmero de enfermedades relacionadas con
la diabetes y los niveles de HbA1c?

Variable PREDICTORA 4 Variable RESULTADO


Cuantitativa discreta Cuantitativa continua
Nmero de enfermedades %HbA1c
relacionadas con la DM

Cul es el test estadstico ms acertado?

Coeficiente de correlacin de Spearman p < 0,05


C aptulo 12 Pgina 1269

Anlisis bivariante:
Existe relacin entre el nmero de enfermedades relacionadas con
la diabetes y los niveles de HbA1c?

Variable PREDICTORA 4 Variable RESULTADO


Cualitativa dicotmica Cuantitativa continua
Nmero de enfermedades %HbA1c
relacionadas con la DM
- Ms de una
- Una o menos de una

Cul es el test estadstico ms acertado?

T de Student para muestras independientes p < 0,05


C aptulo 12 Pgina 1270

Anlisis bivariante:
Existe relacin entre el acceso al dietista y los niveles de
hemoglobina glicosilada?

Variable PREDICTORA 5 Variable RESULTADO


Cualitativa dicotmica Cuantitativa continua
Acceso al DIETISTA %HbA1c

Cul es el test estadstico ms acertado?

T de Student para muestras independientes p < 0,05


C aptulo 12 Pgina 1271

Anlisis bivariante:
Existe relacin entre la actitud y conocimiento del mdico por la
DM y los niveles de HbA1c?

Variable PREDICTORA 6 Variable RESULTADO


Cualitativa dicotmica Cuantitativa continua
Mdico interesado %HbA1c
por la DM
- Si
- No

Cul es el test estadstico ms acertado?

T de Student para muestras independientes p < 0,05


C aptulo 12 Pgina 1272

Anlisis bivariante:
Existe relacin entre el nivel socioeconmico del paciente y
los niveles de HbA1c?

Variable PREDICTORA 7 Variable RESULTADO


Cualitativa policotmica Cuantitativa continua
Nivel socioeconmico %HbA1c

Cul es el test estadstico ms acertado?

Anlisis de la Varianza para un factor (ANOVA) p > 0,1


C aptulo 12 Pgina 1273

Anlisis bivariante:
Existe relacin entre el estilo del vida del paciente y los niveles de
hemoglobina glicosilada?

Variable PREDICTORA 8 Variable RESULTADO


Cualitativa dicotmica Cuantitativa continua
Estilos de vida %HbA1c
- Adecuados
- Inadecuados
(tabaco, alcohol, etc)

Cul es el test estadstico ms acertado?

T de Student para muestras independientes p > 0,1


C aptulo 12 Pgina 1274

Anlisis bivariante:
Existe relacin entre el sexo del mdico y los niveles de
hemoglobina glicosilada?

Variable PREDICTORA 9 Variable RESULTADO


Cualitativa dicotmica Cuantitativa continua
Sexo del Mdico %HbA1c

Cul es el test estadstico ms acertado?

T de Student para muestras independientes p > 0,1


C aptulo 12 Pgina 1275

Anlisis bivariante:
Existe relacin entre el tipo de tratamiento y los niveles de
hemoglobina glicosilada?

Variable PREDICTORA 10 Variable RESULTADO


Cuantitativa continua Cuantitativa continua
Edad del Mdico %HbA1c

Cul es el test estadstico ms acertado?

Coeficiente de correlacin de Pearson p > 0,1


C aptulo 12 Pgina 1276

Acceso al
Tipo de tratamiento
Dietista hospitalario

Sexo del paciente %HbA1c Actitud y conocimiento de


la DM por parte del mdico
Aos desde el diagnstico
de la enfermedad Sexo
del mdico

N de enfermedades
relacionadas Edad del mdico
con la DM

Estilos de vida
Nivel socioeconmico
C aptulo 12 Pgina 1277

Anlisis de regresin lineal mltiple

1. Dummy
Tipo de tratamiento 6. Acceso al
Dietista hospitalario
2. Dummy
Tipo de tratamiento
%HbA1c 7. Actitud y conocimiento de
la DM por parte del mdico
3. Sexo del paciente
4. Aos desde el diagnstico
de la enfermedad

5. N de enfermedades
relacionadas
con la DM

Y = 0 + 1X1 + 2X2 + 3X3 + 4X4 + 5X5 + 6X6


C aptulo 12 Pgina 1278

Anlisis de regresin lineal mltiple


1.- Tipo de tratamiento
Insulina Variables predictoras (X)
Antidiabticos orales (ADO)
Dieta
2.- Sexo del paciente (mujer [1]; hombre [0]) Variable resultado (Y):
HbA1c(%)
3.- Aos desde el diagnstico de la enfermedad
> 7 aos: [1]
< 7 aos: [0]
4.- Nmero de enfermedades relacionadas con la diabetes
- Ms de una: [1]
- Una o menos de una: [0]
5.- Acceso al dietista (si [1]; no [0])
6- Mdico interesado por la diabetes (si [1]; no [0])

Y = 0 + 1X1 + ... + nXn

Y = 0 + 1X1 + 2X2 + 3X3 + 4X4 + 5X5 + 6X6


C aptulo 12 Pgina 1279

Anlisis de regresin lineal mltiple


Y = 0 + 1X1 + ... + nXn Variables predictoras (X)
Variable resultado (Y):
HbA1c(%) Variables asociadas al nivel de hemoglobina glicosilada
Variables predictoras Estimacin Error estndar
Variables PREDICTORAS EE
que estaban relacionadas Constante 10,51 0,59
estadsticamente con la
1 dummy Antidiabticos orales / 0,29 0,37
variable resultado HbA1c insulina
en el anlisis univariante
2 dummy Dieta / insulina -0,97 0,46
N enfermedades relacionadas con la 0,20 0,08
diabetes (> 1 / 1)
Coeficiente de regresin Sexo (mujer/hombre) 0,72 0,28
estandarizado
(t calculada) Aos desde el diagnstico (> 7 / 7) 0,04 0,02
Acceso al dietista hospitalario (si/no) -1,06 0,43
Mdico interesado en la diabetes (si/no) - 0,86 0,38

sexo 0,72
= = 2,57 > Z95% (1,96) p < 0,05
0,28
EE sexo
C aptulo 12 Pgina 1280

Mito 1: La sonrisa de la esfinge

En la tabla de la regresin lineal mltiple presentada se han incluido slo el valor de


y su error estndar EE, pero no se ha incluido el IC95% de ni la significacin
estadstica p de cada variable predictora. Tampoco veo la tabla donde se indica el R 2
(R Square o bondad del ajuste del modelo multivariante).

Ests seguro que las 6 variables predictoras incluidas en el modelo multivariante


presentan significacin estadstica (p<0,05)?

La variable 1 dummy ADO/insulina presenta un valor de (0,29) inferior a su error


estndar EE, (0,37) por lo que su cociente vale 0,78, cifra muy inferior al 1,96 (Z95%)

Por qu has incluido en el modelo de regresin la variable ADO/insulina?


C aptulo 12 Pgina 1281

Anlisis de regresin lineal mltiple


Variable resultado (Y): Y = 0 + 1X1 + ... + nXn Variables predictoras (X)
HbA1c(%)
Variables asociadas al nivel de hemoglobina glicosilada
Cul de las distintas va- Variables predictoras Estimacin Error estndar
riables predictoras inclui- EE
das en el modelo parece Constante 10,51 0,59
afectar ms a la variable 1 dummy Antidiabticos orales / 0,29 0,37
resultado (HbA1c)? insulina
2 dummy Dieta / insulina -0,97 0,46
N enfermedades relacionadas con la 0,20 0,08
diabetes (> 1 / 1)
Sexo (mujer/hombre) 0,72 0,28
Aos desde el diagnstico (> 7 / 7) 0,04 0,02
Acceso al dietista hospitalario (si/no) -1,06 0,43
Mdico interesado en la diabetes (si/no) - 0,86 0,38
C aptulo 12 Pgina 1282

Anlisis de regresin lineal mltiple


Variable resultado (Y): Y = 0 + 1X1 + ... + nXn Variables predictoras (X)
HbA1c(%)
Variables asociadas al nivel de hemoglobina glicosilada
Variables predictoras Estimacin Error estndar Cociente / Significacin
EE EE p
Constante 10,51 0,59
1 dummy Antidiabticos orales / insulina 0,29 0,37 0,78 p > 0,1

2 dummy Dieta / insulina -0,97 0,46 2,11 p < 0,05


N enfermedades relacionadas con la 0,20 0,08 2,5 p < 0,05
diabetes (> 1 / 1)
Sexo (mujer/hombre) 0,72 0,28 2,57 p < 0,01
Aos desde el diagnstico (> 7 / 7) 0,04 0,02 2,00 p < 0,05
Acceso al dietista hospitalario (si/no) -1,06 0,43 2,47 p < 0,02
Mdico interesado en la diabetes (si/no) - 0,86 0,38 2,26 p < 0,05
C aptulo 12 Pgina 1283

Qu diferencia promedio de HBA1c existe entre un


paciente A mujer (sexo=1) y un paciente B hombre
(sexo=0) y a igualdad del resto de las variables predictoras
incluidas en el modelo?
Variables i Paciente A Paciente B
predictoras
Sexo (mujer=1, +0,72 mujer [1] hombre [0]
hombre =0)

Y = 0 + 1X1 + ... + nXn

Las mujeres presentan 0,72


HbA1c (A)= 10,51 + 0,72 (1) = 11,23 unidades ms de HbA1c que los
hombres a igualdad del resto de las
variables predictoras incluidas en el
HbA1c (B) = 10,51 + 0,72 (0) = 10,51 modelo.
C aptulo 12 Pgina 1284

Qu diferencia promedio de HBA1c existe entre un


paciente A con acceso al dietista hospitalario (1) de un
paciente B sin acceso (0) y a igualdad del resto de las
variables predictoras incluidas en el modelo?
Variables predictoras i Paciente A Paciente B

Acceso al dietista -1,06 SI [1] NO [0]


hospitalario
(si =1, no =0)

Y = 0 + 1X1 + ... + nXn

Los pacientes CON acceso al


HbA1c (A)= 10,51 1,06 (1) = 9,45 dietista por termino medio presentan
1,06 unidades menos de HbA1c
HbA1c (B) = 10,51 1,06 (0) = 10,51 que los pacientes SIN dietista
hospitalario a igualdad del resto de
las variables predictoras incluidas
en el modelo.
C aptulo 12 Pgina 1285

Qu diferencia promedio de HBA1c existe entre un


paciente A tratado con ADO (1) de un paciente N tratado
con insulina (0) a igualdad del resto de las variables
predictoras incluidas en el modelo?
Variables predictoras i Paciente A Paciente N

ADO/insulina + 0,29 ADO [1] insulina [0]


(ADO=1, insulina=0)

Y = 0 + 1X1 + ... + nXn

Los pacientes en tratamiento con


HbA1c (A)= 10,51 + 0,29 (1) = 10,8 ADO por termino medio presentan
0,29 unidades ms de HbA1c que
HbA1c (N) = 10,51 + 0,29 (0) = 10,51 los pacientes tratados con insulina
a igualdad del resto de las variables
predictoras incluidas en el modelo.
C aptulo 12 Pgina 1286

Qu diferencia promedio de HBA1c existe entre un


paciente A tratado slo con DIETA (1) de un paciente B
tratado con insulina (0) a igualdad del resto de las variables
predictoras incluidas en el modelo?
Variables predictoras i Paciente A Paciente N

Dieta/insulina - 0,97 dieta [1] insulina [0]


(dieta=1, insulina=0)

Y = 0 + 1X1 + ... + nXn

Los pacientes en tratamiento


HbA1c (D)= 10,51 - 0,97 (1) = 9,54 slo con dieta por termino medio
presentan 0,97 unidades menos de
HbA1c (N) = 10,51 - 0,97 (0) = 10,51 HbA1c que los pacientes tratados
con insulina a igualdad del resto de
las variables predictoras incluidas
en el modelo.
C aptulo 12 Pgina 1287

Qu diferencia promedio de HbA1c existe entre dos


pacientes A y B con las siguientes caractersticas?
Variables predictoras Paciente A Paciente B
Antidiabticos orales/insulina [1/ 0] ADO [1] Insulina [0]
Dieta/insulina [1/ 0] Dieta [1] Insulina [0]

N enfermedades relacionadas con la diabetes 3 [1] 1 [0]


(>1/<=1) [1/ 0]
Sexo (mujer/hombre) Hombre [0] Mujer [1]
Aos desde el diagnstico (> 7 / 7) 8 aos [1] 3 aos [0]
Acceso al dietista hospitalario (si/no) [1/ 0] Si [1] No [0]
Mdico interesado en la diabetes (si/no) Si [1] Si [1]

HbA1c A = 10,51 + 0,29 (1) 0,97 (0) + 0,20 (1) + 0,72 (0) + 0,04 (1) 1,06 (1) 0,86 (1) = 9.12%
HbA1c B = 10,51 + 0,29 (0) 0,97 (1) + 0,20 (0) + 0,72 (1) + 0,04 (0) 1,06 (0) 0,86 (1) = 9,40%
Diferencia HbA1c (A-B) = - 0,28%
C aptulo 12 Pgina 1288

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario INGESA de Ceuta
C aptulo 12 Pgina 1289

PC basal Grupo Cultural

PC post Tabaco

Colesterol total Lp(a) HTA

Colesterol-LDL Cardiopata isqumica

Apoprotena B Arteriopata perifrica

Urea Accidente isqumico


cerebral
Retinopata

Proteinuria Microalbuminuria
C aptulo 12 Pgina 1290

Anlisis de regresin lineal mltiple


1.- Grupo cultural
Cristianos: [1] Variables predictoras (X)
Musulmanes: [0] CUALITATIVAS
2.- Tabaco (si [1]; no [0])
3.- Hipertensin arterial Variable resultado (Y):
Lipoprotena a
si: [1]
no: [0]
4.- Cardiopata isqumica 314 pacientes con
si: [1] DM tipo 2
no: [0]
5.- Arteriopata perifrica (si [1]; no [0])
6- Accidente isqumico cerebral (si [1]; no [0])
7.- Retinopata (si [1]; no [0])
8.- Microalbuminuria (si [1]; no [0])
Y = 0 + 1X1 + ... + nXn
9.- Proteinuria (si [1]; no [0])

Amor Garca, Jacobo Daz, Lus Escobar, Manuel Aguilar, Alipio Mangas.
LIPOPROTENA (a) Y DIABETES MELLITUS TIPO 2: FACTORES QUE INFLUYEN EN LAS
CONCENTRACIONES PLASMTICAS Y UTILIDAD COMO MARCADOR DE COMPLICACIONES
TARDAS (Premio AEBM). Revista: Revista de Diagnstico Biolgico 2000; 49: 125-137.
C aptulo 12 Pgina 1291

Anlisis de regresin lineal mltiple


1.- Edad
2.- Peso Variables predictoras (X)
3.- IMC
4.- ICC
CUALITATIVAS
5.- Tensin arterial sistlica (TAS)
6- Tensin arterial diastlica (TAD) Variable resultado (Y):
7.- Glucemia Lipoprotena a
8.- Pptido C basal (PCB)
9.- Pptido C postprandrial (PCP)
10.- IPC IPC = PCP - PCB
314 pacientes con
11.- HbA1c
12.- Colesterol total DM tipo 2
13.- Triglicridos
14.- Colesterol-HDL
15.- Colesterol-LDL
16.- Apoprotena A1
17.- Apoprotena B
18.- Urea
19.- Creatinina Y = 0 + 1X1 + ... + nXn

Amor Garca, Jacobo Daz, Lus Escobar, Manuel Aguilar, Alipio Mangas.
LIPOPROTENA (a) Y DIABETES MELLITUS TIPO 2: FACTORES QUE INFLUYEN EN LAS
CONCENTRACIONES PLASMTICAS Y UTILIDAD COMO MARCADOR DE COMPLICACIONES
TARDAS (Premio AEBM). Revista: Revista de Diagnstico Biolgico 2000; 49: 125-137.
C aptulo 12 Pgina 1292

Anlisis de regresin lineal mltiple

Variables asociadas al nivel de lipoprotena (a)


Variables predictoras Estimacin Error estndar EE /EE Test F p
CUALITATIVAS
Grupo cultural - 5,1428 2,7270 1,88 3,5564 p > 0,1
Tabaco 0,1952 3,1477 0,062 0,0038 NS
HTA 2,4388 2,5480 0,960 0,9161 NS
Cardiopata isqumica 8,4219 2,8256 2,98 8,9028 p < 0,01
Arteriopata perifrica 3,1005 3,375 0,919 0,8440 NS
AIC 2,041 3,114 0,656 0,4298 NS
Retinopata - 0,8838 2,6850 0,329 0,1084 NS
Microalbuminuria 0,4571 2,6964 0,169 0,0287 NS
Proteinuria 12,905 4,1180 3,13 9,821 p < 0,005

/ EE: Coeficiente de regresin estandarizado


C aptulo 12 Pgina 1293

Anlisis de regresin lineal mltiple

Variables asociadas al nivel de lipoprotena (a)


Pptido C basal - 1,863 0,9581 1,94 3,7807 0,051
Pptido C post - 0,027 0,5067 0,053 0,0029 NS
Colesterol total 0,0638 0,0573 1,113 1,2420 NS
Colesterol-LDL - 0,0518 0,0628 0,825 0,679 NS
Apoprotena B 0,0242 0,0747 0,324 0,1052 NS
Urea 0,1340 0,0704 1,90 3,6205 p > 0,1
AIC 2,041 3,114 0,656 0,4298 NS

/ EE: Coeficiente de regresin estandarizado


C aptulo 12 Pgina 1294

Lp(a)

Cardiopata isqumica

Proteinuria
C aptulo 12 Pgina 1295

Discusin (parte final)

Por lo tanto, la determinacin de Lp(a) presenta utilidad como marcador de las


complicaciones tardas de la DM tipo 2, y sus concentraciones plasmticas estn
influenciadas de forma directa e independiente por la cardiopata isqumica y la
nefropata. Cabe destacar que a pesar de que el diseo del estudio es transversal y no
permite inferir una relacin causal, si tenemos en cuenta el condicionamiento gentico
de la Lp(a), los resultados sugieren que la elevacin de los niveles plasmticos de
Lp(a) predisponen al enfermo diabtico a la aparicin de complicaciones vasculares,
principalmente la cardiopata isqumica y la nefropata diabtica. A pesar de tratarse de
un estudio con elevado nmero de pacientes, dada la gran variabilidad interindividual
de las concentraciones de Lp(a), estas asociaciones deberan confirmarse en estudios
longitudinales ms amplios y ms a largo plazo que los publicados en la actualidad.

Amor Garca, Jacobo Daz, Lus Escobar, Manuel Aguilar, Alipio Mangas.
LIPOPROTENA (a) Y DIABETES MELLITUS TIPO 2: FACTORES QUE INFLUYEN EN LAS
CONCENTRACIONES PLASMTICAS Y UTILIDAD COMO MARCADOR DE COMPLICACIONES
TARDAS (Premio Nacional AEBM). Revista: Revista de Diagnstico Biolgico 2000; 49: 125-137.
C aptulo 12 Pgina 1296

Mito 1: La sonrisa de la esfinge

Segn se desprende en el final de la discusin del estudio, se sugiere que la Lp(a), por su
condicionamiento gentico, podra actuar como variable predictora principal de la aparicin
de algunas complicaciones vasculares como la cardiopata isqumica y la nefropata
diabtica en los pacientes con diabetes tipo 2. Sin embargo en el anlisis multivariante la
has considerado con variable resultado.

Ests seguro que la lipoprotena a es realmente la variable resultado?

No crees que la Lp(a) podra ser la variable predictora principal y la aparicin de algn
tipo complicaciones vasculares la variable resultado?
C aptulo 12 Pgina 1297

Variable PREDICTORA Variable RESULTADO


Cuantitativa continua Cualitativa dicotmica (s o no)
Lp(a) Complicaciones vasculares
- Cardiopata isqumica
- Proteinuria
C aptulo 12 Pgina 1298

PC basal Lp(a)
PC post

Colesterol total Complicaciones


vasculares
Colesterol-LDL

Apoprotena B

Urea

Grupo Cultural

Tabaco

HTA
C aptulo 12 Pgina 1299

Problema clnico: En Atencin Primaria la eficiencia de la determinacin de la excrecin


urinaria de albmina en orina de 24 horas (EUA) para el diagnostico de la nefropata
diabtica es baja.

Objetivo del estudio: Introducir el cociente albmina/creatinina en una muestra de orina


matinal (CAC) como alternativa a la EUA.

Pregunta de investigacin: Podemos sustituir el cociente albmina/creatinina en orina


matinal (CAC) por la excrecin urinaria de albmina (EUA) en orina de 24 horas en
pacientes con sospecha de nefropata diabtica? Qu relacin existe entre el CAC y la
EUA en orina de 24 horas en dichos pacientes?.

Cul es el test estadstico ms acertado?


C aptulo 12 Pgina 1300

Pregunta de investigacin
Qu relacin existe entre el cociente albmina/creatinina en
orina matinal (CAC) y la excrecin urinaria de albmina (EUA)
en orina de 24 horas?

Variable PREDICTORA Variable RESULTADO


Cuantitativa continua Cuantitativa continua
CAC EUA

REGRESIN LINEAL SIMPLE Y = 0 + 1 * X

Coeficiente de correlacin r = 0,893 (89,3%)


C aptulo 12 Pgina 1301

Coeficiente de correlacin de Pearson


Correlacin global EUA versus CAC r = 0,893; R2 = 0,806; p < 0,01

COEFICIENTE DE PEARSON: La magnitud de la asociacin entre la EUA y la CAC es del


89,3% de la posible.

COEFICIENTE DE DETERMINACIN: El 80,6% de la variabilidad de la EUA puede


ser explicada por la distinta CAC, resta por explicar un 19,4% que es achacable a otras
variables PREDICTORAS distintas de la CAC.
Cules son esas variables predictoras?

Influencia del SEXO


EUA versus CAC Correlacin de Pearson r
Sexo masculino 0,753
Sexo femenino 0,979

Las diferencias entre los coeficientes de correlacin para cada sexo (masculino versus
femenino) se pueden analizar por el mtodo de OLKIN.
C aptulo 12 Pgina 1302

El test de Kaiser-Meyer-Olkin (KMO), que mide la idoneidad de los datos para realizar un
anlisis factorial comparando los valores de los coeficientes de correlacin observados con
los coeficientes de correlacin parcial (grupos comparados). Si la suma de los cuadrados
de los coeficientes de correlacin parcial entre todos los pares de variables es pequea
en comparacin con la suma de los coeficientes de correlacin al cuadrado, esta medida
tiende a uno. Para Kaiser los resultados del modelo factorial sern excelentes si el ndice
KMO est comprendido entre 0,9 y 1; buenos, si est comprendido entre 0,8 y 0,9;
aceptables, si se encuentra entre 0,7 y 0,8; mediocres o regulares, cuando resulte entre
0,6 y 0,7; malos, si est entre 0,5 y 0,6; e inaceptables o muy malos cuando sea menor que
0,5.

( r global)2
KMO =
( r global)2 + ( r hombres)2
C aptulo 12 Pgina 1303

El coeficiente de correlacin parcial es un indicador de la fuerza de las relaciones entre


dos variables eliminando la influencia del resto. Si las variables comparten factores
comunes, el coeficiente de correlacin parcial entre pares de variables deber ser bajo,
puesto que se eliminan los efectos lineales de las otras variables.

Una forma de evaluar este hecho es mediante la Medida de Adecuacin de la Muestra


KMO propuesta por Kaiser, Meyer y Olkin. Dicha medida viene dada por la ecuacin KMO
donde rij(p) es el coeficiente de correlacin parcial entre las variables Xi y Xj eliminando la
influencia del resto de las variables.
C aptulo 12 Pgina 1304

( r global)2 ( r global)2
KMO = KMO =
(r global)
2 + (r hombres)
2 ( r global)2 + ( r mujeres)2

KMO hombres = 0,584 KMO mujeres = 0,457

KMO es un ndice que toma valores entre 0 y 1 y que se utiliza para comparar las
magnitudes de los coeficientes de correlacin observados con las magnitudes de los
coeficientes de correlacin parcial de forma que, cuanto ms pequeo sea su valor, mayor
es el valor de los coeficientes de correlacin parciales rij(p) y, por lo tanto, menos deseable
es realizar un Anlisis Factorial. Kaise, Meyer y Olkin aconsejan que si KMO 0,75 la idea
de realizar un anlisis factorial es buena, si 0,75 > KMO 0,5 la idea es aceptable y si
KMO < 0,5 es inaceptable.
C aptulo 12 Pgina 1305

Se observa que el valor del KMO = 0.584 para hombres est en el lmite de los valores
recomendados por Kaiser, Meyer y Olkin poniendo de manifiesto que, en este caso muy
probablemente, el proceso de reduccin de datos no sea muy espectacular.

Se observa que el valor del KMO = 0.457 para mujeres es inferior al lmite de los valores
recomendados por Kaiser, Meyer y Olkin (0,5) poniendo de manifiesto que, en este caso
con toda seguridad, el proceso de reduccin de datos no es importante.
C aptulo 12 Pgina 1306

Regresin lineal mltiple

Factor 1: R2 = 0,806 (80,6%)


Variable predictora 1
CAC
1 = 7.65 p=0,001

Factor 3: Variable RESULTADO


Variable predictora 3 Cuantitativa continua

Edad EUA
3= -0.54 p=0,42

Factor 2: Aplicacin del modelo de regresin mltiple


a los datos de un estudio que usa como
Variable predictora 2 variables predictoras el cociente albmina/
creatinina en orina matinal (CAC), sexo y
Sexo edad del individuo frente a la excrecin
2 = -30.26 p=0,01 urinaria de albmina en orina 24 horas EUA
(variable resultado).
C aptulo 12 Pgina 1307

Anlisis de regresin lineal mltiple

EUA: Excrecin urinaria de Modelo de Regresin Lineal Mltiple


albmina en orina de 24 horas
Coeficiente IC95% de p
CAC: Cociente albmina/creatinina
en una muestra de orina matinal Constante 110,85 13,88 a 187,84 0,02
EUA: Variable dependiente o
CAC 7,65 7,13 a 8,16 0,001
resultado
CAC: Variable Predictora 1 Edad - 0,54 - 1,86 a 0,78 0,42
SEXO: Variable Predictora 2 Sexo - 30,26 - 53,93 a 6,58 0,01
EDAD: Variable Predictora 3

EUA (Y) = 110,85 + 7,65 CAC - 0,54 EDAD 30,26 SEXO

EUA (Y) = 110,85 + 7,65 CAC 30,26 SEXO


C aptulo 12 Pgina 1308

Fases del anlisis estadstico

1. ANLISIS DESCRIPTIVO Qu Variables PREDICTORAS


se deben incluir en el Anlisis de
Regresin Lineal Mltiple?

2. ANLISIS BIVARIANTE

3. ANLISIS MULTIVARIANTE

Variable Predictora 1
Variable Predictora 2
Variable Predictora 3
Variable Resultado
Variable Predictora 4
Variable Predictora 5
Variable Predictora n
C aptulo 12 Pgina 1309

Mtodo de introduccin de las REGRESIN LINEAL REGRESIN LOGSTICA


variables MLTIPLE MULTIVARIANTE
Forward (hacia adelante) Introducir progresivamente en el modelo las variables
predictoras estadsticamente significativas, comenzando por
la que tenga mayor significacin
Backward (hacia atrs) Comienza por estimar un modelo que contiene todas las
variables predictoras para ir eliminando posteriormente
una a una, de forma sucesiva, aquellas que no sean
significativas
Stepwise Es una combinacin de los anteriores
C aptulo 12 Pgina 1310

HIPERLIPIDEMIA

EDAD

SEXO
Excrecin urinaria
NIVEL CULTURAL de sodio en 24 horas

TABAQUISMO

OBESIDAD IMC

DIABETES
C aptulo 12 Pgina 1311

Qu variables predictoras se deben incluir en el anlisis de


regresin lineal mltiple?

Con significacin estadstica


(p<0,05)

Edad

Sexo

Nivel cultural

Tabaquismo

Prxima a la significacin
estadstica (0,05 < p < 0,1)
- IMC
- Hiperlipidemia
C aptulo 12 Pgina 1312

Anlisis de regresin lineal mltiple


Cul de las distintas variables Resultados del anlisis de Regresin Lineal Mltiple
predictoras con significacin
Coeficiente IC95% de p
estadstica (p<0,05) del anlisis
univariante NO aparecen en el Constante 96,67 19,2 a 174,15 0,015
modelo multivariante? Edad - 1,17 - 1,89 a 0,44 0,002
Nivel cultural Sexo 28,71 4,65 a 52,78 0,020
Tabaquismo 29,22 3,83 a 54,6 0,024
Cul de las distintas variables
predictoras prximas a la IMC 4,15 2,00 a 6,29 0,000
significacin estadstica (0,05 La codificacin de las variables dicotmicas se realiz
<p<0,1) del anlisis univariante sexo: mujer = 0, hombre = 1, tabaquismo: no fumador
0, fumador 1). IMC = peso / (talla)2
SI aparecen en el modelo
multivariante?
Obesidad (IMC)

En el anlisis de regresin lineal MLTIPLE se incluyeron las variables predictoras con


Significacin estadstica en el anlisis de regresin lineal SIMPLE (edad, sexo, nivel cultural,
tabaquismo; p<0,05) y aquellas prximas a la significacin (IMC y hiperlipidemia; p=0,1),
identificndose como verdaderas variables predictoras o independientes slo la edad, sexo,
IMC y el tabaco r=0,388 (p<0,05). El resto de las variables NO fueron incluidas en el modelo.
C aptulo 12 Pgina 1313

Pregunta de investigacin
Qu relacin existe entre los niveles de colesterol en sangre y la
tensin arterial?

Variable PREDICTORA Variable RESULTADO


Cuantitativa continua Cuantitativa continua
Colesterol Tensin arterial

REGRESIN LINEAL SIMPLE Y = 0 + 1 * X

Coeficiente de correlacin R2 = 0,691 (69,1%)


C aptulo 12 Pgina 1314

Modelo de regresin lineal simple para la variable resultado tensin


arterial diastlica ajustado por la variable predictora colesterol
Variable Coeficiente EE IC95% t p

Constante 26,91 7,15 12,63 41,19 3,76 < 0,001

Colesterol 0,23 0,03 0,17 0,29 7,70 < 0,001

Suma de g.l Media F p


cuadrados Cuadrtica
Regresin 4067,11 1 4067,11 59,29 < 0,001

Residual 4459,01 65 68,60

Total 8526,12 66 29,22

Y = 0 + 1 * X

TAD = 26.91 + 0.23 * Colesterol


Es el modelo de regresin simple que resulta de tomar como nica variable predictora el colesterol de un
individuo. El valor del coeficiente de determinacin R 2 es 0.691 (69.1%).
Se puede mejorar el R 2 incluyendo otra variable predictora?.
R 2 puede ser mejorado a 0.722 (72.2%) aplicando un modelo multivariante en el que se introduce el ndice
de masa corporal (IMC) como nueva variable predictora.
C aptulo 12 Pgina 1315

Correlacin lineal de las variables predictoras edad, colesterol e ndice


de masa corporal con la variable resultado tensin arterial diastlica

TAD NS

NS EDAD NS NS

NS Colesterol

NS IMC

Prtegas Daz S, Pita Fernndez S. Tcnicas de regresin: Regresin lineal mltiple. Cad Aten Primaria
2000; 7: 173-176.
C aptulo 12 Pgina 1316

Regresin lineal mltiple


Variable
Predictora 1
Causa o Factor 1: Cuantitativa

Variable RESULTADO

Interaccin Desenlace o efecto:


Cuantitativa

Variable
Predictora 2

Causa o Factor 2: Cuantitativa


Y = 0 + 1 * X1 + 2 * X2
C aptulo 12 Pgina 1317

Regresin lineal mltiple

R2 = 0,722 (72,2%)
Factor 1:
Variable predictora 1
Colesterol
t= 5.26 p<0,001
Desenlace o efecto

Factor 2: Tensin arterial


Variable predictora 2
IMC Aplicacin del modelo de regresin
t= 2.45 p=0,017 mltiple a los datos de un estudio que
usa como variables predictoras de la
tensin diastlica (variable resultado) el
colesterol y el ndice de masa corporal de
un individuo.
C aptulo 12 Pgina 1318

Modelo de regresin lineal simple para la variable resultado tensin


arterial diastlica ajustado por las variables predictoras colesterol e
ndice de masa corporal R2 = 0,722 (72,2%)
Variable Coeficiente EE IC95% t p

Constante 19,42 7,54 4,37 34,48 2,58 0,012

Colesterol 0,18 0,03 0,11 0,25 5,26 < 0,001

IMC 0,73 0,30 0,14 1,33 2,45 0,017

Suma de g.l Media F p


cuadrados Cuadrtica
Regresin 4449,72 2 2224,86 34,93 < 0,001

Residual 4076,40 64 63,69

Total 8526,12

TAD = 19,42 + 0.18 * Colesterol + 0,73 IMC

Los coeficientes de regresin para ambas variables predictoras fueron 0.18 (= 0.03) y 0.73 (=0.30)
respectivamente, siendo ambos significativamente distintos de cero. Esto indica que por trmino medio la
tensin arterial diastlica de un paciente se incrementa en 1.8 y 7.3 respectivamente por cada 10 unidades
a mayores en su colesterol o ndice de masa corporal. El valor del coeficiente de determinacin R 2=0.72
(72%) y la significacin del contraste F global de la regresin (p<0.001) sugieren que gran parte de la
variabilidad de la respuesta (TAD) viene explicada por el modelo ajustado.
C aptulo 12 Pgina 1319

Regresin lineal mltiple

Factor 1: R2 = 0,52 (52%)


Variable predictora 1
Colesterol
t= 4.84 p<0,001

Factor 3:
Desenlace o efecto
Variable predictora 3
Edad Tensin arterial
t= 1.67 p=0.10

Factor 2: Aplicacin del modelo de regresin mltiple


a los datos de un estudio que usa como
Variable predictora 2 variables predictoras de la tensin diastlica
(variable resultado) el colesterol, ndice de
IMC masa corporal y edad de un individuo.
t= 2.31 p=0,024
C aptulo 12 Pgina 1320

Modelo de regresin lineal simple para la variable resultado tensin


arterial diastlica (TAD) ajustado por las variables predictoras coles-
terol, ndice de masa corporal y edad R2 = 0,52 (52%)
Variable Coeficiente EE IC95% t p

Constante 10,55 9,13 -7,70 a 28,81 1,15 0,252

Colesterol 0,17 0,03 0,1 0,24 4,84 < 0,001

IMC 0,68 0,30 0,09 1,28 2,31 0,024

Edad 0,24 0,14 - 0,05 a 0,53 1,67 0,100

Suma de g.l Media F p


cuadrados Cuadrtica
Regresin 4622,52 3 1540,84 24,87 < 0,001

Residual 3903,60 63 61,96

Total 8526,12 66

Los coeficientes de regresin para el colesterol fue 0.17 (= 0.03) y de 0.68 (=0.30) para el IMC
continuarn siendo distintos de cero (p<0.05). La introduccin de la nueva variable predictora EDAD en el
modelo, proporciona un cambio en el coeficiente de determinacin R 2 de tan slo 0.028 que NO mejora de
forma significativa (p=0.059). La entrada de la variable edad NO produce una mejora del ajuste del modelo.
El coeficiente de regresin de la EDAD (0.24) no es significativo (p=0.100).
C aptulo 12 Pgina 1321

Modelo de regresin lineal simple para la variable resultado tensin


arterial diastlica (TAD) ajustado por las variables predictoras coles-
terol, ndice de masa corporal y edad
Variable Coeficiente EE IC95% t p

Constante 10,55 9,13 -7,70 a 28,81 1,15 0,252

Colesterol 0,17 0,03 0,1 0,24 4,84 < 0,001

IMC 0,68 0,30 0,09 1,28 2,31 0,024

Edad 0,24 0,14 - 0,05 a 0,53 1,67 0,100

Suma de g.l Media F p


cuadrados Cuadrtica
Regresin 4622,52 3 1540,84 24,87 < 0,001

Residual 3903,60 63 61,96

Total 8526,12 66

edad 0,24
= = 1,71 < Z95% (1,96) p = 0,100
EE edad 0,14

Prtegas Daz S, Pita Fernndez S. Tcnicas de regresin: Regresin lineal mltiple. Cad Aten Primaria
2000; 7: 173-176.
C aptulo 12 Pgina 1322

Mtodo de introduccin de las REGRESIN LINEAL REGRESIN LOGSTICA


variables MLTIPLE MULTIVARIANTE
Forward (hacia adelante) Introducir progresivamente en el modelo las variables
predictoras estadsticamente significativas, comenzando por
la que tenga mayor significacin
Backward (hacia atrs) Comienza por estimar un modelo que contiene todas las
variables predictoras para ir eliminando posteriormente
una a una, de forma sucesiva, aquellas que no sean
significativas
Stepwise Es una combinacin de los anteriores
C aptulo 12 Pgina 1323

Anlisis multivariante
Anlisis multivariante para la deteccin de potenciales factores de
confusin
Variable Predictora 1
Variable Predictora 2
Variable Predictora 3
Variable Resultado
Variable Predictora 4
Variable Predictora 5
Variable Predictora n
C aptulo 12 Pgina 1324

Sesgo de confusin

Variable predictora Exposicin F Variable resultado Enfermedad o


o factor de riesgo efecto E

Variable
confundente

Es el nico sesgo que se puede controlar (evitar) en la fase de anlisis y no slo en la fase de diseo.

Distorsin en las conclusiones del estudio, producida por la distribucin desigual, en los grupos de
comparacin, de una tercera variable (confundente C).
C aptulo 12 Pgina 1325

Portadores del Alelo 4

- Elevada prevalencia de enfermedad coronaria


- Mayor extensin de la arteriosclerosis
- Mayor tasa de IAM
- Mayor mortalidad de causa coronaria

Alelo 4 Enfermedad coronaria

- ANLISIS UNIVARIANTE:
El 15,7% de los portadores del alelo 4 presentaban CI frente al 6,9% en NO
4 (p<0,01)
ORc = 2,49 IC95%: 1,19-5,22
C aptulo 12 Pgina 1326

Modelo de regresin logstica

Exposicin

Alelo 4 Enfermedad coronaria

Potenciales FACTORES DE CONFUSIN


- Edad
- Sexo
- HTA
- Tabaquismo
- Obesidad (IMC)
- Lpidos y lipoprotenas
C aptulo 12 Pgina 1327

Regresin logstica multivariante para la deteccin de


potenciales factores de confusin
Alelo 4 Enfermedad coronaria

OR (IC95%)
No corregido
Corregido para la edad y el sexo 2,49 (1,19 - 5,22)
Corregido para la edad, el sexo y otros 2,59 (1,15 - 5,83)
factores de riesgo cardiovascular (FRCV)
2,83 (1,18 - 6,81)
Corregido para la edad, el sexo, otros
factores de FRCV y perfil lipdico 2,56 (1,03 - 6,39)

0,75 1 2 4 8

Asociacin entre la prevalencia de enfermedad coronaria y el tipo de apo E (4 frente a no 4) expresada


como OR e IC95% en una poblacin de 386 pacientes con hipercolesterolemia. Se presenta la asociacin
simple (anlisis univariante) (OR no corregido) y despus de corregir, de forma escalonada, para distintas
variables predictoras potencialmente confundentes como la edad y el sexo, para estas variables ms la
presencia de hipertensin arterial, tabaquismo e IMC y, por ltimo, todos los anteriores ms el perfil lipdico
colesterol total, cHDL y triglicridos mediante anlisis multivariante.
C aptulo 12 Pgina 1328

Reflexiones finales

Los distintos tipo de sesgos, la influencia del azar y la presencia de variables


predictoras de CONFUSIN deben finalmente siempre, tenerse en cuenta,
en todos los estudios como explicacin posible de cualquier asociacin
estadstica ya sea esta positiva, negativa o no existente.

Y como sealaba M. Susser en sus reflexiones sobre causalidad


Cuando hay minas por todas partes uno no debe aventurarse sin un detector
de minas (ANLISIS MULTIVARIANTE).

Susser M. Conceptos y estrategias en epidemiologa. El pensamiento causal en ciencias de la salud.


Mxico: Biblioteca de la Salud; 1991.
C aptulo 12 Pgina 1329

REGRESIN LINEAL REGRESIN LOGSTICA


MLTIPLE MULTIVARIANTE
Variable Cuantitativa Cualitativa
RESULTADO (dicotmica)

Variables Cualitativa Cualitativa


PREDICTORAS Cuantitativa Cuantitativa

ECUACIN Y = 0 + 1X1 + ... + nXn


C aptulo 12 Pgina 1330

Modelo de regresin mltiple de Cox

REGRESIN
MLTIPLE de COX
Variable Cuantitativa
RESULTADO Desenlace: supervivencia a tiempo t

Variables Cualitativa
PREDICTORAS Cuantitativa
(factores pronstico)

ECUACIN
C aptulo 12 Pgina 1331

Anlisis multivariante

Edad
Estado civil
Tiempo de alcoholismo
Probabilidad de muerte
Bilirrubina
Presencia de ascitis
Albmina
C aptulo 12 Pgina 1332

Estudio de cohortes prospectivo de pacientes alcohlicos

Variables predictoras Anlisis Univariante (p)

Edad p < 0,05

Estado civil p < 0,05

Tiempo de alcoholismo p < 0,05

Bilirrubina srica p < 0,05

Presencia de ascitis p < 0,05

Albmina srica p < 0,05


C aptulo 12 Pgina 1333

Estudio de cohortes prospectivo de pacientes alcohlicos

Factores de Riesgo

Muertos por otras


causas
Fallecimientos 56
162 pacientes
alcohlicos
hospitalizados
Sobrevivientes 59
Prdidas de
seguimiento
Seguimiento mediana 8,7 aos
C aptulo 12 Pgina 1334

Estudio de cohortes prospectivo de pacientes alcohlicos

Edad Ascitis

Pacientes Muerte
alcohlicos

Bilirrubina Estado civil


C aptulo 12 Pgina 1335

Estudio de cohortes prospectivo de pacientes alcohlicos

Variables predictoras con significado pronstico en pacientes alcohlicos


Modelo de Regresin de Cox (mtodo paso a paso)
Variable RR IC95% del RR Significacin

Edad 1,0763 1,0334-1,1209 0,0004

Ascitis 2,0940 1,0553-4,1551 0,0345

Bilirrubina 1,4220 1,2058-1,6769 0,0000

Estado civil 2,3922 1,1796-4,8515 0,0156


C aptulo 12 Pgina 1336

Pruebas estadsticas de contraste de hiptesis ms


aplicables a cada situacin
Variable Variable Pruebas de contraste de Observaciones y/o limitaciones del test
Independiente o Dependiente o hiptesis
PREDICTORA RESULTADO
Cualitativa Cualitativa Ji cuadrado Si el tamao muestral es grande
Prueba exacta de Fisher Si el tamao muestral es pequeo
Test de McNemar Dos grupos de muestras repetidas o apareadas
Q de Cochran Ms de dos grupos de muestras repetidas o apareadas
REGRESIN LOGSTICA Varias variables predictoras cualitativas
Cualitativa Cuantitativa t de Student Compara medias entre dos grupos independientes
Anlisis de la Varianza Compara medias entre ms de dos grupos independientes
Test de Mann-Whitney Dos grupos independientes No paramtricos
Test de Wilcoxon Dos grupos medidas repetidas No paramtrico
Test de Kruskall-Wallis Ms de dos grupos No paramtrico, medidas repetidas
Test de Friedman Ms de dos grupos No paramtrico medidas repetidas
Cuantitativa Cualitativa Regresin logstica simple Una sola variable predictora cuantitativa
Regresin logstica multivariante Varias variable predictoras cuantitativa o cualitativas
Cuantitativa Cuantitativa Regresin lineal simple Paramtrico
Correlacin de Pearson Paramtrico
Correlacin de Sperman No paramtrico
REGRESIN MLTIPLE Varias variables predictoras cuantitativas
Cualitativa Superviviencia Kaplan-Meier Curvas de superviviencia
Long-Rank Compara curvas de superviviencia
Regresin de COX Anlisis Multivariante
C aptulo 13 Pgina 1337

Captulo 13

Publicacin Bioestadstica: Bibliografa.

Dr. Jacobo Daz Portillo


Coordinador de Formacin Continuada
Hospital Universitario de Ceuta
C aptulo 13 Pgina 1338

Bibliografa utilizada en el curso (1)


- Alvarez Cceres R. Estadstica aplicada a las ciencias de la salud. Madrid. Daz de
Santos 2007.
- Martnez-Gonzlez MA, editor. Bioestadstica amigable. 2 ed. Madrid : Daz de
Santos, 2006.
- Martn Andrs A, Luna del Castillo JD. Bioestadstica para las ciencias de la salud. 4
ed. Madrid: NORMA; 1993.
- Milton JS, Tsokos JO. Estadstica para biologa y ciencias de la salud. Madrid:
Interamericana McGraw Hill; 2001.
- Dawson-Saunders B, Trapp RG. Bioestadstica Mdica. 2 ed. Mxico: Editorial el
Manual Moderno;1996.
- Pita Fernndez, S. Uso de la estadstica y la epidemiologa en atencin primaria. En:
Gil VF, Merino J, Orozco D, Quirce F. Manual de metodologa de trabajo en atencin
primaria. Universidad de Alicante. Madrid, Jarpyo Editores, S.A. 1997; 115-161.
C aptulo 13 Pgina 1339

Bibliografa utilizada en el curso (2)


- Castillo Ron E. Introduccin a la estadstica aplicada. Santander: Ed. autor; 1993.
- Cobo E, Muoz P, Gonzlez JA. Bioestadstica para no estadsticos: bases para
interpretar artculos cientficos. msterdam : Elsevier Masson, 2007.
- Morell Ocaa M, Redondo Bautista M. Metodologa cientfica en ciencias de la salud.
Grupo editorial 33 (Mlaga); 2002.
- Argimn Palls JM, Jimnez Villa J. Mtodos de investigacin aplicados a la atencin
primaria de salud. 2 ed. Barcelona: Mosby-Doyma; 1994.
- Sackett DL, Richarson WS, Rosenberg W, Hynes RB. Evidence-based medicine: how
to practice and teach EBM. 2nd ed. London: Churchill-livingstone; 2000.
- Silva Ayaguer LC. Cultura estadstica e investigacin cientfica en el campo de la
salud: una mirada crtica. Madrid: Ediciones Daz de Santos; 1997.
C aptulo 13 Pgina 1340

Bibliografa utilizada en el curso (3)


- Bailar JC III. Some uses of statistical thinking. En: Bailar JC III, Mostoller F, editors.
Medical uses of statistics. Boston: N Engl J Med Books, 1992; p. 25-57
- Bobenrieth Astete M.A . Mitos y realidades en torno a la publicacin cientfica. Med
Clin (Barc) 2000; 114: 339-341.
- Bobenrieth Astete M.A . Lectura crtica de artculos originales en Salud. Medicina de
Familia (And) 2001; 2: 81-90.
- Antoja Rib F. The innocence of the storks. Rev Lab Clin 2010; 3 (2): 51.
- Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ
1995;311:485.
- Argimon JM. La ausencia de significacin estadstica en un ensayoclnico no significa
equivalencia teraputica. Med Clin (Barc) 2002; 118: 701-3
- Mora I, Ripoll R. Cmo mejorar la calidad estadstica de los artculos presentados
a revistas biomdicas: lista de comprobacin para los autores. Med Clin (Barc).
1999;113:138-49.
C aptulo 13 Pgina 1341

Bibliografa utilizada en el curso (4)


- Salsburg DS. The religion of statistics as practiced in medical journals. Am Statistician
1985; 39: 220-223.
- Pocock SJ. The role of statistics in medical research. Br J Psychiat 1980; 137: 188-190.
- Chia KS. Significant-itis: an obsession with the P value. Scand J Work Environ Health.
1997; 23:152-4.
- Christenson P. To p or not to p. J Child Adolesc Psychiatr Nurs. 1995; 8:42.
- Neyman J, Pearson E. On the problem of the most efficient tests of statistical
hypothesis. Philosophical trans of the Royal Society of London (A) 1933;231:289-337.
- Ars A. Tmese una antes de acostarse. 1 edicin. Barcelona: Planeta; 1998.
C aptulo 13 Pgina 1342

Bibliografa utilizada en el curso (5)


- Martn Andrs A. Bioestadstica para ciencias de la salud. 1 ed. Madrid : Ediciones
Norma-Capitel, 2004.
- Prez Lpez C. Mtodos estadsticos avanzados con SPSS. Thomson, 2005.
- Garca A. Mtodos avanzados de estadstica aplicada. Madrid: UNED, 2001.
- Juez Martel P, Diez Vegas FJ. Probabilidad y Estadstica en Medicina. Madrid: Daz de
Santos, 1997.
- Alvarez Cceres R. Estadstica multivariante y no paramtrica con SPSS. Madrid: Daz
de Santos, 1994.
- Armitage P, Berry G. Estadstica para la Investigacin Biomdica. Doyma, Barcelona,
1992.
- DL Sackett. Epidemiologa clnica. Buenos Aires, Editorial Mdica Panamericana,
1994.
C aptulo 13 Pgina 1343

Bibliografa utilizada en el curso (6)


- Pita Fernndez S, Prtega Daz S. Significancia estadstica y relevancia clnica. Cad
Aten Primaria 2001; 8: 191-195.
- Escrig Sos J et al. Intervalos de confianza: por qu usarlos. Cir Esp. 2007;81(3):121-5.
- Camps Garca MT, Muoz Rocan N, Calvo de Mora A, De Ramn Garrido E. Los
cocientes de probabilidad como medida de la utilidad de la determinacin de anticuerpos
antinucleares por inmunofluorescencia indirecta en la clnica. Aplicacin de los
resultados de la investigacin clnica. Med Clin (Barc)1999;113: 476.
- Tibblea J et al. Faecal calprotectin and faecal occult blood tests in the diagnosis of
colorectal carcinoma and adenoma. Gut 2001;49:402-408.
C aptulo 13 Pgina 1344

Bibliografa utilizada en el curso (7)


- Seoanea T et al. Estadstica: Estadstica Descriptiva y Estadstica Inferencial.
SEMERGEN. 2007;33(9):466-71.
- Iraurgi I. Significancia estadstica y relevancia clnica. Norte de Salud Mental 2009;
94 - 108.
- Rubio C. Diseo estadstico de ensayos clnicos. Med Clin (Barc) 1996; 107: 303-309.
- Plasencia A, Porta Serra M. La calidad de la informacin clnica (II): significacin
estadstica. Med Clin (Barc) 1988; 90: 122-126.
- Carlos Manterola D, Viviana Pineda N. El valor de p y la significacin estadstica.
Aspectos generales y su valor en la prctica clnica. Interpretation of medical statistics.
Rev. Chilena de Ciruga 2008; 60: 86-89.
C aptulo 13 Pgina 1345

Bibliografa utilizada en el curso (8)


- Lpez de Ullibarri Galparsoro I, Pita Fernndez S. Medidas de concordancia: el ndice
Kappa. Cad Aten Primaria 1999; 6: 169-171.
- Pita Fernndez S, Prtegas Daz S. Relacin entre variables cuantitativas. Cad Aten
Primaria 1997; 4: 141-144.
- Pita Fernndez S, Prtegas Daz S. Pruebas diagnsticas. Cad Aten Primaria 2003;
10: 120-124.
- Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis
de concordancia para variables numricas. Cad Aten Primaria 2004.
- Prtegas Daz S, Pita Fernndez S. Tcnicas de regresin: Regresin lineal mltiple.
Cad Aten Primaria 2000; 7: 173-176.
C aptulo 13 Pgina 1346

Bibliografa utilizada en el curso (9)


- Pita Fernndez S, Prtegas Daz S. Tcnicas de regresin: regresin lineal mltiple.
Cad Aten Primaria 2000; 7: 91-94.
- Pita Fernndez S. Correlacin frente a causalidad JANO 1996; (1174): 59-60.
- Pita Fernndez S. Determinacin del tamao muestral. Cad Aten Primaria 1996; 3:
138-144.
- Prtegas Daz S , Pita Fernndez S. La distribucin normal. Cad Aten Primaria 2001; 8:
268-274.
- Prtegas Daz S , Pita Fernndez S. Mtodos paramtricos para la comparacin de
dos medias. t de Student. Cad Aten Primaria 2001; 8: 37-41.
- Passing H, Bablok W. A new biometrical procedure for testing the equality of
measurements from two different analytical methods. J Clin Chem Biochem 1983; 21:
709-20.
C aptulo 13 Pgina 1347

Bibliografa utilizada en el curso (10)


- Burgueo MJ, Garca-Bastos JL y Gonzlez-Buitrago JM. Las curvas ROC en la
evaluacin de las pruebas diagnsticas. Med Clin (Barc) 1995: 104: 661-670.
- Hanley JA, McNeil BJ. The meaning and use of the area under aReceiver Operating
Characteristic (ROC) Curve. Radiology 1982; 143: 29-36.
- Lpez de Ullibarri Galparsoro I, Pita Fernndez S. Curvas ROC. Cad Aten Primaria
1998; 5: 229-235.
- McNeil BJ, Keeler E, Adelstein SJ. Primer on certain elements of medical decision
making. N Engl J Med 1975; 293: 211-215.
- Galen RS, Gambino SR. Beyond normality: The predictive value and efficiency of
medical diagnoses. Nueva York: J Wiley and Sons, lnc., 1975.
C aptulo 13 Pgina 1348

Bibliografa utilizada en el curso (11)


- Beck JR, Shultz EK. The use of relative operating characteristic (ROC) curves in test
performance evaluation. Arch Pathol Lab Med 1986; 110:13-20.
- Swets JA. Measuring the accuracy of diagnostic systems. Science 1988; 240: 1.285-
1.293.
- Zweig MH, Campbell G. Receiver-operating characteristic (ROC) plots: a fundamental
evaluation tool in clinical medicine. Clin Chem 1993; 39: 561-577.
- Yupanqui Pacheco RM: Introduccin a la estadstica bayesiana. UNMSM. Facultad
de Ciencias Matemticas. EAP de Estadstica, Lima, 2005 (disponible en: http://sisbib.
unmsm.edu.pe/ bibvirtualdata/Tesis/Basic/yupanqui_pr/yupanqui_pr.pdf).
- Altman DG, Moher D. Elaboracin de directrices para la publicacin de investigacin
biomdica: proceso y fundamento cientfico. Med Clin (Barc). 2005;125(Supl 1):8-13.
C aptulo 13 Pgina 1349

Bibliografa utilizada en el curso (12)


- Lpez, F. Utilizacin adecuada de las pruebas estadsticas en los estudios de
comparacin de procedimientos. Quim Clin 2000; 19: 237.
- Fleiss JL. The design and analysis of clinical experiments. Nueva York: John Wiley &
Sons, Inc., 1986.
- Luis Prieto, Rosa Lamarca, Alfonso Casado. La evaluacin de la fiabilidad en las
observaciones clnicas: el coeficiente de correlacin intraclase. Med Clin (Barc).
1998;110:142-5.
- (*) Wakkers PJM, Hallendoorn HBA, Op de Weegh GJ, Heerspink W. Applications of
statistics in clinical chemistry. A critical evaluation of regression lines. Clin Chim Acta
1975; 64: 173-84.
- Cornbleet PJ, Gochman N. Incorrect least-squares regression coefficients in method-
comparison analysis. Clin Chem 1979; 25: 432-38.
- Zaydman L, Lasky FD, Van Nostrand C, Doptis PD. Recommended linear regressin
models for comparison of method in clinical Chemistry. Clin Chem 1991, 37: 960.
C aptulo 13 Pgina 1350

Bibliografa utilizada en el curso (13)


- Frey E, Fuentes-Arderiu X, Queralt JM. Comparacin estadstica de mtodos
analticos. Educacin continuada Qumica Clnica. 1988; 1: 69-79.
- Lpez, F. Utilizacin adecuada de las pruebas estadsticas en los estudios de
comparacin de procedimientos. Quim Clin 2000; 19: 237.
- Westgard JO, Hunt MR. Use and interpretation of common statistical test in method-
comparison studies. Clin Chem 1973; 19: 44-57.
- Bland JM, Altman DG. Statistical methods for assesing agreement between two
methods of clinical measurement. Lancet 1986; 1: 307-310.
- Pita Fernndez S, Prtegas Daz S. La fiabilidad de las mediciones clnicas: el anlisis
de concordancia para variables numricas. Cad Aten Primaria 2004.
C aptulo 13 Pgina 1351

Bibliografa utilizada en el curso (14)


- Altman DG, Bland JM. Statistical methods for assessing agreement between two
methods of clinical measurement. The lancet 1986; 307-10.
- Altman DG, Bland JM. Measurement in medicine: the analysis of method comparison
studies. The Statistician 1983; 32, 307-317.
- Lpez, F. Utilizacin adecuada de las pruebas estadsticas en los estudios de
comparacin de procedimientos. Quim Clin 2000; 19: 237.
- Prtegas Daz S , Pita Fernndez S. Determinacin del tamao muestral para calcular
la significacin del coeficiente de correlacin lineal. Cad Aten Primaria 2001; 9: 209-211.
- Jacobo Daz Portillo .Influencia del grupo tnico en el patrn lipoproteico de una
determinada poblacin peditrica de Ceuta, Tesis doctoral (1997). Facultad de Medicina
de la Universidad de Cdiz.
C aptulo 13 Pgina 1352

Bibliografa utilizada en el curso (15)


- Albert A, Harris EK. Multivariate interpretation of clinical laboratory data. New York:
Marcel Dekker; 1987.
- Saez M. El problema de las medidas repetidas. Anlisis longitudinal en epidemiologa.
Gac Sanit 2001;15(4):347-352.
- F. Lpez Azorn. La necesidad de mejores evaluaciones metodolgicas y nuestra
exigencia ante los criterios de aceptabilidad de los resultados. Qumica Clnica 2003; 22
(6) 431-432.
- Snchez-Cantalejo Ramrez E. Regresin logstica en salud pblica. EASP 2000.
- Silva Ayaguer LC. Excursin a la regresin logstica en ciencias de la salud. Madrid:
Daz de Santos, 1995.
- Hernndez Aguado I, Porta Serra M, Miralles M, Garca Benavides F, Bolmar F. La
cuantificacin de la variabilidad en las observaciones clnicas. Med Clin (Barc) 1990; 95:
424- 429.
C aptulo 13 Pgina 1353

Bibliografa utilizada en el curso (16)


- Prtegas Daz S, Pita Fernndez S. Representacin grfica en el anlisis de datos.
Cad Aten Primaria 2001; 8: 112-117.
- Lpez de Ullibarri Galparsoro I, Pita Fernndez S. Medidas de concordancia: el ndice
Kappa. Cad Aten Primaria 1999; 6: 169-171.
- Prieto L, Lamarca R, Casado A. La evaluacin de la fiabilidad en las observaciones
clnicas: el coeficiente de correlacin intraclase. Med Clin 1998: 110(4): 142-145.
- Argimon JM. El intervalo de confianza: algo ms que un valor de significacin
estadstica. Med Clin (Barc) 2002;118(10):382-4.
- Argimon JM. La ausencia de significacin estadstica en un ensayo clnico no significa
equivalencia teraputica. Med Clin (Barc) 2002;118(18):701-3.
- Ramalle-Gmara E, Andrs de Llano JM. Utilizacin de mtodos robustos en la
estadstica inferencial. Aten Primaria 2003;32(3):177-82.
- Cobo E. Anlisis multivariante en investigacin biomdica: criterios para la inclusin de
variables. Med Clin (Barc) 2002;119(6):230-237.
Gua Prctica del Curso
de Bioestadstica Aplicada
a las Ciencias de la Salud
Dr. Jacobo Daz Portillo
Coordinador de Formacin Continuada
Hospital Universitario de Ceuta

Edita: Instituto Nacional de Gestin Sanitaria


Subdireccin General de Gestin Econmica y Recursos Humanos
Servicio de Recursos Documentales y Apoyo Institucional
Alcal, 56 28014 Madrid

El copyright y otros derechos de propiedad intelectual pertenecen


al Instituto Nacional de Gestin Sanitaria.
Se autoriza la reproduccin total o parcial para uso no comercial,
siempre que se cite explcitamente su procedencia.

Depsito Legal: M-33564-2011


NIPO: 865-11-010-6
Coleccin Editorial de Publicaciones del INGESA: 1.921
Gua Prctica del Curso
de Bioestadstica Aplicada
a las Ciencias de la Salud

Dr. Jacobo Daz Portillo

También podría gustarte